164 7 5MB
German Pages XXIII, 414 [429] Year 2020
Heiner Klock
Adaptive Interventionskompetenz in mathematischen Modellierungsprozessen Konzeptualisierung, Operationalisierung und Förderung
Studien zur theoretischen und empirischen Forschung in der Mathematikdidaktik Reihe herausgegeben von Gilbert Greefrath, Münster, Deutschland Stanislaw Schukajlow, Münster, Deutschland Hans-Stefan Siller, Würzburg, Deutschland
In der Reihe werden theoretische und empirische Arbeiten zu aktuellen didaktischen Ansätzen zum Lehren und Lernen von Mathematik – von der vorschulischen Bildung bis zur Hochschule – publiziert. Dabei kann eine Vernetzung innerhalb der Mathematikdidaktik sowie mit den Bezugsdisziplinen einschließlich der Bildungsforschung durch eine integrative Forschungsmethodik zum Ausdruck gebracht werden. Die Reihe leistet so einen Beitrag zur theoretischen, strukturellen und empirischen Fundierung der Mathematikdidaktik im Zusammenhang mit der Qualifizierung von wissenschaftlichem Nachwuchs.
Weitere Bände in der Reihe http://www.springer.com/series/15969
Heiner Klock
Adaptive Interventionskompetenz inmathematischen Modellierungsprozessen Konzeptualisierung, Operationalisierung und Förderung
Heiner Klock Institut für Mathematik, Julius-Maximilians-Universität Würzburg, Würzburg, Deutschland Julius-Maximilians-Universität Würzburg, 2020 Tag der mündlichen Prüfung: 08.10.2019 Erstgutachter: Prof. Dr. Hans-Stefan Siller Zweitgutachter: Prof. Dr. Gilbert Greefrath
ISSN 2523-8604 ISSN 2523-8612 (electronic) Studien zur theoretischen und empirischen Forschung in der Mathematikdidaktik ISBN 978-3-658-31431-6 ISBN 978-3-658-31432-3 (eBook) https://doi.org/10.1007/978-3-658-31432-3 Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. © Der/die Herausgeber bzw. der/die Autor(en), exklusiv lizenziert durch Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2020 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von allgemein beschreibenden Bezeichnungen, Marken, Unternehmensnamen etc. in diesem Werk bedeutet nicht, dass diese frei durch jedermann benutzt werden dürfen. Die Berechtigung zur Benutzung unterliegt, auch ohne gesonderten Hinweis hierzu, den Regeln des Markenrechts. Die Rechte des jeweiligen Zeicheninhabers sind zu beachten. Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informationen in diesem Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder der Verlag, noch die Autoren oder die Herausgeber übernehmen, ausdrücklich oder implizit, Gewähr für den Inhalt des Werkes, etwaige Fehler oder Äußerungen. Der Verlag bleibt im Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutionsadressen neutral. Planung/Lektorat: Carina Reibold Springer Spektrum ist ein Imprint der eingetragenen Gesellschaft Springer Fachmedien Wiesbaden GmbH und ist ein Teil von Springer Nature. Die Anschrift der Gesellschaft ist: Abraham-Lincoln-Str. 46, 65189 Wiesbaden, Germany
Geleitwort
Die Betreuung mathematischer Modellierungsaktivitäten bei Lernenden ist und bleibt für Lehrkräfte eine große Herausforderung – ob im Regelunterricht oder bei Modellierungsprojekten. Vor allem Modellierungsaufgaben mit einem hohen Grad an Offenheit stellen aufgrund der Vielzahl an Lösungswegen und nicht vorhersehbarer Unterrichtssituationen hohe Anforderungen an Lehrkräfte. In den letzten Jahren sind zudem Interventionsstrategien als Einflussfaktor für Schülerleistungen in den Fokus der wissenschaftlichen Aufmerksamkeit gerückt. Beide Perspektiven ergeben zusammen ein neues Forschungsgebiet, in dem sich die vorliegende Arbeit bewegt. Herr Klock kombiniert in der vorliegenden Arbeit die beiden genannten Sichtweisen. Dabei baut er auf Forschungsergebnissen auf, nach denen Lehrkräfte in Modellierungssituationen zu direkt und auf einer inhaltlichen Ebene intervenieren, selten strategische Hilfestellungen verwenden sowie – teilweise unbewusst – beeinflussend in Richtung der favorisierten Lösung lenken. Solche Interventionen sind vor allem in kooperativen und selbsttätigen Modellierungsprozessen wenig geeignet. Der Diagnostik von Schwierigkeiten im Lösungsprozess kommt eine entscheidende Rolle zu. In Konsequenz müssen darauf basierend adaptive Interventionen ausgewählt werden, sodass Lernende adäquat beim aktiven Modellieren unterstützt werden. An dieser Stelle setzt die Arbeit von Heiner Klock an. Im Rahmen der „Qualitätsoffensive Lehrerbildung“ führte er eine Studie im Projekt „Modulare Schulpraxiseinbindung als Ausgangspunkt zur individuellen Kompetenzentwicklung“ im Teilprojekt I.I.2 „Lehr-Lern-Labore für eine praxisnahe forschungsbezogene Lehrer/innen-Ausbildung“ durch und konkretisierte Aspekte professioneller Kompetenz von (angehenden) Mathematiklehrkräften hinsichtlich der allgemeinen im Mathematikunterricht zu fördernden Kompetenz „mathematisch Modellieren“. Ziel
V
VI
Geleitwort
des Teilprojekts war insbesondere die Förderung professioneller Kompetenzen zum Lehren mathematischen Modellierens. Im Rahmen eines fachdidaktischen Seminars und einer Praxisphase im LehrLern-Labor wird eine zeitgemäße Theorie-Praxis-Vernetzung ermöglicht, um eine handlungsnahe Förderung der prozessbezogenen Kompetenz „mathematisch Modellieren“ zu ermöglichen. Ein besonderer Fokus des Seminars liegt auf adaptiven Lehrerinterventionen in Phasen der kooperativen Bearbeitung von Modellierungsaufgaben, d. h. auf der adaptiven Interventionskompetenz der angehenden Lehrkräfte. Die Notwendigkeit einer frühen Förderung dieser Kompetenz wird durch Studienergebnisse bestätigt: Selbst gut ausgebildete Lehrkräfte intervenieren nur wenig adaptiv in mathematischen Modellierungsprozessen. Mit der vorliegenden Arbeit von Herrn Klock werden wissenschaftlich-fundierte Forschungsergebnisse zu Lehrerinterventionen in mathematischen Modellierungsprozessen präsentiert, welche für die Professionalisierung von Lehrkräften in allen drei Phasen der Lehrerbildung relevant sind. So wird ein bemerkenswerter Beitrag zum Umgang mit Text- und Videoanalysen im Lehr-Lern-Labor-Seminar geleistet, der die Verbesserung der erwünschten Theorie-Praxis-Verknüpfung unterstützt. Zentral ist dabei die Evaluation professioneller Kompetenzen zum Lehren mathematischen Modellierens, um die universitäre – insbesondere die fachdidaktische – Lehre zu verbessern. Es wird gezeigt, dass anhand eines fachdidaktischen Seminars zum mathematischen Modellieren Teilkompetenzen der adaptiven Interventionskompetenz gesteigert und transmissive Überzeugungen verändert werden. Bemerkenswert ist insgesamt die Erkenntnis, dass der Nutzen und Anwendungsbezug mathematischen Modellierens von den Lehramtsstudierenden nach dem Seminar positiver bewertet wird. Insgesamt bieten die Analysen neue und interessante Einblicke in die Professionalisierung von angehenden Lehrkräften im Bereich des mathematischen Modellierens. Hans-Stefan Siller
Danksagung
Die vorliegende Arbeit entstand in drei spannenden aber auch fordernden Jahren. Durch einige Höhen und Tiefen haben mich in dieser Zeit viele Menschen begleitet. An dieser Stelle möchte ich diesen Personen meinen Dank für ihre Unterstützung während der Entstehungszeit meiner Dissertation aussprechen. In erster Linie möchte ich mich bei meinem Erstgutachter und Doktorvater Prof. Dr. Hans-Stefan Siller für das entgegengebrachte Vertrauen und die umfassende Unterstützung während meiner Promotionszeit bedanken. Nach meinem Studium erlaubte er es mir, meinen Forschungsinteressen frei nachzugehen. Die durch ihn ermöglichten Teilnahmen an nationalen und internationalen Tagungen trugen zur stetigen Weiterentwicklung meiner Arbeit und zur Erweiterung meines Horizonts bei. Ganz besonders wird mir die ICTMA-Tagung in Südafrika in Erinnerung bleiben. Nicht zuletzt stand er mir selbst jederzeit mit kritisch-konstruktiven Anmerkungen zur Seite. Auch meinem Zweitgutachter Prof. Dr. Gilbert Greefrath möchte ich für seine Unterstützung danken. Durch die gute Zusammenarbeit sind gemeinsame Ideen und Publikationen entstanden, die auch das Promotionsvorhaben vorangetrieben haben. Das Interesse an meinem Thema und die kritischen Rückmeldungen ermöglichten mir eine stetige Weiterentwicklung meiner Arbeit. Insbesondere möchte ich mich bei seinem Doktoranden Raphael Wess für die freundschaftliche Zusammenarbeit bei der Durchführung der Studie bedanken. Die Kooperation ermöglichte es uns, gemeinsame Ziele zu erreichen und die Qualität unserer Arbeiten zu steigern. Ohne den gegenseitigen Austausch auf theoretischer und insbesondere methodischer Ebene wäre die Anfertigung unserer Dissertationen in dieser Form nicht möglich gewesen. Die gemeinsamen Tagungsteilnahmen und das gemeinsame Arbeiten an Publikationen sind mit dir immer eine Freude.
VII
VIII
Danksagung
Die Dissertation ist im Rahmen des Projekts MoSAiK an der Universität Koblenz-Landau entstanden, bei dessen Mitarbeiterinnen und Mitarbeitern ich mich für die kollegiale Zusammenarbeit in den vergangenen drei Jahren bedanke. Dabei gebührt ein besonderer Dank den Doktoranden am Campus Koblenz, die die Arbeit durch die freundschaftliche Atmosphäre und den engen Zusammenhalt nicht nur unverwechselbar gemacht haben, sondern in den Doktorandenkolloquien durch ihre Kommentare aus den unterschiedlichsten Fachdisziplinen häufig neue Perspektiven eröffneten. Besonderer Dank gilt in diesem Zusammenhang meinen Kolleginnen und „Doktorschwestern“ Jennifer Lung und Katharina Manderfeld, die mit mir gemeinsam am Mathematischen Institut der Universität Koblenz-Landau am Campus Koblenz und im Projekt MoSAiK tätig waren. In der Promotionszeit habe ich mit euch zusammen vieles durchgestanden. Dass ihr bei Problemen stets als Ansprechpartner zur Verfügung standet und wir gemeinsam nach Lösungen suchen konnten, war ein großer Gewinn für mich. Ohne eure Unterstützung und das gegenseitige Motivieren wäre der Abschluss der Arbeit in dieser Zeit ebenfalls nicht möglich gewesen. Für ihr Engagement und ihre Unterstützung bei der Korrektur meiner Arbeit möchte ich mich bei Dr. Daniel Habeck, Nicole Stürz und Normen Klock bedanken. Bei der Fertigstellung der Dissertation ward ihr eine große Hilfe. Auf die Anfertigung meiner Promotionsarbeit konnte ich mich voll und ganz konzentrieren, da mir meine Familie großen Rückhalt gab. Mein größter Dank gilt meiner Frau Katharina, die mich in der Promotionsphase in jeglicher Form unterstützt hat. Als Lehrerin hast du mich in meiner Arbeit durch deinen unmittelbaren Praxisbezug oft geerdet und auf den Boden der Tatsachen zurückgeholt. Ich war und bin sehr dankbar, dich an meiner Seite zu wissen.
Inhaltsverzeichnis
1
Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1 Motivation und Ausgangspunkt der Arbeit . . . . . . . . . . . . . . . . . . 1.2 Ziele der Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Gliederung der Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Teil I 2
1 2 4 5
Theoretischer Hintergrund
Mathematisches Modellieren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 Mathematisches Modell und Modellieren . . . . . . . . . . . . . . . . . . . 2.2 Modellierungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Mathematische Modellierungskompetenz . . . . . . . . . . . . . . . . . . . 2.3.1 Kompetenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.2 Modellierungskompetenz . . . . . . . . . . . . . . . . . . . . . . . . . 2.4 Modellierungsprozess . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1 Modellierungskreislauf . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.2 Individuelle Modellierungsverläufe . . . . . . . . . . . . . . . . 2.4.3 Gruppenverläufe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Schwierigkeiten im Modellierungsprozess . . . . . . . . . . . . . . . . . . 2.5.1 Studien zu Fehlern, Blockaden und Schwierigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.2 Begriff der Schwierigkeit . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.3 Kategorien von Schwierigkeiten im Modellierungsprozess . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6 Zwischenfazit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9 10 12 20 20 23 26 27 30 32 38 38 43 44 46
IX
X
3
4
5
6
Inhaltsverzeichnis
Interventionen in kooperativen Modellierungsprozessen . . . . . . . . . 3.1 Konstruktivismus, kooperatives und selbstgesteuertes Lernen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.1 Konstruktivistisches Lehr-Lern-Verständnis . . . . . . . . . 3.1.2 Selbstgesteuertes und selbstreguliertes Lernen . . . . . . . 3.1.3 Kooperatives Lernen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Instruktion und Intervention . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Interventionskonzepte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 Tutoring . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.2 Scaffolding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.3 Gestuftes Intervenieren . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.4 Adaptives Intervenieren . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4 Zwischenfazit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Empirische Befunde zu Interventionen . . . . . . . . . . . . . . . . . . . . . . . . . 4.1 Ausgewählte deskriptive Befunde . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.1 Deskriptive Befunde für kooperative Bearbeitungsprozesse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.2 Deskriptive Befunde für kooperative Modellierungsprozesse . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Wirksamkeit von Instruktionen und Interventionen . . . . . . . . . . . 4.2.1 Wirksamkeit von Instruktionen . . . . . . . . . . . . . . . . . . . . 4.2.2 Wirksamkeit von Interventionen . . . . . . . . . . . . . . . . . . . 4.3 Förderung eines adaptiven Interventionsverhaltens . . . . . . . . . . . 4.3.1 Förderung diagnostischer Kompetenzen . . . . . . . . . . . . 4.3.2 Förderung von Diagnose- und Interventionskompetenzen . . . . . . . . . . . . . . . . . . . . . . . . 4.4 Zwischenfazit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
49 50 50 53 55 58 61 64 68 77 82 86 91 91 92 97 102 102 112 124 124 126 128
Adaptive Interventionskompetenz in kooperativen Modellierungsprozessen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1 Diagnostizieren in kooperativen Modellierungsprozessen . . . . . 5.2 Intervenieren in kooperativen Modellierungsprozessen . . . . . . . 5.3 Prozessmodell adaptiver Interventionen . . . . . . . . . . . . . . . . . . . .
133 134 137 140
Professionelle Kompetenz zum Lehren mathematischen Modellierens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1 Professionelle Kompetenz von Lehrkräften . . . . . . . . . . . . . . . . . 6.1.1 Professionelle Kompetenz . . . . . . . . . . . . . . . . . . . . . . . .
143 144 144
Inhaltsverzeichnis
6.1.2
6.2 6.3
7
Konzeptualisierungen der professionellen Kompetenz von Mathematiklehrkräften . . . . . . . . . . . . . Fachdidaktische Kompetenzen zum Lehren mathematischen Modellierens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Strukturmodell der professionellen Kompetenz zum Lehren mathematischen Modellierens . . . . . . . . . . . . . . . . . . . . . . 6.3.1 Modellierungsspezifisches fachdidaktisches Wissen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3.2 Überzeugungen zum mathematischen Modellieren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3.3 Selbstwirksamkeitserwartungen zum mathematischen Modellieren . . . . . . . . . . . . . . . . . . . . . . 6.3.4 Empirische Validierung des Strukturmodells . . . . . . . .
XI
Forschungsfragen und Hypothesen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.1 Dimensionsanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Veränderungsanalysen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.3 Zusammenhangsanalysen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.3.1 Analyse von Einflussfaktoren . . . . . . . . . . . . . . . . . . . . . 7.3.2 Analyse von Zusammenhängen . . . . . . . . . . . . . . . . . . . .
Teil II
147 150 152 153 156 158 159 163 163 164 168 168 171
Methodischer Ansatz der Studie
8
Design der Studie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.1 Methodologischer Ansatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.2 Forschungsdesign . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3 Stichprobe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.4 Treatments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.4.1 Treatment in der EG Koblenz . . . . . . . . . . . . . . . . . . . . . 8.4.2 Treatment in der EG Münster . . . . . . . . . . . . . . . . . . . . . 8.4.3 Treatments in der Kontrollgruppe . . . . . . . . . . . . . . . . . . 8.5 Modellierungsbeispiele aus der EG Koblenz . . . . . . . . . . . . . . . . 8.5.1 Der aufwärtsrollende Doppelkegel . . . . . . . . . . . . . . . . . 8.5.2 Blockabfertigung am Tauern-Tunnel . . . . . . . . . . . . . . .
175 175 176 179 182 182 199 201 203 204 208
9
Methoden der Datenerhebung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.1 Entwicklung des Instruments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.2 Fragebogeninstrument . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.2.1 Selbstberichtete Vorerfahrungen zum mathematischen Modellieren . . . . . . . . . . . . . . . . . . . . . .
215 216 217 217
XII
Inhaltsverzeichnis
9.2.2
9.3
9.4
Überzeugungen zum mathematischen Modellieren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.2.3 Selbstwirksamkeitserwartungen zum mathematischen Modellieren . . . . . . . . . . . . . . . . . . . . . . Testinstrument . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.3.1 Diagnosekompetenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.3.2 A-priori-Interventionskompetenz . . . . . . . . . . . . . . . . . . Durchführung der Datenerhebung . . . . . . . . . . . . . . . . . . . . . . . . .
10 Auswertungsmethodik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.1 Testgütekriterien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.2 Kodierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.2.1 Kodierung des Fragebogen- und Testinstruments . . . . . 10.2.2 Umgang mit fehlenden Werten . . . . . . . . . . . . . . . . . . . . 10.3 Klassische Skalierung der Daten des Fragebogeninstruments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.4 Probabilistische Testtheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.4.1 Itemfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.4.2 Dichotome probabilistische Testmodelle . . . . . . . . . . . . 10.4.3 Rasch-Modelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.4.4 Mehrdimensionale Rasch-Modelle . . . . . . . . . . . . . . . . . 10.4.5 Schätzung der Item- und Personenparameter . . . . . . . . 10.4.6 Schätzung der Reliabilität . . . . . . . . . . . . . . . . . . . . . . . . 10.4.7 Prüfung der Modellgeltung . . . . . . . . . . . . . . . . . . . . . . . 10.4.8 Probabilistische Skalierung der Daten des Testinstruments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.5 Ein- und zweifaktorielle Varianzanalyse mit Messwiederholung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.5.1 Prinzip der einfaktoriellen Varianzanalyse mit Messwiederholung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.5.2 Prinzip der zweifaktoriellen Varianzanalyse mit Messwiederholung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.5.3 Interpretation der Effektstärken . . . . . . . . . . . . . . . . . . . . 10.5.4 Teststärke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.5.5 Prüfung der Voraussetzungen . . . . . . . . . . . . . . . . . . . . . 10.6 Multiple lineare Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.6.1 Lineares Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.6.2 Interpretation der Regressionsgewichte . . . . . . . . . . . . . 10.6.3 Beurteilung der Modellanpassung . . . . . . . . . . . . . . . . . .
219 221 222 225 228 229 233 234 240 240 241 243 245 246 248 250 252 255 258 259 264 268 269 270 270 272 272 274 274 276 277
Inhaltsverzeichnis
10.6.4 Lineare Modelle mit Dummy-Variablen . . . . . . . . . . . . 10.6.5 First-Difference-Modelle . . . . . . . . . . . . . . . . . . . . . . . . . 10.6.6 Prüfung der Voraussetzungen . . . . . . . . . . . . . . . . . . . . . Teil III
XIII
278 280 281
Ergebnisse der Studie
11 Dimensionsanalyse, Modellprüfung und Skalierung . . . . . . . . . . . . . 11.1 Modellvergleich und globaler Modelltest . . . . . . . . . . . . . . . . . . . 11.2 Klassische Itemanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.3 Prüfung der Itemhomogenität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.4 Prüfung der Personenhomogenität . . . . . . . . . . . . . . . . . . . . . . . . . 11.5 Reliabilität der Messung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
287 287 290 293 295 299
12 Veränderungsanalysen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.1 Veränderung von Diagnosekompetenzen . . . . . . . . . . . . . . . . . . . 12.1.1 Veränderungen innerhalb der Gruppen . . . . . . . . . . . . . . 12.1.2 Vergleich der Veränderungen zwischen den Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.2 Veränderung von a-priori-Interventionskompetenzen . . . . . . . . . 12.2.1 Veränderungen innerhalb der Gruppen . . . . . . . . . . . . . . 12.2.2 Vergleich der Veränderungen zwischen den Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.3 Veränderung von Überzeugungen zum mathematischen Modellieren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.3.1 Veränderungen innerhalb der Gruppen . . . . . . . . . . . . . . 12.3.2 Vergleich der Veränderungen zwischen den Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.4 Veränderung von Selbstwirksamkeitserwartungen zum mathematischen Modellieren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.4.1 Veränderungen innerhalb der Gruppen . . . . . . . . . . . . . . 12.4.2 Vergleich der Veränderungen zwischen den Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
303 304 304
13 Zusammenhangsanalysen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.1 Einflussfaktoren für die Veränderungen . . . . . . . . . . . . . . . . . . . . 13.1.1 Einflussfaktoren für die Veränderung der Diagnosekompetenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.1.2 Einflussfaktoren für die Veränderung der a-priori-Interventionskompetenz . . . . . . . . . . . . . . . . . . . 13.1.3 Korrigierte Schätzung der Veränderungen . . . . . . . . . . .
306 308 308 310 312 312 316 319 320 322 325 325 326 333 342
XIV
Inhaltsverzeichnis
13.2 Zusammenhänge zwischen den Konstrukten . . . . . . . . . . . . . . . . 13.2.1 Zusammenhänge mit der Diagnosekompetenz . . . . . . . 13.2.2 Zusammenhänge mit der a-priori-Interventionskompetenz . . . . . . . . . . . . . . . . . . .
347 348 352
14 Zusammenfassung und Diskussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.1 Diskussion der Studienergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . 14.1.1 Diskussion der Dimensionsanalyse . . . . . . . . . . . . . . . . . 14.1.2 Diskussion der Veränderung der adaptiven a-priori-Interventionskompetenz . . . . . . . . . . . . . . . . . . . 14.1.3 Diskussion der identifizierten Einflussfaktoren . . . . . . . 14.1.4 Diskussion der Veränderung von Überzeugungen und Selbstwirksamkeitserwartungen zum mathematischen Modellieren . . . . . . . . . . . . . . . . . . . . . . 14.1.5 Diskussion der Zusammenhänge zwischen den Konstrukten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.2 Diskussion des methodologischen Ansatzes und Studiendesigns . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.3 Diskussion des Testinstruments . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.4 Fazit und Ausblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
361 361 362
Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
393
365 368
373 376 383 384 388
Abbildungverzeichnis
Abbildung 2.1 Abbildung 2.2 Abbildung 2.3 Abbildung 2.4 Abbildung 2.5 Abbildung 2.6 Abbildung 3.1 Abbildung 3.2 Abbildung 3.3 Abbildung 5.1 Abbildung 6.1
Abbildung 6.2 Abbildung 6.3
Funktionen von Modellen (Greefrath et al., 2013) . . . . . Kompetenz als Kontinuum (Blömeke et al., 2015, S. 7) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Modellierungskreislauf nach Leiss (2007, S. 31) . . . . . . Flowchart eines „poor modelling“ (Treilibs et al., 1980, S. 47) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Flowchart eines „good modelling“ (Treilibs et al., 1980, S. 49) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Auszug des Emergent Frameworks nach Galbraith und Stillman (2006) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Konzeptuelles Modell des Scaffolding nach van de Pol et al. (2010) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Model of Contingent Teaching (Van de Pol, Volman, Oort, & Beishuizen, 2014) . . . . . . . . . . . . . . . . . Prozessmodell adaptiver Interventionen nach Leiss (2007, S. 82) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Prozessmodell adaptiver Interventionen . . . . . . . . . . . . . Professionelle Kompetenz zum Lehren mathematischen Modellierens. (Klock et al., 2019; Wess et al., angenommen) . . . . . . . . . . . . . . . . . . . . . . . . Einordnung der adaptiven a-priori-Interventionskompetenz . . . . . . . . . . . . . . . . . . . Strukturgleichungsanalyse zur professionellen Kompetenz zum Lehren mathematischen Modellierens (Klock et al., 2019; Wess et al., angenommen) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12 23 27 34 35 42 72 74 83 140
152 155
160
XV
XVI
Abbildung 8.1 Abbildung 8.2 Abbildung 8.3 Abbildung 8.4 Abbildung 8.5 Abbildung 8.6 Abbildung 9.1 Abbildung 9.2 Abbildung 9.3
Abbildung 9.4 Abbildung 9.5 Abbildung 9.6 Abbildung 9.7 Abbildung 10.1 Abbildung 10.2 Abbildung 10.3 Abbildung 10.4 Abbildung 10.5 Abbildung 10.6 Abbildung 10.7 Abbildung 10.8 Abbildung 10.9 Abbildung 11.1
Abbildungverzeichnis
Design der Studie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Struktur des fachdidaktischen Seminars in Koblenz . . . . Modellierungsaufgabe »Der aufwärtsrollende Doppelkegel« . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Skizzen zum aufwärtsrollenden Doppelkegel (Becker, 2017) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Modellierungsaufgabe »Blockabfertigung im Tauerntunnel« . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Schematische Darstellung der Blockabfertigung . . . . . . Situationswissen zu den Anforderungssituationen (Klock & Wess, 2018) . . . . . . . . . . . . . . . . . . . . . . . . . . . . Aufgabenvignette Stau (K. Maaß & Gurlitt, 2010) . . . . . Beispielitem zur Diagnostik der Modellierungsphase (Klock & Wess, 2018, S. 29) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Beispielitem zur Diagnostik der Schwierigkeit (Klock & Wess, 2018, S. 29) . . . . . . . . . . . . . . . . . . . . . . Beispielitem zur Festlegung des Förderziels (Klock & Wess, 2018, S. 29) . . . . . . . . . . . . . . . . . . . . . . . . . . . . Beispielitems zur a-priori-Interventionskompetenz (Klock & Wess, 2018, S. 30) . . . . . . . . . . . . . . . . . . . . . . Instruktionsfolie zum Testinstrument . . . . . . . . . . . . . . . . Modell kongenerischer Messungen der klassischen Testtheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rasch-Modell (1-Parameter-Logistic-Modell) . . . . . . . . Birnbaum-Modell (2-Parameter-Logistic-Modell) . . . . . 3-Parameter-Logistic-Modell . . . . . . . . . . . . . . . . . . . . . . Mehrdimensionale Item-Response-TheoryModelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Modelle zur Skalierung der adaptiven a-priori-Interventionskompetenz . . . . . . . . . . . . . . . . . . . Ansatz virtueller Personen nach Hartig & Kühnbach (2006, S. 34) . . . . . . . . . . . . . . . . . . . . . . . . . . Ansatz virtueller Items nach Hartig und Kühnbach (2006, S. 35) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vierdimensionales Between-Item-Modell . . . . . . . . . . . . Grafischer Modelltest für das Teilungskriterium Geschlecht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
177 184 204 206 209 210 223 224
226 227 227 228 230 247 249 249 250 253 254 265 267 268 296
Abbildungverzeichnis
Abbildung 11.2 Abbildung 11.3
Abbildung 12.1 Abbildung 12.2 Abbildung 12.3
Abbildung 12.4
Abbildung 12.5
Abbildung 12.6
Grafischer Modelltest für das Teilungskriterium Summenscore . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Verteilungen der Personen- (jeweils links) und Itemparameter (jeweils rechts) in den latenten Dimensionen in Pre- und Posttest . . . . . . . . . . . . . . . . . . Box-Plots der Diagnosekompetenz in Pre- und Posttest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Box-Plots der a-priori-Interventionskompetenz in Pre- und Posttest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Box-Plots der Überzeugungen zum mathematischen Modellieren in der EG Koblenz in Pre- und Posttest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Box-Plots der Überzeugungen zum mathematischen Modellieren in der Kontrollgruppe in Pre- und Posttest . . . . . . . . . . . . . . . . . Box-Plots der Selbstwirksamkeitserwartungen zum mathematischen Modellieren in der EG Koblenz in Pre- und Posttest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Box-Plots der Selbstwirksamkeitserwartungen zum mathematischen Modellieren in der Kontrollgruppe in Pre- und Posttest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
XVII
296
301 305 309
313
314
320
321
Tabellenverzeichnis
Tabelle 2.1 Tabelle 2.2 Tabelle 2.3 Tabelle 2.4 Tabelle 3.1 Tabelle 3.2 Tabelle 4.1 Tabelle 4.2 Tabelle 4.3 Tabelle 4.4 Tabelle 4.5 Tabelle 4.6 Tabelle 6.1 Tabelle 6.2
Klassische Aufgabentypen (Greefrath, 2010a) . . . . . . . . . . Kategoriensystem für Aufgaben nach Maaß (2010) . . . . . . Kategorien der Offenheit einer Aufgabe (Bruder, 2003; K. Maaß, 2010) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kategoriensystem für Schwierigkeiten im Modellierungsprozess . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Merkmale des selbstregulierenden und kooperativen Lernprozesses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Merkmale der Konzepte Scaffolding, gestuftes und adaptives Intervenieren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kategoriensystem für Interventionen nach Fürst (1999, S. 129 ff.) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kategorien individueller Lernunterstützungen nach Krammer (2009, S. 168) . . . . . . . . . . . . . . . . . . . . . . . . . . . . Effektstärken der Metastudie nach Lazonder und Harmsen (2016, S. 701 f.) . . . . . . . . . . . . . . . . . . . . . . . . . . Gesprächsmuster guter Interventionen nach Link (2011, S. 177 ff.) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Gründe für den Erfolg von Interventionen (Stender, 2016, S. 206 ff.) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Empirisch wirksame Arten von Hilfestellungen . . . . . . . . . Konzeptualisierungen der professionellen Kompetenz von (angehenden) Lehrkräften . . . . . . . . . . . . . . . . . . . . . . . Kompetenzen zum Lehren mathematischen Modellierens (Borromeo Ferri, 2018, S. 5; Übersetzung durch den Autor) . . . . . . . . . . . . . . . . . . . . . . .
14 15 18 45 87 88 93 96 104 116 120 131 149
150
XIX
XX
Tabelle 8.1 Tabelle 8.2 Tabelle 8.3 Tabelle 9.1
Tabelle 9.2 Tabelle 9.3
Tabelle 9.4 Tabelle 10.1 Tabelle 10.2 Tabelle 11.1 Tabelle 11.2 Tabelle 11.3 Tabelle 11.4 Tabelle 11.5
Tabelle 11.6 Tabelle 11.7 Tabelle 12.1 Tabelle 12.2 Tabelle 12.3 Tabelle 12.4
Tabelle 12.5
Tabellenverzeichnis
Stichprobenbeschreibung . . . . . . . . . . . . . . . . . . . . . . . . . . . Einordnung der Modellierungsaufgabe »Der aufwärtsrollende Doppelkegel« . . . . . . . . . . . . . . . . . . . . . . Einordnung der Modellierungsaufgabe »Blockabfertigung im Tauerntunnel« . . . . . . . . . . . . . . . . . Beispielitems zu den selbstberichteten Vorerfahrungen zum mathematischen Modellieren (Klock & Wess, 2018) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Beispielitems zu den Überzeugungen zum mathematischen Modellieren (Klock & Wess, 2018) . . . . . Beispielitems zu den Selbstwirksamkeitserwartungen zum mathematischen Modellieren (Klock & Wess, 2018) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Probandenzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Anzahl der Items und Reliabilitäten der Ratingskalen . . . . Dummy-Kodierung der Gruppen-Variablen . . . . . . . . . . . . Modellanpassung der Rasch-Modelle . . . . . . . . . . . . . . . . . Korrelationen der latenten Dimensionen . . . . . . . . . . . . . . . Lösungshäufigkeiten und Trennschärfen der Diagnoseitems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lösungshäufigkeiten und Trennschärfen der Interventionsitems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Itemschwierigkeiten, gewichtete Abweichungsquadrate und t-Werte der Items . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Differential Item Functioning . . . . . . . . . . . . . . . . . . . . . . . . EAP-/PV- und WLE Reliabilitäten in Pre- und Posttest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Einfaktoriellen Varianzanalysen mit Messwiederholung für die Diagnosekompetenz . . . . . . . . . Modellanpassung der multiplen linearen Regression für die Diagnosekompetenz . . . . . . . . . . . . . . . . . . . . . . . . . Regressionskoeffizienten der multiplen linearen Regression für die Diagnosekompetenz . . . . . . . . . . . . . . . Einfaktorielle Varianzanalysen mit Messwiederholung für die a-priori-Interventionskompetenz . . . . . . . . . . . . . . . . . . . . . Modellanpassungen der multiplen linearen Regression für die a-priori-Interventionskompetenz . . . . .
180 208 213
218 220
221 231 245 278 289 289 291 292
293 297 300 305 306 307
309 310
Tabellenverzeichnis
Tabelle 12.6 Tabelle 12.7
Tabelle 12.8 Tabelle 12.9 Tabelle 12.10
Tabelle 12.11
Tabelle 12.12
Tabelle 13.1 Tabelle 13.2
Tabelle 13.3
Tabelle 13.4
Tabelle 13.5
Tabelle 13.6 Tabelle 13.7
Regressionskoeffizienten der multiplen linearen Regression für die a-priori-Interventionskompetenz . . . . . Einfaktorielle Varianzanalysen mit Messwiederholung für die Überzeugungen zum mathematischen Modellieren . . . . . . . . . . . . . . . . . . . . Modellanpassungen für die Überzeugungen zum mathematischen Modellieren . . . . . . . . . . . . . . . . . . . . . . . . Regressionskoeffizienten für die Überzeugungen zum mathematischen Modellieren . . . . . . . . . . . . . . . . . . . . Einfaktorielle Varianzanalysen mit Messwiederholung für die Selbstwirksamkeitserwartungen zum mathematischen Modellieren . . . . . . . . . . . . . . . . . . . . . . . . Modellanpassungen für die Selbstwirksamkeitserwartungen zum mathematischen Modellieren . . . . . . . . . . . . . . . . . . . . . . . . Regressionskoeffizienten für die Selbstwirksamkeitserwartungen zum mathematischen Modellieren . . . . . . . . . . . . . . . . . . . . . . . . Korrelationen der Kontrollvariablen mit der Diagnosekompetenz im Posttest . . . . . . . . . . . . . . . . . . . . . Modellanpassungen für die um die Pretest-Variablen erweiterten Modelle zur Vorhersage der Diagnosekompetenz im Posttest . . . . . . . . . . . . . . . . . . . . . Regressionskoeffizienten der um die Pretest-Variablen erweiterten Modelle zur Vorhersage der Diagnosekompetenz im Posttest . . . . . . . . Modellanpassungen der um die Posttest-Variablen erweiterten Modelle zur Vorhersage der Diagnosekompetenz im Posttest . . . . . . . . . . . . . . . . . . . . . Regressionskoeffizienten der um die Posttest-Variablen erweiterten Modelle zur Vorhersage der Diagnosekompetenz im Posttest . . . . . . . . Korrelationen der Kontrollvariablen mit a-priori-Interventionskompetenz im Posttest . . . . . . . . . . . Modellanpassungen die um die Pretest-Variablen erweiterten Modelle zur Vorhersage der a-priori-Interventionskompetenz im Posttest . . . . . . . . . . .
XXI
311
316 317 318
322
323
323 327
328
330
331
332 333
335
XXII
Tabelle 13.8
Tabelle 13.9
Tabelle 13.10
Tabelle 13.11
Tabelle 13.12 Tabelle 13.13 Tabelle 13.14
Tabelle 13.15
Tabelle 13.16
Tabelle 13.17
Tabellenverzeichnis
Regressionskoeffizienten der um die Pretest-Variablen erweiterten Modelle zur Vorhersage der a-priori-Interventionskompetenz im Posttest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Modellanpassungen die um die Posttest-Variablen erweiterten Modelle zur Vorhersage der a-priori-Interventionskompetenz im Posttest . . . . . . . . . . . Regressionskoeffizienten der um die Pretest-Variablen erweiterten Modelle zur Vorhersage der a-priori-Interventionskompetenz im Posttest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Änderungen der Partialkorrelationen und des multiplen Determinationskoeffizienten durch das Vorwärtsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Modellanpassungen der um die prädiktiven Kontrollvariablen korrigierten Regressionen . . . . . . . . . . . Regressionskoeffizienten der um die prädiktiven Kontrollvariablen korrigierten Regressionen . . . . . . . . . . . Korrelationen der Differenzskalen der Facetten professioneller Kompetenz zum Lehren mathematischen Modellierens und der Diagnosekompetenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Modellanpassung des First-Difference-Modells zum Zusammenhang zwischen Überzeugungen zum mathematischen Modellieren und der Diagnosekompetenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Regressionskoeffizient des First-Difference-Modells zum Zusammenhang zwischen Überzeugungen zum mathematischen Modellieren und der Diagnosekompetenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Modellanpassungen der First-Difference-Modelle zum Zusammenhang zwischen Selbstwirksamkeitserwartungen zum mathematischen Modellieren und der Diagnosekompetenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
337
340
341
343 344 345
348
349
350
351
Tabellenverzeichnis
Tabelle 13.18
Tabelle 13.19
Tabelle 13.20
Tabelle 13.21
Tabelle 13.22
Tabelle 13.23
Tabelle 13.24
Tabelle 13.25
Regressionskoeffizienten der First-Difference-Modelle zum Zusammenhang zwischen Selbstwirksamkeitserwartungen zum mathematischen Modellieren und der Diagnosekompetenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Korrelationen der Differenzskalen zu Aspekten professioneller Kompetenz zum Lehren mathematischen Modellierens und der a-priori-Interventionskompetenz . . . . . . . . . . . . . . . . . . . . . Modellanpassung des First-Difference-Modells zum Zusammenhang zwischen der Diagnose- und a-priori-Interventionskompetenz . . . . . . . . . . . . . . . . . . . . . Regressionskoeffizient des First-Difference-Modells zum Zusammenhang zwischen der Diagnose- und a-priori-Interventionskompetenz . . . . . . . . . . . . . . . . . . . . . Modellanpassungen der First-Difference-Modelle zum Zusammenhang zwischen Überzeugungen zum mathematischen Modellieren und der a-priori-Interventionskompetenz . . . . . . . . . . . . . . . . . . . . . Regressionskoeffizienten der First-Difference-Modelle zum Zusammenhang zwischen Überzeugungen zum mathematischen Modellieren und der a-priori-Interventionskompetenz . . . . Modellanpassungen der First-Difference-Modelle zum Zusammenhang zwischen Selbstwirksamkeitserwartungen zum mathematischen Modellieren und der a-priori-Interventionskompetenz . . . . . . . . . . . . . . . . . . . . . Regressionskoeffizienten der First-Difference-Modelle zum Zusammenhang zwischen Selbstwirksamkeitserwartungen zum mathematischen Modellieren und der a-priori-Interventionskompetenz . . . . . . . . . . . . . . . . . . . . .
XXIII
352
353
354
354
355
356
358
359
1
Einleitung
Interventionen in Gruppenarbeitsprozessen stellen eine tägliche Anforderungssituation für Lehrkräfte dar. Dass Schülerinnen und Schüler während der kooperativen Bearbeitung von Aufgaben durch den Lehrer oder die Lehrerin unterstützt werden, erscheint selbstverständlich. Doch wie interveniert eine Lehrkraft in Gruppenarbeitsprozessen optimal? Über welche Kompetenzen muss sie verfügen, um Lernen möglichst effektiv zu begleiten? Beide Fragestellungen lassen sich nicht in einem Satz beantworten und hängen von zahlreichen Merkmalen der betrachteten LehrLern-Situation ab. Die mathematikdidaktische Forschung liefert zu beiden Fragen noch keine systematische und umfassende Antwort. Ein Bereich, in dem Interventionen unter anderem beforscht wurden, sind mathematische Modellierungsprozesse (z. B. Blum & Schukajlow, 2018; Leiss, 2007; Stender, 2016), die das zweite Kernthema der vorliegenden Arbeit bilden. Durch die Offenheit von Modellierungsprozessen und ihrer Lösungsvielfalt stellen sie besondere Anforderungen an Lehrkräfte. Der Förderung von Modellierungskompetenzen im Mathematikunterricht kommt mittlerweile eine immer größer werdende Bedeutung zu. Die vorliegende Arbeit widmet sich im Anschluss an die obigen Forschungsarbeiten Interventionen in mathematischen Modellierungsprozessen. Dabei wird eine hochschuldidaktische Perspektive eingenommen, indem im Rahmen einer Interventionsstudie die Förderung adaptiver Interventionskompetenzen von Mathematik-Lehramtsstudierenden untersucht werden.
© Der/die Herausgeber bzw. der/die Autor(en), exklusiv lizenziert durch Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2020 H. Klock, Adaptive Interventionskompetenz in mathematischen Modellierungsprozessen, Studien zur theoretischen und empirischen Forschung in der Mathematikdidaktik, https://doi.org/10.1007/978-3-658-31432-3_1
1
2
1.1
1
Einleitung
Motivation und Ausgangspunkt der Arbeit
Das mathematische Modellieren wird von Mathematik-Lehramtsstudierenden im Vergleich zu anderen „Big Ideas“ im Mathematikunterricht, wie z. B. der funktionalen Abhängigkeit, als relativ unbedeutend empfunden, insbesondere im direkten Vergleich zu Studierenden aus Österreich (Siller, Kuntze, Lerman, & Vogl, 2011a, 2011b). Kuntze und Zöttl (2008) stellen fest, dass Aufgaben mit einem hohen Modellierungsgehalt von Mathematik-Lehramtsstudierenden ein geringes Lernpotential beigemessen wird, wohingegen Aufgaben mit einem geringen Modellierungsgehalt konsistent positiv bewertet werden (Kuntze & Zöttl, 2008). Diese Erkenntnisse stehen in Kontrast zur Bedeutung, die der Förderung von Modellierungskompetenzen im Mathematikunterricht zukommt. So beinhalten alle vier Dimensionen der mathematischen Allgemeinbildung nach Graumann (2015) Aspekte, die durch die kooperative Bearbeitung von Modellierungsaufgaben im Mathematikunterricht adressiert werden. Blum und Niss (1991, S. 42 ff.) geben fünf Argumente für die Förderung mathematischer Modellierungskompetenzen im Unterricht an: • Das formative Argument. Erwerb allgemeiner Kompetenzen und Einstellungen zur Förderung sowohl kreativer Forschungs- und Problemlösefähigkeiten als auch der Offenheit und des Selbstvertrauens gegenüber eigenen Fähigkeiten. • Das Argument der kritischen Kompetenz. Erwerb von Fähigkeiten zur kritischen Beurteilung der Nutzung von Mathematik in der Gesellschaft (Erkennen, Verstehen, Analysieren und Beurteilen der Nutzung von Mathematik zur Lösung sozial bedeutsamer Probleme der Gesellschaft). • Das Nützlichkeits-Argument. Erwerb von Fähigkeiten zur Nutzung von Mathematik in außermathematischen Kontexten, in denen sie als Instrument zur Lösung von aktuellen oder zukünftigen Problemen der Schülerinnen und Schüler notwendig ist. • Das Argument zum Bild der Mathematik. Erwerb eines reichen und umfassenden Bildes der Mathematik in all seinen Facetten, als eine Wissenschaft, eine gesellschaftliche Aktivität und als ein Kulturgut. • Das Argument zur Förderung des Lernens von Mathematik. Eignung mathematischen Modellierens, die Motivation zum Lernen und Behalten mathematischer Konzepte, Begriffe, Methoden und Ergebnisse zu fördern, da Einsichten in die Relevanz von Mathematik gegeben werden. Aufgrund dieser Argumente hat das mathematische Modellieren einen berechtigten Platz in einem modernen und allgemeinbildenden Mathematikunterricht und stellt
1.1 Motivation und Ausgangspunkt der Arbeit
3
eine von sechs allgemeinen Kompetenzen in den Bildungsstandards dar (KMK, 2004, 2015). Daraus folgt, dass das mathematische Modellieren auch in der Lehrerausbildung1 berücksichtigt werden muss (K. Maaß, 2004, S. 288 f.; Siller et al., 2011a, 2011b). Neben dem eigenen Erwerb von Modellierungskompetenzen ist die unterrichtliche Inszenierung von Modellierungsprozessen ein relevantes Thema für die hochschulische Lehrerausbildung. Die kooperative Bearbeitung von Modellierungsaufgaben ist eine geeignete Sozialform (Clohessy & Johnson, 2017; Ikeda & Stephens, 1998). Aufgrund der besonderen Anforderungen von Modellierungsprozessen stellen selbst für erfahrene und gut ausgebildete Lehrkräfte Interventionen in diesen Gruppenarbeitsprozessen eine große Herausforderung dar. Studienergebnisse zeigen, dass Lehrkräfte in Gruppenarbeitsphasen ein hohes Kontroll- und Lenkungsbedürfnis besitzen, sich bei Interventionen häufig wenig am Lösungsweg der Lernenden orientieren und bevorzugt direktiv und auf einem geringen Anspruchsniveau intervenieren (Fürst, 1999; Leiss, 2007). So können selbst Interventionen gut ausgebildeter SINUS-Lehrkräfte (Baptist & Raab, 2007) in mathematischen Modellierungsprozessen in großen Teilen nur als wenig adaptiv klassifiziert werden (Tropper, Leiss, & Hänze, 2015). Dabei existieren Hinweise, dass ein adaptives Interventionsverhalten der Lehrkraft entscheidend für einen hohen Lernzuwachs bei Schülerinnen und Schülern ist (Blum & Schukajlow, 2018; Schukajlow et al., 2009). Um Lehramtsstudierende im Hinblick auf die beiden Anforderungsbereiche des mathematischen Modellierens und eines adaptiven Interventionsverhaltens auf zukünftige berufliche Anforderungssituationen vorzubereiten, wurde ein universitäres fachdidaktisches Seminar mit dem Fokus auf der Förderung adaptiver Interventionskompetenzen in mathematischen Modellierungsprozessen entwickelt und evaluiert. Kontext der Studie ist das Projekt „MoSAiK“ (Modulare Schulpraxiseinbindung als Ausgangspunkt zur individuellen Kompetenzentwicklung; Kauertz & Siller, 2016)2 der Universität Koblenz-Landau im Rahmen der gemeinsamen „Qualitätsoffensive Lehrerbildung“ von Bund und Ländern (BMBF, 2016), dessen Fokus unter anderem auf der Vernetzung von theoretischen und praxisorientierten Ausbildungselementen in der universitären Lehrerausbildung liegt. Im Teilprojekt „LehrLern-Labore für eine praxisnahe forschungsbezogene Lehrer/innen-Ausbildung“ 1 Im Folgenden wird in Anlehnung
an Faust-Siehl stets der Begriff der Lehrerausbildung verwendet: „Während Lehrerbildung sich auf alle Phasen bezieht, werden mit Lehrerausbildung die ersten beiden Phasen bezeichnet.“ (Faust-Siehl, 2000, S. 638; Hervorhebung im Original) 2 Das Projekt MoSAiK (Kauertz & Siller, 2016) – Förderkennzeichen 01JA1605 – wurde vom deutschen Bundesministerium für Bildung und Forschung im Rahmen der gemeinsamen „Qualitätsoffensive Lehrerbildung“ von Bund und Ländern gefördert.
4
1
Einleitung
(Siller & Klock, 2016) wurden Praxiselemente, wie Videoanalysen und praktische Erprobungsphasen im Lehr-Lern-Labor, zur Theorie-Praxis-Verzahnung und Förderung der adaptiven Interventionskompetenz in das fachdidaktische Seminar integriert. Die adaptive Interventionskompetenz stellt eine professionelle Kompetenz zum Lehren mathematischen Modellierens dar. Sie lässt sich in einem Strukturmodell verorten, welches in einer Kooperation mit dem Teilprojekt „DwD.LeL“ (Dealing with Diversity. Lehr-Lern-Labore, Lernwerkstätten und Learning-Center; Greefrath & Wess, 2016) der „Qualitätsoffensive Lehrerbildung“ an der Westfälischen Wilhelms-Universität Münster entwickelt wurde (Klock, Wess, Greefrath, & Siller, 2019; Wess, Klock, Greefrath, & Siller, angenommen). Zur Messung dieser professionellen Kompetenzen zum Lehren mathematischen Modellierens wurde ein gemeinsames Testinstrument entwickelt (Klock & Wess, 2018). Sowohl das Strukturmodell als auch das Testinstrument bilden in Teilen eine theoretische und konzeptionelle Grundlage der vorliegenden Arbeit. Bei der Durchführung der Studie fand eine enge Kooperation zwischen den beiden Teilprojekten statt.
1.2
Ziele der Arbeit
In Abgrenzung zu vorherigen Arbeiten (z. B. Leiss, 2007; Stender, 2016), in denen Interventionen von Lehrkräften oder Lehramtsstudierenden anhand qualitativer Erhebungsmethoden untersucht wurden, liegt der Fokus dieser Arbeit auf der Erhebung kognitiver Leistungsdispositionen von Lehramtsstudierenden anhand eines quantitativen fallbasierten Testinstruments. Im Hinblick auf die beschriebene Notwendigkeit, adaptive Interventionskompetenzen in mathematischen Modellierungsprozessen bereits in der hochschulischen Lehrerbildung zu fördern, werden in der vorliegenden Forschungsarbeit die folgenden Ziele verfolgt: • Konzeptualisierung des Konstrukts der adaptiven Interventionskompetenz im Kontext kooperativer Modellierungsprozesse, • Analyse der Dimension des Konstrukts und die Untersuchung des Zusammenhangs seiner diagnostischen und interventionsbezogenen Anteile, • Evaluation der Förderung der adaptiven Interventionskompetenz durch universitäre fachdidaktische Seminare mit Praxiselementen, • Identifikation von Einflussfaktoren bei der Förderung der adaptiven Interventionskompetenz durch universitäre fachdidaktische Seminare mit Praxiselementen,
1.3 Gliederung der Arbeit
5
• Evaluation der Veränderung von Überzeugungen und Selbstwirksamkeitserwartungen zum mathematischen Modellieren durch universitäre fachdidaktische Seminare mit Praxiselementen, • Analyse von Zusammenhängen zwischen den Bestandteilen der adaptiven Interventionskompetenz und weiteren Facetten der professionellen Kompetenz zum Lehren mathematischen Modellierens. Einerseits möchte die Studie einen Beitrag zur Diskussion der Theorie-PraxisVerzahnung in der hochschulischen Lehrerausbildung leisten und kann daher im Bereich der Hochschuldidaktik Mathematik verortet werden. Sie richtet sich vor allem an Dozierende, die Praxiselemente in ihre Lehrveranstaltung integrieren möchten und an Möglichkeiten zur Konzeption und Evaluation interessiert sind. Andererseits möchte die Arbeit einen Beitrag zur Entwicklung einer Theorie von Interventionen in mathematischen Modellierungsprozessen leisten und eine Möglichkeit zur Messung zugehöriger Kompetenzen aufzeigen.
1.3
Gliederung der Arbeit
Die Arbeit gliedert sich in einen theoretischen, einen methodischen und einen Ergebnisteil. In Kapitel 2 werden theoretische Grundlagen zum mathematischen Modellieren, zu Modellierungsaufgaben, zur mathematischen Modellierungskompetenz und damit einhergehend zum Kompetenzbegriff dargestellt. Es wird nachfolgend ein spezifischer Fokus auf den Modellierungsprozess und Schwierigkeiten im Modellierungsprozess eingenommen, deren Kenntnis für eine adäquate Diagnostik des Lösungsprozesses von Schülerinnen und Schülern notwendig ist. Kapitel 3 behandelt verschiedene Interventionskonzepte, die in der deutsch- und englischsprachigen Literatur im Hinblick auf ein adäquates Lehrerhandeln zur Unterstützung von Schülerinnen und Schülern diskutiert werden. Das konstruktivistische Lehr-Lern-Verständnis wird als Grundlage für Interventionen in mathematischen Modellierungsprozessen herausgestellt. Die Ausführungen bilden die theoretische Grundlage für die Konzeptualisierung der adaptiven Interventionskompetenz. Empirische Studien zu Interventionen werden in Kapitel 4 berichtet. Es wird zunächst auf deskriptive Studien eingegangen, die Problemfelder im Kontext von Interventionen in kooperativen Bearbeitungsprozessen aufzeigen. Schließlich werden ausgewählte quantitative und qualitative Studien vorgestellt, die Informationen über die Wirksamkeit verschiedener Arten von Interventionen liefern. Die Unterscheidung zwischen wirksamen und weniger wirksamen Interventionen bildet eine Entscheidungsgrundlage für die Bewertung der Testitems. Einige wenige Studien
6
1
Einleitung
zur Förderung des Interventionsverhaltens werden abschließend berichtet. In Kapitel 5 wird schließlich die Konzeptualisierung der adaptiven Interventionskompetenz in mathematischen Modellierungsprozessen anhand der zuvor dargestellten Inhalte beschrieben. Nach einer kurzen Erläuterung des Begriffs der professionellen Kompetenz wird in Kapitel 6 das Strukturmodell der professionellen Kompetenz zum Lehren mathematischen Modellierens dargestellt und eine Einordnung der adaptiven Interventionskompetenz vorgenommen. In Kapitel 7 werden Forschungsfragen und Hypothesen abgeleitet. Im methodischen Teil der Arbeit werden in Kapitel 8 das Forschungsdesign, die untersuchte Stichprobe, die sich aus Studierenden dreier Universitäten zusammensetzt, und die verschiedenen Treatments erläutert. Das Treatment an der Universität Koblenz-Landau wird inklusive seiner Theorie-Praxis-Verzahnung detailliert beschrieben, da dessen Wirksamkeit in der vorliegenden Arbeit vertiefend untersucht wird. Exemplarisch werden zwei im fachdidaktischen Seminar thematisierte Modellierungsaufgaben mit möglichen Lösungswegen dargestellt. Die Methoden der Datenerhebung, d. h. die Testentwicklung, der verwendete Fragebogen und das Testinstrument mit zugehörigen Beispielitems, werden in Kapitel 9 beschrieben. Kapitel 10 behandelt die angewandte Auswertungsmethodik. Anhand von Methoden der probabilistischen Testtheorie werden eine Dimensionsanalyse und Skalierung vorgenommen. Für die Veränderungs- und Zusammenhangsanalysen kommen ein- und zweifaktorielle Varianzanalysen sowie multiple lineare Regressionen zum Einsatz. Im Ergebnisteil der Arbeit wird in Kapitel 11 das konzeptualisierte Konstrukt anhand eines Vergleichs verschiedener probabilistischer Rasch-Modelle auf seine Dimensionalität überprüft. Im Anschluss erfolgt eine Skalierung der Daten durch die Berechnung der Personenfähigkeiten. In Kapitel 12 werden anschließend die Veränderungsanalysen vorgenommen, die die Wirksamkeit der Treatments in Bezug auf die untersuchten Konstrukte bestimmen. Einflussfaktoren, die für den Erwerb der adaptiven Interventionskompetenz bedeutsam sind, werden in Kapitel 13 im Rahmen der Zusammenhangsanalysen untersucht. Im selben Kapitel werden auch Zusammenhänge zwischen den Facetten der professionellen Kompetenz zum Lehren mathematischen Modellierens bestimmt. Die Ergebnisse werden zusammenfassend in Kapitel 14 diskutiert und abschließend folgt ein Fazit mit Implikationen für die hochschulischen Lehrerausbildung.
Teil I Theoretischer Hintergrund
2
Mathematisches Modellieren
Ein Fokus der vorliegenden Arbeit liegt auf dem mathematischen Modellieren. In diesem Kapitel wird neben der Klärung der Begriffe des mathematischen Modellierens (vgl. Abschnitt 2.1), der Modellierungsaufgabe (vgl. Abschnitt 2.2) und der Modellierungskompetenz (vgl. Abschnitt 2.3) eine theoretische Basis für geeignete Unterstützungsmaßnahmen in mathematischen Modellierungsprozessen geschaffen. Dazu wird der Modellierungsprozess anhand eines ausgewählten Kreislaufschemas veranschaulicht und es werden Einblicke in Studien zum Verlauf von Modellierungsprozessen gegeben (vgl. Abschnitt 2.4). Das Wissen über typische Schwierigkeiten im Modellierungsprozess ist für die Unterstützung von Lernenden von Bedeutung. Ein auf qualitativen Studien basierendes Kategoriensystem wird vorgestellt, um einen Überblick über häufige Schwierigkeiten im Modellierungsprozess zu geben (vgl. Abschnitt 2.5). „Schüler haben weltweit große Probleme mit Modellierungsaufgaben, Modellieren ist offensichtlich schwer!“ (Blum, 2007, S. 3; Hervorhebung im Original) Ein Grund dafür sind die hohen kognitiven und metakognitiven Ansprüche des Modellierungsprozesses. Die Ergebnisse der nationalen und internationalen PISA-Studie (OECD, 2003) wurden hinsichtlich der Modellierungskompetenzen der Lernenden vergleichend untersucht. Der deutsche Skalenwert von 0.85 ist auf einer Skala von 0 bis 3 im Vergleich zum internationalen von 1.52 gering, sodass die Modellierungskompetenzen deutscher Schülerinnen und Schüler im internationalen Vergleich als problematisch eingestuft werden können (Blum, 2007). In der COACTIV Studie wurden insgesamt 47573 von deutschen Lehrkräften eingesetzte Aufgaben aus den Jahren 2003 und 2004 anhand eines Klassifikationssystems (Jordan et al., 2006) analysiert, wobei die zur Bearbeitung notwendigen Kompetenzen untersucht wurden (Neubrand, Jordan, Krauss, Blum, & Löwen, © Der/die Herausgeber bzw. der/die Autor(en), exklusiv lizenziert durch Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2020 H. Klock, Adaptive Interventionskompetenz in mathematischen Modellierungsprozessen, Studien zur theoretischen und empirischen Forschung in der Mathematikdidaktik, https://doi.org/10.1007/978-3-658-31432-3_2
9
10
2
Mathematisches Modellieren
2011). Auf einer Skala von 0 bis 3 wurde beurteilt, inwieweit Modellierungskompetenzen zur Lösung von realitätsbezogenen Aufgaben benötigt werden. Mit einem Skalenwert von maximal 0.34 in beiden Jahren weisen die Ergebnisse darauf hin, dass mathematisches Modellieren in deutschen Klassenzimmern eine untergeordnete Rolle spielt. Nur in geringem Umfang werden echte Realitätsbezüge anhand von Modellierungsaufgaben in den Mathematikunterricht integriert (Blum, 2007). 2004 ist die Kompetenz »(K3) mathematisch Modellieren« als eine von sechs im Mathematikunterricht zu vermittelnden Kernkompetenzen in die Bildungsstandards aufgenommen (KMK, 2004) und in den ländereigenen Lehrplänen verankert worden. Zur Förderung von Modellierungskompetenzen im Unterricht wurde eine Vielzahl von Materialien entwickelt. Eine Quelle stellen die in der ISTRON-Schriftenreihe regelmäßig erscheinenden „Neuen Materialien für einen realitätsbezogenen Mathematikunterricht“ (Eilerts & Skutella, 2018; Grafenhofer & Maaß, 2019; Henn & Meyer, 2014; Humenberger & Bracke, 2017; J. Maaß & Siller, 2014; Siller, Greefrath, & Blum, 2018) sowie die zuvor erschienenen 17 Bände mit dem Titel „Materialien für einen realitätsbezogenen Mathematikunterricht“ dar. Die obigen Studienergebnisse veranschaulichen jedoch eine geringe Thematisierung im Unterricht. „Das liegt wesentlich daran, dass Modellieren auch für Lehrer schwer ist, …“ (Blum, 2007) Unterricht wird durch die Verwendung komplexer realitätsbezogener Aufgaben ebenfalls komplex. Ein fundiertes Wissen zum mathematischen Modellieren bildet die Grundlage für die Bewältigung dieser anspruchsvollen Lehr-Lern-Prozesse. Somit scheint es eine geeignete Maßnahme zu sein, Inhalte zum mathematischen Modellieren bereits in die hochschulische fachdidaktische Lehrerausbildung zu integrieren.
2.1
Mathematisches Modell und Modellieren
Der Begriff des mathematischen Modells weist Eigenschaften auf, die auch im mathematischen Modellieren eine grundlegende Position einnehmen und den Modellierungsprozess charakterisieren. Niss, Blum und Galbraith (2007) definieren den mathematischen Modellbegriff als eine Abbildung. Aus einem Bereich D der Realität werden Übersetzungsprozesse in eine Teilmenge der mathematischen Welt M getätigt. Heißt die verknüpfende Abbildungsvorschrift f, so lässt sich ein mathematisches Modell durch das Tripel (D, M, f) beschreiben. Da es sich hierbei
2.1 Mathematisches Modell und Modellieren
11
nur um Teilmengen handelt, liefert ein Modell „eine vereinfachende, nur gewisse, hinreichend objektivierbare Teilaspekte berücksichtigende Darstellung der Realität“ (Henn & Maaß, 2003, S. 2). Daher wird die Realität durch das mathematische Modellieren bewusst vereinfacht und die Exaktheit, mit der sie abgebildet werden kann, ist stets begrenzt (Henn, 2002). Stachowiak (1973) hat diese Aspekte des allgemeinen Modellbegriffs in drei Merkmalen zusammengefasst: • Das Abbildungsmerkmal legt fest, dass es sich bei einem Modell um eine Repräsentation eines natürlichen oder künstlichen Originals handelt. • Das Verkürzungsmerkmal besagt, dass ein Modell eben nur die relevanten Merkmale des Originals beschreibt, das Modell also eine Reduzierung der Realität darstellt. • Das pragmatische Merkmal beschreibt, dass ein Modell für einen gewissen Zeitraum immer einen spezifischen Zweck für bestimmte Subjekte erfüllt. Modelle erfüllen in der Realität verschiedene Zwecke und lassen sich hinsichtlich ihrer Funktion klassifizieren (vgl. Abbildung 2.1). Deskriptive Modelle beschreiben Daten oder einen Sachverhalt einerseits rein deskriptiv. Ein Beispiel ist die Beschreibung von Messwerten durch eine Normalverteilung in der Statistik. Explikative Modelle liefern darüber hinaus eine Erklärung für die Daten oder einen Sachverhalt und sind daher aussagekräftiger (Körner, 2003). Ein Modell, welches Messwerte zweier Variablen anhand einer linearen Regression (vgl. Abschnitt 10.6) zueinander in Beziehung setzt, kann bspw. Informationen über die Stärke des Zusammenhangs liefern. Probabilistische Modelle treffen eine Vorhersage. Bleiben wir in der Statistik, so ist ein Beispiel das Rasch-Modell (vgl. Abschnitt 10.4.3), welches die Lösungswahrscheinlichkeit zu einem Item bei gegebener Personenfähigkeit liefert. Kann ein zukünftiges Ereignis mithilfe des Modells nicht nur anhand einer Wahrscheinlichkeit, sondern anhand einer eindeutigen Vorhersage bestimmt werden, spricht man von einem deterministischen Modell. Normative Modelle bilden keine Sachverhalte nach, sondern dienen als Vorbild (Greefrath, Kaiser, Blum, & Borromeo Ferri, 2013). Ein Beispiel hierfür ist das deutsche Steuermodell, welches zu einem gegebenen Bruttojahreslohn einen Lohnsteuersatz festlegt.
12
2
Mathematisches Modellieren
Abbildung 2.1 Funktionen von Modellen (Greefrath et al., 2013). (Abgedruckt mit Genehmigung von Springer Nature: Mathematisches Modellieren für Schule und Hochschule. Theoretische und didaktische Hintergründe von R. Borromeo Ferri, G. Greefrath und G. Kaiser; © 2013 Springer Spektrum.)
Das mathematische Modellieren lässt sich als Teilgebiet der Angewandten Mathematik zuordnen. Henry Pollak strukturiert die Angewandte Mathematik in vier Teilbereiche: die „Klassische Angewandte Mathematik“, die „Anwendbare Mathematik“, das „Vereinfachte Modellieren“ und das „Modellieren“ (Pollak, 1977, S. 255). Die Klassische Angewandte Mathematik (bspw. physikalische Anwendungen) und die Anwendbare Mathematik (bspw. Statistik, Lineare Algebra und Analysis) konkretisieren die Angewandte Mathematik anhand inhaltlicher Facetten des Faches. Die beiden Aspekte Vereinfachtes Modellieren (das einmalige Durchlaufen eines Modellierungskreislaufs) und Modellieren (das mehrmalige Durchlaufen eines Modellierungskreislaufs) betonen den prozesshaften Charakter der Angewandten Mathematik (Greefrath et al., 2013). Grundsätzlich bezeichnet das mathematische Modellieren daher den „Prozess des Lösens von Problemen aus der Realität“ (Greefrath et al., 2013, S. 11). In der vorliegenden Arbeit ist damit die Anwendung von Mathematik „in realen und sinnhaften Kontexten [anhand] real existierender Probleme, Fragestellungen oder Zusammenhänge“ (Siller, 2015, S. 2) gemeint. Mathematische Modellierungsprozesse werden im schulischen Kontext durch realistische und authentische Aufgaben initiiert.
2.2
Modellierungsaufgaben
Was unter einer Modellierungsaufgabe verstanden wird, kann sich je nach schulischem oder forschungsbezogenem Kontext stark unterscheiden. Zur Abgrenzung von anderen Aufgabentypen und zur Beschreibung der in dieser Arbeit verwendeten
2.2 Modellierungsaufgaben
13
Modellierungsaufgaben müssen Kriterien und Kategoriensysteme formuliert werden, die eine Klassifikation dieser Aufgaben erlauben. Daher werden im Folgenden Merkmale und Möglichkeiten zur Charakterisierung von Aufgaben erläutert. In einem engen Sinne kann unter einer Modellierungsaufgabe ein komplexes Problem verstanden werden, dessen Lösung ein mehrmaliges Durchlaufen aller Phasen des Modellierungskreislaufs erfordert. Demgegenüber kann im weiteren Sinne darunter auch eine Aufgabe verstanden werden, die bspw. lediglich eine Abschätzung im Sinne einer Fermi-Aufgabe (Haberzettl, Klett, & Schukajlow, 2018) erfordert oder bei der nur gewisse Phasen des Modellierungskreislaufs durchlaufen werden. Eine genaue Beschreibung von Aufgaben kann anhand unterschiedlicher Dimensionen erfolgen. Greefrath beschreibt im Rahmen des Sachrechnens eine Einteilung in „klassische Aufgabentypen“ (Greefrath, 2010a, S. 83), die in Tabelle 2.1 dargestellt sind. Dabei werden eingekleidete Aufgaben, Textaufgaben und Sachaufgaben unterschieden. Eingekleidete Aufgaben weisen keinen echten Realitätsbezug auf, da der Kontext bei der Lösung der Aufgabe beliebig austauschbar ist und keine oder nur eine untergeordnete Rolle bei der Bearbeitung der Aufgabe spielt. Zur Lösung kann der Kontext ignoriert und anhand der Angaben das Ergebnis berechnet werden, sodass die Anwendung von Rechenfertigkeiten im Vordergrund steht. Textaufgaben zeichnen sich ebenfalls durch einen austauschbaren Realitätsbezug aus, bei denen die Angaben und deren Zusammenhang aus dem Text jedoch in die mathematische Sprache übersetzt werden müssen. In Abgrenzung zu eingekleideten Aufgaben liegt der Schwerpunkt von Textaufgaben auf Übersetzungsprozessen in die mathematische Sprache und in der Interpretation der Ergebnisse in der Sachsituation, sodass im Allgemeinen mathematische Fähigkeiten gefördert werden. Bei Sachaufgaben existiert ein echter Realitätsbezug, der sich durch authentische Daten und Fragestellungen auszeichnet. An dieser Stelle steht die Umwelterschließung oder die Wahrnehmung und das Verstehen von „Erscheinungen der Welt um uns, die uns alle etwas angehen“ (Winter, 1995, S. 37) im Vordergrund. Greefrath (2010a) setzt für diesen Fall Sachprobleme mit Modellierungsaufgaben gleich.
14
2
Mathematisches Modellieren
Tabelle 2.1 Klassische Aufgabentypen (Greefrath, 2010a) Eingekleidete Aufgaben
Textaufgaben
Sachaufgaben
Schwerpunkt
rechnerisch
mathematisch
sachbezogen
Ziel
Anwendung/Übung von Rechenfertigkeiten
Förderung mathematischer Fertigkeiten
Umwelterschließung mit Hilfe von Mathematik
Darstellung
in einfache Sachsituationen eingekleidet
in (komplexere) Sachsituationen eingekleidet
reale Daten und Fakten bzw. offene Aufgaben
Kontext
kein wirklicher Realitätsbezug
kein wirklicher Realitätsbezug
echter Realitätsbezug
Tätigkeiten
Rechnen
Übersetzen, Rechnen, Interpretieren
Recherchieren, Vereinfachen, Mathematisieren, Rechnen, Interpretieren, Validieren
Anhand einer umfassenden Literaturrecherche entwickelte Maaß (2010) ein detaillierteres Kategoriensystem mit insgesamt neun Hauptkategorien, wobei sie zwischen Hauptkategorien für Modellierungsaufgaben und allgemeinen Hauptkategorien, die auf jegliche Aufgabentypen angewendet werden können, unterscheidet (vgl. Tabelle 2.2). Die Hauptkategorien werden beschrieben, um eine Einordnung der in der Studie verwendeten Modellierungsaufgaben zu ermöglichen (vgl. Abschnitt 8.5). Je nach Intention unterscheiden sich Modellierungsaufgaben in Ihrem Fokus auf die Modellierungsaktivität an sich. Blømhoj und Jensen (2003) unterscheiden hierbei einen holistischen und atomistischen Ansatz. Nach dem erstgenannten Ansatz werden im Modellierungsprozess alle Phasen des Modellierungskreislaufs (vgl. Tabelle 2.2 und Abschnitt 2.4.1) durchlaufen. Blømhoj und Jensen sehen diese Art von Aufgaben als echte Modellierungsaufgaben an. Bei einem atomistischen Ansatz fokussiert die Modellierungsaufgabe einzelne Phasen des Modellierungsprozesses (bspw. das Mathematisieren; vgl. Abschnitt 2.4.1), sodass sich diese nach den angesprochenen Phasen kategorisieren lassen. In den im Rahmen der Studie durchgeführten Modellierungsaktivitäten – den Modellierungstagen (vgl. Abschnitt 8.4.1; Siller, 2010; Siller & Vogl, 2010) – wurden ausschließlich Modellierungsaufgaben nach einem holistischen Ansatz eingesetzt.
Überbestimmt (ja/nein) Authentisch (ja/nein) Persönliche Situation (ja/nein) Deskriptiv (ja/nein) Text (ja/nein) Gelöstes Beispiel (ja/nein) Außermathematisches Modellieren Mathematisches Gebiet
II Datena
III Realitätsbezuga
IV Situationa
V Modellarta
VI Darstellungsebenea
VII Offenheita
VIII Kognitive Anforderungb
IX Mathema- tischer Inhaltb
Klassenstufe
Innermath. Arbeiten
Bestimmungs aufgabe (ja/nein)
Bild (ja/nein)
Normativ (ja/nein)
Berufliche Situation (ja/nein)
Realitätsnah (ja/nein)
Unterbestimmt (ja/nein)
Verstehen der Situation (ja/nein)
Kategorien der Kl assifikation Gesamter Prozess (ja/nein)
I Fokus der Mod. aktivitäta
Klassifikation
Grundvor stellungen
Umkehraufgabe (ja/nein)
Text und Bild (ja/nein)
Öffentliche Situation (ja/nein)
Eingekleidet (ja/nein)
Über- und unterbestimmt (ja/nein)
Erstellen des Realmodells (ja/nein)
Anmerkung. a Wahl einer Kategorie der Klassifikation, b Wahl in jeder Kategorie der Klassifikation
Allgemeine Klassifikation
Klassifikation für Modellierungsaufgaben
Tabelle 2.2 Kategoriensystem für Aufgaben nach Maaß (2010)
Passend (ja/nein)
Mathematisch arbeiten (ja/nein)
Umgang mit mathematischen Texten
Komplexes Problem (ja/nein)
Material (ja/nein)
Wissenschaftliche Situation (ja/nein)
Mathematisches Argumentieren
Komplexes Umkehrproblem (ja/nein)
Situation (ja/nein)
Bewusst künstlich Fantasie (ja/nein) (ja/nein)
Widersprüchliche Angaben (ja/nein)
Mathematisieren (ja/nein)
Umgang mit mathematischen Repräsentationen
Finden einer Situation (ja/nein)
Interpretieren (ja/nein)
Offenes Problem (ja/nein)
Validieren (ja/nein)
2.2 Modellierungsaufgaben 15
16
2
Mathematisches Modellieren
Des Weiteren unterscheidet Maaß (2010) Modellierungsaufgaben anhand der gegebenen Daten. Bei überbestimmten Aufgaben müssen wichtige von unwichtigen Informationen unterschieden werden. Unterbestimmte Aufgaben erfordern das Treffen von geeigneten Annahmen oder die Recherche weiterer Informationen. Aufgaben können sowohl über- als auch unterbestimmt sein. Widersprüchliche Angaben sollen das Überdenken des Kontextes anregen. Als Beispiel nennt Maaß Kapitänsaufgaben (Baruk, 1985), bei denen die Reflexion des Realitätsbezugs der Aufgabe im Vordergrund steht. Schließlich existieren auch Modellierungsaufgaben, in denen alle benötigten Daten vorgegeben sind. An den Modellierungstagen werden sowohl über- als auch unterbestimmte Aufgabenstellungen verwendet. Modellierungsaufgaben lassen sich nach der Art des Realitätsbezugs kategorisieren. Beginnend bei authentischen Aufgaben, die einen echten Kontext beschreiben und auch von Experten in diesem Bereich als relevant erlebt werden (Vos, 2015), findet eine Abstufung hin zu fantasierten Kontexten statt. Bei realitätsnahen Aufgaben können die Daten authentisch sein, aber die zugehörige Frage nicht oder umgekehrt. Eingekleidete Aufgaben zeichnen sich zwar durch einen Realitätsbezug aus, jedoch ist der Kontext zur Lösung der Aufgabe irrelevant und beliebig austauschbar (Greefrath, 2010a). Bewusst künstliche Daten und Kontexte haben keinen Bezug mehr zum Alltag. Bei expliziter Thematisierung der gekünstelten Einbettung können diese Aufgaben jedoch eine Reflexion über den Kontext anregen und haben damit ihre Berechtigung. Fantasie-Aufgaben können insbesondere für Schülerinnen und Schüler der Grundschule einen Reiz haben, da der Kontext frei erfunden und beliebig gestaltet werden kann (K. Maaß, 2010). Die an den Modellierungstagen eingesetzten Aufgaben sind stets realitätsnah und teilweise als authentisch zu klassifizieren. In der Hauptkategorie Situation unterscheidet Maaß (2010) Modellierungsaufgaben anhand von Merkmalen, die im Rahmen von PISA (OECD, 2003) verwendet wurden. Dabei beschreiben die Kategorien, inwieweit ein Bezug zum Leben der Lernenden hergestellt wird. Beginnend bei einer Situation, die persönliche Berührpunkte für die Schülerinnen und Schüler hat, findet eine Abstufung zur beruflichen – oder für die Lernenden schulischen – Situation statt. In einer weiteren Abstufung erfasst die Aufgabe eine öffentliche Situation, die bspw. die Gesellschaft betreffende Kontexte beinhaltet (vgl. Aufgabe »Blockabfertigung«; Abschnitt 8.5.2). Nach der Kategorisierung bilden wissenschaftliche Situationen Kontexte, die Schülerinnen und Schüler am wenigsten betreffen. Es kann durchaus schwierig sein, für die Lernenden relevante und gleichzeitig gehaltvolle Kontexte zu identifizieren. Die in dieser Arbeit verwendeten Aufgaben thematisieren eine persönliche, berufliche oder öffentliche Situation, sodass ein gewisses Maß an Relevanz stets vorhanden ist.
2.2 Modellierungsaufgaben
17
Je nach Art des Modells nimmt Maaß (2010) eine weitere Einteilung in zu erstellende deskriptive und normative Modelle vor (siehe Abschnitt 2.1). Die von uns verwendeten Modellierungsaufgaben führen sowohl zu deskriptiven (»Evakuierung eines Fußballstadions«) als auch zu normativen (»Kalte Progression«) Modellen (vgl. Abschnitt 8.5). Eine andere Möglichkeit besteht in der Kategorisierung nach in der Aufgabenstellung auftretenden Darstellungsebenen. Maaß (2010) unterscheidet, ob die Aufgabe lediglich in Textform, als Bild oder aus einer Kombination von Text und Bild besteht, die den Bezug zur Realität unterstreicht. Materialien, wie bspw. Audiomaterial oder ein Experiment, können eine Problemstellung illustrieren und so das Problemfeld zugänglich machen. Schließlich kann eine Aufgabenstellung aus der Situation heraus entwickelt werden, wenn Schülerinnen und Schülern im Rahmen eines Ausflugs mathematische Probleme veranschaulicht werden. Diese Darstellungsform ermöglicht die Herstellung eines hohen Realitätsbezugs. Die Modellierungsaufgaben werden an den Modellierungstagen stets durch eine Kombination von Text und Bild veranschaulicht. Maaß (2010) nennt weiterhin die allgemeine Klassifikation Offenheit. Mehrere Autoren unterscheiden zwischen der Offenheit des Anfangszustands, der Transformation und des Endzustands (Bruder, 2003; Greefrath, 2004, 2010a; Wiegand & Blum, 1999). Legt man für jeden dieser drei Aspekte fest, ob er vorgegeben ist oder nicht bzw. klar oder unklar ist, ergeben sich acht unterschiedliche Kombinationsmöglichkeiten, die verschiedene Aufgabentypen bilden. Im Folgenden wird zwischen vorgegebenen und nicht vorgegebenen Zuständen unterschieden. Bruder (2003) stellt die entsprechenden Aufgabentypen zunächst fachunabhängig dar und nennt Beispiele aus verschiedenen Fächern. Maaß (2010) nennt für diese Kombinationen Beispiele für Modellierungsaufgaben. Sieben der acht Möglichkeiten hat sie in ihrem Kategoriensystem berücksichtigt und beschrieben (vgl. Tabelle 2.2). In Tabelle 2.3 sind sowohl die allgemeinen Aufgabenvarianten nach Bruder als auch die Aufgabenvarianten nach Maaß den unterschiedlichen Kombinationen zugeordnet. Bei der Beschreibung der einzelnen Varianten wird sich im Folgenden auf die Nomenklatur von Bruder (Spalte 1) bezogen. Eine gelöste Aufgabe kann zur Illustration einer potentiellen Lösung dienen. Diese Art von Aufgaben eignen sich zusätzlich für Überprüfungsaufträge und in Bezug auf das mathematische Modellieren für die Validierung der Lösung. Eine Grundaufgabe gibt einen Anfangszustand vor und die notwendige Transformation ist direkt ersichtlich, entweder da es sich um elementare Rechnungen (bspw. Kopfrechenaufgaben) handelt oder da sich die Art der Transformation aus dem Unterrichtskontext ergibt. Hier handelt es sich oft um typische eingekleidete Aufgaben ohne Bezug zum Modellieren (Bruder, 2003; K. Maaß, 2010).
18
2
Mathematisches Modellieren
Tabelle 2.3 Kategorien der Offenheit einer Aufgabe (Bruder, 2003; K. Maaß, 2010) Aufgabenvariante nach Bruder (2003)
Aufgabenvariante nach Maaß (2010)
Anfangszustand
Transformation
Endzustand
Gelöste Aufgabe
Gelöstes Beispiel
vorgegeben
vorgegeben
vorgegeben
Grundaufgabe
Bestimmungsaufgabe
vorgegeben
vorgegeben
nicht vorgegeben
Umkehrung einer Grund-aufgabe
Umkehraufgabe
nicht vorgegeben
vorgegeben
vorgegeben
Bestimmungs-aufgabe
Komplexes Problem
vorgegeben
nicht vorgegeben
nicht vorgegeben
Umkehrung einer Bestimmungsaufgabe
Komplexes Umkehrproblem
nicht vorgegeben
nicht vorgegeben
vorgegeben
Anwendungen finden
Finden einer Situation
nicht vorgegeben
vorgegeben
nicht vorgegeben
Offene Aufgabensituation
Offenes Problem
nicht vorgegeben
nicht vorgegeben
nicht vorgegeben
Begründungsaufgabe
–
vorgegeben
nicht vorgegeben
vorgegeben
a
Anmerkung. a Diese Kombination wird bei Maaß (2010) nicht beschrieben.
Bei der Umkehrung einer Grundaufgabe sind die Endsituation und die Transformation gegeben. Ein Beispiel hierfür sind Zahlenrätsel, in denen eine gedachte Zahl anhand einer Rechnungsvorschrift und eines Ergebnisses ermittelt wird. Maaß sieht in diesen Aufgaben das Potential, schrittweise an offenere Aufgaben heran zu führen. Dies kommt insbesondere dann in Betracht, wenn mehrere Lösungen für die Aufgabe möglich sind. Bei einer Bestimmungsaufgabe ist nur die Anfangssituation gegeben. Sie stellt eine Modellierungsaufgabe dar, da der Lösungsweg und das Ergebnis komplett offen sind. Ein Beispiel hierfür ist die Berechnung der Evakuierungszeit eines Stadions (vgl. Abschnitt 8.5). Bei der Umkehrung einer Bestimmungsaufgabe – hier ist lediglich die Endsituation bekannt – kann ebenfalls eine Modellierungsaufgabe konstruiert werden. Da das Ziel der Aufgabe gegeben ist, muss durch Recherchen oder das Treffen von Annahmen der Anfangszustand konkretisiert werden. Anschließend muss eine geeignete Transformation gefunden werden, um das Ziel zu erreichen. Ein Beispiel stellt die Frage nach einem gerechten Steuersystem dar (»Kalte Progression«, vgl. Abschnitt 8.5), das mathematisch beschrieben werden soll. Ist lediglich die Transformation gegeben, besteht
2.2 Modellierungsaufgaben
19
die Aufgabe darin, Anwendungen zu finden. Wird die Transformation in einen realen und authentischen Kontext eingebettet, bietet die Aufgabe das Potential, über die Anwendung von Mathematik in der Realität zu reflektieren (K. Maaß, 2010). Die Aufgabenkonstruktion gestaltet sich jedoch relativ schwierig. Aufgaben, bei denen weder Anfangs- noch Endzustand noch die Transformation vorgegeben sind, werden als Aufgaben mit offener Aufgabensituation bezeichnet. Es wird eine Situation präsentiert, in der die Problemstellung erst noch konkretisiert werden muss. Hier ist ebenfalls die Konstruktion einer Modellierungsaufgabe vorstellbar. Durch die Komplexität der Situation birgt die Aufgabe ein hohes Anforderungsniveau. Ist lediglich die Transformation nicht gegeben, handelt es sich nach Bruder um eine Begründungsaufgabe, wobei dieser Typ bei Maaß (2010) nicht beschrieben wird. Bei einer potentiellen Modellierungsaufgabe ist ein Sachverhalt anhand eines mathematischen Modells zu begründen. Die eingesetzten mathematischen Mittel bzw. das mathematische Modell liefern dann die fehlende Transformation zum Nachweis des Endzustands (Bruder, 2003; K. Maaß, 2010). Die letzten beiden Hauptkategorien stammen aus dem Klassifikationssystem für Mathematikaufgaben, wie es beispielsweise in der COACTIV-Studie angewendet wurde. Die Hauptkategorien ordnen Aufgaben ein kognitives Anforderungsniveau und einen mathematischen Inhalt zu. An dieser Stelle soll aufgrund ihrer Allgemeinheit auf diese beiden Kategorien nicht weiter eingegangen werden. Eine genaue Beschreibung findet sich bei Jordan et al. (2006). Das Kategoriensystem nach Maaß (vgl. Tabelle 2.2) erlaubt eine umfangreiche Klassifikation von Aufgaben. Eine eindeutige Evaluation, ob es sich um eine Modellierungsaufgabe handelt, kann anhand dessen jedoch nicht abschließend festgestellt werden. Kategorien einzelner Klassifikationen müssen normativ als Indikatoren für einen höheren Modellierungsgehalt (Kuntze & Zöttl, 2008) bestimmt werden. Dazu werden in dieser Arbeit Abstufungen innerhalb der Hauptkategorien festgelegt. Es liegt ein höherer Modellierungsgehalt vor, … • wenn der Modellierungskreislauf vollständig durchlaufen wird (Blomhoj & Jensen, 2003) bzw. je mehr Teilkompetenzen durch die Aufgabe gefördert werden, • falls die Aufgabe unter- und/oder überbestimmt ist (Kuntze & Zöttl, 2008), • die Aufgabe einen hohen Realitätsbezug hat und als authentisch klassifiziert werden kann (Greefrath, Siller, & Ludwig, 2017; Vos, 2015), • die Aufgabe die persönliche Situation der Lernenden anspricht bzw. relevant ist (Greefrath et al., 2017; OECD, 2003), • ein komplexes Problem, ein komplexes Umkehrproblem oder ein offenes Problem vorliegt (K. Maaß, 2010).
20
2
Mathematisches Modellieren
Die an den Modellierungsaktivitäten verwendeten Aufgabenstellungen erfüllen zum Großteil die Kriterien für Aufgaben mit einem hohen Modellierungsgehalt und können daher als Modellierungsaufgaben angesehen werden (vgl. Abschnitt 8.5). Die Modellierungsaufgaben, die in der vorliegenden Studie im quantitativen Testinstrument (Klock & Wess, 2018) verwendet werden, sind von den komplexen Modellierungsaufgaben, die an den Modellierungstagen zur Anwendung kommen, abzugrenzen. Aufgrund ihrer Komplexität würden diese in der Kürze des Testzeitraums zu einer kognitiven Überforderung der Probanden führen. Die Komplexität und das Anforderungsniveau müssen bewusst niedrig gehalten werden, um eine angemessene Testlänge sicherzustellen. Die Testaufgaben weisen daher vor allem im Bereich der Kategorien Daten und Offenheit (vgl. Tabelle 2.2) einen geringeren Modellierungsgehalt auf. Durch die Bearbeitung von Modellierungsaufgaben mit einem hohen Modellierungsgehalt (holistischer Ansatz, über- und unterbestimmt, hoher Realitätsbezug, hohe Relevanz, hohe Offenheit) sollen bei Schülerinnen und Schülern Modellierungskompetenzen umfassend gefördert werden. Was genau unter dem Begriff der Modellierungskompetenz verstanden wird, wird nachfolgend geklärt.
2.3
Mathematische Modellierungskompetenz
Die Klärung des Begriffs der Modellierungskompetenz bedingt die vorherige Klärung des Kompetenzbegriffs. Auch im Hinblick auf die Definition professioneller Kompetenzen von (angehenden) Lehrkräften ist eine Erläuterung sinnvoll, die bereits an dieser Stelle vorgenommen wird.
2.3.1
Kompetenz
Aufgrund der alltagssprachlich häufigen Verwendung des Begriffs „Kompetenz“ ist eine klare Definition in der Bildungsforschung unerlässlich. Die alltägliche und selbst in wissenschaftlichen Kontexten nicht einheitliche Verwendung macht die inhaltliche Definition nicht einfach (Hartig, 2006). Weinert (1999) differenzierte den Kompetenzbegriff in einem durch den OECD beauftragten Gutachten in die folgenden Aspekte:
2.3 Mathematische Modellierungskompetenz
21
1. Kompetenzen als allgemeine intellektuelle Fähigkeiten im Sinne von Dispositionen, die eine Person befähigen, in sehr unterschiedlichen Situationen anspruchsvolle Aufgaben zu meistern. 2. Kompetenzen als funktional bestimmte, auf bestimmte Klassen von Situationen und Anforderungen bezogene kognitive Leistungsdispositionen, die sich psychologisch als Kenntnisse, Fertigkeiten, Strategien, Routinen oder auch bereichsspezifische Fähigkeiten beschreiben lassen. 3. Kompetenz im Sinne motivationaler Orientierungen, die Voraussetzungen sind für die Bewältigung anspruchsvoller Aufgaben. 4. Handlungskompetenz als Begriff, der die ersten drei genannten Kompetenzkonzepte umschließt und jeweils auf die Anforderungen und Aufgaben eines bestimmten Handlungsfeldes, zum Beispiel eines Berufes, bezieht. 5. Metakompetenzen als Wissen, Strategien oder auch Motivationen, die Erwerb und Anwendung von Kompetenzen in verschiedenen Inhaltsbereichen erleichtern. 6. Schlüsselkompetenzen, d. h. Kompetenzen im oben unter Punkt 2 definierten funktionalen Sinne, die über eine vergleichsweise breite Spanne von Situationen und Aufgabenstellungen hinweg einsetzbar sind. Weinert zählt hierzu unter anderem muttersprachliche und mathematische Kenntnisse und Fertigkeiten sowie die Inhalte einer basalen Allgemeinbildung. (Klieme, 2004, S. 11)
In seinem Gutachten argumentiert Weinert (1999), für bildungswissenschaftliche Zwecke den unter Punkt 2 definierten Kompetenzbegriff zu verwenden, da er sich auf das Kognitive und bereichsspezifische Anforderungen beschränkt. In einer späteren Publikation, die zu den meist zitiertesten Kompetenzdefinitionen zählt, bezieht er neben kognitiven auch motivationale, volitionale und soziale Bereitschaften und Fähigkeiten mit ein. Er definiert Kompetenz als … die bei Individuen verfügbaren oder durch sie erlernbaren kognitiven Fähigkeiten und Fertigkeiten, um bestimmte Probleme zu lösen, sowie die damit verbundenen motivationalen, volitionalen und sozialen Bereitschaften und Fähigkeiten, um die Problemlösungen in variablen Situationen erfolgreich und verantwortungsvoll nutzen zu können. (Weinert, 2002, S. 27 f.)
Hartig und Klieme (2006) grenzen den Begriff der Kompetenz anhand von drei Merkmalen vom Konstrukt der Intelligenz ab. Durch eine Kontextualisierung beziehen sich Kompetenzen stets auf spezifische Situationen und ihre Anforderungen und sind damit funktional bestimmt, wohingegen Intelligenz mit generalisierten Leistungsdispositionen verbunden ist. Kompetenzen sind dabei auf ähnliche Situationen übertragbar (Weinert, 2002, S. 27 f.). Die Lernbarkeit ergibt sich aus der Kontextualisierung, da Kompetenzen durch Erfahrungen in spezifischen Situationen mit konkreten Anforderungen erworben werden. Intelligenz wird als ein überwiegend stabiles Konstrukt angesehen. Zuletzt unterscheiden sich die beiden
22
2
Mathematisches Modellieren
Konzepte in ihrer Binnenstruktur. Kompetenzen beziehen sich stets auf die konkreten Anforderungen eines situativen Kontextes und den damit einhergehenden Aufgaben, wohingegen sich die Struktur des Intelligenzbegriffs an den kognitiven und biologischen Basisprozessen orientiert (Hartig & Klieme, 2006). Im Hinblick auf diese Merkmale erschweren die unter Punkt 1 und 6 beschriebenen Definitionen eine genaue Abgrenzung von Intelligenz und Kompetenz und sind daher für eine begriffliche Bestimmung ungeeignet (Hartig & Klieme, 2006). Aufgrund einer unterschiedlichen Verwendung des Kompetenzbegriffs in dieser Arbeit werden zwei Arten unterschieden. Die unter Punkt 2 beschriebene Definition wird in der vorliegenden Arbeit als Kompetenz im engeren Sinne bezeichnet, da sie lediglich „kontextspezifische kognitive Leistungsdispositionen umfasst, die sich funktional auf Situationen und Anforderungen“ (Hartig & Klieme, 2006, S. 128) in bestimmten Domänen bezieht. Insbesondere für die Messung eines Kompetenzkonstrukts ist eine Einschränkung auf einen spezifischen Kontext und kognitive Leistungsdispositionen sinnvoll und in bildungswissenschaftlichen Kontexten üblich, da ansonsten die Gefahr besteht, am Konstrukt „vorbei zu messen“ (Hartig, 2006, S. 6). Als Kompetenz im weiteren Sinne wird die sich aus den Punkten 4 und 5 ergebene Definition bezeichnet. Diese unterscheidet sich von der Kompetenz im engeren Sinne dadurch, dass neben kognitiven auch motivationale, volitionale, soziale und metakognitive Kompetenzen miteinbezogen werden, die die Handlungskompetenz mitbestimmen. Die situative Vielfalt wird auf ein Handlungsfeld erweitert, sodass der Kontext ein größeres Repertoire an Anforderungssituationen umfasst. Diese Art des Kompetenzbegriffs ist vor allem für die Interpretation von Kompetenzstrukturmodellen (z. B. das COACTIV-Modell; Baumert & Kunter, 2011a) von Bedeutung, da der Kontext hier in der Regel weiter gefasst wird und bspw. das Zusammenspiel von Überzeugungen, selbstregulativen und motivationalen Fähigkeiten sowie des Professionswissens als die professionelle Kompetenz von Lehrkräften bezeichnet wird. Der Kompetenzbegriff im engeren Sinne bezieht sich auf kognitive Leistungsdispositionen. Blömeke, Gustafsson und Shavelson (2015) stellen einen Zusammenhang zwischen Leistungsdispositionen und beobachtbarem Verhalten bzw. der Handlungskompetenz einer Person her. Kompetenz definieren sie als ein Kontinuum zwischen diesen beiden Kompetenzarten (vgl. Abbildung 2.2). Anstatt auf der Unterscheidung zwischen Leistungsdisposition und Handlung zu bestehen, sehen sie Kompetenz als einen Prozess, der durch viele Teilprozesse gekennzeichnet ist. Als vermittelnde Prozesse werden die Wahrnehmung, Interpretation und das Entscheiden in einer spezifischen Situation vorgeschlagen (Blömeke et al., 2015). Aufgrund dieser situationsspezifischen Fähigkeiten wird das Modell auch als PID-Modell (Perception, Interpretation, Decision making) bezeichnet.
2.3 Mathematische Modellierungskompetenz
23
Abbildung 2.2 Kompetenz als Kontinuum (Blömeke et al., 2015, S. 7). (Abgedruckt mit Genehmigung der Zeitschrift für Psychologie 2015; Vol. 223(1), 3–13; ©2015 Hogrefe Publishing; www.hogrefe.com; DOI: 10.1027/2151-2604/a000194.)
In Bezug auf den Begriff der Modellierungskompetenz stellt sich die Frage, welcher Kompetenzbegriff zur Charakterisierung verwendet werden kann. Nachfolgend wird herausgestellt, dass es sinnvoll ist, den Begriff der Modellierungskompetenz aus der Perspektive eines erweiterten Kompetenzbegriffs zu verstehen. Durch die Beschreibung der vielfältigen Anforderungen von Modellierungsprozessen werden gleichzeitig die Anforderungen für Lehrkräfte bei der Unterstützung mathematischer Modellierungsprozesse illustriert.
2.3.2
Modellierungskompetenz
Es existieren zahlreiche Definitionen für das Konstrukt der Modellierungskompetenz (für einen Überblick siehe Böhm, 2013; Brand, 2014). Einige Autoren charakterisieren den Begriff durch die Angabe der Teilkompetenzen (vgl. Tabelle 2.2 und Abschnitt 2.4.1), die für das Durchlaufen des Modellierungskreislaufs notwendig sind (Blomhoj & Jensen, 2003; Blomhoj & Kjeldsen, 2006; Blum & Kaiser, 1997; Blum & Leiss, 2005; Ikeda & Stephens, 1998; Kaiser, 1995; Leiss, 2007; Profke, 2000 u. v. m.). Die Teilkompetenzen erfassen eine entscheidende Facette von Modellierungskompetenz und stellen eine Voraussetzung dar, um den Modellierungskreislauf erfolgreich durchlaufen zu können (Blomhoj & Jensen, 2003). Im Hinblick auf die obige Diskussion des Kompetenzbegriffs (vgl. Abschnitt 2.3.1) charakterisieren die Teilkompetenzen eine Modellierungskompetenz im engeren Sinne, da zur Ausführung kognitive Fähigkeiten notwendig sind. Greefrath et al.
24
2
Mathematisches Modellieren
(2013) weisen jedoch darauf hin, dass die Phase des mathematischen Arbeitens (vgl. Abschnitt 2.4.1) keinen Teil von Modellierungskompetenz darstellt, da diese nicht charakteristisch für den Modellierungsprozess ist. Niss et al. (2007) beschreiben diese Art von Modellierungskompetenz, indem sie insbesondere die Übersetzungsprozesse zwischen „dem Rest der Welt“ (Pollak, 1979) und der Mathematik in ihrer Definition betonen. So mathematical modelling competency means the ability to identify relevant questions, variables, relations, or assumptions in a given real world situation, to translate these into mathematics and to interpret and validate the solution of the resulting mathematical problem in relation to the given situation, as well as the ability to analyse or compare given models by investigating the assumption being made, checking properties and scope of a given model. In short: modelling competency in our sense denotes the ability to perform the processes that are involved in the construction and investigation of mathematical models. (Niss et al., 2007, S. 12 f.)
Die Fähigkeit gegebene Modelle zu analysieren und zu vergleichen ist an dieser Stelle ebenfalls ein Bestandteil von Modellierungskompetenz. Im Gegensatz dazu steht das „active modelling“ (Niss & Hojgaard, 2011, S. 58), mit dem das selbstständige Modellieren und die Erstellung eigener Modelle bezeichnet werden. In Abgrenzung zum Begriff der Modellierungsfähigkeit, die beim erfolgreichen Durchführen der Modellierungsphasen vorliegt, umfasst der Begriff der Modellierungskompetenz noch weitere Aspekte (Brand, 2014). Bei der Modellierungskompetenz im weiteren Sinne spielen motivationale, volitionale und soziale Kompetenzen sowie die Fähigkeit zur Metakognition eine Rolle. Motivationale und volitionale Kompetenzen äußern sich bspw. über die „Bereitschaft, Fähigkeiten und Fertigkeiten in Handlungen umzusetzen“ (K. Maaß, 2004, S. 35). Ein mangelnder Wille und eine fehlende Motivation wirken sich negativ auf den Modellierungsprozess aus. Die Arbeit in Kleingruppen stellt eine geeignete Sozialform für die Bearbeitung von Modellierungsaufgaben dar (Clohessy & Johnson, 2017; Ikeda & Stephens, 2001). Die Forschung zeigt, dass unter gewissen Voraussetzungen kooperative Lernformen den Lernzuwachs steigern (vgl. Abschnitt 3.1.3), die Selbstbeteiligung erhöhen, die Zufriedenheit steigern, kommunikative und soziale Fähigkeiten fördern und das Selbstbewusstsein von Lernenden erhöhen (Johnson & Johnson, 1999). Eine Voraussetzung für eine gelingende Kleingruppenarbeit sind soziale Fähigkeiten, die eine Kooperation unter den Gruppenmitgliedern ermöglichen. Soziale Kompetenzen, wie bspw. die Kommunikation über und mithilfe von Mathematik (Kaiser, 2007; Niss & Hojgaard, 2011) bilden daher eine Facette der Modellierungskompetenz (Greer & Verschaffel, 2007; Kaiser, 2007).
2.3 Mathematische Modellierungskompetenz
25
Metakognitive Kompetenzen geraten aufgrund ihrer Bedeutung bei der Lösung komplexer mathematischer Probleme zunehmend in den Forschungsfokus. Unter Metakognition werden das „Denken über das eigene Denken sowie die Steuerung des eigenen Denkens“ (Sjuts, 2003, S. 18) verstanden. Prozesse wie das Steuern des Modellierungsprozesses (Kaiser, 2007) und das Reflektieren über die Modellierung als Ganzes (Blomhoj & Jensen, 2003; Niss & Hojgaard, 2011) stellen einen Teil von Modellierungskompetenz dar. Sjuts (2003) unterscheidet dabei drei Dimensionen der Metakognition. Unter der deklarativen Metakognition versteht er das Wissen über die Anforderungen von Aufgaben in Verbindung mit dem Wissen über die eigene kognitive Leistungsfähigkeit. Damit bestimmt der Lernende die Erfolgsaussicht für die erfolgreiche Bearbeitung der Aufgabe. Zudem beinhaltet es Strategiewissen über gewisse Vorgehensweisen und deren Eignung zur Lösung des Problems. Im Kontext mathematischen Modellierens handelt es sich um Metawissen über den Modellierungsprozess, welches sich durch die Kenntnis des Modellierungskreislaufs und der zugehörigen Prozesse auszeichnet (K. Maaß, 2004, S. 36). „Die prozedurale Metakognition verbindet die vor, während und nach einer Aufgabenbearbeitung liegenden Tätigkeiten des Planens, Überwachens und Prüfens“ (Sjuts, 2003, S. 19; Hervorhebung durch den Autor) des Modellierungsprozesses. Diese Tätigkeiten beinhalten das Potential den Lösungsprozess beständig zu evaluieren und ihn, falls nötig, an die Zielstellung anzupassen. Vor allem bei Modellierungsaufgaben, die einen mehrschrittigen Lösungsprozess erfordern, sind derartige Fähigkeiten wichtig, um bspw. den Überblick über die eigene Arbeit zu behalten. Schließlich nennt Sjuts noch die motivationale Metakognition, die aus der Bereitschaft, Motivation und Willenskraft besteht, Metakognition zu betreiben. Diese Bereitschaft kann bspw. entstehen, wenn eine Aufgabe als herausfordernd empfunden wird (Sjuts, 2003). Bei fehlenden Kompetenzen in diesem Bereich hat die Lehrkraft die Aufgabe, durch ein externes Monitoring zur Metakognition anzuregen (K. Maaß, 2004, S. 36). Die kognitiven, motivationalen, volitionalen, sozialen und metakognitiven Aspekte von Modellierungskompetenz führt Maaß (2004) in einer eher allgemeinen Definition zusammen. Modellierungskompetenzen umfassen die Fähigkeiten und Fertigkeiten, Modellierungsprozesse zielgerichtet und angemessen durchführen zu können sowie die Bereitschaft, diese Fähigkeiten und Fertigkeiten in Handlungen umzusetzen. (K. Maaß, 2004, S. 35)
Die beschriebenen Aspekte – die Teilkompetenzen des Modellierungskreislaufs, motivationale, volitionale, soziale und metakognitive Kompetenzen – bilden ein
26
2
Mathematisches Modellieren
Komponentenmodell (Hartig & Klieme, 2006), das die Struktur der Modellierungskompetenz im weiteren Sinne beschreibt (Brand, 2014). Die Kompetenz ergibt sich aus dem Zusammenspiel dieser Aspekte und ist damit mehrdimensional. Eine Förderung der Kompetenz sollte sich daher nicht nur auf die kognitiven Kompetenzen, sondern auch auf die Förderung der übrigen Komponenten beziehen. Das Konstrukt der Modellierungskompetenz im weiteren Sinne ist mehrdimensional und besteht aus einer Reihe von Komponenten, die alle für den Modellierungsprozess eine Rolle spielen. In der fachdidaktischen Forschung ist es aus den in Abschnitt 2.3.1 benannten Gründen sinnvoll, sich bei der Operationalisierung auf die Teilkompetenzen des Modellierungskreislaufs, d. h. auf die Modellierungskompetenz im engeren Sinne, zu beschränken (Greefrath, 2010a; Hankeln, 2019). Diese Beschränkung erfasst den Kern der Kompetenz und stellt daher eine adäquate Operationalisierung dar. Da im Rahmen dieser Arbeit nicht die Messung von Modellierungskompetenzen im Fokus steht, wird im Folgenden der Begriff der Modellierungskompetenz im weiteren Sinne verwendet. Die Vielzahl der strukturellen Komponenten des Konstrukts stellt hohe Anforderungen an Lehrkräfte. Bei der Unterstützung von Modellierungsprozessen muss die Lehrkraft diese verschiedenen Komponenten überwachen, um Probleme in den Teilkompetenzen gegebenenfalls diagnostizieren und adäquat intervenieren zu können. Die erweiterte Perspektive auf die Modellierungskompetenz beschreibt Handlungsfelder für Lehrkräfte, in denen sie bei Bedarf tätig werden müssen.
2.4
Modellierungsprozess
Nachdem grundlegende begriffliche Klärungen vorgenommen wurden, wird der Modellierungsprozess als Ausgangslage für Interventionen der Lehrkraft beschrieben. Für die Unterstützung der Aufgabenbearbeitung ist Metawissen über den Verlauf des Modellierungsprozesses hilfreich. Der im Folgenden dargestellte Modellierungskreislauf charakterisiert den Modellierungsprozess idealtypisch anhand eines theoretischen Modells. Dass der Modellierungsprozess von Schülerinnen und Schülern in der Realität genauso verläuft, d. h. Modellierungsphasen in gleicher Reihenfolge und mit gleicher Intensität durchlaufen werden, wurde mittlerweile widerlegt. Entscheidende Studien dazu wurden von Treilibs, Burkhardt und Low (1980) und Borromeo Ferri (2011) durchgeführt, die in der Modellierungscommunity als Vertreter des „kognitiven Modellierens“ (Kaiser, Blum, Borromeo Ferri, & Greefrath, 2015, S. 363) bezeichnet werden können. Das kognitive Modellieren
2.4 Modellierungsprozess
27
stellt eine Perspektive mathematikdidaktischer Forschung in der Modellierungsdiskussion dar, bei dem es um die Erforschung der Denkprozesse von Lernenden beim Modellieren geht. Die Ergebnisse dieser Studien haben eine große Bedeutung für das Verständnis von Modellierungsprozessen, das für ein adäquates Unterstützungsverhalten von Bedeutung ist, und werden daher im Folgenden ausführlich dargestellt.
2.4.1
Modellierungskreislauf
Bis dato existiert eine Vielzahl von Modellierungskreisläufen, die den Fokus auf unterschiedliche Aspekte legen. Die verschiedenen Modelle eignen sich jeweils für bestimmte Zwecke. Der Modellierungskreislauf nach Blum & Leiss (2005), angepasst nach Leiss (2007), ist für die Analyse und Diagnose von Modellierungsprozessen geeignet (vgl. Abbildung 2.3).
Abbildung 2.3 Modellierungskreislauf nach Leiss (2007, S. 31)
Leiss (2007) definiert zusammenfassend sieben Modellierungsphasen, von denen sich sechs in ähnlicher Bezeichnung im Klassifikationssystem für Modellierungsaufgaben nach Maaß (2010) wiederfinden. Sowohl für die Beschreibung von Modellierungskompetenzen im engeren Sinne (vgl. Abschnitt 2.3.2) als auch für die Diagnostik von Schwierigkeiten bei der Unterstützung von Lernenden ist das Wissen über die Tätigkeiten in den einzelnen Modellierungsphasen von Bedeutung.
28
2
Mathematisches Modellieren
Aus diesem Grund werden die einzelnen Phasen des Modellierungsprozesses nach Leiss (2007, S. 32 f.) ausführlich erläutert. 1. Verstehen des Aufgabentextes und Konstruieren des Situationsmodells • (Sinnentnehmendes) Lesen des Aufgabentextes • Klären von unbekannten Begriffen und Sachverhalten • Erstellen eines (kognitiven) Abbildes der dargestellten Gesamt- oder einer ausgewählten Teilsituation unter (unbewusstem) Rückgriff auf Vorwissen • Erkennen und Verstehen der Fragestellung 2. Bilden des Realmodells durch Vereinfachen und Strukturieren der Situation • Interpretieren der Fragestellung • Erkennen bzw. Bestimmen von relevanten und irrelevanten Aspekten • Erkennen und Benennen von (mathematischen) Zusammenhängen zwischen den Variablen • Strukturieren und Simplifizieren von Sachverhalten evtl. schon in Hinblick auf die zur Verfügung stehenden mathematischen Modelle und Werkzeuge 3. Bilden des mathematischen Modells durch Mathematisieren des Realmodells • Aktivieren von mathematischen Grundvorstellungen und darauf basierend Mathematisieren der relevanten Variablen, ihrer Zusammenhänge sowie der damit verbundenen Fragestellung • Auswahl adäquater mathematischer Notationen/Darstellungsformen (Gleichung, Graph, Tabelle etc.) • Evtl. (bewusstes) Vornehmen weiterer Vereinfachungen aufgrund der Begrenztheit der zur Verfügung stehenden Mathematischen Modelle 4. Die dem Mathematischen Modell zugrunde liegende Aufgabenstellung lösen • Mathematische Werkzeuge auswählen bzw. erschaffen • Mathematisches Wissen und/oder heuristische Strategien anwenden • Unter Berücksichtigung der Genauigkeit der Eingangsvariablen das Ergebnis der Modellrechnung sinnvoll runden 5. Interpretieren des Mathematischen Resultats • Mathematische Grundvorstellungen aktivieren und darauf basierend das mathematische Resultat innerhalb des realen Kontextes interpretieren • Abschätzen, wie speziell bzw. verallgemeinerbar die Lösung ist • Evtl. erfordert der Kontext ein situationsabhängiges Runden 6. Validieren der Lösung • Abschätzen, inwieweit das erhaltene Ergebnis, aber auch das zugrunde liegende Modell, überhaupt sinnvoll erscheinen • Abwägen, ob der Modellierungsprozess oder gewisse Teile davon erneut durchlaufen werden müssen, weil z. B. gewisse Modellannahmen nicht legitim sind oder präzisiert werden können 7. Das Ergebnis – nach einem evtl. mehrmaligen Durchlauf durch den Modellierungskreislauf – darlegen bzw. erklären • Auswahl adäquater, meistens sprachlicher und grafischer Darstellungsformen • Verdeutlichung der eingegangenen Modellannahmen sowie der darauf basierenden Lösung (Leiss, 2007, S. 32 f.)
2.4 Modellierungsprozess
29
Die Auflistung beschreibt jeweils die Tätigkeiten in den in Abbildung 2.3 dargestellten Modellierungsphasen. Dieses detaillierte Wissen zu den Modellierungsphasen ist für Lehrkräfte bei der Diagnostik von Schwierigkeiten wertvoll. Denn jede Modellierungsphase und damit auch jede dieser Tätigkeiten stellt eine potentielle Schwierigkeit für Lernende dar (vgl. Abschnitt 2.5). Für Lehrkräfte ist der Modellierungskreislauf nach Blum und Leiss (2005) daher ein diagnostisches Werkzeug und auch für die Beforschung der Lehr-Lern-Prozesse geeignet. Als metakognitives Hilfsmittel im Lösungsprozess eignen sich für Lernende hingegen eher Kreisläufe geringerer Komplexität, da sie beispielsweise zwischen dem Real- und mathematischen Modell sowie dem Interpretieren und Validieren nicht unterscheiden können (K. Maaß, 2004, S. 162). Es bedarf somit einer Reduktion des in Abbildung 2.3 dargestellten Kreislaufs. Schukajlow, Kolter und Blum (2015) entwickelten einen vierschrittigen Modellierungskreislauf für Lernende, dessen Wirkung sie auf den Erwerb von Modellierungskompetenz auch empirisch evaluierten (vgl. Abschnitt 4.2.1). Neben den vier Modellierungsphasen gibt der Kreislauf Impulse zu den einzelnen Phasen (Blum & Schukajlow, 2018; Schukajlow et al., 2015), die den Lernenden als eine Hilfe zur Selbsthilfe dienen soll. 1. Aufgabe verstehen • Lies den Aufgabentext (noch einmal) genau durch! • Stell dir die Situation konkret vor! • Mache eine Skizze und beschrifte sie! 2. Mathematik suchen • Suche die wichtigen Angaben und ergänze falls nötig fehlende Angaben! • Beschreibe den mathematischen Zusammenhang zwischen den Angaben (z. B. mit einer Gleichung oder einer geometrischen Formel)! 3. Mathematik benutzen • Was weißt du zu diesem mathematischen Thema? Wende es hier an (z. B. Gleichung lösen, Formel umrechnen, Graph zeichnen)! • Falls das nicht geklappt hat: Kannst du noch ein anderes mathematisches Verfahren anwenden? 4. Ergebnis erklären • Runde dein Ergebnis sinnvoll! • Überschlage, ob dein Ergebnis als Lösung ungefähr passt! • Schreibe einen Antwortsatz auf! (Blum & Schukajlow, 2018, S. 64)
Nachdem der Modellierungsprozess nun theoretisch beschrieben wurde, wird der Fokus im Folgenden auf die realen Modellierungsprozesse von Schülerinnen und Schülern gelegt. Die übergeordnete Fragestellung lautet: Durchlaufen die Lernenden den Modellierungskreislauf in der theoretisch beschriebenen Art und Weise? Es wird zwischen individuellen Modellierungsprozessen einzelner Lernender und
30
2
Mathematisches Modellieren
dem Verlauf von Gruppenprozessen unterschieden. Wissen über den realen Verlauf von Modellierungsprozessen stellt in Ergänzung zum Wissen zu den typischen Tätigkeiten in den Modellierungsphasen eine Grundlage für eine adäquate Unterstützung der Lösungsprozesse dar. Insbesondere für die diagnostischen Tätigkeiten der Lehrkräfte erscheint es bedeutsam.
2.4.2
Individuelle Modellierungsverläufe
Grundsätzlich ist es nicht selbstverständlich anzunehmen, dass sich die Phasen des Modellierungskreislaufs empirisch in gleicher Weise rekonstruieren lassen. Borromeo Ferri (2011) verwendete für die qualitative Untersuchung der Lösungsprozesse von 35 Lernenden den Modellierungskreislauf nach Blum und Leiss (2005), wobei sie das Situationsmodell stattdessen mit dem Begriff der „Mentalen SituationsRepräsentation“ (Borromeo Ferri, 2011, S. 40) bezeichnet. Dieser Begriff legt den Fokus auf die individuellen Prozesse der Lernenden und ist nicht wie der Begriff des Situationsmodells aus der Tradition der Textlinguistik entstanden. Anhand von Videoaufnahmen der Gruppenarbeitsprozesse identifizierte sie die aktuellen Phasen des Modellierungsprozesses (Borromeo Ferri, 2011). Die Querschnittsanalyse der Daten zeigt, dass sich die Phasen des Modellierungskreislaufs mit zusätzlichen Ausdifferenzierungen empirisch rekonstruieren lassen. Eine Zuordnung von Phasen war sowohl auf individueller als auch auf der Ebene der Gruppe möglich. Es wurde der empirische Nachweis erbracht, dass der von den Lernenden durchlaufende Modellierungsprozess nicht so idealtypisch verläuft, wie es durch die theoretisch konzeptualisierten Modellierungskreisläufe suggeriert wird (Borromeo Ferri, 2011, S. 171). Die Phase des Validierens differenzierte Borromeo Ferri basierend auf ihren Ergebnissen in das intuitive und wissensbasierte Validieren. Das intuitive Validieren bezeichnet eine Bewertung des Ergebnisses auf Basis von Gefühlen oder Erfahrungen. Es wird keine stichhaltige rationale Argumentation für die Aussage angegeben. Das wissensbasierte Validieren wird anhand von außermathematischem Wissen vorgenommen, mit dem die Plausibilität des Ergebnisses beurteilt werden kann. Die Lernenden kommen so zu einer fundierten Entscheidung, ob das Ergebnis und Modell angenommen oder verworfen werden muss. Unabhängig von diesen beiden Kategorisierungen beschreibt Borromeo Ferri sogenannte „innermathematische Validierungen“ (Borromeo Ferri, 2011, S. 113), mit denen das wiederholte Ermitteln von mathematischen Ergebnissen gemeint ist, ohne dass ein expliziter Bezug zur Realität hergestellt wird. (Borromeo Ferri, 2011, S. 112 f.).
2.4 Modellierungsprozess
31
Da sich in Gruppenarbeitsprozessen Modellierungsprozesse einzelner Schülerinnen und Schüler erkennen lassen, die sich teilweise stark ähneln aber auch stark voneinander abweichen können, ist der Begriff des „individueller[n] Modellierungsverlauf[s]“ (Borromeo Ferri, 2011, S. 114) deutlich geeigneter zur Bezeichnung von individuellen Modellierungsprozessen. Dieser wird wie folgt definiert: Als individueller Modellierungsverlauf wird der Modellierungsprozess des Individuums auf interner und externer Ebene bezeichnet. Das Individuum beginnt den Verlauf in einer bestimmten Phase und durchläuft verschiedene Phasen mehrfach oder einmalig, dabei manche Phasen intensiver und andere auslassend. (Borromeo Ferri, 2011, S. 114; Hervorhebung im Original)
Mit der internen Ebene ist hierbei die Gedankenwelt des Individuums gemeint. Modellierungsverläufe können jedoch durch den Beobachtenden – insbesondere durch Lehrkräfte – nur anhand der externen Ebene, also anhand von Verbalisierungen oder Aufschriften der Lernenden, rekonstruiert werden, weshalb auch vom „sichtbaren Modellierungskreislauf“ (Borromeo Ferri, 2011, S. 114) gesprochen wird. Bei der Untersuchung der Lösungsprozesse untersuchte Borromeo Ferri in Anlehnung an kognitionspsychologische Theorien den Einfluss mathematischer Denkstile (Borromeo Ferri, 2004) auf den Lösungsprozess der Lernenden. Dabei unterschied sie den visuellen, analytischen und integrierten Denkstil (Borromeo Ferri, 2011, S. 45): • Der visuelle Denkstil zeichnet sich durch Präferenzen für bildliche interne Vorstellungen und externe Darstellungen aus. Mathematische Sachverhalte und Zusammenhänge werden überwiegend ganzheitlich erfasst. • Der analytische Denkstil zeigt Präferenzen für formale interne Vorstellungen und externe Darstellungen. Mathematische Sachverhalte und Zusammenhänge werden überwiegend durch ein schrittweises Vorgehen erfasst. • Der integrierte Denkstil weist Präferenzen für beide Denkstile auf. Aufgrund der Fähigkeit zwischen beiden Denkstilen zu wechseln, zeigen diese Individuen viel Flexibilität im Umgang mit Aufgaben. In den individuellen Modellierungsverläufen wurden bis auf einige Ausnahmen bestimmte Muster erkannt. Lernende, die als bildliche Denker klassifiziert wurden, verweilten zu Beginn längere Zeit in der Realität, um sich die Situation zu veranschaulichen. Erst spät nahmen Sie eine Mathematisierung vor. Bei den bildlichen Denkern wurde daher ein eher idealtypisches Durchlaufen des Modellierungskreislaufs beobachtet. Die Präferenz für das Arbeiten in der Realität wurde anhand der
32
2
Mathematisches Modellieren
Anzahl der Aussagen der Lernenden deutlich. Der Großteil konnte dem Bereich Realität zugeordnet werden. Formale Denker wechseln früh im Lösungsprozess in die Mathematik. Durch die fehlende Konkretisierung des Realmodells müssen sie häufig in die Realität zurückspringen, um dieses nachträglich auszubilden. Bei den formalen Denkern konnte ein größerer Anteil der Aussagen dem Bereich Mathematik zugeordnet werden. In beiden Denkstilen war eine Tendenz für die jeweilige Repräsentationsebene erkennbar. Bei Individuen, denen der integrierte Denkstil zugeordnet wurde, wurde kein Verlaufsmuster identifiziert (Borromeo Ferri, 2011, S. 171). Die Studienergebnisse veranschaulichen den Einfluss des außermathematischen Wissens und persönlicher Erfahrungen auf den individuellen Modellierungsverlauf. Selbst formale Denker mit einem entsprechend großen persönlichen Bezug zum außermathematischen Kontext orientierten sich bei der Lösung stark an auf die Realität bezogenen Sachverhalten. Ebenso hat die Struktur der Aufgabe und die Interaktion in der Gruppe einen Einfluss auf den Verlauf des Modellierungsprozesses (vgl. Abschnitt 2.4.3). Damit kann festgehalten werden, dass der Modellierungsprozess durch ein komplexes Gefüge von mathematischem Denkstil, außermathematischem Wissen und der Interaktion der Lernenden in der Gruppe sowie durch die Struktur der Aufgabe beeinflusst wird (Borromeo Ferri, 2011, S. 169 ff.).
2.4.3
Gruppenverläufe
Da Lehrkräfte bei der Bearbeitung von Modellierungsaufgaben in der Regel Kleingruppen von Lernenden betreuen, werden Ergebnisse aus zwei Studien vorgestellt, in denen nicht der Modellierungsprozess einzelner Lernender, sondern von ganzen Gruppen analysiert werden. Treilibs, Burkhardt und Low (1980) untersuchten den Verlauf von Lösungsprozessen in Gruppenarbeiten. Sie stellen die Lösungsprozesse von als gut identifizierten Modellierern („good modelling“) denen von schwachen („poor modelling“) Modellierern (Treilibs et al., 1980, S. 47 ff.) in sogenannten Flowcharts gegenüber und vergleichen diese. Dazu teilten sie den Lösungsprozess in die folgenden Phasen ein (Treilibs et al., 1980, S. 1 ff.):
2.4 Modellierungsprozess
33
• Formulation. Das Erstellen einer theoretischen Struktur, die wesentliche Aspekte der Realsituation widerspiegelt. • Solution. Die Lösung des mathematischen Modells, um zu einem Ergebnis zu gelangen. • Interpretation. Die Übersetzung von mathematischen Antworten in die Sprache der Realsituation. • Validierung. Die Beurteilung des Zwecks und der Genauigkeit des Modells anhand der Realsituation.
Problem MT2
Terry is soon to go to secondary school. The bus trip to school costs 5p and Terry’s parents are considering the alternative of bying a bicycle. Help Terry’s parents decide what to do by carefully working out the relative merits of the two alternatives. (Treilibs et al., 1980, S. 47)
Sie verwendeten Modellierungsaufgaben unterschiedlichen Schwierigkeitsgrades, die von Sechstklässlern in Vierergruppen gelöst wurden. Für die folgende Modellierungsaufgabe sind in Abbildung 2.4 und 2.5 die jeweiligen Flowcharts dargestellt. Durch den Vergleich der Flowcharts mehrerer Gruppen formulieren Treilibs et al. (1980) folgende Hypothesen: • Gute Modellierer sahen die Struktur der Lösungsmethode voraus und haben daher eine gute Orientierung im Lösungsprozess. Schlechte Modellierer erstellen Variablen und Ergebnisse eher zufällig und sehen nur die Art der Lösung voraus. • Gute Modellierer steuerten eher die Organisation des Lösungsprozesses. Die Gruppenmitglieder stimmten sich über die genaue Fragestellung, die Methode, das benötigte mathematische Werkzeug und die Art der Darstellung der Ergebnisse ab. Schwache Modellierer scheinen organisatorische – oder grundsätzlich – Entscheidungen zu vermeiden.
34
2
Mathematisches Modellieren
Abbildung 2.4 Flowchart eines „poor modelling“ (Treilibs et al., 1980, S. 47)
• Gute Modellierer waren in der Lage, die Lösung des Problems in Teilprobleme aufzuteilen, diese zu bearbeiten und am Ende zu einem Bild zusammenzufügen. • Gute Modellierer hatten im Gegensatz zu schwachen Modellierern den Willen Annahmen zu treffen. Treilibs et al. beobachteten iterative Prozesse, die regelmäßig bei der Identifikation von Variablen, Zusammenhängen und Lösungen auftauchten. Sie bezeichneten diese Prozesse als „loop[s]“ (Treilibs et al., 1980, S. 53). Als gute Modellierer bezeichnen sie Probanden, die diese effizient durchliefen, da sie beispielsweise mehr Variablen in derselben Anzahl loops identifizierten als schwache Modellierer (vgl. Abbildung 2.4 und 2.5).
2.4 Modellierungsprozess
35
Abbildung 2.5 Flowchart eines „good modelling“ (Treilibs et al., 1980, S. 49)
Treilibs et al. (1980) stellen fest, dass gute Modellierer in der Lage sind, auf einer strategischen Ebene zu arbeiten, Metakognition zu betreiben und den eigenen Lösungsprozess zu kontrollieren. Gute Modellierer verstanden das zugrundeliegende Modell bereits zu Anfang auf einer qualitativen Ebene, was eine bessere Steuerung des Lösungsprozesses und das Aufteilen der Problemstellung in Teilprobleme ermöglicht. So fiel auch die Auswahl von geeigneten mathematischen Werkzeugen zur Modellierung einfacher. Sie sind sich eher über die Notwendigkeit bewusst, im Problemkontext Annahmen zu treffen, welche häufig eine hohe Qualität aufwiesen (Treilibs et al., 1980). Diese Ergebnisse sind ein Hinweis für die Bedeutung metakognitiver Kompetenzen im Rahmen von Modellierungskompetenz. Der Lehrkraft kommt daher die Aufgabe zu, Prozesse, wie die Organisation des Lösungsprozesses und die Auswahl geeigneter Werkzeuge, zu unterstützen.
36
2
Mathematisches Modellieren
Neben der Rekonstruktion von individuellen Modellierungsverläufen beschrieb Borromeo Ferri (2011) auch den Verlauf des Lösungsprozesses ganzer Gruppen. Sie definiert den Begriff des Gruppenverlaufs wie folgt: Ein „Gruppenverlauf“ ist der Modellierungsverlauf einer Gruppe, die eine Modellierungsaufgabe gemeinsam bearbeitet. Der Gruppenverlauf beschreibt den Modellierungsverlauf aller Gruppenmitglieder als eine Einheit. Der Gruppenverlauf kann, sollte sich die Gruppe während des Prozesses zeitweise in weitere Untergruppen teilen, auch über den Verlauf der Untergruppen beschrieben werden. Der Gruppenverlauf umfasst auch den Prozess von Individuen, falls diese losgelöst von der Gruppe arbeiten. … (Borromeo Ferri, 2011, S. 131; Hervorhebung im Original)
Sie formuliert die Hypothese, dass diese Gruppenverläufe ebenfalls empirisch rekonstruierbar sind. Ein systematischer Zusammenhang mit den mathematischen Denkstilen konnte für die Gruppenverläufe nicht nachgewiesen werden (Borromeo Ferri, 2011, S. 172). Der individuelle Modellierungsverlauf aktiver Gruppenmitglieder beeinflusst den Gruppenverlauf relativ stark. So sind Individuen, die sich im Lösungsprozess engagieren, auch häufig für einen Phasenwechsel verantwortlich. Zusätzlich weichen individuelle Modellierungsverläufe einzelner Individuen vom Gruppenverlauf ab. Dies konnte insbesondere bei passiven Lernenden nachgewiesen werden. Die gegenseitige Beeinflussung der Lernenden steht mit den mathematischen Denkstilen der Individuen in Verbindung. So besteht die Tendenz, dass bildliche Denker von Gruppenmitgliedern in Richtung der Mathematik und formale Denker in Richtung der Realität beeinflusst werden (Borromeo Ferri, 2011, S. 172). Borromeo Ferri folgert aus diesen Ergebnissen, dass es durch die Beeinflussung in der Gruppe für den Zusammenhang zwischen mathematischen Denkstilen und den individuellen Modellierungsverläufen zu einer „schwankenden Konformität“ (Borromeo Ferri, 2011, S. 106) kommt. Durch die Beeinflussung verfolgen die Individuen nicht mehr den für ihren Denkstil typischen Modellierungsverlauf. Die Daten wiesen jedoch eine relativ hohe Konformität auf (Borromeo Ferri, 2011). Durch den Vergleich unterschiedlicher Gruppen konnte bei einer der drei verwendeten Modellierungsaufgaben das „Phänomen der Realmodellrückinterpretation“ (Borromeo Ferri, 2011, S. 106) festgestellt werden. Zwischenschritte oder -ergebnisse werden im Lösungsprozess mehrfach auf die Realität bezogen, um das reale oder mathematische Modell anzupassen. Die Autorin bezeichnet diese häufigen Rückinterpretationen als „Minikreisläufe“ (Borromeo Ferri, 2011, S. 108). Die Minikreisläufe haben die folgende Struktur (Borromeo Ferri, 2011, S. 151):
2.4 Modellierungsprozess
37
• Die Mathematisierung führt zu einem mathematischen Zwischenergebnis. • Das Zwischenergebnis wird in das reale Modell zurückinterpretiert. • Anhand des mathematischen Zwischenergebnisses wird das mathematische Modell weiter verbessert. • Die Mathematisierung führt zu einem weiteren mathematischen Zwischenergebnis. Der Prozess beginnt erneut. Das Auftauchen von Minikreisläufen hängt vor allem mit der Struktur der Modellierungsaufgabe zusammen, wobei hierbei ein Zusammenhang mit dem Gruppenverlauf identifiziert wurde. Es werden zwei Typen von Aufgaben unterschieden, die einen unterschiedlichen Einfluss auf den Lösungsprozess hatten: • Bei Pythagoras-Aufgaben (Borromeo Ferri, 2011, S. 152) besteht die größte Schwierigkeit im Finden eines geeigneten Ansatzes bzw. dem Bilden eines mathematischen Modells. Ist der Ansatz gefunden und das außermathematische Wissen erworben, ist das weitere Vorgehen klar. • Bei funktionalen Aufgaben (Borromeo Ferri, 2011, S. 152) ist der Aufbau des mathematischen Modells direkt ersichtlich, sodass ein schneller Wechsel in die Mathematik stattfindet. Die größte Schwierigkeit liegt im Treffen von einer relativ großen Zahl geeigneter Annahmen. Das mathematische Modell wird anhand von Zwischenergebnissen stetig verbessert. Bei der Bearbeitung von funktionalen Aufgaben traten häufiger Minikreisläufe im Gruppenverlauf auf. Die Zwischenergebnisse wurden immer wieder in die Realität rückinterpretiert, um das mathematische Modell weiter zu verbessern. Bei Pythagoras-Aufgaben sind hingegen selten Minikreisläufe zu beobachten. Generell treten Minikreisläufe bevorzugt gegen Ende des Lösungsprozesses auf, da hier häufig Rekapitulationsprozesse stattfinden (Borromeo Ferri, 2011, S. 152 f.). Die beiden Studien geben einen Einblick in die kognitiven Prozesse von Schülerinnen und Schülern, die für Lehrkräfte bei der Unterstützung von Modellierungsprozessen von Bedeutung sind. Die qualitativen Ergebnisse sind als Hypothesen zu betrachten, deren Gültigkeit noch empirisch abgesichert werden muss. Dennoch erlauben es die Erkenntnisse, den Verlauf des Modellierungsprozesses bereits im Vorfeld besser einzuschätzen. Durch die Zuordnung zu den genannten Aufgabentypen kann die Lehrkraft Anforderungen der Modellierungsaufgabe antizipieren und ihr Interventionsverhalten dementsprechend vorbereiten. Somit können sowohl bezogen auf die verwendete Modellierungsaufgabe als auch in Bezug auf die
38
2
Mathematisches Modellieren
Lerngruppe Schwierigkeiten vorhergesehen werden, sodass Interventionsprozesse – zumindest partiell – planbar werden. Insbesondere die Antizipation von Interventionen durch die Lehrkraft zu typischen, im Vorfeld zu erwartenden Schwierigkeiten sollte ein Bestandteil der Planung von Unterricht zu Modellierungsaufgaben sein.
2.5
Schwierigkeiten im Modellierungsprozess
Ein Wissensrepertoire über typische Probleme von Schülerinnen und Schülern kann die Lehrkraft im Unterricht unterstützen. Die Diagnostik von Problemen im Lösungsprozess stellt einen Bestandteil von Interventionen in kooperativen Bearbeitungsprozessen dar (vgl. Kapitel 5). Daher wird anhand verschiedener Studien ein Überblick zum Stand der Forschung gegeben.
2.5.1
Studien zu Fehlern, Blockaden und Schwierigkeiten
Einige Studien untersuchten Schülerinnen und Schüler beim Modellieren mit dem Fokus auf Problemen im Lösungsprozess, wobei sich die Definitionen eines Problems im Modellierungsprozess stark unterscheiden. Auch beziehen sich die nationalen und internationalen Studien auf sehr unterschiedliche Modellierungskreisläufe, sodass die identifizierten Probleme unterschiedlichen Modellierungsphasen zugeordnet werden. Die Ergebnisse der Studien veranschaulichen, dass Schwierigkeiten in jeder Modellierungsphase auftreten (Blum & Borromeo Ferri, 2009; Galbraith & Stillman, 2006; K. Maaß, 2004). Im Folgenden werden ausgewählte Studien vorgestellt. Es wird eine einheitliche Arbeitsdefinition vorgenommen und ein zusammenfassendes Kategoriensystem für Schwierigkeiten im Modellierungsprozess dargestellt. Dieses aus der Literatur zusammengestellte Kategoriensystem ist für Lehrkräfte bei der Antizipation von Problemen als auch bei der Diagnostik von Problemen im Modellierungsprozess hilfreich. Die Studie von Maaß (2004) Maaß (2004) untersuchte Modellierungsaufgaben in Klassenarbeiten und Tests, um häufige Fehler beim Durchführen des Modellierungsprozesses zu ermitteln, die auch von leistungsstarken Lernenden begangen werden. Dazu analysierte sie die Klassenarbeiten, Hausaufgaben und einen durchgeführten Modellierungskompetenztest von zwei 7. bzw. 8. Klassen qualitativ. Sie klassifizierte die Fehler anhand der Modellierungsphasen, in denen sie sich ereigneten (K. Maaß, 2004, S. 160 ff.):
2.5 Schwierigkeiten im Modellierungsprozess
39
1. Fehler beim Aufstellen des Realmodells • Treffen von falschen oder abwegigen Annahmen, • Bildung des Realmodells wird nicht beschrieben. 2. Fehler beim Aufstellen des mathematischen Modells • Anwenden falscher Algorithmen, • Verwenden nicht-adäquater mathematischer Schreibweisen. 3. Fehler beim Bearbeiten des mathematischen Modells • Rechenfehler, • Fehlende heuristische Strategien, • Bearbeitung ohne Ergebnis beendet. 4. Fehler beim Interpretieren der Lösung • Falsche Interpretation des Ergebnisses, • Ergebnis wird nicht interpretiert. 5. Fehler beim Validieren der Lösung • Ergebnis wird oberflächlich validiert, • Unzulänglichkeit des Modells wird erkannt, aber nicht verbessert, • Ergebnis wird nicht validiert. 6. Fehler, die den ganzen Modellierungsprozess betreffen • Aspekte des Sachkontextes werden beschrieben, aber nicht in die Modellierung miteinbezogen, • Modellierung wird abgebrochen, da Berechnung zu unübersichtlich • oder aufgrund fehlenden Wissens nicht möglich, • Verlieren des Überblicks, • Lernende berichten von Erfahrungen im Sachkontext ohne diese in die Modellierung miteinzubeziehen, • Ungenügende Kommunikation über den Modellierungsprozess, fehlende Argumentationen. Maaß konnte Zusammenhänge zwischen den auftretenden Fehlern feststellen. So traten Fehler beim Bilden des Realmodells häufig in Verbindung mit Fehlern beim Validieren auf. Sie führt dies darauf zurück, dass die Aufgaben für die Lernenden neu waren und sie daher über keine Erfahrungen mit Modellierungsaufgaben verfügten. Bei Lernenden mit durchschnittlichen bis schwachen Leistungen in Mathematik traten bevorzugt Fehler beim Mathematisieren, beim Lösen des mathematischen Modells und beim Interpretieren auf (K. Maaß, 2004, S. 161).
40
2
Mathematisches Modellieren
Darüber hinaus untersuchte sie anhand von Interviews und angefertigten Concept Maps Fehlvorstellungen zu den Modellierungsphasen. Dabei fand sie Zusammenhänge zwischen den Modellierungskompetenzen und den zugehörigen Metakenntnissen. Fehlendes Wissen über den Modellierungsprozess führte zu Fehlern im Lösungsprozess (K. Maaß, 2004, S. 162 ff.). Die Studie von Schaap, Vos und Goedhardt (2011) Schaap et al. (2011) suchten anhand von fünf verschiedenen Modellierungsaufgaben in aufgabenbasierten Interviews nach Blockaden im Modellierungsprozess. Dazu interviewten sie sechs Lernende der 11. Klasse. Unter einer Blockade verstehen die Autoren Aktivitäten im Modellierungsprozess, die nicht erfolgreich durchgeführt werden. Die Studie konzentrierte sich auf die Übersetzungsprozesse von der Realität in die Mathematik im Sinne des Modellierungskreislaufs nach Blum und Leiss (2005). Die identifizierten Blockaden wurden den Modellierungsphasen zugeordnet (Schaap et al., 2011): 1. Blockaden beim Verstehen/Konstruieren • Nicht-Verstehen der Fragestellung, • Hinderliche Formulierung der Fragestellung, • Übersehen entscheidender Aspekte der Fragestellung, • Erwarten von Hinweisen, einem Leitfaden und Daten in der Fragestellung. 2. Blockaden beim Vereinfachen/Strukturieren • Treffen falscher Annahmen, • Fehlende Identifizierung relevanter Variablen. 3. Blockaden beim Mathematisieren • Mangelnde Fähigkeiten Angaben in Beziehungen zwischen den Variablen zu übersetzen, • Mangelnde algebraische Fähigkeiten. Auch Schaap et al. stellen fest, dass Blockaden auftreten, die nicht dem Modellierungskreislauf zugeordnet werden können. So beobachten sie ein sogenanntes „cue-based behaviour“ (Schaap et al., 2011, S. 145; Hervorhebung im Original), bei dem eine Schülerin eine Annahme nicht miteinbezieht, da dazu kein Hinweis in der Aufgabenstellung zu finden ist. Da dieses Verhalten mit Metawissen über Aufgaben in Verbindung steht, ordnen die Autoren diese Blockade den metakognitiven Kompetenzen zu. Negative Erfahrungen mit und Einstellung über Mathematik werden als hinderlich im Modellierungsprozess angesehen. Schaap et al. bringen dies mit Beliefs über Mathematik in Verbindung. So kann eine nicht-ansprechende
2.5 Schwierigkeiten im Modellierungsprozess
41
Aufgabe oder fehlendes Selbstbewusstsein eine Blockade darstellen. Kommunikationsschwierigkeiten können ebenso Blockaden im Lösungsprozess darstellen. Schaap et al. schlagen eine Erweiterung ihres Kategoriensystems für Blockaden um die Kategorien der metakognitiven Kompetenzen und Beliefs vor. Die Studien von Galbraith, Stillman, Brown und Edwards Galbraith und Stillman (2006) entwickelten einen sogenannten „emergent framework“ (Galbraith & Stillman, 2006, S. 146), indem sie die Modellierungsphasen als Kategorien in einer qualitativen Studie mit beobachteten Blockaden füllten (Galbraith & Stillman, 2006; Galbraith, Stillman, Brown, & Edwards, 2007). Verschiedene Lehrkräfte setzten insgesamt vier Modellierungsaufgaben im Unterricht ein. Lernende im Alter von 14 bis 15 Jahren wurden bei der erstmaligen Bearbeitung von Modellierungsaufgaben untersucht. Dazu wurden Videoaufnahmen, Interviews und Aufzeichnungen der Lernenden verwendet. Ein besonderer Fokus in den beiden Studien lag auf dem Technologieeinsatz. Durch den Einsatz von zwei Modellierungsaufgaben wurde ein Kategoriensystem erstellt (Galbraith et al., 2007) und schließlich anhand zweier weiterer Modellierungsaufgaben in anderen Lerngruppen präzisiert und bestätigt (Galbraith & Stillman, 2006). In dem in Abbildung 2.6 dargestellten detaillierten Kategoriensystem für Blockaden im Modellierungsprozess stellen die Phasenübergänge im Modellierungsprozess die Hauptkategorien dar. In einer weiteren Studie befragten Stillman, Brown und Galbraith (2013) Lernende nach der Absolvierung eines Modellierungswettbewerbs nach erlebten Schwierigkeiten. Dazu wurde ein Fragebogen mit offenen Items eingesetzt, der inhaltsanalytisch ausgewertet wurde. Die Schülerinnen und Schüler beschrieben organisatorische Schwierigkeiten, wie den Umgang mit offenen Modellierungsaufgaben und die Steuerung der Gruppenarbeit. Die Suche nach Informationen und Daten bereitete Lernenden Probleme, was bezeichnend für das gewohnte Arbeiten mit exakten Werten ist. Weiterhin wurden Prozesse wie das Mathematisieren, die Lösung des mathematischen Modells, Erzeugen und Interpretieren von Zwischenergebnissen und die Verifizierung genannt (Stillman et al., 2013). Obwohl in den beschriebenen Studien unterschiedliche Hauptkategorien verwendet werden, beziehen sie sich alle auf den Modellierungskreislauf. Eine zusammenfassende Einordnung scheint daher möglich und aufgrund der Vielzahl identifizierter Probleme sinnvoll. In den Studien werden zur Bezeichnung von Problemen im Lösungsprozess die Begriffe Fehler, Blockade und Schwierigkeit verwendet. Für die Kategorisierung der beobachteten Probleme ist daher zuvor eine einheitliche Arbeitsdefinition vorzunehmen.
42
2
Mathematisches Modellieren
Abbildung 2.6 Auszug des Emergent Frameworks nach Galbraith und Stillman (2006)
2.5 Schwierigkeiten im Modellierungsprozess
2.5.2
43
Begriff der Schwierigkeit
Der in der Studie von Maaß (2004) verwendete Begriff Fehler lässt sich im Allgemeinen als „etwas Falsches, Nichtrichtiges, Unkorrektes oder Unzweckmäßiges“ (Heinrich, 2016, S. 4) definieren. Er stellt „ein[en] Sachverhalt oder Prozess [dar], der von einer Norm (z. B. vorgegebenen Rechenregeln) oder einem Ideal (z. B. einer erfolgsversprechenden Vorgehensweise) abweicht“ (Rott, 2016, S. 13). So können auch von den Schülerinnen und Schülern als subjektiv richtig empfundene Sachverhalte oder Prozesse als Fehler klassifiziert werden (Prediger & Wittmann, 2009; Rott, 2016). Bei den von Heinrich (2016) angesprochenen Prozessfehlern fällt es nicht immer leicht, eindeutig festzustellen, ob ein Fehler vorliegt oder nicht. Einer Rechenaufgabe sieht man an, ob sie korrekt oder falsch ausgeführt wurde. Bei der Beurteilung von Modellierungsprozessen und deren Ergebnissen ist aufgrund der multiplen Lösungsmöglichkeiten nicht immer eine eindeutige Zuordnung möglich. Krug und Schukajlow (2015) unterscheiden sogenannte weiche und harte Fehler. Weiche Fehler hängen von der angestrebten Genauigkeit des Modells ab. Je nach Passung des Modells kann es bezüglich dieses Anspruchs dann als fehlerhaft oder geeignet bezeichnet werden. Harte Fehler bezeichnen eindeutiger zuzuordnende Defizite, wie beispielsweise das Erstellen eines Modells, das nicht zur Situation passt (Krug & Schukajlow, 2015). Da nicht immer eine eindeutige Zuordnung vorgenommen werden kann, ist die alleinige Verwendung des Begriffs Fehler für die Analyse von Modellierungsprozessen nicht geeignet. Der Begriff Blockade wird bei Galbraith und Stillman (2006) als etwas definiert, das den Fortschritt im Lösungsprozess behindert. Bei Schaap et al. (2011) liegt eine Blockade vor, wenn eine Aktivität nicht erfolgreich durchgeführt wird. Liegt im Lösungsprozess eine Blockade vor, handelt es sich im Sinne von Rott (2016) auch um einen Fehler. Umgekehrt wird ein Fehler in der Regel, wenn auch eventuell erst langfristig, zu einer Blockade führen. Ein Beispiel hierfür ist das oben angesprochene Erstellen eines inadäquaten Modells. Erst bei der Beantwortung der Fragestellung kommt es zu einer Blockade, da das Modell aufgrund der fehlenden situativen Passung keine Antwort liefern kann. Der Terminus Schwierigkeit wird bei Stillman et al. (2013) nicht näher konkretisiert. Er dient im Folgenden als Oberbegriff für Probleme im Modellierungsprozess, da er begrifflich nicht vorbelastet ist. Anhand der folgenden Arbeitsdefinition können Schwierigkeiten während des Modellierungsprozesses identifiziert werden. Der zuvor häufig verwendete Begriff „Problem“ wird aufgrund der Mehrdeutigkeit hinsichtlich des Begriffs der Problemstellung – insbesondere im Englischen – nicht verwendet.
44
2
Mathematisches Modellieren
Schwierigkeit
Es liegt eine Schwierigkeit im Modellierungsprozess vor, falls ein Lernender einen Fehler im Sinne von Rott (2016) begeht oder erkennbar ist, dass ein zur Lösung der Modellierungsaufgabe notwendiger Prozess nicht durchgeführt werden kann. Mit dem in der Definition verwendeten Fehlerbegriff nach Rott (2016) wird der Begriff der Blockade miteingeschlossen. Die Definition ist recht allgemein, was für die Erfassung von Schwierigkeiten in Modellierungsprozessen unter Berücksichtigung des erweiterten Begriffs von Modellierungskompetenz (vgl. Abschnitt 2.3) mit seiner Vielzahl von Komponenten und der Breite der in den Studien identifizierten Schwierigkeiten notwendig ist. Zudem beschränkt sich die Definition auf die erkennbaren Schwierigkeiten, sodass im Hinblick auf eine Diagnostik durch die Lehrperson lediglich wahrnehmbare Schwierigkeiten eine Rolle spielen. Anhand dieser Arbeitsdefinition werden die in den Studien identifizierten Schwierigkeiten zusammenfassend klassifiziert.
2.5.3
Kategorien von Schwierigkeiten im Modellierungsprozess
Die beobachteten Schwierigkeiten der dargestellten Studien werden zusammenfassend kategorisiert und sind in Tabelle 2.4 dargestellt. Die sich auf den Modellierungskreislauf beziehenden Hauptkategorien wurden aus der Studie von Maaß (2004) übernommen (vgl. auch Klock & Siller, 2020a). Bei der Kategorisierung der sich nicht auf den Modellierungskreislauf beziehenden Schwierigkeiten konnten die zusätzlichen Hauptkategorien metakognitive Aspekte (Schaap et al., 2011), affektive Aspekte, soziale Aspekte und organisatorische Aspekte identifiziert werden. Das Kategoriensystem fasst die empirisch identifizierten Schwierigkeiten aus den beschriebenen nationalen und internationalen Studien zusammen, wobei jeder Kategorie mindestens eine der in Abschnitt 2.5.1 genannten Schwierigkeit zugeordnet wurde (vgl. Indizes in Tabelle 2.4). Die Tabelle stellt keine vollständige Auflistung von Schwierigkeiten in Modellierungsprozessen dar. Sie vermittelt jedoch einen Eindruck über potentielle Schwierigkeiten, die bei der Bearbeitung von Modellierungsaufgaben in den untersuchten Lerngruppen auftraten.
Definieren von Variablen, Einführen geeigneter Notationena,c
Finden von Zusammenhängen zwischen Variablenb,c
Anwenden math. Methoden zum Mathematisierena,b,c
Verwenden von Technologiec
Verstehen des Kontextesc
Verstehen der Aufgabeb
Suchen fehlender Informationend
Identifizieren relevanter Variablenb,c
Verwenden von Technologiec
Anwenden von Lösungs strategien und Algorithmena,c
Anwenden von Formelna,c
Bearbeiten des math. Modells
Beantworten der Fragestellungc
Identifizieren der Bedeutung der Ergebnisse in der Realsituationa,c
Interpretieren
Beurteilen des Modells (global)c
Finden von Verbesserungsmöglichkeitena
Identifizieren Einfluss von Annahmen auf die math. Ergebnissec
Prüfen von (Zwischen-) Ergebnissen anhand der Realsituationa,c
Validieren
a Maaß (2004), b Schaap et al. (2011), c Galbraith & Stillman (2006), d Stillman et al. (2013)
Treffen sinnvoller Annahmena,b
Bilden des math. Modells
Bilden des Realmodells
Fehlendes Metawissen zu Modellierungsschrittena
Fehlendes Metawissen zu Modellierungsaufgabenb,d
Einbezug des Sachkontextes in die Modellierunga
Behalten des Überblicks über den eigenen Lösungsprozessa
Metakognitive Aspekte
Tabelle 2.4 Kategoriensystem für Schwierigkeiten im Modellierungsprozess
Negative Einstellungen zu Modellierungsaufgabenb
Fehlendes Selbstbewusstseinb
Affektive Aspekte
Fehlende Steuerung der Gruppenarbeitd
Probleme bei der Kommunikationa,b
Soziale Aspekte
Hinderliche Formulierung der Modellierungsaufgabeb
Organisatorische Aspekte
2.5 Schwierigkeiten im Modellierungsprozess 45
46
2
Mathematisches Modellieren
Bei der Beobachtung von Modellierungsprozessen können sich auf den Modellierungskreislauf beziehende Schwierigkeiten anhand der Definition des Schwierigkeitsbegriffs (vgl. Abschnitt 2.5.1) zu den Kategorien in Tabelle 2.4 zugeordnet werden. Diese Kodierung enthält jedoch keine Information über die Ursache der aufgetretenen Schwierigkeit. Die den Modellierungsprozess übergreifenden Kategorien (metakognitive, affektive, soziale und organisatorische Aspekte) haben das Potential, Erklärungsansätze für das Auftreten von Schwierigkeiten in den einzelnen Modellierungsphasen zu liefern. Ist es Lernenden beispielsweise nicht möglich, ihre Ergebnisse angemessen zu interpretieren und ist dies auf den Verlust des Überblicks über die eigene Arbeit zurückzuführen (K. Maaß, 2004), ist diese Schwierigkeit nicht der Modellierungsphase »Interpretieren«, sondern der Kategorie der metakognitiven Aspekte zuzuordnen. Die übergreifenden Kategorien können jedoch nur schwierig durch die reine Beobachtung von Modellierungsprozessen zugeordnet werden. An dieser Stelle sind tiefergehende Methoden wie das laute Denken oder aufgabenbasierte Interviews notwendig. Zu dem in Tabelle 2.4 vergleichbare Kategoriensysteme dienen in verschiedenen Studien (Galbraith & Stillman, 2006; Galbraith et al., 2007; Klock & Siller, 2020a; Stillman, Brown, & Galbraith, 2010) zur qualitativen Untersuchung von Modellierungsprozessen und der Identifikation von Schwierigkeiten. In der vorliegenden Arbeit dient das Kategoriensystem zur Unterstützung von diagnostischen Tätigkeiten der Lehrkraft im Modellierungsprozess (vgl. Abschnitt 5.1). Die Identifikation der Modellierungsphase ermöglicht es, sich auf die Diagnostik typischer Schwierigkeiten in den einzelnen Phasen zu konzentrieren (vgl. Tabelle 2.4). In einer Gruppenarbeitssituation gleicht die Lehrkraft die empirisch gefundenen Schwierigkeiten mit der Situation der Lernenden und eventuell im Vorfeld antizipierten Schwierigkeiten zur bearbeiteten Modellierungsaufgabe ab. Das Wissen über potentielle Schwierigkeiten in den einzelnen Modellierungsphasen hat so das Potential, eine genauere und schnellere Diagnostik zu ermöglichen.
2.6
Zwischenfazit
In diesem Kapitel wurden grundlegende Begriffsbestimmungen im Bereich des mathematischen Modellierens vorgenommen. Unter einem mathematischen Modell wird eine vereinfachende Abbildung eines Originals aus der Realität verstanden, die zu einem bestimmten Zweck erstellt wird (Stachowiak, 1973). Dieses Modell kann Sachverhalte beschreiben, erklären und vorhersagen oder als ein normatives Vorbild dienen, um Prozesse regelgeleitet durchzuführen (Greefrath et al., 2013). Der Prozess des mathematischen Modellierens stellt daher die Anwendung von
2.6 Zwischenfazit
47
Mathematik auf reale Probleme in relevanten und authentischen Kontexten dar, in denen es zu Übersetzungsprozessen zwischen der realen und mathematischen Welt kommt (Greefrath et al., 2013; Siller, 2015). Solche Modellierungsprozesse werden durch Modellierungsaufgaben initiiert. In dieser Arbeit werden Modellierungsaufgaben unter einer holistischen Perspektive verstanden, bei der alle Phasen des Modellierungskreislaufs durchlaufen werden (Blomhoj & Jensen, 2003). Aufgaben mit einem hohen Modellierungsgehalt sind realitätsnah, für Lernende relevant und authentisch (Greefrath et al., 2017; Vos, 2015), unter- und/oder überbestimmt (Kuntze & Zöttl, 2008) und besitzen einen hohen Grad an Offenheit (K. Maaß, 2010). Diese Art von Aufgaben kam beim Modellieren mit Schülerinnen und Schülern und Lehramtsstudierenden zum Einsatz. Die zur Lösung von Modellierungsaufgaben notwendigen Kompetenzen lassen sich in einem engeren und weiteren Sinne verstehen. Im Hinblick auf die Unterstützung von Modellierungsprozessen durch die Lehrkraft wird die Modellierungskompetenz im weiteren Sinne verstanden, die neben den kognitiven Fähigkeiten und Fertigkeiten, die einzelnen Modellierungsphasen geeignet durchzuführen (Modellierungskompetenz im engeren Sinne (bspw. Niss et al., 2007, S. 12 f.)), motivationale, volitionale, soziale und metakognitive Kompetenzen miteinbezieht. Dieses Verständnis von Modellierungskompetenz erscheint bezüglich der durch die Lehrkraft zu überwachenden gleichartigen Aspekte (Kognition, Motivation, Leistungsbereitschaft, Kommunikation und Metakognition) bei der Unterstützung von Lernenden als geeignet. Als diagnostisches Werkzeug für Lehrkräfte eignet sich der Modellierungskreislauf nach Blum und Leiss (2005), modifiziert nach Leiss (2007, S. 31), der die Tätigkeiten und Prozesse in den einzelnen Modellierungsphasen genau beschreibt. Er ist einer der am häufigsten verwendeten Kreisläufe, dessen Phasenstruktur auch mit dem in Tabelle 2.4 dargestellten Kategoriensystem größtenteils übereinstimmt. Daher orientiert sich die Beschreibung von Modellierungsprozessen in dieser Arbeit immer an den mit diesem Modellierungskreislauf verbundenen Tätigkeiten. Zur Unterstützung von Lernenden sind hingegen Kreisläufe geringerer Komplexität mit weniger Phasen geeigneter (Schukajlow et al., 2015). Borromeo Ferri (2011) wies nach, dass Modellierungsprozesse nicht so idealtypisch und linear verlaufen, wie es durch den Modellierungskreislauf illustriert wird. Vielmehr ist der Prozess durch ständiges Hin- und Herspringen zwischen einzelnen Phasen gekennzeichnet. Der individuelle Modellierungsverlauf einzelner Lernender wird durch den jeweiligen Denkstil (bildlich, formal, integriert) und das außermathematische Wissen des Individuums bestimmt. Darüber hinaus spielen gruppendynamische Prozesse eine Rolle. Engagierte Schülerinnen und Schüler
48
2
Mathematisches Modellieren
beeinflussen den Lösungsprozess der Gruppe wesentlich im Hinblick auf den eigenen präferierten Denkstil und sind für Phasenwechsel verantwortlich. Auch die Struktur der Aufgabe beeinflusst den Lösungsprozess. Bei funktionalen Aufgaben treten häufiger Minikreisläufe auf, da die Bearbeitung der Aufgabe durch das Treffen und Anpassen zahlreicher Annahmen geprägt ist. In sogenannten Pythagorasaufgaben treten selten Minikreisläufe auf (Borromeo Ferri, 2011). Die Untersuchungen von Treilibs et al. (1980) weisen auf die Bedeutung metakognitiver Kompetenzen im Modellierungsprozess hin. Lernende, die in der Lage sind, den eigenen Lösungsprozess zu planen und geeignete mathematische Werkzeuge bewusst auszuwählen, waren in der Studie erfolgreicher und die besseren Modellierer (Treilibs et al., 1980). Diese Aspekte sollten von Lehrkräften vor und während der Unterstützung von Modellierungsprozessen bedacht werden. Zum einen bieten diese Forschungsergebnisse die Möglichkeit, geeignete und passende Unterstützungsmaßnahmen im Vorfeld zu antizipieren. Auf der anderen Seite ermöglicht das Wissen über typische Schwierigkeiten im Modellierungsprozess eine genaue Diagnostik und gezielte Intervention. Zahlreiche Studien untersuchten Schwierigkeiten beim Modellieren (Galbraith & Stillman, 2006; Klock & Siller, 2020a; K. Maaß, 2004; Schaap et al., 2011; Stillman et al., 2010, 2013), sodass auf Basis der Ergebnisse ein Kategoriensystem erstellt wurde. Dieses ermöglicht einen Überblick über typische Schwierigkeiten, die bei verschiedenen Modellierungsaufgaben und Lernenden auftreten können. Im Hinblick auf ein adäquates Unterstützungsverhalten von Lehrkräften ist ein fundiertes Wissen über das mathematische Modellieren und den Modellierungsprozess von Bedeutung, da nur so geeignet diagnostiziert werden kann. Die Diagnostik stellt wiederum die Voraussetzung für die Auswahl einer geeigneten Intervention dar (vgl. Kapitel 5). Die besonderen Anforderungen des Modellierens bestimmen auch die Art der Intervention. Die folgenden Kapitel beschäftigen sich mit der Frage, wie geeignete Interventionen im Modellierungsprozess aussehen können.
3
Interventionen in kooperativen Modellierungsprozessen
In diesem Kapitel werden die theoretischen Grundlagen für die Konzeptualisierung des Konstrukts der adaptiven Interventionskompetenz in mathematischen Modellierungsprozessen dargestellt. Interventionen von Lehrkräften zur adäquaten Betreuung von Lernenden bei der kooperativen Bearbeitung von mathematischen Modellierungsaufgaben stellen das zweite Kernthema dieser Arbeit dar. In den folgenden Ausführungen werden diese kooperativen Bearbeitungsprozesse zur besseren Lesbarkeit verkürzt als kooperative Modellierungsprozesse bezeichnet. Bevor verschiedene Interventionskonzepte behandelt werden, wird das soziokonstruktivistische Lehr-Lern-Verständnis als theoretische Grundlage für Interventionen in kooperativen Modellierungsprozessen vorgestellt (vgl. Abschnitt 3.1). Es wird eine Verbindung zu selbstständigen und kooperativen Lernformen gezogen, um Anforderungen für die Lehrkraft abzuleiten, die aus selbstständigen und kooperativen Bearbeitungsprozessen resultieren. Gleichzeitig wird das kooperative Lernen als geeignete Sozialform für die Bearbeitung von mathematischen Modellierungsaufgaben herausgestellt. Dazu werden nach Holton & Thomas (2001) vier Typen von Interaktionen im Unterricht unterschieden: • • • •
Interaktion der Lehrperson mit der gesamten Klasse, Interaktion der Lehrperson mit einer Gruppe von Lernenden, Interaktion der Lehrperson mit einzelnen Lernenden, Interaktion von Lernenden untereinander.
In kooperativen Bearbeitungsprozessen kommt es vor allem zu Interaktionen zwischen Lernenden, die für eine Diagnostik der Lernsituation von Bedeutung sind. Im Rahmen der vorliegenden Arbeit steht die Interaktion zwischen der Lehrkraft und © Der/die Herausgeber bzw. der/die Autor(en), exklusiv lizenziert durch Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2020 H. Klock, Adaptive Interventionskompetenz in mathematischen Modellierungsprozessen, Studien zur theoretischen und empirischen Forschung in der Mathematikdidaktik, https://doi.org/10.1007/978-3-658-31432-3_3
49
50
3
Interventionen in kooperativen Modellierungsprozessen
Gruppen von Lernenden, teilweise auch die Interaktion mit einzelnen Lernenden, im Vordergrund. Interaktionen der Lehrperson mit der gesamten Klasse werden nicht betrachtet. Nach einer Differenzierung der Begriffe Instruktion und Intervention (vgl. Abschnitt 3.2) werden vier verschiedene Interventionskonzepte idealtypisch vorgestellt (vgl. Abschnitt 3.3). Es liegt eine Vielzahl von Konzepten zur Unterstützung von Lernenden vor. Es wird kein Anspruch auf Vollständigkeit erhoben, da eine umfassende Darstellung aller bestehenden Konzepte im Rahmen dieser Arbeit kaum möglich ist. Inwiefern die Lehrkraft in den selbstständigen Lösungsprozess der Lernenden eingreifen soll bzw. wie sie diesen adäquat begleiten kann, ist immer noch Bestandteil aktueller Forschung (Krammer, 2009; Leiss, 2010; Link, 2011; Stender, 2016). Es werden Konzepte potentiell geeigneter Interventionen dargestellt, die zum Teil empirisch evaluiert wurden (Krammer, 2009; Stender, 2016; Tropper et al., 2015). Ziel des Kapitels ist die Identifikation gemeinsamer Charakteristika guter Unterstützungsmaßnahmen.
3.1
Konstruktivismus, kooperatives und selbstgesteuertes Lernen
Die konstruktivistische Lehr-Lern-Theorie hängt aufgrund ihrer Merkmale eng mit kooperativen und selbstgesteuerten Lernformen zusammen. Im Folgenden werden die Zusammenhänge aufgezeigt und der Konstruktivismus als die Grundlage eines adaptiven Interventionsverhaltens herausgestellt.
3.1.1
Konstruktivistisches Lehr-Lern-Verständnis
Seit der Entwicklung der Reformpädagogik werden konstruktivistische Lehr- und Lerntheorien immer stärker vertreten. International leistete Pólya mit seinen Arbeiten zum Problemlösen (Pólya, 1945, 1954) einen Beitrag zur Etablierung des Konstruktivismus in der Mathematikdidaktik (Thompson, 2014). Mittlerweile sind diese, auf das Denken der Lernenden ausgerichtete, Theorien wissenschaftlich akzeptiert. Dieser Trend löste die behavioristische Auffassung ab, nach der Lernen als die bloße Transmission von Wissen und das Verstärken positiven Verhaltens verstanden wird. Lernen wird im Behaviorismus als eine Reiz-Reaktion-Verbindung aufgefasst, wobei ein Reiz beim Lernenden zu einem gelernten Antwortverhalten führt (Edelmann, 2000, S. 7 ff.). Der Lernende nimmt in dieser Sichtweise eine
3.1 Konstruktivismus, kooperatives und selbstgesteuertes Lernen
51
passive Rolle ein, die Lehrperson die Rolle des Wissensvermittlers. Die bloße Transmission von Wissen – das Füllen eines leeren Gefäßes – führt zu trägem Wissen, das nicht flexibel einsetzbar ist und nur bedingt transferiert werden kann (Weinert, 1996b, S. 8). Aus heutiger Sicht stellt Lernen einen aktiven und konstruktiven Prozess dar. Es wird davon ausgegangen, dass der Erwerb von Wissen oder Fähigkeiten durch den subjektiv individuellen Aufbau kognitiver Strukturen vollzogen wird, an dem der Lernende aktiv beteiligt ist (Edelmann, 2000, S. 8). Dem konstruktivistischen Gedanken folgend ordnet De Corte (1995) dem Lernen folgende Eigenschaften zu: Lernen ist konstruktiv, kumulativ, selbstgesteuert, zielorientiert, situativ, kollaborativ und individuell verschieden. Lernen ist demnach effektiv, wenn es situiert ist, also den Schülerinnen und Schülern die Gelegenheit gegeben wird, das Wissen mit subjektiv bedeutungsvollen Kontexten in Verbindung und in diesen zur Anwendung zu bringen. Der Schülerselbstständigkeit kommt im Rahmen des Konstruktivismus eine große Bedeutung zu, da der Lernende im Gegensatz zur behavioristischen Sichtweise wesentlich für seinen eigenen Lernprozess verantwortlich ist und diesen selbst steuert (Weinert, 1996b, S. 8). Lernen findet zudem in einem sozialen Kontext statt. Vygotsky (1978) betont den sozialen Aspekt in seinem Konzept der Zone der nächsten Entwicklung: It [The Zone of Proximal Development] is the distance between the actual developmental level as determined by independent problem solving and the level of potential development as determined through problem solving under adult guidance or in collaboration with more capable peers. (Vygotsky, 1978, S. 86)
Er definiert die Zone der nächsten Entwicklung als die Distanz zwischen dem aktuellen Entwicklungsstand des Lernenden und dem potentiellen Entwicklungsstand, den der Lernende durch die Begleitung von oder in Zusammenarbeit mit einer fähigeren Person erreichen kann. Das auf die Leistung bezogene untere Ende der Zone wird durch das Vorwissen der Lernenden begrenzt, das obere Ende durch ein Problem, das die Lernenden selbst mit Hilfe nicht lösen können. Ein angemessenes Anforderungsniveau ist in Vygotskys Theorie entscheidend, um das Denken und Lernen zu fördern (Krammer, 2009, S. 68). Die soziale Interaktion und der Dialog stellen in seinem Verständnis ein „Werkzeug zum Aufbau des Wissen[s]“ (Krammer, 2009, S. 67) dar. Durch den Dialog schaffen es Lernende die Zone der nächsten Entwicklung zu überwinden und zu einem Entwicklungsstand zu gelangen, den sie allein nicht erreichen könnten. Daher verdeutlicht die Zone der nächsten Entwicklung die Notwendigkeit eines sozialen Austauschs beim Lernen (Krammer, 2009, S. 68).
52
3
Interventionen in kooperativen Modellierungsprozessen
Lernen findet zunächst auf einer sozialen und anschließend auf einer individuellen Ebene statt. Es sind die individuellen Schülerinnen und Schüler, die sich das Wissen und die Fertigkeiten aneignen müssen, diese werden jedoch häufig in Zusammenarbeit mit anderen Lernenden erworben (Weinert, 1996b). Die soziale Komponente des Lernens schließt auch die Interaktion mit der Lehrperson als „more capable peer“ (Vygotsky, 1978, S. 86) mit ein. Der Konstruktivismus stellt keine einheitliche Theorie dar, sondern es existiert eine Vielzahl unterschiedlicher Ausdeutungen. Die Spannweite reicht vom radikalen Konstruktivismus, bei dem jegliches Wissen nur auf Basis individueller Erfahrung erzeugt werden kann (Von Glaserfeld, 2015), bis hin zum pragmatischen Konstruktivismus, der für die Schulpraxis versucht, die Konzepte der Konstruktion und Instruktion in Einklang zu bringen (K. Müller, 2001). „Empirische Übergeneralisierungen und mancher theoretische Purismus“ (Weinert, 1996b, S. 9) müssen durchaus kritisch betrachtet werden. Ein Beispiel stellt die „Vergötterung des kreativen Entdeckungsaktes“ (Ausubel, Novak, & Hanesian, 1981, S. 30) dar. Ausubel et al. (1981) stellen zwölf Thesen zum entdeckenden Lernen dar, deren Gültigkeit sie stark eingrenzen oder sogar widerlegen. Im Folgenden werden exemplarisch sechs der Thesen aufgeführt: • • • •
Jede wirkliche Kenntnis ist selbst entdeckt. Die Entdeckungsmethode ist die Hauptmethode der Vermittlung von Fachwissen. Die Fähigkeit zum Problemlösen ist das wichtigste Lehrziel. Das Training in der „Heuristik des Entdeckens“ ist wichtiger als das Training im Fachwissen. • Die Entdeckung organisiert das Lernen effektiv für späteres Lernen. • Das entdeckende Lernen erzeugt in einzigartiger Weise Motivation und Selbstvertrauen. • Das entdeckende Lernen ist die erste Quelle intrinsischer Motivation. Die Fehlvorstellung, „jeder Mensch sei selbst am besten in der Lage, den Prozeß des Lernens über die eigene Person und ihre Welt zu bestimmen und jede Einmischung in die Autonomie sei daher für die Lernergebnisse per definitionem schädlich“ (Ausubel et al., 1981, S. 30), thematisiert eine entscheidende Grenze der konstruktivistischen Lehrstrategien. Aufgrund der Einschränkung der Selbstbestimmung der Schülerinnen und Schüler ein Interventionsverbot auszusprechen, steht im Widerspruch zu Vygotsky (1978). Die Bearbeitung von anspruchsvollen Aufgaben ohne fachkundige Hilfe kann zur Ausbildung von Fehlvorstellungen führen (Weinert, 1996a). Daher erscheint auch aus einer theoretischen Perspektive zumindest eine zeitweise Unterstützung durch die Lehrkraft notwendig.
3.1 Konstruktivismus, kooperatives und selbstgesteuertes Lernen
53
Ein gemäßigtes, sozio-konstruktivistisches Lehr-Lern-Verständnis bildet in dieser wie auch in anderen Arbeiten zu Interventionen in selbstständigkeitsorientierten Lernumgebungen (Krammer, 2009; Leiss, 2007) die Grundlage für eine adäquate Unterstützung der Lernenden. Die Lehrperson stellt den „adult“ bzw. den „more capable peer“ (Vygotsky, 1978, S. 86) dar, der die Schülerinnen und Schüler in ihrer Entwicklung begleitet. Die Lehrperson nimmt also die Rolle eines Lernbegleiters ein, der eine Lernumgebung bereitstellt, in der Schülerinnen und Schüler die Gelegenheit bekommen, „die für das Unterrichtsthema notwendigen kognitiven Aufbauleistungen aktiv, d. h. als eigene Konstruktionsleistung zu vollziehen“ (Messner, 2004, S. 32). Wie eine effektive Begleitung aussieht und inwieweit die Selbstständigkeit der Lernenden gewahrt werden muss, ist Gegenstand aktueller Forschung. Bei einem sozio-konstruktivistischen Lehr-Lern-Verständnis besteht Lernen aus individuellen, möglichst selbstgesteuerten und situativ angebundenen, kollaborativen Lernprozessen, die durch eine Lehrperson begleitet werden. Eine situationsspezifische Anbindung des Kompetenzzuwachses ist im Kontext dieser Arbeit durch realitätsnahe und authentische Modellierungsaufgaben gegeben. Die Bearbeitung dieser Aufgaben ist – vor allem durch ihre Authentizität – komplex, was eine rein selbstständige Bearbeitung in Kleingruppen fast unmöglich macht (Stender, 2016, S. 75). Die Herausforderung für die Lehrkraft besteht bei der Begleitung der Lernenden darin, einen geeigneten Mittelweg zwischen der Erhaltung der Selbstständigkeit der Schülerinnen und Schüler und der benötigten Anleitung herzustellen, sodass die Lernenden zu einem – auch für sie selbst – befriedigenden Ergebnis kommen (Leiss, 2010; Stender, 2016, S. 75).
3.1.2
Selbstgesteuertes und selbstreguliertes Lernen
Selbstständigkeit und selbstgesteuertes Lernen spielen im Hinblick auf ein konstruktivistischen Lehr-Lern-Verständnis eine Rolle. Der Lernende soll „einen vernünftigen Anteil an der Arbeit“ haben und ein „möglichst großes Maß an Selbstständigkeit“ erwerben (Pólya, 1967, S. 14). In der Literatur findet man eine Vielzahl von Definitionen des Begriffs des selbstgesteuerten Lernens, die teilweise keinen gemeinsamen Kern mehr erkennen lassen. Weinert (1982) gibt nach einer Literaturrecherche vier Kriterien zur Charakterisierung an: • Der Lernende legt selbständig Lernziel, Lernzeit und Lernmethode fest. • Der Lernende nimmt diese Spielräume wahr, trifft Entscheidungen und realisiert diese im eigenen Lernprozess.
54
3
Interventionen in kooperativen Modellierungsprozessen
• Der Lernende übernimmt die Rolle des Lehrenden im Rahmen einer Selbstinstruktion. Dazu führt er die Aktivitäten Planen, Beschaffung von Informationen, Auswahl geeigneter Methoden und Prüfen des Lernfortschritts durch. • Der Lernende empfindet die Lernaktivität subjektiv als selbst verursacht, was mit einer Selbstverantwortlichkeit einher geht. Sind diese Kriterien erfüllt, kann von einem selbstgesteuerten Lernprozess gesprochen werden. Der Begriff des selbstregulierten Lernens wird in der Literatur synonym verwendet und beide umfassen das dynamische Zusammenwirken kognitiver, motivationaler und metakognitiver Aspekte (Hasselhorn & Labuhn, 2008). In einem Drei-Schichten-Modell beschreibt Boekaerts (1999) zu regulierende Schichten, in denen sich diese Aspekte wiederfinden: die Regulation des Selbst (Auswahl von Zielen und Ressourcen), die Regulation des Lernprozesses (Steuerung des Lernens mithilfe von metakognitivem Wissen) und die Regulation des Bearbeitungsmodus (Auswahl kognitiver Strategien). Vergleicht man die Anforderungen selbstregulierenden Lernens mit den überfachlichen Komponenten der Modellierungskompetenz, lassen sich diese dort wiederfinden. Motivationale und metakognitive Fähigkeiten werden auch zur erfolgreichen Durchführung eines Modellierungsprozesses benötigt. Ein möglichst selbständiger Bearbeitungsprozess im Sinne des selbstregulierenden Lernens scheint daher geeignet, um Modellierungskompetenz im weiteren Sinne (vgl. Abschnitt 2.3.2) zu fördern. Eine Studie von Perels, Gürtler & Schmitz (2005) erbrachte den Nachweis, dass es selbst in kurzer Zeit möglich ist, selbstregulative Fähigkeiten zu verbessern. Am effektivsten war die Maßnahme bei der gleichzeitigen Förderung von Problemlösestrategien, wie sie auch in Modellierungsprozessen benötigt werden (Greefrath, 2010c). Das selbstregulierende Lernen ist demnach ein geeignetes Mittel zur Förderung von Modellierungskompetenzen im weiteren Sinne. Warum es grundsätzlich sinnvoll ist, Kompetenzen selbstregulierenden Lernens zu fördern, beschreibt Klippert (2004): Grundsätzlich lässt sich sagen, dass ein Schüler, der gelernt hat, selbstständig zu arbeiten, zu entscheiden, zu planen, zu organisieren, Probleme zu lösen, Informationen auszuwerten, Prioritäten zu setzen, kritisch-konstruktiv zu argumentieren etc., ganz gewiss an persönlicher Autonomie und Handlungskompetenz dazugewonnen hat …. Oder anders ausgedrückt: In dem Maße, wie sich sein Methodenrepertoire erweitert und festigt, wächst auch seine Selbststeuerungs- und Selbstbestimmungsfähigkeit und damit seine Mündigkeit. (Klippert, 2004, S. 27)
3.1 Konstruktivismus, kooperatives und selbstgesteuertes Lernen
55
Klippert (2004) verdeutlicht an dieser Stelle auch die Bedeutung selbstregulativer Fähigkeiten für das lebenslange Lernen. Sind Handlungskompetenzen einmal erworben worden, ermöglichen sie die Übernahme von Verantwortung für das zukünftige Lernen. Weinert (1982) weist darauf hin, dass die Befähigung zur Selbststeuerung in der Regel nicht vorausgesetzt werden kann, in Zusammenhang mit der kognitiven Entwicklung steht und einer gesonderten pädagogischen Förderung bedarf. Planen, Steuern, Kontrollieren und Bewerten stellen anspruchsvolle Tätigkeiten im Lernprozess dar (Weinert, 1982), die von Lernenden als unangenehm empfunden werden. In einer Studie von Jahnke-Klein wünschten sich Schülerinnen und Schüler, dass die Lehrkraft den Unterrichtsstoff so lange erklärt, bis auch der Letzte ihn verstanden hat. Lernende empfanden es als positiv, wenn ihnen häufig die Möglichkeit gegeben wurde, Fragen zu stellen (Jahnke-Klein, 2001, S. 108). Dieser Unterrichtsstil würde eher einem behavioristischen als einem konstruktivistischen Lehr-Lern-Verständnis entsprechen. Es ist also notwendig, nicht nur die Fähigkeit, sondern auch die Bereitschaft der Lernenden zu fördern, einen Arbeitsprozess eigenständig zu gestalten (Klippert, 2004, S. 29). Der Lehrperson kommt daher im selbstgesteuerten Lernprozess die Aufgabe zu, eine Überforderung der Lernenden aufgrund fehlender Fähigkeiten zur Steuerung des eigenen Lernprozesses zu vermeiden und beim Aufbau selbstregulativer Fähigkeiten mitzuwirken, ohne die oben aufgeführten konstituierenden Merkmale eines selbstständigen Arbeitsprozesses zu verletzen. Einer Überforderung einzelner Lernender kann durch kooperatives Lernen entgegengewirkt werden.
3.1.3
Kooperatives Lernen
Der soziale Aspekt einer konstruktivistischen Auffassung von Lernen (Vygotsky, 1978) lässt sich anhand von Bearbeitungsprozessen mit kooperativen Sozialformen erfüllen. Konrad und Traub (2010) geben für den Begriff des kooperativen Lernens folgende Definition an. Kooperatives Lernen ist … eine Interaktionsform, bei der die Beteiligten gemeinsam und in wechselseitigem Austausch Kenntnisse und Fertigkeiten erwerben. Im Idealfall sind alle Gruppenmitglieder gleichberechtigt am Lerngeschehen beteiligt und tragen gemeinsam Verantwortung. (Konrad & Traub, 2010, S. 5)
56
3
Interventionen in kooperativen Modellierungsprozessen
Kooperatives Lernen steht für eine Vielzahl von Lernarrangements, wie beispielsweise verschiedene Arten der Gruppenarbeit (ständige Gruppenarbeit, kurzzeitig eingeführte themengleiche Gruppenarbeit, …) aber auch Partnerarbeit. Alle Formen kooperativen Lernens sind dadurch gekennzeichnet, dass … (Traub, 2004, S. 32 f.) • • • •
mindestens zwei Individuen mit dem Ziel, etwas zu lernen, zusammenarbeiten, die Gruppengröße eine Interaktion zwischen allen Mitgliedern zulässt, keine direkte Supervision durch die Lehrkraft stattfindet, die Individuen gleichberechtigte Interaktionspartner sind.
Des Weiteren wird es als wichtig erachtet, dass die Lernenden durch eine oder mehrere der folgenden Maßnahmen durch die Lehrkraft unterstützt werden (Traub, 2004, S. 33): • Unterstützung der aufgabenspezifischen Interaktionen. Die Lehrkraft vermittelt effektive Lern- und Lehrstrategien (beispielsweise wechselseitiges Fragestellen). • Unterstützung der Gruppenprozesse. Die Lehrkraft vermittelt Gruppenregeln, Gruppenrollen oder Möglichkeiten zur Evaluation der Gruppenprozesse. • Feedback. Der Lernfortschritt wird jeweils zurückgemeldet. • Aufgabenspezialisierung. Die Gruppenmitglieder oder Gruppen sind Experten in Ihrem Arbeitsgebiet und müssen diese Informationen vermitteln. Derartige Unterstützungen müssen entweder vor oder während des kooperativen Arbeitsprozesses bereitgestellt werden. Hilfestellungen während des Arbeitsprozesses sollten sich neben den oben dargestellten Empfehlungen von Traub (2004) an Qualitätsmerkmalen kooperativer Arbeitsprozesse orientieren, die im Rahmen empirischer Wirksamkeitsuntersuchungen identifiziert wurden. Dem kooperativen Lernen kann durch die alleinige Durchführung keine durchweg positive Wirkung auf den Lernzuwachs zugeschrieben werden. Vielmehr ist der Lernzuwachs abhängig von den Bedingungen, unter denen kooperatives Lernen stattfindet. Diese Tatsache bekräftigen uneinheitliche Meta-Analysen, die von kleinen bis großen Effekten kooperativen Lernens auf den Lernerfolg berichten (Davidson, 1985; Lou et al., 1996; Springer, Stanne, & Donovan, 1999). Johnson, Johnson & Stanne (2000) kommen nach der Analyse von 165 Einzelstudien und nach der Betrachtung verschiedener Methoden kooperativen Lernens zu folgendem Ergebnis:
3.1 Konstruktivismus, kooperatives und selbstgesteuertes Lernen
57
Hundreds of research studies demonstrate that cooperative efforts result in higher individual achievement than do competitive or individualistic efforts … That all of these methods are effective in increasing achievement is a tribute to the power of cooperation. (Johnson et al., 2000, S. 14, 16)
Johnson et al. (2000) bekräftigen, dass kooperatives Lernen zu höheren individuellen Lernerfolgen führt als individuelles Lernen. Kooperative Lernmethoden, die von Lehrpersonen auf die Bedingungen des Lerninhalts und auf die Lernenden angepasst werden, sog. konzeptionelle Methoden, weisen im Vergleich zur Anwendung von direkten Methoden, die ohne spezielle Planung eingesetzt werden, größere Effekte auf (Johnson et al., 2000; Ufer, Heinze, & Lipowsky, 2015). Hinsichtlich motivationaler und affektiver Aspekte weisen Studien konsistent positive Ergebnisse für das kooperative Lernen nach (Lou et al., 1996; Springer et al., 1999). Neben Blackbox-Studien, die kooperative Lernprozesse mit verschiedenen anderen Sozialformen vergleichen, ist die Untersuchung von Gelingensbedingungen entscheidend. Der Lernzuwachs wird beispielsweise durch Charakteristika der Lernenden, die Gestaltung des Lernsettings und das zu erreichenden Ziel beeinflusst (Brühning, 2015; Cohen, 1988). Studien zur Partnerarbeit weisen beispielsweise einen höheren Lernzuwachs in Gruppen mit einem hohen Grad an Kommunikation nach (Cooper, Ayers-Lopez, & Marquis, 1982; Forman & Cazden, 1985). Bedingungen kooperativen Lernens, die zu effektiven Lernprozessen führen, sind (Johnson & Johnson, 1999): • Positive Interdependenz: Die Lernenden sind sich darüber bewusst, dass die Aufgabe nur gemeinsam lösbar ist. • Individuelle Verantwortung: Jeder Lernende übernimmt Verantwortung für den Bearbeitungsprozess. • Kommunikation: Die Lernenden tauschen sich gegenseitig über Lösungsansätze und Meinungen aus, unterstützen sich und geben sich gegenseitig Rückmeldung. • Soziale Fähigkeiten: Die Lernenden verfügen über soziale Fähigkeiten, die die Kooperation ermöglichen. • Metakognitive und reflexive Tätigkeiten: Die Lernenden steuern aktiv ihren Arbeitsprozess und reflektieren ihr Vorgehen. Kooperative Sozialformen bieten den Schülerinnen und Schülern die Möglichkeit, Fragen zu stellen, Annahmen zu hinterfragen, verschiedene Meinungen zu diskutieren und sich über die eigene Arbeit mit Mitschülern auszutauschen. Unter Einhaltung der oben beschriebenen sozialen Anforderungen kann der Lösungsprozess diskutiert und aktiv gesteuert werden. Kooperative Lernprozesse stellen für die
58
3
Interventionen in kooperativen Modellierungsprozessen
Bearbeitung von komplexen Modellierungsaufgaben eine geeignete Sozialform dar. In einer Interventionsstudie wiesen Clohessy und Johnson (2017) bei der Arbeit in Kleingruppen einen positiven Effekt auf die individuellen Problemlösefähigkeiten nach. Aufgrund einer fehlenden Kontrollgruppe kann dieser Effekt aber nicht ausschließlich auf die kooperative Lernform zurückgeführt werden. Die Schülerinnen und Schüler empfanden die Arbeit in Kleingruppen jedoch als nützlich für das Lösen der Problemlöseaufgabe (Clohessy & Johnson, 2017). Ikeda und Stephens (2001) untersuchten den Einfluss einer Diskussionsphase vor und nach der Bearbeitung einer Modellierungsaufgabe auf das Verständnis von Schlüsselideen zur Lösung der Aufgabe. Dabei stellten sie fest, dass Lernende, die mit ihren Mitschülern diskutierten, ein höheres Verständnis dieser Schlüsselideen erzielten als Lernende, die nicht die Möglichkeit zur Diskussion hatten. Die Studie liefert einen weiteren Hinweis für die Eignung der Kleingruppenarbeit bei der Lösung von Modellierungsaufgaben. In der vorliegenden Studie arbeiteten die Schülerinnen und Schüler daher stets in Kleingruppen von drei bis fünf Lernenden zusammen. Hinsichtlich der Begleitung der Lösungsprozesse ergeben sich bereits aus der Inszenierung der Lernumgebung eine Reihe von Anforderungen an die Lehrperson. Die Lehrkraft muss über geeignete Kompetenzen verfügen, um diese zu meistern. Durch Instruktionen und Interventionen bewältigt die Lehrkraft die Anforderungen. Für die beiden Begriffe wird in dieser Arbeit eine Begriffsklärung und Abgrenzung vorgenommen, die eine einheitliche Verwendung, insbesondere bei der Beschreibung der Studien in Kapitel 4, ermöglicht.
3.2
Instruktion und Intervention
Bei der Diskussion unterrichtlicher Instruktionsmethoden unterscheidet Weinert (1996b) zwischen der direkten und der adaptiven Instruktion. Den Begriff der Instruktion definiert er allgemein … als Inbegriff jener Handlungen und Maßnahmen [umschreiben], die darauf gerichtet sind, die Bedingungen, Prozesse und Ergebnisse des Lernens, kollektiv, differentiell oder individuell zu optimieren. (Weinert, 1996b, S. 37 f.)
Ein Instruktionsprinzip oder eine Instruktionsstrategie legen fest, welche Handlungen und Maßnahmen durchzuführen sind, um den Lernprozess hinsichtlich des Ziels der Instruktion bestmöglich zu modifizieren. Da diese Strategien von Lerninhalten, den Lernenden und dem Lernverlauf abhängen, können sie laut Weinert (1996b) nur auf einer sehr abstrakten Ebene beschrieben werden.
3.2 Instruktion und Intervention
59
Bei der direkten Instruktion handelt es sich um eine Instruktionsstrategie, bei der die Lehrperson das Lernen überwiegend external steuert. Die Lehrkraft bietet dabei ihre Expertise an, um einen möglichst optimalen Lernfortschritt der Lernenden zu gewährleisten. Der Instrukteur legt geeignete Lehrziele fest, zerlegt den Unterrichtsinhalt in sinnvolle Lerneinheiten und erarbeitet diese in einem fragend-entwickelndem Unterrichtsgespräch. Dabei diagnostiziert er durchaus den individuellen Lernfortschritt und hilft bei der Bewältigung von Schwierigkeiten. Der zentrale Aspekt ist jedoch die effektive Nutzung der Lernzeit. Weinert (1996b) betont, dass es sich hierbei nicht um den häufig diffamierten Frontalunterricht handelt, bei dem der Lernende als passivier Rezipient am Unterricht teilnimmt. Vielmehr bildet der Begriff Frontalunterricht einen Oberbegriff für eine Vielzahl von Instruktionsstrategien (Brühning, 2015), von denen nur wenige empirisch untersucht wurden. Die direkte Instruktion erzielte in der Hattie-Studie eine durchaus bedeutsame Effektstärke (d = .59; Hattie, 2009, S. 201). Um die heterogene Ausgangslage der Lernenden zu berücksichtigen, wurde das Konzept der adaptiven Instruktion entwickelt (Corno & Snow, 1986). Dabei wird zwischen Makro- und Mikroadaptionen unterschieden, wobei die Autoren von einem Kontinuum zwischen diesen beiden Ausprägungen sprechen. Die Makroadaption besteht aus „month-to-month decisions“ (Corno & Snow, 1986, S. 607) und ermöglicht durch Schulprogramme oder die Gestaltung von länger voraus geplanten Unterrichtsreihen eine Anpassung an die Bedürfnisse der Lernenden. Beispiele für adaptive Schulprogramme sind die Projekte Individually Guided Education (IGE; Popkewitz, Tabachick, & Wehlage, 1982) und Adaptive Learning Environments Model (ALEM; Wang, 1980; Wang & Walberg, 1983), die jeweils positiv evaluiert wurden. Im Rahmen von Makroadaptionen findet das Aptitude/Attribute-TreatmentInteraction (ATI)-Modell seine Anwendung, bei dem davon ausgegangen wird, dass unterschiedliche Typen von Lernenden durch unterschiedliche Lehrmethoden optimal gefördert werden können (Cronbach & Snow, 1977). Nach einem Eignungstest wird jeder Lernende der für ihn am erfolgversprechendsten Maßnahme zugeordnet. Dadurch soll eine Anpassung der didaktischen Instruktion an kognitive, motivationale und affektive Merkmale des individuellen Lernenden stattfinden (Corno & Snow, 1986). Nach dieser Annahme liegt im Unterricht ein Interaktionseffekt zwischen Schülermerkmalen, Unterrichtsmerkmalen und der Lernleistung vor. Empirische Evaluationen solcher Programme erscheinen vielversprechend (Weinert, 1996b). Mikroadaptionen stellen „moment-to-moment“ (Corno & Snow, 1986, S. 609) Entscheidungen dar, die eher kurzfristig durch die Lehrkraft im Unterricht erfolgen, so auch Hilfestellungen in Gruppenarbeitsprozessen.
60
3
Interventionen in kooperativen Modellierungsprozessen
The research shows that microadaptations in teaching tend to occur spontaneously, with little forethought. Moreover teachers have difficulty articulating “principles” that might guide their adaptive decisions […]. (Corno & Snow, 1986, S. 614)
Diese Anpassungen erfolgen häufig spontan und unsystematisch. Lehrpersonen diagnostizieren für ihre Adaptionen bei Schülerinnen und Schülern regelmäßig die Konstrukte „Fähigkeit“ und „Motivation“. Dabei tritt jedoch eine große Variation des Verständnisses dieser Begriffe unter den Lehrkräften auf (Corno & Snow, 1986). Corno und Snow betonen, dass Mikroadaptionen von Lehrkräften auch kontraproduktiv sein können, wenn diese nicht anhand verlässlicher Kriterien ausgewählt und durchgeführt werden. Ein Kriteriensystem darf jedoch nicht zu einer Überlastung der Lehrkraft führen und muss ökonomisch anwendbar sein (Corno & Snow, 1986). In Abgrenzung zum Begriff der Instruktion werden Hilfestellungen in kooperativen Lernprozessen, die auf der unterrichtlichen Mikroebene stattfinden, in dieser Arbeit allgemein als Interventionen bezeichnet. Interventionskonzepte stellen demnach einen Leitfaden für konkrete Hilfestellungen in kooperativen Lernprozessen bzw. bei der Betreuung mathematischer Modellierungsprozesse dar. Den Begriff der Lehrerintervention charakterisiert Leiss (2007) bei der Untersuchung von mathematischen Modellierungsprozessen: „Als Lehrerinterventionen allgemein werden alle verbalen, paraverbalen und nonverbalen Eingriffe des Lehrers in den Lösungsprozess der Schüler bezeichnet.“ (Leiss, 2007, S. 65; Hervorhebung im Original)
Der Begriff der Intervention stellt in Bezug auf die obige Definition in der vorliegenden Arbeit den konkreten Eingriff in den Lösungsprozess der Lernenden dar, wohingegen Instruktionen allgemeine verhaltenswissenschaftliche Modelle bezeichnen, die die Art und Reihenfolge bestimmter unterrichtlicher Abläufe beschreiben (vgl. direkte und adaptive Instruktion; Weinert, 1996b). Interventionen haben als Instruktionen auf der Mikroebene ebenso zwei Aufgaben: Auf der einen Seite müssen sie die Schülerinnen und Schüler zu eigenständigem und konstruktivem Arbeiten anregen. Auf der anderen Seite muss die Intervention für die Aktivierung des Vorwissens und das Bereitstellen fehlender Informationen oder Strategien sorgen. In Ergänzung dazu müssen affektive Merkmale der Lernenden beeinflusst werden (Weinert, 1996b). Die Beeinflussung verschiedener Schülermerkmale im Unterricht ist auf viele Arten und Weisen möglich. Im Folgenden werden vier Interventionskonzepte idealtypisch vorgestellt, die unter anderem beschreiben, wann und wie eingegriffen werden kann.
3.3 Interventionskonzepte
3.3
61
Interventionskonzepte
Interventionen von Lehrkräften werden begrifflich sehr unterschiedlich gefasst und charakterisiert. Krammer (2009, S. 95) gibt einen Überblick über verschiedene Bezeichnungen im deutschsprachigen Raum: • • • • • • •
Hilfe für die Lernenden (Keller, 1993), Unterstützung der Lernenden (Pauli, 1998), Lernbetreuung (Bräu, 2006), Lernbegleitung (Hess, 2003), Prozessorientierte Lernbegleitung (Kobarg, 2009), Adaptive Lehrerintervention (Leiss, 2007), Individuelle Lernunterstützung (Krammer, 2009).
Genauso wie die Vielzahl von Bezeichnungen existieren in der Literatur viele Interventionskonzepte, die Vorschläge für ein geeignetes Unterstützungsverhalten beschreiben und die zum Teil auch empirisch evaluiert wurden. Fürst (1999) stellt fest, dass Interventionen im Gruppenunterricht oder dem generellen Lehrerverhalten in Phasen kooperativer Aufgabenbearbeitung in der Forschungsliteratur nur wenig Aufmerksamkeit zukommt. Es existieren Empfehlungen, die in vielen Fällen nur auf subjektiven Erfahrungen und weniger auf strengen empirischen Studien beruhen (Fürst, 1999). Demgegenüber steht die Tatsache, dass eine geeignete Unterstützung von Lernprozessen eine zentrale Komponente des Unterrichts darstellt. Mittlerweile gilt es in der Unterrichtsforschung als gesichert, dass die Lehrer-Schüler Interaktion einen Einfluss auf den Lernerfolg der Schülerinnen und Schüler hat (Brophy, 2000, S. 19). Um einen Überblick über die Bandbreite der Empfehlungen für ein adäquates Lehrerverhalten in Gruppenarbeitsprozessen zu geben, werden Beispiele aufgeführt, die deren Vielfältigkeit illustrieren sollen. Dabei handelt es sich um erfahrungsbasierte Aussagen oder Hypothesen, die zum Teil auf empirischen Untersuchungen beruhen. Die aufgeführten Empfehlungen stellen keineswegs eine vollständige Darstellung des Meinungsbildes dar, obwohl es sich hier bereits um eine ausgedehnte Liste handelt. • Diegritz, Rosenbusch und Dann (1999) empfehlen basierend auf Studienergebnissen (vgl. Abschnitt 4.2) die Gruppen aus der Distanz zu beobachten und möglichst wenig – am besten gar nicht – zu intervenieren. Insbesondere seien invasive (eingreifende) Interventionen zu vermeiden. Muss dennoch interveniert werden, sollte die Lehrkraft gut über das Intragruppengeschehen informiert sein.
62
3
Interventionen in kooperativen Modellierungsprozessen
• Meyer (2005, S. 269 f.) legt nahe, sich insbesondere zu Beginn des Arbeitsprozesses zurückzuziehen und nur nach Aufforderung Hilfe zu geben. Die Lehrkraft soll lediglich die Verbindlichkeit der Gruppenarbeit herstellen. Den Lernenden wird der Großteil der inhaltlichen und organisatorischen Entscheidungen überlassen. • Vollrath (2001, S. 68) rät, die Lernenden Probleme immer wieder selbstständig lösen zu lassen, wobei Lösungshinweise vermieden werden sollen. • Krammer (2009, S. 56) sieht die Aufgabe der Lehrkraft darin, die Lernenden zum Nachdenken anzuregen, Strukturierungshilfen zu geben, Reflexionsimpulse zu setzen und die Motivation aufrechtzuerhalten. • Ulm (2005, S. 13 f.) schlägt vor, geeignete Anleitungen und Hilfen bereitzuhalten. Fehler sollen im Gruppenarbeitsprozess angesprochen und Wege zur Weiterentwicklung aufgezeigt werden. • Hmelo-Silver und Barrows (2006) empfehlen, die Lernenden im Lösungsprozess zu aktivieren und sie auf dem richtigen Weg zu halten. Die Schülerinnen und Schüler sollen dazu ermuntert werden, sich selbstständig zu orientieren und Informationen zu sammeln. • Merrill, Reiser, Merrill und Landes (1995) legen nahe, eine Balance zwischen der Eigenständigkeit der Schülerinnen und Schüler und der Anleitung zu einem möglichst produktiven Arbeitsprozess zu finden. Sie bezeichnen diese Vorgehensweise als „guided learning by doing“ (Merrill et al., 1995, S. 316). • Hefendehl-Hebecker (1997, S. 9) rät, die angeleitete Selbstorganisation und die Vermittlung von Inhalten in ein ausgewogenes Verhältnis zu bringen. Dabei sollen die Eigenverantwortung und Zusammenarbeit der Lernenden gestärkt werden. Unterstützende Handlungen sind das Schaffen von Orientierungspunkten und Einsichten in zu erreichende Ziele sowie das Eröffnen von Freiraum für Eigenaktivitäten. • Van Dormolen (1978, S. 87) sieht die Lehrkraft als Begleiter, der das Gruppengeschehen nicht dominieren darf. Er fördert die sozialen Beziehungen und die Motivation innerhalb der Gruppe und gibt auf Wunsch fachkundige Hilfe, darf aber auch unaufgefordert helfen. • Götze (2007, S. 188 ff.) versteht die Lehrkraft in der Grundschule als Manager, der sich in totaler Zurückhaltung üben aber auch kleinschrittige Anleitungen zum kooperativen Arbeiten geben kann. Sie erachtet eine behutsame Anleitung der Kinder als sinnvoll, bei der der Großteil der Verantwortung an die Kinder zurückgegeben wird. Dabei soll die Lehrkraft bei gruppeninternen Diskrepanzen eingreifen, untergehende Beiträge verstärken und das Gruppengespräch mit den Lernenden evaluieren.
3.3 Interventionskonzepte
63
Die Empfehlungen reichen von so gut wie gar nicht intervenieren (Diegritz et al., 1999) über das Intervenieren bei Schwierigkeiten oder Fehlern (Ulm, 2005) bis hin zum Sicherstellen eines produktiven Arbeitsprozesses (Hmelo-Silver & Barrows, 2006; Merrill et al., 1995). Dabei stehen sich häufig Ziele zur Förderung des selbstregulierenden Lernens sowie sozialer Kompetenzen und die zeiteffiziente Vermittlung von Sachinhalten gegenüber. Manche Autoren schlagen daher eine Balance zwischen dem möglichst eigenständigen Arbeiten der Lernenden und einer Anleitung der Schülerinnen und Schüler vor (Hefendehl-Hebecker, 1997; Leiss, 2007; Merrill et al., 1995). Die Auflistung veranschaulicht die Anzahl möglicher Lehrerhandlungen während der Kleingruppenarbeit. Ein Interventionskonzept muss demnach klären, wann und inwieweit es der Lehrkraft erlaubt ist, in den Lösungsprozess der Schülerinnen und Schüler einzugreifen. Darüber hinaus muss ein Interventionskonzept konkrete Angaben zur Art und Form der Hilfestellungen machen. Eine genaue Beschreibung von Interventionen und eine Anweisung, wann diese einzusetzen sind, sind notwendig. Gute Interventionen müssen demnach multiple Ansprüche erfüllen. Krammer (2009, S. 134) fasst die theoretische und auf Basis empirischer Ergebnisse geführte Diskussion zu guten individuellen Lernunterstützungen anhand von neun Kernmerkmalen zusammen. Die Merkmale weisen teilweise inhaltliche Überschneidungen auf, verdeutlichen jedoch gut den hohen Anspruch einer perfekten Lernunterstützung. • Adaptivität. Die Intervention knüpft an die Lernvoraussetzungen und den Vorwissensstand der Lernenden an. • Interaktivität. Die Lernenden werden mit ihren Lösungsvorschlägen aktiv in den Problemlöseprozess eingebunden. • Verstehensorientierung. Ziel ist das Verstehen der Lösungsschritte. Fehler werden als Lerngelegenheiten für weitere Denkschritte genutzt. • Kognitive Aktivierung. Die Lehrperson regt die Lernenden mit Hinweisen und Fragen zu weiteren Denkschritten an und vermeidet instruktionale Erklärungen und Anweisungen. Sie fordert die geistige Aktivität der Lernenden durch einen angemessenen Anforderungsgrad und Anregungen heraus. • Reflexivität. Mit dem Ziel der Übertragung der Verantwortung für die Lösung des Problems an die Lernenden regt die Lehrperson die Lernenden zur Planung, Überwachung und Kontrolle des eigenen Lernprozesses an. • Multikriterialität. Die Unterstützung durch die Lehrperson bezieht sich sowohl auf fachbezogene kognitive und metakognitive Kompetenzen als auch auf affektive Aspekte.
64
3
Interventionen in kooperativen Modellierungsprozessen
• Orientierung am Lernprozess. Die Lehrperson hat eine hohe Aufmerksamkeit für Schwierigkeiten und das Befinden der Lernenden. Sie hat ein echtes Interesse, die Lernenden bei ihrem eigenen Problemlöseprozess zu fördern und zu fordern. • Fading. Die Unterstützung wird zunehmend verringert, um das selbständige Lernen und Problemlösen der Lernenden zu fördern. Das zunehmende Zurückziehen der Lehrkraft ist eine Maßnahme, die sich über längere Unterrichtsperioden erstreckt. • Metakommunikation. Die Lehrperson und die Schülerinnen und Schüler haben ein gemeinsames Verständnis über Ziel und Sinn der Unterstützung beim selbstständigen Lernen. Diese Kernmerkmale veranschaulichen die hohe Komplexität guter Interventionen. Es erscheint unmöglich alle Merkmale in einer Intervention zu beachten, vor allem unter Berücksichtigung des Handlungsdrucks in unterrichtlichen Situationen (Brühwiler, 2014, S. 87). Auffällig bei der Formulierung der Merkmale ist die konsequente Schülerorientierung, die eine Ableitung adäquater Interventionen schwierig macht. Im Folgenden werden verschiedene Interventionskonzepte vorgestellt, die theoretisch und/oder empirisch fundiert sind und die oben genannten Merkmale in Teilen adressieren.
3.3.1
Tutoring
Unter Tutoring werden in der Forschungsliteratur mehrheitlich Eins-zu-Eins Interaktionen verstanden, in denen ein Lernender permanent durch einen Tutor betreut wird. Tutoren stellen dabei in der Forschungsliteratur überwiegend kompetente Peers im schulischen Kontext dar, die im gleichen Alter sind oder vergleichbare Fähigkeiten besitzen. Teilweise existieren aber auch Untersuchungen mit Experten im jeweiligen Inhaltsgebiet. Die Betrachtung geschulter Tutoren kommt der Unterstützung durch eine Lehrkraft am nächsten. Im Hinblick auf den Fokus dieser Arbeit, der auf der Unterstützung von Gruppenarbeitsprozessen liegt, erscheint das Interventionskonzept des Tutoring auf den ersten Blick wenig geeignet, da in der Regel Eins-zu-Eins Settings betrachtet werden. Insbesondere weisen Studienergebnisse darauf hin, dass Erkenntnisse zu Instruktions- und damit auch zu Interventionsmethoden, die in Eins-zu-Eins Settings gewonnen wurden, nicht ohne Weiteres auf Gruppenarbeitsprozesse übertragen werden können (Wood & Wood, 1996). Dennoch ist ein Teil der Forschungsergebnisse interessant für diese Arbeit. Es werden konzeptionelle Gemeinsamkeiten mit einem
3.3 Interventionskonzepte
65
weiteren Interventionskonzept herausgestellt, dem Scaffolding, das sich aus dem Tutoring entwickelt hat und auf die Betreuung von Gruppen übertragen wurde. Merril et al. (1995) leiteten aus der Untersuchung zweier geschulter Tutoren, denen kein Interventionsverfahren vorgeschrieben wurde, Merkmale effizienter Tutorprozesse ab. Dabei bearbeiteten die Lernenden unterstützt durch einen Tutor in einem Programmierkurs Problemlöseaufgaben in einem Eins-zu-Eins Setting. Sie stellten fest, dass erfahrene Tutoren häufig bestätigende Rückmeldungen zu korrekten Arbeitsschritten geben oder dies implizit beim Anleiten der Lernenden geschieht. Treten Fehler im Lösungsprozess auf, so intervenieren die Tutoren direkt (Merrill et al., 1995; Wood & Wood, 1996). Dabei stimmen sie ihre Intervention auf das mögliche Lernpotential des Fehlers ab. Fehler, die wenig Lernpotential beinhalten, korrigieren die Tutoren ohne den Lernenden die Chance für eine eigenständige Verbesserung zu geben. Bei Fehlern mit mittlerem oder hohem Lernpotential beziehen die Tutoren die Lernenden mit ein, regen sie zur eigenständigen Analyse des Fehlers an und korrigieren den Fehler in Kooperation mit den Lernenden. Dabei betonen die Autoren die Bedeutung dieser „self-explanation“ (Chi, Bassok, Lewis, Reimann, & Glaser, 1989; Merrill et al., 1995, S. 353) für den Lernerfolg der Schülerinnen und Schüler. Merril et al. (1995) ziehen daraus den Schluss, dass das Tutoring durch die positiven Rückmeldungen und das direkte Reagieren auf Fehler eine zeiteffiziente Unterstützungsform ist, da der Lösungsprozess stets aufrechterhalten und die Frustration in Grenzen gehalten wird. Die Tutoren bewerten zudem bei der Intervention die Kosten und Nutzen einer selbstständigen Korrektur des Fehlers im Rahmen einer „individualize guidance“ (Merrill et al., 1995, S. 356) und intervenieren dementsprechend. Der Tutor muss demnach in der Lage sein, zu entscheiden, wann und auf welche Art er Feedback gibt, wann Fehler zu berichtigen sind oder wann dem Lernenden die Gelegenheit zur eigenständigen Korrektur gegeben wird (Chi, Siler, Jeong, Yamauchi, & Hausmann, 2001). Graesser et al. (1995) rekonstruierten bei der Untersuchung von Tutoringprozessen ein Muster, das aus fünf Schritten besteht: 1. 2. 3. 4.
Der Tutor wirft eine Frage- oder eine Problemstellung ein. Der Lernende versucht diese zu beantworten. Der Tutor gibt ein kurzes evaluatives Feedback zur Antwort. Der Tutor verbessert in Kollaboration mit dem Lernenden die Antwort oder Lösung. 5. Der Tutor beendet die Diskussion mit der Frage, ob der Lernende alles verstanden hat und erhält in der Regel eine positive Antwort.
66
3
Interventionen in kooperativen Modellierungsprozessen
Die Interaktion wird häufig durch eine Frage eingeleitet (Schritt 1). Dabei wird die Frage solange umformuliert oder zu einer Ja-Nein-Frage vereinfacht, bis der Lernende antwortet oder selbst eine Verständnisfrage stellt. Der Lernende antwortet meist mit einzelnen Worten oder Satzfragmenten, selten klar verständlich in einem vollen Satz (Schritt 2). Teilweise fordert der Tutor den Lernenden durch positives oder neutrales Feedback (bspw. „aha“, „ok“ oder ein Kopfnicken) zu weiteren Aussagen auf. Schließlich gibt der Tutor ein kurzes, bewertendes Feedback zur Aussage des Lernenden (Schritt 3). Fähigere Tutoren verwenden dabei oft lange Pausen oder zögern in ihrer Reaktion, um die Antwort der Schülerinnen und Schüler nonverbal negativ zu bewerten. Untrainierte Tutoren wenden diese Art des Feedbacks selten an. Schließlich verbessern Tutor und Lernender die Qualität der Antwort auf die Fragestellung kollaborativ (Schritt 4). Graesser et al. (1995) nennen eine Liste der dabei am häufigsten beobachteten Interventionsstrategien des Tutors: • Mit Pumping ist die bereits beschriebene Strategie gemeint, bei der der Tutor den Lernenden durch positives oder neutrales Feedback dazu auffordert, weitere Informationen zur Fragestellung zu geben. Dieser Mechanismus wurde insbesondere dann angewendet, wenn die Antwort in Schritt 2 vage oder unzureichend war. • Prompting students to fill in words. Der Tutor fordert den Lernenden durch eine Intonation oder eine bewusste Pause dazu auf, mit einem Begriff seinen Satz zu vervollständigen. • Unter Splicing wird das Einwerfen einer korrekten Information durch den Tutor verstanden. Diese Strategie wird häufig angewendet, wenn die Antwort des Lernenden falsch war. Häufig teilte der Tutor gar nicht mit, dass die gegebene Antwort falsch war. Des Weiteren tritt diese Strategie bei Verständnisfragen auf, die einen höheren Anforderungsgrad mit sich bringen. • Summarizing. Der Tutor stellt eine Zusammenfassung der Informationen bereit, wenn diese ausreichen, um die Fragestellung vollständig richtig zu beantworten. Die Autoren merken jedoch an, dass es stattdessen für die Lernenden gewinnbringender wäre, diese Zusammenfassung selbst zu formulieren, da dies die Organisation und Speicherung von Informationen fördere. In einem letzten Schritt (Schritt 5) fragt der Tutor den Lernenden, ob er alles verstanden hat. Diese Form der Verständnisfragen wurde von den Lernenden jedoch selten ehrlich beantwortet. Kaum werden durch den Tutor Fragen eingebracht, die das Verständnis des Lernenden tatsächlich prüfen. Dabei stellen diagnostische Kontrollfragen eine gute Möglichkeit dar, um Missverständnisse während des Tutoringprozesses auszuschließen.
3.3 Interventionskonzepte
67
Die Autoren veranschaulichen den gesamten Prozess anhand eines Transkripts aus ihren Daten, in dem es inhaltlich um empirische Forschungsdesigns geht (Graesser et al., 1995): 1. 2. 3. 4.
Tutor: Now what is a factorial design? Student: The design has two variables. Tutor: Uh-huh. Tutor: Sodependent there are two or more independent variables and one [pause] Student: variable.
5. Tutor: DoUh-huh. you see that? Student: (Graesser et al., 1995, S. 504)
Im Unterrichtsgespräch werden in der Regel nur die Schritte 1 bis 3 durchlaufen (Cazden, 1986), die das sogenannte IRE-Muster (Initiation-Reply-Evaluation; Mehan, 1979, S. 37 ff.) darstellen. Der Lernertrag ist in Tutoring-Settings dem des Klassenunterrichts erwiesenermaßen überlegen (Graesser et al., 1995). Das Tutoring zeichnet sich zusätzlich durch die Schritte 4 und 5 aus, sodass der zusätzliche Lernertrag auf diese Phasen zurückgeführt wird. Dabei werden die folgenden Merkmale für den höheren Lernertrag verantwortlich gemacht (Graesser et al., 1995): • Lernende und Tutor führen während des Problemlösens einen kollaborativen Dialog. • Dies führt zu logischem, kausalem und zielorientiertem Folgern, was das Tiefenverständnis fördert. • Lernender und Tutor haben die Möglichkeit mehr Fragen zu stellen, die auf das Verständnis abzielen. • Der Tutor vermittelt Anweisungen und die Korrektur von Fehlern auf eine indirekte Art und Weise. Die Interaktivität des Dialogs spielt für den Lernzuwachs eine entscheidende Rolle (vgl. Abschnitt 3.1.1). Der Zuwachs kann nicht allein auf das Intervenieren des Tutors zurückgeführt werden, sondern steht vor allem mit dem aktiven Antworten des Lernenden und der Interaktion zwischen Tutor und Lernendem in Verbindung (Chi et al., 2001). Die in Schritt 4 beschriebenen Interventionsstrategien werden als Formen des Scaffolding bezeichnet (Chi et al., 2001; Graesser et al., 1995). Chi et al. (2001) weisen dem Scaffolding in dieser Phase eine Schlüsselrolle bei der Entfaltung des vollen Potentials des Lernenden zu. Dies verdeutlicht, dass der Begriff Scaffolding im Kontext des Tutoring verwendet wird und einen Teil des fünfschrittigen Musters beschreibt. Es wäre jedoch falsch den Begriff des Scaffolding als einen Unterbegriff
68
3
Interventionen in kooperativen Modellierungsprozessen
des Tutoring zu charakterisieren. Das Tutoring stellt häufig den Situationskontext dar, der in der Regel durch die personale Eins-zu-Eins Betreuung charakterisiert wird, das Scaffolding die bestimmte Art der Unterstützung in diesem Kontext. Beide Begriffe lassen sich jedoch nicht trennscharf unterscheiden (Krammer, 2009, S. 92; Link, 2011, S. 74; Wood, Bruner, & Ross, 1976), da der Begriff des Tutoring in der Literatur teilweise auch für die Charakterisierung der Art der Unterstützung verwendet wird. Im folgenden Kapitel wird auf das Konzept Scaffolding separat eingegangen, da es eine entscheidende Rolle in der aktuellen Forschung einnimmt und mittlerweile getrennt vom Tutoring-Konzept verwendet wird. Die Verwendung des Begriffs hat sich mit der Zeit gewandelt und wurde auch auf die Betreuung von Kleingruppen übertragen.
3.3.2
Scaffolding
Die Metapher des Scaffolding wurde erstmals von Wood, Bruner und Ross (1976) beschrieben (Stone, 1998). Der Begriff stammt vom englischen Wort „to scaffold“ (engl.: mit einem Gerüst versehen) ab. In Bezug auf die Unterstützung in Bearbeitungsprozessen besagt die Metapher, dass für den Lernenden ein Gerüst erbaut wird, mit dessen Hilfe er Schwierigkeiten im Problemlöseprozess überwinden kann und Ziele zu erreichen vermag, die er allein nicht erreichen könnte. Ist der Lernende in der Lage das Problem eigenständig zu lösen, wird das Gerüst nach und nach wieder abgebaut. In ihrem Artikel zur Rolle des Tutoring im Problemlöseprozess beschreiben Wood et al. (1976) das Konzept des Scaffolding wie folgt: More often than not, it [the tutor’s intervention] involves a kind of “scaffolding” process that enables a child or novice to solve a problem, carry out a task or achieve a goal which would be beyond his unassisted efforts. This scaffolding consists essentially of the adult “controlling” those elements of the task that are initially beyond the learner’s capacity, thus permitting him to concentrate upon and complete only those elements that are within his range of competence. (Wood et al., 1976, S. 90; Hervorhebung im Original)
Die Begleitung der Lernenden anhand des Scaffolding-Konzepts sollte nicht nur die Lösung der Aufgaben ermöglichen. Die Lernenden sollen verstehen, welche Schritte zur Lösung der Aufgabe notwendig sind. Dies befähigt sie, ähnliche Probleme zukünftig eigenständiger zu lösen. Wood et al. (1976) grenzten sich mit ihrer Darstellung implizit von einer behavioristischen Auffassung des Lernbegriffs ab, obwohl sie dies nicht explizit darstellten (Stone, 1998).
3.3 Interventionskonzepte
69
In ihrer Studie untersuchten Wood et al. (1976) das Tutoring eines Erwachsenen, der 30 drei bis fünfjährige Kinder beim Zusammenstecken von Pyramiden betreute. Die Aufgabenstellungen waren so gewählt, dass die Kinder sie nicht vollkommen auf sich allein gestellt lösen konnten. Das Ziel bestand darin, die Kinder soweit es geht selbstständig arbeiten zu lassen. Dabei intervenierte der Tutor in erster Linie verbal und erst direkter, falls das Kind die Intervention nicht verstanden hatte (Wood et al., 1976). Der Tutor bildet bei der Betreuung zwei theoretische Modelle aus: Zum einen muss er über eine Theorie der Aufgabe oder des Problems verfügen. Dies beinhaltet das Wissen darüber, wie die Aufgabe zu lösen ist. Des Weiteren benötigt er eine Theorie über die Leistungsmerkmale des Lernenden. Ein effektives Scaffolding wird durch die Interaktion dieser beiden theoretischen Modelle bestimmt. Die Autoren identifizierten in der Studie beim Zusammenspiel dieser Modelle sechs Funktionen des Scaffolding (Wood et al., 1976): • Recruitment (Rekrutierung). Der Tutor weckt das Interesse des Lernenden für die Problemstellung und deren Anforderungen. • Reduction in degrees of freedom (Reduzierung der Freiheitsgrade). Der Tutor reduziert die Anzahl der durch den Lernenden auszuführenden Schritte im Bearbeitungsprozess. Er führt die zu anspruchsvollen Schritte aus und lässt den Lernenden den Rest erledigen. • Direction maintenance (Bearbeitungsrichtung sicherstellen). Der Tutor sorgt dafür, dass die Lernenden das Ziel im Auge behalten und motiviert sie weiter am Problem zu arbeiten. Des Weiteren kümmert er sich darum, dass die Lernenden den nächsten Schritt wagen und sich nicht auf vergangenen Erfolgen ausruhen. • Marking critical features (Kennzeichnung kritischer Punkte). Der Tutor weist auf relevante Punkte des Problems hin. Er stellt Informationen zu seinen Erwartungen an die Lösung der Aufgabe bereit. Dies erfordert den Vergleich zwischen der Lösung des Lernenden und der erwarteten Lösung. • Frustration control (Frustrationskontrolle). Der Tutor hält das Frustrationslevel möglichst gering. Jedoch sorgt er dafür, dass keine Abhängigkeit zwischen Lernendem und Tutor entsteht. • Demonstration (Vorführen). Der Tutor führt Teile oder die gesamte Lösung der Aufgabe in einer idealisierten Weise vor (modelling), sodass der Lernende diese nachahmen kann. Krammer (2009, S. 75) identifiziert in diesen Funktionen drei übergeordnete Ebenen der Unterstützung:
70
3
Interventionen in kooperativen Modellierungsprozessen
• Auf der emotionalen Ebene weckt der Tutor Motivation und hält die Frustration der Lernenden so gering wie möglich. • Auf der prozeduralen Ebene strukturiert der Tutor den Lösungsprozess und erhält ihn aufrecht. Dies tut er unter anderem durch das Einschränken des Lösungsweges. • Auf der inhaltlichen Ebene gibt der Tutor Hinweise zu entscheidenden Punkten der Problemstellung und führt Lösungsschritte vor. Obwohl Wood et al. (1976) in ihrer damaligen Publikation keinen Bezug zur Theorie Vygotskys hergestellt haben, wird das Scaffolding mittlerweile vielfach mit der Zone der nächsten Entwicklung in Verbindung gebracht (Van de Pol, Volman, & Beishuizen, 2010). Das Scaffolding wird dabei als ein Interventionskonzept verstanden, mit dessen Hilfe die Lernenden bei der Durchquerung der Zone der nächsten Entwicklung begleitet werden. Da das Scaffolding eine enge Verbindung zum Tutoring hat und in Zusammenhang mit der Zone der nächsten Entwicklung verstanden wird, stellt es einen interaktiven Prozess zwischen Lehrendem und Lernendem dar, an dem beide aktiv partizipieren (Stone, 1998). Cazden (1979) stellte erstmals den Bezug zur Theorie Vygotskys her, welcher in der späteren Forschungsliteratur auch von den ursprünglichen Autoren des Scaffolding-Konzepts (Wood et al., 1976) akzeptiert wird. Darüber hinaus übertrug Cazden (1979) die ursprüngliche Verwendung des Konzepts in der Erwachsenen-Kind-Interaktion auf die Lehrer-Schüler-Interaktion (Stone, 1998). Van de Pol et al. (2010) führten zur Zusammenfassung der ScaffoldingDiskussion eine Metastudie zur Konzeptualisierung des Begriffs in der LehrerSchüler-Interaktion durch. Anlass dafür war unter anderem eine immer breitere Verwendung des Begriffs, der teilweise als ein Synonym für eine bloße Hilfestellung verwendet wurde (Puntambekar & Hübscher, 2005). In ihrer Metastudie zu 66 theoretischen, deskriptiven und evaluativen englischsprachigen Arbeiten wurden Studien zum Scaffolding in Eins-zu-Eins Situationen, bei der Unterstützung von Kleingruppen und ganzen Klassen einbezogen. Van de Pol et al. (2010) identifizierten drei charakteristische Merkmale. Unter contingency wird die Anpassung der Hilfestellung an das aktuelle Leistungsniveau der Lernenden und deren Antworten verstanden. Im Englischen werden alternativ die Begriffe „responsiveness, tailored, adjusted, differentiated, titrated or calibrated support“ (engl.: Reaktionsfähigkeit, maßgeschneiderte, angepasste, differenzierte, bemessene und kalibrierte Hilfe; Van de Pol et al., 2010, S. 274) verwendet. Das Unterstützungsverhalten ist insoweit angepasst, dass die Hilfestellung sich auf demselben oder einem leicht höheren Leistungsniveau befindet. Ein Werkzeug zur
3.3 Interventionskonzepte
71
Herstellung einer angepassten Hilfestellung sind diagnostische Strategien, mit deren Hilfe das aktuelle Leistungsniveau erfasst werden kann. Mit dem Begriff fading wird das sukzessive Nachlassen der Anzahl und Stärke der Hilfestellungen bezeichnet. Wie schnell die Hilfestellung der Lehrkraft nachlässt, hängt von der Entwicklung und dem Kompetenzniveau des Lernenden ab. Mit dem Fading geht der transfer of responsibility einher. Das immer eigenständigere Lösen einer Aufgabenstellung führt zu einer Übertragung der Verantwortung für die Lösung der Aufgabe und das Lernen an die Schülerinnen und Schüler. Die Verantwortung bezieht sich auf kognitive, metakognitive und affektive Merkmale der Lernenden. Damit hat Scaffolding das Potential, nicht nur die zu vermittelnden Kompetenzen zu fördern, sondern auch affektiv-motivationale Merkmale zu adressieren (Van de Pol et al., 2010). Der Wirkzusammenhang dieser drei Merkmale wurde in einem konzeptuellen Modell des Scaffolding zusammengefasst (siehe Abbildung 3.1). Zum Zeitpunkt 1 ist die Verantwortung des Lernenden für die Lösung der Aufgaben gering und die Lehrkraft gibt in einem relativ großen Umfang angepasste Hilfestellungen. Durch die Anwendung von diagnostischen und Scaffolding-Strategien (Tharp & Gallimore, 1988) fördert die Lehrkraft den Lernenden. Mit der Zeit findet ein Fading und damit eine Übertragung der Verantwortung statt. Das Kompetenzniveau der Lernenden nimmt zu, sodass weniger Hilfestellungen notwendig sind und die Verantwortung der Lernenden für den eigenen Lösungsprozess steigt. Van de Pol et al. (2010) schlagen daher die folgende Kausalkette vor, die es noch empirisch nachzuweisen gilt: „Contingent teaching thus appears to lead to fading that can lead, in turn, to transfer of responsibility.“ (Van de Pol et al., 2010, S. 287) Zur Klassifikation von Scaffolding-Strategien verwenden van de Pol et al. (2010) die Arten der Hilfestellungen nach Tharp und Gallimore (1988), die im Folgenden anhand von selbst konstruierten Sprechakten illustriert werden, wie sie bei der Unterstützung von Modellierungsprozessen verwendet werden können: • Feeding back. Den Lernenden werden Informationen über deren Leistung bereitgestellt. „Ihr seid auf dem richtigen Weg.“ oder „Euer Ansatz ist korrekt.“ • Giving of hints. Die Lehrkraft stellt Hinweise oder Vorschläge zur Verfügung, die den Lösungsprozess vorantreiben sollen. Es werden keine detaillierten Informationen gegeben. „Wie habt ihr solche Gleichungen in der Vergangenheit gelöst?“ • Instructing. Die Lehrkraft sagt den Lernenden, was sie tun müssen oder erklärt, wie und warum etwas zu tun ist.
72
3
Interventionen in kooperativen Modellierungsprozessen
Abbildung 3.1 Konzeptuelles Modell des Scaffolding nach van de Pol et al. (2010) (Abgedruckt mit Genehmigung von Springer Nature: Educational Psychology Review, 22(3), 271–297; © 2010 Springer Nature)
„Ihr müsst nun diese Gleichung lösen, beispielsweise mithilfe der quadratischen Ergänzung.“ • Explaining. Die Lehrkraft stellt detaillierte Informationen zu einem Sachverhalt bereit. „Ein Durchschnittsauto verbraucht in etwa 7 Liter pro Kilometer.“ • Modeling. Die Lehrkraft führt ein Verhalten vor, sodass die Lernenden diese nachahmen können. [Die Lehrkraft führt vor, wie die Gleichung zu lösen ist.] • Questioning. Die Lehrkraft stellt Fragen, die eine Antwort der Lernenden erfordern und damit kognitive Prozesse anregen. „Versetzt euch einmal in die Situation. Welche Aspekte spielen eine Rolle?“ Bei der Begleitung von Modellierungsprozessen in Kleingruppen sehen Stender und Kaiser (2015) ein großes Potential in strategischen Interventionen, um das Scaffolding-Konzept umzusetzen. Durch strategische, nicht auf den Inhalt der Aufgabe bezogene, Prozesshilfen sollen die Schülerinnen und Schüler zum eigenständigen Arbeiten angeregt werden, mit dem langfristigen Ziel, ihren Lernprozess
3.3 Interventionskonzepte
73
selbst zu steuern (transfer of responsibility). Idealerweise erlernen sie Heurismen und können diese in weiteren Kontexten anwenden, sodass sie zukünftig den Modellierungsprozess eigenständiger durchführen können (Stender & Kaiser, 2015). Dies führt zu einer geringeren Notwendigkeit von Interventionen (fading). Entscheidend ist an dieser Stelle jedoch, dass die durch die Lehrkraft bereitgestellten Strategien in der Situation sinnvoll sind und angewendet werden können (contingency; Link, 2011, S. 176). Zur Veranschaulichung wird im Folgenden eine Auswahl heuristischer Strategien mit zugehörigen Interventionen aufgeführt, die deren Anwendung im Modellierungsprozess anregen sollen. Für eine explizite und vollständige Beschreibung wird auf Stender (2016, S. 254 ff.) verwiesen: • Systematisches Probieren (Dörner, 1976). „Rechnet zunächst ein Beispiel mit ausgedachten Zahlen und probiert dann, welche Werte ihr am sinnvollsten findet!“ (Stender, 2016, S. 254) • Zerlegen des Problems in Teilprobleme (Pólya, 1966) Bei der Umrechnung von km/h in m/s: „Dort sind ja jeweils zwei Einheiten vorhanden, rechnet erstmal nur eine von den beiden um!“ (Stender, 2016, S. 255) • Superpositionsverfahren (Pólya, 1966). „Ihr habt bisher mehrere einzelne Ergebnisse heraus bekommen. Stellt diese übersichtlich zusammen und versucht diese zu kombinieren!“ (Stender, 2016, S. 256) • Führe Neues auf Bekanntes zurück (Pólya, 1967). „Kennst du (einfache) Situationen, in denen Du das Ziel … selbstständig erreichen könntest?“ (Stender, 2016, S. 257) • Vergrößere den Suchraum (Dörner, 1976). „Welche Funktionen kennt ihr überhaupt?“ (Stender, 2016, S. 257) • Betrachte Grenzfälle oder Spezialfälle (Pólya, 1967). „Berechne, was geschieht, wenn eine der beiden Größen fast Null wird, was geschieht, wenn die andere sehr klein wird?“ (Stender, 2016, S. 258) • Verallgemeinerungen (Pólya, 1967). „Erstellt eine Liste aller Einflussfaktoren auf die Busfahrt. Dann wählt so wenige wie möglich von diesen Faktoren aus, um eine erste Untersuchung einer idealisierten Busfahrt durchzuführen!“ (Stender, 2016, S. 258) • Repräsentationswechsel (Dörner, 1976). „Stelle die Situation zeichnerisch dar!; Versuche, einen Term aufzustellen!; Verwendet eine Tabelle!“ (Stender, 2016, S. 260) • Symmetrie (Pólya, 1967). „Macht es euch zunächst einfach: geht davon aus, dass die Situation symmetrisch ist!“ (Stender, 2016, S. 261)
74
3
Interventionen in kooperativen Modellierungsprozessen
• Probleme auf Algorithmen zurückführen (Engel, 1977). „Macht daraus ein lineares Gleichungssystem, da wisst ihr, wie man das (mit einem technischen Hilfsmittel) lösen kann!“ (Stender, 2016, S. 262) • Analogie (Pólya, 1967). „Erinnere Dich an die Situation, wo [sic] wir *** gemacht haben!“ (Stender, 2016, S. 263) Scaffolding-Strategien werden durch die Intention der Lehrkraft (siehe Funktionen des Scaffolding; Wood et al., 1976) und die oben beschriebenen Arten der Hilfestellung bestimmt. Ob es sich dabei um Scaffolding-Strategien handelt, ist davon abhängig, ob diese unter Berücksichtigung der drei Merkmale des Scaffolding (contingency, fading, transfer of responsibility) angewendet werden (Van de Pol et al., 2010). Van de Pol, Volman, Elbers und Beushuizen (2012) entwickelten zur Analyse und Beschreibung von Scaffolding sowie zur Unterstützung bei der Durchführung von Hilfestellungen ein Prozessmodell, das Model of Contingent Teaching (vgl. Abbildung 3.2). Sie unterscheiden einen diagnostischen (Schritt 1), einen interventionsbezogenen (Schritt 3) und jeweils evaluierende Schritte (2 und 4).
Abbildung 3.2 Model of Contingent Teaching (Van de Pol, Volman, Oort, & Beishuizen, 2014) (Abgedruckt mit Genehmigung von Taylor & Francis: Journal of the Learning Sciences, 23(4), 600–650; © 2014 Taylor & Francis)
Unter diagnostischen Strategien verstehen die Autoren insbesondere das Stellen von offenen diagnostischen Fragen, die keine Richtung oder Hinweise vorgeben, wie sie zu beantworten sind. Sie erachten diesen Schritt als sehr wichtig, da die Einschätzung von Lehrkräften zum Verständnis des Lernenden oft ungenau sind (Chi, Siler, & Jeong, 2004). Dies kann damit zusammenhängen, dass häufig gar keine Diagnostik vor der Intervention durchgeführt wird (Van de Pol, 2011; Webb, Nemer, & Ing, 2006). Als Grund werden fehlende diagnostische Fähigkeiten, Vorurteile gegenüber einzelne Lernende („Dieser Schüler ist ein schlechter Leser.“),
3.3 Interventionskonzepte
75
ein automatisiertes Bereitstellen von Hilfe oder Zeitmangel genannt. Werden diagnostische Fragen verwendet, haben diese häufig eine schlechte Qualität und zielen nur auf Rückmeldungen zum Verständnis oder dem Wiedergeben von Sachwissen ab. Qualitativ hohe Fragestellungen fordern aufgrund ihrer Offenheit Erklärungen und lassen damit Rückschlüsse auf das konzeptuelle Verständnis der Lernenden zu (Van de Pol et al., 2014). Durch die Überprüfung der Diagnose soll ein gemeinsames Verständnis zwischen Lernendem und Lehrkraft hergestellt werden. Der Lehrende überprüft sein Verständnis des Schülerverstehens, um eine adaptive Reaktion zu garantieren. Dieser Schritt lässt sich durch verbale Zusammenfassungen der Lehrkraft umsetzen, die das Lehrerverständnis für die Schüler transparent werden lassen (Van de Pol et al., 2014). Die Anwendung von Interventionsstrategien richtet sich nach den gewonnen und überprüften Informationen. Die Adaptivität dieser Strategien stellt ein entscheidendes Merkmal effektiver Hilfestellungen dar und ein Zusammenhang mit dem Erfolg der Hilfe ist nachweisbar (Pino-Pasternak, Whitebread, & Tolmie, 2010). Van de Pol et al. (2014) unterscheiden dabei zwei miteinander in Beziehung stehende Arten von Adaptivität: Unter contingency control (engl.: adaptive Kontrolle) verstehen sie die Anpassung der Regulation an das Schülerverstehen, unter dem Begriff contingency uptake (engl.: adaptives Aufnehmen) die Anpassung an das, was der Lernende geantwortet hat. Die adaptive Kontrolle richtet sich insoweit nach dem Schülerverstehen, dass bei einem hohen Verständnislevel die Regulation verringert und bei Fehlschlägen verstärkt wird. Dieses Prinzip steht in engem Zusammenhang mit den Merkmalen des Scaffolding (fading und transfer of responsibility) und wird als contingent shift principle bezeichnet. Das adaptive Aufnehmen der Schülerbeiträge führt zur Anerkennung der Arbeit der Lernenden und gibt ihnen die Möglichkeit, sich aktiv in die Konversation einzubringen (Van de Pol et al., 2014). Darüber hinaus wird dadurch eine Orientierung am Lösungsweg der Schülerinnen und Schüler und nicht an der von der Lehrkraft favorisierten Lösungsvariante gewährleistet. Nach der Intervention muss eine Überprüfung des Lernens erfolgen. Der Fokus liegt nun auf dem neuen Schülerverstehen, das sich (idealerweise) durch den Interventionsprozess verbessert hat. Dazu kommen wiederum diagnostische Kontrollfragen zum Einsatz, die die Schüler zur Demonstration ihres Wissens auffordern. Auf Basis dieser Diagnose entscheidet die Lehrkraft, ob die Verantwortung zurück an die Lernenden übertragen werden kann. Alle Schritte des Prozessmodells sind mit einem Lehrenden-Lernenden-Dialog verbunden. Die reine Beobachtung von Gruppenarbeitsprozessen wird in diesem
76
3
Interventionen in kooperativen Modellierungsprozessen
Interventionskonzept nicht als diagnostische Strategie betrachtet. Obwohl ein individueller Dialog sicherlich eine genaue Diagnostik erlaubt, ist dieser mit einem hohen Zeitaufwand verbunden. In unterrichtlichen Situationen bietet sich durch die bloße Anzahl an zu betreuenden Gruppen und dem damit einhergehenden Zeitmangel die Beobachtung der Gruppendialoge als diagnostische Strategie an. Aus einer theoretischen Perspektive ist die Übertragung des ScaffoldingKonzepts, das sich ursprünglich auf eine Eins-zu-Eins-Interaktion bezog (Puntambekar & Hübscher, 2005), auch auf Kleingruppen (Cazden, 1979) oder sogar eine ganze Klasse möglich (Smit, Eerde, & Bakker, 2013). Der Unterschied besteht darin, dass die Lehrkraft mehrere Zones of Proximal Development diagnostizieren muss, was zu höheren Anforderungen als in der Eins-zu-Eins-Interaktion führt. Smit et al. (2013) heben daher die Bedeutung der Diagnostik für das Scaffolding in Kleingruppen oder in der Klasse explizit hervor, wie auch weitere Autoren (Puntambekar & Hübscher, 2005; Van de Pol et al., 2010). Daher akzentuieren Smit et al. (2013) das Konzept des Scaffolding anhand der Merkmale diagnosis, responsiveness und handover to independence etwas anders. Inhaltlich decken sie sich größtenteils mit den von van de Pol und Kollegen (2010) in der Meta-Studie identifizierten Merkmalen. Zusammenfassend wird festgehalten, dass das Scaffolding-Konzept aus der Tutoring-Diskussion hervorgegangen ist und aufgrund seiner eigenständigen Verwendung in der Literatur als ein eigenes Interventionskonzept angesehen wird. Da das Tutoring eine zeiteffiziente Unterstützungsform ist, deren Ziel unter anderem die permanente Aufrechterhaltung eines produktiven Arbeitsprozesses ist (Merrill et al., 1995), sind je nach Lernpotential der Situation stark anleitende und inhaltliche Interventionen erlaubt. Das Tutoring zeichnet sich durch eine starke Partizipation des Lehrenden am Arbeitsprozess aus, da er in einer Eins-zu-Eins Situation in Kollaboration mit dem Lernenden an der Lösung des Problems arbeitet. Dies erscheint im Hinblick auf eine Förderung der Selbstständigkeit des Lernenden wenig zielführend. Aus diesem Grund kann das idealtypisch beschriebene Tutoring-Konzept als wenig geeignet für die Förderung selbstständigkeitsorientierter Modellierungsprozesse angesehen werden. In Abgrenzung zum Tutoring-Konzept wird beim Scaffolding von einem eigenen Konzept gesprochen, wenn Interventionen auf die kurz-, mittel- oder langfristige Umsetzung seiner drei Merkmale (contingency, fading, transfer of responsibility; Van de Pol, 2011) ausgerichtet sind. Die Förderung der Selbstständigkeit der Lernenden bildet neben der Adaptivität der Hilfestellung das zentrale Charakteristikum. Dabei erfüllt das Scaffolding im ursprünglichen Sinne sechs verschiedene Funktionen (Wood et al., 1976) auf einer emotionalen, prozeduralen oder inhaltlichen Ebene (Krammer, 2009). Interventionen können anhand des Prozessmodells „Model of Contingent Teaching“ (Van de Pol et al., 2012) beschrieben werden. Die
3.3 Interventionskonzepte
77
individuelle Diagnostik nimmt dabei einen großen Stellenwert ein und bestimmt die anzuwendende Interventionsstrategie (Tharp & Gallimore, 1988). Zur Unterstützung von Modellierungsprozessen erachten Stender und Kaiser (2015) im Rahmen des Scaffolding Interventionen zur Vermittlung heuristischer Strategien (Stender, 2016) als besonders wirksam, um die zukünftig selbständigere Lösung von Modellierungsaufgaben zu fördern.
3.3.3
Gestuftes Intervenieren
Einige Empfehlungen aus der Literatur lassen sich einem Konzept zuordnen, dass die größtmögliche Eigenständigkeit der Lernenden durch eine Stufung der Hilfestellungen erhalten möchte. Das Konzept gestufter Hilfestellungen basiert auf der Überlegung, den Lernenden nicht mehr Hilfe als notwendig zu geben. Aebli (1983) benennt dies als das Prinzip der minimalen Hilfe im Rahmen eines problemlösenden fragend-entwickelnden Unterrichts, den er wie folgt beschreibt: Er [Der Unterricht] ist „fragend-entwickelnd“, wenn sich der Schüler selbst, oder, stellvertretend für ihn der Lehrer, nacheinander Fragen stellen [sic], bei deren Beantwortung sich die Problemlösung immer klarer abzeichnet, bis sie, voll entwickelt, dem Denken und Handeln des Schülers einverleibt ist. (Aebli, 1983, S. 296: Hervorhebung im Original)
Der fragend-entwickelnde Unterricht sorgt für eine Präzisierung der Problemstellung, die zur Lösung des Problems beiträgt. Das Hauptproblem wird in verschiedene Teilprobleme aufgeteilt. Jede Frage der Lehrkraft bezieht sich auf das Ergebnis der vorherigen Frage. Dabei hilft sie beim Abrufen des benötigten Wissens zur Lösung des Problems, indem sie, das benötigte Wissenselement im Hinterkopf habend, gezielte Fragen stellt. Schließlich unterstützt die Lehrkraft durch Aufforderungen und Fragen das Herstellen von Beziehungen und beim Zusammensetzen der Lösung (Aebli, 1983, S. 299). Fragen und Aufforderungen werden nach dem Prinzip der minimalen Hilfe formuliert: Bei alledem gilt das Grundprinzip, daß der Lehrer dem selbstständigen Nachdenken der Schüler solange seinen Lauf läßt, als sie auf dem Wege der Lösung des Problems weiterkommt. Aber auch wenn sie Hilfe brauchen, interveniert er nicht sofort auf massive Weise. Es wäre ein Fehler, wenn er die Führung sogleich mittels eng gefaßter Fragen und Aufforderungen übernähme. Dadurch würde er wahrscheinlich Lösungselemente liefern, die die Schüler durchaus selbst finden können. (Aebli, 1983, S. 300)
78
3
Interventionen in kooperativen Modellierungsprozessen
Dabei deutet Aebli bereits hier eine Stufung der Hilfestellungen an, ohne diese direkt zu benennen. Er spricht davon, zunächst „allgemeine Aufforderung[en] zum Beobachten oder Nachdenken an die Klasse [zu richten, allmählich die Leitung zu übernehmen und] die Klasse den Erkenntnissen entgegenzuführen [sowie] Ordnung in die Betrachtung [zu bringen. Schließlich wird] vor der engen Frage und Aufforderung … noch der Hinweis auf den Teil des Gegenstandes oder auf das Element des Problems [eingebracht.] Erst in letzter Linie zeigt er dem Schüler mittels eng gefaßter Fragen und Aufforderungen im einzelnen [sic], was er zu tun hat.“ (Aebli, 1983, S. 300) Auch wenn sich Aebli in diesem Fall auf den Klassenunterricht bzw. den fragend-entwickelnden Unterricht bezieht, bildet das Prinzip der minimalen Hilfe die Ausgangslage für Überlegungen zu einer selbstständigkeitsorientierten Unterstützung von kooperativen Modellierungsprozessen. Dabei ist ein möglichst großer Anteil der Lernenden an der Konstruktion von Wissen zentral. Zech (1996) stellt ein Interventionskonzept bestehend aus gestuften Hilfestellungen vor, das auf dem Prinzip der minimalen Hilfe basiert. Die Lehrperson interveniert bei Schwierigkeiten im Lösungsprozess. Gewinnt der Lehrer den Eindruck, daß ein Schüler bzw. eine Schülergruppe bei der Lösung eines Problems (in »vertretbarer« Zeit) nicht weiterkommt, gibt er ihm bzw. ihr die seiner Einschätzung nach geringste Hilfe, die den Problemlöseprozeß vermutlich weiterbringt. (Zech, 1996, S. 315; Hervorhebung im Original)
Als Leitfaden gibt Zech (1996) eine Taxonomie der Hilfen an, die der Lehrkraft Informationen über die Stärke der Hilfe bereitstellen soll. Sie wurde auf Basis von Unterrichtsbeobachtungen beim Problemlösen entwickelt und schließt an die Arbeiten von Eigler, Judith, Künzel und Schönwälder (1973, S. 86 ff.) sowie von Riedel (1973, S. 75 ff.) an. Die Hierarchie beginnt bei schwachen motivationalen Hilfen und endet bei starken inhaltlichen Interventionen. Zech (1996, S. 315 ff.) unterscheidet zusätzlich zwischen direkten und indirekten Hilfen, je nachdem wie präzise die Lehrkraft in ihrer Formulierung der Hilfestellung ist: 1. Motivationshilfen direkt: „Du wirst es sicher schaffen.“ (an einen bestimmten Schüler gewandt) indirekt: „Die Aufgabe ist nicht so schwierig.“ (an die ganze Klasse gewandt) 2. Rückmeldungshilfe direkt: „An dieser Stelle hast du einen Fehler gemacht.“ (Lehrer deutet auf Stelle) indirekt: „An einer Stelle hast du einen Fehler gemacht.“ 3. Allgemein-strategische Hilfen
3.3 Interventionskonzepte
79
direkt: „Was ist gegeben, was ist gesucht?“ indirekt: „Sieh dir den Aufgabentext vielleicht noch mal genauer an.“ 4. Inhaltsorientierte strategische Hilfe direkt: „Versucht, die Aufgabe mit einem graphischen Fahrplan zu lösen.“ indirekt: „Versucht, die Aufgabe anhand einer anderen Darstellungsweise zu lösen.“ 5. Inhaltliche Hilfe direkt: „Zeichnet doch mal diese Hilfslinien ein.“ indirekt: „Ihr braucht eine Hilfslinie, die einen rechten Winkel erzeugt.“ Motivationshilfen sollen affektive Aspekte der Lernenden beeinflussen und die weitere Arbeit an der Aufgabe sicherstellen. Diese können jedoch durchaus kritisch gesehen werden, da sie je nach Situation auch den gegenteiligen Effekt haben können (Link, 2011, S. 86). Rückmeldungshilfen geben den Lernenden ein Feedback zum Lösungsweg oder Ergebnis. Allgemein-strategische Hilfen bestehen aus fachübergreifenden oder allgemeinen fachlichen Problemlösemethoden (Pólya, 1966, 1967). Es wir hier auch potentiell als sinnvoll erachtet, den Lernenden bloß daran zu erinnern, überlegt vorzugehen („Überlege dir, was der erste (nächste) Schritt sein könnte!“ (Zech, 1996, S. 316)). In inhaltsorientierten strategischen Hilfen werden eher fachbezogene Problemlösemethoden in einem Teilgebiet der Mathematik oder allgemeine Problemlösemethoden bezogen auf einen inhaltlichen Aspekt verwendet. Inhaltliche Hilfen geben Hinweise auf Begriffe, Regeln, Zusammenhänge oder bestimmte Hilfsgrößen oder -linien. Die Hilfestellung erstreckt sich bis zur Vorgabe von Teillösungen (Zech, 1996, S. 316 ff.). Eine Zuordnung von Interventionen zu diesen Kategorien ist nicht eindeutig möglich, da diese nicht überschneidungsfrei sind und in der Praxis häufig Mischformen auftreten. Insbesondere die Abgrenzung von allgemein- und inhaltsorientiert strategischen Hilfen erscheint schwierig. Die Taxonomie bietet einer Lehrkraft die Möglichkeit, geeignete Hilfestellungen zu einer Aufgabenstellung im Vorfeld zu antizipieren. Ihre Wirkung hängt jedoch weiterhin maßgeblich vom Zeitpunkt des Einsatzes ab. In einem subjektiv ausgewählten Moment entscheidet sich die Lehrperson für eine ihrer „Einschätzung nach geringste Hilfe, die den Problemlöseprozeß vermutlich weiterbringt“ (Zech, 1996, S. 315). Dies bedeutet also nicht, dass die Taxonomie bei jeder Intervention von Anfang an, beginnend bei der Motivationshilfe, durchlaufen wird, bis die geeignete Hilfestellung erreicht wird. Vielmehr wird die anfängliche Intervention anhand einer subjektiven Einschätzung, einer Form der Diagnostik, identifiziert. Lediglich die Wahl einer eventuell weiteren, stärkeren Intervention wird durch das Interventionskonzept vorgegeben.
80
3
Interventionen in kooperativen Modellierungsprozessen
Grundsätzlich sind unterschiedliche Taxonomien auf verschiedenen Ebenen denkbar. Dubs (2009, S. 94 f.) gibt eine Taxonomie des Scaffolding an, die sich an den Phasen eines allgemeinen Lernprozesses orientiert. Er formuliert Fragen und Impulse, die die Schülerinnen und Schüler in einer expliziten Phase des Lernprozesses (Lernprozess planen, anregen, ausführen, bewerten, reflektieren) unterstützen sollen. Um eine geeignete Hilfestellung auszuwählen, ist daher eine vorherige Diagnose der Phase des Lernprozesses notwendig, in der sich die Lernenden aktuell befinden. Dem gegenüber steht die Orientierung an der Kompetenz der Lernenden. De Jong und Lazonder (2014) klassifizieren Hilfestellungen zur Unterstützung von entdeckenden Lernprozessen nach ihrer Spezifität. Mit dieser Taxonomie soll die Auswahl einer adaptiven Hilfe anhand von Informationen über das Wissen und die Fähigkeiten der Lernenden möglich sein. Die Spezifität der Hilfestellungen nimmt mit steigender Nummerierung zu (De Jong & Lazonder, 2014): 1. Process constraints (Prozesseinschränkungen) Die Komplexität des entdeckenden Lernprozesses wird verringert, indem die Anzahl möglicher Optionen, die die Lernenden mit einbeziehen müssen, reduziert wird. Ein Beispiel ist die Einteilung der Aufgabenstellung in handhabbare Teilaufgaben. 2. Performance Dashboard (Verschaffen eines Überblicks) Die Hilfe gibt den Lernenden einen Überblick über den eigenen Arbeitsprozess und dessen Qualität. Es wird thematisiert, was gearbeitet wurde und inwiefern dies zur Lösung der Aufgabe beiträgt. Diese Hilfe bedingt die Fähigkeit der Lernenden, mit dieser Information weiterarbeiten zu können. 3. Prompts (Aufforderungen) Es werden zeitlich passende Hinweise gegeben, die den Lernenden daran erinnern, eine bestimmte Handlung durchzuführen. Es wird vermittelt, was zu tun ist, jedoch nicht wie es zu tun ist. Diese Hilfe bedingt, dass die Lernenden dazu in der Lage sind, die Handlung durchzuführen. 4. Heuristics (Heuristiken) Im Vergleich zu Prompts wird sowohl der Hinweis gegeben, dass eine Handlung durchzuführen ist als auch wie diese durchzuführen ist. Diese Hilfestellung kommt zum Einsatz, wenn die Lernenden nicht wissen, wann und wie eine Handlung im Prozess anzuwenden ist. 5. Scaffolds (vgl. Abschnitt 3.3.2) Scaffolds strukturieren den Lösungsprozess, indem alle für die Lösung der Aufgabe notwendigen Komponenten bereitgestellt werden. Diese Art der Hilfe
3.3 Interventionskonzepte
81
kommt zum Einsatz, wenn die Lernenden den Lösungsprozess nicht eigenständig bewältigen können oder er zu kompliziert für die Lernenden ist. 6. Direct Presentation of Information (Erklärungen) Die Hilfestellung besteht aus einer direkten inhaltlichen Instruktion. Die Hilfestellung ist sinnvoll, falls Lernende ein mangelndes Vorwissen haben oder nicht in der Lage sind, sich Informationen selbst zu beschaffen. Die Reihung der Hilfestellungen ist konsequent an den Fähigkeiten der Lernenden ausgerichtet. Sind Schülerinnen und Schüler in der Lage ihren Lernprozess selbst zu steuern, können Hilfestellungen geringerer Spezifität eingesetzt werden. Geringe Kompetenzen im selbstständigen Durchführen des Lösungsprozesses erfordern Hilfen hoher Spezifität. Die Klassifikation nach de Jong und Lazonder (2014) erstreckt sich in Bezug auf die Taxonomie nach Zech (1996) von allgemeinstrategischen Hilfen bis hin zu inhaltlichen Hilfestellungen. Sie kann als eine weitere Ausdifferenzierung dieser drei Stufen verstanden werden. Zusammenfassend wird festgehalten, dass das Prinzip der minimalen Hilfe eine Grundlage für die Unterstützung selbstständigkeitsorientierter Lösungsprozesse bildet, da den Lernenden ein größtmöglicher Anteil am Lösungsprozess eingeräumt wird. Das gestufte Intervenieren trägt diesem Anspruch insofern Rechnung, als dass zunächst Hilfestellungen niedrigster Stärke bzw. Spezifität verwendet werden, um den Lösungsprozess voranzutreiben. Dazu wird eine subjektive Einschätzung des Arbeitsprozesses (Dubs, 2009) und der Leistungsfähigkeit der Lernenden (De Jong & Lazonder, 2014; Zech, 1996) vorgenommen. Sollte die Hilfestellung nicht den gewünschten Erfolg bringen, werden Hilfen größerer Stärke bzw. Spezifität verwendet. Zech (1996, S. 315 ff.) und Dubs (2009, S. 94 f.) geben potentiell geeignete Sprechakte an, die den jeweiligen Taxonomien folgen. Bei der Betrachtung des Konzepts gestuften Intervenierens ist eine Diagnostik des Leistungsniveaus des Lernenden notwendig, um einen geeigneten »Einstieg« in die Taxonomie der Hilfestellungen zu finden. Demnach muss eine Anpassung der Hilfestellung in Bezug auf den Lernenden stattfinden, wie es auch im Scaffolding-Konzept gefordert wird (contingency; Van de Pol et al., 2010). Leiss (2007) entwickelte ein Interventionskonzept, das die Adaptivität der Intervention in den Mittelpunkt stellt. Darüber hinaus entwickelte er in seiner „Theorie allgemeiner Lehrerinterventionen“ (Leiss, 2007, S. 77) ein Prozessmodell, das wesentliche Merkmale adaptiver Interventionen beschreibt.
82
3
3.3.4
Interventionen in kooperativen Modellierungsprozessen
Adaptives Intervenieren
Das wesentliche Merkmal dieses Interventionskonzepts bildet die Adaptivität der Intervention. Im Allgemeinen bezeichnet der Begriff der Adaptivität ein System, welches sich selbstständig oder durch externe Einflüsse an sich verändernde Bedingungen, wie z. B. die Entwicklung eines Individuums vom Novizen zum Experten, anpassen kann (Leutner, 2002). Auf Basis seiner Forschungsergebnisse erweitert Leiss (2007) die Definition des Interventionsbegriffs (vgl. Abschnitt 3.3) und beschreibt adaptive Interventionen wie folgt:
„Eine adaptive Lehrerintervention stellt auf der Grundlage von Wissen und/oder einer Diagnose der Lehrperson einen inhaltlich und methodisch angepassten minimalen Eingriff in den individuellen Lösungsprozess des Schülers dar, wodurch dieser befähigt wird, eine (potentielle) Barriere im Lösungsprozess zu überbrücken und selbstständig weiterzuarbeiten.“ (Leiss, 2007, S. 82)
Nach dieser Definition zeichnen sich adaptive Interventionen im Wesentlichen durch fünf Merkmale aus. Eine adaptive Intervention … 1. basiert auf Wissen und/oder einer Diagnose. Um eine geeignete Intervention auswählen zu können, muss die Lehrkraft über genügend Informationen über das Kompetenzniveau der Lernenden und ihre Schwierigkeit in der konkreten Situation des Lösungsprozesses besitzen. 2. ist inhaltlich und methodisch an das Kompetenzniveau und den individuellen Lösungsprozess der Lernenden angepasst. Dadurch wird sichergestellt, dass der Arbeitsprozess der Schülerinnen und Schüler optimal unterstützt wird. Ebenso wird eine Lenkung des Arbeitsprozesses in Richtung favorisierter Lösungsvarianten der Lehrkraft (Leiss, 2007, S. 281) vermieden. 3. ist minimal. Dieses im Sinne von Aeblis (1983) Prinzip der minimalen Hilfe zu verstehende Merkmal sorgt für einen möglichst großen Anteil der Lernenden am Lösungsprozess. 4. ist selbstständigkeitserhaltend. Die Lernenden sollen entsprechend ihrer Möglichkeiten Verantwortung für ihren eigenen Lernprozess übernehmen (vgl. transfer of responsibility; Van de Pol et al., 2010). Dementsprechend ist der höchste Grad an Selbstständigkeit zu erhalten, bei dem die Lernenden produktiv arbeiten können. Zusätzlich sollen die Lernenden durch die Intervention kognitiv aktiviert (Krammer, 2009, S. 134) werden.
3.3 Interventionskonzepte
83
5. hat eine positive Wirkung auf den Lernprozess. Diese positive Wirkung zeichnet sich dadurch aus, dass die Lernenden eine Schwierigkeit im Lösungsprozess überwunden haben und selbstständig weiterarbeiten. Zur Beschreibung adaptiver Interventionen entwickelte Leiss (2007) ein Prozessmodell (vgl. Abbildung 3.3), das den oben beschriebenen Merkmalen Rechnung trägt. In einem idealtypischen Interventionsprozess unterscheidet er die Aspekte Erkenntnisgrundlage, Ebene und Eigenschaften einer Intervention. Die Erkenntnisgrundlage einer Intervention beinhaltet das Wissen über sowie eine Diagnose der Problemsituation. Die Lehrkraft muss über ein ausreichendes Situationswissen (vgl. bspw. Leiss, 2007, S. 78) verfügen. Es umfasst … • schülerbezogene Aspekte, bspw. das Wissen über die Leistungsfähigkeit der Lernenden, ihr Vorwissen und den aktuellen Stand der Bearbeitung, • die Lernumgebung betreffende Aspekte, bspw. das Wissen über die verbleibende Bearbeitungszeit, das benötigte Vorwissen zur Lösung der Aufgabe sowie den Schwierigkeitsgrad und mögliche Lösungswege der Aufgabe, • interventionsbezogene Aspekte, bspw. ob die Intervention durch den Lernenden (responsiv) oder den Lehrenden (invasiv) verursacht wurde und welche Interventionen bereits im Vorfeld durchgeführt wurden.
Abbildung 3.3 Prozessmodell adaptiver Interventionen nach Leiss (2007, S. 82)
Darüber hinaus ist ein Problemwissen (vgl. bspw. Leiss, 2007, S. 78) notwendig, das in der konkreten Situation durch die Lehrkraft erworben werden muss oder durch vorherige Beobachtungen bereits erworben wurde. Da die Lehrkraft im Unterricht
84
3
Interventionen in kooperativen Modellierungsprozessen
nicht alle Gruppenarbeitsprozesse gleichzeitig beobachten kann, muss sie sich dieses Wissen häufig durch eine Diagnostik der Schwierigkeit erst beschaffen. Die Lehrkraft muss feststellen, … • um welche Art von Schwierigkeit es sich handelt. Die Ursache der Schwierigkeit kann aufgabenbezogen sein (bspw. kognitive oder metakognitive Schwierigkeiten), mit der Lernumgebung in Zusammenhang stehen (bspw. unverständlicher Aufgabentext) oder seine Ursache in affektiven (bspw. geringe Motivation) sowie sozialen Merkmalen (bspw. gestörte Kommunikation) des Lernenden haben (vgl. Leiss, 2007, S. 78). • ob sich die aufgabenbezogene Schwierigkeit in einem theoretischen Modell des Lösungsprozesses verorten lässt (vgl. Leiss, 2007, S. 78). In mathematischen Modellierungsprozessen stellt der Modellierungskreislauf nach Blum & Leiss (2006) ein geeignetes Diagnosewerkzeug dar (vgl. Abschnitt 2.4.1). Alle geschilderten Wissensfacetten spielen für die Auswahl der Intervention eine Rolle. Leiss (2007, S. 78) betont, dass „Erkenntnisse über eine Problemsituation [müssen] jedoch nicht zwangsläufig zu einem Eingriff in den Lösungsprozess durch die Lehrperson führen“ müssen. Durch ein bewusstes Nicht-Intervenieren kann die Lehrkraft den Lernenden die Möglichkeit geben, die Schwierigkeit eventuell selbst zu überwinden. Hier ist jedoch eine weitere Diagnostik des Lösungsprozesses notwendig, um das Scheitern des Lösungsprozesses und affektive Schwierigkeiten abzuwenden (Leiss, 2007, S. 78). Nach dem Erwerb des Situations- und Problemwissens wählt die Lehrkraft eine Intervention aus einer von vier Ebenen, die jedoch im Vergleich zu den dargestellten Taxonomien (De Jong & Lazonder, 2014; Dubs, 2009; Zech, 1996) keine Hierarchie aufweisen. Leiss (2007, S. 79) führt aus, dass es sich bei der Ebene um das zentrale Charakteristikum der Intervention handelt, da viele Autoren sich in ihren Arbeiten nur auf diese beziehen. Bei der Umsetzung einer Intervention müssen diese Ebenen jeweils fach- und problemspezifisch konkretisiert werden (Leiss & Tropper, 2014, S. 19). Zur Illustration wird in der vorliegenden Arbeit zu jeder Ebene nach Leiss (2007, S. 78) exemplarisch ein Sprechakt angegeben, ohne sich auf einen konkreten Kontext zu beziehen. • Organisatorische Interventionen beziehen sich auf die Organisation und den Ablauf des Bearbeitungsprozesses. In selbstständigkeitsorientierten Gruppenarbeiten bildet ein gut organisierter und reibungsloser Ablauf eine Voraussetzung für einen gelingenden Unterricht. Bsp.: „Behaltet die Zeit im Auge!“
3.3 Interventionskonzepte
85
• Affektive Interventionen zielen auf emotionale Aspekte der Lernenden ab, die als Determinanten guter Lernleistungen angesehen werden. Die Lehrkraft beeinflusst die Lernenden extrinsisch bspw. durch positive oder negative Impulse. Bsp.: „Ihr schafft das!“ • Strategische Interventionen vermitteln metakognitive (Lern-)Strategien. Dazu zählen beispielsweise Strategien zur Steuerung der Informationsaufnahme oder der Aufmerksamkeit. Bsp.: „Lest euch die Aufgabenstellung noch einmal genau durch!“ • Inhaltliche Interventionen geben Informationen zu spezifischen Begriffen, Regeln oder Verfahren, die mit der Aufgabe in Zusammenhang stehen. Hierzu zählen auch Informationen, die den Kontext der Aufgabe betreffen. Bsp.: „Ein Auto verbraucht durchschnittlich 7 l/km.“ Auch Leiss (2007, S. 80) spricht die Problematik affektiver Interventionen an (vgl. Abschnitt 3.3.3). Er betont die komplexe Wechselwirkung zwischen der Impulsart und Wirkung auf die Lernenden. So besteht bspw. die Gefahr, dass die Intervention entgegen der Intention der Lehrkraft als kontrollierend empfunden wird und dadurch zu einer Verringerung der Motivation führt. Bei den strategischen Interventionen sieht Leiss (2007, S. 80) das Potential für ein Fading, wenn den Schülerinnen und Schülern auf einer Meta-Ebene verdeutlicht wird, welche Strategien zum Erfolg geführt haben. Dies könnte zukünftig dazu führen, dass die Lernenden ein Problem zum selben Sachverhalt eigenständiger lösen können. Darüber hinaus erhalten strategische Interventionen durch ihren geringen inhaltlichen Bezug die Selbstständigkeit der Lernenden. Dies muss nicht zwangsläufig bedeuten, dass inhaltliche Interventionen die Selbstständigkeit der Lernenden immer einschränken, obwohl von dieser Art der Intervention diesbezüglich eine Gefahr ausgeht. Kleinschrittige Interventionen bezogen auf den nächsten Lösungsschritt führen erfahrungsgemäß zu weiteren responsiven Interventionen der Lehrkraft. Bei inhaltlichen Interventionen sollte die Lehrkraft auf einen hohen Problembezug achten, da diese ansonsten wenig wirksam sind (Leiss, 2007, S. 80). Das Interventionsrepertoire der Lehrkraft besteht aus Hilfestellungen dieser vier Ebenen. Zusätzlich zeichnen sich Interventionen durch verschiedene Eigenschaften aus. Leiss (2007, S. 81) gibt einen Überblick über in der Literatur identifizierte Charakterisierungsmöglichkeiten: • Formale Äußerungsabsicht (Aussage, Frage, Aufforderung), • Prozessbezogene Äußerungsabsicht (z. B. Diagnose, Bewertung, Hinweis), • Länge (ein Wort vs. mini-lesson),
86
• • • • •
3
Interventionen in kooperativen Modellierungsprozessen
Dauer (kurze vs. längere Eingriffe), Bezugsebene (z. B. problembezogen, beispielbezogen, allgemein), Repräsentationsform (z. B. verbal, ikonisch, gestisch, materiell), Adressat (z. B. Einzelperson, Gruppe, Klasse), Häufigkeit (ein oder mehrere Interventionsimpulse).
Leiss (2007, S. 82) kommt zu dem Schluss, dass es keine Hinweise auf eindeutig wirksame Eigenschaften einer Intervention gibt. Dies gilt auch für die Ebenen einer Intervention. Die Aspekte Erkenntnisgrundlage, Ebene und Eigenschaft einer Intervention beschreiben in der angegebenen Reihenfolge den idealtypischen Verlauf einer adaptiven Intervention (vgl. Abbildung 3.3). Dieser mündet idealerweise in einer selbstständigen Fortführung des Arbeitsprozesses der Lernenden. Zusammenfassend wird festgehalten, dass adaptive Interventionen nach Leiss (2007) auf einer Diagnose beruhen, inhaltlich und methodisch angepasst, minimal und selbstständigkeitserhaltend sind sowie sich durch eine positive Wirkung auf den Lösungsprozess auszeichnen. Ein idealtypischer Interventionsprozess lässt sich durch die Aspekte Erkenntnisgrundlage, Ebene und Eigenschaften einer Intervention charakterisieren. Die Erkenntnisgrundlage bildet den diagnostischen Teil des Interventionsprozesses, in dem ein Situations- und Problemwissen erworben wird. Die Ebene als zentrales Merkmal der Intervention und die Eigenschaften bilden den interventionsbezogenen Teil des Prozessmodells. Interventionen können organisatorischer, affektiver, strategischer und inhaltlicher Natur sein. Ergänzend dazu lassen sie sich durch verschiedene Eigenschaften charakterisieren. Es wird ersichtlich, dass eine Lehrkraft sowohl über eine Diagnose- als auch Interventionskompetenz verfügen muss. Dabei muss sie ein breites Repertoire an Unterstützungsmaßnahmen zur Hand haben, um in jeder Situation mit einer geeigneten Hilfestellung reagieren zu können (Leiss, 2007).
3.4
Zwischenfazit
Sowohl die Modellierungsprozesse der Lernenden als auch die Interventionen der Lehrkraft werden in dieser Arbeit unter einem sozio-konstruktivistischen Lehr-Lern-Verständnis aufgefasst. Der Lernprozess wird als eine individuelle Konstruktion von Wissen verstanden, die möglichst selbstgesteuert ist und sich im Rahmen eines sozialen Austauschs mit anderen Lernenden vollzieht (De Corte, 1995). Lernen findet damit zunächst auf einer sozialen und anschließend auf einer
3.4 Zwischenfazit
87
individuellen Ebene statt (Weinert, 1996b). Beim Modellieren findet Lernen aufgrund der Eigenschaften von Modellierungsaufgaben (Realitätsbezug, Relevanz, Authentizität; vgl. Abschnitt 2.2) in bedeutungsvollen Kontexten statt. Die Lehrkraft unterstützt die Lernenden, sodass diese sich in der Zone der nächsten Entwicklung (Vygotsky, 1978) befinden und Ziele erreichen, die sie im alleinigen sozialen Austausch mit Peers nicht erreichen können. Auch im Rahmen eines sozio-konstruktivistischen Lehr-Lern-Verständnisses ist eine Unterstützung durch die Lehrkraft, eines „more capable peer“ (Vygotsky, 1978, S. 86), notwendig, um der Ausbildung von Fehlvorstellungen vorzubeugen (Weinert, 1996a). Dabei ist ein Mittelweg zwischen der direkten Anleitung und dem komplett eigenständigen Arbeiten der Lernenden zu finden (Leiss, 2010). Um einen sozialen Austausch zu ermöglichen, arbeiten die Lernenden bei der Bearbeitung von Modellierungsaufgaben kooperativ zusammen. Das kooperative Lernen findet in dieser Arbeit in Gruppen von mindestens drei bis maximal fünf Lernenden statt. Sowohl das kooperative Lernen an sich (Johnson et al., 2000) als auch das kooperative Lösen von Modellierungsaufgaben (Clohessy & Johnson, 2017; Ikeda & Stephens, 2001) wurden jeweils empirisch positiv evaluiert. Aus theoretischer als auch aus empirischer Perspektive ist die Gruppenarbeit eine geeignete Sozialform für die Bearbeitung von Modellierungsaufgaben. Die Lehrkraft hat die Aufgabe, die Durchführung des selbstregulierenden und kooperativen Lernprozesses zu überwachen und adaptiv einzugreifen. Eine Zusammenfassung der zu überwachenden Merkmale eines selbstregulierenden und kooperativen Lernprozesses ist in Tabelle 3.1 dargestellt.
Tabelle 3.1 Merkmale des selbstregulierenden und kooperativen Lernprozesses Anforderungen an die Selbstregulation (Boekaerts, 1999)
Anforderungen an die Kooperation (Johnson & Johnson, 1999)
Regulation des Selbst (Auswahl von Zielen und eigener Ressourcen)
Positive Interdependenz
Regulation des Lernprozesses (Metakognition)
Kommunikation
Regulation des Bearbeitungsmodus (Auswahl kognitiver Strategien)
Soziale Fähigkeiten
Individuelle Verantwortung
Metakognitive und reflexive Tätigkeiten
Die effizienten und flexiblen Handlungen der Lehrkraft in kooperativen Modellierungsprozessen werden aufgrund der häufigen Verwendung des Adaptivitätsbegriffs in der Literatur als adaptive Interventionen (Leiss, 2007) bezeichnet. Der
88
3
Interventionen in kooperativen Modellierungsprozessen
Begriff der Intervention wird dabei vom Begriff der Instruktion explizit abgegrenzt. Eine Intervention stellt in dieser Arbeit auf der unterrichtlichen Mikroebene einen konkreten Eingriff in den Modellierungsprozess der Lernenden dar. Unter einer Instruktion oder einem Instruktionsverfahren wird eine Handlung oder Maßnahme, die „Bedingungen, Prozesse und Ergebnisse“ (Weinert, 1996b, S. 37 f.) einer Unterrichtsstunde oder einer Reihe von Unterrichtsstunden auf der Makroebene beeinflusst, verstanden. Verschiedene Interventionskonzepte charakterisieren das Wann? und Wie? effizienter und flexibler Handlungen der Lehrkraft. Für die Betreuung der selbstständigkeitsorientierten und kooperativen Bearbeitung von Modellierungsaufgaben werden in dieser Arbeit die Konzepte des Scaffolding (Tharp & Gallimore, 1988; Van de Pol et al., 2010, 2012), des gestuften (De Jong & Lazonder, 2014; Dubs, 2009; Zech, 1996) und adaptiven (Leiss, 2007) Intervenierens als geeignet angesehen. Da das Tutoring in erster Linie eine zeiteffiziente Eins-zu-Eins Interaktion darstellt, in der die Lehrperson die Lösung teilweise in Kooperation mit dem Lernenden erarbeitet, widerspricht dieses Konzept den Merkmalen des selbstregulierenden und kooperativen Arbeitens (vgl. Abschnitt 3.1.2 und 3.1.3). Aus diesem Grund ist das Tutoring Konzept im Rahmen dieser Arbeit als weniger geeignet anzusehen. In Tabelle 3.2 werden die Merkmale adäquater Interventionen der drei als geeignet angesehenen Konzepte idealtypisch gegenübergestellt. Es wurden jeweils die Merkmale eingetragen, die durch die verschiedenen Autoren bei der Charakterisierung des Konzepts hervorgehoben werden. Tabelle 3.2 Merkmale der Konzepte Scaffolding, gestuftes und adaptives Intervenieren Scaffolding (Smit et al., 2013; Van de Pol et al., 2010)
Gestuftes Intervenieren (Aebli, 1983; Zech, 1996)
Adaptives Intervenieren (Leiss, 2007)
diagnosis
(diagnosebasiert)
diagnosebasiert
contingency
fading, transfer of responsibility
inhaltich-methodisch angepasst minimal
minimal
selbstständigkeitsorientiert
selbstständigkeitsorientiert positive Wirkung
Anmerkung. Der Begriff in Klammern wird in diesem Konzept nicht explizit genannt, aber implizit miteinbezogen.
3.4 Zwischenfazit
89
Es ist erkennbar, dass die Merkmale des Konzepts des adaptiven Intervenierens (Leiss, 2007) die Merkmale der übrigen beiden Konzepte nahezu vollständig umfasst. Das Scaffolding Konzept beschreibt durch die Merkmale fading und transfer of responsibility ergänzend einen längerfristigen Unterstützungsprozess (Stender, 2016, S. 92 f.). Da diese Arbeit die kurzfristige Wirkung von Interventionen in Modellierungsprozessen auf der unterrichtlichen Mikroebene fokussiert, werden die Merkmale adaptiver Interventionen als Grundlage für die weiteren Überlegungen verwendet. Zudem wurde dieses Konzept anhand der Untersuchung von mathematischen Modellierungsprozessen entwickelt (Leiss, 2007). Die Merkmale adaptiver Interventionen werden daher in dieser Arbeit zur Bewertung von Interventionen herangezogen. Ein Interventionskonzept muss klären, wann und wie in den Lösungsprozess eingegriffen werden darf. Die drei Interventionskonzepte rechtfertigen nach einer genauen Diagnostik eine Intervention, wenn absehbar ist, dass eine Schwierigkeit vorliegt, die die Lernenden ohne die Hilfe der Lehrkraft im diagnostizierten situativen Rahmen nicht überwinden können. Aus der Literatur wurden zwei Prozessmodelle für Interventionen in unterrichtlichen Mikroprozessen identifiziert. Van de Pol et al. (2012) beschrieben anhand ihres Modells einen idealtypischen Interventionsprozess, wobei das Modell als metakognitives Hilfsmittel für Lehrkräfte eingesetzt wurde. Leiss (2007) verwendet sein deutlich detaillierteres Prozessmodell und zugehörige Kategoriensysteme zur Beschreibung von Interventionsprozessen. Beide Modelle beinhalten einen diagnostischen und einen interventionsbezogenen Teil. Ein Konstrukt, das die adaptive Interventionskompetenz einer Lehrkraft beschreibt, besteht daher aus einem diagnostischen und interventionsbezogenen Teil. Obwohl Merkmale adäquater Interventionen theoretisch abgeleitet wurden, ist für das Intervenieren die Frage nach dem Wie? noch nicht vollständig geklärt. In der Literatur werden Vorschläge für verschiedene Arten von Interventionen (Tharp & Gallimore, 1988), für Interventionen verschiedener Stärke (Zech, 1996) oder Spezifität (De Jong & Lazonder, 2014), für verschiedene Phasen des Arbeitsprozesses (Dubs, 2009) sowie für Interventionen auf verschiedenen Ebenen (Leiss, 2007) unterbreitet. Aufgrund der Vielzahl und Unterschiedlichkeit dieser Klassifikationssysteme ist eine Zusammenfassung in einer gemeinsamen Systematik nicht möglich. Vielmehr stellt die Gesamtheit der Klassifikationssysteme ein Interventionsrepertoire dar, aus dem – basierend auf dem Ergebnis der vorherigen Diagnostik – eine adaptive Intervention ausgewählt werden muss.
4
Empirische Befunde zu Interventionen
Da die Frage nach dem Wie? der Intervention noch nicht vollständig geklärt ist, werden in diesem Kapitel ausgewählte empirische Studienergebnisse zu verschiedenen Instruktionen und Interventionen dargestellt. Es wurden bevorzugt die Studien ausgewählt, deren Qualität und Reichweite anhand der dargestellten Forschungsmethodik beurteilt werden konnte und die für die vorliegende Arbeit relevant sind. Die Studien geben in einem ersten deskriptiven Teil Einblicke in Problemfelder von Interventionen in kooperativen Bearbeitungsprozessen (vgl. Abschnitt 4.1). In einem zweiten Teil werden Wirksamkeitsstudien berichtet, die hinsichtlich ihrer Aussagekraft in Bezug auf komplette Instruktionsverfahren oder in Bezug auf einzelne Interventionen strukturiert sind (vgl. Abschnitt 4.2). In einem dritten Teil werden Studien zur Förderung eines adaptiven Interventionsverhaltens von (angehenden) Lehrkräften berichtet (vgl. Abschnitt 4.3).
4.1
Ausgewählte deskriptive Befunde
Verschiedene deskriptive Studien liefern ein Bild der Praxis von Interventionen in kooperativen Modellierungsprozessen. Diese Studien orientieren sich durchweg am qualitativen Forschungsparadigma, wobei die Ergebnisse häufig anhand von quantitativen Auswertungsmethoden ergänzt werden. Im Folgenden werden ausgewählte nationale und internationale Studien angerissen, um einen Überblick über Problemfelder im Bereich von Interventionen in Gruppenarbeitsprozessen zu geben. Es wurden auf der einen Seite Studien ausgewählt, in denen kooperative Bearbeitungsprozesse im Fach Mathematik aber auch in anderen Fächern untersucht wurden (vgl.
© Der/die Herausgeber bzw. der/die Autor(en), exklusiv lizenziert durch Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2020 H. Klock, Adaptive Interventionskompetenz in mathematischen Modellierungsprozessen, Studien zur theoretischen und empirischen Forschung in der Mathematikdidaktik, https://doi.org/10.1007/978-3-658-31432-3_4
91
92
4
Empirische Befunde zu Interventionen
Abschnitt 4.1.1). Auf der anderen Seite werden anschließend im Sinne einer sukzessiven Fokussierung Studien vorgestellt, in der Interventionen in mathematischen Modellierungsprozessen deskriptiv erfasst wurden (vgl. Abschnitt 4.1.2).
4.1.1
Deskriptive Befunde für kooperative Bearbeitungsprozesse
Die erste vorgestellte Studie (Fürst, 1999) analysiert kooperative Bearbeitungsprozesse in verschiedenen Fächern. Die folgenden zwei Studien (Krammer, 2009; Webb et al., 2006) wurden im Mathematikunterricht durchgeführt. Merkmale von Interventionen im Gruppenunterricht (Fürst, 1999) Fürst (1999) analysierte insgesamt 111 Interventionen aus 40 Gruppenunterrichtssequenzen, die in der fünften und sechsten Jahrgangsstufe an Hauptschulen im nordbayrischen Raum in verschiedenen Fächern erhoben wurden. Insgesamt waren zehn Lehrkräfte beteiligt. Er nahm eine Typisierung entlang der Merkmale invasiv, responsiv und dem Adressaten der Intervention (einzelne Gruppe/Plenum) vor, wobei an dieser Stelle nur die an Gruppen adressierten Interventionen von Interesse sind. Ergänzend wurden die Intentionen der Lehrkraft erfasst und hinsichtlich der Merkmale Orientierung, Aufgabenbezug, Umgangsqualität und Lenkung auf einer fünfstufigen Likert-Skala eingeschätzt. In Tabelle 4.1 werden diese Kategorien erläutert. Die untersuchten Lehrkräfte intervenierten mit durchschnittlich M = 2,8 Interventionen pro Gruppenarbeit relativ häufig. Ca. 70 % der Interventionen sind invasiv, 25 % responsiv. Als erfahren klassifizierte Lehrkräfte intervenierten sehr häufig invasiv (79 %). Dabei dauerte ein Großteil der Interventionen nur wenige Sekunden. 74 % der Eingriffe sind kürzer als 30 Sekunden, über eine Minute dauerten nur 6,3 % der Interventionen. Teilweise bestehen jedoch erhebliche Unterschiede zwischen den Eigenschaften einzelner Interventionen. Die Lehrkräfte unterscheiden sich stark hinsichtlich ihres Interventionsverhaltens (Fürst, 1999).
4.1 Ausgewählte deskriptive Befunde
93
Tabelle 4.1 Kategoriensystem für Interventionen nach Fürst (1999, S. 129 ff.) Niedrige Orientierung
Hohe Orientierung
Die Lehrkraft informiert sich vor der Intervention nicht über das Gruppengeschehen, -gespräch bzw. die Gruppenarbeit.
Die Lehrkraft informiert sich vor der Intervention über das Gruppengeschehen, -gespräch bzw. die Gruppenarbeit.
Niedriger Aufgabenbezug
Hoher Aufgabenbezug
Die Lehrkraft geht nicht auf die Gedanken, Anliegen und Probleme der Lernenden ein, versteht den Intragruppenprozess nicht richtig und handelt nicht situationsgerecht.
Die Lehrkraft geht auf die Gedanken, Anliegen und Probleme der Lernenden ein und versteht den Intragruppenprozess richtig und handelt situationsgerecht.
Niedrige Umgangsqualität
Hohe Umgangsqualität
Die Intervention der Lehrkraft hat folgende Merkmale: geringschätzend, abwertend, entmutigend, grob, verächtlich, lieblos, verletzend, sozial-irreversibel.
Die Intervention der Lehrkraft hat folgende Merkmale: wertschätzend, anerkennend, ermutigend, freundlich, herzlich, tröstend, sozial-reversibel.
Geringe Lenkung
Hohe Lenkung
Die Lehrkraft ist ein gleichberechtigter Gesprächspartner, hält sich mit ihren Gedanken/Wünschen zurück, hat einen geringen Redeanteil und verwendet überwiegend reaktive Sprechakte.
Die Lehrkraft lenkt das Gespräch, rückt ihre Gedanken/Wünsche in den Vordergrund, hat einen hohen Redeanteil und verwendet überwiegend initiative und dirigierende Sprechakte.
Von den 49 gruppenadressierten und invasiven Interventionen informierte sich die Lehrkraft selten über den bisherigen Arbeitsstand der Gruppe (19 Interventionen), gab eine Handlungsanweisung (11 Interventionen), lenkte das Intragruppengeschehen durch Hilfsimpulse (9 Interventionen), korrigierte inhaltliche oder arbeitstechnische Fehler (8 Interventionen) und gab eine positive Rückmeldung (6 Interventionen). Alle weiteren Typen von Interventionen traten weniger als sechs Mal auf. Es wird ersichtlich, dass die Lehrkraft von sich aus häufig kontrollierend oder lenkend eingreift (Fürst, 1999). In den 28 gruppenadressierten und responsiven Interventionen erfragen die Lernenden, was oder wie eine Handlung ausgeführt werden soll (12 Interventionen), erbitten bei technischen oder inhaltlichen Problemen um Hilfe (11 Interventionen), berichten über die bisherige Gruppenarbeit (6 Interventionen) oder verlangen eine Bestätigung für ihre Arbeit (4 Interventionen). Elf Interventionen gehen auf Schwierigkeiten unterschiedlichster Art zurück, in denen die Hilfe einer Lehrkraft notwendig und sinnvoll ist. Die zuletzt genannten beiden, insgesamt zehn, Interventionen hängen mit einem Kontrollbedürfnis der Lernenden zusammen, die eine
94
4
Empirische Befunde zu Interventionen
Bestätigung für die Richtigkeit ihrer Arbeit erhalten möchten. Damit liegt sowohl auf Lehrer- als auch auf Schülerseite ein hohes Kontrollbedürfnis vor (Fürst, 1999). Das Merkmal Orientierung wurde in responsiven Interventionen signifikant höher eingeschätzt (M = 3.52; SD = 1.33; p < 0.01) als in invasiven Interventionen (M = 2.66; SD = 1.56). Ähnlich verhält es sich beim Merkmal Aufgabenbezug (responsiv: M = 3.57; SD = 1.14; invasiv: M = 2.84; SD = 1.16). Das arithmetische Mittel der Skala Umgangsqualität liegt im mittleren Bereich der Skala (M = 3.31; SD = 1.06), die Skala Lenkung weist den größten Mittelwert auf (M = 4.01; SD = 1.11). In den responsiven Interventionen fand eine signifikant kleinere Lenkung statt (M = 2.88; SD = 1.15; p < 0.01) als in invasiven Interventionen (M = 4.01; SD = 1.11; Fürst, 1999). Die Ergebnisse zeigen ein eindeutiges Bild: Ein Großteil der Interventionen gehen von den Lehrkräften aus, die „ständig partizipieren, kontrollieren und lenken“ (Fürst, 1999, S. 144) möchten. Insbesondere die invasiven Interventionen sind mit einem „hohe[s]n Kontroll- und Lenkungsbedürfnis der Lehrkräfte“ (Fürst, 1999, S. 145) und negativen Merkmalen, nämlich einer geringeren Orientierung, einem geringeren Aufgabenbezug und einer hohen Lenkung, verbunden. Die Lehrkräfte greifen in den Lösungsprozess ein, ohne sich über diesen im Vorfeld zu informieren. Grund ist häufig der eigene Anspruch an die Bearbeitung der Aufgabenstellung (Fürst, 1999). Die Skalen Orientierung, Aufgabenbezug und Lenkung können als ein Maß der Adaptivität der Interventionen interpretiert werden. Demnach illustrieren die Studienergebnisse bei invasiven Interventionen eine hohe Gefahr der Nicht-Adaptivität. Insbesondere wenn keine vorherige Diagnostik des Lösungsprozesses stattfindet, ist dies im Hinblick auf die Merkmale adaptiver Interventionen (vgl. Abschnitt 3.3.4) als problematisch anzusehen. Anspruchsniveau von Interventionen (Webb et al., 2006) Webb et al. (2006) untersuchten in den USA in sechs Klassen der siebten Jahrgangsstufe Lehrer-Schüler-Interaktionen anhand von Audioaufnahmen in insgesamt 21 Kleingruppen im Mathematikunterricht. Demnach intervenierten die Lehrpersonen in der Regel, um die Korrektheit der Lösung zu überprüfen oder bei Schwierigkeiten zu unterstützen. In mehr als der Hälfte der Interventionen stellten die Lehrkräfte prozessorientierte Hilfen bereit, indem sie die Gruppe anwiesen, einzelnen Lernenden zu helfen, ihre Lösungen zu vergleichen, ihren eigenen Fortschritt zu überprüfen oder auf administrative Sachverhalte hinzuweisen. In einem Drittel der Interventionen stellten die Lehrkräfte inhaltliche Hilfen bereit. In nur wenigen Interventionen bestätigten sie knapp die Richtigkeit der Lösung (Webb et al., 2006).
4.1 Ausgewählte deskriptive Befunde
95
Bei den inhaltlichen Interventionen wurden überwiegend Hilfen auf einem niedrigen Anspruchsniveau festgestellt. Dazu zählen einfache Antworten auf Schülerfragen und das Bereitstellen von Rechnungen und Prozeduren. Die Lehrpersonen traten an die Gruppen heran, um ihre Arbeit zu überprüfen und ihnen bei Fehlern die korrekte Lösung oder Prozeduren zu vermitteln, jedoch ohne die genaue Ursache des Problems im Vorfeld zu ermitteln. In den wenigen Fällen, in denen die Lehrperson die Schwierigkeit genau diagnostizierte, erklärte sie im Anschluss die korrekte Prozedur oder Rechnung (Webb et al., 2006). In vielen Interaktionen behielten die Lehrkräfte den Rezitationsstil bei, den sie auch im Klassenunterricht anwenden. Dabei lag die Verantwortung für das korrekte Lösen der Probleme bei der Lehrkraft, die die Lernenden häufig lediglich dazu anregte, Ergebnisse konkreter Rechnungen bereitzustellen oder Prozeduren durchzuführen. Selten forderten die Lehrkräfte Schülerinnen und Schüler dazu auf, ihren eigenen Lösungsweg zu erklären. Die Autoren vermuten daher, dass die Lehrkräfte es beabsichtigen, Fehler aufzudecken, die schnell korrigiert werden können, anstatt Verständnisprobleme offen zu legen und diese auszuräumen. Lehrerinnen und Lehrer nehmen demnach die Rolle eines aktiven Problemlösers und Bereitsteller von unreflektierten numerischen Verfahren ein, wohingegen die Lernenden als passive Rezipienten der Lehrerinstruktionen charakterisiert werden. Das durch die Lehrkraft kommunizierte Rollenverständnis von Lehrendem und Lernendem bestimmt die Qualität der Schülerdiskussion. Die Autoren halten fest, dass es schwierig zu sein scheint, diese Kultur der niedrigschwelligen Fragen und Erklärungen zu ändern (Webb et al., 2006). Daher sei bei der Lehreraus- und -fortbildung ein Fokus auf die instruktionale Praxis notwendig. Als Lösungsvorschlag geben die Autoren die Methode des reziproken Lehrens (Palinscar & Brown, 1984) an, bei der die Lehrperson Strategien vorführt oder bereitstellt, die Lernenden dazu auffordert, diese anzuwenden und Rückmeldungen zum Lösungsweg gibt. Lehrpersonen sollten trainiert werden, Lernende dazu aufzufordern, ihre Ideen zu begründen, zu reflektieren und Inkonsistenzen aufzudecken. Die Autoren erachten es ebenfalls als sinnvoll, die Lernenden an ihre Verpflichtungen in der Gruppenarbeit zu erinnern, wie das Einbeziehen aller Gruppenmitglieder, das Austauschen von Ideen, Ansätzen und Ergebnissen (Webb et al., 2006). Interventionen in der TIMSS 1999 Videostudie (Krammer, 2009) Krammer (2009) untersuchte in einer Stichprobe von 130 Unterrichtsstunden, die im Rahmen der TIMSS 1999 Videostudie erhoben wurden, in der 8. Klasse in der Schweiz 3635 Lehrer-Schüler Interaktionen in Schülerarbeitsphasen im Mathematikunterricht. In ca. einem Drittel der Unterrichtsstunden arbeiteten die
96
4
Empirische Befunde zu Interventionen
Schülerinnen und Schüler in Einzelarbeit, in den restlichen bestand die Möglichkeit der Kooperation. Das Datenmaterial wurde hinsichtlich des Umfangs (Zeit), des Inhalts (repetitive oder anspruchsvolle Übungsaufgaben) und der Qualität der Interventionen (potentiell kognitiv aktivierende Lernunterstützung) untersucht. Dabei wurde zwischen organisatorischen und mathematikbezogenen Interventionen unterschieden, die jeweils noch weiter differenziert werden. Unter organisatorische Interventionen fallen sowohl Hilfestellungen, die sich nicht auf die Aufgabe beziehen, als auch Eingriffe bezüglich des Materials oder der Arbeitsform. In Tabelle 4.2 werden die Kategorien dargestellt, wobei lediglich die mathematikbezogenen weiter differenziert werden. Tabelle 4.2 Kategorien individueller Lernunterstützungen nach Krammer (2009, S. 168) Organisatorische Interventionen
Organisatorische Bemerkungen, die sowohl in Zusammenhang als auch nicht im Zusammenhang mit der Bearbeitung der Aufgabe stehen
Mathematikbezogene Interventionen Evaluation des Lernfortschritts
Fragen, die auf das Erfassen des Schülerverständnisses abzielen
Feedback
Kurze Rückmeldung zur Richtigkeit der Schülerarbeit
Erklärung, direkt
Erklären oder Vorführen der Lösung zu einer gesamten Aufgabe oder einzelner Teilschritte (direkte Anweisung)
Hinweis, indirekt
Inhaltlicher und/oder strategischer Hinweis, der zum Weiterdenken anregt (indirekte Unterstützung, Anregung zur Schüleraktivität)
Erklärung und Hinweis
Sowohl Erklärung als auch weiterführender Hinweis
In der Gesamtstichprobe, die die Einzelarbeit und kooperative Sozialformen umfassen, wurden durchschnittlich M = 8.98 (SD = 7.45) organisatorische Interventionen pro Unterrichtsstunde festgestellt. Bei den mathematikbezogenen Interventionen dominiert das Feedback (M = 5.89, SD = 5.68) und die direkte Erklärung (M = 5.62, SD = 5.70). Indirekte Hinweise, zu denen auch strategische Interventionen zählen, werden durchschnittlich M = 4.22 Mal pro Unterrichtsstunde (SD = 2.52) eingesetzt. Die Mischform Erklärung und Hinweis wurde durchschnittlich M = 3.31 Mal pro Unterrichtsstunde kodiert. Interventionen zur Evaluation des Lernfortschritts, die diagnostische Aspekte beinhalten, finden durchschnittlich nur M = 3.52 Mal pro Unterrichtsstunde (SD = 2.81) statt (Krammer, 2009, S. 195). Die Anzahl der direkten Erklärungen und rückmeldenden Interventionen nehmen demnach einen großen Raum ein, sodass die Ergebnisse zu einem hohen
4.1 Ausgewählte deskriptive Befunde
97
Kontroll- und Lenkungsbedürfnis (Fürst, 1999) auch in der Schweiz scheinbar bestätigt werden. Die hohe Anzahl erklärender Interventionen nehmen auch einen hohen durchschnittlichen zeitlichen Anteil pro Unterrichtsstunde an den mathematikbezogenen Interventionen ein. Die hohe Anzahl organisatorischer Interventionen geht mit einem geringen zeitlichen Anteil an der Gesamtheit der Interventionen (M = 8.06 %, SD = 8.16 %) im Vergleich zu mathematikbezogenen Interventionen (M = 45.99 %, SD = 24.02 %) einher (Krammer, 2009, S. 198). Die Unterstützungsformen indirekter Hinweis sowie Erklärung und Hinweis werden in der Studie von Krammer (2009) als potentiell kognitive aktivierende und damit als qualitativ höherwertige Interventionen bezeichnet. Diese nehmen im Vergleich zu erklärenden Interventionen (M = 26.88 %, 23.68 %) zusammengefasst zeitlich und durchschnittlich ca. M = 48.87 % (SD = 28.38 %) der mathematikbezogenen Interventionen ein (Krammer, 2009, S. 201). Dieses Ergebnis scheint ein sehr positives Licht auf die schweizerischen Lehrkräfte zu werfen. Es ist jedoch unklar, inwieweit die Kategorie Hinweis und Erklärung eine Aussage zur kognitiven Aktivierung erlaubt. Zudem wurde anhand der Datenlage nicht ermittelt, inwieweit die Interventionen tatsächlich kognitiv aktivierend waren, was vermutlich auf die große Datenmenge zurückzuführen ist. Die Studie von Krammer (2009) hat aufgrund der großen und repräsentativen Stichprobe eine hohe Reichweite, liefert jedoch relativ wenige Informationen über die Qualität der Interventionen.
4.1.2
Deskriptive Befunde für kooperative Modellierungsprozesse
Aus der Literatur lassen sich zwei deskriptive Studien entnehmen, in denen kooperative Modellierungsprozesse analysiert wurden, die jedoch auf demselben Datenmaterial basieren. In der ersten Studie werden Informationen zur Ursache, Ebene (vgl. Abschnitt 3.3.4) und Absicht der Intervention berichtet (Leiss, 2007). In der zweiten Studie wurde ergänzend die Adaptivität der Interventionen beurteilt (Tropper et al., 2015). Leiss (2007) analysierte in seiner Studie das Interventionsverhalten von fünf Lehrkräften, die am SINUS-Modellversuch beteiligt waren. Es wurden demnach Probanden untersucht, die hinsichtlich der Umsetzung von Qualitätskriterien im Unterricht gut geschult sind (Baptist & Raab, 2007). Sie betreuten im Labor je zwei Schülerinnen und Schüler der neunten Klasse beim Bearbeiten der Modellierungsaufgabe »Tanken« (Blum & Leiss, 2005). In der Studie lag daher ein Fokus auf der Begleitung mathematischer Modellierungsprozesse. Leiss (2007) wertete die videographierten Laborsitzungen inhaltsanalytisch (Mayring, 2007) aus und ergänzte
98
4
Empirische Befunde zu Interventionen
die Kodierung anhand der Ergebnisse anschließender Stimulated Recall-Gespräche (Calderhead, 1981). Die Lehrkräfte wurden anhand der Unterrichtsvideos zum lauten Denken aufgefordert. Die Interventionen wurden anhand der Kategorien Ebene (organisatorisch, affektiv, strategisch, inhaltlich) und Ursache der Intervention (Fehler, Schwierigkeit, Erwartungen, …) sowie der Absicht der Lehrkraft (Diagnose, Feedback, Hilfestellung) kodiert. Die Adaptivität der Hilfestellungen wurde in der Studie von Tropper et al. (2015) anhand desselben Datenmaterials und der folgenden Kriterien eingeschätzt: • Die Intervention basiert auf der Diagnose einer potentiellen Schwierigkeit oder die Lehrkraft wurde von den Lernenden zu einer aufgetauchten Schwierigkeit befragt. • Die Intervention ermöglicht es den Lernenden ihren Arbeitsprozess selbstständig fortzusetzen, ohne dass ein weiteres Eingreifen notwendig ist. • Die Intervention ist selbstständigkeitserhaltend im Sinne, dass die Lernenden nicht fähig gewesen wären, ihren Arbeitsprozess selbständig weiterzuführen, falls die Lehrkraft nicht oder weniger direktiv interveniert hätte.
Ursache, Ebene und Absicht von Interventionen (Leiss, 2007; Tropper et al., 2015) Zwischen 24 % und 61 % der Interventionen hatten ihre Ursache in der Absicht der Lehrkraft, die eigenen Erwartungen an den Lösungsprozess durchzusetzen. Dabei lassen sich forcierende Ansprüche, um den Lösungsprozess voranzutreiben, kontrollierende Ansprüche, um sich über den Lösungsprozess zu informieren und inhaltliche Ansprüche zur Durchführung des Lösungsprozesses unterscheiden (Leiss, 2010). Hohe Anteile an der Gesamtzahl der Interventionen können auf Fragen der Schülerinnen und Schüler und dem Geben positiven Feedbacks zugeschrieben werden. Fehler oder Schwierigkeiten der Lernenden sowie organisatorische Belange waren nur selten die Ursache für eine Intervention (Tropper et al., 2015). Bezüglich der Ebene der Intervention ist mit 78 % bis 95 % eine klare Dominanz der inhaltlichen Hilfestellungen bei den Lehrkräften festzustellen. Organisatorische (M = 6 %), affektive (M = 6 %) und strategische (M = 2 %) Interventionen wurden kaum verwendet. Die inhaltlichen Interventionen bezogen sich zu 33 % auf das Bilden eines Realmodells, da hier die meisten Schwierigkeiten auftraten. 25 % der inhaltlichen Hilfen bezogen sich gegen Ende des Arbeitsprozesses auf das Validieren der Lösung (Tropper et al., 2015).
4.1 Ausgewählte deskriptive Befunde
99
In je 46 % der Interventionen hatte die Lehrkraft die Absicht Feedback oder einen Hinweis zu geben. Lediglich in 8 % der Fälle intervenierte die Lehrkraft, um zu diagnostizieren (Tropper et al., 2015). Aus den fünf Fallanalysen leitet Leiss (2007) durch die Analyse von Beziehungen zwischen den Kodierungen acht Hypothesen zum Interventionsverhalten von Lehrkräften ab, von denen sieben hier aufgeführt werden. Die achte Hypothese bezieht sich auf die Wirksamkeit von Interventionen (vgl. Abschnitt 4.2). Folgende zwei Hypothesen werden für das allgemeine Interventionsverhalten der Lehrkräfte formuliert: 1. „Die Lehrgewohnheit und der eigene Anspruch an den Lösungsprozess sind bei Lehrpersonen die zentralen Gründe, um in den Lernprozess einzugreifen.“ (Leiss, 2007, S. 273) Lehrkräfte intervenieren am häufigsten, um ihren eigenen formalen oder inhaltlichen Anspruch an die Lösung der Aufgabe darzulegen oder dahingehend zu unterstützen (Leiss, 2007, S. 273). 2. „Strategische Interventionen sind im Interventionsrepertoire der Lehrperson kaum vorhanden.“ (Leiss, 2007, S. 273) Bis auf einen Fall wurde keinerlei strategische Hilfestellungen im Interventionsverhalten der Lehrkräfte festgestellt (Leiss, 2007, S. 273). Vier weitere Hypothesen beziehen sich auf Interventionen bei spezifischen Intentionen der Lehrkräfte: 3. „Lehrer kommentieren Fortschritte im Lösungsprozess regelmäßig durch ein kurzes positives Feedback.“ (Leiss, 2007, S. 274) Die Intention, den Lernenden ein positives Feedback zu geben, scheint eine der zentralen Absichten darzustellen. Die meistens invasiven Eingriffe zeichnen sich durch eine permanente Kommentierung von Fortschritten aus (Leiss, 2007, S. 274). 4. „Organisatorische Absichten der Lehrperson werden den Schülern in Form von direkten Arbeitsanweisungen mitgeteilt.“ (Leiss, 2007, S. 274) Bei organisatorischen Absichten, wie dem Strukturieren des Lösungsprozesses, verwenden die Lehrkräfte wenig selbstständigkeitsorientierte Interventionen, indem sie direkte Arbeitsanweisungen für die Lernenden formulieren. Damit möchten sie für ein erleichtertes Weiterarbeiten auf Schülerseite sorgen, ohne dieses Ziel explizit zu kommunizieren (Leiss, 2007, S. 274). 5. „(Potentiellen) inhaltlichen Schwierigkeiten im Lösungsprozess wird i. A. mit Hilfestellungen auf derselben inhaltlichen Ebene begegnet.“ (Leiss, 2007, S. 275) Bis auf eine Laborsitzung geben die Lehrpersonen bei inhaltlichen Schwierigkeiten stets auch inhaltliche Hilfestellungen, die sich direkt auf das Problem der Lernenden beziehen (Leiss, 2007, S. 275).
100
4
Empirische Befunde zu Interventionen
6. „Lehrpersonen wenden bei konkreten inhaltlichen Schwierigkeiten i. A. als selbstständigkeitsorientierte Unterstützungsform „Indirekte Hinweise mit einschrittigem Problemschluss“ an.“ (Leiss, 2007, S. 275; Hervorhebung im Original) Am häufigsten wenden die Lehrpersonen bei inhaltlichen Schwierigkeiten eine Intervention an, bei der die Lernenden nur noch einen Schritt zur Überwindung des Problems selbst gehen müssen. Bei konkreten Fehlern handelt es sich häufig um rhetorische Fragen oder um Fragen, die die Lernenden selbst beantworten oder deren Antwort abschätzen können (Leiss, 2007, S. 275). Eine weitere Hypothese adressiert das Interventionsverhalten speziell bei Modellierungsaufgaben: 7. „Bei Modellierungsaufgaben wird die Validierung der Lösung von den Lehrpersonen als besonders wichtig erachtet.“ (Leiss, 2007, S. 275) Der Schwerpunkt der inhaltlichen Interventionen liegt auf der Validierung der Lösung. Teilweise regen die Lehrkräfte zu einer formal-oberflächlichen Reflexion des Lösungsprozesses an, teilweise regen sie inhaltlich-vertiefende Überlegungen zur Überarbeitung der gefundenen Lösung an (Leiss, 2007, S. 275). Das in der Studie von Fürst (1999) festgestellte hohe Kontroll- und Lenkungsbedürfnis scheint auch im Mathematikunterricht durch die von Leiss (2007) postulierten Hypothesen 1, 4, 5 und 6 bestätigt zu werden. Insbesondere die Steuerung des Lösungsprozesses durch die Lehrkraft in Richtung der eigens favorisierten Lösung wird als problematisch angesehen (Blum & Leiss, 2006; Tropper et al., 2015), da dies die Selbstständigkeit der Lernenden stark einschränkt. Der geringe Anteil expliziter Diagnosen trägt zur fehlenden Anpassung der Intervention an den Lösungsweg der Schülerinnen und Schüler bei und wird auch in der Studie von Krammer (2009) festgestellt. Diagnostizierten die Lehrpersonen die Schwierigkeit explizit, wendeten sie im Anschluss häufig direktive Interventionen an, um den Lösungsprozess zu steuern, obwohl dies in vielen Fällen nicht notwendig erscheint (Tropper et al., 2015). Adaptivität von Interventionen (Tropper et al., 2015) Anhand der drei oben beschriebenen Kriterien wurde die Adaptivität der insgesamt 111 Interventionen beurteilt. Lediglich 12 % bis 33 % der Interventionen der Lehrkräfte basierten auf einer Diagnose. Unter Hinzunahme der beiden weiteren Kriterien sind je nach Lehrkraft nur 0 % bis 29 % der Interventionen als adaptiv zu klassifizieren (Tropper et al., 2015). Unter Berücksichtigung, dass es sich bei den fünf Probanden um gut ausgebildete Lehrkräfte handelt, stellt dies
4.1 Ausgewählte deskriptive Befunde
101
ein überraschendes Resultat dar. Überwiegend werden nicht adaptive Interventionen verwendet. Es ist daher zu vermuten, dass adaptive Interventionen einen hohen Anspruch an Lehrerinnen und Lehrer stellen (Leiss, 2010). Dies erfordert es, Maßnahmen zur Förderung eines adaptiven Lehrerverhaltens zu identifizieren und in die Lehrerausbildung zu integrieren (Tropper et al., 2015). Zusammenfassend weisen die vorgestellten Studien auf ein mehr oder weniger gemeinsames Bild hin, das, da es sich um eine Auswahl von Studien handelt, sicher unvollständig ist. In den Labor- und Unterrichtsanalysen fiel ein hohes Kontroll- und Lenkungsbedürfnis der Lehrkräfte auf, dass sich durch eine große Zahl an invasiven Eingriffen in den Lösungsprozess auszeichnet (Fürst, 1999; Leiss, 2007). Invasive Eingriffe weisen dabei durchweg eine schlechtere Qualität auf (Fürst, 1999), da sie häufig sehr direktiv und auf einem geringen Anforderungsniveau durchgeführt werden (Fürst, 1999; Leiss, 2007; Webb et al., 2006). Dabei scheint vor allem der eigene Anspruch der Lehrkraft an die Art und Weise der Bearbeitung der Aufgabe für die invasiven Eingriffe verantwortlich zu sein. Strategische Interventionen scheinen im Repertoire der Lehrkräfte kaum vorhanden zu sein (Leiss, 2007). Stattdessen kommentiert die Lehrkraft fortlaufend den Fortschritt der Lernenden durch ein Feedback (Krammer, 2009; Leiss, 2007; Webb et al., 2006). Alle Studien illustrieren, dass Lehrkräfte in nur sehr wenigen Fällen Schwierigkeiten bei Schülerinnen und Schüler explizit diagnostizieren. Dies führt allzu häufig zu einer geringen Orientierung am Lösungsweg und den Schwierigkeiten der Lernenden (Fürst, 1999; Leiss, 2007). Somit erfüllt nur ein sehr geringer Anteil der untersuchten Interventionen die Ansprüche einer adaptiven Intervention (vgl. Abschnitt 3.3.4). Webb et al. (2006) vermuten, dass Lehrkräfte die aus dem Klassenunterricht gewohnten Verhaltensweisen (Initiation–Reply–Evaluation (Mehan, 1979)), die sich durch eine hohe Partizipation der Lehrkraft an der Arbeit der Lernenden auszeichnen, auch in der Gruppenarbeit anwenden. Daher müssen (angehende) Lehrkräfte hinsichtlich eines adäquaten Lehrerverhaltens in selbstständigkeitsorientierten Gruppenarbeitsprozessen und insbesondere in kooperativen Modellierungsprozessen sensibilisiert werden. Ein hoher Grad der Lenkung, kleinschrittige Interventionen mit einem niedrigen Anforderungsniveau und eine geringe Orientierung am Lösungsweg der Schülerinnen und Schüler sind nicht im Sinne eines am sozio-konstruktivistischen Lehr-Lern-Verständnis orientierten Gruppenarbeitsprozesses. Daher beschreiben die oben beschriebenen Studienergebnisse Problemfelder, die es in der Lehrerausbildung zu adressieren gilt (Webb et al., 2006). Die vorliegende Arbeit setzt zu diesem Zweck in der universitären Lehrerausbildung an.
102
4
Empirische Befunde zu Interventionen
4.2
Wirksamkeit von Instruktionen und Interventionen
Nachdem anhand der deskriptiven Befunde Problemfelder umrissen wurden, werden im Folgenden Studienergebnisse berichtet, die Hinweise für adäquate und wirksame Instruktionen und Interventionen liefern. Die Studien werden danach strukturiert, ob jeweils ein komplettes Instruktionsverfahren untersucht oder ob die Wirksamkeit einzelner Interventionen analysiert wurde (zur begrifflichen Unterscheidung vgl. Abschnitt 3.2). Diese Unterscheidung kann aufgrund der konzeptionellen Vielfalt der Studien nicht trennscharf vorgenommen werden, sodass diese idealtypisch den Kapiteln zugeordnet wurden.
4.2.1
Wirksamkeit von Instruktionen
In einem ersten Unterkapitel werden Studienergebnisse zu Instruktionen in verschiedenen Fächern dargestellt. Im Anschluss werden Studien erläutert, die jeweils zwei Instruktionsverfahren im Mathematikunterricht vergleichen. Das dritte Unterkapitel beinhaltet Studien, die in kooperativen Modellierungsprozessen durchgeführt wurden und daher für die vorliegende Studie besonders relevant sind.
4.2.1.1 Wirksame Instruktion kooperativer Bearbeitungsprozesse Im Folgenden werden zwei Publikationen gegenübergestellt, die unterschiedliche Auffassungen gegenüber wirksamen Instruktionen erkennen lassen. Kirschner, Sweller und Clark (2006) argumentieren anhand empirischer Ergebnisse für die direkte Instruktion wohingegen Lazonder & Harmsen (2016) anhand einer Metastudie einen differenzierten Einblick in die Wirksamkeit von Instruktionen geben. Wirksamkeit direkter und minimaler Instruktion (Kirschner et al., 2006) Kirschner et al. (2006) argumentieren, dass ein direct instructional approach einem unguided oder minimally instructional approach vorzuziehen sei, da das Arbeitsgedächtnis bei der Steuerung des eigenen Lernens überfordert sei. Kirschner et al. (2006) definieren die beiden Instruktionsvarianten wie folgt: • Direct Instruction: Beim Erwerb neuer Inhalte wird dem Lernenden genau gezeigt, was und wie etwas zu tun ist. Dazu werden adäquate Lernstrategien sowie Informationen bereitgestellt, die das Konzept oder das Verfahren vollständig erklären.
4.2 Wirksamkeit von Instruktionen und Interventionen
103
• Unguided oder Minimally Instruction: Zu dieser Art von Instruktionsverfahren zählen die Autoren das entdeckende, problembasierte, forschende, experimentelle und konstruktivistische Lernen. Im Bereich der Naturwissenschaften entdecken die Lernenden beispielsweise fundamentale Prinzipien des Fachs, indem sie ähnlich zu einem professionellen Forscher einen Forschungsprozess durchführen. Die Lernenden erstellen dabei ihre individuellen Lernprodukte. Prozess- oder aufgabenbezogene Hilfestellungen werden nur gegeben, falls die Lernenden danach verlangen. Kirschner et al. (2006) betonen die Tatsache, dass direkte Instruktionsmethoden erwiesenermaßen hochwirksam sind, wie auch Hattie zuletzt bestätigte (Hattie, 2009, S. 201). Anhand zahlreicher Studien illustrieren die Autoren, dass die unguided oder minimally instruction bei Lernenden häufig zur Frustration und zu Unverständnis führt und diese Form des Lernens ineffektiv ist. Kirschner et al. (2006, S. 80) halten fest: … guided instruction not only produces more immediate recall of facts than unguided approaches, but also longer term transfer and problem-solving skills (Kirschner et al., 2006, S. 80).
Die direkte Instruktion führt demnach zu mehr Faktenwissen sowie zu einer besseren Transfer- und Problemlösefähigkeit. Dieser Sachverhalt veranschaulicht den von Weinert (1996b) benannten Umstand, dass es bei einer fehlenden Unterstützung von Lernenden bei der Bearbeitung von anspruchsvollen Aufgaben zu keinem Lernzuwachs, sondern zur Bildung von Fehlvorstellungen kommen kann. So ist auch bei der Bearbeitung von Modellierungsaufgaben, die aufgrund ihrer Komplexität eine Steuerung des eigenen Lösungsprozesses verlangen (vgl. Abschnitt 2.3.2), von einer vollständig eigenständigen Bearbeitung der Aufgaben durch die Lernenden abzuraten. Die direkte Instruktion erscheint hinsichtlich einer Realisierung kooperativer Modellierungsprozesse aufgrund ihrer geringen Selbstständigkeitsorientierung jedoch wenig geeignet. Es besteht demnach ein großer Unterschied zwischen dem auf sich allein gestellten Arbeiten, einem selbstständigen Arbeiten mit Lehrerunterstützung und der direkten Instruktion durch die Lehrkraft (Blum & Schukajlow, 2018, S. 56). Metastudie zur Spezifität von Hilfestellungen (Lazonder & Harmsen, 2016) Lazonder und Harmsen (2016) greifen die Ergebnisse von Kirschner et al. (2006) auf und stellen heraus, dass forschendes Lernen in den Naturwissenschaften und in Mathematik unter den richtigen Bedingungen durchaus effektiv sein kann. Um ein
104
4
Empirische Befunde zu Interventionen
differenziertes Bild zur Wirkung verschiedener Formen der Lernunterstützung zu erhalten, führten Lazonder und Harmsen (2016) anhand von 72 Studien aus dem mathematisch-naturwissenschaftlichen Bereich eine Metaanalyse zum forschenden Lernen durch. Sie klassifizierten die in den Studien identifizierten Hilfestellungen anhand des Kategoriensystems nach De Jong und Lazonder (2014) hinsichtlich ihrer Spezifität (Process constraints, Performance Dashboard oder Status Overviews, Prompts, Heuristics, Scaffolds, Direct Presentation of Information bzw. Explanations; vgl. Abschnitt 3.3.3). Sie bestimmten die Wirkung dieser Hilfestellungen auf den Handlungserfolg der Lernenden im Lernprozess als auch auf ihren Lernerfolg. Der Handlungserfolg wurde anhand der Lernprodukte erhoben, z. B. anhand der Anzahl valider Folgerungen, der Qualität von Concept Maps oder der Anzahl korrekt beantworteter Aufgaben. Der Lernerfolg wurde anhand von Posttests, Interviews oder Fragebögen erhoben. Die Ergebnisse der Metaanalyse werden in Tabelle 4.3 dargestellt (Lazonder & Harmsen, 2016).
Tabelle 4.3 Effektstärken der Metastudie nach Lazonder und Harmsen (2016, S. 701 f.) Handlungserfolg (N = 17)
Lernerfolg (N = 60)
Effektstärke d
SD
95 %-KI
Effektstärke d
SD
95 %-KI
Gesamt
0.71
0.10
[0.52; .90]
0.50
0.06
[0.37; 0.62]
Process Constraints
0.71
0.14
[0.43; .99]
0.52
0.25
[0.03; 1.01]
Status Overviews
0.22
0.20
[−0.18; 0.61]
0.61
0.35
[−0.09; 1.30]
Prompts
0.50
0.14
[0.23; 0.76] 0.55
0.18
[0.19; 0.91]
Heuristics
1.17
0.34
[0.50; 1.84] 0.22
0.34
[−0.44; 0.88]
Hilfestellung
Scaffolds
0.80
0.13
[0.55; 1.05] 0.34
0.12
[0.11; 0.56]
Explanations
1.45
0.37
[0.72; 2.18] 0.10
0.10
[0.42; 0.80]
Anmerkung. SD: Standardabweichung, 95 %-KI: 95 %-Konfidenzintervall
Anhand von 17 Studien wurde der Handlungserfolg evaluiert. Die Hilfestellungen hatten im Vergleich zu keiner Lernunterstützung einen signifikanten Einfluss auf den Handlungserfolg (d = 0.71; mittlerer bis großer Effekt). Der Einfluss der
4.2 Wirksamkeit von Instruktionen und Interventionen
105
Art der Hilfestellung konnte signifikant nachgewiesen werden. Anhand einer Rangkorrelation (r = 0.53; p = 0.030) wird bestätigt, dass spezifischere Hilfestellungen mit größeren Effektstärken einhergehen, wobei sich die Explanations (d = 1.45; großer Effekt) signifikant von allen anderen Arten von Hilfestellungen unterscheiden. Ebenso sind die Heuristics (d = 1.17; großer Effekt) signifikant effektiver als die weniger spezifischen Hilfestellungen (Lazonder & Harmsen, 2016). 60 Studien wurden zur Evaluation des Lernerfolgs herangezogen. Die Hilfestellungen hatten im Vergleich zu keiner Lernunterstützung einen signifikanten Einfluss auf den Lernerfolg (d = 0.50; mittlerer Effekt). Die Effektstärken bezüglich Fähigkeiten, die dem forschenden Lernprozess zugeordnet werden können (18 Studien), sind mehr als zweimal so groß wie Effektstärken bezüglich des Domänenwissens (42 Studien). Die Art der Hilfestellung hatte hingegen keinen signifikanten Einfluss auf den Lernerfolg. Damit haben alle Lernunterstützungen empirisch gesehen denselben Effekt auf den Lernerfolg (Lazonder & Harmsen, 2016). Sowohl beim Handlungs- als auch beim Lernerfolg spielte das Alter der Probanden keine Rolle. Sie profitierten alle in gleichem Maße von den verschiedenen Hilfestellungen. Lediglich beim Handlungserfolg fungiert die Art der Hilfestellung als Moderator. Dabei tritt der vermutete Effekt ein, dass spezifischere Hilfen kurzfristig zu einem größeren Handlungserfolg führen, jedoch nicht zwangsläufig längerfristig zu einem höheren Lernerfolg. Dass die Art der Hilfestellung beim Lernerfolg nicht als Moderator fungiert, führen die Autoren auf die relativ hohe Anzahl von Studien zum Domänenwissen und des gleichzeitig relativ kleinen Effekts auf selbiges zurück (Lazonder & Harmsen, 2016). Ein zu erwartender Moderator des Handlungs- und Lernerfolgs wäre die Adaptivität, d. h. die situative Passung der durchgeführten Interventionen. Es liegen keine Informationen dazu vor, inwieweit die verschiedenen Hilfestellungen angemessen eingesetzt wurden. Dies wird generell nur in wenigen quantitativen Studien überprüft und konnte in der Metastudie vermutlich nicht berücksichtigt werden. Dieser potentielle Moderator muss bei der Interpretation der Ergebnisse bedacht werden, da ein Interaktionseffekt zwischen der Art der Hilfe und deren Adaptivität auf den Lern- und Handlungserfolg vermutet werden kann (vgl. bspw. Fürst, 1999). In Ergänzung zu den oben dargestellten Ergebnissen zum eigenständigen Arbeiten (Kirschner et al., 2006) erbringt die Metastudie eine wichtige Evidenz. Die Autoren fassen die Ergebnisse mit den folgenden Worten zusammen: …, inquiry-based teaching practices should employ guidance to assist leaners in accomplishing the task and learn from the activity. … So whenever learners act like scientists, their teacher should provide them with adequate guidance. …
106
4
Empirische Befunde zu Interventionen
Adequate guidance is not the same as highly specific guidance. … For example, math teachers do not need to direct students through every step of the mathematical modeling process: giving them a heuristic that conveys the gist of each phase will generally suffice. (Lazonder & Harmsen, 2016, S. 706)
Im forschenden Lernprozess ist eine Betreuung der Lernenden unerlässlich. Insbesondere der adaptive Einsatz und nicht bloß die Art der Intervention ist im Lernprozess vermutlich von Bedeutung. Für die zukünftige Forschung ist es daher von Interesse, wie verschiedene Hilfestellungen erfolgreich kombiniert werden können (Lazonder & Harmsen, 2016).
4.2.1.2 Wirksame Instruktion kooperativer Bearbeitungsprozesse im Mathematikunterricht Sowohl Kramarski, Mevarech und Arami (2002) als auch Dekker und ElshoutMohr (2004) führten Studien im Mathematikunterricht durch, die jeweils zwei Instruktionsverfahren gegenüberstellten und die Effekte jeweils verglichen. Wirksamkeit metakognitiver Fragen (Kramarski et al., 2002) Kramarski et al. (2002) untersuchten die Auswirkungen zweier Instruktionsverfahren auf 91 Schülerinnen und Schüler im Mathematikunterricht der siebten Klasse. Das erste Instruktionsverfahren legt einen Fokus auf metakognitive Fragen, das zweite stellt einen „Standardunterricht“ für Gruppenarbeitsprozesse dar: • COOP+META-Treatment (N = 60). Die Lernenden wurden dazu angeleitet vier verschiedene Typen von Fragen zu formulieren und zu beantworten: Verständnisfragen, die auf das Verstehen der Problemstellung abzielen („Was ist die Problemstellung?“), Fragen zu Analogien, die Gemeinsamkeiten mit bereits gelösten Aufgabenstellungen hinterfragen („Welche Gemeinsamkeit hat diese Aufgaben mit Problemen, die du bereits gelöst hast?“), strategische Fragen, die die Auswahl einer geeigneten Strategie fordern („Welche Strategie kannst du verwenden?“, „Warum ist diese Strategie am geeignetsten?“, „Wie kann die Strategie angewendet werden?“) und Reflexionsfragen, die die Reflexion des Lösungsprozesses anregen („Was tue ich gerade?“, „Kann ich die Aufgabe auf eine andere Art und Weise lösen?“). Die durchführenden Lehrkräfte wurden hinsichtlich des Einsatzes dieser Methode geschult. • COOP-Treatment (N = 31). Die Lernenden lösen die Aufgabe und erklären sich gegenseitig die Lösung zum Problem. Kann keiner der Gruppenmitglieder die Aufgabe lösen, wird die Lehrkraft nach Hilfe gefragt. Die Lehrkräfte waren
4.2 Wirksamkeit von Instruktionen und Interventionen
107
mit der Durchführung kooperativen Lernens vertraut. Diese Maßnahme kann als „Standardunterricht“ ohne besondere Schulung bezeichnet werden. Die Schülerleistung wurde in einem Pre-Post-Designs anhand von je einer Modellierungsaufgabe und verschiedenen Standardaufgaben zu zuvor behandelten Themengebieten (von ganzen Zahlen bis Termen) erhoben. Nach dem Pretest kam über ein Schuljahr je eine der oben beschriebenen Instruktionsverfahren zum Einsatz. Der Posttest konzentrierte sich inhaltlich auf die letzten sechs Wochen des Schuljahres. Sowohl für schwache als auch leistungsstarke Lernende wurden signifikant größere Effekte des COOP+META-Treatments im Vergleich zum COOP-Treatment festgestellt. Dieses Ergebnis ist ein Hinweis auf die Wirksamkeit metakognitiver Fragestellungen, die hauptsächlich auf die Auswahl, Begründung und Reflexion des Strategieeinsatzes abzielen. Aus den Ergebnissen kann nicht abgeleitet werden, dass diese Interventionen in allen Fällen erfolgversprechend sind. Sollte ein Lernender bspw. inhaltliche Verständnisprobleme haben, die nicht durch Intragruppenprozesse behoben werden können, erscheint eine metakognitive Hilfestellung wenig geeignet. Wirksamkeit produkt- und prozessbezogener Hilfen (Dekker & Elshout-Mohr, 2004) Dekker und Elshout-Mohr (2004) untersuchten die Problemlösefähigkeiten von 35 Schülerinnen und Schülern im Alter von 16 und 17 Jahren bei der Lösung von komplexen Geometrieproblemen. Die Lernenden arbeiteten in Gruppen und waren diese Sozialform aus dem Unterricht gewohnt. In je einer Klasse kam ein Instruktionsverfahren mit prozessbezogenen oder produktbezogenen Interventionen zum Einsatz: • Prozessbezogene Hilfe (N = 20). Die Lehrkraft unterstützt die Lernenden bei der Durchführung von regulativen Schlüsselaktivitäten, die die Interaktionen zwischen den Lernenden anregen. Dazu zählt das Vorzeigen („Was tust du?“), Erklären („Warum tust du das?“), Rechtfertigen („Ist das nicht falsch?“) und Überarbeiten („Das ist nicht richtig, weil …“) der eigenen Arbeit in der Gruppe. Es werden keine inhaltlichen Hilfestellungen gegeben. Die Interventionen wurden in der Versuchsgruppe von einem der Autoren durchgeführt. • Produktbezogene Hilfe (N = 15). Die Betreuer unterstützen die Lernenden durch das Geben von inhaltlichen, auf die Aufgabe bezogenen Hinweisen („Spiegele den Punkt an der Achse!“). Die Interventionen wurden in dieser Versuchsgruppe von einer Lehrkraft durchgeführt. Sie konnten dabei auch auf prozessbezogene Hilfestellungen zurückgreifen. Dahingehend erhielt sie jedoch keine besondere Schulung.
108
4
Empirische Befunde zu Interventionen
Die Lernenden bearbeiteten in beiden Maßnahmen jeweils vier Aufgaben zur Reflexion, Rotation, Translation und Schubspiegelung. Eine qualitative Analyse der Instruktionsverfahren bestätigte, dass diese anhand der Skripts durchgeführt wurden. Mithilfe eines quantitativen Testinstruments wurde die Leistung der Lernenden bezüglich der oben angegebenen Inhalte in einem Pre-Post-Design erhoben. Die Gruppe, die die Prozesshilfe erhalten hat, schneidet im Posttest signifikant besser ab als die Kontrollgruppe. Es wird jedoch keine Effektstärke berichtet. Aufgrund der kleinen Untersuchungsgruppe ist eine Bestätigung der Ergebnisse in einer größeren Stichprobe notwendig. Es kann nicht gefolgert werden, dass lediglich prozessbezogene Hilfestellungen anzuwenden sind. Möglicherweise stellt die Kombination prozess- und produktbezogener Hilfestellungen eine idealere Unterstützungsform dar. Diese wurde in der Studie nicht untersucht, da nur eine der beiden Lehrkräfte hinsichtlich prozessbezogener Hilfestellungen geschult wurde.
4.2.1.3 Wirksame Instruktion kooperativer Modellierungsprozesse Verschiedene Instruktionsverfahren wurden auch in Zusammenhang mit mathematischen Modellierungsprozessen untersucht. Während Tanner und Jones (1995) einen explorativen Ansatz verfolgten, stellten Blum und Schukajlow (2018) ein direktives und ein operativ-strategischen Instruktionskonzept gegenüber. Lehr-Ansätze zum Unterrichten mathematischen Modellierens (Tanner & Jones, 1995) Tanner und Jones (1995) beobachteten ca. 100 Unterrichtsstunden an acht Schulen, in denen mathematische Modellierungsaufgaben von Lernenden im Alter von 11 bis 16 Jahren bearbeitet wurden. Analysiert wurden die Stunden anhand von Fragebögen zur Selbst-Evaluation und durch Wissenschaftler, die als teilnehmende Beobachter an den Stunden partizipierten. Der Fokus der Studie lag auf den metakognitiven Prozessen Planen, Überwachen und Evaluieren. Die Lehrkräfte erprobten in den Stunden sechs verschiedene Lehr-Ansätze, die von Lehrkräften und Wissenschaftlern in gemeinsamen Treffen entwickelt und evaluiert wurden (Tanner & Jones, 1995, S. 65 ff.): • Sink or Swim. Die Lernenden werden »ins kalte Wasser geworfen« und erhalten keine Hilfestellung bei der Bearbeitung der Aufgabe. Es wird ein komplett eigenständiges Arbeiten erwartet. Dieser Ansatz war nur bei den besten Lernenden erfolgreich und selbst hier wenig effizient. Unerfahrene Lernende waren teilweise orientierungslos und wussten nicht, was von ihnen erwartet wird.
4.2 Wirksamkeit von Instruktionen und Interventionen
109
• Cookbook Modelling. Den Lernenden wird durch ein hochstrukturiertes Arbeitsblatt oder eine starke Lenkung durch die Lehrkraft eine Strategie zur Lösung der Aufgabe bereitgestellt. Dieser Ansatz führte kurzfristig zu einem großen Erfolg, da die Lernenden leicht für die Aufgabenbearbeitung zu motivieren waren. Längerfristig entwickelten sie jedoch keine metakognitiven Fähigkeiten, sodass selbst eine Übertragung auf leicht modifizierte Aufgaben nicht möglich war. • Questioning Using Organisational Prompts. Den Lernenden wird eine Liste mit Fragen gegeben, die eine strategische Planung fördern. Dies wird durch Lehrerfragen, wie z. B. „Kannst du mir deinen Plan erklären?“, unterstützt. Ziel war die Vermittlung einer Struktur an die Lernenden, nach der sie ihre Gedanken organisieren können. Die Lernenden erwarteten schließlich diese Art von Fragen, sodass sie begannen, diese zu verinnerlichen und für ihre Planung zu verwenden. • Internalization of Scientific Argument. Die Lernenden werden dazu aufgefordert, ihre Zwischenergebnisse im Plenum zu präsentieren. Im Anschluss findet eine „wissenschaftliche“ Diskussion statt, die durch die Lehrkraft gesteuert wird. Die Lernenden verinnerlichten die Art der Fragen und bereiteten für ihre Präsentationen passende Antworten vor. Die Gruppenarbeiten waren durch das Erklären und Diskutieren von Ideen anderer bestimmt, was zur strukturellen Organisation des Lösungsprozesses, sinnvolleren Erarbeitungen und reflexivem Denken führte. • Start, Stop, Go. Die Bearbeitung beginnt mit einer Einzelarbeit, in der die Aufgabe gelesen und Pläne entwickelt werden. Im Anschluss werden diese in der Kleingruppe diskutiert. Daran anknüpfend erfolgt eine Berichterstattung im Plenum, wonach wieder in Kleingruppen gearbeitet wird. Die Lernenden antizipierten die Fragen, die bei der Berichterstattung gestellt werden und begannen so ihren Lösungsprozess zu überwachen und zu planen. Dies ermöglichte es den Lernenden, den Überblick über den Lösungsprozess zu behalten. • Using Peer and Self-Assessment to Encourage Reflection. Die Lernenden werden dazu angeregt, ihre Lösung individuell aufzuschreiben. Ausgewählte Gruppen präsentieren ihr Ergebnis, das von den Peers diskutiert wird. Die Leitfrage dazu lautet: „Wenn ich die Aufgaben noch einmal bearbeiten müsste, würde ich es genauso machen?“ Dies führte zu einem Zurückschauen auf den Lösungsprozess, bei dem die Lernenden die Eleganz und Ökonomie ihrer Lösung diskutierten. Entscheidende Aspekte einer guten Lösung wurden verhandelt. Das Evaluieren und Regulieren des eigenen Lösungsprozesses wurden erlernt.
110
4
Empirische Befunde zu Interventionen
Die entwickelten Lehr-Ansätze liefern Hinweise darauf, welche Prozesse zum Erwerb von Modellierungskompetenz günstig bzw. weniger günstig sind. Ein völlig eigenständiges Arbeiten (Sink and Swim) und eine zu starke Lenkung (Cookbook Modelling) haben negative Effekte, da diese Aspekte auf der einen Seite zur Orientierungslosigkeit und Ineffizienz und auf der anderen Seite zu fehlenden Transferfähigkeiten und metakognitiven Kompetenzen führen (Tanner & Jones, 1995). In den verbleibenden vier Lehr-Ansätzen (Questioning Using Organisational Prompts; Internalization of Scientific Argument; Start, Stop, Go; Using Peer and Self-Assessment to Encourage Reflection) werden entweder durch ein Material oder durch Diskussionen in den Kleingruppen sowie im Plenum metakognitive bzw. reflexive Fragestellungen eingesetzt, um den Lösungsprozess oder die Ergebnisse zu reflektieren und den Lernenden eine Orientierung bei der Bearbeitung zu bieten. Die positive Evaluation dieses Vorgehens durch die Lehrkräfte und Wissenschaftler in der Studie weist darauf hin, dass es sich hierbei um wirksame Methoden zur selbstständigkeitsorientierten Förderung von Modellierungskompetenzen handelt. Der Lehrkraft kommt dabei die Aufgabe zu, anhand von Interventionen die Prozesse des Planens, Überwachens und Evaluierens anzuregen (Tanner & Jones, 1995). Direktiver und operativ-strategischer Unterricht (Blum & Schukajlow, 2018) Im Rahmen des Projekts DISUM (Didaktische Interventionsformen für einen selbstständigkeitsorientierten Unterricht am Beispiel Mathematik) wurde unter anderem der Einfluss verschiedener Instruktionsmethoden auf den Erwerb von Modellierungskompetenzen und Emotionen der Lernenden untersucht. Dazu wurden zwei optimierte Lernumgebungen mit verschiedenen Instruktionsverfahren entwickelt, die sich im Wesentlichen in ihrer Selbstständigkeitsorientierung und den angewandten Interventionen unterscheiden (Schukajlow et al., 2009). Die empirisch als hochwirksam bestätigte direkte Instruktion (Hattie, 2009, S. 201) wurde einem Instruktionsverfahren gegenübergestellt, in dem die Lernenden möglichst selbstständig arbeiten und adaptiv durch die Lehrkraft unterstützt werden (Blum & Schukajlow, 2018; Schukajlow et al., 2009): • Eine lehrerzentrierte Lernumgebung wurde anhand eines direktiven Unterrichts gestaltet, der sich durch ein am Durchschnittsschüler orientiertes fragendentwickelndes Unterrichtsverfahren auszeichnet. In einer Plenumsphase werden zunächst eine Modellierungsaufgabe gemeinsam an der Tafel erarbeitet und Fragen geklärt. In einer anschließenden lehrergelenkten Einzelarbeitsphase lösen
4.2 Wirksamkeit von Instruktionen und Interventionen
111
die Lernenden eine strukturähnliche Modellierungsaufgabe. Im Anschluss präsentiert ein Schüler oder eine Schülerin ihre Lösung an der Tafel, die besprochen und korrigiert wird. • In einer selbstständigkeitsorientierten Lernumgebung kam das operativstrategische Unterrichtskonzept zur Anwendung. Die Lernenden bearbeiten Modellierungsaufgaben individuell in Vierergruppen. Dabei entwickeln die Lernenden in einer Anfangsphase zunächst individuelle Lösungsansätze, die sie in einer anschließenden Austauschphase in der Gruppe diskutieren. Im Anschluss schreiben die Lernenden ihre Lösung auf oder verbessern diese. Dabei unterstützt die Lehrkraft die Lernenden adaptiv bei der Verfolgung individueller Lösungsansätze. Eine oder mehrere Lösungen werden im Anschluss im Plenum diskutiert. Die Maßnahme bestand jeweils aus zehn Unterrichtsstunden in Lerngruppen, die zuvor anhand von PISA Aufgaben hinsichtlich ihrer Leistungsfähigkeit homogenisiert wurden. Es fand eine Schulung der Lehrkräfte hinsichtlich der Durchführung der beiden Unterrichtsverfahren statt. Die Daten wurden in einem Pre-Post-Design anhand schriftlicher Tests und Fragebögen erhoben. Die Studie besteht aus zwei Hauptstudien (Hauptstudie 1 (Schukajlow et al., 2009): 64 Lernende der neunten Klasse, Hauptstudie 2 (Blum & Schukajlow, 2018): 224 Lernenden der neunten Klasse), deren Ergebnisse überwiegend vergleichbar sind. Im Folgenden werden daher nur die Ergebnisse der zweiten Hauptstudie berichtet. In beiden Versuchsgruppen wurde ein Leistungszuwachs festgestellt, jedoch war die Steigerung in der operativ-strategischen signifikant größer (kleiner Effekt). Die Ergebnisse wurden hinsichtlich des Zuwachses im technischen Arbeiten und Modellieren differenziert betrachtet. Es zeigt sich, dass die Zuwächse in der direktiven Gruppe nur auf Steigerungen im technischen Arbeiten zurückzuführen sind, die sich zwischen den Gruppen nicht signifikant unterscheiden. Die Modellierungskompetenz verbesserte sich hingegen nur in der operativ-strategischen Gruppe (mittlerer Effekt). Die Autoren folgern, dass „sich Modellierungskompetenz nur (höchstens) durch selbstständiges Lernen unter adäquater Lehrer-Unterstützung erwerben lässt“ (Blum & Schukajlow, 2018, S. 62). Bezüglich der Emotionen Freude und Interesse wurde in der operativ-strategischen Gruppe ebenfalls ein signifikant höherer Zuwachs (kleiner Effekt) festgestellt (Schukajlow et al., 2012). Damit lassen sich positive Effekte der selbstständigkeitsorientierten Lernumgebung zum Modellieren bei einer Betreuung anhand adaptiver Interventionen sowohl auf kognitive als auch affektive Merkmale feststellen.
112
4
Empirische Befunde zu Interventionen
Zusammenfassend weisen allgemeine Studien zur Wirksamkeit von Instruktionen daraufhin, dass ein entdeckender Lernprozess mit möglichst wenig Hilfestellungen zu Unverständnis und Frustration führen kann (Kirschner et al., 2006). Die Metastudie von Lazonder und Harmsen (2016) zum forschenden Lernen im mathematisch-naturwissenschaftlichen Bereich zeigt, dass die generelle Anwendung von Hilfestellungen einen positiven Effekt auf den Lernerfolg hat. Es konnte jedoch keine zu bevorzugende Art von Hilfestellung identifiziert werden. Quasi-experimentelle Studien im Mathematikunterricht weisen auf die Wirksamkeit von metakognitiven Fragestellungen und prozessbezogenen Hilfestellungen hin (Dekker & Elshout-Mohr, 2004; Kramarski et al., 2002). Untersuchung zur unterrichtlichen Inszenierung von Modellierungsprozessen zeigen, dass weder das völlig eigenständige Bearbeiten noch eine starke Anleitung beim Bearbeiten von Modellierungsaufgaben sinnvoll sind. Auch für kooperative Modellierungsprozesse erscheinen metakognitive und reflexive Fragen geeignet (Tanner & Jones, 1995). Studien von Blum und Schukajlow (2018) illustrieren, dass der operativstrategische Unterricht, bei dem Lernende möglichst adaptiv unterstützt werden, bei der Vermittlung von Modellierungskompetenzen dem direktiven Unterricht überlegen ist.
4.2.2
Wirksamkeit von Interventionen
Eine Schwäche der meisten in Abschnitt 4.2.1 beschriebenen Forschungsansätze liegt in der Tatsache, dass die Adaptivität und damit auch die Qualität der durchgeführten Interventionen nicht in die Interpretation der Ergebnisse mit einbezogen werden kann. Es erscheint weniger wichtig, ob eine gewisse Art von Intervention durchgeführt wurde als vielmehr wie und mit welcher Qualität (Meloth & Deering, 1999, S. 248). Krammer (2009) veranschaulicht diesen Sachverhalt in folgendem Zitat: In Bezug auf die Qualität der individuellen Lernunterstützung zeigt sich aufgrund der vorliegenden Forschungsarbeiten, dass man eine gute Lernunterstützung nicht als ausgefeilte Technik beschreiben kann, man kann sie auch nicht ausschließlich anhand der Feststellung des Auftretens oder Nichtauftretens von beobachtbaren Oberflächenmerkmalen erfassen. Damit zeigt sich analog zur Problematik der Unterrichtbeurteilung, dass die Qualität der Interaktion sich nicht allein an Merkmalen der Oberflächenstruktur festmachen lässt … . (Krammer, 2009, S. 138)
4.2 Wirksamkeit von Instruktionen und Interventionen
113
Einige wenige stärker qualitativ ausgerichtete Studien untersuchen die Wirkung konkreter Interventionen auf den Lösungsprozess der Lernenden. Dieser Forschungsansatz hat den Vorteil, dass verschiedene Arten von Interventionen und nicht komplette Instruktionsverfahren hinsichtlich ihrer Wirksamkeit beurteilt werden können. Die Generalisierbarkeit dieser Befunde ist dafür im Vergleich zu stärker quantitativen Ansätzen eingeschränkt.
4.2.2.1 Wirksame Interventionen in kooperativen Bearbeitungsprozessen Ergänzend zu den in Abschnitt 4.1 geschilderten deskriptiven Befunden von Fürst (1999) wurden in einem gemeinsamen Projekt von Hanns-Dietrich Dann, Theodor Diegritz und Heinz S. Rosenbusch in verschiedenen Fächern Zusammenhangsanalysen anhand verschiedener Merkmale des Lehrerverhaltens im Gruppenunterricht durchgeführt. Die Analysen liefern Hinweise auf die Wirksamkeit von Interventionen mit bestimmten Merkmalen. Qualitätskriterien für den Gruppenunterricht (Dann, Diegritz, & Rosenbusch, 1999) Im Rahmen des Projekts analysierte Fürst (1999) anhand einer Korrelationsanalyse, inwieweit sich verschiedene Merkmale der beobachteten Interventionen auf die inhaltliche Progression des Lösungsprozesses, die Beziehungsentwicklung und die Prozessregelung auswirkten. Dabei stellte er fest, dass ein niedriger Situationsbezug (niedrige Orientierung und niedriger Aufgabenbezug; vgl. Abschnitt 4.1), also eine fehlende Diagnostik der Gruppenarbeit und eine nicht auf den Lösungsprozess abgestimmte Intervention, in signifikanter Weise zu einer Verschlechterung der inhaltlichen Progression führt. Bei bewertenden Sprechhandlungen, bspw. einem Feedback, fungiert der Situationsbezug als Moderator. Positive und negative Evaluationen führen bei einem hohen Situationsbezug zu einer signifikant besseren inhaltlichen Progression. Bei einem niedrigem Situationsbezug ist in signifikanter Weise das Gegenteil der Fall. Obwohl die Ergebnisse aufgrund der relativ kleinen Stichprobe mit Vorsicht zu interpretieren sind, verdeutlichen diese die Bedeutung einer Diagnose und der darauf basierenden Intervention – also der Adaptivität einer Intervention (Fürst, 1999). Direktive, d. h. auffordernde, Sprechhandlungen am Ende einer Intervention führten in einer signifikanten Weise zur Verschlechterung der inhaltlichen Progression. Fürst (1999) vermutet den Grund dieses Sachverhalts in dem von den Lernenden gewohnten Interaktionsmuster Auffordern – Reagieren – Bewerten (vgl. Abschnitt 3.3.1; Initiation – Reply – Evaluation; (Mehan, 1979)). Da keine abschließende Bewertung der Reaktion der Lernenden auf die Aufforderung stattfindet, sind diese irritiert oder verwirrt, was zu einer Störung des Lösungsprozesses führt (Fürst,
114
4
Empirische Befunde zu Interventionen
1999). Demnach muss die Lehrkraft die Reaktion der Lernenden auf die Intervention abwarten, um das Verstehen der Aufforderung sicherzustellen. Anhand einer multiplen Regressionsanalyse wurde der Einfluss des zeitlichen relativen Anteils der Interventionen an der Gesamtzeit der Gruppenarbeit (Prädiktor) auf das Arbeitsergebnis (Kriterium) bestimmt. Es wurde ein Regressionskoeffizient von −0.15 festgestellt. Fürst (1999) interpretiert dies dahingehend, als dass zu langes und häufiges Intervenieren grundsätzlich zu vermeiden sei. Eine derart generalisierende Aussage ist jedoch kritisch zu beurteilen, da das Arbeitsergebnis nicht von der bloßen Durchführung, sondern vermutlich von der Qualität und Adaptivität der Intervention abhängig ist. Da in den deskriptiven Befunden (vgl. Abschnitt 4.1) eine überwiegend geringe Orientierung und ein geringer Aufgabenbezug festgestellt wurde, der zu einer Verschlechterung der inhaltlichen Progression führte, ist dieser Zusammenhang wenig verwunderlich. Mit der Intention, Qualitätskriterien für den Gruppenunterricht abzuleiten, korreliert Haag (1999) Schüler- mit Lehrervariablen desselben Datensatzes. Er kommt zu dem Ergebnis, dass ein geringer Zeitanteil der Interventionen während der Gruppenarbeit (Korrelation mit Arbeitsergebnissen r = −0.44), ein hoher Situationsbezug der Interventionen (Korrelation mit Beziehungsentwicklung r = 0.27) und eine hohe Umgangsqualität (Korrelation mit Arbeitsergebnis und Beziehungsentwicklung r = 0.27) aufgrund ihrer signifikanten Korrelation mit positiven Lernprozess- und Schülermerkmalen als Qualitätskriterien guter Interventionen angesehen werden können. Die Folgerung bezüglich des geringen Zeitanteils ist aus den im vorherigen Absatz genannten Gründen als kritisch zu beurteilen. Die Ergebnisse zum Situationsbezug und zur Umgangsqualität lassen sich jedoch als wichtige Merkmale interpretieren. Die Ergebnisse der Studie zeigen neben der Bedeutung eines hohen Situationsbezugs und einer guten Umgangsqualität vor allem, wie Interventionen in Gruppenarbeitsprozessen nicht aussehen sollten und welchen Einfluss diese auf den Lösungsprozess der Lernenden haben (Leiss, 2007, S. 64). Die Daten wurden in verschiedenen Unterrichtsfächern erhoben, sodass eine Übertragung auf den Mathematikunterricht und insbesondere auf kooperative Modellierungsprozesse nicht ohne Weiteres möglich ist. Im Folgenden werden daher Studien vorgestellt, die einen stärkeren Fokus auf das Problemlösen und mathematische Modellieren legen.
4.2.2.2 Wirksame Interventionen in Problemlöseprozessen Für den Mathematikunterricht liefert vor allem die Studie von Link (2011) Hinweise für wirksame Interventionen in Problemlöseprozessen. Dabei beschränkte sie sich auf die Untersuchung strategischer Interventionen, denen ein großes Potential zugesprochen wird (vgl. Abschnitt 3.3.2).
4.2 Wirksamkeit von Instruktionen und Interventionen
115
Wirksame Gesprächsmuster beim Einsatz strategischer Interventionen (Link, 2011) Link (2011) untersuchte 21 Eins-zu-Eins Gespräche angehender Lehrkräfte mit Lernenden bei der Bearbeitung einer Problemlöseaufgabe. Im Fokus der Analyse stehen strategische Interventionen. Die angehenden Lehrkräfte wurden zuvor hinsichtlich der zu behandelnden Problemlöseaufgaben und Kriterien guter Gesprächsführung (Selter & Spiegel, 1997, S. 101 ff.) geschult und reflektierten begleitend ihr Interventionsverhalten mit der Forscherin anhand von Videomaterial. Die Schülerinnen und Schüler stammen aus der achten Klasse, wobei sowohl leistungsstarke als auch leistungsschwache Lernende ausgewählt wurden. Die Transkripte wurden hinsichtlich begrifflicher Lernmomente der Schülerinnen und Schüler analysiert. Interventionen wurden den vier Ebenen nach Leiss (2007; organisatorische, affektive, strategische und inhaltliche Interventionen) zugeordnet, wobei im Anschluss die strategischen Interventionen genauer untersucht wurden. Anhand eines Grounded Theory Ansatzes (Strauss & Corbin, 1996) wurden die Gesprächsabschnitte analysiert, die zu einem Lernmoment führten. Es wurden potentiell konstruktive Gesprächsmuster identifiziert, die aus strategischen Interventionen auf verschiedenen Ebenen bestehen und den Regeln guter Gesprächsführung folgen. Die Gesprächsmuster bestanden aus strategischen Interventionen auf den folgenden Ebenen (Link, 2011, S. 175 f.): • Allgemein-strategische Interventionen vermitteln Strategien, die unabhängig von einer spezifischen Aufgabe sind und sich in allgemeiner Art und Weise auf den Lösungsprozess beziehen. • Strategieorientiert-strategische Interventionen beziehen sich auf mögliche Arbeitsstrategien, die ebenfalls in verschiedenen Aufgaben zur Anwendung gebracht werden können (heuristische Strategien). Jedoch muss sichergestellt werden, dass die Strategie an dieser Stelle sinnvoll ist. • Inhaltsorientiert-strategische Interventionen beziehen sich auf den Lösungsprozess der Lernenden und müssen daher auf die mathematischen Grundlagen der Aufgabe als auch auf den Lösungsweg der Lernenden abgestimmt sein. Die gefundenen Muster zeichnen sich dadurch aus, dass durch deren Einsatz der Lösungsprozess immer wieder angestoßen wird, ohne inhaltlich einzugreifen. Die Verantwortung für die Lösung des Problems wird konsequent an die Schülerinnen und Schüler zurückgegeben. Die strategischen Interventionsmuster befähigen die Lernenden, Schwierigkeiten im Problemlöseprozess zu überwinden. Dabei nutzt die Lehrkraft die drei Ebenen strategischer Interventionen, um das Gespräch zwischen den Polen einer prozessbezogenen, metakognitiven und einer inhaltlichen Auseinandersetzung mit dem Problem zu steuern. Link (2011, S. 212) bezeichnet
116
4
Empirische Befunde zu Interventionen
diese Vorgehensweise als „Zoomen“. Die Gesprächsmuster werden in Tabelle 4.4 angegeben und erläutert (Link, 2011, S. 210). Bei der Zuordnung der Interventionen zu den drei Ebenen strategischer Interventionen fällt auf, dass die von Link (2011, S. 175 f.) definierten Ebenen nicht mit den Definitionen von Leiss (2007, S. 78) in Übereinstimmung gebracht werden können. So würde bspw. die bei Link (2011, S. 184) als inhaltsorientiert-strategisch klassifizierte Intervention „Ja … da musst ja daran denken die mähn [sic] gleichzeitig“ nach Leiss eine inhaltliche Intervention darstellen. Diese Differenzen sind wahrscheinlich darauf zurückzuführen, dass in der Studie von Link alle Interventionen als strategisch angesehen werden, die von mindestens einem Rater als strategisch eingeordnet wurden (Link, 2011, S. 147). Unter strategischen Interventionen werden in der Studie daher teilweise auch stärker inhaltliche Interventionen verstanden. Tabelle 4.4 Gesprächsmuster guter Interventionen nach Link (2011, S. 177 ff.) Gesprächsmuster
Erläuterung des Gesprächsmusters
Gespräch zeitlich strukturieren (5)
Alle Gesprächsmuster beginnen mit einer allgemein-strategischen Intervention, in der die Lehrkraft die Lernenden Zeit zum Nachdenken bereitstellt. Nach einiger Zeit erfolgt eine weitere strategieorientiert-strategische, eine inhaltsorientiert-strategische oder eine Intervention auf beiden Ebenen in der angegebenen Reihenfolge, um den Lösungsprozess anzuregen.
Zum Reflektieren anregen (5)
Die Lehrperson möchte die Lernenden über den vergangenen Lösungsweg nachdenken lassen oder etwas über den Zukünftigen erfahren.
Vergangenen Lösungsweg reflektieren (2)
Alle Gesprächsmuster beginnen mit einer strategieorientiert-strategischen Intervention, in der die Lehrkraft die Lernenden den vergangenen Lösungsweg reflektieren lässt. Sie nutzt die Erklärung der Lernenden, um auf inhaltliche Unstimmigkeiten hinzuweisen. Im Anschluss interveniert die Lehrkraft erneut strategieorientiert- oder inhaltsorientiert-strategisch, um den Lösungsprozess anzuregen.
Zukünftiges Vorgehen erfragen (3)
Im Gesprächsmuster findet an verschiedenen Stellen eine allgemein-strategische Befragung zum zukünftigen Vorgehen statt. In zwei Fällen wird auf einer strategieorientierten Ebene die Reflexion des vergangenen Lösungsweges angeregt. Falls kein Lösungsansatz erzielt wird, wird der Lösungsprozess auf einer inhaltsorientiert-strategischen Ebene angeregt. (Fortsetzung)
4.2 Wirksamkeit von Instruktionen und Interventionen
117
Tabelle 4.4 (Fortsetzung) Gesprächsmuster
Erläuterung des Gesprächsmusters
Über potentielle Fehler/Irrwege sprechen (10)
Die Lehrkraft spricht potentielle Schwierigkeiten im Lösungsprozess an.
Probleme im Auf- Alle Gesprächsmuster beginnen mit einer gabenverständnis inhaltsorientiert-strategischen Intervention, in der die Lehrkraft beheben (3) das Ziel der Aufgabe erläutert oder indirekt in diesem Zusammenhang auf einen Fehler hinweist. Im Anschluss findet eine allgemein- oder strategieorientiert-strategische Intervention statt, um den Lösungsprozess erneut anzuregen. Fehler im bisherigen Lösungsverlauf thematisieren (3)
Auf einer allgemein- oder strategieorientiert-strategischen Ebene wird den Lernenden ein Fehler im Lösungsprozess verdeutlicht. Dabei werden die Fehler verniedlicht (kleiner Fehler, kleiner Dreher). Die nachfolgenden allgemein- oder inhaltsorientiert-strategischen Interventionen richten sich danach, wie schnell der Fehler behoben werden kann.
Weg als mögliche Alle Gesprächsmuster beginnen mit einer Sackgasse strategieorientiert-strategischen Intervention, in der die Lehrkraft bewerten (4) die von den Lernenden verwendete Strategie thematisiert. Im Anschluss wird den Lernenden auf vorsichtige Art und Weise auf verschiedenen Ebenen die Sackgasse ihrer Strategie verdeutlicht. Die Reihenfolge der Interventionen auf den verschiedenen Ebenen unterscheidet sich stark. Zum Validieren anregen (4)
Die Lehrkraft verdeutlicht zunächst auf einer allgemein- oder strategieorientiert-strategischen Ebene, dass validiert werden muss. Gegebenenfalls wird auf verschiedenen Ebenen thematisiert, wie validiert werden kann. Nur in einem Fall wird durch eine inhaltsorientiert-strategische Intervention thematisiert, wie validiert werden kann.
Zum Aufschreiben anregen (6)
Alle Gesprächsmuster beginnen mit einer strategieorientiert-strategischen Intervention, in der die Lehrkraft die Lernenden zum Aufschreiben auffordert. Anhand des Aufschriebs wird der Lösungsprozess anhand allgemein-strategischer Interventionen weiterentwickelt. In einem Fall ist eine weitere inhaltsorientiert-strategische Intervention notwendig.
Anmerkung. Die Zahlen hinter den Gesprächsmustern geben die Anzahl der Kodierungen an.
118
4
Empirische Befunde zu Interventionen
Auch müssen die Ergebnisse hinsichtlich ihrer Übertragbarkeit auf Gruppenarbeitsprozessen relativiert werden, da es sich um Eins-zu-Eins Gespräche in einer Laborsituation handelt. Die Tatsache, dass zur Sicherstellung eines verständnisvollen Lernprozesses ohne Einschränkung der Selbstständigkeit der Lernenden in der Regel mehrere strategische und/oder inhaltliche Interventionen notwendig und geeignet sind, kann jedoch als das zentrale Ergebnis der Studie herausgestellt werden. Analysiert man die in Tabelle 4.4 beschriebenen Abfolgen strategischer Interventionen, können Tendenzen hinsichtlich gestufter Interventionen (vgl. Abschnitt 3.3.3) identifiziert werden. Möchte die Lehrkraft den Lösungsprozess vorantreiben, interveniert sie beginnend bei den allgemein-strategischen Interventionen bis hin zu den inhaltlicheren Interventionen solange, bis die Lernenden ihren Ansatz selbst weiterverfolgen können.
4.2.2.3 Wirksame Interventionen in kooperativen Modellierungsprozessen Auch in mathematischen Modellierungsprozessen wurden Auswirkungen strategischer Interventionen untersucht. Stender (2016) verfolgte einen explorativen Ansatz und untersuchte Intervention in mathematischen Modellierungsprozessen hinsichtlich der Gründe für ihren Erfolg oder Misserfolg. Schukajlow, Kolter und Blum (2015) sowie Adamek (2018) führten Studien durch, in der Gruppen mit und ohne Lösungsplan, der strategische Hilfestellungen bereitstellt, vergleichend untersucht werden. Gründe für den Erfolg und Misserfolg von Interventionen (Stender, 2016) Stender (2016) untersuchte 238 Interventionen hinsichtlich ihrer kurzfristigen Wirkung auf den kooperativen Modellierungsprozess von Schülerinnen und Schülern. Die Gruppen setzten sich aus vier bis sechs Lernenden zusammen, wobei auf eine gleichmäßige Geschlechterverteilung geachtet wurde. Die Interventionen wurden von Tutorinnen und Tutoren durchgeführt, die im Rahmen ihres Lehramtsstudiums als Betreuer an Modellierungstagen fungierten. Die Studierenden wurden zuvor in einem fachdidaktischen Masterseminar hinsichtlich eines adaptiven Lehrerverhaltens (vgl. Abschnitt 3.3.4) geschult. Anhand von Videoaufnahmen wurden die Betreuer-Schüler-Interaktionen analysiert. Das Material wurde transkribiert und unter Einbezug des Videomaterials mithilfe der strukturierenden Inhaltsanalyse nach Mayring (2007) kodiert. Anhand eines Kategoriensystems wurden der Auslöser sowie die Ebene der Intervention und verschiedene Merkmale des Schülerverhaltens vor und nach der Intervention erfasst, um den Erfolg der Interventionen zu bestimmen. Von einer erfolgreichen
4.2 Wirksamkeit von Instruktionen und Interventionen
119
oder, mit anderen Worten, wirksamen Intervention geht Stender (2016, S. 182 f.) aus, wenn … • vor der Intervention im Lösungsprozess der Lernenden eine Handlungsbarriere vorlag oder sich diese auf einem Irrweg befanden und die Intervention von den Lernenden angenommen wird. • vor der Intervention von den Lernenden eine Frage zum Lösungsprozess gestellt wird (Handlungsbarriere) und die Intervention von den Lernenden angenommen wird. • die Lernenden oder ein Teil der Lernenden vor der Intervention nicht an der Aufgabenstellung arbeiten und die Intervention zu einer Steigerung der Anzahl der Lernenden führt, die sich mit der Aufgabenstellung beschäftigen. Zur Analyse wurden lediglich die als allgemein-strategisch und inhaltlichstrategisch (Zech, 1996) kodierten Interventionen herangezogen. Die zehn Tutoren unterschieden sich teilweise stark in der Anzahl und Dauer der durchgeführten Interventionen. Stender (2016, S. 192) identifiziert in diesen Daten zwei Verhaltensmuster: häufigeres kurzes Intervenieren und weniger häufigeres längeres Intervenieren. Die Dauer der Interventionen nimmt aufgrund der kürzer werdenden Bearbeitungszeit mit der Zeit zu. Mit 60 % überwiegen, wie auch in der Studie von Leiss (2007), die invasiven Interventionen. Stender (2016, S. 193) vermutet jedoch einen angemessenen Einsatz invasiver Interventionen, bspw. um Lernende zur Teilnahme am Lösungsprozess zu motivieren, sodass er der Schulung der Tutorinnen und Tutoren eine positive Wirkung auf das Interventionsverhalten der Studierenden unterstellt. Auch der vermehrte Einsatz allgemein-strategischer und inhaltsorientiert-strategischer Interventionen (je 31 %) unterstützt diese Vermutung (Stender, 2016, S. 198). Invasive Interventionen werden daher ca. gleich oft als erfolgreich kodiert wie responsive Interventionen (51 % und 49 %). Demgegenüber stellen lediglich 22 % der als nicht erfolgreich kodierten Interventionen responsive dar (78 % invasiv). Arbeiten alle Lernenden an der Problemstellung, führen invasive Interventionen nur in 11 % der Fälle zum Erfolg. Die geforderte Zurückhaltung der Lehrperson bezüglich invasiver Interventionen werden durch diese Ergebnisse (Stender, 2016, S. 196) und die Studienergebnisse von Fürst (1999) bestätigt. Betrachtet man den Erfolg der Interventionen auf den verschiedenen Ebenen, lässt sich ein leichter Vorteil der allgemein-strategischen (37 von 74; 50 %) und inhaltlich-strategischen (37 von 73; 51 %) gegenüber den inhaltlichen (22 von 55; 40 %) Interventionen feststellen. Aufgrund der geringen Anzahl von Kodierungen in den einzelnen Ebenen liegt jedoch kein signifikanter Unterschied vor. Inhaltliche
120
4
Empirische Befunde zu Interventionen
Interventionen weisen keinen expliziten Vorteil gegenüber strategischen Interventionen auf (Stender, 2016, S. 199), obwohl diese vermehrt im Unterrichtsalltag eingesetzt werden (Leiss, 2010). In einer weiteren Tiefenanalyse untersuchte Stender (2016, S. 206 ff.) die allgemein- und inhaltlich-strategischen Interventionen nach Gründen für deren Erfolg oder Misserfolg. Die Ergebnisse dieser Analyse sind in Tabelle 4.5 dargestellt. Bei den nicht erfolgreichen Interventionen zeigt sich, dass ein zu offener Impuls für die Lernenden eher ein weiteres Hindernis als eine Hilfestellung im Modellierungsprozess darstellt. Zu einem ähnlichen Ergebnis kommt Leiss (2007) in seiner achten Hypothese zum Erfolg von Interventionen: Inhaltliche Interventionen werden bei der Problemüberwindung bzw. Lenkung des Lösungsprozesses dann von den Schülern aufgegriffen, wenn es sich um „direkte Anweisungen“ oder „um indirekte Hinweise mit einschrittigem Problemschluss“ handelt. Inhaltliche Hilfestellungen die einen offenen (Reflexions-)Impuls darstellen werden von den Schülern im Lösungsprozess kaum weitergeführt. (Leiss, 2007, S. 276)
Es erscheint entscheidend, die Offenheit einer Intervention an die kognitiven und affektiven Merkmale der Lernenden anzupassen. Dazu ist eine genaue Diagnostik notwendig. Eine fehlende oder mangelhafte Diagnose der Schwierigkeit führt zu einer wenig geeigneten Intervention (vgl. Tabelle 4.5).
Tabelle 4.5 Gründe für den Erfolg von Interventionen (Stender, 2016, S. 206 ff.) Grund für den Erfolg/Misserfolg
Beschreibung
Nicht erfolgreiche Interventionen Zu offene Intervention
Der Impuls ist zu offen oder zu schwach, sodass die Lernenden die vorliegende Handlungsbarriere nicht überwinden konnten.
Unzureichende Diagnose
Aufgrund einer fehlenden Diagnose werden motivationale oder kognitive Aspekte der Lernenden nicht (korrekt) eingeschätzt.
Unzureichende fachliche Durchdringung
Die Intervention wird von den Lernenden nicht angenommen, da die fachliche Schwierigkeit nicht vollständig geklärt wird. Die Lehrperson war nicht fähig die fachliche Schwierigkeit zu identifizieren und diese mit den Lernenden zu klären. (Fortsetzung)
4.2 Wirksamkeit von Instruktionen und Interventionen
121
Tabelle 4.5 (Fortsetzung) Grund für den Erfolg/Misserfolg
Beschreibung
Kommunikation mit Einzelnen
Die Lehrperson kommuniziert nur mit einzelnen Gruppenmitgliedern, sodass diese isoliert werden und die übrigen Gruppenmitglieder nicht mitarbeiten.
Fragestellung mit Antwortoption
Durch Suggestivfragen oder zweifelndes Nachfragen nennt die Lehrkraft einen inhaltlichen Aspekt, den die Lernenden im Anschluss nennen oder bejahen. Die positive Reaktion der Lernenden ist jedoch keineswegs auf eine Einsicht in die Situation zurückzuführen, sondern stellt ein sozial erwünschtes Verhalten dar, das durch die Suggestion ermöglicht wird.
Fehlende Handlungsbereitschaft
In der Gruppe sind eine derart fehlende Handlungsbereitschaft und Motivation vorhanden, dass eine Intervention in Ausschöpfung aller Möglichkeiten keinen Erfolg hat.
Fehlende Ernsthaftigkeit Aufgrund einer fehlenden Ernsthaftigkeit auf Schülerseite entfaltet die Intervention keine Wirkung, da die Lernenden „herumspaßen“. Sinnvolles Handeln ohne Erfolg
Eine Intervention wirkt sinnvoll und angemessen, jedoch tritt keine Wirkung ein. Eventuell kann dies auf motivationale Probleme zurückgeführt werden, die zuvor nicht diagnostiziert werden konnten.
Erfolgreiche Interventionen Genaues Diagnostizieren
In zahlreichen Fällen führt allein eine diagnostische Intervention und die Selbsterklärung der Lernenden zu einer erfolgreichen Intervention, da bei den Lernenden Metakognition stattfindet. Im Anschluss gibt die Lehrkraft Hinweise zum weiteren Vorgehen oder eine Rückmeldung.
Bezug zum Modellierungskreislauf
Die Lehrkraft bezieht sich bei ihrer Intervention auf den Modellierungskreislauf. Sie regt an, zu Beginn Annahmen zu treffen und diese zu nutzen, zu einem späteren Zeitpunkt komplexer zu arbeiten und weitere Aspekte zu betrachten und zu validieren.
Ebenso wird ersichtlich, dass der Erfolg der Intervention im Wesentlichen auch von Schülermerkmalen wie der Motivation und Ernsthaftigkeit abhängt. Selbst wenn die Intervention im Hinblick auf die Schwierigkeit der Lernenden und die Situation adaptiv erscheint, muss diese nicht zwangsläufig erfolgreich sein (Stender, 2016, S. 220). Verschaffel, Greer und De Corte (2000, S. 41 f.) weisen darauf hin, dass
122
4
Empirische Befunde zu Interventionen
Lernende bei der Anwendung ungewohnter Kompetenzen geradezu eine Interventionsresistenz aufweisen können. Damit wird ersichtlich, dass es eventuell nicht in allen Fällen eine wirksame bzw. erfolgreiche Intervention geben kann. Bei den erfolgreichen Interventionen stellt die Aufforderung zur Präsentation des Arbeitsstandes (Genaues Diagnostizieren in Tabelle 4.5) in gleich zweifacher Hinsicht eine geeignete Intervention dar. Zum einen werden die Lernenden zur Metakognition angeregt, da sie ihre eigenen Überlegungen ordnen und übersichtlich darstellen. Dies regt eine Reflexion des eigenen Lösungsprozesses an, was zu einer eigenständigen Fortsetzung der Arbeit führt. Zum anderen verschaffen die Lernenden der Lehrperson die Möglichkeit einer genauen Diagnostik, auf deren Basis eine adaptive Intervention den Lösungsprozess weiter fördern kann (Stender & Kaiser, 2015; Vorhölter et al., 2013). Die Wirksamkeit von Selbsterklärungen wird auch von Renkl, Stark, Gruber und Mandl (1998) und anhand von Vorarbeiten von Chi et al. (1989) sowie von Neuman und Schwarz (1998) empirisch bestätigt. Auch auf den Modellierungskreislauf bezogene Interventionen (Bezug zum Modellierungskreislauf in Tabelle 4.5), die das Treffen von Annahmen, das Einbeziehen weiterer Aspekte oder zum Validieren anregen, ließen sich als erfolgreich klassifizieren (Stender, 2016, S. 224). Beide Arten von Interventionen lassen sich in beliebigen Modellierungsprozessen mit verschiedenen Lernenden und Modellierungsaufgaben anwenden. Strategische Hilfen anhand eines Lösungsplans (Adamek, 2018; Schukajlow et al., 2015) Schukajlow, Kolter und Blum (2015) evaluierten in einem quasi-experimentellen Design die Wirkung eines Lösungsplans auf die Modellierungskompetenz von 96 Realschülern der neunten Klasse. Dieser soll anhand von auf den Modellierungsprozess bezogenen strategischen Aufforderungen und Fragestellungen eine Stütze beim eigenständigen Modellieren bieten. Eine Kontrollgruppe (N = 48) sowie eine Experimentalgruppe mit Lösungsplan (N = 48) bearbeitete fünf Modellierungsaufgaben zu den Themengebieten Satz des Pythagoras und linearen Funktionen. Die Gruppen wurden anhand der operativ-strategischen Lehrmethode (vgl. Abschnitt 4.2.1.3) von derselben Lehrkraft unterrichtet. Der Lösungsplan stellt einen auf die vier Schritte Aufgabe verstehen, Mathematik suchen, Mathematik benutzen und Ergebnis erklären (Blum & Schukajlow, 2018; Schukajlow et al., 2015) reduzierten Modellierungskreislauf dar (vgl. Abschnitt 2.4.1). Der Lösungsplan in Form eines zusätzlichen Arbeitsblattes soll es der Lehrkraft und den Lernenden selbst ermöglichen, Hilfestellungen adaptiv zu gestalten und ihre Schwierigkeiten leichter zu diagnostizieren. Den Lernenden wird die Möglichkeit geboten, bei Schwierigkeiten oder fehlenden Strategien das Arbeitsblatt zur Hilfe
4.2 Wirksamkeit von Instruktionen und Interventionen
123
zu nehmen und eigenständig weiterzuarbeiten. Die Vermittlung solcher strategischen Hilfen kann auch durch die Lehrkraft erfolgen, sodass die oben beschriebenen Aufforderungen und Fragen auch für potentielle Interventionen in Frage kommen. Zur Sicherstellung einer korrekten Anwendung der Strategien sind ohnehin Interventionen notwendig (Schukajlow et al., 2015). Nach der zweitägigen Intervention konnte eine vermehrte Nutzung von Strategien in der Experimentalgruppe festgestellt werden. Alle Probanden steigerten signifikant ihre globale Modellierungskompetenz. Jedoch verbesserte sich die Experimentalgruppe im Themengebiet Satz des Pythagoras signifikant mehr (kleiner bis mittlerer Effekt). Differentielle Effekte zeigen sich auch bei der Betrachtung der Teilkompetenzen »Bilden eines mathematischen Modells« und »Interpretieren« mathematischer Ergebnisse. Während die Experimentalgruppe ihre Teilkompetenz »Bilden eines mathematischen Modells« ausschließlich im Themengebiet Satz des Pythagoras steigerte, verbesserte sie sich in der Teilkompetenz »Interpretieren« in beiden Themengebieten mehr als die Kontrollgruppe. Dass teilweise keine Verbesserung im Themengebiet lineare Funktionen festgestellt wurde, erklären die Autoren mit einer geringeren Passung des Lösungsplans zu diesem Themengebiet, sodass passende, auf den Modellierungsprozess bezogene Interventionen schließlich doch durch die Lehrkraft bereitgestellt wurden. Die Passung des Lösungsplans spielt demnach eine Rolle für die Leistungsentwicklung (Schukajlow et al., 2015). Adamek (2018) führte ebenfalls eine quasi-experimentelle Interventionsstudie mit Kontrollgruppe und Follow-Up-Test zur Wirkung eines Lösungsplans beim Erwerb von Modellierungskompetenzen durch. Sie verglich den Effekt einer vierstündigen Unterrichtsreihe in der neunten Klasse in einer Experimentalgruppe mit Lösungsplan (N = 342) mit dem in einer Kontrollgruppe (N = 355), wobei sie die Auswirkungen auf einzelne Modellierungsteilkompetenzen untersuchte. Der Lösungsplan hat aus diesem Grund eine fünfschrittige Struktur (Verstehen und Vereinfachen, Mathematisieren, Mathematische Arbeiten, Interpretieren, Kontrollieren (Adamek, 2018, S. 67)) und basiert auf vorherigen Arbeiten von Schukajlow und Blum (2018), Zöttl (2010) und Greefrath (2013, 2015). Kurzfristig führte der Lösungsplan in keiner der Teilkompetenzen zu einem größeren Effekt beim Erwerb der Modellierungsteilkompetenzen als in der Kontrollgruppe. Im Follow-Up-Test zeigte sich jedoch ein langfristig größerer Effekt des Lösungsplans auf die Teilkompetenzen »Vereinfachen« (tendenziell kleiner Effekt; Adamek, 2018, S. 118) und »Interpretieren« (kleiner bis mittlerer Effekt; Adamek, 2018, S. 123) als in der Kontrollgruppe. Die nicht eindeutig größeren Effekte in der Experimentalgruppe führt sie auf eventuelle Schwierigkeiten der Lernenden zurück, die Phasen Verstehen, Vereinfachen und Mathematisieren bzw. Interpretieren und Validieren zu unterscheiden (Adamek, 2018, S. 159 f., 163).
124
4
Empirische Befunde zu Interventionen
Zusammenfassend weist die Studie von Dann et al. (1999) in verschiedenen Fächern daraufhin, dass Interventionen mit einem niedrigen Situationsbezug aufgrund einer nicht ausreichenden Diagnostik kontraproduktiv sind. Ein hoher Situationsbezug und eine gute Umgangsqualität führen hingegen zu einer inhaltlichen Progression. Link (2011) stellte bei der Untersuchung strategischer Interventionen in mathematischen Problemlöseprozessen wirksame Gesprächsmuster fest, die zu einem Lernmoment führten. Die wirksamen Interventionen bestehen aus mehreren strategischen Interventionen auf verschiedenen Ebenen. Auch in kooperativen Modellierungsprozessen erhält die Wirksamkeit strategischer Interventionen durch die Studien von Schukajlow et al. (2015) und Adamek (2018) partiell eine Bestätigung. Durch einen Lösungsplan, der strategische Impulse bereitstellt, werden Modellierungskompetenzen von Schülerinnen und Schülern (langfristig) in einem größeren Umfang gefördert. Die Resultate der Studie von Stender (2016) bestätigen einige der genannten Befunde auch in kooperativen Modellierungsprozessen. Responsive Interventionen sind im Vergleich zu invasiven Interventionen häufiger wirksam. Eine fehlende Diagnostik kann für das Scheitern einer Intervention verantwortlich sein. Demgegenüber erwiesen sich Interventionen, die das Vorstellen des Arbeitsstandes fordern oder sich auf die Phasen des Modellierungskreislaufs bezogen als wirksam. Nachfolgend stellt sich die Frage, wie ein solch positives Interventionsverhalten effektiv vermittelt werden kann.
4.3
Förderung eines adaptiven Interventionsverhaltens
Wenige Studien untersuchten bisher systematisch, inwieweit sich das Interventionsverhalten von (angehenden) Lehrkräften hinsichtlich der beschriebenen positiven Verhaltensweisen verändern lässt. Für die vorliegende Arbeit ist insbesondere interessant, inwieweit eine Förderung im Rahmen universitärer fachdidaktischer Seminare möglich ist. Es werden Studien zur Förderung diagnostischer Kompetenzen sowie von Diagnose- und Interventionskompetenzen unterschieden, da lediglich eine der berichteten Studien eine ganzheitliche Förderung untersucht hat.
4.3.1
Förderung diagnostischer Kompetenzen
Bei der Förderung von diagnostischen Kompetenzen von Lehramtsstudierenden weisen insbesondere zwei Studien parallelen zur vorliegenden Arbeit
4.3 Förderung eines adaptiven Interventionsverhaltens
125
auf, wobei jeweils unterschiedliche Konstrukte betrachtet wurden. Heinrichs (2015) förderte die fehlerdiagnostische Kompetenz von MathematikLehramtsstudierenden, Treisch (2018) die professionelle Unterrichtswahrnehmung von Physik-Lehramtsstudierenden. Förderung fehlerdiagnostischer Kompetenzen (Heinrichs, 2015) Heinrichs (2015) förderte in vier Seminarsitzungen á 90 Minuten die fehlerdiagnostische Kompetenz von 138 Mathematik-Lehramtsstudierenden anhand von Videovignetten. Das Konstrukt der fehlerdiagnostischen Kompetenz konzeptualisiert sie als die kognitiven Fähigkeiten, den Fehler wahrzunehmen und die Ursache des Fehlers zu finden. Zusätzlich werden Präferenzen zum Umgang mit Fehlern erhoben, die sie den Überzeugungen zuordnet. Für die vorliegende Arbeit ist insbesondere die untersuchte Teilkompetenz zur Ursachendiagnose von Interesse. Anhand eines Testinstruments mit offenen und geschlossenen Items stellte Heinrichs (2015, S. 247 f.) eine signifikante Verbesserung der Kompetenz zur Ursachendiagnose im Rahmen eines kleinen Effekts fest. Im Hinblick auf die lediglich vierstündige Ausbildung ist dieser Effekt als beachtenswert anzusehen. Förderung der professionellen Unterrichtswahrnehmung (Treisch, 2018) Treisch (2018) förderte bei Physik-Lehramtsstudierenden anhand eines Lehr-Lern-Labor-Seminars die professionelle Unterrichtswahrnehmung, die gemeinsame Bestandteile mit diagnostischen Fähigkeiten aufweist. Die professionelle Wahrnehmung konzeptualisiert er nach Seidel und Stürmer (2014) aus den Komponenten des Noticing und Reasoning, wobei sich das Reasoning wiederum in die Dimensionen Beschreiben, Erklären und Vorhersagen von Unterrichtssituationen und ihrer Konsequenzen unterteilt. Die Gesamtfähigkeit wurde anhand geschlossener Rating-Items erhoben. Eine Versuchsgruppe absolvierte ausschließlich ein Seminar und vier Lehr-Lern-LaborSitzungen mit Schülerinnen und Schülern (N = 29). Eine andere Gruppe wurde anhand von Videoanalysen jeweils nach den Lehr-Lern-Labor-Sitzungen (N = 23) trainiert. Es wurde eine Kontrollgruppe (N = 19) erhoben, die kein Treatment durchlief. Bei Studierenden der Lehr-Lern-Labor-Gruppe wurde ein kleiner, nicht signifikanter Effekt im Vergleich zu Veränderungen in der Kontrollgruppe und unter Kontrolle der Pretestergebnisse festgestellt. Die Lehr-Lern-Labor-Video-Gruppe verbesserte sich hingegen signifikant im Rahmen eines kleinen bis mittleren Effekts (Treisch, 2018, S. 86). Aufgrund der geringen Stichprobengröße sind die Ergebnisse der Studie wenig verallgemeinerbar und der kleine Effekt kann nicht signifikant
126
4
Empirische Befunde zu Interventionen
nachgewiesen werden. Beide Studien liefern jedoch Hinweise darauf, dass eine Förderung von diagnostischen Kompetenzen anhand von Praxiselementen in der universitären Lehrerausbildung möglich ist.
4.3.2
Förderung von Diagnose- und Interventionskompetenzen
Studien zur Förderung von Diagnose- und Interventionskompetenzen anhand von Praxiselementen sind kaum zu finden. Stender (2016, S. 198) stellt basierend auf den Ergebnissen seiner Studie (vgl. Abschnitt 4.2.2.3) die Vermutung auf, dass allein durch die Ausbildung von Lehramtsstudierenden in einem fachdidaktischen Seminar das Interventionsverhalten verbessert werden kann (vgl. auch Vorhölter et al., 2013). Studierende wendeten nach Absolvierung eines Modellierungsseminars bevorzugt strategische oder inhaltlich-strategische Interventionen an. Da es sich bei der Studie jedoch nicht um eine Interventionsstudie handelt, sondern nur nach dem Treatment Daten erhoben wurden, kann kein kausaler Zusammenhang zwischen der Absolvierung des Seminars und einer Änderung des Interventionsverhaltens hergestellt werden. Es lässt sich eine Studie im Bereich des Sozialkundeunterrichts finden, in dessen Rahmen sowohl diagnostische als auch interventionsbezogene Kompetenzen gefördert wurden. Ein Prozessmodell als metakognitives Hilfsmittel (Van de Pol et al., 2014) Van de Pol et al. (2014) untersuchten in einer qualitativen Studie, inwieweit und mit welcher Qualität Lehrpersonen nach einer Lehrerfortbildung das Model of Contingent Teaching (Diagnostic strategies, Checking of diagnosis, Intervention strategies, Checking of student learning; vgl. Abschnitt 3.3.2) beim Intervenieren nutzten. 30 Sozialkundelehrer nahmen an der Studie teil, wobei 17 in einer zweistündigen Einführung das Model of Contingent Teaching kennenlernten. Durch die Reflexion von Unterrichtsstunden anhand von Videoaufzeichnungen wurden sie hinsichtlich der Nutzung des Modells trainiert. Die übrigen 13 Lehrkräfte erhielten keine Förderung. Die Probanden unterrichteten fünf Stunden zum Themengebiet der Europäischen Union, in denen Gruppenarbeitsprozesse stattfanden. Jeweils in der ersten und letzten Unterrichtstunde wurden Videoaufnahmen angefertigt, aus denen zufällig jeweils zwei Lehrer-Schüler-Interaktionen in der Gruppenarbeit zur Analyse ausgewählt wurden (Van de Pol et al., 2014). Zur Bestimmung der Häufigkeit der Nutzung des Model of Contingent Teaching wurden die einzelnen Interventionen den Phasen des Modells zugeordnet.
4.3 Förderung eines adaptiven Interventionsverhaltens
127
Die Qualität wurde einerseits danach beurteilt, ob Faktenwissen oder ein konzeptuelles Verständnis durch die Lehrkraft gefördert wurden. Sie kodierten zusätzlich, ob die Lehrkraft die Lernenden lediglich fragt, ob etwas verstanden wurde oder ob eine Erklärung verlangt wird. Zusätzlich wurde die Adaptivität der Interventionen erfasst, indem einerseits kodiert wurde, ob die Intervention dem Schülerverständnis angepasst ist (vgl. contingent shift principle in Abschnitt 3.3.2) und andererseits, ob die Intervention sich auf die Schüleräußerung bezieht. Anhand der Daten wurde jeweils ein Pre-Post-Vergleich durchgeführt (Van de Pol et al., 2014). Die Lehrkräfte der Versuchsgruppe forderten nach dem Treatment bei der Diagnostik signifikant häufiger zu Erklärungen auf als die Lehrkräfte der Kontrollgruppe (mittlerer Effekt). Zudem überprüften sie ihre Diagnose signifikant häufiger (kleiner Effekt). Die Qualität der Interventionen war in der Treatment-Gruppe signifikant höher als in der Kontrollgruppe, da die Interventionen mehr an das Schülerverständnis angepasst waren und sich mehr auf die Schüleräußerung bezogen (Van de Pol et al., 2014). Die Studienergebnisse liefern Hinweise darauf, dass das in der Lehrerfortbildung verwendete Prozessmodell Model of Contingent Teaching als metakognitives Hilfsmittel zu einer Verbesserung des Interventionsverhaltens von Lehrkräften beitragen kann. Die Schulung bestand aus einem theoretischen und praxisorientierten Teil, in dem das Interventionsschema angewendet wurde. Beide Teile der Fortbildung scheinen zur Förderung des Interventionsverhaltens notwendig zu sein. Die Ergebnisse sind jedoch im Hinblick auf die kleine Stichprobe und das qualitative und damit wenig reliable Messverfahren zu relativieren. Zusammenfassend illustrieren die berichteten Studien, dass eine Förderung von Diagnose- und Interventionskompetenzen anhand von Treatments mit TheoriePraxis-Verzahnungen möglich ist. Diagnostische Kompetenzen von Lehramtsstudierenden, wie die fehlerdiagnostische Kompetenz (Heinrichs, 2015) oder die professionelle Unterrichtswahrnehmung (Treisch, 2018), konnten anhand von Praxiselementen verbessert werden. Anhand einer Lehrerfortbildung förderten Van de Pol et al. (2014) sowohl Diagnose- als auch Interventionskompetenzen anhand der Reflexion von Unterrichtsstunden und Videoaufnahmen. Dabei diente ein Prozessmodell als metakognitives Hilfsmittel für die Lehrkräfte. Es besteht jedoch die Notwendigkeit die Ergebnisse anhand einer größeren Stichprobe und quantitativer Erhebungsinstrumente zu überprüfen. Inwiefern das Interventionsverhalten angehender Lehrkräfte durch universitäre fachdidaktische Veranstaltungen verbessert werden kann, stellt daher nach wie vor ein systematisch zu untersuchendes Forschungsdesiderat dar.
128
4.4
4
Empirische Befunde zu Interventionen
Zwischenfazit
Die deskriptiven Befunde veranschaulichen, dass nur ein kleiner Teil der selbst von erfahrenen Lehrkräften durchgeführten Interventionen als adaptiv zu bezeichnen ist (Tropper et al., 2015). Krammer (2009) beschreibt, dass lediglich 49 % der Interventionen als – potentiell – kognitiv aktivierend zu klassifizieren sind. Ob diese Interventionen tatsächlich kognitiv aktivierend auf die Lernenden gewirkt haben, wurde nicht analysiert. Die mit Lernenden der Sekundarstufe I durchgeführten Studien haben folgende Problemfelder bei der Unterstützung von kooperativen Bearbeitungsprozessen herausgestellt: • Lehrkräfte diagnostizieren nur selten explizit den Gruppenarbeitsprozess bzw. die Schwierigkeit im Bearbeitungsprozess (Fürst, 1999; Krammer, 2009; Leiss, 2007; Webb et al., 2006). • Lehrkräfte greifen häufig kontrollierend und lenkend in den Lösungsprozess ein. Eine festgestellte Ursache ist der eigene Anspruch an den Lösungsweg oder die Lösung der Aufgabe (Fürst, 1999; Leiss, 2007). • Ein Großteil der Interventionen ist invasiv und weisen negative Merkmale wie eine geringe Orientierung an den Schwierigkeiten und dem Lösungsprozess der Lernenden sowie einen hohen Grad der Lenkung auf (Fürst, 1999). • Lehrkräften wenden häufig inhaltliche Interventionen in Form von direkten oder indirekten Erklärungen mit einschrittigem Problemschluss an (Krammer, 2009; Leiss, 2007). Die Interventionen weisen ein niedriges Anspruchsniveau für die Lernenden auf (Webb et al., 2006). • Die Lehrgewohnheiten des Klassenunterrichts werden durch die Lehrkräfte auch im Gruppenunterricht angewendet (Leiss, 2007; Webb et al., 2006). Dies führt dazu, dass die Lernenden ihr Rollenverständnis im Klassenunterricht auch im Gruppenunterricht beibehalten, was die Qualität der Schülerdiskussion zu beeinträchtigen scheint (Webb et al., 2006). Insbesondere für die Bearbeitung von Modellierungsaufgaben ist das oben beschriebene Interventionsverhalten als ungünstig zu bezeichnen. Die Studienergebnisse zeigen, dass in kooperativen Modellierungsprozessen ein ähnliches Interventionsverhalten zu beobachten ist (vgl. Abschnitt 4.1). Das Verfolgen eigener Lösungsansätze und anspruchsvolle Diskussionen zwischen den Lernenden werden wenig gefördert und selbstregulative Tätigkeiten werden von der Lehrkraft übernommen. Im Hinblick auf die zu erwerbenden kognitiven, metakognitiven und sozialen Kompetenzen ist die festgestellte Praxis der Unterstützung von kooperativen Modellierungsprozessen als problematisch anzusehen.
4.4 Zwischenfazit
129
Die Problemfelder veranschaulichen die Notwendigkeit einer Aus- und Fortbildung von Lehrkräften hinsichtlich eines adäquaten Lehrerverhaltens in Gruppenarbeitsprozessen und – insbesondere – in kooperativen Modellierungsprozessen. Es müssen daher Möglichkeiten zur effektiven Vermittlung von Diagnose- und Interventionskompetenzen gefunden werden. Die beschriebenen Studien liefern Hinweise, dass Lehrveranstaltungen mit Praxiselementen das Interventionsverhalten von (angehenden) Lehrkräften positiv beeinflussen können. An diesem Punkt setzt die vorliegende Studie an und evaluiert verschiedene universitäre fachdidaktische Seminare mit Praxiselementen hinsichtlich ihrer Wirkung auf Diagnose- und Interventionskompetenzen. Um ein adäquates Lehrerverhalten vermitteln zu können, müssen in Ergänzung zu theoretischen Interventionskonzepten empirisch wirksame Hilfestellungen identifiziert werden. Die Ergebnisse der Wirksamkeitsstudien liefern Hinweise für allgemein adäquate und weniger adäquate Instruktionsverfahren und Interventionen. Instruktionen, die auf ein komplett eigenständiges Arbeiten der Lernenden abzielen, sind aufgrund der Gefahr der Bildung von Frustration, Orientierungslosigkeit und Fehlvorstellungen ungeeignet (Kirschner et al., 2006; Weinert, 1996b). Lazonder und Harmsen (2016) weisen einen mittleren bis großen Effekt der Bereitstellung verschiedener Hilfestellungen im forschenden Lernprozess sowohl auf den kurzfristigen Handlungserfolg als auch auf den längerfristigen Lernerfolg nach. Daraus lässt sich ableiten, dass eine Betreuung der Lernenden – insbesondere in kooperativen Modellierungsprozessen – unerlässlich ist (Blum & Schukajlow, 2018; Stender, 2016, S. 75). Die direkte Instruktion ist aufgrund ihrer geringen Selbstständigkeitsorientierung ebenso wenig geeignet wie ein komplett eigenständiger Lernprozess. Für den kurzfristigen Handlungserfolg erwiesen sich spezifischere Hilfestellungen, die direkter und inhaltlicher sind, als wirksamer. Sagt man Lernenden genau, was und wie sie es zu tun haben, lösen sie im Mittel mehr Aufgaben korrekt, was durchaus zu erwarten ist. Für den längerfristigen Lernerfolg konnten jedoch keine zu bevorzugenden Hilfestellungen ermittelt werden (Lazonder & Harmsen, 2016). Ein kurzfristiger Handlungserfolg, der durch eine spezifische Anleitung der Lehrkraft ermöglicht wird, führt nicht zwangsläufig zu einem langfristigen Lernerfolg, da bspw. Transferleistungen nicht erbracht werden können. Das Fehlen einer empirisch zu bevorzugenden Art von Hilfestellung kann als ein Argument für die Relevanz der Adaptivität der Hilfestellung gedeutet werden. Die Effektivität der Hilfestellungen könnte genauso mit spezifischen Inhalten zusammenhängen oder personenabhängig sein. Demnach ist weniger entscheidend, ob, sondern vielmehr wie und wann eine Hilfestellung eingesetzt wird (Krammer, 2009, S. 138; Meloth & Deering, 1999,
130
4
Empirische Befunde zu Interventionen
S. 248). Ein hoher Situationsbezug und eine gute Umgangsqualität wirken sich nachweislich positiv auf den Lösungsprozess der Lernenden aus (Haag, 1999). Wirksamkeitsstudien, die im Mathematikunterricht durchgeführt wurden, weisen auf die Wirksamkeit metakognitiver, prozessbezogener oder strategischer Hilfestellungen hin (Dekker & Elshout-Mohr, 2004; Kramarski et al., 2002; Link, 2011). Die Bandbreite der Interventionen erstreckt sich von Hilfestellungen, die auf die Förderung der Diskussion unter den Lernenden, die bewusste Steuerung und Reflexion des Lösungsprozesses und das Rechtfertigen des eigenen Ansatzes abzielen (Dekker & Elshout-Mohr, 2004; Kramarski et al., 2002). Strategische Interventionen in Problemlöseprozessen, die Qualitätskriterien einer guter Gesprächsführung folgen, bestehen aus mehreren strategischen Interventionen auf verschiedenen Ebenen (Link, 2011). Speziell in kooperativen Modellierungsprozessen deuten Forschungsergebnisse aus dem DISUM-Projekt darauf hin, dass selbstständigkeitsorientierte Instruktionsformen notwendig sind, um Modellierungskompetenzen zu erwerben, und direktiveren Instruktionsformen überlegen sind. So zeichnet sich das operativ-strategische Unterrichtsverfahren (vgl. Abschnitt 4.2.1), in dem die Lehrkraft individuelle Lösungsprozesse der Lernenden adaptiv unterstützt, ohne deren Selbstständigkeit einzuschränken, sowohl durch Zuwächse im kognitiven (Modellierungskompetenz) als auch im affektiven Bereich (Freude und Interesse) aus (Blum & Schukajlow, 2018). Die Lehrkraft muss über ein möglichst großes Repertoire an unterschiedlichen wirksamen Interventionen verfügen, die sie situationsangemessen einsetzen kann. Diese Interventionen müssen den Lernenden eine genügend starke bzw. spezifische Hilfe bieten, um produktiv weiterarbeiten zu können. Gleichzeitig muss die Selbstständigkeit der Lernenden durch einen möglichst geringen inhaltlichen Eingriff (Aebli, 1983, S. 300) erhalten bleiben sowie deren kognitive Aktivität (Krammer, 2009, S. 134) angeregt werden. Damit soll zudem eine Übertragung der Verantwortung für die Lösung der Aufgabe (Van de Pol et al., 2010) einhergehen. Tanner und Jones (1995) stellen fest, dass dies in mathematischen Modellierungsprozessen anhand von metakognitiven und reflexiven Fragestellungen gelingen kann, die den Lernenden zunächst eine Orientierung bei der Bearbeitung geben und im weiteren Verlauf ein selbstständigeres Arbeiten ermöglichen. In der Studie von Stender (2016) wirken sich das Vorstellen des Arbeitsstandes durch die Lernenden oder Interventionen mit Bezug zum Modellierungskreislauf günstig auf den Arbeitsprozess aus. Rückmeldende oder inhaltliche Interventionen können ebenso zu metakognitiven Prozessen bei den Lernenden führen, die jedoch kein Garant für einen Fortschritt im Lösungsprozess sind (Vorhölter et al., 2013). Bei schwerwiegenden Verständnisproblemen erscheint eine inhaltliche Intervention nach wie vor angebracht und sinnvoll. Die Befunde zum Einsatz von Lösungsplänen liefern
4.4 Zwischenfazit
131
Hinweise, dass sich auch in mathematischen Modellierungsprozessen strategische Interventionen zur Unterstützung des selbstständigkeitsorientierten Erwerbs von Modellierungskompetenzen eignen (Adamek, 2018; Schukajlow et al., 2015). Die dargestellten Studien weisen darauf hin, dass in kooperativen Modellierungsprozessen (Adamek, 2018; Blum & Schukajlow, 2018; Schukajlow et al., 2015; Stender, 2016; Tanner & Jones, 1995) genauso wie im Mathematikunterricht (Dekker & Elshout-Mohr, 2004; Kramarski et al., 2002; Link, 2011) strategische, metakognitive und reflexive Interventionen wirksam zu sein scheinen. Diese Interventionen werden in Tabelle 4.6 zusammengefasst. Studien in verschiedenen Fächern weisen darauf hin, dass eine Unterstützung notwendig ist und dass sich keine eindeutig überlegene Hilfestellung identifizieren lässt (Lazonder & Harmsen, 2016). Die dargestellten Studienergebnisse zeigen also ein uneinheitliches Bild. Einer bestimmten Art von Intervention kann keine generelle Wirksamkeit zugesprochen werden (Leiss, 2007, S. 81) – es gibt kein Erfolgsrezept. Der Erfolg einer Intervention hängt sowohl von Schülermerkmalen, als auch vom aktuellen Lösungsprozess ab (Vorhölter et al., 2013). Es kann vermutet werden, dass die Adaptivität der Intervention das entscheidende Merkmal darstellt und für deren Wirksamkeit hinsichtlich der inhaltlichen Progression des selbstständigen Lösungsprozesses und des Lernerfolgs bedeutsam ist (Diegritz et al., 1999; Fürst, 1999; Haag, 1999).
Tabelle 4.6 Empirisch wirksame Arten von Hilfestellungen Bezeichnung der Hilfestellungen
Beispiele für zugehörige Hilfestellungen
Metakognitive Fragen (Kramarski et al., 2002) Comprehension Questions
“What is the problem/task all about?”; “What is the question?”; “What are the meanings of the mathematical concepts?”
Connection Questions
“How is this problem/task different from/similar to what you have already solved?”
Strategic Questions
“What strategy/tactic/principle can be used in order to solve the problem/task?”; “Why is this strategy/tactic/principle most appropriate for solving the problem/task?”; “How can I organize the information to solve the problem/task?”; “How can the suggested plan be carried out?” (Fortsetzung)
132
4
Empirische Befunde zu Interventionen
Tabelle 4.6 (Fortsetzung) Bezeichnung der Hilfestellungen
Beispiele für zugehörige Hilfestellungen
Reflection Questions
“What am I doing?”; “Does it make sense?”; “What difficulties/feelings do I face in solving the task?”; “How can I verify the solution?”; “Can I use another approach for solving the task?”
Prozessbezogene Hilfestellungen (Dekker & Elshout-Mohr, 2004) Show work
“What are you doing?”; “What have you got?”
Explain work
“Why are you doing that?”; “How did you get that?”
Justify work
“But that’s wrong, because …”
Reconstruct work
“No, your justification isn’t right, because …”
Lösungsplan (Schukajlow et al., 2015) Aufgabe verstehen
„Lies den Aufgabentext (noch einmal) genau durch!“; „Stell dir die Situation konkret vor!“; „Mach eine Skizze und beschrifte sie!“
Mathematik suchen
„Suche die wichtigen Angaben und ergänze falls nötig fehlende Angaben!“; „Beschreibe den mathematischen Zusammenhang zwischen den Angaben!“
Mathematik benutzen
„Was weißt du zu diesem mathematischen Thema? Wende es hier an!“; „Falls das nicht geklappt hat: Kannst du noch ein anderes mathematisches Verfahren anwenden?“
Ergebnis erklären
„Runde dein Ergebnis sinnvoll!“; „Überschlage, ob dein Ergebnis als Lösung ungefähr passt!“; „Schreibe einen Antwortsatz auf!“
5
Adaptive Interventionskompetenz in kooperativen Modellierungsprozessen
In diesem Kapitel wird das in dieser Arbeit untersuchte Konstrukt der adaptiven Interventionskompetenz in mathematischen Modellierungsprozessen anhand der vorgestellten Theorie (vgl. Kapitel 2–4) hergeleitet und begründet. Es wird ein Prozessmodell vorgestellt, das Interventionen speziell in mathematischen Modellierungsprozessen charakterisiert. Dazu wird sich an der Struktur der vorgestellten Prozessmodelle orientiert (Leiss, 2007, S. 82; Van de Pol et al., 2012). Die in den Abschnitten 3.3.2 und 3.3.4 beschriebenen Prozessmodelle bestehen jeweils aus einem diagnostischen und interventionsbezogenen Teil. Van de Pol et al. (2012) unterscheiden in ihrem Model of Contingent Teaching zwischen der Anwendung von diagnostischen Strategien, in der offene Fragen zur Überprüfung des Schülerverständnisses gestellt werden, und Interventionsstrategien, die an das Schülerverständnis und die Antwort der Lernenden angepasst werden. Jeweils im Anschluss wird die Anwendung der Strategien evaluiert, um deren Wirksamkeit sicherzustellen. Van de Pol et al. (2012) verwendeten dieses Modell in einer Studie als metakognitives Hilfsmittel im Interventionsprozess. Mithilfe des Modells konnten Lehrkräfte die Qualität – insbesondere die Adaptivität – ihrer Lernunterstützung verbessern (vgl. Abschnitt 4.3). Leiss (2007, S. 82) differenziert sein rein deskriptives Prozessmodell adaptiver Interventionen in das Verschaffen einer Erkenntnisgrundlage und Merkmale der Intervention. Das Verschaffen einer Erkenntnisgrundlage stellt einen diagnostischen Schritt dar, in dem der Intervenierende sich Informationen über die Problemsituation und die Schwierigkeit verschafft. Der interventionsbezogene Teil wird anhand der Ebene der Intervention (organisatorisch, affektiv, strategisch, inhaltlich) und verschiedener anderer Merkmale (Absicht, Länge, Adressat, …) charakterisiert.
© Der/die Herausgeber bzw. der/die Autor(en), exklusiv lizenziert durch Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2020 H. Klock, Adaptive Interventionskompetenz in mathematischen Modellierungsprozessen, Studien zur theoretischen und empirischen Forschung in der Mathematikdidaktik, https://doi.org/10.1007/978-3-658-31432-3_5
133
134
5
Adaptive Interventionskompetenz
Leiss (2007, S. 66 f) stellt fest, dass „der Lehrer bei einem derart komplexen Vorgehen über zwei zentrale Kompetenzen verfügen muss, nämlich Diagnoseund Interventionskompetenz.“ Neben ihm betonen weitere Autoren die Wichtigkeit einer vorherigen Diagnostik für die Intervention (Hascher, 2003; Leiss, 2007; Smit et al., 2013; Van de Pol et al., 2012 u. v. m.). Weinert (2000) weist die diagnostische Kompetenz neben der Sachkompetenz, der didaktischen Kompetenz und dem Klassenmanagement als eine von vier zentralen Kompetenzbereichen aus, über die eine Lehrkraft zur Durchführung eines guten Unterrichts verfügen muss. Helmke & Schrader (1987) wiesen einen Interaktionseffekt zwischen einer hohen Urteilsgenauigkeit und dem Einsatz individualisierter Hilfestellungen auf den Lernerfolg empirisch nach. Stender (2016, S. 206 ff.) zeigte zudem, dass eine fehlende Diagnostik für das Scheitern von Interventionen verantwortlich sein kann. Da für eine adaptive Intervention sowohl diagnostische (vgl. Abschnitt 5.1) als auch interventionsbezogene (vgl. Abschnitt 5.2) Aspekte notwendig erscheinen, werden im Folgenden beide Kompetenzen in Bezug auf kooperative Modellierungsprozesse getrennt beschrieben. Im Anschluss wird ihr Zusammenspiel in einer idealtypischen adaptiven Intervention in mathematischen Modellierungsprozessen in einem Prozessmodell veranschaulicht (vgl. Abschnitt 5.3).
5.1
Diagnostizieren in kooperativen Modellierungsprozessen
Diagnosetätigkeiten im Bildungs- und Erziehungskontext werden anhand des Begriffs der Pädagogischen Diagnostik beschrieben. Ingenkamp und Lissmann (2008) definieren diesen Begriff wie folgt: Pädagogische Diagnostik umfasst alle diagnostischen Tätigkeiten, durch die bei einzelnen Lernenden und den in einer Gruppe Lernenden Voraussetzungen und Bedingungen planmäßiger Lehr-Lernprozesse ermittelt, Lernprozesse analysiert und Lernergebnisse festgestellt werden, um individuelles Lernen zu optimieren. Zur Pädagogischen Diagnostik gehören ferner die diagnostischen Tätigkeiten, die die Zuweisung zu Lerngruppen oder zu individuellen Förderungsprogrammen ermöglichen sowie die mehr gesellschaftlich verankerten Aufgaben der Steuerung des Bildungsnachwuchses oder der Erteilung von Qualifikationen zum Ziel haben. (Ingenkamp & Lissmann, 2008, S. 13)
Die diagnostischen Tätigkeiten werden dabei unter Beachtung wissenschaftlicher Gütekriterien durchgeführt und die Beobachtungs- und Befragungsergebnisse interpretiert und mitgeteilt (Ingenkamp & Lissmann, 2008, S. 13). Für die vorliegende
5.1 Diagnostizieren in kooperativen Modellierungsprozessen
135
Arbeit ist insbesondere der erste Satz der Definition von Bedeutung, da er sich auf die Optimierung von Lehr-Lern-Prozessen bezieht. Um die Diagnostik in kooperativen Modellierungsprozessen genauer zu beschreiben, werden im Folgenden verschiedene Aspekte Pädagogischer Diagnostik thematisiert. Im pädagogischen Bereich unterscheidet man zwischen den Diagnoseformen Ergebnis- und Prozessdiagnostik. Die pädagogische Maßnahme wird bei der Ergebnisdiagnostik anhand eines Produkts beurteilt. Löst ein Lernender eine Aufgabe in einer Klausur korrekt, ist dies ein Indiz für seine Leistungsfähigkeit. Diese Form der Diagnostik wird regelmäßig nach umfangreichen Lerneinheiten durchgeführt, um den Lernerfolg abschließend zu bestimmen. Die Ergebnisdiagnostik wird daher mit dem Begriff der summativen Evaluation in Verbindung gebracht. Wird der Erfolg der pädagogischen Maßnahme am Verlauf des Lernprozesses beurteilt, findet eine Prozessdiagnostik statt. Durch sie kann nachvollzogen werden, wie ein Produkt zustande gekommen ist. Sie liefert Informationen darüber, wie ein unterrichtlicher Ablauf beeinflusst werden muss, um ihn optimal anzupassen. Die Prozessdiagnostik stellt eine formative Evaluation dar, bei der aufeinander folgende Messungen in möglichst geringem Abstand Veränderungen erfassen (Ingenkamp & Lissmann, 2008, S. 32 f). Hinsichtlich des Ziels der Diagnostik unterscheidet man zwischen der Selektions- und Modifikations- bzw. Förderdiagnostik. Die Selektionsdiagnostik soll zu einer Entscheidung kommen, die Personen zu einer pädagogischen Maßnahme, bspw. einer Schulform, zuordnen. Dabei werden entweder Personen Maßnahmen (Personenselektion) oder Bildungsangebote den Personen (Bedingungsselektion) zugeordnet. Bei der Modifikations- bzw. Förderdiagnostik steht nicht die Zuordnung, sondern die Veränderung des Verhaltens der Personen oder der Lernbedingungen im Vordergrund. Dabei wird sich an einem zu erreichenden Verhaltensziel, bspw. der Beherrschung der Bruchrechnung, orientiert (Ingenkamp & Lissmann, 2008, S. 33 f). Schließlich lässt sich die Diagnostik nach ihrer Methodik unterscheiden. Hier lassen sich formelle und informelle Methoden differenzieren. Die formelle Diagnostik zeichnet sich durch ein zielgerichtetes und wissenschaftliches Vorgehen aus. Die Erhebungsmethodik wird kontrolliert und reflektiert. Dadurch entsteht ein datenbasiertes explizites Urteil, das verbalisiert werden kann (Helmke, 2009, S. 122; Schrader, 2008). Die formelle Diagnostik ist aufgrund ihrer strengen Methodik im schulischen Kontext kaum durchzuführen (Hascher, 2008). Sie bringt hohe Ansprüche für den Unterrichtsalltag mit sich und lässt sich nur schwierig in diesen integrieren. Bei der informellen Diagnostik handelt es sich um nicht zwingend absichtliche „implizite subjektive Urteile, Einschätzungen und Erwartungen, die
136
5
Adaptive Interventionskompetenz
eher beiläufig und unsystematisch im Rahmen des alltäglichen erzieherischen Handelns gewonnen werden“ (Helmke, 2009, S. 122). Implizite Urteile sind nicht verbalisierbar, da sie häufig wenig bewusst oder unbewusst zustande kommen (Hascher, 2008). Die Aufmerksamkeit der Lehrkraft ist häufig auf andere Aspekte ausgerichtet und die Diagnostik wird anhand von subjektiv bedeutsamen Indikatoren vorgenommen (Barth, 2010, S. 17; Heinrichs, 2015, S. 12 f.). Unbewusste Effekte, bspw. subjektive Theorien („Jungen sind eher in den Naturwissenschaften begabt.“), verzerren die Wahrnehmung. Der von Hascher (2008) eingeführte Begriff der semiformellen Diagnostik bildet einen Mittelweg zwischen diesen beiden Formalitätsgraden. Sie stellt „die Gesamtheit aller diagnostischen Tätigkeiten, die nicht den Kriterien der formellen Diagnostik genügen, aber nicht nur zu impliziten Urteilen führen“ (Hascher, 2008, S. 75) dar. Eine Diagnostik ist bspw. semiformell, wenn Beobachtungen gezielt, aber ohne strenge Methodik durchgeführt werden oder, wenn Beobachtungen intuitiv durchgeführt werden, aber explizit in die Bewertung einfließen. In Bezug auf die Unterstützung kooperativer Modellierungsprozesse diagnostiziert die Lehrkraft simultan mehrere Schülerinnen und Schüler, die gemeinsam in Kleingruppen arbeiten (vgl. Abschnitt 2.4 und 3.1.3). Sie diagnostiziert bei der Unterstützung des Modellierungsprozesses die Leistung, das Leitungspotential und leistungsrelevante Persönlichkeitsmerkmale (Anders, Kunter, Brunner, Krauss, & Baumert, 2010) mehrerer Lernender. Zusätzlich sind situative Merkmale des Unterrichtskontextes relevant (Leiss, 2007, S. 82). Dies geschieht im Rahmen einer Prozessdiagnostik, da die Entstehung des Lernproduktes nachvollzogen wird und Informationen über optimale unterrichtliche Adaptionen gewonnen werden sollen. Ziel ist die Modifikation des Lösungsprozesses anhand einer Mikroadaption (Corno & Snow, 1986; Schrader, 2008) in Form einer adaptiven Intervention. Dadurch sollen eine potentielle Schwierigkeit überwunden und ein selbstständiger Arbeitsprozess ermöglicht werden (Leiss, 2007, S. 82). Dabei kommt eine semiformelle oder informelle Diagnostik anhand von Beobachtungen und/oder Interviews mit den Lernenden zum Einsatz (Schrader & Helmke, 2001). Diese führt bestenfalls zu einem expliziten Urteil, das eine kriteriengeleitete Auswahl einer adaptiven Intervention erlaubt. Beginnt die Lehrkraft mit der Diagnostik in einer Kleingruppe, muss sie eine potentielle Schwierigkeit zunächst identifizieren. Die in Abschnitt 2.5.1 dargestellten Studien zu Schwierigkeiten im Modellierungsprozess (Galbraith & Stillman, 2006; K. Maaß, 2004; Schaap et al., 2011; Stillman et al., 2013) strukturieren potentielle Schwierigkeiten anhand der Modellierungsphasen, in denen sie typischerweise auftreten. Aus diesem Grund ist zunächst die Diagnostik der Modellierungsphase
5.2 Intervenieren in kooperativen Modellierungsprozessen
137
sinnvoll, in der sich die Gruppe aktuell befindet. Dies ermöglicht eine fokussierte Identifikation einer potentiellen Schwierigkeit im Modellierungsprozess. Borromeo Ferri und Blum (2010; vgl. auch Borromeo Ferri, 2018) erachten die Diagnostik der Modellierungsphase und von Schwierigkeiten als eine wesentliche Kompetenz bei der Unterstützung von Schülerinnen und Schülern. Neben den Modellierungsphasen zugeordneten Schwierigkeiten treten auch im metakognitiven, affektiven, sozialen und organisatorischen Bereich Schwierigkeiten auf. Diese haben das Potential die in den Modellierungsphasen auftretenden Schwierigkeiten zu erklären (vgl. Abschnitt 2.5.3). Anhand der den Modellierungsprozess übergreifenden Kategorien kann eventuell die Ursache der Schwierigkeit diagnostiziert werden. Um dem Anspruch einer semiformellen Diagnostik zu genügen, muss die Lehrkraft zu einem bewussten und verbalisierbaren Urteil gelangen. Dieses Urteil dient zur Ableitung eines Förderziels und damit als Grundlage für den folgenden Interventionsprozess. Die obigen Ausführungen veranschaulichen, dass es sich bei der Diagnostik um einen komplexen Prozess handelt, der aufgrund der Vielzahl an simultan zu beurteilenden situativen und personellen Merkmalen hohe Anforderungen an Lehrkräfte stellt. In der vorliegenden Arbeit wird die Kompetenz hinsichtlich ihres Anforderungskontextes eingegrenzt, um sie empirisch messbar zu machen (Hartig, 2006). Die kognitiven Fähigkeiten, in einer konkreten Situation die Modellierungsphase und eine potentielle Schwierigkeit zu identifizieren sowie ein Förderziel festzulegen (explizites Urteil), wird im Folgenden als Diagnosekompetenz in mathematischen Modellierungsprozessen bezeichnet. Neben diesen Diagnosekompetenzen sind zur adäquaten Unterstützung von kooperativen Modellierungsprozessen Interventionskompetenzen notwendig.
5.2
Intervenieren in kooperativen Modellierungsprozessen
Zur Beurteilung der Qualität von Interventionen werden die Kriterien adaptiver Interventionen (vgl. Abschnitt 3.3.4) nach Leiss (2007, S. 82) herangezogen. Eine adaptive Intervention hat nach ihrer Definition folgende Merkmale: 1. Sie basiert auf Wissen und/oder einer Diagnose. 2. Sie ist inhaltlich-methodisch an das Kompetenzniveau der Lernenden und den individuellen Lösungsprozess angepasst. 3. Sie ist minimal.
138
5
Adaptive Interventionskompetenz
4. Sie ist selbstständigkeitserhaltend. 5. Sie hat eine positive Wirkung auf den Lernprozess, indem eine Schwierigkeit überwunden wird und die Lernenden selbstständig weiterarbeiten. Es ist ersichtlich, dass die Merkmale in unterschiedlichen Phasen des Interventionsprozesses eine Rolle spielen. Die (1.) Diagnostik bildet das erste Merkmal und wurde im vorherigen Unterkapitel beschrieben. Die restlichen Merkmale beziehen sich auf die Intervention selbst. Hinsichtlich des Interventionsprozesses lassen sich drei verschiedenen Kompetenzen unterscheiden. Die a-priori-Interventionskompetenz ist für die Bewertung und Auswahl einer – potentiell – adaptiven Intervention aus dem Interventionsrepertoire vor der Handlung notwendig. Dazu muss die Lehrkraft über Wissen bezüglich der Wirkung verschiedener Arten von Interventionen verfügen. Sie bewertet mithilfe der expliziten Diagnose, inwiefern mögliche Interventionen (2.) inhaltlich-methodisch angepasst, (3.) minimal und (4.) selbstständigkeitserhaltend sind. Hierbei handelt es sich um „unmittelbare[n] und spontane[n] Kognitionen“ (Brühwiler, 2014, S. 87), die aufgrund des Handlungsdrucks je nach Situation unter Zeitdruck ablaufen. Diese rein kognitiven Prozesse finden vor der Intervention – also a priori – statt und werden in der vorliegenden Arbeit untersucht. Insbesondere für die Bewertung von Punkt (3.) und (4.) liefern die in Abschnitt 4.2 vorgestellten Studien Hinweise für potentiell adaptive Interventionen. Metakognitive, prozessbezogene oder strategische Hilfestellungen (Dekker & Elshout-Mohr, 2004; Kramarski et al., 2002; Schukajlow et al., 2015) haben das Potential, wenig inhaltlich, also minimal, in den Lösungsprozess einzugreifen und die Selbstständigkeit durch die kognitive Aktivierung der Lernenden zu erhalten. Das Vermitteln von (Lern- und Lösungs-)Strategien lässt für die Lernenden offen, wie genau eine Aufgabe zu lösen ist und sie nehmen daher nur indirekt inhaltlich Einfluss auf den Lösungsprozess (Leiss, 2007, S. 80). Stender (2016, S. 253 ff.; vgl. Abschnitt 2.3.2) gibt Beispiele für Interventionen an, die auf heuristischen Strategien basieren. Solche Interventionen weisen eine geringere Stärke (Zech, 1996, S. 315 ff.) bzw. Spezifität (De Jong & Lazonder, 2014; vgl. Abschnitt 2.3.3) auf. Hinsichtlich der Bewertung einer Intervention als potentiell adaptiv ist aber auch eine bewusste Nicht-Intervention denkbar (Leiss, 2007, S. 78).
5.2 Intervenieren in kooperativen Modellierungsprozessen
139
Es erscheint jedoch keineswegs zwingend notwendig – auch wenn die empirischen Erkenntnisse die damit verbundene große Gefahr belegen –, dass durch inhaltliche Interventionen die Selbstständigkeit der Schüler stärker als bei den anderen Interventionsebenen eingeschränkt wird; insbesondere dann nicht, wenn, wenn dadurch Probleme, wie z. B. die Resignation/Frustration überwunden bzw. vermieden werden, … (Leiss, 2007, S. 80)
Aus dem Zitat wird ersichtlich, dass durchaus auch inhaltliche Interventionen die oben genannten Kriterien erfüllen können. Anhand der Diagnose der Problemsituation erscheint es hinsichtlich der (2.) inhaltlich-methodischen Passung sinnvoll, nach der Durchführung mehrerer strategischer Interventionen und bei nur noch wenig verbleibender Bearbeitungszeit inhaltlich zu intervenieren (vgl. gestuftes Intervenieren in Abschnitt 3.3.3). So wird auch in dieser Situation den Lernenden die Möglichkeit gegeben maximal eigenständig zu einer Lösung zu gelangen und einer Frustration vorzubeugen. Hinsichtlich der Wirkung von Interventionen besteht vor allem im Hinblick auf verschiedene situative Gegebenheiten weiterer Forschungsbedarf. Hat die Lehrkraft sich für eine potentiell adaptive Intervention entschieden, kommen Handlungskompetenzen zum Tragen. Die ausgewählte Intervention muss anhand von Mimik, Gestik und Sprache so umgesetzt werden, dass die intendierte Wirkung erzielt wird. Da Handlungskompetenzen nicht im Fokus dieser Arbeit stehen, wird an dieser Stelle auf diesen Aspekt nicht näher eingegangen. Im Anschluss an die Durchführung bewertet die Lehrkraft die (5.) Wirkung der Intervention, d. h. ob die Schwierigkeit überwunden ist und ein selbstständiges Weiterarbeiten stattfindet. Die Fähigkeit, diesen kognitiven Prozess adäquat durchzuführen, wird als a-posteriori-Interventionskompetenz bezeichnet, da er nach der Intervention stattfindet. Die Adaptivität einer Intervention kann abschließend erst im Nachhinein festgestellt werden. Die Evaluation der Intervention ist daher ein bedeutender Schritt im Interventionsprozess. Studienergebnisse veranschaulichen, dass die Adaptivität der Intervention entscheidend für die inhaltliche Progression des Lösungsprozesses (Fürst, 1999) und den Erwerb von Modellierungskompetenzen ist (Blum & Schukajlow, 2018). Kommt der Intervenierende zum dem Schluss, dass seine Intervention abschließend nicht adaptiv war, ist ein neuer Bewertungsprozess notwendig. Die drei Interventionskompetenzen beschreiben idealtypisch die Phasen eines Interventionsprozesses. Link (2011; vgl. Abschnitt 3.2.2) stellte in ihrer Studie fest, dass Interventionen, die den Regeln guter Gesprächsführung folgen, aus mehreren Interventionen auf verschiedenen strategischen Ebenen bestehen. Der Prozess wird daher in der Praxis in der Regel mehrmals durchlaufen. Zur Evaluation der Intervention können bspw. diagnostische Fragen notwendig sein, die wiederum a-priori-Interventions- und Handlungskompetenzen erfordern.
140
5.3
5
Adaptive Interventionskompetenz
Prozessmodell adaptiver Interventionen
Ein Ziel dieser Arbeit ist die Förderung der oben beschriebenen Kompetenzen von Lehramtsstudierenden. Aufgrund des hohen Anspruchs adaptiver Interventionen – insbesondere bei der Betreuung von kooperativen Modellierungsprozessen – wurde in Anlehnung an die Prozessmodelle von Leiss (2007) und van de Pol et al. (2012) ein Prozessmodell für adaptive Interventionen in kooperativen Modellierungsprozessen entwickelt (vgl. Abbildung 5.1). Die Unterscheidung eines diagnostischen und interventionsbezogenen Teils wurde aus den beiden Prozessmodellen übernommen. Die beiden Teile wurden jeweils in Bezug auf mathematische Modellierungsprozesse ausgedeutet, sodass die dargestellte differenzierte Phasenstruktur entsteht. Die Inhalte des Situationswissens wurden aus der Studie von Leiss (2007, S. 78) übernommen, in der mathematische Modellierungsprozesse untersucht wurden.
Abbildung 5.1 Prozessmodell adaptiver Interventionen. (In Anlehnung an Leiss, 2007, S. 82; Van de Pol et al., 2012)
Der Interventionsprozess beginnt mit potentiellen Schwierigkeiten im Lösungsprozess. Die Schritte 1 und 2 bilden den diagnostischen Teil des Prozessmodells (vgl. Abschnitt 5.1), zu dessen Durchführung die Diagnosekompetenz notwendig ist. Tritt eine Schwierigkeit auf, muss diese zunächst mithilfe von semi- oder informellen Beobachtungen und Gesprächen mit den Lernenden diagnostiziert werden. Anhand der Diagnostik der Modellierungsphase (Schritt 1) erlaubt das Wissen über typische Schwierigkeiten (vgl. Abschnitt 2.5.3) eine fokussierte Diagnostik (Schritt 2). Das Wissen über die Wirkung verschiedener Interventionen erlaubt
5.3 Prozessmodell adaptiver Interventionen
141
die Auswahl einer adaptiven Intervention anhand der beschriebenen Kriterien (vgl. Abschnitt 3.3.4). Das Situationswissen hat dabei einen wesentlichen Einfluss auf den Bewertungsprozess. Dabei ist auch eine bewusste Nicht-Intervention denkbar (Leiss, 2007, S. 78). Für diesen Bewertungsprozess ist die a-prioriInterventionskompetenz notwendig. Handlungskompetenzen steuern anschließend die Durchführung der Intervention. Die Evaluation der Intervention findet anhand der a-posteriori-Interventionskompetenz statt. Da der Interventionsprozess häufig mehrmals durchlaufen wird, ist er in Form eines Kreislaufs angeordnet. Wird die Intervention als nicht-adaptiv evaluiert, beginnt der Prozess von vorn. Wird die Intervention als adaptiv bewertet, führt sie zu einer Überwindung der Schwierigkeit und zum selbstständigen Weiterarbeiten der Schülerinnen und Schüler. Die Fähigkeit, den gesamten Prozess erfolgreich durchzuführen, wird zusammenfassend als adaptive Interventionskompetenz in mathematischen Modellierungsprozessen bezeichnet. In dieser Arbeit werden ausschließlich die beiden Teilkompetenzen – die Diagnose- und a-priori-Interventionskompetenz – betrachtet, da die adaptive Interventionskompetenz neben kognitiven Leistungsdispositionen auch Handlungskompetenzen erfordert. Die beiden Teilkompetenzen werden aus pragmatischen Gründen unter dem Begriff der adaptiven a-prioriInterventionskompetenz zusammengefasst. Im Sinne eines Kompetenzbegriffs im engeren Sinne (vgl. Abschnitt 2.3.1) werden diese Teilkompetenzen als kognitive Leistungsdispositionen von Lehramtsstudierenden anhand von verschiedenen Anforderungssituationen erfasst. Betrachtet man den Kompetenzbegriff als ein Kontinuum zwischen Leistungsdisposition und Handlungskompetenz (vgl. Abschnitt 1.3.1; Blömeke et al., 2015), zeichnet sich die adaptive a-priori-Interventionskompetenz durch die im PID-Modell beschriebenen Prozesse Wahrnehmen und Interpretieren einer Situation sowie durch das Treffen einer Entscheidung aus. Die Diagnostik erfordert das Wahrnehmen und Interpretieren des Modellierungsprozesses, woraufhin eine Entscheidung über die durchzuführende möglichst adaptive Intervention gefällt werden muss. Demnach kann die adaptive a-priori-Interventionskompetenz nicht nur als kognitive Leistungsdisposition, sondern auch als verbindender Prozess zwischen Leistungsdisposition und Handlung verstanden werden. Kompetenzen von angehenden Lehrerinnen und Lehrern gelangen immer weiter in den fachdidaktischen Forschungsfokus und werden anhand von Kompetenzmodellen beschrieben. Die adaptive a-priori-Interventionskompetenz ist ein Bestandteil der professionellen Kompetenz zum Lehren mathematischen Modellierens, die im folgenden Kapitel thematisiert wird.
6
Professionelle Kompetenz zum Lehren mathematischen Modellierens
Professionelle Kompetenzen von Mathematiklehrkräften wurden in verschiedenen deutschen large-scale-Studien (Baumert & Kunter, 2011b; Blömeke, Kaiser, & Lehmann, 2008, 2010b; Krauss et al., 2017) global erhoben. Im Rahmen der Professionalisierung von Mathematik-Lehramtsstudierenden stellt sich zur Überprüfung von Kompetenzzuwächsen in spezifischen Bereichen darüber hinaus die Frage nach der Existenz und Struktur bereichsspezifischer Kompetenzen. Aufgrund der zahlreichen Anforderungen bei der Betreuung von kooperativen Modellierungsprozessen und der „hohen didaktischen und bildungspolitischen Relevanz“ (Schwarz, Kaiser, & Buchholtz, 2008) ist eine Ausdifferenzierung professioneller Kompetenzen im Bereich des mathematischen Modellierens sinnvoll (Borromeo Ferri, 2018; Borromeo Ferri & Blum, 2010). Ein Strukturmodell, das professionelle Kompetenzen zum Lehren mathematischen Modellierens beschreibt und zueinander in Beziehung setzt, wurde in einer länderübergreifenden Kooperation zwischen Teilprojekten der Projekte »Dealing with Diversity« (Greefrath & Wess, 2016) und »MoSAiK« (Siller & Klock, 2016) im Rahmen der »Qualitätsoffensive Lehrerausbildung« entwickelt und empirisch evaluiert (Klock et al., 2019; Wess et al., angenommen). Die Konzeptualisierung des Modells, dessen Operationalisierung und empirische Ergebnisse zur Struktur werden in diesem Kapitel beschrieben. Ziel ist die Einordnung der adaptiven a-priori-Interventionskompetenz in das Strukturmodell der professionellen Kompetenz zum Lehren mathematischen Modellierens. Im ersten Teil des Kapitels wird auf den Begriff der professionellen Kompetenz von Lehrkräften eingegangen (vgl. Abschnitt 6.1). Dazu wird zunächst eine Klärung des Begriffs der Profession und der professionellen Kompetenz vorgenommen. Zwei konzeptualisierte Modelle der professionellen Kompetenz von Lehrkräften werden dargestellt. Mithilfe eines Katalogs fachdidaktischer Kompetenzen zum © Der/die Herausgeber bzw. der/die Autor(en), exklusiv lizenziert durch Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2020 H. Klock, Adaptive Interventionskompetenz in mathematischen Modellierungsprozessen, Studien zur theoretischen und empirischen Forschung in der Mathematikdidaktik, https://doi.org/10.1007/978-3-658-31432-3_6
143
144
6
Professionelle Kompetenz zum Lehren mathematischen Modellierens
Lehren mathematischen Modellierens (vgl. Abschnitt 6.2; Borromeo Ferri, 2018; Borromeo Ferri & Blum, 2010) wird eine Ausdeutung des COACTIV-Modells (Baumert & Kunter, 2006, 2011a) vorgenommen, um ein Strukturmodell professioneller Kompetenzen zum Lehren mathematischen Modellierens zu konzeptualisieren, das sich empirisch überprüfen lässt (vgl. Abschnitt 6.3). Ergebnisse zur empirischen Struktur des Konstrukts werden abschließend berichtet.
6.1
Professionelle Kompetenz von Lehrkräften
Der Begriff der professionellen Kompetenz setzt sich aus den Begriffen der Kompetenz und Profession zusammen. Die beiden Kompetenzbegriffe, die im Rahmen dieser Arbeit verwendet werden, wurden in Abschnitt 2.3.1 beschrieben. Die Kompetenz einer Lehrkraft zur Ausübung ihres Berufs ist aufgrund der beruflich bedingten unterschiedlichen Anforderungssituationen unter einem Kompetenzbegriff im weiteren Sinne zu verstehen, da neben kognitiven Leistungsdispositionen auch motivationale, volitionale und soziale Aspekte eine Rolle spielen (Weinert, 2002). Es wird zur Klärung des zweiten Begriffsbestandteils zunächst ausgeführt, unter welchen Voraussetzungen eine Kompetenz als „professionell“ bezeichnet werden kann.
6.1.1
Professionelle Kompetenz
Mithilfe des Begriffs der professionellen Kompetenz werden Kompetenzen von Lehrkräften beschrieben, die zur Bewältigung ihrer beruflichen Anforderungen notwendig sind. Spricht man von professionellen Kompetenzen, wird der Beruf der Lehrkraft als eine Profession aufgefasst. Radtke (2000, S. 1) ordnet dem Professionsbegriff drei Eigenschaften zu: • Wissenschaftliche Fundierung der Tätigkeit in • gesellschaftlich relevanten, ethisch normierten Bereichen der Gesellschaft wie Gesundheit, Recht, auch Erziehung und • ein besonders lizenziertes Interventions- und Eingriffsrecht in die Lebenspraxis von Individuen. Durch ein akademisches Studium erwirbt eine angehende Lehrkraft ein wissenschaftliches Basiswissen in ihren Fächern. Sie übt im gesellschaftlich relevanten
6.1 Professionelle Kompetenz von Lehrkräften
145
Bereich der Bildung und Erziehung ihre Tätigkeit aus und nimmt dabei wesentlich Einfluss auf die zu bildenden Individuen. Nach diesen Eigenschaften kann der Beruf der Lehrkraft klar als Profession bezeichnet werden (vgl. auch Blömeke, 2002, S. 23; Schwarz, 2013, S. 8). Verschiedene Professionstheorien beschreiben den Lehrerberuf anhand unterschiedlicher Aspekte, die eine eindeutige Charakterisierung als Profession nicht immer erlauben. Sie werden daher im Folgenden kurz angerissen (für einen Überblick vgl. Blömeke, 2002, S. 18 ff; Schwarz, 2013, S. 7 ff; Terhart, 2011): • Strukturtheoretischer Ansatz. Der Strukturtheoretische Ansatz nach Oevermann (1996) basiert auf der Anwendung einer therapeutischen Perspektive auf den Lehrerberuf. Die Tätigkeiten der Lehrkraft werden dabei durch zahlreiche Antinomien gekennzeichnet: Nähe vs. Distanz zum Lernenden; Rekonstruktion individueller Situationen vs. Anwendung allgemeiner Regelwerke; Gleichbehandlung vs. individuelle Behandlung (Förderung); … (Terhart, 2011). Für Oevermann (1996) muss das Arbeitsverhältnis aus einer therapeutischen Perspektive durch eine Autonomie des Klienten gekennzeichnet sein. Die Schulpflicht steht dieser Autonomie grundsätzlich entgegen. Daher stellt der Beruf der Lehrkraft unter dieser Perspektive keine Profession dar. Dieser Ansatz wurde jedoch ausgiebig diskutiert und relativiert (vgl. bspw. Baumert & Kunter, 2006). • Machttheoretischer Ansatz. Larson (1977), Daheim (1992) und Rabe-Kleberg (1996) prägten den machttheoretischen Ansatz, der sich durch zwei Aspekte auszeichnet: (1.) Professionelle verfügen über eine wissenschaftliche Ausbildung des oberen Bildungssegments und (2.) verfügen in ihrer Berufsausübung über eine gewisse Autonomie. Daher kommt ihnen ein „ehrenhafter Status“ (RabeKleberg, 1996, S. 287) zu. Larson (1977) spricht dem Lehrerberuf lediglich den Status „semi-professionell“ zu, da er nicht über ein wissenschaftliches Fundament verfüge. Daheim (1992) spricht dem Beruf aufgrund der Einbindung in ein Bildungssystem mit seinen zahlreichen Vorgaben die Autonomie bei der Berufsausübung ab. Aus dieser Perspektive kann der Lehrerberuf als semi-professionell klassifiziert werden. • Systemtheoretischer Ansatz. Der systemtheoretische Ansatz wurde durch Luhmann (2002) und Stichweh (1992) vertreten. Professionelle verwalten darin teilweise oder vollständig sogenannte Funktionensystemen (bspw. das Gesundheitsoder Erziehungswesen, …). Dabei (1.) lösen sie Anwendungsprobleme im Funktionensystem und (2.) sind anderen Mitgliedern des Funktionsbereichs, den Klienten, vorgesetzt. Im Erziehungs- und Bildungssystem löst die Lehrkraft Anwendungsprobleme durch die Vermittlung von relevantem Wissen und nimmt gegenüber ihren Klienten, den Lernenden, eine übergeordnete Position ein. Daher
146
6
Professionelle Kompetenz zum Lehren mathematischen Modellierens
ist der Lehrerberuf nach dem systemtheoretischen Ansatz als eine Profession zu bezeichnen. • Kompetenzorientierter Ansatz. Der kompetenzorientierte Ansatz zeichnet sich durch die tatsächliche (empirische) Bestimmung von Aufgaben und Tätigkeiten einer Lehrkraft aus (Baumert & Kunter, 2006; Terhart, 2011). „Professionell ist ein Lehrer dann, wenn er in den verschiedenen Anforderungsbereichen (Unterrichten und Erziehen, Diagnostizieren, Beurteilen und Beraten, …) über möglichst hohe bzw. entwickelte Kompetenzen und zweckdienliche Haltungen verfügt, die anhand der Bezeichnung „professionelle Handlungskompetenzen“ zusammengefasst werden.“ (Terhart, 2011, S. 207) Die Professionalität wird zum einen anhand festgelegter Kompetenzniveaus und zum anderen indirekt anhand der Lern- und Erfahrungszuwächse der Lernenden überprüft. Schwarz (2013, S. 35) stellt dar, dass der kompetenzorientierte Ansatz im Hinblick auf die Definition des Kompetenzbegriffs im weiteren Sinne nach Weinert (2002) zahlreiche Aspekte der Professionstheorien bedient. Dass Kompetenz grundsätzlich erlernbar ist, ermöglicht eine wissenschaftliche Ausbildung (Machttheorie). Zudem handelt es sich um Fähigkeiten, „um bestimmte Probleme zu lösen“ (Weinert, 2002, S. 27), wie es die Systemtheorie fordert. Im Hinblick auf die Modellierung bereichsspezifischer Kompetenzen zum Lehren mathematischen Modellierens erscheint die Perspektive des kompetenztheoretischen Ansatzes besonders geeignet, da ebenfalls typische Aufgaben und Tätigkeiten einer Lehrkraft zur Ableitung professioneller Kompetenzen genutzt werden. Der Beruf der Lehrkraft wird in dieser Arbeit daher unter einem kompetenzorientierten Ansatz als Profession verstanden (Blömeke, 2002, S. 23; Schwarz, 2013, S. 24 ff), der die „Idee der Steigerbarkeit“ (Terhart, 2011, S. 208) innewohnt, und die professionelle Kompetenz im Hinblick auf einen Kompetenzbegriff im weiteren Sinne als ein Zusammenspiel von • spezifischem, erfahrungsgesättigtem deklarativem und prozeduralem Wissen (Kompetenzen im engeren Sinne: Wissen und Können); • professionellen Werten, Überzeugungen, subjektive Theorien, normativen Präferenzen und Zielen; • motivationalen Orientierungen sowie • metakognitiven Fähigkeiten und Fähigkeiten professioneller Selbstregulation. (Baumert & Kunter, 2006, S. 481)
Mit professionellem Wissen wird das für die Kompetenzen im engeren Sinne notwendige deklarative und prozedurale Wissen bezeichnet, das als Voraussetzung für kompetentes Handeln gesehen wird (Bromme, 1995). Welche konkreten
6.1 Professionelle Kompetenz von Lehrkräften
147
Kompetenzen die oben aufgezählten Aspekte beinhalten, wurde in verschiedenen Konzeptualisierungen jeweils unterschiedlich beschrieben.
6.1.2
Konzeptualisierungen der professionellen Kompetenz von Mathematiklehrkräften
Shulman (1986, 1987) stieß mit seinen Vorschlägen zur Konzeptualisierung des Lehrerwissens national wie international eine Diskussion an. Er entwickelte Kategorien des professionellen Wissens (Shulman, 1986) und unterschied das … • Content Knowledge. Hierbei handelt es sich um reines Fachwissen zum jeweiligen Fachgebiet. Dazu zählen auch Kenntnisse der Fachsystematik, um den Stoff schülergerecht zu organisieren. Dabei sind Fachinhalte hinsichtlich ihrer Bedeutung für das Fach auszuwählen. • Pedagogical Content Knowledge. Es beinhaltet Fachinhalte im Hinblick auf das unterrichtliche Lehren. Hierzu zählen nützliche Repräsentationsformen von Unterrichtsinhalten, Analogien, Beispiele und Erklärungen. Die Lehrkraft muss über unterschiedliche Zugänge und Repräsentationsformen verfügen und zwischen ihnen auswählen können. Im Mittelpunkt steht das Wissen darüber, wie Schülerinnen und Schüler Fachinhalte erlernen können. Dazu muss die Lehrkraft sich über Schwierigkeiten bestimmter Themen bewusst sein und Vorwissen, Vorerfahrungen und Fehlvorstellungen in den Lehr-Lern-Prozess miteinbeziehen. • Curricular Knowledge. Das Wissen über den Bildungsplan, der die Themengebiete in den verschiedenen Klassenstufen enthält und anordnet, findet sich in dieser Wissensdimension. Sie beinhaltet zudem das Wissen und Verstehen von verschiedenen Methoden und Materialien zur Instruktion im Unterricht. Shulman (1986) unterscheidet ein laterales curriculares Wissen, das sich durch Wissen über aktuelle Themen in anderen Fächern auszeichnet, und ein vertikales Curriculum, das Wissen über Themen und Inhalte beinhaltet, die in der Vergangenheit behandelt wurden und in der Zukunft behandelt werden. • Pedagogical Knowledge. Hierbei handelt es sich um fachunspezifisches Wissen einer Lehrkraft, in etwa das Wissen über eine effektive Klassenführung und den Umgang mit Disziplinproblemen. Bei Shulman (1986, 1987) wird diese Dimension nicht weiter ausdifferenziert, da das fachbezogene Wissen im Fokus steht.
148
6
Professionelle Kompetenz zum Lehren mathematischen Modellierens
Bromme (1995) formulierte zu dieser Topologie Anmerkungen, die er zum Anlass einer weiteren Ausdifferenzierung nahm. Er kritisiert vor allem zwei Punkte hinsichtlich der empirischen Überprüfbarkeit der Topologie: (1.) Es wird nicht zwischen der „Theorie der didaktischen Techniken und Begriffe, um sozusagen die „Angebote“ … der Lehrbücher, Unterrichtsmaterialien und didaktischen Konventionen einer bestimmten Epoche und Kultur zu beschreiben“ (Bromme, 1995, S. 108) und ihrer „subjektiven kognitiven Repräsentation bei Lehrern“ (Bromme, 1995, S. 107; Hervorhebung im Original) unterschieden. (2.) Außerdem wird nicht zwischen den Wissenschaftsdisziplinen und den curricularen Inhalten der Schulfächer unterschieden. Beide Unterscheidungen erachtet er als notwendig, um Wechselwirkungen zwischen ihnen analysieren zu können. Die Topologie von Shulman (1986) ergänzt er um den Aspekt der Philosophie des Schulfachs (Bromme, 1997). • Philosophie des Schulfachs. Hierzu zählt das Wissen über die Bedeutung des Schulfachs und seiner Fachinhalte in Bezug auf das Leben. Darüber hinaus zählt er Sichtweisen der Lehrkraft in Bezug auf Fachinhalte zu dieser Dimension hinzu. Mit dem Begriff Philosophie wird zum Ausdruck gebracht, dass eine Bewertung des Unterrichtsinhalts durch die Lehrkraft stattfindet. Sichtweisen der Lehrkraft werden in den aktuell diskutierten Konzeptualisierungen der vergangenen 15 Jahre nicht dem Professionswissen, sondern einem eigenen Konstrukt, den Überzeugungen, Einstellungen oder Werthaltungen, zugeordnet (Schwarz, 2013, S. 46). Im deutschsprachigen Raum untersuchten im Wesentlichen zwei Forscherteams im Anschluss an die Arbeiten von Shulman (1986, 1987) und Bromme (1995, 1997) die professionelle Kompetenz von Lehrkräften anhand ähnlich konzeptualisierter und operationalisierter Kompetenzmodelle, die im Folgenden verglichen werden. Zu nennen sind hier zum einen die Studien „Mathematics Teaching in the 21st Century“ (MT21; Blömeke et al., 2008) und deren Nachfolgestudien „Teacher Education and Development Study – Mathematics“ (TEDS–M Blömeke, Kaiser, & Lehmann, 2010a) und „TEDS – Follow Up“ (TEDS–FU; Blömeke & Kaiser, 2015). Das zweite Forscherteam führte die Studien „Cognitive Actication in the Mathematics Classroom and Professional Competence of Teachers“ (COACTIV) und deren Nachfolgestudien „COACTIV-Referendariat“ (COACTIV-R), „COACTIV University Study“ (Kunter et al., 2011, 2013) und „Broad Educational Knowledge and the Acquisition of Professional Knowledge in Teacher Candidates“ (BilWiss; Terhart et al., 2012) durch. In Tabelle 6.1 werden die konzeptualisierten Bestandteile der professioneller Kompetenz der jeweils ersten Hauptstudien gegenübergestellt.
6.1 Professionelle Kompetenz von Lehrkräften
149
Tabelle 6.1 Konzeptualisierungen der professionellen Kompetenz von (angehenden) Lehrkräften MT21 (Blömeke et al., 2008)
COACTIV (Kunter et al., 2011, 2013)
Professionswissen Fachwissen
Fachwissen
Fachdidaktisches Wissen Lehrbezogene Anforderungen (Curriculares und planungsbezogenes Wissen) Lernprozessbezogene Anforderungen (Interaktionsbezogenes Wissen)
Fachdidaktisches Wissen Erklärungswissen Wissen über das mathematische Denken von Schüler(-innen)n Wissen über mathematische Aufgaben
Erziehungswissenschaftliches Wissen Allgemeindidaktisches Wissen Pädagogisch-psychologisches Wissen Bildungssoziologisches Wissen
Pädagogisch-Psychologisches Wissen Wissen über eine effektive Klassenführung Wissen über Unterrichtsmethoden Wissen über Leistungsbeurteilung Wissen über individuelle Lernprozesse Wissen über individuelle Besonderheiten von Schülerinnen und Schülern Beratungswissen Organisationswissen
Weitere Aspekte professioneller Kompetenz Überzeugungen Epistemologische Überzeugungen Unterrichtsbezogene Überzeugungen Professionsbezogene Überzeugungen
Überzeugungen, Werthaltungen, Ziele Epistemologische Überzeugungen Überzeugungen über das Lehren und Lernen von Mathematik Motivationale Orientierungen Berufswahlmotivation Enthusiasmus Selbstwirksamkeit Selbstregulation
Es ist ersichtlich, dass die professionelle Kompetenz von Lehrkräften in der COACTIV-Studie breiter konzeptualisiert wird als in MT21. Da es sich bei MT21 um eine internationale Vergleichsstudie handelt, mussten in den beteiligten Ländern gemeinsame Anforderungen an Lehrkräfte identifiziert werden (Blömeke et al., 2008, S. 18), was zu einer geringeren Ausdifferenzierung geführt hat. Aus diesem Grund wurde insbesondere aufgrund der zusätzlichen Ausdifferenzierung der motivationalen Orientierungen und der inhaltlichen Kategorisierung des fachdidaktischen Wissens (vgl. Tabelle 6.1) das COACTIV-Modell zur Konzeptualisierung der professionellen Kompetenz zum Lehren mathematischen Modellierens verwendet.
150
6.2
6
Professionelle Kompetenz zum Lehren mathematischen Modellierens
Fachdidaktische Kompetenzen zum Lehren mathematischen Modellierens
Um eine Ausdeutung des COACTIV-Modells für den Bereich des mathematischen Modellierens vornehmen zu können, müssen Anforderungen an Lehrkräfte identifiziert werden, die bei der Vorbereitung und Durchführung von mathematischen Modellierungsprozessen auftreten. Borromeo Ferri und Blum (2010; vgl. auch Borromeo Ferri, 2018) beschreiben Kompetenzen, die sie für das Lehren mathematischen Modellierens als notwendig erachten (vgl. Tabelle 6.2). Jede dieser Dimensionen wird durch je drei Wissens- und/oder Fähigkeitsfacetten konkretisiert. Diese umfassen neben deklarativem und prozeduralem Wissen (bspw. Erkennen von Phasen im Modellierungsprozess) auch Handlungskompetenzen (bspw. Durchführen von Unterricht zu Modellierungsaufgaben) von (angehenden) Lehrkräften. Tabelle 6.2 Kompetenzen zum Lehren mathematischen Modellierens (Borromeo Ferri, 2018, S. 5; Übersetzung durch den Autor) Dimensionen
Facetten
Theoretische Dimension
a) Modellierungskreisläufe b) Ziele/Perspektiven des Modellierens c) Typen von Modellierungsaufgaben
Aufgaben-Dimension
a) Multiples Lösen von Modellierungsaufgaben b) Kognitive Analyse von Modellierungsaufgaben c) Entwicklung von Modellierungsaufgaben
Unterrichts-Dimension
a) Planung von Unterricht zu Modellierungsaufgaben b) Durchführen von Unterricht zu Modellierungsaufgaben c) Interventionen, Hilfe und Feedback
Diagnostische Dimension
a) Erkennen von Phasen im Modellierungsprozess b) Erkennen von Schwierigkeiten und Fehlern c) Bewerten von Modellierungsaufgaben
Die theoretische Dimension beinhaltet das Wissen über Modellierungskreisläufe und deren Eignung zu verschiedenen Zwecken. Die mit dem mathematischen
6.2 Fachdidaktische Kompetenzen
151
Modellieren verbundenen unterrichtlichen Ziele (z. B. Fördern allgemeiner Problemlösefähigkeiten) sowie das Wissen über die verschiedenen Typen von Modellierungsaufgaben (holistisch vs. atomistisch; vgl. Abschnitt 2.2) bilden die Grundlage jeder unterrichtlichen Thematisierung. Die Aufgaben-Dimension umfasst die Fähigkeit der Lehrkraft, Modellierungsaufgaben selbst auf verschiedenen Wegen zu lösen. Das eigene Durchführen von Modellierungsprozessen erlaubt es der Lehrkraft, verschiedene Zugänge zur Aufgabe zu ermitteln und so eine Vorstellung über die Lösungsvielfalt zu erhalten. Daneben werden bei der Analyse der Modellierungsaufgabe auch Schwierigkeiten antizipiert. Sollen Modellierungsaufgaben im Unterricht zielgerichtet zum Einsatz kommen, ist die Entwicklung von Aufgaben notwendig. Dies erlaubt je nach Bedarf eine Förderung einzelner Teilkompetenzen oder von Modellierungskompetenzen im weiteren Sinne (vgl. Abschnitt 2.3.2). Die Unterrichts-Dimension umfasst die Planung von Unterricht zu Modellierungsaufgaben. Diese zeichnet sich unter dem in Abschnitt 3.1.1 beschriebenen konstruktivistischen Lehr-Lern-Verständnis durch die Wahl einer angemessenen Sozialform (Kleingruppenarbeit) und Methode aus. Bei der Durchführung von Unterricht ist auf die Einhaltung der Merkmale des selbstgesteuerten und kooperativen Lernens zu achten (vgl. Abschnitt 3.1.2 und 3.1.3). Bei Schwierigkeiten im Modellierungsprozess unterstützt die Lehrkraft durch adaptives Intervenieren (vgl. Abschnitt 3.3.4). Die Kompetenzen der diagnostischen Dimension bilden in Teilen eine Voraussetzung für einen erfolgreichen Interventionsprozess1 . Die Zuordnung von Modellierungsphasen zum Lösungsprozess der Lernenden ermöglicht eine fokussierte Diagnostik von Schwierigkeiten. Eine explizite Diagnose stellt eine Voraussetzung für die Adaption einer Intervention auf den Lösungsprozess der Schülerinnen und Schüler dar (vgl. Abschnitt 5.1). Die Entwicklung und Bewertung eines Leistungstests mit Modellierungsaufgaben bilden eine weitere Facette der diagnostischen Dimension.
1 Dass
eine adäquate Diagnostik eine Voraussetzung für eine erfolgreiche Intervention ist, wird im Rahmen dieser Arbeit untersucht. Dies wird in der Literatur jedoch auch häufig betont (Leiss, 2007, S. 66; Smit, Eerde, & Bakker, 2013; Van de Pol, Volman, & Beishuizen, 2010) und in Teilen empirisch nachgewiesen (Helmke & Schrader, 1987; Stender, 2016, S. 206 ff.).
152
6.3
6
Professionelle Kompetenz zum Lehren mathematischen Modellierens
Strukturmodell der professionellen Kompetenz zum Lehren mathematischen Modellierens
Die in Tabelle 6.2 dargestellten Kompetenzen werden bei der Ausdeutung des COACTIV-Modells (vgl. Tabelle 6.1), insbesondere des Professionswissens, zur Herleitung eines Strukturmodells der professionellen Kompetenz zum Lehren mathematischen Modellierens herangezogen. Hinsichtlich einer Abgrenzung zu bereichsübergreifenden professionellen Kompetenzen in Mathematik müssen die Bestandteile des Strukturmodells möglichst spezifisch für den Bereich des mathematischen Modellierens sein. Gewisse Aspekte und Kompetenzbereiche der professionellen Kompetenz von Lehrkräften erscheinen daher vor dem Hintergrund des mathematischen Modellierens bedeutsamer. So lassen sich die Aspekte Überzeugungen als Bestandteil der Überzeugungen/Werthaltungen/Ziele, Selbstwirksamkeitserwartungen als Bestandteil der motivationalen Orientierungen und das modellierungsspezifische fachdidaktische Wissen als Bestandteil des Professionswissen durch modellierungsspezifische Aspekte ausdeuten (vgl. Abbildung 6.1).
Abbildung 6.1 Professionelle Kompetenz zum Lehren mathematischen Modellierens. (Klock et al., 2019; Wess et al., angenommen)
Der Aspekt der Selbstregulation bezieht sich auf Persönlichkeitsmerkmale der Lehrkraft und ist daher unabhängig von jeder bereichsspezifischen Konkretisierung. Die verbleibenden drei Kompetenzbereiche des Professionswissens, das
6.3 Strukturmodell der professionellen Kompetenz
153
pädagogisch-psychologische Wissen, Organisationswissen und Beratungswissen, sind nach ihrer Konzeptualisierung ebenfalls fachunabhängig. Das Fachwissen kann bereichsspezifisch als Modellierungskompetenz ausgedeutet werden, wurde aufgrund des guten Forschungsstandes (vgl. bspw. Böhm, 2013; Brand, 2014; Hankeln, 2019) nicht in die Operationalisierung miteinbezogen. Die Konzeptualisierung und Operationalisierung der drei Kompetenzaspekte und -bereiche, der Überzeugungen und Selbstwirksamkeitserwartungen zum mathematischen Modellieren sowie des modellierungsspezifischen fachdidaktischen Wissens, werden in den folgenden Unterkapiteln dargestellt. Das fachdidaktische Wissen wird dabei in Anlehnung an die COACTIV-Studie als deklaratives und prozedurales Wissen (Wissen und Können) verstanden (Baumert & Kunter, 2006, S. 481), das in seinen Kompetenzfacetten über Kompetenzen im engeren Sinne messbar wird. Die Konstrukte wurden zur empirischen Prüfung anhand eines Strukturgleichungsmodells operationalisiert (Klock et al., 2019; Wess et al., angenommen).
6.3.1
Modellierungsspezifisches fachdidaktisches Wissen
Das COACTIV-Modell untergliedert das fachdidaktische Wissen in das Erklärungswissen, das Wissen über das mathematische Denken von Schüler(inne)n und das Wissen über mathematische Aufgaben (vgl. Tabelle 6.1). Diese drei Kompetenzfacetten wurden anhand der fachdidaktischen Kompetenzen zum Lehren mathematischen Modellierens (Borromeo Ferri, 2018; Borromeo Ferri & Blum, 2010) ausgedeutet und um eine weitere Dimension, das Wissen über Konzeptionen/Dimensionen/Ziele, erweitert (vgl. Abbildung 6.1). Die Facette Erklärungswissen wird anhand der Kompetenzen Ub) »Durchführen von Unterricht zu Modellierungsaufgaben« und Uc) »Intervention, Hilfe und Feedback« in Tabelle 6.2 als Wissen über Interventionen ausgedeutet. Diese Kompetenzfacette umfasst das Wissen über Merkmaler adaptiver Interventionen (vgl. Abschnitt 3.3.4) und die Wirkung verschiedener Interventionen auf den Lösungsprozess der Lernenden (vgl. Abschnitt 4.2). Fähigkeiten zur Bewertung von Interventionen hinsichtlich ihrer Adaptivität (a priori und a posteriori) und zur adäquaten Durchführung von Interventionen sind typische Anforderungen an Lehrkräfte bei der Betreuung von mathematischen Modellierungsprozessen. Für den Bereich des mathematischen Modellierens ist spezifisch, dass die Interventionen sich durch eine hohe Selbstständigkeitsorientierung (Smit et al., 2013; Van de Pol et al., 2010) und einen minimalen Eingriff in den Lösungsprozess (Aebli, 1983, S. 300) auszeichnen, sodass nur in wenigen Fällen eine direkte Erklärung der Lehrkraft im Sinne eines Erklärungswissens angebracht ist. Die Kompetenz Ua)
154
6
Professionelle Kompetenz zum Lehren mathematischen Modellierens
»Unterricht zu Modellierungsaufgaben planen« schließt zum einen die Auswahl geeigneter Sozialformen und Methoden mit ein, was dem Anforderungsbereich des pädagogisch-psychologischen Wissens zuzuordnen ist. Aus diesem Grund wird diese Kompetenz nicht in die Konzeptualisierung mit einbezogen. Die Facette Wissen über das mathematische Denken der Schüler(inne)n wird anhand der Kompetenzen Da) »Erkennen von Modellierungsphasen« und Db) »Erkennen von Schwierigkeiten und Fehlern« in Tabelle 6.2 als Wissen über Modellierungsprozesse ausgedeutet. Diese Kompetenzfacette umfasst die Fähigkeiten, Modellierungsphasen und Schwierigkeiten im Modellierungsprozess diagnostizieren zu können und darauf basierend Förderziele für Interventionen festzulegen. Dazu ist ein bereichsspezifisches Wissen über den Modellierungsprozess und beeinflussende Faktoren (vgl. Abschnitt 1.4) sowie über typische Schwierigkeiten notwendig (vgl. Abschnitt 1.5). Diese diagnostische Komponente nimmt für das modellierungsspezifische fachdidaktische Wissen eine zentrale Stellung ein. Diagnostische Fähigkeiten im Rahmen des Modellierungsprozesses sind zum einen eine Voraussetzung für interventionsbezogene Kompetenzen, wie sie in der Facette Wissen über Interventionen beschrieben werden. Auf der anderen Seite sind sie zur Diagnostik von Anforderungen und damit für die Auswahl und Entwicklung kognitiv aktivierender Aufgaben notwendig, womit auch Zusammenhänge zur Facette Wissen über Modellierungsaufgaben bestehen. Die Facette Wissen über mathematische Aufgaben wird anhand der Kompetenzen Tc) »Typen von Modellierungsaufgaben«, Aa) »Multiples Lösen von Modellierungsaufgaben«, Ab) »Kognitive Analyse von Modellierungsaufgaben« und Ac) »Entwicklung von Modellierungsaufgaben« in Tabelle 6.2 als Wissen über Modellierungsaufgaben ausgedeutet. Diese Kompetenzfacette umfasst Wissen über verschiedene Typen und Kriterien von Modellierungsaufgaben. Die Facette beinhaltet darüber hinaus Fähigkeiten zur kriteriengeleiteten Entwicklung von Modellierungsaufgaben sowie deren Analyse und Bearbeitung hinsichtlich multipler Lösungsmöglichkeiten. Die verbleibenden Kompetenzen der theoretischen Dimension Ta) »Modellierungskreisläufe« und Tb) »Ziele/Perspektiven des Modellierens« in Tabelle 6.2 werden als Wissen über Konzeptionen/Dimensionen/Ziele in einer weiteren Kompetenzfacette ausgedeutet. Diese beinhaltet Metawissen zum Modellieren über verschiedene Modellierungskreisläufe und deren Eignung für verschiedene Zwecke (Borromeo Ferri & Kaiser, 2008), unterrichtliche Ziele mathematischen Modellierens (Blum & Niss, 1991) und die Bandbreite von Realitätsbezügen (Greefrath, 2018, S. 91 f.), die Modellierungsaufgaben im Mathematikunterricht bedienen können.
6.3 Strukturmodell der professionellen Kompetenz
155
Die in dieser Arbeit untersuchte adaptive a-priori-Interventionskompetenz wird als ein Zusammenspiel von Diagnose- und a-priori-Interventionskompetenz definiert (vgl. Abschnitt 5.3). Beide Teilkompetenzen lassen sich theoretisch im Strukturmodell professioneller Kompetenzen zum Lehren mathematischen Modellierens im Bereich des modellierungsspezifischen fachdidaktischen Wissens verorten (vgl. Abbildung 6.2).
Abbildung 6.2 Einordnung der adaptiven a-priori-Interventionskompetenz. (vgl. Abschnitt 5.3)
Die a-priori-Interventionskompetenz wird durch die Kompetenzfacette Wissen über Interventionen abgebildet, die Diagnosekompetenz durch die Facette Wissen über Modellierungsprozesse. Die allgemeine Diagnosekompetenz einer Lehrkraft wird in der Regel als ein mehrdimensionales Konstrukt verstanden, das sich aus Fähigkeiten der Kompetenzbereiche des fachdidaktischen und pädagogischpsychologischen Wissens zusammensetzt (Brunner, Anders, Hachfeld, & Krauss, 2011). Da das Strukturmodell jedoch nur modellierungsspezifische Lehrerkompetenzen beinhaltet, spiegelt das Wissen über Modellierungsprozesse die Diagnosekompetenz in mathematischen Modellierungsprozessen wider. Neben dem modellierungsspezifischen fachdidaktischen Wissen sind auch Überzeugungen und Selbstwirksamkeitserwartungen in mathematischen Modellierungsprozessen ein Bestandteil der professionellen Kompetenz zum Lehren mathematischen Modellierens.
156
6.3.2
6
Professionelle Kompetenz zum Lehren mathematischen Modellierens
Überzeugungen zum mathematischen Modellieren
In der deutschsprachigen Literatur werden die Begriffe Überzeugungen, Beliefs, Vorstellungen, Haltungen, subjektive Theorien, Weltbilder und Einstellungen häufig parallel verwendet, ohne dass eine klare Abgrenzung vorgenommen wird (Voss, Kleickmann, Kunter, & Hachfeld, 2011). In der englischsprachigen Literatur wird überwiegend der Begriff der Beliefs verwendet (Leder, Pehkonen, & Törner, 2002). „… the term “belief” is often used loosely and synonymously with terms such as attitude, disposition, opinion, perception, philosophy, and value.“ (Leder & Forgasz, 2002, S. 96) Da sich die begrifflichen Definitionen überlappen, ist eine einheitliche Konkretisierung schwierig (Leder & Forgasz, 2002). In der vorliegenden Arbeit wird daher in Anlehnung an die COACTIV-Studie bevorzugt der Begriff der Überzeugungen verwendet. Darunter werden … überdauernde existentielle Annahmen über Phänomene oder Objekte der Welt, die subjektiv für wahr gehalten werden, sowohl implizite als auch explizite Anteile besitzen und die Art der Begegnung mit der Welt beeinflussen (Voss et al., 2011, S. 235)
verstanden. Sie gelten als relativ stabile kognitive Strukturen (Voss et al., 2011), da durch ihre Filterfunktion Inhalte, die mit eigenen Überzeugungen übereinstimmen, verstärkt und nicht übereinstimmende Inhalte vermindert wahrgenommen werden (Blömeke, 2004; Schwarz, 2013, S. 58; Törner, 2002, S. 75). Nach Patrick und Pintrich (2001) muss zur Veränderung eine intensive Auseinandersetzung mit den eigenen Überzeugungen und anderen Sichtweisen stattfinden. Überzeugungen können für spezifische Inhaltsbereiche konkretisiert werden (Voss et al., 2011). Törner (2002) strukturiert Beliefs in die folgenden drei hierarchisch angeordneten Aspekte: • Global Beliefs. Allgemeine Beliefs beinhalten Überzeugungen zum Lehren und Lernen von Mathematik, zur Natur von Mathematik und der Entwicklung mathematischen Wissens. • Domain-Specific Beliefs. Domänenspezifische Beliefs beinhalten Überzeugungen zu bestimmten mathematischen Teilgebieten, wie z. B. der Analysis, Stochastik oder Geometrie. Diese können sich bspw. in ihren Überzeugungen zur Exaktheit der Mathematik im jeweiligen Gebiet unterscheiden. • Subject-Matter Beliefs. Gegenstandsbezogene Beliefs sind Überzeugungen, die sich auf einen konkreten mathematischen Begriff (Ableitung), ein mathematisches Objekt (Funktion) oder eine mathematische Prozedur (Bisektionsverfahren) beziehen.
6.3 Strukturmodell der professionellen Kompetenz
157
Sollen Überzeugungen zum mathematischen Modellieren konzeptualisiert werden, bietet sich besonders der erste Aspekt an, da er einen relativ hohen Allgemeinheitsgrad aufweist. Woolfolk Hoy, Davis und Pape (2006) unterscheiden in Bezug auf Lehr-Lern-Prozesse epistemologische Überzeugungen und Überzeugungen zum Lehren und Lernen von Mathematik. Epistemologische Überzeugungen beziehen sich auf die Struktur und Genese von Wissen (Buehl & Alexander, 2001). Grigutsch, Raatz und Törner (1998) erfassen diese über die mathematischen Weltbilder, die Überzeugungen gegenüber Bestandteilen von Mathematik darstellen. Sie unterscheiden dabei den Formalismus-Aspekt, den Anwendungs-Aspekt, den Prozess-Aspekt und den Schema-Aspekt. In Bezug auf das mathematische Modellieren ist der Anwendungs-Aspekt von besonderem Interesse, der sich auf den Sinn und Nutzen von Mathematik in der realen Welt bezieht. Grigutsch, Raatz und Törner (1998) fassen unter diesem mathematischen Weltbild Überzeugungen in Bezug auf den Nutzen von Mathematik und dessen alltägliche und gesellschaftliche Bedeutung zusammen. Aufgrund der Anwendungsorientierung und des Realitätsbezugs von Modellierungsaufgaben ist dieser Aspekt zur Konzeptualisierung epistemologischer Überzeugungen zum mathematischen Modellieren geeignet. Aussagen, die dem mathematischen Modellieren einen praktischen Nutzen in der Welt zusprechen, werden als epistemologische Überzeugungen zum mathematischen Modellieren verstanden (Klock et al., 2019; Wess et al., angenommen). Überzeugungen zum Lehren und Lernen von Mathematik umfassen Überzeugungen hinsichtlich unterrichtlicher Zielvorstellungen, unterrichtsmethodischer Präferenzen und zum Classroom Management (C. Müller, Felbrich, & Blömeke, 2008). Bei den unterrichtlichen Zielvorstellungen einer Lehrkraft können kognitive und affektiv-motivationale Lernziele unterschieden werden. Im kognitiven Bereich unterscheiden Müller, Felbrich und Blömeke (2008) den Routineaufbau, das Problemlösen und Modellieren, das Argumentieren und Begründen sowie das Beweisen. Überzeugungen bezüglich des Modellierens im Mathematikunterricht und seiner Lernzielvorstellung können also den Überzeugungen zum Lehren und Lernen zugeordnet werden. Sie werden in Bezug auf das mathematische Modellieren daher als Aussagen konzeptualisiert, die dem mathematischen Modellieren einen berechtigten Platz im Mathematikunterricht einräumen (Klock et al., 2019; Wess et al., angenommen). Beide Bereiche von Überzeugungen zu Lehr-Lern-Prozessen lassen sich auf einer Metaebene unter der Perspektive behavioristischer und konstruktivistischer Lerntheorien (vgl. Abschnitt 3.1.1) betrachten. Das bedeutet, dass sich sowohl epistemologische Überzeugungen als auch Überzeugungen zum Lehren und Lernen von Mathematik aus einer stärker transmissiven oder konstruktivistischen Perspektive verstehen lassen. Voss et al. (2011, S. 239) sprechen in diesem Zusammenhang von
158
6
Professionelle Kompetenz zum Lehren mathematischen Modellierens
sogenannten „Überzeugungssyndromen“. Da diese „lerntheoretische[n] Überzeugungen“ (Voss et al., 2011, S. 239; Hervorhebung im Original) die Überzeugungen zum mathematischen Modellieren auf einer Metaebene bestimmen, werden sie im Sinne einer validen Konzeptualisierung miteinbezogen. Schwarz, Kaiser und Buchholtz (2008) entdeckten in einer qualitativen Studie Zusammenhänge zwischen lerntheoretischen Überzeugungen und Überzeugungen zum Modellieren, die von Kuntze und Zöttl (2008) auch empirisch quantitativ nachgewiesen wurden. Aus diesem Grund leisten sowohl positiv korrelierende konstruktivistische Überzeugungen als auch negativ korrelierende transmissive Überzeugungen einen Beitrag zur Beschreibung von Überzeugungen zum mathematischen Modellieren.
6.3.3
Selbstwirksamkeitserwartungen zum mathematischen Modellieren
Selbstwirksamkeitserwartungen stellen ein empirisch fundiertes Merkmal der professionellen Kompetenz dar (Kunter, 2011). Der Begriff der Selbstwirksamkeitserwartung wird als Bewertung der eigenen Wirksamkeit in gewissen Situationen verstanden. A teachers’ efficacy belief is a judgement of his or her capabilities to bring about desired outcomes of student engagement and learning, even among those students who may be difficult or unmotivated. (Tschannen-Moran & Woolfolk-Hoy, 2001, S. 783)
Sie sind für das Lehrerhandeln bedeutsam und beeinflussen die Leistungen, Überzeugungen und die Motivation von Schülerinnen und Schülern (Philippou & Pantziara, 2015). Sie gehen mit einer höheren Unterrichtsqualität, dem Einsatz innovativerer und effektiverer Methoden im Unterricht und einem höheren Engagement der Lehrkraft einher (Kunter, 2011). Selbstwirksamkeitserwartungen lassen sich in Bezug auf Vorstellungen der Lehrkraft zur eigenen Wirksamkeit in mathematischen Modellierungsprozessen konkretisieren. Die Tätigkeiten werden inhaltlich durch die Facetten des modellierungsspezifischen fachdidaktischen Wissens bestimmt. Eine der Hauptaktivitäten der Lehrkraft während kooperativen Modellierungsprozessen ist die Diagnostik des Lösungsprozesses. Da die diagnostische Komponente sowohl Zusammenhänge zur interventions- als auch zur aufgabenbezogenen Wissensfacette aufweist (vgl. Abschnitt 6.3.1), werden die Selbstwirksamkeitserwartungen über die Einschätzung der eigenen Fähigkeit, das Leistungspotential von Lernenden im Modellierungsprozess zu diagnostizieren, operationalisiert.
6.3 Strukturmodell der professionellen Kompetenz
159
Der Modellierungsprozess der Lernenden zeichnet sich in den verschiedenen Phasen durch unterschiedliche Tätigkeiten und kognitive Prozesse aus (vgl. Abschnitt 2.4). In den verschiedenen Modellierungsphasen, in denen die Lernenden aktuell arbeiten, sind unterschiedliche diagnostische Prozesse notwendig. Damit ist die Annahme gerechtfertigt, dass sich auch die Selbstwirksamkeit der Lehrkraft je nach Modellierungsphase unterscheidet. Im Hinblick auf die Tätigkeiten der Lernenden und die zugehörige Diagnostik können vor allem solche Phasen, die für den Modellierungsprozess unspezifisch sind und in denen die Tätigkeiten anhand von verschriftlichten Materialien nachvollzogen werden können (mathematisches Arbeiten), von Phasen, die für den Modellierungsprozess spezifisch sind (Vereinfachen/Strukturieren; Mathematisieren; Interpretieren; Validieren), abgegrenzt werden. Die Selbstwirksamkeitserwartungen zum mathematischen Modellieren werden daher zur Diagnostik von Leistungspotentialen zu den Tätigkeiten des mathematischen Arbeitens und zum Modellieren konzeptualisiert.
6.3.4
Empirische Validierung des Strukturmodells
Das theoretisch hergeleitete Strukturmodell zur professionellen Kompetenz zum Lehren mathematischen Modellierens (vgl. Abbildung 6.1) wurde anhand eines quantitativen Testinstruments (Klock & Wess, 2018) empirisch überprüft. Anhand einer Stichprobe von 156 Lehramtsstudierenden der Universitäten Duisburg-Essen, Koblenz-Landau und Münster wurde eine Strukturgleichungsanalyse durchgeführt, um die konzeptualisierte Struktur des Professionswissens zu prüfen. An dieser Stelle wird auf die Darstellung der Stichprobe, des vollständigen Testinstruments und der Auswertungsmethodik verzichtet. Hierzu sei auf Klock und Wess (2018), Klock et al. (2019) und Wess et al. (angenommen) verwiesen. Beispielitems zu den Überzeugungen und Selbstwirksamkeitserwartungen zum mathematischen Modellieren sowie dem Wissen über Interventionen und dem Wissen über Modellierungsprozesse werden im Methodenteil (vgl. Kapitel 9) dargestellt. Das Ergebnis der Strukturgleichungsanalyse wird in Abbildung 6.3 dargestellt. Die Fit-Indizes CFI, RMSEA und SRMR und der nicht signifikante Chi2 -Test weisen anhand der Richtwerte nach Hu und Bentler (1998) auf einen globalen Fit des Modells an die Daten hin. Der lokale Fit wird durch eine wenig bedeutsame und nicht signifikante Ladung der transmissiven Überzeugungen (λ = −.09) und einer geringen Varianzaufklärung (R2 = .01) beeinträchtigt. Eine negative Ladung ist dabei durchaus erwartungskonform, da konstruktivistische und transmissive Überzeugungen aufgrund der unterschiedlichen lerntheoretischen Sichtweisen negativ korrelieren (Voss et al., 2011). Alle weiteren Skalen laden signifikant mit einer
160
6
Professionelle Kompetenz zum Lehren mathematischen Modellierens
Abbildung 6.3 Strukturgleichungsanalyse zur professionellen Kompetenz zum Lehren mathematischen Modellierens (Klock et al., 2019; Wess et al., angenommen)
mittleren bis hohen Bedeutsamkeit auf den jeweiligen Konstrukten. Die Struktur des Modells lässt sich durch die Analyse überwiegend bestätigen. Empirisch lässt sich ein schwacher, aber signifikanter latenter Zusammenhang zwischen den Überzeugungen zum mathematischen Modellieren und dem modellierungsspezifischen fachdidaktischen Wissen nachweisen (r = 0.38). Mit den Selbstwirksamkeitserwartungen zum mathematischen Modellieren korrelieren diese beiden Konstrukte nicht signifikant und mit einer geringen Bedeutsamkeit. Aufgrund der Einbeziehung von Überzeugungen, Selbstwirksamkeitserwartungen und kognitiven Leistungsdispositionen werden anhand des Testinstruments (Klock & Wess, 2018) Kompetenzen im weiteren Sinne (vgl. Abschnitt 2.3.1) gemessen. Die Ergebnisse müssen vor einer für die Auswertungsmethodik relativ kleinen und nicht repräsentativen Stichprobe relativiert werden. Eine Prüfung des Strukturmodells anhand weiterer Daten ist notwendig, um eventuell bedeutsame Wechselwirkungen mit den Selbstwirksamkeitserwartungen nachzuweisen. Die Ergebnisse zeigen jedoch, dass sich die professionelle Kompetenz zum Lehren mathematischen Modellierens in den drei Kompetenzbereichen strukturvalide erfassen lässt. Die signifikante latente Korrelation zwischen den Überzeugungen zum mathematischen Modellieren und dem modellierungsspezifischen fachdidaktischen Wissen deuten auf gegenseitige Abhängigkeiten der beiden Konstrukte hin, was
6.3 Strukturmodell der professionellen Kompetenz
161
auf eine Zugehörigkeit zu einem übergeordneten Konstrukt – der professionellen Kompetenz zum Lehren mathematischen Modellierens – hinweist. In zukünftigen Untersuchungen ist darüber hinaus zu klären, welche Rolle ein bereichsspezifisches Fachwissen, bspw. die Modellierungskompetenz, im Strukturmodell spielt.
7
Forschungsfragen und Hypothesen
Anhand des theoretischen Hintergrunds werden Forschungsfragen und zugehörige Hypothesen hergeleitet, die in drei Arten von Fragestellungen gegliedert werden. In der Dimensionsanalyse wird die theoretisch abgeleitete Struktur der adaptiven a-priori-Interventionskompetenz empirisch geprüft (vgl. Abschnitt 7.1). In den Veränderungsanalysen wird die Wirksamkeit von Treatments zur Förderung der adaptiven a-priori-Interventionskompetenz und Veränderung weiterer Aspekte der professionellen Kompetenz zum Lehren mathematischen Modellierens bestimmt (vgl. Abschnitt 7.2). In den Zusammenhangsanalysen werden Einflussfaktoren für den Erwerb der adaptiven a-priori-Interventionskompetenz identifiziert und Zusammenhänge zwischen den Facetten der professionellen Kompetenz zum Lehren mathematischen Modellierens untersucht (vgl. Abschnitt 7.3).
7.1
Dimensionsanalyse
Prozessmodelle zur Beschreibung von Interventionen in Gruppenarbeitsphasen bestehen aus einem diagnostischen und interventionsbezogenen Teil (vgl. Abschnitt 3.3.2 und 3.3.4). In Kapitel 5 wird darauf basierend das Konstrukt der adaptiven a-priori-Interventionskompetenz, bestehend aus der Diagnose- und a-priori-Interventionskompetenz, theoretisch hergeleitet und begründet. Es wird untersucht, ob sich die zugehörige Kompetenzstruktur anhand empirischer Daten belegen lässt. Zur strukturvaliden Interpretation der Ergebnisse des verwendeten Testinstruments muss daher zunächst Forschungsfrage 1 geklärt werden:
© Der/die Herausgeber bzw. der/die Autor(en), exklusiv lizenziert durch Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2020 H. Klock, Adaptive Interventionskompetenz in mathematischen Modellierungsprozessen, Studien zur theoretischen und empirischen Forschung in der Mathematikdidaktik, https://doi.org/10.1007/978-3-658-31432-3_7
163
164
(F1)
7
Forschungsfragen und Hypothesen
Wie lässt sich die Struktur der adaptiven a-priori-Interventionskompetenz von Mathematik-Lehramtsstudierenden in kooperativen Modellierungsprozessen empirisch beschreiben?
Aufgrund der mehrfachen Unterscheidung von Diagnose- und Interventionskompetenzen in verschiedenen Prozessmodellen lässt sich zu Forschungsfrage 1 die folgende Hypothese formulieren: (H1)
7.2
Die Diagnose- und a priori-Interventionskompetenz von Mathematik-Lehramtsstudierenden in kooperativen Modellierungsprozessen bilden in einem zweidimensionalen Modell das Konstrukt der adaptiven a-priori-Interventionskompetenz in kooperativen Modellierungsprozessen.
Veränderungsanalysen
Ein weiteres Ziel der Studie ist die Evaluation einer möglichen Veränderung der adaptiven a-priori-Interventionskompetenz und weiterer Aspekte der professionellen Kompetenz zum Lehren mathematischen Modellierens durch fachdidaktische Seminare mit Praxiselementen. Dazu werden Mathematik-Lehramtsstudierende des Campus Koblenz der Universitäten Koblenz-Landau sowie der Universitäten Münster und Hamburg betrachtet. Anhand qualitativ-orientierter Studien wurden Einflüsse von Treatments mit Praxiselementen auf das Interventionsverhalten von (angehenden) Lehrkräften nachgewiesen (vgl. Abschnitt 4.3). Dabei wurde unter anderem festgestellt, dass Studierende vermehrt strategische Interventionen nutzten als vor den Treatments (Stender, 2016; Vorhölter et al., 2013). Van de Pol et al. (2014) wiesen in einer ebenfalls qualitativen Studie positive Effekte einer Lehrerfortbildung mit Praxiselementen auf den Einsatz und die Qualität adaptiver Interventionen nach. Die Ergebnisse sind aufgrund der kleinen Stichprobe und der qualitativen Herangehensweise wenig verallgemeinerbar. In der vorliegenden Arbeit wird daher anhand eines quantitativen Messinstruments überprüft, ob sich die adaptive apriori-Interventionskompetenz bei Lehramtsstudierenden im Rahmen universitärer fachdidaktischer Seminare mit Praxiselementen verbessern lässt. Sie wird als kognitive Leistungsdisposition von Mathematik-Lehramtsstudierenden untersucht.
7.2 Veränderungsanalysen
(F2)
165
Lässt sich die adaptive a-priori-Interventionskompetenz von Mathematik-Lehramtsstudierenden in kooperativen Modellierungsprozessen durch universitäre fachdidaktische Seminare mit Praxiselementen fördern?
Aufgrund der beschriebenen Studienergebnisse zur Veränderung des Interventionsverhalten von Lehramtsstudierenden und Lehrkräften werden zu Forschungsfrage 2 die folgenden Hypothesen formuliert. Aufgrund der theoretischen Unterscheidung werden Hypothesen in Bezug auf die Diagnose- und a-priori-Interventionskompetenzen formuliert: (H2.1)
Die Diagnosekompetenz von Mathematik-Lehramtsstudierenden in kooperativen Modellierungsprozessen lässt sich durch universitäre fachdidaktische Seminare mit Praxiselementen bedeutsam und signifikant steigern.
(H2.2)
Die a priori-Interventionskompetenz von Mathematik-Lehramtsstudierenden in kooperativen Modellierungsprozessen lässt sich durch universitäre fachdidaktische Seminare mit Praxiselementen bedeutsam und signifikant steigern.
Weiterhin werden Auswirkungen auf Überzeugungen und Selbstwirksamkeitserwartungen von Mathematik-Lehramtsstudierenden untersucht. Als Aspekte der professionellen Kompetenz zum Lehren mathematischen Modellierens bilden beide Konstrukte einen Bestandteil notwendiger Kompetenzen zum Lehren mathematischen Modellierens (vgl. Abschnitt 6.3). Forschungsfrage 3 bezieht sich auf die Überzeugungen zum mathematischen Modellieren.
(F3)
Lassen sich Überzeugungen von Mathematik-Lehramtsstudierenden zum mathematischen Modellieren durch ein universitäres fachdidaktisches Seminar mit Praxiselementen verändern?
Überzeugungen gelten als relativ stabile kognitive Strukturen (Voss et al., 2011), sodass eine intensive Auseinandersetzung mit den eigenen Überzeugungen und anderen Sichtweisen stattfinden muss, um sie zu verändern (Patrick & Pintrich, 2001). Forschungsfrage 3 wird in Bezug auf die vier konzeptualisierten Facetten von
166
7
Forschungsfragen und Hypothesen
Überzeugungen zum mathematischen Modellieren untersucht (vgl. Abschnitt 6.3.2). Da ein sozio-konstruktivistisches Lehr-Lern-Verständnis die Grundlage für die im Seminar geförderte adaptive Interventionskompetenz bildet (vgl. Abschnitt 3.1.1), ist zu vermuten, dass sich die Treatments auf die lerntheoretischen Überzeugungen (Voss et al., 2011, S. 239) der Lehramtsstudierenden auswirken. Es wird erwartet, dass im Posttest höhere Zustimmungswerte in den konstruktivistischen Überzeugungen und geringere in den transmissiven Überzeugungen festgestellt werden. In Bezug auf Forschungsfrage 3 werden folgende Hypothesen formuliert: (H3.1)
Die konstruktivistischen Überzeugungen von Mathematik-Lehramtsstudierenden lassen sich durch universitäre fachdidaktische Seminare mit Praxiselementen hinsichtlich höherer Zustimmungswerte bedeutsam und signifikant verändern.
(H3.2)
Die transmissiven Überzeugungen von Mathematik-Lehramtsstudierenden lassen sich durch universitäre fachdidaktische Seminare mit Praxiselementen hinsichtlich niedrigerer Zustimmungswerte bedeutsam und signifikant verändern.
Epistemologische Überzeugungen und Überzeugungen zum Lehren und Lernen von Mathematik (Woolfolk Hoy et al., 2006) werden hinsichtlich des Lehrens mathematischen Modellierens konkretisiert. Überzeugungen zur Anwendung mathematischen Modellierens beschreiben, inwieweit dem mathematischen Modellieren ein allgemeiner und gesellschaftlicher Nutzen und Anwendungsbezug zugesprochen wird. Überzeugungen zum mathematischen Modellieren in der Schule erfassen, inwieweit der Thematisierung von Modellierungsaufgaben und der Förderung von Modellierungskompetenzen ein berechtigter Platz im Mathematikunterricht zugesprochen wird (vgl. Abschnitt 6.3.2). Aufgrund der Fokussierung des mathematischen Modellierens, der eigenständigen Bearbeitung realistischer und authentischer Modellierungsaufgaben und der Förderung von Kompetenzen zum Lehren mathematischen Modellierens im Treatment kann vermutet werden, dass auch diese Art von Überzeugungen aufgrund einer intensiven Auseinandersetzung mit eigenen Überzeugungen und fremden Sichtweisen verändert werden (Patrick & Pintrich, 2001). Die zugehörigen Hypothesen zu Forschungsfrage 3 lauten: (H3.3)
Die Überzeugungen von Mathematik-Lehramtsstudierenden zur Anwendung mathematischen Modellierens lassen sich durch universitäre fachdidaktische Seminare mit Praxiselementen hinsichtlich höherer Zustimmungswerte bedeutsam und signifikant verändern.
7.2 Veränderungsanalysen
(H3.4)
167
Die Überzeugungen von Mathematik-Lehramtsstudierenden zum mathematischen Modellieren in der Schule lassen sich durch universitäre fachdidaktische Seminare mit Praxiselementen hinsichtlich höherer Zustimmungswerte bedeutsam und signifikant verändern.
Neben den Überzeugungen stellen Selbstwirksamkeitserwartungen einen wichtigen Bestandteil der professionellen Kompetenz von angehenden Lehrkräften dar (Kunter, 2011). Es wird untersucht, ob die Vorstellungen von Mathematik-Lehramtsstudierenden zur eigenen Wirksamkeit in mathematischen Modellierungsprozessen verändert werden. Die Selbstwirksamkeit wird in der vorliegenden Arbeit in Bezug auf die Diagnostik von Leistungspotentialen konkretisiert (vgl. Abschnitt 6.3.3). (F4)
Lassen sich Selbstwirksamkeitserwartungen von Mathematik-Lehramtsstudierenden zum mathematischen Modellieren durch universitäre fachdidaktische Seminare mit Praxiselementen bedeutsam und signifikant steigern?
Zur Veränderung von Selbstwirksamkeitserwartungen von Lehramtsstudierenden während des Studiums existieren Befunde, die einen differenzierten Einblick geben. Schüle et al. (2017) rekonstruieren über die Absolvierung des Studiums einen u-förmigen Verlauf der Selbstwirksamkeitserwartungen, der mit überhöhten Vorstellungen zu Beginn des Studiums, der Herabsetzung des eigenen Bewertungsmaßstabs aufgrund von ersten Praxiserfahrungen (Tschannen-Moran & Woolfolk Hoy, 2007) und des dann stetigen Anstiegs aufgrund von Erfolgserfahrungen in Praktika begründet wird. Da die untersuchten Studierenden sich nicht mehr am Anfang ihres Studiums befinden, haben sie bereits erste Praxiserfahrungen in Praktika gesammelt. Es findet zudem eine explizite Förderung der Diagnosekompetenz statt. Da mit Praxiserfahrungen aufgrund des fortgeschrittenen Studiums vermutlich ein Anstieg der Selbstwirksamkeitserwartungen verbunden ist, kann in beiden Facetten der Selbstwirksamkeitserwartungen zum mathematischen Modellieren (vgl. Abschnitt 6.3.3) eine Steigerung vermutet werden. Sowohl selbst erfolgreich durchgeführte als auch beobachtete erfolgreiche Handlungen tragen in Verbindung mit positiven Emotionen zu einer Steigerung bei (Bandura, 1977). Zu Forschungsfrage 4 werden daher die folgenden Hypothesen formuliert:
168
7
Forschungsfragen und Hypothesen
(H4.1)
Die Selbstwirksamkeitserwartungen von Mathematik-Lehramtsstudierenden zum Modellieren lassen sich durch universitäre fachdidaktische Seminare mit Praxiselementen bedeutsam und signifikant steigern.
(H4.2)
Die Selbstwirksamkeitserwartungen von Mathematik-Lehramtsstudierenden zum mathematischen Arbeiten lassen sich durch universitäre fachdidaktische Seminare mit Praxiselementen bedeutsam und signifikant steigern.
7.3
Zusammenhangsanalysen
Die Zusammenhangsanalysen lassen sich in zwei Teile gliedern. In einem ersten Teil werden Einflussfaktoren für die Wirksamkeit der Treatments in Koblenz und Münster untersucht. In einem zweiten Teil werden Zusammenhänge zwischen der adaptiven a-priori-Interventionskompetenz und weiteren Facetten der professionellen Kompetenz zum Lehren mathematischen Modellierens analysiert.
7.3.1
Analyse von Einflussfaktoren
Anhand von Facetten der professionellen Kompetenz zum Lehren mathematischen Modellierens und anhand von weiteren Personenvariablen wird deren Einfluss auf den Erwerb von Diagnose- und a-priori-Interventionskompetenzen untersucht. So können auf der einen Seite aufgrund des quasi-experimentellen Designs zustande gekommene Unterschiede zwischen den Versuchsgruppen anhand statistischer Verfahren kontrolliert werden. Auf der anderen Seite können günstige Voraussetzungen für die Förderung dieser Kompetenzen identifiziert werden. Die zugehörige Forschungsfrage 5 lautet: (F5)
Welche Einflussfaktoren sind bei Mathematik-Lehramtsstudierende für den Erwerb von Diagnose- und a-priori-Interventionskompetenzen in kooperativen Modellierungsprozessen im Rahmen universitärer fachdidaktischer Seminare mit Praxiselementen bedeutsam?
7.3 Zusammenhangsanalysen
169
Zur Beantwortung von Forschungsfrage 5 wurden folgende Personenvariablen erhoben, die für den Erwerb der beiden Teilkompetenzen eventuell bedeutsam sind. Untersucht werden … 1. 2. 3. 4. 5. 6.
das Geschlecht, das Hochschulsemester, die Abiturnote, die Praxiserfahrung, selbstberichtete Vorerfahrungen zum mathematischen Modellieren, das Vorwissen (Diagnosekompetenz bzw. a-priori-Interventionskompetenz im Pretest), 7. die Überzeugungen zum mathematischen Modellieren im Pretest, 8. die Selbstwirksamkeitserwartungen zum mathematischen Modellieren im Pretest. Das Geschlecht wird als üblicherweise erhobenes sozio-demographisches Merkmal der Probanden in die Analyse miteinbezogen. Es wird überprüft, ob signifikante Effekte aufgrund von Geschlechterunterschieden vorliegen. Kaiser und Steisel (2000) stellen bei der Analyse von Daten der 3. TIMS-Studie leicht bessere Leistungen in realitätsnahen Aufgaben auf Seiten der Jungen fest, wobei in Aufgaben mit einem künstlichen Kontext kein signifikanter Unterschied vorliegt. Auch Brunner, Krauss und Martignon (2011) attestieren Jungen bessere Leistungen in komplexen Aufgaben mit unkonventionellen Problemlösestrategien. Budde (2009, S. 22 f) stellt in der PISA-Studie 2003 jedoch bessere Leistungen der Mädchen im Bereich des Problemlösens fest. Die Ergebnisse zeigen mögliche Einflüsse des Geschlechts beim Erwerb mathematischer Kompetenzen auf. Da das mathematische Modellieren eine zentrale Rolle in den Treatments einnimmt (vgl. Abschnitt 8.4), kann das Geschlecht beim Erwerb der adaptiven a-priori-Interventionskompetenz bedeutsam sein. Anstatt des Alters der Probanden wird der Einfluss des Hochschulsemesters (im Folgenden: Semester) auf den Erwerb der beiden Teilkompetenzen untersucht. Aufgrund des natürlichen Zusammenhangs zwischen dem Alter und Semester kann zur Vermeidung von Multikollinearität nur einer der Prädiktoren in die Analyse mit aufgenommen werden. Da das Semester eine validere Auskunft über den Studienfortschritt gibt, ist diese Variable geeigneter. Es kann vermutet werden, dass Studierende höheren Semesters aufgrund ihres größeren Vorwissens auch größere Zuwächse durch das Treatment erzielen. Affektive Merkmale können den Erwerb beeinflussen, da bei höheren Semestern die größere Nähe zum Studienabschluss
170
7
Forschungsfragen und Hypothesen
und damit zum Berufseinstieg ein größeres Relevanzerleben der Inhalte nach sich ziehen kann. Die Abiturnote wird als bester Prädiktor des Studienerfolgs (r = 0.53) als bedeutsamer Einflussfaktor betrachtet. Sie spiegelt Eigenschaften der Probanden wie kognitive Leistungsfähigkeit, Lernbereitschaft, Leistungsmotivation, Fleiß und sprachliche Ausdrucksfähigkeit wider, die für den Lernprozess von Bedeutung sind (Blömeke, 2002; Trapmann, Hell, Weigand, & Schuler, 2007). Daher wird bei einer kleineren, d. h. besseren Abiturnote ein positiver Einfluss auf den Erwerb der adaptiven a-priori-Interventionskompetenz erwartet. Es wird auch ein Einfluss der Praxiserfahrung der Probanden auf den Erwerb der adaptiven a-priori-Interventionskompetenz vermutet. Durch unterrichtliche Erfahrungen kann das situationsspezifische Training als relevanter für den zukünftigen Beruf empfunden werden. Operationalisiert wird die Praxiserfahrung über die Anzahl der Tage, die in Pflicht-Praktika im Lehramtsstudium absolviert wurden. Auch selbstberichtete Vorerfahrungen der Studierenden werden in die Analysen miteinbezogen. Vorerfahrungen zum mathematischen Modellieren können zu höheren Zuwächsen in den beiden Teilkompetenzen führen. Durch die Bearbeitung von Modellierungsaufgaben kann ein größeres Metawissen zum Modellierungskreislauf vorhanden sein, das die Diagnostik des Lösungsprozesses erleichtert. Unterrichtliche Erfahrungen mit Modellierungsprozessen können den Lernprozess zusätzlich beeinflussen. Die Vorerfahrungen werden anhand von Selbsteinschätzungen erhoben. Das Vorwissen spielt für den Lernerfolg unbestritten eine wichtige Rolle. Dies wurde durch zahlreiche Befunde belegt (Krause & Stark, 2006). Es steuert die Aufmerksamkeit der Lernenden und welche Informationen für wichtig und unwichtig gehalten werden (Alexander, 2012). Demnach haben die Diagnose- und a-priori-Interventionskompetenzen im Pretest vermutlich eine prädiktive Wirkung und werden in der Analyse berücksichtigt. Schließlich können Überzeugungen und Selbstwirksamkeitserwartungen zum mathematischen Modellieren als Aspekte der professionellen Kompetenz zum Lehren mathematischen Modellierens zu Beginn des Treatments einen Einfluss auf den Lernerfolg haben. Überzeugungen wird bei der Wahrnehmung der Realität ähnlich wie dem Vorwissen eine Filterfunktion zugesprochen (Blömeke, 2004; Törner, 2002, S. 75). So können Inhalte, die mit bestehenden Überzeugungen konform gehen, wahrgenommen und ihnen widersprechende Inhalte weniger stark aufgenommen werden (Schwarz, 2013, S. 58). Ein Zusammenhang zwischen den Überzeugungen zum mathematischen Modellieren und dem modellierungsspezifischen fachdidaktischen Wissen wurde strukturanalytisch belegt (Klock et al., 2019). Studienergebnisse zeigen, dass hohe Selbstwirksamkeitserwartungen mit einer höheren
7.3 Zusammenhangsanalysen
171
Unterrichtsqualität, dem Einsatz innovativerer und effektiverer Methoden im Unterricht und einem höheren Engagement zusammenhängen (Kunter, 2011). Demnach kann bei Studierenden mit hohen Selbstwirksamkeitserwartungen eine größere Bereitschaft zum Erwerb adaptiver a-priori-Interventionskompetenzen vermutet werden. Auswirkungen von Überzeugungen und Selbstwirksamkeitserwartungen zu Beginn der Treatments auf den Erwerb der adaptiven a-priori-Interventionskompetenz werden in der vorliegenden Studie untersucht.
7.3.2
Analyse von Zusammenhängen
Es werden sowohl vor als auch nach dem Treatment, in Pre- und Posttest, Daten erhoben. Diese werden zur Bestimmung von Zusammenhängen zwischen den Facetten der professionellen Kompetenz zum Lehren mathematischen Modellierens herangezogen. Dem Zusammenhang zwischen den Teilkompetenzen kommt in der Studie eine besondere Bedeutung zu. In den Abschnitten 3.3.2, 3.3.3 und 3.3.4 wird die Diagnosekompetenz von mehreren Autoren als eine Voraussetzung für eine adäquate Intervention angesehen. Auch empirische Hinweise deuten auf einen Zusammenhang der beiden Teilkompetenzen hin (Helmke & Schrader, 1987; Stender, 2016, S. 206). Daraus ergibt sich die Frage, inwieweit die Diagnose- und a-priori-Interventionskompetenz im konzeptualisierten Konstrukt zusammenhängen. (F6)
Welcher Zusammenhang besteht bei Mathematik-Lehramtsstudierenden zwischen der Diagnose- und a-priori-Interventionskompetenz in kooperativen Modellierungsprozessen?
Im Hinblick auf die theoretischen und empirischen Hinweise kann ein Zusammenhang zwischen den beiden Teilkompetenzen vermutet werden. In Abschnitt 5.3 wird ein Prozessmodell einer idealisierten Intervention vorgestellt, in dem die Diagnostik eine Voraussetzung für die Auswahl einer adaptiven Intervention darstellt. Hinsichtlich des vermuteten Zusammenhangs wird für Forschungsfrage 6 die folgende Hypothese formuliert: (H6)
Die a-priori-Interventionskompetenz in kooperativen Modellierungsprozessen (Kriterium) lässt sich bei Mathematik-Lehramtsstudierenden durch die Diagnosekompetenz in kooperativen Modellierungsprozessen (Prädiktor)
172
7
Forschungsfragen und Hypothesen
vorhersagen. Die Diagnosekompetenz ist ein bedeutsamer Prädiktor der a-priori-Interventionskompetenz. In einem weiteren Schritt werden die Facetten der Aspekte professioneller Kompetenz zum Lehren mathematischen Modellierens hinsichtlich ihres Zusammenhangs mit diesen beiden Teilkompetenzen untersucht. Es werden Fragestellungen in Bezug auf die Diagnose- und a-priori-Interventionskompetenz unterschieden: (F7)
Besteht ein bedeutsamer und signifikanter Zusammenhang zwischen der Diagnosekompetenz in kooperativen Modellierungsprozessen und ... (F7.1) … den Überzeugungen zum mathematischen Modellieren? (F7.2) … den Selbstwirksamkeitserwartungen zum mathematischen Modellieren?
(F8)
Besteht ein bedeutsamer und signifikanter Zusammenhang zwischen der a-priori-Interventionskompetenz in kooperativen Modellierungsprozessen und (F8.1) … den Überzeugungen zum mathematischen Modellieren? (F8.2) … den Selbstwirksamkeitserwartungen zum mathematischen Modellieren?
In Vorarbeiten wurde ein signifikanter, latenter Zusammenhang (mittlerer Effekt) zwischen den Überzeugungen zum mathematischen Modellieren und dem modellierungsspezifischen fachdidaktischen Wissen festgestellt (vgl. Abschnitt 5.3.4; Klock et al., 2019; Wess et al., angenommen). Da jedoch keine Analysen zum Zusammenhang zwischen einzelnen Facetten der Überzeugungen und Selbstwirksamkeitserwartungen und Facetten des modellierungsspezifischen fachdidaktischen Wissens vorliegen, können keine Hypothesen formuliert werden. Die Zusammenhänge werden explorativ bestimmt.
Teil II Methodischer Ansatz der Studie
8
Design der Studie
In diesem Kapitel wird zunächst der methodologische Forschungsansatz erläutert und begründet (vgl. Abschnitt 8.1). Im Anschluss wird das Forschungsdesign der Studie vorgestellt (vgl. Abschnitt 8.2). Es schließt eine Beschreibung der Teilstichproben an den drei unterschiedlichen Standorten an (vgl. Abschnitt 8.3). In Abschnitt 8.4 werden die für die Standorte spezifischen Treatments erläutert, die die Lehramtsstudierenden durchlaufen haben. Dabei liegt ein besonderer Fokus auf dem Treatment in Koblenz, da an diesem Standort eine fokussierte Förderung der adaptiven Interventionskompetenz durchgeführt wurde und die Studierenden zusätzlich hinsichtlich einer Veränderung in Überzeugungen und Selbstwirksamkeitserwartungen untersucht werden. Um einen Einblick in die verwendeten Modellierungsaufgaben und ihren Modellierungsgehalt (Kuntze & Zöttl, 2008) zu geben, werden zwei in Koblenz verwendete Aufgaben inklusive exemplarischer Lösungswege vorgestellt und hinsichtlich ihres Modellierungsgehalts analysiert (vgl. Abschnitt 8.5).
8.1
Methodologischer Ansatz
Im Hinblick auf die abgeleiteten Forschungsfragen und -hypothesen ist eine Forschungsmethodik zu wählen, die geeignet ist, die angeführten Fragestellungen zu beantworten. Dabei kommt ein Kontinuum von Methoden zwischen dem quantitativen Forschungsparadigma, basierend auf der Wissenschaftstheorie des Kritischen Elektronisches Zusatzmaterial Die elektronische Version dieses Kapitels enthält Zusatzmaterial, das berechtigten Benutzern zur Verfügung steht https://doi.org/10.1007/978-3-658-31432-3_8 © Der/die Herausgeber bzw. der/die Autor(en), exklusiv lizenziert durch Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2020 H. Klock, Adaptive Interventionskompetenz in mathematischen Modellierungsprozessen, Studien zur theoretischen und empirischen Forschung in der Mathematikdidaktik, https://doi.org/10.1007/978-3-658-31432-3_8
175
176
8
Design der Studie
Rationalismus (Popper, 1989), und dem qualitativen Forschungsparadigma, das sich aus einer Sammlung „expliziter und impliziter Wissenschaftstheorien, Forschungsstrategien und Denkstile“ (Döring & Bortz, 2016, S. 63) konstituiert, in Frage. Unter anderem ist der Stand der Forschung, d. h. vorhandene Theorien und empirische Befunde, ausschlaggebend. Um ein Konstrukt quantitativ untersuchen zu können, müssen Theorien und Befunde vorliegen, die eine Operationalisierung mithilfe von Variablen erlauben. Ist dies nicht möglich, muss das Konstrukt zunächst anhand qualitativer Methoden beschrieben und verstanden werden. Das quantitative Forschungsparadigma ist daher tendenziell zur Theorie- und Hypothesenprüfung, das qualitative Forschungsparadigma ist tendenziell zur Entwicklung von Theorien und Hypothesen geeignet (Döring & Bortz, 2016, S. 15 f.). Die untersuchten Konstrukte werden in der vorliegenden Arbeit anhand der in den Kapiteln 2–6 dargestellten Theorie konkretisiert, sodass eine Operationalisierung mittels eines quantitativen Instruments möglich ist. Zu einem großen Teil liegen zu den abgeleiteten Forschungsfragen Vorarbeiten und qualitative Befunde vor, die eine Formulierung von Hypothesen erlauben. Die Studie ist in Teilen hypothesenprüfend und daher dem quantitativen Forschungsparadigma zuzuordnen. Es wurde das im Folgenden dargestellte Forschungsdesign angewendet.
8.2
Forschungsdesign
Zur Beantwortung der Forschungsfragen und zur Überprüfung der Hypothesen wurde eine quasi-experimentelle Interventionsstudie1 am Campus Koblenz der Universität Koblenz-Landau in Kooperation mit einem Projekt an der Westfälischen Wilhelms-Universität Münster (Greefrath & Wess, 2016) durchgeführt (vgl. Abbildung 8.1). In einem Pre-Post-Design mit Kontrollgruppe wurden Treatments bestehend aus universitären fachdidaktischen Seminaren mit dem thematischen Schwerpunkt auf dem Lehren und Lernen mathematischen Modellierens durchgeführt. Die Treatments wurden nach einer Pilotierung im Sommersemester 2017 in drei aufeinanderfolgenden Semestern (Wintersemester 2017/2018, Sommersemester 2018, Wintersemester 2018/2019) in das Regelstudium von 1 Streng
genommen ist die Studie in gleicher Weise der Evaluationsforschung zuzuordnen (Döring & Bortz, 2016, S. 996), da Interventions- und Evaluationsforschung in Bildungsstudien schwierig zu unterscheiden sind (Mittag & Bieg, 2010). Im Folgenden wird daher stets von einer Interventionsstudie gesprochen.
8.2 Forschungsdesign
177
Mathematik-Lehramtsstudierenden integriert. Zusätzliche Kontrollgruppen wurden an der Universitäten Münster und Hamburg erhoben. In den Treatments an den Standorten Koblenz und Münster wurden ähnliche theoretische Grundlagen vermittelt, um eine vergleichbare Wissensbasis herzustellen. Der Fokus bei der Förderung der Lehramtsstudierenden lag jedoch auf unterschiedlichen Facetten des modellierungsspezifischen fachdidaktischen Wissens, das einen Aspekt der professionellen Kompetenz zum Lehren mathematischen Modellierens darstellt (vgl. Abschnitt 6.3.1). Am Standort Koblenz lag der Schwerpunkt auf der Förderung der adaptiven Interventionskompetenz anhand von Textund Videovignetten sowie anhand einer Praxiseinbindung im Lehr-Lern-Labor (vgl. Abschnitt 8.4.1). Am Standort Münster wurde die Förderung der Diagnose- und Aufgabenkompetenz fokussiert (vgl. Abschnitt 8.4.2).
Abbildung 8.1 Design der Studie
Es wurden zusätzlich Kontrollgruppen erhoben, die kein Treatment zur Förderung von Aspekten der professionellen Kompetenz zum Lehren mathematischen Modellierens durchliefen. Um eine ausreichende Probandenzahl zu erreichen, wurden diese Daten an den Universitäten Münster und Hamburg erhoben und anschließend zu einer Kontrollgruppe zusammengefasst. Die Wirksamkeit der beiden Treatments in den Experimentalgruppen in Koblenz und Münster kann so im Vergleich zur Kontrollgruppe bestimmt und eventuelle Erinnerungseffekte durch die wiederholte Testbearbeitung abgeklärt werden. Im Pre- und Posttest wurde dasselbe Testinstrument mit identischen Testitems verwendet, um einen direkten Vergleich zwischen den Messzeitpunkten zu ermöglichen. Dadurch können Veränderungen der Testwerte durch unterschiedliche Aufgabenschwierigkeiten oder Kontexte vermieden werden. Der Nachteil besteht in
178
8
Design der Studie
eventuellen Übungs- oder Erinnerungseffekten, die durch die wiederholte Testbearbeitung zustande kommen können. Übungseffekte treten dann auf, wenn Probanden durch das bekannte Itemformat oder den Kontext der Aufgabe kognitiv entlastet sind und daher mehr Aufgaben richtig lösen. Dies würde zu einem höheren Score im Posttest führen, der nicht auf das Treatment zurückzuführen ist. Bei Erinnerungseffekten besteht die Gefahr, dass die Probanden insbesondere im Fragebogen (vgl. Abschnitt 9.2) die Antworten des Pretests memorieren und im Posttest daher gleich antworten, um in ihrem Antwortverhalten sicher zu erscheinen (Schermelleh-Engel & Werner, 2012). Dies führt zu einer geringeren Veränderung der Testscores über das Treatment. Eine Methode zur Lösung beider Probleme stellt das Rotationsdesign dar, bei dem im Pre- und Posttest jeweils nur ein Teil der Testaufgaben bearbeitet werden, die sich teilweise unterscheiden. Anhand der Item-Response-Theory (IRT; vgl. Abschnitt 10.4) können unabhängig von der Schwierigkeit der Items für jede Person und jeden Testzeitpunkt auch für die nicht bearbeiteten Items Lösungswahrscheinlichkeiten berechnet werden, sofern das Modell anwendbar ist (Moosbrugger, 2012). In der vorliegenden Arbeit werden jeweils alle Items in Pre- und Posttest verwendet, um eine möglichst valide Messung sicherzustellen. Im Rotationsdesign hätte sich die Anzahl der eingesetzten Items jeweils halbiert. Bei einem zeitlichen Abstand von 12–19 Wochen zwischen den Testungen wird davon ausgegangen, dass Übungs- und Erinnerungseffekte nur in einem geringen Umfang auftreten. Eventuelle Übungseffekte, die die Ergebnisse positiv verzerren würden, werden in der Kontrollgruppe bestimmt. Erinnerungseffekte verzerren die Ergebnisse negativ und führen daher zu einer Unterschätzung der Effekte. Die in der Studie bestimmten Effekte stellen dann konservative Schätzer dar, was als weniger problematisch zu bewerten ist. Das Design der Studie erlaubt daher die Beantwortung der Forschungsfragen. Aufgrund der erstmaligen Untersuchung der beschriebenen Forschungsfragen handelt es sich um eine Primärstudie, sodass nur ein relativ kleiner Datensatz betrachtet werden kann. Das Erkenntnisinteresse besteht in der empirischen Überprüfung des konzeptualisierten Konstrukts und der Hypothesen. Damit hat die Untersuchung einen explanativen Charakter (Döring & Bortz, 2016, S. 192). Es liegt ein quasi-experimentelles Design vor, da die Voraussetzung eines experimentellen Designs, der randomisierten Zuordnung der Probanden zu den Treatments, nicht erfüllt wird. Es handelt sich um eine Feldstudie in der universitären Lehrerausbildung, sodass die Lehramtsstudierenden nicht randomisiert zu den Treatments zugeordnet werden konnten. Eine Feldstudie birgt den Nachteil, dass Umwelteinflüsse und
8.3 Stichprobe
179
untersuchungsbedingte Störvariablen (bspw. Störung der Treatments durch organisatorische Vorgaben, Selbstselektion, …) nur bedingt kontrolliert werden können, sodass im Vergleich zu Laborstudien eine geringe interne Validität und kausale Übertragbarkeit der Ergebnisse vorliegt. Stattdessen ist jedoch eine größere externe Validität durch eine bessere Übertragbarkeit der Ergebnisse auf den hochschulischen Lehralltag gegeben (Döring & Bortz, 2016, S. 206). Aufgrund der hochschuldidaktischen Ausrichtung der Studie und dem Bezug zur Lehrerausbildung stellt das quasi-experimentelle Feldexperiment daher eine geeignete Wahl zur Untersuchung der Forschungsfragen dar.
8.3
Stichprobe
Die Grundgesamtheiten der untersuchten Probanden stellen jeweils die MathematikLehramtsstudierenden an den Standorten Koblenz, Münster und Hamburg dar. Die untersuchte Stichprobe wurde durch eine Selbstselektion der Studierenden aus den Grundgesamtheiten gewonnen. Die Studierenden belegten ein Pflicht- oder WahlPflicht-Seminar ihres Studiengangs. Aufgrund dieser Selbstselektion handelt es sich nicht um eine Zufalls-, sondern um eine Gelegenheitsstichprobe, was zu einer eingeschränkten Repräsentativität führt. Es können nur bedingt Rückschlüsse auf die Population gezogen werden (Döring & Bortz, 2016, S. 306). Da sich die Stichprobe aus jeweils mehreren Seminargruppen in insgesamt drei Semestern zusammensetzt, liegen Datencluster vor. Diese Cluster-Effekte, die durch die Zugehörigkeit zu einer Universität und zu einer Seminargruppe zustande kommen, können bei der Auswertung der Daten zu einer Verzerrung der Signifikanztests führen. Sie müssen gegebenenfalls bei der Auswertung der Daten und bei der Interpretation der Ergebnisse berücksichtigt werden (vgl. Abschnitt 10.6.6). Die Stichproben der einzelnen Standorte unterscheiden sich in verschiedenen Merkmalen (vgl. Tabelle 8.1; Semester, Abiturnote, Praxiserfahrung, …). Diese wurden im Rahmen der forschungsökonomischen Möglichkeiten mit erhoben. Ihr Einfluss auf die Wirksamkeit der Treatments wird jeweils bestimmt und im Falle der Bedeutsamkeit statistisch kontrolliert. Die Varianz der Daten aufgrund der verschiedenen Merkmale der Probanden über die Standorte hinweg bietet jedoch die Möglichkeit, günstige Voraussetzungen für die Förderung der adaptiven a-priori-Interventionskompetenz zu bestimmen.
180
8
Design der Studie
Tabelle 8.1 Stichprobenbeschreibung N
Geschlecht
Semester
Abiturnote
Praxiserfahrung
m/w
M
SD
M
SD
in Tagena
Zielschulart
EG Koblenz
55
25/30
5.69
2.59
2.42
0.61
N = 15: 15 N = 24: 30 N = 15: 45
11 Rs+ 39 Gym 5 BbS
EG Münster
76
37/39
7.58
2.47
1.83
0.48
N = 1: 20 N = 65: 40 N = 10: 140
76 Gym/Ges
Kontrollgruppe
38
10/28
7.61
1.13
1.88
0.61
16 Prim/Sek 1 34 Gym/Ges
Münster
18
6/12
7.94
1.39
1.88
0.38
N = 18: 30
18 Gym/Ges
Hamburg
20
4/16
7.30
0.73
1.89
0.78
b
16 Prim/Sek 1 4 Gym
Anmerkung. m/w: männlich/weiblich, M: Mittelwert, SD: Standardabweichung, a Differenzen zwischen den Probandenzahlen (N) und den Zelleneinträgen entstehen durch fehlende Werte, b In der Kontrollgruppe Hamburg wurde die Praxiserfahrung nicht erhoben.
In der Experimentalgruppe (EG) Koblenz absolvierten in drei Semestern insgesamt 55 Studierende das Treatment in Koblenz. Das Geschlechterverhältnis ist ausgewogen. Die Studierenden befinden sich in ihrem fünften bis sechsten Semester und damit am Ende ihres Bachelorstudiums. Die durchschnittliche Abiturnote liegt im Bereich einer Zwei bis Drei. Im Rahmen der hochschulischen Lehrerausbildung absolvieren die Studierenden in Rheinland-Pfalz vier Praktika á 15 Tage, wobei drei Praktika im Bachelor-Studium stattfinden. Anhand der absolvierten Praktika wird die im Rahmen des Lehramtsstudiums verpflichtend durch Hospitation und Unterricht gesammelte Praxiserfahrung der Studierenden quantifiziert. Der Großteil der an den Treatments teilnehmenden Studierenden hat bereits die ersten beiden Praktika absolviert, verfügt also über mindestens 30 Tage schulpraktische Erfahrung. An diesem Treatment nahmen Lehramtsstudierende für das Lehramt an der Realschule plus (Rs+), dem Gymnasium (Gym) und der Berufsbildende Schule (BbS) teil. In der EG Münster durchliefen in drei Semestern 76 Lehramtsstudierende das Treatment. Das Geschlechterverhältnis ist ausgewogen. Die Studierenden befinden sich in ihrem siebten bis achten Semester und damit im Master ihres Lehramtsstudiums. Die durchschnittliche Abiturnote liegt im Bereich einer Eins bis Zwei. In Nordrhein-Westfalen absolvieren die Lehramtsstudierenden drei verschiedene Praktika: ein Orientierungspraktikum von mindestens 20 Tagen, ein Berufsfeldpraktikum von mindestens 20 Tagen und ein Praxissemester von mindestens 100 Tagen.
8.3 Stichprobe
181
Zur Quantifizierung der Praxiserfahrung wird die Mindestanzahl der verpflichtenden Praktikumstage verwendet. Bis auf einen Studierenden verfügen alle über mindestens 40 Tage Praxiserfahrung. Es nahmen ausschließlich Studierende für Gymnasium (Gym) und Gesamtschulen (Ges) an diesem Treatment teil. Die 38 Probanden der Kontrollgruppe wurden an den Universitäten Münster und Hamburg beim Besuch fachdidaktischer Seminare getestet. Es befinden sich deutlich mehr Frauen als Männer in der Teilstichprobe. Die Probanden befinden sich durchschnittlich im siebten bis achten Semester und damit im Masterstudium. Die durchschnittliche Abiturnote liegt im Bereich einer Eins bis Zwei. Hinsichtlich der Merkmale Semester und Abiturnote sind die Studierenden der Standorte Hamburg und Münster vergleichbar. Ein Großteil der Studierenden am Standort Hamburg belegt in Abgrenzung zu den anderen Standorten einen gemeinsamen Lehramtsstudiengang für die Primar- und Sekundarstufe 1 (Prim/Sek 1). Lediglich vier der 20 Studierenden streben das gymnasiale Lehramt an (Gym). Beide Lehramtsstudiengänge belegen jedoch dieselben fachdidaktische Wahl-Pflicht-Seminare. Die beiden Experimentalgruppen unterscheiden sich signifikant im Merkmal Semester (p < 0.001), Abiturnote (p < 0.001) und Praxiserfahrung (p < 0.001)2 . Der Unterschied im Merkmal Semester ist darauf zurückzuführen, dass das Treatment am Standort Koblenz im Bachelor- und am Standort Münster im Masterstudiengang verortet ist. Die unterschiedlichen Abiturnoten stehen vermutlich mit einer Zulassungsbeschränkung (Numerus clausus) in Münster und Selektionseffekten durch den Studienfortschritt in Verbindung. Die Kontrollgruppe unterscheidet sich im Merkmal Abiturnote signifikant von der EG Koblenz (p < 0.001). Zur EG Münster gibt es keinen signifikanten Unterschied. Im Merkmal Semester unterscheidet sich die Kontrollgruppe ebenfalls signifikant von der EG Koblenz (p < 0.001). Ein signifikanter Unterschied liegt in der Praxiserfahrung zwischen der Kontrollgruppe und den beiden Experimentalgruppen vor (p < 0.01). Dabei muss jedoch bedacht werden, dass lediglich die Studierenden der Kontrollgruppe aus Münster in den Vergleich miteinbezogen werden, da die Praxiserfahrung in Hamburg nicht erhoben wurde. Die Gruppenunterschiede sind bei der Diskussion der Wirksamkeit der Treatments miteinzubeziehen und werden gegebenenfalls statistisch kontrolliert.
2 Die
statistischen Analysen wurden anhand einer Welch-ANOVA durchgeführt, da keine Varianzhomogenität vorlag. Zur inferensstatistischen Absicherung der Unterschiede wurde der Games-Howell-post-hoc-Test verwendet. Das Prinzip der einfaktoriellen ANOVA wird in Abschnitt 10.5.1 vorgestellt.
182
8.4
8
Design der Studie
Treatments
Die Beschreibung der Lehrveranstaltungen orientiert sich an einem Konzept für die Qualitätsmessung von Lehrveranstaltungen (Donabedian, 2005; Schmidt, 2005). Dabei werden drei Dimensionen der Qualität unterschieden: die Strukturqualität, die Prozessqualität und die Ergebnisqualität. Unter der Strukturqualität werden in erster Linie organisatorische sowie personelle und finanzielle Rahmenbedingungen verstanden, die die Lehrveranstaltung beeinflussen. Abhängig von der Zielstellung der Maßnahme können vor allem personelle und finanzielle Einschränkungen die Zielerreichung erschweren und damit die Qualität mindern. Die Prozessqualität hingegen bezieht sich in der hochschulischen Lehre auf die Konzeption der Lehrveranstaltungen und die Gestaltung der Lehr-Lern-Arrangements. An dieser Stelle spielen bspw. auch Kriterien für Unterrichtsqualität eine Rolle, die in die Hochschuldidaktik übertragen werden sollten (Borromeo Ferri & Blum, 2010). Die Ergebnisqualität erfasst, inwieweit die intendierten Ziele der Lehrveranstaltung erreicht wurden. Im vorliegenden Fall wird sie anhand der Wirksamkeit der Treatments beurteilt, die im Ergebnisteil berichtet werden.
8.4.1
Treatment in der EG Koblenz
Das Ziel des fachdidaktischen Seminars am Campus Koblenz der Universität Koblenz-Landau ist die Förderung der adaptiven Interventionskompetenz in kooperativen Modellierungsprozessen, die sich aus der Diagnose- und Interventionskompetenz (vgl. Abschnitt 5.3) bzw. dem Wissen über Interventionen und dem Wissen über Modellierungsprozesse (vgl. Abschnitt 6.3.1) zusammensetzt. Das Seminar ist im Bachelorstudium verankert und stellt für alle Lehramtsstudierenden im Fach Mathematik mit der Zielschulart Realschule plus, Gymnasium und Berufsbildende Schule eine Pflichtveranstaltung dar. Es wurden keine alternativen Seminare zum hier vorgestellten angeboten, sodass alle Mathematik-Lehramtsstudierenden zum Zeitpunkt der Studie das Treatment durchlaufen mussten. In jedem Semester wurden zwei Seminare mit einer Gruppengröße von 6 bis 13 Studierenden im Zeitraum von 16 bis 20 Uhr angeboten. Die Präsenssitzungen hatten je eine Länge von 90 Minuten. Die fachdidaktische Ausbildung der Lehramtsstudierenden im Bachelorstudiengang besteht aus vier Veranstaltungen: drei Vorlesungen und einem fachdidaktischen Seminar mit je zwei Semesterwochenstunden (SWS), die zum Teil parallel besucht werden können. Eine Wechselwirkung mit weiteren fachdidaktischen Veranstaltungen kann daher nicht ausgeschlossen werden. In der fachdidaktischen Grundlagenvorlesung wird das mathematische Modellieren nur am Rande thematisiert
8.4 Treatments
183
und es werden keine Inhalte zu Interventionen vermittelt. In den anderen beiden Vorlesungen werden keine für die Studie relevanten Inhalte gelehrt, sodass Wechselwirkungen nur in sehr geringem Umfang zu erwarten sind. Die Strukturqualität ist aufgrund der räumlichen und technischen Ausstattung gewährleistet. Für die Praxiseinbindung im Lehr-Lern-Labor standen Tablets in ausreichendem Umfang für die Arbeit mit Schülerinnen und Schülern zur Verfügung. Durchgeführt wurde das Seminar vom Autor selbst, der zu Beginn der Studie eine universitäre Lehrerfahrung von zwei Jahren in unterschiedlichen fachwissenschaftlichen und fachdidaktischen Veranstaltungen nachweisen kann. Personelle Ressourcen standen insoweit zur Verfügung, dass insbesondere im ersten Teil des Seminars, der Vorbereitungsphase, durch das Angebot einer Sprechstunde eine individuelle Betreuung der Lehramtsstudierenden gewährleistet wurde. Die Prozessqualität des Seminars wird in den folgenden Unterkapiteln illustriert. Es werden dabei drei Phasen unterschieden (vgl. Abbildung 8.2). In der Vorbereitungsphase (9 Sitzungen) werden Wissen und Fähigkeiten zum mathematischen Modellieren thematisiert und angewendet sowie theoretische Grundlagen zum Diagnostizieren und Intervenieren in kooperativen Modellierungsprozessen gelegt. Die Theorie wird in praxisnahen Anforderungssituationen angewendet. Die Praxiselemente werden gestuft integriert, indem zunächst Text- und dann Videovignetten fremder Akteure zum Training der Studierenden verwendet werden. In der anschließenden Praxisphase (äquivalent zu 3 Sitzungen) trainieren die Studierenden ihre Fähigkeiten an einem sogenannten Modellierungstag bei der Betreuung von Kleingruppen im Lehr-Lern-Labor. In der Reflexionsphase (2 Sitzungen) werden die Studierenden anhand von Eigenvideos trainiert, die in der Praxisphase angefertigt wurden. Abschließend verschriftlichen die Studierenden ihre Seminararbeiten in einer Hausarbeit. Die Prozessqualität des Seminars wurde in einer Pilotierung im Sommersemester 2017 optimiert. Dazu beantworteten die Lehramtsstudierenden am Ende jeder Pilotierungssitzung in jeweils fünf Minuten drei Reflexionsfragen:
184
8
Design der Studie
Abbildung 8.2 Struktur des fachdidaktischen Seminars in Koblenz
• Welche/s Wissen/Fertigkeiten wurde/n heute im Rahmen des fachdidaktischen Seminars vermittelt? • Erachten Sie es als sinnvoll, dass diese/s Wissen/Fertigkeiten im fachdidaktischen Seminar vermittelt wird/werden? Erklären Sie jeweils warum! • Erachten Sie die Methode, mit der diese/s Wissen/Fähigkeiten vermittelt wurde/n als sinnvoll? Falls nein, welche Methode erscheint ihnen sinnvoller? Die von den Studierenden empfundene Attraktivität und Qualität der Lehrveranstaltung wurde darauf basierend überprüft. Anhand der schriftlichen Antworten der Studierenden und Problemen bei der Durchführung wurden einzelne Elemente der Sitzungen des Seminars überarbeitet. In den folgenden drei Semestern wurden keine Änderungen mehr am Treatment vorgenommen. Die Durchführung der Sitzungen orientiert sich, soweit im Rahmen der unterrichtlichen Planbarkeit möglich, streng an den entwickelten Stundentafeln (vgl. Anhang A). Die im Seminar thematisierten Theorien und Inhalte sind in den Kapiteln 1–5 beschrieben. Bei der Erläuterung der Sitzungen wird daher auf die entsprechenden Kapitel verwiesen. Zuvor wird das dem Seminar zugrunde liegende Prinzip der gestuften Praxiseinbindung erläutert, das die Seminarstruktur theoretisch und methodisch begründet.
8.4 Treatments
185
8.4.1.1 Das Prinzip der gestuften Praxiseinbindung Im fachdidaktischen Seminar findet durch die Verwendung unterschiedlicher Praxiselemente eine Förderung situationsspezifischer Kompetenzen statt. Die Praxiselemente werden im Seminarverlauf hinsichtlich ihrer zunehmenden Komplexität angeordnet, um eine Überforderung der Lehramtsstudierenden zu vermeiden. Damit ist der Gedanke verbunden, dass es den Lehramtsstudierenden leichter fällt, komplexere Anforderungssituationen wahrzunehmen, zu interpretieren und zu bewerten, wenn zuvor bereits weniger komplexe Situationen bewältigt wurden. Die Fallarbeit nimmt bei der Förderung situationsspezifischer Kompetenzen in der Lehrerausbildung eine wichtige Rolle ein. Durch Text- oder Videovignetten lassen sich Praxiselemente in die Ausbildung integrieren. Diese ermöglichen die Analyse und Reflexion lernrelevanter Situationen, die es auch in der Praxis zu interpretieren gilt und in denen Handlungsentscheidungen getroffen werden müssen. Die Arbeit mit Vignetten bietet den Vorteil der wiederholten Betrachtungsmöglichkeit, während komplexe unterrichtliche Situationen nur einmal und unter Handlungsdruck erlebt werden (Kramer, König, Kaiser, Ligtvoet, & Blömeke, 2017). Vignetten eignen sich daher für die theoriebasierte Fortbildung anhand praxisnaher Beispiele (Kersting, Givvin, Sotelo, & Stigler, 2010), bei der unterschiedliche Perspektiven auf die Situation eingenommen werden können (Kramer et al., 2017). Da die Komplexität der analysierten Anforderungssituationen im Seminar stückweise gesteigert wird, wurde die Arbeit mit Textvignetten der mit Videovignetten vorgezogen. Textvignetten ermöglichen zunächst eine genaue und theoriebasierte Analyse der Szenen und stellen daher die Methode mit der geringsten kognitiven Anforderung für die Lehramtsstudierenden dar. Insbesondere für Novizen kann eine Komplexitätsentlastung eine tiefere Analyse der Situation ermöglichen (Kramer et al., 2017). Die Arbeit mit Textvignetten wird aufgrund der geringeren Komplexität und der weniger vorhandenen Parallelität der Handlungen als weniger belastend empfunden als die Arbeit mit Videovignetten (Syring, Bohl, et al., 2015). Daher erscheint für die relativ unerfahrenen Lehramtsstudierenden anfangs die Arbeit mit Textvignetten geeignet, um den Analyseprozess zu verinnerlichen und erste Wahrnehmungs-, Interpretations- und Entscheidungsprozesse (Blömeke et al., 2015) zu durchlaufen. Bei der ausschließlichen Arbeit mit Textvignetten werden selbst konstruierte Vignetten eingesetzt, die eine Fokussierung auf spezifische Schwierigkeiten erlauben und eine Verdichtung von Informationen ermöglichen. In Videovignetten wird ein deutlich realitätsnäheres Bild der Situation vermittelt und die Handlungen der Akteure werden komplex und parallel abgebildet (Kramer et al., 2017). Zusätzlich wird die Arbeit mit dieser Art von Vignette tendenziell als motivierender empfunden (Koehler, Yadav, Phillips, & Cavazos-Kottke, 2005; Yadav et al., 2011). Kramer et al. (2017) weisen eine höhere kognitive Aktivierung
186
8
Design der Studie
und eine tendenziell größere Freude bei der Arbeit mit Videos nach (vgl. auch Syring, Bohl, et al., 2015). Aufgrund der höheren Komplexität von Videovignetten im Vergleich zu Textvignetten werden diese, wie in Sitzung 8 und 9 beschrieben (vgl. Abschnitt 8.4.1.2), erst im zweiten Schritt in Verbindung mit Textvignetten eingesetzt. Studienergebnisse weisen darauf hin, dass sowohl die Arbeit mit Text- als auch mit Videovignetten wirksam ist, wobei bei den Videovignette teilweise größere Effekte gemessen wurden (Balslev, De Grave, Muitjens, & Scherpbier, 2005; Baumgartner, 2018). Kramer et al. (2017) stellen keinen signifikanten Unterschied zwischen der Arbeit mit den verschiedenen Vignettenarten hinsichtlich ihrer Wirkung auf situationsspezifische Klassenführungskompetenzen fest. Aufgrund der Befunde werden in der vorliegenden Studie Videovignetten immer zusammen mit Textvignetten eingesetzt, um zum einen die affektiven Vorteile der Videovignetten zu nutzen und zum anderen von den komplexitätsreduzierenden Eigenschaften der Textvignetten zu profitieren. Bei der Fallarbeit kann zwischen echten und gestellten Videovignetten unterschieden werden (Kramer et al., 2017). Es werden ausschließlich echte Videos verwendet, um eine maximal mögliche Authentizität der Lehr-Lern-Situationen sicherzustellen und um sich hinsichtlich einer stückweisen Komplexitätszunahme auf die nächste Anforderungsebene zu begeben. Es handelt sich hierbei noch nicht um den maximal möglichen situativen Komplexitätsgrad für die Lehramtsstudierenden, da das Video nur einen Ausschnitt der Situation erfasst. Weiterhin wird zwischen Eigen- und Fremdvideos unterschieden. Seidel et al. (2011) verglichen in einer Studie die Wirkung von Eigen- und Fremdvideos auf die Fähigkeit, lernrelevante Situationen zu erkennen und diese auf Grundlage von Wissen zu bewerten. Dabei stellten sie einen tendenziell aber nicht eindeutig besseren Effekt bei der Arbeit mit Eigenvideos fest. Hellermann et al. (2015) wiesen eine höhere Wirksamkeit bei der Kombination beider Videoarten im Vergleich zu Fremdvideos nach. Fremde Videos eignen sich für eine distanzierte Reflexion kritischer Ereignisse. Lehrkräfte gehen bei der Analyse fremder Videos häufiger auf problematische Aspekte ein und diskutieren intensiver über Handlungsalternativen (Kleinknecht & Poschinski, 2014; Kleinknecht & Schneider, 2013). Eigene Videos bieten den Vorteil, dass der Reflektierende selbst über Kontextinformationen zur Situation verfügt, emotional stärker beteiligt ist und es ihm leichter fällt, sich einzudenken (Borko, Jacobs, Eiteljorg, & Pittman, 2008; Kleinknecht & Poschinski, 2014; Seidel et al., 2011). Seidel et al. (2011) fanden zudem Hinweise, dass bei der Reflexion von Eigenvideos mehr relevante Aspekte identifiziert werden als bei Fremdvideos. Jedoch äußern sich in einer Gruppenreflexion Kolleginnen und Kollegen des Reflektierenden weniger kritisch zum Video. Mit Rücksicht auf selbstwertbezogene Emotionen
8.4 Treatments
187
des Akteurs wird eine vertiefende Analyse des Videos verhindert (Kleinknecht & Poschinski, 2014). Aufgrund der verschiedenen Vorteile und der empirischen Hinweise in der Studie von Hellermann et al. (2015) werden beide Arten von Videos im Seminar verwendet. Dabei werden zunächst Fremdvideos analysiert, um eine sachliche und theoriegeleitete Analyse der Videovignetten im Seminar zu etablieren (vgl. Abschnitt 8.4.1.2; Sitzungen 8 und 9), bevor abschließend Eigenvideos ausgewählter Studierender im Plenum reflektiert werden (vgl. Abschnitt 8.4.1.4; Sitzung 11). Die Lernwirksamkeit eines Videotrainings ist auch abhängig von seiner didaktisch-methodischen Inszenierung. Dabei können instruktionale und problemorientierten Lehr-Lern-Konzepte als entgegengesetzte Pole eines Kontinuums dargestellt werden (Kleinknecht & Schneider, 2013). In problembasierten Trainings steht die Erarbeitung einer Lösung für eine vorgegebene Situation im Vordergrund. Im Diskurs werden Lösungsvorschläge abgewägt. Dieser offene Aushandlungsprozess kann zu einer vertieften Analyse der Videovignette führen, weist aufgrund seiner geringen Strukturierung jedoch einen höheren kognitiven Anspruch auf (Kleinknecht & Schneider, 2013). Instruktionale Trainings strukturieren den Analyseprozess stark, bspw. anhand von konkreten Arbeitsaufträgen. Die hohe Strukturierung führt zu einer kognitiven Entlastung der Reflektierenden (Santagata & Guarino, 2011), was eine Verinnerlichung des Analyseprozesses begünstigt. Seidel, Blomberg und Renkl (2013) verglichen in einer Studie Vertreter beider Instruktionsstrategien. Die instruktionale Gruppe war in einem deklarativen Wissenstest und bei der Analyse von Unterricht signifikant besser. Die problemorientierte Gruppe erzielte eine höhere Leistung bei der Planung von Unterricht, in der Wissen auf neue Situationen übertragen werden muss. Syring et al. (2015) stellten in ihrer Vergleichsstudie keinen Unterschied in den Fähigkeiten der Probanden fest, die Analyse anhand von Theorie zu fundieren. Jedoch empfanden die Probanden im problemorientierten Ansatz eine signifikant höhere Involviertheit und Freude und signifikant weniger Ärger. Aufgrund der differenten Effekte der Instruktionsverfahren werden im Seminar beide Instruktionsformen verwendet. Zunächst wird das instruktionale Verfahren für die Analyse der Videovignetten verwendet, um eine gezielte Diagnostik zu ermöglichen und/oder die dargestellte Intervention theoriegeleitet zu bewerten. Im Anschluss kommt die problemorientierte Instruktion zum Einsatz, wenn alternative Interventionen hergeleitet und diskutiert werden. Auf diese Weise kann von beiden Verfahren profitiert werden. In einem dritten Schritt erproben sich die Lehramtsstudierenden bei der Betreuung von Schülerinnen und Schülern im Lehr-Lern-Labor. Lehr-Lern-Labore sind aus Schülerlaboren (Baum, Roth, & Oechsler, 2013) hervorgegangen, in denen
188
8
Design der Studie
zusätzlich zur Förderung von Schülerinnen und Schülern lehrerbildende Elemente integriert werden. Sie erfüllen im Wesentlichen drei Funktionen (Lengnink & Roth, 2016): • Schülerinnen und Schülern ermöglichen Lehr-Lern-Labore das authentische Erleben von mathematischem Arbeiten, was zu einer Förderung des Interesses am Fach Mathematik führen kann. • Lehramtsstudierende können theorie- und forschungsbasierte Konzepte im LehrLern-Labor erproben, sodass eine praxisnahe Ausbildung und eine Vernetzung von Theorie und Praxis ermöglicht werden. • Für Wissenschaftlerinnen und Wissenschaftler bildet das Lehr-Lern-Labor eine Umgebung für empirische Erhebungen zur Implementierung fachdidaktischer und bildungswissenschaftlicher Forschungsziele. Dabei kann der Fokus der Untersuchung sowohl auf Schülerinnen und Schüler als auch auf die Lehramtsstudierenden gerichtet sein. Durch das Treatment werden vor allem die ersten beiden Punkte adressiert, wobei die theorie- und forschungsbasierte Ausbildung von Lehramtsstudierenden im Fokus steht. Eine Grundlage des in der vorliegenden Arbeit durchgeführten Lehr-LernLabors bilden Modellierungstage (Klock & Siller, 2020b; Siller, 2010; Siller & Vogl, 2010), an denen Schülerinnen und Schülern teilnehmen (vgl. Punkt 1). Diese Modellierungstage bieten Lernenden die Möglichkeit, authentische und größtenteils interdisziplinäre Fragestellungen (mathematisch) genauer zu betrachten. Es werden Modellierungsaufgaben, der Idee eines holistischen Ansatzes (Blomhoj & Jensen, 2003) folgend, mit einem hohen Grad an Offenheit verwendet. Bei der Bearbeitung wird eine große Selbstständigkeit der Lernenden gefordert und gefördert. Die Arbeitsteilung, Informationsbeschaffung sowie die Vorbereitung einer adressatengerechten Präsentation obliegt den Schülerinnen und Schülern. Zur Recherche und zum mathematischen Arbeiten stehen ein Tablet pro Gruppe mit relevanter Software (z. B. Excel, GeoGebra, …) zur Verfügung. Den Lernenden werden nur wenige Materialien zur Verfügung gestellt, um die Lernumgebung möglichst offen zu gestalten. Neben der Aufgabenstellung selbst werden je nach Aufgabe nicht vorstrukturierte Datenquellen bereitgestellt. Der Arbeitsprozess entspricht aufgrund seiner Merkmale, wie … (Martius, Delvenne, & Schlüter, 2016, S. 222 ff.) • • • •
das eigenständige, offene und schüleraktive Lernen, die starke Zurückhaltung der Betreuenden, das kooperative Lernen, die Problemorientierung,
8.4 Treatments
189
• das Erfahren von subjektiv und individuell Neuem anhand authentischer und relevanter Themen und • die Art der Erkenntnisgewinnung über Recherche, Befragung oder Exploration, einem forschenden Lernprozess. Neben den Teilkompetenzen des Modellierens werden die Lernenden durch einen holistischen Ansatz auch in den Modellierungsprozess übergreifenden sozialen, motivationalen und metakognitiven Kompetenzen gefördert (vgl. Abschnitt 2.3.2). Die zweite Grundlage des durchgeführten Lehr-Lern-Labors bildet eine theorieund forschungsbasierte Ausbildung von Lehramtsstudierenden während der Modellierungstage (vgl. Punkt 2). Santagata und Guarino (2011) schlagen bei der Förderung situationsspezifischer Kompetenzen vor, Videoanalysen mit der Beobachtung realer Lehr-Lern-Situationen zu verbinden. Mit dem Lehr-Lern-Labor wird ein praxisnahes Element in das universitäre fachdidaktische Seminar mit aufgenommen, welches zugleich die komplexesten Anforderungssituationen bietet. Im Gegensatz zu den Videovignetten nehmen die Studierenden nicht mehr nur einen Ausschnitt der Lehr-Lern-Situation wahr, sondern befinden sich als Akteure in der Situation selbst. Dabei unterliegen sie zusätzlich einem Handlungsdruck. Mit der Komplexität von Unterricht ist die Arbeit im Lehr-Lern-Labor dennoch nicht zu vergleichen, da die Studierenden die erlernten Konzepte in einem geschützten Rahmen erproben und sich auf die Betreuung einer Gruppe von drei bis fünf Lernenden anstatt auf eine ganze Klasse konzentrieren können. Das Prinzip der gestuften Praxiseinbindung zieht sich als roter Faden durch die Seminarstruktur, die nun in ihrer inhaltlichen Ausgestaltung beschrieben wird. Dabei wird auf die Arbeit mit den Text- und Videovignetten in den einzelnen Sitzungen sowie auf die Arbeit der Studierenden im Lehr-Lern-Labor und deren methodische Umsetzung genauer eingegangen.
8.4.1.2 Vorbereitungsphase In der Vorbereitungsphase (vgl. Abbildung 8.2 auf Seite 184) werden theoretische Grundlagen zum mathematischen Modellieren und zu Interventionskonzepten in kooperativen Bearbeitungsprozessen gelegt. Im Anschluss werden zur Vorbereitung auf die Praxisphase Text- und Videovignetten analysiert. Sitzung 1: Pretest und Einführung in das mathematische Modellieren In der ersten Sitzung, die jeweils ein bis zwei Wochen vor dem regulären Beginn der Vorlesungszeit stattfindet, wird nach einer kurzen Einführung des Modellierungsbegriffs (vgl. Abschnitt 2.1) und des Modellierungskreislaufs (vgl.
190
8
Design der Studie
Abschnitt 2.4.1) der Pretest durchgeführt. Es werden anschließend in einem Vortrag grundlegende Inhalte zur Modellierungskompetenz (vgl. Abschnitt 2.3.2) und zu Modellierungsaufgaben (vgl. Abschnitt 2.2) vermittelt. Sollen Modellierungskompetenzen an Schülerinnen und Schüler weitergegeben werden, müssen die Lehramtsstudierenden über hinreichend Erfahrung in der Modellierung von realen, authentischen und komplexen Problemstellungen verfügen (Borromeo Ferri & Blum, 2010). Daher bearbeiteten die Studierenden bis zum Vorlesungsbeginn in Tandems eine komplexe Modellierungsaufgabe und bereiten Kurzvorträge zu ihrer Modellierung vor. Dazu wählen sie je nach Interesse eine von acht Modellierungsaufgaben aus (vgl. Abschnitt 8.5), wobei jede Aufgabe pro Seminargruppe jeweils ein Mal vergeben wird. Die Studierenden erhalten so einen Einblick in unterschiedliche Modellierungen zu verschiedenen Modellierungsaufgaben. Durch die eigene Durchführung des Modellierungsprozesses und die Diskussion der Ergebnisse in den folgenden Sitzungen wird der zuvor thematisierte Modellierungskreislauf an der eigenen Aufgabe durchlaufen. Die Studierenden werden dazu angehalten ihren Vortrag anhand der Phasen des Modellierungsprozesses zu strukturieren. Sitzungen 2 und 3: Erste Diskussion der Modellierungen zu den Aufgaben In den Sitzungen zwei und drei präsentieren die Studierenden in Tandems in einem 10–15-minütigen Vortrag die Ergebnisse ihrer Modellierungen zur jeweils ausgewählten Modellierungsaufgabe. Sie erhalten von ihren Kommilitonen und dem Seminarleiter 10–15 Minuten lang eine kritische Rückmeldung hinsichtlich der Durchführung des Modellierungsprozesses und der Aussagekraft ihrer Ergebnisse. Basierend auf dieser Rückmeldung überarbeiten die Teams ihre Lösungen mit der zusätzlichen Aufgabe, alternative Lösungswege und potentielle Schwierigkeiten für Schülerinnen und Schüler bei der Bearbeitung ihrer Modellierungsaufgabe zu identifizieren. Sitzungen 4 und 5: Zweite Diskussion der Modellierungen zu den Aufgaben In den Sitzungen vier und fünf präsentieren die Tandems erneut ihre Ergebnisse im Seminar und erhalten wiederum eine Rückmeldung. Die Diskussion alternativer Lösungswege und potentieller Schwierigkeiten im Modellierungsprozess dient zur Vorbereitung auf den Modellierungstag. Durch die intensive Beschäftigung mit den Modellierungsaufgaben, deren Lösungswegen und potentiellen Schwierigkeiten wird sichergestellt, dass die Studierenden über einen ausgeprägten „task space“ (Blum & Borromeo Ferri, 2009, S. 53) verfügen. Das Wissen über die vielfältigen Lösungsmöglichkeiten einer Aufgabe ist eine Voraussetzung für die Unterstützung
8.4 Treatments
191
der individuellen Lösungswege der Schülerinnen und Schüler am Modellierungstag (Blum & Borromeo Ferri, 2009). Sitzung 6: Pädagogische Diagnostik und Interventionskonzepte In Sitzung 6 werden erste theoretische Grundlagen für den Erwerb der adaptiven Interventionskompetenz gelegt (vgl. Kapitel 5). Zu Beginn der Stunde entwickeln die Studierenden Vorstellungen zu Anforderungen an Lehrkräfte beim Lehren mathematischen Modellierens, indem sie notwendige Kompetenzen auf Kärtchen an der Tafel gruppieren. Die Studierenden erhalten so einen Überblick über ihre eigenen Vorstellungen zu Beginn der Lerneinheit. Im Anschluss kommt die Methode „Gruppenpuzzle“ zum Einsatz, bei der vier Expertenteams gebildet werden. Jedes der Teams arbeitet an einem ausgewählten Text und fasst die wichtigsten Aspekte zusammen. Anschließend werden die Gruppen gemischt, sodass jeweils ein Experte aus jedem Themengebiet über die Inhalte seines Textes berichten kann. Das erste Material stellt einen Auszug aus der Dissertation von Heinrichs (2015, S. 9–14) dar, in dem eine Definition und wesentliche Formen, Methoden, Ziele und Ergebnisse pädagogischer Diagnostik dargestellt werden (vgl. Abschnitt 5.1). Der zweite Text behandelt in einem Auszug aus Aeblis „Zwölf Grundformen des Lehrens“ (Aebli, 1983, S. 299–303) das Prinzip der minimalen Hilfe und damit die Grundlage der dargestellten Interventionskonzepte (vgl. Abschnitt 3.3.3). Das dritte Material ist ein Auszug aus Zechs „Grundkurs Mathematikdidaktik“ (Zech, 1996, S. 315–320), der die Taxonomie der Hilfen bei Problemlöseprozessen behandelt (vgl. Abschnitt 3.3.3). Der letzte Text stellt die Konzeption einer Theorie allgemeiner Lehrerinterventionen dar (Leiss, 2007, S. 77–83), die Erkenntnisgrundlagen, Ebenen und Eigenschaften von Interventionen unterscheidet und eine Definition adaptiver Interventionen angibt (vgl. Abschnitt 3.3.4). Die Texte wurden vor dem Hintergrund einer schrittweisen Fokussierung auf die adaptive Interventionskompetenz in mathematischen Modellierungsprozessen ausgewählt. In einer anschließenden Sicherungsphase werden die wichtigsten Aspekte erneut thematisiert und deren Bedeutung für mathematische Modellierungsprozesse hervorgehoben. Der Dozent stellt das in Abschnitt 5.3 dargestellte Prozessmodell adaptiver Interventionen in mathematischen Modellierungsprozessen vor, welches im weiteren Verlauf des Seminars ähnlich zum Model of Contingent Teaching (vgl. Abschnitt 3.3.2; Van de Pol et al., 2012) als metakognitives Hilfsmittel für die Lehramtsstudierenden dient. Abschließend werden die erarbeiteten Inhalte mit den erwarteten Kompetenzanforderungen vom Beginn der Stunde verglichen und diskutiert, um den Lernzuwachs zu definieren.
192
8
Design der Studie
Sitzung 7: Scaffolding und adaptive Interventionen In Sitzung 7 werden die Studierenden dazu aufgefordert, Ziele der Behandlung von Modellierungsaufgaben in der Schule zu benennen. Es werden Vorschläge gesammelt, die im Anschluss mit den von Blum und Niss (1991) konkretisierten Zielen verglichen und ergänzt werden. Die Interventionskonzepte des Scaffoldings, des gestuften und adaptiven Intervenierens werden vom Dozenten als Hilfsmittel zum Erreichen der unterrichtlichen Ziele herausgestellt. Die Studierenden erarbeiteten in Einzelarbeit anhand eines Textauszugs (Stender, 2016, S. 89–93) Charakteristika des Scaffolding-Konzepts (vgl. Abschnitt 2.3.2; Van de Pol et al., 2010). Die Charakteristika werden mit den in der vorherigen Sitzung thematisierten Definition adaptiver Interventionen (Leiss, 2007, S. 82) verglichen und diskutiert. Es werden für die weitere Seminararbeit die in Abschnitt 3.3.4 beschriebenen Kriterien adaptiver Interventionen hergeleitet und festgehalten. In einer anschließenden Anwendungsphase durchlaufen die Studierenden anhand der Modellierungsaufgabe »Der aufwärtsrollende Doppelkegel« (vgl. Abschnitt 8.5.1) und einer zugehörigen Textvignette das idealtypische Prozessmodell einer adaptiven Intervention in mathematischen Modellierungsprozessen (vgl. Abschnitt 5.3; Abbildung 5.1). Die Modellierungsaufgabe wird zuvor anhand einer exemplarischen Musterlösung diskutiert, da sie auch in den folgenden beiden Sitzungen die Basis der Schülerinteraktionen in den zu analysierenden Videovignetten darstellt. Die selbst konstruierten Textvignetten beschreiben eine Situation im Modellierungsprozess, in der Schwierigkeiten auftreten, die bei vorherigen Modellierungsaktivitäten mit Schülerinnen und Schülern in ähnlicher Weise beobachtet wurden. Zur Bearbeitung der Textvignetten erhalten die Studierenden die folgenden Arbeitsaufträge: 1. Ordnen Sie dem Arbeitsprozess der Lernenden eine Modellierungsphase zu. 2. Diagnostizieren Sie die Schwierigkeit der Lernenden in der dargestellten Situation. 3. Legen Sie ein Förderziel für eine potentielle Intervention fest. 4. Formulieren Sie eine potentiell adaptive Intervention anhand der thematisierten Kriterien. Textvignette 1 stellt die Schwierigkeit »Anwenden mathematischer Methoden zum Mathematisieren« (vgl. Abschnitt 2.5.3; Tabelle 2.4) in der Phase Mathematisieren dar. Den Lernenden fehlen zwei weitere Skizzen, um die Bewegung des Kegels mathematisch beschreiben zu können. Sie sind daher nicht in der Lage, einen entsprechenden Term aufzustellen. Textvignette 2 illustriert eine Schwierigkeit im
8.4 Treatments
193
metakognitiven Bereich »Einbezug des Sachkontextes in die Modellierung« (vgl. Abschnitt 2.5.3; Tabelle 2.4). Die Lernenden wenden eine inadäquate Strategie an, bei der sie den Realkontext ignorieren und sich über die Bedeutung der Berechnung nicht im Klaren sind. Die Situation wird durch eine unterschiedliche Bezeichnung der verwendeten Variablen durch die Lernenden verschärft. Die zuvor hergeleiteten Kriterien adaptiver Interventionen dienen an dieser Stelle erstmals als Anhaltspunkt für die Versprachlichung konkreter Interventionsphrasen. Die Ergebnisse werden von den Studierenden jeweils im Plenum diskutiert. Sitzung 8: Förderung der Diagnosekompetenz In Sitzung 8 werden die Studierenden schwerpunktmäßig in ihrer Diagnosekompetenz gefördert, indem sie Modellierungsprozesse von Schülerinnen und Schülern analysieren. Zu Beginn der Sitzung wird der Modellierungskreislauf (vgl. Abschnitt 2.4.1), der zuvor von den Studierenden als metakognitives Hilfsmittel zur Lösung der Modellierungsaufgabe verwendet wurde, vom Dozenten als diagnostisches Instrument herausgestellt. Im Anschluss an die Analyse der Textvignetten in der vorherigen Sitzung werden im Rahmen einer gestuften Praxiseinbindung zwei Videovignetten in Verbindung mit den zugehörigen Textvignetten analysiert. Die Videos von maximal zwei Minuten Länge wurden während Modellierungstagen aufgezeichnet und veranschaulichen daher echte Modellierungsprozesse. Sie zeigen Lernende der 11. und 12. Jahrgangsstufe bei der Bearbeitung der Modellierungsaufgabe »Der aufwärtsrollende Doppelkegel«, die bereits in der vorherigen Sitzung behandelt wurde. Kontextinformationen zur Situation werden durch den Dozenten zur Verfügung gestellt. In den Vignetten werden jeweils bis zu 30 Sekunden der Situation vor der relevanten Sequenz dargestellt, um zusätzliche Kontextinformationen miteinzubeziehen. Die untertitelten Videosequenzen wurden so ausgewählt, dass eine möglichst große Bandbreite von Modellierungsphasen und Schwierigkeiten zu sehen sind. Um einen Einblick in die verwendeten Videovignetten zu geben, werden jeweils die Kernaspekte der in den Videos veranschaulichten Situationen beschrieben. Die erste Videovignette zeigt eine Kleingruppe in der Phasen Konstruieren/Verstehen. Zwei Lernende unterhalten sich über das in der Aufgabe thematisierte Experiment und versuchen es zu verstehen. Dabei wird ersichtlich, dass eine Schülerin Probleme beim »Verstehen des Kontextes« (vgl. Abschnitt 2.5.3; Tabelle 2.4) hat. Sie nimmt bereits erste Idealisierungen vor, für die sie in Bezug auf das Experiment falsche Vorhersagen trifft. Die zweite Videovignette zeigt eine Kleingruppe in der Phase Validieren. Es ist eine Schwierigkeit beim »Identifizieren des Einflusses von Annahmen auf die mathematischen Ergebnisse« (vgl. Abschnitt 2.5.3; Tabelle 2.4) zu erkennen. Ein Schüler äußert seine Skepsis zu anhand des Modells berechneten
194
8
Design der Studie
Werten, nachdem er die Ergebnisse mithilfe des Experiments überprüft hat. Bei der Validierung bezieht er nicht die Annahmen des Modells mit ein und tendiert dazu, die Ergebnisse leichtfertig zu verwerfen. Die Videoanalyse nimmt 30 Minuten der Sitzung in Anspruch. Die Studierenden erhalten die ersten drei Arbeitsaufträge, die auch bei der Analyse der Textvignetten in Sitzung 7 eingesetzt wurden. Die Videovignetten werden jeweils zwei Mal vorgespielt. Im Anschluss beantworten die Studierenden unter Zuhilfenahme der Textvignetten die Arbeitsaufträge, die im Anschluss im Plenum diskutiert werden. In der Diskussion wird herausgestellt, dass Modellierungsphasen in der Realität nicht immer eindeutig zugeordnet werden können. Anhand der Videovignetten und Arbeitsaufträge trainieren die Studierenden die Diagnostik der Modellierungsphase, die Diagnostik der Schwierigkeit und das Festlegen eines adäquaten Förderziels für eine Intervention. Das Wahrnehmen und Interpretieren der Videovignetten schulen ihre situationsspezifischen Fähigkeiten. Im Anschluss an die Videoanalyse werden zu jeder Modellierungsphase typische Schwierigkeiten festgehalten, die die Studierenden in der Text- und Videoanalyse oder bei der Bearbeitung ihrer eigenen Modellierungsaufgabe erkannt haben. Die Ergebnisse werden mit den in Tabelle 2.4 (vgl. Abschnitt 2.5.3) dargestellten Schwierigkeiten, die in verschiedenen Studien beobachtet wurden, verglichen und eventuell ergänzt. Im zweiten Teil der Sitzung bearbeiten die Studierenden einen Auszug aus einer Studie (Borromeo Ferri, 2011, S. 113–115, 130, 150–153), in der individuelle Modellierungsverläufe und Gruppenverläufe untersucht wurden (vgl. Abschnitt 2.4). Der Einfluss von mathematischen Denkstilen und der Struktur der Modellierungsaufgabe auf den Lösungsprozess werden thematisiert. Nach der Bearbeitung des Auszugs und der Klärung offener Fragen im Plenum beziehen die Studierenden die Inhalte auf ihre eigene Modellierungsaufgabe, deren Bearbeitung sie am Modellierungstag betreuen werden. Sie antizipieren die Grobstruktur des Lösungsverlaufs und eventuell zu erwartende Minikreisläufe (vgl. Abschnitt 2.4.2). Sitzung 9: Förderung der a-priori-Interventionskompetenz In Sitzung 9 wird schwerpunktmäßig die a-priori-Interventionskompetenz der Lehramtsstudierenden anhand einer 45-minütigen Videoanalyse gefördert. Als Einstieg wird zunächst eine Textvignette aus der Studie von Link zur »Rasen mähen«Aufgabe (Link, 2011, S. 124) mit einem echten Transkript (Link, 2011, S. 178) vorgestellt. Anhand der vier Arbeitsaufträge (vgl. Sitzung 7) wird eine potentiell adaptive Intervention im Plenum erarbeitet. Dabei wird den Studierenden veranschaulicht, dass es durchaus schwierig sein kann, in kürzester Zeit die Situation und Schwierigkeit zu diagnostizieren und eine adäquate Intervention abzuleiten. Sie
8.4 Treatments
195
erkennen die Notwendigkeit, wirksame Interventionsmuster mit einem gewissen Allgemeinheitsgrad zu identifizieren. Dazu bearbeiten die Studierenden im Anschluss einen Textauszug (Link, 2011, S. 175–176, 208–210), in dem die Struktur und Kategorien guter strategischer Interventionen erläutert werden. In der anschließenden Plenumsdiskussion wird herausgearbeitet, dass Interventionen unter Beachtung der Regeln guter Gesprächsführung aus strategischen Interventionen auf verschiedenen Ebenen bestehen (vgl. Abschnitt 4.2.2.2). Die folgende Analyse von zwei Video- und den zugehörigen Textvignetten dient zum einen zur Illustration von Interventionsmustern. Auf der anderen Seite werden die Studierenden in der Bewertung von Interventionen anhand der Kriterien adaptiver Interventionen geschult. Dazu werden die Arbeitsaufträge um eine weitere Aufgabe (Punkt 4.) ergänzt und in gleicher Weise bearbeitet: 1. Ordnen Sie dem Arbeitsprozess der Lernenden eine Modellierungsphase zu. 2. Diagnostizieren Sie die Schwierigkeit der Lernenden in der dargestellten Situation. 3. Legen Sie ein Förderziel für eine potentielle Intervention fest. 4. Bewerten Sie die dargestellte Intervention anhand der Kriterien adaptiver Interventionen. 5. Formulieren Sie eine potentiell adaptive Intervention anhand der thematisierten Kriterien. Die Vignetten stellen Interventionen dar, die in dieser Sitzung im Fokus der Analysen stehen. Die erste Videovignette bezieht sich wiederum auf die Modellierungsaufgabe »Der aufwärtsrollende Doppelkegel«. Auf eine inhaltliche Nachfrage der Schülerinnen und Schüler reagiert die Betreuerin im Video mit einer inhaltlichen Intervention. Diese ist wenig minimal und selbstständigkeitsorientiert und kann daher als wenig adaptiv bewertet werden. Durch einen weiteren Impuls bringt die Betreuerin einen Lösungsansatz mit ein, der aufgrund seiner geringen inhaltlich-methodischen Passung zum Lösungsprozess der Lernenden von diesen nicht weiterverfolgt wird. Der Impuls veranschaulicht den eigenen Anspruch der Betreuerin an den Lösungsweg und das damit einhergehende Kontroll- und Lenkungsbedürfnis (vgl. Abschnitt 4.1). Die aufgezählten Aspekte werden jeweils thematisiert und hinsichtlich der Kriterien adaptiver Interventionen diskutiert. Die zweite Videovignette behandelt mangels geeigneter Vignetten zur Aufgabe »Der aufwärtsrollende Doppelkegel« die Modellierungsaufgabe »Hol’s der Geier« zum gleichnamigen Kartenspiel in der fünften Jahrgangsstufe. Ziel der Modellierungsaufgabe ist es, eine Gewinnstrategie für das Kartenspiel zu entwickeln. Diese
196
8
Design der Studie
Vignette wurde ausgewählt, da sie im Gegensatz zu den übrigen Videos Modellierungsprozesse zu Beginn der Sekundarstufe 1 veranschaulicht. Gezeigt wird ein Gruppenarbeitsprozess von vier Schülerinnen und Schülern, in dem drei zum Teil parallel ablaufende Handlungen die Aufmerksamkeit der Betreuerin bedürfen. Die Komplexität der Situation ist hoch. Im ersten Teil der Videovignette hat ein Schüler Schwierigkeiten beim »Definieren von Variablen und Einführen einer geeigneten Notation« (vgl. Abschnitt 2.5.3; Tabelle 2.4). Die Betreuerin reagiert in dieser Situation adaptiv, indem sie den Schüler auf einer strategischen Ebene bei der Einführung einer Variablen hilft, ohne den Lösungsweg zu beeinflussen. Sie regt die Selbstständigkeit des Schülers an. In der zweiten, direkt im Anschluss stattfindenden Situation interveniert die Betreuerin invasiv aufgrund der Untätigkeit zweier Schülerinnen, die sich nicht mit der Aufgabe beschäftigen. Anhand einer Motivationshilfe fordert die Betreuerin die Schülerinnen dazu auf, sich die verschiedenen Karten erneut anzuschauen. Die Intervention kann als adaptiv bezeichnet werden, da die motivationalen Probleme in der Videovignette erkennbar sind und daher eine inhaltlich-methodische Passung der Intervention vorliegt. In der dritten Situation möchte das vierte Gruppenmitglied eine Skizze anfertigen und fragt die Betreuerin um Hilfe. Diese Handlung findet parallel zur im vorherigen Absatz beschriebenen Handlung statt. Die Strategie der Schülerin ist vermutlich auf den generellen Umgang mit Textaufgaben in ihrem Mathematikunterricht zurückzuführen, da das Zeichnen einer Skizze an dieser Stelle eine ungeeignete Strategie darstellt. Die Betreuerin greift diesen Sachverhalt auf und bewertet die Strategie für den Fall als sinnvoll, falls die Schülerin eine Idee für eine geeignete Skizze hat. Diese Rückmeldehilfe kann als adaptiv bewertet werden, da sie inhaltlichmethodisch angepasst ist und die Verantwortung für die Bearbeitung der Aufgabe bei der Schülerin verbleibt. Direkt im Anschluss schlägt die Betreuerin jedoch vor, eine Tabelle anzufertigen, was eine wenig minimale und daher wenig adaptive Intervention darstellt. Situationsübergreifend lässt sich in der Videovignette feststellen, dass kein funktionierender Gruppenarbeitsprozess stattfindet. Eine Betreuerintervention, die die gemeinsame Gruppenarbeit wiederherstellt und die Arbeit an der gemeinsamen Aufgabe fordert, kann ebenfalls als geeignet bewertet werden. Zudem hätte dadurch eine Entlastung der Betreuerin stattgefunden, die den einzelnen Lernenden aufgrund der Parallelität der Handlungen kaum gerecht werden kann. Die behandelten Text- und Videovignetten illustrieren ein breites Spektrum unterschiedlicher Situationen in verschiedenen Phasen des Modellierungsprozesses, mit verschiedenen Schwierigkeiten und adaptiven sowie weniger adaptiven Interventionen. In Kombination mit der schrittweisen Komplexitätszunahme der
8.4 Treatments
197
Situationen werden die Studierenden auf das anschließende Training im Lehr-LernLabor während der Modellierungstage vorbereitet.
8.4.1.3 Praxisphase In der Praxisphase wenden die Studierenden die in der Vorbereitungsphase erworbenen Fähigkeiten in der Praxis an. Dazu intervenieren sie in Gruppenarbeitsprozessen und reflektieren ihre Interventionen anhand eines Reflexionsinstruments direkt im Anschluss. Sitzung 10: Der Modellierungstag und die Arbeit im Lehr-Lern-Labor In Sitzung 10 trainieren die Lehramtsstudierenden ihre Diagnose- und Interventionskompetenz im Lehr-Lern-Labor. Dazu nahmen in den drei Semestern Schülerinnen und Schüler der Sekundarstufe 2 an den Modellierungstagen am Standort Koblenz teil. Es fand eine Kooperation mit drei Gymnasien und einer berufsbildenden Schule mit beruflichem Gymnasium statt. Zwei der Schulen befinden sich im Stadtgebiet von Koblenz, zwei in der ländlichen Umgebung. In Kleingruppen von drei bis maximal fünf Schülerinnen und Schülern bearbeiten die Lernenden in insgesamt neun Stunden an zwei Tagen die im Seminar thematisierten Modellierungsaufgaben (vgl. bspw. Abschnitt 8.5.2) in den Räumlichkeiten der Universität. Am ersten Tag werden die Schülerinnen und Schüler von den Studierenden des Seminars betreut. Am zweiten Tag werden die Lerngruppen von wissenschaftlichen Hilfskräften und Mitarbeitern unterstützt, beenden ihre Arbeit und erstellen eine Präsentation ihrer Ergebnisse. Die Kleingruppen erhalten neben den Aufgabenstellungen ein Tablet mit Internetzugang und relevanter Software (GeoGebra, Excel, …). In einem Raum arbeiten maximal vier Gruppen gleichzeitig, sodass eine ruhige Arbeitsatmosphäre sichergestellt ist. Zwei Kleingruppen werden inklusive der betreuenden Lehramtsstudierenden isoliert und videographiert, um eine gute Tonqualität sicherzustellen. Sowohl der Modellierungsprozess der Lernenden als auch die Betreuerinterventionen der Studierenden werden zur Reflexion im Seminar mithilfe einer fest installierten Kamera aufgezeichnet. Es werden die Kleingruppen und Studierenden-Tandems zur Videographie ausgewählt, die ihr Einverständnis dazu erteilen. Bei zwei Seminargruppen pro Semester wird je ein Tandem aus jeder Seminargruppe gefilmt. Die Studierenden-Tandems unterstützen lediglich am ersten Modellierungstag über eine effektive Arbeitszeit von sechs Stunden ein bis maximal zwei Kleingruppen, die die im Seminar bearbeitete Modellierungsaufgabe lösen. Dadurch wird sichergestellt, dass die Studierenden über Wissen über zu erwartende Schwierigkeiten verfügen. Dadurch wird eine Grundlage für adaptive Interventionen geschaffen.
198
8
Design der Studie
Diese haben sich die Studierenden im Austausch mit ihren Kommilitonen in den Seminarsitzungen 2–5 erarbeitet. Für ihre Arbeit im Lehr-Lern-Labor erhalten die Studierenden den Auftrag, die Kleingruppen anhand des im Seminar thematisierten Prozessmodells (vgl. Abschnitt 5.3) und den Kriterien adaptiver Interventionen (vgl. Abschnitt 3.3.4) bei Bedarf in ihrem Arbeitsprozess so zu unterstützen, dass sie am Ende des ersten Tages zu einem vorzeigbaren Ergebnis gelangt sind. Die Studierenden werden darauf hingewiesen, die Lernenden während des Arbeitsprozesses mit räumlichem Abstand zu beobachten, um ein permanentes Nachfragen durch die Schülerinnen und Schüler zu vermeiden. Interveniert ein Studierender in der Kleingruppe, hat der Gruppenpartner den Auftrag, die Intervention anhand eines Reflexionsinstruments zu beobachten und zu dokumentieren. Direkt im Anschluss sind die Studierenden-Tandems dazu aufgefordert, ihre Interventionen anhand dieses Reflexionsinstruments zu diskutieren. Es regt anhand der folgenden Fragestellungen eine Selbst- und Fremdreflexion an: • • • •
Wie und was wurde diagnostiziert? Auf welcher Ebene wurde interveniert? Beschreiben Sie die Intervention. War die Intervention (a priori) adaptiv? Beobachten Sie die Schülerinnen und Schüler direkt im Anschluss an ihre Intervention. Zeigte die Intervention die gewünschte Wirkung?
Ihre Notizen dienen den Studierenden als Grundlage für die Hausarbeit zur Reflexion zweier ausgewählter Interventionen, die sie beschreiben, analysieren und hinsichtlich der Kriterien adaptiver Interventionen begründen und bewerten müssen. Auf freiwilliger Basis können die Studierenden am zweiten Modellierungstag an den Ergebnispräsentationen der Lernenden teilnehmen. Eine weitere Betreuung der Lerngruppen und ein weiteres Training finden jedoch nicht statt.
8.4.1.4 Reflexionsphase In der Reflexionsphase werden ausgewählte Szenen der Praxisphase anhand von Videovignetten reflektiert. Zusätzlich reflektieren die Studierenden ihre Erfahrungen des Praxistages. Sitzung 11: Reflexion von Eigenvideos In Sitzung 11 werden Eigenvideos ausgewählter Lehramtsstudierender reflektiert. Die am Modellierungstag aufgezeichneten Videos werden zur Vorbereitung der Reflexionsphase durch den Dozenten gesichtet. Pro Studierenden werden zwei Videovignetten, pro Tandem also vier Vignetten, in jedem Seminar zur Reflexion
8.4 Treatments
199
eingesetzt. Es werden pro Studierenden jeweils eine adaptive und eine weniger adaptive Intervention ausgewählt. Die Videovignetten werden transkribiert und untertitelt, um wie in den vorherigen Sitzungen Text- und Videovignetten einzusetzen. 60 Minuten der Sitzung werden für die Reflexion der Videovignetten verwendet. Es wird dieselbe Analysemethode wie in Sitzung 9 (vgl. Abschnitt 8.4.1.3) angewandt. Dabei werden die adaptiven Interventionen zuerst reflektiert, um Hemmungen bei den dargestellten Studierenden und ihren Kommilitonen abzubauen (Kleinknecht & Poschinski, 2014). Damit soll eine größere Beteiligung bei der Analyse und Diskussion der Interventionen erreicht werden. Die gefilmten Studierenden haben jeweils das Vorrecht sich zuerst zur Vignette zu äußern, um eventuell weitere Kontextinformationen miteinfließen zu lassen (Borko et al., 2008; Kleinknecht & Poschinski, 2014). Das Treatment schließt mit einer Reflexionsrunde. Die Studierenden reflektieren ihre Stärken und Schwächen, die sie über das Treatment festgestellt haben. Dabei benennen sie Bereiche, in denen sie sich eventuell über das Seminar entwickelt haben und legen Zielvereinbarungen für ihre zukünftige Ausbildung fest. Die Ergebnisse ihrer Reflexion präsentieren sie jeweils ihren Kommilitonen. Sitzung 12: Posttest In Sitzung 12 wird der Posttest durchgeführt. Die Reflexionsprozesse im Rahmen der Hausarbeit tragen nicht zum Treatment bei, da der Posttest vor der Anfertigung stattfindet. Durch die Wahrnehmung, Interpretation und Bewertung von Anforderungssituationen im Seminar werden situationsspezifische Diagnose- und a-priori-Interventionskompetenzen gefördert. Inwiefern dies im Rahmen universitärer fachdidaktischer Seminare mit Praxiselementen möglich und das vorgestellte Treatment dazu geeignet ist, wird in der vorliegenden Forschungsarbeit evaluiert. Dazu wurde eine weitere Experimentalgruppe untersucht.
8.4.2
Treatment in der EG Münster
Ziel des Treatments in der EG Münster ist die Förderung der Diagnose- und Aufgabenkompetenz bzw. des Wissens über Modellierungsprozesse und des Wissens über Modellierungsaufgaben (vgl. Abschnitt 6.3.1). Das fachdidaktische Wahl-PflichtSeminar ist im Masterstudiengang angesiedelt und wird von Lehramtsstudierenden mit den Zielschularten Gymnasien und Gesamtschulen besucht. Die Studierenden wählten ein Seminar je nach Interesse, sodass in Münster stärkere Selektionseffekte als in Koblenz zu erwarten sind. Im Wintersemester 2017/2018 und im
200
8
Design der Studie
Sommersemester 2018 wurde jeweils ein Seminar, im Wintersemester 2018/2019 zwei Seminare mit einer Länge von 90 Minuten je Sitzung im Zeitraum von 10 bis 12 Uhr angeboten. Die Teilnehmerzahlen pro Seminar lagen zwischen 14 und 22 Studierenden. Die fachdidaktische Ausbildung der Lehramtsstudierenden findet an der Westfälischen Wilhelms-Universität Münster im Masterstudiengang statt. In diesem belegen die Lehramtsstudierenden eine Vorlesung (4 SWS) und eine zugehörige Übung (2 SWS) sowie ein fachdidaktisches Seminar (2 SWS). Das Treatment findet im Rahmen des fachdidaktischen Seminars statt. Dabei kann es zu Wechselwirkungen zwischen den Veranstaltungen und dem Treatment kommen, da Inhalte zum mathematischen Modellieren auch in der Vorlesung und Übung behandelt werden. Im Wintersemester 2017/2018 wurden in der Übung die Theorie adaptiver Interventionen nach Leiss (2007) behandelt und exemplarische Videoanalysen zur Diagnostik von Modellierungsphasen sowie zur Ableitung adaptiver Interventionen durchgeführt. Insgesamt nahmen in diesem Semester 21 Studierende am Treatment teil, von denen 15 die Übung im gleichen Semester belegten. Inwieweit die in den folgenden Semestern am Treatment teilnehmenden Studierenden durch diese Übung beeinflusst wurden, kann aus dem Datenmaterial nicht erschlossen werden. Die parallele Förderung stellt ein Störfaktor dar, der bei der Diskussion der Wirksamkeit des Treatments berücksichtigt werden muss. Die Vorlesungen und Übungen in den vorherigen und späteren Semestern umfassten keine Inhalte zum Intervenieren in kooperativen Bearbeitungsprozessen. Die Strukturqualität der Veranstaltung ist im selben Umfang wie in Koblenz gewährleistet. Für die Praxiseinbindung stehen ebenfalls Tablets für die Schülerinnen und Schüler zur Verfügung. Das Seminar wurde von einem wissenschaftlichen Mitarbeiter mit einem Jahr Lehrerfahrung in fachwissenschaftlichen und fachdidaktischen Veranstaltungen an der Universität durchgeführt. Die Treatments in Koblenz und Münster weisen eine ähnliche Seminarstruktur auf. In der Vorbereitungsphase (6 Sitzungen) werden Wissen und Fähigkeiten zum mathematischen Modellieren thematisiert und angewendet sowie theoretische Grundlagen zum Diagnostizieren gelegt. Es werden Kriterien adaptiver Interventionen thematisiert, jedoch werden die Analyse und Bewertung anhand dieser Kriterien nicht trainiert. In Abgrenzung zum Treatment in Koblenz liegt ein Schwerpunkt auf der Heterogenität und individuellen Förderung sowie auf Kriterien guter Modellierungsaufgaben. Die Studierenden entwickeln anhand dieser Kriterien Modellierungsaufgaben für die Praxisphase, die in einem Blended Learning Format anhand von Feedbackzyklen weiterentwickelt werden (Wess, 2020; Wess & Greefrath, 2020). In der Praxisphase (2 Sitzungen) gestalten die Lehramtsstudierenden in Dreierteams jeweils zwei 90-minütige Projektsitzungen mit Schülerinnen und
8.4 Treatments
201
Schülern. Diese bearbeiten die selbsterstellten Modellierungsaufgaben und werden zeitgleich von den jeweiligen Lehramtsstudierenden anhand eines Beobachtungsbogens diagnostiziert. Die Studierenden sind dazu angehalten so wenig wie möglich in den Lösungsprozess einzugreifen und überwiegend zu beobachten. Anhand der ausgefüllten Beobachtungsbögen haben sie im Anschluss die Möglichkeit, didaktische Handlungen, wie z. B. den Einsatz von Begleitmaterial, zu reflektieren (Wess, 2020; Wess & Greefrath, 2020). In der Reflexionsphase (4 Sitzungen) werden die Praxiserfahrungen im Hinblick auf den Umgang mit Heterogenität und die eingesetzten Modellierungsaufgaben reflektiert. Es findet zunächst eine theoriebasierte Gruppenreflexion zu vereinbarten Beobachtungsschwerpunkten statt. Das durch die Diskussion erhaltene Feedback verwenden die Studierenden zur weiteren Evaluation ihrer Modellierungsaufgabe. Abschließend fertigen sie einen Reflexionsbericht an. Die Prozessqualität kann ausführlich bei Wess (in Vorbereitung; vgl. auch Wess & Greefrath, 2020) nachvollzogen werden. Strukturell weisen die Treatments in Koblenz und Münster sowohl Gemeinsamkeiten als auch Unterschiede auf. Die Vorbereitungsphase zeichnet sich durch eine gemeinsame theoretische Grundlage zum mathematischen Modellieren und zur pädagogischen Diagnostik aus. Die theoretische Ausbildung unterscheidet sich jedoch in der Schwerpunktsetzung auf die adaptive Interventionskompetenz in Koblenz bzw. die Aufgabenkompetenz in Münster. Die Studierenden in Koblenz erhalten im Gegensatz zur EG Münster eine Schulung anhand von Videovignetten. Die Praxisphase umfasst in Koblenz eine doppelt so lange Zeitspanne (6 Stunden) wie in Münster (3 Stunden). Aus diesem Grund liegt in Koblenz ein zeitlich stärkerer Fokus auf der Praxisphase, in Münster hingegen ein zeitlich stärkerer Fokus auf der anschließenden Reflexionsphase.
8.4.3
Treatments in der Kontrollgruppe
Die Kontrollgruppe setzt sich aus drei Teilstichproben zusammen (vgl. Abschnitt 8.3), die an zwei Universitäten über fachdidaktische Seminare im Masterstudiengang erreicht wurden. An der Universität Münster wurden die Kontrollgruppendaten im Wintersemester 2017/2018 in einem zum Treatment der EG Münster parallel stattfindenden fachdidaktischen Wahl-Pflicht-Seminar zum Einsatz digitaler Medien im Mathematikunterricht erhoben. Es wurden weder Inhalte zum mathematischen Modellieren noch zu Interventionen behandelt. Eine Wechselwirkung mit der fachdidaktischen Vorlesung und Übung kann wie in der Experimentalgruppe jedoch nicht ausgeschlossen werden (vgl. Abschnitt 8.4.2).
202
8
Design der Studie
Die Kontrollgruppendaten an der Universität Hamburg wurden im Wintersemester 2018/2019 in zwei fachdidaktischen Masterseminaren erhoben. In einem Seminar mit N = 13 Studierenden lag der Schwerpunkt auf dem Einsatz digitaler Werkzeuge im Mathematikunterricht. Verschiedene mathematische Probleme wurden mit unterschiedlichen digitalen Werkzeugen bearbeitet. Eine Modellierungsaufgabe, die die Simulation einer Bundesligasaison erfordert, wurde ausführlich behandelt und mithilfe von Microsoft Excel bearbeitet. Da das mathematische Modellieren nur punktuell thematisiert wurde, ist dies als unproblematisch anzusehen. Interventionen wurden im Seminar nicht thematisiert. Das zweite Seminar mit N = 7 Studierenden legte einen Schwerpunkt auf die Diagnostik und Fehler im Mathematikunterricht. Im Seminar wurde ein Prozessmodell zum Umgang mit Fehlern thematisiert (Heinrichs, 2015, S. 66). Es wurden Kurzvideos eingesetzt, bei denen der Fokus auf der Identifikation von Fehlern lag. Dabei wurden keine Interventionsstrategien in Gruppenarbeitsprozessen thematisiert. Im Seminar behandelte Inhalte zur Diagnostik können zu einer Beeinflussung der Diagnosekompetenz der Studierenden geführt haben. Da die Diagnostik nicht in Bezug auf mathematische Modellierungsprozesse konkretisiert wurde, ist von einer geringen Beeinflussung der Testergebnisse auszugehen. Eine positive Wechselwirkung würde zu besseren Testergebnissen führen, was eine konservative Schätzung der Effekte in den Experimentalgruppen zur Folge hat. Dies ist daher als unproblematisch anzusehen. Mit parallel stattfindenden Veranstaltungen sind keine Wechselwirkungen zu erwarten. Obwohl sich die Teilstichproben in ihrem inhaltlichen Fokus wesentlich voneinander unterscheiden, wurden sie zu einer gemeinsamen Kontrollgruppe zusammengefasst. Dies hat auf der einen Seite den forschungspraktischen Grund, dass zur Evaluation der Wirksamkeit der Treatments in den Experimentalgruppen eine Kontrollgruppe mit einer ausreichenden Stichprobengröße notwendig ist. Auf der anderen Seite ähneln sich die Studierenden der Teilstichproben in Merkmalen wie der Abiturnote und dem Semester. Einschränkend ist anzumerken, dass sich die Studierenden aus Hamburg zu einem großen Teil im Studiengang für das Lehramt der Primar- und Sekundarstufe 1 befinden. Obwohl es sich um einen gemeinsamen Studiengang handelt, sind die Studierenden in diesem Merkmal nur bedingt vergleichbar.
8.5 Modellierungsbeispiele aus der EG Koblenz
8.5
203
Modellierungsbeispiele aus der EG Koblenz
Zur Illustration der verwendeten Modellierungsaufgaben im fachdidaktischen Seminar in Koblenz werden zwei Aufgabenbeispiele vorgestellt, in das Klassifikationssystem nach Maaß (2010) eingeordnet und hinsichtlich ihres Modellierungsgehalts (vgl. Abschnitt 2.2) bewertet. Es wurden Modellierungsaufgaben nach einem holistischen Ansatz (Blomhoj & Jensen, 2003) verwendet, die sich durch einen sehr offenen Bearbeitungsprozess auszeichnen, viele Teilkompetenzen des Modellierens und ein selbstständiges Sammeln von Daten erfordern. Durch die Verwendung dieser Art von Aufgaben wird sichergestellt, dass zur Ermöglichung eines erfolgreichen Modellierungsprozesses auch tatsächlich Interventionen zur Unterstützung der Lernenden notwendig sind. Bei derartigen Modellierungsaufgaben kann kein komplett selbstständiger Bearbeitungsprozess erwartet werden (Stender, 2016, S. 75). Die verwendeten Aufgaben ermöglichen den Lernenden einen forschenden Lernprozess (vgl. Abschnitt 8.4.1.1; Martius et al., 2016) und den sie unterstützenden Lehramtsstudierenden gute Möglichkeiten für Interventionen in kooperativen Modellierungsprozessen. Die erste Aufgabe »Der aufwärtsrollende Doppelkegel« wurde von den Studierenden nicht eigenständig bearbeitet, aber im Seminar thematisiert (vgl. Abschnitt 8.4.1.3). Die Aufgabe bildet die Grundlage für die in den Videos dargestellten Modellierungsprozesse und daher auch für die Videoanalyse. Die zweite Modellierungsaufgabe »Blockabfertigung« (Siller, 2013) wurde bereits an zahlreichen Modellierungstagen eingesetzt. Sie wurde von einer Gruppe Lehramtsstudierender im ersten Teil der Veranstaltung eigenständig bearbeitet, in zwei Sitzungen vorgestellt und im Plenum diskutiert. Sie ist ein Beispiel für eine im Lehr-Lern-Labor bzw. am Modellierungstag verwendete Aufgabe, die von Schülerinnen und Schülern bearbeitet wurde. Weitere der Literatur entnommene Modellierungsaufgaben, die auch im Seminar zum Einsatz kamen, sind: • Evakuierung des Moskauer Lushniki-Stadions (Ruzika, Siller, & Bracke, 2017). Wie lange würde es dauern das Moskauer Lushniki-Stadion, welches beim WMFinale voll besetzt ist, nach einer Bombendrohung zu evakuieren? • Kalte Progression (vgl. bspw. Henn, 2017). Wie groß ist die kalte Progression im Jahr 2018? Wie kann die kalte Progression komplett abgebaut werden? Für die Aufgaben »Der aufwärtsrollende Doppelkegel« und »Blockabfertigung« wird jeweils ein exemplarischer Lösungsweg anhand der Modellierungsphasen nach Leiss (2007; vgl. Abschnitt 2.4.1) vorgestellt, um im Anschluss jeweils eine Einordnung der Aufgaben in das Klassifikationsschema nach Maaß (2010; vgl. Abschnitt 2.2) vorzunehmen.
204
8.5.1
8
Design der Studie
Der aufwärtsrollende Doppelkegel
Der aufwärtsrollende Doppelkegel ruft bei Schülerinnen und Schülern erfahrungsgemäß Erstaunen hervor. Entgegen der Intuition des Beobachters rollt der Doppelkegel zwei Schienen ohne jegliche Energiezufuhr scheinbar nach oben (vgl. Abbildung 8.3). Anhand einer geeigneten geometrisch-mathematischen Beschreibung kann eine Rollbedingung hergeleitet werden, die an einem experimentellen Aufbau überprüft werden kann. Das Problem wurde erstmals zum Ende des 17. Jahrhunderts publiziert (Leybourn, 1694) und erhielt in einer Monographie von ’s Gravesande (1720) mehr Aufmerksamkeit. Das Paradoxon wird seitdem auch in der modernen Literatur immer wieder aufgegriffen (Balta, 2002; Ucke & Becker, 1997) und wurde unter anderem in einer Masterarbeit (Becker, 2017) fachdidaktisch analysiert.
Der aufwärtsrollende Doppelkegel Der aufwärtsrollende Doppelkegel ist ein Experiment, bei dem ein Rotationskörper entgegen allen physikalischen Wissens scheinbar ohne jegliche Energiezufuhr eine schiefe Ebene hinaufrollt. Der Versuchsaufbau besteht aus zwei geneigten Schienen, die an ihrem tiefsten Punkt miteinander verbunden sind, und einen Winkel einschließen. Entwickeln Sie ein Modell, welches bei Eingabe der Versuchsparameter voraussagen kann, ob der Doppelkegel die Ebene aufwärtsrollt oder nicht.
Abbildung 8.3 Modellierungsaufgabe »Der aufwärtsrollende Doppelkegel«
8.5 Modellierungsbeispiele aus der EG Koblenz
205
Konstruieren/Verstehen In der ersten Phase des Modellierungsprozesses müssen ein intuitives Verständnis der Realsituation – des Experiments – entwickelt und die Aufgabenstellung verstanden werden. In der Regel führen Schülerinnen und Schüler das Experiment zu Beginn des Bearbeitungsprozesses mehrere Male durch und variieren es durch das Verschieben der hinteren Schiene (vgl. Abbildung 8.3). Der Öffnungswinkel zwischen den Schienen ist im Experiment variabel, was nach der Entwicklung eines Modells eine experimentelle Überprüfung der herzuleitenden Rollbedingung ermöglicht. Durch die Untersuchung des Verhaltens des Doppelkegels bei unterschiedlichen Konfigurationen entwickeln die Lernenden Vorstellungen zur Funktionsweise des Experiments und Bilden ein Situationsmodell des Experiments aus. Vereinfachen/Strukturieren Um den Aufbau des Experiments mathematisch zu beschreiben, müssen diverse Annahmen getroffen werden. Man geht dabei von reibungsfreien Schienen und einem perfekt nivellierten Experiment aus. In dieser Phase stellt die Identifikation von drei den Aufbau bestimmenden Winkeln, die für eine Herleitung der Rollbedingung entscheidend sind, einen wichtigen Schritt dar. Zur Bestimmung dieser Winkel sind Annahmen zu treffen, die am Experiment selbst und anhand von einfachen geometrischen Überlegungen näherungsweise berechnet werden können. Für eine spätere Überprüfung der Rollbedingung sind folgende Winkel bedeutsam: • Der Öffnungswinkel α der Schienen. Er kann im Experiment variiert und anhand einer Winkelskala abgelesen werden (vgl. Abbildung 8.4, links). • Der Steigungswinkel β der Schienen. Er kann anhand der Länge und Höhe der Schienen bestimmt werden (vgl. Abbildung 8.4, rechts). • Der Öffnungswinkel γ des Kegels. Er kann aus dem Radius und der Länge des Doppelkegels bestimmt werden (vgl. Abbildung 8.4, mittig).
Mathematisieren Zur Herleitung der Rollbedingung sind die in Abbildung 8.4 dargestellten Skizzen zum experimentellen Aufbau notwendig, die das Experiment aus verschiedenen Perspektiven zeigt. Die beiden Schienen werden aus der Vogelperspektive als Strahlen modelliert, die einen Winkel α einschließen (vgl. Abbildung 8.4, links). Der Doppelkegel wird zweidimensional anhand von zwei gleichschenkligen Dreiecken beschrieben (vgl. Abbildung 8.4, mittig). Die Schienen werden von der Seite anhand eines Rechtecks und eines Dreiecks modelliert (vgl. Abbildung 8.4, rechts).
206
8
Design der Studie
Abbildung 8.4 Skizzen zum aufwärtsrollenden Doppelkegel (Becker, 2017)
Zum Mathematisieren des Aufbaus müssen verschiedene Variablen eingeführt werden: • R: Radius des Doppelkegels, • a: Strecke zwischen Schwerpunkt und Auflagepunkt des Kegels auf den Schienen, • ys : Höhe des Schwerpunkts über dem Auflagepunkt des Kegels, • s: Länge der Schienen, • h: Höhe der Schiene am Ende der Leiste, • H: Höhe des Schwerpunktes über der Schiene am Anfang der Leiste, • xs : Zurückgelegte Strecke des Schwerpunktes entlang der Winkelhalbierenden der beiden Schienen. Der grundlegende Ansatz der Modellierung besteht in der Überlegung, dass der Schwerpunkt absinken muss, damit der Kegel zu rollen beginnt. Es wird ein funktionaler Zusammenhang hergeleitet, der die Höhe des Schwerpunkts in Abhängigkeit der zurückgelegten Strecke beschreibt. Aus jeder der drei Skizzen können dazu folgende Beziehungen abgelesen werden: Aus der linken Abbildung folgt: tan α2 = xas . R−y Aus der mittleren Abbildung folgt: tan γ2 = a s . h Aus der rechten Abbildung folgt: tan(β) = xs . Mit H = h + yS ergibt sich eine funktionale Beschreibung der Höhe des Schwerpunktes:
8.5 Modellierungsbeispiele aus der EG Koblenz
207
γ α · tan . H(xs ) = R + xs · tan(β) − tan 2 2 Die Funktion H(xs ) beschreibt die Höhe des Schwerpunkts des Doppelkegels in Abhängigkeit der zurückgelegten Strecke xs . Der Kegel kann daher nur zu rollen beginnen, falls die Funktion H(xs ) monoton fällt. Die Rollbedingung lässt sich durch folgende Ungleichung darstellen: d H(xs ) < 0. dxs Mathematisch arbeiten Das mathematische Arbeiten besteht im Wesentlichen aus dem Vereinfachen der Rollbedingung und der Berechnung des Grenzwinkels für den gegebenen experimentellen Aufbau. Durch Ableiten und Umformen erhält man die Rollbedingung in ihrer einfachsten Form: γ α · tan . tan(β) < tan 2 2 Der Steigungswinkel β der Schienen und der Öffnungswinkel γ des Doppelkegels werden aus dem experimentellen Aufbau bestimmt zu β = 1.92◦ und γ = 38.38◦ . Für die Rollbedingung berechnet man α > 11◦ . Interpretieren Für einen Öffnungswinkel der Schienen von α > 11◦ rollt der Doppelkegel scheinbar die Schienen hinauf. Der Schwerpunkt bewegt sich aufgrund der Winkelkonstellation jedoch nach unten, denn die Funktion H(xs ) ist monoton fallend. Ist α > 11◦ ist die Funktion H(xs ) monoton steigend und der Doppelkegel rollt die Schienen in die entgegengesetzte Richtung scheinbar herunter, falls man ihn auf der anderen Seite der Schienen aufsetzt. Validieren Das Ergebnis kann leicht anhand des Experiments überprüft werden. Im Gegensatz zum mathematischen Ergebnis bestimmt Becker (2017, S. 52) den Grenzwinkel experimentell auf α = 14◦ . Ist der Winkel α < 14◦ , beginnt der Doppelkegel nicht zu rollen. Die Differenz zwischen dem berechneten und experimentell bestimmten Winkel kann auf Reibungseffekte zurückgeführt werden.
208
8
Design der Studie
Klassifikation der Modellierungsaufgabe »Der aufwärtsrollende Doppelkegel« Die Merkmale der Modellierungsaufgabe werden anhand des Klassifikationsschemas nach Maaß (2010) bestimmt (vgl. Tabelle 8.2). Anhand der in Abschnitt 1.2 festgelegten Indikatoren lässt sich ein hoher Modellierungsgehalt der Aufgabe bestätigen. Die Aufgabe spricht alle Phasen des Modellierungsprozesses an, ist unterbestimmt und realitätsnah. Sie kann jedoch nicht als authentisch bezeichnet werden, da zwar die zu erzeugenden Daten authentisch sind, aber die Fragestellung wenig Relevanz besitzt. Durch die paradoxe Natur der Aufgabe kann sie der persönlichen Situation der Lernenden zugeordnet werden, da Schülerinnen und Schüler erfahrungsgemäß vom Experiment begeistert sind. Da die Transformation und der Endzustand unklar sind, handelt es sich um ein komplexes Problem, bei dem die Rollbedingung, d. h. der Endzustand, bestimmt werden muss. Tabelle 8.2 Einordnung der Modellierungsaufgabe »Der aufwärtsrollende Doppelkegel« Klassifikation
Kategorie der Klassifikation
Fokus der Modellierungsaktivität
Gesamter Prozess
Daten
Unterbestimmt
Realitätsbezug
Realitätsnah
Situation
Persönliche Situation
Art des Modells
Deskriptiv
Darstellungsebene
Text, Bild, Material
Offenheit
Komplexes Problem
8.5.2
Blockabfertigung am Tauern-Tunnel
Die Modellierungsaufgabe »Blockabfertigung am Tauern-Tunnel« ist eine von acht Aufgaben, die den Lehramtsstudierenden im Treatment in Koblenz zur Bearbeitung zur Auswahl stehen. Besonders zu Ferienbeginn erreichten die Staus auf der Autobahn in Richtung Süden vor dem damals zweispurigen Tauerntunnel eine enorme Länge. Der Staubildung wurde mit der Blockabfertigung entgegengewirkt. Hierbei werden die Fahrzeuge einer Seite abwechselnd gestoppt, sodass die Fahrzeuge der anderen Seite beide Spuren des Tunnels gleichzeitig befahren können. Neben der Minimierung der Staugefahr und Wartezeit wird so eine hohe Verkehrssicherheit gewährleistet. Im Treatment in Koblenz wurde die Aufgabe in der in Abbildung 8.5 dargestellten Form eingesetzt.
8.5 Modellierungsbeispiele aus der EG Koblenz
209
Blockabfertigung am Tauern-Tunnel Regelmäßig zu Ferienbeginn erreicht die Staulänge vor dem Tauern-Tunnel in Richtung Süden ihren Höhepunkt. Um die Sicherheit der Reisenden bei einem erhöhten Verkehrsaufkommen dennoch gewährleisten zu können, wird ab einer bestimmten Verkehrsfrequenz die Blockabfertigung eingesetzt. Dabei werden die Fahrzeuge in beiden Fahrtrichtungen abwechselnd angehalten, um zwei Spuren für die Benutzung in eine bestimmte Fahrtrichtung zur Verfügung zu stellen. Ziel dieses Verkehrssystems ist es, innerhalb einer bestimmten Zeit so viele Fahrzeuge wie möglich durch den Tunnel zu schleusen. Wie müssen die Ampeln geschaltet sein, sodass ein optimaler Verkehrsfluss gewährleistet ist?
Abbildung 8.5 Modellierungsaufgabe »Blockabfertigung im Tauerntunnel«
Siller (2013) stellt eine ausführliche Modellierung und fachdidaktische Analyse einer ähnlichen Aufgabe dar. Dabei unterscheidet er die Modellierung einer optimalen Geschwindigkeit der Fahrzeuge zur Maximierung der Verkehrsfrequenz im Tunnel und die Modellierung einer optimalen Ampelschaltung. In der folgenden Darstellung wird eine alternative Modellierung zur Bestimmung einer optimalen Ampelschaltung vorgestellt, wobei die optimale Geschwindigkeit nach dem Ansatz von Siller (2013) die Grundlage für das vorliegende Beispiel darstellt. Der nachfolgend beschriebene Ansatz ähnelt dem von Greefrath und Schukajlow (2018) vorgeschlagenen Ansatz zur Optimierung einer Baustellenampel. Hierbei wird das Verkehrsaufkommen in den Blick genommen. Konstruieren/Verstehen Zur Bildung eines Situationsmodells müssen die Studierenden bzw. die Schülerinnen und Schüler zunächst den Begriff der Blockabfertigung recherchieren und sich den Aufbau des Tauern-Tunnels und der daran anschließenden Autobahn veranschaulichen. Darüber hinaus ist zu klären, was unter einem optimalen Verkehrsfluss zu verstehen ist. Die Ampelschaltung wird in diesem Beispiel als optimal angesehen, wenn sie einer Staubildung möglichst entgegenwirkt. Bei dieser Herangehensweise wird das Verkehrsaufkommen auf beiden Seiten des Tunnels betrachtet. Vereinfachen/Strukturieren Relevante Einflussgrößen müssen identifiziert und Näherungswerte festgehalten werden. Für die Modellierung werden exemplarisch die folgenden Annahmen getroffen (Kirsch, 1996; Siller, 2013):
210
8
Design der Studie
• Die Tunnellänge beträgt sA = 6546 m. • Die Verkehrsfrequenz q(v0 ) gibt die Anzahl der Fahrzeuge an, die in einer Stunde eine Zählstelle passieren (Siller, 2013). Für die folgenden Berechnungen wird ein Verkehrsaufkommen von q1 = 1150 Fahrzeugen/h ≈ 0.3194 Fahrzeugen/s auf der stark frequentierten Seite des Tunnels (Seite 1) und q1 = 300 Fahrzeugen/h ≈ 0.0833 Fahrzeugen/s auf der weniger frequentierten Seite des Tunnels (Seite 2) angenommen (vgl. Abbildung 8.6). • Die Durchschnittsgeschwindigkeit der Fahrzeuge im Tunnel entspricht der in Anlehnung an Siller (2013) berechneten optimalen Geschwindigkeit von v0 = 11.52 m/s ≈ 41.47 km/h, die durch die Maximierung der Verkehrsfrequenz q(v0 ) im Tunnel bestimmt wird. Dabei beträgt die maximale Verkehrsfrequenz im Tunnel q(v0 ) = 1046.36 Fahrzeuge/h ≈ 0.2907 Fahrzeuge/s.
Abbildung 8.6 Schematische Darstellung der Blockabfertigung
Mathematisieren Für die verschiedenen Ampelphasen werden die folgenden Variablen eingeführt: • tg1 und tg2 stehen für die Grünzeiten auf den jeweiligen Seiten des Tunnels. • tr1 und tr2 stehen für die Rotzeiten auf den jeweiligen Seiten des Tunnels. In diesen Rotzeiten ist nicht die Sicherheitszeit enthalten, die notwendig ist, damit das letzte die Ampel passierende Fahrzeug den Tunnel verlassen kann bevor die Grünphase der anderen Richtung startet. • tS stellt die Sicherheitszeit dar. Diese berechnet sich aus der Zeit, die ein Fahrzeug benötigt, um den Tunnel zu durchqueren und ist daher für beide Seiten gleich groß. Sie berechnet sich zu:
8.5 Modellierungsbeispiele aus der EG Koblenz
tS =
211
sA ≈ 568.2292 s = 9.47 min. v0
• tR1 und tR2 stellen die Gesamtrotzeiten für die jeweilige Seite dar, die sich aus den Zeiten tr1 bzw. tr2 und tS zusammensetzen. Eine optimale Ampelschaltung wird als der Idealfall definiert, nach dem alle in der Rot-, Grün- und Sicherheitszeit ankommenden Fahrzeuge auf der jeweiligen Seite die Ampel in der Grünphase passieren können.3 Die Sicherheitszeit tS fließt zweifach in die Gesamtrotzeiten mit ein, da die Sicherheitszeiten vor den Grünphasen beider Seiten berücksichtigt werden müssen. Für beide Seiten wird eine Gleichung formuliert: q1 · tg1 + tr1 + 2 · tS = tg1 · 2 · q(v0 ) q2 · tg2 + tr2 + 2 · tS = tg2 · 2 · q(v0 ) Die Terme auf der linken Seite des Gleichheitszeichens beschreiben die in den verschiedenen Ampelphasen auf den jeweiligen Tunnelseiten ankommenden Fahrzeuge. Die rechten Seiten der Gleichungen beschreiben die Anzahl der Fahrzeuge, die in den jeweiligen Grünphasen den Tunnel passieren können. Da die Sicherheitszeiten getrennt von den Rotphasen berücksichtigt werden, gilt: tg1 = tr2 und tg2 = tr1
Mathematisch arbeiten Das Gleichungssystem vereinfacht sich durch Sortieren zu: 2·q(v ) 1 − q1 0 · tg1 + tg2 = −2 · tS 2·q(v ) tg1 + 1 − q2 0 · tg2 = −2 · tS Es kann entweder händisch gelöst oder beispielsweise im CAS-Rechner von GeoGebra berechnet werden. Für beide Grünzeiten berechnet man anhand der angegebenen Werte tg1 = tr2 ≈ 2031.26 s ≈ 33.85 min und tg2 = tr1 ≈ 529.75 s ≈ 8.83 min. Die entsprechenden Gesamtrotzeiten berechnen sich dann zu tR1 = tr1 + 2 · tS = 27.77 min und tR2 = tr2 + 2 · tS = 52.79 min. 3 Diese
Idealbedingungen lässt sich im vorliegenden Beispiel aufgrund der hohen Verkehrsfrequenz q1 und der limitierten Verkehrsfrequenz q(v0 ) im Tunnel nicht erfüllen.
212
8
Design der Studie
Interpretieren Formuliert man die Bedingung, dass alle in den Rot-, Grün- und Sicherheitszeiten ankommenden Fahrzeuge auf beiden Seiten des Tunnels in der Grünphase den Tunnel passieren sollen, ergibt sich für die stark frequentierte Seite eine Grünphase von 33.85 min sowie eine Gesamtrotphase von 27.77 min und auf der weniger frequentierten Seite eine Grünphase von 8.83 min sowie eine Gesamtrotphase von 52.79 min. Validieren Die Grünphase der stark frequentierten und die Gesamtrotphase der weniger frequentierten Tunnelseite erscheinen sehr lang. Insbesondere die Gesamtrotphase auf der weniger frequentierten Seite ist nicht zumutbar. Die Betreiber des Tunnels geben eine Wechselzeit der Fahrtrichtung von 15 bis 30 Minuten an (Siller, 2013). Dies lässt vermuten, dass das Computersystem zur Ampelsteuerung bei der Berechnung der Ampelzeiten eine andere Bedingung als die hier gewählte Vermeidung einer Staubildung verwendet. Vergleicht man die angenommene Verkehrsfrequenz der stark frequentierten Seite q1 mit der maximalen Verkehrsfrequenz im Tunnel q(v0 ), so erkennt man, dass weniger Fahrzeuge pro Stunde durch den Tunnel fahren können als ankommen. Daher kann ein Stau grundsätzlich nicht vermieden werden. Ein für die Ampelzeiten ausschlaggebender Faktor sind die Anfahrtszeiten der Fahrzeuge, die sich je nach Fahrzeugtyp unterscheiden. Es ist zu berücksichtigen, dass in einem Stau nicht alle Fahrzeuge gleichzeitig anfahren und eine gewisse Zeit bis zum Erreichen der Reisegeschwindigkeit vergeht (Siller, 2013). Diese Anfahrtszeiten haben einen erheblichen Einfluss auf die Durchflussrate und sollten bei der Interpretation der Ergebnisse bedacht werden. Der genannte Aspekt bietet eine Möglichkeit zur Erweiterung des Modells. Klassifikation der Modellierungsaufgabe »Blockabfertigung im Tauerntunnel« Die in Abschnitt 2.2 beschriebenen Indikatoren attestieren der Aufgabe einen hohen Modellierungsgehalt (vgl. Tabelle 8.3). Es werden alle Phasen des Modellierungsprozesses angesprochen und die unterbestimmte Aufgabenstellung erfordert eine Recherche von Informationen und das Treffen von Annahmen. Der Realitätsbezug der Modellierungsaufgabe ist authentisch, und zwar sowohl in Bezug auf den gewählten Kontext als auch auf die Anwendung von Mathematik (Vos, 2015). Obwohl seit dem Jahr 2010 am Tauerntunnel eine zweite Tunnelröhre eröffnet wurde, die nun auch dem Gegenverkehr die Nutzung von zwei Spuren ermöglicht, ist der Kontext nach wie vor aktuell. Es müssen jedoch Abstriche in Bezug auf die Relevanz des Kontextes für die Schülerinnen und Schüler in Kauf genommen werden. Die Blockabfertigung stellt ein öffentliches Problem dar, das aufgrund der
8.5 Modellierungsbeispiele aus der EG Koblenz
213
vermutlich fehlenden Erfahrungen im Autofahren die Lernenden wenig persönlich betrifft. Durch die unbestimmte Transformation und den Endzustand handelt es sich bei dieser Modellierungsaufgabe ebenfalls um ein komplexes Problem, das zahlreiche Anlässe für Interventionen der Lehrkraft schafft. Tabelle 8.3 Einordnung der Modellierungsaufgabe »Blockabfertigung im Tauerntunnel« Klassifikation
Kategorie der Klassifikation
Fokus der Modellierungsaktivität
Gesamter Prozess
Daten
Unterbestimmt
Realitätsbezug
Authentisch
Situation
Öffentliche Situation
Art des Modells
Normativ
Darstellungsebene
Text, Bild
Offenheit
Komplexes Problem
9
Methoden der Datenerhebung
Nach der Darstellung des Studiendesigns wird in diesem Kapitel zunächst das Vorgehen bei der Testentwicklung des in Kooperation mit Raphael Wess entwickelten Testinstruments »Lehrerkompetenzen zum mathematischen Modellieren« (Klock & Wess, 2018; vgl. Anhang B) beschrieben (vgl. Abschnitt 9.1). Das Testinstrument operationalisiert die in dieser Arbeit untersuchten Konstrukte der Überzeugungen und Selbstwirksamkeitserwartungen zum mathematischen Modellieren sowie die adaptive a-priori-Interventionskompetenz, die sich aus den Facetten des Wissens über Interventionen und des Wissens über Modellierungsprozesse des modellierungsspezifischen fachdidaktischen Wissens zusammensetzt. Zusätzlich wurden Vorerfahrungen zum mathematischen Modellieren erhoben. Dabei steht das Konstrukt der adaptiven a-priori-Interventionskompetenz im Fokus dieser Arbeit. In den Abschnitten 9.2 und 9.3 wird die Operationalisierung der einzelnen Konstrukte im Fragebogen- und Testinstrument anhand von Beispielitems dargestellt. Abschließend wird die Durchführung der Datenerhebung beschrieben (vgl. Abschnitt 9.4).
Elektronisches Zusatzmaterial Die elektronische Version dieses Kapitels enthält Zusatzmaterial, das berechtigten Benutzern zur Verfügung steht https://doi.org/10.1007/978-3-658-31432-3_9 © Der/die Herausgeber bzw. der/die Autor(en), exklusiv lizenziert durch Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2020 H. Klock, Adaptive Interventionskompetenz in mathematischen Modellierungsprozessen, Studien zur theoretischen und empirischen Forschung in der Mathematikdidaktik, https://doi.org/10.1007/978-3-658-31432-3_9
215
216
9.1
9
Methoden der Datenerhebung
Entwicklung des Instruments
Das Fragebogen- und Testinstrument (Klock & Wess, 2018) in Form eines PaperPencil-Testhefts wurde in drei Phasen entwickelt. In Phase 1 wurden anhand des Prinzips der rationalen Testkonstruktion (Bühner, 2011, S. 93) Items zu den Kompetenzaspekten, -bereichen und -facetten der professionellen Kompetenz zum Lehren mathematischen Modellierens (vgl. Abschnitt 6.3) erarbeitet. Die Konstruktion der Items orientierte sich eng an den Inhalten des konzeptualisierten Strukturmodells, um eine valide Messung der Konstrukte zu ermöglichen. Es wurden vier Skalen zu den Überzeugungen zum mathematischen Modellieren (32 Items), zwei Skalen zu den Selbstwirksamkeitserwartungen zum mathematischen Modellieren (24 Items) und vier Skalen zum modellierungsspezifischen fachdidaktischen Wissen (103 Items) konstruiert. Das Wissen über Interventionen (40 Items) und das Wissen über Modellierungsprozesse (30 Items) wird anhand von Modellierungsaufgaben mit fallbasierten Textvignetten, sogenannter Aufgabenvignetten, erhoben, die Schülergespräche während der Bearbeitung der Aufgaben beschreiben. Zur Erhebung von Vorerfahrungen zum Modellieren wurden vier Selbsteinschätzungsskalen mit insgesamt 20 Items konstruiert. In Phase 2 wurde das Fragebogen- und Testinstrument im Wintersemester 2016/2017 im fachdidaktischen Seminar in Koblenz, in dessen Rahmen später das Treatment stattfand, in einer kleinen Stichprobe (N = 8) qualitativ pilotiert. Die Probanden bearbeiteten das Instrument mit dem Auftrag, unverständliche, sehr einfache und sehr schwierige Items zu markieren (Jonkisz, Moosbrugger, & Brandt, 2012). Im Anschluss fand eine Aussprache mit den Studierenden statt. Unverständliche oder unpräzise Items wurden im Anschluss überarbeitet. Im Sommersemester 2017 folgte eine weitere Pilotierung (N = 66), in der das Instrument erstmals quantitativ ausgewertet wurde. Anhand der Itemschwierigkeiten und Trennschärfen wurden kritische Items aus dem Instrument ausgeschlossen. Die Anzahl der Items reduzierte sich auf 16 Items zu den Überzeugungen zum mathematischen Modellieren, 24 Items zu den Selbstwirksamkeitserwartung zum mathematischen Modellieren, 71 Items zum modellierungsspezifischen fachdidaktischen Wissen und 20 Items zu den selbstberichteten Vorerfahrungen zum Modellieren. Insgesamt wurden vier der zehn Aufgabenvignetten aus dem Test ausgeschlossen, 16 Items zum Wissen über Interventionen und 12 Items zum Wissen über Modellierungsprozesse. In Phase 3 wurde das Instrument im Wintersemester 2017/2018 in einer Stichprobe von N = 156 Lehramtsstudierenden abschließend pilotiert. Anhand dieser Stichprobe wurden die Dimension aller Skalen faktorenanalytisch überprüft und erste Skalierungen anhand des Rasch-Modells durchgeführt. Für die Aspekte der professionellen Kompetenz zum Lehren mathematischen Modellierens wurde einer
9.2 Fragebogeninstrument
217
Strukturgleichungsanalyse durchgeführt, die die Struktur des in Abschnitt 6.3.4 dargestellten Modells überwiegend bestätigte (Klock et al., 2019; Wess et al., angenommen). In den folgenden Unterkapiteln werden die Operationalisierungen der in dieser Arbeit untersuchten Konstrukte durch das verwendete Instrument dargestellt. Das Instrument besteht zum einen aus einem Fragebogenteil, der anhand von Ratingskalen die Vorerfahrungen, Überzeugungen und Selbstwirksamkeitserwartungen zum mathematischen Modellieren erfasst. Zum anderen misst ein psychometrischer Leistungstest anhand von Aufgabenvignetten die Diagnose- und a-prioriInterventionskompetenz. Es werden jeweils Beispielitems zu jeder Skala angegeben. Das gesamte Testinstrument kann bei Klock und Wess (2018) eingesehen werden.
9.2
Fragebogeninstrument
Das Antwortformat des Fragebogeninstruments besteht aus fünf-stufigen Ratingskalen mit den Ausprägungen »trifft überhaupt nicht zu«, »trifft eher nicht zu«, »weder noch«, »trifft eher zu« und »trifft voll zu«. Entsprechend den Empfehlungen von Döring und Bortz (2016, S. 269) wurden fünf Stufen gewählt, um den Probanden eine mittlere Ausprägung anzubieten und diese nicht dazu zu zwingen, sich für einen Pol zu entscheiden. Fünf Stufen ermöglichen es, den eigenen Grad der Zustimmung differenziert anhand einer verbalen Abstufung vorzunehmen, ohne dass es zu einer Überforderung der Probanden durch eine zu breite Ratingskala kommt (Bühner, 2011, S. 111).
9.2.1
Selbstberichtete Vorerfahrungen zum mathematischen Modellieren
Zur Kontrolle von Vorerfahrungen zum mathematischen Modellieren wurden Kurzskalen verwendet, die anhand von drei oder sechs Items Selbsteinschätzungen zu verschiedenen Erfahrungsgebieten erfassen. Dazu wurde ein Itempool entwickelt, der nach einer explorativen Faktorenanalyse zur Bildung von vier Skalen führte. Die Items 2.2, 2.4, 2.6, 2.8, 2.10 und 2.13 bilden die Skala »Lehre und Vorbereitung zum mathematischen Modellieren«, die Items 2.1, 2.5 und 2.11 die Skala »Behandlung mathematischen Modellierens«, die Items 2.7, 2.12 und 2.15 die Skala »Modellierungsaufgaben« und die Items 2.3, 2.9 und 2.14 die Skala »Modellieren im Unterricht« (Klock & Wess, 2018, S. 17). Nicht alle Items ließen sich anhand ihrer
218
9
Methoden der Datenerhebung
Ladungen einer Skala zuordnen, sodass die obige Aufzählung nicht alle im Test enthaltenen Items umfasst. Alle Items sind positiv formuliert, sodass keine Umpolungen vorgenommen werden müssen. Beispielitems werden in Tabelle 9.1 angegeben. Tabelle 9.1 Beispielitems zu den selbstberichteten Vorerfahrungen zum mathematischen Modellieren (Klock & Wess, 2018) Skala
Anzahl Items
Itembeispiel
Behandlung mathematischen Modellierens
3
„Mathematische Modellierung hat bereits in einer von mir besuchten Lehrveranstaltung eine Rolle gespielt.“
Lehre und Vorbereitung zum math. Mod.
6
„Ich fühle mich durch meine bisherige Ausbildung auf das Unterrichten mathematischen Modellierens gut vorbereitet.“
Modellierungsaufgaben
3
„Ich habe während meines Lehramtsstudiums schon selbst Modellierungsbeispiele bearbeitet.“
Modellieren im Unterricht
3
„Ich habe bereits mathematische Modellierungen mit Schüler*innen durchgeführt.“
Die erste Skala »Behandlung mathematischen Modellierens« misst, inwieweit mathematisches Modellieren in den hochschulischen Lehrveranstaltungen der Studierenden generell eine Rolle gespielt hat. Dabei wird keine Fokussierung auf bestimmte Aspekte vorgenommen, sodass sowohl fachwissenschaftliche als auch fachdidaktische Veranstaltungen in die Einschätzung mit einfließen. In der zweiten Skala »Lehre und Vorbereitung zum mathematischen Modellieren« wird erfasst, inwieweit die Lehramtsstudierenden auf das Lehren mathematischen Modellierens vorbereitet wurden und sich vorbereitet fühlen. Diese Skala beinhaltet sowohl Items zur Einschätzung, inwieweit die Förderung von Modellierungskompetenzen bei Schülerinnen und Schülern in den bisher absolvierten Lehrveranstaltungen eine Rolle gespielt hat, als auch Items zur Einschätzung der eigenen Fähigkeiten in diesem Bereich. Ob Modellierungsaufgaben bereits in einer anderen Veranstaltung bearbeitet wurden, erfasst die Skala »Modellierungsaufgaben«. Sie liefert einen Eindruck, inwiefern die Studierenden Erfahrungen mit Modellierungsaufgaben gesammelt und Modellierungskompetenzen erworben haben. In dieser Skala können sowohl fachwissenschaftliche als auch fachdidaktische Veranstaltungen zum Skalenwert beitragen. Eine letzte Skala »Modellieren im Unterricht« erfasst, ob bereits Erfahrungen beim Modellieren mit Schülerinnen und Schülern erworben wurden. Dabei wird nicht nur eine Fokussierung auf schulischen Unterricht und schulpraktische Erfahrungen im Rahmen von Praktika vorgenommen. Auch außerschulische Aktivitäten, wie bspw. Erfahrung in der Nachhilfe, werden durch die Skala erfasst.
9.2 Fragebogeninstrument
9.2.2
219
Überzeugungen zum mathematischen Modellieren
Die Überzeugungen zum mathematischen Modellieren werden in Abschnitt 6.3.2 einerseits anhand von globalen Überzeugungen (Törner, 2002) konzeptualisiert, die sich auf Lehr-Lern-Prozesse beziehen. Dabei werden epistemologische Überzeugungen und Überzeugungen zum Lehren und Lernen von Mathematik unterschieden (Woolfolk Hoy et al., 2006). Andererseits leisten lerntheoretische Überzeugungen (Voss et al., 2011), d. h. konstruktivistische und transmissive Überzeugungen, einen Beitrag zur Operationalisierung der Überzeugungen zum mathematischen Modellieren. Die Überzeugungen zum mathematischen Modellieren werden daher von vier Skalen operationalisiert, die anhand einer Strukturgleichungsanalyse auf ihre Eindimensionalität überprüft wurden (Klock et al., 2019; Wess et al., angenommen). Epistemologische Überzeugungen beziehen sich im Allgemeinen auf die Struktur und Genese von Wissen (Buehl & Alexander, 2001) und wurden in Bezug auf den Mathematikunterricht von Grigutsch, Raatz und Törner (1998) über vier Leitvorstellungen von Mathematik operationalisiert: den Formalismus-Aspekt, den Anwendungs-Aspekt, den Prozess-Aspekt und den Schema-Aspekt. Items des Anwendungs-Aspekts (bspw. „Viele Teile der Mathematik haben einen praktischen Nutzen oder einen direkten Anwendungs-bezug.“ (Grigutsch et al., 1998, S. 17)) eignen sich aufgrund ihres Anwendungsbezugs zur Operationalisierung von epistemologischen Überzeugungen in Bezug auf das mathematische Modellieren. Dazu wurde der Begriff »Mathematik« in den Itemformulierungen jeweils durch »mathematisches Modellieren« ersetzt. Die Items erfassen nun, inwieweit dem mathematischen Modellieren ein alltäglicher oder gesellschaftlicher Nutzen beigemessen wird (vgl. Tabelle 9.2). Eine Kürzung der Skala führte schließlich zur Skala »Überzeugungen zur Anwendung mathematischen Modellierens«, die sich aus den Items 3.2, 3.5, 3.12 und 3.15 zusammensetzt (Klock & Wess, 2018, S. 18). Item 3.5 ist negativ gepolt und muss für die Skalierung umgepolt werden. Überzeugungen zum Lehren und Lernen von Mathematik werden in Bezug auf das mathematische Modellieren hinsichtlich unterrichtlicher Zielvorstellungen von Lehrkräften operationalisiert (C. Müller et al., 2008). Es wird die Zustimmung der Probanden zu Aussagen erfasst, die mathematischem Modellieren einen berechtigten Platz im Mathematikunterricht einräumen und die Förderung von Modellierungskompetenzen als wichtig erachten (vgl. Tabelle 9.2). Nach einer Kürzung der Skala bilden die Items 3.1, 3.3, 3.9 und 3.13 die Skala »Mathematisches Modellieren im Unterricht« (Klock & Wess, 2018, S. 18).
220
9
Methoden der Datenerhebung
Tabelle 9.2 Beispielitems zu den Überzeugungen zum mathematischen Modellieren (Klock & Wess, 2018) Skala
Anzahl Itembeispiel Items
Überzeugungen 4 zur Anwendung math. Modellierens
„Viele Aspekte mathematischen Modellierens haben einen praktischen Nutzen oder einen direkten Anwendungsbezug.“
Math. Modellieren 4 im Unterricht
„Mathematisches Modellieren sollte ein Bestandteil von Mathematikunterricht sein.“
konstruktivistische 4 Überzeugungen
„Schüler*innen lernen Mathematik am besten, indem sie selbst Wege zur Lösung von Problemen entdecken.“
transmissive Überzeugungen
„Effektive Lehrpersonen führen die richtige Art und Weise vor, in der ein Anwendungsproblem zu lösen ist.“
4
Zur Erfassung der lerntheoretischen Überzeugungen in ihren konstruktivistischen und transmissiven Ausprägungen wurden vorhandene Items von Staub und Stern (2002) in deutscher Übersetzung verwendet, wie sie in anderer Zusammensetzung auch in der COACTIV-Studie eingesetzt wurden (Baumert et al., 2008; Voss et al., 2011). Items zu konstruktivistischen Überzeugungen repräsentieren Sichtweisen, dass Schülerinnen und Schülern eigene Wege zur Lösung von Aufgaben entdecken, selbständig arbeiten und ihre Lösungsideen diskutieren sollten (vgl. Tabelle 9.2). Items zu den transmissiven Überzeugungen vertreten die Auffassung, dass Lehrpersonen detaillierte Vorgehensweisen vermitteln und selbst bei Anwendungsaufgaben Schemata bereitstellen sollten. Diese Art der Überzeugungen wurden miteinbezogen, da konstruktivistische Überzeugungen einen Zusammenhang mit positiven Überzeugungen zum Modellieren aufweisen und transmissive Auffassungen eher mit negativen Überzeugungen zum Modellieren einhergehen (Kuntze & Zöttl, 2008; Schwarz et al., 2008). Beide Arten von Überzeugungen lassen sich nicht als zwei entgegengesetzte Pole verstehen. Vielmehr sind es nebeneinander liegende negativ korrelierende Konstrukte, wie Voss et al. (2011) empirisch nachweisen. Aus diesem Grund wurden zwei Skalen gebildet. Die gekürzte Skala zu den »konstruktivistischen Überzeugungen« wird anhand der Items 3.3, 3.8, 3.11 und 3.14 gebildet, wohingegen die gekürzte Skala zu den »transmissiven Überzeugungen« anhand der Items 3.6, 3.7, 3.10 und 3.16 gebildet wird (Klock & Wess, 2018, S. 18).
9.2 Fragebogeninstrument
9.2.3
221
Selbstwirksamkeitserwartungen zum mathematischen Modellieren
Die Selbstwirksamkeitserwartungen zum mathematischen Modellieren werden in Abschnitt 6.3.3 anhand von Vorstellungen zur eigenen Wirksamkeit bei der Diagnostik von Leistungspotentialen in mathematischen Modellierungsprozessen konzeptualisiert. Zur Operationalisierung wurden Items entwickelt, die eine Selbsteinschätzung der eigenen Wirksamkeit verlangen, Fähigkeiten von Schülerinnen und Schülern in den Phasen des Modellierungsprozesses (vgl. Abschnitt 2.4.1) und anhand schriftlicher Ergebnisse zu erkennen. Für jede Phase wurde ein positiv und ein negativ gepoltes Item erstellt. In einer faktorenanalytischen Untersuchung bildeten sich zwei eindimensionale Skalen heraus (Klock et al., 2019; Wess et al., angenommen). Beispielitems werden in Tabelle 9.3 dargestellt. Die Items 4.1, 4.4, 4.9, 4.10, 4.13, 4.14, 4.15, 4.16, 4.17, 4.18, 4.21, 4.22 und 4.23 zu den Modellierungsphasen Vereinfachen/Strukturieren, Mathematisieren, Interpretieren und Validieren bilden die Skala der »Selbstwirksamkeitserwartungen zum mathematischen Modellieren« (Klock & Wess, 2018, S. 19 f.), da es sich jeweils um für den Modellierungsprozess spezifische Phasen mit spezifischen diagnostischen Ansprüchen handelt (vgl. Abschnitt 6.3.3). Die Items 4.5, 4.7, 4.8, 4.11, 4.12, 4.19, 4.20 und 4.24 zur Diagnostik schriftlicher Ergebnisse oder zum mathematischen Arbeiten bilden die Skala »Selbstwirksamkeitserwartungen zum mathematischen Arbeiten«, da sich diese empirisch von den Items zu den übrigen Phasen des Modellierungsprozesses abgrenzen (Klock & Wess, 2018, S. 19 f.). Die Items 4.13 bis 4.24 müssen vor der Skalierung aufgrund ihrer negativen Formulierung umgepolt werden. Nicht alle in der Testpublikation enthaltenen Items wurden in die Skalierung miteinbezogen, da sich nicht alle faktoranalytisch zuordnen ließen. Aus diesem Grund ist die obige Aufzählung der Items unvollständig.
Tabelle 9.3 Beispielitems zu den Selbstwirksamkeitserwartungen zum mathematischen Modellieren (Klock & Wess, 2018) Skala
Anzahl Itembeispiel Items
Selbstwirksamkeitserwartungen 13 zum math. Modellieren
„Es fällt mir leicht, die verschiedenen Fähigkeiten der Schüler*innen anhand ihrer Übersetzung der mathematischen Ergebnisse in die Realität zu erkennen.“
Selbstwirksamkeitserwartungen 8 zum math. Arbeiten
„Es fällt mir leicht, die verschiedenen Fähigkeiten der Schüler*innen anhand ihrer Verwendung mathematischer Formeln und Zeichen im Modellierungsprozess zu erkennen.“
222
9.3
9
Methoden der Datenerhebung
Testinstrument
Im Testinstrument werden die Diagnose- und a-priori-Interventionskompetenz im Hinblick auf das Prozessmodell adaptiver Interventionen in mathematischen Modellierungsprozessen erhoben (vgl. Abschnitt 5.3). Die beiden Kompetenzen können nur in Verbindung mit dargestellten Anforderungssituationen gemessen werden, die eine Diagnostik und die Bewertung einer Intervention im situativen Kontext erlauben. Um einen solchen situativen Kontext bei der Messung kognitiver Leistungsdispositionen bereitzustellen, gibt es im Wesentlichen zwei Möglichkeiten: (1.) Die Situation wird mittels einer Videovignette veranschaulicht oder (2.) die Situation wird anhand von Textvignetten beschrieben. Wie in Abschnitt 8.4.1.1 dargestellt, wird die Analyse von Videovignetten als belastender empfunden und stellt aufgrund der Parallelität der Handlungen das kognitiv anspruchsvollere Medium dar (Syring, Bohl, et al., 2015). Die Lehramtsstudierenden in Koblenz werden im Rahmen des Treatments anhand von Videovignetten gefördert und sammeln Erfahrungen in der Analyse und Reflexion von Videovignetten. Im Treatment in Münster und in der Kontrollgruppe kommen keine Videovignetten zum Einsatz. Um einen fairen Gruppenvergleich zu ermöglichen, werden die kognitiv weniger belastenden Textvignetten zur Illustration von Anforderungssituationen verwendet. Die Probanden in Koblenz haben dadurch keinen Vorteil bei der Testbearbeitung durch das Treatment. Ein allgemeines Szenario schafft einen Lehrkontext, der in Ergänzung zu den konkreten Anforderungssituationen allgemeine Informationen zur Sozialform, zur Erfahrung der Lernenden mit Modellierungsaufgaben und ihrem Leistungsniveau, zur Bearbeitungszeit und zu vorherigen Interventionen liefert. Durch diesen Lehrkontext wird den Probanden das Situationswissen (Leiss, 2007) zu den konkreten Anforderungssituationen vermittelt. Die Informationen sind auf einer das Testformat einleitenden Seite abgedruckt (vgl. Abbildung 9.1). Die Anforderungssituationen werden durch Modellierungsaufgaben und zugehörige Textvignetten, sogenannte Aufgabenvignetten, dargestellt, die eine Schülerdiskussion in einer Kleingruppe bei der Bearbeitung der Aufgabe illustrieren. In der finalen Testversion (Klock & Wess, 2018) sind insgesamt sechs Aufgabenvignetten enthalten. Fünf der sechs Modellierungsaufgaben wurden der Literatur entnommen. Dabei handelt es sich um die Aufgaben …
9.3 Testinstrument
223
Sie sind eine Lehrperson an einem Gymnasium und Ihre Schülerinnen und Schüler der jeweils angegebenen Klassenstufe bearbeiten die Aufgabenstellungen im Rahmen eines Kleinprojekts in 3er-Gruppen. Die Schülerinnen und Schüler haben im Vorfeld bereits Erfahrungen mit Modellierungsaufgaben gesammelt. Die dargestellten Situationen finden jeweils in der ersten Hälfte der Bearbeitungszeit statt. Die betrachteten Schülerinnen und Schüler haben für die jeweilige Klassenstufe ein durchschnittliches Leistungsniveau. Sie beobachten die Lernenden bei den - in Ausschnitten - dargestellten Gesprächen. Dabei haben Sie zuvor noch nicht in den Lernprozess eingegriffen.
Abbildung 9.1 Situationswissen zu den Anforderungssituationen (Klock & Wess, 2018)
• • • • •
Stau (K. Maaß & Gurlitt, 2010; vgl. auch Jahnke, 1997), Sicherer Sieg (Blum, Drüke-Noe, Hartung, & Köller, 2010), Milchtüte (Böer, 2018; Danckwerts & Vogel, 2001), Tanken (Blum & Leiss, 2005), Container (Greefrath, 2010b).
Die Modellierungsaufgaben können unterschiedlichen Klassenstufen zugeordnet werden, die bei der jeweiligen Aufgabenstellung mit angegeben werden. Es sind Aufgaben zur sechsten, achten, neunten, zehnten und zwölften Klasse im Testinstrument enthalten. Damit werden Fachinhalte der Sekundarstufe 1 und 2 möglichst breit abgedeckt. Die im Testinstrument verwendeten Modellierungsaufgaben weisen eine geringere Komplexität als die im Treatment verwendeten Aufgaben (vgl. Abschnitt 8.5) auf. Dadurch wird einerseits eine angemessene Testlänge sichergestellt. Auf der anderen Seite liegt der Fokus der Testaufgaben nicht auf der Messung der Modellierungskompetenzen der Probanden. Die Verwendung komplexer Modellierungsaufgaben würde dazu führen, dass nicht vorrangig die Diagnose- und a-priori-Interventionskompetenzen den Testscore bestimmen, sondern im Wesentlichen auch die Modellierungskompetenz der Probanden. Daher muss den Probanden eine leichte Durchdringung der Modellierungsaufgaben ermöglicht werden. Die Stau-Aufgabe (K. Maaß & Gurlitt, 2010) wird im Folgenden zur Illustration der Testitems herangezogen (vgl. Abbildung 9.2). Zu jeder Modellierungsaufgabe wurde eine Schülerdiskussion formuliert, die eine typische Schwierigkeit im Modellierungsprozess illustriert. Es handelt sich also nicht um natürliche, sondern um konstruierte Textvignetten. Wie auch schon bei den im Treatment eingesetzten Textvignetten wird so eine Fokussierung auf eine spezifische Schwierigkeit und eine hohe Informationsdichte gewährleistet.
224
9
Methoden der Datenerhebung
Stau (9. Klasse) Zu Beginn der Sommerferien kommt es oft zu Staus. Christina steckt für 6 Stunden in einem 20 km langen Stau fest. Es ist sehr warm und sie hat großen Durst. Es kursiert das Gerücht, dass ein kleiner Lastwagen die Leute mit Wasser versorgen soll, aber sie hat bisher noch nichts erhalten. Wie lange wird der Lastwagen benötigen, um alle Leute mit Wasser zu versorgen? SCHÜLER 1:
Wir müssten ja eigentlich wissen wie viele Autos überhaupt in dem Stau stehen.
SCHÜLERIN 2: Hä? Stimmt! SCHÜLER 1:
Wie sollen wir dann ausrechnen, wie lange der braucht? Da fehlen doch voll
SCHÜLER 3:
Ja, wir wissen ja auch nicht, wie lange der für jedes Auto braucht.
viele Sachen in der Aufgabe!
SCHÜLERIN 2: Voll die dumme Aufgabe. SCHÜLER 1:
Wir können ja mal die 20 km durch die 6 Stunden teilen, dann wissen wir wie schnell der sein muss.
SCHÜLER 3:
Genau! Mehr haben wir ja eh nicht gegeben.
Abbildung 9.2 Aufgabenvignette Stau (K. Maaß & Gurlitt, 2010)
Zur Messung der Diagnosekompetenz werden geschlossene Items mit Auswahlantworten (Single-Choice-Items) eingesetzt, zur Messung der a-prioriInterventionskompetenz Items mit Alternativantworten (geeignet, ungeeignet). Das geschlossene Itemformat wurde aufgrund seiner Auswertungsobjektivität und zeitökonomischen Testauswertung gewählt (Döring & Bortz, 2016, S. 455). Offene oder halboffene Antwortformate hätten eine Kodierung jeder einzelnen Antwort erfordert, was zu einer geringen Auswertungsobjektivität geführt hätte. Auch ein weiteres sich in der Entwicklung befindendes Testinstrument zur Erhebung von Kompetenzen zum Lehren mathematischen Modellierens verwendet geschlossene Itemformate. Borromeo Ferri (2019) beschreibt ebenfalls die oben genannten Probleme, die offene Itemformate mit sich bringen. Da die vorliegende Arbeit die eher qualitativen Ergebnisse der Vorarbeiten (z. B. Van de Pol et al., 2014) anhand einer quantitativen und möglichst reliablen Erhebung bestätigen möchte (vgl. Abschnitt 8.1), erscheint ein
9.3 Testinstrument
225
geschlossenes Itemformat am geeignetsten. Die geschlossenen Auswahl- oder Alternativantworten wurden hinsichtlich ihres Wahrheitswertes (richtig, falsch) kodiert, sodass im Anschluss eine auswertungsobjektive Kodierung durchgeführt werden konnte (vgl. Abschnitt 10.2.1). In den folgenden beiden Unterkapiteln wird die Operationalisierung der beiden Kompetenzen durch den Leistungstest dargestellt. Testitems zur Aufgabenvignette werden exemplarisch vorgestellt und die theoriebasierte Festlegung des Wahrheitswertes der Antwortalternativen wird an jeweils einem Beispiel illustriert.
9.3.1
Diagnosekompetenz
Die Diagnosekompetenz wird durch die ersten beiden Schritte des Prozessmodells adaptiver Interventionen in mathematischen Modellierungsprozessen – der Identifikation der Modellierungsphase und der Identifikation der Schwierigkeit – charakterisiert (vgl. Abschnitt 5.1). Bei der Identifikation der Schwierigkeit soll der Intervenierende zu einem expliziten Urteil gelangen, um dem Anspruch einer semiformellen Diagnostik gerecht zu werden (Hascher, 2008). Dieses Urteil wird über die Formulierung eines Förderziels operationalisiert, das zur Ableitung der anschließenden Intervention notwendig ist. Da anhand dieser drei Schritte eine diagnostische Grundlage geschaffen wird, operationalisieren sie das erste Kriterium einer adaptiven Intervention (vgl. Abschnitt 3.3.4). Die Diagnosekompetenz wird daher anhand von jeweils drei Items pro Aufgabenvignette operationalisiert. Da sechs Aufgabenvignetten im Testinstrument enthalten sind, besteht die Skala »Diagnose« aus 18 Items. Sie setzt sich aus den Items 7.[1– 6].1, 7.[1–6].2 und 7.[1–6].7 zusammen (Klock & Wess, 2018, S. 27 ff.). Die Skala besteht aus Single-Choice-Items mit vier Antwortmöglichkeiten (Bühner, 2011, S. 117), von denen eine Antwort als richtig zu bewerten ist. Der erste Itemtyp (vgl. Abbildung 9.3) fordert zur Identifikation der Modellierungsphase auf, in der sich die Lernenden im gezeigten Gesprächsausschnitt hauptsächlich befinden. Dies hat den Hintergrund, dass sich Schülerinnen und Schüler bei der kooperativen Bearbeitung von Modellierungsaufgaben nicht zwangsläufig in derselben Modellierungsphase befinden müssen. Die Lernenden können gleichzeitig mehrere Aspekte ansprechen, die unterschiedlichen Modellierungsphasen zugeordnet werden können.
226
9
Methoden der Datenerhebung
In welcher Phase des Lösungsprozesses befinden sich die Schülerinnen und Schüler hauptsächlich? Bitte setzen Sie eine Markierung. Konstruieren/Verstehen Vereinfachen/Strukturieren Mathematisieren Interpretieren
Abbildung 9.3 Beispielitem zur Diagnostik der Modellierungsphase (Klock & Wess, 2018, S. 29)
In der exemplarischen Aufgabenvignette (vgl. Abbildung 9.2) können Aussagen eindeutig der Phase Vereinfachen/Strukturieren zugeordnet werden. Durch Aussagen wie »Wir müssten ja eigentlich wissen wie viele Autos überhaupt in dem Stau stehen.« und »Ja, wir wissen ja auch nicht wie lange der für jedes Auto braucht.« wird ersichtlich, dass die Lernenden relevante und irrelevante Aspekte identifizieren und damit ihr Situationsmodell strukturieren. Diese Tätigkeiten sind der genannten Phase zuzuordnen (vgl. Abschnitt 2.4.1). Die beiden Aussagen »Wie sollen wir dann ausrechnen, wie lange der braucht?« und »Wir können ja mal die 20 km durch die 6 Stunden teilen, dann wissen wir wie schnell der sein muss.« deuten zugleich auf Ansätze einer Mathematisierung hin. Da die Aussagen zur vorherigen Phase überwiegen und selbst Schüler 2 auf die Impulse seiner Mitschüler reagiert, kann hauptsächlich die Phase Vereinfachen/Strukturieren zur Kleingruppenarbeit zugeordnet werden. Die Antwortoption »Mathematisieren« ist an dieser Stelle ein Distraktor, der zu einer hohen Itemschwierigkeit führt. Im Anschluss an die Identifikation der Modellierungsphase müssen die Probanden eine potentielle Schwierigkeit diagnostizieren (vgl. Abbildung 9.4). Da die Modellierungsphase Vereinfachen/Strukturieren identifiziert wurde, kommen typische Schwierigkeiten der Phase des Bildens des Realmodells in Frage. Die einzige Schwierigkeit, die einer Tätigkeit der identifizierten Phase zuzuordnen werden kann, ist »Probleme beim Treffen von Annahmen« (vgl. Abschnitt 2.4.1). Sie lässt sich auch in den empirisch rekonstruierten typischen Schwierigkeiten dieser Phase wiederfinden (vgl. Tabelle 2.4). Anhand der Aussage »Mehr haben wir ja eh nicht gegeben.« wird ersichtlich, dass die Lernenden es nicht gewohnt sind, Annahmen zu treffen. Sie stellen stattdessen Berechnungen anhand der gegebenen Daten an, was zur Lösung der Aufgabenstellung jedoch einen ungeeigneten Ansatz darstellt.
9.3 Testinstrument
227
Diagnostizieren Sie das Problem der Schülerinnen und Schüler bei der Bearbeitung der Aufgabe in dieser Situation. Bitte setzen Sie eine Markierung. Die Lernenden ... ... haben Probleme beim Treffen von Annahmen. ... ziehen einen falschen Schluss aus Ihrem mathematischen Ergebnis. ... haben Probleme beim Verstehen des Kontextes. ... verwenden ein ungeeignetes mathematisches Modell.
Abbildung 9.4 Beispielitem zur Diagnostik der Schwierigkeit (Klock & Wess, 2018, S. 29)
In einem letzten Schritt muss anhand der Diagnose ein Förderziel für die Kleingruppe festgelegt werden (vgl. Abbildung 9.5). Die fehlende Fähigkeit oder Bereitschaft der Lernenden, Annahmen zu treffen, legt das Förderziel »Selbstständige Beschaffung und Bewertung von Informationen« nahe. Um Reihenfolgeneffekte zu vermeiden, wurden die Förderziel-Items jeweils erst nach den Interventionsitems platziert. Dadurch sollte nach Beantwortung des Diagnoseitems ein bloßes Ankreuzen des inhaltlich übereinstimmenden Förderziel-Items vermieden werden. Diese Vorgehensweise schilderten Studierende in Phase 1 der Testentwicklung im Rahmen der qualitativen Pilotierung (vgl. Abschnitt 9.1). Durch die gewählte Platzierung müssen die Probanden zunächst umblättern und die Interventionsitems beantworten. Im Anschluss denken sie erneut über das Förderziel-Item nach, sodass das voreilige Beantworten der Items vermieden wird.
Kreuzen Sie bitte an, welches Förderziel Sie im Anschluss an diese Situation für die Gruppe formulieren würden. Bitte setzen Sie eine Markierung. Selbstständige Beschaffung und Bewertung von Informationen. Kritisches Hinterfragen von Ergebnissen im Modellierungsprozess. Selbstständige Konstruktion mentaler Modelle zu gegebenen Problemsituationen. Sichere Übersetzung vereinfachter realer Situationen in mathematische Modelle.
Abbildung 9.5 Beispielitem zur Festlegung des Förderziels (Klock & Wess, 2018, S. 29)
228
9.3.2
9
Methoden der Datenerhebung
A-priori-Interventionskompetenz
Die a-priori-Interventionskompetenz wurde in Abschnitt 5.2 als die Fähigkeit zur Bewertung von Interventionen anhand der verbleibenden drei Kriterien adaptiver Interventionen (inhaltlich-methodisch angepasst, minimal, selbstständigkeitsorientiert) konzeptualisiert. Dieser Bewertungsprozess basiert auf der diagnostischen Grundlage und führt idealerweise zur Auswahl einer potentiell adaptiven Intervention. Operationalisiert wird die a-priori-Interventionskompetenz über vier Items pro Aufgabenvignette (vgl. Abbildung 9.6). Da sechs Aufgabenvignetten im Testinstrument enthalten sind, besteht die Skala »Intervention« demnach aus 24 Items. Sie setzt sich jeweils aus den Items 7.[1–6].3, 7.[1–6].4, 7.[1–6].5 und 7.[1–6].6 zusammen (Klock & Wess, 2018, S. 27 ff.). Die Items bestehen aus Aussagen, die potentielle Interventionen in der durch die Aufgabenvignette veranschaulichten Situation darstellen. Die Probanden werden dazu aufgefordert potentiell geeignete Interventionen zur selbständigkeitsorientierten Förderung von Modellierungskompetenzen zu identifizieren. Die Skala besteht aus Richtig-Falsch-Items mit den beiden Antwortmöglichkeiten „geeignet“ und „ungeeignet“, von denen eine als richtig bewertet wird.
Markierung bei jeder Intervention.
weiß nicht
Modellierungskompetenzen geeignet sind. Bitte setzen Sie eine
ungeeignet
Situation für eine selbstständigkeitsorientierte Förderung von
geeignet
Kreuzen Sie bitte an, welche der folgenden Interventionen in dieser
„Schätzt zunächst einmal wie lang ein Auto ist.“ „Betrachtet zunächst einmal nur einen Teil des Problems, also bspw. wie viele Autos überhaupt im Stau stehen.“ „Genau, berechnet mal diesen Wert.“ „Überlegt einmal, wie ihr die fehlenden Daten ermitteln könntet.“
Abbildung 9.6 Beispielitems zur a-priori-Interventionskompetenz (Klock & Wess, 2018, S. 30)
Da die Ratewahrscheinlichkeit bei zwei Antwortoptionen 50 % beträgt, wurde die zusätzliche Antwortoption »weiß nicht« mit angegeben. Kennen die Studierenden die Lösung nicht, erhalten sie so eine Antwortalternative und die Anzahl der
9.4 Durchführung der Datenerhebung
229
korrekten Lösungen durch Erraten werden verringert. Alternativ hätte die Ratewahrscheinlichkeit im Rahmen der Skalierung anhand eines 3PL-Modells (vgl. Abschnitt 10.4.2) als zusätzlicher Parameter berücksichtigt werden können. Aufgrund fehlender Modellgeltungstests und der fehlenden spezifischen Objektivität des 3PL-Modells wurde von diesem Ansatz Abstand genommen. Die Antwortkategorie wurde im Pretest pro Item von durchschnittlich 14.63 % (SD = 6.57 %) der Probanden, im Posttest von durchschnittlich 9.18 % (SD = 4.68 %) der Probanden verwendet. Es kann daher davon ausgegangen werden, dass die Antwortkategorie tatsächlich genutzt wurde. Eine Entscheidung, ob eine Intervention geeignet oder ungeeignet ist, wird anhand der übrigen drei Kriterien adaptiver Interventionen getroffen. Die erste Aussage »Schätzt zunächst einmal wie lang ein Auto ist.« wird als nicht adaptiv bewertet. Sie weist zwar eine inhaltlich-methodische Passung zur Schwierigkeit der Lernenden auf (Annahmen treffen; vgl. Abschnitt 9.3.1), sie ist jedoch nicht minimal, da sie stark inhaltlich in den Lösungsprozess eingreift. Sie ist ebenso nicht selbstständigkeitsorientiert, da die Intervention eine große Stärke bzw. Spezifität aufweist (vgl. Abschnitt 3.3.3), d. h. eine direkte und sehr direktive Hilfestellung darstellt. Die zweite Intervention „Betrachtet zunächst einmal nur einen Teil des Problems, also bspw. wie viele Autos überhaupt im Stau stehen.“ kann als potentiell adaptiv bewertet werden. Sie ist inhaltlich-methodisch angepasst, da sie die Schwierigkeit der Lernenden adressiert. Sie ist minimal, da sie keine zusätzlichen Informationen in den Lösungsprozess miteinbringt und sie ist selbstständigkeitsorientiert, da sie wenig direktiv ist. Durch die Aufforderung wird zwar ein Vorschlag für die Weiterarbeit unterbreitet, es wird jedoch nicht vorgegeben, wie die Anzahl der Fahrzeuge zu bestimmen ist. Der Vorschlag, das Problem in Teilprobleme zu zerlegen, stellt ein Beispiel für eine potentiell adaptive strategische Intervention dar, denen in der Literatur ein großes Potential beigemessen wird (vgl. Abschnitt 4.2). Die übrigen Aussagen werden anhand derselben Vorgehensweise bewertet.
9.4
Durchführung der Datenerhebung
Die Datenerhebung wurde jeweils in der ersten und letzten Sitzung der Veranstaltungen als Einzeltest in Gruppen mit einer Größe von bis zu 32 Lehramtsstudierenden durchgeführt. Dabei wurde das komplette Fragebogen- und Testinstrument zur Erhebung der professionellen Kompetenz zum Lehren mathematischen Modellierens eingesetzt (Klock & Wess, 2018). Diese Testvariante erhebt über die hier dargestellten Konstrukte hinaus das Wissen über Modellierungsaufgaben und über
230
9
Methoden der Datenerhebung
Konzeptionen/Dimensionen/Ziele mathematischen Modellierens, welches in der vorliegenden Arbeit nicht untersucht wird. Die Testleitung führte vor der Testung jeweils eine standardisierte Instruktion anhand der in Abbildung 9.7 dargestellten Folie durch, die über den gesamten Testzeitraum gezeigt wurde. Zudem wurden jeweils der Modellierungskreislauf und die Modellierungsphasen anhand eines sehr einfachen Beispiels illustriert. Die Testleitung wies die Probanden an, das Deckblatt des Instruments (Klock & Wess, 2018, S. 15) aufmerksam zu lesen, auf dem sich weitere Informationen zum Hintergrund der Testung und die Zusicherung der Anonymität befinden. Jeder Proband erhielt ein Testheft, zu dessen Bearbeitung außer eines Stifts keine weiteren Hilfsmittel zugelassen waren. Es wurde darauf geachtet, dass eine geringe Lärmbelästigung vorlag und das Instrument in Einzelarbeit ausgefüllt wurde. Während der Testung wurden keine Fragen beantwortet. Die Durchführungsdauer beträgt inklusive Instruktion ca. 70 Minuten. Die maximale reine Bearbeitungszeit für das komplette Fragebogenund Testinstrument beträgt 60 Minuten.
Abbildung 9.7 Instruktionsfolie zum Testinstrument
Zur Auswertung werden die erhobenen Daten der in Abschnitt 8.3 beschriebenen demographischen Merkmale, die selbsberichteten Vorerfahrungen, Überzeugungen und selbstwirksamkeitserwartungen zum mathematischen Modellieren (vgl. Abschnitt 9.2) sowie die adaptive a-priori-Interventionskompetenz (vgl. Abschnitt 9.3) herangezogen. Zur Durchführung der Analysen stehen in der vorliegenden Arbeit aus der EG Münster keine Daten der Überzeugungen und Selbstwirksamkeitserwartungen zum mathematischen Modellieren zur Verfügung. Ein besonderer Fokus der Auswertung liegt für diese Aspekte der professionellen Kompetenz zum Lehren mathematischen Modellierens daher auf der EG Koblenz. Die Evaluation der Veränderung dieser Konstrukte am Standort Münster wird in Wess (in Vorbereitung) dargestellt.
9.4 Durchführung der Datenerhebung
231
In der Kontrollgruppe in Hamburg wurde das Testinstrument als Online-Test absolviert. Die Studierenden erhielten die Instruktionen über ein Online-Portal. Zur Reduzierung der Testlänge bearbeiteten diese Probanden nur drei der sechs Aufgabenvignetten, die zufällig zugeteilt wurden. Die Daten der Probanden aus Hamburg weisen in den Items von je drei Aufgabenvignetten in Pre- und Posttest daher fehlende Werte auf, sogenannte Missings-by-Design. Da zur Skalierung das einfache Rasch-Modell verwendet wird, können für diese Probanden dennoch Fähigkeitsparameter geschätzt werden (vgl. Abschnitt 10.4). Die Kompetenzen wurden bei diesen Probanden durch die geringere Itemanzahl jedoch weniger valide geschätzt. In Tabelle 9.4 sind die Probandenzahlen in den einzelnen Semestern und in den Gruppen an den verschiedenen Standorten dargestellt. Anhand der Daten wird die Stichprobenmortalität bestimmt. Diese kann durch eine eventuelle Positiv- oder Negativselektion zu einer Verzerrung des Treatmenteffekts beitragen (Döring & Bortz, 2016, S. 103). Tabelle 9.4 Probandenzahlen Semester
Gruppe
Koblenz
Münster
Hamburg
Pretest Posttest Pretest Posttest Pretest Posttest WiSe Experimentalgruppe 22 2017/2018 Kontrollgruppe –
21
21
21
–
–
–
20
18
–
–
SoSe 2018 Experimentalgruppe 27
22
14
14
–
–
WiSe Experimentalgruppe 12 2018/2019 Kontrollgruppe –
12
44
41
–
–
–
–
–
49
20
Die Stichprobenmortalität in den Experimentalgruppen und in der Kontrollgruppe Münster ist relativ gering, da zum erfolgreichen Abschluss der fachdidaktischen Seminare eine regelmäßige Teilnahme erforderlich war. Ausschließlich in der EG Koblenz wurden Anwesenheitskontrollen durchgeführt. Die größte Stichprobenmortalität in den Experimentalgruppen ist im Sommersemester 2018 am Standort Koblenz zu verzeichnen, in der 5 von 27 Probanden das Treatment vorzeitig abbrachen. Ausscheidende Probanden brachen das Treatment in den meisten Fällen direkt nach der ersten Sitzung ab, da sie bspw. feststellten, dass die Veranstaltung nicht in ihren Stundenplan passt. Aus diesem Grund ist von keiner Positivselektion in den Experimentalgruppen auszugehen, die den Treatmenteffekt positiv verzerren würde.
232
9
Methoden der Datenerhebung
In der Kontrollgruppe Hamburg liegt eine relativ hohe Stichprobenmortalität vor. Es wurden lediglich 20 der 49 im Pretest erfassten Studierenden auch im Posttest getestet und in die Auswertung miteinbezogen. Dies ist auf die hohe Anzahl fehlender Studierender in den jeweils letzten Seminarsitzungen zurückzuführen. Es kann sich hierbei um eine Positivselektion solcher Studierender handeln, die ein hohes Engagement und eine hohe Lernbereitschaft zeigen. Dadurch könnte es zu einer Überschätzung des Effekts in der Kontrollgruppe kommen, was zu einer Unterschätzung der Effekte in den Experimentalgruppen führen würde. Da die Effekte in den Experimentalgruppen daher konservativ geschätzt werden, ist die hohe Stichprobenmortalität in der Kontrollgruppe als wenig problematisch anzusehen.
Auswertungsmethodik
10
In diesem Kapitel werden die zur Analyse der Daten notwendigen Auswertungsmethoden aufgezeigt. Zunächst werden die allgemeinen Testgütekriterien beschrieben und in Bezug auf das Testinstrument dargestellt (vgl. Abschnitt 10.1). Im folgenden Unterkapitel werden die Kodierung des Fragebogen- und Testinstruments sowie der Umgang mit fehlenden Werten beschrieben (vgl. Abschnitt 10.2). Nach einer kurzen Erläuterung der Charakteristika der klassischen Testtheorie wird die klassische Skalierung der Daten des Fragebogeninstruments dargestellt (vgl. Abschnitt 10.3). Die Daten des Testinstruments werden anhand der probabilistischen Testtheorie skaliert, da die dichotomen Daten im Rasch-Modell zum Vergleich mehrdimensionaler Modelle herangezogen werden. Die für die Durchführung einer klassischen konfirmatorischen Faktorenanalyse notwendige Voraussetzung einer multivariaten Normalverteilung der Items ist aufgrund der dichotomen Daten nicht erfüllt (Bühner, 2011, S. 432). Daher wird auf das Rasch-Modell zurückgegriffen, das sich zur Skalierung dieser Daten eignet. In Abschnitt 10.4 werden die Grundzüge der probabilistischen Testtheorie, das ein- und mehrdimensionale Rasch-Modell, sowie verschiedene Modellgeltungstests erläutert. Schließlich wird die Vorgehensweise bei der Skalierung der Daten des Testinstruments beschrieben. Die Veränderungsanalysen innerhalb der Gruppen werden anhand ein- und zweifaktorieller Varianzanalysen durchgeführt, deren Erläuterung in Abschnitt 10.5 zu finden sind. In Abschnitt 10.6 wird die multiple lineare Regression beschrieben, die sowohl für die Veränderungs- als auch für die Zusammenhangsanalysen herangezogen wird. Nach der Vorstellung des allgemeinen linearen Modells werden lineare Modelle mit Dummy-Variablen zur Durchführung der Veränderungsanalysen beschrieben. Neben den Effekten innerhalb der Gruppen, die anhand der Varianzanalysen bestimmt werden, werden mithilfe der multiplen Regressionen © Der/die Herausgeber bzw. der/die Autor(en), exklusiv lizenziert durch Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2020 H. Klock, Adaptive Interventionskompetenz in mathematischen Modellierungsprozessen, Studien zur theoretischen und empirischen Forschung in der Mathematikdidaktik, https://doi.org/10.1007/978-3-658-31432-3_10
233
234
10
Auswertungsmethodik
die Effekte in den Experimentalgruppen im Vergleich zur Kontrollgruppe und unter Kontrolle des Vorwissens bestimmt. Die Zusammenhangsanalysen werden unter anderem anhand von sogenannten First-Difference-Modellen durchgeführt, die zeitkonstante Störvariablen kontrollieren und nachfolgend erläutert werden.
10.1
Testgütekriterien
Die Testgüte wird insbesondere in Bezug auf die Erfassung der adaptiven a-prioriInterventionskompetenz berichtet, da es sich hierbei um das fokussiert untersuchte Konstrukt handelt. Die Evaluation der Güte des Fragebogeninstruments beschränkt sich auf den Bericht von Kennwerten bei der Skalierung (vgl. Abschnitt 10.3), da die Güte dieser Skalen bereits in Vorarbeiten untersucht wurde (Klock & Wess, 2018; Klock et al., 2019; Wess et al., angenommen). Im Folgenden werden die Haupt- und Nebengütekriterien dargelegt. Die Güte des Testinstruments kann an dieser Stelle nicht in Bezug auf alle Gütekriterien dargelegt werden, da zur Beantwortung von Forschungsfrage 1 eine Dimensionsanalyse durchgeführt wird (vgl. Abschnitt 7.1) und die Skalierung daher ein Bestandteil des Ergebnisteils dieser Arbeit ist (vgl. Kapitel 11). Die Güte des Testinstruments wird daher in diesem Kapitel soweit wie möglich diskutiert und an entsprechender Stelle wird auf den Ergebnisteil verwiesen. Bühner (2011, S. 52) gibt als Hauptgütekriterien die Objektivität, Reliabilität, Validität und Skalierbarkeit eines Testinstruments an. Diese Kriterien sind nicht getrennt voneinander zu betrachten, sondern es besteht eine logische Beziehung zwischen ihnen. Die Objektivität ist eine Voraussetzung für eine reliable Messung und eine reliable Messung ist eine Voraussetzung für die Validität des Instruments (Bühner, 2011, S. 71; Rost, 2004, S. 33). Die Skalierbarkeit des Testinstruments hängt wiederum eng mit seiner Validität zusammen. Objektivität Bei einer objektiven Messung sind die Durchführung und Auswertung der Messung sowie die Interpretation der Testergebnisse unabhängig vom Testleiter (Moosbrugger & Kelava, 2012, S. 8). Es lassen sich drei Arten der Objektivität unterscheiden (Bühner, 2011, S. 59 f.). Zur Sicherstellung der Durchführungsobjektivität darf die Durchführung der Messung nicht zwischen den Messungen variieren. Dazu wird genau festgelegt, unter welchen Bedingungen (z. B. Instruktion, Zeitbegrenzung, Hilfsmittel und Hilfestellungen, …) die Messung durchgeführt wird. In der Studie wurde die
10.1 Testgütekriterien
235
Durchführungsobjektivität durch eine standardisierte Instruktion vor der Testbearbeitung und eine möglichst umfangreiche Kontrolle der Bedingungen der Testung sichergestellt. Sie wird durch die Erhebung zu unterschiedlichen Tageszeiten eingeschränkt. Die Testungen in Münster wurden jeweils um 10:00 Uhr, die Testungen in Koblenz um 16:00 Uhr oder 18:00 Uhr durchgeführt. Zu den verschiedenen Tageszeiten können unterschiedliche kognitive Leistungsfähigkeiten der Probanden für Unterschiede in den Testergebnissen verantwortlich sein. Die Auswertungsobjektivität verlangt, dass die Auswertung der Messung für jeden Probanden unabhängig vom Auswertenden ist. Dazu werden Kodierhandbücher erstellt, die eine objektive Zuweisung von Codes ermöglichen. In der Studie wird sie durch eine Kodieranleitung sichergestellt, die jeder Antwortkategorie einen Code zuweist. Anhand eines Expertenratings wurde der Wahrheitsgehalt der Codes als richtig oder falsch klassifiziert (vgl. Abschnitt 10.2.1). Die Zuweisung der Punkte zu den Codes fand anschließend automatisiert ohne den Einfluss eines Raters statt. Die Interpretationsobjektivität liegt vor, wenn die Interpretation der Messergebnisse unabhängig von der Person ist, die das Ergebnis interpretiert. So ist ein Testergebnis bezüglich eines Referenzwertes für alle Probanden in gleicher Weise als überdurchschnittlich, durchschnittlich oder unterdurchschnittlich einzuschätzen. In der vorliegenden Arbeit ist dieses Objektivitätskriterium nur bedingt relevant, da keine Individualmesswerte betrachtet werden. Individuelle Messwerte können aufgrund einer nicht vorhandenen Normstichprobe lediglich in Bezug auf Gruppenmittelwerte interpretiert werden. Es werden Gruppenvergleiche durchgeführt, die anhand von statistischen Signifikanztests regelgeleitet interpretiert werden. Bei der Interpretation der Effektstärken wird sich an üblichen Richtwerten orientiert (Cohen, 1988). Reliabilität Die Reliabilität ist ein Maß für die Messgenauigkeit eines Instruments und ist unabhängig davon, was gemessen wird. Ist die Objektivität der Messung nicht gewährleistet, ist sie durch systematische Störeinflüsse verzerrt. Dann liegt keine reliable Messung vor. Die Reliabilität ρRel ist grundsätzlich definiert als das Verhältnis der messfehlerfreien Varianz der wahren Werte στ2 der Probanden zur messfehlerbehafteten Gesamtvarianz σx2 der beobachteten Werte (Bühner, 2011, S. 143): ρRel =
στ2 . σx2
236
10
Auswertungsmethodik
Sie gibt an, wie viel Prozent der Messwerte nicht durch Messfehler zustande gekommen sind. Fisseni (1997, S. 124) bezeichnet eine Reliabilität von 0.80 als ausreichend. In der Forschungspraxis wird ein Wert von 0.70 als akzeptabel betrachtet (Moosbrugger & Kelava, 2012), der auch in der vorliegenden Arbeit als Grenzwert für eine akzeptable Messung angesehen wird. Da die Varianz στ2 nicht bekannt ist, wird das Verhältnis in der klassischen Testtheorie anhand der Korrelation paralleler Testversionen geschätzt (Bühner, 2011, S. 144 ff.). In dieser Arbeit wird die innere oder interne Konsistenz der Skalen zur Bestimmung herangezogen. Dabei wird jedes Item als eine eigenständige Testversion betrachtet. Umso höher die Korrelation zwischen den Items ist, umso höher ist die Reliabilität der Messung (Bühner, 2011, S. 60 ff.; Moosbrugger & Kelava, 2012, S. 11 ff.). Als ein Maß für die interne Konsistenz wird der Koeffizient Cronbach’s α bestimmt (Bühner, 2011, S. 166). Die Reliabilitäten der Skalen des Fragebogeninstruments werden klassisch bestimmt und in Abschnitt 10.3 dargestellt. Die Daten des Testinstruments werden hingegen anhand der probabilistischen Testtheorie skaliert. Hier werden zwei Varianten der Reliabilitätsschätzung unterschieden. Die erste Variante orientiert sich an der klassischen Vorgehensweise, bei der die Reliabilität der Messung aus den bestimmten Messwerten bestimmt wird. Die zweite Variante schätzt die Reliabilität aus den latenten Verteilungen der Personenfähigkeiten (Walter & Rost, 2011). Da zum Verständnis dieser Reliabilitätsschätzungen Grundlagen der probabilistischen Testtheorie notwendig sind, werden die Verfahren in Abschnitt 10.4.6 dargestellt. Die Reliabilität des Testinstruments wird im Ergebnisteil in Abschnitt 11.5 berichtet. Sowohl in der klassischen als auch in der probabilistischen Testtheorie werden Reliabilitäten aus Varianzverhältnissen berechnet. Ein entscheidender Nachteil hat dieser Ansatz bei der Arbeit mit Differenzwerten, die aus Messwerten zweier Messzeitpunkte gebildet werden. Die Reliabilität dieser Differenzwerte ist häufig gering, da sowohl der Messfehler des Pre- als auch des Posttests den Messfehleranteil erhöht. Differenzwerte sind doppelt messfehlerbehaftet (Rost, 2004, S. 275). Daraus kann jedoch keineswegs geschlossen werden, dass die Veränderung ungenau bestimmt wurde (Döring & Bortz, 2016, S. 733). Rost (2004, S. 275 f.) zeigt, dass je höher die Korrelation der Messwerte in Pre- und Posttest ist, umso geringer ist die Reliabilität der Differenzwerte. Die Definition der Reliabilität anhand eines Varianzverhältnisses versagt daher bei Differenzwerten, da die Korrelation der Messwerte zwischen den Messzeitpunkten als plausibel anzusehen ist (Döring & Bortz, 2016, S. 734). Aus diesem Grund werden in den Zusammenhangsanalysen Differenzwerte verwendet, deren Messgenauigkeit als ausreichend angesehen werden, wenn die Reliabilitäten zu den einzelnen Messzeitpunkten akzeptabel sind.
10.1 Testgütekriterien
237
Validität Unter der Validität einer Messung versteht man das „Ausmaß, in dem der Test das misst, was er messen soll.“ (Rost, 2004, S. 34; Hervorhebung im Original) Bühner (2011, S. 61) charakterisiert den Begriff der Validität als die Fähigkeit des Testinstruments, eine Aussage über das zu messende Konstrukt zu treffen. Die Reliabilität ist eine Voraussetzung für die Validität einer Messung, da eine sehr ungenaue Messung keine gute Aussage über das Konstrukt trifft. Die Validität der Skalen des Fragebogeninstruments wurde bereits in Vorarbeiten dargelegt (Klock & Wess, 2018; Klock et al., 2019; Wess et al., angenommen). Daher wird im Folgenden ausschließlich die Validität des Testinstruments betrachtet. Hauptsächlich werden drei Arten der Validität unterschieden. Anhand der Inhaltsvalidität wird beurteilt, ob das Testinstrument ausschließlich das operationalisierte Konstrukt misst oder ob auch Überschneidungsbereiche mit anderen Konstrukten erhoben werden. Wird nur das interessierende Konstrukt gemessen, liegt eine valide Messung vor und die Testitems stellen eine repräsentative Auswahl des Itemuniversums dar (Bühner, 2011, S. 61 ff.; Moosbrugger & Kelava, 2012, S. 13 ff.). Die Inhaltsvalidität wird durch eine enge Orientierung am Konstrukt der adaptiven Interventionskompetenz und damit am Prozessmodell adaptiver Interventionen (vgl. Abschnitt 5.3) gewährleistet. Das quantitative fallbasierte Testinstrument bildet das Konstrukt jedoch nicht vollständig ab. Zur Durchführung adaptiver Interventionen sind Fähigkeiten aus dem Kontinuum zwischen kognitiven Leistungsdispositionen und Handlungskompetenzen notwendig (Blömeke et al., 2015). Der Paper-Pencil-Test misst ausschließlich kognitive Leistungsdispositionen und erfasst so den kognitiven Teil der adaptiven Interventionskompetenz, der als adaptive a-priori-Interventionskompetenz bezeichnet wird. Im Rahmen einer rationalen Testkonstruktion (Bühner, 2011, S. 93) wurde sich bei der Itemkonstruktion an den zugehörigen Schritten des idealtypischen Prozessmodells orientiert. Die Items erfassen anhand von sechs verschiedenen Aufgabenvignetten situationsspezifische kognitive Fähigkeiten im Hinblick auf einen Kompetenzbegriff im engeren Sinne (vgl. Abschnitt 2.3.1). Durch das geschlossene Itemformat wird die Inhaltsvalidität eingeschränkt, da die Probanden zwischen vorgegebenen Antwortkategorien wählen, die Antworten jedoch nicht selbst konstruieren müssen. In Bezug auf die adaptive a-priori-Interventionskompetenz als kognitiver Aspekt der adaptiven Interventionskompetenz kann aufgrund einer Erhebung in sechs verschiedenen situativen Kontexten von einer inhaltsvaliden Messung ausgegangen werden. Die Kriteriumsvalidität eines Testinstruments wird anhand von korrelativen Zusammenhängen bemessen, die der Testscore mit externen Kriterien aufgrund des Messanspruchs aufweisen sollte (Bühner, 2011, S. 61 ff.; Moosbrugger &
238
10
Auswertungsmethodik
Kelava, 2012, S. 13 ff.). Sie wird in Abschnitt 14.3 anhand einer Korrelation mit der Abiturnote diskutiert. Anhand der Konstruktvalidität wird beurteilt, ob das Instrument tatsächlich das misst, was es messen soll. Man unterscheidet dabei drei Arten der Konstruktvalidität, die ebenfalls in Abschnitt 14.3 diskutiert werden. Konvergente Validität liegt vor, wenn die Testscores mit Testergebnissen anderer Testinstrumente korrelieren, die dasselbe oder ein verwandtes Konstrukt erheben (Bühner, 2011, S. 61 ff.; Moosbrugger & Kelava, 2012, S. 13 ff.). Sie wird durch Korrelationsanalysen mit den erhobenen konstruktivistischen und transmissiven Überzeugungen untersucht. Aus einer theoretischen Perspektive ist zu erwarten, dass hohe Zustimmungswerte in den konstruktivistischen Überzeugungen mit hohen Diagnose- und a-priori-Interventionskompetenzen einhergehen. Ein konstruktivistisches Lehr-Lern-Verständnis bildet die Grundlage einer selbstständigkeitsorientierten Unterstützung von Modellierungsprozessen (vgl. Abschnitt 3.1). Hingegen ist zu vermuten, dass hohe transmissive Überzeugungen mit geringen Diagnoseund a-priori-Interventionskompetenzen zusammenhängen, da konstruktivistische und transmissive Überzeugungen negativ korrelieren (Voss et al., 2011). Diskriminante Validität liegt vor, wenn die Testscores nicht mit Testergebnissen anderer Testinstrumente korrelieren, die ein anderes Konstrukt messen. Es kann dabei sinnvoll sein, auch ähnliche Konstrukte zu Korrelationsanalysen heranzuziehen, um das gemessene Konstrukt bewusst von diesen abzugrenzen (Bühner, 2011, S. 61 ff.; Moosbrugger & Kelava, 2012, S. 13 ff.). Daher wird die diskriminante Validität durch eine Korrelation mit einem Fachwissenstest (Lung, 2020) beurteilt, um auszuschließen, dass durch das Testinstrument schulrelevantes Fachwissen erhoben wird. Die faktorielle Validität wird anhand von faktorenanalytischen Prüfungen nachgewiesen, die die Homogenität der Skalen nachweisen (Bühner, 2011, S. 61 ff.; Moosbrugger & Kelava, 2012, S. 13 ff.). Sie wird in der vorliegenden Untersuchung anhand eines Vergleichs verschiedener mehrdimensionaler Rasch-Modelle untersucht. Durch die Auswahl des Modells, das die Daten am besten beschreibt, wird die Homogenität der latenten Variablen sichergestellt. Skalierbarkeit Das Gütekriterium der Skalierbarkeit bezieht sich auf die Gültigkeit der Berechnungsvorschrift der Skala. Die berechneten Scores müssen die Merkmalsausprägungen der Probanden und die individuellen Unterschiede adäquat widerspiegeln. Leistungsstarke Probanden müssen durch die Berechnungsvorschrift einen höheren Score erhalten als leistungsschwache Probanden.
10.1 Testgütekriterien
239
In der klassischen Testtheorie liefert die Itemtrennschärfe Informationen darüber, wie viele Informationen ein Item zur Skala beiträgt (Bühner, 2011, S. 67 f.). Sie stellt die Produkt-Moment-Korrelation des Itemscores mit dem Summenscore der übrigen Items dar und wird als part-whole-korrigierte Trennschärfe (Bühner, 2011, S. 172) bezeichnet. Die Trennschärfen der Items des Fragebogeninstruments werden in Abschnitt 10.3 dargestellt. Da die Varianzen der Items abhängig von ihren empirischen Itemschwierigkeiten sind, werden sehr leichte oder schwierige Items aufgrund niedriger Trennschärfen schnell aus dem Test ausgeschlossen (Bühner, 2011, S. 176). Sehr niedrige und hohe Personenfähigkeiten können dann weniger trennscharf voneinander unterschieden werden. Bei dichotomen Items sollte daher der die Trennschärfe korrigierende Selektionskennwert SK zur Itemselektion verwendet werden (Bühner, 2011, S. 176), der auch in der vorliegenden Arbeit zur Anwendung kommt. Im Rahmen der probabilistischen Testtheorie wird der Beitrag jedes Items zur Skala zusätzlich überprüft, indem die Geltung des angewendeten Testmodells untersucht wird (vgl. Abschnitt 10.4.7.1). Lassen sich die Daten durch das Modell beschreiben, kann von einer Skalierbarkeit ausgegangen werden. Die Trennschärfen der Items des Testinstruments und die Überprüfung der Modellgeltung werden im Ergebnisteil (vgl. Abschnitt 11.1) berichtet. Fisseni (1997, S. 124) betrachtet eine Trennschärfe kleiner als 0.30 als niedrig. In verschiedenen Large-Scale-Studien (vgl. bspw. PISA; Adams & Wu, 2002) werden bei Skalierungen anhand der probabilistischen Testtheorie jedoch auch Trennschärfen von 0.20 als akzeptabel angesehen. Demnach wird bei der klassischen Skalierung ein Grenzwert von 0.30 und bei der probabilistischen Skalierung ein Grenzwert von 0.20 angewendet. Nebengütekriterien Verschiedene Nebengütekriterien tragen ebenfalls zur Beurteilung der Testgüte bei, sind jedoch für die Gesamtbeurteilung des Testinstruments von geringerer Bedeutung. Die Normierung eines Instruments ermöglicht die Interpretation der Testergebnisse anhand einer Referenzgruppe, die als Normstichprobe dient (Bühner, 2011, S. 71 f.). Eine Interpretation der individuellen Testscores steht nicht im Fokus der Arbeit, sodass eine Normierung nicht zwingend notwendig ist. Die untersuchte Stichprobe kann als Normstichprobe für zukünftige Untersuchungen dienen, wobei die Stichprobengröße (N = 168) unter der von Bühner (2011, S. 72) vorgeschlagenen Größe von N = 300 Probanden bleibt. Die Vergleichbarkeit des Testinstruments (Bühner, 2011, S. 72) kann aufgrund eines fehlenden parallelen Tests nicht erfüllt werden. Die Ökonomie des Testinstruments (Bühner, 2011, S. 72;
240
10
Auswertungsmethodik
Moosbrugger & Kelava, 2012) liegt vor, da im Verhältnis zu der Vielzahl erhobener Konstrukte eine angemessene Durchführungszeit vorliegt, wenig Material verbraucht wird, das Instrument einfach zu handhaben ist, es als Gruppentest durchführbar ist und eine einfache Auswertung ermöglicht wird. Damit geht auch das Kriterium der Zumutbarkeit einher, da die Probanden nicht übermäßig belastet werden (Bühner, 2011, S. 72; Moosbrugger & Kelava, 2012). Das Gütekriterium der Nützlichkeit bezieht sich auf die praktische Bedeutsamkeit des Testinstruments und den zusätzlichen Nutzen der Testentwicklung (Bühner, 2011, S. 73; Moosbrugger & Kelava, 2012). Die Neuentwicklung rechtfertigt sich vor dem Hintergrund des neu konzeptualisierten Konstrukts und dessen Operationalisierung. Die Testfairness wird anhand einer Untersuchung des Differential Item Functioning evaluiert und im Ergebnisteil berichtet (vgl. Abschnitt 11.4). Es wird überprüft, ob das Instrument gewisse Personengruppen, Männer und Frauen sowie Personen mit hohen und niedrigen Merkmalsausprägungen, systematisch aufgrund unterschiedlicher Itemschwierigkeiten diskriminiert (Bühner, 2011, S. 73; Moosbrugger & Kelava, 2012). Schließlich sollte ein Instrument die Unverfälschbarkeit der Ergebnisse sicherstellen. Dieser Anspruch ist jedoch utopisch, da Probanden prinzipiell immer in der Lage sind das Ergebnis entweder anhand von sozial erwünschtem Verhalten oder dem Erbringen der Minimalleistung zu verfälschen (Bühner, 2011, S. 73). Dieses Kriterium lässt sich zudem schwierig überprüfen.
10.2
Kodierung
Die Kodierung des Fragebogen- und Testinstruments unterscheidet sich aufgrund ihres Itemformats. Wird den Antworten des Fragebogeninstruments lediglich ein Zahlenwert zugeordnet, müssen die Antworten des Testinstruments zusätzlich hinsichtlich ihres Wahrheitsgehalts bepunktet werden.
10.2.1 Kodierung des Fragebogen- und Testinstruments Der Fragebogen erhebt die Konstrukte der selbstberichteten Vorerfahrungen sowie die Überzeugungen und Selbstwirksamkeitserwartungen zum mathematischen Modellieren anhand einer fünfstufigen Ratingskala. Die Antworten der Probanden wurden mit Zahlenwerten von Null für »trifft überhaupt nicht zu« bis Vier für »trifft voll zu« kodiert (Bühner, 2011, S. 217).
10.2 Kodierung
241
Im Testinstrument wurden die Antworten der Probanden in den Single-ChoiceItems zur Messung der Diagnosekompetenz entsprechend der gewählten Antwortalternative mit Zahlenwerten von 1 bis 4 kodiert und in den Richtig-Falsch-Items mit den Zahlenwerten 0 für »ungeeignet«, 1 für »geeignet« und 2 für »weiß nicht« versehen. Bei der Rasch-Skalierung mit der Software ConQuest (Adams, Wu, & Wilson, 2015) wird eine Rekodierung dieser Rohdaten anhand einer Zuweisung der Codes »richtig« (ein Punkt) und »falsch« (null Punkte) zu den Zahlenwerten vorgenommen. Die Antwortalternative »weiß nicht« wird dabei stets als falsche Antwort gewertet. Die Probanden bringen damit zum Ausdruck, dass sie nicht in der Lage sind, das Item zu lösen. Das Einbeziehen der Rohdaten in die Skalierung und die automatisierte Rekodierung durch die Software ConQuest erlauben zusätzlich eine Analyse der Distraktoren, für die ebenfalls Trennschärfen und Itemfunktionen (vgl. Abschnitt 10.4.1) berechnet werden. Für die Rekodierung muss entschieden werden, welche Antwortalternativen in Bezug auf die Aufgabenvignetten als richtig bzw. als falsch zu bewerten sind. Dazu wurde das Testinstrument sechs Forschenden der deutschsprachigen Modellierungscommunity vorgelegt, die die Testitems zunächst unabhängig voneinander lösten. Zur Beantwortung der Items der Skala »Intervention« wurden den Kodierenden die Kriterien adaptiver Interventionen (vgl. Abschnitt 3.3.4) zur Verfügung gestellt, die als Bewertungsmaßstab dienten. Basierend auf den Ratings diskutierten im Anschluss vier der sechs Kodierenden die Items, bei denen nicht alle Antworten übereinstimmten. Einzelne Formulierungen wurden hinsichtlich der Eindeutigkeit der Lösung angepasst, sodass im Rahmen eines Konsensverfahrens der Wahrheitsgehalt der Lösungen (richtig, falsch) festgelegt wurde (Klock & Wess, 2018).
10.2.2 Umgang mit fehlenden Werten In den Daten treten fehlende Werte auf, die in der Auswertung zu berücksichtigen sind. Göthlich (2009) unterscheidet sechs Arten von fehlenden Werten: Bei Unit-Nonresponses weigern sich die Probanden an der Testung teilzunehmen. Dieser Ausfall hat Auswirkungen auf die Rücklaufquote. Ein Unit-Nonresponse trat in der Studie nicht auf, da alle Probanden die Bereitschaft zeigten, die Testung durchzuführen. Bei Item-Nonresponses beantworten die Probanden einzelne Items nicht. Dies ist teilweise der Fall, sodass die Item-Nonresponses im Folgenden näher betrachtet werden. Wave-Nonresponses treten in einer Untersuchung mit mehreren Erhebungswellen auf, bei denen Probanden einzelne Wellen auslassen und an anderen wieder teilnehmen. Da es in der Studie lediglich zwei Erhebungszeitpunkte
242
10
Auswertungsmethodik
gab, können keine fehlenden Werte des Typs Wave-Nonresponse auftreten. Beim Dropout handelt es sich um Probanden, die an späteren Erhebungen nicht mehr teilnehmen (Stichprobenmortalität). Dies trat in gewissen Teilstichproben auf und wird in Abschnitt 9.4 beschrieben. Bei Observation-Nonresponses treten fehlende Werte in zuvor definierten Clustern auf (beispielsweise einer Familie), da bei der Erhebung nicht alle Mitglieder des Clusters erfasst werden können. Solche fehlenden Werte liegen nicht vor, da alle Teilnehmer der Lehrveranstaltungen befragt werden konnten. Schließlich stellen Missing-by-Design-Werte Daten dar, die bewusst nicht erhoben wurden, beispielsweise aufgrund eines Rotationsdesigns. In der Kontrollgruppe Hamburg wurde ein Rotationsdesign angewendet, bei dem die Probanden jeweils drei zufällige Aufgabenvignetten bearbeiteten. In den restlichen drei Aufgabenvignetten liegen fehlende Werte des Typs Missing-by-Design vor, für die im Rasch-Modell jedoch Fähigkeitsparameter geschätzt werden können (Göthlich, 2009). Zu diskutieren sind die fehlenden Werte des Typs Item-Nonresponses. Es können verschiedene sogenannte Fehlendmechanismen (Göthlich, 2009) auftreten, wobei im Wesentlichen drei Typen unterschieden werden (Schafer & Graham, 2002): Missing-Completely-at-Random-Werte (MCAR-Werte) sind zufällig unter den Probanden verteilt und in den beobachteten Daten sind keine Informationen über den Fehlendmechanismus enthalten (z. B.: Ein Proband überliest ein Item). Diese Werte sind unproblematisch, da sie zufällig sind und die Daten nicht verzerren. Sie treten in jeder Untersuchung auf. Missing-at-Random-Werte (MAR-Werte) sind bedingt zufällig, hängen mit einem Merkmal der Probanden zusammen und die beobachteten Daten enthalten Informationen über den Fehlendmechanismus (z. B.: Die Studierenden haben eine geringe Selbstwirksamkeit und beantworten daher die Items nicht). Die MAR-Werte können in der vorliegenden Untersuchung bei der Messung der Diagnose- und a-priori-Interventionskompetenz aufgetreten sein. Eine Berücksichtigung dieser „ignorierbaren Nichtantwort[en]“ (Göthlich, 2009, S. 121) bei der Auswertung der Daten ist aufgrund fehlender gesicherter Verfahren nicht möglich (Göthlich, 2009). Im Fragebogeninstrument ist bei der Messung der Überzeugungen und Selbstwirksamkeitserwartungen zum mathematischen Modellieren ein Auftauchen dieses Fehlendmechanismus wenig wahrscheinlich, da bei der Beantwortung der Items keine Wechselwirkung mit anderen Skalen zu vermuten ist. Missing-Notat-Random-Werte (MNAR-Werte) hängen mit demselben Merkmal zusammen, sind systematisch und die Daten enthalten Informationen über den Fehlendmechanismus (z. B.: Studierende mit geringen Fähigkeiten beantworten die Items nicht, da sie sie nicht lösen können). Sie führen bei einer tatsächlichen Kodierung als fehlende Werte zu einer Verzerrung der Ergebnisse, da beispielsweise Items, die durch den Probanden falsch gelöst werden würden, nicht beantwortet werden. Wie auch
10.3 Klassische Skalierung der Daten des Fragebogeninstruments
243
bei den MAR-Werten ist ein Auftauchen dieser fehlenden Werte zwar im Test, aber weniger im Fragebogeninstrument zu erwarten. Zur Vermeidung von Verzerrungen werden Item-Nonresponses im Testinstrument bei der Skalierung der Diagnose- und a-priori-Interventionskompetenz daher nicht als fehlende Werte, sondern als falsche Antworten kodiert. Somit wird die Kompetenz gemessen, eine richtige Antwort auch tatsächlich geben zu können. Ein Nichtausfüllen eines Items wird eindeutig auf die fehlende Fähigkeit des Probanden zurückgeführt, eine korrekte Antwort zu geben (Brand, 2014, S. 125; Hankeln, 2019, S. 177; Heinrichs, 2015, S. 180). Missing-by-Design-Werte in der Kontrollgruppe Hamburg werden jedoch als fehlende Werte berücksichtigt, da die Probanden nicht die Möglichkeit hatten, ihre Fähigkeiten in diesen Items unter Beweis zu stellen. Item-Nonresponses im Fragebogeninstrument gehen ebenfalls als fehlende Werte in die Skalierung Überzeugungen und Selbstwirksamkeitserwartungen zum mathematischen Modellieren mit ein, da zur Beantwortung dieser Items keine spezifischen Fähigkeiten notwendig sind und es sich daher um MCAR-Werte handelt.
10.3
Klassische Skalierung der Daten des Fragebogeninstruments
Die Konstrukte Überzeugungen und Selbstwirksamkeitserwartungen zum mathematischen Modellieren wurden in Vorarbeiten klassisch skaliert und hinsichtlich ihrer Dimension anhand konfirmatorischer Faktorenanalysen untersucht. Die Überzeugungen zum mathematischen Modellieren stellen ein vierdimensionales, die Selbstwirksamkeitserwartungen zum mathematischen Modellieren ein zweidimensionales Konstrukt dar (vgl. Abschnitt 6.3.4; Klock et al., 2019; Wess et al., angenommen). Aufgrund der Vorarbeiten werden diese Konstrukte auch in dieser Arbeit anhand der klassischen Testtheorie skaliert. Die klassische Testtheorie ist eine Messfehlertheorie, die unsystematische, d. h. zufällig entstandene, Messfehler berücksichtigt. Sie trifft keine Annahmen über die Art und Weise, wie Testergebnisse zustande kommen, sondern geht von vorhandenen Messwerten aus, die eine eindimensionale latente Variable tatsächlich messen (Bühner, 2011, S. 39 ff.). Im eigentlichen begrifflichen Sinne handelt es sich daher um gar keine Testtheorie, da man von einer »per-fiat«-Messung (fiat, lat.: »Es möge sein.«) ausgeht, bei der die tatsächliche Messung eines Konstrukts vorausgesetzt wird. Rost (2004, S. 21) versteht unter einer Testtheorie jedoch genau die Beschreibung des Zusammenhangs zwischen dem Testverhalten und dem zu messenden Konstrukt.
244
10
Auswertungsmethodik
Die klassische Testtheorie hat den Nachteil, dass sie keine Verbindung zwischen dem latenten Merkmal und der Itembeantwortung herstellt. Sie ist eine reine Messfehlertheorie, die auf vorhandene Messwerte angewendet wird. Daraus ergibt sich die Problematik, dass viele Annahmen der klassischen Testtheorie, wie beispielsweise die Unabhängigkeit der Messungen, nur schwierig zu überprüfen sind. Die Kennwerte des Testinstruments sind zudem abhängig von der Stichprobe. Eine Person wird in zwei Testinstrumenten, die dieselbe latente Variable messen, nicht die gleichen Testwerte erhalten. Die Messung ist abhängig von der Anzahl und Schwierigkeit der verwendeten Items. Voraussetzungen, wie die Eindimensionalität des gemessenen Konstrukts, müssen gesondert anhand explorativer und konfirmatorischer Faktorenanalysen überprüft werden (Bühner, 2011, S. 53 ff.). Ein großer Vorteil der klassischen Testtheorie ist jedoch ihre einfache Anwendbarkeit, die sie zu einer der am häufigsten verwendeten Theorien in der empirischen Forschung macht (Bühner, 2011, S. 39). Aus diesem Grund wird sie für die Skalierung der Ratingskalen angewendet, die in der vorliegenden Arbeit nicht fokussiert untersucht werden. Die Ratingskalen werden anhand der Daten aller Versuchsgruppen skaliert. Dabei werden alle Items mit einer part-whole-korrigierten-Trennschärfe kleiner als 0.30 ausgeschlossen. In der Skala »Überzeugungen zum mathematischen Modellieren« verletzt Item 3.5 im Pretest diese Voraussetzung und wird aus der Skalierung ausgeschlossen. Die geringe Passung zur Skala ist vermutlich darauf zurückzuführen, dass es sich um das einzige negativ gepolte Item in der Skala handelt. Zur Beurteilung der Messgenauigkeit in Pre- und Posttest werden in Tabelle 10.1 die internen Konsistenzen als Reliabilitätsschätzer nach Ausschluss des kritischen Items dargestellt. Die selbstberichteten Vorerfahrungen wurden nur im Pretest erhoben. Die transmissiven Überzeugungen im Pretest (α = 0.62) und die konstruktivistischen Überzeugungen im Posttest (α = 0.66) wurden mit einer geringeren Messgenauigkeit gemessen. Die übrigen Reliabilitätskoeffizienten liegen im Bereich von 0.74 bis 0.90 und sind als akzeptabel bis sehr gut zu bezeichnen.
10.4 Probabilistische Testtheorie
245
Tabelle 10.1 Anzahl der Items und Reliabilitäten der Ratingskalen Konstrukt
Skala
Anzahl Items
Reliabilität (Cronbachs α) Pretest
Posttest
Selbstberichtete Vorerfahrungen zum math. Mod.
Behandlung math. Mod.
3
0.88
–
Lehre und Vorbereitung zum math. Mod.
6
0.88
–
Modellierungsaufgaben
3
0.88
–
Math. Mod. im Unterricht
3
0.81
–
konstruktivistische
4
0.75
0.66
transmissive
4
0.62
0.74
zur Anwendung math. Mod.
3
0.74
0.76
zur math. Mod. in der Schule
4
0.83
0.84
zum math. Mod.
13
0.88
0.90
zum math. Arbeiten
8
0.83
0.86
Überzeugungen zum math. Mod.
Selbstwirksamkeits erwartungen zum math. Mod.
10.4
Probabilistische Testtheorie
Im Gegensatz zur klassischen Testtheorie bezieht die probabilistische Testtheorie mit ein, wie beobachtete Antworten durch die Ausprägungen der zu messenden latenten Variablen zustande kommen (Rost, 2004, S. 12). Anhand von manifesten, d. h. direkt beobachteten Itemantworten der Probanden werden Rückschlüsse auf latente, d. h. nicht direkt messbare, Konstrukte gezogen. Die Antworten der Probanden sind voneinander abhängig, da die Ausprägungen quantitativer latenter Variablen – sogenannter Personenfähigkeiten θν einer Person ν – zu manifesten Antwortmustern führen, die diese Rückschlüsse erlauben (Rost, 2004, S. 29). Aus diesem Grund spricht man auch von der Item-Response-Theory. Der Zusammenhang zwischen dem Antwortverhalten und der Personenfähigkeit θν wird hergestellt, indem jedem θν eine Wahrscheinlichkeit p(Xυi = 1) für die richtige Beantwortung des Items i zugeordnet wird. Danach leitet sich der Begriff der probabilistischen Testtheorie ab (Rost, 2004, S. 96).
246
10
Auswertungsmethodik
10.4.1 Itemfunktionen Dieser Zusammenhang zwischen Personenfähigkeit θν und Lösungswahrscheinlichkeit p(Xυi = 1) wird anhand von Testmodellen beschrieben. Das Testmodell beschreibt anhand einer Funktion f(θν ) = p(Xυi = 1) den Verlauf der Lösungswahrscheinlichkeit p(Xυi = 1) für eine kontinuierliche Personenfähigkeit θν . Diese Funktionen bezeichnet man als Item Characteristic Curve oder Itemfunktion. Aus psychologischer Sicht ist es in Bezug auf Kompetenztests plausibel, diese Funktionen als monoton steigend zu definieren, da bei steigender Personenfähigkeit θν auch die Lösungswahrscheinlichkeit p(Xυi = 1) für das Item zunehmen sollte. Auf diese Weise kann im Gegensatz zur klassischen Testtheorie auch die Itemschwierigkeit σi des Items i als Parameter der Funktion f in die Modellierung der Lösungswahrscheinlichkeit miteinbezogen werden. Die Ergebnisse verschiedener Testungen einer Person υ werden dann vergleichbar. Die Gültigkeit der Testmodelle wird anhand von Modellgeltungstests und Modellvergleichen untersucht. Gilt das Testmodell, ist auch die Annahme der lokalen stochastischen Unabhängigkeit (vgl. Abschnitt 10.4.3 und damit der Unabhängigkeit der Messungen erfüllt (Bühner, 2011, S. 57). Welches Testmodell zu wählen ist, hängt in erster Linie von der Beschaffenheit der Daten ab. Die durch das Testinstrument generierten Daten sind dichotom, sodass auf Modelle für dichotome Daten zurückgegriffen wird. Selbst für dichotome Modelle sind eine Vielzahl unterschiedlicher Itemfunktionen möglich. Rost (2004, S. 107) gibt in Bezug auf die Auswahl möglicher Funktionsverläufe drei Kriterien an: • Einfachheit. Das Kriterium der Einfachheit, das für jede Art der Theoriebildung gültig ist, besagt, dass das Modell eine möglichst geringe Komplexität aufweisen sollte. • Vorteilhafte statistische Eigenschaften. Das Modell sollte eine möglichst einfache Schätzung seiner Parameter ermöglichen. • Psychologische Plausibilität. Das Modell sollte für eine möglichst große Zahl an Fragebogen- und Testinstrumente psychologisch plausibel und damit einsetzbar sein. Das einfachste Modell stellt die Modellierung der Lösungswahrscheinlichkeit p(Xυi = 1) durch eine lineare Funktion dar. Diesen Ansatz nutzt die klassische Testtheorie, bei der die Itemfunktionen beispielsweise durch das Modell kongenerischer Messungen (vgl. Abbildung 10.1) beschrieben wird (Rost, 2004, S. 109): p(Xνi = 1) = βi · θν − σi .
10.4 Probabilistische Testtheorie
247
Abbildung 10.1 Modell kongenerischer Messungen der klassischen Testtheorie
Der Parameter σi steht für die Itemschwierigkeit. Zugrunde liegt die Annahme, dass für eine korrekte Beantwortung eines Items i die Personenfähigkeit θν größer sein sollte als die Itemschwierigkeit σi , sodass sie als Differenz θν − σi (Modell tauäquivalenter Messungen) zusammenhängen (Rost, 2004, S. 108). Personenfähigkeit θν und Itemschwierigkeit σi liegen daher auf derselben Skala. Zur Festlegung der Itemschwierigkeit wird gerade der Abszissenwert gewählt, bei dem die Lösungswahrscheinlichkeit p(Xυi = 1) gerade 50 % beträgt, es also gleich wahrscheinlich ist, das Item korrekt oder falsch zu lösen (Rost, 2004, S. 97 f.). Die Itemfunktion in Abbildung 10.1 besitzt somit die Itemschwierigkeit σi = 0. Der Parameter βi gibt die Steigung der Itemfunktion und damit die Trennschärfe des Items an. Sie zeigt an, wie gut das Item zwischen guten und schlechten Personen, also zwischen den Personenfähigkeiten θν , unterscheiden kann (Rost, 2004, S. 98). Mit einer Steigung von βi = 0.25 hat das dichotome Item in Abbildung 10.1 eine akzeptable Trennschärfe (vgl. Abschnitt 10.1). Das Problem dieses klassischen Modells liegt im beschränkten Intervall der Personenfähigkeiten θν (im Beispiel auf das Intervall [−2; 2]). Ein Item kann in diesem Testmodell nie Wahrscheinlichkeiten für alle θν der Probanden angeben, was psychologisch wenig plausibel und insbesondere für dichotome Items problematisch ist. Das zugrundeliegende Problem besteht in der Zuordnung einer psychologisch unbeschränkten Personenfähigkeit zu einem beschränkten Intervall. Die Itemfunktion sollte idealerweise auch für die Personenfähigkeiten in den restlichen Intervallen [−∞; 2] und [2; ∞] Lösungswahrscheinlichkeiten angeben (Rost,
248
10
Auswertungsmethodik
2004, S. 109 f.) und damit alle drei der oben genannten Kriterien erfüllen. Aufgrund der beschriebenen Vorteile der probabilistischen Testtheorie gegenüber der klassischen Testtheorie werden die dichotomen Items zur Messung der adaptiven apriori-Interventionskompetenz probabilistisch skaliert. Geeignete Testmodelle für dichotome Daten werden im Folgenden diskutiert.
10.4.2 Dichotome probabilistische Testmodelle Zur Erfüllung der psychologischen Plausibilität kommen drei Modelle infrage, die sich in ihrer Parameterzahl unterscheiden. Alle Modelle haben gemeinsam, dass sie im mittleren Bereich einen starken Anstieg der Lösungswahrscheinlichkeit p(Xυi = 1) anhand eines näherungsweisen linearen Zusammenhangs unterstellen. Für hohe und niedrige Personenfähigkeiten nähert sich die Itemfunktion asymptotisch den Lösungswahrscheinlichkeiten Null bzw. Eins, sodass für alle Personenfähigkeiten θν eine Lösungswahrscheinlichkeit angegeben werden kann. Solche Itemfunktionen sind psychologisch plausibel (Rost, 2004, S. 115). Das einfachste Modell ist das Rasch-Modell oder auch 1-Parameter-LogisticModel (1PL-Model), das nur den Schwierigkeitsparameter in die Modellierung der Itemfunktion miteinbezieht. Aus diesem Grund haben alle Itemfunktionen denselben Verlauf und sind lediglich auf der Abszisse verschoben (vgl. Abbildung 10.2). Das Birnbaum-Modell oder auch 2PL-Model bezieht zusätzlich den Trennschärfeparameter βi in die Modellierung mit ein. Die Itemfunktionen unterscheiden sich daher nicht nur in ihrer Lage bezüglich der Abszisse, sondern weisen auch unterschiedliche Steigungen im nahezu linearen Bereich auf (vgl. Abbildung 10.3). Das 3PL-Model bezieht einen dritten Parameter, die Ratewahrscheinlichkeit, mit ein, die bei geschlossenen Antwortformaten berücksichtigt werden kann. Für niedrige Personenfähigkeiten konvergiert die Itemfunktion nicht gegen Null, sondern gegen den Betrag der durch das Itemformat vorgegebenen Ratewahrscheinlichkeit (vgl. Abbildung 10.4). Jedes der drei Modelle ist psychologisch plausibel und weist günstige statistische Eigenschaften auf, sodass die Modellparameter anhand gängiger statistischer Verfahren geschätzt werden können. Das Einfachheitskriterium spricht für das Rasch-Modell, das mit den wenigsten Parametern auskommt. Zudem existieren für das Rasch-Modell die meisten gesicherten Verfahren zur Prüfung der Modellgeltung. In den höherparametrischen Modellen sind die Personenfähigkeiten nicht länger unabhängig von der Itemstichprobe, sodass keine spezifische Objektivität vorliegt (vgl. Abschnitt 10.4.3). Im 3PL-Modell ergibt sich darüber hinaus die Schwierigkeit, dass die Parameter nicht länger unabhängig voneinander geschätzt
10.4 Probabilistische Testtheorie
249
werden können (Rost, 2004, S. 135 f.). Aus diesen Gründen wird in der vorliegenden Arbeit das nach seinem Entwickler Georg Rasch (1980) benannte Modell zur Skalierung der Daten verwendet.
Abbildung 10.2 Rasch-Modell (1-Parameter-Logistic-Modell)
Abbildung 10.3 Birnbaum-Modell (2-Parameter-Logistic-Modell)
250
10
Auswertungsmethodik
Abbildung 10.4 3-Parameter-Logistic-Modell
10.4.3 Rasch-Modelle Rasch-Modelle lösen das Problem der Zuordnung einer beschränkten Lösungswahrscheinlichkeit p(Xυi = 1) zu einer unbeschränkten Personenfähigkeit θν durch eine Logit-Transformation der Lösungswahrscheinlichkeiten. Dazu wird ein linearer Zusammenhang zwischen dem Logarithmus des Wettquotienten und der Differenz von Personenfähigkeit θν und Itemschwierigkeit σi hergestellt (Rost, 2004, S. 118): log
p(Xνi = 1) p(Xνi = 0)
= θν −σi .
Der Wertebereich der Personenfähigkeit θν wird dadurch auf das Intervall [−∞; ∞] projiziert. Die Lösungswahrscheinlichkeit p(Xυi = 1) in Abhängigkeit von der Personenfähigkeit θν und der Itemschwierigkeit σi , deren Graphen für verschiedene σi in Abbildung 10.2 dargestellt sind, ergibt sich mithilfe von p(Xυi = 0) = 1 – p(Xυi = 1) durch Umformen zu (Rost, 2004, S. 119): p(Xνi = 1) =
exp(θν −σi ) . 1 + exp(θν −σi )
Da die Differenz von Personenfähigkeit θν und Itemschwierigkeit σi entscheidend ist, lassen sich beide Parameter auf der Abszisse verschieben, ohne dass
10.4 Probabilistische Testtheorie
251
dies die Lösungswahrscheinlichkeit beeinflusst. Daher muss eine der beiden Variablen auf der Abszisse fixiert werden. Dazu kann eine Summennormierung durch Nullsetzen des Mittelwerts der Itemschwierigkeiten oder Personenfähigkeiten vorgenommen werden (Rost, 2004, S. 121). Bei der Berechnung der Itemschwierigkeiten wird in der vorliegenden Arbeit eine Summernormierung in Bezug auf die Personenparameter angewendet, um eine freie Schätzung der Itemparameter zu ermöglichen. Dem Rasch-Modell liegen verschiedene Annahmen zugrunde. Kann die Gültigkeit des Rasch-Modells anhand der Modellgeltungstests nachgewiesen werden, gelten die folgenden Eigenschaften für das untersuchte Testinstrument und in der untersuchten Population. • Suffiziente Statistik. Die Summenscores der Items stellen eine suffiziente Statistik dar, d. h. sie enthalten alle in den Rohdaten vorhandenen Informationen über das Antwortverhalten der Probanden. Die Betrachtung der Antwortmuster einzelner Probanden liefert dann keine zusätzlichen Informationen (Rost, 2004, S. 122). Eine suffiziente Statistik muss die Personenfähigkeiten anhand eines Scores adäquat widerspiegeln. So sollten Personen mit einer hohen Personenfähigkeit auch einen hohen Score erhalten (Strobl, 2010, S. 14 ff.). • Lokale stochastische Unabhängigkeit (Itemhomogenität). Stochastische Unabhängigkeit liegt vor, wenn die Beantwortung eines Items durch einen Probanden unabhängig von der Beantwortung der übrigen Items des Testinstruments ist (Bühner, 2011, S. 493; Strobl, 2010, S. 18). Die lokale stochastische Unabhängigkeit ist ein schwächeres Kriterium und liegt vor, wenn die Antworten der Probanden mit gleicher Merkmalsausprägung nicht korrelieren (Moosbrugger, 2012, S. 229; Strobl, 2010, S. 18). • Spezifische Objektivität (Personenhomogenität). Die Scores, die den Personen durch das Testinstrument zugewiesen werden, hängen nicht von den gelösten Aufgaben ab. Es ist folglich beliebig, ob der Test eher leichte oder eher schwierige Items enthält. Sie gilt lediglich im Rasch-Modell, da sich die Itemfunktionen nicht überschneiden können. Spezifische Objektivität liegt nur dann vor, wenn alle Items für alle Personen dieselbe Itemschwierigkeit besitzen. Man spricht in diesem Zusammenhang von der Stichprobenunabhängigkeit. Sie stellt die lokale stochastische Unabhängigkeit in Bezug auf die Probanden dar. Ob eine Person eine Aufgabe lösen kann, muss unabhängig davon sein, ob andere Personen mit verschiedenen Eigenschafts- oder Fähigkeitsausprägungen die Aufgabe lösen können (Rost, 2004, S. 121 f.; Strobl, 2010, S. 20 ff.).
252
10
Auswertungsmethodik
• Gleiche Trennschärfen. Da die Trennschärfe kein Parameter der Itemfunktion ist, wird für alle Items eine gleiche Trennschärfe angenommen, was zu „parallelen“ Itemfunktionen führt (Rost, 2004, S. 120). Die Summenscores stellen bei Geltung des Rasch-Modells eine suffiziente Statistik dar und korrelieren stark mit den anhand des Testmodells geschätzten Personenparametern θν (r = 0.90 bis 0.95). Daher ist es durchaus gerechtfertigt, die Summenscores als Maß für die Personenfähigkeiten zu verwenden, nachdem die Gültigkeit des Rasch-Modells nachgewiesen wurde. Die geschätzten Personenparameter θν liefern jedoch genauere Messwerte für extreme Fähigkeitsausprägungen (Rost, 2004, S. 122). Daher werden sie in dieser Studie anstatt der Summenscores verwendet.
10.4.4 Mehrdimensionale Rasch-Modelle Häufig besitzen Konstrukte eine mehrdimensionale latente Struktur. In der zugrundeliegenden Theorie adaptiver Interventionen und in der daraus abgeleiteten adaptiven a-priori-Interventionskompetenz werden die Diagnose- und a-prioriInterventionskompetenz unterschieden. Aufgrund der angewandten rationalen Testkonstruktion ist daher zu vermuten, dass die gemessene adaptive a-prioriInterventionskompetenz eine mehrdimensionale latente Struktur aufweist. Über eine solche mehrdimensionale Struktur wird oft hinweggesehen, indem das Konstrukt über eine einzige latente Variable skaliert wird oder die latenten Variablen nach dem sogenannten konsekutiven Ansatz jeweils separat skaliert werden (Adams, Wilson, & Wang, 1997). Wang, Chen und Cheng (2004) zeigen jedoch, dass eine gemeinsame Skalierung unter Berücksichtigung der Korrelationen der latenten Variablen zu einer präziseren und effizienteren Schätzung der Item- und Personenparameter führt. Adams et al. (1997) wiesen in einer Simulationsstudie nach, dass die gemeinsame Skalierung zu besseren Reliabilitäten führt, da Informationen aus allen latenten Variablen verwendet werden. Für Forschungsfrage 1 ist zu klären, wie sich die Struktur der adaptiven a-priori-Interventionskompetenz empirisch beschreiben lässt. Aus diesem Grund werden verschiedene Rasch-Modelle hinsichtlich ihrer Passung zu den Daten verglichen. Um zu entscheiden, welche Modelle empirisch geprüft werden, sind theoretische Vorannahmen über die Struktur des Konstruktes und Überlegungen zur Operationalisierung durch die Testitems notwendig (Hartig & Höhler, 2010). Das einfachste Modell stellt das unidimensionale Rasch-Modell dar, das in den Vergleich miteinbezogen wird. Der Generalfaktor repräsentiert dann das Konstrukt der adaptiven a-priori-Interventionskompetenz (vgl. Abbildung 10.6a).
10.4 Probabilistische Testtheorie
253
Zur Beschreibung der latenten Struktur der adaptiven a-prioriInterventionskompetenz sind eine Vielzahl mehrdimensionaler Modelle möglich. Grundsätzlich werden Between-Item-Modelle und Within-Item-Modelle unterschieden. In Between-Item-Modellen trägt jedes Item zur Messung genau einer latenten Variablen bei (vgl. Abbildung 10.5, links). Die latenten Variablen sind eindimensionale Subskalen des zu messenden Konstruktes, sodass die Multidimensionalität des Testinstruments aufgegriffen wird. Dadurch wird die Berechnung separater Personenfähigkeiten für jede latente Dimension und des Zusammenhangs zwischen den Dimensionen ermöglicht (Adams et al., 1997).
Abbildung 10.5 Mehrdimensionale Item-Response-Theory-Modelle
Aufgrund der theoriebasierten Unterscheidung der Diagnose- und a-prioriInterventionskompetenz scheint ein zweidimensionales Between-Item-Modell zur Beschreibung der Daten geeignet zu sein (vgl. Abbildung 10.6b.). Die latente Dimension »Diagnose« repräsentiert die Diagnosekompetenz, die latente Dimension »Intervention« die a-priori-Interventionskompetenz. Es kommt ebenso ein Modell in Betracht, das die Struktur des Messinstruments berücksichtigt. Die Items erheben die adaptive a-priori-Interventionskompetenz anhand sechs unterschiedlicher Aufgabenvignetten. Es wird daher zusätzlich ein Modell berechnet, bei dem alle Items einer Aufgabenvignette auf einer gemeinsamen Dimension laden. Damit ergibt sich ein sechsdimensionales Between-Item-Modell (vgl. Abbildung 10.6c) für die sechs unterschiedlichen Kontexte. In Within-Item-Modellen tragen Items zur Messung mehrerer latenter Variablen bei (vgl. Abbildung 10.5, rechts). Adams et al. (1997) geben drei Gründe für den Einsatz dieser Modelle an: (1.) Das Testinstrument enthält Items, deren Beantwortung Fähigkeiten mehrerer latenter Variablen verlangt. (2.) Eine Antwort auf ein Testitem wird in Bezug auf mehrere latente Variablen bewertet. (3.) Über verschiedene latente Variablen werden Kompetenzniveaus abgebildet (Adams et al., 1997). Insbesondere Punkt 1 ist in dieser Arbeit von Interesse. Es ist denkbar, dass die Beantwortung
254
10
Auswertungsmethodik
der Testitems durch eine übergreifende latente Variable beeinflusst wird. Walker und Beretvas (2003) ergänzten beispielsweise bei der Skalierung eines Tests zu mathematischen Fähigkeiten eine zweite Dimension für die offenen Aufgabenformate. Die theoretische Annahme bestand darin, dass für diese Items Fähigkeiten zur Kommunikation mathematischer Inhalte eine Rolle spielen und daher bei der Skalierung berücksichtigt werden müssen. Bei der Skalierung der Diagnose- und a-priori-Interventionskompetenz könnte die Lesekompetenz, aber auch die Fachoder Modellierungskompetenz einen Einfluss auf die Beantwortung der Testitems haben, da der Lösungsweg der Lernenden nachvollzogen werden muss. Daher wird auch ein dreidimensionales Within-Item-Modell in den Vergleich miteinbezogen (vgl. Abbildung 10.6d). Sind die Between-Item-Modelle zur Beschreibung von getrennten latenten Dimensionen geeignet, ändert sich in Within-Item-Modellen die Interpretation. Die latenten Dimensionen »Diagnose« und » Intervention« repräsentieren die Kompetenzen, die – zusätzlich – zur Lese-, Fach- oder Modellierungskompetenz notwendig sind, um die Items zu beantworten (Hartig & Höhler, 2010).
Abbildung 10.6 Modelle zur Skalierung der adaptiven a-priori-Interventionskompetenz, a. Generalfaktor-Modell, b. zweidimensionales Between-Item-Modell, c. sechsdimensionales Between-Item-Modell, d. dreidimensionales Within-Item-Modell
10.4 Probabilistische Testtheorie
255
Bei Within-Item-Modellen können kompensatorische und nichtkompensatorische Modelle unterschieden werden (Hartig & Höhler, 2008). In kompensatorischen Modellen können niedrige Personenfähigkeiten in einer latenten Dimension aufgrund der additiven Verknüpfung durch hohe in einer anderen Dimension ausgeglichen werden. In nicht-kompensatorischen Modellen hängen die Lösungswahrscheinlichkeiten von einer multiplikativen Verknüpfung der Personenfähigkeiten ab, sodass Fähigkeiten in beiden latenten Dimensionen notwendig sind, um das Item zu lösen. In diesen Modellen werden höhere Ansprüche an die Kompetenzen der Probanden gestellt. In den meisten Fällen werden kompensatorische Modelle verwendet (Hartig & Höhler, 2010), da nichtkompensatorische sehr hohe Ansprüche an die Stichprobengröße stellen (Babcock, 2011). In der vorliegenden Primärstudie können diese nicht erfüllt werden. Aus diesem Grund werden kompensatorische Modelle berechnet. Die in Abbildung 10.6 dargestellten Modelle werden anhand theoretischer Überlegungen konzeptualisiert und anhand empirischer Daten überprüft. Zur Berechnung wird das in ConQuest 4.0 implementierte Multidimensional Random Coefficients Multinominal Logit Model (Adams et al., 1997) bzw. dessen Spezialfall für dichotome Daten verwendet. Die Lösungswahrscheinlichkeit berechnet sich unter Einbezug mehrerer latenter Dimensionen anhand der folgenden Gleichung (Reckase, 2009, S. 93): p(Xνi = 1) =
exp(ai · θν −σi ) . 1 + exp(ai · θν −σi )
In Ergänzung zur Formel des Rasch-Modells (vgl. Abschnitt 10.4.3) gibt der Vektor ai an, zur Schätzung welcher latenten Dimension Item i einen Beitrag leistet.
10.4.5 Schätzung der Item- und Personenparameter Das beschriebene mehrdimensionale Modell enthält sowohl Itemparameter, die die Schwierigkeit eines Items beschreiben, als auch Personenparameter, die ein Maß für die Kompetenz der Probanden in den latenten Konstrukten sind. Diese werden anhand der erhobenen Daten geschätzt. Dazu wird die Maximum-LikelihoodMethode (ML) angewendet. Die Parameter des Modells werden so bestimmt, dass die Wahrscheinlichkeit der Daten unter der Bedingung des Modells maximal wird. Die Wahrscheinlichkeit der Daten wird anhand der Likelihoodfunktion L bestimmt, die sich aus dem Produkt der Wahrscheinlichkeiten der Antworten zu allen Items i von allen Personen ν ergibt (Rost, 2004, S. 123):
256
10
L=
k N
Auswertungsmethodik
p(Xνi ).
ν=1 i=1
Bei der Bestimmung der Modellparameter können hauptsächlich drei Verfahren unterschieden werden. Die Joint-Maximum-Likelihood-Methode (JML-Methode) schätzt beide Arten von Parametern, die Item- und Personenparameter, gleichzeitig. Dieses Verfahren birgt zwei entscheidende Probleme. Im Gegensatz zu den Itemparametern handelt es sich bei den Personenparametern um sogenannte inzidentelle Parameter, zu deren Berechnung die Informationen nicht beliebig vermehrt werden können. Bei Vergrößerung der Stichprobe kommt je Proband ein weiterer Parameter hinzu. Ein geringes Verhältnis der Anzahl von Item- zu Personenparameter ist daher für die Genauigkeit der Parameterschätzungen und die Modellgeltungstests problematisch (Rost, 2004, S. 125). Daher existieren Verfahren, die die Personenparameter zunächst aus der Likelihoodfunktion herauskonditionieren. Die Conditional-Maximum-LikelihoodMethode (CML-Methode) schätzt die Itemparameter, indem die Wahrscheinlichkeit der Antwortmuster in die Likelihoodfunktion aufgenommen wird. Diese Methode erzeugt optimale Schätzer der Itemparameter. Sie bezieht jedoch nicht alle Daten mit ein, sondern nur die Wahrscheinlichkeit der Antwortmuster (Rost, 2004, S. 310). Die Marginal-Maximum-Likelihood-Methode (MML-Methode) schätzt die Itemparameter, indem zunächst eine Annahme über die Verteilung der Personenparameter getroffen wird. In der Regel wird eine Normalverteilung zugrunde gelegt, wobei das Verfahren hinsichtlich der Verletzung dieser Annahme robust ist. Diese Methode hat den Vorteil, dass die Vielzahl der zu schätzenden Personenparameter durch zwei Verteilungsparameter für die Personenfähigkeiten ersetzt und die Verteilung der latenten Variablen mit geschätzt wird. Dadurch wird eine Überschätzung der Stichprobenvarianz vermieden, da die Varianz der im Modell geschätzten Personenfähigkeiten aufgrund ihrer Messfehlerbehaftung die wahre Varianz stets überschätzt (siehe unten: EAP- und PV-Schätzer; Rost, 2004, S. 127 f.). Zur Skalierung wird daher die in ConQuest (Adams et al., 2015) implementierte MML-Methode verwendet. Nach der Bestimmung der Itemparameter anhand der MML-Methode können die Personenparameter wiederum auf drei verschiedenen Arten bestimmt werden. Die sogenannten Maximum Likelihood Estimates (MLE) werden im Anschluss an das MML-Verfahren anhand der JML-Methode bestimmt, indem die Wahrscheinlichkeit der Daten unter der Bedingung der bereits geschätzten Itemparameter maximiert wird. Der Nachteil dieser Schätzung ist, dass sie nicht konsistent ist, d. h. die Schätzer nähern sich den wahren Werten nur beliebig genau für eine unendlich große
10.4 Probabilistische Testtheorie
257
Zahl an Items. Zudem können für Probanden, die kein oder alle Items richtig gelöst haben, keine Schätzwerte berechnet werden (Rost, 2004, S. 312). Warm (1989) entwickelte dieses Verfahren weiter, indem er anhand des BayesAnsatzes die sogenannten Weighted Maximum Likelihood Estimates (WLE) berechnete. In diesem Verfahren wird nicht die Wahrscheinlichkeit der Daten, sondern der Personenparameter unter der Bedingung der Daten und Itemparameter maximiert. Anhand eines Korrekturterms werden für Probanden, die kein oder alle Items richtig gelöst haben, Personenparameter berechnet und deren Streuung korrigiert. Die WLEs sind die besten Individualschätzer (Hartig & Kühnbach, 2006), da sie die Personenfähigkeiten am genausten bestimmen. Da sie messfehlerbehaftet sind, wird ihre Varianz jedoch überschätzt. Die Verwendung von WLE-Scores stellt eines der Standardverfahren dar (Rost, 2004, S. 313 ff.). Aus den Verteilungsparametern der latenten Personenfähigkeiten, die im Rahmen der MML-Methode genutzt werden, können alternativ sogenannte Expected a Posteriori-Schätzer (EAP-Schätzer) bestimmt werden. Für jeden Probanden wird eine individuelle Verteilung der latenten Personenfähigkeit – eine sogenannte a-posteriori Verteilung – unter der Bedingung der Daten, der Item- und Verteilungsparameter modelliert, deren Erwartungswert den EAP-Schätzer darstellt (Rost, 2004, S. 315). Da die EAP-Schätzer die Streuung der latenten Variablen ignorieren und daher ihre Varianz deutlich unterschätzt wird, wurde die Plausible Values Technik (PV) entwickelt. Aus der individuellen a posteriori Verteilung jedes Probanden werden zufällig mehrere Werte gezogen, um die Varianz der Fähigkeitswerte zu erhöhen (Rost, 2004, S. 316). Dabei werden zusätzliche Informationen über die Probanden (bspw. Geschlecht, Semester, Abiturnote, Praxiserfahrung, …) in einem Hintergrundmodell zusammengefasst und in die Schätzung miteinbezogen. Je besser das Hintergrundmodell spezifiziert ist, desto schmaler sind die individuellen a posteriori Verteilungen der Probanden und desto weniger breit streuen die PVs. Da sie zufällig aus der a posteriori Verteilung gezogen werden, stellen sie – keinesfalls – gute individuelle Schätzer der Personenfähigkeiten dar, jedoch geben sie Populationseigenschaften, wie z. B. Mittelwerte und Varianzen, gut wieder. Die PV-Technik ist geeignet, wenn die Einflüsse von Sekundärmerkmalen in die Schätzung miteinbezogen werden können. Sie wird insbesondere in Large-Scale-Studien wie PISA (OECD, 2017, S. 184) zur Beschreibung von Populationsstatistiken verwendet, da die Schätzungen auf latenter Ebene stattfinden und daher messfehlerbereinigt sind (Hartig & Kühnbach, 2006). Die Berechnung von Personenfähigkeiten anhand der PVs ist in der vorliegenden Arbeit jedoch aus zwei Gründen wenig sinnvoll. Da die Repräsentativität der Stichprobe aufgrund des quasi-experimentellen Designs eingeschränkt ist (vgl.
258
10
Auswertungsmethodik
Abschnitt 8.3), können Populationseigenschaften ohnehin nicht verallgemeinernd beschrieben werden. Daher ist eine Beschreibung der untersuchten Stichprobe anhand von WLE-Scores, die optimale Fähigkeitsschätzer darstellen, sinnvoll. Die Überschätzung der Varianz kann jedoch zu kleineren nicht-signifikanten Ergebnissen im Gruppenvergleich beitragen. Die PV-Technik stellt zudem hohe Anforderungen an die Daten. Das Hintergrundmodell darf keine fehlenden Werte aufweisen, weshalb in Large-Scale-Studien zunächst eine Imputation vorgenommen wird. Da im Hintergrundmodell bereits alle Variablen berücksichtigt werden müssen, die in den späteren Veränderungs- und Zusammenhangsanalysen in statistischen Verfahren verwendet werden, würde dies aufgrund der Vielzahl an Prädiktoren zu einem erheblichen Rechenaufwand führen (Lüdtke & Robitzsch, 2017). Aus diesen Gründen werden in dieser Arbeit WLEs zur Bestimmung der Personenfähigkeiten der Probanden genutzt. Da diese messfehlerbehaftet sind und ihre Varianz überschätzt wird, kann dies zu einer Unterschätzung der Signifikanz der Treatmenteffekte führen. Die Verwendung dieser Personenfähigkeiten führt also zu einer eher konservativen Schätzung der Effekte in der Veränderungsmessung. Monseur und Adams (2009) zeigen jedoch in einer Simulationsstudie, dass die WLEs ab einer Testlänge von 20 Items akzeptable Schätzer darstellen. Die Mittelwerte und individuellen Personenfähigkeiten werden ohnehin korrekt geschätzt, was eine gute Deskription der Eigenschaften der Probanden in der Stichprobe ermöglicht.
10.4.6 Schätzung der Reliabilität Da unterschiedliche Methoden zur Schätzung der Personenparameter existieren, werden auch unterschiedliche Methoden zur Schätzung der Reliabilität angewendet. Die erste Variante orientiert sich am klassischen Reliabilitätsbegriff, nach dem das Verhältnis der Varianz der wahren Werte zur Varianz der beobachteten Werte eine Schätzung der Reliabilität liefert. Alternativ kann dieser Ausdruck anhand der Messfehlervarianz σε2 und Gesamtvarianz σx2 umgeschrieben werden (Walter & Rost, 2011): ρRel = 1 −
σε2 . σx2
In Analogie zum klassischen Reliabilitätsbegriff wird die Messfehlervarianz der Personenparameterschätzung σε2 als Mittelwert der berechneten Messfehlervarianz der WLEs jeder Person bestimmt (Andrich, 1982), sodass anhand der Varianz der
10.4 Probabilistische Testtheorie
259
2 WLEs σWLE eine Berechnung der Reliabilität möglich wird (Adams, 2005; Walter & Rost, 2011):
σε2 . 2 σWLE
ρWLE = 1 −
Da die Messfehlervarianz σε2 der WLEs insbesondere bei kurzen Tests mit weniger als 20 Items überschätzt wird, unterschätzt die WLE-Reliabilität die Messgenauigkeit der Personenparameter (Walter & Rost, 2011). Aus diesem Grund ist die WLE-Reliabilität – insbesondere bei kurzen Tests – wenig aussagekräftig. Nach einer zweiten Variante wird die Reliabilität der Messung anhand der mittleren Varianz der latenten a-posteriori-Verteilungen σa2 posteriori (vgl. Abschnitt 10.4.5) 2 , die die Erwartungsaller Probanden und der Varianz der EAP-Schätzer σEAP werte der a-posteriori-Verteilung darstellen, geschätzt. Man bezeichnet diese Art der Schätzung als EAP-/PV-Reliabilität (Adams, 2005; Walter & Rost, 2011): ρEAP/PV =
2 σEAP 2 σEAP + σa2 posteriori
.
Die Schätzung basiert nicht auf den Messwerten, sondern auf den latenten aposteriori-Verteilungen. Die EAP-/PV-Reliabilität gibt daher Auskunft darüber, inwieweit die Skalierung die Messunsicherheit der latenten Personenfähigkeit reduziert hat (Adams, 2005). Sie ist folglich ein Maß für die Güte des eingesetzten Testinstruments, das anhand der MML-Methode skaliert wird (Walter & Rost, 2011). Die WLE-Reliabilität gibt Auskunft über die Genauigkeit der Messwerte, unterschätzt jedoch die Reliabilität. Die EAP-/PV-Reliabilität bezieht sich auf die Güte des Messinstruments (Walter & Rost, 2011). Aus diesem Grund werden in der Studie beide Reliabilitäten berichtet. Sie können in Anlehnung an die klassischen Richtwerte zur Interpretation von Reliabilitäten interpretiert werden (Moosbrugger & Kelava, 2012).
10.4.7 Prüfung der Modellgeltung Die Schätzung von Personenparametern kann nur dann sinnvoll erfolgen, wenn das Rasch-Modell in der Population gilt. Dazu können verschiedene Verfahren angewendet werden, wobei kein Verfahren diese Frage abschließend beantworten kann. „Die Frage, ob ein Testmodell auf die Daten passt, ist genauso wenig
260
10
Auswertungsmethodik
mit ´ja´ oder ´nein´ zu beantworten, wie die Frage, ob eine Theorie wahr oder falsch ist.“ (Rost, 2004, S. 330; Hervorhebung im Original) Die Modellgeltung wird daher am besten im Vergleich mit anderen Modellen beurteilt. Verfahren zur Überprüfung der Modellgeltung und der in Abschnitt 10.4.3 beschriebenen Annahmen des Rasch-Modells lassen sich in Verfahren zur Überprüfung der Itemhomogenität, Personenhomogenität und globale Modellgeltungsverfahren differenzieren (Rost, 2004, S. 345).
10.4.7.1 Prüfung der Itemhomogenität Liegt Itemhomogenität vor, erfassen alle Items dieselbe Personeneigenschaft. Die Homogenität kann über Abweichungsmaße bestimmt werden, die für jedes Item berechnet werden (Rost, 2004, S. 351). Um zu beurteilen, mit welcher Qualität die Itemfunktion (vgl. Abschnitt 10.4.1) die Daten beschreibt, werden die Residuen jedes Items betrachtet. Dazu werden die Differenzen zwischen den durch die Itemfunktion vorhergesagten Lösungswahrscheinlichkeiten und den tatsächlich eingetroffenen Ereignissen (richtig = 1, falsch = 0) quadriert und anhand der Varianz der Residuen in der Stichprobe standardisiert. Durch die Bildung eines Mittelwertes erhält man das mittlere standardisierte und quadrierte Residuum oder auch den Standardized Mean Square (MNSQ), der als Outfit bezeichnet wird (Bond & Fox, 2015, S. 268 f.). Es ist üblich, die Residuen stärker zu gewichten, bei denen eine sehr genaue Messung vorliegt. Liegen der Item- und Personenparameter auf der gemeinsamen Skala nahe beieinander, unterscheidet der Test zuverlässig gute von schlechten Probanden und liefert für die Personenfähigkeit des Probanden einen genauen Schätzer. Werden die Residuen anhand ihrer Varianz gewichtet, wird der gewichtete Mittelwert der quadrierten standardisierten Residuen gebildet, die Weighted Mean Squares (WMNSQ), die auch als Infit bezeichnet werden (Bond & Fox, 2015, S. 268 f.). Die so berechneten Fit-Statistiken werden in eine χ2 -Statistik transformiert und durch die Anzahl der Freiheitsgrade des Modells dividiert. Die so berichteten Werte haben den Erwartungswert 1. Ein Wert von 1 + x gibt an, dass x % mehr Varianz in den Daten vorhanden ist als durch das Rasch-Modell vorhergesagt wird. Man spricht in diesem Fall von einem Underfit, der eine zu geringe Steigung bzw. Trennschärfe der Itemfunktion anzeigt (Rost, 2004, S. 374; Wilson, 2005, S. 128 f.). Ein Wert von 1 – x gibt an, dass x % weniger Varianz in den Daten vorhanden ist als durch das Rasch-Modell vorhergesagt wird (Bond & Fox, 2015, S. 269). Dies bezeichnet man als Overfit, eine „seltsame Art der Modellverletzung“ (Rost, 2004, S. 374), da die Itemfunktion zu gut zu den Daten passt. Ein Overfit zeigt eine zu große Trennschärfe der Itemfunktion an (Rost, 2004, S. 374; Wilson, 2005, S. 128 f.). Bond und Fox (2015, S. 273) geben als strengstes Beurteilungskriterium ein Intervall von [0.8;
10.4 Probabilistische Testtheorie
261
1.2] an, welches auch in den PISA-Studien zur Itemselektion angewendet wird (Adams & Wu, 2002, S. 105). Werden die Fit-Statistiken hingegen durch eine zTransformation in standardnormalverteilte Größen transformiert, kann überprüft werden, ob die Vorhersage des Modells signifikant von den Daten abweicht. In der Software ConQuest werden t-Werte ausgegeben (vgl. Abschnitt 10.6.2), wobei Werte kleiner als −1.96 oder größer als 1.96 eine signifikante Abweichung auf dem 0.05-Niveau anzeigen (Rost, 2004, S. 373 f.). Zur Beurteilung der Items werden in dieser Arbeit die Infit-Statistiken herangezogen, da sie die Residuen genauer Schätzer stärker gewichten. Da die t-Werte von der Stichprobengröße abhängen, werden sowohl die χ2 -Statistiken als auch die t-Werte interpretiert. Wilson (2005, S. 129) empfiehlt, nur solche Items aus der Analyse auszuschließen, die in beiden Statistiken die oben angegebenen Grenzwerte verletzen.
10.4.7.2 Prüfung der Personenhomogenität Personenhomogenität liegt vor, wenn das Testinstrument bei allen Probanden dieselbe Fähigkeit misst. Wird die Beantwortung der Testitems bei bestimmten Personengruppen durch andere Konstrukte beeinflusst, stellt dies eine Verletzung der Personenhomogenität dar. Man überprüft dies, indem man die Itemschwierigkeit in unterschiedlichen Gruppen der Stichprobe getrennt schätzt und miteinander vergleicht. Liegen in den Gruppen unterschiedliche Itemschwierigkeiten vor, werden auch unterschiedliche Konstrukte gemessen, sodass keine Personenhomogenität vorliegt. Dies bezeichnet man als Differential Item Functioning. Zur Teilung der Stichprobe müssen Hypothesen darüber vorliegen, welche Gruppen sich hinsichtlich der Bearbeitung des Testinstruments unterscheiden. Übliche Teilungskriterien stellen der Summenscore und das Geschlecht der Probanden dar (Rost, 2004, S. 347 ff.). Nach der Schätzung werden die Itemparameter jedes Items in ein Koordinatensystem eingetragen, wobei die Achsen die Itemschwierigkeiten in der jeweiligen Gruppe repräsentieren. Liegen die Punkte nahe der Winkelhalbierenden des ersten und dritten Quadranten liegt Personenhomogenität vor. Dabei handelt es sich um den graphischen Modelltest, der einen ersten Eindruck über die Unterschiedlichkeit der Itemparameter liefert (Rost, 2004, S. 348). Die Software ConQuest (Adams et al., 2015) überprüft den Haupteffekt der Gruppenzugehörigkeit auf die Itemschwierigkeit, der die mittlere absolute Differenz der Itemschwierigkeit zwischen den Gruppen anzeigt. Der Haupteffekt weist jedoch keine Personeninhomogenität nach (Pohl & Carstensen, 2012; Wu, Adams, Wilson, & Haldane, 2007, S. 82). Für jedes Item wird daher eine Interaktion zwischen der Itemschwierigkeit und der Gruppenzugehörigkeit berechnet. Dies ermöglicht den Nachweis von Personeninhomogenitäten, da für jedes Item eine
262
10
Auswertungsmethodik
unterschiedliche Itemschwierigkeit in den Gruppen berechnet wird. Ob die Interaktion signifikant ist, wird anhand von standardnormalverteilten t-Werten überprüft (vgl. Abschnitt 10.5.1). Eine Differenz der Itemschwierigkeiten von 0.4 bis 0.6 Logits zwischen den Gruppen wird als nicht ernsthaft beachtenswert, eine Differenz von 0.6 bis 1 Logits als beachtenswert und eine Differenz größer als 1 Logit als kritisch angesehen (Pohl & Carstensen, 2012, S. 14), die zum Ausschluss des Items führt.
10.4.7.3 Prüfung der globalen Modellpassung Zur Beantwortung von Forschungsfrage 1 muss überprüft werden, welches der spezifizierten Modelle die Daten am besten beschreibt. Die globale Passung eines Rasch-Modells zu den Daten lässt sich anhand des Maximums der Likelihoodfunktion L (vgl. Abschnitt 10.4.5) vergleichend beurteilen. Die logarithmierte und mit dem Faktor –2 multiplizierte Likelihoodfunktion bezeichnet man als Log-Likelihood oder Devianz D (Field, 2013, S. 763): D = −2 · log(L). Muss für eine gute Modellpassung das Maximum der Likelihoodfunktion L möglichst groß sein, so muss die Devianz aufgrund des Logarithmierens betragsmäßig möglichst klein sein. Die Devianz des Modells wird von der Software ConQuest (Adams et al., 2015) nach der Maximierung der Likelihoodfunktion als Final Deviance ausgegeben. Sie wird verwendet, um die Wahrscheinlichkeiten der Daten unter der Bedingung verschiedener Modelle miteinander zu vergleichen. Dazu wird die Differenz der Devianzen gebildet, die zum sogenannten Likelihood-Quotienten umgeschrieben werden kann:
L0 D0 − D1 = −2 · (log(L0 ) − log(L1 )) = −2 · log . L1 Unter bestimmten Bedingungen folgt der Likelihood-Quotient einer χ2 -Verteilung, sodass ein Signifikanztest, der sogenannte χ2 -Differenz-Test, berechnet werden kann. Dazu müssen drei Kriterien erfüllt sein (Geiser, 2010, S. 60; Rost, 2004, S. 332): 1. Das Modell L1 ist ein echtes Obermodell des Modells L0 , d. h. Modell L0 lässt sich anhand von Parameterrestriktionen durch Modell L1 darstellen. 2. Das restriktivere Modell L0 geht nicht durch Null- oder Eins-Setzen aus dem Obermodell L1 hervor.
10.4 Probabilistische Testtheorie
263
3. Die Modellgültigkeit des Obermodells L1 ist bereits nachgewiesen worden. Das Generalfaktor- und das zweidimensionale Between-Item-Modell (vgl. Abbildung 10.6a und b in Abschnitt 10.4.4) stellen „nested-factor model[s]“ (Mulaik & Quartetti, 1997) bzw. geschachtelte Modelle des sechsdimensionalen BetweenItem-Modells (vgl. Abbildung 10.6c) dar. Dabei handelt es sich um ein echtes Obermodell der zwei Modelle. Diese gehen jedoch durch Eins-Setzen der Korrelationen zwischen den Dimensionen aus dem sechsdimensionalen Between-ItemModell hervor, sodass Bedingung (2.) nicht zutrifft. Aus diesem Grund dürfte für diese Modelle streng genommen kein Signifikanztest durchgeführt werden, da die Verteilung des Likelihood-Quotienten unbekannt ist. In der Forschungspraxis werden häufig dennoch eine χ2 -Verteilung unterstellt und ein Differenztest berechnet (Brown, 2006, S. 163). Daher wird der χ2 -Differenz-Test auch in dieser Arbeit durchgeführt, jedoch wird er nicht als alleiniges Entscheidungskriterium herangezogen. Bedingung (3.) wird vernachlässigt, da keine absolute Modellgültigkeit festgestellt werden soll, sondern diese im Vergleich mit anderen theoretisch plausiblen Modellen überprüft wird. Das dreidimensionale Within-Item-Modell (vgl. Abbildung 10.6d) ist weder ein Obermodell noch stellt es ein geschachteltes Modell der übrigen Modelle dar. Daher kann kein χ2 -Differenz-Test durchgeführt werden. Die Devianz wird jedoch für einen deskriptiven Vergleich herangezogen. Die Korrelationen zwischen den Dimensionen der mehrdimensionalen Modelle werden ebenfalls zum Modellvergleich genutzt. Korrelieren zwei Dimensionen sehr stark (> 0.95), weist dies auf ein gemeinsames Konstrukt hin, sodass beide Dimensionen zusammengelegt werden sollten (Pohl & Carstensen, 2012). Eine niedrige Korrelation weist daraufhin, dass es sich um verschiedene Konstrukte handelt. Zum Vergleich von Modellen, die nicht durch Parameterrestriktionen auseinander hervorgehen, wurden verschiedene informationstheoretische Maße entwickelt, die anhand der Devianz, der Parameterzahl und teilweise der Stichprobengröße einen Modellvergleich ermöglichen. Der älteste Informationsindex bezieht lediglich die Devianz D und die Parameteranzahl np des Modells mit ein und wird nach seinem Erfinder als Akaikes Information Criterion (AIC) bezeichnet (Rost, 2004, S. 340): AIC = 2 · np − 2 · log(L). Der AIC beurteilt die empirische Passung des Modells anhand der Likelihoodfunktion L und die Einfachheit des Modells (vgl. Abschnitt 10.4.1) anhand der Parameteranzahl np in gleicher Gewichtung. Dabei wird nicht angenommen, dass das wahre Modell, das die Realität perfekt abbildet, unter den zu vergleichenden
264
10
Auswertungsmethodik
Modellen enthalten ist, sondern die Modelle werden anhand von vorhergesagten Werten beurteilt (Kuha, 2004). Insbesondere bei einer großen Anzahl von Items und Probanden ist es sinnvoll, dem Einfachheitskriterium einen größeren Stellenwert beizumessen, da durch zusätzliche Modellparameter aufgrund der größeren Zahl an Freiheitsgraden ein besserer Modellfit erreicht werden kann. Aus diesem Grund gewichtet das sogenannte Bayesian Information Criterion (BIC) die Parameteranzahl np mit dem Logarithmus der Stichprobengröße N, der für N > 7 stets größer als 2 ist (Rost, 2004, S. 342). Das BIC identifiziert das Modell mit der höchsten Wahrscheinlichkeit das wahre Modell zu sein, unter der Bedingung, dass das wahre Modell unter den betrachteten Modellen zu finden ist (Kuha, 2004): BIC = log(N) · np − 2 · log(L). Das BIC ist dem AIC überlegen, wenn das wahre Modell unter den zu vergleichenden Modellen enthalten ist (Kuha, 2004) und eine große Itemanzahl sowie Antwortmuster mit geringen Häufigkeiten vorliegen (Rost, 2004, S. 344). Für das AIC besteht die Gefahr, dass es große Modelle mit vielen Parametern bevorzugt annimmt, sodass es für kleine Itemanzahlen und Antwortmuster mit großen Häufigkeiten geeignet ist (Rost, 2004, S. 344). Es ist zudem besser geeignet, wenn das wahre Modell nicht im Vergleich enthalten ist (Kuha, 2004). Der große Vorteil der informationstheoretischen Maße besteht darin, dass sie auch auf nicht geschachtelte Modelle angewendet werden können. Es ist sinnvoll zum Vergleich beide Indizes heranzuziehen, da einer der beiden Indizes nicht als grundsätzlich besser angesehen werden kann. Sie unterscheiden sich in ihrer Annahme über die Existenz des wahren Modells unter den zu vergleichenden (Burnham & Anderson, 2004; Kuha, 2004). Es sagt etwas über die Güte eines Modells aus, wenn beide Indizes auf eine bessere Modellpassung hinweisen. Liefern die Kriterien verschiedene Aussagen über favorisierende Modelle, sollte nach weiteren gesucht werden, die beiden Kriterien genügen (Kuha, 2004). Es werden jeweils beide Indizes beim Vergleich der Modelle berücksichtigt.
10.4.8 Probabilistische Skalierung der Daten des Testinstruments Im Folgenden wird die Vorgehensweise bei der Skalierung der Daten anhand der in Abschnitt 10.4.4 dargestellten Modelle beschrieben. Sie wird anhand der folgenden Schritte durchgeführt (Hankeln, 2019, S. 204; Roeling, 2015, S. 85):
10.4 Probabilistische Testtheorie
265
1. Berechnung der ein- und mehrdimensionalen Modelle (Ansatz virtueller Personen, Summennormierung in Bezug auf Personenparameter), 2. Modellentscheidung anhand der globalen Modellprüfungen, 3. Prüfung der Item- und Personenhomogenität, 4. Berechnung der Personenparameter (Ansatz virtueller Items, keine Summennormierung) und Reliabilitätsprüfung. In Schritt 1 wird zur Berechnung der Modelle der Ansatz virtueller Personen nach Hartig und Kühnbach (2006) angewendet. Dazu werden die Daten des Posttests als eigene Fälle, sogenannte virtuelle Personen, mit den Daten des Pretests in eine gemeinsame Datenmatrix eingefügt, sodass sich die Stichprobengröße verdoppelt (N = 338; vgl. Abbildung 10.7). Diese Vorgehensweise hat den Vorteil, dass für die Testitems in Pre- und Posttest dieselben Schwierigkeitsparameter geschätzt werden. Wright (2003) empfiehlt diese Vorgehensweise bei der Bestimmung von Veränderungen in den Personenfähigkeiten. Paarweise Abhängigkeiten zwischen den Probanden werden jedoch nicht berücksichtigt. Starke Abhängigkeiten zwischen Messwerten, die das Modell nicht vorhersagt, führen zu einer geringeren Modellpassung, kleineren Reliabilitäten und geringeren Differenzen zwischen den Messzeitpunkten. Umgekehrt führen starke Abhängigkeiten zwischen Messwerten, die das Modell gut vorhersagt, zu einer größeren Modellpassung, besseren Reliabilitäten und größeren Differenzen zwischen den Messzeitpunkten (Wright, 2003). Zur Berücksichtigung von Abhängigkeiten werden die Personenparameter daher in Punkt 4 anhand des Ansatzes virtueller Items berechnet.
Abbildung 10.7 Ansatz virtueller Personen nach Hartig & Kühnbach (2006, S. 34). (Abgedruckt mit Genehmigung von Springer Nature: Veränderungsmessung und Längsschnittstudien in der empirischen Erziehungswissenschaft von A. Ittel und H. Merkens; © 2006 VS Verlag für Sozialwissenschaften.)
266
10
Auswertungsmethodik
Die Modelle werden anhand des Marginal-Maximum-Likelihood-Verfahrens geschätzt. Wie von Wu et al. (2007) empfohlen, wird zur Schätzung von bis zu zweidimensionalen Modellen die Gauss-Quadratur zur Berechnung von Integralen angewendet. Nach der schrittweisen Steigerung der Knoten tritt bei 40 Knoten pro Dimension keine Verkleinerung der Devianz mehr ein, sodass diese Knotenzahl verwendet wird. Zur Berechnung von höherdimensionalen Modellen empfehlen Wu et al. (2007) die Verwendung des Monte-Carlo-Schätzverfahrens bei der Berechnung der Integrale. Hier wird die maximal sinnvolle Gesamtzahl von 5000 Knoten verwendet. Da zur Bestimmung des Within-Item-Modells eine Summennormierung in Bezug auf die Personenparameter notwendig ist (Wu et al., 2007, S. 105), wird diese Art der Normierung bei allen Modellen angewendet. Dies hat zudem den Vorteil, dass alle Itemparameter frei geschätzt werden. Für den Modellvergleich werden zunächst keine Items aus der Berechnung ausgeschlossen. Dadurch wird verhindert, dass gewisse Modelle aufgrund des Ausschlusses schlecht passender Items einen besseren Fit erzielen. In Schritt 2 werden die Modelle anhand der WMNSQ der Items, ihrer Devianz und der informationstheoretischen Indizes AIC und BIC verglichen. Es wird das Modell ausgewählt, bei dem die WMNSQs in der Nähe des Erwartungswerts 1 liegen und die Devianz sowie die informationstheoretischen Indizes am kleinsten sind. Zusätzlich wird, soweit möglich, der χ2 -Differenz-Test interpretiert. Das am besten passende Modell wird zur Skalierung der Daten ausgewählt. In Schritt 3 wird die Personen- und Itemhomogenität überprüft. Anhand der klassischen Itemstatistiken wird zunächst mithilfe des Selektionskriteriums beurteilt, inwiefern ein Item für den Score der Skala bedeutsam ist (vgl. Abschnitt 10.3). Die Korrelation der Distraktoren mit der Skala sollten klein – idealerweise negativ – sein, da als falsch bewertete Antwortkategorien nichts zu einem hohen Skalenwert beitragen sollten. Wie auch bei der IRT-Skalierung der PISA-Daten (Adams & Wu, 2002, S. 105) und in weiteren Forschungsarbeiten (vgl. bspw. Brand, 2014; Hankeln, 2019; Pohl & Carstensen, 2012) werden abweichend zur Vorgehensweise bei der klassischen Skalierung (vgl. Abschnitt 10.3) Items mit einem Selektionskriterium (vgl. Abschnitt 10.1) kleiner als 0.20 und mit Punkt-biseralen Korrelationen der Distraktoren mit dem Score der Skala größer als 0.05 aus der Rasch-Skalierung ausgeschlossen. Diese Vorgehensweise wird angewendet, da die Trennschärfe ein zentrales Gütekriterium für quantitative Testinstrumente darstellt (Rost, 2004, S. 369 f.). So werden Items mit geringer Qualität aus der Skalierung ausgeschlossen, bevor im Rasch-Modell die Trennschärfen aller Items als gleich angenommen werden (vgl. Abschnitt 10.4.3).
10.4 Probabilistische Testtheorie
267
Die Itemhomogenität wird sichergestellt, indem Items mit WMNSQs außerhalb des Intervalls [0.8; 1.2] und einem t-Wert |T| > 1.96 aus der Skalierung ausgeschlossen werden. Die Personenhomogenität wird anhand des Differential Item Functioning untersucht. Items, deren Itemschwierigkeiten sich um mehr als einen Logit unterscheiden, werden ebenfalls aus der Skalierung ausgeschlossen. Nach dem Ausschluss kritischer Items wird die Modellberechnung (Ansatz virtueller Personen, Summennormierung in Bezug auf Personenparameter) erneut durchgeführt und die Modellpassung noch einmal anhand der beschriebenen Kriterien kontrolliert. In Schritt 4 werden die Personenparameter anhand des Ansatzes virtueller Items (vgl. Abbildung 10.8) bestimmt und die Reliabilität der Personenparameter überprüft. Dazu wird die Datenmatrix wieder in ihre ursprüngliche Form überführt, bei der alle Items in jeweils zwei Spalten die jeweiligen Messzeitpunkte mit den zugehörigen Daten repräsentieren. Verdoppelt sich nun die Anzahl der Items, steht lediglich die einfache Probandenzahl (N=169) zur Skalierung zur Verfügung. Die zwei Messzeitpunkte stellen im Modell jeweils miteinander korrelierende latente Dimension dar, sodass Abhängigkeiten zwischen den Messzeitpunkten bei der Berechnung der Personenparameter mitberücksichtigt werden (vgl. Abbildung 10.9). Die im vorherigen Modell geschätzten Itemparameter werden zur Berechnung des Modells importiert und festgehalten. Dadurch ist keine weitere Summernormierung mehr notwendig, sodass auch die Personenparameter frei geschätzt werden können. Die gewählte Vorgehensweise erlaubt also insgesamt eine freie Schätzung der Item- und Personenparameter.
Abbildung 10.8 Ansatz virtueller Items nach Hartig und Kühnbach (2006, S. 35). (Abgedruckt mit Genehmigung von Springer Nature: Veränderungsmessung und Längsschnittstudien in der empirischen Erziehungswissenschaft von A. Ittel und H. Merkens; © 2006 VS Verlag für Sozialwissenschaften.)
268
10
Auswertungsmethodik
Abbildung 10.9 Vierdimensionales Between-Item-Modell. (Die Abbildung enthält bereits die in Abschnitt 11.2 berichtete finale Itemanzahl.)
Die WLE- und EAP/PV-Reliabilitäten der Skalen werden bestimmt und berichtet. Die WLE-Reliabilität hat aufgrund ihrer Unterschätzung jedoch eine geringere Aussagekraft (vgl. Abschnitt 10.4.6). Die berechneten Personenfähigkeiten können nun in klassischen Auswertungsverfahren verwendet werden (vgl. Abschnitt 10.6 und 10.5).
10.5
Ein- und zweifaktorielle Varianzanalyse mit Messwiederholung
In Forschungsdesigns mit mehr als zwei Versuchsgruppen und/oder Messzeitpunkten werden zur Prüfung von Mittelwertunterschieden in einer abgängigen Variablen ein- und zweifaktorielle Varianzanalysen mit Messwiederholung durchgeführt (Mixed Design ANOVA; vgl. Bühner & Ziegler, 2009, S. 478 ff.; Field, 2013, S. 591 ff.). Unter anderem wird damit überprüft, inwieweit sich die Pre- und Posttestergebnisse innerhalb der Gruppen signifikant unterscheiden und wie viel
10.5 Ein- und zweifaktorielle Varianzanalyse mit Messwiederholung
269
Varianz jeweils durch die Gruppenzugehörigkeit und die Treatmenteffekte aufgeklärt werden. Anhand der zweifaktoriellen Varianzanalyse wird untersucht, ob die Zugehörigkeit zu einer Versuchsgruppe zu unterschiedlich großen und signifikanten Effekten führt. Anhand der einfaktoriellen Varianzanalyse wird dann die Größe der Effekte innerhalb der Gruppen bestimmt. Zum besseren Verständnis wird zunächst die einfaktorielle und im Anschluss die zweifaktorielle Varianzanalyse vorgestellt.
10.5.1 Prinzip der einfaktoriellen Varianzanalyse mit Messwiederholung 2 Das Grundprinzip der Varianzanalyse ist die Zerlegung der Gesamtvarianz σtotal der Messwerte in die Varianz innerhalb eines Messzeitpunktes und in die Varianz zwischen den Messzeitpunkten. Die Varianz innerhalb eines Messzeitpunktes stellt die 2 Varianz σzwischen zwischen den Probanden dar, die durch unterschiedliche Merkmale der Probanden verursacht wird. Die Varianz zwischen den Messzeitpunkten wird durch die Veränderung innerhalb der Probanden über die Zeit verursacht und wird 2 2 daher als σinnerhalb bezeichnet. σinnerhalb setzt sich aus dem Effekt des Treatments 2 2 über die Zeit σZeit und einer Residualvarianz σε, innerhalb zusammen. Die Residual2 varianz σε, innerhalb beinhaltet zufällige Messfehler als auch Fehler, die aufgrund der unterschiedlich großen Wirkung des Treatments über die Zeit bei verschiedenen Personen zustande kommen. Die Gesamtvarianz lässt sich folgendermaßen darstellen (Bühner & Ziegler, 2009, S. 436 ff.): 2 2 2 2 σtotal = σzwischen + σZeit + σε,innerhalb .
Anhand der F-Verteilung wird überprüft, ob ein signifikanter Unterschied zwischen 2 stellt genau dann die Populatiden Messzeitpunkten vorliegt. Die Varianz σZeit onsvarianz dar, wenn die Nullhypothese gilt, also kein Unterschied zwischen den 2 Messzeitpunkten vorliegt. Die Residualvarianz σε, innerhalb repräsentiert unabhängig von der Nullhypothese die Populationsvarianz. Unterscheiden sich die Mittelwerte 2 zwischen den Messzeitpunkten stärker als durch die Populationsvarianz σε, innerhalb zu erwarten ist, liegt ein signifikanter Unterschied vor. Die Prüfgröße F wird wie folgt berechnet (Bühner & Ziegler, 2009, S. 450 ff.): FZeit =
2 σZeit . 2 σε,innerhalb
270
10
Auswertungsmethodik
Überschreitet die Prüfgröße den kritischen F-Wert für das αFehler -Niveau von 0.05, ist der Unterschied signifikant.
10.5.2 Prinzip der zweifaktoriellen Varianzanalyse mit Messwiederholung 2 Die Gesamtvarianz σtotal wird auch bei der zweifaktoriellen Varianzanalyse mit Messwiederholung zerlegt. Bei der einfaktoriellen Varianzanalyse mit Messwie2 in derholung wurde erläutert, dass die Varianz innerhalb der Probanden σinnerhalb 2 2 einen systematischen Anteil σZeit und einen unsystematischen Anteil σε, innerhalb zerlegt wird. Da bei der zweifaktoriellen Varianzanalyse die Gruppenzugehörigkeit als zusätzlicher Faktor miteinbezogen wird, wird auch die Varianz zwischen den Pro2 2 banden σzwischen in einen systematischen Anteil σGruppe und einen unsystematischen 2 Anteil σε,zwischen zerlegt (Bühner & Ziegler, 2009, S. 490 f.). Bei unterschiedlichen Treatments in den Gruppen sind unterschiedlich große Mittelwertunterschiede in 2 den Gruppen zu erwarten. Daher ist für die Varianz innerhalb der Probanden σinnerhalb auch die Interaktion zwischen Gruppenzugehörigkeit und Entwicklung über die Zeit 2 von Bedeutung. In der Varianzzerlegung wird dies durch die Varianz σGruppe X Zeit berücksichtigt (Bühner & Ziegler, 2009, S. 496 ff.): 2 2 2 2 2 2 = σGruppe + σε,zwischen + σZeit + σGruppe×Zeit + σε,innerhalb . σtotal
Die Prüfgröße F berechnet sich analog zur einfaktoriellen Varianzanalyse mit Messwiederholung für den Gruppen- und Interaktionseffekt wie folgt: FGruppe =
2 σGruppe 2 σε,zwischen
, FGruppe×Zeit =
2 σGruppe×Zeit 2 σε,innerhalb
.
10.5.3 Interpretation der Effektstärken Ein Maß für die Größe des Effekts ist der Anteil der jeweiligen systematischen 2 . Zur Berechnung der Effektstärken werden Varianzen an der Gesamtvarianz σtotal jedoch nicht die Varianzen, sondern die Quadratsummen QS verwendet (Bühner & Ziegler, 2009, S. 352). Man bezeichnet das Verhältnis der beiden Quadratsummen als η2 . Die Effektstärken berechnen sich wie folgt (Bühner & Ziegler, 2009, S. 508 ff.):
10.5 Ein- und zweifaktorielle Varianzanalyse mit Messwiederholung
η2Zeit =
271
QSGruppe QSGruppe×Zeit QSZeit , η2Gruppe = , η2Gruppe×Zeit = . QStotal QStotal QStotal
2 Die Gesamtvarianz σtotal beinhaltet jedoch auch die jeweilige Residualvarianz 2 2 σε,zwischen bzw. σε, innerhalb des jeweils anderen Faktors, der für die Schätzung des systematischen Effekts nicht von Bedeutung ist. Sie verkleinert jeweils den Effekt η2 . Aus diesem Grund ist das partielle η2 eine bessere Kenngröße zur Beurteilung des systematischen Effekts, was die folgenden Formeln zur Berechnung illustrieren (Bühner & Ziegler, 2009, S. 508 ff.):
QSZeit QSZeit = , QSinnerhalb QSZeit + QSε,innerhalb QSGruppe QSGruppe = , partielles η2Gruppe = QSzwischen QSGruppe + QSε,zwischen QSZeit×Gruppe QSZeit×Gruppe partielles η2Zeit×Gruppe = = . QSinnerhalb QSZeit×Gruppe + QSε,innerhalb partielles η2Zeit =
Das partielle η2 gibt also den Anteil der Varianz des den Effekt verursachenden Faktors an der Varianz innerhalb bzw. zwischen den Probanden an. Die durch den jeweils anderen Faktor zustande gekommene systematische und unsystematische Varianz ist nicht länger im Nenner enthalten. Daher wird das partielle η2 zur Bestimmung der Effekte verwendet. Cohen (1988, S. 283) interpretiert einen Wert von η2 = 0.01 als kleinen Effekt, einen Wert von η2 = 0.06 als mittleren Effekt und einen Wert von η2 = 0.14 als großen Effekt. Die Ergebnisse werden hinsichtlich der Intervalle 0.01 < η2 < 0.06 als kleine bis mittlere Effekte, 0.06 < η2 < 0.14 als mittlere bis große Effekte und η2 > 0.14 als große Effekte interpretiert. Laut Rasch et al. (2010, S. 113) kann das partielle η2 jedoch nicht anhand der von Cohen (1988, S. 283) definierten Richtlinien interpretiert werden, die für Varianzanalysen ohne Messwiederholung, d. h. für unabhängige Stichproben, entwickelt wurden. Ein Vergleich der Effektstärken zwischen Studien mit unterschiedlich großen Korrelationen zwischen den Messzeitpunkten ist nur bedingt möglich. Da es keine etablierte Alternative zum partiellen η2 gibt, wird es in dieser Studie dennoch anhand der von Cohen (1988, S. 283) definierten Richtlinien interpretiert.
272
10
Auswertungsmethodik
10.5.4 Teststärke Bei den oben beschriebenen Signifikanztests stellt das 0.05-Niveau den Fehler 1. Art αFehler dar. Dieser Fehler beschreibt die Wahrscheinlichkeit, die Nullhypothese (bspw. part. η2 = 0) irrtümlicherweise abzulehnen unter der Bedingung, dass diese in der Grundgesamtheit gilt. Zur vollständigen Beurteilung der Signifikanz des Testergebnisses muss ebenso der Fehler 2. Art βFehler betrachtet werden. Er stellt die Wahrscheinlichkeit dar, die Alternativhypothese irrtümlich abzulehnen unter der Bedingung, dass diese in der Grundgesamtheit gilt. In dieser Studie wird das Hybridmodell zur Bestimmung des βFehler verwendet (Bühner & Ziegler, 2009, S. 185 ff.). Der Term 1 – βFehler gibt dann die Wahrscheinlichkeit der beobachteten Prüfgröße F unter der Annahme der Gültigkeit der Alternativhypothese in der Grundgesamtheit an. Diese Wahrscheinlichkeit wird als post-hoc-Teststärke bezeichnet und bietet neben der Untersuchung des Fehlers 1. Art eine zusätzliche Entscheidungshilfe. Orientiert man sich an der gängigen Konvention, sollte die Teststärke 1 – βFehler größer als 0.80 und der Fehler 1. Art αFehler kleiner als 0.05 sein (Bühner & Ziegler, 2009, S. 664). Alle Teststärken werden anhand von G*Power 3.1 oder in IBM SPSS 25 bestimmt.
10.5.5 Prüfung der Voraussetzungen Das Intervallskalenniveau der abhängigen Variablen stellt eine Voraussetzung von Varianzanalysen dar. In der Studie werden auch für die streng genommen ordinalskalierten Likert-Skalen Varianzanalysen mit Messwiederholung durchgeführt. Entsprechend der gängigen Konvention wird ein Intervallskalenniveau angenommen. Darüber hinaus müssen für die einfaktorielle Varianzanalyse folgende Voraussetzungen erfüllt sein (Bühner & Ziegler, 2009, S. 514 ff.): • Normalverteilung der abhängigen Variablen. Zur Durchführung der Signifikanztests ist eine Normalverteilung der abhängigen Variablen zu jedem Testzeitpunkt notwendig. Bei Verletzung dieser Voraussetzung liefert die Varianzanalyse aufgrund ihrer Robustheit dennoch zuverlässige Schätzer. Bühner und Ziegler (2009, S. 368) raten daher von der unreflektierten Verwendung alternativer Verfahren ab, da diese häufig weniger teststark sind. Die Normalverteilung der Residuen wird anhand des Shapiro-Wilk-Tests überprüft, der bei Erfüllung der Voraussetzung nicht signifikant wird. • Sphärizität (Homogenität der Varianzen und Kovarianzen zwischen den Messzeitpunkten). Unter der Homogenität der Varianzen versteht man, dass die
10.5 Ein- und zweifaktorielle Varianzanalyse mit Messwiederholung
273
Varianzen zwischen den Messzeitpunkten ungefähr gleich groß ausfallen. Die Homogenität der Kovarianzen verlangt zudem, dass die Zusammenhänge zwischen den Messzeitpunkten gleich groß ausfallen (Bühner & Ziegler, 2009, S. 457). Da in der vorliegenden Studie lediglich zwei Messzeitpunkte vorliegen, sind beide Annahmen stets erfüllt, da zwischen den beiden Messzeitpunkten nur eine Differenz bzw. Korrelation berechnet werden kann. • Balanciertes Designs. Für die Bestimmung der Mittelwertunterschiede bei abhängigen Stichproben sollte die Anzahl der Probanden zu allen Messzeitpunkten gleich groß sein. Fehlt bei einer Person ein Messwert zu einem Messzeitpunkt, wird diese aus der Analyse ausgeschlossen (Bühner & Ziegler, 2009, S. 460). Bei der zweifaktoriellen Varianzanalyse spielt zudem der Gruppenfaktor eine Rolle. Daher muss zusätzlich die folgende Voraussetzung erfüllt sein (Bühner & Ziegler, 2009, S. 514 f.): • Homogenität der Gruppenvarianzen. Unter der Homogenität der Gruppenvarianzen versteht man, dass die Residualvarianzen innerhalb der einzelnen Gruppen 2 vergleichbar sind. Dies ist notwendig, da die Varianz σε,zwischen anhand der Mittelwerte der Residualvarianzen in den Gruppen geschätzt wird. Wird dieser Mittelwert durch ungleiche Residualvarianzen verzerrt, ist auch der Signifikanztest verzerrt. Die Voraussetzung wird anhand des Levene-Tests überprüft, der bei Erfüllung der Voraussetzung nicht signifikant wird. Wird der Levene-Test signifikant, empfiehlt sich eine nähere Untersuchung anhand des Fmax -Tests (Bühner & Ziegler, 2009, S. 396 f). Dazu wird das Verhältnis der größten zur kleinsten Gruppenvarianz berechnet. Wenn dieses Verhältnis bei den vorliegenden Gruppengrößen nicht größer als 10:1 ist, kann von einer Homogenität der Gruppenvarianzen ausgegangen werden. Die Normalverteilung der abhängigen Variablen stellt für die in dieser Studie durchgeführten Varianzanalysen somit eine wichtige Annahme dar. Da Ausreißer eine Normalverteilung verzerren können, müssen diese vor der Durchführung des Testverfahrens identifiziert und eventuell ausgeschlossen werden. Messwerte, die um mehr als drei Standardabweichungen vom Mittelwert abweichen, werden von den Analysen ausgeschlossen.
274
10.6
10
Auswertungsmethodik
Multiple lineare Regression
Veränderungsanalysen werden in Forschungsdesigns mit mehreren Messzeitpunkten und/oder Versuchsgruppen häufig in Form zweifaktorieller Varianzanalysen mit Messwiederholung berechnet (vgl. Abschnitt 10.5). Anhand multipler Regressionen kann die Entwicklung der Studierenden im Vergleich zur Kontrollgruppe bestimmt werden. Es werden demnach Effekte zwischen den Gruppen verglichen. Für Aptitude-Treatment-Interaction-Analysen stellt die multiple Regression die beste Methode dar (Eid, Gollwitzer, & Schmitt, 2011, S. 677). In den Analysen wird davon ausgegangen, dass sich Treatments bei Probanden mit verschiedenen Merkmalen unterschiedlich auswirken (Corno & Snow, 1986). Durch die Wahl dieses Verfahrens können die linearen Modelle schrittweise anhand von Kontrollvariablen erweitert und verglichen werden. Ist der Zusammenhang der Kontrollvariablen mit der Veränderung von Interesse, sind multiple Regressionen geeignet, da dieses Verfahren die jeweiligen Regressionskoeffizienten bestimmt. Aus diesen Gründen wird zur Auswertung der Daten der Studie sowohl für die Veränderungs- als auch für Zusammenhangsanalysen zusätzlich auf multiple lineare Regressionen zurückgegriffen. Die multiplen Regressionen werden in IBM SPSS Statistics 25 durchgeführt.
10.6.1 Lineares Modell Eine lineare Regression bestimmt im Allgemeinen, inwieweit ein Unterschied in der abhängigen Variablen (AV), dem sogenannten Kriterium, auf Unterschiede in den unabhängigen Variablen (UV), den sogenannten Prädiktoren, zurückzuführen ist. Dazu wird ein linearer Zusammenhang zwischen den Prädiktoren und dem Kriterium unterstellt (Bühner & Ziegler, 2009, S. 637): yν = b1 · x1,ν + b2 · x2,ν + · · · + bm · xm,ν + a + ε. Die Ausprägung einer Person ν im Kriterium y wird im Modell durch eine Linearkombination der Prädiktoren x1 , x2 , …, xm , einer Konstanten a und eines Fehlers ε beschrieben. x1,ν , x2,ν , …, xm,ν sind die Ausprägungen einer Person ν in den Prädiktoren. Die Regressionsgewichte b1 , b2 , …, bm gewichten die Prädiktoren bei der Vorhersage des Kriteriums y und geben daher eine Auskunft über die Bedeutsamkeit des Prädiktors bei der Vorhersage des Kriteriums. Es können nicht unbegrenzt viele Prädiktoren in ein Modell aufgenommen werden. Bühner (2009, S. 682) gibt als Richtwert an, dass die Stichprobengröße das 15-fache der Anzahl p der Prädiktoren
10.6 Multiple lineare Regression
275
betragen sollte. In der vorliegenden Studie ergibt sich damit eine Maximalzahl von 11 Prädiktoren pro Modell. Inwieweit die Prädiktoren das Kriterium vorhersagen wird anhand der erklärten Varianz beurteilt. Die in den Daten beobachtete Varianz σy2 des Kriteriums y wird zerlegt in die durch das Modell vorhergesagte Varianz σ2 und in die nicht y vorhergesagte Varianz oder Fehlervarianz σε2 (Bühner & Ziegler, 2009, S. 635):
σy2 = σ2 + σε2 . y
Die Regressionsgewichte b1 , b2 , …, bm werden so bestimmt, dass die Fehlervarianz σε2 minimal wird. Dazu wird das Kleinste-Quadrate Kriterium verwendet, welches die Summe der Abweichungsquadrate minimiert (Eid et al., 2011, S. 563 ff.): SAQ =
N 2 yν − yν → min.
ν=1
Dieses Prinzip verleiht diesem linearen Modell den Namen der Ordinary-LeastSquare-Regression (OLS-Regression; Wolf & Best, 2010, S. 614). Lässt sich das Regressionsgewicht in einem linearen Modell mit nur einem Prädiktor anhand eines einfachen Terms bestimmen, müssen die Regressionsgewichte bei einer multiplen linearen Regression anhand der Matrixalgebra berechnet werden (Eid et al., 2011, S. 1024). In dieser Arbeit wird zum einen die Enter-Methode, die in IBM SPSS Statistics 25 als Einschluss-Methode bezeichnet wird, zur Berechnung der Regressionsgewichte verwendet. Bei der Berechnung werden alle Prädiktoren gleichzeitig selektiert und in die Schätzung miteinbezogen. Die Vorwärts-Methode bezieht die Prädiktoren nacheinander in die Berechnung des Modells mit ein. Zunächst wird der Prädiktor ausgewählt, der mit dem Kriterium die betragsmäßig größte Korrelation ausbildet. Ist der Regressionskoeffizient dieses Prädiktors signifikant, werden die Partialkorrelationen (Eid et al., 2011, S. 587 ff.) der übrigen Prädiktoren mit dem Kriterium betrachtet, die um den Einfluss der bereits im Modell befindlichen Prädiktoren bereinigt sind. Der nächste Prädiktor mit der betragsmäßig größten und signifikanten Partialkorrelation wird in das Modell aufgenommen. Korreliert kein Prädiktor mehr signifikant mit dem Kriterium, ist das finale Modell erreicht und die Berechnung wird abgebrochen (Bühner & Ziegler, 2009, S. 682 ff.).
276
10
Auswertungsmethodik
10.6.2 Interpretation der Regressionsgewichte In einer multiplen Regression werden die unstandardisierten Regressionsgewichte b entweder als 1. Regressionsgewichte bedingter einfacher Regressoren oder als 2. Regressionsgewichte von Regressionsresiduen interpretiert: 1. Erhöht sich die Ausprägung des Prädiktors x um eine Einheit, dann erhöht sich das Kriterium um b Einheiten unter der Bedingung, dass die Ausprägungen in den übrigen Prädiktoren konstant sind. Das Regressionsgewicht ist also in Bezug auf Subgruppen zu interpretieren, die sich in den anderen Prädiktoren nicht unterscheiden (Eid et al., 2011, S. 610). 2. Die Regressionsgewichte geben den Einfluss des Prädiktors x auf das Kriterium y an, der nicht bereits durch die übrigen Prädiktoren erklärt wird. Die Zusammenhänge der übrigen Prädiktoren mit dem Prädiktor x und dem Kriterium y werden dazu auspartialisiert (Eid et al., 2011, S. 611). Anhand der zweiten Interpretation erkennt man, dass die Regressionsgewichte mit den sogenannten Partialkorrelationen verwandt sind. Bei der Berechnung von Partialkorrelationen zwischen dem Prädiktor x mit dem Kriterium werden die Varianzanteile, die auf Unterschiede der übrigen Prädiktoren zurückgehen, kontrolliert. Das Regressionsgewicht ist dann nicht mehr durch die übrigen Prädiktoren beeinflusst (Bühner & Ziegler, 2009, S. 642). Aus diesem Grund eignet sich die Aufnahme von Prädiktoren in ein lineares Modell zur Kontrolle von Störvariablen (Eid et al., 2011, S. 602), da diese in den übrigen Regressionsgewichten kontrolliert werden. Werden das Kriterium und die Prädiktoren zuvor anhand einer z-Transformation standardisiert (M = 0; SD = 1), erhält man standardisierte Regressionsgewichte β. Diese Regressionsgewichte sind anders zu interpretieren, da die Metrik der Variablen verändert wurde. Erhöht sich die Ausprägung eines Prädiktors um eine Standardabweichung, so erhöht sich die Ausprägung des Kriteriums um β Standardabweichungen unter der Bedingung, dass die Ausprägungen in den übrigen Prädiktoren konstant sind. Die Konstante a ist immer gleich Null (Eid et al., 2011, S. 573). Durch die Standardisierung weisen alle Prädiktoren und das Kriterium dieselbe Metrik auf. Aufgrund dessen lassen sich die Prädiktoren in ihrer Bedeutung zur Vorhersage des Kriteriums direkt miteinander vergleichen. Cohen (1988) gibt zur Interpretation der Bedeutsamkeit eines standardisierten Regressionskoeffizienten für die Vorhersage des Kriteriums Richtlinien vor. Er spricht von einem kleinen Effekt für β = 0.10, von einem mittleren Effekt für β = 0.30 und von einem
10.6 Multiple lineare Regression
277
großen Effekt für β = 0.50 (Cohen, 1988, S. 79 ff., S. 412). In dieser Arbeit werden daher Effektstärken in den Intervallen 0.10 < β < 0.30 als kleine bis mittlere Effekte, 0.30 < β < 0.50 als mittlere bis große Effekte und β > 0.50 als große Effekte interpretiert. Da der standardisierte Regressionskoeffizient einer einfachen linearen Regression der Korrelation zwischen der abhängigen und unabhängigen Variablen entspricht, werden Korrelationen anhand derselben Richtlinien interpretiert (Cohen, 1988, S. 79 ff.). Um zu überprüfen, ob sich das Regressionsgewicht signifikant von Null unterscheidet, wird ein einseitiger Signifikanztest durchgeführt. Anhand des Regressionsgewichts b und seines Standardfehlers SEb wird die Prüfgröße t mit N − 2 Freiheitsgraden bezüglich eines Werts b0 berechnet: t=
b − b0 . SEb
Die Prüfgröße t folgt einer t-Verteilung, sodass ein signifikanter Unterschied zu b0 bestimmt werden kann. Ist b0 = 0, wird auf einen signifikanten Unterschied von Null getestet (Bühner & Ziegler, 2009, S. 659; Eid et al., 2011, S. 579).
10.6.3 Beurteilung der Modellanpassung Die Güte des Modells zur Vorhersage des Kriteriums y lässt sich an der Größe der Varianz erkennen, die durch das Modell erklärt wird. Der Anteil der vorhergesagten Varianz σ2 an der in den Daten beobachteten Varianz σy2 bezeichnet man als y multiplen Determinationskoeffizienten R2 (Bühner & Ziegler, 2009, S. 652):
σ2 y . σy2
R2 =
√ Die Wurzel des multiplen Determinationskoeffizienten R2 = R stellt die Korrelation zwischen den vorhergesagten und beobachteten Daten dar. Aufgrund der Messfehlerbehaftung der Variablen und eventueller Drittvariablen, die nicht in das Modell miteinbezogen werden, ist der multiple Determinationskoeffizient in der Regel kleiner als Eins (Bühner & Ziegler, 2009, S. 652 f.). Zur Interpretation der Güte der Modellanpassung geben Bühner und Ziegler (2009, S. 663) Orientierungshilfen an. Bei einem R2 von 0.02 sprechen sie von einem kleinen Effekt, bei 0.13
278
10
Auswertungsmethodik
von einem mittleren Effekt und bei 0.26 von einem großen Effekt. Ein Determinationskoeffizient im Intervall 0.02 < R2 < 0.13 wird daher als kleiner bis mittlerer Effekt, im Intervall 0.13 < R2 < 0.26 als mittlerer bis großer Effekt und für R2 > 0.26 als großer Effekt interpretiert. Die Signifikanz des Koeffizienten wird anhand der Prüfgröße F und der zugehörigen F-Verteilung bestimmt, die ein gewichtetes Verhältnis der vorhergesagten Varianz σ2 und der Fehlervarianz σε2 darstellt (Bühner & Ziegler, 2009, S. 661; y Cohen, 1988, S. 409):
F=
(N − p − 1) · R2 . p · 1 − R2
N stellt dabei die Stichprobengröße und p die Anzahl der Prädiktoren dar. Liegt der F-Wert über dem kritischen Wert für das 0.05-Niveau, ist der multiple Determinationskoeffizient signifikant von Null verschieden. Genauso wie bei der Abklärung der Signifikanz der Effektstärken η2 und des partiellen η2 sollte zum Nachweis des multiplen Determinationskoeffizienten R2 die Teststärke bestimmt werden. Da die Vorgehensweise dieselbe ist, wird an dieser Stelle auf Abschnitt 10.5.4 verwiesen.
10.6.4 Lineare Modelle mit Dummy-Variablen Für die Veränderungs- und Zusammenhangsanalysen ist es notwendig, die Gruppenzugehörigkeiten der Probanden im Modell abzubilden. Durch die DummyKodierung können kategoriale Variablen als Prädiktoren in das lineare Modell aufgenommen werden. Dabei werden Variablen mit c Kategorien durch c – 1 Dummy-Variablen ersetzt, die die Ausprägungen 0 und 1 besitzen (Eid et al., 2011, S. 648). Die Kodierung der Dummy-Variablen zur Beschreibung der Gruppenzugehörigkeiten wird in Tabelle 10.2 dargestellt.
Tabelle 10.2 DummyKodierung der Gruppen-Variablen
Dummy-Variable Dummy-Variable Koblenz Münster EG Koblenz
1
0
EG Münster
0
1
Kontrollgruppe
0
0
10.6 Multiple lineare Regression
279
Für die Veränderungsanalysen mit Dummy-Variablen (EG Koblenz, EG Münster, Kontrollgruppe) nimmt die lineare Modellgleichung folgende Gestalt an: yPost = bEG Koblenz · xEG Koblenz + bEG M u.. nster · xEG M u.. nster + xPre + · · · + bm · xm + a + ε. Veränderungen im untersuchten Konstrukt werden bestimmt, indem die Posttestdaten yυ,Post das Kriterium bilden und die Pretestdaten xυ,Pre als Prädiktor kontrolliert werden. Die Kontrollgruppe bildet für die Dummy-Variablen die Referenzkategorie und taucht daher in der Modellgleichung nicht mit einer eigenen Variablen auf. Die unstandardisierten Regressionsgewichte der Dummy-Variablen geben für das Kriterium jeweils den Mittelwertunterschied zwischen der Kategorie, die in der Dummy-Variablen den Wert 1 erhalten hat, und der Referenzkategorie an (Eid et al., 2011, S. 650 f.). Dieser wird anhand der Signifikanz des Regressionsgewichts inferenzstatistisch abgesichert. Bei der Vorhersage der Posttestergebnisse unter Kontrolle der Pretestergebnisse lassen sich die Mittelwertunterschiede im Kriterium zwischen der Kontroll- und der jeweiligen Experimentalgruppe als den durchschnittlichen Zuwachs in der Experimentalgruppe im Vergleich zum Zuwachs in der Kontrollgruppe interpretieren, da die durch die Pretestergebnisse verursachte Varianz auspartialisiert wird (vgl. Abschnitt 10.6.2). Der Mittelwertunterschied zwischen den in der Modellgleichung befindlichen Dummy-Variablen mit dem Wert 1 (EG Koblenz und EG Münster) ergibt sich aus der Differenz der Regressionsgewichte bEG Münster − bEG Koblenz . Zur Signifikanzprüfung für die Differenz wird der in Abschnitt 10.6.2 dargestellte einseitige t-Test verwendet. Die standardisierten Regressionsgewichte lassen sich als Effektstärken interpretieren (vgl. Abschnitt 10.6.2). In die Modellgleichung können weitere Prädiktoren aufgenommen werden, die beobachtete Störvariablen kontrollieren. Die Kontrollvariablen Abiturnote, Semester und Praxiserfahrung sowie die erhobenen Pretestergebnisse der Überzeugungen und Selbstwirksamkeitserwartungen werden in das Modell mit aufgenommen, um die Unterschiede zwischen den Probanden zu kontrollieren. Die Regressionskoeffizienten lassen Rückschlüsse auf günstige oder weniger günstige Einflussfaktoren für die Veränderung des Kriteriums zu.
280
10
Auswertungsmethodik
10.6.5 First-Difference-Modelle Zur Bestimmung von Zusammenhängen zwischen den Facetten der professionellen Kompetenz zum Lehren mathematischen Modellierens sind für die Auswertung andere lineare Modelle geeigneter. In der Sozialwissenschaft hat man zur Untersuchung von Zusammenhängen mit Paneldaten eine Methode entwickelt, die den Einfluss zeitkonstanter Störvariablen (Abiturnote, Semester, Praxiserfahrung, Vorwissen) eliminiert (Allison, 2009). Diese Idee lässt sich auf ein Panel mit zwei Messzeitpunkten, wie sie in dieser Studie vorliegen, übertragen. Der Fehlerterm ε lässt sich in den personenspezifischen, zeitkonstanten Fehler εkonstant und in den zwischen den Personen und über die Zeit variierenden Fehler εvariabel , den sogenannten idiosynkratischen Fehler, unterteilen (Brüderl, 2010). Das lineare Modell lässt sich anhand der standardisierten Regressionskoeffizienten dann wie folgt darstellen: y = β1 · x1 + β2 · x2 + · · · + βm · xm + a + εkonstant + εvariabel . Dieses Modell hat den Nachteil, dass die Schätzung der Regressionskoeffizienten durch unbeobachtete Störvariablen verzerrt wird, wenn diese nicht in die Modellgleichung mit aufgenommen werden (vgl. korrekte Spezifikation des Modells in Abschnitt 10.6.6). Sogenannte First-Difference-Modelle (FD-Modelle) korrigieren diesen Sachverhalt, indem zeitkonstante Störvariablen aus der Modellgleichung entfernt werden. Dies wird ersichtlich, wenn für die Daten des Pre- und Posttests jeweils eine Regressionsgleichung aufgestellt wird: yPre = β1 · x1,Pre + β2 · x2,Pre + · · · + βm · xm,Pre + aPre + εkonstant + εvariabel,Pre , yPost = β1 · x1,Post + β2 · x2,Post + · · · + βm · xm,Post + aPost + εkonstant + εvariabel,Post .
Durch die Subtraktion der beiden Gleichungen werden alle zeitkonstanten Fehler εkonstant aus der Gleichung entfernt und die Schätzung der Regressionsgewichte wird nicht länger von der personenspezifischen unbeobachteten Heterogenität zwischen den Probanden, der sogenannten Between-Varianz, verzerrt. Die resultierende Gleichung enthält nur noch die Within-Varianz innerhalb der Probanden (Brüderl, 2010): yDiff = yPost − yPre = β1 · x1,Post − x1,Pre + β2 · x2,Post − x2,Pre + · · · + βm · xm,Post − xm,Pre + a + εvariabel .
10.6 Multiple lineare Regression
281
Diese Gleichung stellt das FD-Modell dar, dessen Schätzung nur noch durch den idiosynkratischen Fehler verzerrt ist (Brüderl, 2010). Mit dem FD-Modell sind auch Nachteile verbunden. An der Gleichung wird ersichtlich, dass nur die Prädiktoren zur Schätzung beitragen, die sich über die Zeit verändern. Koeffizienten zeitkonstanter Prädiktoren können nicht geschätzt werden. Sie müssen allerdings auch nicht zur Kontrolle der Störvariablen in das Modell aufgenommen werden. Die Regressionsgewichte zeitkonstanter Variablen können daher auch bei Paneldaten nur um die unbeobachtete Heterogenität verzerrt geschätzt werden (Brüderl, 2010). Darüber hinaus ist der Standardfehler im FDModell größer, da es nur die Within-Varianz zur Schätzung nutzt. Die Vermeidung systematischer Verzerrungen wird durch eine kleinere Effizienz erkauft (Allison, 2009, S. 3). Zur Bestimmung von Zusammenhängen zwischen zeitkonstanten Prädiktoren und dem Kriterium werden die OLS-Modelle mit Dummy-Variablen erweitert (vgl. Abschnitt 10.6.4). Zur Bestimmung von Zusammenhängen zwischen den Facetten der professionellen Kompetenz zum Lehren mathematischen Modellierens werden FD-Modelle verwendet. Es können so Zusammenhänge zwischen einer Veränderung des Prädiktors und der damit einhergehenden Veränderung des Kriteriums interpretiert werden.
10.6.6 Prüfung der Voraussetzungen Zur Berechnung von multiplen Regressionen und der zugehörigen Signifikanztests müssen zahlreiche Voraussetzungen erfüllt sein. Das Intervallskalenniveau der abhängigen Variablen ist eine grundlegende Voraussetzung. Die übrigen Annahmen werden jeweils überprüft. • Keine Ausreißer. Ausreißerwerte können entweder aufgrund von Eingabefehlern oder aus inhaltlichen Gründen zustande kommen. Sie beeinflussen die Korrelationen zwischen den Prädiktoren und dem Kriterium stark und verzerren daher die Regression. Probanden, deren Messwert um mehr als drei Standardabweichungen um den Mittelwert streuen, werden von den Analysen ausgeschlossen. (Bühner & Ziegler, 2009, S. 667 ff.; Eid et al., 2011, S. 680 ff.). • Linearität. Das Modell unterstellt einen linearen Zusammenhang zwischen den Prädiktoren und dem Kriterium. Ob ein linearer Zusammenhang vorliegt, wird für jeden Prädiktor anhand von bivariaten Streudiagrammen grafisch kontrolliert (Bühner & Ziegler, 2009, S. 666 f.).
282
10
Auswertungsmethodik
• Homoskedastizität. Liegt Homoskedastizität vor, ist der Vorhersagefehler über alle Werte der beobachteten Variablen gleich verteilt. Sie wird grafisch anhand des Streudiagramms der studentisierten Residuen und der z-standardisierten vorhergesagten Werte kontrolliert. Zusätzlich werden Breusch-Pagan-Tests berechnet, deren Signifikanz eine Verletzung der Homoskedastizitätsannahme anzeigen. Liegt keine Homoskedastizität vor, wird die Varianz der Regressionsgewichte und deren Konfidenzintervalle verzerrt geschätzt (Bühner & Ziegler, 2009, S. 669 ff.; Eid et al., 2011, S. 687 ff.). • Normalverteilung der Residuen. Zur Durchführung der Signifikanztests für die Regressionsgewichte und den multiplen Determinationskoeffizienten müssen die Residuen gleichmäßig um Null streuen. Liegt keine Normalverteilung vor, liefern die Signifikanztests verzerrte Ergebnisse. Bei großen Stichproben (N > 100) ist eine Verletzung jedoch wenig problematisch (Bühner & Ziegler, 2009, S. 673 f.; Eid et al., 2011, S. 690 ff.). Die Normalverteilung der Residuen wird anhand des Shapiro-Wilk-Tests überprüft, der bei Erfüllung der Voraussetzung nicht signifikant wird. • Keine Autokorrelation. Unter Autokorrelation versteht man die Korrelation der Residuen. Dies tritt vor allem dann auf, wenn Abhängigkeiten in den Daten enthalten sind. Die Autokorrelation wird anhand der Durbin-Watson-Statistik überprüft. Werte zwischen 1 und 3 sind als akzeptabel und Werte zwischen 1.5 und 2.5 als gut zu bezeichnen (Bühner & Ziegler, 2009, S. 674 f.; Eid et al., 2011, S. 689 f.). • Keine Multikollinearität. Multikollinearität liegt vor, wenn zwei Prädiktoren hoch miteinander korrelieren. Sie äußert sich dadurch, dass große Regressionskoeffizienten nicht signifikant werden, bzw. kleine Regressionskoeffizienten signifikant werden. Die Regressionskoeffizienten weisen dann hohe Standardfehler auf. Die Multikollinearität wird anhand eines Toleranzwertes überprüft, der mittels der multiplen Determinationskoeffizienten separat berechneter Regressionsmodelle für jeden Prädiktor bestimmt wird. Bei einem Toleranzwert kleiner als 0.10 wird von Multikollinearität ausgegangen (Bühner & Ziegler, 2009, S. 677 f.; Eid et al., 2011, S. 686 f.). • Hohe Reliabilitäten. Die Reliabilitäten der Prädiktoren und des Kriteriums sollten möglichst groß sein. Ist dies nicht der Fall, werden die Korrelationen zwischen den Prädiktoren und dem Kriterium unterschätzt und es erfolgt eine unvollständige Auspartialisierung unter den Prädiktoren (Bühner & Ziegler, 2009, S. 679 f.; Eid et al., 2011, S. 680). Die Prüfung der Reliabilitäten findet im Rahmen der Skalierungen statt. • Keine Varianzbeschränkung. Varianzeinschränkungen führen zu geringeren Korrelationen. Die Varianz der Daten kann beispielsweise durch einen zu einfachen
10.6 Multiple lineare Regression
283
Test und damit einhergehende Deckeneffekte beschränkt sein (Bühner & Ziegler, 2009, S. 680 ff.). • Korrekte Spezifikation des Modells. Fehlt ein Prädiktor im Modell, der viel Varianz aufklärt, werden die Regressionskoeffizienten verzerrt geschätzt, da die Korrelationen zwischen den Prädiktoren mitberücksichtigt werden (vgl. Partialkorrelationen in Abschnitt 10.6.2). Jedoch ist es unmöglich alle relevanten Prädiktoren in ein Modell aufzunehmen. Eine große Zahl von Prädiktoren mit großen gemeinsamen Varianzanteilen führt zu kleinen Regressionsgewichten, die nur in großen Stichproben signifikant nachgewiesen werden können. Fehlende Prädiktoren führen demgemäß zur Überschätzung der Regressionsgewichte. Da der fehlende Prädiktor zudem zur Erklärung der Varianz des Kriteriums beitragen könnte, wird der Determinationskoeffizient R2 unterschätzt (Bühner & Ziegler, 2009, S. 675; Eid et al., 2011, S. 678). • Unabhängigkeit der Probanden. Liegen Abhängigkeiten zwischen den Probanden vor, ist dies im Hinblick auf die Signifikanztests problematisch, da sich die theoretische Stichprobengröße reduziert. Solche Cluster-Effekte (vgl. Abschnitt 8.3) werden anhand der Intra-Class-Correlation (ICC) überprüft, die die Varianz zwischen den Clustern mit der Gesamtvarianz ins Verhältnis setzt. 2 Die Gesamtvarianz σtotal lässt sich aufteilen in die Varianz zwischen den Clus2 tern σLevel k+1 , die sich bei einer hierarchischen Datenstruktur auf dem Level 2 k+1 befinden, und die Varianz der Strukturen innerhalb der Cluster σLevel k , die sich auf dem Level k befinden. Die ICC berechnet sich dann aus dem Ausdruck (Eid et al., 2011, S. 702): ρICC =
2 σLevel k+1 2 σtotal
=
2 σLevel k+1 2 2 σLevel k + σLevel k+1
.
Ein Wert größer 0.05 kann bereits zu einer Verzerrung der Signifikanztests führen (Heck, Thomas, & Tabata, 2014, S. 90). Abhängigkeiten zwischen den Probanden können anhand von gemischten hierarchischen Modellen oder durch die Aufnahme von Dummy Variablen in die Modellgleichung bei der Auswertung berücksichtigt werden (Bühner & Ziegler, 2009, S. 676 f.). Für die Berechnung gemischter hierarchischer Modelle ist die Anzahl der Probanden in den Clustern jedoch zu klein. Eine Aufnahme von DummyVariablen in die Modellgleichung zur Beschreibung der Cluster würde aufgrund der Vielzahl von Clustern zu einer Überschreitung der maximal zulässigen Anzahl von 11 Prädiktoren führen (vgl. Abschnitt 10.6.1). Aus diesem Grund werden die hier
284
10
Auswertungsmethodik
vorgestellten Annahmen für jede Regression überprüft und in Anhang E berichtet. Für den Fall ihrer Bedeutsamkeit wird eine Verletzung der Annahmen bei der Ergebnisinterpretation berücksichtigt und berichtet.
Teil III Ergebnisse der Studie
Dimensionsanalyse, Modellprüfung und Skalierung
11
Bevor die Wirksamkeit der verschiedenen Maßnahmen untersucht werden kann, wird zur Berechnung der Personenfähigkeiten das mehrdimensionale Rasch-Modell bestimmt, das die Daten am besten beschreibt. In diesem Kapitel werden anhand eines Modellvergleichs Forschungsfrage 1 beantwortet (vgl. Abschnitt 11.1) und die Modellgeltung des ausgewählten Modells überprüft (vgl. Abschnitt 11.2, 11.3 und 11.4). Nach der Skalierung der Daten wird die Reliabilität der Messung bestimmt (vgl. Abschnitt 11.5).
11.1
Modellvergleich und globaler Modelltest
In Abschnitt 10.4.4 werden verschiedene, theoretisch plausible ein- und mehrdimensionale Modelle zur Beschreibung der Daten vorgestellt. An dieser Stelle werden zur Beantwortung von Forschungsfrage 1 die Ergebnisse der Dimensionsanalyse dargestellt. Anhand der in Abschnitt 10.4.7.3 vorgestellten Kennwerte wird analysiert, welches Modell die Daten am besten beschreibt. Dieses Modell gibt dann am wahrscheinlichsten die latente Struktur des gemessenen Konstrukts wieder. Die Modelle werden anhand des Ansatzes virtueller Personen (Hartig & Kühnbach, 2006) berechnet. Da ein Proband bzw. eine Probandin aus der EG Koblenz aufgrund des unvollständigen Ausfüllens des Testheftes aus den Analysen ausgeschlossen werden muss, beträgt die doppelte Stichprobengröße N = 336 Personen. Für den Modellvergleich wird zunächst eine Summennormierung in Bezug auf die Personenparameter gewählt. Eine detaillierte Beschreibung der Schätzung der Modelle wird in Abschnitt 9.4.8 dargestellt.
© Der/die Herausgeber bzw. der/die Autor(en), exklusiv lizenziert durch Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2020 H. Klock, Adaptive Interventionskompetenz in mathematischen Modellierungsprozessen, Studien zur theoretischen und empirischen Forschung in der Mathematikdidaktik, https://doi.org/10.1007/978-3-658-31432-3_11
287
288
11
Dimensionsanalyse, Modellprüfung und Skalierung
Die Kennwerte der Modelle werden in Tabelle 11.1 gegenübergestellt. Die Devianz stellt ein Maß für die Wahrscheinlichkeit der Daten unter der Bedingung des Modells dar. Je größer die Wahrscheinlichkeit ist, desto kleiner ist die Devianz. Die Devianzen des zweidimensionalen Between-Item-Modells und des dreidimensionalen Within-Item-Modells sind am niedrigsten und nahezu identisch. Da das zweidimensionale und sechsdimensionale Between-Item-Modell echte Obermodelle des eindimensionalen Generalfaktor-Modells darstellen, wird für sie ein χ2 -Differenz-Test berechnet. Die Differenz zwischen den Devianzen des Generalfaktor- und zweidimensionalen Modells sind signifikant (χ2 = 39.32; df = 2; p < 0.001), genauso wie die Differenz der Devianzen des ein- und sechsdimensionalen Modells (χ2 = 32.18; df = 2; p < 0.001). Diese beiden mehrdimensionalen Between-Item-Modelle weisen eine signifikant bessere Passung auf als das Generalfaktor-Modell. Da eine χ2 -Verteilung der Differenzen der Devianzen nicht mit Sicherheit angenommen werden kann, da die Modelle durch eine EinsRestriktion aus dem Obermodell hervorgehen, muss der Vergleich anhand weiterer Kennwerte abgesichert werden. Die AIC und BIC Indizes beziehen neben der Devianz auch die Parameteranzahl der Modelle mit ein. Kleinere Werte geben eine bessere Modellpassung an. Die Indizes des Generalfaktor- und des sechsdimensionalen Modells sind deutlich größer als die Indizes des zweidimensionalen Between-Item- und des dreidimensionalen-Within-Item-Modells. Das zweidimensionale Between-ItemModell und das dreidimensionale Within-Item-Modell beschreiben die Daten daher am besten. Der AIC Index des ersteren Modells ist lediglich etwas kleiner als der Index des dreidimensionale Within-Item-Modells. Der BIC Index des zweidimensionalen Between-Item-Modells, der die Parameteranzahl der Modelle stärker gewichtet, ist jedoch deutlich kleiner und weist daher auf eine bessere Passung hin. Insbesondere unter Berücksichtigung des Einfachheitskriteriums deuten alle FitIndizes darauf hin, dass das zweidimensionale Between-Item-Modell die Daten am besten beschreibt. Die WMNSQs bewegen sich bei allen Modellen innerhalb der empfohlenen Grenzen nach Bond und Fox (2015, S. 273) von 0.80 bis 1.20. Dass die t-Werte teilweise außerhalb der Grenzen von −1.96 bis 1.96 liegen und daher manche WMNSQ signifikant nachweisen, kann als unproblematisch angesehen werden. Da die Werte bei keinem Modell deutlich näher am Erwartungswert Eins liegen, kann anhand der WMNSQs keine Modellauswahl getroffen werden.
11.1 Modellvergleich und globaler Modelltest
289
Tabelle 11.1 Modellanpassung der Rasch-Modelle Kennwert
GeneralfaktorModell
2-dim. BetweenItem-Modell
6-dim. BetweenItem-Modell
3-dim. WithinItem-Modell
Devianz
14159.53
14120.21
14127.35
14119.31
Anzahl der Parameter
43
45
63
48
AIC
14245.53
14210.21
14253.35
14215.31
BIC
14409.66
14381.98
14493.83
14398.54
WMNSQ
0.90 bis 1.13
0.89 bis 1.15
0.89 bis 1.18
0.89 bis 1.15
t-Werte
−2.40 bis 2.90
−2.60 bis 2.50
−2.80 bis 3.00
−2.50 bis 2.80
Um eine sichere Modellentscheidung zwischen dem zwei- und dreidimensionalen Modell zu treffen, werden die latenten Korrelationen zwischen den Dimensionen als weitere Entscheidungshilfe herangezogen (vgl. Tabelle 11.2). Die latenten Dimensionen des zweidimensionalen Between-Item-Modells korrelieren mit r = 0.67, was für eine getrennte Interpretation der beiden Dimensionen spricht (r < 0.95). Im dreidimensionalen Within-Item-Modell korrelieren diese beiden Dimensionen ebenfalls stark (r = 0.70). Die Korrelationen mit dem Generalfaktor sind jedoch negativ und von hoher Bedeutsamkeit. Sie widersprechen jedoch der theoretischen Ableitung des dreidimensionalen Within-Item-Modells. Da der Generalfaktor den Einfluss der Lese-, Fach- oder Modellierungskompetenz auf die Beantwortung der Testitems widerspiegeln soll, wären positive Korrelationen mit den beiden anderen Dimensionen zu erwarten gewesen. Insbesondere kann ein positiver Einfluss der Lese-, Fachoder Modellierungskompetenz auf die Diagnosekompetenz unterstellt werden, da die Aufgabenvignetten (vgl. Abschnitt 9.3) zunächst verstanden und fachlich durchdrungen werden müssen. Sechs negative Einträge in der Varianz/Kovarianz-Matrix weisen zudem auf eine Fehlspezifikation des Modells hin.
Tabelle 11.2 Korrelationen der latenten Dimensionen Modell
Dimension
2-dim. BetweenItem-Modell
Diagnose Intervention
0.67
3-dim. WithinItem-Modell
Diagnose
1
Intervention
0.70
Generalfaktor
Diagnose
Intervention
Generalfaktor
1
−0.51
1 1 −0.46
1
290
11
Dimensionsanalyse, Modellprüfung und Skalierung
Die Devianzen und informationstheoretischen Indizes bestätigen, dass das zweidimensionale Between-Item-Modell die Daten besser beschreibt als das Generalfaktor- und das sechsdimensionale Between-Item-Modell. Im Vergleich zum Within-Item-Modell zeigen die informationstheoretischen Indizes ebenfalls einen besseren Fit des zweidimensionalen Between-Item-Modells an. Darüber hinaus weisen die Korrelationen zwischen den Dimensionen auf eine Fehlspezifikation des Within-Item-Modells hin. Das zweidimensionale Between-Item-Modell beschreibt die Daten daher am besten und wird zur Skalierung der Daten verwendet. Hypothese 1 kann im Hinblick auf die verglichenen Modelle und die untersuchte Stichprobe bestätigt werden. Resultat 1 zu Forschungsfrage 1
Die Hypothese H1 wird bestätigt. Die adaptive a-priori-Interventionskompetenz der Mathematik-Lehramtsstudierenden lässt sich empirisch anhand des zweidimensionalen Between-Item-Modells mit den Dimensionen der Diagnose- und a-priori-Interventionskompetenz am besten beschreiben. Die Korrelation zwischen den Latenten weist auf die Trennbarkeit der beiden Dimensionen hin. Die theoretisch vorgenommene Unterscheidung zwischen diagnostischen und interventionsbezogenen Fähigkeiten wird empirisch bestätigt.
11.2
Klassische Itemanalyse
Anhand des ausgewählten Modells werden zunächst die Selektionskennwerte und die Distraktor-Skala-Korrelationen analysiert, um die Güte der eingesetzten Testitems sicherzustellen. Die folgenden Kennwerte beruhen auf der obigen Berechnung des zweidimensionalen Between-Item-Modells mit einer Summennormierung in Bezug auf die Personenparameter. In Tabelle 11.3 sind die Selektionskennwerte der Items dargestellt, die zur Messung der Diagnosekompetenz beitragen. Die Items 7.1.1, 7.3.1, 7.3.7, 7.4.7, 7.5.2 und 7.5.7 werden aufgrund geringer Selektionskennwerte (< 0.20) von der Skalierung ausgeschlossen. Die Diagnosekompetenz wird bei Ausschluss dieser Items über mindestens ein Item pro Kontext erhoben. Die Distraktor-SkalaKorrelationen der übrigen Items bewegen sich unter dem Grenzwert von 0.05. Die Diagnosekompetenz wird demnach anhand von 12 Items skaliert.
11.2 Klassische Itemanalyse
291
Tabelle 11.3 Lösungshäufigkeiten und Trennschärfen der Diagnoseitems Aufgaben vignette
Itema
Anzahl Antwortenb
Selektionskennwert
Stau
7.1.1
316
0.11
< 0.06
7.1.2
317
0.40
< −0.09
Abraum
Sicherer Sieg
Tanken
Milchtüte
Container
Distraktor-SkalaKorrelation
7.1.7
318
0.62
< −0.18
7.2.1
315
0.26
< −0.04
7.2.2
314
0.52
< −0.01 < −0.09
7.2.7
314
0.70
7.3.1
311
0.03
< 0.13
7.3.2
311
0.42
< −0.11
7.3.7
309
0.05
< 0.22
7.4.1
314
0.55
< −0.10
7.4.2
315
0.35
< −0.08
7.4.7
314
0.17
< 0.01
7.5.1
314
0.20
< −0.03
7.5.2
314
0.16
< 0.04
7.5.7
314
0.00
< −0.01
7.6.1
313
0.65
< −0.05
7.6.2
314
0.79
< −0.15
7.6.7
314
0.45
< −0.01
Anmerkung. Kursiv gedruckte Items werden von der Skalierung ausgeschlossen. a Die Nummerierung der Items bezieht sich auf Klock und Wess (2018). b Aufgrund des Ansatzes virtueller Personen beträgt die Gesamtstichprobe N = 336. Eine Differenz von 20 Probanden kommt jeweils durch das Rotationsverfahren am Standort Hamburg zustande.
In Tabelle 11.4 sind die Selektionskennwerte der Items dargestellt, die zur Messung der a-priori-Interventionskompetenz beitragen. Die Items 7.2.5, 7.4.4 und 7.6.5 werden aufgrund zu geringer Selektionskennwerte (< 0.20) von der Skalierung ausgeschlossen. Die Distraktor-Skala-Korrelationen der übrigen Items bewegen sich unter dem Grenzwert von 0.05. Die a-priori-Interventionskompetenz wird bei Ausschluss dieser Items über mindestens drei Items pro Aufgabenvignette erhoben. Die a-priori-Interventionskompetenz wird demnach anhand von 21 Items skaliert.
292
11
Dimensionsanalyse, Modellprüfung und Skalierung
Tabelle 11.4 Lösungshäufigkeiten und Trennschärfen der Interventionsitems Aufgaben vignette
Itema
Anzahl Antwortenb
Selektionskennwert
Distraktor-SkalaKorrelation
Stau
7.1.3
317
0.33
−0.21
7.1.4
317
0.26
−0.17
7.1.5
317
0.72
−0.30
7.1.6
318
0.61
−0.30
7.2.3
314
0.28
−0.06
7.2.4
314
0.63
−0.34
7.2.5
315
0.14
0.03
7.2.6
315
0.36
−0.13
7.3.3
311
0.42
−0.20
7.3.4
308
0.73
−0.34
7.3.5
309
0.49
−0.27
Abraum
Sicherer Sieg
Tanken
Milchtüte
Container
7.3.6
309
0.57
−0.25
7.4.3
315
0.59
−0.18
7.4.4
313
0.12
0.08
7.4.5
313
0.20
0.05
7.4.6
313
0.43
−0.18
7.5.3
313
0.26
−0.07
7.5.4
313
0.62
−0.28
7.5.5
312
0.41
−0.16
7.5.6
313
0.61
−0.16
7.6.3
312
0.71
−0.29
7.6.4
313
0.29
−0.10
7.6.5
313
0.00
0.17
7.6.6
313
0.30
−0.04
Anmerkung. Kursiv gedruckte Items werden von der Skalierung ausgeschlossen. a Die Nummerierung der Items bezieht sich auf Klock und Wess (2018). b Aufgrund des Ansatzes virtueller Personen beträgt die Gesamtstichprobe N = 336. Eine Differenz von 20 Probanden kommt jeweils durch das Rotationsverfahren am Standort Hamburg zustande.
Nach Ausschluss der kritischen Items wird das zweidimensionale BetweenItem-Modell für die folgenden Modellgeltungstests erneut berechnet. Der mittlere Selektionskennwert beträgt dann für Diagnoseitems M = 0.48 (SD = 0.18) und für die Interventionsitems ebenfalls M = 0.48 (SD = 0.18).
11.3 Prüfung der Itemhomogenität
11.3
293
Prüfung der Itemhomogenität
Die Itemhomogenität wird anhand der gewichteten Abweichungsquadrate (WMNSQ) und der zugehörigen t-Werte beurteilt (vgl. Abschnitt 10.4.7.1). Die Statistiken werden nach den Dimensionen getrennt aufgeführt und um die im Modell frei geschätzten Itemschwierigkeiten ergänzt. In Tabelle 11.5 werden die Itemkennwerte aufgeführt. Die gewichteten Abweichungsquadrate liegen alle im empfohlenen Intervall [0.80; 1.20] (Bond & Fox, 2015, S. 273). Für Item 7.4.2 wird mit einem t-Wert von 2.2 eine signifikante Abweichung vom Erwartungswert 1 nachgewiesen. Die durch die Daten beschriebene Itemfunktion dieses Items weist eine leicht geringere Steigung und damit eine geringere Trennschärfe als die durch das Modell vorhergesagte Itemfunktion auf. Da diese Abweichung bei einem WMNSQ von 1.10 unter der Grenze von 1.20 liegt, kann dies jedoch als unproblematisch angesehen werden.
Tabelle 11.5 Itemschwierigkeiten, gewichtete Abweichungsquadrate und t-Werte der Items Dimension
Aufgaben vignette
Itema
Itemschwierigkeit
WMNSQ
Diagnose
Stau
7.1.2
−0.24
1.06
1.4
7.1.7
−1.00
0.94
−1.0
7.2.1
−0.94
1.07
1.2
7.2.2
−1.22
0.98
−0.3
7.2.7
−1.83
0.90
−1.1
Sicherer Sieg
7.3.2
−0.38
0.99
−0.1
Tanken
7.4.1
0.24
0.97
−0.7
7.4.2
0.20
1.10
2.3
Milchtüte
7.5.1
−1.67
1.12
1.4
Container
7.6.1
−1.26
0.93
−1.0
7.6.2
−2.54
0.93
−0.5
7.6.7
−2.22
1.01
0.2
Abraum
t-Wert
(Fortsetzung)
294
11
Dimensionsanalyse, Modellprüfung und Skalierung
Tabelle 11.5 (Fortsetzung) Dimension
Aufgaben vignette
Itema
Intervention
Stau
7.1.3
0.17
1.04
1.0
7.1.4
−1.24
1.09
1.2
7.1.5
−1.63
0.93
−0.8
7.1.6
−2.15
0.94
−0.5
7.2.3
−0.12
1.07
1.7
7.2.4
−0.72
0.93
−1.3
7.2.6
−1.95
1.02
0.2
7.3.3
−0.83
1.00
0.0
7.3.4
−1.37
0.90
−1.3
7.3.5
0.51
0.93
−1.5
7.3.6
−1.38
0.96
−0.5
7.4.3
−2.69
1.00
0.0
7.4.5
0.14
1.11
2.6
7.4.6
−0.17
1.00
0.0
7.5.3
−0.36
1.09
2.1
7.5.4
−1.48
0.92
−0.9
7.5.5
−0.09
1.01
0.3
Abraum
Sicherer Sieg
Tanken
Milchtüte
Container
Itemschwierigkeit
WMNSQ
t-Wert
7.5.6
−1.90
0.97
−0.3
7.6.3
−1.57
0.90
−1.2
7.6.4
−1.49
1.08
1.0
7.6.6
−1.27
1.06
0.9
Anmerkung. a Die Nummerierung der Items bezieht sich auf Klock und Wess (2018).
Die Itemkennwerte der Items zur Messung der a-priori-Interventionskompetenz werden ebenfalls in Tabelle 11.5 aufgeführt. Die gewichteten Abweichungsquadrate liegen alle innerhalb der Grenzen nach Bond und Fox (2015, S. 282). Bei den Items 7.4.5 und 7.5.3 wird jeweils eine Abweichung vom Erwartungswert 1 signifikant nachgewiesen. Die aus den Daten ermittelten Itemfunktionen weisen eine leicht geringere Steigung und damit eine geringere Trennschärfe auf als die durch das Modell vorhergesagten Itemfunktionen. Mit WMNSQ von 1.11 und 1.09 liegen die Werte unterhalb der Grenze von 1.20 und werden ebenfalls in die Skalierung miteinbezogen.
11.4 Prüfung der Personenhomogenität
295
Da kein Item die in Abschnitt 10.4.7.1 formulierten Bedingungen verletzt, kann von Itemhomogenität ausgegangen werden. Die Items erfassen in ihren Dimensionen somit jeweils dieselbe Personeneigenschaft. Die Itemhomogenität ist darüber hinaus ein Indiz für die lokale stochastische Unabhängigkeit der Messung, d.h. die Beantwortung eines Items durch einen Probanden ist unabhängig von der Beantwortung der übrigen Items.
11.4
Prüfung der Personenhomogenität
Um zu überprüfen, ob Personenhomogenität vorliegt, wird eine Analyse des Differential Item Functioning durchgeführt (vgl. Abschnitt 10.4.7.2). Dazu werden die Probanden anhand der Teilungskriterien Geschlecht und Summencore in jeweils zwei Gruppen eingeteilt. Der Summenscore wird über alle Items beider latenten Dimensionen gebildet, um anhand des Mittelwertes Probanden mit höheren Kompetenzen von Probanden mit geringeren Kompetenzen zu unterscheiden. Ist die Differenz der Itemschwierigkeiten eines Items zwischen den Gruppen groß und ist die Interaktion zwischen der Itemschwierigkeit und der Gruppenzugehörigkeit signifikant, liegt eine Verletzung der Personenhomogenität vor. In Abbildung 11.1 und Abbildung 11.2 werden die grafischen Modelltests dargestellt. Die Abszissen und Ordinaten repräsentieren die jeweils geschätzten Itemschwierigkeiten in den einzelnen Gruppen. In beiden Grafiken sind keine extremen Ausreißer zu erkennen. In Tabelle 11.6 werden die Differenzen zwischen den Itemschwierigkeiten für jedes einzelne Item dargestellt. Kein Item, weder in der Dimension »Diagnose« noch in der Dimension »Intervention«, überschreitet die kritische Differenz von einem Logit, die einen Ausschluss nach sich ziehen würde (Pohl & Carstensen, 2012, S. 14). In der Dimension »Diagnose« liegt die betragsmäßig größte Differenz in zwei Items bei 0.78 Logits. Item 7.5.1 fällt Probanden mit einem höheren Summenscore tendenziell leichter als Probanden mit einem niedrigeren Summenscore. Item 7.6.1 fällt Frauen tendenziell leichter als Männern. In der Dimension »Intervention« liegt die betragsmäßig größte Differenz mit 0.95 Logits in Item 7.6.3 vor. Dieses Item fällt Probanden mit niedrigem Summenscore tendenziell leichter.
296
11
Dimensionsanalyse, Modellprüfung und Skalierung
Abbildung 11.1 Grafischer Modelltest für das Teilungskriterium Geschlecht
Abbildung 11.2 Grafischer Modelltest für das Teilungskriterium Summenscore
11.4 Prüfung der Personenhomogenität
297
Tabelle 11.6 Differential Item Functioning Dimension
Diagnose
Intervention
Aufgabenvignette
Itema
Differenz der Itemschwierigkeiten für das Teilungskriterium Geschlecht (Männer–Frauen)
Summenscore (hoch–niedrig)
−0.24
−0.18 −0.50
Stau
7.1.2 7.1.7
−0.35
Abraum
7.2.1
−0.08
0.46
7.2.2
−0.35
−0.06
7.2.7
−0.73
−0.60
Sicherer Sieg
7.3.2
−0.22
−0.21
Tanken
7.4.1
−0.16
−0.30
7.4.2
0.04
0.29
Milchtüte
7.5.1
0.23
0.78
Container
7.6.1
−0.78
−0.60
7.6.2
−0.04
−0.19
7.6.7
−0.00
0.63
7.1.3
0.09
−0.01
7.1.4
0.20
0.67
7.1.5
−0.56
−0.18 −0.85
Stau
Abraum
Sicherer Sieg
Tanken
7.1.6
0.03
7.2.3
−0.01
0.84
7.2.4
0.15
−0.62
7.2.6
0.41
0.36
7.3.3
0.07
0.08
7.3.4
0.32
−0.72
7.3.5
0.36
−0.20
7.3.6
0.15
−0.17
7.4.3
0.51
0.47
7.4.5
0.09
0.42
7.4.6
0.24
0.05 (Fortsetzung)
298
11
Dimensionsanalyse, Modellprüfung und Skalierung
Tabelle 11.6 (Fortsetzung) Milchtüte
Container
Anmerkung.
a Die
7.5.3
0.57
0.58
7.5.4
0.01
−0.52
7.5.5
0.27
0.00
7.5.6
0.38
−0.17
7.6.3
0.13
−0.95
7.6.4
−0.86
0.80
7.6.6
0.25
0.44
Nummerierung der Items bezieht sich auf Klock und Wess (2018).
Bei der Analyse der Geschlechterunterschiede sind in der Dimension »Diagnose« die Items 7.2.7 und 7.6.1 beachtenswert (> 0.60 Logits). Beide Items fallen Frauen tendenziell leichter. Es handelt sich dabei einmal um ein Item zur Identifikation der Modellierungsphase und einmal um ein Item zur Festlegung eines Förderziels, sodass kein Zusammenhang mit dem Itemtyp festgestellt werden kann. In der Dimension »Intervention« ist Item 7.6.4 beachtenswert. Es lassen sich demnach drei beachtenswerte Items identifizieren, die Frauen tendenziell leichter fallen als Männern. Da die Differenzen der Itemschwierigkeiten unter dem Grenzwert von einem Logit bleiben, liegt in Bezug auf das Teilungskriterium Geschlecht kein Differential Item Functioning in einem kritischen Umfang vor. Beim Vergleich der Gruppen mit hohen und niedrigen Summenscores sind in der Dimension »Diagnose« vier Items beachtenswert, wobei zwei Items Probanden mit hohen und zwei Items Probanden mit niedrigen Summenscores leichter fallen. Es lässt sich kein Zusammenhang zwischen den Itemtypen und den Summenscores erkennen. In der Dimension »Intervention« sind sieben Items beachtenswert. Drei Items fallen Probanden mit hohen Summenscores einfacher, vier Items Probanden mit niedrigen Summenscores. Die Interventionsitems, die Probanden mit hohen Summenscores einfacher fallen, bestehen ausschließlich aus strategischen Interventionen, die als geeignet zu bewerten sind. Drei der vier Interventionsitems, die Probanden mit niedrigen Summenscores einfacher fallen, bestehen aus inhaltlichdirektiven Interventionen, die als ungeeignet zu bewerten sind. Demnach lässt sich die Tendenz erkennen, dass es Probanden mit hohen Summenscores leichter fällt, strategische Interventionen als geeignet zu bewerten. Probanden mit niedrigen Summenscores scheint es leichter zu fallen, inhaltlich-direktive Items als ungeeignet zu bewerten. Da die Differenzen der Itemschwierigkeiten den Grenzwert von einem Logit nicht überschreiten und leichtere bzw. schwierigere Items bei beiden Personengruppen zu erkennen sind, liegt auch in Bezug auf das Teilungskriterium Summenscore kein Differential Item Functioning in einem kritischen Umfang vor.
11.5 Reliabilität der Messung
299
Das Testinstrument erhebt damit in allen untersuchten Gruppen überwiegend dasselbe Konstrukt. Es lassen sich keine systematischen Unterschiede in den Itemschwierigkeiten in bedeutsamer Größe in den untersuchten Gruppen feststellen. Neben den durchgeführten Untersuchungen sind jedoch systematische Unterschiede bei der Analyse anhand weiterer Teilungskriterien möglich. Das Differential Item Functioning kann daher niemals absolut ausgeschlossen werden. Die Analysen wurden jedoch anhand gängiger Teilungskriterien durchgeführt. Die Ergebnisse können demnach als ein Indiz für die spezifische Objektivität (vgl. Abschnitt 10.4.3) des Testinstruments verstanden werden, einer zentralen Eigenschaft des Rasch-Modells. In der untersuchten Population ist die Zuweisung der Personenscores unabhängig davon, ob die Probanden eher leichte oder eher schwierige Items gelöst haben. Die Zuweisung ist zudem unabhängig davon, ob andere Personen mit verschiedenen Merkmalsausprägungen die Items lösen können. Da sowohl der globale Modelltest als auch die Überprüfung der Personen- und Itemhomogenität positiv ausfallen, kann die Gültigkeit des Rasch-Modells in der untersuchten Population angenommen werden.
11.5
Reliabilität der Messung
Nachdem die Gültigkeit des Rasch-Modells in der untersuchten Population bestätigt wurde, werden die Personenfähigkeiten der Probanden als Weighted Likelihood Estimates bestimmt (vgl. Abschnitt 10.4.5). Dazu werden die Daten entsprechend des Ansatzes virtueller Items (vgl. Abschnitt 10.4.8) umstrukturiert. Die Personenparameter werden dann anhand eines vierdimensionalen Between-Item-Modells berechnet, in dem je eine latente Dimension für eine der beiden Teilkompetenzen und Messzeitpunkte steht. Dadurch werden Abhängigkeiten zwischen den Messzeitpunkten bei der Schätzung der Personenparameter berücksichtigt. Da die Itemparameter aus der vorherigen Berechnung importiert werden, ist das Modell identifiziert, sodass keine Summennormierung notwendig ist. Die Personenparameter werden demnach ebenfalls frei geschätzt. In der Dimension »Diagnose« betragen die mittleren Personenfähigkeiten im Pretest −0.44 (SD = 0.99) und im Posttest 0.35 (SD = 1.15), in der Dimension »Intervention« im Pretest −0.22 (SD = 1.01) und im Posttest 0.21 (SD = 1.06). Zur Bestimmung der Messgenauigkeit werden die in Abschnitt 10.4.6 beschriebenen EAP-/PV- und WLE-Reliabilitäten berechnet. Da der Ansatz virtueller Items zur Berechnung der Personenfähigkeiten verwendet wurde, wird für beide latenten Dimensionen und je Messzeitpunkt jeweils ein Reliabilitätskoeffizient angegeben (vgl. Tabelle 11.7).
300
11
Dimensionsanalyse, Modellprüfung und Skalierung
Tabelle 11.7 EAP-/PV- und WLE Reliabilitäten in Pre- und Posttest Dimension
Messzeitpunkt
EAP-/PV-Reliabilität
WLE-Reliabilität
Diagnose
Pretest
0.71
0.39
Posttest
0.76
0.39
Intervention
Pretest
0.78
0.64
Posttest
0.77
0.60
Die EAP-/PV-Reliabilitäten sind als gut zu bezeichnen und weisen auf eine akzeptable Güte des eingesetzten Testinstruments hin. Die WLE-Reliabilitäten sind insbesondere in der Skala »Diagnose« deutlich niedriger. Die Messfehlervarianz, die in die Berechnung der WLE-Reliabilität mit eingeht, wird bei Tests mit weniger als 20 Items überschätzt. Die WLE-Reliabilität wird daher unterschätzt (Walter & Rost, 2011). Da in der latenten Dimension »Diagnose« lediglich 12 Items zur Bestimmung der Personenfähigkeiten herangezogen werden, kann von einer starken Unterschätzung der WLE-Reliabilität ausgegangen werden. Sie sind für diese Skala daher wenig aussagekräftig. In der Skala »Intervention«, die anhand von 21 Items gemessen wird, sind die WLE-Reliabilitäten im Hinblick auf eine Überschätzung der Messfehlervarianz als akzeptabel zu bezeichnen. In zukünftigen Testungen sollte dennoch eine Erweiterung des Testinstruments durch eine Erhöhung der Itemanzahlen in Betracht gezogen werden. Aufgrund der Erhebung weiterer Konstrukte im Fragebogen- und Testinstrument musste die Anzahl der Aufgabenvignetten zugunsten einer akzeptablen Testlänge begrenzt werden. Die Verteilung der Item- und Personenparameter auf den latenten Dimensionen »Diagnose« und »Intervention« ist für die jeweiligen Messzeitpunkte in Abbildung 11.3 auf der gemeinsamen Logit-Skala dargestellt. Die Kreuze auf der jeweils linken Seite der vertikalen Logit-Skala geben die Verteilung der Personenparameter an (ein × entspricht 3.7 Personen), die Zahlen auf der jeweils rechten Seite repräsentieren die Items. Auch wenn den Items in den beiden Messzeitpunkten unterschiedliche Zahlen zugewiesen wurden, handelt es sich in Pre- und Posttest jeweils um dieselben Items.1
1 Die
Zuordnung unterschiedlicher Zahlen kommt durch den Ansatz virtueller Items und die programminterne Unterscheidung der Messzeitpunkte zustande.
11.5 Reliabilität der Messung
301
Abbildung 11.3 Verteilungen der Personen- (jeweils links) und Itemparameter (jeweils rechts) in den latenten Dimensionen in Pre- und Posttest
Die Diagnoseitems im Pretest (vgl. Abbildung 11.3, links) entsprechen annähernd der Verteilung der Personenparameter. Im oberen Fähigkeitsspektrum (> 0.5 Logits) fehlen insbesondere im Posttest Items höherer Schwierigkeit, um
302
11
Dimensionsanalyse, Modellprüfung und Skalierung
höhere Personenparameter genau zu schätzen und trennscharf zwischen den Personenfähigkeiten zu unterscheiden. Im Posttest werden hohe Personenfähigkeiten daher weniger genau geschätzt als im mittleren und unteren Skalenbereich. Ähnlich verhält es sich bei den Interventionsitems (vgl. Abbildung 11.3, rechts). Im oberen Skalenbereich (> 0.75 Logits) fehlen Items mit einer entsprechenden Itemschwierigkeit, sodass hohe Personenfähigkeiten weniger genau geschätzt werden als mittlere und niedrige. Die Verteilung der Itemparameter deutet darauf hin, dass die Testitems zur Messung beider latenten Konstrukte etwas zu einfach sind. In zukünftigen Testungen sollte eine Erweiterung des Testinstruments um anspruchsvolle Testitems erwogen werden, um auch hohe Personenfähigkeiten zuverlässig zu schätzen. Zusammenfassend lassen sich in Bezug auf die Gültigkeit des Rasch-Modells und die Güte des Testinstruments folgende Ergebnisse festhalten: Resultat 2 zu Forschungsfrage 1
Die Voraussetzungen des zweidimensionalen Rasch-Modells zur Beschreibung der adaptiven a-priori-Interventionskompetenz sind überwiegend erfüllt. Da die Annahmen gleicher und ausreichend hoher Trennschärfen, der lokalen stochastischen Unabhängigkeit (Itemhomogenität) und der spezifischen Objektivität (Personenhomogenität) des Testinstruments überwiegend bestätigt wurden, kann von einer Rasch-Skalierbarkeit in der untersuchten Population ausgegangen werden. Das Testinstrument bestimmt die adaptive a-priori-Interventionskompetenz in ausreichender Qualität und mit einer akzeptablen Reliabilität.
Veränderungsanalysen
12
Zur Analyse der Veränderungen in den untersuchten Konstrukten wird zunächst eine zweifaktorielle Varianzanalyse mit Messwiederholung durchgeführt, um einen eventuellen Haupteffekt des Faktors Zeit bzw. einen Interaktionseffekt zwischen der Gruppenzugehörigkeit und der Veränderung über die Zeit zu bestimmen. Liegt ein Interaktionseffekt vor, unterscheiden sich die Veränderungen in den einzelnen Gruppen. Daher werden einfaktorielle Varianzanalysen durchgeführt, um die Effekte innerhalb der Gruppen zu bestimmen. Ein direkter Vergleich der Veränderungen zwischen den Experimentalgruppen in Bezug auf Veränderungen in der Kontrollgruppe und unter Kontrolle der jeweiligen Pretestergebnisse wird anhand von multiplen linearen Regressionen mit Dummy-Variablen ermöglicht. Zur besseren Lesbarkeit wird bei den Pretestergebnissen der Diagnose- und a-prioriInterventionskompetenz im Folgenden jeweils vom Vorwissen der Studierenden gesprochen. Die Veränderungen der Diagnose- und a-priori-Interventionskompetenz wird zur Beantwortung von Forschungsfrage 2 in den drei Gruppen EG Koblenz, EG Münster und in der Kontrollgruppe untersucht. Die Veränderung der Überzeugungen und Selbstwirksamkeitserwartungen können zur Beantwortung von Forschungsfragen 3 und 4 nur in der EG Koblenz und der Kontrollgruppe analysiert werden, da Daten aus der EG Münster nicht vorliegen. Die Ergebnisse für die EG Münster können in Wess (in Vorbereitung) nachgelesen werden.
Elektronisches Zusatzmaterial Die elektronische Version dieses Kapitels enthält Zusatzmaterial, das berechtigten Benutzern zur Verfügung steht https://doi.org/10.1007/978-3-658-31432-3_12 © Der/die Herausgeber bzw. der/die Autor(en), exklusiv lizenziert durch Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2020 H. Klock, Adaptive Interventionskompetenz in mathematischen Modellierungsprozessen, Studien zur theoretischen und empirischen Forschung in der Mathematikdidaktik, https://doi.org/10.1007/978-3-658-31432-3_12
303
304
12
Veränderungsanalysen
Die Analysen sind hinsichtlich der untersuchten Konstrukte strukturiert. Dabei werden die Voraussetzungen der Verfahren jeweils überprüft. Bei der Darstellung der Ergebnisse werden sie nur dann thematisiert, wenn eine Voraussetzung verletzt ist und dies Auswirkungen auf die Ergebnisinterpretation hat. Deskriptivstatistiken, eine Übersicht der Effektstärken sowie die Tests zur Prüfung der Voraussetzungen werden in Anhang C, D und E dargestellt.
12.1
Veränderung von Diagnosekompetenzen
Nachfolgend wird die Veränderung der Diagnosekompetenz in den Versuchsgruppen untersucht. Die Diagnosekompetenz wurde sowohl in der EG Koblenz als auch in der EG Münster trainiert. Es wird analysiert, inwieweit die Diagnosekompetenz durch die jeweiligen Treatments gefördert wurde.
12.1.1 Veränderungen innerhalb der Gruppen Die Veränderungen der Diagnosekompetenz werden in Abbildung 12.1 dargestellt. Der Zuwachs in der EG Münster ist ca. doppelt so groß wie der Zuwachs in der EG Koblenz. In der Kontrollgruppe verringert sich die durchschnittliche Personenfähigkeit geringfügig. In der EG Koblenz nimmt die Streuung der Personenfähigkeiten im Posttest geringfügig ab, in der EG Münster und der Kontrollgruppe verringert sie sich in einem größeren Umfang. Es bildet sich zudem in der EG Münster kein oberer Whisker aus, da sich über dem oberen Quartil innerhalb des 1,5-fachen Interquartilsabstands keine Personenfähigkeiten befinden. Die maximalen Personenfähigkeiten liegen in der EG Koblenz und der EG Münster im Posttest im selben Bereich. Dies deutet auf Deckeneffekte hin. Die zweifaktorielle Varianzanalyse mit Messwiederholung weist einen signifikanten Interaktionseffekt Zeit × Gruppe nach (F(1, 165) = 38.128; p < 0.001; part. η2 = 0.32). Der große Effekt wird anhand einer hohen Teststärke bestätigt (1 − βFehler ≈ 1). Aufgrund des Interaktionseffekts liegen in den Gruppen unterschiedlich hohe Effekte des Faktors Zeit vor. Daher darf der Haupteffekt nicht interpretiert werden. In jeder Gruppe wird zur Bestimmung der differenten Effekte innerhalb der Gruppen jeweils eine einfaktorielle Varianzanalyse mit Messwiederholung durchgeführt (vgl. Tabelle 12.1).
12.1 Veränderung von Diagnosekompetenzen
305
Abbildung 12.1 Box-Plots der Diagnosekompetenz in Pre- und Posttest
Tabelle 12.1 Einfaktoriellen Varianzanalysen mit Messwiederholung für die Diagnosekompetenz Gruppe EG Koblenz EG Münster Kontrollgruppe
F 28.203 167.52 1.583
df
Sig.
Part. η2
Teststärke
1, 53
< 0.001
0.35
1.00
1, 75
< 0.001
0.69
1.00
1, 37
0.22
0.04
0.23
Anmerkung. F: F-Wert, df: Freiheitsgrade des Zählers und des Nenners der Prüfgröße F, Sig.: p-Wert
In der EG Koblenz und EG Münster werden große Effektstärken signifikant und mit hohen Teststärken nachgewiesen. Dabei ist der Effekt in der EG Münster (part. η2 = 0.69, p < 0.001) nahezu doppelt so groß wie in der EG Koblenz (part. η2 = 0.35, p < 0.001). In der Kontrollgruppe zeigt sich ein kleiner bis mittlerer Effekt (η2 = 0.04, p < 0.22), der eine Verringerung der Diagnosekompetenz anzeigt. Er wird jedoch nicht signifikant nachgewiesen. Ein Effekt aufgrund der wiederholten Testbearbeitung kann daher ausgeschlossen werden. Streng genommen kann aus diesen Ergebnissen noch nicht gefolgert werden, dass das Treatment in Münster einen stärkeren Effekt auf die Diagnosekompetenz der Studierenden hatte als in Koblenz, da sich das Vorwissen der Probanden unterscheiden kann. Abbildung 12.1 deutet auf ähnliche Pretestergebnisse hin. Ein direkter
306
12
Veränderungsanalysen
Vergleich wird anhand einer multiplen linearen Regression ermöglicht, indem die Veränderungen in den Experimentalgruppen unter Kontrolle des Vorwissens im Vergleich zu den Veränderungen in der Kontrollgruppe berechnet werden.
12.1.2 Vergleich der Veränderungen zwischen den Gruppen Zum Vergleich der Veränderungen zwischen den Gruppen wird zunächst ein lineares Modell berechnet, in dem die Posttestergebnisse der Diagnosekompetenz die abhängige Variable und das Vorwissen (Pretestergebnisse) sowie die Dummy-Variablen zur Beschreibung der Gruppenzugehörigkeit (vgl. Abschnitt 10.6.4, Koblenz, Münster) die unabhängigen Variablen darstellen. Inwiefern weitere Personenmerkmale (Geschlecht, Abiturnote, Semester, Praxiserfahrung, …) für den Erwerb der Diagnosekompetenz bedeutsam sind und inwiefern die Kontrolle dieser Merkmale im Rahmen des linearen Modells einen Einfluss auf die Bestimmung der Effektstärken hat, wird in Abschnitt 13.1 berichtet. In Tabelle 12.2 ist die Anpassungsgüte des linearen Modells dargestellt. Der multiple Determinationskoeffizient R2 = 0.60 (p < 0.001) gibt den Anteil der Varianz an, der durch das Modell vorhergesagt wird. Er weist auf einen großen Effekt hin und wird signifikant sowie mit einer hohen Teststärke (1 − βFehler ≈ 1) nachgewiesen. Die Prädiktoren klären 60 % der Varianz in den Daten auf. Das Modell hat daher eine hohe Anpassungsgüte.
Tabelle 12.2 Modellanpassung der multiplen linearen Regression für die Diagnosekompetenz Quadratsumme Regression Residuen Gesamt
df
132.03
3
87.69
164
219.72
167
F
Sig.
R2
Teststärke
82.304
< 0.001
0.60
1.00
Anmerkung. df: Freiheitsgrade, F: F-Wert, Sig.: p-Wert, R2 : Multipler Determinationskoeffizient
In Tabelle 12.3 werden die Regressionskoeffizienten mit den zugehörigen Statistiken dargestellt. Das Vorwissen (Diagnose t1) hat einen signifikanten mittleren bis großen Effekt (β = 0.44, p < 0.001) bei der Vorhersage der Posttestergebnisse. Steigt das Vorwissen um einen Logit, wird durch das Modell ein um durchschnittlich B = 0.51 Logits höherer Posttestwert vorhergesagt. Der Regressionskoeffizient der
12.1 Veränderung von Diagnosekompetenzen
307
EG Koblenz weist daraufhin, dass die Zugehörigkeit zur EG Koblenz unter Kontrolle des Vorwissens der Probanden und im Vergleich zu Veränderungen in der Kontrollgruppe zu einer Steigerung der Diagnosekompetenz von durchschnittlich B = 1.05 Logits führte. In der EG Münster verbesserten sich die Studierenden entsprechend um B = 1.69 Logits. Die standardisierten Regressionskoeffizienten β lassen sich als Effektstärken interpretieren und erlauben einen Vergleich zwischen den Veränderungen in der EG Koblenz und Münster in Bezug auf Veränderungen in der Kontrollgruppe. Liegt in der EG Koblenz mit β = 0.43 (p < 0.001) ein mittlerer bis großer Effekt vor, haben sich die Probanden der EG Münster mit β = 0.74 (p < 0.001) im Rahmen eines großen Effekts gesteigert. Alle Regressionskoeffizienten werden signifikant nachgewiesen. Tabelle 12.3 Regressionskoeffizienten der multiplen linearen Regression für die Diagnosekompetenz Prädiktor
B
SE von B
95 %-KI von B
Konstante
− 0.53
0.13
− 0.78; − 0.28
Koblenz
1.05
0.16
0.74; 1.37
Münster
1.69
0.15
1.40; 1.98
Diagnose t1
0.51
0.06
0.40; 0.63
β
t
Sig.
− 4.161
< 0.001
0.43
6.686
< 0.001
0.74
11.486
< 0.001
0.44
8.728
< 0.001
Anmerkung. B: Regressionskoeffizient, SE von B: Standardfehler von B, 95 %-KI von B: 95 %-Konfidenzintervall von B, β: standardisierter Regressionskoeffizient, t: t-Wert, Sig.: p-Wert
Anhand eines t-Tests wird überprüft, ob sich der Effekt in der EG Münster vom Effekt in der EG Koblenz signifikant unterscheidet. Die Differenz der Effektstärken zwischen den Gruppen beträgt β = 0.31 und ist signifikant (t(166) = 4.759, p < 0.001). Die Gruppen unterscheiden sich im Rahmen eines mittleren Effekts. Die Diagnosekompetenz wurde in der EG Münster signifikant mehr gefördert als in der EG Koblenz. Resultat 1 zu Forschungsfrage 2
Die Hypothese 2.1 wird anhand der Ergebnisse bestätigt. Die Diagnosekompetenz von Mathematik-Lehramtsstudierenden lässt sich durch universitäre fachdidaktische Seminare mit Praxiselementen an beiden Standorten, in der EG Koblenz im Rahmen eines mittleren bis großen Effekts und in der EG Münster im Rahmen eines großen Effekts, steigern. In der EG Münster hat
308
12
Veränderungsanalysen
eine signifikant größere Steigerung der Diagnosekompetenz stattgefunden als in der EG Koblenz. In der Kontrollgruppe zeigt sich erwartungskonform keine signifikante Verbesserung. Es liegt kein Testeffekt vor.
12.2
Veränderung von a-priori-Interventionskompetenzen
Nachfolgend werden Veränderungen in der zweiten Teilkompetenz, der a-priori-Interventionskompetenz, in den Versuchsgruppen untersucht. Im Gegensatz zur Diagnosekompetenz wurde die a-priori-Interventionskompetenz nur in der EG Koblenz fokussiert gefördert. Es wird analysiert, inwieweit das Treatment der EG Koblenz im Vergleich zu den fachdidaktischen Seminaren der Kontrollgruppe als auch im Vergleich zur EG Münster zur Veränderung der a-priori-Interventionskompetenz beigetragen hat.
12.2.1 Veränderungen innerhalb der Gruppen In der EG Koblenz weicht ein Ausreißer um mehr als drei Standardabweichungen nach oben ab und wird von den folgenden Analysen ausgeschlossen. Aufgrund von Clustereffekten in der EG Münster, die anhand von Intraklassekorrelationen nachgewiesen werden (vgl. Anhang E.1), werden die Standardabweichungen, die Signifikanztests der zweifaktoriellen Varianzanalyse als auch der Signifikanztest der einfaktoriellen Varianzanalyse in der EG Münster verzerrt geschätzt. Dies ist bei der Ergebnisinterpretation zu berücksichtigen. Die Veränderungen der a-priori-Interventionskompetenz werden in Abbildung 12.2 dargestellt. Der Zuwachs der Gruppenmittelwerte ist in der EG Münster ca. doppelt so groß wie der Zuwachs in der EG Koblenz. In der Kontrollgruppe verringert sich die durchschnittliche Personenfähigkeit. Die Streuung der Personenfähigkeiten nimmt in der EG Koblenz im Posttest deutlich ab. In der EG Münster bleibt sie nahezu stabil. In der Kontrollgruppe vergrößert sich die Streuung der Personenfähigkeiten. Die maximalen Personenfähigkeiten liegen in der EG Koblenz und der EG Münster im Posttest im selben Bereich, was auf Deckeneffekte hindeutet.
12.2 Veränderung von a-priori-Interventionskompetenzen
309
Abbildung 12.2 Box-Plots der a-priori-Interventionskompetenz in Pre- und Posttest
Die zweifaktorielle Varianzanalyse mit Messwiederholung weist einen signifikanten Interaktionseffekt Zeit × Gruppe nach (F(1, 164) = 12.278; p < 0.001; part. η2 = 0.13). Der mittlere bis große Effekt wird anhand einer hohen Teststärke bestätigt (1 − βFehler ≈ 1). Wie beschrieben, sind die Signifikanztests durch die Clustereffekte verzerrt. Aufgrund der hochsignifikanten Ergebnisse kann jedoch von einem Interaktionseffekt ausgegangen werden. Aus diesem Grund liegen in den Gruppen unterschiedlich hohe Effekte des Faktors Zeit vor. Der Haupteffekt darf daher nicht interpretiert werden. Es werden nachfolgend in jeder Gruppe einfaktorielle Varianzanalysen mit Messwiederholung durchgeführt, um die Entwicklungen innerhalb der Gruppen zu bestimmen (vgl. Tabelle 12.4).
Tabelle 12.4 Einfaktorielle Varianzanalysen mit Messwiederholung für die a-priori-Interventionskompetenz Gruppe
F
df
Sig.
Part. η2
Teststärke
1, 52
< 0.05
0.09
0.60
EG Koblenz
5.134
EG Münster
40.921
1, 75
< 0.001
0.35
1.00
3.192
1, 37
0.08
0.08
0.41
Kontrollgruppe
Anmerkung. F: F-Wert, df: Freiheitsgrade des Zählers und des Nenners der Prüfgröße F, Sig.: p-Wert
310
12
Veränderungsanalysen
In der EG Koblenz wird ein signifikanter mittlerer bis großer Effekt (part. η2 = 0.35, p < 0.001) nachgewiesen. Trotz der Clustereffekte kann aufgrund der Größe des Effekts davon ausgegangen werden, dass dieser überzufällig ist. Der Effekt in der EG Koblenz (part. η2 = 0.01, p < 0.05) kann im Gegensatz zum Effekt in der EG Münster nicht mit einer ausreichenden Teststärke bestätigt werden (1 − βFehler = 0.60). Die Effektstärke in der EG Münster ist um ein Vielfaches größer als in der EG Koblenz. In der Kontrollgruppe zeigt sich ein mittlerer Effekt (part. η2 = 0.08, p = 0.08), der eine Verringerung der a-priori-Interventionskompetenz anzeigt. Er wird jedoch nicht signifikant nachgewiesen. Bei den Probanden der Kontrollgruppe ist keine signifikante Veränderung der Personenfähigkeiten nachzuweisen. Zur Absicherung der differenten Effekte in der EG Koblenz und Münster wird das Vorwissen kontrolliert und die Effekte werden im Vergleich zu den Veränderungen in der Kontrollgruppe bestimmt.
12.2.2 Vergleich der Veränderungen zwischen den Gruppen Zum Vergleich der Veränderungen zwischen den Gruppen wird ein lineares Modell berechnet, in dem die Posttestergebnisse der a-priori-Interventionskompetenz die abhängige Variable und das Vorwissen (Pretestergebnisse) sowie die DummyVariablen zur Beschreibung der Gruppenzugehörigkeit die unabhängigen Variablen darstellen. Bei der Modellberechnung liegt ein Ausreißer vor, der um mehr als drei Standardabweichungen von der Vorhersage abweicht. Er wird in den folgenden Analysen ausgeschlossen. In Tabelle 12.5 ist die Anpassungsgüte des linearen Modells dargestellt. Der multiple Determinationskoeffizient R2 = 0.37 (p < 0.001) weist auf einen großen Effekt hin und wird signifikant sowie mit einer hohen Teststärke (1 − βFehler ≈ 1) nachgewiesen. Die Prädiktoren klären 37 % der Varianz in den Daten auf. Das Modell hat daher eine hohe Anpassungsgüte. Im Vergleich zum Modell zur Vorhersage der Diagnosekompetenzen (vgl. Abschnitt 12.1.2, Tabelle 12.2) wird jedoch deutlich weniger Varianz aufgeklärt.
Tabelle 12.5 Modellanpassungen der multiplen linearen Regression für die a-priori-Interventionskompetenz Quadratsumme Regression
df
65.00
3
Residuen
112.47
163
Gesamt
177.47
166
F
Sig.
R2
Teststärke
31.403
< 0.001
0.37
1.00
Anmerkung. df: Freiheitsgrade, F: F-Wert, Sig.: p-Wert, R2 : Multipler Determinationskoeffizient
12.2 Veränderung von a-priori-Interventionskompetenzen
311
In Tabelle 12.6 werden die Regressionskoeffizienten mit den zugehörigen Statistiken dargestellt. Alle Regressionskoeffizienten werden signifikant nachgewiesen. Die Signifikanztests und die Konfidenzintervalle werden aufgrund von Clustereffekten in der EG Münster jedoch verzerrt geschätzt und die Annahme der Normalverteilung der Residuen wird verletzt. Die hochsignifikanten Ergebnisse weisen jedoch auf überzufällige Effekte hin. Das Vorwissen (Intervention t1) hat bei der Vorhersage der Posttestergebnisse der a-priori-Interventionskompetenz mit β = 0.41 (p < 0.001) einen signifikanten mittleren bis großen Effekt. Steigert sich das Vorwissen um einen Logit, sagt das Modell ein um B = 0.42 Logits höheres Posttestergebnis voraus. In der EG Koblenz verbessern die Studierenden ihre a-priori-Interventionskompetenzen im Vergleich zur Kontrollgruppe und unter Kontrolle des Vorwissens um durchschnittlich B = 0.70 Logits, in der EG Münster um B = 1.10 Logits. Der standardisierte Regressionskoeffizient weist in der EG Koblenz mit β = 0.31 (p < 0.001) einen mittleren Effekt, in der EG Münster mit β = 0.53 (p < 0.001) einen großen Effekt nach.
Tabelle 12.6 Regressionskoeffizienten der multiplen linearen Regression für die a-prioriInterventionskompetenz Prädiktor
B
Konstante
SE von B
95 %-KI von B
β
t − 3.225
Sig.
− 0.44
0.14
− 0.71; − 0.17
Koblenz
0.70
0.18
0.35; 1.05
0.31
3.934
< 0.001
Münster
1.10
0.17
0.77; 1.42
0.53
6.628
< 0.001
Intervention t1
0.42
0.06
0.30; 0.55
0.41
6.605
< 0.001
< 0.01
Anmerkung. B: Regressionskoeffizient, SE von B: Standardfehler von B, 95 %-KI von B: 95 %-Konfidenzintervall von B, β: standardisierter Regressionskoeffizient, t: t-Wert, Sig.: p-Wert
Die Differenz der standardisierten Regressionskoeffizienten β = 0.22 zwischen der EG Koblenz und Münster ist signifikant (t(165) = 2.700, p < 0.01). Der Unterschied hat die Größe eines kleinen bis mittleren Effekts. Die a-priori-Interventionskompetenz wurde somit in der EG Münster signifikant mehr gefördert als in der EG Koblenz. Dieses Ergebnis ist nicht erwartungskonform, da ausschließlich in der EG Koblenz die a-priori-Interventionskompetenz fokussiert gefördert wurde. Es fand jedoch in beiden Treatments eine Praxiseinbindung statt, in der Schülerinnen und Schüler bei der Bearbeitung von Modellierungsaufgaben unterstützt
312
12
Veränderungsanalysen
bzw. beobachtet wurden. Inwiefern sich die differenten Effekte auf Personenmerkmale (Geschlecht, Abiturnote, Semester, Praxiserfahrung, …) und Veränderungen der Diagnosekompetenzen zurückführen lassen wird in den Abschnitt 13.1.2 und 13.1.3 untersucht. Resultat 2 zu Forschungsfrage 2
Die Hypothese 2.2 wird anhand der Ergebnisse bestätigt. Die a-priori-Interventionskompetenz von Mathematik-Lehramtsstudierenden lässt sich durch universitäre fachdidaktische Seminare mit Praxiselementen an beiden Standorten, in der EG Koblenz im Rahmen eines mittleren Effekts und in der EG Münster im Rahmen eines großen Effekts, steigern. In der EG Münster hat eine signifikant größere Steigerung der a-priori-Interventionskompetenz stattgefunden als in der EG Koblenz. In der Kontrollgruppe zeigt sich erwartungskonform kein signifikanter Zuwachs. Es liegt kein Testeffekt vor.
12.3
Veränderung von Überzeugungen zum mathematischen Modellieren
Ergänzend zur Analyse der Veränderungen der adaptiven a-priori-Interventionskompetenzen werden nachfolgend Veränderungen in den Überzeugungen zum mathematischen Modellieren untersucht. Für das Treatment in Koblenz wird analysiert, inwieweit die Überzeugungen zum mathematischen Modellieren im Vergleich zu fachdidaktischen Seminaren ohne Bezug zum Modellieren und zu adaptiven Interventionen in Phasen kooperativer Aufgabenbearbeitung verändert wurden.
12.3.1 Veränderungen innerhalb der Gruppen In der EG Koblenz weicht in der Skala »konstruktivistische Überzeugungen« im Pretest ein Proband um mehr als drei Standardabweichungen nach unten ab, in der Skala »Überzeugungen zur Anwendung mathematischen Modellierens» weichen drei Probanden um mehr als drei Standardabweichungen nach unten ab. Sie werden von den folgenden Analysen ausgeschlossen. Aufgrund von Clustereffekten in der Skala »Überzeugungen zur Anwendung mathematischen Modellierens» in der Kontrollgruppe werden die Standardabweichungen in dieser Gruppe, die Signifikanztests
12.3 Veränderung von Überzeugungen zum mathematischen Modellieren
313
der zweifaktoriellen Varianzanalyse als auch der Signifikanztest der einfaktoriellen Varianzanalyse verzerrt geschätzt. Dies ist bei der Ergebnisinterpretation zu berücksichtigen. Die Veränderungen in den Überzeugungen zum mathematischen Modellieren werden in Abbildung 12.3 und Abbildung 12.4 dargestellt. In der EG Koblenz sind in allen Skalen Veränderungen festzustellen. In der Kontrollgruppe verringern sich die Zustimmungswerte zu den transmissiven Überzeugungen stark, in den übrigen Skalen sind keine nennenswerten Veränderungen zu erkennen. In der EG Koblenz verringert sich die Streuung der Zustimmungswerte in den konstruktivistischen Überzeugungen im Posttest stark. In der Kontrollgruppe vergrößert sie sich in den Überzeugungen zum mathematischen Modellieren in der Schule im Posttest. In den übrigen Skalen bleibt sie relativ stabil.
Abbildung 12.3 Box-Plots der Überzeugungen zum mathematischen Modellieren in der EG Koblenz in Pre- und Posttest
314
12
Veränderungsanalysen
Abbildung 12.4 Box-Plots der Überzeugungen zum mathematischen Modellieren in der Kontrollgruppe in Pre- und Posttest
In allen Skalen sind außer in den transmissiven Überzeugungen bereits im Pretest hohe Zustimmungswerte zu erkennen. Dies kann vermutlich auf die ausschließlich positiv gepolten Items und ein sozial erwünschtes Antwortverhalten der Probanden zurückgeführt werden. In der EG Koblenz sind zudem im Posttest in den konstruktivistischen Überzeugungen und in den Überzeugungen zum mathematischen Modellieren in der Schule Deckeneffekte zu erkennen. Dadurch können in diesen Skalen voraussichtlich keine oder nur geringe Effekte durch das Treatment gemessen werden. Die zweifaktorielle Varianzanalyse mit Messwiederholung wird zur Prüfung von Haupt- und Interaktionseffekten durchgeführt. In den konstruktivistischen Überzeugungen wird weder ein Interaktionseffekt Zeit × Gruppe (F(1, 90) = 0.851; p = 0.36; part. η2 = 0.009) noch ein Haupteffekt für den Faktor Zeit (F(1, 90) = 2.314; p = 0.13; part. η2 = 0.025) signifikant nachgewiesen. In den transmissiven Überzeugungen liegt ebenfalls kein Interaktionseffekt Zeit × Gruppe (F(1, 90) = 1.417; p = 0.24; part. η2 = 0.015), jedoch ein großer Haupteffekt für den Faktor Zeit vor (F(1, 90) = 18.390; p < 0.001; part. η2 = 0.17), der eine Verringerung der Zustimmungswerte anzeigt und durch eine hohe Teststärke bestätigt wird (1 − βFehler = 0.99). Die transmissiven Überzeugungen verändern sich demnach unabhängig von der Gruppenzugehörigkeit sowohl in der EG Koblenz als
12.3 Veränderung von Überzeugungen zum mathematischen Modellieren
315
auch in der Kontrollgruppe hin zu geringeren Zustimmungswerten. Nach der Absolvierung der fachdidaktischen Seminare stimmen die Studierenden Methoden der Wissensvermittlung in Verbindung mit einem lehrerzentrierten Unterricht weniger zu als vor den Seminaren. Für die Überzeugungen zur Anwendung mathematischen Modellierens kann weder ein Interaktionseffekt Zeit × Gruppe (F(1, 87) = 1.482; p = 0.28; part. η2 = 0.017) noch ein Haupteffekt für den Faktor Zeit (F(1, 87) = 3.473; p = 0.07; part. η2 = 0.038) signifikant nachgewiesen werden. Der kleine Haupteffekt ist zwar auf einem α-Fehlerniveau von 0.10 signifikant, kann jedoch nicht mit einer ausreichenden Teststärke bestätigt werden (1 − βFehler = 0.45). Die Signifikanztests sind zudem durch die Clustereffekte in der Kontrollgruppe verzerrt. In den Überzeugungen zum mathematischen Modellieren in der Schule liegt weder ein Interaktionseffekt Zeit × Gruppe (F(1, 90) = 1.796; p = 0.18; part. η2 = 0.020) noch ein signifikanter Haupteffekt für den Faktor Zeit vor (F(1, 90) = 1.243; p = 0.27; part. η2 = 0.014). Obwohl keine signifikanten Interaktionseffekte nachgewiesen werden, werden zur vollständigen Darstellung der Ergebnisse in allen Skalen der Überzeugungen zum mathematischen Modellieren einfaktorielle Varianzanalysen mit Messwiederholung durchgeführt (vgl. Tabelle 12.7). Wie aufgrund des Haupteffekts der zweifaktoriellen Varianzanalyse zu erwarten ist, werden in beiden Versuchsgruppen signifikante Effekte in den transmissiven Überzeugungen nachgewiesen. In der EG Koblenz liegt ein mittlerer bis großer Effekt (part. η2 = 0.10, p < 0.05) vor, der jedoch nicht anhand einer ausreichenden Teststärke abgesichert werden kann (1 − βFehler = 0.65). In der Kontrollgruppe wird ein großer Effekt signifikant und mit einer hohen Teststärke nachgewiesen (part. η2 = 0.26, p < 0.001, 1 − βFehler = 0.94). In den Überzeugungen zur Anwendung mathematischen Modellierens zeigt sich in der EG Koblenz ein signifikanter mittlerer bis großer Effekt (part. η2 = 0.10, p < 0.05), der ebenfalls nicht anhand einer ausreichenden Teststärke nachgewiesen wird (1 − βFehler = 0.64). In den übrigen Skalen zeigen sich in Einklang mit den Ergebnissen der zweifaktoriellen Varianzanalyse keine Effekte.
316
12
Veränderungsanalysen
Tabelle 12.7 Einfaktorielle Varianzanalysen mit Messwiederholung für die Überzeugungen zum mathematischen Modellieren Part. η2
Teststärke
0.09
0.05
0.39
5.719 1, 53
< 0.05
0.10
0.65
Überzeugungen zur Anwendung math. Mod.
5.518 1, 50
< 0.05
0.10
0.64
Überzeugungen zur math. Mod. in der Schule
2.831 1, 50
0.10
0.05
0.38
0.225 1, 37
0.64
0.01
0.08
< 0.001 0.26
0.94
Gruppe
Skala
EG Koblenz
Konstruktivistische Überzeugungen
2.954 1, 53
Transmissive Überzeugungen
Kontrollgruppe Konstruktivistische Überzeugungen Transmissive Überzeugungen
F
df
13.078 1, 37
Sig.
Überzeugungen zur Anwendung math. Mod.
0.184 1, 37
0.67
0.01
0.07
Überzeugungen zur math. Mod. in der Schule
0.037 1, 37
0.85
0.00
0.05
Anmerkung. F: F-Wert, df: Freiheitsgrade des Zählers und des Nenners der Prüfgröße F, Sig.: p-Wert
12.3.2 Vergleich der Veränderungen zwischen den Gruppen Zum Vergleich der Veränderungen zwischen den beiden Gruppen wird für jede Skala ein lineares Modell berechnet, in dem die jeweiligen Posttestergebnisse der Überzeugungen zum mathematischen Modellieren die abhängige Variable und die Pretestergebnisse sowie die Dummy-Variable zur Beschreibung der Gruppenzugehörigkeit die unabhängigen Variablen bilden. Im Modell zu den Überzeugungen zur Anwendung mathematischen Modellierens liegen zwei Ausreißer vor, die um mehr als drei Standardabweichungen von der Vorhersage abweichen. Sie werden in den folgenden Analysen ausgeschlossen. In Tabelle 12.8 ist die Anpassungsgüte des jeweiligen linearen Modells dargestellt. Die multiplen Determinationskoeffizienten R2 weisen mittlere bis große Effekte nach und werden signifikant sowie mit einer hohen Teststärke (1−βFehler > 0.98) nachgewiesen. Die Modelle klären zwischen 20 % und 33 % der Varianz in den Daten auf. Das Modell zum Vergleich der konstruktivistischen Überzeugungen weist die geringste, das Modell zum Vergleich der transmissiven Überzeugungen die höchste Anpassungsgüte auf. Alle Modelle haben eine mittlere bis hohe Anpassungsgüte.
12.3 Veränderung von Überzeugungen zum mathematischen Modellieren
317
Tabelle 12.8 Modellanpassungen für die Überzeugungen zum mathematischen Modellieren Modell Konstruktivistische Überzeugungen
Transmissive Überzeugungen
Quadratsumme df F Regression
3.23 12.64
89
Gesamt
15.87
91
26.93
89
Gesamt
40.24
91
Regression
Überzeugungen zur math. Mod. in der Schule
Regression
8.01
2 13.917 < 0.001 0.24 1.00
Residuen
25.61
89
Gesamt
33.62
91
3.31
Teststärke
2 22.003 < 0.001 0.33 1.00
Residuen
Überzeugungen zur Anwendung math. Mod.
R2
2 11.353 < 0.001 0.20 0.99
Residuen
Regression 13.31
Sig.
2 11.793 < 0.001 0.21 0.99
Residuen
12.20
87
Gesamt
15.50
89
Anmerkung. df: Freiheitsgrade, F: F-Wert, Sig.: p-Wert, R2 : Multipler Determinationskoeffizient
In Tabelle 12.9 werden die Regressionskoeffizienten mit den zugehörigen Statistiken dargestellt. Die Pretestergebnisse (Konst. Ü. t1, Trans. Ü. t1, Ü. Anw. t1, Ü. Mod. t1) haben mit einem β zwischen 0.31 und 0.58 in allen Modellen einen signifikanten mittleren bis großen Effekt bei der Vorhersage der Posttestergebnisse. Der geringste Effekt liegt bei den Überzeugungen zur Anwendung mathematischen Modellierens vor, der größte bei den transmissiven Überzeugungen. Nehmen die Zustimmungswerte im Pretest um eine Stufe zu, so sagt das Modell im Posttest je nach Skala eine durchschnittlich höhere Zustimmung zwischen B = 0.29 und B = 0.51 Stufen auf der Likert-Skala voraus.
318
12
Veränderungsanalysen
Tabelle 12.9 Regressionskoeffizienten für die Überzeugungen zum mathematischen Modellieren Modell
Prädiktor
B
SE 95 %-KI von B von B
Konstruktivistische Überzeugungen
Konstante
2.27 0.26
Koblenz
0.06 0.08
1.76; 2.77
β
t
Sig.
8.900 < 0.001
− 0.10; 0.22 0.07 0.732
0.47
Konst. Ü. t1 0.34 0.07
0.20; 0.49 0.45 4.744 < 0.001
Konstante
0.46 0.17
0.11; 0.80
Koblenz
0.10 0.12
Trans. Ü. t1
0.54 0.08
0.38; 0.71 0.58 6.631 < 0.001
Überzeugungen zur Konstante Anwendung math. Koblenz Mod. Ü. Anw. t1
2.10 0.27
1.57; 2.62
Überzeugungen zur math. Mod. in der Schule
Transmissive Überzeugungen
2.643 < 0.01
− 0.14; 0.33 0.07 0.830
0.41
7.915 < 0.001
0.41 0.12
0.18; 0.64 0.33 3.564 < 0.001
0.29 0.09
0.11; 0.49 0.31 3.268 < 0.01
Konstante
2.04 0.29
1.47; 2.62
Koblenz
0.10 0.08
Ü. Mod. t1
0.40 0.08
7.066 < 0.001
− 0.06; 0.26 0.12 1.293
0.20
0.24; 0.57 0.46 4.787 < 0.001
Anmerkung. B: Regressionskoeffizient, SE von B: Standardfehler von B, 95 %-KI von B: 95%Konfidenzintervall von B, β: standardisierter Regressionskoeffizient, t: t-Wert, Sig.: p-Wert
Der Regressionskoeffizient der EG Koblenz weist für die Überzeugungen zur Anwendung mathematischen Modellierens darauf hin, dass sich diese unter Kontrolle der Pretestergebnisse in der EG Koblenz signifikant mehr verändert haben als in der Kontrollgruppe. Im Mittel kreuzten die Probanden der EG Koblenz im Vergleich zur Kontrollgruppe nach den Treatments auf der fünfstufigen Likert-Skala B = 0.41 Stufen höher an. Die Signifikanztests und die Konfidenzintervalle werden aufgrund von Clustereffekten in der Kontrollgruppe jedoch verzerrt geschätzt und die Annahme der Homoskedastizität ist verletzt. Das hochsignifikante Ergebnis weist jedoch auf einen überzufälligen Effekt hin. Mit einem standardisierten Regressionskoeffizienten von β = 0.33 (p < 0.001) handelt es sich um einen mittleren Effekt. Aussagen zum gesellschaftlichen Nutzen des mathematischen Modellierens werden von den Probanden der EG Koblenz nach dem Treatment stärker zugestimmt als von Probanden der Kontrollgruppe. In den übrigen Skalen zeigen sich keine signifikanten Effekte.
12.4 Veränderung von Selbstwirksamkeitserwartungen
319
Resultat zu Forschungsfrage 3
Die Hypothesen 3.1 und 3.4 können nicht bestätigt werden. In den konstruktivistischen Überzeugungen und den Überzeugungen zum mathematischen Modellieren in der Schule werden keine signifikanten Veränderungen durch das Treatment in der EG Koblenz festgestellt. Hypothese 3.2 wird mit Einschränkungen bestätigt. Die transmissiven Überzeugungen veränderten sich sowohl in der EG Koblenz als auch in der Kontrollgruppe hinsichtlich geringerer Zustimmungswerte im Rahmen eines großen Effekts. Demnach sind auch die analysierten universitären fachdidaktischen Seminare ohne Praxiselemente in der Lage, diese Überzeugungen bei Lehramtsstudierenden zu verändern. Hypothese 3.3 wird anhand der Ergebnisse bestätigt. Überzeugungen zur Anwendung mathematischen Modellierens von MathematikLehramtsstudierenden lassen sich durch ein universitäres fachdidaktisches Seminar mit Praxiselementen in der EG Koblenz hinsichtlich höherer Zustimmungswerte bedeutsam und signifikant verändern. Die Lehramtsstudierenden messen dem gesellschaftlichen Nutzen des mathematischen Modellierens nach Absolvierung des Treatments eine signifikant höhere Bedeutung zu. In der Kontrollgruppe zeigt sich erwartungskonform keine signifikante Veränderung.
12.4
Veränderung von Selbstwirksamkeitserwartungen zum mathematischen Modellieren
Neben Überzeugungen zum mathematischen Modellieren werden Veränderungen von Selbstwirksamkeitserwartungen zum mathematischen Modellieren in der EG Koblenz und der Kontrollgruppe untersucht. Für das Treatment in Koblenz wird analysiert, inwieweit es im Vergleich zu fachdidaktischen Seminaren ohne thematischen Bezug zum mathematischen Modellieren und zu adaptiven Interventionen in Phasen kooperativer Modellierungsprozesse zur Veränderung von Selbstwirksamkeitserwartungen zum mathematischen Modellieren beigetragen hat.
320
12
Veränderungsanalysen
12.4.1 Veränderungen innerhalb der Gruppen Die Veränderungen in den Selbstwirksamkeitserwartungen zum mathematischen Modellieren werden in Abbildung 12.5 und Abbildung 12.6 dargestellt. In der EG Koblenz sind in beiden Skalen Veränderungen in der Größe von mehr als einer halben Standardabweichung festzustellen. In der Kontrollgruppe sind hingegen in beiden Skalen nahezu keine Veränderungen zu erkennen. In der EG Koblenz erhöht sich die Standardabweichung in den Selbstwirksamkeitserwartungen zum mathematischen Arbeiten im Posttest geringfügig, in der Kontrollgruppe vergrößert sie sich stark.
Abbildung 12.5 Box-Plots der Selbstwirksamkeitserwartungen zum mathematischen Modellieren in der EG Koblenz in Pre- und Posttest
Die zweifaktorielle Varianzanalyse mit Messwiederholung weist in den Selbstwirksamkeitserwartungen zum mathematischen Modellieren einen signifikanten Interaktionseffekt Zeit × Gruppe nach (F(1, 89) = 7.143; p < 0.01; part. η2 = 0.07). Der mittlere bis große Effekt wird anhand einer ausreichend hohen Teststärke nachgewiesen (1−βFehler = 0.88).
12.4 Veränderung von Selbstwirksamkeitserwartungen
321
Abbildung 12.6 Box-Plots der Selbstwirksamkeitserwartungen zum mathematischen Modellieren in der Kontrollgruppe in Pre- und Posttest
In den Selbstwirksamkeitserwartungen zum mathematischen Arbeiten liegt ebenfalls ein signifikanter Interaktionseffekt Zeit × Gruppe vor (F(1, 89) = 7.621; p < 0.01; part. η2 = 0.08), der aufgrund einer nicht ausreichenden Teststärke (1−βFehler = 0.78) nicht vollends bestätigt werden kann. Aufgrund der Interaktionseffekte liegen in den Gruppen unterschiedlich hohe Effekte des Faktors Zeit vor. Aus diesem Grund werden einfaktorielle Varianzanalysen mit Messwiederholung durchgeführt (vgl. Tabelle 12.10). In der EG Koblenz werden große Effektstärken in beiden Skalen signifikant und mit hohen Teststärken (1−βFehler > 0.94) nachgewiesen. Die Effektstärke in den Selbstwirksamkeitserwartungen zum mathematischen Modellieren (part. η2 = 0.26, p < 0.001) ist leicht größer als in den Selbstwirksamkeitserwartungen zum mathematischen Arbeiten (part. η2 = 0.21, p < 0.001). In der Kontrollgruppe zeigen sich erwartungskonform verschwindende nicht signifikante Effektstärken. Die differenten Effekte in der EG Koblenz und Kontrollgruppe werden anhand von linearen Regressionen unter Kontrolle der Pretestergebnisse abgesichert.
322
12
Veränderungsanalysen
Tabelle 12.10 Einfaktorielle Varianzanalysen mit Messwiederholung für die Selbstwirksamkeitserwartungen zum mathematischen Modellieren Gruppe
Skala
F
df
Sig.
Part. η2
Teststärke
EG Koblenz
Selbstwirksamkeitserwartungen zum Mod.
18.127
1, 52
< 0.001
0.26
0.99
Selbstwirksamkeitserwartungen zum math. Arbeiten
13.674
1, 52
< 0.001
0.21
0.95
Selbstwirksamkeitserwartungen zum Mod.
0.137
1, 37
0.71
0.00
0.07
Selbstwirksamkeitserwartungen zum math. Arbeiten
0.197
1, 37
0.66
0.01
0.07
Kontrollgruppe
Anmerkung. F: F-Wert, df: Freiheitsgrade des Zählers und des Nenners der Prüfgröße F, Sig.: p-Wert
12.4.2 Vergleich der Veränderungen zwischen den Gruppen Zum Vergleich der Veränderungen zwischen den beiden Gruppen wird ein lineares Modell berechnet, in dem die jeweiligen Posttestergebnisse der Selbstwirksamkeitserwartungen zum mathematischen Modellieren die abhängige Variable und die Pretestergebnisse sowie die Dummy-Variable zur Beschreibung der Gruppenzugehörigkeit die unabhängigen Variablen bilden. Im Modell zu den Selbstwirksamkeitserwartungen zum Modellieren liegt ein Ausreißer vor, der um mehr als drei Standardabweichungen von der Vorhersage abweicht. Er wird in den folgenden Analysen ausgeschlossen. In Tabelle 12.11 wird die Anpassungsgüte der linearen Modelle dargestellt. Die multiplen Determinationskoeffizienten R2 weisen große Effekte nach und werden signifikant sowie mit einer hohen Teststärke (1−βFehler ≈ 1) nachgewiesen. Die Modelle klären zwischen 30 % und 44 % der Varianz in den Daten auf. Das Modell zu den Selbstwirksamkeitserwartungen zum mathematischen Arbeiten weist die höchste Anpassungsgüte auf. Bei beiden Modellen liegt jedoch eine hohe Anpassungsgüte vor. In Tabelle 12.12 werden die Regressionskoeffizienten mit den zugehörigen Statistiken dargestellt. Die Pretestergebnisse (Swe. Mod. t1, Swe. Math. t1) haben
12.4 Veränderung von Selbstwirksamkeitserwartungen
323
Tabelle 12.11 Modellanpassungen für die Selbstwirksamkeitserwartungen zum mathematischen Modellieren Modell
Quadratsumme df
Selbstwirksamkeitserwartungen Regression 7.96 zum math. Mod. Residuen 18.84 Gesamt
2
R2
Sig.
Teststärke
18.590 < 0.001 0.30 1.00
88
26.80
90
Selbstwirksamkeitserwartungen Regression 13.72 zum math. Arbeiten Residuen 17.82
87
Gesamt
F
2
31.54
33.489 < 0.001 0.44 1.00
89
Anmerkung. df: Freiheitsgrade, F: F-Wert, Sig.: p-Wert, R2 : Multipler Determinationskoeffizient
Tabelle 12.12 Regressionskoeffizienten für die Selbstwirksamkeitserwartungen zum mathematischen Modellieren Prädiktor
Selbstwirksamkeitserwartungen zum math. Mod.
Konstante
1.20
0.25
0.72; 1.69
Koblenz
0.27
0.10
0.08; 0.47
0.25
Swe. Mod. t1
0.53
0.09
0.34; 0.71
0.50
5.580
< 0.001
Konstante
0.72
0.25
0.23; 1.22
2.916
< 0.01
Koblenz
0.24
0.10
0.04; 0.43
0.20
2.419
< 0.05
Swe. Math. t1
0.73
0.09
0.54; 0.91
0.64
7.928
< 0.001
Selbstwirksamkeitserwartungen zum math. Arbeiten
B
SE von B
95 %-KI von B
β
Modell
t
Sig.
4.916
< 0.001
2.748
< 0.01
Anmerkung. B: Regressionskoeffizient, SE von B: Standardfehler von B, 95 %-KI von B: 95 %-Konfidenzintervall von B, β: standardisierter Regressionskoeffizient, t: t-Wert, Sig.: p-Wert
mit β = 0.50 (p < 0.001) und β = 0.61 (p < 0.001) einen großen Effekt bei der Vorhersage der Posttestergebnisse. Nehmen die Zustimmungswerte im Pretest um eine Stufe zu, so sagt das Modell im Posttest in den Selbstwirksamkeitserwartungen zum Modellieren eine durchschnittlich höhere Zustimmung von B = 0.53 und in den Selbstwirksamkeitserwartungen zum mathematischen Arbeiten von B = 0.73 Stufen auf der Likert-Skala voraus. Die Regressionskoeffizienten der EG Koblenz zeigen, dass sich die Selbstwirksamkeitserwartungen der Probanden unter Kontrolle der Pretestergebnisse signifikant mehr gesteigert haben als die der Probanden der Kontrollgruppe. Im Mittel kreuzten die Probanden der EG Koblenz im Vergleich zur Kontrollgruppe und unter Kontrolle der Pretestergebnisse nach den Treatments auf der fünfstufigen Likert-Skala B = 0.27 bzw. B = 0.24 Stufen höher an. Mit standardisierten Regressionskoeffizienten von β = 0.25 (p < 0.01) und β = 0.20 (p < 0.05) liegen kleine
324
12
Veränderungsanalysen
bis mittlere Effekte vor. Die Probanden der EG Koblenz haben nach der Absolvierung des Treatments eine höhere Selbstwirksamkeitserwartung in Bezug auf die Diagnostik von Leistungspotentialen in mathematischen Modellierungsprozessen. Resultat zu Forschungsfrage 4
Die Hypothesen 4.1 und 4.2 werden anhand der Ergebnisse bestätigt. Sowohl die Selbstwirksamkeitserwartungen von Mathematik-Lehramtsstudierenden zur Diagnostik von Leistungspotentialen zum Modellieren als auch zum mathematischen Arbeiten lassen sich durch ein universitäres fachdidaktisches Seminar mit Praxiselementen am Standort Koblenz bedeutsam und signifikant steigern. Die Studierenden schätzen ihre eigenen Fähigkeiten zur Diagnostik von Leistungspotentialen nach dem Treatment signifikant höher ein. In der Kontrollgruppe zeigen sich erwartungskonform keine signifikanten Veränderungen.
Zusammenhangsanalysen
13
Die Versuchsgruppen unterscheiden sich durch das Forschungsdesign bedingt in verschiedenen Personenmerkmalen, die einen Einfluss auf die Veränderung der adaptiven a-priori-Interventionskompetenz haben können (vgl. Abschnitt 7.3.1). In einem ersten Teil wird der Einfluss dieser Personenmerkmale bestimmt und kontrolliert, um die Ergebnisse der Gruppenvergleiche aus Kapitel 12 zu korrigieren (vgl. Abschnitt 13.1). Verschiedene Kontrollvariablen werden zur Erweiterung der im letzten Kapitel verwendeten linearen Modelle herangezogen. In einem zweiten Teil werden Zusammenhänge zwischen den Teilkompetenzen und den erhobenen weiteren Facetten der professionellen Kompetenz zum Lehren mathematischen Modellierens bestimmt (vgl. Abschnitt 13.2). Dazu werden FirstDifference-Modelle verwendet, die sowohl die Pre- als auch die Posttestdaten zur Schätzung von Zusammenhängen nutzen.
13.1
Einflussfaktoren für die Veränderungen
Potentielle Einflussfaktoren werden für die beiden Teilkompetenzen, die Diagnoseund a-priori-Interventionskompetenz, getrennt bestimmt. Als Kontrollvariablen wurden demographische Daten, wie das Geschlecht, die Abiturnote, das Semester und die Praxiserfahrung, selbstberichtete Vorerfahrungen zum mathematischen Modellieren sowie Überzeugungen und Selbstwirksamkeitserwartungen als Aspekte der professionellen Kompetenz zum Lehren mathematischen Modellierens erhoben.
© Der/die Herausgeber bzw. der/die Autor(en), exklusiv lizenziert durch Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2020 H. Klock, Adaptive Interventionskompetenz in mathematischen Modellierungsprozessen, Studien zur theoretischen und empirischen Forschung in der Mathematikdidaktik, https://doi.org/10.1007/978-3-658-31432-3_13
325
326
13
Zusammenhangsanalysen
Zur Bestimmung der Einflussfaktoren für den Erwerb von Diagnose- und a-priori-Interventionskompetenzen sind nur die im Pretest erhobenen Daten bedeutsam. Sie beschreiben Personenmerkmale vor der Absolvierung der Treatments, eignen sich daher zur Identifikation günstiger Voraussetzungen und können zur korrigierten Schätzung der Effekte der Treatments herangezogen werden. Die im Posttest erhobenen Daten eignen sich hingegen ausschließlich zur korrigierten Schätzung der Effekte des Treatments. Sie erlauben eine Kontrolle von Einflussfaktoren, die mit dem untersuchten Konstrukt in Wechselwirkung stehen, für das eine Veränderung bestimmt werden soll. Aufgrund der unterschiedlichen Funktionen der Pre- und Posttestdaten wird deren Einfluss auf die Veränderung von Diagnoseund a-priori-Interventionskompetenzen getrennt analysiert. Zur Bestimmung von Einflussfaktoren sind nur die Pretest-Variablen relevant (Forschungsfrage 5). Die Posttest-Variablen werden im Falle ihrer Bedeutsamkeit zur korrigierten Schätzung der Effekte des Treatments verwendet (Forschungsfrage 2). Um aufgrund der Vielzahl an Kontrollvariablen vor der Berechnung der Modelle eine Auswahl zu treffen, werden zunächst die bivariaten Korrelationen mit der abhängigen Variablen hinsichtlich ihrer Signifikanz überprüft (Bühner & Ziegler, 2009, S. 590). Korreliert die Kontrollvariable mit der abhängigen Variablen signifikant, so klärt diese einen bedeutsamen Teil ihrer Varianz auf. Nicht signifikant korrelierende Kontrollvariablen werden daher nicht in die Modelle aufgenommen. Im Anschluss werden die in Abschnitt 12.1.2 bzw. 12.2.2. berechneten linearen Modelle, die im Folgenden als Basismodelle bezeichnet werden, anhand jeder signifikant korrelierenden Kontrollvariablen erweitert, um ihren Einfluss auf die Entwicklung der Diagnose- bzw. a-priori-Interventionskompetenz zu bestimmen. Für jede Kontrollvariable wird dazu ein separates Modell berechnet. Die prädiktiven Kontrollvariablen werden in ein gemeinsames Modell aufgenommen, um eine Korrektur der in Abschnitt 12.1.2 bzw. 12.2.2. berechneten Basismodelle vorzunehmen und diese möglichst vollständig zu spezifizieren (vgl. Abschnitt 13.1.3).
13.1.1 Einflussfaktoren für die Veränderung der Diagnosekompetenz Im berechneten Basismodell zum Vergleich der Veränderungen der Diagnosekompetenzen zwischen den Gruppen stellte die Diagnosekompetenz im Posttest die abhängige Variable und das Vorwissen (Pretestergebnisse) sowie die DummyVariablen zur Beschreibung der Gruppenzugehörigkeit die unabhängigen Variablen dar (vgl. Abschnitt 12.1.2). Die Korrelationen der Kontrollvariablen mit der Diagnosekompetenz im Posttest werden zur Selektion potentieller Prädiktoren in Tabelle 13.1 dargestellt.
13.1 Einflussfaktoren für die Veränderungen
327
Tabelle 13.1 Korrelationen der Kontrollvariablen mit der Diagnosekompetenz im Posttest Konstrukt
Kontrollvariablen
Demographische Daten
Geschlecht
Selbstberichtete Vorerfahrungen
Überzeugungen zum math. Mod.
Abiturnote
Korrelation 0.23 a −0.13
Sig. < 0.01 0.11
Semester
0.28
< 0.001
Praxiserfahrung
0.12
0.16
Vorerf. Behandlung math. Mod.
0.04
0.62
Vorerf. Lehre/Vorb. math. Mod.
0.06
0.41
Vorerf. Modellierungsaufgaben
−0.04
0.64
Vorerf. Math. Mod. im Unterricht
−0.05
0.51
Konstruktivistische Ü. t1
0.12
0.14
Konstruktivistische Ü. t2
0.13
0.09
Transmissive Ü. t1
−0.07
0.35
Transmissive Ü. t2
−0.15
0.06
Ü. zur Anwendung math. Mod. t1
0.19
< 0.05
Ü. zur Anwendung math. Mod. t2
0.18
< 0.05
Ü. zur math. Mod. in der Schule t1
0.17
< 0.05
Ü. zur math. Mod. in der Schule t2
0.23
< 0.01
Selbstwirksamkeits- Swe. zum Modellieren t1 erwartungen zum Swe. zum Modellieren t2 math. Mod. Swe. zum math. Arbeiten t1 Swe. zum math. Arbeiten t2
−0.03
0.69
0.17
< 0.05
−0.09
0.24
0.13
0.09
Anmerkung. Sig.: p-Wert, Für die kategoriale Variable wurde die Rangkorrelation nach Spearman berechnet.
Die Abiturnote korreliert nicht signifikant und mit geringer praktischer Bedeutsamkeit mit der Diagnosekompetenz im Posttest. Auch die Praxiserfahrung der Studierenden und die selbstberichteten Vorerfahrungen zum Modellieren scheinen keinen Einfluss auf die Bearbeitung der Diagnoseitems zu haben. Bei den Überzeugungen korrelieren die Skalen in Pre- und Posttest signifikant, die in Bezug auf das mathematische Modellieren konkretisiert wurden. Die Korrelationen der allgemeineren, lerntheoretischen Überzeugungen sind hingegen nicht signifikant. Auch die Selbstwirksamkeitserwartungen scheinen bis auf eine Skala nicht relevant zu sein. Die Kontrollvariablen Geschlecht, Semester, die Überzeugungen zur Anwendung mathematischen Modellierens sowie zum mathematischen Modellieren in der
328
13
Zusammenhangsanalysen
Schule in Pre- und Posttest und die Selbstwirksamkeitserwartungen im Posttest korrelieren signifikant mit der Skala »Diagnose« im Posttest. Sie werden jeweils in ein lineares Modell aufgenommen. Da das Basismodell bereits den Prädiktor Vorwissen und die Gruppen-Variablen enthält, ist bei Aufnahme der signifikant korrelierenden Kontrollvariablen nicht zwingend mit signifikanten Regressionskoeffizienten zu rechnen. Durch die Auspartialisierung gemeinsamer Varianzanteile zwischen den Prädiktoren ist es möglich, dass die Kontrollvariablen keine zusätzliche Varianz aufklären und daher nicht prädiktiv sind. Es wird also untersucht, inwiefern die Kontrollvariablen zusätzlich zum bereits spezifizierten Modell Varianz aufklären.
13.1.1.1 Einfluss von Pretest-Variablen für die Veränderung der Diagnosekompetenz Die signifikant korrelierenden Pretest-Variablen werden hinsichtlich ihrer Bedeutsamkeit für den Erwerb der Diagnosekompetenz analysiert. In Tabelle 13.2 ist die Anpassungsgüte der jeweils um die Kontrollvariable erweiterten linearen Modelle dargestellt. Die multiplen Determinationskoeffizienten weisen mit R2 = 0.60 (p < 0.001, 1−βFehler = 1.00) bzw. R2 = 0.61 (p < 0.001, 1−βFehler = 1.00) große Effekte nach und werden signifikant sowie mit einer hohen Teststärke nachgewiesen. Die Modelle klären 60 % bzw. 61 % der Varianz in den Daten auf. Das um die Überzeugungen zur Anwendung mathematischen Modellierens erweiterte Modell weist eine geringfügig höhere Anpassungsgüte als die übrigen Modelle auf. Da
Tabelle 13.2 Modellanpassungen für die um die Pretest-Variablen erweiterten Modelle zur Vorhersage der Diagnosekompetenz im Posttest Erweitertes Modell Basismodell
Quadratsumme Regression
132.03
3
87.69
164
Gesamt
219.72
167
Regression
132.35
4
87.37
163
Gesamt
219.72
167
Regression
132.15
4
87.57
163
219.72
167
Residuen + Geschlecht
Residuen + Semester
df
Residuen Gesamt
F
Sig.
R2
Teststärke
82.304
< 0.001
0.60
1.00
61.724
< 0.001
0.60
1.00
61.496
< 0.001
0.60
1.00
(Fortsetzung)
13.1 Einflussfaktoren für die Veränderungen
329
Tabelle 13.2 (Fortsetzung) Erweitertes Modell + Ü. zur Anwendung math. Mod. t1
Quadratsumme Regression Residuen Gesamt
+ Ü. zum math. Regression Mod. in der Residuen Schule t1 Gesamt
df
133.80
4
85.92
163
219.72
167
132.16
4
87.56
163
219.72
167
F
Sig.
R2
Teststärke
63.454
< 0.001
0.61
1.00
61.511
< 0.001
0.60
1.00
Anmerkung. df: Freiheitsgrade, F: F-Wert, Sig.: p-Wert, R2 : Multipler Determinationskoeffizient
das Basismodell bereits eine Anpassungsgüte von R2 = 0.60 aufwies, klären lediglich die Überzeugungen zur Anwendung mathematischen Modellierens im Pretest zusätzlich ca. 1 % der Varianz in den Daten auf. In Tabelle 13.3 werden die Regressionskoeffizienten mit den zugehörigen Statistiken dargestellt. Das Vorwissen (Diagnose t1) hat, wie bereits in Abschnitt 12.1.2 festgestellt, einen signifikanten mittleren bis großen Effekt bei der Vorhersage der Posttestergebnisse (β zwischen 0.43 und 0.44, p < 0.001). Ist das Vorwissen um einen Logit größer, so sagen die Modelle eine Steigerung um B = 0.50 bzw. B = 0.51 Logits im Posttest vorher. In keinem Modell wird der Regressionskoeffizient der Kontrollvariablen signifikant nachgewiesen. Demnach gibt es keinen signifikanten Unterschied beim Erwerb der Diagnosekompetenz zwischen den Geschlechtern. Auch der Studienfortschritt bzw. das Hochschulsemester (Semester) zu Beginn des Seminars hat unter Kontrolle der Gruppenzugehörigkeit und der Diagnosekompetenzen im Pretest keinen Einfluss. Der Regressionskoeffizient der Überzeugungen zur Anwendung mathematischen Modellieren im Pretest (Ü. Anw. t1) ist auf dem 0.10-Niveau signifikant (p = 0.07) und zeigt einen kleinen Effekt an (β = 0.09). Sind die Zustimmungswerte hinsichtlich des gesellschaftlichen Nutzens des mathematischen Modellierens vor dem Treatment um eine Stufe auf der Likert-Skala größer, geht dies tendenziell mit höheren Zuwächsen in der Diagnosekompetenz von durchschnittlich 0.17 Logits einher. In Tabelle 13.2 und im Vergleich zum Basismodell ist erkennbar, dass dieser Prädiktor zusätzlich ca. 1 % der Varianz in den Daten aufklärt. Überzeugungen zum mathematischen Modellieren in der Schule im Pretest (Ü. Mod. t1) spielen für den Erwerb hingegen keine bedeutsame Rolle. Es erscheint unerheblich, ob dem mathematischen Modellieren von Studierenden vor dem Treatment ein berechtigter Platz im Mathematikunterricht eingeräumt wird oder nicht.
330
13
Zusammenhangsanalysen
Tabelle 13.3 Regressionskoeffizienten der um die Pretest-Variablen erweiterten Modelle zur Vorhersage der Diagnosekompetenz im Posttest Erweitertes Modell Basismodell
+ Geschlecht
+ Semester
+ Ü. zur Anwendung math. Mod. t1
+ Ü. zum math. Mod. in der Schule t1
Prädiktor
B
Konstante
SE von B
95 %-KI von B
β
t
Sig.
−0.53
0.13
−0.78; −0.28
−4.161
< 0.001
Koblenz
1.05
0.16
0.74; 1.37
0.43
6.686
< 0.001
Münster
1.69
0.15
1.40; 1.98
0.74
11.486
< 0.001
Diagnose t1
0.51
0.06
0.40; 0.63
0.44
8.728
< 0.001
−0.56
0.13
−0.82; −0.30
Koblenz
1.04
0.16
0.73; 1.35
Münster
1.67
0.15
Diagnose t1
0.50
0.16
Geschlecht
0.09
−4.202
< 0.001
0.42
6.539
< 0.001
1.38; 1.97
0.73
11.222
< 0.001
0.39; 0.62
0.43
8.497
< 0.001
0.12
−0.14; 0.32
0.04
0.771
−0.57
0.16
−0.88; −0.26
Koblenz
1.04
0.16
0.73; 1.36
Münster
1.66
0.16
1.34; 1.98
Diagnose t1
0.51
0.06
0.40; 0.63
Semester
0.01
0.02
−0.03; 0.05
−1.02
0.30
−1.62; −0.44
Koblenz
1.02
0.16
0.71; 1.33
0.42
Münster
1.66
0.15
1.37; 1.95
0.72
Diagnose t1
0.51
0.16
0.39; 0.62
0.44
8.735
< 0.001
Ü. Anw. t1
0.17
0.09
−0.01; 0.36
0.09
1.832
0.07
−0.75
0.45
−1.64; 0.15
Koblenz
1.06
0.16
0.75; 1.38
0.43
6.689
< 0.001
Münster
1.68
0.15
1.39; 1.98
0.73
11.367
< 0.001
Diagnose t1
0.51
0.06
0.39; 0.62
0.44
8.494
< 0.001
Ü. Mod. t1
0.06
0.13
−0.19; 0.32
0.03
0.504
0.62
Konstante
Konstante
Konstante
Konstante
0.44
−3.657
< 0.001
0.43
6.506
< 0.001
0.72
10.317
< 0.001
0.44
8.708
< 0.001
0.03
0.479
0.63
−3.426
< 0.001
6.461
< 0.001
11.24
−1.652
< 0.001
0.10
Anmerkung. B: Regressionskoeffizient, SE von B: Standardfehler von B, 95 %-KI von B: 95 %Konfidenzintervall von B, β: standardisierter Regressionskoeffizient, t: t-Wert, Sig.: p-WertAnmerkung.
Die erhobenen und untersuchten Kontrollvariablen scheinen keinen Einfluss auf den Erwerb der Diagnosekompetenz zu haben. Lediglich die bereits im Basismodell befindlichen Variablen, das Vorwissen (Diagnose t1) und die Gruppen-Variablen (Koblenz, Münster), klären einen Großteil der Varianz in den Daten auf. Das Vorwissen leistet daher einen bedeutsamen Beitrag zur Vorhersage der Diagnosekompetenz im Posttest.
13.1 Einflussfaktoren für die Veränderungen
331
Resultat 1 zu Forschungsfrage 5
Das Vorwissen der Studierenden, d.h. die Diagnosekompetenz im Pretest, ist ein bedeutsamer Einflussfaktor für die Diagnosekompetenz im Posttest. Es liegt ein mittlerer bis großer Effekt vor. Für die übrigen Personenmerkmale konnte kein Zusammenhang mit dem Erwerb der Diagnosekompetenz festgestellt werden.
13.1.1.2 Einfluss von Posttest-Variablen für die Veränderung der Diagnosekompetenz Die signifikant korrelierenden Posttest-Variablen werden hinsichtlich ihres Einflusses auf die Diagnosekompetenz im Posttest untersucht, um sie im Falle ihrer Bedeutsamkeit zu einer korrigierten Schätzung der Treatmenteffekte in das Basismodell aufzunehmen. In Tabelle 13.4 ist die Anpassungsgüte der jeweils um die Kontrollvariablen im Posttest erweiterten linearen Modelle dargestellt. Die multiplen Determinationskoeffizienten weisen mit R2 = 0.60 (p < 0.001, 1−βFehler ≈ 1.00) große Effekte nach und klären 60 % der Varianz signifikant sowie mit einer hohen Teststärke auf. Beide Modelle besitzen eine nahezu identische Anpassungsgüte wie das Basismodell.
Tabelle 13.4 Modellanpassungen der um die Posttest-Variablen erweiterten Modelle zur Vorhersage der Diagnosekompetenz im Posttest Erweitertes Modell Basismodell
Quadratsumme Regression Residuen
df
132.03
3
87.69
164 167
Gesamt
219.72
+ Ü. zur Anwendung math. Mod. t2
Regression
132.07
4
87.65
163
Gesamt
219.72
167
+ Ü. zum math. Mod. in der Schule t2
Regression
132.13
4
87.59
163
219.72
167
Residuen
Residuen Gesamt
F
Sig.
R2
Teststärke
82.304
< 0.001
0.60
1.00
61.405
< 0.001
0.60
1.00
61.472
< 0.001
0.60
1.00
Anmerkung. df: Freiheitsgrade, F: F-Wert, Sig.: p-Wert, R2 : Multipler Determinationskoeffizient
332
13
Zusammenhangsanalysen
In Tabelle 13.5 werden die Regressionskoeffizienten mit den zugehörigen Statistiken dargestellt. Wie auch bei den Pretest-Variablen wird in keinem Modell ein Regressionskoeffizient einer Kontrollvariablen signifikant nachgewiesen. Überzeugungen zur Anwendung mathematischen Modellierens (Ü. Anw. t2) oder zum mathematischen Modellieren in der Schule im Posttest (Ü. Mod. t2) stehen demnach auch nach dem Treatment unter Kontrolle des Vorwissens (Diagnose t1) und der Gruppen-Variablen (Koblenz, Münster) in keinem Zusammenhang mit der a-priori-Interventionskompetenz im Posttest.
Tabelle 13.5 Regressionskoeffizienten der um die Posttest-Variablen erweiterten Modelle zur Vorhersage der Diagnosekompetenz im Posttest β
Erweitertes Modell
Prädiktor
B
SE von B
95 %-KI von B
Basismodell
Konstante
−0.53
0.13
−0.78; −0.28
Koblenz
1.05
0.16
0.74; 1.37
Münster
1.69
0.15
1.40; 1.98
Diagnose t1
0.51
0.06
0.40; 0.63
−0.63
0.35
−1.32; 0.07
1.04
0.17
0.71; 1.37
0.42
6.209
< 0.001
1.68
0.15
1.37; 1.98
0.73
10.891
< 0.001
Diagnose t1
0.51
0.06
0.40; 0.63
0.44
8.708
< 0.001
Ü. Anw. t2
0.03
0.11
−0.19; 0.26
0.02
0.293
0.29
−0.72
0.44
−1.59; 0.16
−1.614
0.11
1.05
0.16
0.73; 1.36
0.43
6.631
1.67
0.15
1.37; 1.98
0.73
10.815
< 0.001
Diagnose t1
0.51
0.06
0.39; 0.63
0.44
8.684
< 0.001
Ü. Mod. t2
0.06
0.13
−0.19; 0.31
0.02
0.438
0.66
+ Ü. zur Konstante Anwendung Koblenz math. Mod. t2 Münster
+ Ü. zum Konstante math. Mod. in Koblenz der Schule t2 Münster
t
Sig.
−4.161
< 0.001
0.43
6.686
< 0.001
0.74
11.486
< 0.001
0.44
8.728
< 0.001
−1.785
0.08
< 0.001
Anmerkung. B: Regressionskoeffizient, SE von B: Standardfehler von B, 95 %-KI von B: 95 %-Konfidenzintervall von B, β: standardisierter Regressionskoeffizient, t: t-Wert, Sig.: p-Wert
Weder Pretest- noch Posttest-Variablen klären einen bedeutsamen zusätzlichen Teil der Varianz in den Daten auf und gehen mit signifikanten Regressionskoeffizienten in das Modell ein. Die gemeinsamen Varianzanteile mit dem Kriterium werden bereits durch im Basismodell befindliche Prädiktoren aufgeklärt. Daher unterscheiden sich die standardisierten Regressionskoeffizienten des Vorwissens (Diagnose
13.1 Einflussfaktoren für die Veränderungen
333
t1) und der Gruppen-Variablen (Koblenz, Münster) kaum zwischen den erweiterten Modellen. Auch im Vergleich mit dem Basismodell sind keine bedeutsamen Unterschiede in der Größe der Regressionskoeffizienten festzustellen. Da keine Kontrollvariablen identifiziert wurden, die mit signifikanten Regressionskoeffizienten in das Modell eingehen und einen zusätzlichen Teil der Varianz aufklären, wird keine Korrektur des in Abschnitt 12.1.2 berechneten Basismodells vorgenommen. Die Kontrollvariablen erklären keinen bedeutsamen zusätzlichen Teil der Varianz. Im Hinblick auf die erhobenen Variablen ist das Basismodell bereits vollständig spezifiziert.
13.1.2 Einflussfaktoren für die Veränderung der a-priori-Interventionskompetenz Im berechneten Basismodell zum Vergleich der Veränderung der a-priori-Interventionskompetenz zwischen den Gruppen stellte die a-priori-Interventionskompetenz im Posttest die abhängige Variable und das Vorwissen (Pretestergebnisse) sowie die Dummy-Variablen zur Beschreibung der Gruppenzugehörigkeit die unabhängigen Variablen dar (vgl. Abschnitt 12.2.2). Im Basismodell liegt ein Ausreißer vor, der von der Analyse ausgeschlossen wurde. Aus diesem Grund wird er auch in den folgenden Analysen aus dem Datensatz entfernt, um eine Vergleichbarkeit zwischen den Modellen herzustellen. Die in der EG Münster festgestellten ClusterEffekte in Bezug auf die a-priori-Interventionskompetenz im Posttest führen auch in den folgenden Analysen zu verzerrten Signifikanztests und Konfidenzintervallen, was bei der Ergebnisinterpretation bedacht werden muss. Die Korrelationen der Kontrollvariablen mit der abhängigen Variablen werden in Tabelle 13.6 dargestellt.
Tabelle 13.6 Korrelationen der Kontrollvariablen mit a-priori-Interventionskompetenz im Posttest Konstrukt
Kontrollvariablen Skala im Pretest
Demographische Daten
Geschlecht
Korrelation 0.07 a
Sig. 0.40
−0.11
0.17
Semester
0.17
< 0.05
Praxiserfahrung
0.00
Abiturnote
0.98 (Fortsetzung)
334
13
Zusammenhangsanalysen
Tabelle 13.6 (Fortsetzung) Konstrukt
Kontrollvariablen Skala im Pretest
Korrelation
Sig.
Selbstberichtete Vorerfahrungen
Vorerf. Behandlung math. Mod.
−0.07
0.39
Vorerf. Lehre/Vorb. math. Mod.
0.00
0.96
Voref. Modellierungsaufgaben
−0.02
0.76
Vorerf. Math. Mod. im Unterricht
−0.19
< 0.05
Adaptive a-prioriInterventionskompetenz
Diagnose t1
0.37
< 0.001
Diagnose t2
0.51
< 0.001
Überzeugungen zum math. Mod.
Konstruktivistische Ü. t1
−0.04
0.61
Konstruktivistische Ü. t2
0.09
0.26
Transmissive Ü. t1
−0.22
< 0.01
Transmissive Ü. t2
−0.21
< 0.01
Ü. zur Anwendung math. Mod. t1
−0.02
0.82
Ü. zur Anwendung math. Mod. t2
0.14
0.07
Ü. zum math. Mod. in der Schule t1
0.08
0.28
Ü. zum math. Mod. in der Schule t2
0.25
< 0.001
Selbstwirksamkeits erwartungen zum math. Mod.
Swe. zum Modellieren t1
−0.16
Swe. zum Modellieren t2
0.05
0.56
Swe. zum math. Arbeiten t1
−0.14
0.07
Swe. zum math. Arbeiten t2
0.05
0.50
< 0.05
Anmerkung. Sig.: p-Wert, a Für kategoriale Variablen wurde die Korrelation nach Spearman verwendet.
Auch mit der a-priori-Interventionskompetenz im Posttest korrelieren weder die Abiturnote noch die Praxiserfahrung signifikant. Zudem liegt diesmal keine signifikante Korrelation mit dem Geschlecht vor. Bis auf die selbstberichteten Vorerfahrungen zum Modellieren im Unterricht stehen wiederum keine Vorerfahrung in einem signifikanten Zusammenhang mit der a-priori-Interventionskompetenz im Posttest. Die Diagnosekompetenz in Pre(r = 0.37, p < 0.001) und Posttest (r = 0.51, p < 0.001) korrelieren mit einem mittleren bis hohen Effekt, der signifikant nachgewiesen wird. Waren bei der Vorhersage der Diagnosekompetenz keine lerntheoretischen Überzeugungen relevant, so korrelieren die transmissiven Überzeugungen im Pre- (r = −0.22, p < 0.01) und Posttest (r = −0.21, p < 0.01) negativ mit der a-priori-Interventionskompetenz im
13.1 Einflussfaktoren für die Veränderungen
335
Posttest. Auch die Überzeugungen zum mathematischen Modellieren in der Schule im Posttest weisen einen signifikanten Zusammenhang auf (r = 0.25, p < 0.001). Die Selbstwirksamkeitserwartungen zum Modellieren im Pretest scheinen für die Vorhersage der a-priori-Interventionskompetenz im Posttest eine Rolle zu spielen (r = −0.16, p < 0.05), die Korrelation der Posttest-Variable ist jedoch nahe Null. Die Selbstwirksamkeitserwartungen zum mathematischen Arbeiten korrelieren für beide Messzeitpunkte nicht signifikant. Die Kontrollvariablen Semester, selbstberichtete Vorerfahrungen zum mathematischen Modellieren in der Schule, die Diagnosekompetenz und transmissive Überzeugungen in Pre- und Posttest sowie die Überzeugungen zum mathematischen Modellieren in der Schule im Posttest korrelieren signifikant mit der Skala »Intervention« im Posttest. Auch mit den Selbstwirksamkeitserwartungen zum Modellieren im Pretest wird eine signifikante Korrelation nachgewiesen. Diese Kontrollvariablen werden jeweils in ein lineares Modell aufgenommen. Die Analysen werden für die Kontrollvariablen aus Pre- und Posttest getrennt vorgenommen.
13.1.2.1 Einfluss von Pretest-Variablen für die Veränderung der a-priori-Interventionskompetenz Die signifikant korrelierenden Pretest-Variablen werden hinsichtlich ihrer Bedeutsamkeit für den Erwerb von a-priori-Interventionskompetenzen analysiert. In Tabelle 13.7 ist die Anpassungsgüte des jeweils um die Kontrollvariable im Pretest erweiterten linearen Modells dargestellt.
Tabelle 13.7 Modellanpassungen die um die Pretest-Variablen erweiterten Modelle zur Vorhersage der a-priori-Interventionskompetenz im Posttest Erweitertes Modell Basismodell
+ Semester
+ Vorerfahrungen zum Mod. im Unterricht
Quadratsumme Regression
df
65.00
3
Residuen
112.47
163
Gesamt
177.47
166
Regression
63.34
4
Residuen
112.13
162
Gesamt
177.47
166
Regression
68.74
4
Residuen
108.73
162
Gesamt
177.47
166
F
Sig.
R2
Teststärke
31.403
< 0.001
0.37
1.00
23.601
< 0.001
0.37
1.00
17.185
< 0.001
0.39
1.00
(Fortsetzung)
336
13
Zusammenhangsanalysen
Tabelle 13.7 (Fortsetzung) Erweitertes Modell + Diagnose kompetenz t1
Quadratsumme Regression
df
70.41
4
Residuen
107.06
162
Gesamt
177.47
166
+ Transmissive Überzeugungen t1
Regression
67.384
4
Residuen
110.088
162
Gesamt
177.472
166
+ Selbstwirksamkeitserwartungen zum Mod. t1
Regression
65.07
4
Residuen
112.21
161
Gesamt
177.28
165
F
Sig.
R2
Teststärke
26.363
< 0.001
0.40
1.00
24.790
< 0.001
0.38
1.00
16.871
< 0.001
0.38
1.00
Anmerkung. df: Freiheitsgrade, F: F-Wert, Sig.: p-Wert, R2 : Multipler Determinationskoeffizient
Die multiplen Determinationskoeffizienten weisen mit Werten zwischen R2 = 0.37 und R2 = 0.40 große Effekte nach und werden signifikant sowie mit einer hohen Teststärke (1 − βFehler ≈ 1) nachgewiesen. Die Modelle klären demnach zwischen 37 % und 40 % der Varianz in den Daten auf. Das um die Diagnosekompetenz im Pretest erweiterte Modell weist die höchste Anpassungsgüte, das um die Kontrollvariable Semester erweiterte Modell die geringste Anpassungsgüte auf. Da das Basismodell bereits eine Anpassungsgüte von R2 = 0.37 aufweist, klären alle Kontrollvariablen bis auf die Variable Semester zusätzlich zwischen 1 % und 3 % der Varianz in den Daten auf. In Tabelle 13.8 werden die Regressionskoeffizienten mit den zugehörigen Statistiken dargestellt. Das Vorwissen (Intervention t1) hat, wie bereits in Abschnitt 12.2.2 festgestellt, einen signifikanten mittleren bis großen Effekt bei der Vorhersage der Posttestergebnisse. Ist das Vorwissen um einen Logit größer, so sagen die Modelle eine durchschnittliche Steigerung zwischen B = 0.36 und B = 0.43 Logits im Posttest vorher. Die Kontrollvariable Semester hat einen verschwindenden Effekt bei der Vorhersage der a-priori-Interventionskompetenz im Posttest und wird nicht signifikant. Demnach führt ein höheres Hochschulsemester nicht dazu, dass die Studierenden einen größeren Zuwachs in ihrer a-priori-Interventionskompetenz erzielen als Studierende mit einem geringeren Hochschulsemester. Die Kontrollvariable Vorerfahrungen zum Modellieren im Unterricht (Vorerf. Mod.) hat mit β = −0.15 (p < 0.05) einen kleinen bis mittleren negativen Effekt. Geben die Studierenden größere Vorerfahrungen im Umfang einer Stufe auf der Likert-Skala an, so sagt das Modell einen durchschnittlich geringeren Zuwachs der
13.1 Einflussfaktoren für die Veränderungen
337
a-priori-Interventionskompetenz von B = −0.15 Logits vorher. Unterrichtliche Vorerfahrung mit Modellierungsaufgaben scheinen daher einen negativen Einfluss auf den Erwerb der a-priori-Interventionskompetenz zu haben. Die Diagnosekompetenz im Pretest (Diagnose t1) hat mit β = 0.19 (p < 0.01) ebenfalls einen kleinen bis mittleren Effekt bei der Vorhersage der a-priori-Interventionskompetenz im Posttest. Besitzen die Studierenden vor dem Treatment eine um einen Logit höhere Diagnosekompetenz, sagt das Modell einen höheren Zuwachs der a-priori-Interventionskompetenz im Umfang von B = 0.20 Logits vorher. Dieses Ergebnis ist ein Indiz für den Zusammenhang zwischen Diagnose- und a-priori-Interventionskompetenzen, der in Abschnitt 13.2.2 genauer untersucht wird.
Tabelle 13.8 Regressionskoeffizienten der um die Pretest-Variablen erweiterten Modelle zur Vorhersage der a-priori-Interventionskompetenz im Posttest Erweitertes Modell Basismodell
+ Semester
+ Vorerfahrungen zum Mod. im Unterricht
+ Diagnosekompetenz t1
Prädiktor
B
Konstante
SE von B
95 %-KI von B
β
t
Sig.
−0.44
0.14
−0.71; −0.17
Koblenz
0.70
0.18
0.35; 1.05
0.31
3.934
< 0.001
Münster
1.10
0.17
0.77; 1.42
0.53
6.628
< 0.001
Intervention t1
0.42
0.06
0.30; 0.55
0.41
6.605
< 0.001
−0.51
0.17
−0.85; −0.18
Koblenz
0.68
0.18
0.32; 1.03
0.31
3.748
< 0.001
Münster
1.05
0.18
0.69; 1.40
0.51
5.750
< 0.001
Intervention t1
0.43
0.07
0.30; 0.56
0.42
6.632
< 0.001
Semester
0.02
0.02
−0.03; 0.06
0.06
0.700
0.49
−0.29
0.15
−0.59; 0.01
Koblenz
0.68
0.18
0.34; 1.03
0.31
3.904
< 0.001
Münster
1.12
0.16
0.80; 1.44
0.54
6.848
< 0.001
Intervention t1
0.40
0.06
0.28; 0.53
0.39
6.295
< 0.001
Vorerf. Mod.
−0.15
0.06
−0.27; −0.02
−0.15
−2.360
< 0.05
Konstante
−0.31
0.14
−0.59; −0.03
−2.182
< 0.05
Koblenz
0.61
0.18
0.26; 0.96
0.28
3.467
< 0.001
Münster
1.03
0.16
0.71; 1.35
0.50
6.284
< 0.001
Intervention t1
0.36
0.07
0.22; 0.49
0.35
5.285
< 0.001
Diagnose t1
0.20
0.07
0.06; 0.34
0.19
2.861
< 0.01
Konstante
Konstante
−3.225
−3.004
−1.942
< 0.01
< 0.01
0.05
(Fortsetzung)
338
13
Zusammenhangsanalysen
Tabelle 13.8 (Fortsetzung) Erweitertes Modell
Prädiktor
95 %-KI von B
−0.12
0.22
−0.55; 0.32
0.68
0.18
0.33; 1.03
0.31
3.849
< 0.001
Münster
1.09
0.16
0.77; 1.42
0.53
6.658
< 0.001
Intervention t1
0.40
0.07
0.27; 0.53
0.39
6.052
< 0.001
−0.18
0.10
−0.38; 0.01
−0.12
−1.872
0.06
Konstante
0.13
0.33
−0.53; 0.79
0.395
0.69
Koblenz
0.70
0.18
0.31
3.943
< 0.001
Münster
1.08
0.17
0.52
6.579
< 0.001
Intervention t1
0.42
0.06
0.30; 0.55
0.41
6.651
< 0.001
−0.23
0.12
−0.47; 0.01
−0.12
−1.883
Trans. Ü. t1 + Selbstwirksamkeitserwartungen zum Mod. t1
β
SE von B
+ Transmissive Konstante Überzeugungen t1 Koblenz
Swe. Mod. t1
B
0.35; 1.05 0.76; 1.41
t
Sig.
−0.536
0.59
0.06
Anmerkung. B: Regressionskoeffizient, SE von B: Standardfehler von B, 95 %-KI von B: 95 %Konfidenzintervall von B, β: standardisierter Regressionskoeffizient, t: t-Wert, Sig.: p-Wert
Die transmissiven Überzeugungen im Pretest (trans. Ü. t1) sind kein signifikanter Prädiktor der a-priori-Interventionskompetenz im Posttest. Der mit β = −0.12 (p = 0.06) kleine Effekt wird jedoch auf dem 0.10-Niveau nachgewiesen. Sind die Zustimmungswerte zu transmissiven Überzeugungen um eine Stufe auf der LikertSkala größer, führt dies in der Modellvorhersage zu einem durchschnittlich um B = −0.18 Logits niedrigeren Zuwachs der a-priori-Interventionskompetenzen. Es ist demnach eine Tendenz erkennbar, dass höhere transmissive Überzeugungen vor den Treatments mit geringeren Fähigkeitszuwächsen in der a-priori-Interventionskompetenz einher gehen. Der kleine negative Effekt der Kontrollvariablen Selbstwirksamkeitserwartungen zum Modellieren im Pretest (Swe. Mod. t1; β = −0.12, p = 0.06) wird ebenfalls nur auf einem 0.10-Niveau nachgewiesen. Um eine Stufe auf der Likert-Skala höhere Selbstwirksamkeitserwartungen vor dem Treatment gehen tendenziell mit einer um 0.20 Logits niedrigeren a-priori-Interventionskompetenz nach dem Treatment einher. Eine hohe Selbstwirksamkeit scheint damit tendenziell einen negativen Einfluss auf den Erwerb von a-priori-Interventionskompetenzen zu haben. Der Effekt kann jedoch nicht signifikant nachgewiesen werden. Aus Tabelle 13.7 und Tabelle 13.8 sowie im Vergleich zum Basismodell wird ersichtlich, dass die Vorerfahrungen zum Modellieren im Unterricht und die Diagnosekompetenz im Pretest die a-priori-Interventionskompetenz im Posttest mit einem signifikanten Regressionskoeffizienten vorhersagen und dabei jeweils zusätzlich zwischen 2 % und 3 % der Varianz aufklären. Das Vorwissen (Intervention t1) geht
13.1 Einflussfaktoren für die Veränderungen
339
in allen Modellen mit einem signifikanten Regressionskoeffizienten von mindestens β = 0.36 in die Vorhersage der a-priori-Interventionskompetenz im Posttest mit ein. Resultat 2 zu Forschungsfrage 5
Das Vorwissen der Studierenden, d.h. die a-priori-Interventionskompetenz im Pretest, ist ein bedeutsamer Einflussfaktor für die a-priori-Interventionskompetenz im Posttest. Das Vorwissen hat einen mittleren bis großen Effekt. Zudem gehen höhere Vorerfahrungen zum Modellieren im Unterricht mit niedrigeren Zuwächsen in der a-priori-Interventionskompetenz einher. Studierende, die Erfahrung mit Modellierungsprozessen im Unterricht haben, haben nach dem Treatment eine geringere a-priori-Interventionskompetenz als Probanden ohne Vorerfahrungen. Die unterrichtlichen Vorerfahrungen haben einen kleinen negativen Effekt. Die Diagnosekompetenzen im Pretest sind ein bedeutsamer Prädiktor für den Erwerb von a-priori-Interventionskompetenzen. Höhere diagnostische Kompetenzen vor dem Treatment führen demnach zu höheren Zuwächsen in der a-priori-Interventionskompetenz. Für die Diagnosekompetenz im Pretest wird ein mittlerer Effekt nachgewiesen. Für die übrigen Personenmerkmale konnte kein Zusammenhang mit dem Erwerb der a-priori-Interventionskompetenz festgestellt werden.
13.1.2.2 Einfluss von Posttest-Variablen für die Veränderung der a-priori-Interventionskompetenz Die signifikant korrelierenden Posttest-Variablen werden hinsichtlich ihres Einflusses auf die a-priori-Interventionskompetenz im Posttest untersucht, um sie im Falle ihrer Bedeutsamkeit zu einer korrigierten Schätzung der Treatmenteffekte in das Basismodell mit aufzunehmen. In Tabelle 13.9 ist die Anpassungsgüte der jeweils um die Kontrollvariable im Posttest erweiterten linearen Modelle dargestellt. Die multiplen Determinationskoeffizienten weisen mit Werten zwischen R2 = 0.37 und R2 = 0.39 große Effekte nach und werden signifikant sowie mit einer hohen Teststärke (1−βFehler ≈ 1) nachgewiesen. Die Modelle klären demnach zwischen 37 % und 39 % der Varianz in den Daten auf. Das um die Diagnosekompetenz im Posttest erweiterte Modell weist die höchste Anpassungsgüte, das um die Kontrollvariable der transmissiven Überzeugungen im Posttest erweiterte Modell die geringste Anpassungsgüte auf. Da das Basismodell bereits eine Anpassungsgüte von R2 = 0.37 aufweist, werden zusätzlich zwischen 0 % und 2 % der Varianz aufgeklärt.
340
13
Zusammenhangsanalysen
Tabelle 13.9 Modellanpassungen die um die Posttest-Variablen erweiterten Modelle zur Vorhersage der a-priori-Interventionskompetenz im Posttest Erweitertes Modell Basismodell
+ Diagnosekompetenz t2
Quadratsumme Regression
65.00
3
Residuen
112.47
163
Gesamt
177.47
166
Regression
70.01
4
Residuen
107.47
162
Gesamt
177.47
166
+ Transmissive Regression ÜberzeugunResiduen gen t2 Gesamt + Ü. zur math. Mod. in der Schule t2
df
Regression
65.62
4
111.85
162
177.47
166
66.97
4
Residuen
110.50
162
Gesamt
177.47
166
F
Sig.
R2
Teststärke
31.403
< 0.001
0.37
1.00
25.382
< 0.001
0.39
1.00
23.762
< 0.001
0.37
1.00
24.547
< 0.001
0.38
1.00
Anmerkung. df: Freiheitsgrade, F: F-Wert, Sig.: p-Wert, R2 : Multipler Determinationskoeffizient
In Tabelle 13.10 werden die Regressionskoeffizienten mit den zugehörigen Statistiken dargestellt. Die Diagnosekompetenz im Posttest (Diagnose t2) hat im Vergleich zur Diagnosekompetenz im Pretest mit β = 0.23 (p < 0.01) einen noch größeren Effekt bei der Vorhersage der a-priori-Interventionskompetenz im Posttest. Eine um einen Logit größere Diagnosekompetenz nach dem Treatment geht unter Kontrolle des Vorwissens und der Gruppenzugehörigkeit mit einer durchschnittlich größeren a-priori-Interventionskompetenz von B = 0.21 Logits im Posttest einher. Durch die Aufnahme dieser Kontrollvariable wird der Einfluss der durch die Treatments gesteigerten Diagnosekompetenz auf die a-priori-Interventionskompetenz im Posttest kontrolliert. Aufgrund der hohen latenten Korrelation zwischen den Teilkompetenzen (vgl. Abschnitt 11.1) kann ein Zusammenhang vermutet werden. Dieser Zusammenhang zwischen den Teilkompetenzen wird tiefergehend in Abschnitt 13.2.2.1 analysiert.
13.1 Einflussfaktoren für die Veränderungen
341
Tabelle 13.10 Regressionskoeffizienten der um die Pretest-Variablen erweiterten Modelle zur Vorhersage der a-priori-Interventionskompetenz im Posttest Erweitertes Modell Basismodell
+ Diagnosekompetenz t2
+ Transmissive Überzeugungen t2
+ Ü. zum math. Mod. in der Schule t2
Prädiktor
B
Konstante
SE von B
95 %-KI von B
β
t
Sig.
−0.44
0.14
−0.71; −0.17
Koblenz
0.70
0.18
0.35; 1.05
0.31
3.934
< 0.001
Münster
1.10
0.17
0.77; 1.42
0.53
6.628
< 0.001
Intervention t1
0.42
0.06
0.30; 0.55
0.41
6.605
< 0.001
−0.27
0.15
−0.56; 0.03
Koblenz
0.44
0.20
0.05; 0.83
Münster
0.71
0.21
Intervention t1
0.37
0.07
Diagnose t2
0.21
Konstante
−3.225
< 0.01
−1.803
0.07
0.20
2.220
< 0.05
0.29; 1.14
0.34
3.318
< 0.001
0.24; 0.50
0.36
5.546
< 0.001
0.08
0.06; 0.36
0.23
2.746
< 0.01
−0.30
0.20
−0.70; 0.09
Koblenz
0.70
0.18
0.35; 1.05
0.32
3.956
< 0.001
Münster
1.07
0.17
0.73; 1.40
0.52
6.328
< 0.001
Intervention t1
0.41
0.07
0.28; 0.54
0.40
6.317
< 0.001
Trans. Ü. t2
−0.10
0.10
−0.30; 0.11
−0.06
−0.947
0.35
Konstante
−1.25
0.50
−2.23; −0.27
−2.522
< 0.05
Koblenz
0.68
0.18
0.34; 1.03
0.31
3.842
< 0.001
Münster
1.01
0.17
0.67; 1.35
0.49
5.845
< 0.001
Intervention t1
0.42
0.06
0.29; 0.54
0.41
6.549
< 0.001
Ü. Mod. t2
0.24
0.14
−0.04; 0.52
0.11
1.699
0.09
Konstante
−1.529
0.13
Anmerkung. B: Regressionskoeffizient, SE von B: Standardfehler von B, 95 %-KI von B: 95 %Konfidenzintervall von B, β: standardisierter Regressionskoeffizient, t: t-Wert, Sig.: p-Wert
Die transmissiven Überzeugungen im Posttest (trans. Ü. t2) sind kein signifikanter Prädiktor der a-priori-Interventionskompetenz im Posttest. Inwiefern Studierende transmissiven Überzeugungen nach dem Treatment zustimmen hat somit keine Auswirkungen auf ihre a-priori-Interventionskompetenz im Posttest. Die Überzeugungen zum mathematischen Modellieren in der Schule im Posttest (Ü. Mod. t2) werden mit β = 0.11 (p = 0.09) auf dem 0.10-Niveau nachgewiesen. Wird das mathematische Modellieren nach dem Treatment als ein berechtigter Bestandteil von Mathematikunterricht angesehen, geht dies tendenziell mit einer höheren a-priori-Interventionskompetenz im Rahmen eines kleinen Effekts einher. Dabei handelt es sich jedoch um eine Tendenz, die nicht sicher belegt werden kann. In Tabelle 13.9 und Tabelle 13.10 ist zu erkennen, dass auch die Diagnosekompetenz im Posttest die a-priori-Interventionskompetenz im Posttest vorhersagt und
342
13
Zusammenhangsanalysen
zusätzlich 2 % der Varianz in den Daten aufklärt. Die drei identifizierten bedeutsamen Kontrollvariablen – die Vorerfahrungen zum Modellieren im Unterricht, die Diagnosekompetenz im Pretest und die Diagnosekompetenz im Posttest – haben einen Einfluss bei der Vorhersage der a-priori-Interventionskompetenz im Posttest. Die standardisierten Regressionskoeffizienten des Vorwissens (Intervention t1) und der Gruppen-Variablen (Koblenz, Münster) variieren zwischen den um die prädiktiven Kontrollvariablen erweiterten Modelle und im Vergleich zum Basismodell. Insbesondere die Aufnahme der Diagnosekompetenz in Pre- oder Posttest führt im Vergleich zum Basismodell zu einer Verkleinerung der Regressionskoeffizienten der Gruppen-Variablen (Koblenz, Münster). Mit Abstand am stärksten ist dieser Effekt bei Aufnahme der Diagnosekompetenz im Posttest. Die Verkleinerung der Regressionskoeffizienten kommt zustande, da die Diagnosekompetenz im Posttest gemeinsame Varianzanteile mit den Gruppen-Variablen aufweist, die gegenseitig auspartialisiert werden (vgl. Abschnitt 10.6.2). Daraus lässt sich schlussfolgern, dass die durch die Treatments gesteigerte Diagnosekompetenz im Posttest zum Teil für die im Basismodell festgestellte Steigerung der a-priori-Interventionskompetenz verantwortlich ist. Diese Argumentation ist auf die anderen beiden prädiktiven Kontrollvariablen übertragbar, wenngleich für diese geringere Auswirkungen auf die Regressionskoeffizienten zu beobachten sind. Aus diesem Grund wird für die apriori-Interventionskompetenz ein um die prädiktiven Kontrollvariablen erweitertes Modell berechnet, um die Schätzung der Effekte der Treatments zu korrigieren.
13.1.3 Korrigierte Schätzung der Veränderungen Die prädiktiven Kontrollvariablen werden in das Basismodell aufgenommen, um eine korrigierte Schätzung der Treatmenteffekte vorzunehmen. Dazu werden die Kontrollvariablen mit signifikanten Regressionskoeffizienten nach dem Vorwärtsverfahren (vgl. Abschnitt 10.6.1) in das Basismodell aufgenommen. In Abschnitt 13.1.1.2 wurde festgestellt, dass das Basismodell zum Vergleich der Veränderungen der Diagnosekompetenz zwischen den Versuchsgruppen in Bezug auf die erhobenen Kontrollvariablen bereits vollständig spezifiziert ist und daher keine korrigierte Berechnung vorgenommen wird. Für die Vorhersage der a-priori-Interventionskompetenz im Posttest wurden in Abschnitt 13.1.2.2 die zusätzlichen prädiktiven Kontrollvariablen Vorerfahrungen zum Modellieren im Unterricht und die Diagnosekompetenz in Pre- und Posttest identifiziert. Nachfolgend wird daher ausschließlich eine korrigierte Berechnung der Effekte in Bezug auf die a-priori-Interventionskompetenz vorgenommen. In Tabelle 13.11 sind die Änderungen der Partialkorrelationen der Prädiktoren mit dem Kriterium und des multiplen Determinationskoeffizienten bei der
13.1 Einflussfaktoren für die Veränderungen
343
schrittweisen Aufnahme der Kontrollvariablen in das Modell dargestellt. Bei Auspartialisierung der im Basismodell befindlichen Prädiktoren korrelieren die Diagnosekompetenz im Pretest (rP = 0.22, p < 0.01) und im Posttest (rP = 0.21, p < 0.01) nahezu gleich stark mit dem Kriterium. Die Diagnosekompetenz im Pretest korreliert betragsmäßig am stärksten und wird als erstes in das Modell aufgenommen. Der multiple Determinationskoeffizient R2 nimmt signifikant um 0.030 (p < 0.01) zu, sodass zusätzlich 3 % der Varianz in den Daten aufgeklärt wird. Die Partialkorrelationen der Vorerfahrungen zum Modellieren im Unterricht und insbesondere die Partialkorrelation der Diagnosekompetenz im Posttest sinken nach Aufnahme der Diagnosekompetenz im Pretest. Tabelle 13.11 Änderungen der Partialkorrelationen und des multiplen Determinationskoeffizienten durch das Vorwärtsverfahren Modell
Prädiktor
Partialkorrelation
Sig.
Basismodell
Vorerf. Mod.
−0.18
< 0.05
0.22
< 0.01
Diagnose t1 Diagnose t2
0.21
< 0.01
−0.16
< 0.05
Diagnose t2
0.12
0.13
Diagnose t2
0.12
0.13
+ Diagnose kompetenz t1
Vorerf. Mod.
+ Diagnosekompetenz t1 + Vorerf. zum Mod. im Unterricht
R2
F
df
Sig.
0.030
8.185
1, 162
< 0.01
0.015
4.158
1, 161
< 0.05
Anmerkung. Sig.: p-Wert der Partialkorrelation, R2 : Änderung des multiplen Determinationskoeffizienten, F: Änderung des F-Werts, df: Freiheitsgrade des Zählers und des Nenners der Prüfgröße F, Sig.: p-Wert der Änderung des multiplen Determinationskoeffizienten
Mit der betragsmäßig größten Partialkorrelation (rP = −0.16, p < 0.05) wird als nächstes die Kontrollvariable Vorerfahrungen zum Modellieren in das Modell aufgenommen. Der multiple Determinationskoeffizient nimmt wiederum signifikant um 0.015 zu (p < 0.05) und es werden zusätzlich 1,5 % der Varianz in den Daten aufgeklärt. Die Diagnosekompetenz im Posttest korreliert unter Kontrolle der im Modell befindlichen Prädiktoren nun nicht mehr signifikant (rP = 0.12, p < 0.13). Sie klärt keine zusätzliche Varianz des Kriteriums auf und wird daher nicht in das Modell aufgenommen. Das um die Vorerfahrungen zum Modellieren im Unterricht und die Diagnosekompetenz im Pretest erweiterte Basismodell ist in Bezug auf
344
13
Zusammenhangsanalysen
die erhobenen Kontrollvariablen daher das Modell, das am meisten Varianz in den Daten aufklärt. Aufgrund einer hohen Korrelation zwischen der Diagnosekompetenz im Pre- und Posttest (r = 0.53, p < 0.001) würde bei Aufnahme beider Variablen Multikollinearität vorliegen. Um auch den Einfluss der Kontrolle der Diagnosekompetenz im Posttest auf die Treatmenteffekte abschätzen zu können, wird ein weiteres Modell nach dem Einschlussverfahren berechnet, bei dem die Diagnosekompetenz im Posttest anstatt der Diagnosekompetenz im Pretest in das Modell aufgenommen wird. Da die Korrelationen der Diagnosekompetenz in Pre- und Posttest mit der a-priori-Interventionskompetenz im Posttest vor der Aufnahme in das Modell ca. den gleichen Betrag haben (vgl. Tabelle 13.11, Basismodell), ist diese Vorgehensweise legitim. In Tabelle 13.12 ist die Anpassungsgüte der um die Kontrollvariablen erweiterten linearen Modelle im Vergleich zum Basismodell dargestellt. Die multiplen Determinationskoeffizienten der erweiterten Modelle weisen mit R2 = 0.41 einen großen Effekt nach und werden signifikant sowie mit einer hohen Teststärke (1−βFehler ≈ 1) nachgewiesen. Die Modelle klären demnach 41 % der Varianz in den Daten auf. Da das Basismodell bereits eine Anpassungsgüte von R2 = 0.37 aufweist, klären die erweiterten Modelle zusätzlich 4 % der Varianz in den Daten auf. Die Zunahme der Varianzaufklärung ist jeweils signifikant (vgl. Tabelle 13.11).
Tabelle 13.12 Modellanpassungen der um die prädiktiven Kontrollvariablen korrigierten Regressionen Erweitertes Modell Basismodell
Quadratsumme Regression
df
65.00
3
Residuen
112.47
163
Gesamt
177.47
166
+ Diagnosekompetenz t1 + Vorerf. Zum Mod. im Unterricht
Regression
73.11
5
Residuen
104.36
161
Gesamt
177.47
166
+ Diagnosekompetenz t2 + Vorerf. Zum Mod. im Unterricht
Regression
73.25
5
Residuen
104.22
161
Gesamt
177.47
166
F
Sig.
R2
Teststärke
31.403
< 0.001
0.37
1.00
22.56
< 0.001
0.41
1.00
31.403
< 0.001
0.41
1.00
Anmerkung. df: Freiheitsgrade, F: F-Wert, Sig.: p-Wert, R2 : Multipler Determinationskoeffizient
13.1 Einflussfaktoren für die Veränderungen
345
In Tabelle 13.13 werden die Regressionskoeffizienten und die zugehörigen Statistiken dargestellt. Die Diagnosekompetenz im Pretest (Diagnose t1) sagt mit β = 0.17 (p < 0.001) mit einem kleinen bis mittleren Effekt die a-priori-Interventionskompetenz im Posttest vorher. Die Vorerfahrungen zum Modellieren im Unterricht (Vorerf. Mod.) sagen mit einem kleinen negativen Effekt (β = −0.13, p < 0.05) die a-priori-Interventionskompetenz im Posttest vorher. Das Konfidenzintervall des zugehörigen unstandardisierten Regressionskoeffizienten B lässt erkennen, dass die Vorerfahrungen mit hoher Wahrscheinlichkeit mit einem negativen Vorzeichen in die Vorhersage der a-priori-Interventionskompetenz im Posttest eingehen. Die zuvor in den separaten Regressionen festgestellten Ergebnisse (vgl. Abschnitt 13.1.2.1) werden für die beiden Kontrollvariablen bestätigt. Tabelle 13.13 Regressionskoeffizienten der um die prädiktiven Kontrollvariablen korrigierten Regressionen β
Erweitertes Modell
Prädiktor
B
SE von B
95 %-KI von B
Basismodell
Konstante
−0.44
0.14
−0.71; −0.17
Koblenz
0.70
0.18
0.35; 1.05
0.31
3.934
< 0.001
Münster
1.10
0.17
0.77; 1.42
0.53
6.628
< 0.001
Intervention t1
0.42
0.06
0.30; 0.55
0.41
6.605
< 0.001
−0.19
0.15
−0.49; 0.11
Koblenz
0.61
0.17
0.26; 0.95
0.27
3.476
< 0.001
Münster
1.05
0.16
0.73; 1.38
0.51
6.485
< 0.001
Intervention t1
0.34
0.07
0.21; 0.48
0.34
5.138
< 0.001
Diagnose t1
0.18
0.07
0.04; 0.32
0.17
2.596
< 0.001
Vorerf. Mod.
−0.13
0.06
−0.25; 0.00
−0.13
Konstante
−0.14
0.16
−0.45; 0.18
Koblenz
0.44
0.20
0.05; 0.82
Münster
0.75
0.21
Intervention t1
0.35
0.07
Diagnose t2
0.20 −0.14
+ Diagnosekompetenz t1 + Vorerf. Zum Mod. im Unterricht
+ Diagnosekompetenz t2 + Vorerf. Zum Mod. im Unterricht
Konstante
Vorerf. Mod.
t
Sig.
−3.225
< 0.01
−1.267
−2.039
0.21
< 0.05
−0.854
0.39
0.20
2.243
< 0.05
0.33; 1.17
0.36
3.536
< 0.001
0.22; 0.48
0.34
5.315
< 0.001
0.08
0.05; 0.35
0.22
2.639
< 0.01
0.06
−0.26; −0.02
−0.14
−2.238
< 0.05
Anmerkung. B: Regressionskoeffizient, SE von B: Standardfehler von B, 95 %-KI von B: 95 %Konfidenzintervall von B, β: standardisierter Regressionskoeffizient, t: t-Wert, Sig.: p-Wert
Ähnliche Ergebnisse lassen sich im zweiten Modell erkennen, in dem die Diagnosekompetenz im Posttest (Diagnose t2) anstatt der Diagnosekompetenz im Pretest einen Prädiktor darstellt. Die Effekte der Kontrollvariablen sind betragsmäßig größer. Insbesondere hat die Diagnosekompetenz im Posttest einen größeren
346
13
Zusammenhangsanalysen
Effekt bei der Vorhersage der a-priori-Interventionskompetenz im Posttest als die Diagnosekompetenz im Pretest im vorherigen Modell. Vergleicht man die Regressionskoeffizienten der Gruppen-Variablen (Koblenz, Münster), die den Effekt der Treatments im Vergleich zur Kontrollgruppe angeben, so sind die Effekte bei zusätzlicher Kontrolle der Diagnosekompetenz im Posttest deutlich geringer als unter Kontrolle der Diagnosekompetenz im Pretest. Die Diagnosekompetenz im Posttest ist damit erwartungskonform in größerem Umfang für den Zuwachs der a-priori-Interventionskompetenz verantwortlich als die Diagnosekompetenz im Pretest. Es kann an dieser Stelle zumindest eine partielle Mediation (Bühner & Ziegler, 2009, S. 692) der Diagnosekompetenz im Posttest auf die apriori-Interventionskompetenz im Posttest vermutet werden. Dies ist jedoch anhand einer Mediationsanalyse zu belegen.1 Die Differenz der Effekte in der EG Koblenz und Münster im Vergleich zur Kontrollgruppe wird anhand eines t-Tests auf Signifikanz überprüft. Unter Kontrolle der Diagnosekompetenz im Pretest wird für die Differenz der Regressionskoeffizienten der Gruppen-Variablen β = 0.24 ein signifikanter Unterschied (t(165) = 2.217, p < 0.05) im Umfang eines kleinen bis mittleren Effekts nachgewiesen. Unter Kontrolle der Diagnosekompetenz im Posttest wird bei einer Differenz der Regressionskoeffizienten von β = 0.16 jedoch kein signifikanter Unterschied (t(165) = 1.605, p = 0.11) zwischen den Gruppen nachgewiesen. Der kleine bis mittlere Effekt zwischen den Gruppen ist nicht überzufällig. Da beide Modelle eine vergleichbare Modellanpassung besitzen, die Effekte der Kontrollvariablen im um die Diagnosekompetenz im Posttest erweiterten Modell jedoch höher sind, wird dieses zur korrigierten Schätzung der Treatmenteffekte verwendet. Auch aus einer theoretischen Perspektive erscheint es sinnvoller zur Bestimmung möglichst korrekter Regressionskoeffizienten die Diagnosekompetenz zu genau dem Zeitpunkt zu kontrollieren, zu dem die a-priori-Interventionskompetenz vorhergesagt werden soll. Im korrigierten Modell liegen, obwohl sich die Effekte durch die Kontrolle der Diagnosekompetenz im Posttest erheblich verringert haben, weiterhin ein kleiner bis mittlerer Effekt in der EG Koblenz und ein mittlerer Effekt in der EG Münster im Vergleich zur Kontrollgruppe und unter Kontrolle des Vorwissens vor. Die Differenz der Effektstärken der Gruppen-Variablen im Basismodell beträgt β = 0.22 (t(165) = 2.700, p < 0.01). Die Differenz ist im korrigierten Modell daher mit β = 0.16 (t(165) = 1.605, p = 0.11) deutlich geringer und kann nicht 1 In einer ersten Analyse erweist sich die Diagnosekompetenz im Posttest als ein signifikanter
Mediator der a-priori-Interventionskompetenz im Posttest. Dieses Ergebnis ist jedoch anhand weiterer Analysen abzusichern.
13.2 Zusammenhänge zwischen den Konstrukten
347
länger signifikant nachgewiesen werden. Die unterschiedlichen Effekte, die die standardisierten Regressionskoeffizienten angeben, können daher zufällig bedingt sein. In diesem Fall hätten die Studierenden in den Experimentalgruppen ihre a-prioriInterventionskompetenz nicht in unterschiedlichem Maße verbessert. Gleichzeitig muss jedoch festgehalten werden, dass die differenten Effekte in den Treatments nicht vollständig durch die erhobenen Kontrollvariablen aufgeklärt werden können. Die Varianzaufklärung wird jedoch um 4 % gesteigert. Tendenziell liegt selbst im korrigierten Modell in der EG Münster ein größerer Effekt vor, obwohl in der EG Koblenz ein größerer Zuwachs der a-priori-Interventionskompetenz zu erwarten gewesen wäre. Resultat 3 zu Forschungsfrage 2
Auch unter Kontrolle prädiktiver Kontrollvariablen wird die Förderung der adaptiven a-priori-Interventionskompetenz durch universitäre fachdidaktische Seminare mit Praxiselementen bestätigt. Die mittleren bis großen Effekte auf die Diagnosekompetenz der Studierenden bleiben unverändert bestehen. In der EG Münster werden dabei deutlich größere Effekte festgestellt als in der EG Koblenz. Bei der Förderung der a-priori-Interventionskompetenz verringern sich die Effektstärken unter Kontrolle prädiktiver Kontrollvariablen zu kleinen bis mittleren Effekten. Unter Kontrolle der prädiktiven Kontrollvariablen lassen sich im korrigierten Modell keine signifikanten Unterschiede zwischen der Entwicklung in der EG Koblenz und Münster feststellen. Tendenziell ist ein größerer Effekt in der EG Münster festzustellen.
13.2
Zusammenhänge zwischen den Konstrukten
Bei der Analyse von Einflussfaktoren wurden Zusammenhänge zwischen den Teilkompetenzen der adaptiven a-priori-Interventionskompetenz im Posttest und den Pre- oder Posttest-Skalen von Facetten der professionellen Kompetenz zum Lehren mathematischen Modellierens entdeckt. In diesem Kapitel werden anhand von FirstDifference Modellen die Informationen der Pre- und Posttestdaten verwendet, um Zusammenhänge zwischen den Konstrukten zu identifizieren. In diesen Modellen werden nur die Unterschiede zwischen den Messzeitpunkten, d.h. Veränderungen innerhalb der Probanden (Within-Varianz), zur Berechnung der Zusammenhänge verwendet. Unterschiede zwischen den Probanden (Between-Varianz) werden im
348
13
Zusammenhangsanalysen
Modell nicht berücksichtigt (vgl. Abschnitt 10.6.5). Zusammenhänge zwischen den Überzeugungen und Selbstwirksamkeitserwartungen zum mathematischen Modellieren und den jeweiligen Teilkompetenzen werden getrennt analysiert. Der Zusammenhang zwischen der Diagnose- und a-priori-Interventionskompetenz wird in Abschnitt 13.2.2.1 bestimmt, in dem auch die Zusammenhänge mit der a-priori-Interventionskompetenz untersucht werden. Die Vorgehensweise bei der Berechnung der First-Difference-Modelle ähnelt der bei der Analyse potentieller Einflussfaktoren (vgl. Abschnitt 13.1), wobei die Zusammenhänge in diesem Kapitel anhand von Differenzwerten bestimmt werden. Es werden zunächst potentiell prädiktive Variablen anhand von bivariaten Korrelationen identifiziert. Im Anschluss werden mit diesen Variablen First-Difference-Modelle berechnet.
13.2.1 Zusammenhänge mit der Diagnosekompetenz Nachfolgend werden Zusammenhänge zwischen den Skalen der Überzeugungen und Selbstwirksamkeitserwartungen zum mathematischen Modellieren und der Diagnosekompetenz bestimmt. Dabei stellt die Differenz der Diagnosekompetenz zwischen Pre- und Posttest stets die abhängige Variable und die Differenz des jeweiligen Prädiktors zwischen den Messzeitpunkten die unabhängige Variable dar. Zur Selektion potentiell bedeutsamer Prädiktoren werden in Tabelle 13.14 die Korrelationen zwischen den Differenzskalen der Überzeugungen und Selbstwirksamkeitserwartungen zum mathematischen Modellieren und der Diagnosekompetenz dargestellt. Tabelle 13.14 Korrelationen der Differenzskalen der Facetten professioneller Kompetenz zum Lehren mathematischen Modellierens und der Diagnosekompetenz Konstrukt
Differenzskala
Überzeugungen zum math. Mod.
Konstruktivistische Ü.
0.08
0.28
−0.15
< 0.05
Ü. zur Anwendung math. Mod.
0.00
1.00
Ü. zur math. Mod. in der Schule
0.15
0.05
0.25
< 0.001
0.29
< 0.001
Transmissive Ü.
Selbstwirksamkeitserwartungen Swe. zum Modellieren zum math. Mod. Swe. zum math. Arbeiten Anmerkung. Sig.: p-Wert
Korrelation Sig.
13.2 Zusammenhänge zwischen den Konstrukten
349
Die transmissiven Überzeugungen korrelieren negativ und signifikant mit der Diagnosekompetenz im Umfang eines kleinen Effekts (r = −0.15, p < 0.05). Hohe Zustimmungswerte in den transmissiven Überzeugungen gehen mit einer niedrigen Diagnosekompetenz einher. Die Selbstwirksamkeitserwartungen zum Modellieren und zum mathematischen Arbeiten korrelieren ebenfalls signifikant (p < 0.001) mit der Diagnosekompetenz. Die Korrelationen haben die Bedeutsamkeit eines mittleren Effekts. Hohe Selbstwirksamkeitserwartungen zum mathematischen Modellieren gehen mit hohen Diagnosekompetenzen einher. Für diese potentiell bedeutsamen Prädiktoren werden jeweils einfache First-Difference-Modelle berechnet.
13.2.1.1 Zusammenhänge zwischen Überzeugungen zum mathematischen Modellieren und der Diagnosekompetenz In Tabelle 13.15 ist die Anpassungsgüte des einfachen linearen Modells aufgeführt, in dem die transmissiven Überzeugungen den Prädiktor darstellen. Der Determinationskoeffizient weist mit R2 = 0.02 einen kleinen Effekt nach und wird signifikant nachgewiesen. Das Modell klärt gerade einmal 2 % der Varianz in den Daten auf. Die Teststärke ist gering, sodass ein signifikanter Unterschied von Null nicht bestätigt werden kann. Tabelle 13.15 Modellanpassung des First-Difference-Modells zum Zusammenhang zwischen Überzeugungen zum mathematischen Modellieren und der Diagnosekompetenz Modell
Quadratsumme
Transmissive Regression 4.326 Ü. Residuen 178.42 Gesamt
182.75
df
F
Sig.
R2
Teststärke
1 4.025 < 0.05 0.02 0.45 166 167
Anmerkung. df: Freiheitsgrade, F: F-Wert, Sig.: p-Wert, R2 : Determinationskoeffizient
In Tabelle 13.16 werden die Regressionskoeffizienten mit den zugehörigen Statistiken dargestellt. Um eine Stufe auf der Likert-Skala höhere Zustimmungswerte zu den transmissiven Überzeugungen (trans Ü.) gehen mit durchschnittlich B = −0.24 Logits niedrigeren Diagnosekompetenzen einher. Studierende, die eher ein behavioristisches Lehr-Lern-Verständnis prägt und die die Lehrperson im Zentrum von Unterricht sehen, haben durchschnittlich geringere Diagnosekompetenzen. Da die transmissiven Überzeugungen nur einen geringen Teil der Varianz in den Daten aufklären, was nicht anhand einer ausreichenden Teststärke bestätigt wird, sind sie für die Vorhersage der Diagnosekompetenz wenig bedeutsam.
350
13
Zusammenhangsanalysen
Tabelle 13.16 Regressionskoeffizient des First-Difference-Modells zum Zusammenhang zwischen Überzeugungen zum mathematischen Modellieren und der Diagnosekompetenz Modell
Prädiktor
Transmissive Ü.
Konstante Trans. Ü.
B
SE von B
95 %-KI von B
0.68
0.10
0.49; 0.87
−0.24
0.12
−0.48; 0.00
β
−0.15
t
Sig. 7.119
0.49
−2.006
< 0.05
Anmerkung. B: Regressionskoeffizient, SE von B: Standardfehler von B, 95 %-KI von B: 95 %-Konfidenzintervall von B, β: standardisierter Regressionskoeffizient, t: t-Wert, Sig.: p-Wert
Resultat zur Forschungsfrage 7.1
Es besteht ein signifikanter negativer Zusammenhang mit einem kleinen bis mittleren Effekt zwischen den transmissiven Überzeugungen und der Diagnosekompetenz. Die transmissiven Überzeugungen sind in der untersuchten Stichprobe zur Vorhersage der Diagnosekompetenz jedoch wenig bedeutsam. Es werden keine Zusammenhänge der Diagnosekompetenz zu den konstruktivistischen Überzeugungen oder Überzeugungen zur Anwendung mathematischen Modellierens bzw. zum mathematischen Modellieren in der Schule nachgewiesen.
13.2.1.2 Zusammenhänge zwischen Selbstwirksamkeitserwartungen zum mathematischen Modellieren und der Diagnosekompetenz In Tabelle 13.17 ist die Anpassungsgüte der einfachen linearen Modelle aufgeführt, in denen die Selbstwirksamkeitserwartungen zum Modellieren und zum mathematischen Arbeiten jeweils die Prädiktoren darstellen. Im Modell zu den Selbstwirksamkeitserwartungen zum Modellieren weist der Determinationskoeffizient mit R2 = 0.06 einen kleinen bis mittleren Effekt nach und wird signifikant nachgewiesen. Das Modell klärt 6 % der Varianz in den Daten auf. Die Teststärke (1−βFehler = 0.90) ist ausreichend hoch, um den Effekt nachzuweisen. Die Selbstwirksamkeitserwartungen zum mathematischen Arbeiten klären mit R2 = 0.09 und mit einem kleinen bis mittleren Effekt 9 % der Varianz in den Daten auf. Der Effekt wird mit einer großen Teststärke (1−βFehler = 0.98) nachgewiesen.
13.2 Zusammenhänge zwischen den Konstrukten
351
Tabelle 13.17 Modellanpassungen der First-Difference-Modelle zum Zusammenhang zwischen Selbstwirksamkeitserwartungen zum mathematischen Modellieren und der Diagnosekompetenz Modell
Quadratsumme df
Swe. zum Regression 10.95 Modellieren Residuen 171.17 Gesamt Swe. zum math. Arbeiten
Regression
182.12 15.400
F
Sig.
R2
Teststärke
1 10.555 < 0.001 0.06 0.90 165 166 1 15.241 < 0.001 0.09 0.98
Residuen
166.722
165
Gesamt
182.122
166
Anmerkung. df: Freiheitsgrade, F: F-Wert, Sig.: p-Wert, R2 : Determinationskoeffizient
In Tabelle 13.18 werden die Regressionskoeffizienten mit den zugehörigen Statistiken dargestellt. Um eine Stufe auf der Likert-Skala höhere Selbstwirksamkeitserwartungen zum Modellieren (Swe. Mod.) stehen mit durchschnittlich höheren Diagnosekompetenzen im Umfang von B = 0.44 Logits in Verbindung. Schätzen Studierende ihre eigenen Fähigkeiten, das Leistungspotential von Schülerinnen und Schülern in den modellierungsspezifischen Phasen des Modellierungsprozesses zu beurteilen, hoch ein, verfügen sie auch gleichzeitig über höhere Diagnosekompetenzen. Bei den Selbstwirksamkeitserwartungen zum mathematischen Arbeiten (Swe. math. Arb.) ist dieser Effekt noch stärker. Um einen Punkt höhere Selbstwirksamkeitserwartungen zum mathematischen Arbeiten gehen durchschnittlich mit B = 0.49 Logits höheren Diagnosekompetenzen einher. Schätzen die Studierenden ihre Fähigkeiten zur Diagnostik von Leistungspotentialen im Teilprozess des mathematischen Arbeitens oder anhand von schriftlichen Lösungen der Lernenden höher ein, so besteht ein Zusammenhang mit höheren Diagnosekompetenzen. Bei der Vorhersage der Diagnosekompetenz klären die Selbstwirksamkeitserwartungen einen relativ großen Teil der Varianz auf und sind daher bedeutsam.
352
13
Zusammenhangsanalysen
Tabelle 13.18 Regressionskoeffizienten der First-Difference-Modelle zum Zusammenhang zwischen Selbstwirksamkeitserwartungen zum mathematischen Modellieren und der Diagnosekompetenz Modell
Prädiktor
B
SE von B
95 %-KI von B
Swe. zum Modellieren
Konstante
0.63
0.09
0.45; 0.82
Swe. Mod.
0.44
0.14
0.17; 0.71
Swe. zum math. Arbeiten
Konstante
0.62
0.09
0.44; 0.80
Swe math. Arb.
0.49
0.13
0.24; 0.74
β
t 6.769
< 0.001
0.25
3.249
< 0.001
6.922
< 0.001
3.904
< 0.001
0.29
Sig.
Anmerkung. B: Regressionskoeffizient, SE von B: Standardfehler von B, 95 %-KI von B: 95 %-Konfidenzintervall von B, β: standardisierter Regressionskoeffizient, t: t-Wert, Sig.: p-Wert
Resultat zu Forschungsfrage 7.2
Es bestehen signifikante Zusammenhänge im Umfang kleiner bis mittlerer Effekte zwischen den Skalen der Selbstwirksamkeitserwartungen zum mathematischen Modellieren und der Diagnosekompetenz. Für die Vorhersage der Diagnosekompetenz sind in der untersuchten Stichprobe beide Skalen bedeutsam.
13.2.2 Zusammenhänge mit der a-priori-Interventionskompetenz Nachfolgend werden Zusammenhänge der Diagnosekompetenz, den Überzeugungen und Selbstwirksamkeitserwartungen zum mathematischen Modellieren mit der a-priori-Interventionskompetenz bestimmt. Dabei stellt die Differenz der a-prioriInterventionskompetenz zwischen Pre- und Posttest stets die abhängige Variable und die Differenz der Messzeitpunkte des jeweiligen Prädiktors die unabhängige Variable dar. Zur Selektion potentiell bedeutsamer Prädiktoren werden in Tabelle 13.19 die Korrelationen zwischen den Differenzskalen der Diagnosekompetenz, der Überzeugungen und Selbstwirksamkeitserwartungen zum mathematischen Modellieren mit der a-priori-Interventionskompetenz dargestellt.
13.2 Zusammenhänge zwischen den Konstrukten
353
Tabelle 13.19 Korrelationen der Differenzskalen zu Aspekten professioneller Kompetenz zum Lehren mathematischen Modellierens und der a-priori-Interventionskompetenz Konstrukt
Differenzskala
Adaptive a-prioriInterventionskompetenz
Diagnose
Überzeugungen zum math. Mod. Konstruktivistische
Sig.
0.23
< 0.01
0.17
< 0.05
−0.03
0.73
zur Anwendung math. Mod.
0.22
< 0.01
zur math. Mod. in der Schule
0.29
< 0.001
zum Modellieren
0.20
< 0.05
zum math. Arbeiten
0.20
< 0.01
Transmissive
Selbstwirksamkeitserwartungen zum math. Mod.
Korrelation
Anmerkung. Sig.: p-Wert
Die Diagnosekompetenz korreliert signifikant mit der a-priori-Interventionskompetenz im Umfang eines kleinen bis mittleren Effekts (r = 0.23, p < 0.01). Hohe Diagnosekompetenzen gehen mit hohen a-priori-Interventionskompetenzen einher. Bei den Überzeugungen zum mathematischen Modellieren korrelieren einzig die transmissiven Überzeugungen nicht signifikant mit der a-priori-Interventionskompetenz. Höhere Zustimmungswerte in den konstruktivistischen Überzeugungen gehen mit höheren a-priori-Interventionskompetenzen einher. Es ist ein kleiner bis mittlerer Effekt festzustellen (r = 0.17, p < 0.05). Zudem besteht bei den Studierenden ein Zusammenhang zwischen höheren Zustimmungswerten in den Überzeugungen zur Anwendung mathematischen Modellierens und höheren a-priori-Interventionskompetenzen. Hier liegt ebenfalls ein kleiner bis mittlerer Effekt vor (r = 0.22, p < 0.01). Die Überzeugungen zum mathematischen Modellieren in der Schule haben mit einem mittleren Effekt r = 0.29 (p < 0.001) den stärksten Zusammenhang. Bei den Selbstwirksamkeitserwartungen zeigen sich ähnlich wie bei der Diagnosekompetenz kleine bis mittelgroße Zusammenhänge. Die Selbstwirksamkeitserwartungen zum Modellieren (p < 0.05) und zum mathematischen Arbeiten (p < 0.01) korrelieren beide mit r = 0.20. Demnach lässt sich kein Unterschied zwischen dem Zusammenhang mit Selbstwirksamkeitserwartungen in Bezug auf die Diagnostik von Leistungspotentialen in modellierungsspezifischen Phasen des Lösungsprozesses und der Phase des mathematischen Arbeitens sowie anhand von schriftlichen Lösungen feststellen. Für die potentiell bedeutsamen Prädiktoren werden jeweils einfache lineare Regressionen anhand von First-Difference-Modellen berechnet. Die a-priori-Interventionskompetenz stellt dabei die abhängige Variable und die signifikant korrelierenden Variablen jeweils die unabhängige Variable dar.
354
13
Zusammenhangsanalysen
13.2.2.1 Zusammenhänge zwischen der Diagnose- und a-priori-Interventionskompetenz In Tabelle 13.20 ist die Anpassungsgüte des einfachen linearen Modells aufgeführt, in dem die Diagnosekompetenz den Prädiktor darstellt. Der Determinationskoeffizient weist mit R2 = 0.05 einen kleinen bis mittleren Effekt nach und wird signifikant nachgewiesen. Das Modell klärt 5 % der Varianz in den Daten auf, was anhand einer ausreichenden Teststärke (1−βFehler = 0.84) nachgewiesen wird. Tabelle 13.20 Modellanpassung des First-Difference-Modells zum Zusammenhang zwischen der Diagnose- und a-priori-Interventionskompetenz Modell
Quadratsumme df
Diagnosekompetenz Regression
9.88
F
Sig.
R2
Teststärke
1 9.377 < 0.01 0.05 0.84
Residuen
172.74
164
Gesamt
182.62
165
Anmerkung. df: Freiheitsgrade, F: F-Wert, Sig.: p-Wert, R2 : Determinationskoeffizient
In Tabelle 13.21 werden die Regressionskoeffizienten mit den zugehörigen Statistiken dargestellt. Um einen Logit größere Diagnosekompetenzen (Diagnose) gehen mit durchschnittlich höheren a-priori-Interventionskompetenzen von B = 0.23 Logits einher. Der theoretisch angenommene Zusammenhang zwischen Diagnose- und a-priori-Interventionskompetenzen wird damit bestätigt. Sind die Studierenden besser in der Lage, die Modellierungsphase und die Schwierigkeit zu identifizieren sowie ein geeignetes Förderziel festzulegen, so verfügen sie auch über größere Fähigkeiten bei der Beurteilung von Interventionen hinsichtlich ihrer Adaptivität. Da die Diagnosekompetenz einen von Null verschiedenen Varianzanteil aufklärt, ist sie für die Vorhersage der a-priori-Interventionskompetenz bedeutsam.
Tabelle 13.21 Regressionskoeffizient des First-Difference-Modells zum Zusammenhang zwischen der Diagnose- und a-priori-Interventionskompetenz Modell
Prädiktor
B
SE von B
95 %-KI von B
Diagnosekompetenz
Konstante
0.24
0.10
0.04; 0.44
Diagnose
0.23
0.08
0.08; 0.38
β
0.23
t
Sig.
2.392
< 0.05
3.062
< 0.01
Anmerkung. B: Regressionskoeffizient, SE von B: Standardfehler von B, 95 %-KI von B: 95 %-Konfidenzintervall von B, β: standardisierter Regressionskoeffizient, t: t-Wert, Sig.: p-Wert
13.2 Zusammenhänge zwischen den Konstrukten
355
Resultat zur Forschungsfrage 6
Die Hypothese H6 wird bestätigt. Es besteht im Umfang eines kleinen bis mittleren Effekts ein signifikanter Zusammenhang zwischen der Diagnoseund a-priori-Interventionskompetenz. Die Diagnosekompetenz ist in der untersuchten Stichprobe ein bedeutsamer Prädiktor bei der Vorhersage der a-priori-Interventionskompetenz.
13.2.2.2 Zusammenhänge zwischen Überzeugungen zum mathematischen Modellieren und der a-priori-Interventionskompetenz In Tabelle 13.22 ist die Anpassungsgüte der einfachen linearen Modelle aufgeführt, in denen die als bedeutsam identifizierten Variablen der Überzeugungen zum mathematischen Modellieren jeweils die Prädiktoren darstellen. Im Modell zum Zusammenhang mit den konstruktivistischen Überzeugungen weist der Determinationskoeffizient mit R2 = 0.03 einen kleinen Effekt nach und wird signifikant nachgewiesen. Das Modell klärt lediglich 3 % der Varianz in den Daten auf. Die Teststärke (1−βFehler = 0.62) zeigt jedoch an, dass eine tatsächlich von Null verschiedene Varianzaufklärung nicht abschließend bestätigt werden kann. Die Überzeugungen zur Anwendung mathematischen Modellierens klären mit R2 = 0.05 und damit mit einem kleinen bis mittleren Effekt bereits 5 % der Varianz in den Daten auf. Die Teststärke (1−βFehler = 0.80) weist diesen Effekt in einem gerade noch ausreichenden Umfang nach. Die Überzeugungen zum mathematischen Modellieren in der Schule haben mit einem Determinationskoeffizienten von R2 = 0.08 ebenfalls einen kleinen bis mittleren Effekt bei der Vorhersage der a-priori-Interventionskompetenz. Die Varianzaufklärung von 8 % wird anhand
Tabelle 13.22 Modellanpassungen der First-Difference-Modelle zum Zusammenhang zwischen Überzeugungen zum mathematischen Modellieren und der a-priori-Interventionskompetenz Modell
Quadratsumme df
Konstruktivistische Regression 6.21 Überzeugungen Residuen 200.05 Gesamt
206.26
F 1
Sig.
5.153 < 0.05
R2
Teststärke
0.03 0.62
166 167 (Fortsetzung)
356
13
Zusammenhangsanalysen
Tabelle 13.22 (Fortsetzung) Modell Überzeugungen zur Anwendung math. Mod.
Quadratsumme df Regression
F
8.64
1
Residuen
184.56
165
Gesamt
193.20
166
Überzeugungen Regression 14.37 zum math. Mod. in Residuen 158.72 der Schule Gesamt 173.10
163
7.73
1 14.76
Sig.
R2
< 0.01
0.05 0.80
Teststärke
< 0.001 0.08 0.97
164
Anmerkung. df: Freiheitsgrade, F: F-Wert, Sig.: p-Wert, R2 : Determinationskoeffizient
einer hohen Teststärke bestätigt (1−βFehler = 0.97). Damit klärt diese Art der Überzeugungen im Vergleich zu den anderen Skalen am meisten Varianz auf. In Tabelle 13.23 werden die Regressionskoeffizienten mit den zugehörigen Statistiken dargestellt. Bei um eine Stufe höheren Zustimmungswerten in den konstruktivistischen Überzeugungen (konstr. Ü.) sagt das Modell eine um B = 0.42 Logits höhere a-priori-Interventionskompetenz vorher. Der standardisierte Regressionskoeffizient β = 0.17 (p < 0.05) zeigt jedoch nur einen kleinen bis mittleren Effekt an. Ein konstruktivistischeres Lehr-Lern-Verständnis scheint mit hohen a-priori-Interventionskompetenzen einher zu gehen.
Tabelle 13.23 Regressionskoeffizienten der First-Difference-Modelle zum Zusammenhang zwischen Überzeugungen zum mathematischen Modellieren und der a-priori-Interventionskompetenz Prädiktor B
Konstruktivistische Überzeugungen
Konstante
0.39 0.09
0.23; 0.56
Konstr. Ü.
0.42 0.18
0.05; 0.78 0.17 2.270 < 0.05
Überzeugungen zur Anwendung math. Mod.
Konstante
0.33 0.09
0.16; 0.50
Ü. Anw.
Überzeugungen zum Konstante math. Mod. in der Schule Ü. Mod.
SE 95 %-KI von B von B
β
Modell
t
Sig.
4.603 < 0.001 3.821 < 0.001
0.36 0.13
0.10; 0.61 0.21 2.780 < 0.01
0.32 0.08
0.16: 0.48
0.59 0.15
0.28: 0.89 0.29 3.842 < 0.001
4.022 < 0.001
Anmerkung. B: Regressionskoeffizient, SE von B: Standardfehler von B, 95 %-KI von B: 95 %Konfidenzintervall von B, β: standardisierter Regressionskoeffizient, t: t-Wert, Sig.: p-Wert
13.2 Zusammenhänge zwischen den Konstrukten
357
Die Überzeugungen zur Anwendung mathematischen Modellierens (Ü. Anw.) sagen eine durchschnittliche Steigerung der a-priori-Interventionskompetenz um B = 0.36 Logits vorher, wenn sich die Zustimmungswerte in der Skala um eine Stufe steigern. Wird dem mathematischen Modellieren ein höherer gesellschaftlicher Nutzen und Anwendungsbezug zugesprochen, verfügen die Probanden gleichzeitig über eine höhere a-priori-Interventionskompetenz im Umfang eines kleinen bis mittleren Effekts (β = 0.21, p < 0.01). Steigert sich der Zustimmungswert zu den Überzeugungen zum mathematischen Modellieren in der Schule (Ü. Mod.) um eine Stufe auf der Likert-Skala, so steigern sich auch die a-priori-Interventionskompetenzen um B = 0.59 Logits. Im Umfang eines mittleren Effekts (β = 0.29, p < 0.001) liegt für die Überzeugungen zum mathematischen Modellieren in der Schule der stärkste Zusammenhang bei den Überzeugungen zum mathematischen Modellieren vor. Studierende, die dem mathematischen Modellieren einen berechtigten Platz im Mathematikunterricht einräumen, verfügen gleichzeitig über eine hohe a-priori-Interventionskompetenz. Die Varianzaufklärung der Überzeugungen zur Anwendung mathematischen Modellierens und zum mathematischen Modellieren im Unterricht ist im Vergleich zu den konstruktivistischen Überzeugungen hoch. Mit signifikant nachgewiesenen Varianzaufklärungen von 5 % und 8 % sind sie zur Vorhersage der a-priori-Interventionskompetenz bedeutsam. Dass sich die Varianzaufklärung der konstruktivistischen Überzeugungen von Null unterscheidet, kann aufgrund einer geringen Teststärke nicht bestätigt werden. Daher wird die Bedeutsamkeit dieses Prädiktors nicht bestätigt. Resultat zu Forschungsfrage 8.1
Zwischen konstruktivistischen Überzeugungen und der a-priori-Interventionskompetenz besteht ein Zusammenhang im Umfang eines kleinen bis mittleren Effekts. Für die Vorhersage der a-priori-Interventionskompetenz sind sie in der untersuchten Stichprobe jedoch wenig bedeutsam. Mit transmissiven Überzeugungen ist kein Zusammenhang feststellbar. Zu Überzeugungen zur Anwendung mathematischen Modellierens besteht ein Zusammenhang im Umfang eines kleinen bis mittleren Effekts. Der mittlere und gleichzeitig stärkste Effekt liegt zwischen der a-priori-Interventionskompetenz und den Überzeugungen zum mathematischen Modellieren in der Schule vor. Beide Prädiktoren sind für die Vorhersage der a-priori-Interventionskompetenz bedeutsam.
358
13
Zusammenhangsanalysen
13.2.2.3 Zusammenhänge zwischen Selbstwirksamkeitserwartungen zum mathematischen Modellieren und der a-priori-Interventionskompetenz In Tabelle 13.24 ist die Anpassungsgüte der einfachen linearen Modelle aufgeführt, in denen die Selbstwirksamkeitserwartungen zum Modellieren und zum mathematischen Arbeiten die a-priori-Interventionskompetenz vorhersagen. Im Modell zum Zusammenhang mit den Selbstwirksamkeitserwartungen zum Modellieren weist der Determinationskoeffizient mit R2 = 0.05 einen kleinen bis mittleren Effekt nach und wird signifikant nachgewiesen. Es werden 5 % der Varianz in den Daten aufgeklärt. Die Teststärke (1−βFehler = 0.84) ist ausreichend hoch, um den Effekt nachzuweisen. Die Selbstwirksamkeitserwartungen zum mathematischen Arbeiten klären mit R2 = 0.05 ebenfalls 5 % der Varianz in den Daten auf und haben damit einen kleinen bis mittleren Effekt. Eine Teststärke von 1−βFehler = 0.86 weist den Effekt nach. Tabelle 13.24 Modellanpassungen der First-Difference-Modelle zum Zusammenhang zwischen Selbstwirksamkeitserwartungen zum mathematischen Modellieren und der a-prioriInterventionskompetenz Modell
Quadratsumme
Selbstwirksamkeitserwartungen zum Modellieren
Regression
Selbstwirksamkeitserwartungen zum math. Arbeiten
df
9.94
1
Residuen
185.13
164
Gesamt
195.07
165
Regression
9.62
1
Residuen
173.33
163
Gesamt
182.94
164
F
Sig.
R2
Teststärke
8.807
< 0.01
0.05
0.84
9.043
< 0.01
0.05
0.86
Anmerkung. df: Freiheitsgrade, F: F-Wert, Sig.: p-Wert, R2 : Determinationskoeffizient
In Tabelle 13.25 werden die Regressionskoeffizienten mit den zugehörigen Statistiken dargestellt. Mit der a-priori-Interventionskompetenz weisen die Selbstwirksamkeitserwartungen signifikante Zusammenhänge auf. Erhöhen sie sich um einen Punkt auf der Likert-Skala, so sagt das Modell für die Selbstwirksamkeitserwartungen zum Modellieren (Swe. Mod.) eine Erhöhung der a-priori-Interventionskompetenz von B = 0.42 Logits und für die Selbstwirksamkeitserwartungen zum mathematischen Arbeiten (Swe. math. Arb.) eine Erhöhung von B = 0.39
13.2 Zusammenhänge zwischen den Konstrukten
359
Logits vorher. Höhere Selbstwirksamkeitserwartungen zur Diagnostik von Leistungspotentialen in modellierungsspezifischen und unspezifischen Phasen des Lösungsprozesses hängen demnach mit höheren a-priori-Interventionskompetenzen zusammen. Die Varianzaufklärung beider Skalen ist jedoch geringer als bei der Vorhersage der Diagnosekompetenz. Da sie sich signifikant von Null unterscheiden und mit einer ausreichenden Teststärke nachgewiesen werden, werden sie als bedeutsam angesehen.
Tabelle 13.25 Regressionskoeffizienten der First-Difference-Modelle zum Zusammenhang zwischen Selbstwirksamkeitserwartungen zum mathematischen Modellieren und der a-prioriInterventionskompetenz Modell
Prädiktor
B
SE 95 %-KI von B von B
Selbstwirksamkeitserwartungen zum Modellieren
Konstante
0.29
0.10
0.10; 0.49
Swe. Mod.
0.42
0.14
0.14; 0.71
Selbstwirksamkeitserwartungen zum math. Arbeiten
Konstante
0.25
0.09
0.07; 0.43
Swe. math. Arb.
0.39
0.13
0.13; 0.64
β
t
0.23
2.968 < 0.01
Sig.
3.005 < 0.01
2.672 < 0.01 0.23
3.007 < 0.01
Anmerkung. B: Regressionskoeffizient, SE von B: Standardfehler von B, 95 %-KI von B: 95 %-Konfidenzintervall von B, β: standardisierter Regressionskoeffizient, t: t-Wert, Sig.: p-Wert
Resultat zu Forschungsfrage 8.2
Im Umfang kleiner bis mittlerer Effekte besteht jeweils ein Zusammenhang zwischen den Selbstwirksamkeitserwartungen zum Modellieren und den Selbstwirksamkeitserwartungen zum mathematischen Arbeiten mit der a-priori-Interventionskompetenz. Beide Skalen sind in der untersuchten Stichprobe für die Vorhersage der a-priori-Interventionskompetenz bedeutsam.
Zusammenfassung und Diskussion
14
In diesem abschließenden Kapitel werden die Methodik und die Ergebnisse der Studie diskutiert. Im ersten Teil (vgl. Abschnitt 14.1) werden die Studienergebnisse kurz zusammengefasst, anhand von Befunden aus der Literatur eingeordnet und hinsichtlich ihrer Aussagekraft diskutiert. Es werden ein weiterer Forschungsbedarf und gegebenenfalls Möglichkeiten für zukünftige Untersuchungen aufgezeigt. Im zweiten Teil (vgl. Abschnitt 14.2) wird sich vertiefend mit dem methodologischen Ansatz und dem Forschungsdesign auseinandergesetzt, um Grenzen der durchgeführten Studie aufzuzeigen. Das Testinstrument wird vertiefend hinsichtlich seiner Validität und Reliabilität diskutiert und es werden Möglichkeiten zur Weiterentwicklung aufgezeigt (vgl. Abschnitt 14.3). Abschließend werden zusammenfassend ein Fazit gezogen und Implikationen für die Lehrerausbildung abgeleitet (vgl. Abschnitt 14.4).
14.1
Diskussion der Studienergebnisse
Die Diskussion der Studienergebnisse wird anhand der untersuchten Konstrukte strukturiert, um eine stringente Diskussion und Einordnung zu ermöglichen. Die adaptive a-priori-Interventionskompetenz, die im Mittelpunkt der Untersuchung stand, wird zunächst hinsichtlich ihrer latenten Struktur und ihrer empirischen Beschreibung diskutiert (vgl. Abschnitt 14.1.1). Im Anschluss werden die Effekte der universitären fachdidaktischen Seminare mit Praxiselementen auf die Diagnoseund a-priori-Interventionskompetenz genauer betrachtet und eingeordnet (vgl. Abschnitt 14.1.2). Einflussfaktoren für den Erwerb der beiden Teilkompetenzen
© Der/die Herausgeber bzw. der/die Autor(en), exklusiv lizenziert durch Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2020 H. Klock, Adaptive Interventionskompetenz in mathematischen Modellierungsprozessen, Studien zur theoretischen und empirischen Forschung in der Mathematikdidaktik, https://doi.org/10.1007/978-3-658-31432-3_14
361
362
14
Zusammenfassung und Diskussion
werden im Anschluss diskutiert (vgl. Abschnitt 14.1.3). Die Veränderung von Überzeugungen und Selbstwirksamkeitserwartungen zum mathematischen Modellieren in der EG Koblenz und der Kontrollgruppe werden nachfolgend zusammengefasst und eingeordnet (vgl. Abschnitt 14.1.4). Abschließend wird die Bestimmung von Zusammenhängen zwischen den Facetten der professionellen Kompetenz zum Lehren mathematischen Modellierens anhand von First-Difference-Modellen diskutiert (vgl. Abschnitt 14.1.5).
14.1.1 Diskussion der Dimensionsanalyse Werden Interventionsprozesse in kooperativen Bearbeitungsprozessen von Schülerinnen und Schülern in der Literatur beschrieben (Leiss, 2007, S. 208; Van de Pol et al., 2012), werden diagnostische und interventionsbezogene Prozesse unterschieden. Mit Forschungsfrage 1 wird in Kapitel 11 der Frage nachgegangen, welche latente Struktur das Konstrukt der adaptiven a-priori-Interventionskompetenz aufweist und ob sich die beiden konzeptualisierten Teilkompetenzen tatsächlich empirisch trennen lassen. Zur Erhebung des Konstrukts wurde ein Testinstrument entwickelt (Klock & Wess, 2018), das die beiden Teilkompetenzen jeweils anhand von fallbasierten Aufgabenvignetten misst (vgl. Abschnitt 9.3). In einer RaschSkalierung wurden vier verschiedene Modelle zur Beschreibung der Daten und der latenten Struktur der adaptiven a-priori-Interventionskompetenz verglichen (vgl. Abschnitt 11.1). Das zweidimensionale Between-Item-Modell, in dem die Diagnose- und Interventionsitems auf jeweils einer latenten Variablen laden, beschreibt die Struktur der adaptiven a-priori-Interventionskompetenz von Mathematik-Lehramtsstudierenden am besten. Die Diagnose- und a-priori-Interventionskompetenz weisen eine latente Korrelation von r = 0.67 auf. Auf der einen Seite spricht diese hohe Korrelation dafür, dass beide Teilkompetenzen einem gemeinsamen Konstrukt zuzuordnen sind, auf der anderen Seite korrelieren die latenten Variablen nicht zu hoch, sodass von getrennten Teilkompetenzen gesprochen werden kann. Hypothese 1 wird bestätigt, da die empirischen Ergebnisse ebenfalls auf zwei Teilkompetenzen hindeuten, die getrennt interpretiert werden können, aber einem gemeinsamen Konstrukt zuzuordnen sind. Obwohl das zweidimensionale Modell unter Begutachtung der Fit-Indizes und der Korrelationen zwischen den latenten Variablen die beste Passung zu den Daten aufweist, kann die Gültigkeit dieses Modells nicht abschließend beurteilt werden. Da die globale Passung nur im Vergleich zu anderen Modellen bestimmt
14.1 Diskussion der Studienergebnisse
363
wird, ist ein Modell mit einer anderen latenten Struktur denkbar, das die Kompetenzstruktur der adaptiven a-priori-Interventionskompetenz besser widerspiegelt. Beispielsweise konnten nicht-kompensatorische Within-Item-Modelle aufgrund ihrer hohen Stichprobenansprüche nicht berechnet werden. Die für die Berechnung mehrdimensionaler Rasch-Modelle eher kleine Stichprobe in der Studie lässt die Modellierung weiterer theoretisch-plausibler Modelle nicht zu. Anhand der untersuchten Modelle wird jedoch gezeigt, dass der verwendete Kontext zur Erhebung der Teilkompetenzen bzw. die Struktur des Testinstruments keine Rolle spielt (sechsdimensionales Between-Item-Modell). Ebenso scheint kein übergeordnetes Konstrukt, wie z. B. die Lese-, Fach- oder Modellierungskompetenz der Studierenden, die Beantwortung der Testitems zu beeinflussen, da das dreidimensionale Within-Item-Modell keine bessere Passung aufweist. Es wurde gezeigt, dass es sich bei der adaptiven a-priori-Interventionskompetenz – keinesfalls – um ein eindimensionales Konstrukt handelt. Das zweidimensionale Between-Item-Modell weist unter Beachtung des Einfachheitskriteriums die beste Passung zu den Daten auf. Das erzielte Ergebnis bestätigt daher die theoretische Unterscheidung zwischen diagnostischen und interventionsbezogenen Prozessen und lässt sich in der Literatur zu adaptiven Interventionen in Phasen kooperativer Bearbeitungsprozesse einordnen. Leiss (2007, S. 82) unterscheidet in seinem deskriptiven Prozessmodell ebenfalls die Phasen der Bildung einer Erkenntnisgrundlage (diagnostischer Teil) und der Intervention (interventionsbezogener Teil, vgl. Abschnitt 3.3.4). Auch in der internationalen Literatur entwickelten van de Pol et al. (2012) im Rahmen der Scaffolding-Diskussion ein Prozessmodell als metakognitives Hilfsmittel für Lehrkräfte im Interventionsprozess, bei dem zwischen diagnostischen Strategien und Interventionsstrategien unterschieden wird (vgl. Abschnitt 3.3.2). Die empirische Überprüfung der Kompetenzstruktur leistet insofern einen Beitrag zur Weiterentwicklung dieser Arbeiten, als dass die theoretisch getroffene Unterscheidung zwischen diagnostischen und interventionsbezogenen Prozessen nun eine erste empirische Bestätigung erhält. Da sich die Konzeptualisierung und Operationalisierung der adaptiven a-priori-Interventionskompetenz eng an den beiden aus der Literatur entnommenen Prozessmodellen orientiert, scheinen die betrachteten Kompetenzen zur Durchführung adaptiver Interventionen eine ähnliche latente Struktur wie die theoretisch beschriebenen Prozessmodelle aufzuweisen. Zur Förderung eines adaptiven Interventionsverhaltens von (angehenden) Lehrkräften reicht es demnach nicht aus, geeignete Interventionskonzepte und Kriterien adaptiver Interventionen zu lehren. Es müssen genauso diagnostische Fähigkeiten gefördert werden. Da die adaptive a-priori-Interventionskompetenz auf die besonderen Anforderungen von mathematischen Modellierungsprozessen konkretisiert wurde, sind
364
14
Zusammenfassung und Diskussion
die Ergebnisse nicht ohne Weiteres auf andere Bereiche des Faches (bspw. das Problemlösen) oder auf andere Fachdisziplinen (bspw. das Fach Deutsch) übertragbar. Insbesondere die diagnostischen Prozesse der Lehrkraft erfordern in anderen Bereichen oder Fachdisziplinen ein anderes Metawissen, beispielsweise über die Phasenstruktur des Lösungsprozesses und häufig auftretende Schwierigkeiten. Die a-priori-Interventionskompetenz ist aufgrund ihrer geringeren bereichsund fachspezifischen Orientierung einfacher zu übertragen. Zwei der vier Kriterien adaptiver Interventionen (»minimal«, »selbstständigkeitsorientiert«) können dem pädagogisch-psychologischen Wissen zugeordnet werden und erhalten erst in Verbindung mit dem Kriterium der inhaltlich-methodischen Passung in einer konkreten Unterrichtssituation ihren fachdidaktischen Bezug. Das für mathematische Modellierungsprozesse entwickelte Prozessmodell adaptiver Interventionen ist hinsichtlich seiner Struktur übertragbar, die inhaltliche Ausgestaltung des Modells ist jedoch bereichsspezifisch vorzunehmen. Daraus lässt sich ableiten, dass die Notwendigkeit eines bereichsspezifischen Wissens einen Einfluss auf die latente Struktur der adaptiven a-prioriInterventionskompetenz und die Unterscheidung der beiden Teilkompetenzen haben kann. Diese wird in der vorliegenden Arbeit streng genommen ausschließlich für den Bereich der kooperativen Bearbeitung mathematischer Modellierungsaufgaben nachgewiesen. Eine Übertragbarkeit auf andere Gebiete des Fachs Mathematik kann vermutet werden, ist jedoch empirisch nachzuweisen. Im Hinblick auf die Absicherung des Resultats zu Forschungsfrage 1 ist daher eine Reproduktion der Ergebnisse in einer größeren Stichprobe und unter Einbezug weiterer theoretisch-plausibler Modelle wünschenswert, um die Kompetenzstruktur der adaptiven a-priori-Interventionskompetenz abschließend zu bestätigen. Die korrekte Modellierung der Kompetenzstruktur ist eine Voraussetzung für die strukturvalide Berechnung zugehöriger Personenfähigkeiten und damit für die Erfassung dieser kognitiven Leistungsdisposition. Zur Prüfung der Übertragbarkeit der Ergebnisse sind weitere Untersuchungen in anderen mathematischen Gebieten oder Fachdisziplinen notwendig. Die Entwicklung ähnlicher Prozessmodelle (vgl. Abschnitt 5.3) und zugehöriger Testinstrumente (vgl. bspw. Klock & Wess, 2018) ermöglicht eine Prüfung des Zusammenhangs zwischen Diagnose- und a-priori-Interventionskompetenzen in anderen Fachkontexten.
14.1 Diskussion der Studienergebnisse
365
14.1.2 Diskussion der Veränderung der adaptiven a-priori-Interventionskompetenz In der Literatur sind nur wenige Studien zur Förderung des Interventionsverhaltens von (angehenden) Lehrkräften zu finden. Es existieren jedoch Hinweise, dass eine Förderung anhand von Seminaren und Fortbildungen mit Praxiselementen möglich ist (Stender, 2016; Van de Pol et al., 2014; Vorhölter et al., 2013). In der vorliegenden Arbeit wurde zur Beantwortung von Forschungsfrage 2 eine Interventionsstudie mit Kontrollgruppe anhand universitärer fachdidaktischer Seminare mit Praxiselementen durchgeführt, um die adaptive a-priori-Interventionskompetenz zu fördern. Die Veränderungsanalysen zeigen, dass sowohl die Diagnose- als auch die a-priori-Interventionskompetenz in beiden Experimentalgruppen im Umfang mittlerer bis großer Effekte verbessert wurden (vgl. Abschnitt 12.1, 12.2 und 13.1.3). Testwiederholungseffekte können aufgrund nicht signifikanter Veränderungen in der Kontrollgruppe ausgeschlossen werden. Die Hypothesen 2.1 und 2.2 werden bestätigt. Die Befunde bekräftigen die Ergebnisse vorheriger Studien (Stender, 2016, S. 198; Van de Pol et al., 2014; Vorhölter et al., 2013), die ebenfalls positive Effekte feststellten. Demnach scheinen fachdidaktische Seminare durch eine Vernetzung von Theorie und Praxis geeignet zu sein, um Diagnose- und a-priori-Interventionskompetenzen zu fördern. Theorie-Praxis-Verzahnungen durch Praxiselemente im Lehramtsstudium werden aktuell zur Förderung von Diagnosekompetenzen und verwandten Konstrukten in verschiedenen Seminar- und Förderkonzepten in die hochschulische Lehrerausbildung integriert (vgl. bspw. Leuders, Leuders, Prediger, & Ruwisch, 2017) und hinsichtlich ihrer Wirksamkeit evaluiert. Treisch (2018, S. 86) stellt bei der Förderung der professionellen Unterrichtswahrnehmung von Physik-Lehramtsstudierenden anhand eines Seminars mit Videoanalysen und einer Praxiseinbindung im LehrLern-Labor einen kleinen bis mittleren Effekt (β = 0.25, p < 0.05) fest. Bei Studierenden, die nur das Lehr-Lern-Labor-Seminar besuchten, wurde keine signifikante Steigerung erzielt. Heinrichs (2015, S. 247 f) stellte bei einem Treatment anhand von Videovignetten bestehend aus vier Sitzungen einen kleinen Effekt (d = 0.15, p = 0.05, einseitig) bei der Förderung der Kompetenz zur Ursachendiagnose von Mathematik-Lehramtsstudierenden fest. Da bereits nach einem derart kurzen Treatment Effekte auf diagnostische Kompetenzen nachgewiesen werden können, erscheinen die in der vorliegenden Studie gefundenen mittleren bis großen Effekte nach einem Treatment bestehend aus zwölf Sitzungen plausibel. Die gefundenen Effekte zur a-priori-Interventionskompetenz lassen sich schwieriger im aktuellen Forschungsdiskurs verorten, da nur wenige Interventionsstudien
366
14
Zusammenfassung und Diskussion
zur Förderung verwandter Konstrukte existieren. Van de Pol et al. (2014) stellten bei einer Förderung von Lehrkräften mit dem Model of Contingent Teaching (vgl. Abschnitt 3.3.2) ebenfalls positive Effekte fest. Die regulierenden Interventionen der teilnehmenden Lehrkräfte waren nach dem Treatment 49 % (SD = 30 %) öfter an das Schülerverstehen angepasst (Contingency Control). Zusätzlich griffen die Lehrkräfte in 58 % (SD = 21 %) mehr Interventionen das auf, was die Lernenden antworteten (Contingency Uptake). In diesem Zusammenhang lassen sich die gefundenen kleinen bis mittleren Effekte als plausibel einordnen. Vergleicht man die Effekte zwischen den beiden Experimentalgruppen, so ist der Zuwachs der Diagnosekompetenz der Lehramtsstudierenden in der EG Münster (β = 0.74, p < 0.001) doppelt so groß wie in der EG Koblenz (β = 0.43, p < 0.001). Auch die a-priori-Interventionskompetenz verbessert sich in der EG Münster (β = 0.53, p < 0.001) in größerem Umfang als in der EG Koblenz (β = 0.31, p < 0.001, vgl. Abschnitt 12.1 und 12.2). Bei Einbezug prädiktiver Kontrollvariablen verringert sich die Differenz der Effekte auf die a-priori-Interventionskompetenz in den Versuchsgruppen – insbesondere unter Kontrolle der Diagnosekompetenz im Posttest –, sodass die Effekte sich nicht länger signifikant unterscheiden (EG Koblenz β = 0.20, p < 0.05; EG Münster β = 0.36, p < 0.001, vgl. Abschnitt 13.1.3). Trotz der Kontrolle relevanter Störvariablen ist der Effekt in der EG Münster tendenziell größer als in der EG Koblenz. Dies ist nicht erwartungskonform, da die a-priori-Interventionskompetenz ausschließlich in der EG Koblenz fokussiert gefördert wurde. Die differenten Effekte lassen sich nicht vollständig durch die Kontrolle der erhobenen Störvariablen erklären. Die größeren Effekte in der EG Münster können aufgrund des quasi-experimentellen Designs mehrere Gründe haben. Stichprobenmerkmale (bspw. die Intelligenz der Probanden), die durch das Testinstrument nicht erhoben wurden, können einen Beitrag zur Aufklärung der Unterschiede leisten. Aufgrund der Selbstselektion der Studierenden sind Unterschiede im Interesse und der Motivation zu erwarten, da das Seminar in der EG Münster ein Wahl-Pflichtund in der EG Koblenz ein Pflicht-Seminar darstellt. Die Treatments wurden von unterschiedlichen Lehrpersonen durchgeführt, die verschieden große Veränderungen in den Teilkompetenzen erklären können. Studienergebnisse zeigen, dass die Lehrperson einen entscheidenden Einfluss auf den Lernerfolg von Schülerinnen und Schülern hat (Hattie, 2009, S. 108 ff). Diese Ergebnisse der Hattie-Studie sind mit Einschränkungen sicher auf den hochschulischen Kontext übertragbar. Die Lehrveranstaltungen fanden regelmäßig zu unterschiedlichen Seminarzeiten statt, sodass auch organisatorische Bedingungen die Treatments beeinflussten. In der EG Münster fanden die Seminarsitzungen in der Regel vormittags zwischen
14.1 Diskussion der Studienergebnisse
367
10 Uhr und 12 Uhr statt, wohingegen die Seminarsitzungen in der EG Koblenz zwischen 16 Uhr und 20 Uhr stattfanden. Es kann vermutet werden, dass die kognitive Leistungsfähigkeit und die Motivation der Probanden während der Seminarsitzungen in der EG Koblenz aufgrund der späteren Tageszeit und des Besuchs vorheriger Lehrveranstaltungen niedriger waren als in der EG Münster. Dies kann zu differenten Effekten beim Erwerb der Diagnose- und a-priori-Interventionskompetenz geführt haben. Wechselwirkungen mit pädagogischen und psychologischen Lehrveranstaltungen, deren Besuch im Rahmen der Studie nicht reguliert werden konnte, können insbesondere einen Einfluss auf die a-priori-Interventionskompetenz gehabt haben. Die Kriterien »minimal« und »selbstständigkeitsorientiert« zur Beurteilung adaptiver Interventionen gehen mit einem konstruktivistischen Lehr-Lern-Verständnis einher, das in parallelen Lehrveranstaltungen eventuell beeinflusst wurde. In der EG Münster trat im Wintersemester 2017/2018 eine Wechselwirkung mit einer parallelen Vorlesung und Übung auf, in der sowohl das mathematische Modellieren als auch adaptive Interventionen thematisiert und in einer Übung anhand von Videoanalysen behandelt wurden. Die Studierenden der EG Münster erhielten in diesem Semester eine zusätzliche Förderung in ihrer Diagnose- und a-priori-Interventionskompetenz. Darüber hinaus unterscheiden sich die Treatments in der Konzeption der fachdidaktischen Seminare. Stimmen die in den Experimentalgruppen vermittelten theoretischen Grundlagen überwiegend überein, so unterscheiden sich die Treatments in der Einbindung der Praxiselemente und in der Schwerpunktsetzung auf einzelne Phasen des Seminars (vgl. Abschnitt 8.4). Fand in der EG Münster fast ausschließlich eine Beobachtung und Diagnostik der Modellierungsprozesse von Schülerinnen und Schülern in der Praxisphase statt, wurden die Studierenden der EG Koblenz zunächst anhand von Text- und Videovignetten geschult, um in der Praxisphase im Lehr-Lern-Labor sowohl zu diagnostizieren als auch zu intervenieren. In der EG Koblenz absolvierten die Studierenden eine Praxiseinbindung von sechs Stunden, die in der anschließenden Reflexionsphase innerhalb von eineinhalb Stunden reflektiert wurde. In der EG Münster betrug die Länge der Praxiseinbindung gerade einmal drei Stunden, wohingegen diese sechs Stunden lang reflektiert wurde. Insbesondere die ausgedehnte Reflexionsphase in der EG Münster kann mit den höheren Effekten in Verbindung gebracht werden. Ein weiterer, potentieller Erklärungsansatz stellt der Matthäus-Effekt (Zuckermann, 2010) dar, nach dem Studierende mit hohen Kompetenzwerten im Pretest höhere Kompetenzzuwächse erzielen als Studierende mit niedrigeren Kompetenzwerten. Dieser Vermutung widerspricht jedoch die Tatsache, dass sich die Studierenden der Experimentalgruppen im Pretest weder in der Diagnose-
368
14
Zusammenfassung und Diskussion
(t(128) = 0.598; p = 0.55) noch in der a-priori-Interventionskompetenz (t(128) = 0.043; p = 0.97) signifikant unterscheiden. Diese die Ergebnisse relativierenden Einschränkungen müssen bei der Interpretation berücksichtigt werden. Trotz der umfangsreichen Kontrolle von Störvariablen besitzt die Studie kein experimentelles Design, da die Probanden nicht randomisiert zu den Treatments zugeordnet wurden und diese in mehreren Aspekten variiert wurden. Aufgrund einer bereits großen Testlänge wurde von der Erhebung weiterer Kontrollvariablen, wie z. B. Intelligenz oder Motivation abgesehen. Daher können keine kausalen Rückschlüsse auf die Wirksamkeit einzelner Bestandteile der Treatments, wie z. B. des Videoeinsatzes oder der Implementation der Praxiseinbindung, gezogen werden. Im Rahmen der durchgeführten Evaluationsforschung kann Forschungsfrage 2 jedoch beantwortet werden, da die Zuwächse der Diagnose- und a-priori-Interventionskompetenz auf die Seminarteilnahme zurückgeführt werden können und die Treatments als Ganzes evaluiert wurden. Im Hinblick auf zukünftige Untersuchungen ist eine Evaluation der Wirksamkeit einzelner Seminarbestandteile wünschenswert, um zu bestimmen, welche Praxiselemente zur Förderung von Diagnose- und a-priori-Interventionskompetenzen am geeignetsten sind. Trotz des nicht-experimentellen Designs liefern die Ergebnisse einen Hinweis darauf, dass ein fachdidaktisches Seminar mit einer Praxiseinbindung im Lehr-Lern-Labor ohne den Einsatz von Videovignetten (EG Münster) in gleicher Weise Diagnose- und a-priori-Interventionskompetenzen fördern kann wie ein fachdidaktisches Seminar mit einem kombinierten Einsatz beider Trainingsmethoden. Dieser Befund widerspricht nicht dem oben beschriebenen der Studie von Treisch (2018), da auch hier ein kleiner aber nicht signifikanter Effekt in der Versuchsgruppe festgestellt wurde, die ausschließlich anhand des Lehr-Lern-Labors gefördert wurde. Ein systematischer, experimenteller Vergleich der Methoden zur Theorie-Praxis-Verzahnung wird einen Einblick in eventuelle differentielle Effekte auf die Teilkompetenzen liefern. Die Integration von Praxiselementen in universitäre fachdidaktische Seminare kann in Bezug auf die Förderung der adaptiven a-priori-Interventionskompetenz im Hinblick auf die Studienergebnisse jedenfalls als ein lohnendes Unterfangen bewertet werden.
14.1.3 Diskussion der identifizierten Einflussfaktoren Aufgrund der differenten Effekte in den beiden Experimentalgruppen wurden erhobene Kontrollvariablen in die linearen Modelle aufgenommen (vgl.
14.1 Diskussion der Studienergebnisse
369
Abschnitt 13.1), um eine korrigierte Berechnung der Effektstärken vorzunehmen (vgl. Abschnitt 13.1.3). Anhand der im Pretest erhobenen Kontrollvariablen wurden günstige Bedingungen für den Erwerb der adaptiven a-prioriInterventionskompetenz identifiziert, indem ihre Bedeutsamkeit für die Vorhersage der Posttestergebnisse bestimmt wurde. In die Analysen werden sowohl demographische Merkmale, wie das Geschlecht, das Hochschulsemester, die Abiturnote und die Praxiserfahrung, als auch das Vorwissen sowie Überzeugungen und Selbstwirksamkeitserwartungen zum mathematischen Modellieren mit einbezogen. Das Geschlecht spielt in der untersuchten Stichprobe für den Erwerb von Diagnose- und a-priori-Interventionskompetenzen keine Rolle. Männer und Frauen unterschieden sich nicht signifikant beim Erwerb der jeweiligen Teilkompetenz in den Versuchsgruppen. Geschlechterspezifische Unterschiede, die bei der Bearbeitung realitätsnaher, komplexer Aufgaben oder Problemlöseaufgaben gefunden wurden (Brunner, Krauss, et al., 2011; Budde, 2009, S. 22 f.; Kaiser & Steisel, 2000), haben in den Treatments der vorliegenden Studie keinen Effekt. Zu diesem Ergebnis gelangten auch Studien bei der Untersuchung ähnlicher Konstrukte. Treisch (2018, S. 104 f.) stellte keine geschlechterspezifischen Unterschiede beim Erwerb der professionellen Unterrichtswahrnehmung fest, die anhand verschiedener Lehr-Lern-Labor-Seminare gefördert wurde. Auch in der Studie von Heinrichs (2015, S. 231 f.) wird der Befund dadurch unterstützt, dass kein Zusammenhang zwischen der fehlerdiagnostischen Kompetenz und dem Geschlecht im Pretest gefunden wurde. Diese Studienergebnisse unterstützen die Vermutung, dass das Geschlecht für den Erwerb der beschriebenen situationsspezifischen Kompetenzen nicht von Bedeutung ist. Das Hochschulsemester der Studierenden und damit der Studienfortschritt ist für den Erwerb der beiden Teilkompetenzen ebenfalls nicht von Bedeutung. Dieser Befund wird in anderen Studien zur Förderung ähnlicher Konstrukte bestätigt (Treisch, 2018, S. 111). Heinrichs (2015, S. 256) stellte beim Vergleich von Bachelor- und Masterstudierenden beim Erwerb der fehlerdiagnostischen Kompetenz keine Unterschiede fest. Diese Studienergebnisse lassen sich vermutlich dadurch erklären, dass die Studierenden zuvor mit den geförderten Konstrukten nicht oder nur am Rande in Kontakt kamen. Die geförderten Kompetenzen werden durch die Praxisbezüge von hohen und niedrigen Semestern vermutlich gleichermaßen als relevant erlebt, sodass auch affektive Merkmale keine unterschiedlichen Effekte verursachen. Die Abiturnote spielt etwas überraschend in der untersuchten Stichprobe für den Erwerb der Diagnose- und a-priori-Interventionskompetenz keine Rolle. Für den Erwerb der professionellen Unterrichtswahrnehmung liegen jedoch ebenfalls Befunde vor, nach denen sich die Abiturnote als ein schlechter Prädiktor erweist
370
14
Zusammenfassung und Diskussion
(Stürmer, Könings, & Seidel, 2015; Treisch, 2018, S. 109). Es besteht die Vermutung, dass die Abiturnote generell eine geringe Vorhersagekraft hat, wenn es um die Anwendung von Wissen in praxisnahen Situationen geht, da es sich um eine distale Variable handelt (Stürmer et al., 2015). Daher stimmt das Ergebnis der vorliegenden Studie mit Befunden in der Literatur überein. Für die Kontrollvariable Praxiserfahrung wurde ebenfalls kein signifikanter Effekt auf den Erwerb der adaptiven a-priori-Interventionskompetenz nachgewiesen. Für den Einfluss der Praxiserfahrung beim Erwerb situationsspezifischer Kompetenzen finden sich unterschiedliche Befunde, sogar in Bezug auf dasselbe Konstrukt. Stellen Stürmer et al. (2015) keinen Zusammenhang zwischen der professionellen Unterrichtswahrnehmung und der Praxiserfahrung der Studierenden fest, kommt Treisch (2018, S. 93) zu dem Ergebnis, dass die Unterrichtserfahrung den Erwerb der professionellen Unterrichtswahrnehmung signifikant im Umfang eines mittleren Effekts (β = 0.35, p < 0.001) vorhersagt. Heinrichs (2015, S. 255 f.) stellt hingegen keinen Einfluss der außerschulischen Praxiserfahrung, z. B. durch Nachhilfe, auf den Erwerb der fehlerdiagnostischen Kompetenz fest. Es zeigt sich also ein uneinheitliches Bild. Der nicht signifikante Einfluss der Praxiserfahrung in der vorliegenden Studie könnte mit der Art der Erhebung des Merkmals zusammenhängen. Die Praxiserfahrung wurde anhand der Praxistage im Rahmen der absolvierten Pflicht-Praktika berechnet, sodass weitere Praxiserfahrungen, bspw. durch Nachhilfe, nicht erfasst wurden. Die daraus folgende geringe Validität kann für den fehlenden Zusammenhang verantwortlich sein. In Bezug auf den Erwerb der Diagnosekompetenz erweist sich keine der Skalen der selbstberichteten Vorerfahrungen zum mathematischen Modellieren als prädiktiv. Obwohl insbesondere zur Diagnostik Metawissen über das mathematische Modellieren, beispielsweise über den Modellierungskreislauf, benötigt wird, leisten Erfahrungen in der Bearbeitung von Modellierungsaufgaben, Vorerfahrungen aus Lehrveranstaltungen oder aus dem Unterrichten mit Modellierungsaufgaben keinen Beitrag zur Vorhersage des Zuwachses. Beim Erwerb der a-prioriInterventionskompetenz sind die Vorerfahrungen zum mathematischen Modellieren im Unterricht jedoch ein signifikanter Prädiktor. Mit einem kleinen Effekt (β = −0.15, p < 0.05) haben diese Vorerfahrungen einen negativen Einfluss auf den Erwerb der a-priori-Interventionskompetenz. Der negative Effekt kann vermutlich auf Handlungsroutinen zurückgeführt werden, die sich ohne eine geeignete theoretische Fundierung durch unterrichtliche Erfahrungen bei den Studierenden gefestigt haben. So könnten vermeintlich positive unterrichtliche Erfahrungen mit direktiven Interventionen in Gruppenarbeitsprozessen beispielsweise dazu führen, dass adaptive Interventionen in der Testsituation als ungeeignet bewertet werden. Dieser
14.1 Diskussion der Studienergebnisse
371
Befund ist ein Indiz dafür, dass eine rein praxisorientierte Ausbildung ohne theoretische Fundierung sogar kontraproduktiv sein kann. Ergebnisse der COACTIV-Studie belegen beispielsweise eine kleine negative Korrelation (r = −0.15) der Berufserfahrung von deutschen Lehrkräften mit dem fachdidaktischen Wissen (Krauss et al., 2008). Das Vorwissen der Diagnose- und a-priori-Interventionskompetenz ist für beide Teilkompetenzen ein bedeutsamer Prädiktor. Die Diagnosekompetenz im Pretest sagt die Posttestergebnisse mit einem mittleren bis großen Effekt vorher (β = 0.44, p < 0.001), ähnlich verhält es sich mit der a-priori-Interventionskompetenz im Pretest bei der Vorhersage der a-priori-Interventionskompetenz im Posttest (β = 0.41, p < 0.001). Studierende mit hohen Pretestergebnissen erzielen höhere Posttestergebnisse als Studierende mit niedrigeren Pretestergebnissen. Dieses Ergebnis geht mit zahlreichen Befunden zur Rolle des Vorwissens in Bildungsstudien einher (Krause & Stark, 2006) und ist daher erwartungskonform. Die Überzeugungen zum mathematischen Modellieren wurden anhand von vier Skalen erhoben, von denen zwei lerntheoretische – konstruktivistische und transmissive – Überzeugungen erheben. Zwei weitere Skalen erheben Überzeugungen zum Anwendungsbezug des mathematischen Modellierens sowie zum mathematischen Modellieren als ein Bestandteil von Mathematikunterricht. Für die Entwicklung der Diagnose- und a-priori-Interventionskompetenz geht keine der Überzeugungsskalen mit einem signifikanten Prädiktor in die Regressionsgleichungen ein. Für die Entwicklung der Diagnosekompetenz zeichnet sich bei den Überzeugungen zur Anwendung mathematischen Modellierens mit einem kleinen Effekt jedoch eine Tendenz ab (β = 0.09, p = 0.07). Wird das mathematische Modellieren von den Studierenden im Pretest als nützlich angesehen, werden Diagnosekompetenzen tendenziell in einem größeren Umfang erworben. Dieser Effekt lässt sich im Hinblick auf die Filterfunktion von Überzeugungen (Blömeke, 2004; Törner, 2002, S. 75) erklären. Wird das mathematische Modellieren als relevant erlebt, kann dies aufgrund einer höheren Aufmerksamkeit und Informationsaufnahme zu höheren Zuwächsen führen. In Bezug auf den Erwerb von a-priori-Interventionskompetenzen sind Tendenzen für die Bedeutsamkeit der transmissiven Überzeugungen (β = −0.12, p = 0.06) erkennbar. Höhere transmissive Überzeugungen vor den Treatments gehen demnach mit niedrigeren Zuwächsen in der a-priori-Interventionskompetenz einher. Einen Erklärungsansatz liefern Ergebnisse der COACTIV-Studie. Demnach erweisen sich transmissive Überzeugungen nachteilig für die Unterrichtsqualität und die kognitive Aktivierung der Lernenden und stehen in einem negativen Zusammenhang mit konstruktiver Unterstützung (Voss et al., 2011). Da ein konstruktivistisches Lehr-Lern-Verständnis die Grundlage adaptiver Interventionen bildet, erscheint die
372
14
Zusammenfassung und Diskussion
tendenzielle Bedeutsamkeit der transmissiven Überzeugungen für den Erwerb von a-priori-Interventionskompetenzen plausibel. Der nicht signifikante Nachweis der beiden beschriebenen kleinen Effekte ist vermutlich auf eine nicht ausreichend große Stichprobengröße zurückzuführen. Fehlende Zusammenhänge mit den konstruktivistischen Überzeugungen und den Überzeugungen zum mathematischen Modellieren in der Schule können auf Deckeneffekte im Pretest zurückgeführt werden, die vermutlich durch ein sozial erwünschtes Antwortverhalten der Probanden (Döring & Bortz, 2016, S. 437ff) zustande kommen. Aufgrund der geringen Varianz in den Prädiktoren können sich keine ausreichenden Korrelationen mit dem Kriterium ausbilden. Aufgrund der prädiktiven transmissiven Überzeugungen und den Befunden aus der Literatur (Voss et al., 2011) wäre auch für die konstruktivistischen Überzeugungen ein positiver Zusammenhang zu erwarten gewesen. Selbstwirksamkeitserwartungen zum mathematischen Modellieren sind für den Erwerb von Diagnosekompetenzen nicht von Bedeutung. Auch hinsichtlich der Steigerung von a-priori-Interventionskompetenzen ist lediglich eine Tendenz der Selbstwirksamkeitserwartungen zum Modellieren im Rahmen eines kleinen negativen Effekts erkennbar (β = −0.12, p = 0.06). Hohe Selbstwirksamkeitserwartungen zur Diagnostik von Leistungspotentialen in den modellierungsspezifischen Phasen des Lösungsprozesses führen demnach zu geringeren Zuwächsen in den a-prioriInterventionskompetenzen. Diese Tendenz widerspricht den Erwartungen eines höheren Zuwachses, der aufgrund eines mit hohen Selbstwirksamkeitserwartungen einher gehenden hohen Engagements der Lehramtsstudierenden zustande kommen könnte. Aufgrund der Nicht-Signifikanz des Effekts kann es sich um ein statistisches Artefakt handeln, das aufgrund des quasi-experimentellen Design und der nichtrepräsentativen Stichprobe zustande kommt. Es lassen sich keine unterstützenden Befunde in der Literatur finden, sodass zunächst eine inferenzstatistische Absicherung des Effekts in einer größeren Stichprobe vorgenommen werden muss. Erhärtet sich der Zusammenhang, erscheint eine tiefergehende Untersuchung notwendig. Um eine Bedeutsamkeit der nicht signifikanten Prädiktoren auszuschließen, sind zukünftig zwei Maßnahmen notwendig. Einerseits müssen Deckeneffekte in den Skalen der Überzeugungen zum mathematischen Modellieren in zukünftigen Untersuchungen vermieden werden. Dies wird erreicht, indem die Stufenzahl der Likert-Skala erhöht oder ein sozial erwünschtes Antwortverhalten vermieden wird. Objektive Persönlichkeitstests, in denen das Fragebogeninstrument durch eine geringe Augenscheinvalidität für die Probanden undurchschaubar gestaltet wird (Döring & Bortz, 2016, S. 438), verhindern ein solches Antwortverhalten. Eine andere vielversprechende Möglichkeit sind Kontrollskalen, die Tendenzen
14.1 Diskussion der Studienergebnisse
373
zur Fremd- und Selbsttäuschung messen. Der Einfluss dieser Täuschungstendenzen kann dann anhand statistischer Methoden kontrolliert werden (Döring & Bortz, 2016, S. 439). Andererseits ist eine höhere Stichprobenzahl notwendig, um auch kleine Effekte (|β| < 0.10) signifikant nachzuweisen.
14.1.4 Diskussion der Veränderung von Überzeugungen und Selbstwirksamkeitserwartungen zum mathematischen Modellieren Überzeugungen und Selbstwirksamkeitserwartungen zum mathematischen Modellieren stellen einen Bestandteil der professionellen Kompetenz zum Lehren mathematischen Modellierens dar (Klock et al., 2019; Wess et al., angenommen). Für das Treatment in Koblenz wurde daher untersucht, inwiefern sich Überzeugungen (Forschungsfrage 3) und Selbstwirksamkeitserwartungen (Forschungsfrage 4) in mathematischen Modellierungsprozessen durch ein fachdidaktisches Seminar mit Praxiselementen zum mathematischen Modellieren verändern lassen (vgl. Abschnitt 12.3 und 12.4). Evaluationsergebnisse für die EG Münster werden bei Wess (in Vorbereitung) dargestellt.
14.1.4.1 Diskussion der Veränderung von Überzeugungen zum mathematischen Modellieren Bei den lerntheoretischen Überzeugungen wird eine signifikante Abnahme der transmissiven Überzeugungen in der EG Koblenz (part. η2 = 0.10) und der Kontrollgruppe (part. η2 = 0.26) im Umfang mittlerer bis großer Effekte festgestellt.1 Die Studierenden stimmen einer behavioristischen Lehr-Lern-Auffassung nach Absolvierung der fachdidaktischen Seminare in einem geringeren Umfang zu und sehen die Lehrperson weniger im Mittelpunkt des Lernprozesses. Da dieser Effekt auch in der Kontrollgruppe festgestellt wurde, kann die Abnahme dieser Art von Überzeugungen nicht eindeutig dem Treatment in Koblenz zugeordnet werden. Scheinbar lassen sich transmissive Überzeugungen auch anhand fachdidaktischer Seminare ohne Praxiselemente verändern. Die Hypothese 3.2 kann daher nur bedingt bestätigt werden. Die Veränderung der transmissiven Überzeugungen kann jedoch als positiv
1 Da
auch in der Kontrollgruppe ein Effekt auf die transmissiven Überzeugungen festgestellt wurde, ist der Regressionskoeffizient des zugehörigen linearen Modells nicht signifikant, da er den Effekt der Veränderung in der EG Koblenz im Vergleich zur Kontrollgruppe angibt. Daher werden an dieser Stelle die partiellen η2 als Effektstärken berichtet.
374
14
Zusammenfassung und Diskussion
bewertet werden, da sie in Zusammenhang mit einer schlechteren Unterrichtsqualität, einer geringeren kognitiven Aktivierung und konstruktiven Unterstützung von Schülerinnen und Schülern und damit in Zusammenhang mit einem geringeren Lernerfolg stehen (Voss et al., 2011). In den konstruktivistischen Überzeugungen und den Überzeugungen zum mathematischen Modellieren in der Schule konnten keine Veränderungen festgestellt werden, was vermutlich auf die bereits in Abschnitt 14.1.3 beschriebenen Deckeneffekte zurückzuführen ist. Durch bereits hohe Zustimmungswerte im Pretest können keine Veränderungen hinsichtlich höherer Zustimmungswerte erfasst werden. Die Hypothesen 3.1 und 3.4 können daher nicht bestätigt werden. Die Überzeugungen zur Anwendung mathematischen Modellierens werden durch die Belegung des fachdidaktischen Seminars mit Praxiselementen (EG Koblenz) im Vergleich zur Kontrollgruppe signifikant im Umfang eines mittleren Effekts (β = 0.33) hinsichtlich höherer Zustimmungswerte verändert. Die Hypothese 3.3 kann damit voll bestätigt werden. Die Studierenden sehen nach Absolvierung des Treatments einen größeren gesellschaftlichen Nutzen und Anwendungsbezug im mathematischen Modellieren. Studienergebnisse belegten zuletzt, dass Aufgaben mit einem hohen Modellierungsgehalt von angehenden Lehrkräften ein geringes Lernpotential beigemessen wird (Kuntze & Zöttl, 2008) und dass das mathematische Modellieren im Vergleich mit anderen grundlegenden Ideen im Mathematikunterricht als relativ unbedeutend angesehen wird (Siller et al., 2011b). Dahingehend sind die erzielten Veränderungen als positiv zu bewerten. Aufgrund der handlungsleitenden Eigenschaften von Überzeugungen spielt das mathematische Modellieren im zukünftigen Unterricht der Lehramtsstudierenden eventuell eine größere Rolle. Im Hinblick auf die Stabilität von Überzeugungen (Voss et al., 2011) zeigt der mittlere Effekt relativ große Veränderungen in den kognitiven Strukturen der Lehramtsstudierenden an. Untersuchungen zeigen jedoch, dass kleine Veränderungen in den Überzeugungen durchaus erwartet werden können (vgl. bspw. aus dem SINUS-Projekt Kaiser & Maaß, 2007). Die Lehramtsstudierenden setzten sich im Zeitraum eines Semesters intensiv mit dem Gebiet des mathematischen Modellierens und Modellierungsprozessen auseinander, sodass der Effekt durchaus als erwartungskonform bezeichnet werden kann. Die festgestellten Effekte lassen vermuten, dass die Studierenden sich durch die Auseinandersetzung mit dem mathematischen Modellieren und einem adaptiven Interventionsverhalten in kooperativen Modellierungsprozessen mit eigenen Überzeugungen auseinandersetzen konnten oder mit zu ihren Überzeugungen konträren Inhalten konfrontiert wurden. Es ist zu vermuten, dass sich so ihre Überzeugungen, zumindest partiell, verändert haben. Die Zuwächse sind jedoch vor einem eventuell sozial erwünschten Antwortverhalten im Posttest zu relativieren. Durch das
14.1 Diskussion der Studienergebnisse
375
Treatment könnten die Studierenden eine bessere Vorstellung davon bekommen haben, welche Ausprägungen der Items als wünschenswert anzusehen sind und die Fragebogenitems entsprechend beantwortet haben.
14.1.4.2 Diskussion der Veränderung von Selbstwirksamkeitserwartungen zum mathematischen Modellieren Neben Überzeugungen wurde die Veränderung von Selbstwirksamkeitserwartungen in Bezug auf die Diagnostik von Leistungspotentialen untersucht (vgl. Abschnitt 12.4). Sowohl in den Selbstwirksamkeitserwartungen zum Modellieren (β = 0.25, p < 0.01) als auch in den Selbstwirksamkeitserwartungen zum mathematischen Arbeiten (β = 0.20, p < 0.05) wurden in der EG Koblenz Veränderungen im Umfang kleiner bis mittlerer Effekte im Vergleich zur Kontrollgruppe und unter Kontrolle der Pretestergebnisse festgestellt. Die Hypothesen 4.1 und 4.2 werden daher in vollem Umfang bestätigt. Der Aufbau von Selbstwirksamkeitserwartungen ist aufgrund ihrer vorteilhaften Eigenschaften (Kunter, 2011) wünschenswert. Im Hinblick auf den u-förmigen Verlauf der Entwicklung von Lehrerselbstwirksamkeitserwartungen während des Lehramtsstudiums (Schüle et al., 2017) ist ein Anstieg zu erwarten gewesen. Aufgrund von überhöhten Vorstellungen zu Beginn des Studiums führen erste Praxiserfahrungen in Verbindung mit neuen Anforderungssituationen und Handlungsdomänen zu einem Abfall der Selbstwirksamkeitserwartungen (Tschannen-Moran & Woolfolk Hoy, 2007). Im weiteren Verlauf des Studiums sorgen Erfolgserfahrungen in Handlungsfeldern des Lehrerberufs und positive affektive Zustände durch weitere Praxiserfahrungen wiederum für einen Anstieg der Selbstwirksamkeitserwartungen (Schüle et al., 2017). Die untersuchten Studierenden befinden sich am Ende des Bachelorstudiums oder im Masterstudium und haben mindestens zwei Praktika absolviert. Demnach durchlaufen sie aktuell eine Phase der Professionalisierung, in der sie anhand weiterer Praxiserfahrungen Selbstwirksamkeitserwartungen aufbauen. Obwohl den Studierenden Interventionsprozesse im Bereich des mathematischen Modellierens vor dem Treatment größtenteils unbekannt waren, werden in Verbindung mit der Schulung von Diagnosekompetenzen Selbstwirksamkeitserwartungen aufgebaut. Die Größe der gefundenen Effekte deckt sich mit in der Literatur zu findenden kleinen Effekten (Schüle et al., 2017). Rückblickend ist es ähnlich wie bei der Bestimmung von Einflussfaktoren (vgl. Abschnitt 14.1.3) in zukünftigen Untersuchungen wünschenswert die Deckeneffekte in den Skalen der Überzeugungen zum mathematischen Modellieren zu vermeiden, um Veränderungen messbar zu machen. Im Hinblick auf eine experimentelle Variation des Videoeinsatzes und der Praxiseinbindung im Lehr-Lern-Labor
376
14
Zusammenfassung und Diskussion
zwischen den Treatments ist in zukünftigen Untersuchungen zu klären, durch welche Bestandteile des fachdidaktischen Seminars bevorzugt eine Veränderung von Überzeugungen und Selbstwirksamkeitserwartungen stattfindet. Die festgestellten Effekte lassen fachdidaktische Seminare mit Praxiselementen allgemein als geeignet erscheinen, um Überzeugungen und Selbstwirksamkeitserwartungen hinsichtlich wünschenswerter Ausprägungen zu verändern.
14.1.5 Diskussion der Zusammenhänge zwischen den Konstrukten Zusammenhänge zwischen den Aspekten der professionellen Kompetenz zum Lehren mathematischen Modellierens wurden in Vorarbeiten anhand einer Strukturgleichungsmodellierung auf latenter Ebene bestimmt. Diese Ergebnisse lassen auch Zusammenhänge zwischen den einzelnen Facetten vermuten. Um sowohl die Informationen aus dem Pre- als auch aus dem Posttest miteinzubeziehen, wurden die Zusammenhänge zwischen den Facetten der professionellen Kompetenz zum Lehren mathematischen Modellierens anhand von First-Difference-Modellen bestimmt (vgl. Abschnitt 13.2), die um zeitkonstante Störvariablen bereinigt sind und nur die Within-Varianz zur Bestimmung der Zusammenhänge verwenden (vgl. Abschnitt 10.6.5). Diese Modelle haben sowohl Vor- als auch Nachteile. Ein Vorteil ist, dass Unterschiede zwischen den Probanden, die sogenannte Between-Varianz, nicht im Modell enthalten ist. Dadurch ändert sich die Interpretation der Determinationskoeffizienten R2 im Vergleich zu den üblichen OLS-Regressionen (vgl. Abschnitt 10.6.1). In den Berechnungen sind die Varianzaufklärungen jeweils relativ klein (