321 51 5MB
German Pages XXXIV, 314 [342] Year 2021
Jennifer Lung
Schulcurriculares Fachwissen von Mathematiklehramtsstudierenden Struktur, Entwicklung und Einfluss auf den Studienerfolg
Studien zur theoretischen und empirischen Forschung in der Mathematikdidaktik Reihe herausgegeben von Gilbert Greefrath, Münster, Deutschland Stanislaw Schukajlow, Münster, Deutschland Hans-Stefan Siller, Würzburg, Deutschland
In der Reihe werden theoretische und empirische Arbeiten zu aktuellen didaktischen Ansätzen zum Lehren und Lernen von Mathematik – von der vorschulischen Bildung bis zur Hochschule – publiziert. Dabei kann eine Vernetzung innerhalb der Mathematikdidaktik sowie mit den Bezugsdisziplinen einschließlich der Bildungsforschung durch eine integrative Forschungsmethodik zum Ausdruck gebracht werden. Die Reihe leistet so einen Beitrag zur theoretischen, strukturellen und empirischen Fundierung der Mathematikdidaktik im Zusammenhang mit der Qualifizierung von wissenschaftlichem Nachwuchs.
Weitere Bände in der Reihe http://www.springer.com/series/15969
Jennifer Lung
Schulcurriculares Fachwissen von Mathematiklehramts studierenden Struktur, Entwicklung und Einfluss auf den Studienerfolg
Jennifer Lung Westernohe, Deutschland Dissertation Julius-Maximilians-Universität Würzburg, 2019 Tag der mündlichen Prüfung: 07.10.2019 Erstgutachter: Prof. Dr. Hans-Stefan Siller Zweitgutachterin: Prof. Dr. Christina Drüke-Noe
ISSN 2523-8604 ISSN 2523-8612 (electronic) Studien zur theoretischen und empirischen Forschung in der Mathematikdidaktik ISBN 978-3-658-31095-0 ISBN 978-3-658-31096-7 (eBook) https://doi.org/10.1007/978-3-658-31096-7 Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. © Der/die Herausgeber bzw. der/die Autor(en), exklusiv lizenziert durch Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2021 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von allgemein beschreibenden Bezeichnungen, Marken, Unternehmensnamen etc. in diesem Werk bedeutet nicht, dass diese frei durch jedermann benutzt werden dürfen. Die Berechtigung zur Benutzung unterliegt, auch ohne gesonderten Hinweis hierzu, den Regeln des Markenrechts. Die Rechte des jeweiligen Zeicheninhabers sind zu beachten. Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informationen in diesem Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder der Verlag, noch die Autoren oder die Herausgeber übernehmen, ausdrücklich oder implizit, Gewähr für den Inhalt des Werkes, etwaige Fehler oder Äußerungen. Der Verlag bleibt im Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutionsadressen neutral. Planung/Lektorat: Carina Reibold Springer Spektrum ist ein Imprint der eingetragenen Gesellschaft Springer Fachmedien Wiesbaden GmbH und ist ein Teil von Springer Nature. Die Anschrift der Gesellschaft ist: Abraham-Lincoln-Str. 46, 65189 Wiesbaden, Germany
Geleitwort
Diskussionen über das Fachwissen angehender Lehrkräfte, insbesondere am Übergang Schule-Hochschule, werden in den letzten Jahren intensiv geführt. Hierbei werden nicht nur evidenzbasierte Argumente ausgetauscht, sondern oftmals wird anhand subjektiver Erfahrungen diskutiert. Eingebettet in das Qualitätsoffensive-Projekt Modulare Schulpraxiseinbindung als Ausgangspunkt zur individuellen Kompetenzentwicklung hat Frau Lung im Teilprojekt II.2 „Heterogenität als Ausgangspunkt für Professionsentwicklung“ das Thema am Übergang Schule-Hochschule wie auch am Übergang Hochschule-Schule aufgegriffen und Schulcurriculares Fachwissen von Mathematiklehramtsstudierenden untersucht. Theoriegestützt und mit Rückgriff auf evidenzbasierte Erkenntnisse aus Learning Mathematics for Teaching, COACTIV und MT21 erarbeitet Frau Lung eine Operationalisierung zum Schulcurricularen Fachwissen als wesentlichen Bestandteil des professionsbezogenen Fachwissens angehender Mathematiklehrkräfte. Eine Komponente der vorliegenden Arbeit liegt in einer theoretisch fundierten Herangehensweise über die Fehlerkultur in der Mathematik. So gelingt es Frau Lung, einen objektiveren Blick auf Grundwissen und Grundfertigkeiten von Studierenden des Unterrichtsfachs Mathematik am Campus Koblenz der Universität Koblenz-Landau zu richten, indem sie ein Testinstrument entwickelt, um das Konstrukt Schulcurriculares Fachwissen, welches insbesondere mathematisches Alltagswissen und Sekundarstufenwissen beinhaltet, zu überprüfen. Mit Hilfe dieses Testinstruments gelingt es, die theoretisch erarbeitete Struktur dieses Konstrukts empirisch zu prüfen sowie eine theoretisch fundierte und empirisch gestützte Diskussion um das Fachwissen an den Übergängen von Schule zur Hochschule sowie von der Hochschule zur Schule – ganz im Geiste der doppelten Diskontinuität von Felix Klein – darzulegen.
V
VI
Geleitwort
Frau Lung gelingt es, mit der Arbeit ein valides Testinstrument zur Feststellung von Basiswissen und -können bereitzustellen, sodass das operationalisierte Konstrukt Schulcurriculares Fachwissen im Laufe des Studiums immer wieder gemessen werden kann und evidenzbasierte Hinweise zum Studienerfolg ermöglicht werden. Bemerkenswert ist hierbei auch der Umstand, dass im Rahmen der Untersuchung insbesondere der Blick auf Studierende in einem Bundesland (Rheinland-Pfalz) gerichtet wird, die ohne zentrale Abschlussprüfung die Hochschulzugangsberechtigung erhalten, sodass – a priori – vermutet werden könnte, der Wechsel an die Universität finde unter besonders heterogenen Bedingungen statt. Die Arbeit von Frau Lung ist ein wichtiger Beitrag in der Diskussion um Schulcurriculares Wissen zu Beginn eines Mathematiklehramtsstudiums sowie für den Übergang in das Referendariat.
Danksagung
Nach insgesamt drei intensiven Jahren ist nun der Moment gekommen, Danke zu sagen. An erster Stelle danke ich meinem Doktorvater Prof. Dr. Hans-Stefan Siller, der mir die Möglichkeit eröffnete, diesen spannenden Weg in die Forschung einzuschlagen. Ohne dessen Unterstützung und Betreuung wäre die vorliegende Arbeit nie entstanden. Zudem möchte ich mich bei meiner Zweitgutachterin Prof. Dr. Christina Drüke-Noe bedanken, die stets am Fortgang meiner Arbeit interessiert war und mit ihren wertvollen Anregungen wesentlich zum Gelingen dieser Arbeit beigetragen hat. Mein Dank gilt auch dem MoSAiK-Projekt, das den konzeptuellen Rahmen für diese Arbeit bot und die notwendigen finanziellen Mittel bereitstelle. Der interdisziplinäre Austausch hat meine Arbeit in vielen Aspekten bereichert. Darüber hinaus durfte ich viele wertvolle Menschen in Koblenz, Landau, Weingarten und Würzburg kennen lernen, die mich stets unterstützt, inspiriert und motiviert haben. So bin ich meinen Kolleginnen und Kollegen aus Koblenz und Weingarten zum Dank verpflichtet, die sich immer für meine Erhebungen interessiert und diese im Rahmen ihrer Lehrveranstaltungen ermöglicht haben. Insbesondere möchte ich mich bei den Kolleginnen und Kollegen der Koblenzer und Würzburger Arbeitsgruppen bedanken, die wertvolle Rückmeldungen und Denkanstöße lieferten und den Fortschritt dieser Arbeit maßgeblich beeinflusst haben. Auch den studentischen Hilfskräften gebührt an dieser Stelle großer Dank. Ohne eure Hilfe würde ich vermutlich noch heute Tests kodieren. Ganz besonders möchte ich meinen beiden Doktorgeschwistern Ina und Heiner danken. Ohne eure tägliche Unterstützung in inhaltlichen, methodischen, strukturellen, organisatorischen, persönlichen und allen weiteren denkbaren
VII
VIII
Danksagung
Belangen wäre ich nicht dort, wo ich heute bin. Ich kann glücklich sein, in euch Freunde fürs Leben gefunden zu haben. Doch neben all den lieben Kolleginnen und Kollegen möchte ich mich herzlichst bei meinen Freunden und meiner Familie bedanken, die während dieser Zeit sehr viel auf mich verzichten mussten, mir jedoch stets Verständnis und Zuspruch entgegenbrachten. Der größte Dank gilt dabei Kevin und meiner Mutter. Ihr habt mir in Höhen und vor allem in Tiefen zur Seite gestanden und mir Rückhalt und Durchhaltevermögen gegeben. Ohne eure tagtägliche Unterstützung würde diese Arbeit jetzt nicht vor euch liegen. Vielen herzlichen Dank!
Einleitung
Seit der Veröffentlichung der Ergebnisse internationaler Vergleichsstudien wie PISA und TIMSS steht das professionelle Wissen von Lehrkräften sowie deren Ausbildung erneut im Mittelpunkt des öffentlichen und wissenschaftlichen Interesses. Angeregt durch diese Diskussion wurden verschiedene nationale als auch internationale large-scale-Studien wie MT21 (Blömeke, Kaiser, & Lehmann, 2008b), TEDS-M 2008 (Blömeke, Kaiser, & Lehmann, 2010a, 2010b) und COACTIV (Kunter, Baumert, et al., 2011) ins Leben gerufen, um die professionelle Kompetenz von Lehrkräften sowie die Wirksamkeit der Lehrerausbildung im Hinblick auf die Vermittlung dieser Kompetenz zu untersuchen. Dabei ist es insbesondere Ziel der ersten Phase der Lehrerausbildung, eine anschlussfähige Wissensbasis zu schaffen, um den künftigen vielfältigen Anforderungen im Berufsfeld gerecht zu werden (KMK, 2017a, S. 3; Terhart, 2002, S. 30 f.). Einer der zentralen Bereiche dieses professionsspezifischen Wissens ist das Fachwissen, das den Entwicklungsraum des fachdidaktischen Wissens definiert und darüber vermittelt die Unterrichtsqualität maßgeblich beeinflusst (Baumert & Kunter, 2011b, S. 185). Auch wenn bekannt ist, dass die Vermittlung von professionsspezifischem Wissen ein erklärtes Ziel der universitären Lehrerausbildung darstellt und dieses Wissen von zentraler Bedeutung für die Qualität von Unterricht ist, ist die Frage, ob die Ausbildung dieses Wissen tatsächlich wirksam vermittelt, bislang weitgehend ungeklärt. So sind die Befunde der bisherigen Forschungsarbeiten in diesem Feld nur schwer miteinander in Zusammenhang zu setzen und erlauben bislang nur wenig konkrete Aussagen wie die folgende: „Insgesamt deuten die Analysen darauf hin, dass sich auch im Mathematiklehramtsstudium die Wissensentwicklung nicht so kanonisch vollzieht wie häufig angenommen“ (Buchholtz & Kaiser, 2013b, S. 139 f.). Demnach besteht erheblicher Forschungsbedarf hinsichtlich der Frage,
IX
X
Einleitung
wie sich das Fachwissen im Laufe der Ausbildung entwickelt. An dieser Stelle setzt die vorliegende Studie an. Aufgrund der Befunde der hochschuldidaktischen Übergangsforschung, die bereits eindrücklich die mangelnden Fähigkeiten von Studierenden in Bezug auf schulmathematische Inhalte belegen konnten (siehe z. B. Biehler, Bruder, Hochmuth, & Koepf, 2014; Pinkernell & Greefrath, 2011), fokussiert sich diese Arbeit auf die Entwicklungsprozesse bezüglich des Fachwissens über diese schulmathematischen Inhalte. In Anlehnung an die Konzeptualisierungen des mathematischen Fachwissens im Rahmen der Studien MT21 (Blömeke et al., 2008, S. 106) und COACTIV (Krauss et al., 2011, S. 142) wurde das Konstrukt des Schulcurricularen Fachwissens definiert, welches Mathematisches Alltagswissen und Sekundarstufenwissen umfasst. Die erste übergeordnete Zielstellung der vorliegenden Arbeit besteht somit zunächst darin, ein geeignetes Testinstrument zu entwickeln und die theoretisch abgeleitete Struktur dieses Konstrukts empirisch zu überprüfen. Die zweite übergeordnete Zielstellung spiegelt das zentrale Erkenntnisinteresse dieser Arbeit wieder: Die Beschreibung des Schulcurricularen Fachwissens und dessen Entwicklung im Studienverlauf. Hierzu wird neben einer quantitativ-empirischen Perspektive weiterhin eine fachinhaltliche Perspektive eingenommen, indem sowohl die Testleistungen als auch die von den Mathematiklehramtsstudierenden begangenen Fehler im Studienverlauf untersucht werden. Vor dem Hintergrund der Wirksamkeit der Lehrerbildung wird die Entwicklung von Fachwissen im Rahmen der dritten Zielstellung schließlich mit Studienerfolg in Zusammenhang gebracht. Dabei wird das Schulcurriculare Fachwissen der Studierenden sowohl als Prädiktor als auch als eigenständiges Kriterium von Studienerfolg betrachtet und vor dem Hintergrund der individuellen Eignung und der institutionellen Qualifikation reflektiert. Den Ausgangspunkt der vorliegenden Arbeit bildet die Darstellung des theoretischen Rahmens der Studie. Dabei wird zunächst mathematisches Fachwissen als Aspekt der professionellen Kompetenz von Mathematiklehrkräften vorgestellt. Im Fokus dieser Betrachtungen steht neben der Struktur des Fachwissens und dessen Bedeutung für den Unterricht insbesondere dessen Entwicklung im Laufe der ersten Phase der Lehrerausbildung. Auf Grundlage dieser Ausführungen und der vorgenommenen theoretischen Fokussierungen wird das dieser Arbeit zugrundeliegende Konstrukt des Schulcurricularen Fachwissens als Teilbereich des professionsspezifischen Fachwissens von (angehenden) Mathematiklehrkräften spezifiziert (siehe Kapitel 1). Das zweite Kapitel bettet die vorliegende Arbeit in ihren situativen Kontext ein, indem die Entwicklung
Einleitung
XI
von Fachwissen vor dem Hintergrund der beiden Übergänge von der Schule an die Hochschule und nach dem Studium erneut von der Hochschule an die Schule hinsichtlich der entsprechenden Passungsverhältnisse reflektiert wird. Diese Ausführungen verdeutlichen die Rolle der Entwicklung von Fachwissen als erklärtes Ziel der universitären Lehrerbildung und eröffnen die Betrachtung des Schulcurricularen Fachwissens aus Perspektive des Studienerfolgs. Auf Basis theoretischer Überlegungen und empirischer Befunde wird schließlich ein Rahmenmodell entwickelt, welches den Ausgangspunkt der Analysen zur Vorhersage von Studienerfolg im Rahmen der vorliegenden Arbeit darstellt (siehe Kapitel 2). Im dritten Kapitel des theoretischen Hintergrunds wird der Begriff des Fehlers spezifiziert und eine Klassifizierung verschiedener Fehlerphänomene dargelegt, die zur inhaltsanalytischen Auswertung der studentischen Aufgabenbearbeitungen herangezogen wird (siehe Kapitel 3). Auf dieser theoretischen Grundlage werden anschließend die der vorliegenden Arbeit zugrundeliegenden Fragestellungen entwickelt, in die drei übergeordneten Zielstellungen eingebettet und, sofern möglich, in Form konkreter Hypothesen weiter ausdifferenziert (siehe Kapitel 4). Im Anschluss an die Formulierung dieser Zielstellungen erfolgt die Darlegung des methodischen Ansatzes der Studie. Hierzu wird zunächst das zugrundeliegende Studiendesign und die untersuchte Stichprobe vorgestellt (siehe Kapitel 5), bevor das konkrete Vorgehen der Datenerhebung in Kapitel 6 begründet und beschrieben wird. Im Vordergrund steht hierbei die Darstellung des in der Arbeit verwendeten Testinstruments zur Messung des Schulcurricularen Fachwissens. Abgeschlossen wird dieser Abschnitt durch die Beschreibung der verwendeten Methoden zur Analyse der erhobenen Daten (siehe Kapitel 7). An diese theoretischen und methodischen Grundlegungen schließen die Darstellung und Diskussion der gewonnenen Ergebnisse an. Die Präsentation der Ergebnisse erfolgt dabei aus inhaltlicher Perspektive, sodass dieses Kapitel im Einklang mit den drei herausgestellten Zielstellungen ebenfalls in drei Unterkapitel gegliedert ist. Demnach werden in Kapitel 8 zunächst die Ergebnisse der Strukturprüfung des Konstrukts des Schulcurricularen Fachwissens vorgestellt. Im Sinne der zweiten Zielstellung erfolgt daran anschließend die Beschreibung des Schulcurricularen Fachwissens und dessen Entwicklung im Studienverlauf (siehe Kapitel 9). Die Ergebnisse der Untersuchung der beiden betrachteten Facetten von Studienerfolg und deren Bedingungsfaktoren werden in Kapitel 10 dargestellt. Die Diskussion der jeweiligen Ergebnisse findet sich am Ende jedes Abschnittes.
XII
Einleitung
Den Abschluss der vorliegenden Arbeit stellt eine übergreifende Diskussion der zentralen Ergebnisse der Untersuchung dar. Neben der Formulierung möglicher praktischer Implikationen zur Förderung der Entwicklung von Schulcurricularem Fachwissen werden die methodischen Grenzen dargelegt und reflektiert sowie resultierende weiterführende Fragestellungen aufgezeigt (siehe Kapitel 11).
Inhaltsverzeichnis
Teil I Theoretischer Rahmen 1
Schulcurriculares Fachwissen als Teilbereich des professionsspezifischen Fachwissens von (angehenden) Mathematiklehrkräften. . . . . . . . . . . . . . . . . . . . . . 3 1.1 Fachwissen als Aspekt der professionellen Kompetenz von Lehrkräften. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.1.1 Lehrkräfte im Fokus der Lehr-Lern-Forschung. . . . . . . . 4 1.1.2 Der Begriff der Kompetenz. . . . . . . . . . . . . . . . . . . . . . . 6 1.1.3 Das Konstrukt der professionellen Kompetenz. . . . . . . . 8 1.1.4 Konzeptualisierungen des mathematischen Fachwissens. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.1.5 Empirische Befunde zur Bedeutung des mathematischen Fachwissens. . . . . . . . . . . . . . . . . . . . . 19 1.2 Die Entwicklung des Fachwissens angehender Lehrkräfte. . . . . . 21 1.2.1 Die Eignungs- und Qualifikationshypothese. . . . . . . . . . 22 1.2.2 Empirische Befunde zur Entwicklung des mathematischen Fachwissens. . . . . . . . . . . . . . . . . . . . . 23 1.3 Zwischenfazit und Schlussfolgerungen. . . . . . . . . . . . . . . . . . . . . 26
2
Fachwissen im Kontext der Übergangsforschung. . . . . . . . . . . . . . . . 33 2.1 Begriffsbestimmung und theoretische Einordnung. . . . . . . . . . . . 34 2.2 Fachwissen am Übergang Schule-Hochschule . . . . . . . . . . . . . . . 36 2.2.1 Fachwissen am Ende der gymnasialen Oberstufe. . . . . . 37 2.2.2 Fachwissen in der Studieneingangsphase . . . . . . . . . . . . 41
XIII
XIV
Inhaltsverzeichnis
2.2.3 2.2.4
2.3
2.4
2.5
Studienabbruch im Lehramt Mathematik . . . . . . . . . . . . 44 Unterstützungsmaßnahmen in der Studieneingangsphase . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 Prädiktoren für Studienerfolg . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 2.3.1 Individuelle Studierendenmerkmale . . . . . . . . . . . . . . . . 56 2.3.2 Universitäre Lerngelegenheiten. . . . . . . . . . . . . . . . . . . . 61 2.3.3 Rahmenmodell zur Vorhersage von Studienerfolg. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 Fachwissen an der Schnittstelle Hochschule-Schule. . . . . . . . . . . 64 2.4.1 Ziele des Mathematiklehramtsstudiums. . . . . . . . . . . . . . 64 2.4.2 Empirische Befunde zum Fachwissen von Studienabsolventinnen und Studienabsolventen respektive Referendarinnen und Referendaren . . . . . . . . 66 Zwischenfazit und Schlussfolgerungen. . . . . . . . . . . . . . . . . . . . . 69
3
Fehleranalysen in der Mathematikdidaktik. . . . . . . . . . . . . . . . . . . . . 73 3.1 Begriffsbestimmung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 3.2 Klassifizierung von Fehlern. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 3.3 Zwischenfazit. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4
Ziele, Fragestellungen und Hypothesen der Vorliegenden Studie. . . . 83 4.1 Forschungsfrage 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 4.2 Forschungsfrage 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 4.3 Forschungsfrage 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 4.4 Forschungsfrage 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
Teil II Methodischer Ansatz 5 Untersuchungsdesign. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 5.1 Die Mathematiklehramtsausbildung am Campus Koblenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 5.2 Methodologische Verortung der vorliegenden Studie . . . . . . . . . . 97 5.3 Anlage der Studie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 5.4 Beschreibung der Stichproben. . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 6
Beschreibung der Datenerhebung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 6.1 Entwicklung des Testinstruments. . . . . . . . . . . . . . . . . . . . . . . . . . 105 6.2 Durchführung der Studie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
Inhaltsverzeichnis
XV
7 Vorbereitung und Beschreibung der Datenanalyse. . . . . . . . . . . . . . . 117 7.1 Datenaufbereitung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 7.2 Skalierung des Schulcurricularen Fachwissens. . . . . . . . . . . . . . . 118 7.2.1 Begründung der Verwendung des ordinalen Rasch-Modells. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 7.2.2 Schätzung der Itemparameter. . . . . . . . . . . . . . . . . . . . . . 121 7.2.3 Modellauswahl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 7.2.4 Ermittlung der Personenparameter. . . . . . . . . . . . . . . . . . 131 7.2.5 Kontrolle der Modellpassung. . . . . . . . . . . . . . . . . . . . . . 133 7.3 Überprüfung der Testgütekriterien. . . . . . . . . . . . . . . . . . . . . . . . . 135 7.3.1 Hauptgütekriterien. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 7.3.2 Nebengütekriterien. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 7.4 Methoden der Datenanalyse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 7.4.1 Übersicht über die Analysemethoden nach Forschungsfragen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 7.4.2 Verwendete Methoden der Zusammenhangsanalysen. . . . . . . . . . . . . . . . . . . . . . . . . 141 7.4.3 Verwendete Methoden der Unterschiedsprüfung. . . . . . . 143 7.4.4 Quantitative Inhaltsanalyse der Aufgabenbearbeitungen. . . . . . . . . . . . . . . . . . . . . . . . . . 145 Teil III Darstellung und Diskussion der Ergebnisse 8
Struktur des Schulcurricularen Fachwissens. . . . . . . . . . . . . . . . . . . . 155 8.1 Vorläufige Modellauswahl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 8.2 Kontrolle der Modellauswahl: Analyse der Itemkennwerte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 8.3 Kontrolle der Modellauswahl: Differential Item Functioning. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160 8.4 Itemkennwerte und Deskriptivstatistik des ausgewählten Modells. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 8.5 Zusammenhang zwischen Mathematischem Alltagswissen und Sekundarstufenwissen. . . . . . . . . . . . . . . . . . . 165 8.6 Diskussion der ersten Zielstellung. . . . . . . . . . . . . . . . . . . . . . . . . 167
9
Schulcurriculares Fachwissen im Studienverlauf . . . . . . . . . . . . . . . . 173 9.1 Testleistungen im Studienverlauf. . . . . . . . . . . . . . . . . . . . . . . . . . 173 9.1.1 Schulcurriculares Fachwissen von Studienanfängerinnen und Studienanfängern . . . . . . . . . 174
XVI
Inhaltsverzeichnis
9.1.2
9.2
9.3
Vergleich von Studienanfängerinnen und Studienanfängern mit Abiturientinnen und Abiturienten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 9.1.3 Schulcurriculares Fachwissen von fortgeschrittenen Bachelorstudierenden. . . . . . . . . . . . . . 182 9.1.4 Schulcurriculares Fachwissen von fortgeschrittenen Masterstudierenden . . . . . . . . . . . . . . . 185 9.1.5 Schulcurriculares Fachwissen im Studienverlauf. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188 Fehlerhäufigkeiten im Studienverlauf . . . . . . . . . . . . . . . . . . . . . . 196 9.2.1 Fehlerhäufigkeiten von Studienanfängerinnen und Studienanfängern . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 9.2.2 Fehlerhäufigkeiten von fortgeschrittenen Bachelorstudierenden. . . . . . . . . . . . . . . . . . . . . . . . . . . . 198 9.2.3 Fehlerhäufigkeiten von fortgeschrittenen Masterstudierenden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200 9.2.4 Fehlerhäufigkeiten im Studienverlauf . . . . . . . . . . . . . . . 201 9.2.5 Identifikation von inhaltlichen Stärken und Schwächen. . . . . . . . . . . . . . . . . . . . . . . . . . 204 Diskussion der zweiten Zielstellung . . . . . . . . . . . . . . . . . . . . . . . 217 9.3.1 Diskussion des Schulcurricularen Fachwissens von Studienanfängerinnen und Studienanfängern. . . . . . 218 9.3.2 Diskussion des Schulcurricularen Fachwissens von fortgeschrittenen Bachelorstudierenden. . . . . . . . . . 222 9.3.3 Diskussion des Schulcurricularen Fachwissens von fortgeschrittenen Masterstudierenden. . . . . . . . . . . . 223 9.3.4 Diskussion der Entwicklung des Schulcurricularen Fachwissens . . . . . . . . . . . . . . . . . . . . 225
10 Bedingungsfaktoren für den Studienerfolg . . . . . . . . . . . . . . . . . . . . . 229 10.1 Einflüsse auf die durchschnittliche Studiennote . . . . . . . . . . . . . . 229 10.1.1 Einflüsse individueller Studierendenmerkmale auf die durchschnittliche Studiennote . . . . . . . . . . . . . . . 229 10.1.2 Einflüsse universitärer Lerngelegenheiten auf die durchschnittliche Studiennote . . . . . . . . . . . . . . . 243 10.1.3 Gemeinsame Betrachtung von individuellen Studierendenmerkmalen und universitären Lerngelegenheiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
Inhaltsverzeichnis
XVII
10.2 Einflüsse auf die Entwicklung des Schulcurricularen Fachwissens. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252 10.3 Diskussion der dritten Zielstellung . . . . . . . . . . . . . . . . . . . . . . . . 256 10.3.1 Diskussion der Einflussfaktoren auf die durchschnittliche Studiennote . . . . . . . . . . . . . . . . . . 257 10.3.2 Diskussion der Einflussfaktoren auf die Entwicklung des Schulcurricularen Fachwissens . . . . . . 264 11 Zusammenfassung und Ausblick. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267 11.1 Zusammenfassende Diskussion der Ergebnisse. . . . . . . . . . . . . . . 267 11.2 Praktische Implikationen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270 11.2.1 Beratung und Vorbereitung von Abiturientinnen und Abiturienten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270 11.2.2 Auswahl geeigneter Bewerberinnen und Bewerber. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273 11.2.3 Unterstützung von Studienanfängerinnen und Studienanfängern. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273 11.2.4 Unterstützung von fortgeschrittenen Studierenden. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277 11.3 Methodische Grenzen der Studie. . . . . . . . . . . . . . . . . . . . . . . . . . 279 11.4 Ausblick und Fazit. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287 Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293
Abkürzungsverzeichnis
AIC Akaike’s Information Criterion BBS Berufsbildende Schule BIC Bayesian Information Criterion CAIC Consistent Akaike’s Information Criterion CCK common content knowledge cosh cooperation Schule Hochschule DIF Differential Item Functioning DMV Deutsche Mathematiker-Vereinigung EPA Einheitlichen Prüfungsanforderungen in der Abiturprüfung Mathematik GDM Gesellschaft für Didaktik der Mathematik Gym Gymnasium HZB Hochschulzugangsberechtigung IEA International Association for Evaluation of Educational Achievement KMK Ständige Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland LMT Learning Mathematics for Teaching MaLeMINT Mathematische Lernvoraussetzungen für MINT-Studiengänge MNU Deutscher Verein zur Förderung des mathematischen und naturwissenschaftlichen Unterrichts MT21 Mathematics Teaching in the 21st Century PV Plausible Value RS Realschule Plus SCK specialized content knowledge TEDS-LT Teacher Education and Development Study: Learning to Teach
XIX
XX
Abkürzungsverzeichnis
TEDS-M Teacher Education and Development Study: Learning to Teach Mathematics WLE Weighted-Likelihood-Estimate WMNSQ Weighted Mean Square
Abbildungsverzeichnis
Abbildung 1.1
Abbildung 1.2 Abbildung 1.3 Abbildung 2.1 Abbildung 2.2 Abbildung 2.3 Abbildung 2.4 Abbildung 3.1
Abbildung 5.1 Abbildung 6.1 Abbildung 6.2
Das Kompetenzmodell von COACTIV. (Adaptiert nach Baumert & Kunter, 2011a, S.32; mit freundlicher Genehmigung von © Waxmann Verlag GmbH, 2011. All Rights Reserved). . . . . . . . . . . 9 Übersicht über die Erhebungszeitpunkte der vorgestellten Studien. . . . . . . . . . . . . . . . . . . . . . . . . 26 Struktur des Schulcurricularen Fachwissens. . . . . . . . . . 30 Darstellung der in der vorliegenden Arbeit untersuchten Übergänge . . . . . . . . . . . . . . . . . . . 36 Darstellung der untersuchten Aspekte beim Übergang von der Schule an die Hochschule. . . . . . . . . 37 Rahmenmodell zur Vorhersage des Studienerfolgs. . . . . 63 Darstellung der untersuchten Aspekte beim Übergang von der Hochschule an die Schule. . . . . . . . . 64 Klassifikation der Fehlerphänomene der vorliegenden Arbeit. (Adaptiert nach Türling, 2014, S. 48; mit freundlicher Genehmigung von © Springer Fachmedien Wiesbaden GmbH 2014. All Rights Reserved). . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 Übersicht über die verschiedenen Erhebungszeitpunkte der Trendstudie. . . . . . . . . . . . . . . 98 Aufgabe A1.02 (Mathematisches Alltagswissen, Leitidee 1). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 Aufgabe S5.02 (Sekundarstufenwissen, Leitidee 5). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
XXI
XXII
Abbildung 7.1 Abbildung 7.2
Abbildung 7.3
Abbildung 7.4
Abbildung 7.5
Abbildung 7.6 Abbildung 7.7 Abbildung 7.8 Abbildung 8.1 Abbildung 8.2 Abbildung 8.3
Abbildung 8.4
Abbildung 8.5
Abbildung 9.1 Abbildung 9.2
Abbildungsverzeichnis
Between-item-Modell mit dem übergeordneten Generalfaktor „Schulcurriculares Fachwissen“ . . . . . . . 124 Between-item-Modell mit den beiden komponentenbezogenen Dimensionen „Mathematisches Alltagswissen“ und „Sekundarstufenwissen“. . . . . . . . . . . . . . . . . . . . . . . . . 125 Between-item-Modell mit den drei strukturbezogenen Dimensionen „Mathematisches Alltagswissen“, „Sekundarstufen-I-Wissen“ und „Sekundarstufen-II-Wissen“ . . . . . . . . . . . . . . . . . . 126 Between-item-Modell mit den beiden curriculumsbezogenen Dimensionen „Sekundarstufen-I-Wissen“ und „Sekundarstufen-II-Wissen“. . . . . . . . . . . . . . . . . . . . . . 127 Ausschnitt aus der Kodieranleitung zur Kodierung der verwendeten Strategie in Aufgabe S5.02. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 Scan eines Rechenfehlers in Aufgabe S5.02. . . . . . . . . . 149 Ausschnitt aus der Kodieranleitung zur Kodierung der Ausführung in Aufgabe S5.02. . . . . . . . . 149 Ausschnitt aus der Kodieranleitung zur Kodierung der Ergebnisdarstellung in Aufgabe S5.02. . . . . . . . . . . 150 Graphischer Modelltest bezüglich des Geschlechts. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 Graphischer Modelltest bezüglich des Medians. . . . . . . 162 Boxplots der relativen Summenscores des Mathematischen Alltagswissens und des Sekundarstufenwissens (N = 848). . . . . . . . . . . . . . 164 Boxplots der relativen Summenscores des Mathematischen Alltagswissens und des Sekundarstufenwissens (N = 582). . . . . . . . . . . . . . 165 Streudiagramm des Zusammenhangs zwischen Mathematischem Alltagswissen und Sekundarstufenwissen (N = 582). . . . . . . . . . . . . . . . . . 166 Übersicht über die verschiedenen Erhebungszeitpunkte. . . . . . . . . . . . . . . . . . . . . . . . . . . . 174 Boxplots der relativen Summenscores des Mathematischen Alltagswissens und des Sekundarstufenwissens der Studienanfängerinnen und Studienanfänger (t1, N = 108). . . . . . . . . . . . . . . . . 175
Abbildungsverzeichnis
Abbildung 9.3
Abbildung 9.4
Abbildung 9.5
Abbildung 9.6
Abbildung 9.7
Abbildung 9.8
Abbildung 9.9
Abbildung 9.10
XXIII
Säulendiagramm der absoluten Häufigkeiten der relativen Summenscores des Mathematischen Alltagswissens der Studienanfängerinnen und Studienanfänger mit markiertem Schwellenwert bei 70 % (t1, N = 108) . . . . . . . . . . . . . . . . . . . . . . . . . . 176 Säulendiagramm der absoluten Häufigkeiten der relativen Summenscores des Sekundarstufenwissens der Studienanfängerinnen und Studienanfänger mit markiertem Schwellenwert bei 60 % (t1, N = 108) . . . . 177 Säulendiagramm der absoluten Häufigkeiten der relativen Summenscores des Mathematischen Alltagswissens der Abiturientinnen und Abiturienten mit markiertem Schwellenwert bei 70 % (t0, N = 145). . . . . . . . . . . . . . 181 Säulendiagramm der absoluten Häufigkeiten der relativen Summenscores des Sekundarstufenwissens der Abiturientinnen und Abiturienten mit markiertem Schwellenwert bei 60 % (t0, N = 145) . . . . . . . . . . . . . . . . . . . . . . . . . . 181 Boxplots der relativen Summenscores des Mathematischen Alltagswissens und des Sekundarstufenwissens der fortgeschrittenen Bachelorstudierenden (t2, N = 130). . . . . . . . . . . . . . . . 183 Säulendiagramm der absoluten Häufigkeiten der relativen Summenscores des Mathematischen Alltagswissens der fortgeschrittenen Bachelorstudierenden mit markiertem Schwellenwert bei 75 % (t2, N = 130). . . . . . . . . . . . . . 184 Säulendiagramm der absoluten Häufigkeiten der relativen Summenscores des Sekundarstufenwissens der fortgeschrittenen Bachelorstudierenden mit markiertem Schwellenwert bei 70 % (t2, N = 130) . . . . . . . . . . . . . . . . . . . . . . . . . . 184 Boxplots der relativen Summenscores des Mathematischen Alltagswissens und des Sekundarstufenwissens der fortgeschrittenen Masterstudierenden (t3, N = 121). . . . . . . . . . . . . . . . . . 185
XXIV
Abbildung 9.11
Abbildung 9.12
Abbildung 9.13
Abbildung 9.14
Abbildung 9.15
Abbildung 9.16
Abbildung 9.17
Abbildung 9.18
Abbildungsverzeichnis
Säulendiagramm der absoluten Häufigkeiten der relativen Summenscores des Mathematischen Alltagswissens der fortgeschrittenen Masterstudierenden mit markiertem Schwellenwert bei 80 % (t2, N = 130) . . . . . . . . . . . . . . . . . . . . . . . . . . 186 Säulendiagramm der absoluten Häufigkeiten der relativen Summenscores des Sekundarstufenwissens der fortgeschrittenen Masterstudierenden mit markiertem Schwellenwert bei 75 % (t2, N = 130) . . . . . . . . . . . . . . . . . . . . . . . . . . 187 Boxplots der relativen Summenscores des Mathematischen Alltagswissens und des Sekundarstufenwissens nach Messzeitpunkt (Nt1 = 84, Nt2 = 64, Nt3 = 86) . . . . . . . . . . . . . . . . . . . . 188 Boxplots der Differenzen der relativen Summenscores des Mathematischen Alltagswissens und des Sekundarstufenwissens zwischen den Messzeitpunkten t1 und t2 (N = 15). . . . . . . . . . . . . . . . 195 Boxplots der relativen Anteile von Ausführungs-, Strategie- und Darstellungsfehlern an falsch bearbeiteten Aufgaben sowie nicht bearbeiteter Aufgaben der Studienanfängerinnen und Studienanfänger (t1, N = 108) . . . . . . . . . . . . . . . . . . . . 198 Boxplots der relativen Anteile von Ausführungs-, Strategie- und Darstellungsfehlern an falsch bearbeiteten Aufgaben sowie nicht bearbeiteter Aufgaben der fortgeschrittenen Bachelorstudierenden (t2, N = 129). . . . . . . . . . . . . . . . 199 Boxplots der relativen Anteile von Ausführungs-, Strategie- und Darstellungsfehlern an falsch bearbeiteten Aufgaben sowie nicht bearbeiteter Aufgaben der fortgeschrittenen Masterstudierenden (t3, N = 114). . . . . . . . . . . . . . . . . . 200 Boxplots der Anzahl falsch bearbeiteter Aufgaben nach Messzeitpunkt (Nt1 = 84, Nt2 = 64, Nt3 = 86) . . . . . . . . . . . . . . . . . . . . 201
Abbildungsverzeichnis
Abbildung 9.19
Abbildung 9.20 Abbildung 9.21 Abbildung 9.22 Abbildung 9.23 Abbildung 9.24 Abbildung 9.25 Abbildung 10.1 Abbildung 10.2
Abbildung 10.3
Abbildung 10.4
Abbildung 10.5
Abbildung 10.6
Abbildung 10.7
Abbildung 10.8
XXV
Boxplots der relativen Anteile von Ausführungs-, Strategie- und Darstellungsfehlern an falsch bearbeiteten Aufgaben sowie nicht bearbeiteter Aufgaben nach Messzeitpunkten (Nt1 = 83, Nt2 = 63, Nt3 = 82) . . . . . . . . . . . . . . . . . . . . 202 Aufgabe A2.01. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 Aufgabe A5.01. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206 Aufgabe S1.02. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208 Aufgabe S4.01. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 Aufgabe S4.02 (vgl. Baumert et al., 1999, S. 78). . . . . . 209 Aufgabe S2.02. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213 Betrachtete Aspekte des Rahmenmodells zur Vorhersage der durchschnittlichen Studiennote. . . . . . . 230 95 %-Konfidenzintervalle der durchschnittlichen Studiennote nach Geschlecht (Nweiblich = 96, Nmännlich = 101) . . . . . . . . . . . . . . . . . . . 231 95 %-Konfidenzintervalle der durchschnittlichen Studiennote nach Bundesland der HZB (NRLP = 167, NAußerhalb von RLP = 25) . . . . . . . . . . . 232 95 %-Konfidenzintervalle der durchschnittlichen Studiennote nach Schulart der HZB (NGymnasium = 154, NBerufliches Gymnasium = 26, NGesamtschule = 11, NSonstige = 6). . . . . . . . . . . . . . . . . . . . 232 Streudiagramm des Zusammenhangs zwischen der Dauer zwischen Schulabschluss und Studienbeginn und der durchschnittlichen Studiennote (N = 185) . . . . . . . . . . . . . . . . . . . . . . . . . . 233 Streudiagramm des Zusammenhangs zwischen der Abiturnote und der durchschnittlichen Studiennote (N = 185) . . . . . . . . . . . . . . . . . . . . . . . . . . 235 Streudiagramm des Zusammenhangs zwischen der letzten schulischen Mathematiknote und der durchschnittlichen Studiennote (N = 188). . . . . . . . . . . 236 95%-Konfidenzintervalle der durchschnittlichen Studiennote nach Kurswahl (NLeistungskurs = 151, NGrundkurs = 40). . . . . . . . . . . . . . . . 237
XXVI
Abbildung 10.9
Abbildung 10.10
Abbildung 10.11
Abbildung 10.12
Abbildung 10.13 Abbildung 10.14
Abbildung 10.15
Abbildung 10.16
Abbildung 10.17
Abbildungsverzeichnis
Streudiagramm des Zusammenhangs zwischen dem Mathematischen Alltagswissen und der durchschnittlichen Studiennote (N = 197). . . . . . . . . . . 237 Streudiagramm des Zusammenhangs zwischen dem Sekundarstufenwissen und der durchschnittlichen Studiennote (N = 197) . . . . . . . . . . . . . . . . . . . . . . . . . . 238 Einfaches Mediationsmodell zwischen letzter schulischer Mathematiknote, Abiturnote und durchschnittlicher Studiennote (N = 180, * p 31
0
3
5
8
Anzahl bestandener Module
t1
t2
t3
Gesamt
0
108
8
0
173
1–2
0
20
0
35
3–4
0
57
0
62
5–6
0
36
2
39
7–8
0
8
23
31
9–10
0
0
32
32
11–12
0
0
15
15
13
0
0
1
1
Die 145 untersuchten Abiturientinnen und Abiturienten (40 % weiblich) waren im Durchschnitt 18.6 Jahre alt (SD = 0.8 Jahre). 62.8 % der Schülerinnen und Schüler belegten einen Leistungskurs Mathematik; die mittlere letzte Mathematiknote beträgt 2.6 (SD = 1.2).
104
5 Untersuchungsdesign
Da die Befragung in Form eines Paper-Pencil-Tests stattgefunden hat, konnten die Testbögen an die in der jeweils besuchten Lehrveranstaltung anwesenden Studierenden ausgeteilt und nach Bearbeitung vor Ort wieder eingesammelt werden, sodass insgesamt eine hohe Rücklaufquote erreicht werden konnte. Da versäumt wurde, die Anwesenheit zu protokollieren, wurde die Anzahl der anwesenden Studierenden in den jeweiligen Lehrveranstaltungen nachträglich gemeinsam mit den verantwortlichen Dozierenden geschätzt. Die Rücklaufquote dürfte nach diesen Schätzungen zwischen 85 % und 100 % liegen, da jeweils, wenn überhaupt, nur wenige Studierende die Teilnahme verweigerten und die Veranstaltung vorzeitig verlassen haben. Die Anwesenheitsquoten lagen je nach Veranstaltung etwa zwischen 45 % und 88 %.5 Damit handelt es sich bei den anwesenden Studierenden lediglich um einen Teil der offiziell angemeldeten Studierenden. Demnach muss von einer Selbstselektion ausgegangen werden, da vermutet werden kann, dass aufgrund der fehlenden Anwesenheitspflicht überwiegend motivierte Studierende die Vorlesungen besuchen. Bei der Testung der Abiturientinnen und Abiturienten konnten jeweils 100 % der anwesenden Schülerinnen und Schüler getestet werden.
5Da
die Anzahl der anwesenden Studierenden nachträglich geschätzt werden musste, sind diese Anwesenheitsquoten jedoch ebenfalls unter Vorbehalt zu verstehen.
6
Beschreibung der Datenerhebung
Das vorliegende Kapitel dient der Darlegung der verwendeten Datenerhebungsmethode. Dabei wird in Abschnitt 6.1 zunächst die theoretische Fundierung des Testentwurfes vorgestellt, bevor die empirische Überprüfung dessen im Ergebnisbericht dieser Arbeit erfolgt (siehe Kapitel 8). Abschnitt 6.2 liefert einen Einblick in die praktische Durchführung der Erhebungen der vorliegenden Studie.
6.1 Entwicklung des Testinstruments Das eingesetzte Testinstrument ist ein psychometrischer Leistungstest, da sich das zu erfassende Konstrukt des Schulcurricularen Fachwissens auf die kognitive Leistungsfähigkeit der Testpersonen bezieht (Jonkisz, Moosbrugger, & Brandt, 2012, S. 29). Dabei handelt es sich um eine Mischform von Speed- und Powertests, da der Test sowohl leichte als auch schwierige Aufgaben umfasst und die Bearbeitungszeit begrenzt ist (Jonkisz et al., 2012, S. 30). Hinsichtlich der weiteren Differenzierung von Leistungstests nach Döring und Bortz (2016c) kann der eingesetzte Test rein formal als Schulleistungstest verstanden werden, da sich die Testaufgaben auf die Inhalte des entsprechenden Schulfaches, hier also die Mathematik, beziehen (S. 457). Auch wenn der Test im universitären und nicht im schulischen Kontext eingesetzt wird, wäre es auf inhaltlicher Ebene nicht angebracht, von einem „Studienleistungstest“ zu sprechen, sodass die Elektronisches Zusatzmaterial Die elektronische Version dieses Kapitels enthält Zusatzmaterial, das berechtigten Benutzern zur Verfügung steht https://doi. org/10.1007/978-3-658-31096-7_6. © Der/die Herausgeber bzw. der/die Autor(en), exklusiv lizenziert durch Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2021 J. Lung, Schulcurriculares Fachwissen von Mathematiklehramtsstudierenden, Studien zur theoretischen und empirischen Forschung in der Mathematikdidaktik, https://doi.org/10.1007/978-3-658-31096-7_6
105
106
6 Beschreibung der Datenerhebung
Bezeichnung als Schulleistungstest an dieser Stelle zur theoretischen Einordnung des Instrumentes beibehalten wird. Insgesamt umfasst der eingesetzte Testbogen vier strukturierende Elemente: Das Deckblatt mit Titel, Instruktion sowie der Angabe des anonymisierten persönlichen Codes, einen Fragenblock zu soziodemographischen und studienverlaufsspezifischen Angaben, den inhaltlichen Teil mit den Testaufgaben zur Erfassung der beiden Facetten des Schulcurricularen Fachwissens sowie einen Schlussteil mit der Möglichkeit für Feedback. Der Fragenblock umfasst Einzelitems zur Erfassung der für die vorliegende Arbeit relevanten individuellen Studierendenmerkmale sowie Angaben zu universitären Lerngelegenheiten (siehe Abschnitt 2.3.3). Dabei handelt es sich um Selbstauskünfte, die in Form quasi-geschlossener Faktenfragen (z. B. „Alter in Jahren: ________“) oder geschlossenen Auswahlantworten (z. B. Kurswahl: □ Grundkurs, □ Leistungskurs) erhoben wurden (Döring & Bortz, 2016c, S. 408). Die Konstruktion des inhaltlichen Teils des Tests erfolgte nach der rationalen Konstruktionsstrategie, da eine „gut ausgearbeitete Theorie für das zu untersuchende Konstrukt vorliegt“ (Bühner, 2011, S. 93). Da die angenommene zweidimensionale Struktur des Schulcurricularen Fachwissens in dieser Form jedoch bislang nicht empirisch bestätigt wurde, gilt es im Rahmen der vorliegenden Studie zu explorieren, ob diese theoretisch angenommenen Dimensionen tatsächlich vorliegen (siehe erste Zielstellung in Kapitel 4). Demnach umfasst die verwendete Konstruktionsstrategie neben deduktiven auch induktive Aspekte (Bühner, 2011, S. 94 f.; Jonkisz et al., 2012, S. 38). Die beiden Facetten des Schulcurricularen Fachwissens wurden in zwei „Untertests“ separat erfasst. Um die beiden Wissensfacetten inhaltlich valide zu messen und das inhaltliche Spektrum der Mathematik bestmöglich abzudecken, wurden beide Untertests jeweils nach den fünf Leitideen der Bildungsstandards (KMK, 2004) binnenstrukturiert, woraus die in Tabelle 6.1 dargestellte Matrix resultiert. Diese Grundstruktur wurde schließlich zur Konstruktion der Items genutzt, indem die Zugehörigkeit zu einem der fünf Inhaltsbereiche bei der Auswahl der Testaufgaben berücksichtigt wurde. Dabei erfolgte die Auswahl im Bewusstsein darüber, dass eine mathematische Aufgabenstellung in der Regel nicht nur einer, sondern oftmals mehreren Leitideen zuzuordnen ist (KMK, 2004, S. 9). Um die verschiedenen Inhaltsbereiche sowie die beiden Facetten in gleichem Maße abzudecken, wurde vorab festgelegt, dass zu jeder Leitidee insgesamt vier Testaufgaben konzipiert werden. Somit umfassen die beiden Untertests jeweils
6.1 Entwicklung des Testinstruments
107
zwei Aufgaben pro Leitidee, woraus sich insgesamt zehn Aufgaben pro Untertest ergeben. Aus ökonomischen Gründen wurde davon abgesehen, eine größere Anzahl an Aufgaben in das Instrument aufzunehmen, um eine Testdauer von 45 Minuten nicht zu überschreiten. Die Kurzbezeichnungen der Aufgaben, wie sie auch in Tabelle 6.1 dargestellt sind, ergeben sich schließlich aus der zugehörigen Dimension (A für Mathematisches Alltagswissen, S für Sekundarstufenwissen) sowie der Leitidee (z. B. A1 beziehungsweise S1 für die erste Leitidee). Die letzte Ziffer der Aufgabenbezeichnung des Sekundarstufenwissens gibt weiterhin an, ob dieses Item der Sekundarstufe I (z. B. S1.01) oder der Sekundarstufe II (z. B. S1.02) zuzuordnen ist. Um Mathematisches Alltagswissen von Sekundarstufenwissen abzugrenzen, wurden die Aufgaben stets mit den Mathematischen Basiskompetenzen nach Drüke-Noe et al. (2011) verglichen und hinsichtlich des Alltagsbezugs reflektiert. Auch wenn sich die Aufgaben des Mathematischen Alltagswissen (A1.01 bis A5.02) ebenfalls auf Inhalte der Sekundarstufe I beziehen, unterscheiden sich diese aufgrund des hohen Alltagsbezugs deutlich von den Aufgaben S1.01, S2.01, S3.01, S4.01 und S5.01, sodass diese konzeptionsbedingt dem Mathematischen Alltagswissen zugeordnet wurden. Tabelle 6.1 Matrix der Teststruktur und Aufgabenbezeichnungen (L1: Leitidee Zahl, L2: Leitidee Messen, L3: Leitidee Raum und Form, L4: Leitidee Funktionaler Zusammenhang, L5: Leitidee Daten und Zufall) Wissensfacette
Mathematische Inhaltsbereiche L1
L2
L3
L4
L5
Mathematisches Alltagswissen
A1.01 A1.02
A2.01 A2.02
A3.01 A3.02
A4.01 A4.02
A5.01 A5.02
Sekundarstufenwissen
S1.01 S1.02
S2.01 S2.02
S3.01 S3.02
S4.01 S4.02
S5.01 S5.02
Zur Operationalisierung der ersten Dimension des Mathematischen Alltagswissens wurden aufgrund der hohen Übereinstimmung hinsichtlich der Auffassung als notwendiges Alltagswissen die „Mathematischen Basiskompetenzen“ nach Drüke-Noe et al. (2011) herangezogen. Diese sind wie folgt definiert: Als Basiskompetenzen in Mathematik bezeichnen wir die mathematischen Kompetenzen, über die alle Schülerinnen und Schüler aller Bildungsgänge am Ende der allgemeinen Schulpflicht mindestens und dauerhaft verfügen müssen. Sie
108
6 Beschreibung der Datenerhebung
sind Voraussetzung für eine eigenständige Bewältigung von Alltagssituationen und die aktive Teilhabe als mündige Bürgerinnen und Bürger am gesellschaftlichen und kulturellen Leben. Sie sind ebenso Voraussetzung für einen Erfolg versprechenden Beginn einer Berufsausbildung und die Ausübung beruflicher Tätigkeiten. (S. 8)
Hierzu wurde der Aufgabenkatalog der Basiskompetenzen, der nach den fünf Leitideen strukturiert ist, gemeinsam mit der Arbeitsgruppe gesichtet und die Umsetzung konkreter Items im Test im Sinne einer Fragebogenkonferenz (Döring & Bortz, 2016c, S. 411) beurteilt und diskutiert. Diese Arbeitsgruppe setzt sich aus fünf wissenschaftlichen Mitarbeiterinnen und Mitarbeitern des Mathematischen Institutes des Campus Koblenz der Universität Koblenz-Landau zusammen, die sowohl in fachdidaktischen als auch methodischen Bereichen Expertise aufweisen. Professoral unterstützt wurde diese Auswahl durch den Gutachter und die Zweitgutachterin der vorliegenden Arbeit, die insbesondere im Bereich der Aufgabenkultur in Mathematik, den Bildungsstandards und den Mathematischen Basiskompetenzen über herausragende Expertise verfügt. Schließlich wurden pro Leitidee jeweils zwei geeignete Basiskompetenzen ausgewählt, die in den Testentwurf aufgenommen wurden (siehe Tabelle 6.2). Die Items der zweiten Dimension des Sekundarstufenwissens basieren weitestgehend auf bestehenden Testaufgaben. Hierzu wurden veröffentlichte Aufgaben der TIMSS-Studien (Baumert et al., 1998, 1999), des Online Mathematik Brückenkurses OMB+ (Seiler & Pütz, 2019) und des von Gerster, Siller und Ullrich (2014) eingesetzten Testinstruments verwendet sowie einige wenige auf Basis von Schulbuchaufgaben neu entwickelt, um insgesamt zehn geeignete Items für diesen Untertest zu generieren (siehe Tabelle 6.3). Da die Testaufgaben insgesamt ohne technische Hilfsmittel bearbeitet werden sollten, wurde bei der Konstruktion der Items auf ganzzahlige Ergebnisse geachtet. Zudem wurde berücksichtigt, dass die Aufgaben bezüglich des Umfanges und der Komplexität vergleichbar sein sollten. Um mögliche Schwierigkeiten der künftigen Befragungspersonen bei der Bearbeitung des Tests zu antizipieren, wurden studentische Hilfskräfte (und damit Personen aus der Zielgruppe) gebeten, mithilfe der Methode des lauten Denkens (Döring & Bortz, 2016c, S. 411) qualitative Rückmeldung zu der allgemeinen Teststruktur und den einzelnen Aufgabenstellungen zu geben. Daraufhin wurden einige wenige Unverständlichkeiten sowie strukturelle Aspekte wie beispielsweise die Größe von Abbildungen oder Antwortfeldern überarbeitet. Zudem
6.1 Entwicklung des Testinstruments
109
konnte bestätigt werden, dass eine Bearbeitungszeit von 45 Minuten durchaus angemessen ist, da die studentischen Hilfskräfte den Test in der vorgegebenen Zeit vollständig bearbeiten konnten. Im Anschluss an diesen qualitativen Pretest erfolgte im Wintersemester 2016/17 schließlich ein quantitativer Pretest in Form einer ersten Erhebung (Döring & Bortz, 2016c, S. 411). Die Daten dieser Pilotierung wurden schließlich genutzt, um die relevanten Itemkennwerte (Häufigkeitsverteilungen, Itemtrennschärfen und Itemschwierigkeiten) im Zuge einer Itemanalyse (Jonkisz et al., 2012, S. 71) zu überprüfen, um schließlich ungeeignete Items zu identifizieren und auszuschließen. So zeigte sich beispielsweise, dass eine Aufgabe zum Logarithmus („Wenn logb 2 = 13, dann ist logb 32 gleich … ?“) (Baumert et al., 1999, S. 67) mit einer Itemschwierigkeit von .06 deutlich zu schwer war. Kommentare der Studierenden bezüglich dieser Aufgaben wie „Logarithmus haben wir im Unterricht nicht behandelt“ bestätigten diese Entscheidung. Um weiterhin die gewünschte Teststruktur (siehe Tabelle 6.1) zu gewährleisten und die ausgeschlossenen Items zu ersetzen, wurden erneut mögliche Items zusammengetragen, mit der Arbeitsgruppe diskutiert, den studentischen Hilfskräften vorgelegt und schließlich in einer zweiten Pilotierung im Sommersemester 2017 empirisch erprobt. Die anschließende Itemanalyse offenbarte erneut einige kritische psychometrische Kennwerte, sodass der beschriebene Prozess der Itemkonstruktion erneut durchlaufen wurde, woraufhin die finale Testversion konzipiert wurde, die schließlich für die Erhebungen der Hauptuntersuchung verwendet wurde (siehe Abschnitt 6.2). Tabelle 6.2 liefert einen Überblick über die inhaltliche Umsetzung der zugrunde gelegten Basiskompetenzen im finalen Testinstrument. Die Aufgaben A2.01, A2.02, A3.01, A3.02, A4.01, A5.01 und A5.02 wurden nahezu unverändert aus dem Katalog der Basiskompetenzen (Drüke-Noe et al., 2011) übernommen, während die Aufgaben A1.01, A1.02 und A4.02 in Anlehnung an die beschriebenen Kompetenzen neu entwickelt wurden. Welche Inhalte die Aufgaben des Untertests zum Sekundarstufenwissen bedienen, ist in Tabelle 6.3 dargestellt. Aus motivationalen Gründen wurden die Items im Rahmen des Testinstrumentes mit (aus theoretischer Perspektive) aufsteigender Schwierigkeit angeordnet, sodass der Untertest zur Erfassung des Mathematischen Alltagswissens dem zweiten Untertest zum Sekundarstufenwissen vorgeschaltet wurde.
110
6 Beschreibung der Datenerhebung
Tabelle 6.2 Übersicht über die Aufgaben zur Erfassung des Mathematischen Alltagswissens nach Leitidee Leitidee
Inhaltliche Umsetzung im Testinstrument
L1: Zahl
A1.01: Elementare Bruchrechnungen (Multiplikation, Division und Ordnen von Brüchen) (Drüke-Noe et al., 2011, S. 11) A1.02: Elementare Prozentrechnungen (Berechnung des Prozentwertes, Prozentsatzes und Grundwertes) (DrükeNoe et al., 2011, S. 11)
L2: Messen
A2.01: Umrechnung gebräuchlicher Maßeinheiten (Längen, Flächeninhalte und Volumina) (Drüke-Noe et al., 2011, S. 16) A2.02: Umrechnung gebräuchlicher Maßeinheiten (Längen, Flächeninhalte und Volumina) (Drüke-Noe et al., 2011, S. 16)
L3: Raum & Form
A3.01: Auswahl von Würfelnetzen aus vorgegebenen Netzen (Drüke-Noe et al., 2011, S. 22) A3.02: Zerlegen gegebener Figuren (Gebäude) in bekannte Körper (Drüke-Noe et al., 2011, S. 22)
L4: A4.01: Berechnung der Veränderung des Umfanges und Funktionaler Zusammenhang des Flächeninhaltes eines Quadrates bei Vergrößerung der Seitenlänge auf das Dreifache (Drüke-Noe et al., 2011, S. 26) A4.02: Aufstellen und Lösen einer linearen Funktion (gleichmäßiger Wasserablauf aus einer Badewanne) (Drüke-Noe et al., 2011, S. 26) L5: Daten & Zufall
A5.01: Berechnung des arithmetischen Mittels und des Medians und deren Vergleich (Drüke-Noe et al., 2011, S. 32) A5.02: Ermittlung der Gewinnchance bei elementarem Laplace-Experiment (Drüke-Noe et al., 2011, S. 32)
So sollen die ersten, leichten Aufgaben zum Mathematischen Alltagswissen der Leitidee Zahl eine „Eisbrecherfunktion“ (Jonkisz et al., 2012, S. 68) erfüllen. Um die entsprechenden Inhalte möglichst umfassend abzudecken, wurden einige der insgesamt 20 Aufgaben in mehrere Unteraufgaben, also Items, unterteilt. Insgesamt beinhaltet der Untertest zum Mathematischen Alltagswissen somit 21 Items, während der Untertest zum Sekundarstufenwissen aus 14 Items besteht.
6.1 Entwicklung des Testinstruments
111
Tabelle 6.3 Übersicht über die Aufgaben zur Erfassung des Sekundarstufenwissens nach Leitidee Leitidee
Inhaltliche Umsetzung im Testinstrument
L1: Zahl
S1.01: Zuordnung gegebener Zahlen zu den entsprechenden Zahlenmengen (Test aus E.-M. Gerster et al., 2014) S1.02: Bestimmung der Lösungsmenge eines linearen Gleichungssystems (OMB+, o. J.-a)
L2: Messen
S2.01: Auswahl des Terms zur Berechnung einer vorgegebenen Seitenlänge in einem rechtwinkligen Dreieck (KMK, 2004, S. 11) S2.02: Berechnung des Flächeninhaltes zwischen zwei Funktionsgraphen (KMK, 2002b, S. 6)
L3: Raum & Form
S3.01: Berechnung der Seitenlänge bei ähnlichen Dreiecken (Baumert et al., 1998, S. 105) S3.02: Bestimmung der Lagebeziehung zwischen Punkt und Geraden (OMB+, o. J.-b)
L4: Funktionaler
S4.01: Berechnung der Schnittpunkte zweier quadratischer Funktionen (KMK, 2004, S. 12)
Zusammenhang
S4.02: Auswahl eines Funktionsgraphen mit vorgegebenen Eigenschaften (Baumert et al., 1999, S. 78)
L5: Daten & Zufall
S5.01: Berechnung einer absoluten Häufigkeit im Rahmen eines Laplace-Experiments (Baumert et al., 1998, S. 27) S5.02: Berechnung einer bedingten Wahrscheinlichkeit (Baumert et al., 1999, S. 97)
Abbildung 6.1 zeigt exemplarisch Aufgabe A1.02 mit den drei zugehörigen Items, die der Dimension des Mathematischen Alltagswissens und der Leitidee Zahl zuzuordnen sind. Diese Aufgabe basiert auf der Basiskompetenz B1.14 nach Drüke-Noe et al. (2011, S. 15) und erhebt prozedurales Wissen zur Prozentrechnung. Der sichere Umgang mit der Prozentrechnung ist im alltäglichen Leben von zentraler Bedeutung. So wird man beispielsweise in Form von Werbeanzeigen oder den Nachrichten täglich mit Prozentangaben konfrontiert, deren mathematisches Verständnis in der heutigen Gesellschaft vorausgesetzt wird. Schließlich ist die sachgerechnete Verwendung von Prozent- und Zinsrechnung als inhaltbezogene mathematische Kompetenz der ersten Leitidee in den Bildungsstandards für den mittleren Schulabschluss aufgeführt (KMK, 2004, S. 10), deren Thematisierung gewöhnlich in der 7. Klassenstufe erfolgt (siehe z. B. Ministerium für Bildung, Wissenschaft, Jugend und Kultur Rheinland-Pfalz, 2007, S. 42).
112
6 Beschreibung der Datenerhebung
Abbildung 6.1 Aufgabe A1.02 (Mathematisches Alltagswissen, Leitidee 1)
Bei korrekter Lösung1 erhielten die Testpersonen jeweils 0.33 Punkte pro Teilaufgabe und damit insgesamt bis zu einem Punkt für die gesamte Aufgabe A1.02. Im Durchschnitt erreichten die Testpersonen 0.76 Punkte (SD = 0.28 Punkte, N = 582); die Hälfte aller Testpersonen erreichte die volle Punktzahl. Damit handelt es sich aus empirischen Gesichtspunkten um eine mittelschwere Aufgabe.
1Lösungen:
a) 160 Flaschen, b) 80 %, c) 400 m3
6.1 Entwicklung des Testinstruments
113
In Aufgabe S 5.02 ist eine bedingte Wahrscheinlichkeit zu berechnen (siehe Abbildung 6.2). Das hierzu benötigte Wissen wird im Rahmen der gymnasialen Oberstufe und damit der Sekundarstufe II vermittelt (KMK, 2012, S. 21), sodass diese Aufgabe der Wissensfacette des Sekundarstufenwissens zuzuordnen ist. In haltlich bezieht sich dieses Item auf die Leitidee Daten und Zufall.
Abbildung 6.2 Aufgabe S5.02 (Sekundarstufenwissen, Leitidee 5)
Für eine richtige Lösung2 wird ein Punkt vergeben. Mit einer durchschnittlichen Punktzahl von 0.31 Punkten (SD = 0.46 Punkte, N = 582) ist diese Aufgabe als vergleichsweise schwer einzustufen. Hinsichtlich der Wahl des Antwortformats umfasst der Test sowohl geschlossene als auch halboffene Items (Döring & Bortz, 2016c, S. 454) (siehe Tabelle 6.4). Dieser Entscheidung liegt ein methodischer Kompromiss zugrunde: So ist es zum einen Ziel der vorliegenden Arbeit, nicht nur die reine Leistung, sondern auch die Fehler der Testpersonen zu untersuchen, was ein halboffenes
2Lösung: 16 17
114
6 Beschreibung der Datenerhebung
Itemformat voraussetzt. Auf der anderen Seite sollte die Dauer der Untersuchung sowie der Auswertung in einem zumutbaren Rahmen bleiben, sodass neben halboffenen auch einige geschlossene Items verwendet wurden, um in der vorgegebenen Testdauer möglichst viele Items stellen zu können. Wie in Tabelle 6.4 dargelegt, wurden die Aufgabenstellungen zugunsten der Fehleranalyse hauptsächlich halboffen angelegt, um die „freie Rekonstruktion von Wissen“ (Bühner, 2011, S. 131) zu ermöglichen. Der Nutzen dieser halboffenen Itemkonstruktion übertrifft schließlich die Kosten hinsichtlich der Objektivitäts- und Ökonomieeinbußen. So wurden (wenn möglich) auch die geschlossenen Antwortformate der verwendeten TIMSS-Aufgaben in halboffene überführt. Bei den geschlossenen Itemformaten handelt es sich überwiegend um Single-Choice-Fragen, da nur eine der vorgegebenen Antwortoptionen richtig ist (Döring & Bortz, 2016c, S. 455). Lediglich die Auswahl aller möglichen Würfelnetze in Aufgabe A3.01 erfolgte in Form einer Multiple-Choice-Aufgabe, da es mehrere verschiedene Netze eines Würfels gibt. Tabelle 6.4 Übersicht über die Anzahl geschlossener und halboffener Antwortformate nach Leitidee Untertest
Mathematische Inhaltsbereiche L1
L2
L3
L4
L5
Mathematisches All- 0 SC 0 SC 2 SC 0 SC 0 SC tagswissen 2 halb-offen 2 halb-offen 0 halb-offen 2 halb-offen 2 halboffen Sekundarstufenwissen
1 MC 1 SC 0 SC 1 SC 0 SC 1 halb-offen 1 halb-offen 2 halb-offen 1 halb-offen 2 halboffen
Gesamt
1 MC 1 SC 2 SC 1 SC 0 SC 3 halb-offen 3 halb-offen 2 halb-offen 3 halb-offen 4 halboffen
Gesamt
5 geschlossene Antwortformate 15 halboffene Antwortformate
Anmerkung: L1: Leitidee Zahl, L2: Leitidee Messen, L3: Leitidee Raum und Form, L4: Leitidee Funktionaler Zusammenhang, L5: Leitidee Daten und Zufall; SC = SingleChoice, MC = Multiple-Choice
Da zwischen den Erhebungen im Falle einer längsschnittlichen Untersuchung mindestens ein Semester und damit etwa sechs Monate lagen, konnten im Falle eines Längsschnittes unerwünschte Erinnerungseffekte weitestgehend ausgeschlossen werden. Damit war es weiterhin nicht notwendig, ein aufwändiges Testdesign wie beispielsweise ein Multi-Matrix-Design (Frey, Hartig, & Rupp,
6.2 Durchführung der Studie
115
2009) zu verwenden, wie es in large-scale-Studien wie PISA und TIMSS eingesetzt wird. Zudem wäre es im Rahmen eines solchen Designs nicht möglich, die gewünschten Rückschlüsse auf die individuelle Entwicklung der Studierenden im Sinne einer Einzelfalldiagnostik zu ziehen, da zu verschiedenen Messzeitpunkten unterschiedliche Items eingesetzt werden. Das vollständige Testinstrument kann online im elektronischen Zusatzmaterial eingesehen werden.
6.2 Durchführung der Studie Die Erhebungen mithilfe des Testbogens erfolgten stets unangekündigt zu Beginn der jeweiligen Vorlesungen (siehe Abschnitt 5.2). Dabei wurde die Testung der Studienanfängerinnen und Studienanfänger (Messzeitpunkt t1) in den ersten Vorlesungen des jeweiligen Semesters durchgeführt, um erste universitäre Lerngelegenheiten dieser Kohorte ausschließen zu können, während die Erhebungen zu den fortgeschrittenen Messzeitpunkten t2 und t3 zum Teil wenige Wochen nach Semesterbeginn erfolgten. Tabelle 6.5 liefert einen Überblick über die konkreten Termine der einzelnen Erhebungen. Tabelle 6.5 Übersicht über die Erhebungstermine und den Stichprobenumfang nach Erhebungszeitpunkten
WiSe 16/17 SoSe 17 WiSe 17/18 SoSe 18 WiSe 18/19 SoSe 19
t1
t2
Modul 1
Modul 4
24.10.16 N = 153
t3 Modul 5
21.04.17 N = 30
18.04.17 N = 57
09.04.18 N = 35
10.04.18 N = 46
17.10.17 N = 58
22.10.18 N = 91
21.11.18 N = 20
Modul 7
Modul 11
13.05.17 N = 15
08.04.19 N = 63
09.04.19 N = 40
Modul 12
06.11.17 N = 47
23.10.18 N = 34
Die Testungen im Wintersemester 2016/17 sowie im Sommersemester 2017 dienten der Pilotierung des Testinstrumentes (siehe Abschnitt 6.1) und werden somit nicht in die weiteren Analysen der Hauptuntersuchungen einbezogen
116
6 Beschreibung der Datenerhebung
Insgesamt fanden somit jeweils drei Testungen pro Messzeitpunkt statt. Um auch Abiturientinnen und Abiturienten in der vorliegenden Untersuchung miteinbeziehen zu können, wurden insgesamt drei rheinland-pfälzische Gymnasien kontaktiert und über das Vorhaben informiert. Nach Erhalt der Zusage wurden die Erhebungen durch die rheinland-pfälzische Aufsichts- und Dienstleistungsdirektion unter Beachtung datenschutzrechtlicher Vorgaben genehmigt. Die Auswahl der Kurse, in denen die Erhebungen jeweils stattfanden, erfolgte in Absprache mit den jeweiligen Kontaktpersonen, sodass je nach Umsetzbarkeit einzelne Mathematikkurse oder in einem Falle auch die gesamte Jahrgangsstufe getestet werden konnte. Die Erhebungen fanden am 14.02.2018 (N = 28), 19.02.2018 (N = 35) und 28.02.2018 (N = 82) und damit wenige Wochen nach der schriftlichen Abiturprüfung in Mathematik am 22.01.2018 statt. Zu jedem Erhebungstermin erfolgte zunächst eine kurze Ansprache durch die Autorin, in der im Sinne einer aktiven Rekrutierung (Döring & Bortz, 2016c, S. 411) für die freiwillige Teilnahme an der Testung motiviert und über organisatorische Gegebenheiten informiert wurde, wobei stets vergleichbare Untersuchungsbedingungen angestrebt wurden. Die Bearbeitungszeit des Paper-Pencil-Tests betrug 45 Minuten, der Gebrauch technischer Hilfsmittel wurde nicht erlaubt. Die Autorin wurde bei den Erhebungen durch den verantwortlichen Dozierenden beziehungsweise die verantwortliche Lehrkraft sowie geschulte Hilfskräfte unterstützt. Nach abgeschlossener Testung wurde den Testpersonen für ihre freiwillige Teilnahme gedankt und der Vorlesungs- beziehungsweise Unterrichtsbetrieb konnte wie gewohnt fortgesetzt werden.
7
Vorbereitung und Beschreibung der Datenanalyse
Bevor die herausgearbeiteten Forschungsfragen mit geeigneten Analysemethoden beantwortet werden können, müssen die im Rahmen der Erhebungen gewonnenen Daten zunächst für die Datenanalyse aufbereitet werden. In Abschnitt 7.1 werden hierzu zunächst die qualitätssichernden Veränderungen des Rohdatenmaterials begründet und dokumentiert. Um aus den aufbereiteten Rohdaten schließlich Test- und somit Fähigkeitswerte ableiten zu können, muss eine geeignete Skalierung vorgenommen werden. Das Vorgehen zur Skalierung des Schulcurricularen Fachwissens wird in Abschnitt 7.2 dargelegt. Daran anschließend wird in Abschnitt 7.3 gezeigt, dass die Hauptund Nebengütekriterien psychometrischer Tests im Rahmen der vorliegenden Untersuchung als erfüllt angesehen werden können, bevor im abschließenden Abschnitt 7.4 die verwendeten Methoden der Datenanalyse offengelegt werden.
7.1 Datenaufbereitung Um die Datenqualität von Beginn der Auswertungen an zu überprüfen und schließlich sicherzustellen, wurden in Anlehnung an Döring und Bortz (2016b) Maßnahmen der Datenaufbereitung umgesetzt, um die inhaltliche Datenanalyse vorzubereiten. Für eine standardisierte Eingabe der Daten wurde eine vollständig
Elektronisches Zusatzmaterial Die elektronische Version dieses Kapitels enthält Zusatzmaterial, das berechtigten Benutzern zur Verfügung steht https://doi. org/10.1007/978-3-658-31096-7_7. © Der/die Herausgeber bzw. der/die Autor(en), exklusiv lizenziert durch Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2021 J. Lung, Schulcurriculares Fachwissen von Mathematiklehramtsstudierenden, Studien zur theoretischen und empirischen Forschung in der Mathematikdidaktik, https://doi.org/10.1007/978-3-658-31096-7_7
117
118
7 Vorbereitung und Beschreibung der Datenanalyse
kommentierte und belabelte Datenmatrix vorbereitet und Kodiererinnen und Kodierern auf einem Server bereitgestellt. Im Anschluss an den Kodierprozess, der in Abschnitt 7.4.4 ausführlich beschrieben wird, wurden die Datensätze gesichtet und auf Irregularitäten hin überprüft, wie beispielsweise Tippfehler, wenn Daten außerhalb des zugelassenen Wertebereichs liegen. Diese Werte wurden in Abgleich mit dem jeweiligen Originaltestbogen korrigiert. Nicht bearbeitete Aufgaben werden in der vorliegenden Untersuchung als fehlende Werte im Sinne des Missing Not at Random (MNAR) (Lüdtke, Robitzsch, Trautwein, & Köller, 2007, S. 105) behandelt, da unbearbeitete Aufgaben, die möglicherweise auf Zeitmangel in der Testsituation zurückzuführen sind, mit geringem Schulcurricularem Fachwissen zusammenhängen (Produkt-Moment-Korrelation der Anzahl nicht bearbeiteter Aufgaben mit der Testleistung insgesamt ergibt r = −.698, p 1.3 Fit (WMNSQ) und t > 1.96
Bond und Fox (2015, S. 273), Wilson (2004, S. 129)
Korrelation zwischen den Dimensionen
Pohl und Carstensen (2012, S. 14)
r 1.96. Schließlich liefern die Korrelationen zwischen den latenten Dimensionen Hinweise auf eine mögliche Mehrdimensionalität: If the correlation is perfect (1.0), then the data can be analyzed as one single Rasch dimension. However, if the correlation is high but not perfect, then the MIRM [multidimensional item response model] uses information from both tests to estimate of performances on each of the latent traits (Bond & Fox, 2015, S. 291).
Laut Pohl und Carstensen (2012) kann bei latenten Korrelationen kleiner als .95 von mehrdimensionalen Konstrukten ausgegangen werden (S. 14; siehe auch OECD, 2012, S. 194).
7.2.4 Ermittlung der Personenparameter Konnte im Rahmen der Modellauswahl gezeigt werden, dass das eingesetzte Testinstrument die Voraussetzungen eines Rasch-Modells erfüllt, gilt das Konstrukt als rasch-skalierbar und der ungewichtete Summenscore stellt eine suffiziente Statistik dar (Rost, 2004, S. 122 ff.). Diesbezüglich konnte Rost (2004) zeigen, dass der Summenscore nahezu linear mit geschätzten Personenfähigkeiten zusammenhängt und berichtet Korrelationen zwischen .90 und 0.95 (S. 122).
4Wie
beispielsweise in der PISA-Studie 2000 (R. Adams & Wu, 2002, S. 105).
132
7 Vorbereitung und Beschreibung der Datenanalyse
„Dieser enge Zusammenhang zwischen Summenscore und Personenparameter besagt auch, dass die Personenparameter – abgesehen von den Skalenenden – keine wesentlich genauere Messung der Personenfähigkeiten bieten als die Summenscores“ (Rost, 2004, S. 122). Umfasst die Stichprobe also nur wenige Testpersonen mit extremen Summenwerten, ist es durchaus berechtigt, die Summenscores als Messwerte zu verwenden. Dabei stellt Rost (2004) weiterhin klar (siehe auch Bühner, 2011, S. 79): Auf die Rasch-Analyse zu verzichten, kann jedoch nicht die Konsequenz sein, denn nur, wenn das Rasch-Modell gilt, ergibt sich die dargestellte Beziehung zwischen Summenscore und latenter Variable. Die Geltung des Rasch-Modells für einen Test ist die Voraussetzung dafür, dass der Summenscore eine sinnvolle Aussage über die Fähigkeitsausprägung einer Person macht. Insofern ist das Ziel einer Analyse mit dem Rasch-Modell nicht primär, die Summenscores durch Personenparameter zu ersetzen, sondern die Überprüfung, ob es überhaupt gerechtfertigt ist, mit Summenscores zu arbeiten (S. 122).
Im Rahmen der vorliegenden Studie wird in diesem Sinne auf die Schätzung von Personenfähigkeitsparametern mithilfe von Maximum-Likelihood-Verfahren verzichtet. Hinsichtlich dieser Schätzverfahren werden zur genauen Schätzung von Fähigkeiten einzelner Personen sogenannte Weighted-Likelihood-Estimates (WLE s) als „beste Punktschätzer“ (Rost, 2004, S. 316) empfohlen, während plausible values (PVs) messfehlerbereinigte Schätzungen von Gruppenstatistiken und Zusammenhängen liefern (Hartig & Kühnbach, 2006, S. 30 f.; Walter & Rost, 2011, S. 132 f.). Hartig und Kühnbach (2006) halten zusammenfassend fest: Steht eine Schätzung individueller Fähigkeiten im Mittelpunkt des Interesses, so sollten – auch in einem Längsschnittdesign – keinesfalls PVs verwendet werden. Auf die Verwendung von PVs sollte vornehmlich dann zurückgegriffen werden, wenn die Effekte von externen Variablen in einer Population von Interesse sind (S. 42).
Da das Schulcurriculare Fachwissen im Rahmen der vorliegenden Studie jedoch sowohl auf Ebene der Gruppen als auch auf Ebene der einzelnen Testpersonen analysiert wird, werden anstelle von Schätzwerten die ungewichteten Summenscores der Testpersonen ermittelt, um die Ausprägung des Schulcurricularen Fachwissens zu messen. Bühner (2011) nennt schließlich die leichtere Interpretierbarkeit als weiteren Vorteil von ungewichteten Summenwerten (S. 341).
7.2 Skalierung des Schulcurricularen Fachwissens
133
7.2.5 Kontrolle der Modellpassung Wurde das relativ passendste Modell zur Beschreibung der Daten ermittelt und mithilfe dessen das Schulcurriculare Fachwissen skaliert, können im Anschluss kritische Items identifiziert und schließlich die Reliabilitäten der Skalen ermittelt werden. Um weiterhin Personenhomogenität zu gewährleisten, wird das ausgewählte Modell abschließend auf Differential Item Functioning geprüft. Im Rahmen der Analyse der Itemkennwerte wird zunächst die Trennschärfe herangezogen, die die Repräsentativität eines Items für das Gesamtergebnis kennzeichnet (Döring & Bortz, 2016c, S. 478). In Anlehnung an das Vorgehen der OECD (2012) wird r = 0.2 als untere Grenze für dieses Kriterium verwendet (S. 133, siehe auch Pohl & Carstensen, 2012, S. 12). Im Vergleich zu Bühner (2011, S. 81) oder Döring und Bortz (2016c, S. 478), die Werte unter 0.3 bereits als niedrig einstufen, scheint dieser Grenzwert von 0.2 gering. Es wird jedoch davon ausgegangen, dass das untersuchte Konstrukt des Schulcurricularen Fachwissens inhaltlich sehr heterogen ist, sodass auch Items mit einer vergleichsweise geringen Trennschärfe beibehalten werden, um eine ausreichende Inhaltsvalidität zu gewährleisten (Bühner, 2011, S. 178). Weiterhin ist zu beachten, dass Items mit hoher oder geringer Itemschwierigkeit niedrige Trennschärfen aufweisen. Um ausreichend differenzieren zu können, soll jedoch eine Vielfalt an Itemschwierigkeiten erhalten bleiben, sodass auch Items mit niedrigen Trennschärfen nicht ausgeschlossen werden sollen (Döring & Bortz, 2016c, S. 479). Zur Beurteilung der Itemschwierigkeiten werden die Grenzen nach Bühner (2011) herangezogen, sodass die Itemmittelwerte über .80 auf zu leichte und solche unter .20 auf zu schwere Items hinweisen (Bühner, 2011, S. 81). Kelava und Moosbrugger (2012) erweitern dieses Intervall, sodass auch Items beibehalten werden sollen, deren Schwierigkeiten zwischen 0.05 und 0.95 liegen, sofern diese ausreichend hohe Trennschärfen aufweisen und explizit die Absicht besteht, zwischen Testpersonen mit extremen Merkmalsausprägungen zu differenzieren (S. 87). Da nach erfolgreicher Überprüfung der Modellgeltung die Testwerte in Form ungewichteter Summenscores ermittelt werden, wird die Reliabilität im Sinne der Klassischen Testtheorie mithilfe von Cronbach’s Alpha (Cronbach, 1951) berichtet. Dieses gilt als gängigstes Maß zur Bestimmung der internen Konsistenz und entspricht der mittleren Testhalbierungs-Reliabilität aller möglichen Testhalbierungen (Schermelleh-Engel & Werner, 2012, S. 130 f.). Bühner (2011, S. 80), Field (2013, S. 715) und Moosbrugger und Kelava (2012b, S. 11) empfehlen Reliabilitäten über .70.
134
7 Vorbereitung und Beschreibung der Datenanalyse
Eine Annahme des Rasch-Modells ist die Personenhomogenität (Döring & Bortz, 2016c, S. 491; Walter & Rost, 2011, S. 112). Dabei wird davon ausgegangen, dass die Items in jeder beliebigen Teilstichprobe dieselbe Fähigkeit messen (Bühner, 2011, S. 539). Personenhomogenität kann also angenommen werden, wenn sich die geschätzten Itemparameter nicht systematisch zwischen verschiedenen Personengruppen unterscheiden. Gängige Kriterien zur Unterteilung der Stichprobe sind das Geschlecht oder eine Trennung nach niedrigen und hohen Summenscores (Moosbrugger, 2012a, S. 244 f.; Rost, 2004, S. 347). Die einfachste Möglichkeit, Testdaten auf Personenhomogenität zu prüfen, ist ein grafischer Modelltest (Strobl, 2012, S. 40). Hierbei wird die Stichprobe in zwei Gruppen aufgeteilt, deren Itemparameter getrennt geschätzt und in einem bivariaten Streudiagramm dargestellt werden. Liegen die Schätzungen der beiden Gruppen auf der Diagonalen des Streudiagramms, stimmen die Schätzungen der beiden Gruppen überein (Moosbrugger, 2012a, S. 244 f.). „Diese Forderung ist aber unrealistisch, da Schätzwerte aufgrund der zufälligen Stichprobenziehung immer zufälligen Schwankungen unterworfen sind. Eine geringe Abweichung von der Winkelhalbierenden ist also noch zu tolerieren“ (Strobl, 2012, S. 40). Unterscheiden sich die Schätzungen der Itemparameter in den unterschiedlichen Personengruppen jedoch systematisch voneinander, liegt ein sogenanntes Differential Item Functioning (DIF) vor (Moosbrugger, 2012a, S. 245; Strobl, 2012, S. 40; Walter & Rost, 2011, S. 142). Pohl und Carstensen (2012) empfehlen eine Ausschlussgrenze bezüglich der Differenz von 1 Logit (S. 12). In Tabelle 7.2 sind die genannten Kriterien abschließend zusammengefasst.
Tabelle 7.2 Übersicht über die verwendeten Kriterien zur Kontrolle der Modellpassung Kriterium
Vorgehen bzw. Kriterien zur Kontrolle der Modellpassung
Quelle
Reliabilität (interne Konsistenz)
Cronbach’s α > .70
Bühner (2011, S. 80)
Trennschärfe und punktbiseriale Korrelationen
r > 0.2
OECD (2012, S. 133)
Itemschwierigkeit
0.2