206 118 33MB
German Pages 88 [92] Year 1982
HERAUSGEBER HUBERT FEGER
C. F. G R A U M A N N KLAUS HOLZKAMP MARTIN IRLE
BAND
15 1 9 8 4 H E F T 2
V E R L A G HANS H U B E R BERN STUTTGART WIEN
Zeitschrift für Sozialpsychologie 1981, B a n d 12, H e f t 1 INHALT
Theorie und M e t h o d e n B E R K A , H . - H . & WESTHOFF, K . : L e h r e r e r w a r t u n g e n u n d
Schülerverhal-
ten JANSEN, P . G . W . : S p e z i f i s c h o b j e k t i v e M e s s u n g im F a l l e m o n o t o n e r E i n stellungsitems WEHNER, T . : Die M e t h o d e der « P a s s i v » - V a r i a b l e n - P r o j e k t i o n als elem e n t a r - s t a t i s t i s c h e s V o r g e h e n bei d e r I n t e r p r e t a t i o n e i n e r o p t i m a l e n Clusterzahl BOSSHARDT, H . - G . : M e t h o d i s c h e Ü b e r l e g u n g e n z u m P r o b l e m der E r f a s sung naiver Verhaltenstheorien
1 24
42 49
Empirie GIGERENZER, G . : I m p l i z i t e P e r s ö n l i c h k e i t s t h e o r i e n o d e r q u a s i - i m p l i z i t e Persönlichkeitstheorien? Eine Begriffsklärung und eine Validitätsstudie zu i n d i v i d u e l l e n i m p l i z i t e n T h e o r i e n
65
Literatur Neuerscheinungen
81
Titel u n d A b s t r a c t a
83
Nachrichten und Mitteilungen
85
Autoren
87
Copyright 1981 Verlag Hans Huber Bern Stuttgart Wien Herstellung: Satzatelier Paul Stegmann, Bern Printed in Switzerland Library of Congress Catalog Card Number 78-126626 Die Zeitschrift für Sozialpsychologie wird in Social Sciences Citation Current Contents/ Social and Behavioral Sciences erfaßt.
Index (SSC1) und
1
Zeitschrift für Sozialpsychologie 1981,12,1-23
Theorie und Methoden Lehrererwartungen und Schülerverhalten HANS-HENNING BERKA Seminar für Schulpädagogik der R W T H Aachen KARL W E S T H O F F Institut für Psychologie der R W T H Aachen
Es wird eine kritische Übersicht über die Literatur zu Lehrererwartungen und Schülerverhalten gegeben. Unter «Erwartung» wird ein hypothetisches Konstrukt mit verschiedenen Facetten verstanden. Die in der Literatur verstreuten Überlegungen werden zu einer neuen Taxonomie von Hypothesen zusammengefaßt, die als Grundlage f ü r weitere Arbeiten zu sich selbst-erfüllenden Prophezeiungen gesehen werden kann. Die referierten Studien werden danach klassifiziert, ob Lehrererwartungen als abhängige oder als unabhängige Variablen konzipiert wurden. Lehrererwartungen können als unabhängige Variablen eine Wirkung auf Schülerleistungen u n d / o d e r die Lehrer-Schüler-Interaktion haben. Die Bedeutung von Lehrererwartungen für diese Interaktion wurde sowohl in naturalistischen Untersuchungssituationen als auch experimentell untersucht. In einigen neueren Arbeiten wird der kombinierte Einfluß von Attribuierungen und Erwartungen der Lehrer auf ihr Verhalten untersucht. Weiter werden die Ergebnisse einiger quasi-experimenteller LängsschnittUntersuchungen zum Pygmalion-Effekt dargestellt. Die in diesem Zusammenhang wichtigen Arbeiten zur Untersuchung von Schülererwartungen werden referiert. Abschließend werden methodische Probleme diskutiert.
This is a critical review of the literature dealing with teachers' expectations and pupils' behavior. «Expectation» means a hypothetical construct with several different facets. Theoretical considerations scattered in the relevant literature are put together into a new taxonomy of hypotheses. This taxonomy may serve as a guide for further research on self-fulfilling prophecies. The reviewed studies are classified according to whether teachers' expectations are dealt with as dependent or independent variables. Teachers' expectations conceptualized as independent variables in some cases show an effect on pupils' achievement a n d / o r the interaction between teachers and pupils. T h e impact of teachers' expectancies on this interaction has been studied within naturalistic situations as well as by experimental induction of expectations. Some recent research deals with the joint influence of teachers' attributions and expectations on their behavior. The results of several quasi-experimental longitudinal studies concerning the Pygmalion-effect are presented. Another topic of interest in this domain is the investigation of pupils' expectations. Finally, some methodological problems are discussed.
1.
A u s g a n g s p u n k t des überwiegenden Teils der angelsächsischen und deutschsprachigen Literatur zu dieser T h e m a t i k scheint das von dem amerikanischen Soziologen THOMAS 1928 f o r m u l i e r t e T h e o r e m : «if men define situations as real, they are real in their consequences» (zit. nach MERTON, 1957, p.475) zu sein. In den 60er J a h r e n begannen ROSENTHAL, FoDE, JACOBSON et al. mit der Ü b e r t r a g u n g dieses G e d a n k e n s auf E r w a r t u n g s e f f e k t e von Testleitern u n d Lehrern; meist w u r d e die A u s w i r k u n g auf die Intelligenzleistungen von Kindern untersucht. In der Folge dieser U n t e r s u c h u n g e n w u r d e zum einen Kritik an M e t h o d e n und Schlußfolge-
Einleitung
Vergegenwärtigt m a n sich den überaus komplexen Z u s a m m e n h a n g zwischen Einstellung und Verhalten bei ein und derselben P e r s o n (vgl. Six, 1 9 7 5 , 1 9 8 0 ; MUMMENDEY, 1 9 7 9 ) , m u t e t d e r Ver-
such, Schülerverhalten als d u r c h Lehrererwartungen determiniert zu sehen (ROSENTHAL & JACOBSEN, 1968), g e r a d e z u a b e n t e u e r l i c h a n (vgl. a u c h HOFER et a l . , 1 9 7 9 ) .
Die auf den ersten Blick h o h e Plausibilität und bestechende Einfachheit dieses Ansatzes scheinen der Forschung zu « P y g m a l i o n e f f e k t e n » und «sich selbst erfüllender P r o p h e z e i u n g » bis heute eine h o h e Attraktivität zu verleihen.
r u n g e n v o n ROSENTHAL g e ü b t ( z . B . ELASHOFF &
2
Berka & Westhoff: Lehrererwartungen und Schülerverhalten
SNOW, 1971), zum anderen hielt man den Grundgedanken der «Erwartungseffekte» für weiterhin erforschenswert, was sich unschwer an der Expansion der Literatur in diesem Gebiet ablesen läßt (so zählt ROSENTHAL 1973 241 Untersuchungen; eine gute Übersicht bis 1973 bieten BROPHY & GOOD, 1974 b z w . 1976).
Trotz der Flut von Forschungsarbeiten auf diesem Gebiet sind erst wenige theoretische Analysen des «Pygmalion-Effekts» vorgelegt worden, die sich detailliert mit den antezedierenden Bedingungen und intervenierenden Prozessen bei Erwartungseffekten beschäftigen (z.B. KOHN, 1 9 7 3 ; NICKEL, 1 9 7 6 ) .
Nach einigen begrifflichen und theoretischen Vorüberlegungen wollen wir die vorliegenden Forschungsergebnisse zu Lehrererwartungen und Schülerverhalten darstellen.
2.
Begriffliche und theoretische Vorüberlegungen
Ganz allgemein besagt der von ROSENTHAL SO genannte Pygmalioneffekt (ein Spezialfall einer sich selbst-erfüllenden Prophezeiung), daß sich ein Schüler gemäß den Erwartungen des ihn unterrichtenden Lehrers verhält, weil der Lehrer diese Erwartungen hat. Diese auf den ersten Blick möglicherweise eigene anekdotische E r f a h r u n gen bestätigende Hypothese hat in der Literatur bisher viel Beachtung gefunden. Meist ging es dabei um die empirische P r ü f u n g dieser Hypothese. Wir wollen jedoch zunächst eine theoretische Analyse dessen vornehmen, was uns eine solche Hypothese zu implizieren scheint.
2.1
Zum Begriff «Erwartung»
Zunächst wird behauptet, daß der Lehrer bestimmte Erwartungen habe. Hier müßte zunächst geklärt werden, was man unter einer Erwartung verstehen soll. In der Literatur finden sich hauptsächlich die folgenden Auffassungen: a) Erwartung als die Vorstellung eines möglichen zukünftigen Ereignisses, b) Erwartung als eine subjektiv eingeschätzte Auftretenswahrscheinlichkeit für ein zukünftiges Ereignis,
c) Rollenerwartungen d) Erwartungen als generelle Einstellungen. M a n k ö n n t e m i t SECORD & BACKMAN (1976)
auf den antizipatorischen und normativen Charakter von Erwartungen verweisen, damit ist jedoch kein Rahmen für die vorliegenden Arbeiten entstanden. Bei dem in der Psychologie äußerst bedeutsamen Begriff «Erwartung» handelt es sich um ein hypothetisches Konstrukt. Als allgemeine Definition des hypothetischen Konstrukts Erwartung schlagen wir vor: Eine Erwartung eines Individuums ist eine Vorstellung, die es von einem möglichen zukünftigen Ereignis hat. Anstelle einer definitorischen Abgrenzung gegenüber verwandten hypothetischen Konstrukten wollen wir im folgenden Facetten von Erwartungen vorstellen. Eine Aufteilung von Erwartungen in verschiedene Klassen je nach Art der vorgestellten Ereignisse, wie sie zuletzt von SCHWARZER et al. (1980) vorgeschlagen wurde, halten wir im vorliegenden Fall f ü r keinen gangbaren Weg, da sich dabei keine allgemeinen Facetten von Erwartungen ableiten ließen. Eine zentrale Facette zur Einstufung von Erwartungen ist die subjektive Beurteilung des Wertes oder Bewertung des vorgestellten Ereignisses durch das Individuum. Wir ziehen den Begriff der Bewertung dem der Valenz vor, da er in der Literatur nicht einheitlich verwendet wird (vgl. hierzu HECKHAUSEN, 1977, p.285). Die Bewertung beinhaltet nicht nur den Aspekt der Gerichtetheit, also ob ein Ereignis als positiv oder negativ bewertet wird, sondern auch den Aspekt der Intensität, d . h . wie stark ein Ereignis als positiv oder negativ erlebt wird. In der Literatur wird die Facette der subjektiv eingeschätzten Auftretenswahrscheinlichkeit eines vorgestellten Ereignisses sehr o f t mit Erwartung gleichgesetzt. Da die Beschäftigung mit Erwartungen zumeist in Modellen erfolgt, die von «rationalem» menschlichen Verhalten auszugehen scheinen, wird die Facette des Emotionalitätsgrades kaum beachtet. Wir verstehen hierunter den Grad der in einer Erwartung ausgedrückten Emotion. Je stärker in einer Erwartung Emotionen angesprochen oder ausgedrückt werden, um so schwieriger wird es z.B. sein, solche Erwartungen zu ändern. Da Erwartungen variieren können von situa-
3
Zeitschrift für Sozialpsychologie 1981,12,1-23
tionsspezifisch bis sehr stark generalisiert, werden auch in der Literatur Erwartungen häufig nach ihrem Generalisiertheitsgrad unterschiedlich verwendet. Von dem Generalisiertheitsgrad einer Erwartung ist u. E. die Facette der Häufigkeit ihres Auftretens zu unterscheiden. Dabei ist es wahrscheinlich nützlich, diese Facette in zwei aufzuteilen: Häufigkeit des Auftretens einer Erwartung in gleichen Situationen und Häufigkeit des Auftretens einer Erwartung in verschiedenen Situationen. In bezug auf die Verhaltensrelevanz von Erwartungen läßt sich begründet vermuten, daß zwei weitere Facetten von Erwartungen bedeutsam sind: die zeitliche Nähe des vorgestellten Ereignisses und zeitliche Dauer des vorgestellten Ereignisses. Neben den o.g. Facetten kann ein Individuum auf Befragen auch Angaben machen über den Grad der subjektiven Sicherheit, daß die Vorstellung des zukünftigen Ereignisses angemessen ist. Bei einer Reihe von Erwartungen wird sich auch objektiv (= intersubjektiv) der Grad der Angemessenheit einer Erwartung einstufen lassen. Doch m u ß darauf hingewiesen werden, daß dies sicherlich nicht bei allen Erwartungen der Fall sein wird. Je stärker in einer Erwartung eine Emotion angesprochen oder ausgedrückt wird, um so weniger wird eine objektive Einstufung ihrer Angemessenheit möglich sein. Synonym mit dem objektiven Grad der Angemessenheit einer Erwartung sehen wir den Grad des Realitätsbezuges. Nicht unproblematisch ist natürlich die Festlegung eines Kriteriums für den Grad des Realitätsbezuges, dies soll hier aber nicht weiter diskutiert werden. Anzumerken bleibt, daß der objektive Grad der Angemessenheit einer Erwartung unabhängig ist von ihrer Verhaltensrelevanz für das antizipierende Individuum. Da Erwartungen eine unterschiedlich lange Zeit bestehen können, ist der Grad der Stabilität von Erwartungen eine weitere wichtige Facette. Nicht damit verwechselt werden darf u . E . der Grad der Änderbarkeit einer Erwartung. Hierunter verstehen wir den reziproken A u f w a n d , den man zur Änderung einer Erwartung betreiben muß, d . h . je höher der zur Änderung erforderliche A u f w a n d um so geringer ist der Grad der Änderbarkeit einer Erwartung. Bevor man sich der Frage der Änderbarkeit
von Erwartungen (und dem damit verbundenen Verhalten) zuwendet, m u ß zunächst der Grad der Relevanz von Erwartungen für die Vorhersage von Verhalten untersucht werden. Dabei d ü r f t e die Einstufung einer Erwartung auf dieser Facette, ebenso wie die Einstufung auf der Facette Änderbarkeit, von Beurteilung auf den anderen o . g . Facetten abhängig sein. Die Bedeutung von Erwartungen für die Vorhersage von Verhalten und gegebenenfalls die Änderung von Verhalten hängen u . a . ab von den Möglichkeiten und dem Bedürfnis eines Individuums, Erwartungen auszubilden. Für empirische Untersuchungen ist zu beachten, daß sich ein Individuum seiner Erwartung in einem unterschiedlichen Grad bewußt sein kann und in unterschiedlichem Maße in der Lage sein kann, seine Erwartung auszudrücken, womit nicht nur der Grad der Verbalisierbarkeit gemeint ist. Beziehungen zwischen den Facetten von Erwartungen brauchen u . E . hier nicht näher untersucht zu werden. Als kleiner Exkurs sei schon hier darauf hingewiesen, daß es u . E . von Bedeutung ist, wie das hypothetische Konstrukt Erwartung bzw. seine Facetten operationalisiert werden. Man kann zwei Gruppen von Vorgehensweisen unterscheiden: l . e h e r direkte Operationalisierungen von Erwartungen bzw. ihren Facetten und 2. eher indirekte d . h . schlußfolgernde Erfassung von Erwartungen bzw. deren Facetten. Zu der ersten Gruppe gehören Verfahren wie «freies Assoziieren» oder «lautes Denken», Interview und Vorgabe von Skalen oder Listen. Als geradezu typisch kann man im Bereich der Erforschung des sog. Pygmalioneffekts die schlußfolgernde Erfassung von Erwartungen ansehen. Dabei werden in der Regel den untersuchten Lehrern Informationen über ihre Schüler gegeben und aus je nach Information unterschiedlichem Lehrerverhalten auf die Ausbildung und Wirkung von Erwartungen geschlossen. Auf die damit verbundenen Probleme werden wir weiter unten noch eingehen.
2.2
Hypothesen zum Pygmalioneffekt
Nach diesen allgemeinen theoretischen Vorüberlegungen wollen wir uns der Bedeutung von Lehrererwartungen f ü r das Verhalten von Schülern
4 zuwenden. Dabei wollen wir eine Taxonomie von Hypothesen vorschlagen, die den Spezialfall einer sich selbst erfüllenden Prophezeiung, den sog. Pygmalioneffekt, möglichst weitgehend abdeckt. Dabei könnten die o.g. Facetten von Erwartungen die Grundlage bilden für eine systematische Untersuchung der in diesem Bereich zu entwickelnden Hypothesen.
2.2.1 Allgemeine Überlegungen zu Lehrererwartungen Lehrererwartungen beziehen sich auf die Leistungen, den sozialen und emotionalen Bereich des Verhaltens eines Schülers. Als Quellen für Lehrererwartungen kann man die naive Verhaltenstheorie des Lehrers ansehen, die wiederum entstanden ist auf der Grundlage von E r f a h r u n gen, allgemeinen und persönlichen Stereotypen, Erziehung und Ausbildung. Daneben spielen jedoch auch u . U . «direktere» Informationen über den Schüler eine Rolle wie z.B. Beurteilungen durch andere Lehrer, Eltern oder Geschwister. Ganz entscheidend dürften jedoch auch die Informationen sein, die ein Lehrer im direkten Umgang mit einem Schüler erhält. Bei allen Erwartungen, die ein Lehrer entwickelt, ist es entscheidend, wie hoch er sie einstuft auf der Facette Relevanz für die Vorhersage von Verhalten. Hiervon d ü r f t e es z. B. überhaupt abhängen, ob er eine Erwartung überhaupt zum Ausdruck bringt. Wenn Lehrererwartungen Einfluß nehmen sollen auf das Verhalten von Schülern, so müssen sie in irgendeiner Weise zum Ausdruck gebracht werden. Hierbei handelt es sich um einen oft vollkommen außerachtgelassenen Bereich in empirischen Untersuchungen. In verbalen Äußerungen können Erwartungen von einem Lehrer mehr oder weniger eindeutig geäußert werden. So besteht z. B. eine eher indirekte F o r m , Erwartungen zu äußern, in den unterschiedlichen Formen von Lob und Tadel bzw. Bewertungen von Leistungen oder sozialem und emotionalem Verhalten. Eine weitere Möglichkeit, Erwartungen indirekt zum Ausdruck zu bringen, besteht in nonverbalen Verhaltensweisen des Lehrers z.B. in Variationen des Blick- und Sprechverhaltens.
Berka & Westhoff: Lehrererwartungen und Schülerverhalten
2.2.2 Inter- vs. intrapersonale sich selbst-erfüllende Prophezeiungen Neben der mehr oder weniger direkten Äußerung einer Erwartung ist von ganz entscheidender Bedeutung, was darauf in der Lehrer-Schüler-Interaktion geschieht. Ein Lehrer kann neben der Äußerung einer Erwartung auch zusätzlich solche Bedingungen schaffen, daß sich seine Prognose (= Erwartung) mit erhöhter Wahrscheinlichkeit erfüllt. Die Untersuchung dessen, was ein Lehrer tut, hat eine Fülle von Arbeiten bewirkt, auf die wir weiter unten eingehen wollen. Diesen Fall wollen wir als interpersonale sich selbst-erfüllende Prophezeiung bezeichnen, da hier jemand außer dem von der Prophezeiung Betroffenen noch Bedingungen schafft, damit sie eher zutrifft. Der theoretisch weiter ausgearbeitete Fall ist die intrapersonale sich selbst-erfüllende Prophezeiung, hierbei schafft der Prophet selbst die Bedingungen, die die Wahrscheinlichkeit des Eintreffens seiner Prophezeiung erhöhen. ARCHIBALD (1974) gibt Erklärungsansätze, die sich auf negative intrapersonale sich selbst-erfüllende Prophezeiungen beschränken, das sind solche, deren Zutreffen für den Propheten unangenehm sind, diese Einschränkung macht JONES (1977, p. 167 ff.) in seinem Ansatz nicht mehr. JONES bezieht sein Modell explizit nur auf die Facette subjektiv eingeschätzte Auftretenswahrscheinlichkeit eines Erfolges. Er versucht also nur Verhalten zu erklären, das sich als mehr oder weniger erfolgreich einstufen läßt. Weiter nennt er selbst zwei ganz entscheidende Randbedingungen: Er beschränkt sich nur auf Situationen mit vom Individuum geschätzten Zielen und geht zudem davon aus, daß ein Individuum sich frei für oder gegen die Teilnahme entscheiden kann, also kein irgendwie gearteter Zwang auf das Individuum ausgeübt wird. «The general hypothesis, then, is that the subjective probability of success is the key to intrapersonal self-fulfilling prophecies. As the subjective probability of success increases, the likelihood that one will exert whatever effort is required for success also increases» (JONES, 1977, p. 162). Bei der weiteren Analyse unterscheidet JONES zwischen generalisierter und situationsspezifischer subjektiver Erfolgswahrscheinlichkeit und geht davon aus, daß erstere die anfängliche Ein-
5
Zeitschrift für Sozialpsychologie 1981,12,1-23
Schätzung der Erfolgswahrscheinlichkeit bei relativ unbekannten Aufgaben bestimmt. Hat ein Individuum Erfahrungen mit bestimmten Aufgaben, so wird seine Schätzung der Erfolgswahrscheinlichkeit mehr durch die situationsspezifische Komponente der subjektiven Wahrscheinlichkeit bestimmt. Damit ein Individuum Erfahrungen mit bestimmten Aufgaben sammeln kann, ist nicht nur Feedback erforderlich, sondern es ist von ganz entscheidender Bedeutung, welche Kausalattribuierungen das Individuum nach dem Feedback vornimmt. Die Wirkung des Feedbacks hängt außerdem von den Zielen des Individuums und der Ausprägung bestimmter Persönlichkeitsmerkmale wie z.B. Feldabhängigkeit ab. Eine Erklärung für die Bedeutung der subjektiven Erfolgswahrscheinlichkeit für den Erfolg eines Individuum sieht JONES (1977, p.182) in den unterschiedlichen Strategien, die Personen mit hoher bzw. niedriger subjektiver Erfolgswahrscheinlichkeit bei der Bearbeitung von Aufgaben verfolgen. Damit eine vom Lehrer geäußerte Erwartung bezüglich des Verhaltens eines Schülers zu einer intrapersonalen sich selbst-erfüllenden Prophezeiung werden kann, müssen mindestens die folgenden Bedingungen bei einem Schüler erfüllt sein: Es müssen Fähigkeit und Interesse in ausreichendem Maße vorhanden sein, zum Ausdruck gebrachte Erwartungen wahrzunehmen (vgl. JONES, 1977, p.110), sein Selbstbild muß im relevanten Ausschnitt mit der Erwartung des Lehrers übereinstimmen (FINN, 1972, p.407, detailliertere Angaben über mögliche Bereiche finden sich bei COOPER, 1979, p.405), weiter müssen Kausalattribuierungen, Anspruchsniveau und u . U . Bezugsnormorientierung in der geäußerten Lehrererwartung, so wie sie vom Schüler wahrgenommen wird, und in der Erwartung des Schülers übereinstimmen. Sind diese Bedingungen nicht erfüllt, so kommt es nicht zu einer intrapersonalen sich selbst-erfüllenden Prophezeiung. Der Schüler kann dann mit kognitiv-emotionalen Prozessen u n d / o d e r offenem Verhalten reagieren, wobei sich keine Übereinstimmung mit den Erwartungen des Lehrers zeigt. Anders sieht die Situation aus, wenn der Lehrer neben dem Ausdruck einer Erwartung zusätzliche Bedingungen schafft, die im Sinne dieser Erwartung wirken, hierbei handelt es sich dann um eine interpersonale sich selbst-erfüllende
Prophezeiung. Hier steht dem Lehrer im Prinzip das gesamte Erfahrungswissen zur Modifikation menschlichen Verhaltens offen und er kann sich ihm optimal erscheinende Techniken auswählen und einsetzen. Damit es zu einer intrapersonalen sich selbsterfüllenden Prophezeiung kommen kann, sind je nach Lerngeschichte und Lebensbedingungen des Schülers die Wahrnehmungen und Beurteilungen des Lehrers durch den Schüler wichtig. So spielt es wohl eine Rolle, in welchem Maße ein Lehrer von einem Schüler als überzeugend, selbstsicher, engagiert, kompetent und emotional positiv gegenüber dem Schüler eingestellt wahrgenommen wird. Experimentell nicht variierbar sind eine Reihe von Bedingungen, die auch bei der Untersuchung von sich selbst-erfüllenden Prophezeiungen in der Schule von großer Bedeutung sein dürften, wie z.B. die gesamtgesellschaftliche Situation (vgl. ACHTENHAGEN, 1978), allgemeine Lebensbedingungen und speziell hier die Arbeitsmarktsituation. Desgleichen dürften sich Gruppeneinflüsse und auch die Art einer Schule selten wirksam kontrollieren lassen. Bisher haben wir nur die Richtung möglicher Beeinflussung vom Lehrer auf den Schüler betrachtet, selbstverständlich beeinflußt auch das Verhalten eines Schülers das Verhalten des Lehrers, so daß wir es hier mit einem komplexen Prozeß wechselweiser Beeinflussung zu tun haben. Hier bieten Modellvorschläge wie die von NICKEL (1976), HOFER & DOBRICK (1979) oder COOPER (1979) Ansatzpunkte zur Untersuchung der Interaktionsprozesse, die zwischen Lehrer und Schüler ablaufen. Diesen Bereich der Erforschung von Lehrer-Schüler-Interaktionen wollen wir hier jedoch nicht mit in die Betrachtungen einbeziehen. Wir wollen uns vielmehr im folgenden auf die Beeinflussung von Lehrererwartungen und die Wirkung dieser Erwartungen auf das Verhalten von Lehrern u n d / o d e r Schülern zuwenden.
3.
Lehrererwartungen als abhängige Variablen
Bei Untersuchungen zu dieser Thematik geht es d a r u m , unabhängige Variablen zu identifizieren, die einen Einfluß auf die Erwartungen von Lehrern haben.
6
Berka & Westhoff: Lehrererwartungen und Schülerverhalten
Die experimentelle Manipulation besteht meist darin, daß unterschiedliche Informationen über Attraktivität, sozioökonomischen Status, Geschlecht, Fähigkeiten, Rasse, Verhalten u n d / oder Leistungen von Schülern oder Studenten in Form von schriftlichen Berichten oder Fotografien an die jeweilige Lehrer- (Studenten-) Stichprobe gegeben werden. A u f g a b e der Lehrer ist es
dann je nach Untersuchung, verschiedene Beurteilungen u n d / o d e r Erwartungen zu äußern, die zum Beispiel das allgemeine oder spezielle Leistungspotential von Schülern, ihre Einstellungen, Schulerfolg oder soziale Beziehungen betreffen; eine detaillierte Übersicht der vorliegenden Untersuchungen bietet Tabelle 1.
Tab. 1: Lehrererwartungen als abhängige Variablen. Untersuchung (Autoren, Jahr)
U n a b h ä n g i g e Variablen
A D A M S & LAVOIE
-
1974
- Verhalten - Attraktivität
A b h ä n g i g e Variablen
Stichprobe
Ergebnisse
Lehrereinschätzungen bezüglich: - des Elterninteresses des Schülers an der Schule - der Beziehung zu Gleichaltrigen - der Einstellungen des Schülers - seiner A r b e i t s h a l t u n g
350 Lehrer
Das Verhalten des Schülers (operationalisiert d u r c h I n f o r m a t i o n e n über die persönliche und soziale Reife, Arbeitshaltung, Einstellung und A u f m e r k s a m keit des Schülers) hatte einen signifikanten E i n f l u ß auf alle vier a b h ä n g i g e n Variablen (= E r w a r t u n g e n ) ; die physische Attraktivität u n d das Geschlecht der Schüler übte keinen deutlichen E i n f l u ß auf die Lehrereinschätzungen a u s .
Vorhersage bezüglich: 1. kreativer Fähigkeit 2. intellektueller Fähigkeit 3. Art der Schuleingruppierung 4. G r a d sprachlicher Trainierbarkeit 5. Qualität der LehrerSchüler-Interaktion
490 Lehrer
sign. E i n f l u ß des Familienhintergrundes auf die Günstigkeit der E r w a r t u n g e n von Lehrern: die zur Mittelklasse gehörig beschriebenen Kinder provozierten günstigere E r w a r t u n g e n bei L e h r e r n f ü r alle 5 abhängigen Variablen; Die Attraktivität eines Kindes h a t t e einen b e d e u t s a m e n E i n f l u ß auf die Erwartungen der Lehrer hinsichtlich der abhängigen'Variablen 1 - 4 . Positiv: B e r e c h n u n g der E f f e k t s t ä r k e n Kritik: Fehlende Theoriegeleitetheit der U n t e r s u c h u n g u n d univariate Varianzanalysen statt angemessener komplexerer A u s w e r t u n g s m e t h o d e n .
E r w a r t u n g e n hinsichtlich der sozialen Effektivität (Beliebtheit, Klassensprecher-Wahl)
490 Lehrer
Es zeigten sich signifikante Einflüsse des s o z i o ö k o n o m i s c h e n Status auf die vom Lehrer perzipierte Wahrscheinlichkeit der Schüler, K l a s s e n f ü h r e r zu w e r d e n (co = .65), auf den w a h r g e n o m m e n e n Sozialstatus (CD = .42) und die v o m Lehrer vermutete interpersonelle E r f a h r u n g (co' = .21) sowie der Attraktivität auf die vermutete Familiengröße (co = .24) u n d den Sozialstatus (co2 = .11). Kritik s . u .
Lehrervorhersagen bzgl. 350 Lehrer - akademischer Fähigkeiten - Anspruchsniveau Führungspotential
Verhaltensbewertungen (akzeptabel oder nicht) beeinflußten alle L e h r e r v o r h e r sagen, wohingegen kein E i n f l u ß der Attraktivität u n d des Geschlechts festgestellt werden k o n n t e . Die Kinder, die leistungsorientiert, k o o p e r a t i v u n d a b h ä n gig sind, d . h . diejenigen, die akzeptiert werden, werden als akademisch fähiger und erfolgreicher im Beruf angesehen.
Informationen über:
ADAMS & COHEN
1976
Geschlecht
Informationen über: - A t t r a k t i v i t ä t , sozioökonomischen S t a t u s , - Geschlecht, Fähigkeiten, Familienklima
1977
Informationen über: - A t t r a k t i v i t ä t , sozioökonomischen Status, - Geschlecht, Fähigkeiten, - Familienklima
LA V o i t & ADAMS 1974
Informationen über: - Verhalten - Attraktivität - Geschlecht
ADAMS & COHEN
7
Zeitschrift für Sozialpsychologiel981,12,1-23
Tabelle 1 (Fortsetzung) Untersuchung (Autoren, Jahr)
COOPER et al. 1975
DEITZ & PURKEY 1969
FINN 1972
FOSTER & YSSELDYKE1976
HARVEY & SLATIN 1975
HEINTZ
1974
KEHLE et a l .
1974
MASON
1973
U n a b h ä n g i g e Variablen
I n f o r m a t i o n e n über Kinder - S Ö S (mittel/niedrig) - Rasse ( s c h w a r z / w e i ß )
Informationen über - Rassenzugehörigkeit von Kindern Informationen über - Schüleraufsätze - I n f o r m a t i o n e n über Schreiber hinsichtlich: - Rasse - Geschlecht - Fähigkeit - Leistung in der Vergangenheit Kinder (Etikettierungen): - e m o t i o n a l gestört - lernbehindert - geistig zurückgeblieben - normal - VIDEO-Aufnahme
F o t o s von Kindern (Rasse, perzipierter SÖS)
Informationen über: - Geschlecht - S Ö S (Arzt-, A r b e i t e r k i n d ) von retardierten Kindern Informationen über: - Geschlecht - Rasse - Intelligenz - Attraktivität
günstige/ungünstige/ neutrale Berichte über Intelligenz, E m o t i o n a l i t ä t , Familienhintergrund, Einstufungsempfehlung.
A b h ä n g i g e Variablen
Stichprobe
Ergebnisse
- Leistungserwartungen - Kausalfaktoren - Verantwortlichkeit (intern/extern)
64 Lehrer u n d 64 Leherstudenten
- weiße Mittelschichtschüler werden eher als intern verantwortlich gesehen - an Mittelklasse-Schüler wurden h ö h e r e Leistungserwartungen gestellt
- erwarteter akademischer E r f o l g (Leistung)
147 S t u d e n t e n
keine signifikanten Unterschiede
- Aufsatzbewertungen (Erwartungen?)
300 Lehrer
- Interaktionseffekt Rasse/Geschlecht, d . h . unterschiedliche Bewertungen f ü r weiße männliche/weibliche Schüler - den g r ö ß t e n E i n f l u ß h a t t e das wahrgen o m m e n e Fähigkeitsniveau - K o m m e n t a r : Es ist z w e i f e l h a f t , o b hier E r w a r t u n g e n operationalisiert wurden.
-
38 Lehrerstudenten
- gegenüber Kindern, die als abweichend bezeichnet w u r d e n , entwickelten Lehrerstudenten negative E r w a r tungen.
Verhaltenserwartungen Verhaltensbeurteilungen
- die Bezeichnung «geistig retardiert» f ü h r t e a m ehesten zu negativen E r w a r tungen und Beurteilungsverfälschungen. Einschälzungen des 96 Lehrer Leistungspotentials von Schülern, z.B. hinsichtlich des Lesens von Büchern, des Anfertigens von H a u s a u f g a b e n usw.
- signifikant positive Beziehung zwischen der L e h r e r w a h r n e h m u n g (perzipierter SÖS) der Kinder u n d den Erwartungen hinsichtlich z u k ü n f t i g e r Leistungen: gegenüber Kindern, deren S Ö S von den Lehrern als mittelhoch oder hoch eingeschätzt w u r d e , äußerten sie fast nur E r f o l g s e r w a r t u n g e n , w ä h r e n d sie bei niedrig perzipiertem S Ö S beinahe ausschließlich Mißerfolgserwartungen a u s d r ü c k t e n . - von weißen Kindern w u r d e ö f t e r erwartet, d a ß sie in der Schule erfolgreich sein w ü r d e n .
Beurteilung der zu erreichenden Lesefertigkeit
72 e r f a h r e n e Sonderschullehrer
- kein signifikanter E i n f l u ß . H o h e Variabilität in d e m E r w a r t u n g s niveau der Lehrer.
96 Lehrer
- signifikant: Geschlecht sowie Geschlechts/ A t t r a k t i v i t ä t s - I n t e r a k t i o n Folgerung: L e h r e r e r w a r t u n g e n sind eher komplex u n d basieren auf einer K o m b i n a t i o n von Schülercharakteristika; die A u t o r e n v e r m u t e n als Vermittlervariablen das A n s p r u c h s n i v e a u der Lehrer bezüglich Schülerleistungen und a f f e k t i v e E r w a r t u n g s a n t e i l e .
Lehrerbeurteilungen von - Persönlichkeitseigenschaften - Aufsatzleistungen
Leistungsbeurteilungen und erwartete N o t e n a m E n d e des Schuljahres
79 Lehrer u n d LehrerStudenten
signifikante E f f e k t e unterschiedlich getönter I n f o r m a t i o n e n auf die E r w a r tungen: Lehrer, die negative Berichte lasen, hatten die niedrigsten Erwartungen. kein signifikanter E f f e k t hinsichtlich der beobachteten u n d beurteilten Leistungen.
8
Berka & Westhoff: Lehrererwartungen und Schülerverhalten
Tabelle 1 (Fortsetzung) Untersuchung
Unabhängige Variablen
Abhängige Variablen
Stichprobe
Ergebnisse
- Leistungsbeurteilungen - Erwartungen hinsichtlich des Besitzes bestimmter kognitiver und affektiver Eigenschaften
33 Lehrer und
- signifikant unterschiedliche Beurteilung der erwarteten Charakteristika, d . h . psychologische Berichte können Erwartungen des Lehrers beeinflussen
- Beurteilung des erwarteten Erfolges am Ende des 1.Schuljahres; Bereiche: Lesen, Rechnen, sozialemotionale Entwicklung usw.
7 9 Lehrer
-
94 Lehrer in der
(Autoren, J a h r ) Informationen über: MASON & LARIMORE günstige/ungünstige/ 1974 neutrale Berichte über Intelligenz, Emotionalität, Familienhintergrund, Einstufungsempfehlung.
MASON et al. 1976
Informationen (psychologische Berichte) - Lehrererfahrung
manipulierte Informationen Uber Geschlecht der Schüler
MERTENS 1976
-
3 0 Studenten
- kein signifikanter Effekt hinsichtlich der beobachteten und beurteilten Leistungen.
- signifikante Haupteffekte für beide unabhängige Variablen.
Aufsatzbeurteilungen
Ausbildung
- erwartete Noten am Ende des Schuljahres
Bericht-Günstigkeit (IQ, SÖS)
- Interaktionseffekt Lehrererfahrung/ Einfluß der Berichte: Erfahrungen der Lehrer scheinen wenig wahrscheinlich beeinflußbar (differentieller Aspekt).
- Stil des Berichts (klinisch vs. verhaltensorientiert)
- Interaktion Geschlecht/Günstigkeit der Berichte sowohl hinsichtlich Leistungsbewertung als auch Leistungserwartung signifikant. - signifikanter Haupteffekt der Günstigkeit eines Berichts, - Berichtstil und Geschlecht der Schüler: nicht signifikant.
Ross & SALVIA 1975
- Attraktivität ( F o t o s ) sonst gleiche psychologische Berichte
A l s b e e i n f l u s s e n d e F a k t o r e n a u f die E r w a r tungen von L e h r e r n w u r d e n bisher gefunden: -
die A t t r a k t i v i t ä t v o n S c h ü l e r n (ADAMS & COHEN, 1 9 7 6 u n d 1 9 7 7 ; R o s s & SALVIA, 1 9 7 5 )
-
das
(berichtete)
Verhalten
von
Schülern
(ADAMS & LAVOIE, 1 9 7 4 ; LAVOIE & ADAMS, 1974) -
die G ü n s t i g k e i t v o n p s y c h o l o g i s c h e n B e r i c h ten (MASON, 1 9 7 3 ; MASON& LARIMORE, 1 9 7 4 ; MASON et a l . , 1 9 7 6 ; MERTENS, 1 9 7 6 )
-
d a s G e s c h l e c h t v o n S c h ü l e r n (KEHLE et a l . , 1974)
-
die R a s s e v o n S c h ü l e r n (HARVEY & SLATIN, 1975).
tivität
der
Schüler,
bei
HENDERSON &
LONG
( 1 9 7 3 ) e r g a b e n sich I n t e r a k t i o n s e f f e k t e der R a s s e der S c h ü l e r mit ihren F ä h i g k e i t s t e s t w e r t e n die
Einschätzung
zukünftiger
auf
Leseleistungen,
MERTENS ( 1 9 7 6 ) b e r i c h t e t v o n einer I n t e r a k t i o n der F a k t o r e n G ü n s t i g k e i t eines B e r i c h t s ( h o h e r I Q u n d h o h e r S Ö S ) u n d G e s c h l e c h t a u f die E r w a r t u n g e n d e r L e h r e r , KEHLE ( 1 9 7 4 ) f a n d eine signifikante
Interaktionswirkung
des
Ge-
schlechts und der Attraktivität von Schülern a u f die B e u r t e i l u n g e n v o n L e h r e r n ( v g l . T a b . l ) . D i e vielleicht z u n ä c h s t w i d e r s p r ü c h l i c h u n d v e r w i r r e n d e r s c h e i n e n d e n E r g e b n i s s e sind u n s e r e s E r a c h t e n s nicht v e r w u n d e r l i c h ; ein Blick a u f T a b e l le 1 e r m ö g l i c h t es, einige K e n n z e i c h e n des F o r -
In a n d e r e n U n t e r s u c h u n g e n e r g a b e n sich j e d o c h z u m Teil für die e b e n g e n a n n t e n F a k t o r e n k e i n e s i g n i f i k a n t e n A u s w i r k u n g e n a u f die E r wartungen von Lehrern bzw.
- Für unattraktive Kinder wurden signifikant niedrigere Erwartungen hinsichtlich schulischer und sozialer Entwicklungen geäußert.
76 Lehrer
- Erwartungen hinsichtlich schulischer und sozialer Entwicklung
Interaktionswir-
k u n g e n mit a n d e r e n u n a b h ä n g i g e n V a r i a b l e n a u f die E r w a r t u n g e n v o n L e h r e r n ; s o zeigten sich
s c h u n g s s t a n d e s zu i d e n t i f i z i e r e n : -
Verwendung unterschiedlicher Stichproben;
-
v e r s c h i e d e n e B e z u g s p u n k t e f ü r die E r w a r t u n gen;
-
z u m Beispiel bei ADAMS & LAVOIE ( 1 9 7 4 ) , LAVOIE & ADAMS ( 1 9 7 4 ) keine s i g n i f i k a n t e n E f f e k t e der unabhängigen Variablen Geschlecht und A t t r a k -
Unterschiede, je nachdem, ob
Erwartungen
oder Bewertungen von den Lehrern verlangt wurden; -
fehlende Kontrolle wichtiger L e h r e r c h a r a k t e r i s t i k a , wie z u m Beispiel E r f a h r u n g im U n t e r -
9
Zeitschrift für Sozialpsychologie 1981,12,1-23
rieht, z u g e s c h r i e b e n e R e l e v a n z v e r s c h i e d e n e r Informationen; lassen die A u s l ö s u n g gleicher E r w a r t u n g e n bei v e r s c h i e d e n e n L e h r e r n u n w a h r s c h e i n l i c h ers c h e i n e n (vgl. a u c h die drei L e h r e r t y p e n v o n BROPHY & GOOD (1976) s o w i e die B e i t r ä g e v o n HOFER (1969) z u r impliziten P e r s ö n l i c h k e i t s t h e o rie v o n
Lehrern
s o w i e SCHWARZER & LANGE
(1979) zur i m p l i z i t e n U n t e r r i c h t s t h e o r i e v o n L e h rern). W a s bleibt als v o r l ä u f i g e s R e s ü m e e ü b r i g ? Unterschiedlich gefärbte I n f o r m a t i o n e n (günstig, u n g ü n s t i g o d e r n e u t r a l ) s c h e i n e n einen E i n f l u ß a u f d e n v o n L e h r e r n e r w a r t e t e n E r f o l g ihrer S c h ü l e r a u s ü b e n zu k ö n n e n , nicht j e d o c h a u f ihre L e i s t u n g s b e u r t e i l u n g e n (MASON, 1973, 1974, 1 9 7 6 ; MERTENS, 1 9 7 6 ) .
In d e n d a b e i v e r w e n d e t e n B e r i c h t e n w u r d e n a l l e r d i n g s I n f o r m a t i o n e n ü b e r Intelligenz, F a m i lie, E i n s t u f u n g s e m p f e h l u n g e n , E m o t i o n e n u s w . k o m b i n i e r t g e g e b e n . KEHLE (1974) f o l g e r t e , d a ß L e h r e r e r w a r t u n g e n als k o m p l e x a n z u s e h e n seien u n d a u f einer K o m b i n a t i o n v o n S c h ü l e r c h a r a k t e ristika b a s i e r e n d ü r f t e n . Dies e n t s p r ä c h e a u c h m e h r der n a t ü r l i c h e n S i t u a t i o n , in der verschied e n e C h a r a k t e r i s t i k a der S c h ü l e r e b e n f a l l s simult a n a u f t r e t e n . LAVOIE & ADAMS (1974) v e r m u t e n a n a l o g d e r A t t r a k t i v i t ä t s f o r s c h u n g v o n BERSCHEID & WALSTER ( 1 9 6 9 ; v g l . M I K U L A & STROE-
BE, 1977), d a ß sich die B e w e r t u n g d e s L e h r e r s a n f a n g s e h e r a u f ä u ß e r e M e r k m a l e stützt u n d erst später auf das beobachtete Verhalten u n d vermutete E i g e n s c h a f t e n , ein Z w e i - S t u f e n - M o d e l l , d a s e m p i r i s c h zu p r ü f e n w ä r e . D e r F a m i l i e n h i n t e r g r u n d (Mittel- vs. U n t e r schicht) b e e i n f l u ß t d e u t l i c h die E r w a r t u n g e n von Lehrern hinsichtlich der «sozialen Effektivität» ihrer S c h ü l e r ( z u m Beispiel die v o m L e h r e r perzip i e r t e W a h r s c h e i n l i c h k e i t eines K i n d e s , Klassenf ü h r e r zu w e r d e n ) , d e r Q u a l i t ä t der L e h r e r - S c h ü l e r - I n t e r a k t i o n , der A r t der S c h u l e i n g r u p p i e r u n g , der k r e a t i v e n u n d intellektuellen F ä h i g k e i ten s o w i e d e s G r a d e s a n b e r u f l i c h e m E i g n u n g s t r a i n i n g (ADAMS & COHEN, 1 9 7 6 ) .
D i e A r b e i t e n v o n ADAMS & COHEN v e r d i e n e n i n s o f e r n b e s o n d e r e B e a c h t u n g , als sie - im G e g e n s a t z zu allen a n d e r e n u n s b e k a n n t e n S t u d i e n a u f d i e s e m G e b i e t - die B e r e c h n u n g der E f f e k t s t ä r k e n der e i n z e l n e n F a k t o r e n v o r n a h m e n ; leider b e r i c h t e t e n die A u t o r e n n u r E r g e b n i s s e uni-
variater Varianzanalysen, während unseres Era c h t e n s m u l t i v a r i a t e A n a l y s e n a n g e m e s s e n e r gewesen w ä r e n : m ö g l i c h e I n t e r a k t i o n s e f f e k t e k o n n t e n so nicht e n t d e c k t w e r d e n . I n s g e s a m t fällt a u f , d a ß die E r f o r s c h u n g von L e h r e r e r w a r t u n g e n als a b h ä n g i g e r V a r i a b l e n bisher n u r einen - w e n n a u c h w i c h t i g e n - A u s s c h n i t t möglicher Einflußgrößen untersucht hat: nämlich I n f o r m a t i o n e n ü b e r S c h ü l e r . Nicht u n t e r s u c h t w u r d e n b i s h e r e v e n t u e l l e E i n f l ü s s e v o n L e h r p l ä n e n , K o l l e g e n , Vorgesetzt e n , F r e u n d e n u n d E r f a h r u n g e n d e r L e h r e r in Elt e r n h a u s , S c h u l e u s w . a u f die E n t w i c k l u n g v o n E r w a r t u n g e n (vgl. NICKEL, 1976). I n s b e s o n d e r e die g e n a u e r e A n a l y s e v o n E i n s t e l l u n g e n , impliziter F ü h r u n g s - , P e r s ö n l i c h keits- u n d U n t e r r i c h t s t h e o r i e n v o n L e h r e r n als G r u n d l a g e ihrer E r w a r t u n g e n wäre unseres Era c h t e n s f ü r d a s w e i t e r e V o r g e h e n vielversprechend.
4.
Lehrererwartungen als unabhängige Variablen
V i e l f a c h a n g e r e g t d u r c h die A r b e i t e n v o n ROSENTHAL u n d M i t a r b e i t e r n ( 1 9 6 3 , 1 9 6 6 , 1 9 6 8 ) u n t e r s u c h e n S t u d i e n dieser A r t , o b b e s t i m m t e E r w a r t u n g e n v o n L e h r e r n (meist hinsichtlich der Intelligenz/Leistungsentwicklung von Kindern) einen E i n f l u ß a u f die I n t e l l i g e n z e n t w i c k l u n g , S c h u l l e i s t u n g e n u n d / o d e r die L e h r e r - S c h ü l e r Interaktion ausüben. I m G e f o l g e dieser F o r s c h u n g w u r d e in d e n letzten zehn J a h r e n i m m e r w i e d e r v e r s u c h t , mit H i l f e f a l s c h e r I n f o r m a t i o n e n ü b e r die Intelligenz v o n S c h ü l e r n (Beispiel: «ein intellektuelles A u f b l ü h e n » ist zu e r w a r t e n ) bei d e n L e h r e r n ( f ä l s c h liche) E r w a r t u n g e n zu i n d u z i e r e n , u m d a n n d e r e n Einflußmöglichkeiten auf Schüler- u n d / o d e r L e h r e r v e r h a l t e n zu e r g r ü n d e n . Seltener ü b e r p r ü f t e m a n b i s h e r , o b die E r w a r t u n g s i n d u k t i o n t a t s ä c h l i c h g e l u n g e n w a r (FLEMING & ANTTONEN, 1 9 7 1 ) s o w i e d i e A u s w i r k u n -
g e n v o n n a t ü r l i c h e n E r w a r t u n g e n (DUSEK & O'CONNELL, 1973) o d e r d i r e k t e n E r w a r t u n g s ä u ß e r u n g e n (ENTWISLE et a l . , 1 9 7 2 ; MEICHENBAUM & SMART, 1 9 7 1 ) .
A n a l o g d e n o b e n skizzierten t h e o r e t i s c h e n V o r ü b e r l e g u n g e n b e z ü g l i c h der h y p o s t a s i e r t e n P r o z e s s e , die u . E . bei der U n t e r s u c h u n g d e s Ein-
10
Berka & Westhoff: Lehrererwartungen und Schülerverhalten
flusses v o n L e h r e r e r w a r t u n g e n b z w . E r w a r t u n g s i n d u k t i o n e n bei L e h r e r n a u f d a s V e r h a l t e n von Schülern mitberücksichtigt werden müssen, wollen wir im f o l g e n d e n v e r s u c h e n , d e n S t a n d der Forschung a n h a n d vorliegender empirischer A r b e i t e n d a r z u s t e l l e n (vgl. T a b . 2 u n d 3). A l s relativ g r o b e s G l i e d e r u n g s m e r k m a l dien e n u n s d a b e i z u n ä c h s t die in den jeweiligen U n t e r s u c h u n g e n als a b h ä n g i g d e f i n i e r t e n V a r i a b l e n ; ä h n l i c h w i e BROPHY & GOOD ( 1 9 7 6 ) u n d DUMKE
(1977) wollen wir S t u d i e n u n t e r s c h e i d e n mit Int e l l i g e n z - / S c h u l l e i s t u n g e n als a b h ä n g i g e n Variablen ( « P r o d u k t d a t e n » ) u n d I n t e r a k t i o n v o n L e h rern u n d S c h ü l e r n als a b h ä n g i g e V a r i a b l e ( « P r o zeßdaten»).
4.1
Untersuchungen der Wirkungen v o n Lehrererwartungen auf Schiilerverhalten (Produktdaten)
D i e v o n ROSENTHAL u n d JACOBSON
s i g n i f i k a n t e n Steigerungen einer S c h ü l e r s t i c h p r o b e a u s L e h r e r n als «intellektuelle dert w o r d e n w a r e n , sind zu
berichteten
des I Q bei d e n 2 0 % 18 Klassen, die ihren A u f b l ü h e r » geschilRecht von ELASHOFF
& S N O W ( 1 9 7 2 ) , B A R K E Y ( 1 9 7 1 ) , SCHUSSER ( 1 9 7 2 )
u n d a n d e r e n kritisiert w o r d e n . M ä n g e l im Vers u c h s p l a n u n d der statistischen A n a l y s e lassen a u c h u . E . die w e i t g e h e n d e n S c h l u ß f o l g e r u n g e n der A u t o r e n nicht zu. Ä h n l i c h angelegte U n t e r s u c h u n g e n (z. B. FLEM I N G & ANTTONEN, 1 9 7 1 ; MENDELS & FLANDERS, 1 9 7 3 ; S O U L E , 1 9 7 2 ; GOZALI & M E Y E N , 1 9 7 0 ; B A BAD, 1 9 7 7 ; D U S E K & O ' C O N N E L L , 1 9 7 3 ) f a n d e n -
a u c h w e n n Schulleistungen als a b h ä n g i g e Variablen f u n g i e r t e n - meist keine s i g n i f i k a n t e n E f f e k te d e r v e r s u c h t e n E r w a r t u n g s m a n i p u l a t i o n der L e h r e r a u f Testleistungen der Schüler b z w . Schulleistungen u n d / o d e r Intelligenzmaße. Ein etwas a n d e r e s Bild scheint sich zu e r g e b e n , w e n n m a n die U n t e r s u c h u n g e n b e t r a c h t e t , die im G e g e n s a t z zu ROSENTHAL u n d vielen N a c h u n t e r s u c h u n g e n - sich mit d e m E i n f l u ß n a t ü r l i c h e r Erwartungen O'CONNELL
(DUSEK &
DUSEK,
&
O'CONNELL,
1974;
1973;
SUTHERLAND
&
GOLDSCHMID, 1974), starker Erwartungsw e c k u n g (DUMKE, 1978) o d e r expliziter E r w a r tungsäußerung
(ENTWISLE &
WEBSTER,
1972;
M E I C H E N B A U M & SMART, 1 9 7 1 ) b e s c h ä f t i g t e n .
Die z u m Teil h e t e r o g e n e n E r g e b n i s s e sollen et-
was detaillierter analysiert w e r d e n : In den Studien
von
DUSEK
&
O'CONNELL
(1973/1974)
k o n n t e n E f f e k t e n a t ü r l i c h e r E r w a r t u n g e n von L e h r e r n (n = 4) bezüglich der s p r a c h l i c h e n u n d r e c h n e r i s c h e n F ä h i g k e i t e n ihrer S c h ü l e r (n = 64) a u f e n t s p r e c h e n d e L e i s t u n g s t e s t w e r t e der S c h ü ler n a c h g e w i e s e n w e r d e n . D e n A u t o r e n scheint dieser E f f e k t die F ä h i g keit d e r L e h r e r zu r e f l e k t i e r e n , d a s L e i s t u n g s p o tential ihrer S c h ü l e r g e n a u e i n z u s c h ä t z e n . Sie v e r m u t e n eher einen E f f e k t der L e i s t u n g e n d e r Schüler a u f die L e h r e r e r w a r t u n g e n als u m g e kehrt ( s . T a b . 2 ; vgl. WILLIAMS, 1975). Die H y p o t h e s e n v o n SUTHERLAND & GOLDSCHMID ( 1 9 7 4 )
w u r d e n nicht d u r c h g ä n g i g b e s t ä t i g t . Sie f a n d e n keine lineare B e z i e h u n g zwischen d e n E r w a r t u n gen v o n L e h r e r n bezüglich des schulischen P o tentials von K i n d e r n u n d Z u w ä c h s e n bei den Int e l l i g e n z q u o t i e n t e n von 109 S c h ü l e r n . Bezüglich d e r D i s k r e p a n z zwischen intellektuellem N i v e a u der Kinder u n d d e r L e h r e r w a h r n e h m u n g dieses N i v e a u s e r g a b sich n u r ein E f f e k t , w e n n bei Kind e r n mit h o h e m I Q die L e h r e r e i n s c h ä t z u n g n e g a tiv d a v o n a b w i c h . D a s P r ä - / P o s t t e s t - I n t e r v a l l b e t r u g e t w a 5 M o n a t e . DUMKE (1978) v e r s u c h t e d u r c h intensive E r w a r t u n g s w e c k u n g bei sieben G r u n d s c h u l l e h r e r i n n e n die Intelligenzleistungen von S c h u l a n f ä n g e r n im Verlauf d e s 1. S c h u l j a h res zu b e e i n f l u s s e n . Diesem Ziel d i e n t e n a n die L e h r e r gestellte A u f g a b e n , die die v e r m e h r t e Bea c h t u n g u n d Z u w e n d u n g der L e h r e r 10 K i n d e r n g e g e n ü b e r e r f o r d e r t e n (5 in der E x p e r i m e n t a l g r u p p e , 5 in d e r H a w t h o r n e - G r u p p e ) . E r h ö h t e I Q - A n g a b e n w u r d e n n u r f ü r die e r s t e G r u p p e geg e b e n . Ein s i g n i f i k a n t e r « E r w a r t u n g s v o r t e i l » der E x p e r i m e n t a l g r u p p e ( R o h w e r t z u n a h m e im Bildertest 1 - 2 ) g e g e n ü b e r der K o n t r o l l g r u p p e konnte nachgewiesen werden, gegenüber der « H a w t h o r n e - G r u p p e » b e s t a n d n u r eine t e n d e n zielle Ü b e r l e g e n h e i t . W i r h ä t t e n u n s a u c h bei dieser U n t e r s u c h u n g eine B e r e c h n u n g der E f f e k t stärken gewünscht. D o c h a u c h , w e n n m a n der S c h l u ß f o l g e r u n g DUMKES f o l g t , « d a ß d a s von ROSENTHAL bes c h r i e b e n e P h ä n o m e n e n d e r sich selbsterfülleriden P r o p h e z e i u n g z u m i n d e s t u n t e r b e s t i m m t e n V o r a u s s e t z u n g e n a u c h im intellektuellen Bereich w i r k s a m w e r d e n k a n n » bleibt die F r a g e , wie dieser E f f e k t z u s t a n d e k o m m t b z w . w e l c h e P r o z e s s e ihn v e r m i t t e l n . E i n Schritt z u r B e a n t w o r t u n g dieser F r a g e k ö n n t e in der U n t e r s u c h u n g des E i n -
11
Zeitschrift für Sozialpsychologie 1981,12,1-23
flusses von Erwartungsäußerungen liegen: MEI-
Hypothesen über eventuelle vermittelnde Fakto-
CHENBAUM & SMART ( 1 9 7 1 ) v e r s u c h t e n d u r c h p o -
r e n s e h e n MEICHENBAUM & SMART in d e n T h e o -
sitive Erwartungsäußerung nach einen Test (hohe Wahrscheinlichkeit akademischen Erfolges) bei 12 (von 24) Ingenieurstudenten bei mittleren Leistungen Auswirkungen auf deren Kursleistungen, Einstellungen und Erwartungen festzustellen. Ergebnisse: Die Studenten zeigten größeres Selbstvertrauen, höhere Erwartungen bezüglich des akademischen Erfolges, größeres Interesse, hielten den Kursstoff für relevanter und verbesserten ihre Leistungen in einem von vier Kursen signifikant.
rien des Anspruchsniveaus, der kognitiven Dissonanz und der Selbstattribution. ENTWISLE et al. (1972) konnten keinen signifikanten Effekt des Treatments (schriftlicher Ausdruck positiver Erwartungen eines Schuldirektors an eine Zufallsstichprobe aus 442 Grundschülern nach einem Test) auf die Leistungen dieser Schüler bei der Testwiederholung nachweisen. Die Autoren vermuten - ähnlich wie FINN (1972) - , daß ein Einfluß der Erwartungen anderer vorliegen könne und weisen auf Unterschiede bei den Personen hin, deren Erwartungen geändert werden sollen (Tab.2).
Wegen der kleinen, besonderen Stichprobe können dieErgebnisse jedoch nicht ohne weiteres z.B. auf die Schulsituation übertragen werden.
Tab. 2: Lehrererwartungen als unabhängige Variablen - Schülerverhalten als abhängige Variablen. Untersuchung (Autoren, Jahr)
BABAD
1977
U n a b h ä n g i g e Variablen
A b h ä n g i g e Variablen
- manipulierte Informationen ü b e r d a s L e r n p o t e n t i a l - I Q von K i n d e r n Schulleistungen - Lernpotential der Kinder Lehrerbeurteilungen hinsichtlich sozialer u n d Leistungsvariablen.
Stichprobe
58 e r z i e h u n g s schwierige, geistig retardierte Kinder 8 Lehrer
Ergebnisse
Kein E i n f l u ß v o n L e h r e r e r w a r t u n g e n auf IQ Einfluß des Leistungspotentials auf I Q - G e w i n n e ; d . h . bei h ö h e r e m Leistungspotential höhere IQ-Gewinne, I n t e r a k t i o n zwischen L e h r e r b e u r t e i lungen und Leistungstestwerten, (nicht s i g n i f i k a n t ü b e r alle) Selbstkritik. Die A u t o r i n ist nicht sicher, o b eine R e p l i k a t i o n gleiche E r g e b n i s s e b r i n g e n w ü r d e ; sie v e r m u t e t d e n E i n f l u ß v o n Vermittler-Variablen wie z. B. d a s intellektuelle P o t e n t i a l der Schüler o d e r die L e h r e r - S c h ü l e r - I n t e r a k t i o n
DUSEK & O ' C O N -
NELL1973 (Längsschnittstudie über 3 Meßzeitpunkte)
- natürliche Lehrererwart u n g e n bzgl. s p r a c h l i c h e r u n d rechnerischer Fähigkeiten a m E n d e d e s Schuljahres -
ENTWISLE et a l .
1972
Leistungstestwerte
64 Schüler u n d 4 Lehrer (2. u n d 4. Klassen)
Leistungen bei Test Wiederholung
442 Schüler
Erwartungsinduktion d u r c h falsche I n f o r m a t i o nen ü b e r F o r t s c h r i t t e bei bestimmten Schülern.
schriftlicher A u s d r u c k positiver E r w a r t u n g e n eines m ä n n l i c h e n Schuld i r e k t o r s an Schüler n a c h einem Rechentest
- kein s i g n i f i k a n t e r E f f e k t d u r c h die versuchte Erwartungsmanipulation der L e h r e r a u f L e i s t u n g s t e s t w e r t e , - s t a r k e E f f e k t e der e r w a r t e t e n R a n g o r d n u n g der Schüler auf dieTestwerte, - n a c h M e i n u n g d e r A u t o r e n liegt hier e h e r ein E f f e k t der L e i s t u n g e n der S c h ü l e r a u f die L e h r e r e r w a r t u n g e n vor als u m g e k e h r t ; d e r E f f e k t d e r e r w a r t e ten L e i s t u n g e n scheint i h n e n eher die Fähigkeit der L e h r e r zu r e f l e k t i e r e n , d a s L e i s t u n g s p o t e n t i a l ihrer Schüler genau einzuschätzen. kein s i g n i f i k a n t e r E f f e k t des T r e a t m e n t s a u f T e s t w e r t e im 2 . T e s t .
12
Berka & Westhoff: Lehrererwartungen und Schülerverhalten
Tabelle 2 (Fortsetzung) Untersuchung
U n a b h ä n g i g e Variablen
A b h ä n g i g e Variablen
Stichprobe
Ergebnisse
859 Schüler
- keine signifikanten E f f e k t e von l n f o r -
(Autoren, Jahr) I n f o r m a t i o n e n Uber FLEMING &
Intelligenz der S c h ü l e r
ANITONEN
SÖS
1971a)
Lehrereinstellungen zu
IQ
29 Lehrer
m a t i o n e n der L e h r e r über Intelligenz ihrer S c h ü l e r a u f die Intelligenztest-
Test verfahren
leistungen, - signifikante E f f e k t e der Lehrereinstellungen g e g e n ü b e r standardisierten Testverfahren, - signifikanter E f f e k t des S Ö S a u f Intelligenztestleistungen, - Interaktionseffekt SÖS/Lehrereinstellung zu T e s t v e r f a h r e n , Selbstkritik: U n g l e i c h m ä ß i g e Verteilung der L e h r e reinstellungen, zu kleine L e h r e r s t i c h probe.
I n f o r m a t i o n e n Uber FLEMING &
- Intelligenz der S c h u l e r ,
ANITONEN
- Einstellung der L e h r e r
1971b)
gegenüber Testverfahren.
-standardisierte Schulleistungs-Test -
Selbstkonzept
-
Noten
859 Schüler 29 Lehrer
- keine signifikanten A u s w i r k u n g e n der Intelligenz-Informationen a u f rechnerische L e i s t u n g e n , S e l b s t k o n z e p t und Noten, - j e d o c h U n t e r s c h i e d e hinsichtlich Schulleistungen d u r c h verschiedene Lehrereinstellungen zu den Testverf a h r e n ; L e h r e r mit h o h e r M e i n u n g von Intelligenztests scheinen h ö h e r e Leistungen ihrer S c h ü l e r bei den Intelligenztests zu e r r e i c h e n . K o m m e n t a r : L e h r e r u n t e r s c h i e d e wichtig, U n t e r s c h e i d u n g , o b E r w a r t u n g e n induziert wurden o d e r n i c h t , wesentlich.
GOZALI & MEYEN
2 0 % der S c h ü l e r wurde
162 erziehungs-
Keine L e h r e r e r w a r t u n g s e f f e k t e
1970
« v e r s t e c k t e s , geistiges
schwierige K i n d e r ,
bezüglich der S c h u l l e i s t u n g e n .
P o t e n t i a l » zugeschrieben.
16 L e h r e r
O'CONNELL et al.
- natürliche L e h r e r e r w a r -
1974
tungen bzgl. s p r a c h l i c h e r und rechnerischer Fähig-
-
-
Schulleistungen
Leistungstestwerte
6 4 S c h ü l e r und 4 Lehrer ( 2 . und 4 . Klassen)
keiten a m E n d e des S c h u l -
versuchte E r w a r t u n g s m a n i p u l a t i o n der L e h r e r a u f Leistungstestwerte, - starke E f f e k t e der erwarteten R a n g -
jahres -
- kein signifikanter E f f e k t durch die
o r d n u n g der S c h ü l e r a u f die T e s t w e r t e ,
Erwartungsinduktion
- nach M e i n u n g der A u t o r e n liegt hier
durch falsche I n f o r m a t i o -
eher ein E f f e k t der Leistungen der
nen über F o r t s c h r i t t e bei
S c h ü l e r a u f die L e h r e r e r w a r t u n g e n vor
bestimmten S c h ü l e r n .
als u m g e k e h r t ; der E f f e k t der erwarteten Leistungen scheint ihnen eher die Fähigkeit der L e h r e r zu r e f l e k t i e r e n , das L e i s t u n g s p o t e n t i a l ihrer S c h ü l e r genau e i n z u s c h ä t z e n .
SUTHERLAND SL
Leistungsbeurteilungen
GOLDSCHMID
( = natürliche E r w a r t u n -
1974
gen?) - IQ
109 Schüler 6 Lehrer
- H y p o t h e s e : E r w a r t u n g s e f f e k t e bei D i s k r e p a n z zwischen Intelligenz und W a h r n e h m u n g dieses Niveaus. Resultate uneinheitlich: - keine lineare B e z i e h u n g zwischen E r wartungen und I Q - V e r ä n d e r u n g e n - signifikante B e z i e h u n g bei negativ a b weichenden L e h r e r e r w a r t u n g e n und I Q - V e r ä n d e r u n g e n bei Kindern mit hohem IQ. Kritik: Keine theoretische Herleitung, keine E f f e k t s t ä r k e n berechnet, zu kleine S t i c h p r o b e .
13
Zeitschrift für Sozialpsychologie 1981,12,1-23
4.2
Untersuchungen der Wirkungen von Lehrererwartungen auf die Lehrer-Schiiler-Interaktion
Unter diesem Punkt sind Arbeiten zu besprechen, die sich um die Erhellung des Prozesses der Erwartungsvermittlung bemühen, d . h . um die
Beantwortung der Frage, ob, und wenn j a , wie Erwartungen des Lehrers in seinem Interaktionsverhalten dem Schüler gegenüber zum Ausdruck gebracht werden. Betrachtet man die vorliegenden Untersuchungen, ergibt sich ein uneinheitliches Bild, Dazu einige Beispiele (Tab.3).
Tab.3: Lehrererwartungen als unabhängige Variablen - Schülerleistung und Interaktionsverhalten von Lehrern und Schülern als abhängige Variablen. Untersuchung
Unabhängige Variablen
Abhängige Variablen
Stichprobe
Ergebnisse
- nicht verbales L e h r e r verhalten
15 L e h r e r 13 Klassen
- k e i n e s i g n i f i k a n t e n U n t e r s c h i e d e in der Behandlung «guter/schlechter» Leser.
(Autoren, Jahr) Informationen über: Schulerfähigkeiten (= E r w a r t u n g e n ? )
ALPERT
1974
BEEZ
1968 (zitiert n a c h BROPHY & G O O D
1976, p . 8 2 f f . )
- Interaktionsbeobachtung 30 Tutoren, - falsche I n f o r m a t i o n e n (Lehrerverhalten) ü b e r intellektuelles N i v e a u 30 K i n d e r - Einstufungen der Kinder hinsichtlich L e i s t u n g s n i v e a u , sozialer u n d intels t u n g s n i v e a u , sozialer u n d intellektueller F ä h i g k e i t e n -
Lernleistung
- T u t o r e n mit h o h e n E r w a r t u n g e n vers u c h t e n d e n K i n d e r n m e h r W o r t e beiz u b r i n g e n ( m e h r Zeil a u f U n t e r r i c h tung verwendet) - h ö h e r e E i n s t u f u n g e n h i n s i c h t l i c h Leis t u n g s n i v e a u , sozialer u n d intellektueller F ä h i g k e i t e n bei T u t o r e n mit hohen Erwartungen - h ö h e r e L e r n l e i s t u n g d e r K i n d e r (Origin a l a r b e i t lag leider nicht v o r , so d a ß Auswertungsergebnisse nicht geprüft werden konnten).
BROPHY & G O O D
1970
- natürliche Erwartungen ( L e h r e r sollten S c h ü l e r in eine Leistungsreihenfolge bringen)
- Vielzahl v o n Intera k t i o n s m a ß e n zwischen Lehrern und einzelnen Schülern.
4 Lehrer und jeweils 3 gute/ 3 schlechte Schüler
- E r g e b n i s s e b e z i e h e n sich e h e r a u f S c h u l e r f ä h i g k e i t e n - wie sie v o m L e h rer gesehen w u r d e n - u n d i h r e A u s w i r k u n g e n a u f die I n t e r a k t i o n (= Erwartungen?) - es zeigen sich S c h ü l e r - / L e h r e r - / K l a s senunterschiede, - g u t e S c h ü l e r e r h a l t e n m e h r L o b , initiieren m e h r I n t e r a k t i o n mit d e n L e h rern.
BROWN
1970 (zitiert n a c h BROPHY & G O O D
- falsche I n f o r m a t i o n e n über Fähigkeiten ( h o h e / niedrige Erwartungsinduktion)
- Lernleislungen und Interaktion
- Information über K i n d e r (3 S t u f e n : intelligent, k e i n e A n g a b e , unbegabt)
- nicht verbales Lehrerverhalten
10 P r a k t i k a n t e n , 80 E r s t k l ä s s l e r
- b e z ü g l i c h L e r n l e i s t u n g e n : kein signifikanter Unterschied - I n t e r a k t i o n : L e h r e r p r a k t i k a n t e n mit h o h e n E r w a r t u n g e n v e r s u c h t e n , Kindern mehr Worte beizubringen.
1976 p . 82 f f .
(= Einfluß auf Lehrerverhalten). CHAIKIN et a l .
1974
42 Studenten
- s i g n i f i k a n t e U n t e r s c h i e d e im n i c h t verbalen Verhalten der Versuchspers o n e n mit « b e g a b t e n » / « u n b e g a b t e n » Schülern - mehr direkter A u g e n k o n t a k t - mehr Nach-vorne-Lehnen - m e h r Kopfnicken der Versuchsperson e n mit « b e g a b t e n » S c h ü l e r n als K o n troll-Tutoren und solchen, die glaubt e n , ihre S c h ü l e r seien u n b e g a b t .
CLAIBORN
1969 (Vor-, Nachtest)
-
Erwartungsinduktion ( 2 0 % d e r S c h ü l e r als intellektuelle A u f b l ü h e r bezeichnet)
-
IQ-Gewinne
-
Lehrer-SchülerInteraktion
12 L e h r e r 246 Schüler
- Keine signifikanten IQ-Gewinne, keine signifikante Interaktionsveränderung.
14
Berka & Westhoff: Lehrererwartungen und Schülerverhalten
Tabelle 3 (Fortsetzung) Untersuchung
U n a b h ä n g i g e Variablen
Abhängige Variablen
Stichprobe
- starke Erwartungsweckung
-
7 Lehrer 84 Schüler (Schulanfänger)
Ergebnisse
(Autoren, Jahr) DUMKE
1978
Intelligenztest
- Geschlecht - hoher/niedriger IQ
JOSÉ & CODY
1971
RESTER SL LETCHWORTH
1972 (zitiert n a c h
- R o h w e r t z u n a h m e in d e n Intelligenztests; bei S c h ü l e r n mit n i e d r i g e m I Q größerer Anstieg, - Lehrer m a ß e n Intelligenztestwerten a n f ä n g l i c h g r o ß e B e d e u t u n g bei ( d . h . eventuell: E r w a r t u n g s i n d u k t i o n gelungen).
- falsche I n f o r m a t i o n e n Uber i n t e l l e k t u e l l e Entwicklung
-
IQ Schulleistungen/ Bewertungen - Lehrer-SchülerInteraktion
144 S c h ü l e r 18 L e h r e r
- k e i n e s i g n i f i k a n t e n U n t e r s c h i e d e bei IQ, Leistungen, Noten, Schülerverhalten oder Lehrerverhalten.
- falsche I n f o r m a t i o n e n über intellektuelle Fähigkeiten
- Interaktionsbeobachtung - L e i s t u n g s - , Intelligenz-, Einstellungstests,
23 L e h r e r , 150 S c h ü l e r
- L e h r e r s p r a c h e n h ä u f i g e r mit d e n als « g e s c h e i t » b e z e i c h n e t e n S c h ü l e r n , vers u c h t e n sie m e h r zu f ö r d e r n , i n s b e sondere d a n n , wenn Schüler reziprok r e a g i e r t e n , d . h . selbst K o n t a k t e mit d e m L e h r e r in G a n g s e t z t e n ,
BROPHY & G O O D
1976 p . 8 2 f f . )
- bezüglich d e r P r o d u k t d a t e n kein signifikanter Unterschied. MEICHENBAUM et a l . - I n f o r m a t i o n : Ein Teil
1969
d e r K i n d e r ist « S p ä t entwickler»
- Leistungstests - V e r h a l t e n in d e r Klasse -
Noten Lehrer-SchülerInteraktion
4 Lehrer 14 d e l i n q u e n t e Mädchen.
- V e r b e s s e r u n g e n in d e n L e i s t u n g s t e s t s , - a n g e m e s s e n e r e s V e r h a l t e n in d e r Klasse, - keine besseren N o t e n , - d i f f é r e n t i e l l e E r g e b n i s s e f ü r verschied e n e L e h r e r : einige e r h ö h t e n p o s i t i v e Interaktion, während andere negative Interaktionen verminderten. - S c h ü l e r v e r ä n d e r u n g e n n u r bei 6 d e r 14 Mädchen.
MENDELS & FLANDERS
1973
PANDA & GUSKIN
1970
- (falsche) I n f o r m a t i o n e n Uber K i n d e r hinsichtlich « v e r s t e c k t e n geistigen Potentials»
- IQ - Lese/Rechennoten - soziale G e s c h i c k l i c h k e i t - Leseniveau
120 e r z i e h u n g s schwierige Kinder, 10 L e h r e r .
- keine signifikanten Unterschiede der «intellektuellen A u f b l ü h e r » hinsichtlich d e r a b h ä n g i g e n V a r i a b l e n .
- teilweise R e p l i k a t i o n d e r BEEZ-Untersuchung
-
retardierte
- T u t o r e n , d i e bessere L e i s t u n g e n erwarten sollten, konnten den Kindern nicht m e h r W o r t e b e i b r i n g e n als diej e n i g e n , d e n e n eine s c h l e c h t e E r w a r tung induziert wurde.
Lernleistung
Kinder
(zitiert n a c h BROPHY & GOOD
1976 p . 8 2 f f . )
ROSENTHAL & JACOBSON
I n f o r m a t i o n an L e h r e r : - 2 0 % d e r S c h ü l e r sind «intellektuelle A u f b l ü h e r »
IQ
-
1968 ROTBART et a l .
1971
- I n f o r m a t i o n e n ü b e r einen Teil d e r S c h ü l e r , d e r als «klug» beschrieben wurde.
-
Interaktionsbeobachtung von Lehrern und Schülern Lehrerbeurteilungen
13 L e h r e r studenten, 52 S c h ü l e r
- signifikant größere IQ-Steigerungen (vgl. Kritik bei ELASHOFF & SNOW, 1971) bei d e n A u f b l ü h e r n . - Vorteile d e r als k l u g b e z e i c h n e t e n Schüler: - mehr Beachtung - Lehrerbeurteilungen: intelligenter, mehr Schulerfolg zugeschrieben - ä u ß e r n sich m e h r - h i n s i c h t l i c h d e r V e r s t ä r k u n g : kein U n terschied.
15
Zeitschrift für S o z i a l p s y c h o l o g i e 1 9 8 1 , 1 2 , 1 - 2 3
Tabelle 3 (Fortsetzung) Untersuchung
U n a b h ä n g i g e Variablen
Abhängige Variablen
Stichprobe
Ergebnisse
- verschiedene quanti-
26 S t u d e n t e n
- Erwartungen scheinen Interaktionsq u a l i t ä t zu b e e i n f l u s s e n u n d z w a r :
(Autoren, Jahr) RUBOVITS &
S c h ü l e r w u r d e n als
MAEHR
b e g a b t vs. nicht b e g a b t
tative und qualitative
als L e h r e r
1971
beschrieben.
Interaktionsmaße
104 S c h ü l e r
- L o b h ä u f i g k e i t ( m e h r bei « b e g a b t e n » Schülern - F o r d e r u n g e n d e s L e h r e r s ( m e h r verlangte Äußerungen) - kein s i g n i f i k a n t e r E i n f l u ß w u r d e festgestellt h i n s i c h t l i c h : - des U m f a n g s a n L e h r e r a u f m e r k s a m keit, d e r E r m u t i g u n g , I g n o r i e r u n g , Kritik, der A u s a r b e i t u n g von Schülerb e i t r ä g e n s o w i e hinsichtlich d e r D o g matismusvariable.
SOULE
1972
- experimentell induzierte Lehrererwartungen (optimistische psychologische Berichte)
4.2.1 Naturalistische
-
Intelligenztests Vokabeltest
- Reifetest -
Interaktionsbeobachtung
Untersuchungen
Während ALPERT (1974) bei 15 Lehrern keine signifikanten Unterschiede in ihrem nicht-verbalen Verhalten gegenüber Schülern mit guten oder schlechten Leseleistungen feststellen konnte, ber i c h t e n BROPHY & GOOD ( 1 9 7 0 ) v o n U n t e r s c h i e -
den zwischen Lehrern, Klassen und Schülern hinsichtlich ihres Interaktionsverhaltens. So erhielten beispielsweise gute Schüler einerseits mehr Lob, andererseits schienen sie auch mehr Interaktion mit dem Lehrer zu initiieren als die niedriger eingestuften Schüler; beobachtet wurden hier die dyadischen Kontakte zwischen vier Lehrern und jeweils sechs Schülern, die nach Ansicht der Lehrer entweder gute oder schlechte Leistungen brachten. Auf beide Untersuchungen bezieht sich unsere Überlegung, ob hier von natürlichen Erwartungen ausgegangen wurde oder - wie wir meinen von vom Lehrer perzipierten Schülercharakteristika, so daß das beobachtete Interaktionsverhalten der Lehrer mehr auf objektive bzw. subjektiv erlebte Schülerverhaltensdifferenzen zurückzuführen ist. BROPHY & GOOD ( 1 9 7 4 , d e u t s c h 1976) b e r i c h -
ten von drei Replikationsversuchen (EVERTSON et al., 1972,
1973 u n d
BROPHY et al., 1 9 7 3 ) , d i e
die
oben geschilderten Ergebnisse der Autoren (1970) im allgemeinen nicht bestätigen konnten. Die Beobachtung, daß jedoch jeweils eine Minderheit der Lehrer gute Schüler bevorzugte und
24 8 - 1 6 j ä h r i g e schwer zurückgebliebene Kinder
- keine E f f e k t e der Lehrererwartungen auf Testleistungen, Interaktionen usw. K r i t i k : Kleine S t i c h p r o b e
schlechtere Schüler unangemessen unterrichtete, weist nach BROPHY und GOOD (1976, p.158) darauf hin, daß individuelle Unterschiede hinsichtlich der Empfänglichkeit der Lehrer für die Auswirkungen von Lehrererwartungen bestehen. Als implizite Hypothese steckt u . E . in dieser Interpretation die Gleichsetzung der Erwartungswirkung mit der Wirkung wahrgenommener Leistungsdifferenzen. Als weiteren Beleg verweisen die Autoren auf eine Studie von GARNER & BING (1973), die nach ihrer Ansicht eine auffallende Variabilität zwischen den untersuchten Lehrern ergab. Damit modifizieren BROPHY & GOOD ihre 1970 geäußerte A n n a h m e von der generellen Gültigkeit der Auswirkungen von Lehrererwartungen auf Lehrer und Schüler und postulieren nun (1974/1976) gemäß den eben angeführten Überlegungen drei verschiedene Lehrertypen: proaktive, passive und überreaktive, die sich hinsichtlich ihrer Empfänglichkeit für Erwartungseffekt e u n t e r s c h e i d e n s o l l e n . SCHWARZER & LANGE
(1979) konnten mit Hilfe der KFA die beiden Extremtypen «proaktiver» und «Überreaktiver» Lehrer identifizieren, die sich hinsichtlich verschiedener Merkmale, u . a . bezüglich der Erwartungshaltung (kurzfristig, flexibel vs. langfristig, starr) unterschieden.
16 4.2.2 Untersuchungen mit experimentell induzierten Erwartungen Bei den im folgenden zu besprechenden Studien fungierte das Interaktionsverhalten von Lehrern und Schülern oft in Kombination mit Produktmaßen (IQ, Lernleistung, Beurteilung der Lehrer) als abhängige Variable. Wiederum sind die Ergebnisse durchaus nicht einheitlich: CHAIKIN et al. ( 1 9 7 4 ) berichten über signifikante Unterschiede im nicht-verbalen Verhalten der Versuchspersonen bei «schwachen» und «guten» Schülern: Im Vergleich zu Kontroll-Tutoren und solchen, die glaubten, ihre Schüler seien unbegabt, zeigten die Verschspersonen mit «hellen» Schülern mehr direkten Augenkontakt sowie häufigeres Kopfnicken und Nach-vorne-Lehnen. In einer von ROTHBART et al. (1971) durchgeführten Untersuchung (13 Lehrerstudenten, 52 Schüler) wurden als klug bezeichnete Schüler von ihren Lehrern mehr beachtet und günstiger beurteilt; im Verstärkerverhalten der Lehrerstudenten zeigte sich kein Unterschied. Außerdem äußerten sich die als klug bezeichneten Schüler häufiger im Unterricht als die restlichen. Etwas anders fielen die Ergebnisse bei RUBOVITS & MAEHR ( 1 9 7 1 ) aus; sie stellten mehr Lob der Lehrer bei den als begabt geschilderten Schülern fest; ebenso verlangten die Lehrer mehr Äußerungen von diesen Schülern. Keinen signifikanten Einfluß der induzierten Erwartungen konnten die Autoren auf den Umfang der Lehreraufmerksamkeit, der Ermutigung, Ignorierung oder Kritik sowie des Weiterführens von Schülerbeiträgen feststellen. Hierbei war die Ausprägung von «Dogmatismus» bei den Lehrern ohne Bedeutung. Keine signifikanten IQ-Gewinne, keine Unterschiede hinsichtlich des Interaktionsverhalten von Lehrern und Schülern sowie hinsichtlich der Leistungen der Schüler und deren Bewertung ergaben die Studien von CLAIBORN ( 1 9 6 9 ) und JOSÉ & CODY ( 1 9 7 1 ) . DUMKE (1977) weist jedoch auf «Schwächen» der beiden letztgenannten Untersuchungen hin, die den Zeitpunkt der Erwartungsweckung (2. Schuljahreshälfte), die schwache Intensität und kurze Dauer der Erwartungsweckung betreffen. Insofern sind negative Ergebnisse für ihn nicht verwunderlich. Die von DUMKE genannten Kritikpunkte deuten auf die Möglichkeit hin, daß die
Berka & W e s t h o f f : L e h r e r e r w a r t u n g e n und Schülerverhalten
intendierte Erwartungsinduktion nicht erfolgreich war; dabei mögen auch interindividuelle Unterschiede bei Lehrern und bei Schülern eine Rolle spielen (vgl. dazu BROPHY & G O O D , 1976, p.7ff.). Dieselben Autoren zitieren weitere Untersuchungen mit Produkt- und Prozeßdaten (1976, p.82ff.) mit zum Teil unterschiedlichen Ergebnissen: So konnte BEEZ (1968) durch falsche Informationen über das intellektuelle Niveau von 30 Kindern bei 30 Tutoren in einem zehnminütigen Experiment signifikante Effekte hinsichtlich des Interaktionsverhaltens der «Lehrer» (Tutoren mit hohen Erwartungen versuchten den Kindern mehr Worte beizubringen), bezüglich ihrer Einstufungen der Kinder (höhere Einschätzung bezüglich Leistungsniveau, sozialen und intellektuellen Fähigkeiten) sowie hinsichtlich der Lernleistung der Kinder feststellen. Folgeuntersuchungen ( P A N D A & GUSKIN, 1 9 7 0 ; B R O W N , 1 9 7 0 ; KESTER &
LETCHWORTH,
1972) zeigten nach BROPHY & G O O D keine signifikanten Unterschiede hinsichtlich der Lernleistung der Kinder, jedoch hinsichtlich des Lehrerverhaltens: Lehrer sprachen häufiger mit den als «gescheit» bezeichneten Schülern, sie versuchten ihnen mehr Wörter beizubringen, insbesondere dann, wenn die Schüler reziprok reagierten. MEICHENBAUM et al. (1969) wiesen durch Induktion von «Spätentwickler»-Erwartungen bei vier Lehrern Verbesserungen in Leistungstests und beim Verhalten in der Klasse von delinquenten Mädchen (6 von 14) nach. Einige Lehrer erhöhten die Anzahl «positiver» Interaktionen, d.h. drückten häufiger Ermutigung, Lob oder Zufriedenheit gegenüber den Schülern aus, andere verminderten die Anzahl negativer Interaktionen, d.h. reduzierten den Ausdruck von Lob und Tadel, Kritik oder Unzufriedenheit: bessere Noten wurden nicht gegeben. Während für die letzte Untersuchung eine sehr kleine, spezielle Stichprobe eine Generalisierung der Befunde ausschließt, kann als Mangel aller in diesem Kapitel aufgeführten Studien die fehlende Berechnung der Effektstärke (falls überhaupt signifikante Ergebnisse vorlagen) genannt werden. Eine zusammenfassende Bewertung der eben kurz skizzierten Studien fällt schwer; unter bestimmten Bedingungen scheint die Induktion einer Erwartung zu unterschiedlichem Interaktionsverhalten führen zu können. Eine ebenso
17
Zeitschrift für Sozialpsychologie 1981,12,1-23
simple wie wichtige Voraussetzung scheint zu sein, d a ß tatsächlich E r w a r t u n g e n beim Lehrer induziert w u r d e n ! Schwächen der experimentellen M a n i p u l a t i o n , individuelle Unterschiede in der «Anfälligkeit» f ü r solche Erwartungen wie bereits bei den Lehrern bestehende Erwartungen scheinen wichtige intervenierende Variablen f ü r die Etablierung neuer E r w a r t u n g e n gegenüber Schülern und deren E i n f l u ß auf o f f e n e s Lehrerverhalten zu sein.
5.
Neuere Arbeiten zu Lehrererwartungen und Schülerverhalten
In den letzten J a h r e n findet m a n vermehrt Arbeiten zur U n t e r s u c h u n g der Bedeutung von Lehrererwartungen auf Schülerverhalten, die nicht das in diesem T h e m e n k r e i s sonst bevorzugte experimentelle Vorgehen wählen. Einige sehr interessante Ergebnisse aus diesem Bereich wollen wir im folgenden kurz vorstellen.
5.1
Lehrererwartung, Attribution und Lehrerverhalten
RHEINBERG ( 1 9 7 5 ) untersuchte die Bedeutung der von Lehrern w a h r g e n o m m e n e n Stabilität bzw. Steuerbarkeit der Bedingungen schulischer Leistungen. Dabei f a n d er folgende Z u s a m m e n h ä n ge zwischen dem Leistungsniveau, das Lehrer von Schülern erwarteten, und dem Sanktionsverhalten der Lehrer: Je stabiler und unbeeinflußbarer ein Lehrer die Leistungsbedingungen eines Schülers einschätzt (Fähigkeiten, Milieu), desto eindeutiger sind seine E r w a r t u n g e n hinsichtlich der weiteren Leistungsentwicklung des Schülers. Sein Sanktionsverhalten ändert sich in A b h ä n gigkeit d a v o n , wie variabel u n d kontrollierbar er die Leistungsbedingungen (Interesse, Arbeitshaltung) des Schülers beurteilt. O f f e n bleibt dabei allerdings die Frage, o b die g e f u n d e n e n Unterschiede auf bestehende Unterschied zwischen den Schülern z u r ü c k z u f ü h r e n sind oder o b sie A u s d r u c k spezifischer Attributionsgewohnheiten der Lehrer sind.
In seiner Kritik an COOPER & BARON ( 1 9 7 7 ) , die die E r w a r t u n g e n von Lehrern bezüglich der Leistungen von Schülern als bessere P r ä d i k t o r e n des Verstärkungsverhaltens der Lehrer ansahen
als deren Kausalattribuierungen, weist M E Y E R (1979) auf deutliche Beziehungen zwischen Kausalattributionen von Lehrern und ihrem Verstärkerverhalten hin. D a n a c h werden z.B. Leistungen, die auf g r o ß e A n s t r e n g u n g und geringe Fähigkeitsausprägungen bei Schülern zurückgef ü h r t werden, vom Lehrer mehr gelobt als Ergebnisse, die anders erklärt werden (vgl. auch M E Y E R et al., 1 9 7 8 ; W E I N E R , 1 9 7 7 ) . A u c h in den A n s ä t z e n v o n H E C K H A U S E N ( 1 9 7 4 ) u n d HOFER e t a l .
(1979) spielen Kausalattributionen von Lehrern bei der E r w a r t u n g von Schülerleistungen eine wichtige Rolle. Wir wollen hier jedoch aus R a u m g r ü n d e n nicht näher d a r a u f eingehen.
5.2
Quasi-experimentelle Studien
verwendete zur Analyse der Daten von 6000 kanadischen High School-Schülern ein Kausalmodell u n d p r ü f t e die als reziprok postulierten Einflüsse zwischen Lehrererwartungen und Schülerehrgeiz an Längsschnittdaten. Er interpretiert die Ergebnisse dahingehend, d a ß Lehrer von Schülern um so mehr erwarten, je höher deren eigene A n s p r ü c h e an sich selbst sind. In dieser Hinsicht beeinflussen die Schüler die Erwartungen der Lehrer mehr, als die Lehrererwartungen von Bedeutung sind f ü r die A n s p r ü c h e der Schüler an ihre Leistungen. In einer weiteren Studie untersuchte WILLIAMS ( 1 9 7 6 ) a n h a n d der Daten von 10 500 High School-Schülern die Quellen von L e h r e r e r w a r t u n g e n . Nach den Ergebnissen basieren die Lehrererwartungen mehr auf den Leistungen der Schüler als auf deren sonstigen M e r k m a l e n , die o f t f ü r relevant gehalten werden, wie z.B. der Schichtzugehörigkeit. Darüber hinaus scheinen Lehrererwartungen nicht so sehr das Gelernte, gemessen mit Leistungstests, zu beeinflussen als die Bewertungen der Lernleistungen der Schüler durch die Lehrer. Die Erwartungen der Lehrer an die Schüler in bezug auf Leistung und in bezug auf sozial erwünschtes Verhalten in der Klasse beeinflussen sich gegenseitig, doch scheint dabei das Geschlecht der Schüler M o d e r a t o r f u n k t i o n zu haben. WILLIAMS ( 1 9 7 5 )
Bei der Analyse der Daten einer vier J a h r e d a u e r n d e n Längsschnittstudie an britischen G r u n d s c h u l k i n d e r n verwendeten C R A N O & M E L LON (1978) cross-lagged panel-Analysen. Sie fanden dabei nicht nur einen stärkeren E i n f l u ß der
18
Berka & Westhoff: Lehrererwartungen und Schülerverhalten
Lehrererwartungen auf Schülerleistungen, sondern wiesen insbesondere nach, d a ß die Erwartungen und Bewertungen der sozialen Entwicklung eines Kindes in bezug auf die Schule einen größeren E f f e k t auf spätere Leistungen hatten als Leistungserwartungen. Die A u t o r e n schlußfolgern, d a ß zumindest in den ersten Grundschulklassen die affektive Reaktion eines Lehrers auf ein Kind eine starke W i r k u n g auf dessen Schulleistungen haben k a n n .
6.
Schülererwartungen als Untersuchungsgegenstand
D a die Kongruenz von Lehrer- und Schülererwartungen eine notwendige Bedingung f ü r bestimmte Varianten sich selbst-erfüllender Prophezeiungen in der Schule zu sein scheint, wollen wir uns kurz den Untersuchungen von Schülererwartungen zuwenden. Es fällt a u f , d a ß zu diesem Bereich weit weniger Veröffentlichungen vorliegen. Wie Schüler ihre Lehrer w a h r n e h m e n und beurteilen, welche Erwartungen sie an sie richten,
bzw. Abneigungen bezüglich bestimmter Lehrereigenschaften.
Ergebnisse
von
SEIFERT
(1975)
scheinen diese A u f f a s s u n g zu bestätigen: D a n a c h bestehen Z u s a m m e n h ä n g e zwischen Erwartungsgemäßheit des Lehrerverhaltens in den A u gen der Schüler und ihrem Unterrichtsverhalten, ihrer Leistung und ihrem Interesse. Erwartet werden nach SEIFERT vor allem gerechte Behandlung und Bewertung sowie ein interessanter Unterricht. Aus der Sicht der Schüler besteht hier jedoch eine starke Diskrepanz zur Realität. Als « G r u n d d i m e n s i o n e n » der Schüler-Erwartungen gibt er an: 1. kooperatives, partnerschaftliches Führungsverhalten, 2. interessante, praxisnahe Unterrichtsgestaltung und 3. fachliche und menschliche Autorität bzw. Kompetenz. Ähnliche F a k t o r e n identifizieren ACHTENHAGEN et al. (1979).
Andere Arbeiten beschäftigen sich mit Schülerbeurteilungen über ihre Lehrer in Abhängigkeit von erwarteten und erhaltenen Noten (HOLMES, 1 9 7 2 ; P I C K U P & ANTONY, 1 9 6 8 ; SNYDER &
ist G e g e n s t a n d d e r A r b e i t e n v o n NASH ( 1 9 7 4 ) ,
CLAIR, 1976) sowie dem Versuch der Erwartungsinduktion bei Studenten (MEICHENBAUM & SMART, 1971) und bei Schülern und Lehrern
SEIFERT ( 1 9 7 5 ) u n d ACHTENHAGEN et a l . ( 1 9 7 9 ) .
(ZANNA e t a l . , 1 9 7 5 ; RAPPAPORT & RAPPAPORT,
Weitere Studien zu diesem Komplex referiert
1975). Bei den letztgenannten A u t o r e n f ü h r t e die positive E r w a r t u n g s i n d u k t i o n f ü r alle drei Experimentalbedingungen (Versuch der positiven Erwartungsinduktion bei Schülern, Lehrern sowie Lehrern und Schülern) zu verbesserten Leseleistungen. Dabei stellte sich die kombinierte Erwartungsmanipulation bei Lehrern und Schülern als effektivste Bedingung heraus. Diesen Interaktionseffekt konnten ZANNA et al. (1975) nicht finden. Einen Überblick über die anderen hier relevanten Arbeiten vermittelt Tabelle 4.
GERSTENMAIER ( 1 9 7 5 ) .
NASH (1974) ließ 34 Z w ö l f j ä h r i g e Lehrer beschreiben, mit denen sie zurechtkamen, und solche, mit denen dies nicht der Fall war. Er f a n d sechs bipolare Beurteilungsdimensionen: l . h ä l t O r d n u n g vs. hält keine O r d n u n g , 2. aktivierender vs. nicht aktivierender Unterricht, 3.erklärt vs. erklärt nicht, 4. interessant vs. langweilig, 5. fair vs. unfair, 6. freundlich vs. unfreundlich. Nach A u f f a s s u n g des A u t o r s handelt es sich hierbei nicht um verhaltensirrelevante Vorlieben
Tab.4: Schülererwartungen als unabhängige Variablen. Untersuchung (Autoren, Jahr)
U n a b h ä n g i g e Variablen
A b h ä n g i g e Variablen
Stichprobe
Ergebnisse
Herrell
- I n f o r m a t i o n e n über Lehrer (warm/kalt-Variable)
- Lehrerverhalten
47 S t u d e n t e n
- S t u d e n t e n , die einen « k a l t e n » Lehrer erwarten, « p r o d u z i e r t e n » einen solchen, - Kritik: f e h l e n d e E f f e k t s t ä r k e n s c h ä t zung
1971
19
Zeitschrift für Sozialpsychologie 1 9 8 1 , 1 2 , 1 - 2 3
Tabelle 4 (Fortsetzung) Untersuchung (Autoren, Jahr)
U n a b h ä n g i g e Variablen
A b h ä n g i g e Variablen
HOLMES
- erwartete/erhaltene Noten
- Beurteilungen der Schüler über ihre Lehrer
1972
Stichprobe
Ergebnisse
hinsichtlich d e r erteilten N o t e n k o n n ten k e i n e E i n f l ü s s e d e r B e w e r t u n g e n d e r L e h r e r d u r c h d i e S c h ü l e r festgestellt w e r d e n , wenn die Noten entgegen den Erwartungen der Schüler ausfielen, bestand eine T e n d e n z , d i e U n t e r r i c h t s l e i s t u n g d e s L e h r e r s zu m i ß b i l l i g e n .
M EICHENBAUM & SMART
1971
Erwartungsäußerungen von Beratern (Erwart u n g s i n d u k t i o n bei Studenten)
Leistungen und Einstellungen
24 IngenieurS t u d e n t e n mit
- d i e zwölf S t u d e n t e n , d e n e n eine h o h e Wahrscheinlichkeit akademischen Er-
mittleren Leistungen.
f o l g e s ( a u f g r u n d v o n T e s t d a t e n ) mitgeteilt w u r d e ( « S p ä t e n t w i c k l e r » ) : - v e r b e s s e r t e n i h r e L e i s t u n g e n in 2 ( v o n 4) K u r s e n s i g n i f i k a n t , - zeigten g r ö ß e r e s S e l b s t v e r t r a u e n , h ö here E r w a r t u n g e n bezüglich a k a d e m i s c h e n E r f o l g e s , g r ö ß e r e s Interesse, u n d hielten d e n K u r s s t o f f f ü r relevanter. - Kritik: Kleine, b e s o n d e r e S t i c h p r o b e , - bezüglich d e r L e i s t u n g s t e s t s n u r in 2 v o n 4 K u r s e n s i g n i f i k a n t e Verbesserungen, - keine E f f e k t s t ä r k e n berechnet, - Hypothesen über eventuelle vermitt e l n d e F a k t o r e n s e h e n d i e A u t o r e n in Theorien des Anspruchsniveaus, der kognitiven Dissonanz u n d der Selbstattribution.
NASH
1974
Schülererwartungen an ihre L e h r e r
B e u r t e i l u n g e n , Beschreib u n g e n v o n L e h r e r n , mit d e n e n sie z u r e c h t k a m e n b z w . nicht z u r e c h t k a m e n ,
34 1 2 j ä h r i g e
- gefunden wurden 6 gemeinsame, bipolare Dimensionen: - Ordnung/keine Ordnung - aktivierender Unterricht/de-aktivierender Unterricht - erklärt/erklärt nichts - interessant/langweilig - fair/unfair - freundlich/unfreundlich
PICKUP &
erwartete und tatsäch-
Leistungsverhalten der
ANTHONY
liche N o t e n in einer
Schüler
1968
Arbeit,
253 S c h ü l e r
- Deskriptiv: 7 2 , 6 % überschätzten ihre N o t e n , b e s o n d e r s s o l c h e mit s c h l e c h ten W e r t e n .
Diskrepanzen: Effekte?
- Keine s i g n i f i k a n t e n E f f e k t e v o n E r wartungsdiskrepanzen, - bei s c h l e c h t e r e n S c h ü l e r n w a r e i n e bessere N o t e als d i e e r w a r t e t e e f f e k t i v , d . h . L e i s t u n g s v e r b e s s e r u n g in e i n e m Test.
RAPPAPORT & RAPPAPORT
1975
positive Erwartungsi n d u k t i o n bei S c h ü l e r n und Lehrern,
Leseleistungen
45 s t ä d t i s c h e farbige 5-6jährige S c h u l k i n d e r mit unterdurchschn. Leseleistungen,
signifikant verbesserte Leseleistungen f ü r alle 3 E x p e r i m e n t a l b e d i n g u n g e n kombinierte Erwartungsmanipulation von Lehrern u n d Schülern waren e f f e k t i v e r als d i e alleinige L e h r e r erwartungsmanipulation.
3 weibl. L e h r e r (interessiert, intelligent) SNYDER & CLAIR
erwartete Noten
Bewertungen von Lehrern
1976
erhaltene Noten
Attribution von Leistungen
72 S t u d e n t e n
- j e n i e d r i g e r die e r w a r t e t e N o t e , u n d j e h ö h e r die e r h a l t e n e N o t e , d e s t o g ü n stiger w u r d e n L e h r e r e i n g e s c h ä t z t , - g u t e N o t e n f ü h r t e n die S t u d e n t e n a u f eigene L e i s t u n g e n , s c h l e c h t e a u f E i n flüsse d e s L e h r e r s z u r ü c k .
20
7.
Berka & Westhoff: Lehrererwartungen und Schülerverhallen
Methodische Anmerkungen
Schon bald nach der Veröffentlichung der Ergebn i s s e v o n ROSENTHAL & JACOBSON u n d d e n v o n
ihnen inspirierten Arbeiten wurde eine heftige Methodenkritik geübt und ist sehr gründlich in ELASHOFF & SNOW (1972)
zusammengetragen.
Wir wollen hier nur kurz auf die grundsätzlichen methodischen Aspekte eingehen, die u . E . immer wieder in den empirischen Arbeiten zum Pygmalioneffekt zu wenig oder gar nicht berücksichtigt werden. Im Sinne der A u s f ü h r u n g e n von RUNKEL & MCGRATH (1972, p . 4 2 4 f f . ) fehlt d e n b i s h e r vor-
liegenden empirischen Arbeiten durchweg die B e m ü h u n g um theoretische Eingliederung in eine Taxonomie von Hypothesen. Damit verbunden ist fast immer eine nicht kontinuierliche Arbeit in diesem Forschungsbereich. Beides zusammen f ü h r t zu einem Sammelsurium an empirischen Arbeiten, die wenig A u s s a g e k r a f t haben und ein ungenügendes F u n d a m e n t für weitere Forschungen darstellen. Mit FINN (1972, p. 399) kann m a n der Ansicht sein, d a ß eine Fülle von F a k t o r e n das Verhalten von Schülern beeinflussen, so d a ß es verwunderlich ist, daß ü b e r h a u p t E f f e k t e von Lehrererwartungen bemerkbar waren. In einer solchen Forschungssituation würde man eine sorgfältige Sicherung der Befunde erwarten. Leider gibt es jedoch kaum Arbeiten, die echte Replikationen von anderen darstellen, dabei wären Replikationen der Königsweg zu abgesicherten Ergebnissen, Signifikanztests können sie nur bedingt und o f t gar nicht ersetzen (vgl. GUTTMAN, 1975, p.86 und p.92). Wenn m a n es aber bei Signifikanzprüfungen beläßt, würde man wenigstens Schätzungen der E f f e k t s t ä r k e e r h o f f e n , um einen Eindruck von der «praktischen Bedeutsamkeit» (vgl. BREDENKAMP, 1972) der E r g e b n i s s e zu be-
k o m m e n . Wie unsere Literaturübersicht zeigt, ist dies kaum einmal der Fall. Weiter schlagen wir vor, d a ß Arbeiten zum Pygmalioneffekt es nicht bei den genannten Vorgehensweisen belassen sollten, denn damit ist noch nichts über die Dauer bzw. Stabilität eines E f f e k t e s der Lehrererwartungen auf das Schülerverhalten ausgesagt. Um dies zu erreichen, sind immer wiederholte Messungen der abhängigen Variable erforderlich in Verbindung mit den oben angesprochenen Maß-
n a h m e n , kompliziertere Designs und entsprechend anspruchsvolle Auswertungsmethoden werden d a n n nötig. Weiter oben haben wir E r w a r t u n g als ein hypothetisches Konstrukt bezeichnet und verschiedene Erfassungsmodi f ü r seine unterscheidbaren Facetten vorgeschlagen. Da der Schluß auf das Vorhandensein von Erwartungen (bei Lehrern) a u f g r u n d von Veränderungen in der abhängigen Variablen (Schülerverhalten) nicht immer valide sein m u ß , sehen wir es als erforderlich an, direktere Erfassungsweisen von E r w a r t u n g e n in die Designs mit einzubeziehen und in einer multitrait-multimethod matrix zu berücksichtigen. Dabei könnten d a n n verschiedene Erwartungen und unterscheidbare Facetten einer E r w a r t u n g als multitrait a u f g e f a ß t werden. Zu ergänzen wäre ein solches Design d a n n in bezug auf mehrere Zeitpunkte. Auf diese Weise k ö n n t e man d a n n zu A n t w o r t e n auf die heute noch völlig o f f e n e Frage n a c h d e r G e n e r a l i s i e r b a r k e i t (CRONBACH, RAJARATNAM & GLESER, 1 9 6 3 ) s o g . P y g m a l i o n e f f e k t e
kommen.
Literatur ACHTENHAGEN, F. 1978. Beanspruchung von Schülern: BMBW-Gutachten 9, Bonn. ACHTENHAGEN, F . , SEMBILL, D . , STEINHOFF, E . 1 9 7 9 .
Die
Lehrerpersönlichkeit im Urteil von Schülern. Ein Beitrag zur Aufklärung «naiver» didaktischer Theorien. Zeitschrift für Pädagogik, 25,109-208. A D A M S , G . R . & COHEN, A . S . 1 9 7 6 . A n e x a m i n a t i o n o f c u m u -
lative folder information used by teachers in making differential judgements of children's abilities. The Alberta Journal of Educational Research, 22, 216-222. A D A M S , G . R . & COHEN, A . S . 1 9 7 7 . C h a r a c t e r i s t i c s o f c h i l -
dren and teacher expectency. Journal of Educational Research, 70, 238-241. A D A M S , G . R . & LA VOIE, J . C . 1 9 7 4 . T h e e f f e c t o f s t u d e n t ' s
sex, conduct and facial attractiveness on teacher expectancy. Education, 95, 76-83.
ALPERT, J.C. 1974. Teacher behavior across ability groups: a consideration of the mediation of Pygmalion effects. Journal of Educational Psychology, 66, 348-353. ARCHIBALD, W.P. 1974. Alternative explanations for selffulfilling prophecy. Psychological Bulletin, 81, 74-84. BABAD, E.Y. 1977. Pygmalion in reverse. The Journal of Special Education, 11, 81-90. BARKEY, P. 1971. Self-fulfilling prophecy als Phänomen sozialer Interaktionen der Erziehungsprozesse. Schule und Psychologie, 18, 264-274. BEEZ, W. 1968. Influence of biased psychological reports on teacher behavior and pupil performance. Proceedings of the 76 th Annual Convention of the American Psychological Association, 3, 605-606.
21
Zeitschrift f ü r Sozialpsychologie 1 9 8 1 , 1 2 , 1 - 2 3
BERSCHEID, E . & WALSTER, E . 1 9 6 9 . I n t e r p e r s o n a l a t t r a c t i o n .
R e a d i n g , M a s s a c h u s e t t s : Addison-Wesley. BREDENKAMP, J . 1972. Der Signifikanztest in der psychologischen F o r s c h u n g . F r a n k f u r t : A k a d e m i s c h e Verlagsgesellschaft. BREDENKAMP, J . & FEGER, H . 1 9 7 0 . K r i t e r i e n f ü r d i e E n t -
scheidung über die A u f n a h m e empirischer Arbeiten in die Z e i t s c h r i f t f ü r Sozialpsychologie. Zeitschrift f ü r Sozialpsychologie,
1,43-57.
Intelligenzleistung bei intensiver E r w a r t u n g s w e c k u n g . Psychologie in E r z i e h u n g u n d U n t e r r i c h t , 25, 3 2 - 3 8 . DUSEK, J . B . & O'CONNELL, E . J . 1 9 7 3 . T e a c h e r e x p e c t a n c y
e f f e c t s on t h e achievement test p e r f o r m a n c e of elementary school children. J o u r n a l of E d u c a t i o n a l P s y c h o l o g y , 65, 371-377. ELASHOFF, J . D . & S N O W , R . E . 1 9 7 1 . P y g m a l i o n
reconsider-
ed. W o r t h i n g t o n : J o n e s . D e u t s c h : 1972. P y g m a l i o n auf dem P r ü f s t a n d . M ü n c h e n : Kösel.
1973.
ENTWISLE, D . R . , CORNELL, E . & EPSTEIN, J . 1 9 7 2 . E f f e c t o f a
C o m m u n i c a t i o n of teacher expectations: f i f t h g r a d e Rep o r t N o . 9 3 . Research a n d D e v e l o p m e n t Center f o r Teacher E d u c a t i o n . T h e University of Texas, A u s t i n .
principal's e x p e c t a t i o n s o n test p e r f o r m a n c e of elementary-school children. Psychological R e p o r t s , 31, 551-556.
BROPHY, J . , EVERTSON, L . , H A R R I S , T . & G O O D , T .
BROPHY, J . & G O O D , T . 1 9 7 0 . T e a c h e r s c o m m u n i c a t i o n
of
d i f f e r e n t i a l expectations f o r c h i l d r e n ' s classroom p e r f o r m a n c e : S o m e behavioral d a t a . J o u r n a l of E d u c a t i o n a l Psychology, 61, 365-374. BROPHY, J . E . & G O O D , T . L . 1 9 7 4 / 1 9 7 6 . T e a c h e r - s t u d e n t -
relationships. New-York: H o l t , Rinehart & W i n s t o n . D e u t s c h : Die L e h r e r - S c h ü l e r - I n t e r a k t i o n . M ü n c h e n : U r ban & S c h w a r z e n b e r g . BROWN, W. 1970. T h e i n f l u e n c e of student i n f o r m a t i o n o n the f o r m u l a t i o n of teacher e x p e t a n c y . Dissertation A b stracts, 3 0 , 4 8 2 2 A . BRUNNER, R. 1978. L e h r e r v e r h a l t e n . P a d e r b o r n : S c h ö n i n g h . CAMPBELL, D . T . & FISKE, D . W . 1 9 5 9 . C o n v e r g e n t a n d d i s -
c r i m i n a n t validation by the m u l t i t r a i t - m u l t i m e t h o d m a trix. Psychological Bulletin, 56, 81-105. CASPARIS, C . 1980. Eine theoretische Analyse von « P y g m a l i o n e f f e k t e n » und «sich selbst e r f ü l l e n d e n Voraussagen». Zeitschrift f ü r Sozialpsychologie, 11, 124-128. C H A I K I N , A . L . , SIOLER, E . , DERLEGA, V . J . 1 9 7 4 . N o n v e r b a l
m e d i a t o r s of teacher expectancy e f f e c t s . J o u r n a l of Personality a n d Social P s y c h o l o g y , 3 0 , 1 4 4 - 1 4 9 . CLAIBORN, W . L . 1969. E x p e c t a n c y e f f e c t s in the classroom: A failure to replicate. J o u r n a l of E d u c a t i o n a l Psychology, 60,377-383. COOPER, H . M . 1979. P y g m a l i o n g r o w s up: a model f o r teacher e x p e c t a t i o n , c o m m u n i c a t i o n a n d p e r f o r m a n c e influence. Review of E d u c a t i o n a l Research, 49, 389-410. C O O P E R , H . & BARON, R . 1 9 7 7 . A c a d e m i c e x p e c t a t i o n s a n d
a t t r i b u t e d responsibility as p r e d i c t o r s of professional teachers' r e i n f o r c e m e n t b e h a v i o r . J o u r n a l of E d u c a t i o n a l Psychology, 69, 409-418.
ENTWISLE, D. & WEBSTER, U. 1972. Raising c h i l d r e n ' s p e r f o r m a n c e e x p e c t a t i o n s . Social Science Research, 1 , 1 4 7 - 1 4 8 . EVERTSON, C . , BROPHY, J . & G O O D , T . 1 9 7 2 . C o m m u n i c a t i o n
of teacher expectancies: first g r a d e . R e p o r t N o . 9 1 , Research a n d D e v e l o p m e n t C e n t e r f o r Teacher E d u c a t i o n . T h e University of Texas at A u s t i n . FELDMAN, R . S . & PROHASKA, T . 1 9 7 9 . T h e s t u d e n t a s p y g m a -
lion: E f f e c t of s t u d e n t e x p e c t a t i o n o n the teacher. J o u r n a l of E d u c a t i o n , 71, 4 8 5 - 4 9 3 . FINN, J . D . 1972. E x p e c t a t i o n s a n d the e d u c a t i o n a l environm e n t . Review of E d u c a t i o n a l Research, 42, 387-410. FLEMING, E. & ANTTONEN, R. 1971a. Teacher expectancy or M y Fair L a d y . A m e r i c a n E d u c a t i o n a l Research J o u r n a l , 8,241-252. FLEMING, E . S . & ANTTONEN, R . G . 1971b. Teacher expectancy as related to the a c a d e m i c a n d p e r s o n a l g r o w t h of prim a r y age children. M o n o g r a p h s of the Society f o r Research in Child D e v e l o p m e n t , 36 (5, serial N o . 145). FOSTER, G . & YSSELDYKE, J . 1 9 7 6 . E x p e c t a n c y a n d h a l o e f -
fects as a result of artificially i n d u c e d teacher bias. C o n t e m p o r a r y E d u c a t i o n a l P s y c h o l o g y , 1, 3 7 - 4 5 . FRICKE, R. 1978. Z u s a m m e n h ä n g e zwischen Lehrerverhalten und Schülerleistung. Zeitschrift f ü r Erziehungswissenschaftliche F o r s c h u n g , 12, 8 5 - 9 4 . FRIEDMAN, H . 1968. M a g n i t u d e of e x p e r i m e n t a l effect a n d a table for its rapid e s t i m a t i o n . Psychological Bulletin, 70, 245-251. G A R N E R , J . & BING, M . 1 9 7 3 . T h e e l u s i v e n e s s o f P y g m a l i o n
a n d d i f f e r e n c e s in teacher-pupil c o n t a c t s . I n t e r c h a n g e , 4, 34-42. GERSTENMAIER, J . 1975. Urteile v o n Schülern ü b e r L e h r e r . Weinheim: Beltz.
C O O P E R , H . M . , BARON, R . M . & L O W E , C . A . 1 9 7 5 . T h e i m -
GOZALI, J . & M E Y E N , E . L . 1 9 7 0 . T h e i n f l u e n c e o f t h e t e a c h e r
p o r t a n c e of race a n d social class i n f o r m a t i o n in the f o r m a tion of expectancies a b o u t a c a d e m i c p e r f o r m a n c e . J o u r n a l of E d u c a t i o n a l P s y c h o l o g y , 67, 312-319.
expectancy p h e n o m e n o n o n the a c a d e m i c p e r f o r m a n c e s of educable mentally r e t a r d e d pupils in special classes. J o u r nal of Special E d u c a t i o n , 4, 4 1 7 - 4 2 4 .
C R A N O , W . D . & MELLON, P . M . 1 9 7 8 . C a u s a l i n f l u e n c e o f
GUTTMAN, L. 1975. W h a t is not what in statistics. T h e Statistician, 26, 81-107.
t e a c h e r ' s expectations o n c h i l d r e n ' s a c a d e m i c p e r f o r m a n c e : a cross lagged panel analysis. J o u r n a l of E d u c a tional P s y c h o l o g y , 70, 3 9 - 4 9 . C R O N B A C H , L . J . , RAJARATNAM, N . & GLESER, G . C .
1963.
T h e o r y of generalizibility t h e o r y . British J o u r n a l of Statistical P s y c h o l o g y , 16, 137-163. DEITZ, S . M . & PURKEY, W . W . 1 9 6 9 . T e a c h e r e x p e c t a t i o n o f
p e r f o r m a n c e based on race of s t u d e n t . Psychological Rep o r t s , 24, 694. DUMKE, D. 1977. Die A u s w i r k u n g e n von L e h r e r e r w a r t u n g e n auf Intelligenz- und Schulleistung. Psychologie in Erzieh u n g und U n t e r r i c h t , 24, 9 3 - 1 0 8 . DUMKE, D. 1978. Der E i n f l u ß des R o s e n t h a l - E f f e k t s auf die
HARVEY, D . G . & SLATIN, G . T . 1 9 7 5 . T h e r e l a t i o n s h i p
be-
tween child's S E S a n d teacher expectations: a test of the middle class bias h y p o t h e s i s . Social Forces, 1 , 1 4 0 - 1 5 9 . HECKHAUSEN, H . 1 9 7 4 . L e h r e r - S c h ü l e r - I n t e r a k t i o n . I n : W e i -
nert F. E. et al. (Eds.): F u n k - K o l l e g P ä d a g o g i s c h e Psychologie, 1, 549-573. HECKHAUSEN, H . 1977. A c h i e v e m e n t m o t i v a t i o n a n d its constructs: a cognitive m o d e l . M o t i v a t i o n a n d E m o t i o n , 1, 283-329. HEINTZ, P. 1974. Teacher expectancy f o r a c a d e m i c acheivement of mentally r e t a r d e d pupils. M e n t a l R e t a r d a t i o n , 12, 24-27.
22
Berka & Westhoff: Lehrererwarlungen und Schülerverhallen
HENDERSON, E . H . & LONG, B . H . 1 9 7 3 . A c a d e m i c e x p e c -
tancies of black and white teachers for black and white first graders. Proceedings, 81st Annual Convention A P A , 1973, 685-686. HERRELL, J . M . 1971. Galatea in the classroom: student expectations affect teacher behavior. Paper presented at the annual meeting of the American Psychological Association. HOFER, M. 1969. Die Schülerpersönlichkeit im Urteil des Lehrers. Weinheim: Beltz. HOFER, M . & DOBRICK, M . 1 9 7 9 . s. H o f e r et a l . 1 9 7 9 . HOFER, M . , SIMONS, H . , WEINERT, F . E . , ZIELINSKI, W . , DOBRICK, M . , FIMPEL, P . & TACKE, G . 1 9 7 9 . « K o g n i t i v e B e -
deutungen individualisierenden Verhaltens von Lehrern.» DFG-Abschlußbericht. Heidelberg/Braunschweig. HOLMES, D.S. 1972. Effects of grades and disconfirmed grade expectancies on students' evaluations of their instructor. Journal of Educational Psychology, 63,130-133. HUBER, G . L . & MANDL, H . 1 9 7 9 . S p i e g e l n L e h r e r u r t e i l e d i e
implizite Persönlichkeitsstruktur der Beurteiler oder der Beurteilungsbögen? Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 11, 218-231. JONES, R . A . 1977. Self-fulfilling prophecies - social, psychological and physiological effects of expectancies. NewYork: Wiley. JOSÉ, J. & CODY, J. 1971. Teacher-pupil interaction as it relates to attempted changes in teacher expectancy of academic ability and achievement. American Educational Research Journal, 8, 39-49. KEHLE, T . J . , BRAMBLE, W . J . & MASON, E . J . 1 9 7 4 . T e a c h e r ' s
expectations: ratings of student performance as biased by student characteristics. The Journal of Experiment Education, 43, 54-60. KESTER, S . & LETCHWORTH, G . 1 9 7 2 . C o m m u n i c a t i o n
of
teacher expectations and their effects on achievement and attitudes on secondary school children. The Journal of Education Research, 66, 51-55. KOHN, P . M . 1973. Relationships between expectations of teachers and performance of students (Pygmalion in the classroom). Journal of School Health, 43, 498-503. LANTERMANN, E . D . 1980. Interaktionen - Person, Situation und Handlung. München: Urban und Schwarzenberg. LA Vorn & ADAMS. 1974. Teacher expectancy and its relation to physical and interpersonal characteristics of the child. The Alberta Journal of Education Research, 20,122-132. MANDL, H . & HUBER, G . L . 1 9 7 9 . K o m p l e x i t ä t s c h u l i s c h e r
Interaktionsprozesse. Unterrichtswissenschaft, 1, 63-77. MASON, E . J . 1973. Teachers' observations and expectations of boys and girls as influenced by biased psychological reports and knowledge of bias. Journal of Educational Psychology, 65,238-243. MASON, E . J . & LARIMORE, D . L . 1 9 7 4 . E f f e c t s o f b i a s e d p s y -
chological reports on two types of teacher's ratings. Journal of School Psychology, 12, 46-50. MASON, E . J . , LARIMORE, D . L . & K I F E R , E . 1 9 7 6 . T e a c h i n g e x -
perience and teachers' expectations for grades in academic subject areas. Contemporary Educational Psychology, 1, 369-375. MEICHENBAUM, D . , BOWERS, K . & R o s s , R . 1 9 6 9 . A b e h a v -
ioral analysis of teacher expectancy effect. Journal of Personality and Social Psychology, 13, 306-316. MEICHENBAUM, D . & SMART, J . 1 9 7 1 . U s e o f d i r e c t e x p e c t a n c y
to modify academic performance and attitudes of college students. Journal of Counseling Psychology, 18,531-535. MENDELS, G . E . & FLANDERS, J . P . 1 9 7 3 . T e a c h e r s ' e x p e c t a -
tions and pupil performance. American Educational Research Journal, 10, 203-212. MERTENS, D . M . 1976. Expectations of teachers-in-training: the influence of a students sex and a behavioral vs. descriptive approach in an biased psychological report. Journal of School Psychology, 14, 222-229. MERTON, R.K. 1957. The self-fulfilling prophecy. In: Merton, R.K. (Ed.): social theory and social structure. Glencoe, 475-490.
MEYER, W.-U. 1979. Academic expectations, attributed responsibility, and teachers reinforcement behavior: a comment on Cooper and Baron with some additional data. Journal of Educational Psychology, 71, 269-273. MEYER, W . U . , SIMONS, G . & B U T Z K A M M , A . 1 9 7 8 . U r s a c h e n -
erklärung von Rechennoten: II.Lehrerattribuierungen und Sanktionen. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 10, 169-178. MIELKE, R. 1978. Einstellungen und Verhalten bei Lehrern unter Berücksichtigung von interner-extemer Kontrolle und Merkmalen der Schulumwelt. Bielefelder Arbeiten zur Sozialpsychologie, Nr.28. MIKULA, G. & STROEBE, W. (Eds.) 1977. Sympathie, Freundschaft und Ehe - Psychologische Grundlagen zwischenmenschlicher Beziehungen. Bern: Huber. MUMMENDEY, H.-D. (Ed.) 1979. Einstellung und Verhalten. Stuttgart: Huber. NASH, R. 1974. Pupils' expectations for their teachers, Research in Education, 12, 47-61. NICKEL, H. 1976. Die Lehrer-Schüler-Beziehung aus der Sicht neuerer Forschungsergebnisse. Ein transaktionales Modell. Psychologie in Erziehung und Unterricht, 23, 153172. O'CONNELL, E . J . , DUSEK, J . B . & WHEELER, R . J . 1 9 7 4 . A
Follow-up study of teacher expectancy effects. Journal of Educational Psychology, 66, 325-328. PANDA, K.&GUSKIN, S. 1970. Effect of social reinforcement, locus of control and cognitive style on concept learning among retarded children. Annual Report, Center for Educational Research and Development for Handicapped children. Indiana University. PICKUP, A . J . & ANTHONY, W . S . 1 9 6 8 . T e a c h e r s ' m a r k s a n d
pupils' expectations: the short-term effects of discrepancies upon classroom performance in secondary schools. British Journal of Educational Psychology, 38, 302-309. RAPPAPORT, M . M . & RAPPAPORT, H . 1 9 7 5 . T h e o t h e r h a l f o f
theexpectancy equation: Pygmalion. Journal of Educational Psychology, 67, 531-536.
RHEINBERG, F. 1975. Zeitstabilität und Steuerbarkeit von Ursachen schulischer Leistung in der Sicht des Lehrers. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 7, 180-194.
RHEINBERG, F. 1977. Soziale und individuelle Bezugsnorm. Unveröffentlichte Dissertation, Ruhr-Universität Bochum. RHEINBERG, F. 1979. Anstrengung wozu? Motivationsphänomenejenseits von Unterschieden der Anstrengungsattribution. Vorläufiges Diskussionspapier zum Symposium «Attributionen» in Berlin 1979 auf der Tagung «Entwicklungspsychologie».
23
Zeitschrift f ü r S o z i a l p s y c h o l o g i e l 9 8 1 , 1 2 , 1 - 2 3
RHEINBERG, F. 1980. Leistungsbewertung und Lernmotivation. Göttingen: H o g r e f e . R H E I N B E R G , F . , SCHMÄLT, H . - D . & WASSER, 1 . 1 9 7 8 . E i n L e h -
rerunterschied, der etwas a u s m a c h t . Zeitschrift f ü r Entwicklungspsychologie und Pädagogische Psychologie, 10,
umwelt. Vortrag für die Expertentagung am 1 7 . / 1 8 . April im Staatsinstitut für P ä d a g o g i k , M ü n c h e n . SECORD, P . F . & BACKMAN, C . W . 1 9 7 6 .
Sozialpsychologie.
ROSENTHAL, R . & F O D E , K . L . 1 9 6 3 . T h e e f f e c t f o e x p e r i m e n t -
F r a n k f u r t a . M . F a c h b u c h h a n d l u n g f ü r Psychologie, Verlagsabteilung. SEIFERT, K . H . 1975. Schülererwartungen und Lehrerverhalten. In: Reinert, G. (Ed.): Bericht über den 28. Kongreß der Deutschen Gesellschaft f ü r Psychologie in Kiel 1972, G ö t tingen: H o g r e f e , 202-211. Six, B. 1975. Die Relation von Einstellung und Verhalten. Zeitschrift f ü r Sozialpsychologie, 4, 270-296. Six, B. 1980. Einstellung und Verhalten (im Druck).
er bias o n the p e r f o r m a n c e of the albino rat. Behavioral
SNYDER, C . R . & CLAIR, M . 1 9 7 6 . E f f e c t s o f e x p e c t e d a n d o b -
Science, 8 , 1 8 3 - 1 8 9 .
1966. D a t a desirability, experimenter expectancy, and the results of psychological research. J o u r n a l of Personality and Social Psychology, 3, 20-27.
tained grades o n teacher evaluation a n d attribution of perf o r m a n c e . J o u r n a l of Educational Psychology, 6 8 , 7 5 - 8 2 . SOULE, D. 1972. Teacher bias effects with severely retarded children. American J o u r n a l of Mental Deficiency, 77, 208-211.
ROSENTHAL, R . & JACOBSON, L . 1 9 6 8 . P y g m a l i o n i n t h e c l a s s -
SUTHERLAND, A . & GOLDSCHMID, M . E . 1 9 7 4 . N e g a t i v e t e a c h -
classroom. New York: H o l t , Rinehart & Winston. Deutsch: Pygmalion im Unterricht. Weinheim: Beltzl971. Ross, M . B . & SALVIA, J. 1975. Attractiveness as a biasing f a c t o r in teacher judgements. American J o u r n a l of Mental
er expectation and IQ change in children with superior intellectual potential. Child Deveolopment, 45, 852-856. WAGNER, H . 1980. Wie nehmen Schüler den Lehrer w a h r ? Einige Bedingungen der Beschreibung von Lehrerabsichten d u r c h Schüler. Psychologie in Erziehung und Unterricht, 27, 6 5 - 7 2 . WEINER, B. 1977. A n attributional a p p r o a c h t o educational psychology. In: Schulman (Ed.): Review of Research in E d u c a t i o n (Vol.4). Itaska, Illinois: P e a c o c k . WESTHOFF, K. & BERKA, H . - H . 1980. « P y g m a l i o n s neue Kleid e r . » Ein Diskussionsbeitrag zu C . C a s p a r i s : Einetheoretische Analyse von « P y g m a l i o n e f f e k t e n » und «sich selbst erfüllenden Voraussagen». Zeitschrift für Sozialpsychologie, 1 1 , 1 2 9 - 1 3 0 . WILLIAMS, T. 1975. Educational a m b i t i o n : teacher and students. Sociology of E d u c a t i o n , 48, 432-456. WILLIAMS, T. 1976. Teacher prophecies a n d the inheritance of inequality. Sociology of E d u c a t i o n , 49, 223-236.
3-7. RHEINBERO, F . , KÜHMEL, B . & DUSCHA, R . 1 9 7 9 . E x p e r i m e n -
tell variierte Schulleistungsbewertung u n d ihre motivationalen Folgen. Empirische P ä d a g o g i k , 3, 1 - 1 2 . ROSENTHAL, R. 1973. T h e Pygmalion effect lives. Psychology Today, 7, 56-63.
ROSENTHAL, R . , K O H N , P . , G R E E N F I E L D , P . M . & C A R O T A , N .
Deficiency, 80, 9 6 - 9 8 . ROTHBART, M . , D A L F E N , S . & BARRETT, R . 1 9 7 1 . E f f e c t s o f
teacher's expectancy on student-teacher interaction. Journal of Educational Psychology, 62, 4 9 - 5 4 . RUBOVITS, P . & M A E H R , M . 1 9 7 1 . P y g m a l i o n a n a l y z e d : t o -
ward an explanation of the Rosenthal-Jacobson findings. J o u r n a l of Personality and Social Psychology, 19, 197203. RUNKEL, P . J . & MCGRATH, J . E . 1972. R e s e a r c h o n
Human
Behavior - A systematic Guide to M e t h o d . New York: Holt, Rinehart and Winston. SCHUSSER, G. 1972. Lehrererwartungen. München: Goldmann. SCHWARZER, R . & LANGE, B . 1 9 7 9 . I m p l i z i t e U n t e r r i c h t s t h e o -
rie von Lehrern. In: Bolscho, D. & Schwarzer, C. (Eds.): Beurteilung in der Grundschule. M ü n c h e n : Urban & Schwarzenberg. S C H W A R Z E R , R . , JERUSALEM, M . & L A N G E , B . 1 9 8 0 . D i e B e -
deutung subjektiver Kompetenzerwartungen für die kognitive Regulation gegenüber A n f o r d e r u n g e n der Lern-
Z A N N A , M . P . , SHERAS, P . L . , C O O P E R , J . & S H A W ,
C. 1975. Pygmalion and Galatea: the interactive effect of teacher and student expectancies. J o u r nal of Experimental Social Psychology, 1 1 , 2 7 9 287.
^ ^ H I
A
24
Jansen: Spezifisch objektive Messung im Falle m o n o t o n e r Einslellungsitems
Spezifisch objektive Messung im Falle monotoner Einstellungsitems P.G.W.JANSEN, Den H a a g
RASCHS F o r d e r u n g nach spezifisch objektiver Messung k o n n te bis jetzt nur durch das RASCH-Modell erfüllt werden. Eine Voraussetzung des RASCH-Modells besteht jedoch d a r i n , d a ß die itemcharakteristischen Kurven m o n o t o n sind, was im Z u s a m m e n h a n g mit Einstellungsitems selten erfüllt sein wird. In diesem Artikel werden die Vor- und Nachteile zweier Verfahren zur Festlegung einer Menge m o n o t o n e r Items diskutiert u n d a n h a n d eines kritischen Überblicks über f r ü h e r e F o r s c h u n g zu dieser Fragestellung illustriert.
RASCHS d e m a n d for specific objective m e a s u r e m e n t until now could be only fulfilled in the RASCH model. A prerequisite for the RASCH model, however, is that the item characteristic curves a r e m o n o t o n e ; in case of a t t i t u d e items this condition rarely will be met. In this article the a d v a n t a g e s a n d disadvantages of two procedures for establishing a set of m o n o t o n e items a r e discussed. T h e discussion is illustrated with a critical review of some previous research on this topic.
1.
der Einstellungsmessung impliziert spezifische O b j e k t i v i t ä t a u c h , d a ß der Vergleich der Items hinsichtlich ihres Skalenwertes oder latenten P a rameters ( d . h . ihrem Wert auf d e m interessierend e n E i n s t e l l u n g s k o n t i n u u m ) u n a b h ä n g i g ist v o n der P e r s o n e n s t i c h p r o b e .
Einführung*
I n s e i n e m V o r t r a g v o n 1 9 6 6 f ü h r t e RASCH d a s K o n z e p t der spezifischen Objektivität ein. N a c h RASCH m u ß e i n e W i s s e n s c h a f t l i e h e T h e o r i e d u r c h eine M e n g e von objektiven Aussagen über die Relationen zwischen O b j e k t e n formuliert werden. Die Relation einer M e n g e von O b j e k t e n k a n n d a d u r c h beobachtet werden, d a ß m a n ihre Reaktionen gegenüber einem anderen Objekt vergleicht, welches als A g e n t bezeichnet w i r d . W e n n d e r V e r g l e i c h d e r O b j e k t e u n a b h ä n g i g ist v o m A g e n t e n , der eine S t i c h p r o b e eines relevanten U n i v e r s u m s von A g e n t e n darstellt, d a n n wird dieser Vergleich, o d e r diese M e s s u n g , spezifisch objektiv genannt. I m F a l l e v o n E i n s t e l l u n g s m e s s u n g z u m Beispiel i m p l i z i e r t s p e z i f i s c h e O b j e k t i v i t ä t , d a ß d e r Vergleich der P e r s o n e n hinsichtlich ihrer Einstell u n g s w e r t e o d e r l a t e n t e n P a r a m e t e r , d i e a u s ihren R e a k t i o n e n g e g e n ü b e r einem A g e n t e n resultierten, nicht b e e i n f l u ß t wird d u r c h die S t i c h p r o b e d e r E i n s t e l l u n g s i t e m s , w e l c h e hier a l s A g e n t e n oder Meßinstrumente dienen. A b e r in RASCHS K o n e z p t i o n m u ß f ü r s p e z i f i sche O b j e k t i v i t ä t a u c h der u m g e k e h r t e Fall gelt e n : D e r V e r g l e i c h d e r A g e n t e n ist u n a b h ä n g i g von der Auswahl der O b j e k t e . U m unser Beispiel f o r t z u s e t z e n : Im
Bereich
* Der A u t o r dankt E.ROSKAM und A . VAN DEN WOLLENBERG f ü r ihre K o m m e n t a r e u n d Vorschläge. Diese Arbeit wurde von D.LEUTNER aus dem Englischen übersetzt.
S p ä t e r w u r d e n a c h g e w i e s e n ( z . B . FISCHER, 1 9 7 4 , p . 4 2 0 ) , d a ß im B e r e i c h d e r p r o b a b i l i s t i schen, eindimensionalen Zwei-Parameter-Mod e l l e e i n z i g u n d a l l e i n d a s v o n RASCH ( 1 9 6 0 ) f o r m u l i e r t e Testmodell die B e d i n g u n g der spezifis c h e n O b j e k t i v i t ä t e r f ü l l t . D i e s e s RASCH-Modell k a n n als die f o l g e n d e w o h l b e k a n n t e logistische itemcharakteristische Kurve oder A n t w o r t f u n k t i o n f ü r ein d i c h o t o m e s I t e m f o r m u l i e r t w e r d e n : (1) p ( l | U ö i ) =
e x p ( ^ v - Oj) 1 + exp(4v - 0|)
= p ( l | v , i),
wobei: o ^ latenter P a r a m e t e r eines Items i E,v: l a t e n t e r P a r a m e t e r e i n e r P e r s o n v 1: « j a » o d e r e i n e a n d e r e A n t w o r t e i n e r P e r s o n a u f ein I t e m . D e r I t e m - P a r a m e t e r O; ( w e l c h e r d i e P o s i t i o n des Items auf dem b e t r e f f e n d e n Einstellungskont i n u u m anzeigt) kann u n a b h ä n g i g geschätzt werden von der Stichprobe der Personen, und - umgekehrt - der Personen-Parameter (welcher die Position der Person auf dem Einstellungskontin u u m a n z e i g t , a l s o die E i n s t e l l u n g d e r P e r s o n ) kann unabhängig geschätzt werden von der Stichprobe der Items. Dieses P h ä n o m e n wird «stichprobenunabhängige Schätzung» oder « S t i c h p r o b e n - U n a b h ä n g i g k e i t » g e n a n n t u n d ist
25
Zeitschrift für S o z i a l p s y c h o l o g i e 1 9 8 1 , 1 2 , 2 4 - 4 1
e i n e E i g e n s c h a f t der s p e z i f i s c h e n O b j e k t i v i t ä t . I m n ä c h s t e n A b s c h n i t t w i r d d a s RASCH-Modell detaillierter diskutiert werden. E s ist e i n f a c h zu s e h e n , d a ß (1) eine m o n o t o n steigende F u n k t i o n von u n d e i n e m o n o t o n fall e n d e F u n k t i o n v o n Oj ist: M a n s a g t , d a ß die I C C « d o p p e l t e M o n o t o n i z i t ä t » b e s i t z t . In B e g r i f f e n d e r E i n s t e l l u n g s m e s s u n g b e d e u t e t dies, d a ß ein Anstieg der betreffenden latenten Disposition o d e r E i n s t e l l u n g ( k o d i e r t als einer P e r s o n v ein e r h ö h e r e n W a h r s c h e i n l i c h k e i t f ü r eine « j a » A n t w o r t a u f ein E i n s t e l l u n g s i t e m e n t s p r i c h t . Bei s t a n d a r d i s i e r t e n I n t e l l i g e n z t e s t s ist es n u n e i n i g e r m a ß e n w a h r s c h e i n l i c h , d a ß die M o n o t o n i z i t ä t s - A n n a h m e e r f ü l l t w i r d (vgl. FISCHER, 1974, p . 3 0 1 f . ) , a b e r bei E i n s t e l l u n g s f r a g e b ö g e n scheint dies u m einiges s c h w i e r i g e r zu sein. Bet r a c h t e n wir z u m Beispiel d a s f o l g e n d e Einstell u n g s i t e m ( a u s WAKENHUT, 1 9 7 4 , p . 8 8 ) :
« D i e S t r a f a u s s e t z u n g a u f B e w ä h r u n g ist in d e n m e i s t e n F ä l l e n eine p r o b l e m a t i s c h e S a c h e . » Bezüglich d e r E i n s t e l l u n g zu S t r a f g e s e t z e n k a n n eine P e r s o n a u s m e h r e r e n , s e h r verschieden e n G r ü n d e n z u s t i m m e n , w a s v e r s c h i e d e n e n Bewertungen des Items entspricht. Somit erzeugen v e r s c h i e d e n e l a t e n t e P a r a m e t e r %y, w e l c h e die bet r e f f e n d e l a t e n t e D i s p o s i t i o n m e s s e n , dieselbe m a n i f e s t e W a h r s c h e i n l i c h k e i t einer « j a » - A n t w o r t , w a s e i n e V e r l e t z u n g d e r o b e n beschrieben e n M o n o t o n i z i t ä t s - A n n a h m e ist. W e n n die M o d e l l a n n a h m e der M o n o t o n i e d u r c h ein I t e m nicht verletzt w i r d , d a n n wird dieses I t e m m o n o t o n g e n a n n t ; e n t s p r e c h e n d ist ein I t e m wie d a s a n g e f ü h r t e n i c h t - m o n o t o n . I m A b s c h n i t t 3 w e r d e n diese K o n z e p t e weiter e r l ä u t e r t werden. D a eine g r u n d l e g e n d e A n n a h m e des RASCHM o d e l l s in d e r F o r d e r u n g n a c h m o n o t o n e n I t e m s b e s t e h t , ist die E x i s t e n z v o n n i c h t - m o n o t o n e n E i n s t e l l u n g s i t e m s ein H i n d e r n i s f ü r s p e z i f i s c h e O b j e k t i v i t ä t im Bereich d e r E i n s t e l l u n g s m e s s u n g . E s gibt j e d o c h v e r s c h i e d e n e W e g e , u m mit d e m P r o b l e m n i c h t - m o n o t o n e r Einstellungsitems u m z u g e h e n , v o n d e n e n zwei in dieser Studie d i s k u t i e r t w e r d e n ; ein d r i t t e s V e r f a h r e n wird in einer s p ä t e r e n V e r ö f f e n t l i c h u n g vorgestellt. I m A b s c h n i t t 4 k o n z e n t r i e r e n wir u n s a u f eine Elimination von nicht-monotonen Items, bevor e i n e A n a l y s e mit d e m RASCH-Modell v o r g e n o m m e n w i r d ( « a p r i o r i s c h e E l i m i n a t i o n » ) . Dieses Verfahren verlangt M e t h o d e n , welche nicht-mo-
n o t o n e I t e m s a u s f i n d i g m a c h e n u n d ihre A b w e i c h u n g von M o n o t o n i e testen k ö n n e n . Im A b s c h n i t t 5 wird M o n o t o n i e in der experim e n t e l l e n P h a s e i n d u z i e r t ; die F o r m des F r a g e b o g e n s g a r a n t i e r t m o n o t o n e I t e m s . In solch ein e m Fall k ö n n e n die P e r s o n e n nicht a n d e r s als sich « m o n o t o n v e r h a l t e n » . N a t ü r l i c h verlang! dies die K e n n t n i s der E i g e n s c h a f t e n m o n o t o n e r I t e m s (siehe A b s c h n i t t 3). Die d r i t t e M e t h o d e (in dieser S t u d i e nicht disk u t i e r t ) läßt der P e r s o n die M ö g l i c h k e i t , nichtm o n o t o n zu a n t w o r t e n , w o b e i j e d o c h a u f der M o d e l l s e i t e eine spezielle F o r m v o n M o n o t o n i e a n g e n o m m e n w i r d . In e i n e m a n d e r e n A r t i k e l w e r d e n wir diese M e t h o d e b e s c h r e i b e n ; sie l ä u f t a u f e i n e K o m b i n a t i o n d e s RASCH-Modells mit ein e m P r ä f e r e n z - M o d e l l h i n a u s , w o b e i ein M o d e l l , welches n i c h t - m o n o t o n e P r ä f e r e n z k u r v e n a n n i m m t , mit d e m m o n o t o n e n , logistischen M o d e l l von RASCH v e r b u n d e n w i r d .
2.
D a s RASCH-Modell
Die n o t w e n d i g e n u n d h i n r e i c h e n d e n B e d i n g u n gen des RASCH-Modells sind H o m o g e n i t ä t (die D a t e n aller P e r s o n e n w e r d e n erzeugt d u r c h dasselbe l a t e n t e K o n t i n u u m ) , D i c h o t o m i e der I t e m s , S u f f i z i e n z ( d e r G e s a m t - M a r g i n a l w e r t a v 0 , i.e. die A n z a h l der « k o r r e k t e n » I t e m s , einer P e r s o n v ist eine e r s c h ö p f e n d e Statistik f ü r d e n P e r s o n e n p a rameter vgl- MOOD et a l . , 1974, p . 3 2 6 ) , u n d l o k a l e s t o c h a s t i s c h e U n a b h ä n g i g k e i t (vgl. LAZARSFELD & HENRY, 1 9 6 8 , p , 1 7 f . ) .
D a s d i c h o t o m e RASCH-Modell k a n n d a n n a l s o bezüglich zweier A n t w o r t k a t e g o r i e n wie folgt explizit g e s c h r i e b e n w e r d e n : exp«+o, (2) p ( l | v , i ) = exP(4(1) v wobei:
+
o(1)) i
+
exP(4(2)+o(2V v ]
P e r s o n e n p a r a m e t e r f ü r die I t e m kategorie 1 o^:
I t e m p a r a m e t e r f ü r die K a t e g o r i e 1
I m Fall v o n I n t e l l i g e n z t e s t s w e r d e n die b e i d e n K a t e g o r i e n m e i s t e n s mit « r i c h t i g / f a l s c h » etikettiert, im Fall v o n E i n s t e l l u n g s i t e m s g e w ö h n l i c h mit « j a / n e i n » o d e r « s t i m m e z u / s t i m m e nicht zu».
26
Jansen: Spezifisch objektive M e s s u n g im Falle m o n o t o n e r Einstellungsilems
Wenn wir definieren: (3)
=
-
(Tendenz, die Kategorie 1 der Kategorie 2 vorzuziehen) O; = o ' j ' - c r ^ ( « A t t r a k t i v i t ä t » der Kategorie 1 des Items i gegenüber der Kategorie 2 des Items i),
ter
k a n n eine Bedingung f ü r die eindimensio-
nale R e d u k t i o n ähnlich zu (5) formuliert werden (siehe FISCHER, 1974, p.437).
Testung des RASCH-Modells d a n n k a n n (2) auf (1) reduziert werden; h a u p t sächlich setzen wir in (3) o ^ = ^
= 0, und
schreiben und o ^ entsprechend als und O;. A u f S Kategorien generalisierend k ö n n e n wir schreiben:
(4) p ( l | v, i, g) = —
.
^ e x p ^ J W p )
Wie wir wissen, ist die S t i c h p r o b e n u n a b h ä n g i g keit eine bedeutende Eigenschaft des RASCH-MOdells. Z u r P r ü f u n g dieser S t i c h p r o b e n u n a b h ä n gigkeit wird h ä u f i g der folgende Test benutzt: Mit Hilfe eines Kriteriums (z.B. dem Gesamtwert a v 0 jeder Person) wird die Stichprobe in zwei disjunkte G r u p p e n aufgeteilt, und die I t e m p a r a meter werden d a n n f ü r diese beiden Substichproben geschätzt, wodurch m a n f ü r die beiden Substichproben 1 und 2 o [ und o? als Schätzungen f ü r Oj erhält. Wenn Stichprobenunabhängigkeit gegeben ist, d a n n sollte m a n feststellen, d a ß
In jedem multikategorialen oder polychotomen RASCH-Modell k a n n m a n nun die Kategorie S eliminieren, indem m a n durch e x p ( ^ ^ + o teilt. Dies ist äquivalent zur Setzung ^ ^ = 0 (Vv) und
= 0 (vi). In dem Anwendungsbeispiel in
Abschnitt 5.1 haben wir zum Beispiel 3 Kategorien, weswegen wir o ^ = 0, Vi setzen. Dementsprechend hat ein RASCH-Modell f ü r Items mit S A n t w o r t k a t e g o r i e n S - l P a r a m e t e r f ü r j e d e Person u n d jedes Item. Deshalb hat ein polychotomes RASCH-Modell auch maximal S - l Dimensionen, (das e i n f a c h e Modell in (1) hat genau 1 Dimension, wie es auch sein sollte a u f g r u n d seiner H o m o g e n i t ä t s a n n a h me.) Wir schreiben « m a x i m a l » , weil immer die Möglichkeit besteht, d a ß unsere P a r a m e t e r eindimensional sind (wie es auch in Abschnitt 5.1 der Fall sein wird). Eine Bedingung f ü r die Eindimensionalität der P a r a m e t e r o ^ ist, d a ß (5) a ( ? ) = c i w ( g ) . Für die Ableitung von (5) und die Berechnung von w ( g ) und o [ sei der Leser auf den A n h a n g verwiesen. Für die p o l y c h o t o m e n P e r s o n e n p a r a m e -
o | = o ? (Vi). Die A b w e i c h u n g zwischen o j und o j k a n n d a n n auf verschiedenen Wegen bewertet werden: M a n k a n n den sogenannten Modell-Test II ben u t z e n (FISCHER & SCHEIBLECHNER, 1 9 7 0 ; FISCHER, 1 9 7 4 , p . 2 9 7 - 2 9 8 ; HENNING, 1 9 7 4 , p . 9 6 -
98; WAKENHUT, 1974, p . 4 9 - 5 0 ) . M a n b e k o m m t hierdurch sowohl ein allgemeines / 2 - M a ß der Abweichung, als auch individuelle M a ß e f ü r einzelne Items. 1 2 M a n k a n n auch die Oj u n d o | gegeneinander abtragen. Bei gegebener S t i c h p r o b e n u n a b h ä n gigkeit sollten sich die Schätzwerte entlang der Linie durch den U r s p r u n g mit einem Winkel von 45° zur Abszisse a n o r d n e n . Schließlich ist es möglich, die Schätzwerte der beiden Substichproben simultan d u r c h einen konditionalen «likelihood-ratio»-Test zu vergleichen, der von ANDERSON (1973) entwickelt wurde. Alle drei Tests der S t i c h p r o b e n u n a b h ä n g i g keit werden in Abschnitt 5.1 benutzt. D a das RASCH-Modell f ü n f A x i o m e n entspricht, besteht ein P r o b l e m bezüglich der vorh a n d e n e n Teststatistiken: M a n weiß nichts über die Sensitivität dieser Statistiken gegenüber Verletzungen bestimmter A x i o m e . In dieser Studie
27
Zeitschrift für Sozialpsychologie 1 9 8 1 , 1 2 , 2 4 - 4 1
j e d o c h werden wir a n n e h m e n , d a ß alle von uns oder von den A u t o r e n benutzten Teststatistiken in Abschnitt 4 gute Tests des RASCH-Modells darstellen. Als einen Gegenpol zu dieser Zuversichtlichkeit verweisen wir auf VAN DEN WOLLENBERG (1979). Die in dieser M o n o g r a p h i e diskutierten P r o b l e m e treten in unserer Studie allerdings nicht auf.
chung (6) in ihrer deterministischen F o r m ausarbeiten. Im Fall d i c h o t o m e r Items gibt es zwei ideale I t e m t y p e n , die zu verschiedenen Modellen f ü h ren. Betrachten wir die folgenden zwei Items (aus
3.
Das erste Item teilt das interessierende Kontin u u m ( G r ö ß e ) in zwei nicht ü b e r l a p p e n d e Segmente, welche in einem deterministischen Skaliermodell ausschließlich die latenten P a r a m e t e r der P e r s o n e n enthalten, die « j a » A n t w o r t e n oder die P a r a m e t e r der P e r s o n e n mit einer «nein»A n t w o r t (siehe A b b . 2 a ) . Wir k ö n n e n sagen, d a ß zwischen den A n t w o r t k a t e g o r i e n u n d dem zugrundeliegenden K o n t i n u u m eine Eins-zu-einsBeziehung besteht. Items dieses Typs heißen m o n o t o n e Items; andere Bezeichnungen sind z . B . kumulative Items oder LIKERT-Items. Es sei angemerkt, d a ß in unserem Beispiel (Item 1) die Grenze zwischen den beiden Segmenten den folgenden Wert auf dem zugrundeliegenden Kontin u u m der G r ö ß e hat:
Monotonie
F o r m a l definieren wir M o n o t o n i e wie folgt, wobei wir die Definition auf m o n o t o n ansteigende F u n k t i o n e n beschränken: (6) S v > £ w " P ( l | v , i ) > p ( l | w , i). M o n o t o n i e impliziert f ü r jedes Item eine Einszu-Eins-Beziehung zwischen den P u n k t e n £ u n d P u n k t e n im Intervall (0,1). Es gibt keine Mehrdeutigkeit bezüglich der Regression von manifesten Wahrscheinlichkeiten auf latente P a r a meter. N i c h t - m o n o t o n e itemcharakteristische F u n k t i o n e n j e d o c h erlauben keine eindeutige Z u o r d n u n g von P a r a m e t e r n zu Wahrscheinlichkeiten, wie A b b . 1 zu e n t n e h m e n ist: Dort sehen wir, d a ß bei einer n i c h t - m o n o t o n e n Kurve sehr unterschiedliche P a r a m e t e r mit ein und derselben Wahrscheinlichkeit p ( l ) korrespondieren können. Die Begriffe « m o n o t o n e s Item» und «nichtm o n o t o n e s Item» lassen sich auf COOMBS (1964, p.563) z u r ü c k f ü h r e n , und wir werden diese Konzepte a n h a n d zweier Beispiele erläutern. Im wesentlichen werden wir im folgenden die Glei-
TORGERSON, 1958, p . 3 0 4 ) :
1. I a m over five feet six inches tall: yes/no; 2. I a m between five feet six inches tall a n d five feet ten inches tall: yes/no.
\ (Grenze) = 5 ' 6 " = o , .
Der latente P a r a m e t e r eines Items wird also durch den Skalenwert der Grenze zwischen den beiden A n t w o r t k a t e g o r i e n angegeben. O b w o h l das RASCH-Modell probabilistisch ist, kann man zwei «Segmente» unterscheiden: Das erste entspricht der manifesten Kategorie « n e i n » und enthält alle P e r s o n e n p a r a m e t e r f ü r die gilt:
Jansen: Spezifisch objektive Messung im Falle monotoner Einstellungsitcms
28 (a)
yes 1 0
(b)
1 1 0
(c)
1
1
5.6 no
i 5.6
IH)
1
0
yes
i 5.10
no
yes
5.6
I 1
[
™
1
10
Abb.2: Schematische Repräsentation eines monotonen Items (a), eines nicht-monotonen Items (b) und eines quasi-monotonen Items (c).
(7) p ( l | v , i ) < ' / 2 . F ü r d i e z w e i t e K a t e g o r i e gilt n a t ü r l i c h d e r u m g e k e h r t e F a l l . D e s w e i t e r e n gilt im RASCH-MOd e l l , d a ß d e r I t e m p a r a m e t e r Oj d u r c h d e n S k a l e n w e r t d e r I t e m g r e n z e a n g e g e b e n w i r d . E s ist n ä m lich l e i c h t z u s e h e n , d a ß (8) p ( l U v ) o i = U = ' / 2 . W e n n wir u n s d a s Item 2 n ä h e r a n s c h a u e n , k ö n n e n wir a u f g r u n d d e r v o r a n g e g a n g e n e n Disk u s s i o n s o f o r t f e s t s t e l l e n , d a ß bei d i e s e r A r t v o n I t e m s k e i n e E i n s - z u - e i n s - B e z i e h u n g besteht zwischen den Antwortkategorien und dem latenten K o n t i n u u m : S o w o h l P e r s o n e n , die g r ö ß e r als f ü n f feet z e h n i n c h e s s i n d , a l s a u c h P e r s o n e n , d i e k l e i n e r a l s f ü n f feet s e c h s i n c h e s s i n d , w e r d e n « n e i n » sagen, o b w o h l ihre Position a u f d e m zugrundeliegenden K o n t i n u u m sehr unterschiedlich ist ( s i e h e A b b . 2 b ) . I t e m s d i e s e s T y p s h e i ß e n n i c h t - m o n o t o n ; sie s i n d a u c h u n t e r d e n B e z e i c h n u n g e n P u n k t i t e m s o d e r T H U R s r o N E - I t e m s bekannt. N i c h t - m o n o t o n e Items k ö n n e n a u f g r u n d ihrer V e r l e t z u n g d e s M o n o t o n i e - A x i o m s in e i n e r A n a lyse m i t d e m R A S C H - M o d e l l n i c h t b e n u t z t w e r d e n . Es scheint j e d o c h eine E i n s c h r ä n k u n g zu geb e n , die a n d e m f o l g e n d e n Beispiel erläutert werden kann: 3. I a m b e t w e e n f i v e feet six i n c h e s tall a n d t e n feet ta.ll:
« I a m o v e r f i v e f e e t six i n c h e s t a l l » . S o l c h e I t e m s k ö n n e n w i r « q u a s i - m o n o t o n » n e n n e n . O b sich n u n ein n i c h t - m o n o t o n e s I t e m w i e e i n m o n o t o n e s verhält, das hängt von der M e n g e von Personen a b , f ü r die dieses Item e n t w o r f e n w u r d e . Quasim o n o t o n e I t e m s s i n d im m i t t l e r e n B e r e i c h d e r P e r s o n e n m o n o t o n ( s i e h e A b b . 3 a ) , a b e r sie s i n d nicht-monoton für mittlere und extreme Personen (siehe A b b . 3b). W i r k ö n n e n j e d o c h nicht der Tatsache entkommen, daß quasi-monotone Items a u f g r u n d der benutzten Stichprobe m o n o ton, aber a u f g r u n d ihrer S t r u k t u r n i c h t - m o n o t o n s i n d . Q u a s i - M o n o t o n i e ist e i n e s t i c h p r o b e n a b h ä n g i g e E i g e n s c h a f t von Items; deswegen verletzen q u a s i - m o n o t o n e I l e m s eine wesentliche C h a rakteristik des RASCH-Modelts, n ä m l i c h die S t i c h p r o b e n u n a b h ä n g i g k e i t o d e r spezi fische O b jektivität. W e n n d a s R A S C H - M o d e l l g e l t e n s o l l , d a n n ist es n o t w e n d i g , d a ß d i e v e r w e n d e t e n I t e m s a u f g r u n d ihrer S t r u k t u r m o n o t o n sind, nicht a u f g r u n d der spezifischen P e r s o n e n s t i c h p r o b e . Dies k a n n d a d u r c h erreicht werden, d a ß m a n Items eliminiert, welche g a n z gewiß nicht die ziemlich restriktiven A n f o r d e r u n g e n des RASCH-Modells e r f ü l l e n , u n d z w a r b e v o r eine A n a l y s e mit d e m RASCH-Modell d u r c h g e f ü h r t wird ( A b s c h n i t t 4). D i e a n d e r e M ö g l i c h k e i t b e s t e h t in d e r B e n u t z u n g von I t e m s , die allein v o n ihrer S t r u k t u r her M o n o t o n i e zu garantieren scheinen (Abschnitt 5).
yes/no.
I t e m 3 ist t h e o r e t i s c h n i c h t - m o n o t o n , p r a k t i s c h a b e r m o n o t o n : D a n i e m a n d g r ö ß e r ist a l s t e n feet ( s i e h e A b b . 2 c ) , ist d e r e n t s p r e c h e n d e Bereich d e s l a t e n t e n K o n t i n u u m s leer, u n d d a s Item ist p r a k t i s c h ä q u i v a l e n t m i t d e m m o n o t o n e n I t e m
4.
Eliminierung n i c h t - m o n o t o n e r Items: zwei Fallstudien
In d i e s e m A b s c h n i t t w e r d e n w i r z e i g e n , w i e zwei A u t o r e n versucht haben, das P r o b l e m nicht-mo-
29
Zeitschrift für Sozialpsychologie 1 9 8 1 , 1 2 , 2 4 - 4 1
(a) Stichprobe a:
- — I
™
^ (mittlerer Bereich)
(b) Stichprobe b:
ü?
^
1
1
(mittlere und extreme Personen) Abb.3:
Q u a s i - M o n o t o n i e (a) und N i c h t - M o n o t o n i e (b) eines Items und deren Stichprobenabhängigkeil.
n o t o n e r Einstellungsitems zu lösen. Im Abschnitt 4.1. dient das RASCH-Modell selbst als ein Mittel zur Eliminierung abweichender Items, w ä h r e n d in Abschnitt 4.2. eine andere, nichtparametrische Technik benutzt wird. Somit kann allein im Abschnitt 4.2. tatsächlich von einer a priorischen Itemeliminierung gesprochen werden. 4 . 1 . D i e Studie v o n WAKENHUT
In dieser Studie versuchte WAKENHUT (1974), mit Hilfe des RASCH-Modells drei soziale/politische Einstellungen zu messen. Als A u s g a n g s p u n k t f ü r seine Itemeliminationstechnik benutzte WAKENHUT f ü r jede Einstellung einen bereits bestehenden I t e m p o o l von u n g e f ä h r 120 Items. Dieser Itempool w u r d e mit dem RASCH-Modell analysiert, wobei zuvor erhaltene Daten benutzt wurden. M a n erhielt so einen allgemeinen %2-Wert u n d individuelle % 2 -Werte f ü r die Items (ModellTest II) als M a ß e f ü r die Abweichung der Itemmenge u n d der einzelnen Items von der sog. RASCH-Homogenität. (Dieser Begriff bezieht sich auf eine Menge von Items, welche alle Eigenschaften des RASCH-Modells erfüllen.) Im Falle einer signifikanten Abweichung der Itemmenge von der RASCH-Homogenität w u r d e das Item mit dem höchsten %2-Wert eliminiert, worauf die restliche I t e m m e n g e (nun 119 Items) einer erneuten Analyse mit dem RASCH-Modell unterzogen wurde. Diese P r o z e d u r w u r d e d a n n so lange wiederholt, bis der allgemeine x 2 -Wert nicht mehr signifikant war; in diesem Fall w u r d e d a n n angenommen, d a ß die übriggebliebenen Items eine RASCHh o m o g e n e Skala bilden. Der Kürze wegen nennen wir diese Prozedur I R R , was «interative, reduktive RASCH-Analyse» bedeutet. Die IRR der drei Itempools erzeugte drei RASCH-homogene Itemmengen von je u n g e f ä h r 30 Items, welche f ü r eine neue Datenerhebung
benutzt wurden ( S t i c h p r o b e n g r ö ß e 477). Diese Daten w u r d e n anschließend mit dem RASCH-MOdell analysiert: Keine der drei Itemmengen erwies sich in dieser P h a s e als RASCH-homogen. Die E r h e b u n g neuer Daten ist eine entscheidende empirische Validierung der RASCH-HOITIOgenität bzw. der Itemmenge, welche mittels der I R R aus dem Itempool ausgewählt w u r d e . Da nun die empirische Validierung das Ergebnis der IRR widerlegt, m u ß geschlußfolgert werden, d a ß die IRR kein geeignetes Itemselektionsverfahren darstellt. Weiter unten werden wir zeigen, w a r u m eine I R R ein unzuverlässiges Verfahren zur Konstruktion einer RASCH-homogenen Skala ist, sofern keine Kreuzvalidierung v o r g e n o m m e n wird. A n g e n o m m e n , wir haben eine große, nicht RASCH-homogene Menge von Items, was durch den Test auf Stichprobenunabhängigkeit aus Abschnitt 2 festgestellt worden ist. D a n n k ö n n t e ein 1 2 Plot der Itemvektoren ( O j , Oj) aussehen wie in il
gen» machen kann.
30
Jansen: Spezifisch objektive Messung im Falle monotoner Einstellungsilems
A b b . 4 . In solch einem Fall ist es nicht schwierig, mit nichts anderem als dem nackten A u g e eine U n t e r m e n g e von Items zu identifizieren, welche augenscheinlich RASCH-Homogenität besitzt. Wir könnten z.B. ein Band über die zerstreuten P u n k t e legen (wie es in A b b . 4 zu sehen ist) und alle Items a u ß e r h a l b unserer angestrebten « S k a l a » eliminieren. Die verbleibenden Items w ü r d e n d a n n RASCH-homogen erscheinen. Somit ist es also möglich, von einem g r o ß e n Itempool ausgehend eine U n t e r m e n g e von Items auszuwählen, welche den Test auf RASCH-Homogenität bestehen. Wir müssen jedoch festhalten, d a ß in dieser « H o m o g e n i s i e r u n g » der Itemmenge die ganze Zeit über dieselbe Personenstichprobe benutzt wurde, so d a ß eine empirische Validierung niemals s t a t t g e f u n d e n hat: Das Risiko einer A u s n u t z u n g des Zufalls ist also in der iterativen, reduktiven RAscH-Analyse g r o ß . Tatsächlich ist es möglich, mit exakt derselben M e t h o d e , die WAKENHUT benutzte, nämlich der I R R , einen zufälligen Datensatz auf eine RAscH-homogene «Skala» zu reduzieren, welche den Test auf Stichprobenunabhängigkeit besteht.
Eine
Simulation
Wir erzeugten eine lOOx 50 Matrix A von Zufallsdaten mit den Eingängen 1 und 0, um die A n t w o r ten von 100 Personen auf 50 Items zu simulieren. Hierzu definierten wir jeden Eingang a v i von A als das Ergebnis eines unabhängigen BernoulliVersuchs mit p = .50. Wegen der großen Z a h l von Items schätzten wir die Itemparameter mit Hilfe des in FISCHER (1974, p.269-272) beschriebenen M i n i m u m - C h i Q u a d r a t - V e r f a h r e n s . Als Modelltests benutzten wir die drei in Abschnitt 2 diskutierten Tests auf Stichprobenunabhängigkeit. In A b b . 5 sind die Ergebnisse dargestellt. A u f der Abszisse sind die I t e m p a r a m e t e r abgetragen, welche in der P e r s o n e n g r u p p e mit niedrigen Werten geschätzt wurden (Werte 0 - 2 4 , N = 53), auf der O r d i n a t e die Schätzwerte aus der G r u p p e mit hohen Werten (Werte 25-50, N = 47). Wir sehen s o f o r t , d a ß unsere Daten tatsächlich zufällig sind: r = - . 1 5 . (Die Korrelation zeigt an, d a ß wir mit unserer Datenerzeugung wenig Glück hatten: Wir haben eine A n o r d n u n g von P u n k t e n , die bezüglich einer RASCH-homogenen Menge in genau
obere
untere
Abb.5: Graphische Darstellung von zufällig erzeugten Daten (Konstruktionsverfahren im Text) und deren Parameter: N = 100, K = 50, x = 66.23 (df = 49), r = -.15.
der falschen Richtung orientiert ist. M a n k ö n n t e dies als eine zusätzliche Beeinträchtigung f ü r unsere Simulationsstudie a u f f a s s e n . ) Aber erstaunlicherweise ist der x 2 -Wert des Fits (Modell-Test II) zwischen unteren und oberen Schätzwerten weit d a v o n e n t f e r n t , signifikant zu sein: % = 66.23, df = 49. In diesem Fall aber ist die Nicht-Signifikanz des x 2 -Wertes kein I n d i k a t o r f ü r RASCH-HOITIOgenität; die Ursache liegt vielmehr in der Stichp r o b e n p r o z e d u r und im « h o c h / t i e f » - M o d e l l t e s t . A u f g r u n d der S t i c h p r o b e n p r o z e d u r h a b e n die Gesamtmarginalwerte der Items E a v i = a 0 i eine E r w a r t u n g von 50. U n d tatsächlich variierten die Itemgesamtwerte a o i u m 50, wobei die meisten zwischen 40 und 60 lagen. D a die A n t w o r t e n der 100 P e r s o n e n zufällig erzeugt w u r d e n , sollte die A u f t e i l u n g der Stichprobe zwei G r u p p e n ergeben, j e d e mit u n g e f ä h r 50 P e r s o n e n u n d einer Erw a r t u n g der Itemgesamtwerte a 0 i von Vi x 50 = 25. In beiden Substichproben würden die Itemgesamtwerte und somit die I t e m p a r a m e t e r eine niedrige Varianz h a b e n , weshalb wir eine niedrige 1 2 absolute D i f f e r e n z der Schätzwerte Oj u n d Oj erwarteten. A u s diesem G r u n d waren niedrige % Werte zu erwarten, o b w o h l der Plot von Schätzwerten eine perfekte Z u f a l l s s t r e u u n g von P u n k -
31
Zeitschrift für Sozialpsychologie 1 9 8 1 , 1 2 , 2 4 - 4 1
ten darstellt (siehe A b b . 5). In diesem Fall sollte eine Art von scheinbarer RASCH-Homogenität g e f u n d e n werden. Hieraus k a n n geschlossen werden, d a ß sogar bei 100 P e r s o n e n u n d Zufallsdaten der Modelltest II einen ziemlich großen Fehler 2. Art impliziert. Deshalb m u ß die Validität des Modelltests II e r n s t h a f t angezweifelt werden. Anstatt die RASCH-Homogenität einer Untermenge von Items über die Signifikanz des beobachteten x 2 -Wertes zu bestimmen, entschieden wir uns deshalb f ü r eine Feststellung auf der G r u n d l a g e der Korrelation, genauer: der Linearität des Plots. N a c h d e m wir n u n auf diese Weise einen Itempool hergestellt h a t t e n , der nach üblichen Stand a r d s nicht als RASCH-homogen akzeptiert würde, wie m a n an der Korrelation sieht, benutzten wir diesen P o o l als A u s g a n g s p u n k t f ü r eine I R R . G e m ä ß der I R R eliminierten wir Items mit hohem x 2 -Wert, und um die erhebliche Reduktion des allgemeinen % -Wertes und das Ansteigen der Korrelation zu demonstrieren, eliminierten wir sukzessive 20, 5 u n d n o c h m a l s 5 Items. Der A b fall von x und der Anstieg der Korrelation sind der Tabelle 1 zu e n t n e h m e n . A b b . 5 ist in A b b . 6 wiederholt, wobei in der letzteren die 20 f ü r die «Skala» beibehaltenen Items mit einem Stern markiert sind. Die bandartige Struktur dieser Items ist deutlich zu sehen. In Tabelle 1 k ö n n e n wir sehen, d a ß die Korrelation mit diesen 20 Items einen akzeptablen Wert erreicht, so d a ß m a n fälschlicherweise schließen k ö n n t e , d a ß diese Items RASCH-homogen sind. D a aber diese Items eine U n t e r m e n g e von Zufallsdaten sind, wird die Kreuzvalidierung mit einer anderen P e r s o n e n s t i c h p r o b e dieses Ergebnis zurückweisen. Wir schlußfolgern, d a ß die Simulationsstudie unsere B e h a u p t u n g u n t e r m a u e r t , d a ß eine I R R o h n e eine Validierung mittels einer neuen Personenstichprobe ein schlechtes - und tatsächlich nutzloses - Verfahren zur Itemselektion darstellt. Tab.l:
IRR eines zufälligen Itempools. 2
K
df
X
r
50 30 25 20
49 29 24 19
66.23 7.46 4.12 2.02
-.15 .70 .80 .87
obere
- untere
Abb.6:
Wie man Zufallsdaten «RASCH-homogen» machen kann. *: In der endgültigen Skala beibehaltene Items. Statistiken dieser Skala: N = 1 0 0 , K = 20, x ' = 2.016 ( d f = 19), r = .87.
4.2. Die Studie von
HENNING
In diesem Abschnitt wird gezeigt werden, d a ß es keine einfache A u f g a b e ist, einfache u n d leistungsfähige M e t h o d e n zur a priorischen Eliminierung solcher Items zu f i n d e n , die von M o n o t o nie abweichen. HENNING (1974) versuchte, genau wie WAKENHUT, drei Einstellungen mit Hilfe des RASCH-MOdells zu messen. Bevor er jedoch eine RASCHAnalyse v o r n a h m , eliminierte er solche Items, die g e m ä ß eines Kriteriums ziemlich sicher in der RASCH-Analyse als abweichend a u f f a l l e n würden. HENNING wählte als V o r a u s w a h l m e t h o d e die bei MOKKEN (1971) beschriebene Skalog r a m m t e c h n i k (die wir im folgenden mit S C A M M O bezeichnen). Diese M e t h o d e basiert auf der Idee des « H o l o m o r p h i s m u s » , was auf RASCH (1960, p.169) zurückgeht: MOKKEN leitete von einer A n z a h l von A n n a h men eine Menge von leicht verifizierbaren A n f o r derungen an die b e o b a c h t b a r e n Werte a v i a b , welche von der Verteilung der P e r s o n e n u n a b hängig sind. Wir werden diese A n n a h m e n nicht auflisten, stattdessen aber einige Definitionen geben (MOKKEN, 1971, p.118): -
Die A n t w o r t f u n k t i o n p ( l 1 O i ) heißt homogen, wenn sie ausschließlich über den P a r a m e ter Oj v o m Item i a b h ä n g t .
32 -
-
J a n s e n : Spezifisch o b j e k t i v e M e s s u n g im Falle m o n o t o n e r E i n s t e l l u n g s i l e m s
Die Antwortfunktion ist monoton-homogen, wenn sie homogen (bezüglich O;) und eine monoton steigende Funktion von ist. Die Antwortfunktion ist holomorph, wenn sie monoton-homogen und eine monoton abfallende Funktion von c^ ist.
M O K K E N ( 1 9 7 1 , p.131) hat gezeigt, daß eine notwendige Bedingung für eine monoton-homogene Itemmenge erfüllt ist, wenn gilt:
(9) Pjj(l, 1) > PjPj, Vi, j. M O K K E N ( 1 9 7 1 , p.132) hat auch gezeigt, daß eine notwendige Bedingung für eine holomorphe Itemmenge erfüllt ist, wenn gilt:
(10) (a) P l j ( l , 1) < p I k ( l , 1) (b) P;j(0, 0 ) > p i k ( 0 , 0), (für alle Triaden der Items (i, j, k) gilt: 0 j > 0 k ; d . h . : j ist schwieriger als k, und dies unabhängig von i) Ungleichungen (9) und (10) sind notwendige, aber nicht hinreichende Bedingungen (siehe MOKKEN, 1971, p. 181-182). (10) ist das bedeutsamste Theorem: Es zielt darauf ab, nicht-holomorphe Items zu eliminieren. Die Verifizierung von (10) kann mittels der folgenden Methode vorgenommen werden (nach MOKKEN, 1971, p.134): Wir definieren M als eine K x K Matrix mit den Eingängen m^ = £ v a v i a v j und M + als eine K x K Matrix mit den Eingängen m|j = E v ( l - a v i ) ( l - a v j ) . Wenn die N X K Datenmatrix A hinsichtlich ihrer Spalten-Gesamtwerte von hohen nach niedrigen Werten geordnet ist, dann sollte, sofern (10a) gilt, die obere rechte Dreiecksmatrix in M weder in ihren Zeilen (von links nach rechts) noch in ihren Spalten (von unten nach oben) ansteigende Werte enthalten. Für M + gilt genau das Gegenteil. Nach M O K K E N ist es möglich, mit Hilfe seiner «visuellen Prüfmethode» die Items zu bestimmen, welche vom Holomorphismus abweichen. Gleichung (9) entspricht:
(11)
»
I J =
PUD.
D-P.PI
KPiPjil-PiJU-Pj)
Dies bedeutet, daß im Fall einer Menge von monoton-homogenen Items die Matrix O der Interitem-Korrelationen nur positive (oder 0-) Eingänge enthält. Gleichung (9) gilt, wenn die Items monoton in E,v und homogen in Gj sind. Sie ist ferner formuliert für konstante a t und Oj und für veränderliche was einer Korrelation der Items über die Personen entspricht. Monotonie in Oj (so daß p(l | E,v, O;) mit Oj abfällt) ist keine hinreichende (und auch keine notwendige) Bedingung für (9). Das bedeutet, daß jedes Verfahren, welches den Holomorphismus allein über das Monotonie-Muster der O; zu verifizieren versucht, die Möglichkeit beobachtbarer negativer Korrelationen (11) nicht ausschließt. Gleichung (10) macht mit ihren notwendigen Bedingungen für einen Holomorphismus keine Einschränkungen bezüglich des Monotonie-Musters von sie gibt nur einige Anforderungen an CTj. Deshalb ist es immerhin möglich, daß eine Menge von Items (10) erfüllt und gleichzeitig eine Korrelationsmatrix mit positiven und negativen Eingängen besitzt. In Tabelle 2 geben wir ein konstruiertes Beispiel: Die Datenmatrix und die geordneten Matrizen M und M + erfüllen (10), während die Korrelationsmatrix jedoch (9) verletzt. Man sieht, daß eine Menge von mit (10) übereinstimmenden Items (9) verletzen kann: Der Grund liegt darin, daß (10) keine erschöpfende Beschreibung eines Holomorphismus darstellt. Um eine bessere Verifizierung doppelter Monotonie oder eines Holomorphismus zu bekommen, sollte (10) mit einem analogen Theorem bezüglich der Monotonie von p(l | Oj) in ergänzt werden. Dies würde dann eine visuelle Prüfung des Monotonie-Musters der N x N Matrix M^ erfordern, in welcher die Personen hinsichtlich ihrer marginalen Gesamtwerte £a v i = a v0 gei ordnet sind, und welche die Eingänge £a v i a w i entV
hält. (Natürlich gilt entsprechendes für die analoge Gleichung zu 10b.) Eine solche P r ü f u n g ist jedoch praktisch unmöglich: Die Matrix M^ würde minimal die Dimension 100 X 100 haben. Da also, wie wir gesehen haben, die Itemeliminierung mittels (10) keine Beziehung zu (9) beinhaltet - wobei (9) eine notwendige Bedingung für RASCH-homogene Items darstellt (nämlich Itemkorrelationen größer oder gleich 0) - , erwarten
33
Zeitschrift f ü r S o z i a l p s y c h o l o g i e l 9 8 1 , 1 2 , 2 4 - 4 1
Tab. 2: Datenmatrix (a), die Matrizen M (b) und M + (c), die (10) entsprechen, während jedoch die Korrelationsmatrix (d) (9) verletzt.
1 2 3 4 5 6 7 8 9 10 11 12
a
b
c
d
e
1 1 1 1 1 1 1 1 0 0 1 1
1 1 1 1 1 1 1 0 0 1 1 0
1 1 1 1 1 0 0 0 0 1 0 1
1 1 1 0 0 0 0 0 0 1 1 1
1 0 0 0 0 0 0 0 1 0 0 0
10
9
7
6
2
(a)
a b c d e
a
b
c
d
e
*
8
6 6
5 5 5
1 1 1 1
*
*
*
*
(b)
a b c d e
a
b
c
d
e
*
1
1 2
1 2 4
1 2 4 5
*
*
*
*
ne Garantie f ü r die RASCH-Homogenität dieser Menge. Zur Erstellung einer h o l o m o r p h e n Itemmenge benutzte H E N N I N G neben der «visuellen P r ü f m e t h o d e » ein Suchverfahren, welches auf dem folgenden Homogenitätskoeffizienten H (MOKKEN, 1971, p.149) basiert: I
[Pij(l,
l)-PiPj]
(
H = ii Z
Pi(l-Pj)
(i,j)
(der Index (i, j) bedeutet, d a ß die S u m m a t i o n über alle P a a r e (i, j) läuft, wobei Oj < o ^ Item j ist leichter als Item i, gemessen durch die marginalen Gesamtwerte a 0 i und a o j . ) In H E N N I N G S Suchverfahren wurden die Items so lange umgruppiert, bis der allgemeine H o m o genitätskoeffizient H größer als ein Kriterium wurde. In diesem Fall wurde a n g e n o m m e n , daß das endgültige Item-Cluster eine Skala bildet. Durch die Maximierung von H steigt zwar die Wahrscheinlichkeit, eine Itemmenge mit positiven Korrelationen zu finden, aber dieses Suchverfahren p r ü f t wiederum nur die M o n o t o n i e des Itemparameters c^. A u ß e r d e m ist dieses Verfahren den selben Einwänden ausgesetzt, die wir zur I R R - M e t h o d e von W A K E N H U T v o r b r a c h t e n . Tab. 3: Holomorphismus und RASCH-Modell für drei Fragebögen (+: eine Skala ist auffindbar).
(c)
Holomorphismus
RASCH-
Modell a a b c d e
*
b
c
d
e
Self-esteem
(7 Cluster, jedes etwa 3 Items)
.26
.08 .29
0 .19 .51
-.40 -.26 -.08 0
Genuß und Modernität
Gl, GUI (jedes etwa 10 Items)
Machiavellismus
Mach I, II, IV
*
•
*
+
+
*
(d)
wir weder eine systematische Beziehung zwischen RASCH-Homogenität und (mittels (10)) geschätztem H o l o m o r p h i s m u s noch zwischen beobachtetem H o l o m o r p h i s m u s und klassischer Itemanalyse (auf der Grundlage von Korrelationen). Da ein H o l o m o r p h i s m u s eine notwendige, aber nicht hinreichende Bedingung für RASCHH o m o g e n i t ä t darstellt, ist somit ein nachgewiesener H o l o m o r p h i s m u s einer Menge von Items kei-
Tab. 4: Vergleich zwischen klassischen Itemanalysen und S C A M M O (+ eine Skala ist auffindbar). Skala
Subskala
Itemanalyse
SCAMMO
Mach
I II IV
+ -
+ + +
I II III IV
+ + + +
+
I
+
Genuß und Modernität
Self-Esteem
-
34
Jansen: Spezifisch objektive Messung im Falle m o n o t o n e r Einstellungsiierns
Die Ergebnisse der Analyse von HENNING sind in den Tabellen 3 und 4 dargestellt ( M A C H bedeutet Machiavellismus): Eine mutmaßlich holom o r p h e Itemmenge w u r d e mittels der «visuellen P r ü f m e t h o d e » und des auf H basierenden Suchverfahrens erstellt(zusammengefaßt a l s « S C A M M O » ) , während RASCH-Homogenität u . a . durch den Modelltest II begründet wurde. Tabelle 3 illustriert, d a ß die Studie von HENNING keine A n t w o r t bezüglich der Beziehung zwischen RASCH-Modell und H o l o m o r p h i s m u s geben k a n n . Da H o l o m o r p h i s m u s eine notwendige Bedingung f ü r das RASCH-Modell darstellt, fällt das Ergebnis f ü r die Einstellungsskala «Selfesteem» so ziemlich gegen die Intuition aus. HEN-
ein zweifelhaftes Ergebnis v o r g e f u n d e n werden; deshalb sollte jede Analyse mit dem RASCH-MOdell durch eine Kreuzvalidierungsstudie ergänzt werden. Wir fordern dies ziemlich nachhaltig, weil wir meinen, daß man sich die Strenge der Restriktionen, welche das RASCH-Modell den Daten auferlegt, unzureichend bewußt ist.
NING v e r m u t e t , d a ß die RASCH-Homogenität der
5.
Skala «Self-esteem» mehr oder weniger zufällig a u f t r a t . Aber es k a n n genauso gut sein, d a ß die Abwesenheit eines H o l o m o r p h i s m u s zufällig eintrat, d a das Suchverfahren in S C A M M O Zufallseinflüssen ausgesetzt ist (siehe MOKKEN, 1971, p.193). Tabelle 4 demonstriert, d a ß in HENNINGS Studie keine Verbindung zwischen S C A M M O und klassischer Itemanalyse besteht. In Tabelle 3 sehen wir, d a ß S C A M M O f ü r die Maschiavellismusitems drei h o l o m o r p h e ItemCluster ( M A C H I, II u n d IV) erhielt. In jeder Skala bzw. jedem Cluster wurden mittels der visuellen P r ü f u n g von M und M + vom H o l o m o r phismus abweichende Items identifiziert. Jedoch gab es keine E n t s p r e c h u n g zwischen diesen «verdächtigen» Items u n d solchen, die in einer anschließenden RASCH-Analyse als abweichend a u f f i e l e n . Daraus schloß HENNING, d a ß RASCHAnalyse und S C A M M O (visuelle P r ü f u n g von M und M + ) auf Itemebene nicht übereinstimmen.
Die Simulationsstudie zeigt a u ß e r d e m , d a ß der Modelltest II nicht sehr sensibel ist f ü r Abweichungen von der RASCH-Homogenität; in diesem Fall ist die Korrelation zwischen P a r a m e t e r s c h ä t zungen aus verschiedenen Substichproben ein besserer Indikator f ü r RASCH-Homogenität.
Strukturell monotone Items
Wie wir in der Einleitung schon feststellten, besteht eine Möglichkeit, M o n o t o n i e zu garantieren darin, solche Items zu benutzen, die schon allein a u f g r u n d ihrer F o r m M o n o t o n i e gewährleisten. Diese Art von Items, d u r c h die eine Person veranlaßt wird, m o n o t o n zu a n t w o r t e n , gibt es tatsächlich - obwohl sie praktisch selten vorzufinden sind. Ein relativ altes, aber immer noch benutztes Verfahren mit einer langen Tradition im Bereich der Sozialpsychologie, welches diese A n f o r d e r u n g zu erfüllen scheint, ist die BOGARDus-Skala. Im Abschnitt 5.1. werden wir ihre Eigenschaften diskutieren und ein Datenbeispiel geben. Im Abschnitt 5.2. werden wir ein anderes Beispiel geben, in dem (wahrscheinlich unbewußt) eine Art von BoGARDUS-Skala zur Einstellungsmessung mittels des RASCH-Modells benutzt worden ist.
5 . 1 . D i e BoGARDUS-Skala
Schlußfolgerung Die Studie von HENNING zeigt, daß es keinesfalls eine einfache A u f g a b e ist, eine leistungsfähige a priorische Item-Selektionsmethode zu f i n d e n , welche einfach a n z u w e n d e n ist und gleichzeitig eine Beziehung zu den A x i o m e n des RASCH-MOdells herstellt. Es k a n n gefragt werden, w a r u m wir nicht das RASCH-Modell selbst als ein ItemEliminierungsverfahren verwenden. Wie die Studie von WAKENHUT u n d unsere Simulationsstudie zeigen, kann RASCH-Homogenität leicht als
Die «Skala der sozialen Distanz» von BOGARDUS hat in der Sozialpsychologie eine lange Geschichte. Sie k a n n als ein polytochomes Item mit 7 Antwortkategorien beschrieben werden, wobei eine A n t w o r t des Typs «Wähle irgendeine aus 7» verlangt wird. Das Item besteht aus dem b e t r e f f e n den Einstellungsobjekt, w ä h r e n d die A n t w o r t k a tegorien 7 soziale K o n t a k t e beinhalten, zu denen die Person das Einstellungsobjekt zuläßt oder nicht. Z u m Beispiel: I admit Türks, (1) as a marriage suitor
Zeitschrift für S o z i a l p s y c h o l o g i e 1 9 8 1 , 1 2 , 2 4 - 4 1
(2) (3) (4) (5) (6) (7)
to my club to the street were I live as colleague on my work as Citizen of my country as visitor only of my c o u n t r y not to my country
D u r c h diese sieben A n t w o r t k a t e g o r i e n , oder 7 d i c h o t o m e Items, versuchte BOGARDUS (1925; a b g e d r u c k t in FISHBEIN, 1 9 6 7 , p . 7 1 - 7 6 ) , d i e v o n
ihm so b e n a n n t e «soziale Distanz» zwischen einer P e r s o n u n d einem Einstellungsobjekt zu messen. O b w o h l diese Items eine A u s p r ä g u n g der Präferenz messen, handelt es sich nicht um P r ä f e renz- oder THURSTONE-Items. BoGARDUs-Items haben nämlich einen bemerkenswerten Vorteil gegenüber anderen Einstellungsitems: Sie sind zumindest theoretisch - m o n o t o n (wenn man das Wort «only» in Kategorie oder Item 6 herausläßt). BOGARDUS erhielt diese M o n o t o n i e , welche eine A u s n a h m e im Bereich der Einstellungsfragebogen darstellt, nicht nur a u f g r u n d der mehr oder weniger natürlichen O r d n u n g der A n t w o r t alternativen, sondern hauptsächlich d a d u r c h , d a ß er Einstellungen als eine A u s p r ä g u n g von Akzeptanz auffaßte. In dieser Sichtweise beschreibt eine Menge von Items verschiedene Situationen, durch die es möglich sein sollte, eine Person auf dem «Akzept a n z - K o n t i n u u m » zu lokalisieren. £,v ist d a n n die p e r s o n e n a b h ä n g i g e Disposition, welche die Akzeptierung des b e t r e f f e n d e n Einstellungsobjektes f ö r d e r t («Toleranz»), w ä h r e n d = 0. Der Darstellung dieser Parameter in Abb. 11 ist zu entnehmen, daß durch das Item 5 (und evtl. Item 3) eine annehmbar eindimensionale Lösung verhindert wird. Die Korrelation zwischen den beiden Dimensionen beträgt - . 7 5 . Deshalb eliminierten wir das Item 5 und wiederholten die Analyse (Tabelle 8). In Abb. 12 ist die Dimension « j a » gegen die Dimension «nein» abgetragen, wobei die Korrelation dieser beiden Dimensionen - . 9 2 beträgt. Obwohl Item 3 immer noch abweicht, kann die Lösung also als eindimensional angesehen werden. Wie im Anhang erklärt, berechneten wir die Eigenwerte der 3 x 3 Kovarianzmatrix der Kategorieparameter: ^ = 5.84;
2
= .24.
38
Jansen: Spezifisch objektive Messung im Falle monotoner Eiristellungsitems
Tab. 7: Polytochome Analyse der Akzeptanzskala. Item
nein
Kategorie 1 (ja)
2 (nein)
3 (weiß nicht)
1 2 3 4 5 6 7 8
3.0 1.6 -.5 -.2 .5 -.4 -2.3 -1.7
-3.1 -1.0 -1.1 .1 1.9 .7 1.8 .7
0 0 0 0 0 0 0 0
I
0
0
0
\ \
7
\
\ » X • \
\
6 Ì
4 \
•3
\
2 x
-
\
\
N
nein
\
\
\
Abb. 12: Graphische Darstellung der polytochomen Analyse der reduzierten Akzeptanzskala. Statistiken: N = 357, K = 7, r = - . 9 2 ; (Item 5 eliminiert).
•5
\
\
4V \
3 •
\
\
Eigenvektor (normalisiert auf w' w = 1) wird dann zu:
l \
\
\
w' = ( - . 7 7 2 , .636), \
1
\
Abb. II: Graphische Darstellung der polychotomen Analyse der Akzeptanzskala. Statistiken: N = 367, K = 8, r = - . 7 5 .
Tab. 8: Polytochome Analyse der reduzierten Akzeptanzskala. Item
Kategorie 1 (ja)
2 (nein)
3 (weiß nicht)
1 2 3 4 6 7 8
3.4 1.9 -.4 -.2 -.4 -2.5 -1.8
-2.9 -.8 -.9 .3 .9 2.4 1.0
0 0 0 0 0 0 0
E
0
0
0
Da der erste Eigenwert 96% der Varianz der P u n k t e o- 8 ' erklärt, können wir akzeptieren, daß nur ein Eigenwert existiert. Der entsprechende
welcher die Richtungskosinusse der Hauptachse enthält. Diese ist in A b b . 12 als gepunktete Linie eingetragen. Wie wir gesehen haben, erklärt die erste H a u p t k o m p o n e n t e 96% der Varianz. Im Falle der kompletten Akzeptanzskala (einschließlich Item 5) erklärt die erste Hauptachse (eingetragen in Abb. 11) 86% und die zweite Hauptachse 14% der Varianz (wobei die Items 5 und 3 für den größten Teil dieser 14% verantwortlich sind). Wenn wir mit der reduzierten Akzeptanzskala fortfahren, ergeben sich die Projektionen auf die Hauptachse (mit umgekehrtem Vorzeichen): Item: 1 2 3 4 Projektion: 4.47 1.98 .26 - . 3 5
6
7
8
- . 8 8 -3.46 -2.03,
welches die neuen eindimensionalen Itemparameter sind. Die Korrelation dieser Werte mit denen unter der Dichotomisierung DN beträgt .99 und unter DY ebenso .99. Daraus läßt sich folgern, daß unsere Reduktion gelungen ist. Die Items 1, 2, 3, 4, 6, 7 und 8
39
Zeitschrift für Sozialpsychologie 1 9 8 1 , 1 2 , 2 4 - 4 1
sind e i n d i m e n s i o n a l und s t i m m e n RASCH-Modell sehr gut ü b e r e i n .
mit
dem
E i n Vorteil der p o l y t o c h o m e n A n a l y s e liegt d a r i n , d a ß wir den K o e f f i z i e n t e n w ( g ) aus (5) erh a l t e n , welcher die relative B e d e u t u n g der K a t e g o r i e g a n g i b t . F ü r die reduzierte S k a l a ergibt sich: w(1) = - . 7 7 2 ( j a ) w< 2 »= . 6 3 6 (nein) w(3) = 0
(ich weiß n i c h t )
« I c h weiß n i c h t » liegt somit also m e h r in der R i c h t u n g von « n e i n » , s c h e m a t i s i e r t : ja i —
ich weiß nicht ———i
nein 1
M ö g l i c h e r w e i s e s c h ä m t e n sich die P e r s o n e n einer « n e i n » - A n t w o r t und b e n u t z t e n deshalb die i n d i f f e r e n t e K a t e g o r i e , um ihre negative Einstellung g e g e n ü b e r entlassenen P s y c h i a t r i e p a t i e n t e n auszudrücken.
5 . 2 . Die Studie von STAPF G e n a u wie HENNING, eliminierte a u c h STAPF ( 1 9 7 0 ) vor einer RASCH-Analyse die « s c h l e c h t e n » I t e m s . A b e r a u c h hier fehlte eine Kreuzvalidier u n g , was u m s o u n g l ü c k l i c h e r ist, da nur 9 der ursprünglich 2 0 Items in die endgültige S k a l a a u f g e n o m m e n w o r d e n sind. Bei der S e l e k t i o n dieser I t e m s ging STAPF von der f o l g e n d e n Ü b e r l e g u n g a u s : I t e m s mit den selben m a r g i n a l e n G e s a m t w e r t e n a o j und d e s h a l b mit identischen I t e m p a r a m e t e r n O; k ö n n e n diese W e r t e aus verschiedenen G r ü n d e n erhalten hab e n . STAPF gibt als Beispiel die I t e m s : (1) Z u r S t r a f e schlage ich m e i n e n S o h n / T o c h t e r ziellos. (2) Z u r S t r a f e gebe ich m e i n e m S o h n / T o c h t e r alte S a c h e n zum A n z i e h e n . B e i d e I t e m s k ö n n e n denselben ziemlich niedrigen m a r g i n a l e n G e s a m t w e r t a o i , j e d o c h aus unterschiedlichen G r ü n d e n e r h a l t e n : Die meisten L e u t e werden wegen der S t r e n g e der S t r a f e a u f (1) mit « n e i n » a n t w o r t e n und die gleiche A n t w o r t a u f ( 2 ) g e b e n , weil diese A r t der S t r a f e sehr ungew ö h n l i c h ist. N a c h STAPF ist Item (1) « s t ä r k e r » als I t e m ( 2 ) .
Tab.9: Die endgültigen 9 Items von STAPF (1970), geordnet nach ansteigender «Schwierigkeit» Oj. Item
Inhalt
1 2 3 4 5 6 7 8 9
Zur Zur Zur Zur Zur Zur Zur Zur Zur
Strafe: Strafe: Strafe: Strafe: Strafe: Strafe: Strafe: Strafe: Strafe:
eine Moralpredigt halten sagen: er/sie soll sich schämen Schläge androhen andere Kinder als Vorbild vorhalten seine/ihre Vergehen und Fehler vorhalten ihm/ihr Hausarrest geben ihm/ihr den Hintern versohlen ihn/sie ohrfeigen ihn/sie nicht mehr beachten
Nun a r g u m e n t i e r t STARF, d a ß die I t e m s t ä r k e m o n o t o n mit der I t e m s c h w i e r i g k e i t a n w ä c h s t : E i n I t e m , das m e h r P e r s o n e n a b l e h n t , sollte im Vergleich zu e i n e m leichteren I t e m a u c h eine s c h w e r w i e g e n d e r e S t r a f e b e i n h a l t e n . Diese I t e m s t ä r k e s c h ä t z t e STAPF mittels einer nicht weiter erläuterten R a t i n g - M e t h o d e . D a wir den v o r a u s g e g a n g e n e n A b s c h n i t t kenn e n , k ö n n e n wir s a g e n , d a ß STAPFS Ü b e r l e g u n g e n a u f eine A u s w a h l von I t e m s h i n a u s l a u f e n , welche wie die BoGARDUS-Skala eine k u m u l a t i v e S k a l a bilden. T a b e l l e 9 beinhaltet die 9 endgültigen I t e m s , wobei die I t e m p a r a m e t e r die k u m u l a t i v e S t ä r k e o d e r S t r e n g e der S t r a f e a n g e b e n . E i n e A n zahl g r a p h i s c h e r Tests a u f S t i c h p r o b e n u n a b h ä n gigkeit zeigen, d a ß diese 9 I t e m s eine RASCH-hom o g e n e S k a l a konstituieren (STAPF, 1 9 7 0 , p.111-113).
6.
Diskussion
D a die « l i k e l i h o o d - r a t i o » - S t a t i s t i k sehr sensibel f ü r die Verletzung der M o n o t o n i e a n n a h m e ist (VAN DEN WOLLENBERG, 1 9 7 9 , p. 8 9 ) , k ö n n e n wir ziemlich sicher sein bezüglich der RASCH-HOITIOg e n i t ä t der I t e m s der A k z e p t a n z s k a l a in A b schnitt 5 . W i r n a h m e n eine R e a n a l y s e mit den neuen S t a t i s t i k e n von VAN DEN WOLLENBERG 1 9 7 9 ) v o r , w o d u r c h j e d o c h die H y p o t h e s e der RASCH-Homogenität nicht z u r ü c k g e w i e s e n werden k o n n t e . U m g a n z sicher g e h e n zu k ö n n e n , m ü s s e n wir natürlich eine Kreuzvalidierungsstudie d u r c h f ü h r e n . Bis j e t z t k ö n n e n zwei H a u p t r i c h t u n g e n in der K o n s t r u k t i o n von RASCH-homogenen Einstell u n g s f r a g e b ö g e n unterschieden w e r d e n : D i e erste besteht d a r i n , eine a u g e n s c h e i n l i c h RASCH-ho-
40
Jansen: Spezifisch objektive Messung im Falle monotoner Einslellungsitems
m o g e n e U n t e r m e n g e von Items auszuwählen. Wir n e h m e n an, d a ß die beste Möglichkeit zur Eliminierung abweichender Items das RASCHModell selbst ist ( z u s a m m e n mit einem einfachen A priori-Kriterium wie z . B . positive InteritemKorrelationen). Natürlich setzt dies gute Teststatistiken voraus, die f ü r verschiedene Verletzungen des RASCH-Modells sensibel sind. A m wichtigsten ist jedoch eine Kreuzvalidierung. Die zweite M e t h o d e zielt (mittels einer Einstellungstheorie) auf die K o n s t r u k t i o n einer k u m u l a tiven Skala ab, welche der w o h l b e k a n n t e n BoGARDUS-Skala analog ist. Hier k a n n allerdings g e f r a g t werden, o b alle Einstellungsfragebögen in Begriffen einer kumulativen Distanzskala umformuliert werden k ö n n e n . Unserer Ansicht n a c h ist dies jedoch eine Frage von Skalenkonstruktionstechniken - und nicht eine theoretische F r a g e bezüglich der N a t u r von Einstellungen. Die Definition einer Einstellung in der Sozialpsychol o g i e ( z . B . FISHBEIN & AJZEN, 1975, p . 6 ) k a n n
kein Hindernis f ü r solch eine K o n s t r u k t i o n sein. Wenn es jedoch absolut unmöglich ist, eine M e n g e von m o n o t o n e n Items auszuwählen oder eine kumulative Skala zu konstruieren, und wenn d e n n o c h spezifische Objektivität verlangt wird, d a n n ist eine andere M e t h o d e v e r f ü g b a r . Diese M e t h o d e benötigt jedoch ein ziemlich extensives D a t e n e r h e b u n g s v e r f a h r e n , u m genügend I n f o r m a t i o n e n f ü r eine eindeutige Lokalisierung der P e r s o n e n - und I t e m p a r a m e t e r zu b e k o m m e n (vgl. A b b . l ) . In einer späteren Veröffentlichung werden wir die Eigenschaften dieser M e t h o d e diskutieren.
Anhang Dimensionalitätsreduktion RASCH-Modells
des
polychotomen
In Abschnitt 2 formulierten wir die Gleichung (4) f ü r das polytochome RASCH-Modell mit dem P a rameter f ü r die allgemeine Kategorie g des Items i: Oj(g) (g = 1, ..., S). Wenn wir S Kategorien haben, kann jedes Item als ein S-dimensionaler Vektor (mit dem letzten Element = 0) repräsentiert werden. Diese K Vektoren fassen wir in der K x S Matrix X mit den Eingängen a - g ) zusamm e n . N u n interessieren wir uns f ü r die H a u p t a c h se, welche durch die Streuung der P u n k t e l ä u f t , die aus den Itemvektoren bestehen. Die P r o j e k -
tion der Itemvektoren auf diese Achse ergibt die gesuchte eindimensionale Lösung, w ä h r e n d die Distanzen zwischen den Vektoren u n d der Achse minimal ist (was genau die Definition der H a u p t achse ist). A b e r wie wir wissen (MORRISON, 1976, p. 278), sind die Richtungskosinusse dieser Achse gleich den Elementen des normalisierten Eigenvektors, welcher zum größten Eigenwert der Kovarianzmatrix der Variablen g e h ö r t . In unserem Fall sind die S Kategorien die Variablen, so d a ß sich eine S x S Kovarianzmatrix X ' X / K = E ergibt (wobei E Oj