200 81 26MB
German Pages 75 [80] Year 1979
H ERAUSGEBER H U B E R T F E G ER
C. F. G R A U M A N N KLAUS HOLZKAMP MARTIN IRLE
BAN D 9
1978
H E FT 2
VERLAG HANS HUBER BERN STUTTGART WIEN
Zeitschrift für Sozialpsychologie 1978, Band 9, Heft 2 INHALT
Zu diesem Heft
109
Theorie und Methoden GIGERENZER, G . Artefakte in der dimensionsanalytischen Erfassung von Urteilsstrukturen FIEDLER, K.: Multiple Regression - Ein Modell der Urteilsbildung
110 117
SCHULZE, G.: Ein Verfahren zur multivanaten Analyse der Bedingungen von Rangvariablen. Hierarchische Rangvarianzanalyse
129
Empirie KLUMP, H. & BANDILLA, W.. Wertkonnotationen der Skalenbenennung und ihr Einfluß auf Extremisierungseffekte bei der Beurteilung von Attitüden-Items BORG, J
Ein Vergleich verschiedener Studien zur Lebensqualität
142 152
LANTERMANN, E.-D. & LAVEAUX, P.: Generalisierung über Personen und Situationen bei der Beurteilung alter Menschen
165
Diskussion AMELANG, M. & WENDT, W.: Feststellungen zu den „Bemerkungen" von Berger und Schulte
173
Literatur Neuerscheinungen
178
Titel und Abstracta
180
Autoren
182
Copyright 1978 Verlag Hans Huber Bern Stuttgart Wien Druck Lang Druck AG, Liebefeld-Bern Printed in Switzerland Library of Congress Catalog Card Number 78 - 126626 Die Zeitschrift für Sozialpsychologie wird in Social Sciences Citation Index (SSCIj und Current Contents/Social and Behavioral Sciences erfaßt
Zeitschrift für Sozialpsychologie 1 9 7 8
109
Zu diesem Heft Seit BRUNER und TAGIURI 1 9 5 4 das Konstrukt „implizite Persönlichkeitstheorie" in die Sozialpsychologie einbrachten, ist das Interesse an impliziten Theorien wach. WEGNER und VALLACHER bieten in ihrer Untersuchung von 1 9 7 7 bereits sechs Typen impliziter Theorien an. Eine der wichtigsten Erkenntnisse über dieser Beschäftigung mit dem Impliziten ist die, daß die implizite Psychologie nicht nur die „naive" des „Laien" ist, sondern auch die des wissenschaftlichen Psychologen, wenn er naiv, d.h. unreflektiert, mit Modellen und Methoden operiert, die seiner expliziten Theorie nicht angemessen sind. Am Beispiel einer dimensionsanalytischen Erfassung von Urteilsstrukturen zeigt GIGERENZER, wie derartige wissenschaftliche Naivität zu Artefakten führen kann. Daß „einprägsame, auf Formalisierungen beruhende Modelle auf strukturell ähnliche, aber nicht gleiche, kognitive Prozesse übertragen werden" und damit Probleme schaffen, ist auch ein Argument des Beitrags von FIEDLER, der im übrigen das Paradigma der multipen Regression als Modell der Urteilsbildung dadurch in Frage stellt, daß er BRUNSWIK (auf dessen Linsenmodell das Paradigma zurückgeht) in seiner Repräsentativitätsforderung ernster nimmt als die Verfechter des MRP als Urteilsmodell. Neben dem Sozialpsychologen wird den Diagnostiker der Vorschlag interessieren, in einer von Fiedler entwickelten Methode die Kodier- und die Integrationsleistung zu erfassen. Ein Verfahren, eine Gesamtstichprobe nach möglichen Bedingungen „baumanalytisch" in Untergruppen aufzuteilen, „die hinsichtlich der abhängigen Variablen möglichst homogen sind", stellt G . SCHULZE mit seiner hierarchischen Rangvarianzanalyse vor. Im empirischen Teil, der diesmal ganz der Problematik sozialer Wahrnehmung und Beurteilung gewidmet ist, berichten KLUMP und BANDILLA über ihren Versuch, durch eine Integration zweier (akzentuierungs-) theoretischer
Ansätze zu einer besseren Erklärung und Vorhersage von Polarisierungs- bzw. Extremisierungseffekten (bei der Beurteilung von Attitüden-Items) zu kommen. Sie setzen damit die Reihe der (seit 1971) in dieser Zeitschrift veröffentlichten Beiträge zum Problem der Wahrnehmungs- bzw. Urteilsakzentuierung fort. BORG, der 1976 in dieser Zeitschrift Grundkonzepte der Facettentheorie vorgestellt hatte (Band 7 , 2 3 1 — 2 4 7 ) , demonstriert anhand dreier deutscher Untersuchungen zur Lebensqualität, welchen Informationswert „perzeptive Sozialindikatoren" im Rahmen der Facettentheorie gewinnen. Der für jedes soziale Urteil mittlerweile als wichtig erkannten Interaktion zwischen der Perzeption sozialer Sachverhalte und der jeweiligen Situation, in der diese perzipiert werden, widmen LANTERMANN & LAVEAUX eine Studie, die Stereotypisierungsprozesse (über alte Männer) zum Thema hat. Ein zusätzliches theoretisches Interesse verdient die hier überprüfte Hypothese durch ihre Herleitung aus einer Verknüpfung von Reizklassifikations- und Attributionstheorie. Der Diskussionsteil schließt mit der Replik von AMELANG & WENDT auf die im letzten Heft erschienenen Bemerkungen von Berger und Schulte eine Kontroverse ab, die um den Beitrag „Stabilität und Veränderungen von Einstellungen gegenüber Fragen der aktuellen Politik" 1 9 7 7 in Band 8 , 1 6 7 - 1 8 4 , entbrannt war. Angegriffene Autoren erhalten in dieser Zeitschrift grundsätzlich das unbeschnittene Recht zur ein- und letztmaligen Replik. Die Zeitschrift hat sich seit ihrem Bestehen auch der wissenschaftlichen Kontroverse geöffnet und sie wird ihr, auch wenn diese gelegentlich cum ira et studio geführt wird, weiterhin Raum geben. Im übrigen gelte, wie AMELANG & WENDT bekennen: „Stilfragen sind Geschmacksache". C. F. Graumann
110
G i g e r e n z e r : A r t e f a k t e in d e r d i m e n s i o n s a n a l y t i s c h e n E r f a s s u n g v o n U r t e i l s s t r u k t u r e n
Theorie und Methoden Artefakte in der dimensionsanalytischen Erfassung von Urteilsstrukturen G E R D GIGERENZER I n s t i t u t für P s y c h o l o g i e d e r Universität M ü n c h e n
Die A n w e n d u n g v o n M e t h o d e n d e r m e h r d i m e n s i o n a l e n Skalierung zur Analyse von Urteilsstrukturen geht mit d e r M ö g l i c h k e i t e i n h e r , d a ß die d u r c h d e n d i m e n s i o n s a n a l y t i s c h e n U n t e r s u c h u n g s p l a n g e n e r i e r t e n Ergebnisse ( U r t e i l s s t r u k t u r e n ) A r t e f a k t e d a r s t e l l e n . Dies wird f ü r das E r g e b n i s d e r U n t e r s u c h u n g v o n ROSENBERG & SEDLAK ( 1 9 7 2 a ) in d e r v o r l i e g e n d e n A r b e i t n a c h g e w i e sen. D e r N a c h w e i s e r f o l g t auf d e m H i n t e r g r u n d einer g e n e r e l l e n T h e o r i e über A r t e f a k t e in d e r d i m e n s i o n s a n a l y t i s c h e n F o r s c h u n g . Diese w i e d e r u m basiert auf der Implikationsthese, welche besagt, d a ß jede dimens i o n s a n a l y t i s c h e M e t h o d e d u r c h ihre A n w e n d u n g auf einen psychologischen Gegenstandsbereich eine charakt e r i s t i s c h e T h e o r i e ü b e r d i e s e n G e g e n s t a n d s b e r e i c h impliziert. S t e h t l e t z t e r e mit der g e g e n s t a n d s b e z o g e n e n T h e o r i e des F o r s c h e r s , die die K o n s t r u k t i o n d e r Frages t e l l u n g u n d die I n t e r p r e t a t i o n b e s t i m m t , im Widers p r u c h , so wird das E r g e b n i s als „ D i v e r g e n z - A r t e f a k t " bezeichnet.
T h e a p p l i c a t i o n of m u l t i d i m e n s i o n a l scaling m e t h o d s t o t h e analysis of j u d g m e n t s t r u c t u r e s e n t a i l s t h e possibility t h a t t h e results ( j u d g m e n t s t r u c t u r e s ) arrived at by m e a n s of t h e d i m e n s i o n a l - a n a l y t i c e x p e r i m e n t a l design are n o t h i n g o t h e r t h a n a r t e f a c t s . T h e p r e s e n t p a p e r d e m o n s t r a t e s this w i t h regard t o t h e result o b t a i n e d in t h e s t u d y b y ROSENBERG & S E D L A K ( 1 9 7 2 a ) . T h e e v i d e n c e is p r e s e n t e d against t h e b a c k g r o u n d of a g e n e r a l t h e o r y o n a r t e f a c t s in d i m e n s i o n a l - a n a l y t i c research. T h e t h e o r y is in t u r n b a s e d o n t h e „ i m p l i c a tion thesis", which states that any dimensional-analytic m e t h o d s i m p l i e s a c h a r a c t e r i s t i c t h e o r y in relat i o n t o t h e p s y c h o l o g i c a l area u n d e r s t u d y . S h o u l d this t h e o r y be at variance w i t h t h e r e s e a r c h e r ' s p s y c h o l o g i cal t h e o r y regarding t h e s a m e p s y c h o l o g i c a l area - a t h e o r y w h i c h , of c o u r s e , d e t e r m i n e s t h e f o r m t h e inv e s t i g a t i o n will t a k e a n d its i n t e r p r e t a t i o n - t h e n t h e result is d e s c r i b e d as a „ d i v e r g e n c y a r t e f a c t " .
Dimensionsanalytische Modelle werden heute in wachsendem Ausmaß zur Abbildung von Urteilsstrukturen verwendet (vgl. ROSENBERG & SEDLAK, 1972a, b; SCHNEIDER 1973). In diesem Beitrag wird
plikationsthese" (GIGERENZER 1977) zugrunde. Diese beinhaltet, daß jedes mathematische System (z. B. eine dimensionsanalytische Methode) bereits durch seine Anwendung auf einen psychologischen Gegenstandsbereich G eine psychologische Theorie über diesen Gegenstandsbereich G impliziert. Diese psychologische Theorie sei als das „mathematisch strukturierte psychologische Modell (MSPM)" von G bezeichnet. Zum besseren Verständnis wird der folgende Gedankengang an einer dimensionsanalytischen Untersuchung von PEABODY (1967) zum Urteilsverhalten entwickelt, welche die innerhalb der Vielfalt dimensionsanalytischer Modelle allgemein vertraute korrelationsstatistische und faktorenanalytische Methodik verwendet. An ihrem Beispiel wird aufgezeigt, daß die Ver-
1. ein Modell der Artefakte dieses Forschungsbereiches entworfen und 2. für die Studie von ROSENBERG & SEDLAK (1972a) „Structural Representations of Perceived Personality Trait Relationships" der Nachweis geführt, daß sie ein „DivergenzArtefakt" (s.u.) darstellt. Entwurf eines Modells der Artefakte in der dimensionsanalytischen Forschung Den folgenden Ausführungen liegt die sog. „Im-
Zeitschrift für S o z i a l p s y c h o l o g i e 1 9 7 8 , 9 , 1 1 0 - 1 1 6
nachlässigung der durch diese Methoden implizierten psychologischen Modelle (MSPM) von G zu Artefakten, d.h. zu theoretisch wertlosen Ergebnissen führt. PEABODY versuchte, unter dem Titel „Trait Inferences: Evaluative and Descriptive Aspects" die Anteile der beiden so bezeichneten Aspekte bei der Personenbeurteilung mit Hilfe des TraitInference-Ansatzes abzuschätzen. Er kam zu dem - früheren Untersuchungen (z. B. OSGOOD, 1 9 6 2 ; OSGOOD, S u a & TANNENBAUM, 1 9 5 7 ) w i -
dersprechenden — Ergebnis: „The common emphasis on the importance of evaluation in judgment was critically examined in a study of inferences between traits... the descriptive aspects were always decisive over evaluation. Factor analysis showed that none of the factors was evaluative(PEABODY,
1 9 6 7 , 1).
Im folgenden wird nun ein kleiner, jedoch innerhalb der von PEABODY herangezogenen faktorenanalytischen Methodik wichtiger Teil des methodischen Vorgehens betrachtet: die Produkt-Moment-Korrelation (PMK). Die PMK ist ein normiertes Skalarprodukt und kann in Verbindung mit einer Objektmenge als mathematisches System bezeichnet werden. Sobald PEABODY die PMK zur Bestimmung (genauer: als Modell) der paarweisen Zusammenhänge zwischen den Persönlichkeitsmerkmalen heranzieht, aus denen anschließend durch Faktorenanalyse die evaluativen Anteile berechnet werden, hat die PMK in Verbindung mit der Menge der bipolaren Persönlichkeitsmerkmale (Skalen) als Objektmenge die Funktion eines mathematischen Modells übernommen. PEABODY geht dabei von Vierergruppen von Merkmalen aus, die jeweils aus den beiden deskriptiven Gegensätzen (z. B. serious-gay) und deren evaluativen Kontrasten (hier: grimfrivolous) bestehen. Die in die Untersuchung eingehenden bipolaren Skalen konstruiert er unter Berücksichtigung sowohl des deskriptiven als auch des evaluativen Gegensatzes (also hier die beiden Skalen: serious-frivolous und gay-grim und nicht z. B. serious-gay). Diese so erhaltenen Persönlichkeitsskalen werden interkorreliert. Dem mathematischen Modell der PMK entspricht gemäß der eingangs formulierten Impli1
Hervorhebung durch den Verfasser.
111 kationsthese ein psychologisches Modell (MSPM) über Urteilsverhalten in der Trait-Inference-Versuchsanordnung. PEABODY hat dieses psychologische Modell nicht expliziert. Die folgenden Ausführungen beschränken sich auf einen einzigen Satz im mathematischen Modell der PMK, der einen entsprechenden Satz im zugeordneten MSPM impliziert. Letzterer steht im Widerspruch zu einem theoretischen Postulat PEABODYS. Dieses Postulat liegt der Fragestellung und Versuchsanordnung zugrunde und läßt sich folgendermaßen formulieren: (1) Deskription und Evaluation sind zwei relevante Aspekte im Urteilsverhalten der Vpn in der vorliegenden Versuchsanordnung. Der entscheidende Satz im mathematischen Modell ist der über die Mittelwert-Transformation: (2) Durch die PMK werden die Skalen mittelwert-normiert. Mit der Anwendung der PMK auf die Peabodysche Versuchsanordnung wird ein entsprechender psychologischer Satz über das Urteilsverhalten der Vpn impliziert: (3) Unterschiedliche mittlere Urteile auf den bipolaren Eigenschaftsskalen enthalten keine problemrelevante Information über das Urteilsverhalten der Vpn. „Problemrelevante I n f o r m a t i o n " hat, entsprechend der Peabodyschen Fragestellung und Versuchsanordnung die Bedeutung von Information über deskriptive und evaluative Aspekte im Urteil. PEABODY hat zur Bestimmung der PMK die bipolaren Eigenschaftsskalen bezüglich der evaluativen Polarisierung gleichgerichtet. Die unterschiedlichen Mittelwerte der Skalen weisen damit auf evaluative Unterschiedlichkeit hin. Somit folgt aus dem explizierten Satz (3) des MSPM unmittelbar der Satz (4): (4) Evaluative Varianz (Evaluation) ist kein relevanter Aspekt des Urteilsverhaltens der Vpn in der vorliegenden Versuchsanordnung. Dieser Satz des MSPM steht in klarem Widerspruch zu PEABODYS theoretischem Postulat und damit zu den der Fragestellung und Versuchs-
112
Gigerenzer: A r t e f a k t e in der d i m e n s i o n s a n a l y t i s c h e n Erfassung v o n Urteilsstrukturen
anordnung zugrunde liegenden theoretischen Annahmen. Hierdurch wird verständlich, warum die Faktorenanalyse der Korrelationsmatrix keine evaluative Dimension aufweisen konnte. Eine Re-Analyse von PEABODYS Urteilsdaten durch ROSENBERG & OLSHAN (1970) über die euklidische Distanz als Operationalisierung des Ähnlichkeitsbegriffes zeigt entsprechend zu den obigen Ausführungen einen starken evaluativen Faktor auf. Die Re-Analyse und Kritik der Autoren erfolgt jedoch wiederum ohne Bezug auf ein aus dem mathematischen Modell expliziertes MSPM, und die spätere eigene Untersuchung (ROSENBERG & SEDLAK, 1972a) mit Hilfe der nonmetrischen multidimensionalen Skalierung (NMDS) wird weiter unten erstmals als ein erneutes Divergenz-Artefakt (s.u.) ausgewiesen.
ein methodisches Problem, sondern u m die Divergenz zweier theoretischer Vorstellungen handelt. Auf der einen Seite steht die gegenstandsbezogene Urteilstheorie eines Forschers, auf der anderen das psychologische Urteilsmodell, das durch das jeweils zur Anwendung kommende mathematische System miteingeht. Diese theoretischen Artefakte werden in der vorliegenden Arbeit als „Divergenz-Artefakte" gekennzeichnet. Sie sind von den eigentlich methodischen Artefakten, die durch Unzulänglichkeiten des Algorithmus verursacht werden (z. B. lokale Minima und degenerierte Konfigurationen in der NMDS, vgl. SHEPARD, 1974) und für die psychologische Theoriebildung kaum Bedeutung haben, begrifflich zu trennen.
Das Paradigma des Divergenz-Artefakts
Der Nachweis eines Divergenz-Artefakts in der Studie von ROSENBERG & SEDLAK
In der Untersuchung von PEABODY werden die Konsequenzen deutlich, welche die mangelnde Berücksichtigung von „Methoden" als mathematische Modelle und die damit einhergehende Vernachlässigung des impliziten psychologischen Urteilsmodells (MSPM) haben kann. Diese Konsequenzen werden — falls entdeckt — meist als „methodische A r t e f a k t e " bezeichnet. Aus den vorangegangenen Ausführungen ist ersichtlich geworden, daß es sich dabei nicht um
Das Paradigma des Divergenz-Artefakts ist in Abb. 1 dargestellt.
Die Studie von ROSENBERG & SEDLAK (1972a) stellt eine in mancher Hinsicht bemerkenswerte Entwicklung in der Anlage dimensionsanalytischer Untersuchungen über Urteilsstrukturen dar. Zum einen werden als Datenbasis nicht Urteile auf vorgegebenen Skalen, sondern freisprachliche Texte zur Personenbeurteilung verwendet, zum anderen erfolgt die Analyse dieser freien Texte erstmals über NMDS, wodurch auf
I Postulate widersprüchlich
t __J M a t h e m a t i s c h strukturiertes p s y c h o l o gisches Modell (MSPM) d e s Gegenstandsbereichs: Postulate 1, . . . , P 2
•*
(Implikationsthese)
Abb. 1. Paradigma d e s Divergenz-Artefakts. D i e d u r c h g e z o g e n e n Pfeile g e b e n den U n t e r s u c h u n g s ablauf, die u n t e r b r o c h e n e n Pfeile die V e r k n ü p f u n g mit d e m MSPM wieder.
113
Zeitschrift für S o z i a l p s y c h o l o g i e 1 9 7 8 , 9 , 1 1 0 - 1 1 6
eine Reihe fraglicher Annahmen (vgl. GIGERENZER & STRUBE, 1 9 7 8 ) verzichtet werden kann. Im folgenden wird der Nachweis erbracht, daß das Ergebnis der bis heute unkritisierten und vielzitierten Studie ein Divergenz-Artefakt darstellt. Er wird dadurch geführt, daß zwischen einem theoretischen Postulat von ROSENBERG & SEDLAK und einem durch das verwendete mathematische Modell implizierten Postulat ein Widerspruch aufgezeigt wird. Dabei steht die Problematik einer theoriebezogenen Operationalisierung des Ähnlichkeitsbegriffs innerhalb des dimensionsanalytischen Versuchsplanes im Vordergrund. Da die Autoren ihre theoretische Position nicht ausführen (vgl. dagegen die Entwicklung eines durch die Anwendung der NMDS implizierten MSPM über Urteilsverhalten bei GiGERENZER, 1 9 7 7 ) , sondern schlicht davon ausgehen, daß Persönlichkeitsmerkmale umso häufiger gemeinsam bei der Beschreibung von Personen verwendet werden, je stärker die Zusammenhangskognitionen der Merkmale („perceived personality trait relationships") sind, m u ß das für den Nachweis eines Artefaktes bedeutsame theoretische Postulat von ROSENBERG & SEDLAK im folgenden erst expliziert werden. Anhand Abb. 2 lassen sich am Beispiel von vier Eigenschaftsbegriffen die bei ROSENBERG & SEDLAK zugrundeliegenden theoretischen Vorstellungen veranschaulichen. 2
0zufrieden o liberal 0warm
Bei Eigenschaften, die eine kleine Distanz voneinander und damit große Ähnlichkeit haben, liegen starke Zusammenhangskognitionen vor. Dementsprechend kann als theoretisches Postulat der Autoren der folgende Satz abgeleitet werden: Je stärker die Zusammenhangskognitionen zweier Beschreibungsbegriffe, desto höher ihre gemeinsame Auftretenswahrscheinlichkeit. Da das hypothetische Konstrukt "Zusammenhangskognition" im räumlichen Modell (invers) durch den euklidischen Distanzbegriff ersetzt, bzw. auf ihn abgebildet wird, ergibt sich als formale Fassung dieses Postulats: w^f-id..)
(1)
wobei Wjj für die gemeinsame Auftretenswahrscheinlichkeit der Beschreibungsbegriffe i und j, % für eine monoton fallende Funktion und djj für die euklidische Distanz von i und j steht. Im folgenden wird zunächst am Beispiel von Abb. 2, dann allgemein gezeigt, daß das hier explizierte theoretische Postulat (1) von ROSENBERG & SEDLAK mit der Operationalisierung des Begriffs „gemeinsame Auftretens Wahrscheinlichkeit" als Teilaspekt des zur Anwendung gekommenen mathematischen Modells im Widerspruch steht. Damit ist das Paradigma eines Divergenz-Artefakts erfüllt. Die Operationalisierung wird in der Studie wie folgt definiert: „A disagreement score between traits i and j was first obtained for each subject in the study. A subject l's disagreement score between traits i and j was defined as follows: m s
• kalt kühn 0
Abb. 2. Modell einer Urteilsstruktur zur Personenbeurteilung. Eingezeichnet sind vier Beschreibungsmerkmale.
iji=
2 V W / m p= 1
(2)
where m is the number of persons described by the subject (generally 10 in the study), r ; i and Tjj are the number of times he used i and j, respectively, in all m descriptions, and p is an index for the person being described. If i and j never co-occur in any of the m persons described by 1, then Sy, = 1. If i and j co-occur in at least one person, then
114
Gigerenzer: Artefakte in der dimensionsanalytischen Erfassung von Urteilsstrukturen
0 1 f
P
if neither i nor j occur in p if either i or j but not both occur in p if both i and j occur in p
=
r ji V d The Sj, was defined as the average of Ml value " all s i j 1 values. That is
V j ^ / N
(3)
where N is the number of subjects" (a.a.O., 153) 2 . Das Unähnlichkeitsmaß ist in Anlehnung a n ROSENBERG, NELSON & VIVEKANANTHAN
(1968) definiert: « i j = 2 Csik " s j k ) 2 keT
(4)
wobei T die Menge der „traits" ist. In der freien Personenbeschreibung variieren die Häufigkeiten, mit denen verschiedene Beschreibungsmerkmale verwendet werden, beträchtlich. Die Häufigkeiten der 80 Merkmale streuten in der zitierten Untersuchung in einem Bereich zwischen 143 und 10.
Aus Gleichung ( 1 ) folgt die Forderung (5), die durch eine adäquate Operationalisierung 3 erfüllt werden muß: , < s 34
(5)
Aus der Definition von s ^ ergibt sich für das oben konstruierte Beispiel: = (1 + 1 + 1 + 1 + 1 + 1 + 4 - 1 ^ - ! )/10 =.66 1 _1 S341 = (1 + 1 + 1 + 1 + + 5 • 0)/10 =.40 3 3 Es folgt: s121 > s341 s 121
Betrachtet man die Vp 1 als mittlere Vp, so gilt nach (3): s 12> s 34
(6)
Die Ungleichung ( 6 ) steht mit dem aus dem theoretischen Postulat ( 1 ) der Autoren abgeleiteten Satz ( 5 ) im Widerspruch. Die Verletzung der Monotonitätsbedingung durch das Maß s^ gilt darüber hinaus für das unter ( 4 ) definierte Maß Sy, das zur Berücksichtigung der Verwendung von Synonyma, die ja eher alternativ als gemeinsam verwendet werden, eingeführt wurde 4 .
Unter Berücksichtigung unterschiedlicher Häufigkeiten sei für die in Abb. 2 eingeführten vier Beschreibungsmerkmale angenommen, die Person 1 habe in ihren 10 Personenbeschreibungen lOmal „zufrieden", 4mal „liberal" und je 3mal „ w a r m " und „kühn" gebraucht. „Liberal" ( = 1) sei dabei immer zusammen mit „zufrieden" ( = 2) verwendet worden, „ w a r m " ( = 3) und „kühn" ( = 4 ) dagegen seien ein einziges Mal zusammen aufgetreten. 2 In einer weiteren, im wesentlichen identischen Veröffentlichung ( R O S E N B E R G & S E D L A K , 1972b) verwenden die Autoren einen unterschiedlichen Koeffizienten, den sie nicht angeben, sondern lediglich auf eine unveröffentlichte Arbeit von S E D L A K (1971, zit. in R o S E N B E R G & S E D L A K , 1972b) verweisen. Über die Modelladäquatheit dieser Operationalisierung kann hier nichts ausgesagt werden. Doch zeigt diese zweite Ver-
öffentlichung, daß der Streß mit der Verwendung des nicht angegebenen alternativen K o e f f i z i e n t e n sogar leicht ansteigt.
3 Dabei ist zu beachten, daß das Maß s^ bei ROSENB E R G & S E D L A K nicht als Ähnlichkeitsmaß, sondern als Unähnlichkeitsmaß („disagreement s c o r e " ) definiert ist. 4 Betrachtet man das mathematische Modell ( 4 ) genauer, so wird deutlich, daß es das Synonyma-Problem zwar elegant, jedoch nur unter der Annahme gleicher Verwendungshäufigkeiten der sinnverwandten Beschreibungsbegriffe löst. Faßt man „ S y n o n y m i e " zweier Begriffe i und j nicht als dichotome, sondern als quantitative Variable auf, so läßt sie sich operational als der Anteil aller Personen (allgemein: aller Sätze) bestimmen, in denen i durch j und j durch i substituiert werden können. Eine hiervon abweichende mathematische Definition ist unter ( 4 ) gegeben. Dort liegt Synonymie vor, wenn zwei Begriffe i und j mit allen dritten Begriffen k gleiche Auftretenshäufigkeiten haben. Beide Definitionen stimmen genau dann überein, wenn i und j mit allen k gleich häufig auftreten. Eine Gleichverteilung der Häufigkeiten liegt bei R O S E N B E R G & S E D L A K (1972a, 151 f . ) jedoch nicht vor.
115
Zeitschrift für Sozialpsychologie 1 9 7 8 , 1 1 0 - 1 1 6
h
Das läßt sich wie folgt zeigen:
— 22 = 22 ( (ssiw i k - s sjilr k )J keT
5U
(7)
(aus (1), (5) u n d (6))
25) und durch „o" die mit den kleinsten Auftretenshäufigkeiten (12 > r j > 10).
Die Strukturierung des Urteilsraumes von (1972a, 158) durch die Relation „Differenz der Häufigkeiten" wird in Abb. 3 aufgezeigt. Obgleich die Anpassungsgüte der zweidimensionalen Konfiguration bei einem Streß S = .30 nicht hoch ist, ist die Differenzierung der Beschreibungsbegriffe zur Personenbeurteilung nach ihren Häufigkeiten klar zu erkennen 5 . ROSENBERG & SEDLAK
5 Es ist denkbar, daß das Artefakt noch deutlicher ausfallen würde, wenn nicht ein Zusammenhang zwischen der Dimension „Häufigkeit rj" und der „globalen Bewertung" der Persönlichkeitsmerkmale i bestünde. Dieser Zusammenhang zeigt sich nach Durch-
116
Gigerenzer: A r t e f a k t e in der dimensionsanalytischen Erfassung von Urteilsstrukturen
Bei der Anwendung mathematischer Methoden auf psychologische Fragestellungen im allgemeinen und bei der Anwendung dimensionsanalytischer Versuchspläne auf die Untersuchung von Urteilsstrukturen im besonderen gehen zweierlei psychologische Modellvorstellungen über den untersuchten Gegenstandsbereich mit ein. Um ein Untersuchungsergebnis gegen eine Interpretation als Divergenz-Artefakt abzusichern, muß der Forscher sowohl 1. seine eigene gegenstandsbezogene psychologische Theorie (z. B. in Form von Postulaten) als auch 2. das durch das mathematische Modell implizierte gegenstandsbezogene psychologische Modell explizieren und 3. auf das Vorliegen widersprüchlicher Postulate hin prüfen. Das mathematische Modell ist dabei durch die Gesamtheit aller auf die Untersuchung von G angewendeten mathematischen Operationen definiert. Weist die Prüfung auf die Struktur eines Divergenz-Artefakts hin, so ist mindestens eine der folgenden Veränderungen notwendig: 1. Die Veränderung des MSPM über die Wahl anderer mathematischer Modelle zur Ähnlichkeitsmessung und Skalierung. Alternativ e n z e i g e n z. B. GREGSON ( 1 9 7 5 ) , BOORMANN & ARABIE ( 1 9 7 2 ) u n d BOYD ( 1 9 7 2 ) . D i e s e
können sowohl innerhalb der dimensionsanalytischen Konzeption als auch außerhalb (vgl. z. B. BOYD [ 1 9 7 2 ] ) g e f u n d e n w e r d e n .
2. Die Veränderung der gegenstandsbezogenen psychologischen Theorie des Forschers. Die Konsequenz des hier dargestellten Gedankenganges ist, daß nur solche psychologische Fragestellungen über ein bestimmtes dimensionsanalytisches Modell valide untersucht werden können, die auf einem dem mathematischen Modell entsprechenden MSPM basieren. sieht der Häufigkeitstabelle (a.a.O., 151 f.). Er besteht darin, daß im allgemeinen positiv b e w e r t e t e Begriffe häufiger zur Personenbeurteilung verwendet werden als negativ bewertete. Die S t r u k t u r i e r u n g der Merkmale nach der Dimension „ H ä u f i g k e i t " in Abb. 3 wirkt sich d e m n a c h zu einem u n b e k a n n t e n Anteil in Richtung einer Strukturierung durch eine globale Urteilsdimension „positive vs. negative B e w e r t u n g " aus.
Literatur BOORMAN, S.A. & ARABIE, P. 1972. S t r u c t u r a l measures and the m e t h o d of sorting. In R . N . S h e p a r d , A. K. R o m n e y & S. B. Nerlove (eds.) Multidimensional scaling. Vol.I. New Y o r k : Seminar Press. BOYD, J. P. 1972. I n f o r m a t i o n distance f o r discrete structures. In R . N . S h e p a r d , A. K. R o m n e y & S.B. Nerlove (eds.) Multidimensional scaling. Vol.1. New Y o r k : Seminar Press. GIGERENZER, G. 1976. Sprachliche Begriffssysteme in der Personenbeurteilung. Vortrag, gehalten auf der 18. Tagung der experimentell a r b e i t e n d e n Psychologen in Bochum. GIGERENZER, G. 1977. N o n m e t r i s c h e multidimensionale Skalierung als Modell des Urteilsverhaltens. Zur Integration von dimensionsanalytischer Methodik u n d psychologischer Theoriebildung. Dissertation, München. GIGERENZER, G. & STRUBE, G. 1978. Zur Revision der üblichen A n w e n d u n g dimensionsanalytischer Verfahren. Z. Entw. Psychol. Päd. Psychol. 1 0 , 7 5 - 8 6 . GREGSON, R . A . M . 1975. Psychometrics of similarity. New York: Academic Press. OSGOOD, C.E. 1962. Studies o n the generality of affective meaning systems. Amer.Psychologist 17, 10—28.
OSGOOD, C.E., S u c i , G.J. & TANNENBAUM, B.H. 1957. The measurement of meaning. Urbana: Univ. of Illinois Press. PEABODY, D. 1967. Trait inferences: evaluative and descriptive aspects. J. Pers. Soc. Psychol. 7 (4, whole No. 644). ROSENBERG, S., NELSON, C. & V I V E K A N A N T H A N , P. S.
1968. A multidimensional a p p r o a c h t o t h e structure of personality impressions. J. Pers. Soc.Psychol. 9 283-294. ROSENBERG, S. & OLSHAN, K. 1970. Evaluative and descriptive aspects in personality p e r c e p t i o n . J.Pers. Soc. Psychol. 16, 6 1 9 - 6 2 6 . ROSENBERG, S. & SEDLAK, A. 1972a. Structural representations of perceived personality trait relationships. In: R o m n e y , A.K., Shepard, R . N . & Nerlove, S. G. (eds.) Multidimensional scaling. Vol.11. New Y o r k : Seminar Press. ROSENBERG, S. & SEDLAK, A. 1972b. Structural representation of implicit personality t h e o r y . In: Berkowitz, L. (eds.) Advances in experimental social psychology. Vol.6, New Y o r k : Academic Press. SCHNEIDER, D.J. 1973. Implicit personality t h e o r y : a review. Psychol. Bull. 79, 2 9 4 - 3 0 9 . SHEPARD, R.N. 1974. Representation of structure in similarity data: p r o b l e m s and prospects. Psychometrika 39, 3 7 3 - 4 2 2 . SUPPES, P. & ZINNES, J. L. 1963. Basic measure^ ^ ment t h e o r y . In: Luce, R . D . , Bush, R . R . & ^ H Galanter, E. (eds.) H a n d b o o k of m a t h e m a t ical psychology. Vol.1. New Y o r k : Wiley. I J
117
Zeitschrift für Sozialpsychologie 1 9 7 8 , 9, 1 1 7 - 1 2 8
Multiple Regression — Ein Modell der Urteilsbildung? KLAUS FIEDLER Fachbereich Psychologie der Justus-Liebig-Universität Gießen
Dieser Beitrag befaßt sich mit einer experimentellen Anordnung, die auf einer Formalisierung v o n BRUNSWIKS Linsenmodell beruht, dem „multiple regression paradigm" (MRP). Innerhalb dieses Paradigmas wurden während der letzten Jahre zahlreiche Untersuchungen zur Urteilsbildung durchgeführt, die zu pessimistischen Folgerungen über die Effizienz menschlicher Urteiler, aber auch zu deskriptiven Interpretationen über den Urteilsprozeß führten. Das MRP beschreibt die kognitive Verarbeitung von Merkmalsinformationen nach b e s t i m m t e n Kompositionsregeln. Viele B e f u n d e über die Merkmalsintegration erhalten j e d o c h eine alternative Interpretation, wenn man die Abbildung von ,,distal-ökologischen Variablen" (sensu BRUNSWIK) auf die Merkmalsebene als Teil des kognitiven Prozesses versteht.
This article is concerned with an experimental arrangement based o n a formalization of BRUNSWlKs lens model, the „multiple regression paradigm" (MRP). Within this paradigm, numerous studies have been conducted during the last years, leading to pessimistic implications about human judges' e f f i c i e n c y as well as to descriptive interpretations about the process of judgement formation. The MRP-methodology describes the cognitive utilization of cue-informations according to certain c o m p o s i t i o n rules. Many findings concerning cue-utilization can be alternatively interpreted, h o w ever, if the representation of „distal ecological variables" (sensu BRUNSWIK) is conceived as part of the cognitive process.
Das sogenannte „multiple regression paradigm" (MRP) stellt eine experimentelle Anordnung zur Untersuchung kognitiver Informationsverarbeitung dar, deren methodische Stärke und Eleganz vor allem durch den Formalisierungsgrad und ein integriertes Forschungsprogramm begründet ist (vgl. SLOVIC & LICHTENSTEIN, 1 9 7 1 ; HAMMOND et al., 1 9 7 5 ) . Das MRP bildet eine unmittelbare Operationalisierung des Brunswikschen Linsenmodells, und seine heutigen Vertreter — insbesondere Hammond und Mitarbeiter — interpretieren ihre empirischen Befunde auch fest auf dem Boden Brunswikscher Methodologie, des „probabilistischen Funktionalismus". Der vorliegende Beitrag befaßt sich mit kritischen oder eher: skeptischen Überlegungen zur Untersuchung bewußter, rationaler Vorgänge des Urteilens und Problemlösens mithilfe des MRP. Es sei vorab klargestellt, daß sich diese Kritik weder gegen das MRP als solches richtet noch die Brauchbarkeit des übergeordneten Linsenmodells einschränken soll. Sie folgt im Gegenteil m. E. Brunswiks Denkweise und seiner Forderung nach einem repräsentativen Design,
wenn die Eignung des MRP, zu psychologischen Aussagen über eine bestimmte Klasse kognitiver Vorgänge zu gelangen, angezweifelt wird. Das Linsenmodell sollte ursprünglich die psychologischen Beziehungen bei der physikalischen und sozialen Wahrnehmung abbilden (BRUNSWIK, 1 9 5 6 ) , wie sie zwischen nicht unmittelbar beobachtbaren ökologischen Variablen (Entfernung; Intelligenz) und deren subjektiver Wahrnehmung bestehen und durch sensorisch faßbare Variable oder „Cues" (Textur, Helligkeit; Stirnhöhe, Kopfform) vermittelt werden (vgl. Abbildung 1). In methodologischer Hinsicht erweiterte BRUNSWIK allerdings den Anwendungsbereich dieses mediationalen Modells auf die Untersuchung aller möglichen Anpassungsvorgänge des Organismus an ökologische Gegebenheiten aufgrund probabilistischer Erfahrungen. Er bezog seinen probabilistischen Funktionalismus auf die multivariaten, probabilistischen, größtenteils unbewußt ablaufenden peripheren Wahrnehmungsvorgänge. Er grenzte davon die anders funktionierenden höheren kognitiven Vorgänge des rationalen Denkens, des „Reasoning", ab:
118
F i e d l e r : M u l t i p l e Regression - Ein M o d e l l d e r U r t e i l s b i l d u n g
„Cues" Textur
„ecological validity"^
Test A Merkmal 1 Disparität
„cue-utilization" Subjektive Variable Subj. E n t f e r n u n g
Ökologische Variable Entfernung Test B Merkmal 2 Helligkeit
Prognose Klassenzuordnung
„ R i c h t i g e " Diag n o s e , Klassenzugehörigkeit 1.Teilprozeß'
Test C Merkmal 3 Bewegungsparallaxe
2. T e i l p r o z e ß
Test D Merkmal 4
„functional validity"
Abb. 1: V e r a n s c h a u l i c h u n g des L i n s e n m o d e l l s an v e r s c h i e d e n e n k o g n i t i v e n L e i s t u n g e n : T i e f e n w a h r n e h m u n g ( o b e r e Kennzeichnung), diagnostischer Urteilsbildung u n d Begriffsbildung (untere Kennzeichnungen). Der Z u s a m m e n h a n g z w i s c h e n Y u n d X m i ß t die A n p a s s u n g s l e i s t u n g des I n d i v i d u u m s ( „ f u n c t i o n a l v a l i d i t y " ) . Diese wird v e r m i t t e l t d u r c h e i n e n z w e i s t u f i g e n V o r g a n g : Die A b b i l d u n g von X auf die „ C u e s " a, b, c, d, e r f a ß b a r als „ e c o l o g i c a l v a l i d i t y " , u n d die k o g n i t i v e V e r a r b e i t u n g der „ C u e s " zu e i n e m s u b j e k t i v e n Urteil Y ü b e r X ( „ c u e - u t i l i z a t i o n " ) .
„The entire pattern of the reasoning solutions ... resembles the switching of trains at a multiple junction, with each of the possible courses being well organized and of machinelike precision yet leading to drastically different destinations. ... The relative ease of switching off at any one of a series of choice points in a basically linear, unidimensional, all-or-none series of relays is at least in part the result of the precise formulation, yet relatively small number of basic cues, involved in most typical reasoning tasks. ... On the other hand, intuitive perception must simultanously integrate many different avenues of approach, or cues. Whereas distance is directly stated in the reasoning version, its perceptual registering' must remain based on insufficient evidence, that is, on criteria none of which is foolproof or fully ,ecologically valid'" (BRUNSWIK, 1 9 5 6 , p . 9 1 f.). Warum der Linsenmodell-Ansatz jedoch gerade mit der Untersuchung höherer kognitiver Vorgänge des Urteilens und Problemlösens ver-
knüpft wurde (vgl.
HAMMOND et al., 1 9 7 5 ; zeigt sich an seiner strukturellen Übereinstimmung (vgl. Abbildung 1) mit den Forschungsansätzen des „Multiple-CueProbability-Learning" (z. B. ARMELIUS & A R M E LIUS, 1 9 7 5 ) und zahlreichen Experimenten zur (meist diagnostischen) Urteilsbildung (LEE & TUCKER, 1 9 6 2 ; GOLDBERG, 1 9 7 0 ) sowie mit der experimentellen Anordnung zur Begriffsbildung FISCHHOFF, 1 9 7 6 ) ,
( v g l . BRUNER e t a l . , 1 9 5 6 ) .
Für die strukturellen Gemeinsamkeiten dieser Ansätze soll zunächst ein fester Sprachgebrauch vereinbart werden. Die Aufgabe der Vp besteht darin, eine Regel oder Beziehung zwischen Kriteriumsklassen X, und den Ausprägungen a k , b|, c m , d n von Merkmalen a, b, c, d zu finden oder zu erlernen, um ein Urteil Y¡ über die Klassenzugehörigkeit abzugeben. — Bei der Begriffsbildung m u ß z. B. gelernt werden, daß die Ausprägungen „ r o t " und „Dreieck" der Merkmale „ F a r b e " und „ F o r m " , konjunktiv verknüpft, in regelmäßiger Beziehung zu den beiden Kriteriumsklassen „richtig" und
Zeitschrift für Sozialpsychologie 1 9 7 8 , 1 1 7 - 1 2 8
„falsch" stehen. Tiefenwahrnehmung basiert auf erlernten Regelmäßigkeiten zwischen den Ausprägungen bestimmter Cues (Textur, Disparität) und den quantitativen Klassen des Kriteriums „Entfernung". Die Anwendung der gelernten Regeln ermöglicht dann ein Urteil über die Entfernung aufgrund der Cues. Dieses Regelerkennen ist deshalb ein wichtiger Bestandteil der Untersuchungsanordnung, weil nicht nur das Resultat, sondern vor allem die Entstehung des Urteils oder der Problemlösung erfaßt werden soll. Das MRP im engeren Sinne beruht auf einer Formalisierung des Linsenmodells (HURSCH et al., 1964) entsprechend einer doppelten multiplen Regression. Die sequentielle Versuchsanordnung sieht vor, daß die Vp bei jedem Durchgang Informationen über die Merkmale a, b, c, d (z. B. 4 Testwerte) erhält und daraufhin ein Urteil oder eine Vorhersage Y (z. B. über das Ausmaß von Neurotizismus) trifft; anschließend bekommt die Vp ein Feedback über das Kriterium X (i.e. die richtige Vorhersage). Es kommt darauf an, die Beziehung zwischen X und den Merkmalen a, b, c, d über viele Durchgänge hinweg zu ermitteln, um die eigenen Urteile Y so genau wie möglich an X anzupassen. — Die zu lernende Beziehung („ecological validity") wird durch die multiple Regression von X auf a, b, c, d beschrieben und die Urteilsstrategie („cue-utilization") der Vp durch die Regression von Y auf a, b, c, d, das heißt durch die Gewichte, welche die Vp den einzelnen Merkmalen über viele Durchgänge hinweg beimißt. Dabei erhalten verschiedene korrelative Statistiken zwischen X, Y und den Merkmalen eine psychologische Interpretation ( H A M M O N D & SUMMERS, 1972). Auf diese konkrete Versuchsanordnung beziehen sich die folgenden Argumente, auf eine Untersuchungsmethode zur Urteilsbildung, die das Erkennen einer Beziehung verlangt. (Die Argumente treffen jedoch teilweise auch für die strukturell ähnlichen Begriffsbildungs-Experimente zu.)
Zur externen Gültigkeit des MRP Mit welchem Gültigkeitsanspruch die im Rahmen des MRP gesicherten empirischen Ergeb-
119 nisse verknüpft werden, zeigen die daraus abgeleiteten psychologischen Aussagen und Interpretationen. — Die allgemeinste Aussage der für das MRP typischen Experimente betrifft die Suboptimalität und Fehlerhaftigkeit — gemessen an einem normativen Modell — menschlicher Urteiler (vgl. SLOVIC & LICHTENSTEIN, 1971). Hiermit zusammen hängt die seit zwei Jahrzehnten andauernde Kontroverse über „klinische vs. aktuarische Urteilsbildung" ( M E E H L , 1954; GOLDBERG, 1970). GOLDBERGS provozierender Vergleich „Man vs. Model of Man" veranlaßte ihn und andere Autoren zu ! der Folgerung, daß ein Diagnostiker, der mehrere Test werte a k , b,, c m , d n zu einer Diagnose Y¡ integriert, immer noch von einer Formel oder einem Computer-Programm übertroffen wird, das seine eigene Strategie (oder besser noch: die Strategie eines Experten) simuliert, d.h. einfach seine aufgrund der Regressionsrechnung ermittelten Gewichtungen der einzelnen Tests verwendet. Der Grund für dieses nur auf den ersten Blick paradoxe Ergebnis liegt darin, daß der Computer des Diagnostikers eigene Urteilsregel letztlich konsistenter anwendet. Die Unterlegenheit gegenüber einem linearen Modell liegt dabei keineswegs an der Tendenz geübter Diagnostiker, die Testwerte in nicht-linearer, konfigurationaler Weise zu verarbeiten, denn die Kompositionsregel eines Urteilers ist fast immer durch ein lineares Modell beschreibbar. Diese Goldbergschen Folgerungen betreffen im Grunde die Effizienz, mit der eine Regel — zunächst ohne Rückmeldung — angewendet wird, während beim MRP das Erlernen einer Beziehung und damit der Prozeß der Urteilsbildung im Vordergrund steht. Trotzdem haben GOLDBERGS provokative Befunde sicherlich die folgenden Aussagen mitbestimmt, die unter den meisten Vertretern des MRP als gesichert und als charakteristisch für rationale Urteilsbildung im allgemeinen gelten: Bei der Aufgabe, mehrere Merkmale so zu gewichten und zu kombinieren, daß die Urteile nach einer Zahl von Durchgängen mit der Rückmeldung übereinstimmen, werden nicht-lineare Beziehungen gar nicht oder nur mit großer Mühe gelernt ( H U R S C H et al., 1964; HAMMOND et al., 1964). Andererseits lernen die Vpn auch eine lineare Urteilsregel nur sehr unvollkom-
120
Fiedler: Multiple Regression - Ein Modell der Urteilsbildung
men zu beherrschen. Die Abweichungen vom optimalen, normativen Urteilen beruhen dabei — neben semantischen Einflüssen (KAHNEMAN & TVERSKY, 1 9 7 3 ) , die eher anekdotisch behandelt werden — auf verzerrtem Gebrauch des Zahlensystems und auf dem sogenannten Konservativismus, d.h. der Tendenz, valide Merkmale verglichen mit invaliden nicht extrem genug zu gewichten (PETERSON et al., 1 9 6 5 ) . Menschliche Urteiler sind jedoch zu einer besseren (auch nicht-linearen) Informationsverarbeitung imstande, wenn sie anstelle des üblichen „Outcome-Feedback" eine kognitiv adäquatere Rückmeldung bekommen, nämlich in Form ihrer eigenen Urteilsstrategie (i. e. Regressionsgewichte) im Vergleich zur optimalen Strategie ( H A M M O N D & SUMMERS, 1 9 7 2 ) . Der Ausnutzung solcher Feedback-Techniken zum Zwecke eines Urteils- oder Entscheidungstrainings gilt gegenwärtig ein Teil des Forschungsinteresses. Dieser stark verkürzte Abriß gibt dennoch in etwa die psychologischen Aussagen der MRPForschung wieder. Übrigens ist zu bedenken, daß diese Aussagen z.T. durchaus deskriptiv gemeint sind und nicht bloß auf normative Modelle bezogen. Demgegenüber stehen nun die folgenden methodischen Einschränkungen, die gewöhnlich nicht explizit formuliert werden: El:
E2:
E3:
E4:
E5: E6:
Untersucht werden solche Urteilsprozesse, die aus einer Sequenz von völlig gleich strukturierten Einzelbeurteilungen bestehen. Die Merkmale, mit deren Integration Urteilsbildung gleichgesetzt wird, müssen nicht erst wahrgenommen oder entdeckt werden, sondern liegen bereits als exakte Werte vor. Sämtliche Merkmale (Prädiktoren) müssen in der Regel beim Urteil berücksichtigt werden; es gibt selten irrelevante Merkmale. Merkmale und Kriterium haben zumeist die Form von abgestuften oder numerischen Variablen. Das „richtige Urteil" ist als Außenkriterium bekannt. Die zu lernende Urteilsregel kennzeichnet ein System, das über viele Beurteilungen hinweg unveränderlich und statisch bleibt.
Auf die vorangegangenen Explikationen wird gelegentlich bezug genommen, wenn die Frage der Repräsentativität des MRP im folgenden behandelt wird.
Repräsentativität bezüglich rationaler Urteilsbildung Schlußfolgerungen vom multiplen Wahrscheinlichkeitslernen im Sinne des MRP auf den Prozeß rationaler Beurteilung — wie sie teilweise in FISCHHOFFS ( 1 9 7 6 ) ansonsten lesenswertem Artikel über MRP und Attributionstheorie enthalten sind - haben m. E. viel Verwirrung erzeugt. Die Meinungsbildung eines Richters, das klinische Urteil, die Prognose eines Börsenmaklers oder die Leistungsbeurteilung eines Lehrers sind Beispiele für das, was hier als „rationale Beurteilung" bezeichnet wird. Es handelt sich hierbei um einmalige (nicht sequentielle) Beurteilungen aufgrund von komplexen semantischen Informationen (z. B. Beobachtungsprotokolle, sprachliche Mitteilungen), die eine gewisse Ähnlichkeit mit wissenschaftlicher, rationaler Vorgehens weise haben, weil sie stets eine Begründung oder Systematisierung (STEGMÜLLER, 1970) einschließen. Ein Gesichtspunkt, der sich unmittelbar aufdrängt, betrifft die Unterscheidung zwischen sequentiellen Urteilsformen (immer wiederholte MMPI-Auswertungen) und der Aktualgenese einer Einzelbeurteilung. Während das MRP so angelegt ist, daß die Vp ihre Aufgabe sequentiell strukturiert und die Rückmeldungsinformation ausnutzt, muß der Diagnostiker aufgrund der semantischen Struktur der Gesamtinformation ein einmaliges Urteil abgeben (wenngleich die Stimulus-Informationen sequentiell erfolgen können). Dieser Unterschied ist für den kognitiven Vorgang von großer Bedeutung: Die sequentielle Anordnung einschließlich Feedback soll die Vp zu einer aktiv hypothesentestenden Strategie veranlassen. Dagegen m u ß der Diagnostiker die Bedingtheit eines Symptoms durch einen perzeptiv strukturierenden Prozeß herausfinden, d.h. er muß semantische und epistemische Prinzipien zuhilfe nehmen, um die Zusammenhänge einer einmaligen Information zu erfassen 1 . — Dieses Problem 1
Dies gilt wenigstens größtenteils für die h e r k ö m m -
liche Diagnostik.
Zeitschrift für S o z i a l p s y c h o l o g i e 1 9 7 8 , 9 , 1 1 7 - 1 2 8
der kognitiven Strategie soll später ausführlicher behandelt werden. Hier dient es lediglich dem Hinweis auf die häufig ignorierte Einschränkung des MRP auf sequentielle Beurteilungen (vgl. E l ) , wie sie in realiter recht selten etwa in institutionalisierter oder bürokratisierter Form (Personalauslese, Börsenmakler) vorkommen, um Entscheidungen innerhalb relativ statischer Systeme zu treffen (vgl. E6). Das Linsenmodell als Bezugsrahmen ist nun keineswegs an solche sequentiellen Vorgänge gebunden, wie der folgende Entwurf einer Untersuchung über diagnostische Urteilsbildung zeigt: Die Vp bekommt hintereinander eine Reihe von Informationen über eine Stimulus-Person (Klient). Jede Information enthält eine Verhaltensbeschreibung oder -beobachtung und sagt aus, unter welchen Bedingungen a, b, c, d (soziale Anreize, Medikamente, Örtlichkeiten usw.) die Person bestimmte Verhaltensweisen Xj (Symptome, Assets) zeigt. Aus den Korrelationen zwischen den Merkmalen a, b, c, d und dem Kriterium X erklärt die Diagnostiker-Vp die Bedingtheit der Symptomatik und kann daraufhin auch Vorhersagen Y{ treffen. Die korrelativen Kennwerte des Linsenmodells sind hier auch auf die Entstehung einer einzelnen Beurteilung anwendbar. Ein solcher Entwurf eines Experiments weicht hauptsächlich in zweierlei Hinsicht vom üblichen MRP ab: (a) Die komplexen StimulusInformationen enthalten neben den validen Merkmalen a, b, c, d sicherlich eine Vielzahl irrelevanter Informationen, von denen der Urteiler abstrahieren muß (vgl. E3), und (b) die Beschaffenheit der Stimulus-Informationen verlangt eine weitaus stärkere Betonung des semantischen Aspekts (vgl. E4, E2). Der Unterschied erster Art (a) trägt ohne Frage dazu bei, die Repräsentativität oder „Inhaltsvalidität" des Designs bezüglich natürlicher Urteilsbildung - verglichen mit dem MRP - zu verbessern. Umgekehrt verdeutlicht er die problematische Einschränkung des MRP auf ausschließlich relevante Merkmale. Es scheint ohne weiteres denkbar, dass der als „Konservativismus" bezeichnete Fehlereinfluß, weniger valide Cues zu stark zu gewichten, mit diesem Umstand zusammenhängt, daß es nämlich ausschließlich relevante Cues gibt. Diese von der Wirklichkeit abweichende Situation könnte
121 eine Einstellung hervorrufen, wonach sämtliche Cues bedeutsam sind. Abgesehen davon kann man sich vorstellen, daß bei einer Vielzahl von Cues die Gewichtung viel weniger entscheidend ist als grundsätzlich falsche MerkmalsawswaW. Die zweite Veränderung (b) gegenüber dem MRP hebt zunächst eine Selbstverständlichkeit hervor. Sprachlich-semantische Einflüsse wurden zwar auch von Vertretern des MRP aufgegriffen, aber theoretisch bezeichnenderweise als „fehlleitende Tendenzen" behandelt (MILLER, 1971, Titel: „Do labels mislead?"). Abgesehen von der trivialen Einsicht in die semantische Beschaffenheit des kognitiven Vorgangs wird durch den semantischen Aspekt vor allem der erste Teilprozeß (vgl. Abbildung 1) der Informationsverarbeitung im Sinne des Linsenmodells berücksichtigt: die Abbildung einer distalen ökologischen Variablen auf die Merkmalsebene. Denn der Urteiler bekommt die Merkmale nicht in Form von klar definierten Werten (MMPI-Profile, Zahlen) vorgelegt, sondern m u ß die komplexen Stimulus-Informationen erst nach semantischen Kategorien codieren (vgl. E2). Stimuli sind bei dieser veränderten Anordnung nicht die Merkmale selbst, sondern Beobachtungen oder Mitteilungen. Entscheidend ist, daß der Experimentator, um die bei der Urteilsbildung wirksamen Merkmale zu kontrollieren, die semantischen Kategorien des Urteilenden erst kennen muß. — Die semantische Natur der Merkmalsstruktur ist vielleicht der wichtigste Unterscheidungsgrund zwischen höheren und periphären kognitiven Prozessen. Die Beziehung zwischen einer ökologischen Variablen (z. B. einer Verhaltensstörung) und deren Abbildung auf eine Reihe von Merkmalen - einschließlich des Problems der Anzahl und Auswahl von Merkmalen — wird von der MRP-Methodologie dem Experimentator überlassen. Es ist jedoch charakteristisch für rationale Urteilsbildung, daß der Urteiler die Stimulus-Informationen erst nach semantischen Merkmalen codieren muß, daß die Abbildung von distalen Variablen auf die Merkmalsebene also ein Teil seiner kognitiven Leistung ist, der von SARBIN et al. (1960) „Instantiation" genannt wird. Wie sich zeigen wird, ergeben sich grundsätzlich andere Gesichtspunkte für die Interpretation der Befunde des MRP, wenn man den ersten Teilprozeß der Urteilsbildung, das Codie-
122
Fiedler: Multiple Regression — Ein Modell der Urteilsbildung
ren der semantischen Information, berücksichtigt. Was während des ersten Teilprozesses an Merkmalsinformation nicht codiert wird, kann später nicht in das Urteil eingehen. Auf diesem Prinzip basiert z. B. auch die Tragweite von C R A I K & LOBKHARTS ( 1 9 7 2 ) Konzept „levels of processing", i. e. der semantischen Tiefe des Codierens. Daß eine ähnliche Variable, nämlich die Vielfalt der an einer Information codierten Merkmale, die Urteilsbildung verändert, zeigte eine Untersuchung von F I E D L E R (in Vorbereitung). Die Vpn hatten anhand mehrerer Verhaltensbeschreibungen das Sozialverhalten einer Stimulus-Person zu beurteilen, wobei es entweder darauf ankam, möglichst viele Aspekte jeder Verhaltensbeschreibung zu codieren oder aber einen einzigen Bedeutungsaspekt. Die Codierungen waren als offene Eintragungen in ein vorgegebenes semantisches Kategoriensystem vorzunehmen. Durch dieses transparente Kategoriensystem konnte beobachtet werden, wie trotz identischer StimulusInformation die beiden Codierweisen zu unterschiedlichen Eintragungsmustern und schließlich zu divergenten Beurteilungen führten. Das Erkennen einer Beziehung zwischen X und a, b, c, d, das den untersuchten Urteilsformen zugrunde liegt, kann bei semantischen, Bedeutung tragenden Merkmalen nicht allein auf Korrelationen zurückgeführt werden. So ist es bekannt ( C H A P M A N & C H A P M A N , 1 9 6 9 ) , daß plausible, konsistente Korrelationen mit gleichen Ausprägungen bei ähnlichen Merkmalen leichter gelernt oder wahrgenommen werden. Übrigens weist auch B R U N S W I K neben der Korrelation auf mögliche andere Ähnlichkeitsmaße hin (vgl. E4). Bei der veränderten Versuchsanordnung muß die Vp weniger eine korrelative Beziehung erkennen als vielmehr Proximitätsmaße zwischen Merkmalen und Kontingenzen zwischen Merkmalen und Kriterium.
Deskriptive Aussagen über kognitive Informationsverarbeitung Sofern die Forderung akzeptiert ist, daß auch das Zustandekommen der Merkmalsinformation untersucht werden muß, könnte man ein Zwei-Stufen-Modell der Urteilsbildung, beste-
hend aus beiden Teilprozessen des Codierens und Integrierens, vorschlagen (vgl. Abbildung 1). Beim Codieren werden Beobachtungen oder Mitteilungen semantisch kategorisiert; das Ergebnis ist diejenige Merkmalsinformation, die den Input für das Integrieren bildet. Übrigens können gemäß BRUNSWIKS „Vicarious Functioning" dieselben Beobachtungen auf verschiedene Merkmalssysteme abgebildet werden. — Für den zweiten Teilprozeß, das Integrieren, könnte man die Methodik und die empirischen Befunde des MRP gelten lassen. Als Ergänzung wäre dann eine zweite Untersuchungsmethode zu entwickeln, die den ersten Teilprozeß, das Codieren, genauer zu analysieren gestattet. Ziel der folgenden Argumentation ist es jedoch nicht nur zu zeigen, daß das Codieren von Informationen nach einem semantischen Merkmalssystem größere Beachtung verdient. Es soll vielmehr deutlich gemacht werden, daß bereits dem Codieren die entscheidende Bedeutung bei der Informationsverarbeitung zukommen kann, so wie der Wert eines Beobachtungsverfahrens in der Verhaltensdiagnostik — um ein künstliches aber klares Beispiel zu geben — viel mehr von der Auswahl der Kategorien als von der Verrechnung dieser Kategorien abhängt. — Das gewichtigste Argument besagt jedoch, daß das Integrieren nicht losgelöst vom Codieren behandelt werden darf, so daß die meisten gesicherten Befunde des MRP über die Merkmalsintegration alternativ erklärt werden können. Eine kurze Betrachtung additiver Modelle in der Urteilsbildung (vgl. auch A N D E R S O N , 1 9 7 4 ) mag dies verdeutlichen. Es ist vielfach belegt, daß es menschlichen Urteilern schwer fällt, Merkmale nach einer nicht-additiven Kompositionsregel zu integrieren. Untersucht man aber das „Wie wird kombiniert?" nicht losgelöst vom „Welche Merkmale werden kombiniert?", dann wird die Aussage sinnlos, daß die Urteiler Wechselwirkungen oder konfigurationale Beziehungen nicht verarbeiten können: Die Aufgabe könnte, um ein erfundenes Beispiel zu geben, darin bestehen, zwei Merkmale a und b nach folgender multiplikativer Regel zu einer Vorhersage Y zu integrieren: Y = w,a + w 2 b + w 3 ab, wobei w,, w2 und w 3 als Gewichte aufzufassen sind, a könnte z.B. ein Interessentest, b ein Motivationstest und Y die Prognose des
123
Z e i t s c h r i f t für S o z i a l p s y c h o l o g i e 1 9 7 8 , 9, 1 1 7 - 1 2 8
Schulerfolgs sein. Das multiplikative Glied w 3 ab besagt, psychologisch gesehen, daß der Einfluß von Interesse auf den Schulerfolg vom Motivationsgrad moderiert wird. Die UrteilerVp sagt den Schulerfolg von z.B. 100 Schülern voraus, jeweils aufgrund zweier Testwerte a und b, und erhält nach jeder Vorhersage als Rückmeldung die richtige Prognose. Es zeigt sich, daß die Vp nicht lernt, die Wechselwirkung ab zu berücksichtigen. Ein solcher Befund bedeutet jedoch keineswegs, daß die Vp dasselbe Problem nicht mit anderen Mitteln lösen kann. Entscheidend ist in dem Beispiel, daß der Vp vom Experimentator ein Merkmalssystem, bestehend aus zwei Kategorien a und b, aufgezwungen wird. Wären die Test-Informationen über die Schüler nach den Kategorien a, b, ab" (Interesse bei geringer Motivation) und ab + (Interesse bei hoher Motivation) codiert, so reduzierte sich die Aufgabe auf eine simple additive Vorhersageregel. Die Vp könnte sich ihre Aufgabe erheblich erleichtern, wenn sie ein anderes Merkmalssystem wählen dürfte. Spielt die Wechselwirkung zwischen Interesse und Motivation eine Rolle, so ist es sogar naheliegend, daß ein vernünftiger Urteiler den Einfluß des Interesses bei geringer und hoher Motivation (ab~ und ab + ) gesondert erfaßt. Hierüber erhält die Vp jedoch keine Information. Würde der Teilprozeß des Codierens in die Untersuchung einbezogen, indem man Verhaltensbeschreibungen von Schülern als Stimulus-Informationen verwendet, so könnte die Vp von sich aus andere Merkmalskategorien verwenden, welche die Wechselwirkung besser erfassen. Man sieht an diesem Beispiel, daß die „NichtAdditivität" oder „Konfigurationalität" eines Urteilsproblems ein Konstrukt des Experimentators ist, der nach dem Modell der multiplen Regression zu denken gewohnt ist. Dies ist der schwerwiegendste Grund der Kritik: Was eine beliebige Kompositionsregel leistet, leistet immer auch eine andere Kompositionsregel, die auf andere Merkmalskategorien angewandt wird 2 . Eine Kompositionsregel kann keine Beschreibung eines Urteilsproblems sein. Es ist daher sinnlos, Kompositionsregeln isoliert zu untersuchen und daraus Aussagen über die Fähig2
Diese B e h a u p t u n g ist allerdings nicht i m streng mathematischen Sinne gemeint.
keit menschlicher Urteiler abzuleiten, wenn das Urteilsproblem mittels anderer Merkmalssysteme viel eleganter zu bewältigen ist. Und es ist voreilig, Trainingsmethoden zu entwickeln, die den zweiten Teilprozeß des Integrierens optimieren sollen, obwohl ein einfaches Hilfsmittel zum Codieren (z. B. ein graphisches Kategoriensystem oder eine Tabelle) vielleicht von größerem Wert für die Informationsverarbeitung ist. Eine ähnliche Argumentation gilt hinsichtlich der Aussage, daß menschliche Urteiler eine Kompositionsregel suboptimal anwenden, bedingt durch Inkonsistenz und Konservativismus bei der Merkmalsgewichtung. Konservativismus, also die zu geringe Gewichtung der zentralen Merkmale, wäre beispielsweise nicht als Fehlertendenz anzusehen, wenn natürliche Urteiler gewöhnlich solche Merkmalssysteme wählen, die eine konservative Gewichtung verlangen, z. B. weil die Ausprägungen weniger valider Merkmale subjektiv gröber skaliert werden (vgl. Tabelle 1). Überdies könnte sich erweisen, daß der semantische Klassifizierungsprozeß so uneindeutig und „ f e h l e r h a f t " ist, daß die Suboptimalität bei der Merkmalsgewichtung vernachlässigt werden kann. Tab. 1: I l l u s t r a t i o n der s u b s t i t u t i v e n B e z i e h u n g z w i s c h e n K o m p o s i t i o n s r e g e l n u n d der B e s c h a f f e n h e i t d e s Kategoriensystems. Diese Schwierigkeit einer
... wird d u r c h ein K a t e -
K o m p o s i t i o n s r e g e l ...
g o r i e n s y s t e m mit f o l g e n der Eigenschaft vermieden
N i c h t - L i n e a r i t ä t ; z. B. log-
Größere Kategorienab-
B e z i e h u n g z w i s c h e n Merk-
stände (bzw. subjektive
mal a u n d K r i t e r i u m X
S k a l e n e i n h e i t e n ) für wachsende Merkmalsausprägungen von a
G e r i n g e Reliabilität e i n e s
Weniger u n d g r ö b e r e Ka-
Merkmals
t e g o r i e n für d i e M e r k m a l s abstufungen
V o r k o m m e n w e n i g e r re-
Weniger s u b j e k t i v e Ska-
levanter Merkmale (Ge-
leneinheiten zwischen
fahr v o n Konservativis-
d e n A u s p r ä g u n g e n dieser
mus)
Merkmale
Konfigurationalität;
Zusätzliche Merkmalska-
z. B. m u l t i p l i k a t i v e Ver-
t e g o r i e n für die W e c h s e l -
k n ü p f u n g z w e i e r Merk-
w i r k u n g ; z . B . für a bei
male a und b
verschiedenen Ausprägung e n v o n b ( a b + u n d ab")
124
Fiedler: Multiple Regression — Ein Modell der Urteilsbildung
In Tabelle 1 wird die substitutive Beziehung zwischen kognitiven Merkmalskategorien und bestimmten Kompositionsregeln dargestellt. Die Tabelle zeigt, wie eine „kognitiv schwierige" Kompositionsregel, die das Modell des Experimentators bildet, durch geeignete Merkmalskategorien, welche die Vp wählen könnte, vermieden werden kann. Die rechte Spalte gibt jeweils an, wie ein Kategoriensystem beschaffen sein muß, damit eine (vermeintliche) Schwierigkeit der Kompositionsregel umgangen wird (linke Spalte) und eine einfache lineare Regel resultiert. Die Folgerung nach diesen Überlegungen lautet daher, daß die einseitige Analyse der Kompositionsregeln auch über den zweiten Teilprozeß der Urteilsbildung keine Aussagen zuläßt, da das Integrieren nicht unabhängig vom Codieren nach einem semantischen Merkmalssystem untersucht werden kann. Diese Kritik richtet sich wohlgemerkt nicht gegen die empirischen Ergebnisse selbst, sondern gegen bestimmte Interpretationen und Aussagen über die Fähigkeiten und die Strategien menschlicher Urteiler. Es fragt sich nur, für welche Leistung höherer kognitiver Informationsverarbeitung diese Ergebnisse gelten. Leistungen wie die wiederholte Auswertung der gleichen Testprofile gehören sicherlich dazu, ebenso wie natürlich auftretende Vorgänge des multiplen Wahrscheinlichkeitslernens. Eine präzise Abgrenzung des Geltungsbereichs wäre eine methodologisch interessante Aufgabe, die von den Vertretern des MRP m.W. bisher nicht aufgegriffen wurde, ginge jedoch über den Rahmen dieses Beitrags hinaus.
Erfassung kognitiver Strategien Die methodische Attraktivität des MRP beruht teilweise auf seiner technologischen Einfachheit und auf der Verfügbarkeit von kybernetischen Modellen. Daß kybernetische Modelle nicht einfach mit deskriptiven psychologischen Modellen gleichgesetzt werden dürfen, soll an dem Gebrauch des Begriffs „Strategie" innerhalb des MRP begründet werden. Ein kybernetisches Modell für den Aufbau eines effizienten Computer-Programms läßt es selbstverständlich erscheinen, daß das Erlernen einer Bezie-
hung zwischen Merkmalen und Kriterium nach einer hypothesentestenden Strategie geschieht (vgl. STROBEL, 1976). Die augenblickliche Hypothese äußert sich in der Gewichtung der Merkmale; das Feedback bietet einen Test der Hypothese und führt zu einer Erhärtung oder Revision der Hypothese. Dies gilt für das kybernetische Modell oder für das Computer-Programm. Die psychologisch interessanten deskriptiven Aussagen des MRP betreffen aber die Darstellung von Strategien der Informationsverarbeitung, die — nicht bloß kybernetisch, sondern auch psychologisch - als „paramorphes Modell" (HOFFMAN, 1960) von kognitiven Strategien betrachtet werden. Erfaßt wird eine (Urteils-) Strategie durch die Regressionskoeffizienten bzw. Gewichtungen der einzelnen Merkmale (über eine bestimmte Zahl von Versuchsdurchgängen). Die zentrale Rolle des Feedback innerhalb der experimentellen Anordnung entspricht der Auffassung, daß die Vp nach einer hypothesentestenden Strategie vorgeht. Es wird außerdem die implizite Annahme getroffen, daß die Vp ihre Hypothesen durch ihre Vorhersagen tatsächlich äußert; sonst könnte die Regression der Vorhersagen auf die Merkmale nicht ihre Strategie beschreiben (siehe z. B. HAMMOND & SUMMERS, 1972). Am deskriptiven Gebrauch des Strategie-Begriffs kann die typische Problematik verdeutlicht werden, die daraus folgt, daß einprägsame, auf Formalisierungen beruhende Modelle auf strukturell ähnliche, aber nicht gleiche, kognitive Prozesse übertragen werden. — Was ist eigentlich gemeint, wenn man von einer „hypothesentestenden" Strategie spricht? Die Vorstellung, wonach eine Vp ihre Aufgabe löst, indem sie verschiedene Hypothesen testet, kann nicht durch die triviale Beobachtung begründet werden, daß die Vp überhaupt zu manchen Zeitpunkten ihre Leistung überprüft. „Hypothesentest" in diesem trivialen Sinne besagt nicht mehr, als daß die Feedback-Information überhaupt beachtet wird. Es kann also nur ein aktiv herbeigeführtes Hypothesenprüfen gemeint sein, das die gedankliche Aktivität der Vp beschreibt und tatsächlich für das Erlernen einer Beziehung entscheidend ist. Es gibt hauptsächlich zwei Gründe dafür, warum die MRP-Methodologie zur Beschreibung einer solchen Strategie
125
Zeitschrift für Sozialpsychologie 1978, 9, 1 1 7 - 1 2 8
wenig geeignet ist. Erstens besitzt die Vp typischerweise keine Freiheit zum aktiven Experimentieren. Sollte die Vp wirklich hypothetische Lösungen gezielt testen und damit erfolgreich sein, so müßte sie — u m einige Möglichkeiten zu nennen — selbst Merkmalsprofile auswählen dürfen, Profile vergleichen, einige Merkmale aus dem Profil eliminieren o. ä. Ein solches aktives Vorgehen wird jedoch durch das experimentelle Arrangement verhindert. — Zweitens wird man bei einer hypothesentestenden Strategie erwarten, daß die A n t w o r t e n oder Vorhersagen der Vp nicht nach jeweils bestem Wissen erfolgen, sondern aus taktischen Gründen so gewählt werden, daß ein größerer Informationsgewinn erreicht wird. So sollte z. B. eine absichtlich zu extrem gewählte Vorhersage dann besonders informativ sein, wenn sie sich aufgrund der Rückmeldung als richtig erweist (vgl. auch STROBEL, 1976). Genau dann kann man j e d o c h weder die Strategie noch die Leistung der Vp durch die Regressionsgewichte kennzeichnen, weil diese Statistiken womöglich nur das Probierverhalten beschreiben. Läßt man allerdings die Annahme eines aktiv hypo-
thesentestenden Vorgangs zugunsten eines perzeptiv strukturierenden Prozesses fallen — was z. T. bei der rationalen Urteilsbildung und allgemein bei zu komplexen, durch zufällige Hypothesen nicht erfaßbaren Beziehungen sinnvoll ist - dann k o m m t dem Feedback keine wesentliche Bedeutung mehr zu. Doch welche kognitive Leistung oder „Strategie" beschreiben dann die Regressionsgewichte?
Schlussfolgerungen Die vorangegangenen kritischen Überlegungen sollten mit einem konstruktiven Vorschlag für eine geeignetere Untersuchungsmethode verknüpft werden, die diese Überlegungen berücksichtigt. Die Methode sollte die Entstehung einer Beurteilung erfassen, auch einer einmaligen Beurteilung, ihrer semantischen Natur gerecht werden und beide Teilprozesse, das Codieren und das Integrieren, in Betracht ziehen. Da das Ergebnis des Codierens gewöhnlich unsichtbar bleibt, sollten außerdem die subjektiven Codierungen des Urteilers durch die Methode ir-
Situationen bi
b2
+ —
—
b3
b4
—
—
+
+
-£> Selektive W a h r n e h m u n g S t r u k t u r i e r u n g nach Merkmalen W a h r n e h m u n g einer Abhängigkeit zwischen x u n d anderen Merkmalen
+
—
Inferenzschlüsse, Vorhersagen
• Attributive Beurteilung
+ Integrieren
Stimulus Information
Kategorien Schema
Resultate der Beurteilung
Abb. 2: Darstellung einer V e r s u c h s a n o r d n u n g , die es erlaubt, n e b e n einer Kompositionsregel a u c h die subjektive Merkmals-Codierung zu erfassen. Die A u f g a b e der Vp ist d u r c h ein K a t e g o r i e n s c h e m a v o r s t r u k t u r i e r t . In diesem Kategorienschema codiert die Vp schriftlich die M e r k m a l s i n f o r m a t i o n e n , die in einer Stimulus-Aussage über eine zu beurteilende Person e n t h a l t e n sind, z.B. - wie in der A b b i l d u n g a n g e d e u t e t — d a ß der Wert + des Merkmals x verk n ü p f t mit d e n Ausprägungen a s u n d b 3 anderer Merkmale a u f t r i t t , w o b e i die Vp irrelevante Merkmale u, v, w ignorieren m u ß . A u f g r u n d der Codierung m e h r e r e r Stimulus-Aussagen e r k e n n t die Vp die Beziehung zwischen d e m „abh ä n g i g e n " Merkmal x u n d den „ u n a b h ä n g i g e n " Merkmalen a, b.
126
Fiedler: Multiple Regression - Ein Modell der Urteilsbildung
gendwie transparent gemacht werden. (Hierzu müssen die Merkmalskategorien durch die Aufgabenstellung und andere experimentelle Maßnahmen vorgegeben werden, nicht aber die Codierungen selbst.) Nur wenn man das Ergebnis des Codierens kennt, kann man den kognitiven Prozeß als eine „Arbeitsteilung" zwischen Codieren nach einem aufgabenbezogenen Kategoriensystem und dem Integrieren nach einer bestimmten Kompositionsregel beschreiben. Der Entwurf einer solchen Untersuchungsanordnung wurde bereits weiter oben skizziert und wird in Abbildung 2 durch ein Beispiel-Experiment veranschaulicht. Stimuli sind eine Reihe von Verhaltensaufzeichnungen (Film, schriftlich) eines Kindes (Stimulus-Person). Die Vp codiert die relevanten Merkmale jeder Verhaltensbeschreibung, d.h. jeder Beobachtungseinheit, in einem diagnostischen Beobachtungsschema. Entsprechend dem diagnostischen Zweck (z. B. Beurteilung der Bedingtheit von Ängsten) wird die Vp die Merkmalsvariablen (vgl. Abbildung 2) in unabhängige (Kontaktpersonen; Situationen) und abhängige Variable (Auftreten von Angst + oder nicht —) einteilen. Die Vp codiert etwa eine Verhaltensbeschreibung, indem sie in der entsprechenden Zelle des Schemas notiert, daß das Kind in der Situation „zuhause" gegenüber Person B keine Angst (—) zeigt. Das Ergebnis des Codierens — oder wenigstens eine Simulation davon — wird dann durch die Eintragungen in das Beobachtungsschema sichtbar gemacht. Die abschließende attributive oder diagnostische Beurteilung des Kindes könnte man als „Auswertung" des resultierenden Eintragungsmusters betrachten. Diese Versuchsanordnung kann in verschiedener Hinsicht methodisch elaboriert werden. So wird der Experimentator die Stimulus-Informationen zu skalieren versuchen, indem er die Verhaltensbeschreibungen in einem Vorversuch in dasselbe Beobachtungsschema kategorisieren läßt; somit kann er deren Bedeutung (modale Codierungen) bei der Versuchsplanung kontrollieren. — Um den Prozeß der Merkmalsintegration zu formalisieren, wie es beim MRP oder bei ANDERSONS (1974) algebraischen Modellen geschieht, wird man möglicherweise die Ähnlichkeit des Beobachtungsschemas mit KELLEYS Attributionsmodell (1967) aufgreifen und das Urteil der Vp über die Bedingtheit der Ängste
mit einer normativ-varianzanalytischen Auswertung des Schemas vergleichen. Andererseits wird jedoch gerade interessant sein, die Abweichungen der Urteile von einem solchen Modell, bedingt durch semantische Faktoren und sprachliche Benennungen der Merkmalskategorien, durch ein differenzierteres Modell zu beschreiben. Beispielsweise könnte der Experimentator abweichend von KELLEYS Modell feststellen, daß die Zuschreibung der Ängste an bestimmte Situationen nicht allein von der Kovariation mit verschiedenen Situationen abhängt, sondern durch eine psychologisch konsistente Kovariation mit semantisch plausiblen Situationen bewirkt wird. Hierbei erscheint das Modell der Varianzanalyse nicht zuletzt deshalb angemessener als das der multiplen Regression, weil ersteres die Darstellung von qualitativen Merkmalen (vgl. E4) mit Ähnlichkeitsbeziehungen zwischen den Ausprägungen leichter ermöglicht 3 . Schließlich ist das Resultat der Beurteilung nicht durch eine einzige Variable beschreibbar, sondern es sollten die Beziehungen zwischen mehreren beobachtbaren kognitiven Outputs untersucht werden. Im vorliegenden Falle u m f a ß t die Beurteilung wenigstens folgende Leistungen, die mit der Versuchsanordnung erfaßt werden können: (1) Wahrnehmung einer Abhängigkeit der Ängste von verschiedenen Situationen und/oder Kontaktpersonen (i.e. Kausalzuschreibung); (2) selektive Wahrnehmung und Strukturierung der Stimulus-Informationen, zu erfassen durch die schriftlich vorgenommenen Codierungen; (3) Inferenzschlüsse über das Verhalten unter anderen Bedingungen, zu erfassen durch die (subjektive) Ergänzung fehlender Eintragungen in bestimmte Zellen des Schemas; und (4) eine attributive Beurteilung des Kindes etwa anhand eines Polaritätenprofils. Die experimentelle Variation der Stimulus-Information oder des Kategorienschemas wird vermutlich manche dieser kognitiven Leistungen stärker beeinflussen als andere; beispielsweise könnten sich die subjektiven Inferenzschlüsse (3) vor allem dann als „ergiebige" Messung erweisen, wenn das Kategorienschema der impliziten Persönlichkeitstheorie des Urteilers entspricht. 3 Die Ausprägungen eines Merkmals entsprechen hierbei den A b s t u f u n g e n eines Faktors.
127
Z e i t s c h r i f t f ü r S o z i a l p s y c h o l o g i e 1 9 7 8 , 9, 1 1 7 - 1 2 8
Es stellt sich die Frage, was eine solche Untersuchungsanordnung 4 , die den Überlegungen z u m Prozeß der Urteilsbildung eher Rechnung trägt, n o c h mit dem MRP gemeinsam hat. Einige Unterschiede sind nicht prinzipieller Art und lassen sich durch Erweiterung des MRP beseitigen. BRUNSWIKS ( 1 9 5 6 ) Forderung, eine repräsentative Stichprobe von Subjekten, Objekten und Situationen zu bilden, wird beim MRP nur hinsichtlich der multivariaten Verteilungsform der Merkmale angestrebt. Es wäre jedoch ohne weiteres auch denkbar, die Merkmalskategorien nach einem repräsentativen Stichprobenverfahren auszuwählen. Durch eine Erweiterung des Ansatzes k ö n n t e auch die linke Seite des Linsenmodells, die Abbildung von distalen Variablen auf die Merkmalsebene, hier als „Cod i e r e n " bezeichnet, erfaßt werden. T r o t z d e m verlangen die folgenden Gründe eine wesentliche Unterscheidung zwischen der vorgeschlagenen — oder einer anderen denkbaren — Untersuchungsmethode und dem MRP. Zunächst u m f a ß t die Formalisierung der Regressionsrechnung neben Korrelationen keine anderen Ähnlichkeitsmaße, mit denen semantische Beziehungen darzustellen wären. Selbst das Zulassen einer veränderlichen Merkmalsanzahl würde der Regressionsrechnung Schwierigkeiten bereiten. Die methodische Kritik, die sich gegen das lineare Regressionsmodell als solches richtet (vgl. z. B. YNTEMA & TORGERSON, 1 9 6 1 ) , wird hierbei gänzlich außer acht gelassen. — Zweitens betrachtet das MRP als abhängige Messung nur eine von mehreren kognitiven Leistungen, die das Resultat einer Beurteilung bilden: nämlich die Vorhersage einer singulären Größe. Die experimentelle Vorhersagesituation kann man überdies nur auf sequentielle Entscheidungen oder Urteile sinnvoll übertragen. — Schließlich betrifft der vielleicht wesentlichste Grund die Annahme des MRP, d a ß eine distale ökologische Variable als Außenkriterium meßbar und d e m Experimentator bekannt ist (vgl. E5). Die von der Vp zu lernende Beziehung ist immer eine Beziehung zwischen Merkmalen und einem vom Experimentator kontrollierten Kriterium; sowohl die Bewertung der kogniti4
Recht interessante Ergebnisse b r a c h t e eine erste
A n w e n d u n g d i e s e r M e t h o d e ( F I E D L E R , in V o r b e r e i tung).
ven Leistung als auch die Versuchsplanung überh a u p t setzen dieses Kriterium voraus. Das Außenkriterium liefert als Feedback auch die wesentliche I n f o r m a t i o n , die der Urteiler verwerten kann. Die Entstehung einer einmaligen Beurteilung — in der Diagnostik, in der Rechtsprechung oder der schulischen Leistungsbewertung - m u ß jedoch prinzipiell o h n e Außenkriterium a u s k o m m e n und auf anderen Informationen beruhen. Bei der vorgeschlagenen Untersuchungsmethode lernt der Urteiler nicht die Beziehung zu einem Kriterium, sondern konstruiert bestimmte Merkmale als abhängig von anderen, stellt also die zu erkennende Abhängigkeitsbeziehung erst her. Dem Autor ist unklar, inwiefern das Außenkriterium ein inhärenter Teil von BRUNSWIKS Methodologie ist und diese - wie ROMMETVEIT (1960) meint — grundsätzlich von KELLYS (1955) konstruktivistischem Ansatz unterscheidet. Oder würde BRUNSWIK sagen, daß das Linsenmodell auch die Beziehungen zwischen subjektiv konstruierten Variablen beschreiben kann?
Literatur ANDERSON, N . H . 1 9 7 4 . C o g n i t i v e a l g e b r a : I n t e g r a t i o n t h e o r y a p p l i e d t o social a t t r i b u t i o n . I n : B e r k o w i t z , L. ( E d . ) A d v a n c e s in e x p e r i m e n t a l social p s y c h o l o g y . V o l . 7 , N e w Y o r k : A c a d e m i c Press. ARMELIUS, B.-A. & ARMELIUS, K. 1 9 7 5 . I n t e g r a t i o n rules in a m u l t i p l e - c u e p r o b a b i l i t y l e a r n i n g t a s k w i t h intercorrelated cues. U m e a Psychological R e p o r t s , No. 80. BRUNER, J . S . , GOODNOW, J . J . & AUSTIN, G . A . 1 9 5 6 . A s t u d y of t h i n k i n g . N e w Y o r k : Wiley. BRUNSWIK, E. 1 9 5 6 . P e r c e p t i o n a n d t h e r e p r e s e n t a t i v e design of e x p e r i m e n t s . B e r k e l e y : U n i v e r s i t y of Calif o r n i a Press. CHAPMAN, L . J . & CHAPMAN, J . P . 1 9 6 9 . I l l u s o r y c o r r e l a t i o n as an o b s t a c l e t o t h e u s e of valid p s y c h o d i a g n o s t i c signs. J o u r n a l o f A b n o r m a l P s y c h o l o g y , 7 4 , 271-280. CRAIK, F . I . M . & LOCKHART, R . S . 1 9 7 2 . L e v e l s of processing: A f r a m e w o r k for m e m o r y research. Journal of V e r b a l L e a r n i n g a n d V e r b a l B e h a v i o r , 1 1 , 671-684. FIEDLER, K. U n t e r s u c h u n g e n ü b e r r a t i o n a l e U r t e i l s b i l dung. In Vorbereitung ( Ä n d e r u n g e n im Titel vorbehalten). FISCHHOFF, B. 1 9 7 6 . A t t r i b u t i o n t h e o r y a n d j u d g m e n t u n d e r uncertainty. In: Harvey, J.H., Ickes, W.J. & K i d d , R. F. ( E d s . ) N e w d i r e c t i o n s in a t t r i b u t i o n re-
128
Fiedler: Multiple Regression - Ein Modell der Urteilsbildung
s e a r c h . Vol. 1. H i l l s d a l e , N e w J e r s e y : L a w r e n c e Erlbau m Associates. GOLDBERG, L. R. 1 9 7 0 . M a n v e r s u s m o d e l of m a n : A r a t i o n a l e , p l u s s o m e e v i d e n c e , f o r a m e t h o d of i m p r o v i n g o n clinical i n f e r e n c e . P s y c h o l o g i c a l B u l l e t i n , 73, 4 2 2 - 4 3 2 . HAMMOND, K. R., HURSCH, C . I . & TODD, F . J . 1 9 6 4 . A n a l y z i n g t h e c o m p o n e n t s of clinical i n f e r e n c e . Psychological Review, 71, 4 3 8 - 4 5 6 . HAMMOND, K. R. & SUMMERS, D. A. 1 9 7 2 . C o g n i t i v e control. Psychological Review, 79, 5 8 - 6 7 . HAMMOND, K. R., STEWARD, T . R „ BREHMER, B. & STEINMANN, D . O . 1 9 7 5 . S o c i a l j u d g m e n t t h e o r y . I n : K a p l a n , M. F. & S c h w a r z , S. ( E d s . ) H u m a n j u d g ment and decision processes. New York: Academic Press. HOFFMAN, P . I . 1 9 6 0 . T h e p a r a m o r p h i c r e p r e s e n t a t i o n of clinical j u d g m e n t . P s y c h o l o g i c a l B u l l e t i n , 4 7 , 116-131. HURSCH, C., HAMMOND, K. R. & HURSCH, I . 1 9 6 4 . S o m e m e t h o d o l o g i c a l c o n s i d e r a t i o n s in m u l t i p l e cue probability studies. Psychological Review, 71, 42-60. KAHNEMAN, D. & TVERSKY, A. 1 9 7 3 . O n t h e p s y c h o l o g y of p r e d i c t i o n . P s y c h o l o g i c a l R e v i e w , 8 0 , 237-251. KELLEY, H . H . 1 9 6 7 . A t t r i b u t i o n t h e o r y in social p s y c h o l o g y . I n : L e v i n e s , D. ( E d . ) N e b r a s k a s y m p o s i u m o n m o t i v a t i o n . L i n c o l n : U n i v e r s i t y of N e b r a s k a Press. KELLY, G. A. 1 9 5 5 . T h e p s y c h o l o g y of p e r s o n a l c o n structs. New York: Norton. LEE, I . C . & TUCKER, R. B. 1 9 6 2 . A n i n v e s t i g a t i o n o f clinical j u d g m e n t : A s t u d y in m e t h o d . l o u r n a l of A b n o r m a l a n d Social P s y c h o l o g y , 6 4 , 2 6 2 — 2 8 0 .
MEEHL, P . E . 1 9 5 4 . Clinical v e r s u s s t a t i s t i c a l p r e d i c t i o n . M i n n e a p o l i s : U n i v e r s i t y of M i n n e s o t a Press. MILLER, P. McC. 1 9 7 1 . D o l a b e l s m i s l e a d ? A m u l t i p l e c u e s t u d y , w i t h i n t h e f r a m e w o r k of B r u n s w i k ' s probabilistic functionalism. Organizational Behavior a n d H u m a n P e r f o r m a n c e , 6, 4 8 0 - 5 0 0 . PETERSON, C. R., HAMMOND, K. R. & SUMMERS, D. A. 1965. Multiple probability learning with shifting cue weights. A m e r i c a n l o u r n a l of Psychology, 78, 660-663. ROMMETVEIT, R. 1 9 6 0 . S e l e c t i v i t y , i n t u i t i o n a n d h a l o e f f e c t s in social p e r c e p t i o n . O s l o : O s l o U n i v e r s i t y Press. SARBIN, T. R., TAFT, R. & BAILEY, D . E . 1 9 6 0 . C l i n i c a l inference and cognitive theory. New Y o r k : Holt. SLOVIC, P. & LICHTENSTEIN, S. 1 9 7 1 . B a y e s i a n a n d reg r e s s i o n a p p r o a c h e s t o t h e s t u d y of i n f o r m a t i o n p r o c e s s i n g in j u d g m e n t . O r g a n i z a t i o n a l B e h a v i o r a n d H u m a n P e r f o r m a n c e , 6, 6 4 9 — 7 4 4 . STEGMÜLLER, W. 1 9 7 0 . A u f s ä t z e z u r W i s s e n s c h a f t s theorie. D a r m s t a d t : Wissenschaftliche Buchgesellschaft. STROBEL, R. 1 9 7 6 . U n s c h a r f e B e g r i f f e als R e s u l t a t kognitiver Prozesse. In: Klix, F. (Ed.) Psychologis c h e B e i t r ä g e z u r A n a l y s e k o g n i t i v e r P r o z e s s e . Berlin: V E B - V e r l a g . YNTEMA, D . B . ä T O R G E R S O N , W . S . 1 9 6 1 . M a n - c o m p u t e r c o o p e r a t i o n in d e c i s i o n s r e q u i r i n g c o m m o n sense. I R E T r a n s a c t i o n s of t h e ^ ^ H P r o f e s s i o n a l G r o u p o n H u m a n F a c t o r s in Electronics, HFE-2(1), 2 0 - 2 6 . I J
129
Zeitschrift für S o z i a l p s y c h o l o g i e 1 9 7 8 , 9 , 1 2 9 - 1 4 1
Ein Verfahren zur multivariaten Analyse der Bedingungen von Rangvariablen: Hierarchische Rangvarianzanalyse G E R H A R D SCHULZE Institut für S o z i o l o g i e u n d S o z i a l a n t h r o p o l o g i e der Universität Erlangen — Nürnberg
Das im f o l g e n d e n vorgestellte Verfahren ist geeignet für eine B e d i n g u n g s a n a l y s e , w o sich die abhängige Variable auf o r d i n a l e m S k a l e n n i v e a u b e f i n d e t u n d mehrere unabhängige Variable auf b e l i e b i g e m Skalenniveau vorliegen. Die hierarchische Rangvarianzanalyse ist eine Prozedur der s e q u e n t i e l l e n Klassenbildung, w o b e i die unabhängigen Variablen als Trennkriterien b e n u t z t werden u n d die neu g e b i l d e t e n Klassen im Hinblick auf die abhängige Variable i m m e r h o m o g e n e r w e r d e n . Der H o m o g e n i s i e r u n g s e f f e k t läßt sich als „ A n t e i l erklärter Rangvarianz" z u m A u s d r u c k bringen. Das Verfahren erlaubt eine E i n s c h ä t z u n g der Erklärungskapazität der B e d i n g u n g e n u n d eignet sich z u m A u f f i n d e n von Int e r a k t i o n s e f f e k t e n ( a n a l o g z u m A I D - V e r f a h r e n nach SONQUIST).
T h e p r o c e d u r e o f „hierarchical analysis o f variance o f ranks" can be e m p l o y e d , if the d e p e n d e n t variable is an ordinal scale and the i n d e p e n d e n t variables are n o m i nal, ordinal or interval scales. It is a p r o c e s s o f splitting the s a m p l e i n t o subclasses, r e s e m b l i n g t o the m e t h o d o f „tree analysis" as d e v e l o p e d b y SONQUIST and MORGAN ( A I D ) . The subclasses are c o n s t r u c t e d according t o the i n d e p e n d e n t variables. F r o m step t o step, t h e resulting classes b e c o m e m o r e and m o r e h o m o g e n e o u s in respect t o the d e p e n d e n t variable. T h e gain in h o m o g e n e i t y is e x p r e s s e d as „ e x p l a i n e d variance o f ranks". T h e principal i n f o r m a t i o n s are the f o l l o w i n g : ( 1 ) the e x p l a n a t o r y p o w e r of the i n d e p e n d e n t variables, ( 2 ) interaction effects.
1. Fragestellung und Hauptergebnisse des Verfahrens
Die Hauptergebnisse der hierarchischen Rangvarianzanalyse sind in einer F o r m darstellbar, die auch statistischen Laien zugänglich ist. Charakteristisch für das Verfahren ist ferner eine gewisse understatement-Tendenz; es liefert eine „vorsichtige" Beurteilung des Erklärungspotentials von Bedingungen, und neigt weniger als beispielsweise die multiple Regressionsanalyse dazu, aus sample-spezifischen Zufälligkeiten (Erklärungs-)Kapital zu schlagen (vgl. zu dieser Eigenart der Regressionsanalyse z.B. HOPE, 1975). Die hierarchische Rangvarianzanalyse wird forschungspraktisch eingesetzt bei SCHULZE (1977).
Die Fragestellung, für welche die im folgenden dargestellte Technik entwickelt wurde, ist im Grunde ein datenanalytisches Standardproblem der empirischen Sozialforschung: Es geht um die Erklärung einer abhängigen Variablen auf ordinalem Skalenniveau (z. B. Bildungsniveau) durch eine Reihe von unabhängigen Variablen („Bedingungen") auf beliebigem Skalenniveau (z. B. Intelligenz, Schichtposition der Herkunftsfamilie, Religion, Geschlecht usw.). Die unabhängigen Variablen können untereinander zusammenhängen. Das Verfahren (hierarchische Rangvarianzanalyse) liefert insbesondere die folgenden I n f o r m a t i o n e n : 1) Eine Schätzung der Gesamterklärungskapazität der Bedingungen; 2) Hinweise auf Interaktionsbeziehungen zwischen den Bedingungen; 3) Aussagen über die verbleibende Erklärungskapazität einer gegebenen Bedingung bei Kontrolle aller anderen Bedingungen.
2. Das analytische Grundprinzip Das Ausgangsproblem des Datenanalytikers besteht darin, daß er auf eine bestimmte Variation der abhängigen Variablen in der Gesamtstichprobe t r i f f t und wissen möchte, wie diese Variation z u s t a n d e k o m m t . Wenn es eine „total determinierende" Bedingung der abhängigen
130
S c h u l z e : V e r f a h r e n zur multivariaten A n a l y s e der B e d i n g u n g e n v o n Rangvariablen
Variablen gäbe, so müßte eine Aufteilung der Gesamtgruppe in Teilgruppen nach dieser Bedingung zu einem völligen Verschwinden der Variation der abhängigen Variablen in den Teilgruppen führen. Wäre beispielsweise die Schichtzugehörigkeit die einzige Bedingung des Schulerfolgs, so müßte eine Aufspaltung der Gesamtstichprobe nach der Schichtzugehörigkeit zu Untergruppen führen, die im Hinblick auf den Schulerfolg vollkommen homogen wären. Das ist natürlich unrealistisch; es kommt hier nur auf den aus der parametrischen Varianzanalyse vertrauten Hinweis an, daß eine Bildung von Teilklassen zu einer größeren Homogenität der abhängigen Variablen in den Teilklassen führt, wenn die Teilklassen nach einer relevanten Bedingung gebildet werden: Die ursprüngliche Heterogenität der abhängigen Variablen in der Gesamtstichprobe wird in relative Homogenität in den Untergruppen überführt. Gelingt dies bis zum Extremfall vollkommener Homogenität in den Untergruppen, so läßt sich von „hundertprozentiger Erklärung der Varianz (oder Heterogenität) der abhängigen Variablen in der Gesamtgruppe" sprechen. Das Prinzip der hierarchischen Rangvarianzanalyse besteht nun in dem Versuch, die Gesamtstichprobe nach potentiellen Bedingungen in Untergruppen aufzuspalten, die hinsichtlich der abhängigen Variablen möglichst homogen sind. Dieser Aufspaltungsprozeß geht hierarchisch vor sich (d.h. es werden zunächst Teilgruppen nach einer „ersten" Bedingung gebildet, diese Teilgruppen nach einer „nächsten" Bedingung unterteilt usw.) und die Beurteilung des Homogenisierungseffektes erfolgt rangvarianzanaly tisch, deshalb die Bezeichnung „hierarchische Rangvarianzanalyse". Das folgende Schema veranschaulicht das Grundprinzip; gleichzeitig werden verschiedene Bezeichnungen eingeführt, die im weiteren Text konsistent verwendet werden. Beispiel: Abhängige Variable sei der Schulerfolg. Die Gesamtstichprobe wird zunächst nach der sozialen Herkunft aufgeteilt, die resultierenden Untergruppen nach der Intelligenz, die dabei resultierenden Untergruppen nach dem Geschlecht usw. Bei jedem Schritt nimmt die Homogenität des Schulerfolgs innerhalb der Gruppen zu, gleichzeitig vergrößern sich die Unterschiede zwischen den Gruppen.
Eine sehr verwandte Konzeption liegt der „AID"-Prozedur zugrunde ( S O N Q U I S T / M O R G A N , 1 9 6 4 ; SONQUIST, 1 9 7 0 ; S O N Q U I S T / B A K E R / M O R -
Der wesentliche Unterschied besteht darin, daß die abhängige Variable nicht als Intervalleariable, sondern lediglich als Ordinalvariable aufgefaßt wird (es existiert im übrigen auch ein hierarchisches Verfahren für abhängige Variable auf nominalem Skalenniveau; vgl. ANDREWS/MESSENGER, 1 9 7 3 ) . Damit wird eine spezifische Berechnungsmethodik zur Charakterisierung des Homogenisierungseffektes der Gruppenbildung („erklärte Rangvarianz") erforderlich. Im Unterschied zur AID-Prozedur („automatic interaction decoder") wird hier außerdem der Standpunkt vertreten, daß es einer hierarchischem Datenanalyse grundsätzlich abträglich ist, den gesamten Prozeß der Aufspaltung automatisch vornehmen zu lassen; vielmehr sollte der Forscher immer in Kontakt mit den Daten bleiben und die Teilgruppenbildungen selbst kontrollieren, weil hierbei verschiedene Kriterien abgewogen werden müssen, wobei sich persönliche Kompetenz nicht voll maschinell ersetzen läßt. GAN, 1 9 7 3 ) .
3. Die erklärte Rangvarianz bei der Aufteilung einer Gruppe Bei der hierarchischen Rangvarianzanalyse wird die ursprüngliche Rangheterogenität der Gesamtstichprobe in möglichst große Ranghomogenität in Teilgruppen aufgelöst, die durch sequentielle Klassifikation entsprechend verschiedenen „Bedingungen" gewonnen werden. Der durch die Gruppenbildung erzielte Gewinn an Ranghomogenität ist ein Ausdruck für das Erklärungspotential der Bedingungsvariablen. Bei der hierarchischen Rangvarianzanalyse wird der Gewinn an Ranghomogenität als Anteil erklärter Rangvarianz definiert. Das allgemeine Modell zur Ableitung des Anteils erklärter Rangvarianz ist das gleiche wie bei der parametrischen Varianzanalyse: Gesamtvarianz (Vt)
= Varianz innerhalb der Gruppen (Vin) + Varianz zwischen den Gruppen (Vzw) Vzw Erklärter Varianzanteil = Vt Vt - Vin Vt
131
Zeitschrift für Sozialpsychologie 1978, 9 , 1 2 9 - 1 4 1
Schema einer Rangvarianzanalyse und Einführung der wichtigsten Bezeichnungen Abhängige Variable Y
Teilgruppe AA
Teilgruppe A
Teilgruppe AB
Teilgruppe AC
Teilgruppe BA Gesamtgruppe
X X X
Teilgruppe BBA
Teilgruppe BB
Teilgruppe B
Teilgruppe BC
X
Teilgruppe CA
X
1 Teilgruppe CB
^
Teilgruppe C
1
K
Teilgruppe BBB
t
G r u p p e n a u f t e i l u n g e n nach den unabhängigen Variablen Xi Weitere im Text vorkommende Obergruppe
Bezeichnungen:
= G r u p p e , die geteilt wird;
Untergruppen = G r u p p e n , die bei Teilung einer O b e r g r u p p e e n t s t e h e n ; VG; V C A ; V D ; VJJ = Varianz der G e s a m t g r u p p e ; der Teilgruppe C A ; der O b e r g r u p p e ; der U n t e r g r u p p e ; erkl. V B ß(B B ) = Erklärter Varianzanteil bei einer A u f s p a l t u n g von G r u p p e BB, bezogen auf die Varianz von G r u p p e BB; erkl. V B B ( G ) = erklärter Varianzanteil bei einer A u f s p a l t u n g von G r u p p e BB, bezogen auf die Varianz der Geiamigruppe; = gU(0>;gAC(G) Anteil der Varianz einer U n t e r g r u p p e an der Varianz der O b e r g r u p p e ; Anteil der Varianz der G r u p p e AC an der Varianz der G e s a m t g r u p p e .
Je größer der Homogenisierungseffekt der Gruppenaufteilung ist, desto geringer ist die Varianz innerhalb der Gruppen, desto größer ist die Varianz zwischen den Gruppen, und desto größer ist der erklärte Varianzanteil. Der erklärte Varianzanteil schwankt zwischen 0 (minimales Erklärungspotential) und 1 (maximales Erklärungspotential). Es geht nun darum, die einzelnen Größen Vt, Vzw und Vin für Äartgvariable so zu definieren, daß die Gleichung Vt = Vzw + Vin erfüllt ist. Dabei läßt sich von dem Ansatz von K R U S K A L / W A L L I S ( 1 9 5 2 ) ausgehen, wo die Variation von
Rangwerten durch den Begriff der „Rangdevianz" erfaßt wird. Die Bestimmung der Rangdevianz setzt als erstes die Zuweisung von numerischen Rangwerten zu den einzelnen Rangplätzen der abhängigen Variablen voraus. Ist jeder Rangplatz nur einfach besetzt, so besteht der Vorgang der Wertzuweisung einfach im „Durchnumerier e n " der Rangplätze von unten nach oben. Im Normalfall einer sozialwissenschaftlichen Datenanalyse treten jedoch viele Mehrfachbesetzungen von Rangplätzen („Rangbindungen") auf. Unter diesen Umständen müssen die Rang-
132
S c h u l z e : V e r f a h r e n zur multivariaten A n a l y s e der B e d i n g u n g e n v o n Rangvariablen
werte für die einzelnen Rangplätze nach einem besonderen Verfahren bestimmt werden (vgl. Berechnungsbeispiele weiter unten). Sind die Rangwerte bestimmt, so läßt sich die Rangdevianz (oder Rangvarianz) der gesamten Gruppe nach KRUSKAL/WALLIS ermitteln. Die Rangdevianz erfaßt die Abweichung der einzelnen Rangwerte vom mittleren Rangwert (als Summe quadrierter Abweichungen). Das varianzanalytische Modell Vt = Vin + Vzw ist erfüllt, wenn die verschiedenen Größen als Rangdevianzen definiert werden: Vt = Rangdevianz für die Obergruppe; Vin = Summe der Rangdevianzen in den einzelnen Untergruppen; Vzw = Rangdevianz zwischen den Gruppen (Summe der quadrierten Abweichungen der mittleren Rangplätze in den Untergruppen vom Rangplatz der Gesamtgruppe, gewichtet mit der Anzahl der Einheiten in den Untergruppen). Die genaue Berechnung dieser Größen wird im Schlußabschnitt dargestellt. An dieser Stelle soll nur eines festgehalten werden: Die Rangvarianz in einer gegebenen Gruppe A (VA) kann in zwei Komponenten aufgespalten werden, wenn man diese Gruppe in Untergruppen aufteilt: Yy,, und V ^ , wobei bei Anwendung der eben angeführten Definitionen gilt: V = V + V A Ain Azw
Beide Komponenten der Gesamtrangvarianz geben Aufschluß über den Homogenisierungseffekt, den man durch die Aufteilung der Obergruppe A in den Untergruppen erzielt: Je weniger Variation in den Gruppen verbleibt (d.h. je geringer Yyn wird), desto größer ist der Homogenisierungseffekt. Ebenso gilt: Je schärfer die Gruppen voneinander abgehoben sind, d.h. je größer VAzw ist, desto größer ist der Homogenisierungseffekt. Beide Varianzkomponenten verhalten sich umgekehrt proportional. In den Extremfällen ist eine der beiden Varianzkomponenten gleich der Gesamtvarianz und die andere Varianzkomponente gleich Null. Der Anteil erklärter Rangvarianz (erkl. läßt sich sinnvoll bestimmen als Quotient VAzw V - VAin y A
Wenn die neuen Gruppen in sich vollkommen homogen sind und keine Streuung von Rangwerten aufweisen (\^ i n = 0), ist der Wert des Quotienten 1; im umgekehrten Fall — wenn die Rangwerte in den Teilgruppen genauso heterogen sind wie in der Gesamtgruppe und zwischen dem Teilgruppen keine Unterschiede bestehen (YvzW = 0) ist der Wert des Quotienten 0. Diese Größe ist identisch mit dem von LIENERT/RAATZ ( 1 9 7 1 ) vorgeschlagenen Rangkorrelationsverhältnis Eta-H2. Er läßt sich auch als Funktion von N und der Prüfgröße H aus dem H-Test errechnen (vgl. LIENERT/RAATZ 1 9 7 1 , S.409):
H Erklärter Rangvarianzteil = ——Dieser Berechnungsansatz dürfte in den meisten Fällen der einfachste sein, weil nahezu jedes Programmsystem zur Analyse sozialwissenschaftlicher Daten die Errechnung von H beinhaltet. Treten Rangbindungen auf, muß allerdings H in der „bindungskorrigierten Fassung" zugrundegelegt werden (vgl. ferner Berechnungsbeispiel weiter unten).
4. Die erklärte Rangvarianz der Gesamtgruppe bei mehrstufigen Aufteilungen Es bedarf zusätzlicher Operationen, um den erklärten Anteil an Gesamtvarianz zum Ausdruck zu bringen, wenn die Analyse mehrstufig verläuft, also die beim ersten Schritt resultierenden Teilgruppen weiter aufgeteilt werden. Im parametrischen Gegenstück zur hierarchischen Rangvarianzanalyse, dem AID-Verfahren, ist die Berechnung der erklärten Gesamtvarianz auch bei einer mehrstufigen Analyse sehr einfach: Es wird einfach die Summe aller Varianzen zwischen den Gruppen (V Xzw ), die sich bei den verschiedenen Aufteilungen ergeben, gebildet und auf die Varianz der Gesamtgruppe bezogen. Bei der hierarchischen Rangvarianzanalyse dürfen die verschiedenen Vzw jedoch nicht einfach aufaddiert werden. Der Grund ist leicht einzusehen: die Rangwerte der Individuen verändern sich bei der sequentiellen Bildung von Untergruppen zunehmend höherer Ordnung immer wieder. Rangwerte sind ja gruppenspezifische Werte; sie hängen ab von der Anzahl verschiedener Rangpositionen, von der Häufigkeit
133
Zeitschrift für Sozialpsychologie 1978, 9 , 1 2 9 - 1 4 1
von Rangbindungen und der Gesamtzahl der Individuen in einer Obergruppe — deswegen erhält ein Individuum im Verlauf der sequentiellen Gruppenbildung immer wieder neue Rangwerte zugeschrieben. Die Werte der Varianzen zwischen den Gruppen (V Xzw ), die bei verschiedenen Stadien der Aufteilung gewonnen werden, beruhen also nicht auf denselben individuellen Werten (wie bei der parametrischen Variante) und sind deshalb nicht einfach für die Berechnung der erklärten Gesamtvarianz aufzuaddieren. Das im folgenden dargestellte Verfahren zur Bestimmung des Anteils an erklärter Gesamtgruppenvarianz bei der Aufteilung einer beliebigen Teilgruppe setzt die Bestimmung von zwei Größen voraus: 1. Erklärte Varianz bei einer Aufteilung der Gruppe X, bezogen auf die Varianz der Gruppe X (erkl. V X ( X ) ); 2. Anteil der Varianz der Gruppe X an der Varianz der Gesamtgruppe (g X(G) )• Der Anteil an Gewzmfgruppenvarianz, der durch die Aufteilung von Gruppe X erklärt wird, ergibt sich als Produkt dieser beiden Größen: erkl. V X(G) = (erkl. V X ( X ) ) ( g X ( G ) ) Mit anderen Worten: das gruppenspezifische Erklärungspotential (erkl. V X(X) ) wird gewichtet mit dem Anteil an Gesamtgruppenvarianz, den die Gruppe repräsentiert (g(X(G) )• Wie das gruppenspezifische Erklärungspotential zu ermitteln ist, wurde bereits im vorhergehenden Abschnitt dargestellt. Deshalb braucht hier nur darauf eingegangen zu werden, wie sich das Gewicht der Varianz einer Teilgruppe an der Varianz der Gesamtgruppe (gX(G)) bestimmen läßt: Jede beliebige Gruppe X läßt sich als Untergruppe zu einer Obergruppe auffassen. Von X führt ein „hierarchischer Weg" über immer größere Obergruppen zur Gesamtgruppe. Wenn X beispielsweise die Gruppe CABB ist, so hat dieser Weg folgendes Aussehen: CABB - ABB - BB - B - Gesamtgruppe. Im ersten Schritt muß nun für die gesamte Kette der Varianzanteil von Untergruppen an Obergruppen bestimmt werden: g
U(0)
vv
0
Im Beispiel müssen vier verschiedene Werte bestimmt werden, die etwa folgendes Aussehen haben mögen: !•)
SCABB(ABB)
2)
gABB(BB)
3)
gßB(B)
4-)
SB(Gesamtgruppe)
= = = =
0,6 0,7 0,5 0,5
Im zweiten Schritt kann der Anteil der Gruppe X an der Gesamtgruppenvarianz als einfaches Produkt aller X „vorgeschalteten" Varianzanteile von Untergruppen an Obergruppen bestimmt werden. Im Beispiel: ScABB(G) = ( 0 , 6 ) ( 0 , 7 ) ( 0 , 5 ) ( 0 , 5 ) = 0 , 1 0 5 = 1 0 , 5 %
Diese Größe läßt sich für jede beliebige Aufteilung in einer Erklärungshierarchie bestimmen. Soll zum Ausdruck gebracht werden, wieviel Gesamtgruppenvarianz durch die gesamte Hierarchie erklärt wird, so muß einfach die Summe aller erkl. gebildet werden. Diese Summe schwankt zwischen 0 und 1 (vgl. zu all dem auch die Berechnungsbeispiele im letzten Abschnitt).
5. Anmerkungen zur Untersuchung von Interaktionseffekten Von Interaktion (im Gegensatz zu Additivität) soll im folgenden dann gesprochen werden, wenn die Wirkung einer unabhängigen Variablen XI auf die abhängige Variable Y von der Ausprägung einer dritten Variablen X2 abhängt (Interaktionen höherer Ordnung, wobei es auf die Ausprägung von mehreren „dritten" Variablen ankommt, sollen hier der Einfachheit halber ausgeklammert bleiben. Sie lassen sich jedoch in gleicher Weise wie Interaktionen erster Ordnung untersuchen). Ein „baumanalytisches" Verfahren wie die hierarchische Rangvarianzanalyse ist für die Entdeckung von Interaktionseffekten besonders gut geeignet, da ja nach der ersten Gruppenbildung die weitere Analyse immer für bestimmte Untergruppen erfolgt, die sich nach der Ausprägung von „dritten" Variablen stark oder vollkommen unterscheiden. Wenn die in einem „späten" Stadium in die Analyse eingeführte unabhängige Variable mit den bereits vorher eingeführten Variablen interagiert (d.h.
134
Schulze: Verfahren zur multivariaten Analyse der Bedingungen von Rangvariablen
in ihrer Wirkungsweise von spezifischen Ausprägungen von vorher eingeführten Variablen abhängt), so m u ß sich dies zeigen. Ein fiktives Beispiel: Bei der Bestimmung des Bildungsniveaus interagiert der Faktor „Geschlecht" mit dem Faktor „Stadt-Land". Geschlechtsspezifische Differenzierungen nach dem Schulerfolg treten nur auf dem Land auf, nicht in der Stadt, da nur noch auf dem Land eine geschlechtsspezifische Differenzierung der Lebensplanung vorzufinden ist. Mit anderen Worten: die Wirksamkeit des Faktors Geschlecht hängt ab von der Ausprägung des Faktors Stadt-Land. In einer hierarchischen Rangvarianzanalyse kann dies dann aufgedeckt werden, wenn die Gesamtgruppe zunächst nach dem Faktor Stadt-Land aufgeteilt wird und die Analyse in den Teilgruppen dann mit dem Faktor Geschlecht fortgesetzt wird. Dabei muß unter den gegebenen Voraussetzungen in der Teilgruppe „ L a n d " ein beachtenswerter Anteil der Rangvarianz des Schulerfolgs erklärt werden, in der Teilgruppe „ S t a d t " dagegen nicht. Dies verweist auf zwei wichtige Prinzipien bei der Suche nach Interaktionseffekten: 1. Diejenige Variable, von der man vermutet, daß von ihrer Ausprägung die Wirksamkeit einer anderen Variable abhängt, ist zweckmäßigerweise zuerst in die Hierarchie der Gruppenaufteilung einzuführen (im Beispiel: Stadt-Land-Aufteilung vor der Aufteilung nach Geschlechtern). 2. Der wichtigste Indikator für Interaktionseffekte ist der Unterschied des erklärten Anteils von Rangvarianz zwischen vergleichbaren Gruppen. In der Sozialwissenschaft sind solche Interaktionseffekte besonders häufig, wo eine unabhängige Variable unter bestimmten Bedingungen (d.h. bei bestimmten Ausprägungen von anderen Variablen) „relativ s t a r k " wirksam ist, unter bestimmten anderen Bedingungen dagegen „relativ schwach" oder gar nicht. Wenn dies der Fall ist, kommt dies in einem Gefälle der erklärten Rangvarianzanteile in verschiedenen Gruppen (d. h. unter verschiedenen Bedingungen) zum Ausdruck. Dabei sind nicht die Anteile erklärter Geiawifgruppenvarianz zu verwenden, sondern die Anteile erklärter 7e/7gruppenvarianz. Der Anteil erklärter Gesamtgruppenvarianz
wird nämlich nicht nur durch die Erklärungskraft des Kriteriums bestimmt, nach welchem geteilt wird, sondern auch durch die in der Teilgruppe verbliebenen Gesamtgruppenvarianz, die unter anderem von der bloßen Anzahl der Individuen in der Teilgruppe abhängt. Es sind natürlich auch andere Formen der Interaktion denkbar. Insbesondere kann es sein, daß eine Variable unter verschiedenen Bedingungen zwar etwa gleich viel Varianz erklärt, daß jedoch die Beziehung zwischen unabhängiger und abhängiger Variable unter den verschiedenen Bedingungen genau umgekehrt ist. Um im Beispiel zu bleiben: sowohl bei der Stadtjugend als auch bei der Landjugend gibt es geschlechtsspezifische Unterschiede im Bildungserfolg; bei der Stadtjugend „ f ü h r e n " jedoch beispielsweise die Mädchen, bei der Landjugend dagegen die Jungen. Interaktionseffekte dieser Art werden durch den Anteil erklärter Varianz nicht aufgedeckt; sie sind jedoch auch sehr unwahrscheinlich. Um sie dennoch zu kontrollieren, müssen die bivariaten Datenmatrizen inspiziert werden und/oder (sofern dies möglich ist) gerichtete Koeffizienten für die Beziehung zwischen abhängiger und unabhängiger Variable bei den verschiedenen Teilgruppen errechnet werden. Ein weiteres Beispiel für eine Interaktionsbeziehung findet sich im Abschnitt 9.
6. Die Bestimmung des eigenständigen Erklärungspotentials einer unabhängigen Variablen Sehr o f t ergibt sich die Frage, ob eine Variable auch dann noch Varianz zu erklären vermag, wenn andere Variable bereits berücksichtigt sind. Dies kann bei der hierarchischen Rangvarianzanalyse festgestellt werden, indem die Gesamtgruppe zunächst nach den „anderen" Variablen aufgeteilt wird und die in Frage stehende Variable dann als letzte in den Prozeß der Gruppenbildung eingeführt wird. Die Summe der dabei anfallenden Anteile erklärter Gesamtgruppenvarianz gibt Auskunft über das eigenständige Erklärungspotential der zuletzt eingeführten Variable bei Kontrolle (oder „Konstanthalten") der vorgeschalteten Variablen.
135
Zeitschrift für Sozialpsychologie 1978, 9, 1 2 9 - 1 4 1
Bei der Interpretation sind jedoch zwei Vorsichtsregeln zu beachten: 1. Es ist in der Regel zweifelhaft, ob dabei das gesamte Erklärungspotential der „ l e t z t e n " Variable zum Ausdruck k o m m t . Insbesondere bei korrelierenden unabhängigen Variablen ist der Verdacht angebracht, d a ß ein Teil des Erklärungspotentials der letzten Variable latent bereits bei vorhergehenden Gruppenbildungen „ v e r b r a u c h t " wurde. 2. Es ist möglich, d a ß das Erklärungspotential der „ l e t z t e n " Variable verschwinden würde, wenn andere, nicht berücksichtigte Variable kontrolliert würden. Die Aussagekraft der Prozedur ist also stark von der Qualität der Auswahl der vorgeschalteten Variablen abhängig. Wenn es plausibel ist, d a ß bei der Auswahl der (durch vorgeschaltete Gruppenbildungen) kontrollierten Variablen alle relevanten Faktoren erfaßt sind, liefert die hier skizzierte analytische Strategie eine Mindestschätzung des Erklärungspotentials der „ l e t z t e n " Variable. Damit werden Aussagen von etwa folgender Struktur möglich: „Variable X h a t einen eigenständigen E f f e k t " , oder: „Variable X hat möglicherweise keinen eigenständigen E f f e k t " .
7. Signifikanzprüfung Die Untersuchung, ob Aufteilungen signifikant sind, erfolgt naheliegenderweise über den H-Test. Dabei läßt sich H leicht bestimmen aus der Beziehung H = (Erklärter Varianzanteil) (N - 1) Die Signifikanzprüfung kann sich sowohl auf die gesamte Erklärungshierarchie beziehen, als auch auf jeden beliebigen Teilschritt. Je nachdem ist entweder der Anteil erklärter Gesamtgruppenvarianz und das N der Gesamtgruppe einzusetzen, oder der Anteil erklärter Teilgruppenvarianz und das N der Teilgruppe. Auch die Freiheitsgrade sind verschieden: Freiheitsgrade bei Bezug auf die Gesamtgruppe: Anzahl der Endgruppen minus 1; Freiheitsgrade bei Bezug auf eine Teilgruppe: Anzahl der Ergebnisgruppen minus 1.
8. Einige „strategische" Hinweise Grundsätzlich wird hier die Ansicht vertreten, d a ß es — von einigen unscharfen Prinzipien abgesehen - keine automatisierbare Prozedur der hierarchischen Rangvarianzanalyse gibt oder geben sollte. Das „ H e r u m p r o b i e r e n " o h n e starres Regelsystem, die Suchstrategie unter der Frage „was passiert wenn ..." ist viel kreativer als ein blindes Befolgen von vorgefertigten Entscheidungskriterien. Als Minimalgrundsätze mögen die folgenden Punkte dienen: 1. Bei jeder Aufteilung einer Obergruppe sollen möglichst wenig Untergruppen gebildet werden. Damit soll zum ersten vermieden werden, d a ß das Ergebnis der Analyse zu einem undurchschaubaren, vielfältig verästelten Gebilde wird. Vor allem aber geht es d a r u m , die Fallzahlen in den Untergruppen möglichst groß zu halten, damit man den Aufteilungsp r o z e ß möglichst lange fortsetzen kann. Es soll j e d o c h nicht gefordert werden, grundsätzlich nur d i c h o t o m e Aufteilungen vorzun e h m e n ; in vielen Fällen kann auch eine drei- oder vierfache Aufteilung einer G r u p p e sinnvoll sein (etwa bei einer unabhängigen Variablen auf Nominalniveau mit mehr als zwei Ausprägungen, oder für eine differenzierte Untersuchung von Interaktionseffekten). 2. Bei j e d e m Aufteilungsschritt soll möglichst viel erklärte Gesamtgruppenvarianz hinzugewonnen werden. Dieses Prinzip kollidiert mit dem erstgenannten Grundsatz, die Zahl der neugebildeten Gruppen möglichst klein zu halten, da umso mehr Varianz erklärt werden kann, je differenzierter die Aufteilung ist, d.h. je mehr Gruppen gebildet werden. Es müssen also Kompromisse geschlossen werden. In den meisten Fällen sind diese Kompromisse nicht mit gravierenden Nachteilen verbunden, da schon bei d i c h o t o m e n oder gar t r i c h o t o m e n Aufteilungen o h n e h i n der größte Teil des Erklärungspotentials einer unabhängigen Variablen genutzt wird (bei d i c h o t o m e n Aufteilungen meist 60—70% des erklärten Varianzanteils, der sich bei voller Nutzung der „ A u f t e i l u n g s k a p a z i t ä t " der unabhängigen Variablen ergeben würde; bei trichotomen Aufteilungen 80—90%).
136
Schulze: Verfahren zur multivariaten Analyse der Bedingungen von Rangvariablen
Die Maximierung der erklärten Gesamtgruppenvarianz ist auch ein Anhaltspunkt für die Lösung der Frage, an welcher Stelle bei den unabhängigen Variablen Trennpunkte zu setzen sind. Wenn beispielsweise eine lOstufige unabhängige Variable auf Ordinalniveau als Kriterium für eine dichotome Aufteilung benutzt werden soll, bei der eine „ h ö h e r e " und eine „tiefere" Gruppe resultiert, so gibt es neun verschiedene Möglichkeiten, einen Trennpunkt zu setzen. Dieser Trennpunkt soll nun nach Möglichkeit so gesetzt werden, daß der durch die Aufteilung erklärte Varianzanteil ein Maximum erreicht. Ein weiteres Kriterium für die Lokalisation von Trennpunkten (welches mit dem eben genannten allerdings selten in Konflikt gerät) ist das Prinzip, zu ungefähr gleich großen Gruppen zu gelangen, damit man bei allen neuen Gruppen gleiche Möglichkeiten zur Fortsetzung der Analyse hat. Es kann jedoch sinnvoll sein, kleine und sehr homogene Extremgruppen abzuspalten, ohne sie weiter aufzuteilen, und weitere Aufspaltungen nur bei großen, heterogenen Restgruppen vorzunehmen.
auf, wesentliche Beziehungsstrukturen in den Daten transparent und verstehbar zu machen. Lieber sollte auf zusätzliche 5% erklärter Gesamtgruppenvarianz verzichtet werden, als auf Übersichtlichkeit und theoretische Interpretierbarkeit. 4. Für den Abbruch des Verfahrens bei einer bestimmten Gruppe kommen verschiedene Kriterien in Betracht: weitere Aufteilungen sind statistisch nicht mehr signifikant; die in Betracht stehende Gruppe ist zu klein; die Gruppe ist bereits weitgehend homogen; der Gewinn an zusätzlich erklärter Gesamtgruppenvarianz ist zu gering. Damit soll jedoch nur auf wichtige Beurteilungsmaßstäbe hingewiesen sein; es ist nicht sinnvoll, hier generelle Regeln zu formulieren.
9. Die Darstellung der Ergebnisse
Bei der Darstellung der Ergebnisse sollte vor allem zum Ausdruck kommen, wie sich die verschiedenen Gruppen hinsichtlich der abhängigen Variablen unterscheiden. Bei der AID-Prozedur erfolgt die Kennzeichnung dieser Unter3. Die Aufteilungshierarchie soll so einfach und schiede durch die Angabe der gruppenspezifileicht durchschaubar wie möglich gehalten schen Mittelwerte, was bei einer ordinalen abwerden. Dies impliziert nicht nur die bereits hängigen Variablen natürlich nicht möglich ist. erwähnte Forderung, möglichst wenig GrupStattdessen folgender Vorschlag: pen zu bilden, sondern berührt die gesamte analytische Strategie. Beispielsweise sollte Zunächst ist der Punkt auf der abhängigen auch darauf geachtet werden, daß unabhänVariablen zu bestimmen, der möglichst genau gige Variable in verschiedenen „ Ä s t e n " der die „ o b e r e n " und die „ u n t e r e n " 50% in der GeErklärungshierarchie nicht in unterschiedlisamtgruppe trennt. Die Teilgruppen können cher Reihenfolge zur Aufteilung herangezonun unterschieden werden nach den Prozentgen werden, weil dies Verwirrung für denjenisätzen, die diesen Punkt über- bzw. unterschreigen stiftet, dem das Ergebnis mitgeteilt werten. So kennzeichnet etwa ein Verhältnis den soll. Die Reihenfolge der unabhängigen 20% : 80% eine Teilgruppe mit vielen relativ Variablen sollte nach Möglichkeit auch theo„ h o h e n " Ausprägungen der abhängigen Variaretisch einen Sinn ergeben (etwa: „ f r ü h e " blen; bei einer Teilgruppe mit einem Verhältnis Faktoren - „späte" Faktoren; Makrofaktovon 80% : 20% ist es umgekehrt. Das Verhältren — Mikrofaktoren; Umweltfaktoren — psy- nis der Prozentsätze läßt sich auch graphisch chische Faktoren). Um die Zahl der Erklädarstellen. Zusätzlich m u ß angegeben werden, rungsebenen möglichst gering zu halten, durch welche spezifischen Ausprägungen von sollte versucht werden, zu sinnvollen Verunabhängigen Variablen die einzelnen Teilgrupschmelzungen von unabhängigen Variablen pen gekennzeichnet sind, wie hoch der insgezu gelangen. samt erklärte Anteil an Gesamtgruppenvarianz ist und wie signifikant die gesamte ErklärungsAlles in allem kommt es nicht darauf an, den hierarchie ist. Möglich, aber nicht unabdingbar Anteil erklärter Gesamtgruppenvarianz ohne sind ferner folgende Angaben: Anzahl der InRücksicht auf den Sinn der Ergebnisse zum dividuen in den einzelnen Gruppen, erklärter absoluten Maximum zu treiben, sondern dar-
Zeitschrift für Sozialpsychologie 1978, 9, 1 2 9 - 1 4 1
137
Anteil an Obergruppenvarianz bei jeder Aufteilung und erklärter Anteil an Gesamtgruppenvarianz bei jeder Aufteilung. Eine sehr detail-
Hierarchische
lierte Darstellung einer rangvarianzanalytischen Erklärungshierarchie könnte sich an folgendem fiktiven Beispiel orientieren:
Rangvarianzanalyse
Abhängige Variable: Unabhängige Variable:
Schulerfolg Schichtzugehörigkeit, Intelligenz Gruppe: IQ größer 100 N = 150
Gruppe A
75%
Oberschicht N = 250 erkl. V A ( A ) = 10% erkl. Va(g) = 2,5% 70%
IQ kleiner 100 N = 100 |
30%
| 63%
50%
50%
erkl.V B ( B ) = 20% erkl.V B ( G ) = 10%
35%
IQ kleiner 100 N = 220 30%
50%
BB
70%
IQ größer 100 N = 100
Gruppe C Unterschicht N = 250
60%
erkl.Vc(c) = 3 0 % erkl.Vc ( G) = 7 , 5 % 30%
37%
BA
65%
Mittelschichten N = 500
50%
]
IQ größer 100 N = 280
Gruppe B
Gesamtgruppe N = 1000 erkl. V G ( G ) = 30%
| 25%
I 70%
IQ kleiner 100 N = 150 J
CA J
40%
CB
90%
10% Insgesamt erklärte Varianz der G e s a m t g r u p p e : 50% Alle Aufteilungen sind signifikant (p < 0 , 0 0 1 ; H-Test) Jugendliche mit gutem Schulerfolg (obere 50% der G e s a m t g r u p p e ) Jugendliche mit weniger g u t e m Schulerfolg ( u n t e r e 50% der G e s a m t g r u p p e ) A n m e r k u n g : Die Darstellung gibt auch Aufschluß über einen I n t e r a k t i o n s e f f e k t : Je h ö h e r die Schichtposition, desto weniger wirkt sich die Intelligenz auf den Schulerfolg aus. Dies läßt sich aus einem Vergleich der Varianzanteile schließen, die bei den drei Schichtgruppen durch eine Aufteilung nach der Intelligenz erzielt werden, w o b e i der erklärte Varianzanteil mit Bezug auf die Teilgruppe (nicht mit Bezug auf die G e s a m t g r u p p e ) zu v e r w e n d e n ist: 10% ( O b e r s c h i c h t ) - 20% (Mittelschicht) - 30% (Unterschicht). Die erklärten Varianzanteile sind hier wegen der besseren Mitteilbarkeit als Prozentzahlen angegeben.
138
Schulze: Verfahren zur multivariate!! Analyse der Bedingungen von Rangvariablen
10. Berechnungsformeln und Berechnungsbeispiele
r3 = 64 + 163 +
A. Berechnungen bei der Aufspaltung Gruppe in Teilgruppen
rl = 32,5 / r2 = 146 / r3 = 298,5 / r4 = 4 4 1 , 5
a) Rangvarianz der Gruppe A = b) Rangvarianzen innerhalb der einzelnen neugebildeten Teilgruppen VXA. YAB usw.; c) gesamte Rangvarianz innerhalb der Teilgruppen = VAI„;
d) Rangvarianz zwischen den Teilgruppen = V ^ z w ; e) durch Aufteilung von A erklärter Rangvarianzanteil, bezogen auf Rangvarianz von Gruppe A = erkl. VA(A);
f) Prüfgröße H.
Im Beispiel erfolgt eine Aufteilung in vier Gruppen. Für die Berechnung wird folgende Matrix zugrundegelegt:
Ausprägungen von X
von VA (Rangvarianz
F o r m e l : VA =
Z f - N
der
I ( y N Y
j
Yj)
2
-
Berechnung: VA = ( 3 2 , 5 ) 2 - 6 4 + ( 1 4 6 ) 2 - 1 6 3 + ( 2 9 8 , 5 ) 2 • 142 + + (441,5)2-144 (32,5'64+146'163 + 298,5'142+441,4'144)2 513 = 10380294 Alternativ kann die bindungsadjustierte Formel zur Berechnung der Rangvarianz nach K R U S K A L / W A L L I S zugrunde gelegt werden. Das Ergebnis ist dasselbe.
Obergruppe: A
X2
X3
X4
Yl
21
23
18
2
64
Y2
23
56
67
17
163
Y3
14
40
52
36
142
Y4
5
18
50
71
144
NXj
63
137
187
126
AA
AB
AC
AD
Der erste Schritt besteht in der Berechnung der Rangwerte r l , r2 usw., die den einzelnen Ausprägungen Y l , Y2 usw. zuzuordnen sind. Dies erfolgt nach der Formel rj=
a) Berechnung Gruppe A):
XI
Untergruppen:
= 298,5
Es ergeben sich folgende Rangwerte:
einer
Ausgangspunkt ist in j e d e m Fall eine bivariate Datenmatrix (ob es sich nun um die Analyse der Gesamtgruppe oder einer beliebigen Teilgruppe handelt). Die im folgenden analysierte Gruppe erhält die Bezeichnung A. Die Datenmatrix wird anhand der unabhängigen Variablen X und der abhängigen Variablen Y gebildet. Folgende Grössen sind zu berechnen:
Ausprägungen von Y
1
N j - 1 Yj + l 2 N „Ym _ + 2 m= 1
Beispielsweise errechnet sich der Rangwert r3 wie folgt:
(Die Besetzungszahlen innerhalb der Matrix werden allgemein durch NxiYj bezeichnet)
Nyj
N t = 513
b) Berechnung von VAA, VAB, VAC, varianz in den Untergruppen):
VAD(Rang-
Formel für die Untergruppe Xj: S M " N ^ ) V
AXi
2
rj
2-
NxiYj
2
Xi
Berechnung für Untergruppe AA:
( i k o n
_
s t a n t )
139
Z e i t s c h r i f t für S o z i a l p s y c h o l o g i e 1 9 7 8 , 9 , 1 2 9 - 1 4 1
V ^ = (32,5) 2 -21+(146) 2 "23+(298,5) 2 • 14 + + (441,5) 2 • 5 (32,5-21 + 146-23 + 2 9 8 , 5 - 1 4 + 4 4 1 , 5 - 5 ) . 63 = 1008741 Für alle Untergruppen ergeben sich folgende Rangvarianzen: VAA = 1008741
VAB = 2231958
VAC = 3524234
VAD = 1600149
c) Berechnung von (gesamte innerhalb der Teilgruppen):
2015215 10380297
10380297-8365082 10380297
= 0,194138 Prozentual ausgedrückt: Die Aufteilung erklärt 19,4% Rangvarianz von A. f ) Berechnung von H:
Rangvarianz B. Die Umwandlung von Teilgruppenerklärungen in Gesamtgruppenerklärungen
Berech- VAin = 1008741 + 2231958 + 3524234 + nung: 1600149=8365082 d) Berechnung von VAzw(Rangvarianz den Untergruppen in der Gruppe A):
zwischen
VA -
Berechnung: = 10380294 - 8365082 = 2015212 Die Grundformel innerhalb des rangvarianzanalytischen Modells hat folgendes Aussehen (diese Formel ist zur Berechnung weniger gut geeignet, führt jedoch zum selben Ergebnis):
Vazw = 2 NXi i=1
erkl.VA(A)
Formel: H = (erkl. V A(A) ) (N - 1) Berechnung: H = (0,194138) (512) = 99,56 Freiheitsgrade: Anzahl der Aufteilungen minus 1 = 4 - 1 = 3; p < 0 . 0 0 1
Formel: VAin = 2 VAU
Formel: V =
Berechnung:
j ^ l r J ' ' N XXiYj i N,
d 2 j f i i j - N Y j =
0
(die Berechnung der Größe erkl. VA(A) ist weiter oben dargestellt) Die Summe aller erkl. \^(G) gibt den Anteil der Gesamtgruppenvarianz an, der durch die gesamte Aufteilungshierarchie erklärt wird. Wenn der Anteil von Gesamtgruppenvarianz ausgedrückt werden soll, der durch eine bestimmte Variable (insbesondere die zuletzt eingeführte) erklärt wird, so ist die Summe aus allen erkl. \$c(G) z u bilden, die auf eine Aufteilung nach dieser Variablen zurückgehen. Zur Verdeutlichung ein Beispiel. Für die einzelnen Teilgruppen werden folgende Werte angegeben:
0 9 6
AAA AA a b c d
a = gU(O) b = SX(G) c = erkl.Vx(x) d = erkl.Vx(G) a b c d
= = = =
0,4 0,4 0,2 0,08
a b c d
= =
1 1
= =
0,3 0,3
0,6 0,24 0,3 0,072
0,3 0,072
AAB 0,4 0,096 ABA
AB a b c d
Gesaratgruppe
= = = =
a = b =
= = = =
0,2 0,08 0,1 0,008
a = b =
0,5 0,04
ABB a = b =
0,4 0,032
BAA BA a b c d
B a b c d
= = = =
0,3 0,3 0,4 0,12
c) Berechnung von erkl. VAfGj (durch Teilung von Gruppe A erklärte Varianz, bezogen auf die Varianz der Gesamtgruppe Formel: erkl. VA(G) = (erkl. V A(A) ) (g A ( G ) )
= = = =
0,3 0,09 0,2 0,018
a = b =
0,6 0,054
BAB a = b =
0,2 0,018
BBA BB a = 0,3 b = 0,09 c = 0,3 d = 0,027
a = b =
0,5 0,045
BBB a b
= =
0,2 0,018
141
Zeitschrift für Sozialpsychologie 1978, 9, 1 2 9 - 1 4 1
Die insgesamt erklärte Gesamtgruppenvarianz ist identisch mit der Summe der bei allen Teilschritten erklärten Gesamtgruppenvarianzen, die im Beispiel durch den Wert d angegeben werden. Es ergibt sich ein Anteil von 0.625 = = 62,5%. Komplementär dazu verhält sich der Anteil an Gesamtgruppenvarianz, der n o c h in den Endgruppen verblieben ist. Dieser Anteil wird durch den Wert b angegeben. Als Summe ergibt sich über die 8 Endgruppen ein Anteil von 0,375 = = 37,5%. Die Gesamtvarianz zerfällt also genau in einen erklärten und einen unerklärten Anteil: 6 2 , 5 % + 3 7 , 5 % = 100%. Wenn alle Endgruppen nach ein u n d derselben unabhängigen Variablen gebildet wurden, so kann es von Interesse sein, wie g r o ß das eigenständige Erklärungspotential dieser Variablen ist. Dieser Wert ergibt sich als Summe der erklärten Anteile von Gesamtgruppenvarianz in den vorletzten G r u p p e n ; er beträgt im Beispiel 0.125 = 12,5%.
Literatur ANREWS, F M. & MESSENGER, R.C. 1973. Multivariate nominal scale analysis. Ann Arbor: The university of Michigan Press. HOPE, K. 1975. Methoden multivariater Analyse. Weinheim und Basel: Beltz. KRUSKAL, W.H. & WALLIS, W.A. 1952. Use of ranks in one-criterion variance analysis. Journal of the American Statistical Association 47, 5 8 3 - 6 0 7 . LIENERT, G. A. & RAATZ, U. 1971. Das Rangkorrelationsverhältnis Eta-H-Quadrat als nichtlineares Abhängigkeitsmaß. Biometrische Zeitschrft 13, 4 0 7 413. SCHULZE, G. 1977. Politisches Lernen in der Alltagserfahrung. München: Juventa. SONQUIST, J.A. 1970. Multivariate model building. Ann Arbor: The University of Michigan Press. SONQUIST, J. A., BAKER, E . L . & MORGAN, J . N . 1973. Searching for structure. Ann Arbor: The University of Michigan Press. SONQUIST, J . A . & MORGAN, J . N . 1964. The ^ H detection of interaction effects. Ann Arbor: The University of Michigan Press. I J
142
K l u m p & Bandilla: W e r t k o n n o t a t i o n e n der S k a l e n b e n e n n u n g
Empirie Wertkonnotationen der Skalenbenennung und ihr Einfluß auf Extremisierungseffekte bei der Beurteilung von Attitüden-Items H A N S KLUMP & WOLFGANG BANDILLA Sonderforschungsbereich 24, „Sozial- und Wirtschaftspsychologische Entscheidungsforschung" der Universität Mannheim
Ausgehend von empirischen Widersprüchen u n d theoretischen Mängeln bisheriger U n t e r s u c h u n g e n z u m Einf l u ß d e r E i n s t e l l u n g e i n e r P e r s o n a u f die B e u r t e i l u n g v o n A t t i t ü d e n - I t e m s w i r d ein n e u e r E r k l ä r u n g s a n s a t z v o r g e s c h l a g e n . Die A k z e n t u i e r u n g s t h e o r i e v o n HOLZKAMP w i r d z u r E r k l ä r u n g v o n U r t e i l e n ü b e r s o z i a l e S a c h v e r h a l t e a n g e w e n d e t u n d d u r c h das M e h r d i m e n s i o n a l i t ä t s k o n z e p t v o n ElSER & STROEBE e r w e i t e r t . Zwei Hypothesen werden aufgestellt und überprüft: 1) P o l a r i s i e r u n g ist e i n e F o l g e d e s „ Ü b e r s c h ä t z e n s " d e s Skalenwertes von Aussagen d u r c h Personen mit extrem e r Einstellung. 2) Das A u s m a ß der „ Ü b e r s c h ä t z u n g " ist a b h ä n g i g v o n d e n m i t d e r B e n e n n u n g d e r A n t w o r t skalen v e r b u n d e n e n W e r t k o n n o t a t i o n e n .
Starting f r o m empirical i n c o n s i s t e n c i e s a n d t h e o r e t i c a l d e f i c i e n c i e s of research o n the e f f e c t s o f j u d g e s ' attit u d e s o n rating o f a t t i t u d e s t a t e m e n t s , a n e w a p p r o a c h is suggested. A t h e o r y o f p e r c e p t u a l a c c e n t u a t i o n (HOLZKAMP) is adapted t o e x p l a i n j u d g e m e n t s o f social stimuli, and integrated i n t o a m u l t i d i m e n s i o n a l m o d e l of social j u d g e m e n t (ElSER & STROEBE). T w o h y p o theses are p o s t u l a t e d and tested: 1) Polarized judgem e n t s result f r o m subjects with e x t r e m e p o s i t i o n s „ o v e r e s t i m a t i n g " the scale value o f s t a t e m e n t s . 2 ) T h e degree o f „ o v e r e s t i m a t i o n " is a f u n c t i o n of t h e value c o n n o t a t i o n s associated with d i f f e r e n t j u d g e m e n t scale labels.
Einführung
negativer Einstellung unterschied sich häufig nicht von denen mit neutraler Position. Einer der bekanntesten Ansätze zur Erklärung des hier beschriebenen Polarisierungseffekts ist das „Assimilations-Kontrast-Modell" von SHERIF & HOVLAND ( 1 9 6 1 ) . Es bietet aber nur eine Deskription des Polarisierungseffektes, indem gesagt wird, daß die zu beurteilenden Aussagen „assimiliert" bzw. „kontrastiert" werden, ohne daß eine Erklärung für diese beiden Erscheinungen gegeben wird. Eine weitergehende Erklärungsmöglichkeit wird von UPSHAW ( 1 9 6 2 , 1 9 6 5 ) mit einem hypothetischen Skalenmodell („variable series model") gegeben, bei dem Personen mit unterschiedlicher Einstellung zu einem Attitüdenobjekt unterschiedliche „psychologische Perspektiven" unterstellt werden, die sich wiederum auf die Benutzung der Response-Skalen auswirken. Für beide Ansätze gilt jedoch, daß sie die empirisch
Extremisierungseffekte bei der Beurteilung von Attitüden-Items sind in zahlreichen Untersuchungen festgestellt worden ( H O V L A N D & SHERIF, 1 9 5 2 ; UPSHAW, 1 9 6 2 ; SELLTITZ e t a l . ,
1965;
Insbesondere hat sich dabei gezeigt, daß Personen mit extremer Einstellung zu dem betreffenden Attitüdenobjekt stärker zwischen positiven und negativen Aussagen differenzieren als Personen mit einer neutralen Einstellung. Dieser Effekt wird als Polarisierung bezeichnet. Im größten Teil der Untersuchungen war jedoch das Phänomen festzustellen, daß nur Personen mit extrem positiver Einstellung diesen Effekt produzierten. Dies gilt vor allem für Experimente, in denen Aussagen zur Einstellung gegenüber dem schwarzen Bevölkerungsteil in den USA bewertet werden mußten: das Urteilsverhalten der Personen mit ZAVALLONI & C O O K , 1 9 6 5 ) .
Z e i t s c h r i f t für S o z i a l p s y c h o l o g i e 1 9 7 8 , 9, 1 4 2 - 1 5 1
festgestellten Unterschiede im Polarisieren von Personen mit extrem positiver und extrem negativer Einstellung nicht erklären können. In der vorliegenden Untersuchung wird deshalb der Versuch einer theoretischen Neuorientierung u n t e r n o m m e n , der z u m Teil auf der Erweiterung der Akzentuierungstheorie von TAJFEL (TAJFEL, 1 9 5 7 , TAJFEL & WILKES,
1963)
durch EISER & STROEBE ( 1 9 7 2 ) , zum anderen auf den akzentuierungstheoretischen Aussagen von HOLZKAMP und Mitarbeitern (HOLZKAMP et al., 1 9 6 8 ; NAATZ & HÜMMELINK, 1 9 7 1 ) a u f b a u t .
Theoretische Grundlagen und Hypothesen Akzentuierungstheoretische Überlegungen gehen von einem Urteilsmodell aus, bei dem zwischen einer fokalen und einer peripheren Stimulusdimension unterschieden wird. Als fokale Stimulusdimension wird die Dimension bezeichnet, auf die sich die Urteilsaufgabe bezieht. Peripher sind solche Stimulusdimensionen, auf denen explizit keine Urteile abzugeben sind, die aber aufgrund ihrer Steuerungsfunktion die Urteilsabgabe beeinflussen können. In den Akzentuierungstheorien sind die Randbedingungen festgelegt, unter denen eine periphere Dimension diese kognitive Steuerungsfunktion in bezug auf die Urteilsabgabe auf der fokalen Dimension erfüllt. Diese Bedingungen ergeben sich aus der Art der Verknüpfung beider Dimensionen innerhalb einer Reizserie. In der theoretischen Version von HOLZKAMP, die ursprünglich für eine valenzbesetzte periphere Dimension formuliert wurde, später jedoch auf inhaltlich beliebige Dimensionen erweitert wurde, lautet die G r u n d h y p o t h e s e : „Besteht bei einer Versuchsperson eine vorexperimentell etablierte oder experimentell hergestellte assoziative Valenz-Dimension-Verknüpfung, u n d wird die Versuchsperson mit einem experimentell valenzbesetzten Stimulus konfrontiert, den sie hinsichtlich der in der Assoziation implizierten Dimension beurteilen soll, so wird sie eher solche .Fehlurteile' tolerieren, die mit der assoziativen Valenz-Dimension-Verk n ü p f u n g der Richtung nach übereinstimmen als solche, die es nicht t u n " ( N A A T Z & HÜMMELINK, 1 9 7 1 , p . 3 6 4 ) . Das b e d e u t e t : Existiert zwischen fokaler und peripherer Dimension
143 eine positiv m o n o t o n e Beziehung, so überschätzt die Person die vorgegebenen Reize im Vergleich zu einer Person, für die diese systematische Verknüpfung nicht besteht. Eine negative Beziehung führt dagegen zu einer entsprechenden Unterschätzung. Für den theoretischen Ansatz von TAJFEL ist das Vorzeichen der Verknüpfung o h n e Bedeutung. Basierend auf dem gleichen Urteilsmodell mit einer diskreten Klassifikation als peripherer Dimension und einem kontinuierlichen Attribut (fokale Dimension) wird vorausgesagt, daß im Falle einer systematischen Verknüpfung die urteilenden Personen die (biseriale) Korrelation zwischen beiden Dimensionen überschätzen. Zwischen Reizen, die in unterschiedliche Klassen fallen, wird von diesen Personen stärker differenziert als von Personen, für die diese Verknüpfung nicht existiert. Während also in der Theorie von HOLZKAMP die Richtung der Urteilsverschiebung vorausgesagt wird, postuliert die Theorie von TAJFEL einen relativen Extremisierungseffekt. Wendet man die Akzentuierungshypothesen zur Erklärung des Polarisierungsphänomens bei der Skalierung von Attitüden-Items an, so wird nach EISER & STROEBE die fokale Dimension durch den Grad, zu dem die Aussagen für oder gegen ein bestimmtes A t t i t ü d e n o b j e k t sprechen, gebildet. Das Ausmaß der Zustimmung zu den Aussagen bzw. der Ablehnung der Aussagen durch die urteilende Person stellt die periphere Dimension dar. Für Personen mit neutraler Einstellung ist die Verknüpfung zwischen peripherer und fokaler Dimension in einer solchen Situation nicht m o n o t o n . Entsprechend ist kein steuernder E f f e k t der peripheren Dimension zu erwarten. Für Personen mit e x t r e m positiver bzw. negativer Einstellung steht die Ausprägung der Items in m o n o t o n e r Beziehung z u m Grad ihrer eigenen Übereinstimmung mit den Aussagen. Beispielsweise gilt für eine Person mit extrem positiver Einstellung: „Je positiver die Aussage, desto mehr stimme ich ihr z u " . Es besteht hier also eine positive Verknüpfung. Entsprechend ist die Voraussage, d a ß diese Person positive Items positiver beurteilt, d . h . überschätzt, im Vergleich zu einer neutralen Person. Für negative Items lautet die Verknüpfung: „Je negativer die Aussage, desto mehr lehne ich sie a b " . Wir erhalten wiederum eine positive
144
K l u m p & Bandilla: W e r t k o n n o t a t i o n e n der S k a l e n b e n e n n u n g
Beziehung, aufgrund derer eine Überschätzung erwartet werden muß, diesmal aber im negativen Bereich. Überschätzen bedeutet demnach: Positivere Beurteilung von positiven Aussagen und negativere Beurteilung von negativen Aussagen im Vergleich zu einer neutralen Person. Zur Erklärung der Unterschiede im Polarisierungsverhalten von Personen mit positiver und negativer Einstellung erweitern EISER & STROEBE das Urteilsmodell der Akzentuierungstheorien, wobei sie sich auf die Theorie von TAJFEL beziehen. Da die Randbedingungen - die systematische Verknüpfung von zwei Dimensionen — für beide oben dargestellten Akzentuierungsansätze die gleichen sind, geht unsere These dahin, daß diese Erweiterung auch für die Theorie von HOLZKAMP sinnvoll ist und erst in diesem Zusammenhang zu theoretisch eindeutig begründbaren Hypothesen führt. EISER & STROEBE postulieren, daß bei der Beurteilung von Attitüden-Items nicht nur eine einzige periphere Dimension eine Rolle spielt, wie es in bezug auf den Einfluß der Einstellung der Urteiler angenommen wird, sondern daß weitere Item-Dimensionen systematisch mit der fokalen Dimension verknüpft sind. So ist bei einem sozial relevanten Attitüdenobjekt die Frage der „sozialen Erwünschtheit" einer Einstellung in Betracht zu ziehen, wobei diese zusätzliche Dimension als „Wertkonnotationen der Skalentermini" bezeichnet wird. Die Verknüpfung dieser Dimension mit der fokalen Dimension kann gleichsinnig mit der anderen peripheren Dimension sein und deren steuernden Effekt verstärken. Ist die Verknüpfung anders gepolt, so ist zu erwarten, daß sie diesen Effekt abschwächt. Sollen zum Beispiel — wie in der vorliegenden Arbeit — positive und negative Aussagen über die Einführung bleifreien Benzins von Personen mit extrem positiver Einstellung zu diesem Attitüdenobjekt auf einer Skala mit den Termini „umweltfeindlich/umweltfreundlich" beurteilt werden, so kann man unterstellen, daß die Zustimmung zu den Aussagen und der Grad der sozialen Erwünschtheit dieser Zustimmung zwei periphere Dimensionen bilden. Beide Dimensionen sind mit der fokalen Dimension positiv verknüpft, und es ist zu erwarten, daß ihre Effekte sich verstärken. Bei der Beurteilung der gleichen Aussagen auf einer Skala
mit den Benennungen „wirtschaftlich unvernünftig/wirtschaftlich vernünftig" ist dagegen der Zustimmungsgrad eines Urteilers mit positiver Einstellung negativ mit dem Urteilskontinuum verknüpft. In bezug auf die soziale Erwünschtheit besteht weiterhin eine positive Verbindung: Die Effekte beider Verknüpfungen heben sich gegenseitig auf. Diese Argumentation ist systematisch im Rahmen der akzentuierungstheoretischen Überlegungen nur durchzuführen, wenn man sich auf die Theorie von HOLZKAMP stützt, da bei dieser das Vorzeichen der Verknüpfung eine Rolle spielt. Die Konzeption von EISER & STROEBE in bezug auf die Funktion von Wertkonnotationen muß bei einer Beschränkung auf den Ansatz von TAJFEL als nicht ausreichend angesehen werden. Empirisch konnte der Einfluß von Wertkonnotationen in einer Reihe von Untersuchungen bereits partiell nachgewiesen werden ( E I S E R , 1 9 7 1 ; EISER & MOWER WHITE, 1 9 7 5 ) . Neben methodischen Mängeln in bezug auf die Messung der abhängigen Variablen (Standardabweichung als Polarisierungsmaß) fehlt diesen Untersuchungen jedoch die theoretische Grundlage. Die Entwicklung dieser theoretischen Konzeption ist das Anliegen der vorliegenden Arbeit.
Hypothesen In den Hypothesen werden die Aussagen von HOLZKAMP über die Richtung der Urteilsverschiebung mit dem Mehrdimensionalitätskonzept von EISER & STROEBE integriert. Den Hypothesen liegt die Annahme zugrunde, daß bei der Beurteilung von Attitüden-Items die Zustimmung/Ablehnung der Aussagen durch den Urteiler und das Ausmaß der sozialen Erwünschtheit der in den Aussagen zum Ausdruck gebrachten Einstellung zwei periphere Dimensionen darstellen.
Hypothese
1
Im Vergleich zu den Urteilen von Personen mit neutraler Einstellung polarisieren Personen mit extrem positiver oder extrem negativer Einstellung als Folge einer Überschätzung positiver und negativer Aussagen.
145
Zeitschrift für Sozialpsychologie 1978, 9, 1 4 2 - 1 5 1
Hypothese
2
Der Effekt der Überschätzung von Aussagen durch Personen mit extremer Einstellung zum Attitüdenobjekt verstärkt sich mit zunehmender Kongruenz der Verknüpfung zwischen den peripheren Dimensionen und der fokalen Dimension und nimmt ab mit zunehmender Inkongurenz.
Experimentelle Durchführung Zur Überprüfung der Hypothesen war ein Versuchsplan mit drei unabhängigen Variablen zu realisieren. Eine Variable konstituierte die Klassifikation der Versuchspersonen entsprechend ihrer Einstellung zum Attitüdenobjekt. Eine zweite Variable stellte die Unterteilung der zu beurteilenden Aussagen in positive und negative Items dar. Als dritte Variable ging die Kongruenz/Inkongruenz der Verknüpfungen, die durch eine Veränderung der Skalenbenennung variiert wurde, in den Versuchsplan ein.
Unabhängige Variablen A: Einstellung zum Attitüdenobjekt mit drei Stufen; pro, neutral, contra; B: Itemvalenz mit zwei Stufen: positiv, negativ; C: Skalenbenennung mit drei Stufen: Skala I: Kongruenz für Pro-Urteil er, Inkongruenz für Contra-Urteiler; Skala II: Ohne explizite Wertkonnotationen; Skala III: Inkongruenz für Pro-Urteiler, Kongruenz für Contra-Urteiler.
Abhängige Variable Die Mittelwerte für positive bzw. negative Items pro Versuchsperson.
Versuchsplan Aus den unabhängigen Variablen ergab sich ein dreifaktorieller Versuchsplan mit Meßwieder-
holung auf den Faktoren „Itemvalenz" und „Skalenbenennung". Die Zellen des Planes waren mit jeweils 20 Personen besetzt ( n = 60).
Das Attitüdenobjekt Untersucht wurde die Einstellung zum BenzinBlei-Gesetz, was sich insofern als günstig erwies, als dieses Gesetz zum Zeitpunkt der Befragung (etwa '/4 Jahr vor Inkrafttreten) aufgrund unterschiedlicher Darstellungen in der Presse stark umstritten war und somit extrem positiv bzw. negativ und neutral eingestellte Versuchspersonen zur Verfügung standen. Hauptargument der Befürworter des Gesetzes war die Verbesserung der Umweltbedingungen, während von gegnerischer Seite u. a. auf eine Verteuerung des Benzins sowie auf technische Probleme bei der Umstellung der Motoren auf den neuen Kraftstoff hingewiesen wurde.
Operationalisierungen Den befragten Personen wurden 16 Aussagen vorgelegt, von denen acht eine positive bzw. acht eine negative Stellungnahme zum BenzinBlei-Gesetz zum Inhalt hatten (die Valenzbesetzung wurde in einer Voruntersuchung überprüft). Beispiel für eine positive Aussage: „Bei der hohen Verkehrsdichte darf eine Maßnahme zur Senkung des gefährlichen Bleigehaltes auch zu einem höheren Benzinpreis führen." Beispiel für eine negative Aussage: „Dieser Griff ins Portemonnaie der Autofahrer ist überflüssig, da es schon genügend Maßnahmen zum Schutz der Umwelt gibt." Für die Wahl der Skalenbenennung wurde unterstellt, daß bei der Beurteilung von Aussagen zu sozialen Sachverhalten die eigene Einstellung der Person und die kognizierte soziale Bewertung dieser Beurteilungen („soziale Erwünsch theit") zwei periphere Dimensionen darstellen. Die Benennungen der Skalen mit expliziten Wertkonnotationen waren „umweltfeindlich/umweltfreundlich" und „wirtschaftlich unvernünftig/wirtschaftlich vernünftig". Im ersten Fall sind die Verknüpfungen zwischen der fokalen und den beiden peripheren
146
Klump & Bandilla: Wertkonnotationen der Skalenbenennung
Dimensionen für eine Person mit positiver Einstellung kongruent: „Je positiver eine Aussage über das Attitüdenobjekt ist, desto mehr stimme ich ihr zu" und „je positiver eine Aussage, desto positiver ist ihre soziale Bewertung"; bzw. „je negativer eine Aussage, desto stärker lehne ich sie ab" und „je negativer eine Aussage, desto negativer ist ihre soziale Bewertung". Bei einer Person mit positiver Einstellung sind also bei der Skalenbenennung „umweltfeindlich/umweltfreundlich" vier positive monotone Beziehungen vorhanden. Für eine Person mit Contra-Einstellung gegenüber dem Gesetz sind dagegen in diesem Fall die Verknüpfungen zwischen eigener Zustimmung/Ablehnung und dem Ausprägungsgrad der Items negativ, während weiterhin die Verknüpfungen mit der kognizierten sozialen Bewertung positiv sind. Wir haben hier also eine inkongruente Bedingung für Contra-Urteiler. Im Fall der Skalenbenennung „wirtschaftlich unvernünftig/wirtschaftlich vernünftig" ist die Situation genau umgekehrt: Für eine Person mit positiver Einstellung sind die Verknüpfungen inkongruent, für eine Person mit negativer Einstellung kongruent. Die Skalenbedingung ohne explizite Wertkonnotationen entsprach der in Rating-Aufgaben üblichen Urteilsaufgabe. Die Skalenenden waren benannt mit „gegen das Gesetz/für das Gesetz". Diese Version wurde aufgenommen, um eine Vergleichsmöglichkeit mit den bisherigen Untersuchungen zu haben.
Fragebogen und Versuchsablauf Die Befragung wurde im November 1975 auf dem Gelände des Technischen Überwachungsvereins in Mannheim durchgeführt. Der Versuchsablauf war folgender: Diejenigen PKWFahrer, die in einer längeren Autoschlange auf die Abnahme ihres Wagens warteten, wurden gefragt, ob sie an einer Befragung über das Benzin-Blei-Gesetz teilnehmen würden. Sofern Interesse vorlag, wurde ihnen der Fragebogen in den Wagen gereicht. Nach Verlesen des Instruktions-Textes durch den Versuchsleiter wurden die Versuchspersonen aufgefordert, den Fragebogen selbständig durchzuarbeiten. Der Fragebogen bestand aus 18 zusammen-
gehefteten Blättern und begann mit einer Instruktion auf der ersten Seite, in der einige allgemeine Informationen zum Benzin-Blei-Gesetz aufgeführt waren und die Benutzung der Urteilsskalen erläutert wurde. Auf jeder der folgenden Seiten war eine Aussage zusammen mit den Antwortskalen präsentiert. Die Reihenfolge dieser Skalen und der Aussagen wurden systematisch rotiert. Die Einstellungsmessung erfolgte erst auf der letzten Seite des Fragebogens mittels einer 21stufigen Skala, um etwaige Einflüsse dieser Messung auf das Urteilsverhalten auszuschließen. Der Pro- bzw. ContraGruppe gehörten diejenigen Urteiler an, die auf dieser Einstellungsskala Werte zwischen +7 und +10 bzw. - 7 und - 1 0 angekreuzt hatten, während die neutrale Gruppe aus denjenigen Urteilern gebildet wurde, deren Werte zwischen +3 und —3 lagen. Die Urteilsaufforderung für die beiden Skalen mit expliziten Wertkonnotationen lautete: „Wie beurteilen Sie die Einstellung, die in der Aussage zum Ausdruck kommt?" Geurteilt werden mußte dabei auf einer Skala, die von „umweltfeindlich" bzw. „wirtschaftlich unvernünftig" (Skalenwert: - 7 ) über „weder noch" (Skalenwert: 0) bis „umweltfreundlich" bzw. „wirtschaftlich vernünftig" (Skalenwert: +7) reichte. Die Urteilsskala ohne explizite Wertkonnotationen reichte von „gegen das Gesetz" (Skalenwert: —7) über „weder noch" (Skalenwert: 0) bis „für das Gesetz" (Skalenwert: +7), wobei auf die Frage „Welche Einstellung gegenüber dem Benzin-Blei-Gesetz hat Ihrer Meinung nach eine Person, die diese Aussage für richtig hält" geantwortet werden mußte.
Ergebnisse Zur Überprüfung der Hypothesen gingen die Mittelwerte der Urteile für die acht positiven bzw. acht negativen Aussagen pro Versuchsperson als abhängige Variable in die Analyse ein. Tabelle 1 zeigt die Gruppenmittelwerte dieser durchschnittlichen Bewertungen unter allen drei Skalenbedingungen. Zu beachten ist, daß sich bei Skala III („Wirtschaftsskala") das Vorzeichen umkehrt, da die Aussagen in diesem Fall im Vergleich zu den beiden anderen Skalen einer umgekehrten Bewertung unterliegen müssen.
147
Zeitschrift für Sozialpsychologie 1 9 7 8 , 9, 1 4 2 - 1 5 1
Tab. 1: Mittelwerte der Urteile unter allen Skalen- und Einstellungsbedingungen positive Valenz
negative Valenz
Skala 1
Skala II
Pro
5.825
5.487
-2.559
-3.714
-4.277
1.502
Neutral
2.640
2.422
-0.414
-0.485
-1.985
-0.506
Contra
3.503
3.690
-2.996
-2.390
-4.147
3.015
Skala III
Die Werte in der Tabelle entsprechen den in Hypothese 1 vorausgesagten Überschätzeffekten. Zur inferenzstatistischen Absicherung beider von uns postulierten Hypothesen war eine signifikante Dreifach-Interaktion A x B x C notwendig, die aus Tabelle 2 zu entnehmen ist. Der behauptete Überschätzeffekt der Personen mit extremer Einstellung bedurfte eines Signifkanztests in Form von Mittelwertsvergleichen. Hierzu wurde der Test für „posthoc-comparisons" nach SCHEFFE (vgl. HAYS, 1973) benutzt. Für jeden Mittelwertsvergleich zwischen den Urteilen der Personen mit extremer Einstellung und denen mit neutraler Einstellung wurde das 99%^Konfidenzintervall berechnet. Diese Intervalle sind in Tabelle 3 wiedergegeben. Der entsprechende Mittelwertsvergleich war auf dem 19^Niveau signifikant, wenn das Intervall den Wert Null nicht enthielt. Hypothese 1 kann insoweit als bestätigt angesehen werden, als die positiven Aussagen von
Skala I
Skala II
Skala III
den Pro-Urteilern auf allen drei Skalen und von den Contra-Urteilern auf der dritten Skala signifikant „überschätzt" wurden. Eine signifikante „Überschätzung" negativer Statements erfolgte bei positiv eingestellten Urteilern auf den beiden ersten Skalen, bei den negativ eingestellten Urteilern auf den Skalen II und III. Die partielle NichtÜberschätzung steht in Übereinstimmung mit der von uns aufgestellten Hypothese 2, die eine Veränderung des „Überschätzeffektes" in Abhängigkeit von der Skalenbenennung postuliert. Diese Hypothese behauptet eine Abschwächung bzw. Verstärkung des Überschätzens für Skala I bzw. Skala III je nach Einstellung der Urteiler. Die graphische Darstellung dieser Veränderung in Bild 1 verdeutlicht diese Behauptung. Im Versuchsplan drückt sich die Veränderung des Überschätzens durch eine Interaktion der Variablen „Skalenbenennung" mit den Mittel Wertsvergleichen der Einstellungsbedingun-
Tab. 2: Zusammenfassung der dreifaktoriellen Varianzanalyse Quelle Zwischen Ss A (Einstellung) Ss in groups Innerhalb Ss B (Valenz) AB B x Ss in groups C (Wertkonnotationen) AC C X Ss in groups BC ABC BC X Ss in groups
SS
df
MS
255.183 4.298 250.885
59 2 57
2.149 4.401
4592.796 1039.312 127.394 222.439 90.307 23.409 142.174 2054.532 421.154 427.075
300 1 2 57 2 4 114 2 4 114
1039.312 63.697 3.902 45.154 5.852 1.247 1027.266 105.289 4.141
F
P
266.354 16.324
.01 .01
36.210 4.693
.01 .05
248.072 25.246
.01 .01
Anmerkung: Für die Freiheitsgrade wurde die Korrektur nach GREENHOUSE & GEISSER (vgl. WINER, 1 9 7 1 2 , p . 5 2 3 ) angewendet.
148
Klump & Bandilla: Wertkonnotationen der Skalenbenennung
Tab. 3: Mittelwertsvergleiche nach SCHEFFE pro/neutral positive
negative
Valenz
Valenz
contra/neutral
Skala I
1.0497 < ^