179 47 6MB
German Pages 70 [76] Year 1986
HERAUSGEBER HUBERT FEGER
C. F. G R A U M A N N KLAUS HOLZKAMP MARTIN IRLE
BAND
15 1 9 8 4 H E F T 2
V E R L A G HANS H U B E R BERN STUTTGART WIEN
Zeitschrift für Sozialpsychologie 1985, Band 16, Heft 2 I N H A L T
Theorie und Methoden v. C O L L A N I , G.: Ein Verfahren zur Stabilitätsprüfung von Clustern in sozialen Netzwerken H E N S S , R . : Verhandlungsergebnisse und Koalitionsbildung in einem kooperativen Normalformspiel. - Theoretische Lösungskonzepte ORTH, B.: Bedeutsamkeitsanalysen bilinearer Einstellungsmodelle
83 91 101
Empirie Verhandlungsergebnisse und Koalitionsbildung in einem kooperativen Normalformspiel. - Empirische Befunde M U M M E N D E Y , A., L Ö S C H P E R , G., L I N N E W E B E R , V., O T T E N , S. & M E Y B E R G , J.-D.: Der normative Kontext aggressiver Interaktionen. Subjektive Repräsentationen von Unangemessenheit M U M M E N D E Y , H . D . & B O L T E N , H . - G . : Zur Überprüfung des Bogus-Pipeline-Paradigmas: Verhaltens-Bericht und Verhaltens-Bewertung in vier Bereichen sozialen Verhaltens HENSS, R . & OSTMANN, A . :
116
128 139
Literatur Neuerscheinungen
148
Titel und Abstracta
149
Nachrichten und Mitteilungen
150
Autoren
151
Copyright 1985 Verlag Hans Huber Bern Stuttgart Toronto Herstellung: Satzatelier Paul Stegmann, Bern Printed in Switzerland Gedruckt mit Unterstützung der Deutschen Forschungsgemeinschaft. Library o f Congress Catalog Card Number 78-126626 Die Zeitschrift für Sozialpsychologie wird in Social Sciences Citation Index (SSCI) und Current Contents / Social and Behavioral Sciences erfaßt.
83
Zeitschrift für Sozialpsychologie 1985,16,83-90
Theorie und Methoden Ein Verfahren zur Stabilitätsprüfung von Clustern in sozialen Netzwerken GERNOT VON COLLANI Technische Universität Braunschweig Es wird ein Verfahren vorgestellt, mit dem die zeitliche Stabilität und Veränderung von Gruppierungen in sozialen Netzwerken über log-lineare Modell zufallskritisch geprüft werden kann. Ausgehend von clusteranalytischen Gruppierungen zu zwei aufeinanderfolgenden Erhebungszeitpunkten werden mehrdimensionale Kontingenztafeln für die Häufigkeit sozialer Relationen zwischen Clustermitgliedern über die Zeit gebildet. Für diese Kontingenztafeln werden anschließend geeignete log-lineare Modelle gesucht. Die geschätzten Modellparameter dienen als Kriterium für die Clusterstabilität.
A procedure based on log-linear models is presented to test the stability and change of informal clusters in social networks over time. Clusters of group members from a longitudinal study are used to build up multidimensional contingency tables, representing the social relations among the cluster members over time. The estimated parameters of the model fitted to the contingency table are taken as a measure for the stability of the clusters.
1. Veränderungsmessung in der Soziometrie
dann abgelehnt werden, sofern die Daten überhaupt einen Zusammenhang aufweisen. Da man dies bei soziometrischen Daten vernünftigerweise unterstellen kann, liefert die Verwerfung einer derartigen Nullhypothese keinen besonderen Erkenntnisgewinn. 2. Die Stabilität des individuellen Wahlverhaltens sagt nicht notwendigerweise etwas über die Stabilität einzelner soziometrischer Teilstrukturen wie z.B. Cliquen oder Cluster aus. Mögliche Veränderungen von Gruppenstrukturen sind außerdem für sich genommen meist von größerem Interesse als globale Veränderungen in vordefinierten Kategorien von sozialen Beziehungen zwischen Personen. Dies gilt z.B. für pädagogische oder therapeutische Evaluationsstudien, in denen tiie Wirksamkeit von Interventionen auf die Beziehungsstruktur der Gruppenmitglieder untersucht werden soll. Gemessen an ihrer inhaltlichen und theoretischen Bedeutung sind strukturelle Veränderungen jedoch bisher in der Soziometrie relativ selten untersucht worden. Während ältere Arbeiten die
Die meisten bisherigen Arbeiten zur Veränderungsmessung oder zur Stabilität in der Soziometrie haben sich mit dem individuellen Wahlverhalten beschäftigt, z.B. mit Veränderungen von Wahlen, Ablehnungen und Indifferenzen (vgl. etwa PETILLON, 1 9 8 1 ) oder mit der Stabilität von Indizes wie dem individuellen Wahlstatus (siehe z.B. DOLLASE, 1 9 7 2 ) . Bei der Untersuchung der Stabilität individuellen Wahlverhaltens wird typischerweise eine zweidimensionale Kontingenztafel zwischen dem soziometrischen Urteilsverhalten zu zwei Erhebungszeitpunkten aufgestellt, und es werden Indizes für Übereinstimmung berechnet und ein Test auf Unabhängigkeit durchgeführt (KATZ & POWELL, 1 9 5 3 ; HUBERT & BAKER, 1 9 7 8 ) . Diese Art der Analyse hat auch für bestimmte Fragestellungen ihre Berechtigung. Es sind jedoch zwei grundsätzliche Bedenken dagegen zu erheben: 1. Die Nullhypothese der Unabhängigkeit des Wahlverhaltens zu zwei Zeitpunkten kann immer
84
v.Collani: Stabilitätsprüfung von Clustern in sozialen Netzwerken
Veränderungen von Gruppenstrukturen vorwiegend auf deskriptive Weise darzustellen versuchen (vgl. z . B . HEINICKE & BALES, 1 9 5 3 ; HILLEBRANDT, 1 9 5 8 ) , werden unter den neueren, stärker methodisch ausgerichteten Arbeiten vor allem stochastische Modelle zur Veränderungsmessung herangezogen. Diese Arbeiten beschränken sich jedoch meistens darauf, die Übergangswahrscheinlichkeiten zwischen dyadischen oder triadischen Strukturen von einem Erhebungszeitpunkt zum nächsten mit Hilfe von Markow-Modellen zu beschreiben (vgl. beispielsweise KATZ & PROCTOR, 1 9 5 3 ; HALLINAN & SOERENSEN, 1 9 7 6 ; HOLLAND & LEINHARDT, 1 9 7 7 ; RUNGER & WASSERMAN, 1 9 7 9 ) . Eine der wenigen Arbeiten zur
Veränderungsmessung, in denen komplexere Strukturen untersucht wurden, stammt von SCHWARTZ ( 1 9 7 7 ) . Er benutzt das Verfahren der Blockmodellanalyse, um Veränderungen zwischen Teilstrukturen (Blöcken) zu erfassen. Eine andere Methode hat LANGEHEINE ( 1 9 7 8 ) gewählt. Er führt eine multidimensionale Skalierung soziometrischer Datenmatrizen durch und vergleicht anschließend die Übereinstimmung der Lösungen zu verschiedenen Zeitpunkten miteinander. Dagegen bestimmt BARTRAM ( 1 9 7 7 ) soziometrische Gruppierungen über eine Clusteranalyse und schlägt ein Urnenmodell für die Veränderung der Cluster vor. Ein ähnliches Modell haben auch v. COLLANI & WEBER ( 1 9 8 2 ) verwendet, um die Stabilität soziometrischer Cluster zufallskritisch zu überprüfen. In dieser Arbeit wird eine andere Methode vorgestellt, mit der Veränderungen von Strukturen in sozialen Netzwerken erfaßt und zufallskritisch überprüft werden können. Die soziale Struktur einer Gruppe wird dabei durch informelle Gruppierungen bestimmt, wie sie sich beispielsweise aus Clusteranalysen von Soziomatrizen ergeben. Insbesondere wird die Frage untersucht werden, welche der informellen Gruppierungen sich verändert haben und welche stabil geblieben sind. Die Stabilität und Veränderung von Clustern soll mit Hilfe von Kontingenztafeln erfaßt und über log-lineare Modelle statistisch geprüft werden. Die Möglichkeit, einzelne Soziomatrizen in Form von Kontingenztafeln darzustellen und mit log-linearen Modellen zu analysieren, wurde erstmals von FIENBERG & WASSERMAN ( 1 9 8 1 ) aufgezeigt (vgl. auch REITZ, 1 9 8 2 ) . Sie verwenden
dabei binäre Zellfrequenzen, was zu erheblichen statistischen Problemen bei der Modellanpassung und bei der Durchführung der Modelltests führt. Wir werden hier ein anderes Verfahren vorschlagen, das von echten Zellhäufigkeiten ausgeht. Außerdem wird die Fragestellung erweitert, indem nun zwei Datenmatrizen sowie die Veränderungen zwischen ihnen betrachtet werden. Zunächst sollen jedoch einige Bezeichnungen eingeführt und die verwendeten Kontingenztafeln definiert werden, bevor anschließend die Modelle entwickelt und an den Daten überprüft werden.
2. Die Repräsentation soziometrischer Veränderungen durch Kontingenztafeln In bezug auf die Notation lehnen wir uns hier zunächst an die Arbeit von FIENBERG & WASSERMAN (1981)an. Wie sich noch zeigen wird, sind jedoch die Kontingenztafeln und die dazugehörigen loglinearen Modelle anders aufgebaut als bei den genannten Autoren. Wir gehen aus von einer Soziomatrix S(tl) zum Zeitpunkt 11 mit den Elementen Sy(t 1). Um die Schreibweise einfach zu halten, bezeichnen wir die Personen nur mit ihren Indizes und nicht als indizierte Elemente von Mengen. n(l)by(tl) \ c ^ i \ -- /( 01:: aPerson i wählt Person j (i ndernfalls
j)
füri, j = 1, . . . , n , i * j . Eine entsprechende Soziomatrix S(t2) sei auch für Zeitpunkt t2 gegeben. Wir beschränken uns hier auf soziometrische Relationen mit nur zwei Kategorien: Wahlen und Nichtwahlen. Grundsätzlich sind jedoch beliebige andere qualitative Relationen in sozialen Netzwerken zugelassen, z.B. Kontakte, Kommunikation, Aktivitäten usw. Die Relationen können auch mehr als zwei Abstufungen aufweisen. Die Matrix S besteht üblicherweise aus n Zeilen und n Spalten, sie muß jedoch nicht notwendig quadratisch sein. Es sind beispielsweise auch Soziomatrizen mit n 1 Wählern und n2 Gewählten denkbar, wobei n2 > n 1. Wir definieren nun «Dyaden» D y als Relationen über die Zeit zwischen den n(n-l) Elementen
85
Zeitschrift für Sozialpsychologie 1985,16,83-90
von S(tl) und S(t2) außerhalb der Diagonalen. Eine Dyade Dy ist hier ein geordnetes Paar mit (2) Dy = = (k,l) füri, j = l, ...n,i*=j;k,l = 0,1. Bei m = 2 soziometrischen Kategorien gibt es m 2 = 4 Arten von Dyaden, nämlich: (3a)Dy = (3b)Dy = (3c) Dy = (3d)Dy =
(1,1> (0,0) (0,1) (1,0)
(= (= (= (=
=) Sy(tl) = 1 und S y (t2) = 1 = > Sjj(tl) = 0 und Sy(t2) = 0 =) Sy(tl) = 0 und Sy(t2) = 1 =) Sy(t 1) = 1 und Sy(t2) = 0.
Die Dyaden (3a) und (3b) nennen wir «stabile Dyaden», (3c) und (3d) «instabile Dyaden». Im Gegensatz zu den sonst üblichen Bezeichnungen (z.B. FIENBERG & WASSERMAN, 1 9 8 1 ) sind Dyaden hier nicht als Relationen zwischen je zwei Personen definiert, sondern als Relation zwischen zwei einander entsprechenden Elementen i,j aus S(tl) und S(t2). Wir führen nun Indikatormatrizen X(k,l) für jeden Dyadentyp k,l ein:
(4)Xy(k,l)=
f 1, wenn Dy = (Sy(tl),Sy(t2)) =(k,l) l 0, andernfalls. für i,j = l , . . . , n , i ^ j ; k , 1 = 0,1.
Jedem der m 2 Typen von Dyaden ist genau eine solche Matrix X zugeordnet. Insgesamt werden alle n(n-l) möglichen Relationen bestehend aus geordneten Paaren zwischen den Kanten des Graphen von S(tl) und den dazugehörigen Kanten des Graphen von S(t2) betrachtet. Die Indikatormatrizen geben an, zu welcher Art von Dyade jede der n(n-l) dyadischen Relationen über die Zeit gehört. Durch die Einführung der Indikatormatrizen vereinfacht sich später die Bestimmung der Kontingenztafeln. Die Gruppenstruktur zum Zeitpunkt 11 für die Menge G der Gruppenmitglieder wird über eine Clusterlösung für S(tl) definiert, wobei die Cluster aus Teilgruppen von G bestehen. Die Clusterlösung wird durch die Menge C1 gebildet, deren Elemente aus den einzelnen Clustern c p vom Umfang n p bestehen. Insbesondere soll gelten:
(5) Cl = (c„c 2 (5a) c p * 0 (5b)chncq = 0 (5c) U c p = G. P
Cp,..., c r )mit
h*p f ü r p = 1, . . . , r .
Entscheidend ist nur, daß die r Cluster eine Partition von G bilden. Die Art des verwendeten Clusterverfahrens spielt dabei keine Rolle. Es kann auch eine vorgegebene «natürliche» Aufteilung verwendet werden, z.B. eine selbstgewählte Aufteilung in nichtüberlappende Arbeitsgruppen. Eine entsprechende Clusterstruktur C2 bezüglich S(t2) mit s Clustern c q sei auch für t2 gegeben. Die Zeilen der beiden Soziomatrizen S(t 1) und S(t2) werden nun nach der Zugehörigkeit der Individuen zu den Clustern c p zu 11 geordnet, die Spalten von S(tl) und S(t2) dagegen nach Zugehörigkeit zu den Clustern c q zu t2. Durch diese Umordnung der Zeilen und Spalten der Matrizen verändern sich die soziometrischen Relationen zwischen den Personen nicht. Auch die Zeilenund Spaltensummen der Matrizen, d.h. die Anzahl der von den Personen ausgehenden und auf sie gerichteten Wahlen und Indifferenzen, bleiben unverändert. Ebenso bleibt die Anzahl der symmetrischen Relationen, z.B. die Anzahl gegenseitiger Wahlen, durch diese Umordnung erhalten. Wir können nun die 4dimensionale Kontingenztafel Y bestimmen. Sie entsteht durch Summation über die einzelnen Clusterelemente in den geeigneten Indikatormatrizen. Die Zeilen und Spalten der Indikatormatrizen kann man sich dazu nach Clustern für die beiden Zeitpunkte entsprechend den Soziomatrizen geordnet vorstellen. Man erhält dann die Kontingenztafel (6) YpqkI = X I X ijkl . iec p jec q für p = 1, ...,r; q = 1
s; k, 1=0,1.
Die vier Dimensionen der Tafel werden aus den r Clustern zu 11, den s Clustern zu t2 sowie den beiden Antwortkategorien 0 und 1 zu beiden Zeitpunkten gebildet. Die einzelnen Dimensionen sollen im folgenden in fortlaufender Reihenfolge mit den Buchstaben A bis D bezeichnet werden.
86
v.Collani: Stabilitätsprüfung von Clustern in sozialen Netzwerken
Die Summe über alle Zellen von Y ergibt die Gesamtzahl der dyadischen Relationen zwischen S(tl) und S(t2): (7)Y +
+ + +
=
£ Ypqkl = n(n-l). p,q,k,l
Auf verschiedene andere Summentafeln von Y werden wir später bei der Spezifikation von Modellen eingehen.
3. Ein Anwendungsbeispiel Um das Vorgehen zu veranschaulichen, wählen wir eine soziometrische Untersuchung an einer 5. Klasse der Orientierungsstufe einer Integrierten Gesamtschule. 1 Die 24 Schüler wurden im Abstand von 4 Wochen u.a. gebeten, diejenigen ihrer Mitschüler anzugeben, mit denen sie gerne zusammen in einer Klasse bleiben würden. Es waren nur positive Wahlen zugelassen. Die Anzahl der Nennungen war auf maximal 4 begrenzt. Zunächst soll beschrieben werden, auf welche Weise die Clusterlösungen zu den beiden Erhebungszeitpunkten ermittelt wurden. Als Clusterkriterium diente die Ähnlichkeit im Wahlverhalten der Schüler, d.h. es wurden diejenigen Schüler zu Clustern zusammengefaßt, die in ihren Wahlen und Indifferenzen den Mitschülern gegenüber möglichst gut übereinstimmten. Die Vereinigung von Individuen zu einem Cluster setzt im Gegensatz zu gebräuchlichen Definitionen soziometrischer Cliquen keine gegenseitigen Wahlen zwischen Cliquenmitgliedern voraus. Als Distanzmaß wurden hier quadrierte euklidische Distanzen gewählt, die zwischen allen n(n-1 )/2 Paaren von Zeilenvektoren einer Soziomatrix bestimmt wurden. Die erhaltene symmetrische Distanzmatrix zwischen Wählern wurde anschließend mit einem hierarchischen Clusterverfahren analysiert, in diesem Fall mit dem Verfahren von Ward (vgl. ECKES & ROSSBACH [ 1 9 8 0 ] zum Verfahren selbst, sowie STEINHAUSEN & LANGER [ 1 9 7 7 ] und SPÄTH [ 1 9 7 7 ] zu Rechenprogrammen). Als Kriterium für die Festlegung der 1 Die Daten entstammen einer unveröffentlichten Untersuchung, die vom Autor zusammen mit Gerd Weber im Sommer 1981 an einer Braunschweiger Schule durchgeführt
wurde. Sabine Bohnenpoll und Ralph Melzer danke ich für die Erhebung der Daten.
Clusterzahl diente der «Fehlerwert», interpretierbar als Summe der quadrierten Abweichungen der Clusterelemente von ihrem jeweiligen Clusterschwerpunkt. Mit der gewählten Clusterlösung ergibt sich dann die Zusammensetzung der einzelnen Cluster. Wir summieren nun in jeder Indikatormatrix X über die Mitglieder der einzelnen Cluster und erhalten die 4dimensionale Kontingenztafel Y pqkl (siehe Tab. 1). Von den 5 Individuen in Cluster Cj zu t l beispielsweise gehen 11 stabile Wahlen aus. Alle 11 Wahlen sind an Personen gerichtet, die auch zu t2 wieder ein Cluster bilden. Es ist von daher plausibel, dieses Cluster im anschaulichen Sinn als zeitlich stabil zu betrachten. Dagegen gehen von den 3 Individuen aus Cluster c 5 zu 11 insgesamt 6 stabile Wahlen aus. Nur 3 davon sind an Personen gerichtet, die auch zu t2 wiederum zusammen in einem Cluster vereinigt sind, nämlich in Cluster c 4 . Cluster c 5 zu t l würde man deshalb wahrscheinlich nicht mehr als stabil ansehen können. Für die vollständige Kontingenztafel beobachteter Häufigkeiten sollen nun geeignete loglineare Modelle gefunden werden, mit denen die vermuteten Beziehungen zwischen den Clustern und den soziometrischen Kategorien vorhergesagt werden können.
Tab. 1: 4dimensionale Kontingenztafel Y zur Clusterstabilität. Zeitabstand 11, t2: 4 Wochen; 5.Klasse; 24 Schüler. B: c q , Zeitpunkt t2 cl n=5
tl A:
c2 n=4
c3 n=4 D:
0
1
0
1
15 0
5 0
15 0
0 0
40 0
0 0
23 0
1 17 0
0
1 0
16 5
2 19
1 20 9 0
0 0
15 0
0 0
28 1
3 7
1 12 1 10 0
0 0
32 0
0 0
1 2
0 3
19 0
4 1
3 0
0 0
4 0
1
1
0
0 20 0
0 0
0 0
24 0
0 0
25 0
0 0
4 2
0 1
19 0
1 0
16 0
0 0
0
c5 n=3
0 1
15 0
0 0
9 3
0 0
9 0
1 2
c6 n=1
0 1
4 0
0 1
4 0
0 0
4 0
0 0
C:
0
1
cl n=5
0 1
6 3
11
c2 n=6
0 1
30 0
c3 n=5
0 1
c4 n=4
p
c5 n=8
1
0
c
c4 n=3
2
Zeitschrift für Sozialpsychologie 1985,16,83-90
87
4. Modelle zur Stabilität von Clustern
haltens zuwenden. Dazu müssen wir auf eine weitere spezielle Summentafel näher eingehen, nämlich auf die Randsummen für die Dimensionen ABC. Sie ergeben sich aus der Summe
Für die Auswahl geeigneter Modelle sind einige Vorüberlegungen zu den Randsummen und Summentafeln der vollständigen Kontingenztabelle Y erforderlich. Wir betrachten zunächst die eindimensionalen Randsummen von Y (vgl. Tab. 1). Die Randsummen für die Dimension A ergeben sich durch Summation über die restlichen drei Dimensionen als Yp + + + + = £ Ypqld. Diese q,k,l Summen sind gleich n p • (n-1), nämlich gleich dem Umfang n p eines Clusters c p zu 11 multipliziert mit der Größe der Gesamtgruppe minus eins. Sie umfassen die Gesamtzahl der möglichen Relationen der jeweils n p Clustermitglieder zu den übrigen n-1 Gruppenmitgliedern. Entsprechende Randsummen sind auch für die Dimension B der Tafel, die Cluster c q zum Zeitpunkt t2, definiert. Die Randsummen für die beiden anderen Dimensionen C und D dagegen geben an, wieviele Wahlen und Indifferenzen zum Zeitpunkt 1 bzw. 2 insgesamt bestanden haben, d.h. insgesamt ausgesprochen und empfangen wurden. Für die Modellbildung sind weiterhin die zweidimensionalen Randsummen Y p q + + und Y + + kI der Dimensionen AB bzw. CD von Bedeutung. Auf die Tabelle für CD werden wir später im Zusammenhang mit der Stabilitätsbetrachtung noch näher eingehen. Die Summentabelle für AB wird gebildet durch Ypq + +
=
£ Ypqkl" k,l
Sie enthält die Gesamtzahl aller soziometrischen Relationen zwischen den Mitgliedern von zwei Clustern c p und c q zu t l bzw. zu t2. Diese Häufigkeiten sind eine Funktion des Umfangs beider beteiligter Cluster sowie der Anzahl ihrer gemeinsamen Mitglieder. Seien n p und n q die jeweiligen Clustergrößen und u die Anzahl der Individuen, die gleichzeitig beiden Clustern angehören. Dann läßt sich leicht zeigen, daß Ypq++=np-nq-u,
mitu = £ i e c p n c q . i
Wir wollen uns nun den Überlegungen zur Stabilität der Cluster und des individuellen Wahlver-
Ypqk +
=
£ Ypqkl" 1
Wie bereits erwähnt, sind die Häufigkeiten Y pql + , d. h. die zum Zeitpunkt 11 von den Mitgliedern eines Clusters c p an die späteren Mitglieder eines Clusters c q gerichteten Wahlen, ein möglicher Indikator dafür, ob das Cluster c p über die Zeit als stabil anzusehen ist oder nicht. Sind diese Häufigkeiten überproportional groß, dann soll das Cluster c p nach unserer Definition als stabil gelten. Diese Häufigkeit kann allerdings nur dann einen substantiellen Wert annehmen (maximal werden), wenn die Teilgruppen zu 11 und t2 ähnlich genug in Umfang und Zusammensetzung sind, d.h. wenn sie genügend viele Mitglieder gemeinsam haben. In unsere Stabilitätsdefinition gehen also neben der Konsistenz des Wahlverhaltens zwischen Clustermitgliedern über die Zeit auch Informationen über die Clustergröße und die Clusterzusammensetzung ein. Eine weitere Komponente der Stabilität muß jedoch noch berücksichtigt werden, nämlich der Zusammenhang zwischen den individuellen Wahlentscheidungen zu beiden Zeitpunkten, der durch die gemeinsame Summentafel für die Dimensionen C und D erfaßt wird. Diese Tafel ergibt sich aus Y++w=
E Y pqkl (sieheTab.2). P.Q
Tab.2: CD-Kontingenztafel Y + S1 und S2.
+kl
zur «Konformität» von
D:t2
C: t l
Indiffer. 0
Wahl 1
Indiffer.
0
449
21
470
Wahl
1
17
65
82
466
86
552
v.Collani: Stabilitätsprüfung von Clustern in sozialen Netzwerken
88
Sie stellt die zweidimensionale Kontingenztafel dar, an der üblicherweise die Konformität zwischen zwei Soziomatrizen bestimmt wird (vgl. z.B. KATZ & POWELL, 1953) und umfaßt die allgemeine Stabilität und Veränderung des individuellen Wahlverhaltens über die Zeit, unabhängig von der Clusterstabilität. Wenn sich herausstellen sollte, daß die Randsummen für die Dimensionen ABC und die Dimensionen CD hinreichend wären, um die Häufigkeiten in der gesamten Kontingenztabelle vorherzusagen, dann sollte das sparsamste log-lineare Modell zur Beschreibung der Daten Parameter für die Effekte ABC und CD enthalten, mit denen auch die dazugehörigen beobachteten Randsummen reproduziert werden können. Es ist natürlich auch möglich, daß das abgeleitete Modell mit den Effekten ABC und CD nicht in der Lage ist, die Daten hinreichend gut zu repräsentieren. Deshalb sind als Alternativen auch komplexere Modelle mit weiteren Parametern in Erwägung zu ziehen. Es ist nun zu prüfen, ob ein Modell mit diesen beiden Effekten auf empirische Daten wie jene in Tabelle 1 zutrifft.
5. Modellanpassung und Parameterschätzung Wie bei log-linearen Modellen üblich, können die Erwartungswerte in den Zellen, epqlcl bzw. ihre Logarithmen In e pqkl , als Funktion von Parametern A des jeweiligen Modells dargestellt werden: lne
pqkl
=
Als Kriterium für die Güte der Modellanpassung ziehen wir sowohl die x2-Statistik von Pearson als auch den nach x 2 verteilten LikelihoodRatio heran (zur Diskussion der beiden Statistiken vgl. z . B . UPTON, 1978 oder BISHOP, FIENBERG & HOLLAND, 1975, p.l23ff.). Wie man aus den Chiquadratstatistiken erkennen kann, paßt das aus theoretischen Überlegungen abgeleitete Modell mit den Effekten ABC und CD recht gut auf die Daten (siehe Tab.3). Dieses Modell ist gleichzeitig das sparsamste Modell, das die Daten erklären kann. Eine weitere Reduktion der Modellparameter ergibt eine deutliche Verschlechterung der Anpassung. Dies gilt insbesondere für die beiden spezielleren Modelle Nr.II und Nr.III, bei denen gegenüber dem Basismodell (Modell I) bestimmte Parameter gleich Null gesetzt wurden. Bei Modell Nr. II fehlt der Wechselwirkungseffekt CD, der die Stabilität des individuellen Wahlverhaltens beinhaltet. In Modell Nr. III wurde dagegen der Effekt ABC gleich Null gesetzt. Er umfaßt die Stabilität der Cluster. Wegen der deutlichen Unterschiede in der Güte der Anpassung kann hier auf einen formellen Test der beiden spezielleren Modelle II und III gegen Modell I als Basismodell verzichtet werden. Es überrascht nicht, daß Modell IV mit den Effekten ABD und CD die Daten nicht erklären kann. Bei diesem Modell werden nämlich die Wahlen und Indifferenzen aus der Matrix S(t2) benutzt, die dort von c p auf c q entfallen, wobei jedoch die c p an der Matrix S(t 1) bestimmt wurden. Dagegen kann Modell V, das beide Wechselwirkungseffekte 2. Ordnung als Parameter ent-
f A
( A> ¿B> •••)•
Die Modellanpassung und die Schätzung der A-Parameter aus den Erwartungswerten erfolgte hier für einen gegebenen Datensatz mit dem Programm ECTA (FAY & GOODMAN, 1973), das auf dem Algorithmus des «iterative proportional fitting» (IPF) beruht (vgl. BISHOP, FIENBERGÄ HOLLAND, 1975). In Anlehnung an Vorschläge zur Parameterschätzung bei saturierten Modellen (siehe z.B. UPTON, 1978, p.65) wurden die Häufigkeiten in den Zellen wegen der vorhandenen Nullzellen um den Wert 0.5 erhöht, weil sonst die Erwartungswerte einiger Randsummen Null werden und mit dem IPF Algorithmus dann keine Parameterschätzungen mehr möglich sind.
Tab.3: Modelle, Freiheitsgrade, xJ-Statistiken und Irrtumswahrscheinlichkeiten . Modell
df
I
58
ABC, CD
XJP
P
X'l-R
P
52.26
.688
< .001 253.79
< .001
420.63
< .001 325.10
< .001
129.48
< .001
93.00
.002
29
7.89
> .500
6.72
> .500
40
134.29
< .001
79.75
< .001
65.29
II ABC, D
59
287.76
III AB, AC, BC, CD
78
IV ABD, CD
58
V ABC, ABD, CD VI ACD, BCD,ABD
.238
89
Zeitschrift für Sozialpsychologie 1985,16,83-90
hält, die Daten sehr gut erklären, während beispielsweise Modell VI, das zwar ebenfalls relativ komplex ist und viele Parameter enthält, sich aber nicht mehr inhaltlich sinnvoll interpretieren ließe, offensichtlich den Daten nicht angemessen ist (siehe Tab.3). Ähnliche Modelltests wurden noch an weiteren Datensätzen von anderen Schulklassen durchgeführt. Es zeigte sich dabei, daß immer das auch hier gefundene Modell mit den Wechselwirkungseffekten ABC und CD auf die Daten paßte. Wir wollen uns nun der Frage zuwenden, welche der sechs zum Zeitpunkt 11 gefundenen Cluster stabil geblieben sind und welche sich Uber die Zeit verändert haben. Dazu betrachten wir die Modellparameter A a b c für die Wechselwirkung ABC (Tab.4). Sie wurden nach einem Vorschlag von GOODMAN (vgl. UPTON, 1978, p.62f.) standardisiert, indem die Schätzwerte für die Parameter durch ihre jeweiligen Standardfehler dividiert wurden. Die Abschätzung für die Standardfehler stellt dabei deren obere Grenze dar. Die standardisierten Parameter werden dann über die Standardnormalverteilung N(0,1) beurteilt. Geprüft wird die Hypothese A a b c = 0 gegen die Alternativ e ¿ABC >
Insgesamt sind nach den Tests vier Parameter signifikant. Sie geh ör en zu den Clustern c j bis c4zu 11, so daß die ersten vier Cluster gemäß unserem Kriterium als zeitlich stabil angesehen werden können, während die Cluster c 5 und c 6 , letzteres bestehend aus einer Einzelperson, danach nicht
Tab. 4: Standardisierte lambda-Parameter für die Wechselwirkung ABC. Die angegebenen Parameter beziehen sich auf die Variablenkombination ABC p 4 ,, die der Häufigkeit stabiler Wahlen zwischen Clustern entspricht. Parameter mit p(z) < .0005 sind durch * gekennzeichnet. B:t2 A: t l
cl
cl
4.387*
c2 -0.794 -0.835
c3
c4
c5
-0.872
-0.419
-1.488
-0.914
-0.452
4.535*
-1.343
-0.873
1.103
-0.531
-1.570
c2
-0.761
c3
-1.199
c4
-0.823
-0.895
c5
-1.343
0.374
-0.222
2.171
-1.573
c6
0.563
-0.401
-0.474
-0.127
0.635
3.298*
3.369*
mehr als stabil gelten können (a = .01; einseitig). Dasselbe Ergebnis erhält man auch mit der sehr konservativen a-Adjustierung nach Bonferroni beia = .05undr = 30Testsmita' = a / r = .00167. 6. Diskussion Folgende Annahmen müssen für eine Anpassung von log-linearen Modellen, wie wir sie hier vorgenommen haben, gemacht werden. Für alle N = n(n-1) dyadischen Relationen innerhalb einer Soziomatrix wird paarweise Unabhängigkeit vorausgesetzt. Die Zellhäufigkeiten Ypqkl werden als Realisation einer Multinomialverteilung mit den Wahrscheinlichkeiten P pqkl = e pqk i/N angenommen. Die Annahme unabhängiger Dyaden ist zwar üblich in vielen Netzwerkmodellen (vgl. z.B. FIENBERG & WASSERMAN, 1 9 8 1 ; RUNGER & WASSERMAN, 1979; REITZ, 1982). Man muß sich je-
doch darüber im klaren sein, daß diese Annahme allenfalls eine Approximation darstellt. Die Tatsache allerdings, daß - wie wir hier gesehen haben - nicht irgendwelche beliebigen Modelle die Daten erklären können, sondern daß auch bei mehreren unabhängigen Datensätzen nur eine bestimmte Art von Modellen zutrifft, spricht dafür, daß die Modelle sinnvoll gewählt wurden undeinebrauchbare Beschreibung der Daten darstellen. Bei der Bestimmung der Clusterstabilität sind wir hier im Sinne einer Prädiktion vorgegangen: wir haben die Stabilität über soziometrische Wahlentscheidungen definiert, die zu einem gegebenen Zeitpunkt von Mitgliedern eines bestimmten Clusters gegenüber denjenigen anderen Gruppenmitgliedern getroffen wurden, die zu einem späteren Zeitpunkt ein Cluster bilden werden. Wir hätten auch in umgekehrter Richtung vorgehen können, indem wir fragen, wieviele Mitglieder eines Clusters zu einem gegebenen Zeitpunkt ihre Wahlentscheidung an diejenigen anderen Gruppenmitglieder richten, die zu einem vorangegangenen Zeitpunkt ein Cluster gebildet haben (Postdiktion). Man kann jedoch auch die beiden erwähnten Ansätze, Prädiktion und Postdiktion, in einem gemeinsamen «bidirektionalen» Modell vereinigen. Dazu müssen allerdings die beiden Soziomatrizen z.T. etwas anders angeordnet werden. Die genannten Modellsätze erwiesen sich ebenfalls an
90
v.Collani: Stabilitätsprüfung von Clustern in sozialen Netzwerken
den Daten als zutreffend. Ihre detaillierte Darstellung würde jedoch in diesem Rahmen zu weit führen. Wir haben in dieser Arbeit versucht, die Stabilität einzelner Cluster Uber die Zeit zufallskritisch zu überprüfen. Eine Art von globaler Stabilitätsprüfung wäre ebenfalls denkbar, nämlich ein Vergleich der Partitionen zu beiden Zeitpunkten bzw. ein Vergleich der beiden Baumstrukturen aus den hierarchischen Clusterlösungen. Verfahren und Ähnlichkeitsmaße für solche Vergleiche werden z.B.beiEcKEs & ROSSBACH (1980) dis kutiert. Eine
zufallskritische Prüfung von Ähnlichkeitsmaßen für Partitionen ist zwar mit der von HUBERT & SCHULTZ ( 1 9 7 6 ) vorgeschlagenen Methode des möglich, die Prüfung der Nullhypothese setzt jedoch voraus, daß die beiden Partitionen unabhängig voneinander zustandegekommen sind. Diese Unabhängigkeit ist jedoch in unserem Fall nicht gegeben, zumal beide Partitionen auch noch mit demselben Clusterverfahren ermittelt wurden.
Literatur BARTRAM, M. 1977. Zur zufallskritischen Hypothesenprüfung bei Änderung in soziometrisch ermittelten Gruppenstrukturen. Arbeitsberichte/Forschungsergebnisseder Arbeitseinheit Pädagogische Psychologie an der Ruhr-Universität Bochum. Heft 1. Bochum. BISHOP, YVONNE M . M . , FIENBERG, E . S . & HOLLAND, P . W .
1975. Discrete multivariate analysis. Cambridge, Mass.: MIT Press.
FIENBERG, S . E . & WASSERMAN, S.S. 1981. Categorical d a t a
analysis of single sociometric relations. In: Leinhardt, S. (Ed.): Sociological Methodology 1981, p.156-192. San Francisco: Jossey-Bass. HEINICKE, C . & BALES, R.F. 1953. Developmental trends in
the structure of small groups. Sociometry, XVI, 7-38. HILLEBRANDT, F. 1958. Die Gruppenstruktur einer Schulklasse und ihre Wandlung. Schule und Psychologie, 5, 225-236. HOLLAND, P.W. & LEINHARDT, S. 1977. A dynamic model f o r
social networks. Journal of Mathematical Sociology, 5 , 5 20. HUBERT, L . J . & BAKER, F . B . 1978. Evaluating the conformity of sociometric measurements. Psychometrika, 43, 3141. HUBERT, L. J . & SCHULTZ, J . V. 1976. Q u a d r a t i c assignment as
a general data analysis strategy. British Journal of Mathematical and Statistical Psychology, 29, 190-241. KATZ, L . & POWELL, J . H . 1953. A proposed index of the con-
formity of one sociometric measurement to another. Psychometrika, 18, 249-256. KATZ, L. &PROCTOR, C . H . 1959. T h e concepts of configura-
tions of interpersonal relations in a group as a time dependent stochastic process. Psychometrika, 24, 317-327. LANGEHEINE, R. 1978. Strukturelle Stabilität - Ein neuer Ansatz zur Überprüfung der Réhabilitât in der Soziometrie. Psychologische Beiträge, 20, 571-588. PETILLON, H. 1981. Validität und Réhabilitât des soziometrischen Tests. In: Ingenkamp, K. (Hrsg.): Wert und Wirkung von Beurteilungsverfahren. Weinheim: Beltz. REITZ, K.P. 1982. Using log linear analysis with network data: Another look at Sampson's monastery. Social Networks, 4, 243-256. RUNGER, G . & WASSERMAN, S. 1979/1980. Longitudinal ana-
lysis of friendship networks. Social Networks, 2,143-154. SCHWARTZ, J . E . 1977. The structure of affective relations over time: A blockmodel analysis. In: Hummell, H. J. & Ziegler, R. (Hrsg.): Anwendung mathematischer Verfahren zur Analyse sozialer Netzwerke. Duisburg: Verlag der Sozialwissenschaftlichen Kooperativ, 73-106.
COLLANI, G . VON & WEBER, G . 1 9 8 2 . Z u r S t a b i l i t ä t u n d V e r -
SOERENSEN, A . B . & HALLINAN, M . T .
änderung soziometrischer Gruppierungen in Schulklassen. Zeitschrift für Empirische Pädagogik, 6 , 1 0 3 - 1 2 1 . DOLLASE, R. 1972. Zur UnZuverlässigkeit soziometrischer Wahlen in Schulklassen. Schule und Psychologie, 19, 3946.
model for change in group structure. Social Science Research, 5,43-61. SPÄTH, H. 1977. Cluster-Analyse-Algorithmen zur Objektklassifizierung und Datenreduktion. München: Oldenbourg.
ECKES, T. & ROSSBACH, H . 1980. Clusteranalysen. Stuttgart:
STEINHAUSEN, D . & LANGER, K . 1 9 7 7 . C l u s t e r a n a -
Kohlhammer. FAY, R. & GOODMAN, L.A. 1973. ECTA program description for users. University of Chicago. Unpublished Document.
lyse. Berlin: de Gruyter. UPTON, G . J . G . 1978. The analysis of cross-tabulated data. New York: Wiley.
1976. A
stochastic
I
^
Zeitschrift für Sozialpsychologie 1985,16,91-100
91
Verhandlungsergebnisse und Koalitionsbildung in einem kooperativen Normalformspiel - Theoretische Lösungskonzepte* RONALD HENSS Universität des Saarlandes, Saarbrücken Gegenstand dieser Arbeit sind Verhandlungen und Einigungen in einem Interessenkonflikt zwischen (mindestens) drei Personen. Ausgehend von einem Drei-Personen-Normalformspiel und dessen formaler Analyse wird eine Fortentwicklung und Präzisierung bislang üblicher Lösungsmodelle zur kooperativen Konfliktlösung versucht. Durch die Möglichkeit externer Effekte und die Verknüpfung von kooperativen und nicht-kooperativen Aspekten werden herkömmliche Betrachtungsweisen um neue Gesichtspunkte erweitert. Zentrale Differenzierungsmerkmale im Rahmen der kooperativen Analyse sind die Koalitionsdynamik sowie unterschiedliche, zum Teil bislang unberücksichtigt gebliebene Argumentationstypen zur Begründung von Forderungen.
This paper sketches a formal analysis of a three-person game in normal form enabling the study of bargaining and coalition formation in a particular kind of a conflict of interests. Customary solution models are further developed to meet this specific situation. The possibility of external effects and the combination of cooperative and non-cooperative aspects provide some new perspectives. Basic features of the cooperative analysis are: the distinction between domination and weak domination; and different forms of control. The latter are conceptualized as different types of argumentation, some of which have not been considered in this context up to now.
1.
pretation im Bereich der Sozialwissenschaften erdacht und entwickelt worden ist». Zahlreiche sozialwissenschaftliche Disziplinen lassen spieltheoretische Modellansätze in ihre Analyse von Konflikten einfließen. Im Rahmen sozialpsychologischer Forschung nehmen Untersuchungen interpersonaler Konflikte mit Hilfe «experimenteller Spiele» einen festen, wenn auch eng umschriebenen Platz ein. Die Formalisierung von Konflikten durch v. NEUMANN & MORGENSTERN benutzt «Spiele» in verschiedener Form. In der Folgezeit führt dies unter anderem zur Unterscheidung von kooperativen und nicht-kooperativen Modellen. Die kooperative Analyse bedient sich sogenannter charakteristischer Funktionen, die Auskunft darüber geben, wieviel jede mögliche Koalition «wert» ist. Die nicht-kooperative Analyse bedient sich der Normalform, die angibt, welche Konsequenzen die Entscheidungen der einzelnen Konfliktparteien für die Beteiligten haben. In jedem Falle geht man davon aus, daß die Spieler um einen zu verteilenden Nutzen konkurrieren. Seit den 50er Jahren werden Konzepte der Spieltheorie auch zur Modellierung experimenteller Spiele herangezogen. Hier finden wir ana-
Einführung
Interessenkonflikte zwischen verschiedenen Personen oder Gruppen sind in allen Lebensbereichen anzutreffen, und es besteht oft ein dringendes Bedürfnis, das Verhalten der Beteiligten in solchen Situationen besser zu verstehen. So ist es nicht verwunderlich, daß sich viele wissenschaftliche Disziplinen in irgendeiner Form mit Interessenkonflikten beschäftigen. Unter all diesen Bemühungen nehmen «spieltheoretische» Ansätze, die ihren Ausgang in der Monographie von v. NEUMANN & MORGENSTERN (1944) nahmen, einen prominenten Platz ein. Die Spieltheorie ist eine formalisierte Theorie, die Modelle für «rationales» Verhalten in Konfliktsituationen zu erarbeiten versucht. Nach COOMBS, DAWES & TVERSKY (1975, p.238) «ist sie wahrscheinlich die am besten ausgearbeitete mathematische Theorie, die mit dem Ziel einer Inter-
* Diese Arbeit entstand im Rahmen des Forschungsprojekts «Formale Modelle kooperativer Konfliktlösung», das unter Ta 56/3 von der Deutschen Forschungsgemeinschaft unterstützt wird.
92
Henss: Kooperatives Normalformspiel - theoretische Lösungskonzepte
log die Unterscheidung zwischen kooperativen und nicht-kooperativen Situationen. Im Rahmen der Analyse von Normalformspielen beschränkte man sich bislang überwiegend auf den Zwei-Personen-Fall bei wiederholten Spielen (einen Überblick gibt KRIVOHLAVY, 1974) und dort vor allem auf die recht spezielle «Prisoner's-Dilemma-Situation» (RAPOPORT & CHAMMAH, 1 9 6 5 ) . Veröffentlichungen zu experimentellen Normalformspielen mit mehr als zwei Personen liegen kaum vor. Dabei erscheint diese Variante recht interessant, denn sie führt nicht lediglich zu mehr beteiligten Konfliktparteien und damit auch zu einer größeren Komplexität; vielmehr tritt hier ein völlig neuartiges - aber außerordentlich wichtiges - Element hinzu, nämlich die Möglichkeit zur Bildung nicht-trivialer Koalitionen. Im Rahmen der Analyse von Spielen mit charakteristischer Funktion wurden hingegen zahlreiche Untersuchungen zu Interessenkonflikten zwischen mehr als zwei Parteien durchgeführt (siehe KAHAN & RAPOPORT, 1 9 8 4 ) . Besonders gut erforscht sind (Drei-Personen-)5p/'e/e mit Seitenzahlungen. Diese zeichnen sich dadurch aus, daß die Mitglieder einer Koalition, die wirklich zustandekommt, den erzielten Koalitionsgewinn beliebig untereinander aufteilen können. Hinzu kommt, daß Aufteilungsentscheidungen innerhalb einer Koalition die Möglichkeiten der übrigen Konfliktparteien in keiner Weise affizieren; es gibt keine sogenannten externen Effekte. Können Gewinne innerhalb einer Koalition nicht beliebig verteilt werden, so spricht man von
Spielen ohne Seitenzahlungen. Experimentelle
Untersuchungen hierzu liegen nur für wenige Sondersituationen vor (MCKELVEY, ORDESHOOK & WINER, 1978;FIORINA&PLOTT, 1 9 7 8 ; ALBERS, 1981).
In der vorliegenden Arbeit werden Konfliktsituationen betrachtet, die durch seitenzahlungsfreie Spiele modelliert werden können. Sie zeichnen sich also dadurch aus, daß den Mitgliedern einer Koalition feste Gewinnkombinationen zur Verfügung stehen, ohne daß die Möglichkeit einer Umverteilung der in diesen Kombinationen festgelegten Gewinne besteht. Darüberhinaus sind sie so gestaltet, daß Entscheidungen der Mitglieder einer Koalition auch Konsequenzen für die jeweils übrigen Konfliktpartner haben, die der betrachteten Koalition nicht angehören.
Außerdem vereinen sie kooperative und nichtkooperative Aspekte, indem den Versuchspersonen zwar ein Normalformspiel vorgelegt wird, sie aber über Kooperation verhandeln können. Wir werden darlegen, in welcher Weise mit diesem Normalformspiel charakteristische Funktionen ohne Seitenzahlungen verbunden sind. Die Koalitionsvereinbarungen sind nicht bindend - insofern bleibt das Spiel nicht-kooperativ. Konfliktsituationen im Alltag, die solchen Situationen ähneln, lassen sich unschwer vorstellen. Wir sehen in diesen Spielen die Chance, die seit v. NEUMANN & MORGENSTERN in Extremsituationen auseinandergedrifteten Analyse-Ansätze in einem relevanten Bereich zusammenzuführen. Im folgenden Abschnitt 2 wird mit dem «Matrix-Spiel» eine Versuchsanordnung beschrieben, mit deren Hilfe Verhandlungsverhalten, Koalitionsbildung und Kompromißfindung in der gerade skizzierten spezifischen Form des Interessenkonflikts untersucht werden können. Im Abschnitt 3 werden nach der Einführung wichtiger Grundbegriffe einige formale Lösungsmodelle für diese Konfliktsituation dargestellt (vollständige Definitionen finden sich bei TACK, 1980b und vor allem bei OSTMANN, 1984). Unter
Lösungsmodellen (-konzepten, -prinzipien) sind dabei Mengen möglicher Verhandlungsergebnisse zu verstehen, die aufgrund bestimmter Kriterien als «faire», «akzeptable» oder «stabile» Kompromisse aufgefaßt werden können. Schließlich wird noch auf einige Determinanten der Koalitionsgröße eingegangen. Die Ergebnisse zweier Versuchsserien, bei denen die hier vorgestellten Lösungsansätze einer systematischen Überprüfung unterzogen wurden, sind bei HENSS & OSTMANN, 1 9 8 5 (in diesem Heft) dargestellt (vgl. auch HENSS, 1 9 8 4 ) .
2.
Beschreibung des «Matrix-Spiels»
Das «Matrix-Spiel» ist durch folgende Versuchsanordnung gekennzeichnet: Drei Personen (Spieler) sitzen so an einem großen Usch, daß jeder über einen linken und einen rechten Nachbarn verfügt. Vor jedem Spieler befindet sich ein Computer-Terminal (Bildschirm mit zugehöriger Schreibtastatur). Auf «seinem» Bildschirm sieht jeder Spieler drei auf den Spit-
Zeitschrift für Sozialpsychologie 1985,16,91-100
93
Abb. 1: Darstellung des «Matrix-Spiels».
zen stehende Matrizen, wie sie in Abbildung 1 dargestellt sind. Jede der 27 Zellen in den Matrizen stellt ein mögliches Ergebnis einer Verhandlungsrunde dar, wobei die Zahlenwerte in diesen Zellen als Punktwerte zu interpretieren sind: Den oberen Punktwert erhält der Spieler, der diese Anordnung vor sich sieht, den Punktwert links darunter erhält sein linker Nachbar und sein rechter Nachbar bekommt die rechts unten stehende Punktzahl. Die Aufgabe der Spieler besteht darin, durch Verhandeln genau eine der 27 Zellen als Ergebnis zu bestimmen. Dabei sollen sie - jeder für sich selbst - versuchen, möglichst viele Punkte zu erzielen. Zur Festlegung des Ergebnisses verfügt jeder Spieler über drei Alternativen (Strategien). Auf den einzelnen Bildschirmen sind die Anordnungen der Punkte und Alternativen so vertauscht, daß die Aufgabe eines jeden Spielers darin besteht, selbst eine der drei Matrizen festzulegen. Im vorliegenden Beispiel kann der Spieler entweder die Matrix , oder wählen. Sein lin-
ker Nachbar kann in jeder dieser Matrizen eine der von links oben nach rechts unten verlaufenden Reihen («Linksstreifen»; hier: , oder ) wählen. Der rechte Nachbar entscheidet sich durch seine Wahl für einen der drei «Rechtsstreifen» (, oder ). Ein Ergebnis kann nur durch das Zusammenwirken aller Spieler zustande kommen, denn eine Einzelentscheidung beschränkt den Bereich möglicher Ergebnisse auf neun Zellen, eine Kombination von zwei Wahlen determiniert drei Zellen und erst durch die Kombination der Entscheidungen aller drei Spieler wird eine Punkte-Kombination als Ergebnis eindeutig bestimmt. Da durch die Verteilung der möglichen Kombinationen von Punktwerten ein mehr oder weniger deutlicher Interessenkonflikt vorgegeben wird, müssen die Spieler zur Festlegung des Ergebnisses miteinander verhandeln, um möglichst einen akzeptablen Kompromiß zu finden. Diese Verhandlung unterliegt keinerlei zeitlichen Begrenzungen und erfolgt bei völlig unbeschränkter Kommunikation. Sie ist beendet, wenn eine der drei folgenden Bedingungen erfüllt ist:
94
Henss: Kooperatives Normalformspiel - theoretische Lösungskonzepte
- Alle drei Spieler haben sich auf eine bestimmte Wahlkombination geeinigt (Große Koalition). - Es hat sich eine Paar-Koalition gebildet, die allen Bemühungen des dritten Spielers um eine Veränderung ihrer Entscheidung widersteht. - Es kommt keine Einigung zustande, alle drei Spieler wollen aber trotzdem die Verhandlung beenden. Zum Abschluß des Experiments muß jeder Spieler seine endgültige Entscheidung treffen, wobei jetzt keiner weiß, wie sich die anderen entschieden haben. Somit ist hier also durchaus auch die Möglichkeit des «Betrugs» gegeben. Erst wenn alle drei Entscheidungen vorliegen, ist das Ergebnis festgelegt und das Spiel beendet.
3.
Formale Lösungsmodelle
3.1 Grundkonzepte Das Matrix-Spiel repräsentiert eine Konfliktsituation, die formal durch das Mengen-System (N; A1 An; P,, ..., Pn) beschrieben werden kann. Hierbei steht N für die Menge aller Spieler, die mit 1,2, ..., n bezeichnet werden. Die MengenFolge A „ . . . , An gibt für jeden Spieler die Menge seiner Alternativen an. Daraus läßt sich die Menge A aller möglichen Ergebnisse konstruieren, die durch die Menge aller Alternativen-Kombinationen gegeben ist. Die Mengen-Folge P , , . . . , Pn beschreibt für jeden Spieler eine zweistellige Präferenz-Relation, die für je zwei Ergebnisse angibt, welches über das andere präferiert wird. In der Terminologie von TACK (1980b) repräsentiert das Matrix-Spiel eine vollständige und meßbare C-Situation. Das Attribut «vollständig» soll ausdrücken, daß die Spieler in der Lage sind, alle möglichen Ergebnisse bei ihren Entscheidungen zu berücksichtigen (dies kann zum Beispiel bei Spielen mit unendlich vielen Ergebnissen, wie sie für Seitenzahlungssituationen typisch sind, nicht angenommen werden). «Meßbar» bedeutet, daß die individuellen Präferenzen durch numerische Funktionen dargestellt werden können. Der Term «C-Situation » verweist auf eine allgemeinere Klasse von «conflict »-Situationen, in denen eine kooperative Konfliktlösung in dem Sinne möglich ist, daß die beteiligten Par-
teien miteinander verhandeln und mehr oder weniger bindende Absprachen Uber die Koordination ihrer Entscheidungen treffen können; es handelt sich dabei also um ein explizites Aushandeln eines Kompromisses («explicit bargaining» im Sinne von SCHELLING, i960). Hat jeder Spieler seine Entscheidung getroffen, so ist hiermit ein Ergebnis (engl.: «outcome») festgelegt, das durch die Angabe der Strategien-Kombination bezeichnet wird. Dieses bewirkt eine Auszahlung (engl.: «payoff»), die angibt, welchen Punktwert jeder Spieler aufgrund des erzielten Ergebnisses erhält. (Wir werden im folgenden nicht zwischen «Ergebnissen» und «Auszahlungen» unterscheiden, da Verwechslungen nicht zu befürchten sind.) Zur vollständigen Beschreibung eines Verhandlungs-Äesw/iais (engl.: «result») gehört neben der Angabe des Ergebnisses auch eine Angabe über dessen Zustandekommen. Letztere erfolgt anhand der sogenannten «Koalitionsstruktur», deren Definition jedoch zuerst noch eine Präzisierung des Begriffs «Koalition» vorangestellt werden muß. Jede nicht-leere Teilmenge der Spielermenge N ist eine Koalition, d.h. eine Menge S ist eine Koalition, wenn gilt: (i) SCN (ii) S * 0 . Dieser Koalitions-Begriff umfaßt auch die Sonderfälle der Koalition aus allen Spielern («Große Koalition») sowie jede Menge, die lediglich aus einem einzelnen Spieler besteht. Eine Koalitionsstruktur T ist eine Menge von Koalitionen T = {Sx Sk] für die gilt: (i) Sjn Sj = 0 für alle i * j (ii) US; = N i = 1,.... k. Eine Koalitionsstruktur ist demnach eine Partition der Spielermenge N. Durch diese Definition ist gewährleistet, daß das Zustandekommen eines Ergebnisses stets auf einer Koalitionsstruktur basiert. Zahlreiche Lösungsmodelle für kooperative Situationen greifen auf das Konzept der S-Rationalitätzurück: Ein Ergebnis ist für eine Koalition S S-rational, wenn kein anderes Ergebnis exi-
Zeitschrift für Sozialpsychologie 1985,16,91-100
stiert, welches für diese Koalition besser und durchsetzbar ist. Die Entscheidung, welches von zwei verschiedenen Ergebnissen «besser» ist, kann immer dann Probleme aufwerfen, wenn mindestens zwei Personen beteiligt sind. Aus der Sicht einer Koalition S ist ein Ergebnis asA zweifellos dann besser als ein Ergebnis beA, wenn alle Mitglieder von S das Ergebnis a dem Ergebnis b vorziehen (für alle ieS gilt: x,(a) > X;(b)). In diesem Falle sprechen wir von einer «starken» S-Präferenz. Es erscheint aber sinnvoll, diesem sehr restriktiven «Besser»-Begriff eine «schwache» S-Präferenz gegenüberzustellen: Für eine Koalition S ist das Ergebnis a besser als das Ergebnis b, wenn kein Koalitionsmitglied b über a präferiert, aber mindestens ein Mitglied a über b präferiert (für alle ieS gilt: X;(a) > X;(b) und es gibt ein Mitglied jeS für das gilt: XJ(a) > XJ(b)). Die schwache Präferenz erlaubt es also, den Vorteil eines anderen zumindest auch dann zu verfolgen, wenn niemand einen Nachteil davon hat; bisherige Untersuchungen verweisen auf ein deutliches Überwiegen dieser Form der Präferenz (TACK, 1980a, b). Man kann die beiden Präferenzarten auch im Sinne einer Koalitionsdynamik interpretieren: Die Beschlußfassung erfordert Einstimmigkeit, wobei Indifferenzen im Falle der starken Präferenz als Neinstimmen und im Falle der schwachen Präferenz als Enthaltungen gewertet werden. Bei der Frage nach der Durchsetzbarkeit eines Ergebnisses ist zu beachten, daß in den hier betrachteten Konfliktsituationen jede Koalition über gewisse Kontrollmöglichkeiten verfügt. Diese lassen sich auch als unterschiedliche Argumentationstypen darstellen, mit denen aus der Zuweisung von aktiver und reaktiver Rolle bestimmte Forderungen als begründbar abgeleitet werden können. (Die folgenden Betrachtungen sind aus der Sicht der Großen Koalition irrelevant, da für diese jedes mögliche Ergebnis auch durchsetzbar ist.) Im einfachsten Falle können die Mitglieder einer Koalition vereinbaren, nur noch ganz bestimmte Wahlen in Betracht zu ziehen und damit den Bereich der möglichen Ergebnisse auf eine Teilmenge von A einschränken: Für eine Koalition S ist ein Ergebnis aeA dann a-durchsetzbar,
95
wenn sie Uber eine Wahlmöglichkeit (d.h. über eine Kombination wählbarer Alternativen ihrer Mitglieder) verfügt, bei der jedes Koalitionsmitglied mindestens so viel erhält wie bei a, unabhängig davon, wie sich die Mitglieder der Gegenkoalition N-S entscheiden. Hier legt die Koalition S aktiv eine Strategie vor und betrachtet, was schlimmstenfalls passieren kann. In dem oben angegebenen Beispiel könnte der Spieler, der diese Anordnung vor sich sieht, etwa so argumentieren: «Ich wähle , weil ich dann auf jeden Fall mindestens 3 Punkte erhalte». Daneben besteht für eine Koalition aber auch - zumindest theoretisch - die Möglichkeit, die eigenen Entscheidungen in Abhängigkeit von den Entscheidungen ihrer Nicht-Mitglieder einzuschränken: Ein Ergebnis aeA ist für eine Koalition S ß-durchsetzbar, wenn S für jede mögliche Entscheidung ihrer Nicht-Mitglieder eine Reaktionsmöglichkeit zur Verfügung steht, die sicherstellt, daß jedes Mitglied von S mindestens so viel wie bei a erhält. Da die Spielregeln vorsehen, daß die Spieler ihre endgültige Entscheidung ohne Kenntnis der Wahlen der anderen treffen, ist strenggenommen die - nur reagierende - ß-Durchsetzbarkeit in dieser konkreten Versuchsanordnung unangebracht. Während der Verhandlung scheint diese Kontrollmöglichkeit aber eine gewisse Rolle zu spielen; sie manifestiert sich dort in Aussagen der Art «Wenn Ihr und wählt, dann wähle ich aber ». Die Koalition S argumentiert also so, als hätte sie die Möglichkeit zu reagieren und gegen die von der Gegenkoalition N-S vorgelegte oder zumindest angekündigte Wahl zu optimieren. Die Unterscheidung zwischen a- und ßDurchsetzbarkeit geht auf Überlegungen von AUMANN, PELEG und JENTZSCH zurück (AUMANN & PELEG, 1 9 6 0 ; AUMANN, 1 9 6 1 ; JENTZSCH, 1 9 6 4 ) .
Kehrt man die Verteilung von aktiver und reaktiver Rolle um, so folgt aus der ß-Durchsetzbarkeit eine weitere Kontrollmöglichkeit: Die Koalition S legt selbst aktiv eine Strategie vor, wobei sie davon ausgeht, daß die Gegenkoalition N-S dagegen optimiert oder die Gegenkoalition N-S sogar explizit dazu auffordert, dies zu tun. Damit sind für S die Reaktionen von N-S kalkulierbar geworden. Dieses Konzept wurde zwar schon im Rahmen der ökonomischen Duopoltheorie diskutiert (STACKELBERG, 1938), blieb
96
Henss: Kooperatives Normalformspiel - theoretische Lösungskonzepte
aber im Zusammenhang mit dem hier betrachteten Konflikttyp bislang völlig unbeachtet. Aus den Beobachtungen von Verhandlungen ergeben sich jedoch zahlreiche Hinweise auf die Verwendung dieses Argumentationstyps, wie zum Beispiel «Wir wählen und . Dann wirst Du nämlich wählen, weil das für Dich am besten ist.» Wir sprechen von y-Durchsetzbarkeit, wenn die Koalition S davon ausgeht, daß N-S im Sinne der schwachen Präferenz entscheidet und von öDurchsetzbarkeit, wenn die Koalition S der Gegenkoalition die Optimierung im Sinne der starken Präferenz unterstellt. Kombiniert man die unterschiedlichen Arten der Durchsetzbarkeit mit den beiden Formen der S-Präferenz, so lassen sich verschiedene Varianten der S-Rationalität unterscheiden. Geht man davon aus, daß die jeweilige Sichtweise von allen Spielern akzeptiert wird, so können diese als unterschiedliche Argumentationsweisen aufgefaßt werden, mit deren Hilfe im Laufe der Verhandlung bestimmte Vorschläge oder Forderungen begründet oder argumentativ vertreten werden können. Jeder Argumentationstyp führt auf eine bestimmte charakteristische Funktion, die jeder Koalition eine Menge von Ergebnissen zuordnet, die für diese - im Rahmen eben dieses Argumentationstyps - «forderbar» ist. Argumentationen eines bestimmten Typs können «scheitern», indem sie zum Beispiel zu Ergebnissen führen, die als inkonsistent empfunden werden oder indem sie zu keinerlei Ergebnis führen. Welche Variante «am weitesten führt», hängt von den spezifischen strukturellen Merkmalen der Konfliktsituation ab. Bislang wurde noch nicht untersucht, welche Argumentationstypen im Laufe einer Verhandlung verwendet und ob sie «situationsangemessen» eingesetzt werden. 3.2 Verhandlungsergebnisse Die einfachste Forderung an eine «vernünftige» Lösung besteht wohl darin, daß jeder Spieler zumindest so viel erhalten soll, wie er sich selbst, das heißt auch ohne jegliche Kooperation mit anderen, sichern kann. Auszahlungen, die dieser Bedingung genügen, also für jeden Einzelspieler Srational sind, heißen individuell rational. Wäre die individuelle Rationalität nicht sichergestellt, so würde das Ergebnis für den betroffenen Spie-
ler gewissermaßen eine Bestrafung darstellen. Da er diese aber im Rahmen seiner eigenen Kontrollmöglichkeiten vermeiden kann, besteht für ihn eigentlich kein Grund, einer derartigen Einigung zuzustimmen. Zahlreiche empirische Untersuchungen stützen dieses theoretisch plausible Konzept. Verletzungen der individuellen Rationalität konnten nur äußerst selten beobachtet werden. Bei seitenzahlungsfreien Spielen ließen sich diese wenigen Fälle überwiegend auf ganz bestimmte Auszahlungs-Konfigurationen zurückführen (TACK, 1983). Ergebnisse, die für die Gesamtmenge aller Spieler - also für die Große Koalition - S-rational sind, erfüllen die Bedingung der Gruppen-Rationalität; sie bilden die Menge der N-pareto-optimalen Ergebnisse und zeichnen sich dadurch aus, daß Verbesserungen eines Einzelnen oder mehrerer Spieler nur dann möglich sind, wenn sich zugleich zumindest ein Spieler (echt) verschlechtert. Umgekehrt existiert zu jedem nicht N-pareto-optimalen Ergebnis mindestens ein Ergebnis, welches für die gesamte Spielermenge N besser ist. Bei der Bestimmung der N-pareto-optimalen Ergebnisse sind die Interessen aller Spieler miteinander verträglich, innerhalb dieser Menge ergeben sich aber auf jeden Fall Konflikte, da Verbesserungen für eine Koalition stets nur auf Kosten anderer erzielt werden können. Ein Ergebnis, welches sowohl individuell rational als auch gruppenrational ist, heißt Imputation. Bei den bisherigen Betrachtungsweisen wurden die Möglichkeiten, die sich durch die Bildung «echter» Koalitionen ergeben, nicht beachtet. Dehnen wir diese Überlegungen nun auf jede mögliche Koalition aus, so führt dies auf ein besonders wichtiges Lösungsmodell: Das Core (Kern) besteht aus der Menge aller Auszahlungen, die für jede mögliche Koalition S-rational sind. Im 3-Personen-Fall bedeutet dies, daß Core-Auszahlungen gleichzeitig für jeden Einzelspieler, für jede Paar-Koalition und auch für die Große Koalition rational sind. Die Attraktivität einer Lösung mit all diesen Eigenschaften erscheint unmittelbar plausibel; gegen Core-Auszahlungen können von keiner Seite irgendwelche Einwände vorgebracht werden in dem Sinne, daß keine anderen Auszahlungen existieren, die sowohl besser als auch durchsetzbar sind.
97
Zeitschrift für Sozialpsychologie 1985,16,91-100
Das Core-Konzept liefert aber nicht unbedingt eine gute Vorhersage des voraussichtlichen Ergebnisses, denn unter Umständen existiert gar keine Auszahlung, die für jede mögliche Koalition S-rational ist, das heißt das Core kann leer sein. Andererseits spricht die Tatsache, daß das Core auch mehrere verschiedene Elemente enthalten kann, nicht gegen seinen prognostischen Wert, da auch Lösungskonzepte sinnvoll sind, die den Bereich der zu erwartenden Ergebnisse lediglich einschränken, ohne jedoch eine einzige (Punkt-)Lösung vorherzusagen; dies gilt übrigens für alle hier betrachteten Lösungsmodelle. Je nach der zugrundeliegenden RationalitätsVariante kann das Core sehr unterschiedlich ausfallen. Aufgrund einer bestimmten Sichtweise kann es «groß» sein, während eine andere Form der Rationalität auf ein leeres Core führt. Dabei gelten folgende Beziehungen: ß-, y- und 8-Core sind immer Teilmengen des a-Core und das Core auf der Basis der «^»-Relation ist stets eine Teilmenge jenes Core, das aus der « > »-Relation resultiert. Ein offenkundiger Mangel des Core-Konzepts läßt sich unmittelbar an dem in Abbildung 1 vorgestellten Beispiel verdeutlichen (Anmerkung: Die Matrizen sind in diesem Beispiel so konstruiert, daß einerseits nicht zwischen starker und schwacher Präferenz und andererseits nicht zwischen a- und ß-Durchsetzbarkeit unterschieden werden kann. Day- bzw. 8-Durchsetzbarkeithier auf ein leeres Core führen, gelten die folgenden Betrachtungen nur für die a- und die ß-Durchsetzbarkeit). Das Core zur Auszahlungskonfiguration in Abbildung 1 ist durch die Auszahlung (3,12,11) gegeben (Strategien: twz). Der «erste» Spieler erhält somit nur 3 Punkte. Diesen Betrag kann er sich jedoch auch ohne jegliche Kooperation mit anderen sichern, indem er wählt. Diesem Spieler gewährt somit die Core-Auszahlung keine positive Dividende. Seine Mitarbeit würde sich überhaupt nicht auszahlen; ein Motiv für seine Kooperation ist nur schwer vorstellbar. Es wäre für ihn sogar vorteilhaft, in überhaupt keine Koalition einzutreten und nur abzuwarten, was die anderen tun, da für ihn damit in vielen Fällen eine echte Verbesserung verbunden wäre. Damit ist das Phänomen der externen Effekte angesprochen, das bei den in der einschlägigen Literatur üblicherweise untersuchten Spielen mit Seitenzahlungen nicht auftritt.
Dies Beispiel lenkt zugleich den Blick auf ein weiteres Lösungskonzept, die sogenannte d-Lö-
sung.
Diese läßt sich wohl am besten anhand einer graphentheoretischen Betrachtungsweise erläutern: Man stelle sämtliche verschiedenen Ergebnisse als Punkte dar. Präferiert irgendeine Koalition S ein Ergebnis aeA über ein Ergebnis beA und ist a für diese Koalition durchsetzbar, so soll ein Pfeil von b nach a führen. Ein derartiger Pfeil symbolisiert die Tendenz der Koalition S, von dem Ergebnis b zum Ergebnis a überzugehen, also die «dynamische» Komponente der Verhandlung. Eine Menge von Ergebnissen heißt absorbierend, wenn von keinem ihrer Punkte irgendein Pfeil zu einem Ergebnis außerhalb dieser Menge führt. Durch die absorbierende Menge werden jene Punkte ausgesondert, zu denen keine besseren und durchsetzbaren Ergebnisse existieren, die somit von keinem Element außerhalb dieser Menge dominiert werden. Da die Menge aller möglichen Ergebnisse trivialerweise auch absorbierend ist, ist folgende Einschränkung angezeigt: Eine Menge von Ergebnissen heißt minimal absorbierend oder Endzyklus, wenn sie selbst absorbierend, jede ihrer nicht-leeren echten Teilmengen aber nicht mehr absorbierend ist. Die Vereinigung aller Endzyklen bildet die d-Lösung («dynamic Solution»; vgl. SHENOY, 1977), die als jene Lösungsmenge verstanden werden kann, in der die Spieler schließlich verbleiben. Ist ein Endzyklus einelementig («entartet»), dann ist dieser Punkt ein Core-Element. Die d-Lösung im obigen Beispiel enthält also insbesondere auch die Core-Auszahlung (3, 12, 11). Interessant wird sie allerdings erst dadurch, daß sie einen weiteren, und zwar nicht-entarteten Endzyklus enthält, der aus den Auszahlungen (5, 10,10), (7, 11, 8) und (9, 9, 9) besteht. Innerhalb dieses Dreier-Zyklus präferiert jeweils eine andere Paar-Koalition eine Auszahlung über eine andere, wobei aber stets für alle Spieler eine positive Dividende gewährleistet ist. Im vorliegenden Falle beschreibt dieser echte d-Zyklus vermutlich eine attraktive Lösungsmenge. Die Spielregeln sehen vor, daß die Spieler ihre endgültige Entscheidung ohne Kenntnis der Entscheidungen der anderen treffen; Einigung und tatsächlich realisiertes Ergebnis müssen also nicht unbedingt übereinstimmen. Damit erhebt
98
Henss: Kooperatives Normalformspiel - theoretische Lösungskonzepte
sich die Frage, in welchem Umfange die Spieler dies berücksichtigen und sich bei der Einigung gegen einen möglichen «Betrug» absichern. Stellen wir uns vor, daß sich alle Spieler auf eine bestimmte Wahlkombination geeinigt haben. Nun kann sich jeder überlegen, ob sich unter der Voraussetzung, daß sich alle anderen an die Verabredung halten, eine Abweichung für ihn lohnen würde. Ein Ergebnis aeA ist ein (schwaches) Gleichgewicht, wenn es aus der Sicht eines jeden Spielers eine beste Antwort auf die jeweiligen Wahlen der übrigen Spieler darstellt. Das heißt: unter der Voraussetzung, daß jeweils alle anderen bei der vereinbarten Wahl bleiben, verfügt kein Spieler über eine Alternative, die für ihn selbst zu einem besseren Ergebnis führt; möglicherweise würden aber auch weitere Alternativen dieses Spielers für ihn selbst zum gleichen Punktwert führen. Ein Ergebnis aeA ist ein starkes Gleichgewicht, wenn dies für jeden Spieler zugleich auch die einzige beste Antwort auf die entsprechenden Wahlen der anderen ist. Die Einigung auf ein Gleichgewicht ist insofern attraktiv, als es für keinen Einzelnen ein - eigennütziges - Motiv gibt, von dieser Verabredung abzuweichen. Ein starkes Gleichgewicht besitzt darüberhinaus auch noch den Vorteil, daß jede Abweichung eines einzelnen Spielers unweigerlich mit eigenen Verlusten einhergehen würde. Im Beispiel der Auszahlungskonfiguration aus Abbildung 1 ist die Gefahr, daß ein Spieler bei seiner endgültigen Entscheidung von der vereinbarten Einigung abweicht, relativ gering. Da hier a- und ß-Durchsetzbarkeit nicht unterscheidbar sind, ist nämlich, sobald sich eine Paar-Koalition gebildet hat, der dritte Spieler «machtlos». Wird diese Voraussetzung aufgegeben, so führt dies zu einer beträchtlichen Erweiterung des Handlungsspielraums, so daß nun unter Umständen ein Bruch der Vereinbarung sehr attraktiv sein kann. Versuchen .mehrere Spieler, sich durch Abweichen von der Absprache einen Vorteil zu verschaffen, so kann dies allerdings zu Ergebnissen führen, die für alle sehr viel schlechter sind. Erste Aufschlüsse darüber, unter welchen Bedingungen sich die Spieler an die getroffene Vereinbarung halten bzw. durch Abweichen ein «Nachbessern» ihres Ergebnisses zu erzielen versuchen, geben die Ergebnisse empirischer Untersuchungen, welche an anderer Stelle beschrieben
werden sollen sem Heft).
(HENSS & OSTMANN, 1 9 8 5 ,
in die-
3.3 Determinanten der Koalitionsgröße Es ist nahezu selbstverständlich, daß eine Einigung nicht unabhängig von den strukturellen Merkmalen der jeweils gegebenen Konfliktsituation erfolgt. Eine wichtige Determinante der Koalitionsgröße ist - zumindest im Seitenzahlungsfall - die Core-Größe. Bei Spielen mit nicht-leerem Core wird die Einigung zumeist im Rahmen der Großen Koalition erzielt, bei Spielen mit leerem Core nimmt der Anteil von Paar-Koalitionen und einem isolierten Einzelspieler in der Regel zu (KAUFMANN & TACK, 1 9 7 5 ; MEDLIN, CROTT, SCHOLZ, KSIENSK & POPP, 1 9 8 3 ) .
1976;
NichtEinigungen sind hingegen sehr selten und meist auf ganz bestimmte, sogenannte «unwesentliche» Situationen beschränkt. Ein erhöhter Anteil von Paar-Koalitionen bei Spielen mit leerem Core erscheint auch bei Spielen ohne Seitenzahlungen plausibel: Ein leeres Core ist dadurch charakterisiert, daß keine Auszahlung existiert, die für jede Paar-Koalition S-rational ist, somit gibt es zu jedem möglichen Einigungsvorschlag für die Gesamtgruppe stets ein Spielerpaar, welches die Große Koalition verhindern möchte, da für dieses Paar eine bessere und auch durchsetzbare Auszahlung vorhanden ist. Dagegen können Core-Auszahlungen (im Rahmen der zugrundeliegenden Argumentationsweise) von keiner Koalition abgelehnt werden, so daß im Falle eines nicht-leeren Core ein hoher Anteil von Einigungen in der Großen Koalition erwartet werden kann. In seiner Kritik der Lösungsmodelle für Seitenzahlungsspiele weist SELTEN ( 1 9 7 2 ) darauf hin, daß Einigungskoalitionen ausschöpfend sein sollten, das heißt daß durch die Bildung einer größeren Koalition der verteilbare Gesamtwert nicht vergrößert werden kann. Seine Nachanalyse des bis dahin vorliegenden Datenmaterials stützt diese Hypothese. Eine ausschöpfende Paarstruktur liegt vor, wenn eine Paar-Koalition und ein isolierter Einzelspieler existieren, für die gilt, daß der Wert, den die Paar-Koalition erhält, plus dem Wert, den der Einzelspieler erhält, genau den Wert der Großen Koalition ergeben. In
Zeitschrift für Sozialpsychologie 1985,16,91-100
diesem Falle besteht weder für die Paar-Koalition noch für den Einzelspieler ein Anreiz, die Große Koalition zu bilden, da damit keine zusätzlichen Gewinne verbunden wären, welche die beiden Parteien untereinander aufteilen könnten. Neuere Experimente zu Spielen mit Seitenzahlungen (vgl. TACK, 1 9 8 4 ) zeigen, daß die Anzahl ausschöpfender Paarstrukturen in Interaktion mit der Core-Größe einen wesentlichen Einfluß auf die Art der Einigung hat. Da bei Spielen ohne Seitenzahlungen die «Werte» der verschiedenen Koalitionen aber nicht durch eine einzige Zahl, sondern stets durch einen Auszahlungs-Vektor gegeben sind, ist die Übertragung des Begriffes «ausschöpfende Paarstruktur» auf diesen Konflikttyp nicht eindeutig. Wie die Ergebnisse erster systematischer Untersuchungen gezeigt haben, ist eine befriedigende Generalisierung dieses wichtigen Konzepts bislang noch nicht gelungen (HENSS, 1984). 4.
Zusammenfassung
Mit dem «Matrix-Spiel» wurde eine Versuchsanordnung vorgestellt, die in mehreren Punkten von den bislang vorherrschenden Paradigmen abweicht. Hier sind vor allem die Beschränkung auf einen endlichen Ergebnisraum, die NichtÜbertragbarkeit von Gewinnen, die Möglichkeit externer Effekte, sowie die Verknüpfung von kooperativen und nicht-kooperativen Aspekten zu nennen (vgl. OSTMANN, 1984). Es wurde eine Übertragung herkömmlicher Lösungsmodelle auf diesen spezifischen Konflikttyp versucht, und die Analyse-Ansätze wurden durch die Unterscheidung zwischen starker und schwacher Präferenz, sowie durch die Betrachtung unterschiedlicher Argumentationstypen zur Begründung von Forderungen um einige neuartige Gesichtspunkte erweitert. Auskünfte über den deskriptiven Wert der hier vorgestellten Lösungsmodelle geben erste systematische empirische Untersuchungen zu dieser spezifischen Konfliktsituation (HENSS, 1984;HENSS&OSTMANN, 1985, in diesem Heft).
99
Literatur ALBERS, W. 1981. Ergebnisse experimenteller Standortspiele. Erster Überblick. Bielefeld: Institut für Mathematische Wirtschaftsforschung, Diskussionspapier. AUMANN, R.J. 1961. A survey of cooperative games without side payments. In: Shubik, M. (Ed.): Essays in mathematical economics in honour of Oskar Morgenstern. Princeton, N.J.: Princeton University Press, 3-27. AUMANN, R . J . & PELEG, B . 1 9 6 0 . V o n
Neumann-Morgen-
stern solutions to cooperative games without side-payments . Bulletin of the American Mathematical Society, 66, 173-179.
C.H., DAWES, R.M. Ä T V E R S K Y , A. 1975. Mathematische Psychologie. Weinheim: Beltz.
COOMBS,
CROTT, H . W . , SCHOLZ, R . W . , KSIENSIK, M . I . & POPP, M .
1983. Koalitionsentscheidungen und Aufteilungsverhalten in Drei-Personen-Spielen. Frankfurt/M.: Lang. FIORINA, M . P . & PLOTT, C . R . 1978. C o m m i t t e e decisions u n -
der majority rule: An experimental study. American Political Science Review, 7 2 , 5 7 5 - 5 9 8 . HENSS, R. 1984. Das «Matrix-Spiel»: Verhandlungsergebnisse und Koalitionsbildung in einem Drei-Personen-Spiel ohne Seitenzahlungen. Saarbrücken: Arbeiten der Fachrichtung Psychologie, Universität des Saarlandes, Nr. 87. HENSS, R . & OSTMANN, A . 1 9 8 5 . Verhandlungsergebnisse und Koalitionsbildung in einem kooperativen Normalformspiel. Empirische Befunde. Zeitschrift für Sozialpsychologie, 16, 1 1 6 - 1 2 7 .
JENTZSCH, G. 1964. Some thoughts on the theory of cooperative games. Annals of Mathematics Studies, 52, 407-442 (posthum). KAHAN, J . P . & RAPOPORT, A . 1 9 8 4 . Theories of coalition formation. Hillsdale: Erlbaum. KAUFMANN, M . A . & TACK, W . H . 1 9 7 5 . Koalitionsbildung und Gewinnaufteilung bei strategisch äquivalenten 3-Personen-Spielen. Zeitschrift für Sozialpsychologie, 6, 227245.
KRIVOHLAVY, J. 1974. Zwischenmenschliche Konflikte und experimentelle Spiele. Bern: Huber. MCKELVEY, R . D . , ORDESHOOK, P . C . & WINER, M . 1 9 7 8 . T h e
competitive solution for N-person games without transferable untility, with an application to committee games. American Political Science Review, 7 2 , 5 9 9 - 6 1 5 . MEDLIN, S.M. 1976. Effects of grand coalition payoffs on coalition formation in three-person games. Behavioral Science, 21, 48-61. VON NEUMANN, J . & MORGENSTERN, O . 1 9 4 4 . Theory of games and economic behavior. Princeton, N.J.: Princeton University Press. (Deutsch: Spieltheorie und wirtschaftliches Verhalten. Würzburg: Physica, 1 9 6 1 . ) OSTMANN, A. 1984. Die Berücksichtigung externer Effekte und der Endlichkeit des Ergebnisraums bei kooperativ gespielten Normalformspielen. Saarbrücken: Arbeiten der Fachrichtung Psychologie, Universität des Saarlandes, Nr. 88. RAPOPORT, A . äCHAMMAH, A . M . 1965. Prisoner's Dilemma:
A study in conflict and cooperation. Ann Arbor: The University of Michigan Press. SCHELLING, T.C. 1960. The strategy of conflict. New York: Oxford University Press.
100
Henss: Kooperatives Normalformspiel - theoretische Lösungskonzepte
SELTEN, R. 1972. Equal share analysis of characteristic function experiments. In: Sauermann, H. (Ed.): Contributions to Experimental Economics. Vol.III. Tübingen: Mohr, 130-165. SHENOY, P . P . 1 9 7 7 . On game theory and coalition formation. New York: Cornell University, Techn. Report 342. STACKELBERG, H. 1938. Probleme der unvollkommenen Konkurrenz. Weltwirtschaftliches Archiv, 48, 95-138. TACK, W.H. 1980a. Modelle kooperativer Konfliktlösung. In: Witte, E.H. (Ed.): Beiträge zur Sozialpsychologie. Festschrift für Prof. P.R. Hofstätter. Weinheim: Beltz, 71-80. TACK, W.H. 1980b. Cooperative conflict resolution: A formal approach and some empirical results. In: Lantermann,
E.D., Feger, H. (Eds.): Similarity and choice: Papers in honour of Clyde Coombs. Bern: Huber, 290-326. TACK, W.H. 1983. Conditions of violating individual rationality. In: Scholz, R.W. (Ed.): Decision Making Under Uncertainty. Amsterdam: Elsevier (North-Holland), 211227. TACK, W . H . 1984. The Real-Estate Brokers Problem: Coalition formation and conflict resolution in an experimental game. In: TACK, W . H . , OSTMANN, A., HENSS, R . , SCHMAUCH, C . & W U T K E , J . : F o r m a l e M o -
delle kooperativer Konfliktlösung. Bericht über ein Forschungsprojekt mit Unterstützung der Deutschen Forschungsgemeinschaft. Saarbrükken.
w L
1 I
101
Zeitschrift für Sozialpsychologie 1985,16,101-115
Bedeutsamkeitsanalysen bilinearer Einstellungsmodelle BERNHARD ORTH Universität Hamburg Einstellungstheorien beinhalten häufig numerische Aussagen über das Zusammenwirken mehrerer Variablen. Nicht immer wird hierbei jedoch beachtet, daß derartige Aussagen nur dann empirisch bedeutsam und damit sinnvoll sind, wenn die betreffenden Variablen auf bestimmten Skalenniveaus gemessen werden. Dies wird am Beispiel «bilinearer» Einstellungsmodelle aufgezeigt. Im einzelnen werden für ROSENBERGS affektiv-kognitive Konsistenztheorie, das FISHBEINModell und das Komponentenmodell von FEGER die Implikationen für das Skalenniveau der jeweils beteiligten Variablen untersucht. Als Alternative zu diesen Modellen werden bilineare Einstellungsmodelle für intervallskalierte Variable vorgestellt. Diskutiert werden Konsequenzen für die Messung und die Theorienbildung in der Einstellungsforschung.
1. Einleitung Wenn bei einem Einstellungstest zwei Personen die Einstellungswerte 10 bzw. 5 erzielen, so wird wohl niemand allen Ernstes hieraus die Aussage ableiten wollen, daß die eine Person zu dem betreffenden Einstellungsobjekt eine doppelt so positive Einstellung wie die andere Person habe. Gerechtfertigt erscheint dagegen die Aussage, daß die eine Person eine positivere Einstellung als die andere Person habe. Der Unterschied zwischen diesen beiden Aussagen liegt darin, daß die erstere Aussage in hohem Maße von der verwendeten Einstellungsskala abhängig ist und nicht erwartet werden kann, daß die beiden Personen aufgrund einer anderen, gleichwertigen Einstellungsskala ebenfalls Einstellungswerte im Verhältnis 2:1 erzielen; die letztere Aussage sollte sich dagegen auch bei der Verwendung anderer, gleichwertiger Einstellungsskalen machen lassen, sie wäre damit von dem gewählten Meßinstrument unabhängig. Aussagen aufgrund von Skalenwerten, die nur für spezielle, nicht aber gleichwertige Skalen gelten, sind als Skalen-Artefakte zu betrachten, denen keinerlei empirische
Attitude theories often contain numerical statements about the interplay of several variables. It has not generally been recognized, however, that statements of this kind are meaningless unless each variable is measured on that scale level required by the respective combination rule. This is shown for bilinear attitude models. For ROSENBERG'S affective-cognitive theory of consistency, FISHBEIN'S belief-attitude model and F E G E R ' S component model the implications for the scale levels of the respective variables involved are examined. Modified bilinear attitude models requiring only interval scale measurements are suggested and some further implications for measurement and theory construction in attitude research are discussed.
Bedeutung zukommt. Derartige Aussagen sind empirisch nicht bedeutsam und somit in einer empirischen Wissenschaft nicht sinnvoll. Um sinnvoll (bedeutsam) zu sein, muß eine numerische Aussage also für alle gleichwertigen Skalen gelten. Diese Forderung läuft darauf hinaus, daß eine Aussage aufgrund von Skalenwerten gleichermaßen für die zulässig transformierten Skalenwerte der beteiligten Skalen gelten muß. In diesem Sinne liegen gleichwertige Skalen dann vor, wenn sie jeweils durch zulässige Transformationen ineinander überführbar sind. Da die zulässigen Transformationen einer Skala den Typ oder das Niveau einer Skala bestimmen, spielen die verschiedenen Skalentypen eine wichtige Rolle bei der Untersuchung der Bedeutsamkeit numerischer Aussagen. So wäre die erstere der oben genannten Aussagen nur dann sinnvoll, wenn sie auch für sämtliche durch zulässige Transformationen erhaltenen Einstellungsskalen gelten würde, was jedoch nur dann der Fall wäre, wenn diese Transformationen Multiplikationen mit einem positiven Faktor wären, d.h. wenn die Einstellungsskala vom Typ einer Verhältnisskala wäre. Dagegen
102 ändert sich die Gültigkeit der zweiten obigen Aussage selbst bei einer beliebigen monoton steigenden Transformation der Einstellungsskala nicht; diese Aussage ist also sinnvoll, wenn die Einstellungsskala lediglich eine Ordinalskala ist. Mit dem Begriff der zulässigen Transformationen bzw. der Skalentypen ist gleichzeitig eine praktisch durchführbare Möglichkeit zur Prüfung gegeben, ob bzw. unter welchen Voraussetzungen eine gegebene numerische Aussage sinnvoll ist oder nicht. Dies wird im folgenden Abschnitt 2 näher ausgeführt. Das Konzept der Bedeutsamkeit numerischer Aussagen erstreckt sich im Prinzip auf alle Aussagen, die aufgrund von Meßwerten gemacht werden können. In Einstellungstheorien sind dies häufig Aussagen über additive und/oder multiplikative Verknüpfungen zwischen Variablen. Bedeutende Beispiele sind die «bilinearen» (oder Erwartungs-Wert- oder multiattributiven) Modelle in der Einstellungsforschung, nach denen sich ein Einstellungswert als Summe (über n Zustände oder Komponenten) der Produkte zweier Variabler zusammensetzt. Mit Hilfe des Konzepts der Bedeutsamkeit wird im folgenden gezeigt, welche Implikationen bilineare Einstellungsmodelle für die Skalierung der beteiligten Variablen haben und daß diese Implikationen in der Literatur und selbst bei den Autoren dieser Modelle nicht immer genügend Beachtung finden. Dies wird im einzelnen in den Abschnitten 3 bis 5 für die affektiv-kognitive Konsistenztheorie (ROSENBERG, 1 9 5 6 ) , das Modell von FISHBEIN ( 1 9 6 3 ; FISHBEIN & ATZEN, 1 9 7 5 ) und das Komponentenmodell (FEGER, 1 9 7 9 ) untersucht. Abschnitt 6 enthält eine allgemeine Bedeutsamkeitsanalyse bilinearer Einstellungsmodelle, und in Abschnitt 7 werden modifizierte Einstellungsmodelle vorgestellt, die ein niedrigeres Skalenniveau erfordern. Einige Folgerungen aus dieser Analyse für die Messung und Theorienbildung (sowie deren Wechselwirkung) in der Einstellungsforschung werden in Abschnitt 8 diskutiert.
2. Die Analyse der Bedeutsamkeit numerischer Aussagen Der aus der Meßtheorie stammende Begriff der Bedeutsamkeit einer numerischen Aussage (d.h. einer Aussage aufgrund von Meßwerten) wird
Orth: Bedeutsamkeitsanalysen bilinearer Einstellungsmodelle
üblicherweise wie folgt definiert (siehe z.B. SUPP E S & ZINNES, 1 9 6 3 ; ORTH, 1 9 7 4 ; ROBERTS, 1 9 7 9 ) :
Eine numerische Aussage ist sinnvoll (bedeutsam) dann und nur dann, wenn sich ihr Wahrheitswert («wahr» oder «falsch») unter allen zulässigen Transformationen der betreffenden Skala (oder Skalen) nicht ändert. Etwas formaler kann für den Fall nur einer Skala definiert werden: Es seien a, a n Meßobjekte und f eine Skala, so daß f(aj) den Skalenwert des Meßobjekts a ; bezeichnet (i = 1,..., n), und t sei die Klasse der zulässigen Transformationen der Skala f; dann ist eine Aussage AUS(f(a,) f(an)) über Meßwerte f(a t ) f(a n ) sinnvoll (bedeutsam) genau dann, wenn für alle zulässigen Transformationen Tex gilt: AUS(f(a,) f(a n ))o AUS(T(f(a,)) T(f(an))). (Eine numerische Aussage kann formal als eine Relation auf einer Menge von Meßwerten betrachtet werden.) Für den Fall mehrerer Skalen f,, ..., f k kann (in vereinfachter Schreibweise) entsprechend formuliert werden: Eine Aussage A U S ^ fk) über Meßwerte auf den Skalen ^ f k ist sinnvoll (bedeutsam) genau dann, wenn für alle T^T ,, ..., TKETK gilt: AUS(f„ . . . , f k ) « AUSCT,(f,),..., Tk(fk)), wobei ..., xk die Klassen der zulässigen Transformationen der Skalen f f k bezeichnen. Eine Aussage über Meßwerte ist also sinnvoll, wenn sie dann und nur dann gilt, wenn sie über die zulässig transformierten Meßwerte gilt; d.h. wenn ihr Wahrheitswert unabhängig von zulässigen Transformationen ist bzw. unter ihnen invariant ist. Zwei einfache Beispiele mögen diese Definition veranschaulichen. Die eingangs genannte Aussage, daß ein Meßwert doppelt so groß wie ein anderer sei, lautet f(a,) = 2f(a2), wenn f(a,) und f(a2) die betreffenden Meßwerte bezeichnen. Diese Aussage ist sinnvoll dann und nur dann, wenn für alle zulässigen Transformationen T der Skala f gilt: f(a1) = 2f(a2)«>T(f(a1)) = 2T(f( a2 »
(1)
Zeitschrift für Sozialpsychologie 1985,16,101-115
103
(wobei T(f(a!)) und T(f(a2)) die zulässig transformierten Meßwerte f(aj) und ffaj) sind). Die Aussage, daß zwei Variable (Skalen) f, und f 2 in einem linearen Zusammenhang stehen, lautet f t = a + bf 2 , wobei a und b Konstanten sind. Damit diese Aussage sinnvoll ist, muß für jede zulässige Transformation Tj der Skala f j und T2 der Skala f 2 gelten: f, = a + bf 2 »T 1 (f 1 ) = a ' + b'T 2 (f 2 )
(2)
für Konstanten a ' und b'. Strenggenommen gilt die obige Definition nur für sogenannte reguläre Skalen (ROBERTS & FRANKE, 1 9 7 6 ; ROBERTS, 1 9 7 9 ) . Dies kann hier jedoch vernachlässigt werden, da im folgenden nur reguläre Skalen betrachtet werden. Der Begriff der Bedeutsamkeit ist nicht zu verwechseln mit dem der logischen Wahrheit oder dem der empirischen Gültigkeit. Die Aussage, daß es am Nordpol wärmer als am Äquator sei, ist bedeutsam; ihre Falschheit ändert sich unter zulässigen Transformationen der Temperaturskala (z.B. °C) nicht. Zu betonen ist ferner, daß sich der Begriff der Bedeutsamkeit stets auf Aussagen bezieht und nicht auf Rechenoperationen oder z.B. statistische Methoden der Datenauswertung. Nicht Rechenoperationen oder statistische Tests sind sinnvoll («zulässig») oder nicht sinnvoll, sondern die Aussagen, die mit Hilfe dieser Operationen oder Tests aufgrund von Meßwerten gemacht werden (z.B. statistische Hypothesen, die getestet werden sollen). Zulässige Transformationen charakterisieren den Zusammenhang zwischen gleichwertigen Skalen (d.h. zwischen Skalen, die gleichermaßen homomorphe Abbildungen eines empirischen Relativs in dasselbe numerische Relativ sind; sieh e z . B . PFANZAGL, 1 9 6 8 ; KRANTZ, LUCE, SUPPES &TVERSKY, 1 9 7 1 ; ORTH, 1974; ROBERTS, 1979).
Einige häufig vorkommende Klassen zulässiger Transformationen von Skalen bestimmen die verschiedenen Skalentypen oder Skalenniveaus. So heißt eine Skala, deren zulässige Transformationen alle eineindeutigen Transformationen (d.h. x = y » T(x) = T(y) für Meßwerte x und y und eine Transformation T) sind, Nominalskala; sie heißt Ordinalskala, wenn ihre zulässigen Transformationen monoton steigende Transformationen sind (d.h. x > y & T(x) > T(y)), Intervallskala, wenn ihre zulässigen Transformatio-
nen positiv lineare Transformationen sind (d.h. T(x) = ux + v mit u, v reell und u > 0), Verhältnisskala, wenn ihre zulässigen Transformationen Ähnlichkeits-Transformationen sind (d.h. T(x) = ux mit u > 0 und reell), und Absolutskala, wenn die einzige zulässige Transformation die Identitäts-Transformation ist (d.h. T(x) = x). Die obige Definition der Bedeutsamkeit kann auf zweierlei Weise als Kriterium benutzt werden: (a) Zur Prüfung, ob eine gegebene numerische Aussage bei bekanntem Skalenniveau sinnvoll ist; (b) Zur Beantwortung der Frage, welches Skalenniveau für eine gegebene numerische Aussage erforderlich ist, damit diese sinnvoll ist. Die Anwendung der Definition soll anhand der beiden oben genannten Beispiele verdeutlicht werden. Für die Aussage, daß ein Meßwert doppelt so groß wie ein anderer sei, ist also zu prüfen, ob die obige Äquivalenz (1) gilt bzw. für welche zulässigen Transformationen T sie gilt. Unter der Annahme, f sei eine Verhältnisskala, gilt T(f(a,)) = uf(a,) und 2T(f(a2)) = 2uf(a2) für u > 0. Die rechte Gleichung in (1) lautet somit uf(a,) = 2uf(a2) und ist offensichtlich der linken Gleichung in (l)äquivalent. Also gilt (1), und die Aussage ist sinnvoll, wenn f eine Verhältnisskala ist. Dies ist jedoch i.a. nicht der Fall, wenn f eine Intervallskala ist. Denn für eine positiv lineare Transformation T lautet die rechte Gleichung in (1) uf(a1) + v = 2uf(a2) + 2v oder f(a,) = 2f(a2) + v/u und ist i.a. der linken Gleichung in (1) nicht äquivalent. Dies zeigt ein einfaches Beispiel: Sind f(a,) = 10 und f(aj) = 5 und u = v = 1, so gilt zwar f(a1) = 2f(a2), nicht aber T(f(a1)) = 2T(f(a2)), da 11 2-6 ist. Die Aussage ist somit nicht sinnvoll, wenn f eine Intervallskala ist (und damit auch nicht, wenn f Ordinal- oder Nominalskala ist). Für die Aussage, daß zwischen zwei Skalen f, und f 2 ein linearer Zusammenhang bestehe, ist entsprechend zu prüfen, ob bzw. unter welchen Bedingungen die Äquivalenz (2) gilt. Ist eine der beiden Skalen lediglich eine Ordinalskala, so zeigen einfache Zahlenbeispiele, daß die Aussage nicht sinnvoll ist. Es sei angenommen, daß beide Skalen Intervallskalen sind, so daß Tt(f j) = uf, + v und T2(f2) = wf 2 + x gelte (mit u, w > 0). Wenn die Aussage sinnvoll ist, muß es Konstanten a' und b ' geben, so daß (2) gilt. Man setze a ' = au + v-bux/w und b ' = bu/w. Dann lautet die rechte Gleichung in (2) uf x + v = au + v-bux/w + (bu/w) (wf2 + x) und nach Umformen f x = a + bf 2 ; sie ist
104
Orth: Bedeutsamkeitsanalysen bilinearer Einstellungsmodelle
also mit der linken Gleichung in (2) identisch. (Man kann a ' und b ' durch Berechnung von T 1 (f,) = a + bT2(f2) erhalten.) Damit gilt (2); die Aussage ist also sinnvoll, wenn f, und f 2 Intervallskalen sind (und damit auch, wenn zumindest eine von beiden Skalen ein höheres Skalenniveau hat). 3. Die Theorie der affektiv-kognitiven Konsistenz Die Theorie der affektiv-kognitiven Konsistenz (ROSENBERG, 1956; 1960a, b; 1965; 1968) ist eine (dynamische) Theorie der Einstellungsänderung, die auf der (strukturellen) Annahme der Konsistenz zwischen einer Einstellung und einer mit ihr assoziierten kognitiven Struktur (ROSENBERG, 1956) bzw. zwischen der affektiven und der kognitiven Komponente einer Einstellung (ROSENBERG, 1960a, b; 1965; 1968) beruht. Die kognitive Struktur (Komponente) setzt sich hierbei zusammen aus den Überzeugungen (beliefs) einer Person darüber, in welchem Maße das Einstellungsobjekt der Verwirklichung von Werten (values), über die diese Person verfügt, förderlich oder hinderlich ist. Die grundlegende konsistenztheoretische Annahme der Theorie läßt sich im Sinne ROSENBERGS darstellen als
E
PO = F( E IipoWip), i=1
(3)
wobei E p o die Einstellung (bzw. deren affektive Komponente) einer Person p zu einem Einstellungsobjekt o bezeichnet und F eine monoton steigende Funktion ist, deren Argument (d.h. der Ausdruck in Klammern) ein «Index der kognitiven Struktur» (ROSENBERG, 1960b) ist. Hierbei ist I lpo die von der Person p wahrgenommene Instrumentalität (perceived instrumentality), die das Einstellungsobjekt o für die Verwirklichung des Wertes i hat; W ip ist die Wert-Wichtigkeit (value importance) des Wertes i für die Person p; und n ist die Anzahl der Werte. Der Theorie ROSENBERGS strenggenommen nicht gerecht werden Darstellungen (z.B. FISHBEIN, 1963; FISHBEIN & AJZEN, 1975; IRLE, 1975; STROEBE, 1980; ähnlich 2 HERKNER, 1981), die die affektive und die kognitive Komponente (bzw. die Einstellung und
den «Index der kognitiven Struktur») gleichsetzen, d.h.
Epo = I IipoWip. i=1
(4)
Dieser Hinweis ist erforderlich, weil es sich bei den Gleichungen (3) und (4) um unterschiedliche numerische Aussagen über den funktionalen Zusammenhang zwischen den Variablen E, I und W handelt. Im folgenden wird deshalb die Bedeutsamkeit der numerischen Aussage (3) untersucht (wobei sich allerdings herausstellt, daß das Ergebnis auch für die speziellere Aussage (4) gilt). Der in beiden Gleichungen enthaltene «Index der kognitiven Struktur» ist ein «bilinearer» Ausdruck (z.B. KRUSKAL, 1978), da er für eine der beiden Variablen linear ist, sofern die andere konstant gehalten wird. Die Analyse der Bedeutsamkeit der durch die Gleichung (3) ausgedrückten numerischen Aussage erfordert nach dem im vorigen Abschnitt Gesagten die Bestimmung der Skalenniveaus der Variablen E, I und W, die (mindestens) erforderlich sind, damit die Aussage (3) sinnvoll ist. Zumindest ist zu untersuchen, ob die von ROSENBERG in empirischen Untersuchungen verwendeten Skalen für E, I und W derart sind, daß die Aussage (3) sinnvoll ist. Im vorliegenden Fall ist es jedoch grundlegender und gleichzeitig günstiger, anstelle der Aussage (3) zunächst eine numerische Aussage zu untersuchen, die der Gleichung (3) zugrundeliegt und die wie folgt hergeleitet werden kann. Wegen der monoton steigenden Funktion F kann Gleichung (3) auch geschrieben werden als n n E p o ^ E q o « £ IipoWipS> £ I iqo W iq i=l i=l
(5)
(hier für den Vergleich der Einstellungen zweier Personen p und q zu einem Einstellungsobjekt; entsprechend natürlich auch als Vergleich der Einstellungen einer Person zu zwei Einstellungsobjekten; der Einfachheit halber wird hier ein gleiches n für p und q angenommen - die Ergebnisse gelten jedoch auch allgemeiner). Diese Aussage (5) enthält als «Teilaussage» die Aussage
105
Zeitschrift für Sozialpsychologie 1985,16,101-115
n n L iiPoWip> £ i iqo w iq> i= 1 i=1
(6)
deren Bedeutsamkeit zunächst untersucht werden soll. Man beachte, daß sich diese Aussage ausschließlich auf den «Index der kognitiven Struktur» bezieht und unabhängig von der Variablen E ist. Nach Abschnitt 2 ist die Aussage (6) genau dann sinnvoll, wenn gilt: n n £ i iP oW ip > L i i q o w i q « i= 1 i=1 n n L T,(I ipo )T w (W iq )> X T^I^TwOV;,), i= l i=1
(7)
wobei Tj und T w (beliebige) zulässige Transformationen der Skalen I bzw. W sind. ROSENBERG (1956; 1960b) hat die Variablen seiner Theorie wie folgt gemessen. Die Einstellung E einer Person wurde bestimmt durch deren Wahl einer von fünf bzw. 16 möglichen geordneten Antwortkategorien zu einem Einstellungsitem. Zur Bestimmung des «Index der kognitiven Struktur» verwendete er 35 bzw. 31 bzw. 32 Wertitems, die einzuschätzen waren (a) hinsichtlich der Wert-Wichtigkeit auf einer 21 stufigen bipolaren Ratingskala mit den Extremkategorien + 10 («gives me maximum satisfaction») und -10 («gives me maximum dissatisfaction») und (b) hinsichtlich der wahrgenommenen Instrumentalität auf einer 11 stufigen bipolaren Ratingskala mit den Extremkategorien + 5 («is completely attained by» (Einstellungsitem)) und -5 («is completely blocked by» (Einstellungsitem)). ROSENBERG selbst (1956, p.368-369, Fußnote) bezweifelt, daß diese Skalierungen zu Intervallskalen führen. Zunächst sei deshalb angenommen, daß die Variablen I und W jeweils auf Ordinalskalenniveau gemessen seien. Das folgende Beispiel zeigt jedoch, daß die Aussage (6) unter dieser Annahme nicht sinnvoll ist. Es seien n = 2, I l p o = 2,1 2po = 3, I l q o = 3 und 1^0 = 4, die zulässig (monoton steigend) transformiert werden in die Skalenwerte 3, 4, 4 bzw. 6, und es seien W j ^ 1, W 2p = 2, W l q = 3 und W l p = 5, die zulässig (monoton steigend) transformiert werden in die Skalenwerte 3,
4,6 bzw. 7. Dann gilt die linke Ungleichung in der Äquivalenz (7) (weil 2-5 + 3-2 = 16 > 1 3 = 3-3 + 4-1), nicht aber die rechte Ungleichung (für die zulässig transformierten Skalenwerte) (weil 3 -7 + 4-4 = 3 7 < 42 = 4- 6 + 6- 3). Also gilt die Äquivalenz (7) nicht, und die Aussage (6) ist nicht sinnvoll, wenn I und W Ordinalskalen sind. Damit ist auch Aussage (5) und damit Aussage (3) (und ferner auch Aussage (4)) nicht sinnvoll, wenn I und W Ordinalskalen sind. Dies gilt unabhängig davon, welches Skalenniveau die Einstellungsskala E hat. Somit führt die Annahme ROSENBERGS über das Skalenniveau der von ihm gemessenen Variablen insofern zu einem Widerspruch, als dann die grundlegende Annahme seiner Konsistenz-Theorie - die Gleichung (3) - eine nicht sinnvolle numerische Aussage ist. Dieser Sachverhalt wäre weniger schwerwiegend, wenn er durch die Annahme des Intervallskalenniveaus für die Variablen E, I und W aufgehoben werden könnte. Dies ist jedoch nicht der Fall. Das folgende Beispiel zeigt, daß die Aussage (6) auch unter der Annahme, daß I und W Intervallskalen sind, nicht sinnvoll ist. Es sei n = 2, und die I- und W-Skalenwerte seien dieselben wie im vorigen Beispiel; die zulässigen (positiv linearen) Transformationen seien Tj(I) = 3I + l und T w (W) = 11 + 3, so daß die I-Skalenwerte 2, 3, 3 und 4 transformiert werden in die Skalenwerte 7, 10,10 und 13 und die W-Skalenwerte 1,2,3 und 5 in die Skalenwerte 4,5,6 und 8. Dann gilt wie vorher die linke Ungleichung in der Äquivalenz (7), nicht aber die rechte Ungleichung, da 7-8 +10-5 = 106 < 1 1 2 = 10-6 +13 -4 gilt. Somit gilt auch in diesem Fall die Äquivalenz (7) nicht; die Aussage (6) ist also auch dann nicht sinnvoll, wenn I und W Intervallskalen sind. Unabhängig vom Skalenniveau der Skala E ist damit auch die Aussage (3) der affektiv-kognitiven Konsistenztheorie selbst dann nicht sinnvoll, wenn I und W Intervallskalen sind. Die allgemeinere Untersuchung der Bedeutsamkeit der numerischen Aussage (3), d.h. die Beantwortung der Frage, auf welchen Skalenniveaus die Variablen E, I und W gemessen werden müssen, damit die Aussage sinnvoll ist, wird bis zum Abschnitt 6 zurückgestellt.
4. Das Modell von FISHBEIN Nach dem Modell von
FISHBEIN
(1963, 1967a;
106
Orth: Bedeutsamkeitsanalysen bilinearer Einstellungsmodelle
über die Beziehung zwischen Einstellungen und Überzeugungen (beliefs) ist die Einstellung einer Person zu einem Einstellungsobjekt eine Funktion (a) (der Stärke) der Überzeugungen dieser Person über Eigenschaften des Einstellungsobjekts oder dessen Beziehungen zu anderen Einstellungsobjekten und (b) der Bewertungen (evaluations) dieser Eigenschaften oder Beziehungen. Spezifiziert wird diese Funktion durch die «zentrale Gleichung» (FISHBEIN & AJZEN, 1 9 7 5 , p.29) des Modells: FISHBEIN & AJZEN, 1 9 7 5 )
n Apo = I b ipo e ip . i= 1
(8)
Hierbei bezeichnet A ^ die Einstellung (im Sinne der affektiven Komponente im Rahmen eines Komponentenansatzes) einer Person p zu einem Einstellungsobjekt o; bipo ist die Stärke der Überzeugung i der Person p über eine Eigenschaft (oder Beziehung) des Einstellungsobjekts o, d.h. die subjektive Wahrscheinlichkeit, mit der dem Objekt die betreffende Eigenschaft von der Person zugeschrieben wird; eip ist die Bewertung der der Überzeugung i entsprechenden Eigenschaft (oder Beziehung) durch die Person p; und n ist die Anzahl der (für die Person p und das Objekt o) herausragenden oder bedeutenden Überzeugungen (salient beliefs), d.h. der Überzeugungen, die Determinanten (determinants) der Einstellung sind. Im Unterschied zur Theorie der affektiv-kognitiven Konsistenz sind Überzeugungen im Sinne des Modells von FISHBEIN nicht unbedingt in einem funktionalen Sinne zu verstehen und auch nicht notwendigerweise auf Werte (values) bezogen; tatsächlich bilden Überzeugungen im Sinne ROSENBERGS begrifflich nur eine von sechs Arten von Überzeugungen im Sinne des FISHBEIN-MOdells (FISHBEIN, 1967b). Ferner werden in diesem Modelli.a. keine allgemeinen Werte, sondern auf das Einstellungsobjekt unmittelbar bezogene Bewertungen betrachtet. Schließlich versteht FISHBEIN sein Modell nicht als eine Konsistenztheorie. Die in das Modell von FISHBEIN eingehenden Variablen A, b und e werden zumeist mittels Rating-Verfahren mit bipolaren numerischen Ratingskalen oder semantischen Differentialen gemessen (z.B. FISHBEIN, 1963; vgl. FISHBEIN &
1975; AJZEN & FISHBEIN, 1980). Dies gilt auch für die subjektiven Wahrscheinlichkeiten (Überzeugungsstärken), und zwar mit der Begründung, daß eine subjektiv seltene, negativ bewertete Eigenschaft eines Einstellungsobjekts wegen der multiplikativen Verknüpfung der Variablen b und e - einen positiven Beitrag zur Einstellung liefere. (Beispiel: Subjektiv eher unwahrscheinliche Nebenwirkungen der «AntiBaby-Pille» tragen zu einer positiven Einstellung zur «Anti-Baby-Pille» bei.) Die Wahrscheinlichkeitsskala wird von FISHBEIN also nicht als eine Funktion in das reelle Zahlenintervall [0, 1] betrachtet. Die bedeutenden Überzeugungen einer Person zu einem Einstellungsobjekt können durch eine Assoziationsaufgabe erhoben werden; anstelle dieser individuellen Überzeugungen werden in empirischen Untersuchungen jedoch die von einer Gruppe von Personen am häufigsten genannten Überzeugungen (Assoziationen) ermittelt und als mittlere bedeutende Überzeugungen (modal salient beliefs) verwendet. Über das erzielte oder erforderliche Skalenniveau der Variablen A, b und e des FISHBEIN-MOdells gehen die Meinungen auseinander. Während beispielsweise ROSENBERG (1956) (vgl. Abschnitt 3) den verwendeten (Rating-)Verfahren nur Ordinalskalenniveau zutraut, sind zum Beispiel OSTROM (1980) und SJÖBERG (1982) der Ansicht, daß das Modell - zumindest für die Variablen b und e - Verhältnisskalen erfordere. Eine «mittlere» Position vertritt WESTERMANN (1982), der zu begründen versucht, daß für die Einstellungsskala A Intervallskalenniveau zu erzielen sei, sofern b und e Intervallskalen seien und einige zusätzliche Bedingungen gelten (auf die weiter unten eingegangen wird). FISHBEIN & AJZEN (1975) argumentieren (vgl. WESTERMANN, 1983), daß viele Methoden der Einstellungsmessung mit dem Modell von FISHBEIN konsistent seien (d.h. ebenfalls auf der Messung von Überzeugungen und Bewertungen beruhen) und zu Ordinalskalen AJZEN,
(GuTTMAN-Skalierung und LIKERT-Skalierung)
oder zu Intervallskalen führen (THURSTONES Methode der gleich-erscheinenden Intervalle und die Methode des semantischen Differentials). Es darf daher angenommen werden, daß nach der Ansicht FISHBEINS semantische Differentiale zu Intervallskalen führen und Intervallskalen seines Erachtens ausreichen, um das Modell angemessen anzuwenden und zu prüfen.
107
Zeitschrift für Sozialpsychologie 1985,16,101-115
Ebenso wie ROSENBERGS «Index der kognitiven Struktur» ist die Gleichung (8) des Modells von FISHBEIN ein bilinearer Ausdruck und das FISHBEIN-Modell insofern ein bilineares Modell. Die Gleichung (8) ist mit der Gleichung (4) formal identisch, und der Äquivalenz (5) entspricht hier die folgende Äquivalenz (9), die unmittelbar aus der Gleichung (8) folgt: n n Ä p o > A q o « £ b i p o e i p > £ b iqo e iq . i= 1 i=1
(9)
Analog zur Ungleichung (6) ergibt sich hieraus die für eine Bedeutsamkeitsanalyse zunächst grundlegende Aussage n n I b i p o e i p > I b iqo e iq . i= 1 i=1
(10)
Aufgrund dieser formalen Übereinstimmung des Modells von FISHBEIN mit der Theorie ROSENBERGS gelten die im vorigen Abschnitt dargestellten Ergebnisse zur Frage der Bedeutsamkeit für die Aussagen ( 1 0 ) , (9) und (8) des FISHBEIN-MOdells entsprechend. Dieses bedeutet: (a) Die Aussagen (10), (9) und (8) sind nicht sinnvoll, wenn die Variablen b und e Ordinalskalen sind; (b) Sie sind ebenfalls nicht sinnvoll, wenn b und e Intervallskalen sind; (c) Dieses gilt jeweils unabhängig vom Skalenniveau der Einstellungsskala A; (d) Damit besteht auch beim Modell von FISHBEIN ein Widerspruch zwischen der theoretischen Formulierung des Modells und der praktischen Durchführung der Messung der beteiligten Variablen bzw. der empirischen Anwendung und Prüfung des Modells; (e) Somit sind die Ergebnisse der oben zitierten empirischen Untersuchungen zum FiSHBEiN-Modell insofern artifiziell, als sie nur für bestimmte, nicht aber gleichwertige Skalen gelten, und stellen damit keine angemessene Prüfung des Modells dar. Diese Ergebnisse der Bedeutsamkeitsanalyse des Modells von FISHBEIN stehen in einem scheinbaren Widerspruch zu der Arbeit von WESTERMANN ( 1 9 8 2 ) , der mit Hilfe des Konzepts der abgeleiteten Messung (im Sinne von SUPPES & ZINNES, 1 9 6 3 ; ROBERTS, 1 9 7 9 ) f ü r d a s FISHBEIN-MO-
dell gezeigt haben will, daß die Einstellungsskala A eine Intervallskala ist, sofern b und e Inter-
vallskalen sind und zusätzlich gilt, daß (a) die Anzahl n der (bedeutenden) Überzeugungen, (b) die Summe der Überzeugungsstärken b ipo und (c) die Summe der Bewertungen e ip jeweils für alle untersuchten Personen und Einstellungsobjekte eine beliebige Konstante ist. Dieses Ergebnis von WESTERMANN (1982) berücksichtigt nicht den Zusammenhang zwischen der abgeleiteten Messung und dem (grundlegenderen) Sachverhalt der Bedeutsamkeit numerischer Aussagen. Während WESTERMANNS zusätzliche Bedingung (a) strenggenommen zwar nicht dem für Individuen formulierten FiSHBEiN-Modell gerecht wird, aber mit FISHBEINS eigenen Erhebungen der mittleren bedeutenden Überzeugungen konsistent ist, handelt es sich bei den Bedingungen (b) und (c) von WESTERMANN unter seiner Annahme des Intervallskalenniveaus von b und e um nicht sinnvolle numerische Aussagen. So lautet die Bedingung (b) von WESTERMANN (1982) n £ b i p o = c, i=1
(11)
wobei c eine beliebige reelle Konstante ist (die für alle Personen p und alle Einstellungsobjekte o gilt). Wäre c eine absolute Konstante, d.h. unabhängig von den Skalenfaktoren der Skala b, so müßte b eine Absolutskala sein, damit die Aussage (11) sinnvoll wäre. Aber selbst wenn c ein (zulässig transformierbarer) Meßwert der Skala b wäre, so erfordert diese Aussage - wie sich leicht zeigen läßt - Verhältnisskalenniveau von b; Aussage (11) ist also nicht sinnvoll, wenn b eine Intervallskala ist, wie es von WESTERMANN angenommen wird. Analog ist WESTERMANNS Bedingung (c) unter seiner Annahme des Intervallskalenniveaus von e nicht sinnvoll. (Dies gilt auch für das Theorem in WESTERMANN, 1983, p.231, das die obigen Aussagen enthält.) WESTERMANN (1982) versucht ferner zu zeigen, wie seine Bedingungen (b) und (c) durch «adäquate Methoden» (p. 103) empirisch zu erfüllen sind. Für die Erfüllung der Bedingung (c) (Konstanz der Summe der Bewertungen) schlägt er vor, anstelle der individuellen Bewertungen die über die Personen gemittelten Bewertungen zu verwenden (p.104). Abgesehen davon, daß ein derartiges Verfahren keineswegs als «in der Skalierung allgemein üblich» gelten kann und bei
108 WESTERMANN eine Verringerung der Anzahl der zuvor als bedeutend erkannten Überzeugungen zur Folge hat, kann eine Verwendung «mittlerer Bewertungen» in keiner Weise dem individuellen FisHBEiN-Modell gerecht werden. Im Zusammenhang mit den Überzeugungsstärken erkennt dagegen auch WESTERMANN ( 1 9 8 2 , p. 105) diesen Umstand ausdrücklich an und macht zwei Vorschläge zur Erfüllung der Bedingung (b) (Konstanz der Summe der Überzeugungsstärken). Zunächst diskutiert er die Möglichkeit einer speziellen Instruktion für die Messung der Überzeugungsstärken, nach der die Personen eine konstante Summe von Skalenwerten unter den einzelnen Überzeugungen aufzuteilen haben, übersieht aber, daß eine solche Skalierungsmethode zu einer Verhältnisskala führen müßte. (Sie wäre übrigens eine Verallgemeinerung der Methode der konstanten Summe von COMREY, 1 9 5 0 ; vgl. TORGERSON, 1 9 5 8 . ) Danach schlägt WESTERMANN ( 1 9 8 2 , p. 106) eine «nachträgliche» Transformation von Ratingskalenwerten für die Überzeugungsstärken vor (seine Gleichung (11)), ohne zu erkennen, daß diese Transformation (bei der die Skalenwerte durch deren Summe dividiert werden) eine nicht sinnvolle numerische Aussage für Meßwerte auf Intervallskalenniveau ist. Darüber hinaus beinhaltet dieses Vorgehen individuelle Transformationen, deren Zulassung zur Folge hätte, daß die Aussage (10) selbst dann nicht sinnvoll wäre, wenn alle Variablen Verhältnisskalenniveau hätten.
Somit können die zusätzlichen Bedingungen (b) und (c) von WESTERMANN ( 1 9 8 2 ) weder durch die von ihm angeführten Methoden noch allgemein etwas an dem oben ausgeführten Sachverhalt ändern, daß die Gleichung (8) des Modells von FISHBEIN nicht sinnvoll ist, wenn Überzeugungsstärken und Bewertungen auf Intervallskalenniveau gemessen werden. Die für das FISHBEIN-Modell erforderlichen Skalentypen werden in Abschnitt 6 untersucht. Es ist zu erwähnen, daß die Ergebnisse der Bedeutsamkeitsanalyse des Modells von FISHBEIN über die Beziehung von Einstellungen und Überzeugungen auch Implikationen für sein Modell der Einstellungs-Verhaltens-Beziehung (siehe z . B . FISHBEIN & AJZEN, 1 9 7 5 ; AJZEN & FISHBEIN,
1980) haben, da dieses eine Erweiterung des hier untersuchten Modells ist.
Orth: Bedeutsamkeitsanalysen bilinearer Einstellungsmodelle
5. Das Komponentenmodell Das auf FEGER (1979) zurückgehende Komponentenmodell sozialer Einstellungen (DOHMEN, 1983; DOHMEN&DOLL, 1984;im Druck; DOHMEN & FEGER, 1984; FEGER & DOHMEN, 1984) geht von einer Menge von Einstellungsobjekten (eines Einstellungsbereichs) und deren «Komponenten» aus, wobei letztere als Merkmalszuschreibungen im Sinne der Überzeugungen (beliefs) des FISHBEIN-Modells verstanden werden, und betrachtet (a) die subjektive Einstellungsstruktur (d.h. die subjektiven Ähnlichkeiten zwischen den Einstellungsobjekten) als eine Funktion komponentenweiser Ähnlichkeiten, die sich aus den «Zuschreibungen» (d.h. den «typisch»-Urteilen über die Zuschreibungen von Komponenten zu Objekten) der betreffenden Person zu je zwei Einstellungsobjekten ergeben (Annahme der «Strukturgleichheit»), und (b) die Präferenz (d.h. die Einstellung bzw. deren affektive Orientierung) einer Person zu einem Einstellungsobjekt als eine Funktion dieser «Zuschreibungen» sowie der «Bewertungen» der zugeschriebenen Komponenten (Annahme der «Präferenzgleichheit»). Diese letztere Annahme beinhaltet die Übereinstimmung der direkt beurteilten (globalen) Präferenz einer Person für ein Einstellungsobjekt mit der «komponentenbedingten Präferenz» (DOHMEN & DOLL, im Druck), die sich als Summe (über die Komponenten) der Produkte von Zuschreibungen und Bewertungen ergibt. Demnach läßt sich die Annahme der Präferenzgleichheit darstellen als
P
po=
E
Z
i= 1
ipoBip
d2)
oder, was der Modellvorstellung möglicherweise gerechter wird, als Ppo = F( I Z ipo B ip ), i= 1
(13)
wobei F eine monoton steigende Funktion ist und jeweils P po die Präferenz (Einstellung) einer Person p für ein Einstellungsobjekt o bezeichnet, Z ipo die Zuschreibung der Komponente i zum Objekt o durch die Person p und Bip die Bewertung
109
Zeitschrift für Sozialpsychologie 1985,16,101-115
der Komponente i durch die Person p; ferner ist n jeweils die Anzahl der Komponenten. Da die Präferenzen P den Einstellungen A des FISHBEINModells entsprechen, die Bewertungen B mit den Bewertungen e bei FISHBEIN übereinstimmen und die Zuschreibungen Z begrifflich weitgehend den Überzeugungsstärken b entsprechen dürften, kann das Komponentenmodell als ein im wesentlichen durch die Annahme der Strukturgleichheit erweitertes FISHBEIN-Modell charakterisiert werden, auch wenn weder (12) noch (13) als «zentrale Gleichung» des Modells angesehen werden. Da ferner die Annahme der Strukturgleichheit im wesentlichen das Ähnlichkeitsmodell von TVERSKY ( 1 9 7 7 ) beinhaltet, kann das Komponentenmodell im Grunde als eine «Vereinigung» der Modelle von TVERSKY und FISHBEIN betrachtet werden. In den oben genannten empirischen Untersuchungen zum Komponentenmodell wurden sämtliche Variablen mit Hilfe von (unipolaren) Ratingskalen skaliert, so daß für P, Z und B bestenfalls Intervallskalenniveau angenommen werden kann. Die methodischen Probleme, die z.B. DOHMEN & DOLL ( 1 9 8 4 ) im Zusammenhang mit der Produktsummenbildung im Sinne der Gleichungen (12) und (13) sehen, bestehen deshalb darin, daß diese Gleichungen unter der Annahme des Intervallskalenniveaus der Variablen Z und B keine sinnvollen numerischen Aussagen sind. Dies folgt aus der Tatsache, daß die Gleichungen (12) und (13) formal mit den Gleichungen (8) bzw. (3) identisch sind, und wurde in den vorigen Abschnitten gezeigt. Somit gelten die Ergebnisse der Bedeutsamkeitsanalysen der affektiv-kognitiven Konsistenztheorie und des FISHBEIN-Modells entsprechend auch für das Komponentenmodell sozialer Einstellungen.
6. Allgemeine Bedeutsamkeitsanalyse bilinearer Modelle In den vorigen Abschnitten wurde anhand konkreter Beispiele von Einstellungsmodellen gezeigt, daß bilineare Modelle der Form C = I AjBj i=1
(14)
oder n C = F( £
AJBJ)
(15)
i=1 (wobei F eine monoton steigende Funktion ist und A, B und C Variablen sind) keine sinnvollen numerischen Aussagen sind, sofern die Variablen A und B auf Ordinal- oder Intervallskalenniveau gemessen sind (unabhängig vom Skalentyp der Skala C). Im folgenden wird untersucht, welches Skalenniveau die Variablen A, B und C haben müssen, damit die Aussagen (14) und (15) sinnvoll sind. Es sei zunächst angenommen, daß sowohl A als auch B Verhältnisskalen seien, und es wird zunächst wieder die von (14) und (15) implizierte Aussage C p > C q bzw. n m I A i p B i p > £ AjqBjq i=l j=l
(16)
untersucht. (Dies entspricht einem Vergleich von Einstellungswerten zweier Personen und/oder zweier Einstellungsobjekte; es kann n ^ m gelten.) Damit die Aussage (16) sinnvoll ist, muß nach Abschnitt 2 gelten n m I AipBip> £ AjqBjq« i=l j=l n m £ TA(Aip)TB(Bip)> £ TA(Ajq)TB(Bjq) (17) i=l j=l für alle zulässigen Transformationen TA und TB der Skalen A bzw. B. Für A und B als Verhältnisskalen seien TA = uA und TB = wB mit u, w > 0 . Dann lautet die rechte Ungleichung in (17) n m £ uAipwBip3> £ uA jq wB jq i=l j=l
(18)
und nach Umformen m n UW £ AipBIP^UW £ Aj q Bj q , i=l j=l
(19)
110
Orth: Bedeutsamkeitsanalysen bilinearer Einstellungsmodelle
und ist wegen uw > 0 mit der linken Ungleichung in (17) äquivalent. Somit gilt die Äquivalenz (17); die Aussage (16) ist also für Verhältnisskalenniveau von A und B sinnvoll (auch wenn n ^ m gilt). Hiermit ist eine entscheidende Voraussetzung dafür gegeben, daß die Aussagen (14) und (15) sinnvoll sind, da dieses nunmehr nur vom Skalenniveau von C abhängig ist. Hierauf wird weiter unten eingegangen. Zunächst ist der Fall zu betrachten, daß eine der beiden Skalen A und B Verhältnisskala und die andere Intervallskala ist. Dieser Fall ist auch deshalb von Bedeutung, weil z.B. FISHBEIN & A J ZEN (1975) die T h e o r i e ROSENBERGS u n d d a s M o -
dell von FISHBEIN sowie formal ähnliche Modelle aus anderen Bereichen der Psychologie in Anlehnung an das SEU-Modell (Modell des subjektiv erwarteten Nutzens, siehe z.B. EDWARDS, 1954, 1961) als Erwartungswert-Modell bezeichnen (vgl. z.B. FEATHER, 1982). Das SEU-Modell hat zwar die Form der Gleichung (14), wobei C der subjektiv erwartete Nutzen einer Wahlalternative, Aj die subjektive Wahrscheinlichkeit des Ereignisses i und B; der Nutzen der Konsequenz des Ereignisses i sind, es nimmt jedoch zusätzlich an, daß die n Ereignisse sich gegenseitig ausschließen und erschöpfend sind, so daß die Summe der Wahrscheinlichkeiten A; Eins ist. Unter dieser Zusatzannahme sind Vergleiche subjektiv erwarteter Nutzen-Werte, d.h. Aussagen in der Form von (16), sinnvoll, wenn B Intervallskala und A Absolutskala ist (wie es für das SEU-Modell üblicherweise angenommen wird). Denn mit T A = A und TB = uB + v (u > 0) lautet die rechte Ungleichung in (17)
m n £ A ip (uB ip + v)> £ A jq (uB jq + v) i=l j=l
(20)
und nach Umformen n n " I AipBip + v £ A i p > i=l i=l m m u L A j q B j q + v £ Aj q j=l j=l
(21)
n m und ist wegen u > 0 und £ A ip = £ A j q = 1 i=l j=l mit der linken Ungleichung in (17) äquivalent (vgl. ROBERTS, 1979, p.310). Eine analoge Rechnung zeigt, daß dieses auch dann gilt, wenn A Verhältnisskala ist und die Summe der Skalenwerte Aj gleich ist einem Meßwert von A (d.h. in diesem Sinne konstant ist). Für die in dieser Arbeit betrachteten Einstellungsmodelle ist jedoch zu sagen, daß es keinen Grund für die Annahme gibt, daß die Summe der Skalenwerte Aj oder Bj konstant sei. Dies gilt auch dann, wenn Instrumentalitäten, Überzeugungsstärken oder Zuschreibungen als subjektive Wahrscheinlichkeiten betrachtet werden, da sich diese nicht auf sich ausschließende und erschöpfende Ereignisse beziehen. Wie das folgende Beispiel zeigt, ist die Aussage (16) ohne zusätzliche Annahmen nicht sinnvoll, wenn A Verhältnis- und B Intervallskala ist. (Wegen der Symmetrie von A und B gilt dasselbe, wenn A Intervall- und B Verhältnisskala ist.) Es seien n = 2, A l p = 2, A 2p = 3, A l q = 3, A ^ = 4, B l p = 5, B2p = 2, B l q = 3, B ^ = 1 und T A = 2A und TB = B + 2. Dann gilt Aussage (16) und damit die linke Ungleichung in (17) (weil 2-5 + 3-2 = 16> 13 = 3-3 +4-1), aber nicht die rechte Ungleichung (weil 4-7 + 6-4 = 52 < 54 = 6-5 + 8-3). Damit sind in diesem Fall auch die Aussagen (14) und (15) nicht sinnvoll. Dasselbe Ergebnis ergibt sich auch in dem Fall, daß A Absolut- und B Intervallskala ist. (Man betrachte hierzu dasselbe Beispiel wie oben, jedoch mit T A = A.) Somit ist die Aussage (16) ohne zusätzliche Annahmen bereits dann nicht sinnvoll, wenn auch nur eine der beiden Skalen A und B eine Intervallskala ist (unabhängig vom Skalentyp der anderen Skala). Es bleibt zu untersuchen, ob es andere zusätzliche Bedingungen gibt, die für die hier untersuchten Einstellungsmodelle möglicherweise angemessen sind und Intervallskalenniveau von A und/oder B erlauben. Wenn es sie gäbe, müßten sie aus der Äquivalenz (17) ersichtlich werden, wenn für T A und/oder TB positiv lineare Transformationen angenommen werden. Im allgemeinsten Fall möge also beides gelten, d.h. T A = uA + v und TB = wB + x mit u, w > 0. Nach Einsetzen in die rechte Ungleichung in (17) und nach mehrfachem Umformen lautet diese
111
Zeitschrift für Sozialpsychologie 1985,16,101-115
n m E AipBip> £ AjqBjq + i=l j=l m +
E
j=i
n A
io"
E
A
i=i
iP> +
m n + 5 ( 1 B j q - Z Bip) + ^ ( m - n ) . j=l i=l
(22)
Damit die Äquivalenz (17) gilt, muß die Summe der drei letzten Summanden in (22) Null sein, d.h. es muß gelten m w< I j=l
n A
iQ-
£
i=l
A
sind nur dann sinnvoll, wenn sowohl A als auch B (mindestens) Verhältnisskalen sind. Abschließend ist zu untersuchen, welches Skalenniveau die Variable C haben muß, wenn A und B Verhältnisskalen sind, damit die Aussage (14) oder (15) sinnvoll ist. Hierbei kommt es entscheidend darauf an, ob die Gleichung (14) so verstanden wird, daß sie Skalenkonstanten enthalten darf oder nicht. Denn ohne jegliche Konstanten wäre (14) nur sinnvoll, wenn alle drei Skalen Absolutskalen wären. Läßt man dagegen in (14) einen konstanten Faktor zu (auf einer der beiden Seiten dieser Gleichung), so ist die Aussage sinnvoll, wenn A, B und C Verhältnisskalen sind (nicht aber, wenn C Intervallskala ist). Denn dann führt mit TA = uA, TB = wB und T C = yC (u, w, y > 0) n
iP) +
m n + £< Z ®jq~ L Bip) + ^ ( m - n ) = 0. (23) j= l i= l
TC(C) =
£ T ^ A ^ B ; ) I=L
ZU N
Diese Bedingung ist erfüllt, (i) wenn v = x = 0 gilt, was dem bereits untersuchten Fall entspricht, daß A und B Verhältnisskalen sind, (ii) wenn v = 0 (d.h. A Verhältnisskala ist) und die Summe der A-Meßwerte konstant ist, (iii) wenn x = o (d.h. B Verhältnisskala ist) und die Summe der B-Meßwerte konstant ist, was - wie (ii) - dem im Zusammenhang mit dem SEU-Modell erörterten Fall entspricht, und (iv) wenn m = n = konstant gilt und außerdem die Summe der A-Meßwerte und die der B-Meßwerte konstant sind, was den in Abschnitt 4 untersuchten Bedingungen von WESTERMANN (1982) entspricht, von denen die beiden letzteren keine sinnvollen numerischen Aussagen bei Intervallskalenniveau von A und B sind. Weitere Fälle, in denen (23) gilt, sind von den Transformationskonstanten u, v, w und x abhängig und können daher nicht als die gesuchten Bedingungen in Betracht kommen. Somit läßt sich das Ergebnis der Bedeutsamkeitsanalyse zunächst dahingehend zusammenfassen, daß im Gegensatz zum SEU-Modell die hier untersuchten bilinearen Einstellungsmodelle in Form der Gleichungen (14) oder (15) nicht sinnvoll sind, wenn auch nur eine der beiden Variablen A und B Intervallskalenniveau hat; sie
(24)
YC =
X
N UAJWBJ = UW £
i= 1
A ^
(25)
i=1
bzw. n nur
C = V
y
L
i=1
AJB;,
(26)
was äquivalent zu dieser Form von (14) ist. Dieser Fall entspricht der Formulierung (15), bei der F eine Ähnlichkeitsfunktion ist. Den hier betrachteten Einstellungsmodellen am ehesten gerecht werden dürfte jedoch die Annahme, daß (14) sowohl einen konstanten Faktor als auch eine additive Konstante enthält bzw. daß die Funktion F in (15) eine (positiv) lineare Funktion ist. Eine analoge Rechnung zeigt in diesem Fall, daß C eine Intervallskala sein muß, wenn A und B Verhältnisskalen sind, damit die Ausage sinnvoll ist. Dagegen braucht C offensichtlich nur eine Ordinalskala zu sein, damit die Aussage (15) mit einer monoton steigenden Funktion F sinnvoll ist, wenn A und B Verhältnisskalen sind.
Orth: Bedeutsamkeitsanalysen bilinearer Einstellungsmodelle
112
7. Bilineare Modelle für Variablen auf Intervallskalenniveau
genau dann gilt, wenn (28) gilt. Es seien T A = uA + v und T b = wB + x mit u, w > 0 und a ' = ua-v und b ' = wb-x. Dann lautet (29)
In diesem Abschnitt wird gezeigt, daß die Annahmen in Form der Gleichungen (14) oder (15) der affektiv-kognitiven Konsistenztheorie, des Modells von FISHBEIN sowie des Komponentenmodells derart modifiziert werden können, daß sie sinnvolle numerische Aussagen sind, wenn die Variablen A und/oder B lediglich Intervallskalenniveau haben. Im folgenden wird für diese Theorien bzw. Modelle anstelle von (14) die folgende Gleichung betrachtet
m £ (uAj q + v + ua-v) (wBjq + x + wb-x) j= l
(30)
und nach Umformen n uw £ (A ip + a) (Bip + b)> i=1
n n c = E (Aj + a) (Bj + b) = £ A ß , + i= 1 i=1 n n + b £ A; + a £ Bj + abn, i= 1 i=1
n £ (uA ip + v + ua-v) (wBip + x + wb-x) > i=1
(27)
m uw £ (A jq + a)(A j q + b) j= l
(31)
wobei a und b reelle Konstanten sind. Es wird behauptet, daß ein Modell in Form der Gleichung (27), das ebenfalls ein bilineares Modell ist, lediglich Intervallskalenniveau für alle Variablen erfordert. Zunächst wird gezeigt, daß für Intervallskalen A und B Vergleiche von Einstellungswerten sinnvoll sind, d.h. daß die Ungleichung C p > Cq bzW.
und ist wegen uw > 0 äquivalent mit (28). Also erfordert (28) tatsächlich nur Intervallskalenniveau für die Variablen A und B. Zur Bestimmung des Skalentyps der Variablen C, der für die Bedeutsamkeit der Aussage (27) erforderlich ist (wenn A und B Intervallskalen sind), sollten strenggenommen wie in Abschnitt 6 wieder Skalenkonstanten in (27) eingefügt werden bzw. eine Funktion F, d.h.
n £ (A ip + a) (Bip + b ) > i=1
n C = F( £ (Ai + a)(B i + b)). i=1
m £ (A jq + a)(B jq + b) j= l
(28)
eine sinnvolle numerische Aussage ist. Für positiv lineare Transformationen T A und TB muß es also Konstanten a ' und b ' geben, so daß n £ (TA(Aip) + a') (TB(Bip) + i=1
b')>
m £ (TA(Ajq) + a') (TB(Bjq) + b') j= l
(29)
(32)
Sind also A und B Intervallskalen, so gilt: Ist F eine Ähnlichkeitsfunktion, dann muß C eine Verhältnisskala sein; ist F eine (positiv) lineare Funktion, muß C Intervallskala sein; ist F eine monoton steigende Funktion, so braucht C lediglich Ordinalskala zu sein. Für den Fall, daß A Verhältnis- (oder Absolut-)skala und B Intervallskala ist, kann anstelle von (27) die folgende Modellgleichung betrachtet werden:
C=
n n n £ A;(Bi + b ) = Z A ^ + b £ Aj, i= 1 i= 1 i=1
(33)
Zeitschrift für Sozialpsychologie 1985,16,101-115
wobei b eine reelle Konstante ist. Diese Gleichung könnte beispielsweise dann in Betracht kommen, wenn die Variable A als subjektive Wahrscheinlichkeit nicht nur interpretiert, sondern auch gemessen wird (und dann eine Absolutskala ist). Sinnvoll sind Vergleiche von Einstellungswerten aufgrund des bilinearen Ausdrucks in (33) jedoch auch, wenn A «nur» Verhältnisskala und B Intervallskala ist. Dies zeigt eine zu den Ungleichungen (28) bis (31) analoge Untersuchung der Bedeutsamkeit. Ebenfalls entsprechend gilt hier das im Zusammenhang mit der Gleichung (32) Gesagte über das Skalenniveau der Variablen C. Als Alternative zu der Modellgleichung (14) sind die Modellannahmen (27) und (33) hier als eine Möglichkeit vorgeschlagen worden, bilineare Einstellungsmodelle für intervallskalierte Variablen zu formulieren. Wieweit diese alternativen Modelle inhaltlich den Vorstellungen der hier betrachteten Einstellungsmodelle gerecht werden, kann an dieser Stelle nicht näher untersucht werden. Dies gilt auch für die eher «technischen» Fragen der Parameterschätzung, da ja die Gleichungen (27) und (33) eine Schätzung der additiven Konstanten a und/oder b erfordern. Offensichtlich ist jedoch, daß bei Intervallskalenniveau von A und/oder B die Modelle (27) und (33) zu einer «besseren» Datenanpassung bzw. Vorhersage der Einstellungswerte (C-Werte) führen (die jedoch nicht vergleichbar ist mit einer «Anpassung» an das Modell (14), da dieses für Intervallskalen A und B nicht sinnvoll ist). Deshalb hätten die bisherigen empirischen Untersuchungen zu den genannten Einstellungsmodellen mit intervallskalierten Variablen bei Anwendung der Modellgleichung (27) anstelle von (14) nicht nur eine sinnvolle numerische Aussage geprüft, sondern auch zu numerisch besseren Vorhersagen der Einstellungswerte und damit zu einer größeren Bestätigung der geprüften Modelle geführt.
8. Diskussion In der vorliegenden Arbeit wurde gezeigt, daß empirische Prüfungen der affektiv-kognitiven Konsistenztheorie, des Modells von FISHBEIN und des Komponentenmodells im Widerspruch zu den theoretischen Annahmen dieser Modelle stehen, da diese Annahmen Verhältnisskalenniveau für die Variablen I und W bzw. b und e bzw.
113 Z und B erfordern, während in den empirischen Untersuchungen bestenfalls Intervallskalen verwendet wurden. Hiermit wurde am Beispiel dieser bilinearen Einstellungsmodelle eine auch in der Sozialpsychologie leider nicht selten zu beobachtende Kluft zwischen theoretischer Modellbildung und praktischer Modellprüfung aufgezeigt. Diese Kluft beruht auf der Nichtbeachtung der gegenseitigen Abhängigkeit von Messung und Theorienbildung und dürfte denkbar ungeeignet sein, zu einer theoretischen wie empirischen Weiterentwicklung der Einstellungsforschung beizutragen. Die Tatsache, daß die Modellvorhersagen in den oben genannten empirischen Untersuchungen vergleichsweise gut bestätigt werden konnten, steht hiermit selbstverständlich nicht im Widerspruch, denn abgesehen davon, daß die Vorhersagen bei Verwendung gleichwertiger Skalen erheblich schlechter sein können, gibt es keinen Grund dafür, warum Richtiges nicht auch aus Falschem (bzw. Sinnlosem) vorhergesagt werden könnte. Für eine Aufhebung der Kluft zwischen Theorienbildung und -prüfung bestehen nach dem Gesagten grundsätzlich drei Möglichkeiten. Erstens können bei unveränderten Modellen in empirischen Untersuchungen Skalierungsverfahren eingesetzt werden, die zu einem den Modellen angemessenen Skalenniveau führen, d.h. die für die bilinearen Einstellungsmodelle zu Verhältnisskalen führen. Zweitens können die Modelle derart formuliert oder modifiziert werden, daß sie für die beteiligten Variablen lediglich Intervallskalenniveau erfordern, so daß die Messung dieser Variablen grundsätzlich mit denselben Methoden wie bisher erfolgen kann. Schließlich ist es natürlich auch möglich, sowohl die Modelle als auch die Meßmethoden so zu verändern, daß beide ebenfalls einander angemessen sind. Die erstgenannte Möglichkeit birgt insofern eine Schwierigkeit in sich, als eine Messung psychologischer Variablen auf Verhältnisskalenniveau nach allen bisherigen Erfahrungen nicht ohne weiteres erreichbar sein dürfte. Denken könnte man beispielsweise an die Methode der Größenschätzung (magnitude estimation) (vgl. z.B. WEGENER, 1982), doch führt diese Methode ohne strenge zusätzliche Annahmen lediglich zu einer sog. logarithmischen Intervallskala. Verhältnisskalen sind jedoch zum Beispiel zu erhal-
114 ten durch ein Verfahren der intermodalen Angleichung (cross-modality-matching) aufgrund von KRANTZ (1972) oder durch eine gemeinsame Verwendung von Rating-Verfahren und Größenschätz-Methode (ORTH, 1982a, b). Ein Beispiel für die zweite der genannten Möglichkeiten wurde in Abschnitt 7 vorgestellt. Allgemein stellt sich hierbei die Frage, inwieweit eine Änderung eines Modells den ursprünglich mit diesem Modell verbundenen inhaltlichen Vorstellungen gerecht zu werden vermag. So könnten hier die Konstanten a und b aufgrund der linken Gleichung in (27) lediglich als «Skalentransformationskonstanten» angesehen werden, denen keine inhaltliche Bedeutung zukommt; andererseits bewirken sie, wie der rechte Ausdruck in (27) zeigt, daß die Modellgleichung nicht mehr ausschließlich eine Produktsumme, sondern zusätzlich Summen von Skalenwerten enthält. Hierbei könnten die Konstanten a und b möglicherweise als Gewichtungsfaktoren dieser Summen betrachtet werden. Die inhaltliche Bedeutung der Meßwert-Summen ist allerdings ungewiß. Wird die Variable A als subjektive Wahrscheinlichkeit interpretiert, wie dies zumindest beim FISHBEINModell geschieht, so ist es sicherlich nicht plausibel anzunehmen, daß die Einstellung eine monotone Funktion u.a. der Summe der Wahrscheinlichkeiten aller Überzeugungen sei. In diesem Fall sollte deshalb die Modellgleichung (33) der Annahme (27) vorgezogen werden. Zu der drittgenannten Möglichkeit kann der Versuch gezählt werden, die ursprüngliche Modellannahme in Form der Gleichung (14) durch eine geeignete meßtheoretische Axiomatisierung zu ersetzen, deren empirische Prüfung lediglich Ordinalskalenniveau erfordert. Dieser Ansatz könnte grundsätzlich nach dem Vorbild der verbundenen Messung (vgl. z.B. KRANTZ et al., 1 9 7 1 ; ORTH, 1 9 7 4 ; ROBERTS, 1 9 7 9 ) erfolgen, wurde aber noch nicht vollständig ausgearbeitet. Bisher vorliegende Ergebnisse beschränken sich auf den Fall n = 2. Dies gilt für die von KAHNEMAN & TVERSKY ( 1 9 7 9 ) grob skizzierte theoretische Entwicklung wie für eine empirische Untersuchung im Rahmen dieses Ansatzes von COOMBS & LEHNER ( 1 9 8 4 ) . Die Weiterentwicklung dieser Vorgehensweise erscheint wünschenswert, zumal in ihr die befriedigendste Möglichkeit einer Überwindung des erörterten Widerspruchs zwischen Theorienbildung und Theorienprüfung gesehen
Orth: Bedeutsamkeitsanalysen bilinearer Einstellungsmodelle
werden kann. Dieser meßtheoretische Ansatz wird nicht nur wissenschaftstheoretischen Ansprüchen an eine Theorienbildung gerecht (SNEED, 1971), sondern erlaubt insbesondere eine detailliertere empirische Prüfung der betrachteten Einstellungsmodelle, da die hinter der Modellgleichung (14) stehenden Annahmen explizit gemacht werden, und kann bei der Anwendung auf intervall-oder verhältnisskalierte Variablen mit ihren häufig nicht prüfbaren Voraussetzungen verzichten. Literatur AJZEN, I. & FISHBEIN, M . 1980. Understanding attitudes and
predicting social behavior. Englewood Cliffs, N.J.: Prentice-Hall. COMREY, A.L. 1950. A proposed method for absolute ratio scaling. Psychometrika, 15, 3 1 7 - 3 2 5 . COOMBS, C . H . & LEHNER, P . E . 1 9 8 4 . Conjoint design and analysis of the bilinear model: An application to judgments of risk. Journal of Mathematical Psychology, 28,1 42.
DOHMEN, P. 1983. Einstellungsstruktur, Präferenz und Einstellungsänderung: eine experimentelle Prüfung des Komponentenmodells sozialer Einstellungen. Dissertation, RWTH Aachen. DOHMEN, P. &DOLL, J . 1984. Einstellungsstrukturen zu Per-
sonen und Politikern: Eine experimentelle Studie. Zeitschrift für experimentelle und angewandte Psychologie, 31,419-438.
DOHMEN, P. & DOLL, J. (im Druck). Strukturänderungen ex-
perimentell erzeugter Einstellungen. Psychologische Beiträge. DOHMEN, P . & FEGER, H . 1 9 8 4 . U n t e r s u c h u n g e n z u m K o m -
ponentenmodell der Einstellungsobjekte: II. Experimentelle Prüfungen. Zeitschrift für Sozialpsychologie, 15, 136-150.
EDWARDS, W. 1954. The theory of decision making. Psychological Bulletin, 51, 380-417. EDWARDS, W. 1961. Behavioral decision theory. Annual Review of Psychology, 12,473-498. FEATHER, N.T. (Ed.) 1982. Expectations and actions: Expectancy-value models in psychology. Hillsdale, N.J.: Erlbaum. FEGER, H. 1979. Einstellungsstruktur und Einstellungsänderung: Ergebnisse, Probleme und ein Komponentenmodell der Einstellungsobjekte. Zeitschrift für Sozialpsychologie, 10,331-349. FEGER, H . & DOHMEN, P . 1 9 8 4 . U n t e r s u c h u n g e n z u m K o m -
ponentenmodell der Einstellungsobjekte: I. Theorie und nichtexperimentelle Studien. Zeitschrift für Sozialpsychologie, 15,33-43. FISHBEIN, M. 1963. An investigation of the relationships between beliefs about an object and the attitude toward that object. Human Relations, 16, 233-239. FISHBEIN, M. 1967a. A behavior theory approach to the relations between beliefs about an object and the attitude to-
Zeitschrift für Sozialpsychologie 1985,16,101-115 ward the object. In: Fishbein, M. (Ed.): Readings in attitude theory and measurement. New York: Wiley, 389-400. FISHBEIN, M. 1967b. A consideration of beliefs, and their role in attitude measurement. In: Fishbein, M. (Ed.): Readings in attitude theory and measurement. New York: Wiley, 257-266. FISHBEIN, M. & AJZEN, I. 1975. Belief, attitude, intention, and behavior: An introduction to theory and research. Reading, Mass.: Addison-Wesley. HERKNER, W. 19812. Einführung in die Sozialpsychologie. Bern: Huber. IRLE, M. 1975. Lehrbuch der Sozialpsychologie. Göttingen: Hogrefe. KAHNEMAN, D . & TVERSKY, A. 1 9 7 9 . Prospect theory: An analysis of decision under risk. Econometrica, 47, 263291.
KRANTZ, D.H. 1972. A theory of magnitude estimation and cross-modality matching. Journal of Mathematical Psychology, 9,168-199. KRANTZ, D . H . , LUCE, R . D . , SUPPES, P . &TVERSKY, A . 1 9 7 1 .
Foundations of measurement, Vol.1: Additive and polynomial representations. New York: Academic Press. KRUSKAL, J.B. 1978. Factor analysis and principal components: I. Bilinear methods. In: Kruskal, W.H. & Tanner, J.M. (Eds.): International encyclopedia of statistics. New York: Free Press, 307-330. ORTH, B . 1 9 7 4 . Einführung in die Theorie des Messens. Stuttgart: Kohlhammer. ORTH, B. 1982a. A theoretical and empirical study of scale properties of magnitude-estimation and category-rating scales. In: Wegener, B. (Ed.): Social attitudes and psychophysical measurement. Hillsdale, N.J.: Erlbaum, 351377. ORTH, B. 1982b. Zur Bestimmung der Skalenqualität bei «direkten» Skalierungsverfahren. Zeitschrift für experimentelle und angewandte Psychologie, 29,160-178. OSTROM, T . M . 1 9 8 0 . Wechselseitige Beeinflussung von Einstellungstheorie und Einstellungsmessung. In: Petermann, F. (Hrsg.): Einstellungsmessung - Einstellungsforschung. Göttingen: Hogrefe, 37-54. PFANZAGL, J . 1 9 6 8 . Theoryof measurement. Würzburg: Physica. ROBERTS, F.S. 1979. Measurement theory: With applications to decisionmaking, utility, and the social sciences. Reading, Mass.: Addison-Wesley. ROBERTS, F . S . & FRANKE, C . H . 1 9 7 6 . On the theory of uniqueness in measurement. Journal of Mathematical Psychology, 1 4 , 2 1 1 - 2 1 8 .
115 ROSENBERG, M.J. 1956. Cognitive structure and attitudinal affect. Journal of Abnormal and Social Psychology, 53, 367-372. ROSENBERG, M.J. 1960a. A structural theory of attitude dynamics. The Public Opinion Quarterly, 24, 319-340. ROSENBERG, M.J. 1960b. An analysis of affective-cognitive consistency. In: Rosenberg, M. J., Hovland, C.I., McGuire, W. J., Abelson, R.P. & Brehm, J.W.: Attitude organization and change. New Haven: Yale University Press, 1564. ROSENBERG, M.J. 1965. Inconsistency arousal and reduction in attitude change. In: Steiner, I.D. &Fishbein, M. (Eds.): Current studies in social psychology. New York: Holt, 121-134. ROSENBERG, M.J. 1968. Hedonism, inauthenticity, and other goads toward expansion of a consistency theory. In: Abelson,R. P.,Aronson.E.,McGuire.W. J., Newcomb.T.M., Rosenberg, M. J. & Tannenbaum, P.H. (Eds.): Theories of cognitive consistency: A sourcebook. Chicago: Rand McNally, 73-111. SJÖBERG, L. 1982. Beliefs and values as attitude components. In: Wegener, B. (Ed.): Social attitudes and psychophysical measurement. Hillsdale, N.J.: Erlbaum, 1 9 9 - 2 1 7 . SNEED, J.D. 1971. The logical structure of mathematical physics. Dordrecht: Reidel. STROEBE, W. 1980. Grundlagen der Sozialpsychologie I. Stuttgart: Klett-Cotta. SUPPES, P. & ZINNES, J.L. 1963. Basic measurement theory. In: Luce, R.D., Bush, R.R. & Galanter, E. (Eds.): Handbook of mathematical psychology, Vol.1. New York: Wiley, 1-76. TORGERSON, W. S. 1958. Theory and methods of scaling. New York: Wiley. TVERSKY, A. 1977. Features of similarity. Psychological Review, 84,327-352. WEGENER, B. (Ed.) 1982. Social attitudes and psychophysical measurement. Hillsdale, N.J.: Erlbaum. WESTERMANN, R. 1982. Zur Messung von Einstellungen auf Intervallskalenniveau. Zeitschrift für Sozialpsychologie, 13,97-108. WESTERMANN, R. 1983. Interval-scale measurement of attitudes: Some theoretical conditions and F I empirical testing methods. British Journal of ^^^ Mathematical and Statistical Psychology, 36, 228-239.
116
Henss & Ostmann: Kooperatives Normalformspiel - empirische Befunde
Empirie Verhandlungsergebnisse und Koalitionsbildung in einem kooperativen Normalformspiel - Empirische Befunde* RONALD HENSS & AXEL OSTMANN Universität des Saarlandes, Saarbrücken Die Untersuchung kooperativer Normalformspiele ermöglicht die Analyse von Konfliktlösungen in einem Interessenkonflikt, der sowohl kooperative wie auch nicht-kooperative Aspekte aufweist. In dieser Arbeit werden die Ergebnisse zweier Experimentalserien (124 bzw. 96 Einzelexperimente) vorgestellt, welche die zugehörigen theoretischen Lösungsmodelle (die an anderer Stelle dargestellt wurden) einer ersten systematischen Überprüfung unterziehen. Zentral - und teilweise überraschend - sind das Zusammenspiel von kooperativen und nicht-kooperativen Lösungskonzepten sowie die relativ hohen Trefferzahlen für kooperative Konzepte, obschon die vielfältigen Argumentations- und Koalitionsbildungsmöglichkeiten nur unvollständig genutzt werden.
1.
Fragestellungen
Die vorliegende Arbeit knüpft an einen Artikel von HENSS (1985, in diesem Heft) an und setzt die dort vorgestellten Lösungsmodelle für kooperative Normalformspiele als bekannt voraus. Dabei werden Verlauf und Ergebnis eines Verhandlungsprozesses wesentlich durch die Komponenten Koalitionsdynamik und Argumentationstyp geprägt (HENSS, 1985, p. 95). Die empirische Überprüfung von Lösungsansätzen muß daher in erster Linie nach dem Geltungsbereich dieser Prinzipien fragen. Im Hinblick auf die Koalitionsdynamik ist von vorrangigem Interesse, inwieweit Verhandlungsergebnisse bereits durch das Prinzip der schwachen Präferenz erklärt werden können, in* Diese Arbeit entstand im Rahmen des Forschungsprojekts «Formale Modelle kooperativer Konfliktlösung», das unter Ta 56/3 von der Deutschen Forschungsgemeinschaft unterstützt wird.
The study of cooperative normal-form games enables the investigation of conflict resolution in a conflict of interests which features cooperative as well as non-cooperative aspects. Game theoretic solution concepts which have been proposed elsewhere are subjected to first systematic empirical investigations (124 and 96 individual experiments, respectively). Results indicate an intriguing relationship between cooperative and non-cooperative solution concepts; they yield a rather high proportion of cooperative solutions, despite the fact that the players did not fully make use of the variety of possibilities of argumentation and coalition formation.
wieweit es also zur Akzeptanz eines Ergebnisses ausreicht, daß zumindest ein Spieler davon einen Vorteil hat, solange den anderen dabei keine Nachteile erwachsen. In bezug auf den Argumentationstyp ist zu fragen, in welchem Umfange unterschiedliche Formen der Begründung von Forderungen überhaupt verwendet und welche Argumentationsweisen akzeptiert werden, dies vor allem im Hinblick auf die spezifischen Stärken und Schwächen des jeweiligen Argumentationstyps. So repräsentiert der Argumentationstyp a ein reines Sicherheitskonzept. Die Durchsetzbarkeit der Vorschläge (auch ohne weitere «Bedingungen») nach diesem Argumentationstyp führt dazu, daß zum Teil auch relativ schlechte Ergebnisse noch «rational» sind. Argumentationen vom Typ ß setzen dagegen voraus, daß die jeweilige Gegenkoalition die aktive Rolle übernimmt. Da die Spielregeln aber eine geheime Entscheidung vorsehen, ist eine Rollenverteilung in aktiv und reaktiv Handelnde aus den Spielregeln selbst
117
Zeitschrift für Sozialpsychologie 1985,16,116-127
nicht ableitbar. Gelegentlich suggerieren oder unterstellen die Spieler aber eine solche Rollenverteilung, wie man an Argumenten der Art «Wenn Ihr ... wählt, dann wähle ich ...» sieht, die im Laufe der Verhandlungen immer wieder verwendet werden. Die eigentliche Erweiterung herkömmlicher Konzepte besteht in der Berücksichtigung der Argumentationstypen y und 5. Beide haben einen gewissen «Zwangs-Charakter» («Wir wählen..., dann mußt Du nämlich ... wählen»); die darin angesprochene Rollenverteilung muß aber akzeptiert werden, wenn die als Argument benutzten Koalitionen zustandegekommen sind und die Opposition nicht ihrerseits über Zwangs-Argumente verfügt. Die Unterscheidung zwischen den beiden Unterformen y und 8 basiert auf der unterstellten Koalitionsdynamik: Bei der 5-Argumentation unterstellt die argumentierende Koalition der Gegenkoalition eine Entscheidung im Sinne der strikten Präferenz. Die Stärke dieser Argumentation liegt darin begründet, daß sich die Gegenkoalition ihr nur entziehen kann, indem sie selbst ein Opfer bringt. Die Koalitions-OppositionsPolarisierung kann dazu führen, daß man bei der bestehenden Koalitionsstruktur stehen bleibt und die Bildung der Großen Koalition verhindert wird. Die Argumentationsweise y unterstellt dagegen der Gegenkoalition die Entscheidung im Sinne der schwachen Präferenz. Man will von der Opposition noch die Versicherung, daß sie sich in einer vorgeschriebenen Weise verhält, das heißt die Opposition ist als Partner noch erwünscht. Ausgehend von den Konzepten Koalitionsdynamik und Argumentationstyp wurde das Prinzip der Koalitions-Rationalität und darauf aufbauend das Core als das kooperative Lösungsmodell eingeführt. Stellt man sich den Extremfall vor, daß sämtliche möglichen Ergebnisse durch die verschiedenen Koalitionen im Rahmen eines bestimmten Argumentationstyps und unter Zugrundelegung einer bestimmten Koalitionsdynamik überprüft werden, so bleiben schließlich die entsprechenden Core-Elemente als jene Ergebnisse übrig, die von keiner Koalition abgelehnt werden können. Jeder Kombination von Argumentationstyp und Koalitionsdynamik entspricht eine bestimmte Menge von Core-Elementen; Abbildung 1 soll die Teilmengenbeziehungen zwischen den verschiedenen Core-Arten verdeutlichen.
y-Core
S-Core
ß-Core
a-Core
yS-Core
ar-Core
Abb. 1: Teilmengen-Relation zwischen verschiedenen CoreTypen. Pfeile führen von der Teilmenge zur Obermenge. Eine Koalitionsdynamik im Sinne der strikten Präferenz wird durch Überstreichung gekennzeichnet. (Da wir nur «homogene» Argumentationen betrachten, werden das S- sowie das y-Core nicht berücksichtigt.)
In Abhängigkeit von der jeweils konkreten Konfliktsituation können die einzelnen Argumentationstypen unterschiedlich «weit führen»; insbesondere können sie «scheitern», indem sie auf ein leeres Core führen. Damit ist die Akzeptanz verschiedener Argumentationstypen auch als Spiel-abhängig zu erwarten. Es erhebt sich die Frage, ob jene Argumentationsweise bevorzugt wird, die «am weitesten führt». Hierzu führen wir mit dem Minimal-Core ein neues Lösungsmodell ein: Das Minimal-Core ist der Durchschnitt aller nicht-leeren Cores; es umfaßt damit die «kleinste» Menge aller nicht ablehnbarer Vorschläge gemäß aller Argumentationen, die nicht scheitern, und ist im Rahmen unserer Konzeptualisierung das (am weitesten führende) kooperative Lösungsmodell. Da nur die «Schlußabstimmung» bindend ist, ist ein Abweichen von der getroffenen Vereinbarung möglich. Dies kann als ein Zurückwerfen auf ein nicht-kooperatives Spiel aufgefaßt werden, so daß es natürlich ist, in diesem Rahmen auch nicht-kooperative Lösungskonzepte zu betrachten und auf ihre Bedeutung zu untersuchen. Diese werden hier durch das nicht-kooperative Lösungsmodell Gleichgewicht repräsentiert. Es ist zu vermuten, daß Verhandlungen eine unterschiedliche Dynamik aufweisen, je nachdem, ob in einem Spiel ein Gleichgewicht - und damit eine nicht-kooperative «Rückzugsposition» - überhaupt vorhanden ist und ob die ko-
118
Henss & Ostmann: Kooperatives Normalformspiel - empirische Befunde
operativen und die nicht-kooperativen Lösungskonzepte miteinander vereinbar sind oder ob sie miteinander konkurrieren. 2.
Durchführung der Versuche
Zur empirischen Überprüfung der geschilderten Fragestellungen wurden zwei verschiedene Experimentalserien durchgeführt. Dabei nahmen 96 bzw. 72 Student(inn)en aus verschiedenen Fachrichtungen der Universität des Saarlandes als Versuchspersonen teil. Die Versuchsdurchführung wurde in ihrer allgemeinen Form schon in HENSS ( 1 9 8 5 ) beschrieben. Der konkrete Versuchsablauf war für beide Versuchsserien gleich: Jede Vp nahm an vier verschiedenen Verhandlungsrunden teil. Dabei wurde sie in jeder Runde mit anderen Mitspielern konfrontiert. Im Anschluß an die letzte Verhandlungsrunde erhielten die Teilnehmer Geldbeträge, die sich durch eine (den Vpn nicht genau bekannte) strikt monotone Transformation aus der erzielten individuellen Punktesumme ergab. Durch diese Maßnahmen sollte sichergestellt werden, daß die in jedem Einzelspiel erzielte Punktzahl als individuell verdienter Geldbetrag interpretiert wurde und daß seitenzahlungsähnliche Absprachen zwischen den Teilnehmern nicht möglich waren. Die Durchführungsbedingungen erfüllten die Anforderungen, die SELTEN ( 1 9 7 2 ) an «reguläre Spiele» stellt. 2.1 Die Experimentalserie 1 Die Experimentalserie 1 betrachtet Sonderfälle. Bei der Konstruktion der Matrizen wurde darauf geachtet, daß die Argumentationstypen a und ß die gleichen Implikationen zur Folge hatten und daß darüberhinaus auch schwache und strikte Präferenz dieselben Resultate lieferten. Die Gleichheit der a- und der ß-Implikation wird in früheren Arbeiten (vgl. JENTZSCH, 1964) als besonders interessanter Entartungsfall («clear games») beschrieben. Ein solches Vorgehen ermöglicht folgendes: 1. Da zwischen den Argumentationstypen a und ß nicht unterschieden werden kann, werden die Spieler von einer differenzierten Argumentation entlastet.
2. Aufgrund der Nicht-Unterscheidbarkeit von schwacher und strikter Präferenz wird der Konflikt um die Koalitionsdynamik vermieden. 3. Der Versuchsplan kann durch Kontrollvariablen angereichert werden. Konkret wurden folgende unabhängige Variablen betrachtet: Die «zentralen» Variablen und sowie die drei «Kontrollvariablen» , und . Variable A: Anzahl ausschöpfender Paarstrukturen. Wir bezeichnen eine Zerlegung in eine Paarkoalition und einen isolierten Einzelspieler als eine ausschöpfende Paarstruktur, wenn der Wert (die Wert-Menge) der Paarkoalition vereinigt mit dem Wert (der Wert-Menge) des Einzelspielers den Wert der Großen Koalition (die gesamte Auszahlungsmenge) ergibt. Auf andere Weise ausgedrückt heißt dies: jedes mögliche Ergebnis ist durch die Paarkoalition oder durch den isolierten Spieler sicherbar. Zur Bildung der Großen Koalition besteht hier insofern kein Anreiz, als es nicht möglich ist, daß sich in dieser gleichzeitig die Paarkoalition wie auch der Einzelspieler verbessern könnten. Je nach der Anzahl ausschöpfender Paarstrukturen wird die Attraktivität der Spieler als Partner variiert (die Definition der «Attraktivität» ist jedoch für seitenzahlungsfreie Spiele umstritten). AO: Keine ausschöpfenden Paarstrukturen (alle Spieler sind «gleich umworben»). AI: Eine ausschöpfende Paarstruktur (ein Spieler ist «wenig umworben»). A2: Zwei ausschöpfende Paarstrukturen (ein Spieler ist «stark umworben»). A3: Drei ausschöpfende Paarstrukturen (alle Spieler sind «gleich umworben»). Variable B: Core-Größe. Geht man davon aus, daß Core-Treffer nicht selbstverständlich sind, so könnte die Größe des Cores einen Einfluß auf die Treffer-Zahl haben. Deshalb wurde wie folgt unterschieden: BO: Die a- (und damit auch die ß-)Argumentation scheitert. B1: Das Core enthält genau einen Auszahlungsvektor. B2: Das Core ist «mittelgroß». B3: Das Core ist «groß».
119
Zeitschrift für Sozialpsychologie 1985,16,116-127 Ausschöpfende Paarstrukturen
Core-Grösse B0
B1
B2
B3
A0 A1 A2 A3
8 8 8 8
2*8 2*8
8 8 8 6
8 8 8 6
Abb.2: Versuchsplan Serie 1. Variation der und der . Die Tabelle enthält die Anzahl der Spiele, die sich aus der Kombination der Variablen C, D und E ergaben. (Genauere Angaben zum Versuchsplan finden sich bei HENSS, 1984, p.24ff.)
(Die unscharfe Definition der Core-«Größe» ist darauf zurückzuführen, daß diese nicht unabhängig von den übrigen Variablen betrachtet werden kann.) Variable C: Gleichaufteilung. Die Hälfte der Spiele enthielt eine Auszahlung, die jedem Spieler genau ein Drittel der maximalen Summe zuteilte. Eine solche Auszahlung, die dann auch NPareto-optimal ist, ist möglicherweise aufgrund von Fairneß-Überlegungen besonders attraktiv. Variable D: Summe. Um zu überprüfen, ob die absolute Größe der erreichbaren Punkte einen Einfluß auf das Verhandlungsverhalten ausüben, wurde bei der einen Hälfte der Spiele die maximale Auszahlungssumme auf 27 festgelegt. Bei den übrigen Spielen wurden alle Punktwerte mit dem Faktor 3 multipliziert. Variable E: Ausreißer. Die Hälfte der Spiele enthielt einen für einen einzigen Spieler sehr deutlich angehobenen Auszahlungswert. Dieser war aber nicht durch den betreffenden Spieler sicherbar. Möglicherweise könnte ein solcher «Ausreißer»-Wert das Anspruchsniveau dieses Spielers und damit die Verhandlung insgesamt beeinflussen. Aus der Kombination der fünf unabhängigen Variablen ergaben sich insgesamt 124 (106 verschiedene) Spiele (vgl. Abb.2).
2.2 Die Experimentalserie 2 Die volle Entfaltung der oben angesprochenen Fragestellungen erfolgte in der zweiten Experimentalserie. Hier wurde sowohl die Differenzier-
barkeit zwischen den unterschiedlichen Argumentationstypen und den beiden Formen der Präferenz ermöglicht als auch die Verbindung zwischen dem Minimal-Core als dem kooperativen und dem Gleichgewicht als dem nicht-kooperativen Lösungsmodell hergestellt. Der Versuchsplan dieser Serie basiert auf der systematischen Variation dreier unabhängiger Variablen: Variable A: Minimal-Core. Die verschiedenen Cores waren in den Spielen dieser Serie so als Teilmengen ineinandergeschachtelt, daß das Minimal-Core stets einem ganz bestimmten Argumentationstyp entsprach, um auf diese Weise die am weitesten führende Argumentationsweise identifizieren zu können. Dabei wurden vier Fälle unterschieden: AI: A2: A3: A4:
das das das das
ß-Core ist 8-Core ist ß-Core ist y-Core ist
minimal minimal minimal minimal.
Variable B: Scheiternde Argumentationstypen. Die Variation der Argumentationstypen, die scheitern können, bezog nur die Konzepte ß, y und 8 ein (das heißt, daß die a-Cores stets nichtleer waren). Es wurden folgende fünf Fälle berücksichtigt: B1: B2: B3: B4:
kein Argumentationstyp scheitert nur die y-Argumentation scheitert nur die ß-Argumentation scheitert die 5- (und damit auch die y)-Argumentation scheitert B5: die ß- (und damit auch die ß)-Argumentation scheitert. Die Variable A definiert die Zeilen und die Variable B die Spalten des Versuchsplans, der in Abbildung 3 dargestellt ist (da diese Variablen nicht voneinander unabhängig sind, schöpfen die besetzten Zellen alle Kombinationsmöglichkeiten aus). Die dritte unabhängige Variable stellt den Zusammenhang zwischen kooperativen und nichtkooperativen Lösungskonzepten her. Variable C: Gleichgewicht und MinimalCore. Zu jeder Zelle des Versuchsplans wurde je ein Spiel mit einer der folgenden Eigenschaften konstruiert: CO: Es ist überhaupt kein Gleichgewicht, also keine nicht-kooperative «Rückzugsposition», vorhanden.
120
Henss & Ostmann: Kooperatives Normalformspiel - empirische Befunde
Minimal-Core
Scheiternde Argumentationstypen B1
B2
B4
B3
B5
CO, CI, C2
A1 CO, C1, C2
A2 A3
CO, C1, C2
A4
CO, C I , C2
CO, CI, C2
CO, C I , C2
CO, C I , C2
CO, C1, C2
Abb.3: Versuchsplan Serie 2.
C l : Es ist (mindestens) ein Gleichgewicht vorhanden. Die Menge der Gleichgewichte und das Minimal-Core haben jedoch einen leeren Durchschnitt, so daß kooperative und nichtkooperative Lösungen miteinander konkurrieren. C2: Die Menge der Gleichgewichte und das Minimal-Core haben einen nicht-leeren Durchschnitt, das heißt es besteht eine (partielle) Übereinstimmung zwischen kooperativen und nicht-kooperativen Lösungsmodellen. (Die Unterscheidung zwischen starkem und schwachem Gleichgewicht wurde nicht systematisch kontrolliert. Echte Gleichaufteilungen wurden in den Spielen dieser Serie entweder überhaupt nicht angeboten oder sie waren (mit einer Ausnahme) in dem Sinne unattraktiv, daß sie nicht N-Pareto-optimal waren.) Der Versuchsplan definiert 8 x 3 = 24 verschiedene Konfliktsituationen. Da jedes Spiel genau einmal in jeder der vier Verhandlungsrunden gespielt wurde, ergaben sich im Rahmen dieser Experimentalserie insgesamt 96 Einzelexperimente.
3.
Ergebnisse
3.1 Experimentalserie 1 Die Ergebnisse der ersten Experimentalserie zeigten keinen Einfluß der Manipulation der drei Kontrollvariablen auf irgendeinen Aspekt des Verhandlungsresultats. Dies ist insofern erfreulich, als damit keine Verzerrung durch außerhalb der eigentlichen Spielsituation liegende Faktoren nachgewiesen werden konnte. In bezug auf die
Variable ist aber anzumerken, daß das Nicht-Vorhandensein eines experimentellen Effekts offensichtlich darin begründet liegt, daß jeder «echten» Gleichaufteilung in der anderen Hälfte der Spiele eine (N-Pareto-optimale Aufteilung der maximalen Summe mit minimaler Punktevarianz, welche zugleich den Wert des «schwächsten» Spielers maximierte) entsprach, die zu nahezu identischen Konsequenzen führte. In 113 der 124 Spiele wurde eine explizite Einigung erzielt (vgl. Tab. 1). Mit Ausnahme von vier Fällen hielten sich die Spieler an die getroffenen Absprachen, so daß Abweichungen im Rahmen dieser Spielserie vernachlässigbar sind. Sofern sich alle Spieler an die verabredete Wahl hielten, wurden ausschließlich Auszahlungen gewählt, die sowohl individuell rational als auch N-Pareto-optimal - mithin Imputationen - waren. Ebenso werden nahezu alle Ergebnise durch das Lösungsmodell d-Lösung beschrieben. Dagegen spielte das nicht-kooperative Konzept Gleichgewicht im Rahmen dieser Serie keine Rolle. Die hier betrachteten Sonderfälle zeichneten sich ja
Tab. 1: Koalitionsstrukturm Abhängigkeit von den Variablen A und B. (Reihenfolge: keine Einigung; Paarkoalition; Große Koalition.) aussch. Paarstr.
Core-Größe
AO AI A2 A3
0; 1; 2; 0; 2; 1; 1; 3;
Gesamt
5; 5; 22 3; 9; 20 2; 5; 23 1; 3; 26
B0
B1
B2
7 0; 1; 15 l; l; 6 6 3; 8; 5 0; l; 7 5 1; 3; 4 4 0; 0; 6
B3 1;2; 0; 0; 0; 1; 0; 0;
Gesamt 5 8 7 6
2; 5; 3; 1;
5; 33 9; 26 5;16 3;16
11; 22; 91
121
Zeitschrift für Sozialpsychologie 1985,16,116-127
gerade dadurch aus, daß zwischen aktiver und reaktiver Rolle nicht unterschieden werden konnte (a = ß), so daß die größtenteils sehr einfachen Konfliktsituationen auch keine attraktiven Abweichungsmöglichkeiten boten. Tabelle 1 zeigt, welche Koalitionsstrukturen realisiert wurden. Es erscheint sinnvoll, die Resultate aus Tabelle 1 im Zusammenhang mit denen der Tabelle 2 zu betrachten, welche den Anteil von Core-Lösungen wiedergibt. Bei beiden Tabellen springt die Sonderstellung der Variablenkombination A l / B l unmittelbar ins Auge: Zum einen ist hier der Anteil von Einigungen im Rahmen der Großen Koalition auffallend gering (und der Anteil von Paarkoalitionen entsprechend groß), zum anderen wurde hier kein einziges Mal die Core-Auszahlung gewählt, während im übrigen 92% der Ergebnisse eine Core-Lösung darstellten. Eine mögliche Erklärung für diesen merkwürdigen Sachverhalt wurde schon bei HENSS (1985) gegeben, wo ein Repräsentant dieser Spiele als Beispiel verwendet wurde: In den Spielen der Kombination A l / B l war das Core sehr unattraktiv, weil es einem Spieler keine positive Dividende gewährte. Für diesen war es sinnvoller, von einer Koalitionsbildung Abstand zu nehmen, als der von der Großen Koalition verwirklichbaren Core-Auszahlung zuzustimmen. Diese Tatsache weist auf die Notwendigkeit hin, bei der Betrachtung der Wert-Menge einer Koalition auch die Auszahlungen an Dritte zu berücksichtigen (externe Effekte; vgl. OSTMANN, 1984). Die Lösung wurde hier innerhalb eines echten d-Zyklus gesucht. Die Spiele dieser Klasse waren im übrigen die einzigen, bei denen zwischen der a- (bzw. ß-)Argumentation einer-
Tab.2: Core-Lösungen in Abhängigkeit von den Variablen A und B. (Reihenfolge: Nicht-Core-Lösungen; Core-Lösungen.) aussch. Paarstr.
Core-Größe B1
B2
AO AI A2 A3
0; 16 16; 0
i; 2; 2; 0;
Gesamt
16; 16
5; 25
B3 7 6 6 6
Gesamt 7 8 8 6
2; 30 18; 14 2; 14 0; 12
1; 29
22; 70
i; 0; 0; 0;
seits und der y-Argumentation andererseits differenziert werden konnte. Während a- (bzw. ß-)Core durch eine unattraktive Auszahlung definiert werden, ist das y-Core dieser Spiele stets leer. Mithin kann dies als ein erster Hinweis auf die Relevanz des Y-Konzepts aufgefaßt werden. Die Sonderrolle dieser Spiele spiegelt sich auch in der Verhandlungsdauer wider: Während diese bei den restlichen Spielen im Durchschnitt etwa 9 Minuten betrug, wurden bei den Spielen der Kombination A1 /B1 im Mittel mehr als 26 Minuten benötigt. Sieht man von den Sonderfällen aus A l / B l ab, so lassen sich keine Einflüsse der Core-Größe oder der Anzahl ausschöpfender Paarstrukturen auf die verschiedenen Aspekte des Verhandlungsresultats ausmachen. Die verbleibenden sechs Fälle aus Tabelle 2, in denen das Ergebnis nicht im Core lag, können dadurch erklärt werden, daß hier Core-Auszahlungen und (Fast-)Gleichaufteilung miteinander konkurrierten. Die besondere Rolle der (Fast-)Gleichaufteilung wird in der Diskussion noch einmal aufzugreifen sein. 3.2 Experimentalserie 2 Die Wahl der Koalitionsstrukturläßt kaum einen Unterschied zwischen den beiden Experimentalserien erkennen (16% Paarkoalitionen und 82% Große Koalitionen in der zweiten Serie). Im Gegensatz zur Serie 1 war bei den Spielen der Serie 2 das Abweichen von einer Vereinbarung oftmals attraktiv. Die Daten zeigen, daß die Möglichkeit des Abweichens auch oft genutzt wurde: In 26 von 94 Spielen (bei denen eine Einigung erzielt wurde) hielten sich Spieler nicht an die getroffenen Absprachen. Die zahlreichen Abweichungen machen es erforderlich, zwischen der erzielten Einigung, also der getroffenen Vereinbarung und dem tatsächlich realisierten Ergebnis zu unterscheiden. Im folgenden beschränken wir uns auf die Betrachtung der Einigungen - und dabei auf die 79 Fälle, in denen die Einigung in der Großen Koalition erzielt wurde, da nur diese einen eindeutigen Auszahlungsvektor definieren. (Die Ergebnisse bieten im allgemeinen ein recht ähnliches Bild wie die Einigungen, was auf zwei gegenläufige Tendenzen zurückgeführt werden kann: Die Abweichungen führten zum Teil zu «Verschlechterun-
122
Henss & Ostmann: Kooperatives Normalformspiel - empirische Befunde
gen», während die Einigungen in einer Paarkoalition häufig «gute» Ergebnisse hervorbrachten.) Auch in der zweiten Experimentalserie waren nahezu alle Einigungen Imputationen, d.h. daß auch hier die Einigungen fast immer individuell rational (und zwar im Hinblick auf alle betrachteten Argumentationstypen) und N-Pareto-optimal (im Sinne der strikten wie auch der schwachen Präferenz) waren. Bei den Einigungen wurden für die Cores aller Argumentationstypen hohe Trefferzahlen beobachtet, die die Hypothese des Zufallstreffers signifikant ausschließen (vgl. Abb.4), dies gilt insbesondere auch für die Häufigkeit von Einigungen im Minimal-Core. Nur die Trefferzahl für das ß-Core fällt gegenüber den anderen CoreTreffernab. Gemäß der Spielregeln hat ein Vorschlag zwei Hürden zu überwinden: Zum einen muß er sich als akzeptabel in der Verhandlung erweisen und zu einer entsprechenden Einigung führen und zum anderen muß er auch bei der «Schlußabstimmung» noch Bestand haben. Unter den Einigungen, die Bestand haben, variiert die Häufigkeit von Core-Treffern für die verschiedenen Argumentationstypen zwischen 98% und 65%, wobei auch hier das ß-Core am schlechtesten abschneidet. Die geringen Fallzahlen lassen jedoch keine Aussage über Akzeptanzunterschiede zu. Es kann versucht werden, über den Einfluß der unabhängigen Variablen A und B doch noch einen Unterschied in der Akzeptanz der verschiedenen Argumentationstypen sichtbar zu ma-
chen. Dazu betrachten wir in Tabelle 3 die Verteilung der Einigungstreffer für das Minimal-Core bezüglich dieser Variablen. _ In der Zelle A3/B4 fällt auf, daß bei leerem 5Core das Minimal-Core fast nie getroffen wird. Auch die Spalte B1 weist eine geringe Trefferzahl auf. Dies ist im wesentlichen verursacht durch die geringe Trefferzahl, wenn das ß-Core das Minimal-Core repräsentiert (Zelle A3/B1). Die Relation, die in Spalte B1 zwischen den Zellen vorgefunden wurde, spiegelt sich auch wider als Relation zwischen den entsprechenden Zeilensummen: Ist das ß-Core minimal (Zeile A3), so erhalten wir vorwiegend Nicht-Treffer, ist jedoch das Y-Core minimal (Zeile A4), so erhalten wir vorwiegend Minimal-Core-Treffer. Zusammen mit der oben genannten insgesamt geringeren Trefferhäufigkeit für das ß-Core läßt dieser Sachverhalt eine Überlegenheit der y- gegenüber der ßArgumentation vermuten. Als von zentraler Bedeutung erwies sich die Manipulation der unabhängigen Variablen C. Tabelle 4 zeigt, daß Gleichgewichte fast nur dann gewählt wurden, wenn sie nicht mit einer kooperativen Lösung in Konkurrenz traten. Dies ist vor allem im Hinblick auf den hohen Anteil von Abweichungen ein sehr bemerkenswertes Ergebnis, hätte man doch zumindest bei den Spielen der Klasse C1 Abweichungen durch
Tab. 3: Einigungen im Minimal-Core in Abhängigkeit von den Variablen A und B. (Reihenfolge: nein; ja.) MinimaiCore AI A2 A3 A4
Scheiternde Argumentationstypen „. B3 B4 B5 B1 B2
8; 2 4; 5
Gesamt 12; 7
t
1
1
.10 .20 .30
1
.40
1
1
1
. 50 .60 .70
1
.80
3; 7
2; 8 1; 10 18; 9 7; 24
3; 7
28; 51
2; 8 1; 10 2; 6
8; l 0; 12 2; 20
3; 16
8; 1
Gesamt
r
.90
Abb.4: Häufigkeiten von Core-Treffern X-Achse: Relative Häufigkeiten von Core-Treffern (MC = Minimal-Core) bezogen auf die Einigungen in der Großen Koalition. Y-Achse: Relative Häufigkeit von Core-Auszahlungen in der Grundgesamtheit aller Spiele.
Tab. 4: Einigungen auf Gleichgewichte in Abhängigkeit von der Variablen C.
nein ja
C1
C2
Gesamt
26 2
6 19
32 21
123
Zeitschrift für Sozialpsychologie 1985,16,116-127 Tab. 5: Häufigkeit von Abweichungen in Abhängigkeit von der Variablen C.
keine Abweichung mindestens eine Abweichung
CO
C1
C2
Gesamt
17
20
31
68
14
11
1
26
Tab. 6: Einigungen im Minimal-Core in Abhängigkeit von der Variablen C.
nein ja
CO
C1
C2
Gesamt
15 11
7 21
6 19
28 51
die Wahl eines Gleichgewichts unattraktiv machen können (vgl. aber Tab.5). Überraschend ist jedoch vor allem folgendes Ergebnis: Das Vorhandensein eines Gleichgewichts scheint eine kooperative Lösung zu stabilisieren. Die Ergebnisse der Tabelle 6 stützen die Interpretation des Gleichgewichts als einer «nicht-kooperativen Rückzugsposition» (vgl. die Ausführungen in der folgenden Diskussion). Ein analoges Bild ergibt sich auch für die anderen Cores. In diesem Zusammenhang ist es auch interessant, daß Verfahrensregeln (z.B. Losen, «blind» wählen) vor allem in Spielen der Klassen CO und C1 vorgeschlagen wurden.
4.
Diskussion
In der vorliegenden Arbeit haben wir Verhandlungen in einem kooperativen Normalformspiel betrachtet und uns dabei auf verschiedene Aspekte des Verhandlungsergebnisses bzw. der erzielten Einigung konzentriert. Die zugrundeliegenden theoretischen Lösungskonzepte führen zu Mengen von «rationalen» Ergebnissen, indem sie bestimmte Annahmen darüber treffen, was die Spieler in die Verhandlung einbringen. Diese Annahmen müßten sich wenigstens teilweise auch in den Argumenten, wie sie im Laufe der Verhandlungen auftreten, wiederfinden lassen. Die Beobachtung und Beschreibung des Verhandlungsverlaufs ist jedoch naturgemäß weit-
aus schwieriger als die Betrachtung der Verhandlungsergebnisse. Umfangreiche Informationen über den Verhandlungsprozeß enthalten zum einen Tonbandmitschnitte der Verhandlungen sowie zum anderen standardisierte Verhandlungsprotokolle, welche vom jeweiligen Versuchsleiter angefertigt wurden. Die Auswertung dieser Daten steht aber zum größten Teil noch aus, ebenso wie die Auswertung teilstrukturierter Nachbefragungen, mit denen unter anderem versucht wurde, Auskünfte Uber die individuellen Zielsetzungen der Versuchsteilnehmer sowie über deren subjektive Interpretation der Untersuchungssituation zu erhalten. Trotz der weitgehenden Beschränkung auf die Betrachtung der Verhandlungsergebnisse konnten wir Resultate vorstellen, die für sich genommen interessant, weil nicht selbstverständlich, sind und die darüberhinaus für die Analyse des Verhandlungsverlaufs richtungsweisend sind. Im folgenden wollen wir fünf zentrale Ergebnisse diskutieren: 1. Alle vorgestellten kooperativen Lösungskonzepte, insbesondere auch das Minimal-Core, besitzen einen hohen deskriptiven Wert. 2. Dies ist vor allem im Hinblick darauf interessant, daß Koalitionsbildungs- und Argumentationsmöglichkeiten nur unvollständig genutzt werden. 3. Werden attraktive Abweichungsmöglichkeiten angeboten, so hat ein beträchtlicher Teil der Einigungen keinen Bestand. 4. Gleichgewichte werden nur selten gewählt, sie scheinen aber kooperative Lösungen zu stabilisieren. 5. Das häufige Auftreten von (Fast-)Gleichaufteilungen als Ergebnis verweist darauf, daß in die Verhandlungen zusätzliche Gerechtigkeitsüberlegungen mit einfließen. Zu 1.: Unsere Untersuchungen weisen allen kooperativen Lösungskonzepten einen hohen deskriptiven Wert zu. Dabei lassen sich aufgrund der Trefferzahlen für die verschiedenen Cores keine eindeutig überlegenen Argumentationstypen ausmachen, ebensowenig wie zwischen den beiden Formen der Koalitionsdynamik ein augenfälliger Unterschied besteht. Am ehesten deutet sich eine leichte Unterlegenheit der mit der schwachen Präferenz verknüpften ß-Argumentation an. Besonders hervorzuheben ist der hohe
124
Henss & Ostmann: Kooperatives Normalformspiel - empirische Befunde
deskriptive Wert des «am weitesten führenden» kooperativen Lösungskonzepts, des MinimalCore. Die hohen Trefferzahlen für alle kooperativen Lösungsmodelle könnten insgesamt die Vermutung nahelegen, daß die theoretisch zugrundeliegenden Vorstellungen in den Verhandlungen eine ausschlaggebende Rolle spielen. Dies würde bedeuten, daß sich die Spieler an individuellen Nutzen werten orientieren, daß vor allem die strategischen Aspekte des Spiels von Bedeutung sind und daß die Möglichkeiten zur Koalitionsbildung voll berücksichtigt werden. Zu 2.: Vor allem an der letzten Folgerung (Koalitionsbildung) sind jedoch starke Zweifel angebracht. Die Beobachtung der Verhandlungen vermittelte eher den Eindruck, daß sowohl die Möglichkeiten zur Koalitionbildung als auch die unterschiedlichen Argumentationsmöglichkeiten nur unvollständig genutzt wurden. Die spieltheoretischen Lösungskonzepte unterstellen, daß im Laufe der Verhandlung alle Möglichkeiten der Koalitionsbildung berücksichtigt werden. Dabei spielt insbesondere auch die Bildung von «Präkoalitionen» eine wesentliche Rolle (eine «Präkoalition» ist ein fester, aus mehreren Spielern bestehender «Block», der zum Zwecke der Verhandlung wie ein Spieler, das heißt mit einer einheitlichen Strategie auftritt). Die Beobachtung der Verhandlungen zeigt aber, daß in diesem experimentellen Rahmen Präkoalitionen (hier: als «Block» auftretende Paarkoalitionen) kaum explizit gebildet werden. Anregungen zur Formierung einer Paarkoalition erfolgen eher sporadisch, und die vorgeschlagene Koalition zerfällt häufig wieder, ohne ihre argumentativen Möglichkeiten voll auszuschöpfen. Die hier ausschließlich betrachteten 3-Personen-Spiele nehmen allerdings insofern eine Sonderstellung ein, als hier Präkoalitionen automatisch «Isolation» (des dritten Spielers) erzeugen. Aus der Beobachtung der Verhandlungen resultiert aber der Eindruck, daß die Spieler diese Form der Konfrontation scheuen. In vielen Fällen, in denen sich zwei Spieler im Grunde genommen schon über eine koordinierte gemeinsame Entscheidung einig sind, wird die entsprechende Paarkoalition nicht realisiert - es wird stattdessen intensiv versucht, die Zustimmung des Dritten zu erhalten und auf diese Weise die Bildung der Großen Koalition absegnen zu lassen. Mehr
als ein Viertel der Großen Koalitionen der Serie 2 sind in dem Sinne «unecht», als sie nur dadurch zustandekamen, daß nach langer Debatte der isolierte Spieler schließlich doch noch «zähneknirschend» seine Zustimmung erteilte (der Unterschied zwischen «echten» und «unechten» Großen Koalitionen spiegelt sich deutlich in den entsprechenden Verhandlungszeiten wider: 27.0 vs. 34.6 Minuten). Weitere Untersuchungen, bei denen sich die Spieler nicht direkt gegenübersitzen, sondern nur über Rechner-Terminals miteinander verhandeln können («computer-controlled bargaining»), sollen Aufschlüsse darüber liefern, inwieweit die konkrete Bedingung der face-to-face-Interaktion einen Druck zur Bildung der Großen Koalition erzeugt. Das verstärkte Bemühen um eine gemeinsame Einigung mag wohl auch dafür verantwortlich sein, daß bei den Spielen mit leerem Core (Serie 1) der erwartete «Run auf die Paarkoalitionen» nicht einsetzte; stattdessen bewegte sich hier die Diskussion so lange in dem von wechselnden Paarkoalitionen getragenen echten d-Zyklus (vgl. das Beispiel in HENSS [ 1 9 8 5 ] ) bis dann doch ein Spieler nachgab und einer für ihn selbst unvorteilhaften Einigung in der Großen Koalition zustimmte. Bei den Spielen der Serie 2 waren stets zumindest die a-Cores nicht-leer, so daß im Rahmen dieses Konzepts auch immer die Ansprüche aller Paarkoalitionen befriedigt werden konnten. Nichtsdestoweniger wäre auch hier in vielen Fällen die Bildung von Paarkoalitionen attraktiv gewesen. Soweit Paarkoalitionen realisiert wurden, waren diese im allgemeinen «rational», und zwar in folgendem Sinne: geht man davon aus, daß der isolierte Dritte sich dem durch das y- (bzw. S-)Konzept definierten Zwang beugt, dann führen die weitaus meisten Paarkoalitionen zu einer Lösung im Minimal-Core. Die unvollständige Nutzung der Argumentationsmöglichkeiten zeigt sich vor allem darin, daß die reaktive Rolle zumeist nur einem Einzelnen zugedacht wird. So finden sich auf Seiten der ß-Argumentation häufig Äußerungen der Art «Wenn Ihr ... wählt, dann wähle ich ...», aber kaum Aussagen der Form «Wenn Du ... wählst, dann wählen wir ...». Bezüglich der y- (bzw. 8-)Argumentation stehen den relativ häufig auftretenden Äußerungen der Form «Wir wählen...,
125
Zeitschrift für Sozialpsychologie 1985,16,116-127
dann mußt Du nämlich... wählen» kaum Aussagen der Art «Ich wähle..., weil Ihr d a n n . . . wählen müßt» gegenüber. Die häufiger vorkommenden Äußerungen sind insofern die einfacheren, als sie den Konflikt um die Koalitionsdynamik (bei der reagierenden Partei) umgehen, ist doch für den reagierenden Einzelnen die Differenzierung zwischen strikter und schwacher Präferenz irrelevant. Es sei noch angemerkt, daß die Interpretation obiger Aussagen als Argumente Probleme aufwirft. Sehen wir uns etwa die Wenn-dann-Aussagen näher an, so bleibt zunächst unklar, was damit argumentativ gemeint ist. Abhängig vom Kontext können sie als Abwehr eines Vorschlages (im Sinne der ß-Argumentation) oder aber als Akzeptieren eines Zwanges gedeutet werden (wurde zuvor der Vorschlag A präsentiert, dann kann die Aussage «Wenn Ihr A wählt, dann wähle ich ...» so verstanden werden, daß die im Vorschlag A, eventuell nur implizit, enthaltene reaktive Rolle akzeptiert wird). Das Nicht-Ausschöpfen aller Argumentations- und Koalitionsbildungsmöglichkeiten liegt
unter Umständen auch darin begründet, daß die Spieler ihre wahren Absichten nur ungern offenlegen wollen. Möglicherweise wollen sie nicht zugeben, daß sie sich vorwiegend an individuellen Nutzenwerten orientieren und daß sie beabsichtigen, alle strategischen Möglichkeiten des Spiels zu nutzen. Vielleicht wollen sie auch als «fair» erscheinen oder im Hinblick auf profitable Abweichungsmöglichkeiten als «verläßlich». Zu 3.: Der hohe Anteil von Abweichungen muß als eines der bemerkenswertesten Resultate angesehen werden. Dies vor allem vor dem Hintergrund, daß die Möglichkeiten des Abweichens in den meisten Verhandlungen nicht nur gesehen, sondern häufig ausführlich diskutiert wurden, wobei Gleichgewichtspunkte durchaus als «betrugssichere» Alternative erkannt - aber trotzdem nicht gewählt - wurden. Am Beispiel der in Abbildung 5 dargestellten Konfliktsituation lassen sich einige Besonderheiten der Abweichungsfälle gut illustrieren. In drei von vier Fällen einigten sich die Spieler im Rahmen der Großen Koalition auf die Mini-
Abb.5: Beispiel einer Konfliktsituation aus Serie 2 (Variablenkombination: A1/B3/C1). Minimal-Core: sux Gleichgewicht: tuy
126
Henss & Ostmann: Kooperatives Normalformspiel - empirische Befunde
mal-Core-Auszahlung . Allerdings hielten sich nur einmal alle drei Spieler an die getroffene Vereinbarung. In den beiden anderen Fällen wählte jeweils der «rechte» Spieler die Alternative (anstelle von ). Dies ist in dreierlei Hinsicht typisch für die Abweichungsfälle überhaupt: Zum einen gingen Abweichungen zumeist von dem Spieler aus, der im Einigungspunkt den niedrigsten Wert erzielt hätte (man beachte vor allem die profitable Abweichungsmöglichkeit, die sich für den «mittleren» Spieler durch die Wahl von ergäbe - vorausgesetzt, er weicht als einziger ab). Zum zweiten hielt sich in der Regel nur ein einziger Spieler nicht an die Absprache (man überlege sich die vielfältigen Möglichkeiten im Falle von Mehrfach-Abweichungen). Da drittens Abweichungen «aus Angst vor fremden Abweichungen» kaum vorkamen, waren Abweichungen in den allermeisten Fällen lohnend, also aus der Perspektive der individuellen Nutzenmaximierung «rational». Aufgrund eines ersten groben Überblicks über die «individuelle Verhandlungsgeschichte» der Spieler konnten keine «notorischen Abweichler» identifiziert werden. Besonders hervorzuheben ist die Tatsache, daß die Teilnahme an vier verschiedenen Verhandlungsrunden keinerlei «Lerneffekt» bewirkte: Obgleich mit zunehmender Spielerfahrung immer mehr Versuchsteilnehmer unmittelbar mit dem Problem der Abweichungen konfrontiert wurden, sei es als «Abweichende», sei es als «Betroffene», war über die Verhandlungsrunden hinweg keine Veränderung der Abweichungshäufigkeiten zu beobachten. Die vierte Verhandlung zu der als Beispiel verwendeten Konfliktsituation markiert in dieser Hinsicht eine der seltenen Ausnahmen: Hier einigten sich der «linke» und der «mittlere» Spieler im Rahmen einer Paarkoalition auf die Wahl von und . Damit blieb dem «rechten» Spieler nur noch die Wahl von übrig, so daß auf diese Weise durch die Paarkoalition die Wahl des Gleichgewichts «erzwungen» wurde. Zu 4.: Obschon Gleichgewichte offensichtlich nicht die erwartete Rolle einer «Sicherung gegen Abweichungen» spielten, hat die Manipulation der Variablen C in der Serie 2 auf eine andere, möglicherweise bedeutsame Funktion der Gleichgewichte aufmerksam gemacht. Es hat
nämlich den Anschein, als würde das nicht-kooperative Lösungsmodell kooperative Lösungen stabilisieren. Es muß vorläufig noch offenbleiben, inwieweit die folgende, aus der «social-choice»-Vorstellung vom «pure bargaining» abgeleitete, Interpretation dieses Phänomen zutreffend beschreibt. In dieser Sichtweise werden lediglich ein Auszahlungsvektor für den Nichteinigungsfall sowie im Einigungsfall eine Menge möglicher Auszahlungen für die Große Koalition betrachtet, alle anderen Koalitionen bleiben unberücksichtigt. Es wird dann versucht, durch Kooperation etwas Besseres als den Nichteinigungspunkt zu erreichen. Angewandt auf unseren Fall könnte man sich ein Gleichgewicht als «Nichteinigungspunkt» vorstellen. Ist dieser nicht N-Pareto-optimal, so können die Spieler ausgehend von dieser «nicht-kooperativen Rückzugsposition» versuchen, durch Kooperation ein günstigeres Ergebnis zu erzielen - und auf diese Weise zur kooperativen Lösung gelangen. Zu 5.: Die zahlreichen Wahlen von (Fast-)Gleichaufteilungen (auch in Serie 2) werten wir als Hinweis darauf, daß in vielen Fällen nicht nur der Aspekt des individuellen Nutzens (wie von den Lösungskonzepten Core und Gleichgewicht unterstellt) für das Ergebnis eine Rolle spielt, sondern daß darüberhinaus häufig auch «Gerechtigkeitsüberlegungen» hinzutreten. Eine Differenzierung verschiedener Gerechtigkeitsprinzipien (etwa «geringste Verteilungsschiefe»oderRAWLs' «maximin») war aber im Rahmen der bisherigen Untersuchungen nicht angestrebt. Diese verlangt wohl auch eher eine «social-choice»-Formulierung, etwa im Sinne des schon angesprochenen «pure bargaining» (vgl. z.B. Yaari & BarHillel, 1984). Spieltheoretische Modelle berücksichtigen explizit die Koalitionen und stellen «Gerechtigkeitsüberlegungen» an, die wegen ihrer Komplexität bei den betrachteten experimentellen Spielen wenig Bedeutung haben dürften, zumal es, wie oben erwähnt, kaum explizite Präkoalitionen gibt. Inwieweit die prominente Rolle der (Fast-) Gleichaufteilung mit der Problematik der «notorischen Gleichaufteiler» zusammenhängt, soll durch anstehende Analysen der «individuellen Verhandlungsgeschichten» untersucht werden.
127
Zeitschrift für Sozialpsychologie 1985,16,116-127
Literatur
HENSS, R. 1984. Das «Matrix-Spiel»: Verhandlungsergebnisse und Koalitionsbildung in einem Drei-Personen-Spiel ohne Seitenzahlungen. Saarbrücken: Arbeiten der Fachrichtung Psychologie, Universität des Saarlandes, Nr.87. HENSS, R. 1985. Verhandlungsergebnisse und Koalitionsbildung in einem kooperativen Normalformspiel. Theoretische Lösungskonzepte. Zeitschrift für Sozialpsychologie, 16, 9 1 - 1 0 0 .
JENTZSCH, G. 1964. Some thoughts on the theory of coopera-
tive games. Annals of Mathematics Studies, 52, 407-442. (Posthum) OSTMANN, A. 1984. Die Berücksichtigung externer Effekte und der Endlichkeit des Ergebnisraums bei kooperativ gespielten Normalformspielen. Saarbrücken: Arbeiten der Fachrichtung Psychologie, Universität des Saarlandes, Nr. 88. SELTEN, R. 1972. Equal share analysis of characteristic function experiments. In: Sauermann, H . (Ed.): Contributions to Experimental Economics. Vol.III. Tübingen: Mohr, 130-165. R YAARI, M . E . & BAA-HILLEL, M . 1 9 8 4 . O n d i v i d i n g
justly. Social Choice and Welfare, 1, 1 -24.
H
M
128
Mummendey et al.: Normativer Kontext aggressiver Interaktionen
Der normative Kontext aggressiver Interaktionen. Subjektive Repräsentationen von Unangemessenheit* AMELIE MUMMENDEY, GABI LÖSCHPER, VOLKER LINNEWEBER, SABINE OTTEN & JÖRG-DIETRICH MEYBERG Universität Münster Subjektive Repräsentationen von Regeln und Normen in aggressiven Interaktionen in Schulen werden mittels multidimensionaler Skalierung (MDS) erfaßt. 15 anhand einer Voruntersuchung ausgewählte Episoden aggressiver Auseinandersetzungen werden von 80 Schülern mit bipolaren Eigenschaftsratings (ebenfalls Resultat der Voruntersuchung) beurteilt. Die Urteile werden mittels eines INDSCAL-S Verfahrens ausgewertet. Durch eine weitere, der Kreuzvalidierung dienende Studie mit 100 Schülern, mit clusteranalytischer Auswertung werden die Resultate und Interpretationen gestützt. Die Ergebnisse zeigen, daß der normative Kontext aggressiver Interaktionen in Schulen durch vier Eigenschaftsdimensionen repräsentiert werden kann. Die kennzeichnenden Adjektivpaare sind: , , und . Die Ergebnisse werden im Zusammenhang eines sozialpsychologischen Aggressionskonzeptes (MUMMENDEY, BORNEWASSER, LÖSCHPER & LINNEWEBER, 1 9 8 2 ) diskutiert.
By a multidimensional scaling method (MDS) subjective representations of rules and norms in aggressive interactions in schools are registered. 80 pupils rate on bipolar scales (constructed on the basis of a pretest) 15 episodes of aggressive interactions (also results of a pretest). Judgements are evaluated by INDSCAL-S. A further study with 100 pupils using clusteranalysis of data was done in order to support the results and the interpretation via crossvalidation. The results show that the normative context of aggressive interactions in schools can be represented by four cognitive dimensions. Characterizing pairs of adjectives are (beleidigend-höflich) , , and . The results are discussed within a social psychological concept of aggression (MUMMENDEY, BORNEWASSER, LÖSCH-
1.
1 9 7 6 ; TEDESCHI, 1 9 8 4 ; TEDESCHI e t a l . , 1 9 7 7 ; T E DESCHI et al., 1 9 7 4 ) diskutiert. Empirische Stu-
Problemstellung
Während in der psychologischen Aggresionsforschung die Definitionskriterien Schaden und Intention bereits seit geraumer Zeit sowohl in Bestrebungen um eine wissenschaftliche Definition des Forschungsgegenstandes als auch in Studien zum Beurteilungsprozeß aggressiven Verhaltens etabliert sind, wird das Kriterium «Normabweichung» erst in den letzten Jahren von einer zunehmenden Zahl von Autoren (z. B . BILLIG, 1 9 7 6 ; DAGLORIA & DERIDDER, 1 9 7 7 ; LÖSCHPER e t a l . , 1 9 8 4 ; MUMMENDEY, 1 9 8 2 ; RIVERA & TEDESCHI, * Die Autoren danken Herrn Dipl.-Soz. D . F I C H T E N für seine Unterstützung bei der Datenverarbeitung sowie Herrn Dipl.-Päd. RAINER LAU für die Durchführung der Untersuchung. Die vorliegende Untersuchung entstand im Rahmen eines von der Deutschen Forschungsgemeinschaft unterstützten Forschungsprojektes (Mu 551/2-6). HOFER
PER & LINNEWEBER, 1 9 8 2 ) .
dien belegen, daß ungerechtfertigte Angriffe die Wahrscheinlichkeit aggressiver Gegenreaktionen erhöhen (RULE & NESDALE, 1 9 7 4 ; ZILLMANN etal., 1 9 7 5 ; ZILLMANN&CANTOR, 1 9 7 6 ) und daß initiativ-feindseliges Verhalten als antinormativ und aggressiv bewertet wird, während reaktivaversives Verhalten als eher moralisch akzeptabel beurteilt wird (BROWN & TEDESCHI, 1 9 7 6 ; CARPENTER & DARLEY, 1 9 7 8 ; KANE etal., 1 9 7 6 ; 1 9 7 7 ) ; entsprechend der Retaliationsnorm ergibt sich für den Betroffenen das Recht auf aggressive ReAktionen nach ungerechtfertigten Angriffen (FRACZEK, 1980).
1974;
LAGERSPETZ
&
WESTMAN,
Die vorliegende Studie bemüht sich um eine differenzierende Analyse des Definitionskriteriums «Normabweichung» in der Beurteilung aggressiven Verhaltens. Dem Beurteilungsprozeß
129
Zeitschrift für Sozialpsychologie 1985,16,128-138
wird im Rahmen eines interaktiven Aggressionskonzeptes (vgl. MUMMENDEY et al., 1982) sowohl für die Diskussion um den Aggressionsbegriff (MUMMENDEY, 1982) als auch für die Analyse von Verläufen aggressiver Interaktionen zentrale Bedeutung beigemessen. Für das Definitionskriterium wird davon ausgegangen, daß Vorstellungen über die Angemessenheit (bzw. Normabweichung) in Frage stehenden Verhaltens sich an situativ als gültig erachteten Normen orientieren (FORGAS, 1979b; 1980; 1982), an die sich darüber hinaus auch Erwartungen bezüglich des Fortgangs der Interaktion knüpfen (vgl. ARGYLEetal., 1981).
Im Rahmen einer empirischen Studie zu Normvorstellungen in aggressiven Interaktionen erscheint die Begrenzung auf ein definiertes soziales Feld mit relativ konsensualen Regeln und Zielen sinnvoll, da eine detaillierte Betrachtung nicht lediglich auf die bekannten allgemeinen normativen Orientierungen wie equity (WALSTER et al., 1976) oder Reziprozität (GOULDNER, 1960), sondern systemspezifische Verhaltenserwartungen und Ausformungen bzw. Konkretisierungen allgemeiner Normen in ihrem Einfluß auf aggressive Interaktionen und Angemessenheitsvorstellungen abzielen sollte. Die Wahl eines exemplarischen Feldes (im vorliegenden Fall «Schule») stellt somit zwar scheinbar eine Einschränkung im Hinblick auf die Generalisierbarkeit der Ergebnisse dar, erscheint allerdings im Hinblick auf die angestrebte Detailanalyse geboten. Wie auch etwa die Untersuchungen von ARGYLE et al. (1979) und FORGAS (1981) zeigen, erweist es sich als erforderlich, Normen in Abhängigkeit von einer bestimmten Gruppe oder Umgebung zu explorieren, die Studien von ARGYLE et al. (1979) weisen darüber hinaus nach, daß eine Vielzahl von Normen situationsspezifisch, also nur für eine begrenzte Zahl von Situationen gültig ist. Ziel der vorliegenden Untersuchung ist damit die Ermittlung von Repräsentationsdimensionen, entlang derer sich die Einschätzung der situativen Angemessenheit eines Verhaltens wesentlich orientiert. Sowohl der theoretische Rahmen als auch das methodische Vorgehen stützt sich dabei auf FORGAS' (1979b) Theorie der (social episodes>. «Social episodes will be defined here as cognitive representations of stereotypical interaction sequences, which are repre-
sentative for a given cultural environment» (p. 15). Wesentlich scheint dabei die Annahme, daß die individuelle Wahrnehmung und Beurteilung einer Episode (in der vorliegenden Studie: aggressive Auseinandersetzungen) von normativen konsensualen Vorstellungen innerhalb eines gegebenen Milieus determiniert sind: «There is a shared consensual representation in a given culture about what constitutes an episode and what are the norms, rules and expectations that apply» (p. 15). In ihren Studien konnten FORGAS und Mitarbeiter zeigen, daß über individuelle Ratings von Situationen mittels multivariater Methoden allgemeine kognitive Beurteilungsdimensionen von Mitgliedern eines speziellen Feldes empirisch faßbar sind (vgl. z.B. FORGAS, 1976). Dem Ansatz FORGAS' folgend, soll hier versucht werden, über Einschätzungen und Differenzierungen sozialer Situationen Rückschlüsse auf die normative Struktur eines umrissenen sozialen Systems zu ziehen. Es ist angestrebt, in enger Anlehnung an das methodische Vorgehen von FORGAS (1979b), kognitive Repräsentationsdimensionen spezifiziert für das Feld Schule und bezogen auf aggressive Interaktionen zu ermitteln. 2.
Methode
Das methodische Vorgehen erfolgt in mehreren aufeinanderfolgenden Schritten: (1) Erhebung freier Situationsschilderungen und dazugehöriger charakterisierender Adjektive; (2) Auswahl eines repräsentativen Samples von Situationsschilderungen und Adjektiven; (3) Einschätzungen der ausgewählten Episoden anhand dieser Adjektive, die bipolar skaliert wurden; (4) statistische Auswertung über die Multidimensionale Skalierung. 2.1
Erster Untersuchungsschritt
2.1.1 Versuchspersonen An der Untersuchung nahmen 57 ll-17jährige männliche und weibliche Schüler einer Hauptschule (6. Klasse) und eines Gymnasiums (8., 9. und lO.Klasse) in Münster auf Empfehlung ihrer Lehrer teil.
130
Mummendey et al.: Normativer Kontext aggressiver Interaktionen
2.1.2 Durchführung Die Untersuchungen fanden außerhalb der Unterrichtszeit statt. Nach einer kurzen Instruktion wurden den Schillern die Fragebögen mit nach Hause gegeben. Sie wurden aufgefordert, auf einem Fragebogen eine als Beteiligter oder als Beobachter selbst erlebte Situation, bei der es «zwischen zwei (oder mehreren) Personen Ärger gegeben hat», schriftlich zu schildern . Zur genauen Kennzeichnung der Episoden waren einige Fragen zu beantworten: -
Drei Fragen zu Situationskennzeichen: Zeit der Handlung, Anwesenheit von Kontrollpersonen, Anwesenheit von Zuschauern; Zwei Fragen bezüglich Normen: Was genau war falsch, wie hätte man sich besser verhalten können und warum wäre das besser? Eine FVage nach die Episode charakterisierenden Adjektiven.
2.1.3 Auswertung
undErgebnise
Das gesamte Ergebnismaterial des ersten Untersuchungsschrittes umfaßt 58 Situationsschilderungen, 93 Normen und 71 Adjektive. Episoden: 37 Episoden betreffen aggressive Interaktionen zwischen Schülern. 18 Episoden aggressives Verhalten von Lehrern gegenüber Schülern, 3 Episoden aggressives Verhalten von Schülern gegenüber Lehrern. In den Schilderungen wird von den Schülern zumeist die Perspektive eines Beobachters (N = 23) oder eines Betroffenen (N = 26) eingenommen, nur in 8 Episoden wird die Begebenheit aus der Sicht des Akteurs oder Initiators geschildert. Normen: Die 93 erhaltenen Normschilderungen wurden zunächst unter Beseitigung sprachlicher Mängel abstrakter und präziser formuliert.1 Im Hinblick auf die Verwendung im zweiten Untersuchungsabschnitt wurden die 15 breitesten Normkategorien, d.h. diejenigen, zu denen 1 Die Normen beziehen sich auf die Bereiche «Interaktionen zwischen Schülern» (z.B. Aggressives Verhalten darf nicht mit Ärger oder physischer Aggression beantwortet werden ; Schüler dürfen kleine Aggressionen nicht mit großen Aggressionen beantworten); «Interaktionen des Lehrers mit Schülern» (z.B. Der Lehrer darf Schüler nicht unnötig beleidigen, bloßstellen, einschüchtern; der Lehrer soll Schüler gerecht und unabhängig von den Einschätzungen anderer Lehrer beurteilen) und «Interaktionen von Schülern mit Lehrern » (z.B. Schüler sollen sich gegen Schikanen des Lehrers wehren; Schüler sollen Unstimmigkeiten mit Lehrern durch Diskussion klären).
die größte Anzahl von Schilderungen abgegeben wurden, ausgewählt und jeweils eine Episode ausgehend von den erhobenen Situationsschilderungen formuliert. Es resultierten (vgl. Tab. 1):
Tab. 1: Liste der verwendeten Episoden. Episode 1 A. kommt mit einer Gruppe von Mitschülern aus der Turnhalle. Er geht zum Fahrradständer. Dort steht schon B. Schüler A. glaubt, B. habe ihn vorige Stunde verpetzt. Ehe B. so recht etwas erwidern kann, haut ihm A. eine runter. Episode 2 A. trifft B. auf dem Schulhof. Er ruft: «Hey, Pelzkopf.» B. mag diesen Spitznamen gar nicht und wird wütend. Er schlägt A. mit der Faust ins Gesicht. Sie prügeln sich, bis ein Lehrer kommt und sie trennt. Episode 3 Schüler A. wird von Schüler B. geärgert. Er ist sauer und erwartet, daß B. sich entschuldigt oder wenigstens aufhört. Aber Schüler B. ärgert den A. unbeirrt weiter. Episode 4 A. hat eine Türnübung beendet. Mitschüler B. klopft ihm von hinten auf die Schulter. B. hat das anerkennend gemeint, hat aber wohl zu feste geschlagen. A. ist auf jeden Fall sauer und stellt dem B. kurze Zeit später ein Bein. Episode 5 Die Schulstunde ist zu Ende. Alle Schüler verlassen den Klassenraum. Da haut A. dem B. auf die Schulter. Ohne erstmal den A. zu fragen, warum er das gemacht hat, wirbelt B. herum und schlägt dem A. in den Magen. Episode 6 Schüler B. hat Langeweile. Er hat nichts besseres zu tun, als den A., der in ein paar Metern Entfernung steht, dauernd beim Spitznamen zu rufen. A. kocht vor Wut. Episode 7 Schüler A. sieht, wie sich B. und C. in einer Schulhofecke prügeln. Zusammen mit einem Mitschüler geht er näher heran. Er sagt: «Guck Dir mal die Spinner an!» B. hört das, geht auf A. zu und schlägt ihm wütend in den Magen. Episode 8 Im Schulbus nach der 6. Stunde: Mehrere Schüler sind vom langen, aufreibenden Schulalltag gereizt. Während die meisten sich zusammenreißen, brüllt A. vor lauter Unmut: «Scheißladen hier!» und schleudert seine Mappe quer durch den Bus, knapp am Kopf einer Mitschülerin vorbei. Episode 9 Kurz vor Stundenbeginn - alle Schüler sind in der Klasse. Nur um eine Schau abzuziehen, schlägt A. dem B. die Tasche um die Ohren, schreit ihn an und schlägt auf ihn ein.
131
Zeitschrift für Sozialpsychologie 1985,16,128-138 Episode 10 Viele Schüler stehen herum. Versehentlich schubst Schüler A. den Schüler B. Schüler A. entschuldigt sich zwar, aber B. wird handgreiflich. Episode 11 Der Deutschlehrer kommt herein und setzt sich hinter das Pult. Er nimmt das Klassenbuch, um seine Eintragungen zu machen. Beim Durchblättern stutzt er plötzlich und sagt zu A., der in der letzten Reihe sitzt: «Meine Güte, hast Du schon wieder eine Fünf in Mathematik!» Episode 12 Doppelstunde Geschichte: Zwei Schüler betreten kurz nach dem Lehrer die Klasse. Lehrer L. schimpft die beiden aus und läßt zudem für die ganze Klasse die Fünf-Minuten-Pause ausfallen. Episode 13 Lehrer L. kommt in die Klasse. Alle Schüler unterhalten sich lebhaft. Der Lehrer greift sich willkürlich drei Schüler heraus und wirft ihnen vor, sie seien die lautesten gewesen. Die drei sind ganz schön sauer. Episode 14 Deutschstunde: Schüler B. liest seinen Aufsatz vor. Lehrer L. macht eine kritische Anmerkung zu B.'s Satzbau. Der hört ihm gar nicht erst zu, sondern fährt den Lehrer an: «Sie mit Ihrem dämlich konservativen Stil.» Episode 15 Lehrer L. ist sehr beliebt. In seiner Unterrichtsstunde kommen zwei Schüler wenige Minuten zu spät. Der Lehrer ist sauer und enttäuscht; man kann es ihm die ganze Stunde lang anmerken.
10 Schilderungen normabweichenden Verhaltens zwischen Schülern, 3 Schilderungen normabweichenden Verhaltens eines Lehrers gegenüber Schülern, 2 Schilderungen normabweichenden Verhaltens von Schülern gegenüber Lehrern. Die relativen Anteile entsprechen dem frei erhobenen Material. Adjektive: Aus den erhaltenen Adjektiven konnten 12 Kategorien mit synonymen Begriffen gebildet werden. Im Hinblick auf ihre spätere Verwendung in Form von Ratingskalen genügen sie den von FORGAS (1979b) formulierten Kriterien Häufigkeit, Anwendbarkeit auf verschiedene Episoden und Trennschärfe. Aus den zwölf gebildeten Kategorien wurden jeweils zwei häufig genannte Adjektive ausgewählt, von denen schließlich dasjenige für die Konstruktion von Ratingskalen Verwendung findet, zu dem sich am
besten ein Antonym für die Konstruktion der bipolaren Skalen finden ließ. Es resultierten Skalen mit folgenden Benennungen: ungerecht rücksichtslos beleidigend unnachgiebig ungeduldig verärgert unsinnig brutal feige wichtigtuerisch verrückt selbstherrlich 2.2
gerecht rücksichtsvoll höflich nachgiebig geduldig erfreut sinnvoll sanft mutig zurückhaltend normal bescheiden
Zweiter Untersuchungsschritt
2.2.1 Versuchspersonen An der Untersuchung nahmen 80 14- 17jährige männliche und weibliche Schüler zweier Gymnasien (9. und lO.Klasse) in Münster teil. 2.2.2 Durchführung Die Untersuchungen fanden während einer von den Lehrkräften dafür freigestellten Unterrichtsstunde statt. Die Lehrer waren anwesend und übergaben den Versuchsleitern das Wort, die zunächst die Instruktion zum Ausfüllen der Bögen gaben (Erläuterungen zum Gegenstand der Untersuchung, zum Bearbeiten des Materials und zur Skalenverwendung). Das zu bearbeitende Material bestand aus 15 Blättern, in denen jeweils eine Episode geschildert war, die auf 12 bipolaren siebenstufigen Ratingskalen (mit Variationen von Polung und Reihenfolge) beurteilt werden sollte. Während der Durchführung der Untersuchung griffen die Versuchsleiter nur gelegentlich erläuternd oder zu Ruhe und ernsthaftem Bearbeiten mahnend ein. 2.2.3 Auswertung und Ergebnisse Es liegen Ratingskalen zu 80 komplett ausgefüllten Bögen vor. Zunächst wurden pro Episode
132
Mummendey et al.: Normativer Kontext aggressiver Interaktionen
und Skala Mittelwerte berechnet, die für die Dissimilaritätsmatrizen für multidimensionale Skalierung durch INDSCAL erforderlich sind. In die Auswertung gehen also Mittelwerte (über alle Versuchspersonen) und nicht einzelne Ratingdaten ein. INDSCAL: In die MDS (INDSCAL) gehen 12 Matrizen mit je 15x15 Ähnlichkeitsmaßen ein, d.h. jede der fünfzehn Episoden wird mit jeder anderen Episode hinsichtlich der einzelnen Beurteilungsskalen verglichen. Der von FORGAS et al. (1980) referierte Algorithmus zur Bestimmung von Ähnlichkeit zwischen Episoden wird zur Erstellung der Matrizen angewendet. Die Ähnlichkeitsmatrizen, die INDSCAL als Eingabe erwartet, lassen sich in Korrelationsmatrizen transformieren, wie sie die Faktorenanalyse verlangt. Laut K Ü H N (1976) weisen Faktorenanalyse und MDS in Zielsetzung und Analysetechnik Parallelen auf; die beiden Verfahren lassen sich ineinander überführen. Allerdings ist der Weg, wie bei der Faktorenanalyse durch Rotation der Achsen eine psychologisch relevante Lösung zu finden, bei INDSCAL nicht gegeben. Sowohl CARROLL & CHANG (1970) als
auch FORGAS (1981; FORGAS et al., 1980) sehen in dieser Beschränkung einen Vorteil. Sie gehen davon aus, daß die von INDSCAL gefundenen Dimensionen unmittelbar interpretierbar sind. FORGAS belegt die Annahme der direkten psychologischen Relevanz der INDSCAL-Dimensionen in verschiedenen Untersuchungen (FORGAS et al., 1980; FORGAS, 1981). Aus diesem Grund wurde einer faktorenanalytischen Verwendung der Daten die MDS (INDSCAL) vorgezogen. Es wurden die Lösungsräume für ein-, zwei-, drei-, vier- und fünfdimensionale Lösungen gerechnet. Durch Vorgabe unterschiedlicher Startkonfigurationen wurde die Stabilität der Lösungen überprüft. Mit zunehmender Dimensionalität erhöht sich die aufgeklärte Varianz folgendermaßen: 1 Dimension : .54 2 Dimensionen: .63 3 Dimensionen: .71 4 Dimensionen: .77 5 Dimensionen: nicht interpretierbar durch extrem negative Dimensionsgewichte im «subject space».
Tab. 2: Beurteilungsmittelwerte der Kreuzvalidierung über alle Versuchspersonen (N = 80) und Episoden auf den Skalen 1-12. Episode
Skala
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 M SD
1* 5.50 5.18 5.71 4.142 5.30 5.43 4.94 5.31 6.413 5.68 5.55 5.66 5.53 5.60 4.50 5.36 1.31
2** 1.88 3.30 3.31 3.36 2.29 3.25 3.34 1.96 2.83 2.00 3.28 1.99 1.843 1.96 3.782 2.71 1.35
3" 1.68 2.38 1.53 3.762 1.79 1.90 3.16 1.66 1.203 1.49 1.38 1.44 1.76 2.09 2.69 1.99 1.28
4* 4.75 4.44 4.66 4.21 4.93 4.71 4.11 4.26 4.80 4.71 4.86 4.65 5.103 3.702 4.05 4.49 1.35
5" 1.75 2.90 2.58 3.50 1.44 3.15 3.24 2.26 1.193 1.54 2.34 2.73 2.86 3.09 3.752 2.55 1.33
6" 2.19 2.20 2.13 4.362 2.50 1.85 2.80 2.95 1.73 2.04 1.343 2.49 2.09 1.89 2.82 2.36 1.35
7* 6.20 5.15 6.06 4.112 5.83 5.58 4.50 5.39 6.763 6.55 6.46 6.68 6.58 5.68 5.01 5.77 1.49
8* 6.01 5.69 6.21 4.192 5.96 6.23 5.34 6.09 6.863 6.48 6.46 6.39 5.99 5.81 5.01 5.91 1.45
Extreme Beurteilungsmittelwerte sind durch kursive Schrift gekennzeichnet 2 bedeutet: Episode mit positivster Beurteilung auf der betreffenden Skala 3 bedeutet: Episode mit negativster Beurteilung auf der betreffenden Skala Bei Skalen mit * indizieren hohe Ratingmittelwerte negative, bei Skalen mit ** indizieren niedrige Ratingmittelwerte negative Beurteilungen
9* 5.44 4.86 6.093 4.252 5.21 5.19 4.48 4.68 5.15 5.95 4.89 6.04 5.60 5.28 4.48 5.17 1.34
10** 2.40 2.91 2.75 4.262 2.55 3.04 3.26 2.29 2.50 2.19 2.58 1.96} 2.09 2.81 3.40 2.73 1.43
11* 5.08 4.03 5.30 3.212 5.33 4.88 4.01 4.93 6.283 5.38 5.15 5.45 4.98 4.75 3.76 4.83 1.69
12** 2.48 2.62 1.99 3.482.55 2.01 2.64 2.16 1.19 2.08 2.18 2.41 2.40 2.30 3.43 2.39 1.28
133
Zeitschrift für Sozialpsychologie 1985,16,128-138
Die vierdimensionale Lösung wurde ausgewählt, da sie sowohl hinsichtlich des Kriteriums (aufgeklärte Varianz> als auch dnterpretierbarkeit und Übersichtlichkeit der Lösung) (vgl. FORGAS, 1979a) zufriedenstellende Ergebnisse bringt. Während für einige andere Verfahren multidimensionaler Skalierung, z.B. PINDIS (vgl. LANGEHEINE, 1980, 1982) Normen zur Bewertung der Lösungen vorliegen, stehen für INDSCAL keine statistischen Optimierungsverfahren zur Bestimmung der «richtigen» Anzahl von Dimensionen zur Verfügung. Die Entscheidung für vier Dimensionen ist also mit einer gewissen Willkürlichkeit behaftet. Sie erscheint allerdings durch o.g. Entscheidungskriterien gerechtfertigt. Unter der Einschränkung, 23% der beobachteten Varianz nicht zu erfassen, eruiert INDSCAL somit vier näher bezeichnete Dimensionen, auf die sich (selbstverständlich aus der Perspektive der dem Verfahren zugrundeliegenden Modellvorstellungen) die Urteilsbildung der Versuchspersonen zurückführen läßt. Tabelle 2 zeigt die Beurteilungsmittelwerte und Standardabweichungen über alle Versuchspersonen und Episoden auf den Skalen 1-12; zudem sind jeweils diejenigen Episoden mit den geringsten und höchsten Ratingmittelwerten vermerkt, da diese Kennwerte zur Interpretation der Dimensionen herangezogen werden. Es zeigt sich, daß alle Urteile zum negativen Pol tendieren; näher im Bereich der Skalenmitte (4.00) liegen die Ratingmittelwerte der Skalen 4 (mutigfeige) mit einem Mittelwert von 4.49 und 11 (normal-verrückt) mit 4.83. Faßt man die negativen Pole der Skalen als Indikatoren für die Beurteilung einer Episode als «aggressiv» auf, so zeigt sich hier, daß insgesamt den Episoden eine Tendenz zur Beurteilung als aggressiv zukommt. Eine gewisse Ausnahme stellten die Beurteilungsmittelwerte der Episode 4 dar, hier sehen die Versuchspersonen vergleichsweise positives Verhalten realisiert. Auf extreme Beurteilungsmittelwerte in negativer Richtung der Skalen wird im Rahmen der Interpretation der Dimensionen eingegangen (z.B. Episode 9). Tabelle 3 zeigt Dimensionsgewichte sowohl der Skalen als auch der Episoden («subject»- und «group-space») der vierdimensionalen Lösung. Die höchsten Korrelationen der Skalen bzw. Episoden mit den Dimensionen sind:
Tab.3: Dimensionsgewichte der Skalen 1-12 und Episoden 1-15 (4dimensionale Lösung). subject space Dimensionsgewichte
Skala Nr.
1 2 3 4 5 6 7 8 9 10 11 12
Dim. 1
Dim.2
Dim. 3
Dim. 4
0.54 -.0.00 0.67 0.03 0.08 0.95 0.52 0.76 0.23 0.60 0.44 0.49
0.03 0.93 0.17 0.01 0.11 -0.02 0.26 0.10 0.43 0.50 0.60 -0.04
0.43 0.06 0.23 0.17 0.82 -0.06 0.13 0.16
0.47 0.37
0.21 0.02 0.26 0.65 0.06 0.06 0.48 0.20 0.42 0.14 0.29 0.23
-0.00 0.01
group space Episode Nr.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Skalen: Skala 1 Skala 2 Skala 3 Skala 4 Skala 5 Skala 6 Skala 7 Skala 8 Skala 9 Skala 10 Skala 11 Skala 12
Dimensionsgewichte Dim.l
Dim.2
Dim.3
Dim. 4
-0.05 0.02 -0.13 0.89
0.30 -0.24 -0.13 -0.48 0.17 -0.24 -0.22 0.23 -0.07 0.28 -0.17 0.30 0.31 0.21 -0.27
0.19 -0.19 0.06 -0.39 0.29 -0.08 -0.27 0.15 0.56 0.25 0.05 -0.02
-0.11
0.01
-0.15
0.11 0.00
-0.24 0.10 -0.22 -0.10 -0.04 -0.10 0.12 bescheiden ungeduldig rücksichtslos mutig brutal beleidigend gerecht sinnvoll nachgiebig verärgert normal wichtigtuerisch -
-0.11
-0.07 -0.42
selbstherrlich geduldig rücksichtsvoll feige sanft höflich ungerecht unsinnig unnachgiebig erfreut verrückt zurückhaltend
Dim. 1: (r = .95) (r = .76) Episode 4 (r = .89) Dim.2: (r = .93)
0.14 -0.26 0.16 0.14 -0.06 0.52 0.21 -0.27 -0.16 -0.18 -0.30 -0.40 0.28 0.28
134
Mummendey et al.: Normativer Kontext aggressiver Interaktionen
Dim.3: (r = .65) Dim.4: (r = .82) Episode 9 (r = .56) 2.3
seits. Gruppiert man dem INDSCAL-Ergebnis entsprechend die Beurteilungsdimensionen in vier Cluster (eine Clusterzahl, die sich auch aufgrund des Anstiegs des Generalisierungsgrades anbietet), so zeigt sich eine weitgehende Übereinstimmung der Ergebnisse der Untersuchungen:
Kreuzvalidierung
Zur Unterstützung der Datenauswertung durch die multidimensionale Skalierung wurde eine weitere Untersuchung mit gleicher experimenteller Prozedur mit 100 14-18jährigen männlichen und weiblichen Gymnasiasten (9. und 10. Klasse) eines weiteren Gymnasiums in Münster durchgeführt. Die Daten wurden nicht durch INDSCAL, sondern durch eine hierarchische Clusteranalyse nach dem WARDschen (1963) Kriterium der Varianzminimierung ausgewertet, um nicht nur Stichproben- sondern auch Auswertungsartefakte durch eine Kreuzvalidierung ausschließen zu können (Tab.4). Ziel ist dabei die Gruppenbildung der Beurteilungsdimensionen über Ratings der 15 Episoden. Zunächst bestätigt sich die extreme Beurteilung der Episoden 4 und 15 einerseits und 9 anderer-
INDSCAL
CA
Dim.l Skala 6 (beleidigendhöflich) Skala 8 (sinnvoll-unsinnig)
Cluster B 6 (beleidigend-höflich) 8 (sinnvoll-unsinnig) 3 (rücksichtslos-rücksichtsvoll) 7 (gerecht-ungerecht) 12 (wichtigtuerisch-zurückhaltend)
Cluster A Dim.2 Skala 2 (ungeduldig- 2 (ungeduldig-geduldig) 10 (verärgert-erfreut) geduldig) 9 (nachgiebig-unnachgiebig)
Tab. 4: Beurteilungsmittelwerte über alle Versuchspersonen und Episoden auf den Skalen 1-12 (Kreuzvalidierungsstudie). Episode
Skala 1»
2**
3"
4*
5"
6**
7*
8*
9*
10**
11*
12**
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 M SD
5.24 4.79 4.97 4.39 4.78 4.72 4.66 4.82 6.073 5.12 5.11 5.55 5.33 5.08 4.3l2 5.00 1.32
2.123 3.67 3.70 3.77 2.65 3.40 3.64 2.20 3.33 2.47 3.822 2.38 2.23 2.55 3.822 3.04 1.33
1.74 2.46 1.92 3.352 1.89 2.04 3.16 1.88 1.49 1.63 1.34* 1.63 1.84 2.41 3.01 2.12 1.40
4.53 4.23 4.17 4.32 4.10 4.67 3.82 4.06 4.86 4.42 4.68 4.48 4.903 3.352 4.02 4.31 1.42
1.73 2.82 2.74 3.32 1.70 3.13 3.11 2.59 1.193 1.67 2.67 2.94 2.83 3.30 3.762 2.63 1.35
2.46 2.13 2.23 4.132 2.63 1.84 2.93 3.15 1.79 2.34 1.56* 2.73 2.28 2.07 3.06 2.49 1.42
6.03 5.28 5.75 4.302 5.75 5.73 4.48 4.86 6.59 6.30 6.21 6.703 6.48 5.40 4.58 5.63 1.56
6.00 5.60 5.96 4.472 5.86 5.94 4.72 5.61 6.643 6.23 6.17 6.36 5.86 5.64 4.62 5.71 1.60
5.14 4.45 5.28 4.35 4.85 4.32 4.222 4.32 4.54 5.633 4.45 5.63* 5.10 5.01 4.232 4.77 1.28
2.76 3.33 3.29 4.042 3.02 3.30 3.47 2.72 2.86 2.66 1.95 2.483 2.59 2.93 3.65 3.07 1.37
4.81 4.26 4.79 3.78 4.60 5.53 4.08 4.59 6.023 4.97 4.73 5.20 4.86 4.91 3.562 4.65 1.65
2.61 2.58 2.63 3.462 2.95 2.47 3.05 2.60 1.313 2.25 2.48 2.36 2.66 2.38 3.46 2.62 1.32
Extreme Beurteilungsmittelwerte sind durch kursive Schrift gekennzeichnet 2 bedeutet: Episode mit positivster Beurteilung auf der betreffenden Skala 3 bedeutet: Episode mit negativster Beurteilung auf der betreffenden Skala Bei Skalen mit * indizieren hohe Ratingmittelwerte negative, bei Skalen mit ** indizieren niedrige Ratingmittelwerte negative Beurteilungen
Zeitschrift für Sozialpsychologie 1985,16,128-138
11 (normal-verrückt) 1 (bescheiden-selbstherrlich) Cluster C Skala 4 (mutig-feige) 4 (mutig-feige) Cluster D Dim.4 5 (brutal-sanft) Skala 5 (brutalsanft) Dim.3
Es zeigt sich, daß die Skalen mit den jeweils höchsten Dimensionsgewichten (Dim. 1: Skala 6; Dim.2: Skala2; Dim.3: Skala4; Dim.4: Skala5) in jeweils eines der entstehenden Cluster fallen; hier resultiert also eine vollkommene Entsprechung der Ergebnisse, so daß die INDSCAL-Ergebnisse bezüglich der primär charakterisierenden Beurteilungsdimensionen unterstützt werden. Da im Gegensatz zur INDSCAL-Auswertung, deren Ziel die Identifizierung charakterisierender Skalen ist, durch die Clusteranalyse sämtliche Skalen gruppiert werden, finden sich in einigen Clustern (A und B) weitere Skalen, die zur Charakterisierung der INDSCAL-Dimensionen nicht herangezogen werden. Dieses Ergebnis ist allerdings nicht als Diskrepanz zwischen Clusteranalyse und Multidimensionaler Skalierung anzusehen, sondern muß als verfahrensbedingt betrachtet werden. Eine Clusteranalyse über die Daten der ursprünglichen Untersuchung und eine INDSCALAuswertung der zunächst in die Clusteranalyse eingegangenen Daten erbringen eine Bestätigung der hier referierten Ergebnisse. 3.
Diskussion
Die Auswertung der Daten zeigt, daß die Urteile über die Episoden sinnvoll auf vier Dimensionen reduziert werden können. Die Dimensionen können durch Skalen gekennzeichnet werden, die ein hohes Dimensionsgewicht aufweisen. Die Adjektivpaare beziehen sich auf voneinander abgrenzbare qualitativ unterschiedliche Beurteilungsaspekte. Zur Interpretation der inhaltlichen Bedeutung der Dimensionen wird auch auf das in der ersten Untersuchungsphase erhobenen Material zurückgegriffen, da die Adjektive dort zur Kennzeichnung der geschilderten Episoden gewählt wurden. Die Betrachtung wird für alle in-
135 nerhalb einer Dimension als relevant angesehenen Aspekte durchgeführt, wodurch sich ein zumeist breit variierendes Bild des mit den Begriffen verknüpften Ereignisses ergibt. Als weitere Möglichkeit, die das Aggressionsurteil leitenden Dimensionen näher zu benennen, werden für jede Dimension die hochkorrelierenden Skalen herausgegriffen und für jede Skala diejenige Episode bestimmt, in der das Verhalten des Akteurs von den Versuchspersonen extrem negativ beurteilt wird. Charakteristika dieser Episode können zur näheren Kennzeichnung der entsprechenden Dimensionen herangezogen werden. Dieser Weg, weitere Dimensionsetikettierungen zu erhalten, sollte allerdings mit Vorbehalten betrachtet werden. Immerhin konstruiert INDSCAL den «group-space»; eindeutig einzelne Dimensionen kennzeichnende Episoden lassen sich also gegebenenfalls entnehmen. Wenn der «group-space» nur vereinzelt solche Episoden nennt, heißt das also: Es existieren nur wenige Geschichten, die auf einer Dimension eine hohe und den drei übrigen Dimensionen nur minimale Ausprägungen haben. Dimension 1 ist durch die Skalen beleidigend-höflich) und mit gekennzeichnet. Der Begriff taucht im Zusammenhang mit einer Episode auf, in der geschildert wird, daß ein Schüler dauernd beim Spitznamen gerufen wird. Das Adjektiv (bzw. Synonyma) dient zur Charakterisierung von Episoden, in denen Personen in nicht nachvollziehbarer, unerwarteter oder als überflüssig erachteter Weise Auseinandersetzungen verursachen, z.B. durch Provokation, Bloßstellungen, Rempeleien oder auch unsinnige schulorganisatorische Regelungen. Extremwerte auf der Skala beleidigend-höflich) wurden zur Episode 11 vergeben; d.h. alle anderen Episoden sind auf dieser Skala positiver bewertet. Die Bezeichnungen beleidigend> und können unter Einbeziehung dieser Episode folgendermaßen inhaltlich gefüllt werden: Eine Person unterbricht ihr vom situativen Kontext her zu erwartendes und zuvor gezeigtes Verhalten, um eine andere mit einer wohlüberlegten, taktlosen Anklage abzuwerten oder sonstwie zu schädigen. Der Betroffene muß die Beleidi-
136
Mummendey et al.: Normativer Kontext aggressiver Interaktionen
gung oder Beeinträchtigung ohnmächtig über sich ergehen lassen. Auf der Dimension 2 hat die Skala besonders hohes Dimensionsgewicht. Mit werden zwei Schilderungen gekennzeichnet, in denen jemandem nicht genügend Zeit für eine Meinungsäußerung gegeben wird. Anhand der Episode mit extremsten Urteilen auf der Skala mit höchsten Dimensionsgewichten (Episode 13) läßt sich folgende charakteristische Episode beschreiben. Ein Lehrer kommt in die Klasse, während sich alle Schüler lebhaft unterhalten. Er greift sich willkürlich drei Schüler heraus und wirft ihnen vor, sie seien die lautesten gewesen. Für die Dimension 3 ist die Skala (feige-mutig) bedeutsam. In den Schilderungen wird der Begriff im Zusammenhang mit einem Ausnutzen von Gutmütigkeit, dem Wählen des leichtesten Weges sowie einem Ausweichen einer Auseinandersetzung mit einer Person höheren Status' gebraucht. Die Episode mit extremen Urteilen auf der Skala mit höchstem Dimensionsgewicht (4) ist wieder Episode 13 (wie für Dimension 2). Eine Lehrerperson macht Schülern spontan einen unbesonnenen, ungerechtfertigten Vorwurf. Die Betroffenen sind aufgebracht. Dieses Verhalten wird also sowohl als extrem feige als auch als extrem ungeduldig bezeichnet. Spontane, scharfe Vorwürfe gelten hingegen als mutig, wenn ein Schüler sich damit gegen eine Autoritätsperson zur Wehr setzt. Die Skala hat mit der Dimension 4 die höchste Korrelation. In den als gekennzeichneten Episoden ist das Erleben von Hilflosigkeit und Kontrollverlust vorherrschend (lediglich eine Episode beinhaltet Sachbeschädigungen). Der Begriff bezieht sich demnach weniger auf physische als vielmehr psychische Beeinträchtigungen. Auffällig ist, daß sich über die Zuordnung von Episoden kein deutlicher Zusammenhang von Brutalität und physischem auf andere Personen gerichtetem aggressivem Verhalten zeigt. In der zweiten Untersuchungsphase hat allerdings diejenige Episode den höchsten Mittelwert auf der Skala , in der ein physischer Angriff eines Schülers auf einen Mitschüler
berichtet wird. Dieser Widerspruch zwischen den Ergebnissen der beiden Untersuchungsphasen läßt sich jedoch aufklären: Gerade wenn aus Schülersicht ein enger Zusammenhang von physischen Aggressionen quasi als gelten, ist es einsichtig, daß dieses Adjektiv nicht mehr zur besonderen Kennzeichnung solcher Episoden verwendet wird, sondern implizit darin eingeht. Auf der Basis relativ weniger Situationsschilderungen ist es allerdings nur schlecht möglich, weiterführende Aussagen zur Bedeutung der die Dimension kennzeichnenden Adjektive zu machen. Insbesondere bezüglich der zu Dimension 3 gemachten Aussagen sind deutliche Vorbehalte gegeben. Beide zur Kennzeichnung der Dimension herangezogenen Skalen haben einen Mittelwert nahe der Skalenmitte bei nur schwacher Streuung, d.h. sie differenzieren nur gering zwischen den zu Beurteilung vorgelegten Episoden. Daß INDSCAL Skalen konstruiert, für die es keine typischen Episoden (und/oder Skalen) angibt, sagt allerdings nichts über die Qualität der Lösung aus. Das Ziel des Verfahrens liegt anderswo, nämlich im gering-dimensionalen Raum die Episoden so anzuordnen, daß ihre Abstände voneinander den (Un-)Ähnlichkeitsmaßen der Eingabedaten mit möglichst geringem Fehler gerechnet werden. Wenn die meisten Episoden nennenswerte Gewichte auf drei oder allen vier Dimensionen aufweisen, so heißt das, daß diese Dimensionen in ihrem Zusammenwirken für die Bildung des Aggressionsurteils bei den meisten Episoden verantwortlich sind. Gruppieren sich die Episoden (durch INDSCAL) zu einer Punktwolke ohne (Ausreißen auf den Dimensionsachsen, so kann der Lösungsraum durchaus befriedigend sein (das Qualitätsmaß liefert die aufgeklärte Varianz); schwierig d.h. eine Interpretation erfordernd - ist allein die Benennung der Dimensionen. Zur Höhe der in den Episoden insgesamt beurteilten Normabweichung sind noch einige Anmerkungen zu machen: Es gibt eine Episode, die von den Versuchspersonen besonders positiv (Episode 4), und eine (Episode 9), die auffallend negativ auf allen Skalen bewertet wird. Die Episoden werden deutlich unterschiedlich beurteilt. Dies ist insofern nicht verwunderlich, als die Instruktion zur Erhebungsphase selbsterlebter aggressiver Interaktio-
Zeitschrift für Sozialpsychologie 1985,16,128-138
137
nen (erster Untersuchungsabschnitt) kein bestimmtes Maß an Normabweichung bzw. Aggressivität vorgab. Bei der Zusammenfassung der 58 geschilderten Ereignisse zu 15 repräsentativen wurden keine korrigierenden oder nivellierenden Veränderungen vorgenommen. Die Spannweite im Aggressionsurteil dürfte deshalb das Spektrum der ursprünglich geschilderten Episoden widerspiegeln. Die Ergebnisse belegen die Relevanz des Beurteilungskriteriums «Normabweichung» im Hinblick auf den Bewertungsprozeß in aggressiven Interaktionen und beschreiben Eigenschaftsdimensionen, die die Beurteilung eines Verhaltens als situativ-normativ abweichend leiten. Im Hinblick auf die Konzeption von Aggression als kontextabhängigem Beurteilungsprädikat (MUMMENDEY et al., 1982) liefert die vorliegende Untersuchung Ergebnisse, die zwar feldspezifisch sind, sich aber auf andere soziale Systeme durchaus übertragen lassen oder Anhaltspunkte für die Suche nach analogen Regulationsprozessen liefern. In mehreren Studien konnte die Relevanz des Bestimmungsstückes «Normabweichung» für allgemeine und schultypische feindselige Auseinandersetzungen
(BORNEWASSER
et
al.,
1982) für die Beurteilungsdivergenz zwischen A k t e u r u n d B e t r o f f e n e m (MUMMENDEY, LINNEWEBER & LÖSCHPER, 1 9 8 4 ) f ü r d e n V e r l a u f a g g r e s s i v e r I n t e r a k t i o n e n (MUMMENDEY, LÖSCHPER, LINNEWEBER & BORNEWASSER, 1 9 8 4 ) i m Z u -
sammenhang mit weiteren Beurteilungskriterien (Intention und Schaden) aufgezeigt werden. In Übereinstimmung mit verschiedenen anderen A u t o r e n ( z . B . DERIDDER, 1 9 8 3 ; FERGUSON et a l . , 1983; RULE & FERGUSON, 1 9 8 3 ) , d i e s i c h g e g e n -
wärtig im Kontext sozialpsychologischer Aggressionsforschung mit Beurteilungs- und Bewertungsprozessen beschäftigen, belegt die vorliegende Studie die Relevanz des Beurteilungskriteriums Normabweichung und liefert Hinweise für eine differenziertere Betrachtung.
Literatur ARGYLE, M . , FURNHAM, A . & GRAHAM, J . A . 1 9 8 1 .
Social
situations. London: Cambridge University Press. ARGYLE, M . , GRAHAM, J . A . , CAMPBELL, A . & WHITE, P .
1979. The rules of different situations. New Zealand Psychologist, 8 , 1 3 - 2 2 .
Social psychology and intergroup relations. London: Academic Press.
BILLIG, M . 1 9 7 6 .
BORNEWASSER, M . , MUMMENDEY, A . , LÖSCHPER, G . & LIN-
NEWEBER, V. 1982. Aggressive Interaktionen und normativer Kontext: Einflüsse differentieller Normverletzungen auf das Aggressionsurteil. Zeitschrift für Entwicklungspsychologie und pädagogische Psychologie, 14, 308-323. BROWN, R.C. & TEDESCHI, S . T . 1976. Determinants of perceived aggression. Journal of Social Psychology, 100,7787. CARPENTER, B. &DARLEY, J . M . 1978. A naive psychological
analysis of counteraggression. Personality and Social Psychology Bulletin, 4 , 6 8 - 7 2 . CARROLL, J . D . & CHANG, J . J . 1970. Analysis of individual
differences in multidimensional scaling via N-way generalization in «Eckart-Young» decomposition. Psychometrika, 35, 283-319. D E RIDDER, R . 1983. Normative considerations in the study of human aggression: Labeling and attribution of (harmful) behavior. Paper presented at the 2nd European ISRA Conference, Zeist, The Netherlands, September, 26.-30., 1983. D A GLORIA, J. & D E RIDDER, R . 1977. Aggression in dyadic interaction. European Journal of Social Psychology, 7, 189-219. FERGUSON, T . J . , RULE, B . G . &OLTHOF, T . 1 9 8 3 . A c o g n i t i v e -
attributional analysis of aggression in children and adults. Paper presented at the 2nd European ISRA Conference, Zeist, The Netherlands, September, 26.-30., 1983. FORGAS, J.P. 1976. The perception of social episodes: Categorial and dimensional representations in two different social milieus. Journal of Personality and Social Psychology, 34, 199-209. FORGAS, J . P . 1979a. Multidimensional scaling: A discovery method in social psychology. In: Ginsburg, G.P. (Ed.): Emerging strategies in social psychological research. New York: Wiley, 253-288. FORGAS, J.P. 1979b. Social episodes. The study of interaction routines. London: Academic Press. FORGAS, J. P. 1981. Social episodes and group milieu: A study in social cognition. British Journal of Social Psychology, 20, 219-230. FORGAS, J.P. 1982. Episode cognition: Internal representations of interaction routines. In: Berkowitz, L. (Ed.): Advances in experimental social psychology, Vol.15. New York: Academic Press, 59-101. FORGAS, J . P . , BROWN, L . B . & MENYHART, J . 1 9 8 0 . D i m e n -
sions of Aggression: The perception of aggressive episodes. The British Journal of Social and Clinical Psychology, 19, 2 1 5 - 2 2 7 . FRACZEK, A. 1974. Informational role of situation as a determinant of aggressive behavior. In: DeWit, J. & Hartup, W.W. (Eds.): Determinants and origins of aggressive behavior. The Hague: Monton, 225-229. GOULDNER, A.W. 1960. The norm of reciprocity: A preliminary statement. American Sociological Review, 25, 161178. KANE, T . R . , JOSEPH, J . M . & TEDESCHI, J . T . 1 9 7 6 . P e r s o n
perception and the Berkowitz Paradigm for the study of aggression. Journal of Personality and Social Psychology, 33,663-673. KANE, T . R . , JOSEPH, J . M . &TEDESCHI, J . T . 1 9 7 7 . P e r c e i v e d
freedom, aggression and responsibility and assignment of
138
Mummendey et al.: Normativer Kontext aggressiver Interaktionen
punishment. The Journal of Social Psychology, 103,257263. KUEHN, W. 1976. Einführung in die multidimensionale Skalierung. München/Basel: Ernst Reinhardt Verlag. LAGERSPETZ, K . M . & WESTMAN, M . 1980. M o r a l approval
of aggressive acts: A preliminary investigation. Aggressive Behavior, 6, 119-130.
LANGEHEINE, R. 1980. Erwartete Fitwerte für Zufallskonfigurationen in PINDIS. Zeitschrift für Sozialpsychologie, 11,38-49. LANGEHEINE, R. 1982. Statistical evaluation of measures of fit in the Lingoes-Borg procrustean individual differences scaling. Psychometrika, 47, 421-442. LÖSCHPER, G . , MUMMENDEY, A . , LINNEWEBER, V. & B O R N E WASSER, M . 1984. The judgement of behavior as being aggressive and sanctionable. European Journal of Social Psychology, 14, 391-404. MUMMENDEY, A. 1982. Zum Nutzen des Aggressionsbegriffs für die psychologische Aggressionsforschung. In: Hilke, R. & Kempf, W. (Hrsg.): Naturwissenschaftliche und kulturwissenschaftliche Perspektiven der Aggressionsforschung. Bern: Huber, 3 1 7 - 3 3 3 . MUMMENDEY, A . , BORNEWASSER, M . , LÖSCHPER, G . & LIN-
NEWEBER, V. 1982. Aggressiv sind immer die anderen. Plädoyer für eine sozialpsychologische Perspektive in der Aggressionsforschung. Zeitschrift für Sozialpsychologie, 13, 177-193. MUMMENDEY, A . , LINNEWEBER, V. & LÖSCHPER, G .
1984.
Actor or victim of aggression: Divergent perspectives - divergent evaluations. European Journal of Social Psychology, 14, 2 9 7 - 3 1 1 . MUMMENDEY, A . , LÖSCHPER, G . , LINNEWEBER, V. & BORNE-
WASSER, M. 1984. Social-consensual conceptions about the progress of aggressive interactions in the school. European Journal of Social Psychology (in prep.).
A.N. & TEDESCHI, J . T . 1976. Competitive behavior and perceived aggression. Perceptual and Motor Skills, 42, 181-186.
RIVERA,
RULE, B . G . & FERGUSON, T . J . 1984. Developmental issues in
attribution, moral judgement and aggression. In: Kaplan, R.M., Konecni, V. J. ÄNovacl, R. W. (Eds.): Aggression in children and youth. The Hague, The Netherlands: Martinus Nijhof, 138-161. RULE, B . G . & NESDALE, A . R . 1974. Differing f u n c t i o n s of
aggression. Journal of Personality, 42, 467-481. 1984. A social psychological interpretation of human aggression. In: Mummendey, A. (Ed.): Social psychology of aggression: From individual behavior towards social interaction. New York: Springer, 5-20.
TEDESCHI, J . T .
TEDESCHI, J . T . , GAES, G . G . & RIVERA, A . N . 1 9 7 7 . A g g r e s -
sion and the use of coercive power. Journal of Social Issues, 33, 101-125. TEDESCHI, J . T . , SMITH, R . B . & BROWN, R . C . 1 9 7 4 . A r e i n t e r -
pretation of research on aggression. Psychological Bulletin, 81, 540-562. WALSTER, E . , BERSCHEID, E . & WALSTER, G . W . 1 9 7 6 . N e w
directions in equity research. In: Berkowitz, L. (Ed.): Advances in Experimental Social Psychology, Vol.9. New York: Academic Press, 1-42. WARD, H.H. 1963. Hierarchical grouping to optimize an objective function. Journal of the American Statistical Association, 58, 2 3 6 - 2 4 4 . ZILLMANN, D . & CANTOR, J . R . 1976. E f f e c t of timing of in-
formation about mitigating circumstances on emotional responses to provocation and retaliatory behavior. Journal of Experimental Social Psychology, 12, 38-55. ZILLMANN, D . , BRYANT, J . , CANTOR, J . R . & DAY,
K.D. 1975. Irrelevance of mitigating circumstances in retaliatory behavior at high levels of excitation. Journal of Research in Personality, 9, 282-293.
w L
i
139
Zeitschrift für Sozialpsychologie 1985,16,139-148
Zur Überprüfung des Bogus-Pipeline-Paradigmas: Verhaltens-Bericht und Verhaltens-Bewertung in vier Bereichen sozialen Verhaltens* HANS DIETER MUMMENDEY & HEINZ-GERD BOLTEN Universität Bielefeld In vier Experimenten werden Verhaltens-Berichte und Verhaltens-Bewertungen unter Bogus-Pipeline- und Papier-Bleistift-Bedingungen miteinander verglichen. Während für den Verhaltensbereich «Strassenverkehrsverhalten» unter Bogus-Pipeline-Bedingungen Verhaltens-Berichte modifiziert werden, sind entsprechende Modifikationen beim Thema «Frauenfeindliches Verhalten» für die Verhaltens-Bewertungen zu beobachten. Für sexuelles und aggressives Verhalten läßt sich kein Bogus-Pipeline-Effekt nachweisen. Die Ergebnisse werden unter dem Gesichtspunkt der relativen Stärke sozialer Verhaltenserwartungen diskutiert.
In four experiments behavior reports are compared with behavior evaluations, both under bogus-pipeline and paperpencil conditions. For road traffic behavior, behavior reports are modified under bogus-pipeline conditions but for behavior which is directed against women's interests, behavior evaluations are modified in the bogus-pipeline situation. No bogus-pipeline effects could be demonstrated with respect to sexual and aggressive behavior. The results are discussed under the aspect of social norm strength in different areas of social behavior.
1.
ment an deutschen Versuchspersonen zeigen, daß «Türken» unter BPL-Bedingungen wesentlich ungünstiger beurteilt werden als unter PapierBleistift-Bedingungen, unter denen sie ebenso gut abschneiden wie «Deutsche». Auch die Literaturübersicht von BRACKWEDE (1980) erbrachte in der überwiegenden Zahl experimentelle Belege für die Leistungsfähigkeit des BPL-Verfahrens. Eine besondere Bedeutung haben BPL-Experimente im Rahmen der Impression-ManagementTheorie erhalten; so zeigten TEDESCHI & ROSENFELD (1981), daß Einstellungsänderungen der von FESTINGER & CARLSMITH (1959) postulierten Art in der Forced-Compliance-Situation dann ausbleiben, wenn die Einstellungsmessung unter BPL-Bedingungen vorgenommen wird. Die Autoren vertreten die Auffassung, daß die von den Dissonanztheoretikern aufgezeigten Einstellungsänderungen nur dann geäußert werden, wenn die Vpn beim VI den Eindruck von Konsistenz erzeugen wollen. Trotz einer offensichtlichen Vielzahl von Belegen für die Brauchbarkeit des BPL-Verfahrens als Forschungsinstrument ist die Antwort auf die Frage nach dem «Wie» des Funktionierens der Methode bis heute offen. So wurde von Anbeginn diskutiert, ob es statt der erwarteten Reduk-
Problemstellung
Anfang der siebziger Jahre stellten JONES & SiGALL (1971) ein experimentalpsychologisches Paradigma - das Bogus-Pipeline (BPL)-Paradigma - vor, mittels dessen Tendenzen von Versuchspersonen, sozial erwünscht zu antworten, verringert werden sollten. Dem BPL-Paradigma liegt die Annahme zugrunde, daß eine Vp dann eher auf beschönigte Antworten verzichtet, wenn sie an eine Apparatur angeschlossen ist, die scheinbar Einstellungen physiologisch exakt messen kann. Beispielsweise gelang es SIGALL & PAGE ( 1 9 7 1 ) aufzuzeigen, daß weiße Vpn Farbige dann erheblich negativer einschätzen, wenn ihre Einstellungen in Gegenwart einer entsprechenden Versuchsapparatur gemessen werden als wenn die Einstellungsmessung in traditioneller Manier erfolgt. MUMMENDEY, BOLTEN & ISERMANN-GERKE (1982) konnten in einem vergleichbaren Experi-
* Die Autoren danken Frau Dipl.-Psych. MARGRET ISERund Herrn B E R N D SCHELP für ihre Mitarbeit als Versuchsleiter. Diese Arbeit wurde durch eine Sachbeihilfe der Deutschen Forschungsgemeinschaft (Mu 597/1-2) finanziell unterstützt. MANN-GERKE
Mummendey & Bolten: Bogus-Pipeline-Paradigma
140 tion von Beschönigungs- oder Verfälschungstendenzen unter BPL-Bedingungen nicht einfach zu einem «negative bias» kommt, oder ob die BPLInstruktion bei der Versuchsperson nicht einfach die affektive gegenüber der kognitiven Einstellungskomponente hervorhebe, so daß der Antwortende sich z.B. darauf einstelle, gewissermaßen «es-haft» zu reagieren (JONES & SIGALL, 1971). Unklar ist auch, ob das BPL-Paradigma wie ursprünglich angenommen - eher die bei jeder Einstellungsmessung zu erwartenden Tendenzen, sozial erwünscht zu antworten, abschwächt oder eher - wie z.B. durch QUIGLEYFERNANDEZ & TEDESCHI (1978) nahegelegt - ein Verfahren der «Lügendetektion» (genauer: «Lügenmodifikation») darstellt, in dem Verfälschungen von Berichten über eigenes, tatsächlich aufgetretenes Verhalten verringert werden können. Denkbar wäre auch, daß in der BPL-Situation sowohl Einstellungs-Urteile als auch Verhaltens-Berichte modifiziert werden; in diesem Falle fände unter BPL-Bedingungen sowohl eine Reduktion von Tendenzen «sozial erwünschter» Einstellungsäußerung als auch eine Art «Lügendetektion» statt. In dem Bemühen, die Frage «Social-Desirability-Reduktion oder Lügendetektion?» experimentell zu entscheiden, sollen vier Experimente geplant und ausgeführt werden. Innerhalb jedes dieser Experimente soll für jeden der untersuchten Verhaltensbereiche entschieden werden, ob in der BPL-Situation a) Einstellungsänderungen (im Sinne einer Reduktion von Tendenzen der «sozialen Erwünschtheit») stattfinden, b) Angaben über Verhaltensweisen verändert werden (im Sinne von «Lügendetektion»), c) sowohl Einstellungsänderungen als auch Verhaltensberichtänderungen auftreten (d.h., sowohl a als auch b treffen zu) oder d) weder Reduktionen der «sozialen Erwünschtheit» noch «Lügendetektion» stattfinden (d.h., weder a noch b treffen zu, und das BPL-Paradigma wäre invalidiert).
2.
Versuchsplan und Hypothesen
Um zu überprüfen, welche Erklärung für die möglicherweise auftretenden BPL-Effekte zutrifft, sollen die Vpn in allen vier Experimenten angeben, wie sie bestimmte Verhaltensweisen bewerten (Einstellungsmessung), und inwieweit sie
diese Verhaltensweisen selbst ausüben (Verhaltensbericht). In allen Fällen werden die Angaben der Vpn sowohl unter einer BPL-Bedingung als auch unter einer Kontrollbedingung (Paper-Pencil-Bedingung; PP) erhoben. Berücksichtigt man noch die Reihenfolge, in der Verhaltens-Bewertung und Verhaltens-Bericht erfolgen und variiert diese systematisch, so ergeben sich die folgenden acht Bedingungskombinationen: I. II. III. IV. V. VI. VII. VIII.
BPL-Verhalten BPI^Bewertung BPL-Verhalten BPL-Bewertung PP-Verhalten PP-Bewertung PP-Verhalten PP-Bewertung
BPL-Bewertung BPL-Verhalten PP-Bewertung PP-Verhalten BPL-Bewertung BPL-Verhalten PP-Bewertung PP-Verhalten
Entsprechend den genannten Überlegungen zur Erklärung von BPL-Effekten lassen sich nun vier alternative, sich wechselseitig ausschließende Annahmen formulieren: Hypothese 1 («SD-Annahme»): In der BPL-Situation werden im Unterschied zur PP-Situation Tendenzen der «sozialen Erwünschtheit» reduziert. (Es werden Unterschiede erwartet zwischen BPL-Verhaltensbewertungen und PP-Verhaltensbewertungen, nicht jedoch zwischen BPLVerhaltensberichten und PP-Verhaltensberichten.) Hypothese 2 («LD-Annahme»): In der BPL-Situation findet im Unterschied zur PP-Situation eine «Lügendetektion» statt. (Es werden Unterschiede erwartet zwischen BPL-Verhaltensberichten und PP-Verhaltensberichten, nicht jedoch zwischen BPL-Verhaltensbewertungen und PP-Verhaltensbewertungen.) Hypothese 3: Die SD-Annahme und die LD-Annahme treffen beide gleichermaßen zu. (Es werden Unterschiede erwartet sowohl zwischen BPL-Verhaltensberichten und PP-Verhaltensberichten als auch zwischen BPL-Verhaltensbewertungen und PP-Verhaltensbewertungen.) Hypothese 4: Weder die SD-Annahme noch die LD-Annahme treffen zu. (Es werden keine Unterschiede erwartet zwischen den BPL- und den PP-Verhaltensberich-
141
Zeitschrift für Sozialpsychologie 1985,16,139-148
ten und zwischen den BPL- und PP-Verhaltensbewertungen.) 3.
3.1
Versuchsbedingungen und Versuchsablauf
Durchführung
In allen nachfolgend berichteten Experimenten ist die Bogus-Pipeline (BPL)-Bedingung identisch mit der bei MUMMENDEY et al. ( 1 9 8 2 ) beschriebenen «BPL-Neu»-Bedingung (nähere Beschreibungen siehe dort, p.306). Die Vp sitzt an einem Mikrocomputer und ist durch zwei Armmanchetten scheinbar mit dem Gerät verbunden. Zu Beginn des Versuchs, in der «Überzeugungsphase», antwortet die Vp auf einer siebenstufigen Beurteilungsskala auf vier unverfängliche Feststellungen, die gleichen, die sie vor Beginn des Experiments schon einmal beantwortet hatte. Die erneute Darbietung der Feststellungen wird mit einer notwendigen Einregulierung des Gerätes begründet. Durch eine unbemerkte Manipulation des Versuchsleiters an dem Mikrocomputer gibt dieser als «Einstellungsmessung» der ersten Messung weitgehend ähnliche Daten wieder. Nachdem somit für die Vp deutlich ist, daß die Apparatur weitgehend richtige Werte mißt, erhält sie für den weiteren Versuchsablauf die Instruktion, bei abgedeckter Meßanzeige vorherzusagen, welche Werte das Gerät bei den nachfolgenden Messungen anzeigen werde, angeblich um herauszufinden, wie gut jemand sich selbst kenne. Diese Schätzungen der Vp werden vom VI aufgezeichnet. In der Paper-Pencil (PP)-Bedingung bittet der VI die Vp anzugeben, wie sie die dargebotenen, identischen Stimuli beurteilt, ohne daß irgendeine physiologische Messung vorgetäuscht wird (vgl. MUMMENDEY et al., 1 9 8 2 , p.304). Die Vpn werden per Zufall einer der oben aufgeführten acht Bedingungskombinationen zugeordnet. Unter der Bedingung «Verhaltensbericht» soll die Vp auf einer siebenstufigen Skala angeben, inwieweit sie die betreffende Verhaltensweise selbst ausübt (-3 = die Verhaltensweise wird nie gezeigt; + 3 = die Verhaltensweise wird bei jeder sich bietenden Gelegenheit gezeigt). Unter der Bedingung «Verhaltensbewertung» erfolgt eine Bewertung der betreffenden Verhal-
tensweise auf einer siebenstufigen Skala (-3 = sehr negativ; + 3 = sehr positiv). Alle Vpn werden vor der Abgabe ihrer Urteile auf potentielle Diskrepanzen zwischen Einstellungen und Verhaltensweisen hingewiesen (z.B. daß man Verhaltensweisen ausüben kann, die man gleichwohl sehr negativ bewertet). Die Teilnahme am Experiment wird mit DM 7 , - vergütet.
3.2
Nachbefragung
Im Anschluß an jedes der Experimente werden die Vpn schriftlich nach einigen persönlichen Daten und ihrer Vorerfahrung als Vp in psychologischen Experimenten befragt. Ferner soll jede Vp angeben, ob die Untersuchung ihrer Meinung nach zu wissenschaftlichen Fortschritten führe, was wohl durch sie herausgefunden werden solle, aus welchen Gründen die Vp an der Untersuchung teilnehme und - sofern sie eine BPL-Messung absolviert hat - wie zuverlässig die Apparatur sei und welche Anschaffungskosten wohl angefallen seien.
3.3 Aufklärung der Vpn Nach Beendigung einer Experimentalserie werden die Vpn schriftlich über die Zielsetzung des Versuchs unterrichtet, und es wird ein Termin für ein Gespräch über das Experiment angeboten.
4.
Auswertung
Alle Experimente werden wie folgt ausgewertet: Alle Verhaltens-Bericht-Daten, die unter der BPL-Bedingung erhoben werden (also unter den Bedingungskombinationen IV, V, VII und VIII), werden zusammengefaßt und mit allen Verhaltens-Bericht-Daten der PP-Bedingung (Bedingungskombinationen I, II, III und VI) verglichen. Analog wird mit den Verhaltens-Bewertung-Daten verfahren. Somit kann über die jeweiligen Differenzen zwischen BPL und P P mit dem t-Test für unabhängige Stichproben entschieden werden.
142 5.
Mummendey & Bolten: Bogus-Pipeline-Paradigma
Experimentelle Ergebnisse
5.1 Experiment 1: Straßenverkehrsverhalten Aufgrund einer Durchsicht verkehrspsychologischer Literatur und einer Voruntersuchung an 100 studentischen Vpn wurden 13 Straßenverkehrsverhaltensweisen ausgesucht, die einerseits relativ häufig gezeigt werden, andererseits aber als unerwünscht gelten oder mit Strafe bedroht sind (vgl. Tab. 1 ) . C R O N B A C H ' S alpha-Wert dieser Skala des Straßenverkehrsverhaltens beträgt 0.80 (Verhaltens-Bericht) bzw. 0.72 (VerhaltensBewertung). Die 13 Verhaltensweisen wurden 80 männlichen Autofahrern (39 Schüler eines Kollegs, 36 Ingenieurstudenten, 15 Sonstige; Durchschnittsalter 24,3 Jahre) unter den acht verschiedenen Bedingungskombinationen zur Beurteilung gegeben. Pro Versuchsperson wurde ein «Verhaltenswert» und ein «Bewertungswert» gebildet. Der «Verhaltenswert» besteht aus der Summe der Ratings der Verhaltensberichte über alle Items hin-
weg, analog dazu besteht der «Bewertungswert» aus der Summe der Verhaltensbewertungen (max./min. Wert für beide Skalen ist ± 39). Mittels t-Test wurde geprüft, ob die Vpn, die ihre Verhaltensberichte unter der BPL-Bedingung abgegeben hatten, sich in ihren «Verhaltenswerten» von denjenigen unterschieden, die ihre Verhaltensberichte unter der PP-Bedingung abgegeben hatten. Entsprechend wurde für den «Bewertungswert» verfahren. Die Ergebnisse sind in Tabelle 2 aufgeführt und in Abbildung 1 graphisch dargestellt. Während sich für den Verhaltenswert ein signifikanter Unterschied zwischen der BPL- und der PP-Bedingung ergibt (der entsprechende Omega2-Wert beträgt 0.12), kann für den Bewertungswert kein Unterschied statistisch abgesichert werden. Danach erfährt Hypothese2 empirische Unterstützung, d.h., die «Lügendetektions»-Annahme wird nahegelegt.
Score
Tab. 1: Liste der Straßenverkehrs- Verhaltensweisen (in Klammern Item-Test-Korrelationen für Verhaltens-Bericht und Verhaltens-Bewertung; n = 100).
-3 .
1. wenig übersichtliche Kurven schneiden (.42, .31) 2. als Rechtsabbieger sich nicht nach Fahrradfahrern umschauen (.36, .32) 3. bei Kolonnenfahrten dicht auffahren, damit kein Überholer in die Lücke schlüpft (.40, .08) 4. kurz vor einer Bergkuppe zum Überholen ansetzen (.46, .35) 5. nachts auf einer kurvenreichen Straße mit 120 km/h fahren (.43, .34) 6. auf notorische Linksfahrer dicht auffahren, um sie zum Freigeben der Überholspur zu veranlassen (.47, .33) 7. im Stadtverkehr ständig die Fahrspur wechseln, um schneller vorwärts zu kommen (.49, .40) 8. trotz «Überholverbotsschild» und durchgezogenem Mittelstreifen überholen (.36, .36) 9. bei dem Warnzeichen «Vorsicht Schulkinder» mit unverminderter Geschwindigkeit weiterfahren (.50, .33) 10. auf den Vordermann dicht auffahren, damit man überholen kann, sobald sich eine Gelegenheit ergibt (.56, .44) 11. nachts mit 80 km/h durch geschlossene Ortschaften fahren (.39, .43) 12. sich bei dichtem Nebel an ein zu schnell fahrendes Fahrzeug «anhängen» (.42, .32) 13. auf zweispurigen Straßen trotz Gegenverkehr überholen, wenn die Straße breit genug ist (.44, .37)
-9 .
VerhaltensBericht
-15 _ VerhaltensBewertung
-21 .
-23 Strassenverkehrsverhalten
BPL
T PP
Abb.l: Straßenverkehrsverhalten: Verhaltens-Bericht und Verhaltens-Bewertung unter Bogus-Pipeline (BPL)- und Papier-Bleistift (PP)-Bedingungen. (Je höher der Score, desto häufiger das berichtete Verhalten bzw. desto positiver die Bewertung des Verhaltens.)
143
Zeitschrift für Sozialpsychologie 1985,16,139-148 Tab. 2: Straßenverkehrs verhalten: Mittelwerte, Standardabweichungen und Ergebnisse der Prüfung von Mittelwertsdifferenzen der Verhaltens- und Bewertungsscores unter BogusPipeline- und Papier-Bleistift-Bedingungen. (n = 80)
BPL X
Verhaltensscore Bewertungsscore
PP s
X
s
t
df
P
- 3.40 13.01 -12.80 11.40 3.43 78
.001
9.94 -19.25 11.44 1.24 78
.218
-16.28
5.2 Experiment2: Sexuelles Verhalten Da es sich als schwierig erwies, sexuelle Verhaltensweisen zu bestimmen, die einerseits genügend konkret sexuelle Praktiken beschreiben und andererseits tatsächlich relativ weit in der Bevölkerung verbreitet sind, konnte nur eine relativ geringe Zahl von Verhaltensweisen gesammelt werden, so daß eine Voruntersuchung zur Itemselektion nicht möglich war und die Bildung globaler Maße ausgeschlossen werden mußte. Anhand von Ergebnissen des RALF-Reports von EICHNER & HABERMEHL ( 1 9 7 8 ) wurden neun Verhaltensweisen ausgewählt, die von großen Teilen der Bevölkerung praktiziert werden und die zugleich ein relativ «moderates» Sexualverhalten darzustellen scheinen, so daß sie bei einer Befragung im Rahmen eines Experiments voraussichtlich nicht schockierend wirken (vgl. Tab. 3). Die neun Verhaltensweisen wurden 80 männlichen Studenten mit sexueller Vorerfahrung (19 Lehramtsstudenten, 14 Theologen, 10 Juristen, 37 Sonstige; Durchschnittsalter 23,6 Jahre) unter den acht verschiedenen Bedingungskombinationen zur Beurteilung gegeben. Mittels t-Test für unabhängige Stichproben wurden für jede Verhaltensweise Mittelwertsdifferenzen zwischen der BPL- und der PP-Bedingung getrennt sowohl für die Verhaltensberichte als auch die Verhaltensbewertungen berechnet. Während sich für die Verhaltensberichte in keinem einzigen Fall ein signifikanter Mittelwertsunterschied ergibt, wird bei der Verhaltensbewertung lediglich die Mittelwertsdifferenz der Verhaltensweise Nr.2 («Mit der Partnerin über gemeinsame sexuelle Praktiken reden») auf dem 1 %-Niveau signifikant; die Verhaltensweise wird
Tab.3: Liste der sexuellen Verhaltensweisen. 1. Geschlechtsverkehr haben 2. Mit der Partnerin über gemeinsame sexuelle Praktiken reden 3. Sich selbst befriedigen 4. Sexuelle Phantasien haben 5. Zu Beginn des Geschlechtsverkehrs ein ausgedehntes Vorspiel praktizieren 6. Die Geschlechtsorgane der Partnerin mit dem Mund stimulieren 7. Sich durch Sexual-Lektüre (Bilder oder Texte) sexuell erregen 8. Beim intimen Kontakt mit der Partnerin einen Orgasmus haben 9. Beim Geschlechtsverkehr Hilfsmittel wie Magazine oder Kunstglieder anwenden
unter der PP-Bedingung positiver bewertet als unter der BPL-Bedingung. Demnach wird - mit der Ausnahme des genannten Einzelfalles - Hypothese 4 empirisch gestützt, d. h., es wurde überwiegend kein BPL-Effekt gefunden. (Dieses Resultat blieb unverändert, nachdem post hoc mit aufgrund einer Faktorenanalyse gebildeten Summenwerten gerechnet wurde.)
5.3 Experiment 3: Aggressives Verhalten Nach einer Durchsicht von Fachliteratur zu aggressivem Verhalten sowie einer Voruntersuchung an 83 studentischen Vpn wurde eine Liste von 10 aggressiven Verhaltensweisen im Alltagsleben, die jedoch keineswegs «spektakulär» aggressives Verhalten darstellen, erstellt (vgl. Tab. 4 ) . CRONBACHS alpha dieser Skala aggressiven Tab. 4: Liste der aggressiven Verhaltensweisen (in Klammern Item-Test-Korrelationen für Verhaltens-Bericht und Verhaltens-Bewertung; n = 83). 1. 2. 3. 4. 5. 6. 7.
Rücksichtslos durch die Menge drängeln (.56, .57) Auf Beleidigungen mit Drohungen reagieren (.50, .56) Nach einem Streit die Türen zuschlagen (.61, .43) Versuchen, sich beim Anstellen vorzudrängein (.52, .51) Andere Leute vor den Kopf stoßen (.51, .39) Hämisch anderen ihre Fehler nachweisen (.64, .44) In Diskussionen die Meinung anderer unterdrücken (.69, •57) 8. In Debatten den eigenen Standpunkt kompromißlos durchsetzen (.51, .35) 9. Über das Ungeschick anderer Leute spotten (.64, .60) 10. Bei schlechter Laune den an Unbeteiligten ablassen (.67, .63)
144
Mummendey & Bolt en: Bogus-Pipeline-Paradigma
Verhaltens beträgt 0.87 (Verhaltens-Bericht) bzw. 0.82 (Verhaltens-Bewertung).
Tab. 5: Aggressives Verhalten: Mittelwerte, Standardabweichungen und Ergebnisse der Prüfung von Mittelwertsdifferenzen der Verhaltens- und Bewertungsscores unter BogusPipeline- und Papier-Bleistift-Bedingungen. (n = 80)
BPL X
Verhaltensscore Bewert ungsscore
PP s
X
s
t
df
P
- 8.75
8.84 - 7.75 10.38 0.46 78
.644
-15.78
7.33 -16.48
.714
9.53 0.37 78
Tab. 6: Liste der frauenfeindlichen Verhaltensweisen (in Klammern Item-Test-Korrelationen für Verhaltens-Bericht und Verhaltens-Bewertung; n = 106). 1. Sich über «Emanzen» lustig machen (.41, .51) 2. Unqualifizierte Beiträge von Frauen offen lächerlich machen (.46, .64) 3. In der Phantasie Frauen sexuell mißbrauchen (.61, .57) 4. Über das häßliche Aussehen von Frauen spotten (.49, .61) 5. Frauen intellektuelle Fähigkeiten absprechen (.47, .71) 6. Uneinsichtige Frauen zur Einsicht zwingen (.45, .58) 7. Häßlichen Frauen deutlich mit Ablehnung begegnen (.63, .67) 8. Frauen in Diskussionen übergehen (.50, .58) 9. Die Meinung von Frauen nicht ernst nehmen (.54, .71) 10. Frauen hämisch ihre Fehler nachweisen (.49, .73) 11. «Mannweiber» verächtlich machen (.59, .63) 12. Hübsche Frauen als «Dumm'chen» behandeln (.43, .59) 13. Auf Frauen am Steuer schimpfen (.32, .49) 14. Auf Ab Weisungen von Frauen abweisend reagieren (.51, .58) 15. Mit anderen Männern über Frauen (.56, .53) 16. Gut aussehende Frauen bevorzugt behandeln (.40, .49) 17. Nach einem vergeblichen Anmachversuch die Frau beleidigen (.43, .70)
Die 10 Verhaltensweisen wurden 80 männlichen Versuchspersonen (52 Kolleg-Schülern des zweiten Bildungsweges, 28 Ingenieur Studenten; Durchschnittsalter 23,9 Jahre) unter den acht verschiedenen Bedingungskombinationen zur Beurteilung gegeben. Wie in Experiment 1 wurde je ein « Verhaltenswert»undein«Bewertungswert»gebildet(max./ min. Wert für beide Skalen ist ± 30). Mittels t-Test wurde überprüft, ob sich die Verhaltens- und Bewertungsmaße der jeweils unter der BPL- und der PP-Bedingung untersuchten Personengruppen unterscheiden. Die Ergebnisse sind in Tabelle 5 aufgeführt. Es zeigt sich weder für den Verhaltens- noch für den Bewertungswert ein interpretierbarer Unterschied, so daß Hypothese 4 Unterstützung findet, d.h., es ist kein BPL-Effekt nachweisbar.
5.4 Experiment 4: Frauenfeindliches Verhalten Aufgrund einer Durchsicht von Literatur sowie einer Voruntersuchung an 106 männlichen studentischen Vpn wurden 17 Verhaltensweisen ausgewählt, die den gegenwärtig zumindest im Hochschulbereich stark normiert erscheinenden Vorstellungen darüber, wie man sich Frauen gegenüber zu verhalten hat, eher zuwiderlaufen (vgl. Tab.6). CRONBACHS alpha dieser Skala frauenfeindlichen Verhaltens beträgt demnach 0.87 (Verhaltens-Bericht) und 0.91 (VerhaltensBewertung). Die 17 Verhaltensweisen wurden 112 männlichen Ingenieur-Studenten mit einem Durchschnittsalter von 23,5 Jahren unter den acht Bedingungskombinationen zur Beurteilung vorgelegt. Vorsichtshalber wurde zur Kontrolle möglicher geschlechtsspezifischer Einflüsse der Person des Versuchsleiters mit einem männlichen und ei-
Tab. 7: Frauenfeindliches Verhalten: Verhaltensscore. Mittelwerte (x), Standardabweichungen (s) und die Ergebnisse der Varianzanalyse x (pro Zelle n = 28). Varianzanalyse
Meßmethode Geschlecht des VI
BPL
PP
Quelle
df
MS
F
P
männlich
x: -14.79 s: 15.86
x: - 17.00 s: 14.72
weiblich
x: -14.50
x: -18.43
Meßmethode (A) Geschlecht des VI (B) AxB Error
1 1 1 108
264.14 9.14 20.57 254.43
1.04 0.04 0.08
0.311 0.850 0.777
145
Zeitschrift für Sozialpsychologie 1985,16,139-148
Tab. 8: Frauenfeindliches Verhalten: Bewertungsscore. Mittelwerte (x), Standardabweichungen (s) und die Ergebnisse der Varianzanalyse x (Geschlecht des Vl> (pro Zelle n = 28). Meßmethode
Varianzanalyse
Geschlecht des VI
BPL
PP
Quelle
df
MS
F
p
männlich
x: -22.89 s: 12.00
x: -28.71 s: 13.61
weiblich
x: -14.61 s: 15.92
x: -32.46 s: 12.55
Meßmethode (A) Geschlecht des VI (B) AxB Error
1 1 1 108
3924.72 144.01 1014.01 185.09
21.20 0.78 5.48
0.000 0.380 0.021
nem weiblichen VI, systematisch über die Versuchsbedingungen variiert, gearbeitet. Analog zu den Experimenten 1 und 3 wurden «Verhaltenswerte» und «Bewertungswerte» gebildet (max./min. Werte ± 5 1 ) . Es wurden 2 x 2 Varianzanalysen mit den unabhängigen Faktoren «Meßmethode» (BPL vs. PP) und «Geschlecht des VI» gerechnet, und zwar sowohl für den Verhaltens- als auch für den Bewertungswert. Die Ergebnisse der Varianzanalysen sind in Tabelle 7 und Tabelle 8 wiedergegeben. Es zeigt sich für den Bewertungswert ein signifikanter BPL-Effekt (Omega2 = 0.15) sowie eine signifikante Wechselwirkung zwischen den Faktoren «Meßmethode» und «Vl-Geschlecht» (Omega 2 = 0.03). Für den Verhaltenswert zeigt sich kein interpretierbares Ergebnis. Die Veränderung des «Bewertungswertes» unter den verschiedenen Versuchsbedingungen ist in Abbildung 2 graphisch dargestellt. Damit wird Hypothese 1 empirisch unterstützt, d.h., es werden unter Bogus-Pipeline-Bedingungen eher Tendenzen der «sozialen Erwünschtheit» reduziert. Außerdem zeigt sich in dem vorliegenden Experiment ein Einfluß der Person des Versuchsleiters, und zwar, wie die nähere Analyse der Wechselwirkung ergibt, nur unter der BPL-Bedingung; die frauenfeindlichen Verhaltensweisen werden in der BPL-Situation bei einem weiblichen VI weniger negativ bewertet als bei einem männlichen VI.
6.
VerhaltensBewertung Score
VI weiblich
Frauenfeindliches Verhalten
1 BPL
1 PP
Abb.2: Frauenfeindliches Verhalten: Bewertung des Verhaltens unter Bogus-Pipeline (BPL)- und Papier-Bleistift (PP)Bedingungen bei männlichem und weiblichem Versuchsleiter (VI). (Je höher der Score, desto positiver die Bewertung des Verhaltens.)
Weitere Ergebnisse und Resultate der Nachbefragung
Um festzustellen, unter welcher experimentellen Bedingung sich die Vpn eher günstig darstellen, wurde für die beiden Experimente 1 und 4, in de-
nen sich interpretierbare BPL-Effekte nachweisen ließen, pro Vp zusätzlich ein «Selbstdarstellungswert» berechnet. Er besteht aus der Summe der Produkte der Verhaltens- und Bewertungs-
146
Mummendey & Bolten: Bogus-Pipeline-Paradigma
Urteile pro Verhaltensweise (Item). Vpn, die beide Messungen (Verhaltens- und BewertungsMessung) unter BPL-Bedingungen absolvierten (Bedingungskombinationen I und II des Versuchsplans), wurden mit denjenigen Vpn hinsichtlich des «Selbstdarstellungswertes» verglichen, die beide Messungen unter PP-Bedingungen ausführten (Bedingungskombinationen VII und VIII des Versuchsplans). Sowohl in Experiment 1 als auch in Experiment 4 zeigte sich der mittlere «Selbstdarstellungswert» unter der BPL-Bedingung signifikant verringert, d.h., die Vpn stellen sich in der Bogus-Pipeline-Situation weniger günstig dar. Die Ergebnisse der umfangreichen Nachbefragungen lassen sich wie folgt kurz zusammenfassen: Die Vpn verfügten überwiegend über wenig experimentelle Vorerfahrung und gaben zum größten Teil «Allgemeine Neugier» als Hauptgrund für ihre Teilnahme an. Sie glaubten zum überwiegenden Teil, daß das Experiment zu wissenschaftlichen Fortschritten führe. Die Einschätzung der Zuverlässigkeit der BPL-Apparatur variierte ebenso wie diejenige ihrer vermuteten Anschaffungskosten relativ stark. Es ließ sich jedoch in keinem einzigen Falle eine statistisch bedeutsame Beziehung zwischen einer Variablen der Nachbefragung und irgendeinem berichteten experimentellen Ergebnis feststellen.
7.
Diskussion
In zwei der berichteten Experimente konnte ein Bogus-Pipeline-Effekt aufgezeigt werden. In Experiment 1 wurden Straßenverkehrsverstöße unter BPL-Bedingungen eher zugegeben als unter Papier-Bleistift-Bedingungen, und in Experiment 4 wurden frauenfeindliche Verhaltensweisen unter BPL-Bedingungen von Männern nicht so negativ bewertet wie unter PP-Bedingungen. In beiden Experimenten stellten sich die Versuchspersonen in der BPL-Situation insgesamt ungünstiger dar als in der Kontrollbedingung. Für die Verhaltensbereiche «Sexualität» und «Aggression» ließ sich dagegen kein BPL-Effekt aufweisen. Auch eine Einbeziehung der bei den Nachbefragungen erhobenen Daten änderte an den berichteten Ergebnissen nichts. Dabei überrascht, daß auch das geschätzte Ausmaß der Zuverlässig-
keit der BPL-Apparatur für das Auftreten von BPL-Effekten irrelevant zu sein scheint. Im Mittelpunkt der vorliegenden Untersuchung stand die Frage, ob die Bogus-PipelineApparatur quasi wie ein Lügendetektor wirke, oder ob durch die BPL-Methode eher sozial erwünschte Antworttendenzen bei der Abgabe von Einstellungsurteilen reduziert würden. Die «Lügendetektions»-Annahme beruhte darauf, daß eher unerwünschte Verhaltensweisen zugegeben werden, aber gleichzeitig keine Modifikation der Bewertung dieser Verhaltensweisen erfolgt. Sollten dagegen Verhaltensbewertungen modifiziert werden, nicht jedoch Verhaltensberichte, so spräche dies für die Richtigkeit der «Social Desirability»-Annahme. Während die Resultate von Experiment 1 die «Lügendetektions»-Annahme stützen, sprechen die Ergebnisse von Experiment 4 für die «Social Desirability»-Annahme. Somit scheinen beide Erklärungsmöglichkeiten in Abhängigkeit von dem jeweils untersuchten Gegenstandsbereich zutreffen zu können. Ausgeschlossen werden konnte jedenfalls die in der Literatur häufig anzutreffende Alternativerklärung des BPL-Effektes, wonach Versuchspersonen auf Anforderungsmerkmale der BPL-Situation, sich negativ darzustellen, reagieren und dementsprechend nur einem «negativen Bias» unterliegen; es ist nämlich nicht einzusehen, wieso ein solcher «negativer Bias» entweder nur beim Verhaltens-Bericht oder aber nur bei der Verhaltens-Bewertung unter BPL-Bedingungen auftreten sollte. In der vorliegenden Untersuchung traten BPL-Effekte nie gleichzeitig beim Verhaltens-Bericht und bei der Verhaltens-Bewertung auf. Daß nur bei der Hälfte der ausgeführten Experimente BPL-Effekte nachgewiesen werden konnten, spricht dafür, daß solche Effekte - wie es bereits OSTROM (1973) vermutete - eher als relativ schwach anzusehen sind. Eventuell könnte man auch - etwa in Anlehnung an EHLERS (1973) - argumentieren, daß die Variable «Soziale Erwünschtheit» als mögliche Störvariable bei der Einstellungsmessung und beim Verhaltensbericht stark überschätzt wird. Auf jeden Fall scheint die Art des unter BPL-Bedingungen untersuchten Verhaltens eine Rolle zu spielen. Vergleicht man die Verhaltensbereiche, bei denen BPL-Effekte nachgewiesen werden konnten, mit
Zeitschrift für Sozialpsychologie 1985,16,139-148
denjenigen, bei denen dies nicht gelungen ist, so scheint es sich im ersteren Falle (Straßenverkehrsverstöße und frauenfeindliches Verhalten) um Verhalten zu handeln, das in der Öffentlichkeit starke Beachtung findet und hinsichtlich dessen sich starke normative Verhaltenserwartungen herausgebildet haben. Dies scheint in bezug auf den mehr «privaten» Bereich des hier untersuchten sexuellen Verhaltens und auch in bezug auf die für die vorliegende Untersuchung ausgewählten aggressiven Alltagsverhaltensweisen vergleichsweise nicht so sehr der Fall zu sein. In den Experimenten 1 und 4 scheinen also Verhaltensweisen untersucht worden zu sein, die öffentlich hinreichend normiert sind, so daß die hier vorherrschenden sozialen Normen der Versuchsperson eine deutliche Orientierung für «sozial erwünschtes» Verhalten liefern. In den Experimenten 2 und 3 scheint demgegenüber eine entsprechende, ausgeprägte normative Orientierung eher gefehlt zu haben. Eine in diesem Sinne fehlende Eindeutigkeit der Verhaltenserwartungen und eine daraus folgende relativ geringere Homogenität des sozialen Verhaltens in den Bereichen «sexuelles» und «aggressives Verhalten» könnte möglicherweise zu individuellen Unterschieden in den Urteilen zu diesen Verhaltensbereichen führen, die größer sind als bei den hier als stärker sozial normiert angesehenen Bereichen. Die Urteilsvarianzen der berichteten Experimente geben hierüber noch keinen Aufschluß, doch ließen sich beim Vorliegen starker interindividueller Unterschiede die Hypothesen der vorliegenden Untersuchung auch durch intraindividuelle Vergleiche prüfen. Wir haben aber auf ein solches Vorgehen, bei dem Bogus-Pipeline- und Papier-Bleistift-Urteile bei jeder Person direkt miteinander verglichen würden, aus Furcht vor Meßwiederholungseffekten verzichtet und sind den aufwendigeren Weg des Vergleichs unabhängiger Stichproben gegangen.
147
Die berichteten Ergebnisse und die dazu angestellten Überlegungen sprechen für die bereits von JONES & S I G A Ü ( 1 9 7 1 ) erhobene Forderung, die Bogus-Pipeline-Methode nicht als Routineverfahren einzusetzen, sondern sie nur dann anzuwenden, wenn eine wirklich gut begründete Annahme besteht, daß der zu untersuchende Verhaltensbereich in besonderer Weise zu sozial erwünschten Reaktionen animiere.
Literatur BRACKWEDE, D. 1980. Das Bogus-Pipeline-Paradigma: Eine Übersicht über bisherige experimentelle Ergebnisse. Zeitschrift für Sozialpsychologie, 11, 50-59. EHLERS, T. 1973. Zur Effektivität der Kontrollen von Reaktionseinstellungen. In: Reinert, G. (Hrsg.): Bericht Uber den 27. Kongreß der Deutschen Gesellschaft für Pychologiein Kiel 1970. Göttingen: Hogrefe, 48-53. EICHNER, K . & HABERMEHL, W . 1 9 7 8 . D e r R a l f - R e p o r t - D a s
Sexualverhalten der Deutschen. Hamburg: Hoffmann & Campe. FESTINGER, L. & CARLSMITH, J . M . 1959. Cognitive conse-
quences of forced compliance. Journal of Abnormal and Social Psychology, 58, 203-211. JONES, E . E . & SIGALL, H . 1 9 7 1 . The bogus pipeline: A new paradigm for measuring affect and attitude. Psychological Bulletin, 76, 349-364. MUMMENDEY, H . D . , BOLTEN, H . - G . & ISERMANN-GERKE, M .
1982. Experimentelle Überprüfung des Bogus-PipelineParadigmas: Einstellungen gegenüber Türken, Deutschen und Holländern. Zeitschrift für Sozialpsychologie, 13, 300-311. OSTROM, T.M. 1973. The bogus pipeline: A new ignis fatuus? Psychological Bulletin, 7 9 , 2 5 2 - 2 5 9 . QUIGLEY-FERNANDEZ, B . & TEDESCHI, J.T. 1 9 7 8 . The bogus pipeline as a lie detector: Two validity studies. Journal of Personality and Social Psychology, 3 6 , 2 4 7 - 2 5 6 . SIGALL, H . & PAGE, R . 1 9 7 1 . Current stereotypes: A little fading, a little faking. Journal of Personality and Social Psychology, 1 8 , 2 4 7 - 2 5 5 . TEDESCHI, J . T . & ROSENFELD, P . 1 9 8 1 . I m p r e s s i o n
management theory and the forced compliance situation. In: Tedeschi, J.T. (Ed.): Impression management theory and social psychological research. New York: Academic Press, pp. 147-177.
F B^M
148
Literatur
Neuerscheinungen
P. 1984. Schizophrenia and human value. Oxford: Blackwell, pp.223, £19.50. BEM, S., RAPPARD, H . & V.HOORN, W . (Eds.) 1984. Proceedings of the second meeting of Cheiron, European Society for the History of the Behavioral and Social Sciences, held at Heidelberg, September 2-4,1983. Leiden: Psychologisch Instituut van de Rijksuniversiteit Leiden. COOPER, C . L. (Ed.) 1984. Psychosocial stress and cancer. Cichester: Wiley, pp.265, £17.—. DAVIDSON, M . J . & COOPER, C . L . (Eds.) 1 9 8 4 . Working women. An international survey. Cichester: Wiley, pp.306, £ 1 8 . — . BARHAM,
DREIKURS, R . , GOULD, S . & CORSINI, R . J . 1 9 8 5 .
Familienrat. Für ein glücklicheres Zusammenleben von Eltern und Kindern. München: dtv, pp. 153, DM 9.80. FREINET, E. 1985. Erziehung ohne Zwang. Der Weg Celestin Freinets. München: dtv, pp. 189, DM 10.80. FREY, D . & IRLE, M . (Hrsg.) 1 9 8 4 . Theorien der Sozialpsychologie. Bd.I: Kognitive Theorien. Bern: Huber, pp. 303, DM 38.—. FROMM, E. 1985. Psychoanalyse und Ethik. Bausteine zu einer humanistischen Charakterologie. München: dtv, pp.201, DM 9.80. HODAPP, V. 1984. Analyse linearer Kausalmodelle. Bern: Huber, pp. 138, DM 48.—. HÜPPAUF, B . (Hrsg.) 1984. Ansichten vom Krieg. Vergleichende Studien zum Ersten Weltkrieg in Literatur und Gesellschaft. Königstein: Forum Academicum, pp.257, DM 48.—.
JÄGER, R . S . , MATTENKLOTT, A . & SCHRÖDER,
R.-D. (Hrsg.) 1984. Diagnostische Urteilsbildung in der Psychologie. Grundlagen und Anwendungen. Göttingen: Hogrefe, pp.345, DM 45.—. JUNGNITSCH, G. 1984. Vergleichende Untersuchung bei vollsinnigen und geburtsblinden Personen an einer Form der Symmetrietäuschung. Königstein: Hain, pp.231, DM 48.—. KAKAR, S. 1984. Schamanen, Heilige und Ärzte. Psychotherapie und traditionelle indische Heilkunst. München: Biederstein, pp.316, DM 34.—. LORENZ, R.J. 1984. Grundbegriffe der Biometrie. Stuttgart: Fischer, pp.241, DM 48.—. LÜCK, H . E . , MILLER, R . & R E C H T I E N , W. (Hrsg.) 1984. Geschichte der Psychologie. Ein Handbuch in Schlüsselbegriffen. München: Urban & Schwarzenberg, pp.273, DM 36.—. LUTHE, H . 0 . 1 9 8 5 . Distanz. Untersuchung zu einer vernachlässigten Kategorie. München: Fink, pp.263, DM 28.—. MAYER, R.A.M. 1984. Medienumwelt im Wandel. München: Verlag Deutsches Jugendinstitut, pp.141. MEYER-DRAWE, K. 1984. Leiblichkeit und Sozialität. Phänomenologische Beiträge zu einer pädagogischen Theorie der Inter-Subjektivität. München: Fink, pp.301, DM 48.—. MICHAELIS, W. & STEPHAN, E. (Hrsg.) 1984. Ausbildungsreform Psychologie. Argumente, Standpunkte, Forderungen. Göttingen: Hogrefe, pp.435, DM 38.—. REUBAND, K.-H. & ROHLINGER, H. 1984. Empirische Sozialforschung 1983. Frankfurt: Campus, pp.436, DM 65.—.
149
Zeitschrift für Sozialpsychologie 1985,16,149
Titel und Abstracta 1984. Repräsentation von Ordinaldaten durch Graphen: Ordinale Netzwerkskalierung. Kölner Zeitschrift für Soziologie und Sozialpsychologie, 36, 494510.
FEGER, H . & DROGE, U .
«Ordinal Network Scaling represents ordinal dissimilarities 8¡j, i, j = l N by a directed or undirected graph with non-negative weights. The points of the graph represent the N objects. The dissimilarities are represented by distances d¡j between the points i and j by a path length metric such that the relation between the dissimilarities 5y and the distances dy is strictly monotone. For these representations a representation theorem is provided. Further, the uniqueness of the structure of solutions is expressed by a theorem which allows one to determine the set of all those lines common to all representations of a matrix (5y). Monte Carlo studies show that the lines common to all representations exhaust the set of lines of the representing graphs to ca. 90%. Thus the structure of graphs is to a large extent determined by ordinal data. Examples with different kinds of data demonstrate Ordinal Network scaling» (Abstract).
F. & KRÖLL, F. 1 9 8 4 . Einführung in die Geschichte der Soziologie. Stuttgart: Enke, pp.152, DM 19.80.
HECKMANN,
«Die Frage wird in diesem Buch durch die Darstellung ihrer Entstehung und Entwicklung beantwortet. Dabei wird der Entstehungsgeschichte der Soziologie in Deutschland besondere Aufmerksamkeit geschenkt. Eine Sammlung von Klassikertexten ergänzt die Darstellung» (Umschlagtext). Inhalt (Haupttitel): 1. Aspekte einer Problemgeschichte gesellschaftstheoretischen Denkens bis zur Herausbildung der Soziologie als Einzeldisziplin 2. Zur Konstituierung einzelwissenschaftlicher Soziolog i e b e i COMTE u n d SPENCER
3. Zum Konstitutionsprozeß der Soziologie als Einzel Wissenschaft in Deutschland: Ausgangspunkte und Entwicklungslinien 4. Begründung und Ausarbeitung der Soziologie als Einzelwissenschaft in Deutschland. Quellentexte von COMTE, SPENCER, SIMMEL, WEBER.
K.J. Ä S O D E U R , W. 1984. Interpersonelle Beziehungen und Netzstruktur. Bericht über ein Projekt der Strukturentwicklung unter Studienanfängern. Kölner Zeitschrift für Soziologie und Sozialpsychologie, 36, 511556.
HUMMELL,
«This is a report on an empirical investigation of students during their first nine weeks at university, which focuses on the spontaneously evolving net of contacts and social relationships among 182 students. The development of the net over time is described with the help of structural indices which are interpreted in comparison to biased nets, as well as in the light of theories of structural balance (in the tradition of DAVIS, HOLLAND and LEINHARDT). The problems of the empirical application of the D-H-L models are discussed in detail.» (Abstract).
P. 1984. Strukturelle Äquivalenz in Netzwerken: Algebraische und topologische Modelle. Kölner Zeitschrift für Soziologie und Sozialpsychologie, 36, 464-493.
KAPPELHOFF,
«The definition of positions of structural equivalent actors in multiple networks and the resulting determination of role relations between positions characterizes a new approach to the study of social structure. The origin of the algebraic oriented role structure analysis in the formal representation of classificatory kinship systems as algebraic groups and the further developments of blockmodel analysis (HARRISON C.WHITE) are outlined. Another approach is the embedding of social relations by means of Euclidean distances in a social topology (ROLAND S. BURT). Central to our discussion are not the technical details of the various blockmodelling methods, but the basic theoretical assumptions underlying the two different approaches. The algebraic approach is viewed as being related to structuralism, whereas the topological approach is based on a concept of structural action» (Abstract).
M. 1984. Kommunikation und Gesellschaft. Theorien zur Massenkommunikation. Köln: Böhlau, pp.284, DM 68.—.
KUNCZIK,
Ziel der Studie ist zu prüfen, «ob die Situation der Soziologie der Massenkommunikation noch immer entscheidend durch das Fehlen eines (oder mehrerer) umfassenden(r) theoretischen(r) Rahmen(s) charakterisiert ist, der (die) es erlauben würde(n), die Vielzahl der Einzelbefunde zu integrieren, sowie die Forschungsbemühungen zu koordinieren. Untersucht wird, wie Massenkommunikation innerhalb verschiedener Theorienansätze gefaßt wird» (p.l). Inhalt (Haupttitel): 1. Massenkommunikation im Rahmen soziologischer Theoriebildung 2. Frühe Theorieansätze zu einer Soziologie der Massenkommunikation und primitive Medienanalyse 3. Funktionalistische Theorien der Massenkommunikation 4. Kritische Medientheorie 5. Systemtheoretisch orientierte Theorien der Massenkommunikation 6. Systemmodelle der Massenkommunikation 7. Schlußbemerkung
150
Nachrichten und Mitteilungen PSYNDEX, die Literaturdatenbank der Zentralstelle für Psychologische Information und Dokumentation (ZPID) PSYNDEX, die Datenbank psychologischer Literatur aus den deutschsprachigen Ländern, weist Literatur aus allen Bereichen der Psychologie nach. Dokumentiert wird außerdem psychologisch relevante Literatur aus benachbarten Wissensgebieten, wie Soziologie, Linguistik, Kriminologie, Betriebswirtschaft, Erziehungswissenschaften, Psychiatrie, Medizin. Für PSYNDEX werden laufend aktuelle Zeitschriftenaufsätze, Monographien, Sammelwerke und deren Einzelbeiträge, Dissertationen und Reports ausgewertet. PSYNDEX enthält sämtliche Literaturnachweise, die in den von der ZPID herausgegebenen gedruckten Diensten dokumentiert sind: Psychologischer Index. Referatedienst über die psychologische Literatur aus den deutschsprachigen Ländern (erscheint seit 1981) und Bibliographie deutschsprachiger psychologischer Dissertationen (berichtet ab Promotionsjahr 1968), darüber hinaus Zeitschriftenaufsätze der Erscheinungsjahre 1977 bis 1980 und Sammelwerksbeiträge ab 1982. Ende 1984 waren in PSYNDEX rund 22 000 Literaturnachweise gespeichert; jährlich kommen etwa4500Nachweise hinzu. Jedes Originaldokument ist in PSYNDEX ausführlich inhaltlich und formal beschrieben
mittels Schlagworten, Kurzzusammenfassung und bibliographischen Angaben, wobei die inhaltlichen Beschreibungselemente sowohl in deutscher als auch in englischer Sprache formuliert sind. Die Datenbank PSYNDEX steht in- und ausländischen Interessenten für individuelle Literatursuchen online beim Host DIMDI, Köln, zur Verfügung; sie ist deutsch- und englischsprachig absuchbar. Neben der Möglichkeit eines Direktzugriffes auf PSYNDEX über Datenfernverarbeitung können Literatursuchen auch über die ZPID und andere Informationsvermittlungsstellen in Auftrag gegeben werden. Weitere Informationen können bei der ZPID, Universität Trier, Postfach 3825, D-5500Trier (Tel. 0651-716221)erfragt werden.
21. International Congress of Applied Pychologie, July, 13-18,1986, Jerusalem, Israel Ein detailliertes Programm steht ab Juli 1985 zur Verfügung. Voranmeldungen sind vom l.Juni 1985 an möglich. Weitere Informationen: Secretariat 21. International Congress of Applied Psychology P.O.B. 50006 Tel Aviv 61500 Israel
Zeitschrift für Sozialpsychologie 1985,16,151
151
Autoren HEINZ-GERD BOLTEN
Dipl.Soz. 1979 (Bielefeld) Dipl.-Psych. 1981 (Bielefeld) Dr.phil. 1984 (Bielefeld)
Wichtige Veröffentlichungen
Experimentelle Prüfung des Bogus-Pipeline-Paradigmas (1982)
Derzeitige Forschungsvorhaben
Überprüfung des Bogus-Pipeline-Paradigmas Adresse: c/o H.D. Mummendey GERNOT VON COLLANI
Dipl.-Psych. 1969 (Hamburg) Dr.rer.nat. 1973 (Braunschweig) Hochschulassistent am Psychologischen Institut der TU Braunschweig
Wichtige Veröffentlichungen
Arbeiten zu geometrischen Täuschungen (1978, 1979) Zur Soziometrie in Schulklassen (zusammen mit G.WEBER) (1982)
Mathematisch-statistische Rechenverfahren für Microcomputer (1983)
Derzeitige Forschungsarbeiten
Analyse sozialer Netzwerke mit loglinearen Modellen Arbeiten zur Attributionstheorie Adresse: Dr. G. von Collani Institut für Psychologie TU Braunschweig Spielmannstraße 12a D-3300 Braunschweig RONALD HENSS
Dipl.-Psych. 1978 (Mainz) Wissenschaftlicher Mitarbeiter am DFG-Forschungsprojekt «Formale Modelle kooperativer Konfliktlösung» Adresse: Ronald Henss Psychologisches Institut Bau 1 Universität des Saarlandes D-6600 Saarbrücken
VOLKER LINNEWEBER
Dipl.-Päd. 1977 (Münster) Dipl.-Psych. 1979 (Münster) Dr.phil. 1981 (Münster)
Wichtige Veröffentlichungen
Aggressiv sind immer die anderen. Plädoyer für eine sozialpsychologische Perspektive in der Aggressionsforschung (zusammen mit MUMMENDEY, BORNE WASSER & LÖSCHPER) (1982)
Classification of situations specific to field and behaviour: The context of aggressive interactions in schools (zusammen mit MUMMENDEY, BORNEWASSER & LÖSCHPER) (1984)
Aggression: From act to interaction (zusammen m i t MUMMENDEY & LÖSCHPER) (1984)
Derzeitige Forschungsarbeiten
Aggressive Interaktionen in spezifischen sozialen Kontexten Umgebungsrepräsentationen und Situationsdefinitionen in sozialen Interaktionen Adresse: c/o A. Mummendey GABI LÖSCHPER
Dipl.-Psych. 1978 (Münster) Dr.phil. 1981 (Münster)
Wichtige Veröffentlichungen
Aggressiv sind immer die anderen. Plädoyer für eine sozialpsychologische Perspektive in der Aggressionsforschung (zusammen mit MUMMENDEY, BORNE WASSER & LINNE WEBER) (1982)
The judgement of behaviour as aggressive and sanctionable (zusammen mit MUMMENDEY, LINNEWEBER & BORNEWASSER) (1984)
Aggression: From act to interaction (zusammen m i t MUMMENDEY & LINNEWEBER) (1984)
Derzeitige Forschungsarbeiten
Situationsdefinitionen und Attributionsprozesse in sozialen Interaktionen. Situative und soziale Identität Adresse: c/o A. Mummendey
152 JÖRG-DIETRICH MEYBERG
BERNHARD ORTH
Lehramt für Grund- und Hauptschule 1977/1978 (Aachen)
Dipl.-Psych. 1974 (Hamburg) Dr.rer.nat. 1979 (Kiel) Professor am Fachbereich Psychologie der Universität Hamburg
Student der Psychologie (Universität Münster) Adresse: c/o A.Mummendey AMÉLIE MUMMENDEY
Dipl.-Psych. 1968 (Bonn) Dr.rer.nat. 1970 (Mainz) Habilitation 1974 (Münster) Professorin am Psychologischen Institut der Universität Münster
Wichtige Veröffentlichungen
Aggressives Verhalten (1983) Social Psychology of Aggression: From Individual behavior to Social Interaction (1984)
Derzeitige Forschungsvorhaben
Aggressive Interaktionen Beziehungen zwischen sozialen Gruppen Soziale Gerechtigkeitsvorstellungen und Gewalt Adresse: Prof.Dr. A.Mummendey FB Psychologie der Universität Münster Schlaunstraße 2 D-4400 Münster HANS DIETER MUMMENDEY
Dipl.-Psych. 1963 (Bonn) Dr.phil. 1965 (Bonn) Habilitation 1970 (Mainz) Professor an der Universität Bielefeld
Wichtige Veröffentlichungen Soziale Einstellungen (1975) Einstellung und Verhalten (1979) Attitudes and Behavior (1983)
Wichtige Veröffentlichungen
Einführung in die Theorie des Messens (1974) On the foundations of multidimensional scaling: An alternative to the Beals, Krantz, and Tversky approach (1980) A theoretical and empirical study of scale properties of magnitude-estimation and categoryrating scales (1982)
Derzeitige Forschungsarbeiten Skalierung, Meßtheorie Einstellungsmessung Theorie der Rangordnungen Adresse: Prof.Dr. Bernhard Orth Psychologisches Institut I Universität Hamburg Von-Melle-Park 6 D-2000 Hamburg 13 AXEL OSTMANN
Dipl. Math. 1975 (Tübingen) Dr.rer.pol. 1978 (Karlsruhe) Wissenschaftlicher Mitarbeiter am DFG-Forschungsprojekt «Formale Modelle kooperativer Konfliktlösung» Adresse: Axel Ostmann Psychologisches Institut Bau 1 Universität des Saarlandes D-6600 Saarbrücken
Derzeitige Forschungsvorhaben
SABINE OTTEN
Einstellungs- und Selbstkonzeptänderung nach Veränderung des offenen Verhaltens Experimentelle Kontrolle sozialer Erwünschtheit
Dipl.-Psych. 1984 (Münster) Studentin der Mathematik (Universität Münster)
Adresse: Prof.Dr. H.D.Mummendey Universität Bielefeld Postfach 8640 D-4800 Bielefeld 1
Adresse: c/o A.Mummendey
Zeitschrift für Sozialpsychologie Geschäftsführender Herausgeber (1984/85):
Redaktion:
Prof. Dr. Klaus Holzkamp
Dr. Morus Markard
Freie Universität Berlin
N y m p h e n b u r g e r Straße 4 D - 1000 Berlin 62 Tel. 030/853 98 04
Psychologisches Institut, W E 3 Habelschwerdter Allee 45 D - 1000 Berlin 33 Tel. 030/8384806
Die Zeitschrift für Sozialpsychologie ist für den deutschen Sprachraum das erste Organ, welches Forschungsarbeiten aus den Gebieten der Sozialpsychologie sowie der Sprachpsychologie und der politischen Psychologie an einem Ort vereinigt, und das der wissenschaftlichen Kontroverse zwischen verschiedenen theoretischen Standpunkten das ihr gemäße Forum schafft. Dieses Forum ist ebenso offen für die Methodologie der empirischen Sozialforschung, für Beiträge sozialpsychologischer Forschung zu jeglichen Anwendungsfeldern, wie für Beiträge zu interdisziplinären Positionen der Sozialpsychologie in Sozial-(Wirtschafts-, Politik- und Rechts-)Wissenschaften und Bio-Wissenschaften. Eine weitere Aufgabe sehen die Herausgeber in der D o k u m e n t a t i o n von Neuerscheinungen, von Artikeln aus anderen deutschsprachigen Zeitschriften, von Dissertationen und Diplomarbeiten und von Nachrichten über den Status der Sozialpsychologie, repräsentiert durch - auch interdisziplinäre - wissenschaftliche Veranstaltungen. Die Autoren werden gebeten, ihre Manuskripte in Sfacher Ausfertigungbeim geschäftsführenden Herausgeber einzureichen. Für die Manuskriptgestaltung sind die im Auftrag der Deutschen Gesellschaft für Psychologie von Prof. Dr. G ü n t h e r Reinert verfaßten Richtlinien maßgebend, die der geschäftsführende Herausgeber den Autoren auf Anfrage zusendet. Der U m f a n g der eingesandten Arbeiten darf 20 Schreibmaschinenseiten (l'/2 Zeilenabstand, 32 Zeilen á 60 Anschläge) nicht übersteigen. Arbeiten, die unter der Rubrik «Kurze Forschungsberichte» (vgl. zu den inhaltlichen Kriterien das Editorial 1/85) erscheinen sollen, dürfen einen U m f a n g von 4 Schreibmaschinenseiten nicht überschreiten. - Den Arbeiten sind Abstracta in deutscher und englischer (einschließlich des Titels der Arbeit) Sprache voranzustellen, für die die einschlägigen Richtlinien des GJP maßgebend sind. Diese werden auf Anfrage vom geschäftsführenden Herausgeber zugesandt. - Beizufügen ist der Hinweis, daß der Beitrag nicht bereits an anderer Stelle publiziert wurde. - Die Autoren werden um maximal 5 Stichwörter zur Kennzeichnung ihrer Arbeit und schließlich um biographische Daten gebeten: J a h r und Ort akademischer Prüfungen, das jetzige Arbeitsverhältnis, die wichtigsten Veröffentlichungen (Titel, Jahr) sowie derzeitige Forschungsarbeiten. Ü b e r die A n n a h m e von Manuskripten entscheidet das Kollegium der Herausgeber. Bezüglich der Anforderungen, die an empirische Arbeiten gestellt werden, informiert der Artikel von Bredenkamp/Feger «Kriterien zur Entscheidung über die A u f n a h m e empirischer Arbeiten in die Zeitschrift für Sozialpsychologie» in Bd. 1, H. 1,43 - 47 dieser Zeitschrift. Mit der A n n a h m e des Manuskripts zur Veröffentlichung erwirbt der Herausgeber im N a m e n des Verlages das volle und exklusive Copyright für alle Länder und alle Sprachen (im R a h m e n gesetzlicher Schutzfristen für Zeitschriftenaufsätze). A u t o r k o r r e k t u r e n , die 10% der Satzkosten überschreiten, werden den Urhebern in Rechnunggestellt. 20 Sonderdrucke erhält der Autor (oder erhalten die Autoren zusammen) für jeden Artikel kostenlos. Weitere können gegen Rechnung angefordert werden, spätestens wenn die Korrekturabzüge zurückgeschickt werden. Die Zusendung von Besprechungsexemplaren veranlaßt die Herausgeber lediglich zur D o k u m e n t a t i o n , nicht aber zur Rezension.
Anzeigenannahme:
Verlag Hans Huber, Länggaßstraße 76, CH - 3000 Bern 9
Erscheinungsweise: 4 Hefte jährlich Abonnementspreise pro Band: SFr. 88. - / D M 98. - ; für Studenten SFr. 44. - / D M 49. Porto und Versandgebühren: Schweiz SFr. 3. - ; übrige Länder SFr. 13. - / D M 14.50 Einzelheft:SFr. 28. - / D M 3 2 . - ; für Studenten SFr. 1 4 . - / D M 1 6 . Einbanddecke: SFr. 1 5 . - / D M 1 7 . -
Zeitschrift f ü r Différentielle und Diagnostische Psychologie Herausgegeben von H.J. Bochnik, G.H. Fischer, H. Hacker, D. Klebelsberg, K. Pawlik, LR. Schmidt, K.H. Stapf Redaktion und geschäftsführender Herausgeber: H.Häcker
Der Verlag Hans Huber (Bern, Stuttgart, Toronto) hat die Zeitschrift für Différentielle und Diagnostische Psychologie im gegenseitigen Einvernehmen vom Beltz Verlag (Weinheim, Basel) übernommen. Die Herausgeber haben diesem Verlagswechsel zugestimmt. Bereits der Jahrgang 6 (1985) wird bei Hans Huber erscheinen; das erste Heft ist in der Produktion. Das Abonnement kostet weiterhin DM 6 0 . — pro Jahr (vier Ausgaben).
Zeitschrift -|-| -| -j«
Deutschen Gesellschaft für
Organder Psychologie
Différentielle und Diagnostische Psychologie Herausgegeben von
6. Jahrgang Heft 1 März, 1985
H. G. H. D. K. L. K.
J. Bochnik, Frankfurt H. Fischer, Wien Häcker, Wuppertal Klebelsberg, Innsbruck Pawlik, Hamburg R. Schmidt, Trier H. Stapf, Tübingen
Verlag Hans Huber Bern Stuttgart Toronto
Die Zeitschrift publiziert empirische und theoretische Originalarbeiten zur Differentiellen Psychologie und zur psychologischen Diagnostik. Sie behandelt alle grundlagenwissenschaftlichen, methodischen und anwendungsbezogenen Themen aus den genannten Teilgebieten der Psychologie. Sie informiert regelmässig über Neuerscheinungen zur Differentiellen und Diagnostischen Psychologie und über Neuentwicklungen im Testbereich.
Verlag Hans Huber Bern Stuttgart Toronto