171 28 33MB
German Pages 87 [93] Year 1977
H ERAUSGEBER HUBERT FEGER
C. F. G R A U M A N N KLAUS HOLZKAMP MARTIN IRLE
BAND 7 1976
HEFT 2
V E R L A G HANS H U B E R BERN STUTTGART WIEN
Zeitschrift für Sozialpsychologie 1976, Band 7, Heft 2 INHALT
Theorie KNOPF, M. & PETERMANN, F . : P r o b l e m e bei d e r Messung v o n Einstellungs-
änderungen I — Grundlegende Fragen und Konzepte Ethnische Identifikation
127
UPMEYER, A . :
143
Empirie BRAUNE, P., BODEN, U . , BORTZ, J . & FRANKE, J . : D e r E i n f l u ß v o n T a g e s z e i -
tungen auf die Bewertung eines aktuellen politischen Ereignisses Die Dimensionalität kognitiver Repräsentation sozialer Objekte: Informationsverarbeitung in Relation zu politischer Haltung LÖSEL, F . & WÜSTENDÖRFER, W . : Persönlichkeitskorrelate delinquenten Verhaltens oder offizieller Delinquenz? PIEHL, J . : Zusammenhang zwischen wiederholter Reizdarbietung und Wertakzentuierung - Artefakte der Versuchsanordnung?
154
LANTERMANN, E . - D . :
168 177 192
Diskussion KAISER, G.: Die Frage nach der Persönlichkeit des Rechtsbrechers heute . . NAATZ, T . : Das Problem der Wahrnehmungsakzentuierung — ein psychologisch fruchtbares Feld?
198 202
Literatur Neuerscheinungen Titel und Abstracta
207 209
Autoren
210
Vorankündigungen
211
Mitteilung
212
Copyright 1 9 7 6 by Verlag Hans Huber Bern Stuttgart Wien Druck: Lang Druck AG, Liebefeld-Bern Printed in Switzerland Library of Congress Catalog Card Number 78 - 1 2 6 6 2 6 Die Zeitschrift fir Sozialpsychologie wird in Social Sciences Citation Current Contents/Social and. Behavioral Sciences erfaßt.
Index
(SSCI)
und
Zeitschrift für Sozialpsychologie 1976, 7, 1 2 7 - 1 4 2
127
Theorie Probleme bei der Messung von Einstellungsänderungen I — Grundlegende Fragen und Konzepte MONIKA KNOPF, FRANZ PETERMANN
Psychologisches Institut der Universität Heidelberg
Die Messung von V e r ä n d e r u n g e n w u r d e in der Vergangenheit im Bereich der Sozialpsychologie k a u m diskutiert, o b w o h l die meisten Fragestellungen sich mit d e m Wandel von M e r k m a l e n , Einstellungen, etc. beschäftigten. Als ein Paradigma der V e r ä n d e r u n g s m e s s u n g in der Sozialpsychologie wird die Einstellungsforschung (attit u d e change) angesehen. Zunächst w e r d e n e x p e r i m e n telle Fehlerquellen vorgestellt. Die zentrale Rolle n i m m t die Beschreibung der Veränderungsmessung im R a h m e n der klassischen T e s t t h e o r i e ein; hier w e r d e n Meßprobleme (Reliabilität unterschiedlicher V e r ä n d e r u n g s m a ß e , Reliabilitäts-Validitäts-Dilemma, etc.) ausführlich diskutiert.
The m e a s u r e m e n t of change has seldom b e e n discussed in social psychology, t h o u g h m a n y of its research p r o b l e m s have been c o n c e r n e d with change of social a t t r i b u t e s , att i t u d e s and structures. T h u s , a t t i t u d e change is seen as a paradigm f o r m e a s u r e m e n t change in social p s y c h o l o gy. First, various sources of e x p e r i m e n t a l e r r o r variance are identified. A central place is given t o m e a s u r e m e n t change within classical test t h e o r y , a n d m e a s u r e m e n t p r o b l e m s (like t h e reliability of various change measures, the reliability-validity-dilemma, etc.) are f u l l y discussed.
gen, so erkennt man, daß Mehrzeitpunktanalysen an Bedeutung gewinnen (NESSELROADE & REESE 1 9 7 3 ) . So stellt CATTELL ( 1 9 6 6 ) anhand einer ZuVeränderungsmessungen werden in allen Bereifallsauswahl von 100 Zeitschriftenartikeln fest, daß chen der Sozialwissenschaften durchgeführt in über 50% von ihnen sich mit Veränderungsmessung der Absicht, den Wandel von psychischen Merkmalen, kognitiven Zuständen und Verhaltenswei- befaßten. Dieses starke Interesse an Mehrzeitpunktuntersuchungen ist vor allem in den letzten zwanzig sen einer Person zu beschreiben. Damit steht in Jahren zu beobachten, obwohl sie schon etwa seit der Veränderungsmessung die Analyse der intra1 0 0 Jahren bekannt sind (vgl. etwa GALTON 1 8 8 3 ) . individuellen Struktur und Variabilität im Vordergrund. Im vorliegenden Übersichtsreferat wer- Durch diese komplexeren Analyseformen wurde denbeispielhaft anhand der Einstellungsforschung erst die Grundlage für differenziertere Fragestellungen in den Verhaltenswissenschaften geschaffen. die grundlegenden Probleme der Veränderungsmessung diskutiert. Die dargestellten ÜberlegunEine Literaturdurchsicht ergibt, daß Verändegen können jedoch auf Fragestellungen der Verrungsmessung in den einzelnen Bereichen der Soänderung, des Wandels im allgemeinen übertrazialwissenschaften mit unterschiedlichen Begrifgen werden. Das hier diskutierte Problem der fen beschrieben wird. So erscheinen die Termini Messung von Veränderungen ist ein grundsätz- Längsschnittstudie (BALTES 1 9 6 8 ; BALTES & liches, das alle Bereiche der Sozialwissenschaften NESSELROADE 1 9 7 2 ) betrifft. Prozeß- und Erfolgsforschung (BASTINE 1970) Teilt man psychologische Untersuchungen in - V e r l a u f s f o r s c h u n g (FAHRENBERG 1 9 6 7 , 1 9 6 8 , Einzeitpunkt- und Mehrzeitpunktuntersuchun1 9 6 9 ; FAHRENBERG & MYRTEK 1 9 6 7 ) Einleitung
128 - Zeitreihenanalyse
Knopf & Petermann: Einstellungsänderungen 1
1968, p.46f.). Wir wollen in zwei Kapiteln zur Messung bzw. Wahl des Verändeund rungsindexes und zur Auswertung diskutieren, - Panelstudie (NEHNERAJSA 1 9 7 4 ) . welche Fehler sich durch die Korreliertheit der Messungen in Mehrzeitpunktuntersuchungen, auf der Stufe der Meßwerterhebung und Wir wollen hier den Begriff der MehrzeitpunktAuswertung, einstellen. untersuchung und/oder den der Veränderungs— auf der Interpretationsstufe die Notwendigmessung verwenden. keit der Beschreibung von latenten Verläufen, Spezielle meßtheoretische Überlegungen oder die nur anhand von beobachtetem Geschehen besondere Untersuchungsstrategien für Mehrzeiterfolgen kann. Die besondere Schwierigkeit punktuntersuchungen, im Gegensatz zu Einzeitder Veränderungsmessung besteht hierbei in punktuntersuchungen, wurden erst in neuerer der Wahl eines Untersuchungsmerkmals, das Zeit entwickelt (vgl. hierzu Kapitel zu neueren sowohl über einen ausgedehnten UntersuchungsEntwicklungen und Konzepten der Veränderungszeitraum operationalisierbar sein, als auch über messung). Abgesehen davon kann die typische den gesamten Zeitraum den Änderungsverlauf Mehrzeitpunktuntersuchung als .Zusammenfastypisch repräsentieren muß. Wir wollen die sung von mehreren Einzeitpunktuntersuchungen' Diskussion dieses Problems ebenfalls aufnehaufgefaßt werden. Analog zu Einzeitpunktuntermen. suchungen gelten für sie (CAMPBELL 1 9 5 7 , 1 9 5 9 , 1 9 6 3 ;
NOVICK
CAMPBELL & STANLEY 1 9 7 0 ; FAHRENBERG 1 9 6 8 )
— auf der Planungsstufe die Forderungen nach einem Design, das die optimale Kontrolle von Störfaktoren ermöglicht: die Entwicklung der abhängigen Variable muß im gesamten Untersuchungszeitraum unter der Kontrolle des Experimentators stehen. Im folgenden seien zunächst Fehlerquellen diskutiert, die im besonderen Maß als Ergebnis des ausgedehnten Untersuchungszeitraums und der Anzahl der Meßwiederholungen zu erwarten sind. Sie können als wesentliche Störgrößen des experimentellen Arbeitens bei Mehrzeitpunktuntersuchungen angesehen werden. — auf den Stufen der Meßwerterhebung und Auswertung die Axiome der Klassischen Testtheorie, die auf der Zerlegung des beobachteten Meßwerts x ; in einen wahren Merkmalsanteil Xj und einen Fehleranteil fußen. Bekanntlich lassen sie sich folgendermaßen zusammenfassen: „Der durchschnittliche Meßfehler jeder beliebigen Population oder Teilpopulation Pist Null, der Meßfehler ist mit dem wahren Testwert unkorreliert, und auch die Meßfehler verschiedener Tests sind unkorreliert, sofern die Tests experimentell unabhängig vorgegeben werden" (FISCHER 1974, p. 31 f.). Gegen die Prämisse der experimentellen Unabhängigkeit der Einzelbeobachtungen wird durch die wiederholte Testung in Mehrzeitpunktuntersuchungen, die in aller Regel mit ein- und demselben Test durchgeführt werden, verstoßen (vgl. L O R D &
Experimentelle Fehlerquellen und Untersuchungs- Design Eine grundsätzliche Erörterung der experimentellen Fehler erfolgte in der Experimentalpsychologie (Cox 1 9 6 1 ; CAMPBELL 1 9 6 3 ; BREDENKAMP 1 9 6 9 ; CAMPBELL & STANLEY 1 9 7 0 ; KLAUER 1 9 7 3 )
und andererseits im Rahmen der psychologischen Diagnostik (COHEN 1 9 6 2 ; ROSENTHAL 1 9 6 3 , 1 9 6 4 ; SADER & KEIL 1 9 6 6 ; HARTMANN 1 9 7 0 ; WINE 1 9 7 1 ) . Es würde den Rahmen dieses Übersichtsreferates sprengen, die Diskussion in ihrer gesamten Breite erneut aufzunehmen. Als extrem zeitabhängige oder meßprozeßabhängige Fehler und damit als bedeutsamste experimentelle Fehler für Mehrzeitpunktuntersuchungen wollen wir festhalten:
— Selektive Ausgangsstichprobe — Stichprobenveränderungen — Zeit als Störfaktor — Testungseffekte und — Einflüsse des Meßinstruments. Selektive
Ausgangsstichprobe
Da Veränderungsmessungen erhebliche Anforderungen an die Kooperations- und Testfreudigkeit der Untersuchungsteilnehmer stellen, zeichnen
129
Z e i t s c h r i f t für S o z i a l p s y c h o l o g i e 1 9 7 6 , 7 , 1 2 7 - 1 4 2
sich die Teilnehmer von MehrzeitpunktuntersuZeit als Störfaktor chungen häufig durch das Attribut der ,expliziten Freiwilligkeit zur Teilnahme' aus. R O S E ( 1 9 6 5 ) Hier handelt es sich u m eine Diskussion, die von u n d ROSENTHAL & ROSNOW ( 1 9 6 9 , p p . 6 1 f f . ) a r G A L T U N G (1967), K U B I E ( 1 9 7 3 ) u n d R E N N ( 1 9 7 3 ) beiteten die Merkmale von freiwilligen Untersugeführt wurde. Den A u t o r e n erschien wichtig chungsteilnehmern heraus und machen die Einge- herauszustellen, welche Bedeutung die Wahl des schränktheit deutlich, solche Befunde auf andeUntersuchungszeitraums für die Erfassung des re Populationen generalisieren zu können. Änderungsverlaufs hat. So bringt ein zu kurz geEine aus ökonomischen und organisatorischen wähltes Zeitintervall mit sich, daß sich in den Erfordernissen häufig praktizierte Vorgehenswei- Messungen ein noch nicht abgeschlossener Prose, schon mit kleinen Stichprobenumfängen eine zeß niederschlägt u n d eine zu lang gesetzte ZeitMehrzeitpunktuntersuchung zu starten, wird von spanne, daß die Meßergebnisse des zu untersuK L A U E R ( 1 9 7 3 ) in zweifacher Hinsicht kritisiert. chenden Prozesses durch einen wieder angelauZum einen k ö n n e n Befunde aus kleinen Unterfenen neuen Prozeß, der im R a h m e n der jeweisuchungseinheiten nur geringe Repräsentativität ligen Untersuchung nicht interessiert, k o n f u n für Populationen beanspruchen, zum anderen diert werden. bedingen sie die Wahl von weniger aussagekräftiDie Wahl des jeweiligen Zeitintervalls zwischen gen Signifikanztests bei der Hypothesenprüfung den Messungen m u ß letztlich vom theoretischen ( v g l . KELLERER 1 9 7 0 ; COCHRAN
1972).
Das Interesse zur Veränderungsmessung an Personen, die zu Beginn der Untersuchung eine extreme Ausprägung der abhängigen Variable aufweisen (vgl. BETTELHEIM & JANOWITZ 1 9 5 0 ) wurde von CAMPBELL & STANLEY ( 1 9 7 0 ) kritisiert. Ergebnisse solcher Untersuchungen sind für Regressionsartefakte besonders anfällig.
Stichprobenveränderung
Hintergrund jeder Untersuchung abhängen (vgl. R E N N 1973, p . 4 0 f . ) . Für die Vielfalt sozialpsychologischer Theorien zur Einstellungsänderung ( v g l . HIMMELFARB & E A G L Y 1 9 7 4 ; INSKO 1 9 6 7 ;
et al. 1969) k a n n damit keine generelle Richtlinie zur Wahl der Meßmodalitäten bestehen. Neben dem Problem des ,Timing', d.h. der Wahl der Meßzeitpunkte für die Wiederholungsmessungen, treten in längeren Untersuchungszeiträumen Phänomene der ,Reifung' (vgl. CAMPKIESLER
BELL & STANLEY 1 9 7 0 ; K L A U E R 1 9 7 3 ) a u f , d i e
Wie bereits erwähnt, erfordern Mehrzeitpunktuntersuchungen ein relativ hohes Engagement von seiten der Versuchspersonen über einen größeren Zeitraum. Dieses Interesse kann nicht bei allen Untersuchungsteilnehmern in gleichem Maß vorausgesetzt werden. Neben dem Ausscheiden aus Desinteresse ( „ r e f u s e r " ) k o m m t es aber auch zum Ausscheiden aus äußeren Gründen, wie Wohnungs-, Schul- oder Berufsortwechsel. Diese Selektion wirkt sich bekanntlich solange nicht verfälschend auf die Untersuchungsergebnisse aus — abgesehen von der Minderung der Aussagekraft durch Stichprobenverkleinerung — wie kein systematisches Ausscheiden vorliegt. Die verschiedenen Strategien zur Behandlung von selektiv verzerrtem Datenmaterial wurden von Ü B E R LA ( 1 9 7 5 ) kritisch betrachtet und durch einen Vorschlag ergänzt: die Gesamtstichprobe sollte durch Bildung von Untergruppen in homogenere Einheiten zerlegt werden, über die eine Schätzung der fehlenden Werte vorgenommen werden kann.
sich in der abhängigen Variablen d o k u m e n t i e r e n können. Die daraus resultierende Verzerrung des tatsächlichen Änderungsverlaufs kann durch .zwischenzeitliches Geschehen' (CAMPBELL & S T A N LEY 1970) n o c h verstärkt werden.
Testungseffekte Hierunter lassen sich die Einflüsse der Versuchsperson, des Versuchsleiters und deren Interaktion zusammenfassen. Im einzelnen sind zu nennen: — Wirkungen, die auf die Messung zurückzuführen sind: H a w t h o r n e - E f f e k t (vgl. etwa BLUM & N A Y L O R 1968, p p . 3 0 6 f f . ) , Testerfahrung durch vorhergegangene Testungen in Mehrzeitpunktuntersuchungen (testsophistication; vgl. etwa Sensibilisierung durch
130
Knopf & Petermann: Einstellungsänderungen I
Vortests - pretest-sensitation; vgl. L A N A 1969) — Zeiteffekte, instrumentelle Fehler und Stichprobenveränderungen sind dagegen primär eiund ne Funktion des Untersuchungszeitraums. Sie Sättigung und Motivationsverlust durch wiesteigen mit zunehmender Untersuchungsdauderholte Messungen. er in nicht vorhersehbarem Ausmaß an. Da ge— Wirkungen, die entweder dem Versuchsleiter genläufige Störgrößen wirksam sein können oder der Versuchsperson zuzuschreiben sind: (z.T. Testerfahrung vs. Sättigung), können Fehverbale Konditionierung (vgl. etwa TIMEAUS lerbeträge zwischen einzelnen Meßzeitpunkten 1974), zudem erheblich variieren. Versuchsleitereffekt ( R O S E N T H A L 1 9 6 4 ) , spezifische Reaktionen oder Prädispositionen Solche Erkenntnisse können allerdings nur von seiten der Versuchsperson wie Testangst, grobe Richtlinien für die Bedeutung von experiAusmaß an Ego-Involvement (vgl. HARTMANN mentellen Fehlern in Mehrzeitpunktuntersuchun1 9 7 0 ; SADER & K E I L 1 9 6 6 ) u n d gen darstellen. Jedoch scheinen vor allem für FeldTäuschungsversuche (GRABITZ-GNIECH 1 9 7 2 ) . experimente (vgl. BREDENKAMP 1 9 6 9 ; PAGES 1 9 7 4 ) keine besseren Strategien verfügbar, experimentelle Störeinflüsse abzuschätzen. Einfluß des Meßinstruments NAMBOODIRI ( 1 9 7 2 ) stellt die Verfahrensweisen zur Bestimmung von Zeiteffekten in LaborunterFragebogen als Kriterienmeßinstrumente verliesuchungen vor. Mit Hilfe von ausbalancierten Deren durch ,ceiling'-Effekte die Fähigkeit, Ändesigns können Treatment-Effekte kontrolliert werrungen präzise wiederzugeben, wenn im Unterden, die von einem Meßzeitpunkt in den nächsuchungszeitraum Wandlungen aufgetreten sind, sten verschleppt werden („carry-over-effects"). die bei der Wahl des Fragebogens nicht berückDie Untersuchung einer großen Stichprobe ist sichtigt wurden. Das Problem der Reliabilität hierfür Voraussetzung. WILLIAMS ( 1 9 5 0 ) schließund Validität von Paper-and-Pencil-Tests für Mehrlich weist auf eine Strategie hin, auch weiterreizeitpunktuntersuchungen sei an dieser Stelle auschende „carry-over-effects" von den jeweiligen geklammert. Es soll im Rahmen der Erörterung Behandlungseffekten zu trennen. Damit scheides Reliabilitäts-Validitäts-Dilemmas zur Sprache nen die Möglichkeiten, in Mehrzeitpunktunterkommen. suchungen präzise Schätzungen von experimenWenn Änderungsbeträge von Beurteilern eintellen Störgrößen vorzunehmen, ebenfalls ergeschätzt werden, sind Fehler dadurch zu erwarschöpft. ten, daß ein objektiver Beurteilungsmaßstab über längere Zeiträume nicht ohne weiteres aufrecht erhalten werden kann. Mit Halo-Effekten, logiMessung und Wahl des Veränderungsindexes schen Fehlern, Nachsichtigkeits- oder Mildefehlern ist zu rechnen (vgl. HERRMANN 1 9 6 9 , pp. Die Registrierung von Merkmalsveränderungen 1 6 5 f f . ; CRONBACH 1 9 7 0 ) . über mehrere Untersuchungszeitpunkte ist solange problemlos durchzuführen, wie die vorgenannten experimentellen Fehler keinen Beitrag zur Resümee Variation der Merkmalsausprägungen bedingen. Für diesen Fall bietet sich der DifferenzändeZur Bedeutung der vorgenannten wichtigsten exrungsscore (dj = Xj — yj) zur Abbildung der sich perimentellen Fehlerquellen für Mehrzeitpunktändernden latenten Merkmalsdimension an. Von untersuchungen kann zusammenfassend festgeeinzelnen psychophysiologischen Messungen abstellt werden: gesehen (vgl. FAHRENBERG 1967), finden sich der— Testungseffekte treten vornehmlich als Funk- artig meßprozedur- und zeitunabhängige Merktion der Anzahl der Meßwiederholungen auf. malsentwicklungen in der psychologischen ForSie sind durch eine Verlängerung des Zeitraums schung nicht. In einer Reihe von Ansätzen zur zwischen zwei Meßzeitpunkten zu minimieren Bestimmung von Veränderungsbeträgen kommt (vgl. F I N N E Y 1964; COCHRAN & Cox 1968). das Ringen um einen adäquaten psychologischen
131
Z e i t s c h r i f t für S o z i a l p s y c h o l o g i e 1 9 7 6 , 7 , 1 2 7 - 1 4 2
Änderungs-Index zum Ausdruck. Einzelne Strategien seien an dieser Stelle kritisch beleuchtet.
Differenz-Änderungsscores Betrachtet man zwei aufeinanderfolgende Zeitp u n k t e der Datenerhebung, so erhält man als Differenz zwischen dem Ausgangswert x ( u n d dem Meßwert der Wiederholungsmessung y j die Meßwertveränderung d.. FAHRENBERG ( 1 9 6 8 ) , BASTINE ( 1 9 7 0 ) u n d CRONBACH & F U R B Y ( 1 9 7 0 )
arbeiteten die Schwächen dieses Indexes für die psychologische Veränderungsmessung heraus. Von den fünf bei FAHRENBERG ( 1 9 6 8 , p. 5 9 f.) diskutierten Problemen, die dieses Maß als Indikator der wahren Veränderung bei psychologischen Mehrzeitpunktuntersuchungen birgt, sei hier lediglich eines erörtert. Demnach zeigt der Differenz-Änderungsscore gravierendste Fehleinschätzungen des wahren Änderungsbetrages für diejenigen Personen, die in der Ausgangsmessung extreme Merkmalsausprägungen aufweisen. Analysiert man das Veränderungsgeschehen in den Extremgruppen einer Untersuchungspopulation, so zeigt sich, daß Personen mit hohen Ausgangswerten in der Zweitmessung niedrigere Werte erzielen. Umgekehrt erreichen Personen mit niedriger Merkmalsausprägung in der Erstmessung im allgemeinen in der Zweitmessung höhere Merkmalsausprägungen (vgl. auch graphische Darstellung von L O R D 1 9 6 3 ) . Dieses Phänomen wurde bekanntlich als Regressionseffekt bezeichnet. Das A u f t r e t e n von Regressionseffekten bei Wiederholungsmessungen in Extremgruppen wird über die Fehlerhaftigkeit der Einzelmessung erklärt. Versuchspersonen, die in der Ausgangsmessung eine extrem niedrige Merkmalsausprägung aufweisen, weisen mit großer Wahrscheinlichkeit nicht eine wahre Merkmalsausprägung in dieser Größe auf, sondern m u ß t e n einen Fehleranteil hinnehmen, der die Merkmalsausprägung zusätzlich in die extreme Richtung verzerrte. Bei einer Wiederholungsmessung ist es wenig wahrscheinlich, daß Meßfehler in gleicher Richtung und Größe erneut a u f t r e t e n . Der Meßwert dieser Versuchsperson wird sich deshalb aufgrund statistischer Prinzipien in der Wiederholungsmessung erhöhen. Analog gilt dieses Erklärungsprinzip für Versuchspersonen, die einen extrem h o h e n Ausgangswert aufweisen.
H U N T E R & COHEN ( 1 9 7 4 ) demonstrieren Regressionsartefakte im Bereich der Einstellungsforschung. In einer empirischen Untersuchung fanden sie, d a ß unkorrigierte Differenz-Änderungsscores Einstellungsänderungen anzeigen, wie sie mit der „ i n f o r m a t i o n processing t h e o r y " (a.a.O., p . 4 4 6 f . ) erklärt werden k ö n n e n , während die wahren Veränderungsscores der gleichen Daten Änderungsbeträge anzeigen, wie sie durch die „reinforcement t h e o r y " (a.a.O., p . 4 4 6 f . ) erklärt werden müssen. Die Kontroverse zwischen CAMPBELL & ERLEBACHER (1970a, 1970b), CICIRELLI (1970) u n d EVANS & SCHILLER (1970) u m die Evaluation eines kompensatorischen Trainingsprogramms demonstriert die gleiche Problematik im Bereich der pädagogischen Forschung. COLEMAN ( 1 9 6 8 , p . 4 3 8 f . ) stellt die Richtigkeit des Erklärungsprinzips für den Regressionseffekt in Frage. Da Regressionseffekte auch bei Wiederholungsmessungen von exakt quantifizierbaren Variablen a u f t r e t e n (z. B. Wiederholungsmessungen des Körpergewichts) scheint die Fehlerhaftigkeit der Messungen nicht die wirkliche Ursache für die Regression von Wiederholungsmeßwerten zum Mittelwert der Population. Allzu leicht scheinen statistische Wirkmechanismen angen o m m e n worden zu sein, wo es nicht gelang, Veränderungsprozesse wirklich zu beschreiben. Nach COLEMAN ( 1 9 6 8 ) kann dies freilich nur gelingen, wenn einfache Veränderungsmaße, wie das Differenz-Änderungsmaß, durch prozeßadäquatere ersetzt werden.
Korrelationsmaße Bereits THORNDIKE (1924) kritisierte ein Änderungsmaß, das sich unmittelbar aus dem Differenz-Änderungsindex herleiten läßt: die Korrelation zwischen der Ausgangsmessung x ( und dem Differenz-Änderungsscore d j (r Xjdi ). Dieser Korrelationsindex berücksichtigt weder den Fehleranteil in den Einzelerhebungen Xj bzw. x^ und yt bzw. y^, noch korrigiert er die Abhängigkeit der beiden aufeinanderfolgenden Messungen voneinander bzw. die Korreliertheit der Fehleranteile der beiden Einzelerhebungen (vgl. auch BEREITER 1963; O ' C O N N O R 1972a, p . 7 5 ) . Ein Korrelationsindex erbringt beispielsweise immer dann einen in negativer Richtung verzerr-
132
ten Änderungsbetrag, wenn bereits in der Ausgangsmessung Meßfehler enthalten sind. Dieser Fehler der Ausgangsmessung erscheint in der Wiederholungsmessung in umgekehrter Richtung und läßt das Korrelationsmaß zu niedrig ausfallen. Wie BEREITER ( 1 9 6 3 , p. 7) anhand einer Literaturdurchsicht zur Veränderungsmessung feststellt, basieren die Mehrzahl der Untersuchungen zur Beurteilung von Veränderungsbeträgen auf korrelativen Veränderungsmaßen.
Regressionsmaße sowie WISEMAN & n e h m e n eine Korrektur der Meßfehler in den Einzelerhebungen vor, bevor sie den Änderungsbetrag bestimmen. Statt der fehlerhaften Ausgangsmessung x i ; legen sie den über eine Regressionsschätzung ermittelten wahren Ausgangswert Xj der Schätzung des Änderungsbetrages zugrunde. Als Änderungsindex wählten sie demnach einen korrigierten Korrelationskoeffizienten ( r _ y). L O R D ( 1 9 5 8 , 1 9 6 3 ) kritisierte diese Vorgehensweise, da x und y wie unabhängige Einzelmessungen behandelt werden und die Korreliertheit der Beobachtungen keine Berücksichtigung findet. Er weist darauf hin, daß beide Einzelbeobachtungen Xj und yj immer dann Informationen über den wahren Merkmalsanteil der Ausgangsmessung Xj enthalten, wenn die Korrelationen zwischen den wahren Merkmalsanteilen (r X Y ) ungleich Null ist. Mit einer gesonderten Schätzung der wahren Ausgangswerte X läßt sich demnach keine Bestimmung der wahren Merkmalsänderung vornehmen. Er entwickelte auf der Basis einer multiplen Regression ein Schätzverfahren, in dem die beiden abhängigen Messungen x und y über Partialkorrelationen als Bestimmungsstücke der Veränderung berücksichtigt werden. TRIMBLE & CRONBACH ( 1 9 4 3 ) WRIGLEY ( 1 9 5 3 )
CRONBACH & F U R B Y ( 1 9 7 0 , p. 7 2 ) beurteilten die Schätzgenauigkeit der drei genannten Regressionsansätze zur Bestimmung der wahren Merkmalsänderung. Den wahren Änderungsbetrag D errechneten sie aus korrigierten, unkorrelierten Messungen. Sie kamen zu dem Ergebnis, d a ß die Korrelation r^ D von Verfahren (1) nach (3) größer wird u n d daß das mittlere Quadrat (D - D) 2 von Verfahren (1) nach (3) klei-
K n o p f & P e t e r m a n n : Einstellungsänderungen I
ner wird. Damit kann das LoRD-Verfahren als die beste Regressionsschätzung gelten, wenn aus abhängigen Messungen x und y der Änderungsbetrag f) bestimmt werden soll. Kritisiert wurde das LoRD-Verfahren von CRONBACH & F U R B Y ( 1 9 7 0 ) deshalb, weil es eine Korrelation der Veränderungsbeträge mit bedeutsamen Drittvariablen nicht vorsieht ( so etwa Determinanten der Einstellungsänderung, Moderatoren der Einstellungsänderung). So weisen H U N T E R & COHEN ( 1 9 7 4 ) darauf hin, d a ß zur Überprüfung der gängigen theoretischen Konzepte zur „attitude-change" methodische Verfahren notwendig sind, die neben dem Ausgangsstatus x und der Wiederholungsmessung y zwei Außenvariablen verarbeiten k ö n n e n . Am Beispiel der Kongruenztheorie ( O S G O O D , T A N NENBAUM & Suci 1 9 5 7 ) sind dies: die anfängliche Attitüde des Probanden (x bzw. X), der Inhalt der Botschaft (UV,), die Glaubwürdigkeit des K o m m u n i k a t o r s (UV 2 ) u n d die resultierende Einstellung des Probanden (y bzw. Y). C R O N BACH & F U R B Y ( 1 9 7 0 ) entwickelten einen erweiterten Regressionsansatz, in dem zwei Außenvariablen w und z, die zeitgleich mit x u n d / o d e r y erhoben werden, mit in die Schätzung des Änderungsbetrags eingehen. Die Schätzung der Änderungsbeträge nach CRONBACH & F U R B Y (1970) wird wie folgt durchgeführt: D = b t x + b2y + b3w + b4z Die Regressionsgewichte b , , b 2 , b 3 und b 4 werden so bestimmt, daß die Varianz der Differenz D — D ein Minimum erreicht. Die Korreliertheit der abhängigen Variablen wird erneut über partielle Korrelation vor der Bestimmung der Regressionsgewichte berücksichtigt. Dieses Verfahren erlaubt bislang die theorieadäquatesten Schätzungen von Änderungsbeträgen mit Hilfe eines Regressionsansatzes. Gegenüber anderen Regressionsstrategien hat es den Vorteil, komplexe theoretische Fragestellungen prüfbar zu machen, da Drittvariablen als Änderungsagenten berücksichtigt werden k ö n n e n . Und doch zeigt dieser methodisch weit entwikkelte Ansatz eine grundlegende Schwierigkeit der Änderungsmessung. Es stellt sich die Frage nach den jeweils bedeutsamen Drittvariablen. Von der Beantwortung dieser Frage hängt es ab, welche Zusammensetzung die Regressionsglei-
133
Z e i t s c h r i f t für S o z i a l p s y c h o l o g i e 1 9 7 6 , 7 , 1 2 7 - 1 4 2
chung erhält und welcher Änderungsbetrag letztlich resultiert.
Residual-Änderungsmaße Bereits WOODROW (1946) k o n n t e zeigen, daß Differenz-Änderungsmaße erstaunlicherweise häufig nur Nullkorrelationen mit hypothetisch für den Änderungsprozeß wichtigen Außenvariablen aufweisen. Auf diesem Befund f u ß t die Entwicklung von Residualmaßen in der Veränderungsmessung. D u B o i s ( 1 9 5 7 ) , L O R D (1958, 1963), M A N N I N G & Du Bois (1958, 1962) und D u B o i s & M A N N I N G (1961) erbrachten Hinweise dafür, daß sich die erwarteten Korrelationen dann nachweisen lassen, wenn als Änderungsindex ein Residuum (g = y.x) gewählt wird. BEREITER ( 1 9 6 3 ) b e t o n t , daß trotz dieser erwarteten Korrelationen dem Residual-Änderungsm a ß keine a-priori-Überlegenheit über andere Änderungsmaße z u k o m m e n kann. Er charakterisiert die Situation eines Untersuchers, der die Wahl hat zwischen dem Differenz-Änderungsscore und dem Residual-Änderungsindex als „over-correction-under-correction d i l e m m a " (vgl. BEREITER 1963, p.8). Bestimmt er den Änderungsbetrag über ein Differenz-Änderungsmaß, so resultieren negative Korrelationen zwischen dem Änderungsbetrag und bedeutsamen Drittvariablen, sobald die Drittvariablen mit dem Ausgangsstatus der abhängigen Variablen teilweise korreliert. Eine solche Korrelation zwischen Ausgangsstatus und Drittvariablen ist jedoch geradezu ein Indikator für die Bedeutsamkeit der Außenvariablen. Die unerwartet niedrige oder negative Korrelation zwischen Differenz-Änderungsmaß und relevanter Drittvariablen ist demnach ein Ergebnis einer ungewöhnlich starken Korrektur des wahren Ausgangsstatus X durch das Differenz-Änderungsmaß („over-correction"). Wählt er im Gegensatz dazu ein Residual-Änderungsmaß zur Bestimmung des Änderungsbetrages, so ergeben sich positive Korrelationen zwischen dem Änderungsbetrag und relevanten Drittvariablen, wenn die Drittvariablen mit dem Ausgangsstatus der abhängigen Variablen positiv korreliert. Der wahre Ausgangsstatus wird durch das Residual-Änderungsmaß nur wenig korrigiert („under-correction").
TUCKER, D A M A R I N & MESSICK (1966) entwikkelten die zunächst vorliegenden Residual-Änderungsmaße, die sämtlich auf unkorrigierten Einzelbeobachtungen (d = y.x) a u f b a u t e n , weiter. Mit dem „base-free measure of c h a n g e " konstruierten sie einen Änderungsindex, indem die wahre Ausprägung der Merkmale zum Zeitpunkt der Ersterhebung (X) bei den nachfolgenden Beobachtungen auspartialisiert wird. Obwohl auch BEREITER ( 1 9 6 3 ) forderte, daß eine Minderungskorrektur der Ausgangsbeobachtungen für die Änderungsmessung von primärer Bedeutung ist, blieb das „base-free measure of c h a n g e " nicht lange unkritisiert. O ' C O N N O R (1972a, p. 78) bezeichnet es als eine hybride Merkmalskombination, da es aus unkorrigierten Beobachtungswerten z u m Zeitpunkt der Nachmessung (y) und minderungskorrigierten Werten zum Zeitpunkt der Ersterhebung (X) gebildet wird. Der resultierende Änderungsbetrag sei daher weder eine Schätzung einer wahren Merkmalsänderung, noch ein Abbild der Veränderung in reinen Beobachtungswerten.
Eine erneute Modifikation des Residual-Änderungsmaßes nehmen CRONBACH & F U R B Y (1970) vor. Analog zu ihrem Differenz-Änderungsmaß berücksichtigen sie auch im ResidualÄnderungsmaß zwei Außenvariablen über ihren minderungskorrigierten Anteil (W, Z). Die Korreliertheit der Einzelbeobachtungen wird über Partialkorrelationen bei der Schätzung des Änderungsbetrages berücksichtigt. Die Schätzung der wahren Merkmalsänderung erfolgte zunächst über eine schrittweise Auspartialisierung der korrigierten Variablen (Y.XW). O ' C O N N O R (1972b) veränderte die Schätzformel dahingehend, daß der Änderungsbetrag über eine gleichzeitige Auspartialisierung des Ausgangsstatus X und der Drittvariablen W errechnet wird. Die residuale Schätzung der Veränderung lautet demnach: Y. XW = b , x + b 2 y + b 3 w + b 4 z. Dieses Residual-Änderuqgsmaß teilt die Schwächen des Differenz-Änderungsmaßes von CRONBACH & F U R B Y (1970). Auch hier entsteht das Problem der Auswahl von relevanten unabhängigen Variablen, von denen das Änderungsergebnis determiniert wird. CRONBACH & F U R B Y (1970) sehen sich nicht imstande, einen Ände-
134 rungsindex zu erstellen, mit dem Änderungsbeträge in ihrer wahren Größe bestimmt werden könnten. Sie empfehlen stattdessen ein Ausweichen auf experimentelle Vorgehensweisen, die ohne Wiederholungsmessungen auskommen. Beispielsweise sollte die Fragestellung „Welche Auswirkungen hat ein Treatment auf die Merkmalsausprägung in einer Untersuchungspopulation? " ersetzt werden durch die Fragestellung „Welchen Effekt hat ein Treatment auf die Merkmalsausprägung in einer Untersuchungspopulation, verglichen mit seinen Effekten in einer anderen Population? " Uber vollständige Randomisierung zweier Vergleichsgruppen kann die Ausgewogenheit der Ausgangsscores und der Meßfehler in beiden Stichproben erzielt werden, so daß die Treatment-Effekte ohne problematische Wiederholungsmessungen zu bestimmen sind.
Veränderungsmessung mit Hilfe von Paralleltests Gemäß der Definition von parallelisierten Testverfahren erfassen diese jeweils gleiche Inhaltsbereiche. Im Gegensatz zu den abhängigen, korrelierten Beobachtungen bei wiederholtem Einsatz von ein- und demselben Meßinstrument, ermöglichen sie die Bestimmung von unabhängigen Merkmalsgrößen zu den verschiedenen Untersuchungszeitpunkten. Eine unproblematische Erfassung von Änderungsbeträgen ist demnach immer dann zu erreichen, wenn soviele parallelisierte Testverfahren zur Verfügung stehen, wie Untersuchungszeitpunkte vorgesehen sind. Der Mangel an Paralleltests verhindert jedoch im allgemeinen diese naheliegende Untersuchungsstrategie bei der Bestimmung von Veränderungen. CATTELL und Mitarbeiter (CATTELL et al. 1961) konstruierten beispielsweise für Verlaufsuntersuchungen zur Persönlichkeitsentwicklung acht Parallelformen zu einem Persönlichkeitstest. MEFFERD und Mitarbeiter (vgl. z. B. MEFFERD e t a l . 1 9 6 5 ; MEFFERD e t a l . 1 9 6 6 ) e n t -
wickelten eine Reihe von Parallelverfahren zu unterschiedlichen Fähigkeitstests (vgl. auch THORNDIKE 1966).
Knopf & Petermann: Einstellungsänderungen I
Resümee Die vorliegenden Änderungsmaße, DifferenzÄnderungsmaß, Korrelations-Änderungsmaß, sind nicht imstande, aus korrelierten Beobachtungen in Wiederholungsmessungen die wahren Änderungsbeträge eines Merkmals herauszufiltern. Die in der Literatur vorherrschende Ansicht, daß mit zunehmender Elaboriertheit des Änderungsmaßes (z. B. Differenz-Änderungsmaß vs. Residual-Änderungsmaß) zumindest eine graduelle Verbesserung der Schätzgenauigkeit des wahren Änderungsbetrages erzielt werden kann, wird durch ein neues Ergebnis erschüttert (vgl. RICHARDS et al. 1975; RICHARDS 1975). Jedoch wird in diesen Arbeiten die Kriterienentwicklung, und mithin die Prüfgröße, gegen die einzelnen Indizes getestet wurden, nicht einsichtig. Es ist deshalb immer noch eine ungelöste Aufgabe, eine gleichzeitige Einschätzung der unterschiedlichen Änderungsmaße vorzunehmen. Als Kriterium sollte ein Änderungsverlauf, der über Paralleltests gewonnen wurde, zugrunde gelegt werden. Dies deshalb, weil Mehrzeitpunktuntersuchungen mit Paralleltests im Rahmen der klassischen Testtheorie als einzige imstande sind, wahre Änderungsverläufe erkennen zu lassen.
Auswertungsverfahren für Mehrzeitpunktuntersuchungen Nonparametrische
Tests
Die Prüfverfahren, die mit den geringsten Modellannahmen auskommen, sind bekanntlich die nonparametrischen Verfahren. Diese sind in der Veränderungsmessung immer dann zu empfehlen, wenn die Vorannahmen komplexer Prozeduren von den Daten nicht erfüllt werden (vgl. FAHRENBERG 1968, p.61). Sie erlauben eine der konservativen Vorgehensweise entsprechende Prüfung der Daten, ohne eine besondere Qualität der methodischen Auswertung vorzuspiegeln. Für die Anwendung der hier in Frage kommenden Prozeduren mit abhängigen Stichproben verweisen wir auf SIEGEL (1956) und LIENERT(1973). Wir wollen auf diese nonparametrischen Auswertungsverfahren nicht näher eingehen, sondern die komplexeren multivaria-
135
Zeitschrift für S o z i a l p s y c h o l o g i e 1 9 7 6 , 7 , 1 2 7 — 1 4 2
ten Analysen einer kritischen Diskussion unterziehen.
Pfadanalyse Die Pfadanalyse ermöglicht eine theorienahe Datenauswertung, bei der multivariate Kausalmodelle überprüft werden können. In der Mehrzeitpunktuntersuchung angewendet, kann sie die Bedeutung von theoretisch fundierten unabhängigen Variablen (Agenten der Einstellungsänderung) für abhängige Variablen (Ausprägung der Einstellung) zu unterschiedlichen Zeitpunkten erhellen (vgl. L A N D 1969; WERTS & L I N N 1 9 7 0 ; SEIBEL & N Y G R E E N 1 9 7 2 ; V E T T E R 1 9 7 2 ;
1973, pp.305ff.). Die Pfadanalyse kann aufgrund ihrer restringierenden Vorannahmen (vgl. H E I S E 1969) nur eine beschränkte Bedeutung hinsichtlich der Überprüfung von Theorien aus dem Bereich der Sozialpsychologie besitzen. Als Schwierigkeiten fuhrt H E I S E (1969) das Spezifikationsproblem an, das die Sequenz der Inputvariablen und die Eindeutigkeit der jeweiligen endogenen Variablen umfaßt. Hierbei geht als Vorbedingung eine hohe Reliabilität und Validität der endogenen Variablen und des Kriteriums ein. Solche Voraussetzungen sind im Bereich der Einstellungsforschung jedoch schwer zu erfüllen. KERLINGER & PEDHAZUR
Eine weitere Schwierigkeit sieht HEISE ( 1 9 6 9 ) im Identifikationsproblem, das sich aus der Tatsache ergibt, unbekannte Parameter (Pfadkoeffizienten) des Modells aus den verfügbaren Daten schätzen zu müssen. Grundlegende Voraussetzung hierfür ist jedoch, daß theoretisch fundierte Variablen mit Residualvariablen keine Korrelationen aufweisen und daß die Residualvariablen untereinander nicht korrelieren (KERLINGER & PEDHAZUR 1 9 7 3 ) . Die Wahrscheinlichkeit, daß diese Orthogonalität nicht vorliegt, ist immer dann groß, wenn bedeutsame Residualanteile auftreten. Die Pfadanalyse kann deshalb prinzipiell nur in solchen Bereichen zur Anwendung kommen, in denen fundierte theoretische Modelle zur Überprüfung anstehen. Für Mehrzeitpunktuntersuchungen im Bereich der Einstellungsforschung würde dies bedeuten, daß Theorien verfügbar sein müßten, die die Bedeutung einzelner Agenten der Einstellungsänderung exakt beschreiben würden. J Ä G E R & Goss-
LAR (1975) stellen die Konsequenzen von Verletzungen der vorgenannten Restriktionen dar. Hinzu kommt, daß die Pfadanalyse nur lineare, additive Kausalmodelle zu testen vermag (vgl. L A N D 1969). Komplexeren theoretischen Systemen, die etwa kurvilineare oder multiplikative Kausalbezeichnungen enthalten, wird diese Auswertungsstrategie nicht gerecht. Eine weitere bedeutsame Restriktion enthält die Methode dadurch, daß sie lediglich Einwegkausalbezeichnungen aufzudecken vermag. Interaktive theoretische Modelle, die die gegenseitige, zeitgleiche Beeinflussung von zwei Variablen enthalten, sind mit der herkömmlichen linearen, rekursiven Verfahrenweise nicht prüfbar. Die in jüngerer Zeit entwickelten nonrekursiven linearen Modelle können diesen Mangel beseitigen (vgl. V A N D E G E E R 1971, p p . 2 1 0 f f . ) . Solche Verfahren erlauben es, Zweiwegkausalbeziehungen zu untersuchen, bei denen eine abhängige Variable in bezug auf eine andere zur unabhängigen Variablen wird. Jedoch werden durch diese weit komplexeren Ansätze die sonst angesprochenen Probleme eher vergrößert denn gelöst. Somit erscheint aufgrund der spezifischen Annahmen der Pfadanalyse und aufgrund des Theoriengebäudes in der Sozialpsychologie der Einstellungsänderung, dieses Verfahren zur Beschreibung von Änderungsverläufen kaum geeignet.
Varianzanalyse Die bei W I N E R (1971, p p . 2 6 1 f f . ) dargestellte „repeated measures analysis of variance" erlaubt die Analyse von Daten, die aus Wiederholungsuntersuchungen mit einer abhängigen Variablen hervorgegangen sind. Neben der Normalverteilungsannahme und der Forderung nach Homogenität der Varianz innerhalb Zellen, verlangt diese Auswertungsstrategie die Homogenität der Kovarianzen. G A I T O & W I L E Y (1963) stellen in einem Anwendungsbeispiel dieses Prinzip, in Anlehnung an A L E X A N D E R (1946), für das einfaktorielle Design vor. Der Verlauf der abhängigen Variablen wird dadurch bestimmt, daß ihr Trend über die Zeitspanne mittels orthogonaler Komponenten errechnet wird. Sämtliche orthogonalen Komponenten, die eine signifikante Ausprägung aufweisen, zeigen in additiver Kombination die Verlaufsfunktion an. Analog lassen
136 sich zweifaktorielle und komplexere Designs analysieren, solange Varianzhomogenität und Kovarianzhomogenität vorliegt (vgl. G A I T O & WILEY 1963, p p . 6 3 f f . ) . Interessant scheint hier vor allem das Prüfverfahren von G R A N T (1962), das über die herkömmliche Signifikanzprüfung hinaus Möglichkeiten enthält, das theoretische Modell im Sinne der empirischen B e f u n d e zu verbessern. Einschränkend gilt für die vorgenannten Trendanalysen, daß sie nur theoriebezogen zum Einsatz k o m m e n sollten. Signifikante F-Werte können nur dann als echte Bestandteile der Verlaufsfunktion akzeptiert werden, wenn a priori-Hypothesen für ihre Relevanz vorliegen. Wie KOGAN (1948) und Box (1954) nachwiesen, führt vor allem die Verletzung der Bedingung Kovarianzhomogenität zur erheblichen Verfälschung der Analysebefunde. Es ist für solche Daten ein erhöhter FWert zu beobachten. G A I T O & WILEY ( 1 9 6 3 ) sowie M C C A L L & APPELBAUM ( 1 9 7 3 ) diskutieren Möglichkeiten der Auswertung von Daten aus Mehrzeitpunktuntersuchungen, in denen diese wichtigste Voraussetzung für die Varianzanalyse nicht vorliegt. Zum einen bewirken Randomisierungstechniken bzw. Matchingverfahren eine Homogenisierung der Kovarianzen, oder es kann auf die nonparametrischen Analyseverfahren ausgewichen werden. Alternativ k ö n n t e auch ein konventioneller F-Wert berechnet und dieser durch eine Reduktion der Freiheitsgrade korrigiert werden. Das Problem der adäquaten Vorgehensweise für eine solche Korrektur scheint ausdiskutiert (vgl. M C C A L L & APPELBAUM 1973, p p . 4 1 2 f f . ) . BOCK ( 1 9 6 3 ) entwickelte einen multivariaten varianzanalytischen Ansatz für Mehrzeitpunktuntersuchungen, der den Nachweis von unterschiedlichen Verlaufsentwicklungen in verschiedenen experimentellen G r u p p e n ermöglichen soll. Von den grundlegenden Einwänden, die (1968, p . 6 1 ) den parametrischen Verfahren im allgemeinen und den vorgenannten varianzanalytischen Verfahren zur Analyse von Mehrzeitpunktuntersuchungen im besonderen entgegenbringt, scheint uns einer besonders gewichtig: die Adäquanz der Normalverteilung zur CharakFAHRENBERG
Knopf & Petermann: Einstellungsänderungen 1
terisierung von Daten aus Mehrzeitpunktuntersuchungen ist umstritten. Erhebliche Verzerrungen der Verteilungsform können sich einstellen im Zusammenhang mit systematischen Drop-outs und mit Varianzveränderungen über die Zeitspanne; einen inhaltlichen Bedeutungswandel kann die ursprüngliche Normalverteilung erfahren im Zusammenhang mit Regressionseffekten und mit gegenläufigen psychologischen Vorgängen, die sich im Gesamtverlauf verlieren. Die Entwicklung von grundlegend veränderten Strategien zur Analyse von Protokollen aus Mehrzeitpunktuntersuchungen (single-case Modelle; mathematische Modelle) kann durch solche Erkenntnisse vorangetrieben werden.
Faktorenanalyse In dem von CATTELL(1946) entwickelten Kovariationswürfel sind mit der S- und T-Technik faktorenanalytische Ansätze für die Analyse von gruppenspezifischen Veränderungen auf einer Merkmalsdimension und mit der P- und O-Technik faktorenanalytische Prozeduren für multivariate individuelle Merkmalsänderungen vorgesehen. Bei der S-Technik werden die Individuen über Situations-Kovariationen analysiert, wobei Personendimensionen resultieren; bei der T-Technik analysiert man Personen-Kovariationen und erhält Situationsdimensionen. Beide Verfahren wurden für die Analyse von Mehrzeitpunktuntersuchungen, wahrscheinlich wegen der eingeschränkten univariaten Analysemöglichkeit, nur selten eingesetzt. Obwohl die P-Technik als Verfahren zur Analyse von individuellen Veränderungen konzipiert wurde, war sie es, die in Modifikationen auch zur Analyse von Mehrzeitpunkt-Gruppenuntersuchungen häufig eingesetzt wurde. Die Gruppen-P-Technik verwendet Mittelwerte einer Stichprobe zur Analyse der Merkmalsänderungen, bei der Ketten-P-Technik werden Beobachtungswerte einzelner Individuen bzw. Mittelwertsequenzen mehrerer Stichproben aneinandergefügt u n d analysiert, weil die jeweils gesonderten Datensätze zu wenig ergiebig wären. Die Kritik an derartigen Modifikationen der konventionellen P-Technik zur Analyse von Gruppenmittelwerten formulierte FAHRENBERG ( 1 9 6 8 , p. 64f.).
Zeitschrift für S o z i a l p s y c h o l o g i e 1 9 7 6 , 7 , 1 2 7 - 1 4 2
Mit der Intention der Analyse von multivariaten Datensätzen wurde eine nahezu unüberschaubare Anzahl von faktorenanalytischen Auswertungsstrategien für Mehrzeitpunktuntersuchungen entwickelt. In den Überblicksreferat e n v o n NUNNALLY ( 1 9 7 3 ) u n d BENTLER ( 1 9 7 3 )
137
gleichs im Rahmen der Veränderungsmessung wurden Mitte der 60er Jahre (vgl. S I X T L 1964; FISCHER & ROPPERT 1 9 6 4 ; EYFERTH & SIXTL
1965) grundlegend diskutiert. In der Praxis zeigten sich erhebliche Schwächen, die in einer Methodenstudie von NESSELROADE & BALTES (1970) zum Ausdruck kamen. Die Autoren konnten nachweisen, daß eine Wechselwirkung besteht zwischen Stichprobengröße, Variablenanzahl und Zahl der extrahierten Faktoren. Ferner werden unzureichende Rotationstechniken und nicht aussagekräftige Signifikanztests bemängelt.
sind annähernd 20 Prozeduren samt ihren kritischen Implikationen beschrieben (vgl. auch NESSELROADE & KALTES 1 9 7 0 ) . Es bedürfte jedoch einer Reihe von Monte-Carlo-Studien, um den Wert der einzelnen Prozeduren eindeutig erkennen zu können. JÖRESKOG ( 1 9 7 5 ) erarbeitete einen Gliederungsvorschlag für diese faktorenanalytischen ProzeduResümee ren und trug damit zur Klärung der Bedeutung der einzelnen Verfahren für die MehrzeitpunktDie vorgenannten Möglichkeiten der Ausweruntersuchung bei. — Eine abschließende Bewertung von Veränderungen zeigen, daß ein sehr tung der Faktorenanalyse für Mehrzeitpunktvielfaltiges Instrumentarium dem Untersucher untersuchungen ergibt, daß meßtechnische Prozur Verfügung steht. Es wird jedoch häufig deutbleme, wie die Schwierigkeit der Berücksichtilich, daß der Theoriebestand in der Sozialpsygung von mehr als zwei Variablen zu einem Unchologie hinsichtlich der Beschreibung und Ertersuchungszeitpunkt („multiset factor analyklärung hochkomplexer Veränderungsphänomesis method"), die Verarbeitung von binären Inne unzureichend ist, und daß letztlich aus dieformationen („monotonicity analysis method"), sem Grunde einzelne statistische Auswertungsdie Analyse von Variablenkombinationen aus verfahren nicht zum Einsatz kommen können. Differenz-Änderungsmaßen oder Residual-ÄnAuf der anderen Seite scheinen einzelne Methoderungsmaßen („canonical factor model"; vgl. den noch zu wenig erprobt, als daß von der notHARRIS 1 9 6 3 ) , die Analyse von Dreiweg-Mawendigen Ausgereiftheit ausgegangen werden trizen aus N-Personen, M-Variablen und T-Unkönnte. In der Konsequenz muß dies bedeuten, tersuchungszeitpunkten (,,three-way-factor anadaß auf der inhaltlich-theoretischen Seite zulysis"; TUCKER 1 9 6 3 , 1 9 6 4 , 1 9 6 6 ; L E V I N 1 9 6 5 ) nächst mit anspruchslosen Verfahren Theorien nährungsweise gelöst sind. zu präzisieren sind, so daß sukzessiv verbesserEine grundlegend ungelöste Problematik erte Methoden erprobt werden können; und daß gibt sich hinsichtlich der Validität faktorenanaauf der formal-methodischen Seite einzelne Auslytischer Ergebnisse. Wird ein Konstrukt (Einwertungsverfahren und Modelle besser auf psystellung gegenüber Gastarbeitern als Wohnungschologische Fragestellungen zugeschnitten wernachbarn, Intelligenz), das über einen längeren den müssen. Zeitraum untersucht wird und sich hypothetisch in seinem Ausprägungsgrad nicht verändert, tatsächlich immer durch die gleiche Variablenkonstellation gebildet, so daß stabile Faktoren Interpretation von Veränderungsbeträgen resultieren? Müßten dann im Untersuchungszeitraum Veränderungen am UntersuchungsinAls zentrales Problem bei der Interpretation von strument vorgenommen werden, um jeweils den Veränderungswerten wird in der Literatur das gleichen Merkmalskomplex zu erfragen? Zei,,physicalism-subjectivism"-Dilemma (BEREITER gen andererseits invariate Faktorenstrukturen 1963) diskutiert. Es beschreibt die Schwieriggleichzeitig invariate psychologische Merkmale keit der Gewinnung von exakt quantifizierbaan, oder sind gleiche Faktorenstrukturen ledigren Merkmalsbereichen, die zugleich psychololich eine Bedingung für invariate psychologische gisch interpretierbar sind. An einem Beispiel Prozesse (vgl. Buss 1975)? sei die „physikalistische" Vorgehensweise der Bestimmung von Veränderungen der „subjektiDie Möglichkeiten des Faktorenstrukturvervistischen" gegenübergestellt:
138
K n o p f & Petermann: Einstellungsänderungen I
I n e i n e m E x p e r i m e n t v o n JANIS & MANN
( 1 9 6 5 ) wurden College-Studentinnen, alle Raucherinnen, gebeten, die Rolle von Patienten zu spielen, die an den Folgen des Rauchens erkrankt seien. Die fiktiven Patienten erlebten ihre Situation so realistisch, daß sie ihren durchschnittlichen Zigarettenkonsum, im Vergleich zu einer Kontrollgruppe, erheblich verringerten. Angen o m m e n , zwei Raucherinnen, die sich in ihrem früheren Konsum nicht unterschieden, rauchen nach dem Treatment täglich durchschnittlich fünf Zigaretten weniger. Beide würden damit objektiv den gleichen Treatment-Erfolg aufweisen, und dennoch sind die beiden Veränderungen nicht notwendigerweise psychologisch äquivalent. S o ist hypothetisch denkbar, daß aufgrund unterschiedlicher Einflußgrößen der Verminderung des Konsums für eine Patientin schwieriger ist als für die andere. Feedback-Mechanismen der Umwelt, zusätzliche Anti-Raucher-Propaganda, Balance des kognitiven Systems spielen hier eine Rolle. Die dabei ablaufenden psychologischen Prozesse finden im objektiven Maß keinen Ausdruck, und doch sind es gerade diese Prozesse, die etwa im Hinblick auf eine Prognose des Erfolgs von Bedeutung sind. Eine subjektive Erfassung der relevanten Einflußgrößen und eine Beschreibung des Veränderungsprozesses könnten hier von Bedeutung sein. Entscheidender Nachteil dieser subjektiven Methoden ist freilich, daß Grad und Bedeutung der Wirkgrößen und der Veränderungsbetrag das Ergebnis von Beurteilungen sind und dadurch mit dem Stigma der Willkürlichkeit behaftet bleiben. Ein zweites grundlegendes Problem der Veränderungsmessung besteht in der Unvereinbarkeit von reliablen und validen Einzelmessungen x und y mit reliablen Differenzwerten D. Dieses Phänomen, das als Reliabilitäts-Validitäts-Dilemma in der Literatur der Veränderungsmessung diskutiert wird, erklärt die generelle Schwierigkeit reliable Differenzbestimmungen vornehmen zu können. NachGuiLFORD ( 1 9 5 4 , p . 3 9 3 ) läßt sich die Reliabilitätsbestimmung einer Differenz folgendermaßen vornehmen (man geht hierbei von z-transformierten Werten aus): _ fn + r22 — 2 r12 2 ( 1 — r12)
Wie leicht zu ersehen ist, läßt sich die Reliabilität des Differenzwertes aus der Reliabilität der Pretest-Messung ( r n ) , der Reliabilität der Posttest-Messung ( r 2 2 ) und der Korrelation zwischen beiden Messungen ( r 1 2 ) vollständig bestimmen. Die Beziehung zwischen diesen drei Kennwerten ist dergestalt, daß unreliable Differenzen zwei Ursachen haben können. Zum einen können sie aus unreliablen Einzelbeobachtungen x und y resultieren, zum anderen aus einer hohen Korrelation zwischen x und y. BEREITER ( 1 9 6 3 ) demonstriert diese Gesetzmäßigkeit anhand unterschiedlicher Reliabilitäts- und Korrelationsgrade. Wählt man, um unreliable Differenz-Bestimmungen zu vermeiden, für eine Mehrzeitpunktuntersuchung Tests mit hohen Reliabilitäten aus, so stellt sich gleichzeitig eine Erhöhung der Interkorrelation der Beobachtungen ein. Demzufolge wird der Reliabilitätskoeffizient für die Differenz lediglich einen mittleren Wert erreichen. Eine hohe Differenzreliabilität kann man nur dann erzielen, wenn hohe Reliabilitäten der Einzelbeobachtungen mit niedrigen Interkorrelationen auftreten würden ( d . h . fehlende Validität der Beobachtungen), oder wenn hohe Interkorrelationen mit niedrigen Reliabilitäten der Einzelmessungen vereint wären ( d . h . fehlende Reliabilität). Im einen Fall läßt sich die meßgenaue Merkmalsdifferenz aufgrund mangelnder Validität der Veränderung nicht interpretieren, im anderen Fall ist eine Interpretation aufgrund fehlender Reliabilität nicht möglich.
Ausblick Die Arbeit zeigte die Schwierigkeiten der Untersuchung von Veränderungen auf der E b e n e der experimentellen Planung, der Registrierung und Auswertung von Veränderungsbeträgen und der Interpretation der Änderungen. Mögen die Fehler auf der Stufe der experimentellen Planung durch aufwendige Kontrollprozeduren noch zu kontrollieren sein, so werden die Fehlergrößen im Verlauf der Datenerhebung und Auswertung und damit die Schwierigkeiten der Veränderungsmessung immer gravierender. Dies auch deshalb, weil die Fehlergrößen der einzelnen Ebenen sich kumulieren. A u f der E b e n e der Interpretation schließlich wird deutlich, daß testtheoretische
Zeitschrift für Sozialpsychologie 1976, 7 , 1 2 7 - 1 4 2
Grundkonzepte so sehr durch abhängige Beobachtungen in Wiederholungsmessungen verletzt sind, daß es unmöglich erscheint, Veränderungsmessung im Rahmen der klassischen Testtheorie vorzunehmen. Wir werden deshalb in einem zweiten Artikel die Frage der Veränderungsmessung erneut aufgreifen und Möglichkeiten vorstellen, Änderungsbeträge mit Hilfe neuerer Konzepte und Entwicklungen zu bestimmen.
Literatur ALEXANDER, H.W. 1946. A general test for trend. Psychological Bulletin 43, 5 3 3 - 5 5 5 . BALTES, P.B. 1968. Longitudinal and cross-sectional sequences in t h e study of age and generation effects. Human Development 11, 145 — 171. BALTES, P . B . & NESSELROADE, J . R . 1 9 7 2 . C u l t u r a l
139 CAMPBELL, D.T. 1959. Methodological suggestions f r o m a comparative psychology of knowledge processes. Inquiry 2, 1 5 2 - 1 8 2 . CAMPBELL, D.T. 1963. F r o m description to experimentation: Interpreting trend as quasi-experiments. In: C.W.Harris (ed.): Problems in measuring change. Madison, Milwaukee and L o n d o n : The University of Wisconsin Press, 212—242. CAMPBELL, D . T . & E R L E B A C H E R , A. 1 9 7 0 . H o w regres-
sion artifacts in quasi-experimental evaluations can mistakenly make compensatory education look harmful. In: J . H e l l m u t h (ed.): Disadvantaged child. Vol.3. New Y o r k : Brunner & Mazel, 1 8 5 - 2 1 0 (a). CAMPBELL, D . T . & ERLEBACHER, A. 1 9 7 0 . R e p l y t o
the replies. In: J . H e l l m u t h (ed.): Disadvantaged child. Vol. 3. New York: Brunner & Mazel, 2 2 1 - 2 2 5 (b). C A M P B E L L , D . T . & STANLEY, J . C . 1 9 6 3 . E x p e r i m e n t a l
and quasi-experimental designs for research on teaching. In: N.L.Gage (ed.): H a n d b o o k of research on teaching. Chicago: Rand McNally, 171—246. C A M P B E L L , D . T . & STANLEY, J . C . 1 9 7 0 . E x p e r i m e n -
BENTLER, P.M. 1973. Assessment of developmental factor change at the individual and group level. In: J. R. Nesselroade & H. W. Reese (eds.): Life-span developmental psychology. New York: Academic Press, 145-174. BEREITER, C. 1963. Some persisting dilemmas in the measurement of change. In: C.W.Harris (ed.): Problems in measuring change. Madison, Milwaukee and L o n d o n : The University of Wisconsin Press, 3—20.
telle u n d quasi-experimentelle Anordnungen in der Unterrichtsforschung. In: K . I n g e n k a m p & E.Parey (Hrsg): H a n d b u c h der Unterrichtsforschung, Bd. 1. Weinheim: Beltz, 4 4 9 - 6 2 7 . CATTELL, R. B. 1946. The description and measurement of personality. New York: World Book C o m p a n y . CATTELL, R.B. 1963. The structuring of change by Ptechnique and incremental R-technique. In: C.W. Harris (ed.): Problems in measuring change. Madison, Milwaukee and L o n d o n : The University of Wisconsin Press, 1 6 7 - 1 9 8 . CATTELL R.B. 1966. Patterns of change: Measurement in relation to state-dimension, trait change, lability and process concepts. In: R. B.Cattel (ed.): Handbook of multivariate experimental psychology. Chicago: Rand McNally, 3 5 5 - 4 0 2 .
B E T T E L H E I M , B. & J A N O W I T Z , M. 1 9 5 0 . D y n a m i c s o f
CATTELL, R . B . & SCHEIER, I . H . 1 9 6 1 . T h e m e a n i n g
change and adolescent. An application of longitudinal sequences. Developmental Psychology 7, 244— 256.
BASTINE, R. 1970. Forschungsmethoden in der klinischen Psychologie. In: W.J.Schraml (Hrsg.): Klinische Psychologie. Bern/Stuttgart/Wien: Huber, 5 2 3 559.
and measurement of neuroticism and anxiety. New prejudice: a psychological and sociological study of York: Ronald. veterans. New York: Harper & Row. CLCIRELLI, V.G. 1970. The relevance of the regression BLUM, M.L. & NAYLOR, J.C. 1968. Industrial Psycholoartifact problem to the Westinghouse-Ohio evaluation gy. New York: Harper & Row. of head start: a reply to Campbell and Erlebacher. In: BOCK, R.D. 1963. Multivariate analysis of variance of J.Hellmuth (ed.): Disadvantaged child. Vol.3. New repeated measurement. In: C. W. Harris (ed.): Problems York: Brunner & Mazel, 2 1 1 - 2 1 5 . in measuring change. Madison, Milwaukee and L o n d o n : COCHRAN, G.W. 1972. Stichprobenverfahren. Berlin, The University of Wisconsin Press, 2 1 - 3 8 . New York: De Gruyter & C o m p a n y . B o x , G. E. P. 1954. Some theorems on quadratic forms COCHRAN, G.W. & C o x , G.M. 1968. Experimental deapplied in the study of an analysis of variance probsigns. New York: Wiley. lems, II. Effects of inequality of variance and of corCOHEN, R. 1962. Die Psychodynamik der Testsituation. relation between errors in the two-way classification. Diagnostica 8, 3 — 12. Annals of Mathematical Statistics 25, 4 8 4 - 4 9 8 . COLEMAN, I.S. 1968. The mathematical study of BREDENKAMP, J. 1969. Experiment und Feldexperichange. In: H.M.Blalock & A.B.Blalock (eds.): ment. In: C. F . G r a u m a n n (Hrsg.): H a n d b u c h der PsyMethodology in social research. New York: McGraw chologie, Bd. 7, 1. Göttingen: Hogrefe, 3 3 2 - 3 7 4 . Hill, 4 2 8 - 4 7 8 . B u s s , A. R. 1975. An inferential strategy for determing CRONBACH, L.J. 1970. Essentials of psychological factor invariance across different individuals and diftesting. L o n d o n : Harper. ferent variables? Multivariate Behavioral Research 10, CRONBACH, L . J . & FURBY, L. 1 9 7 0 . H o w w e s h o u l d 365-371. measure „ c h a n g e " — or should we? Psychological CAMPBELL, D.T. 1957. Factors relevant to the validity Bulletin 74, 6 8 - 8 0 . of experiments in social settings. Psychological Bulletin 54, 2 9 7 - 3 1 2 .
140 C o x , D. R. 1961. Design of e x p e r i m e n t s : T h e c o n t r o l of error. J o u r n a l of Royal Statistical Society Series 124, 4 4 - 4 8 . Du BOIS, P . H . 1957. Multivariate correlational analysis. New Y o r k : Harper. D u BoiS, P . H . & MANNING, W.H. 1 9 6 1 . M e t h o d s of research in technical training. St. Louis: Washington University T e c h n . Rep. No. 3. EVANS, J. W. & SCHILLER, J. 1970. H o w p r e o c c u p a t i o n with possible regression a r t i f a c t s can lead t o a f a u l t y strategy f o r t h e evaluation of social action p r o g r a m : a reply t o Campbell and Erlebacher. In: J . H e l l m u t h (ed.): Disadvantaged child. V o l . 3 . New Y o r k : Brunner & Mazel, 2 1 6 - 2 2 0 . EYFERTH, K. & SLXTL, F. 1965. B e m e r k u n g e n zu ein e m V e r f a h r e n zur m a x i m a l e n A n n ä h e r u n g zweier F a k t o r e n s t r u k t u r e n a n e i n a n d e r . Archiv für die gesamte Psychologie 117, 1 3 1 - 1 3 8 . FAHRENBERG, J. 1967. Psychophysiologische Persönlichkeitsforschung. G ö t t i n g e n : Hogrefe. FAHRENBERG, J. 1968. A u f g a b e n u n d M e t h o d e n der psychologischen Verlaufsanalyse (Zeitreihenanalyse). In: K . J . G r o f f m a n n & K.H. Wewetzer (Hrsg.): Person als Prozeß. B e r n / S t u t t g a r t / W i e n : H u b e r , 4 1 - 8 2 . FAHRENBERG, J. 1969. Die B e d e u t u n g individueller Unterschiede für die Methodik der Aktivierungsforschung. In: W. S c h ö n p f l u g (Hrsg.): M e t h o d e n der Aktivierungsforschung. B e r n / S t u t t g a r t / W i e n : H u b e r . FAHRENBERG, J. & MYRTEK, M. 1 9 6 7 . Zur Methodik der Verlaufsanalyse: Ausgangswerte, Reaktionsgrößen ( R e a k t i v i t ä t ) u n d Verlaufsanalyse. Psychologische Beiträge 10, 58—77. FINNEY, D. J. 1964. Statistical m e t h o d in biological assay. New Y o r k : H a f n e r . FISCHER, G . H . & ROPPERT, J. 1964. B e m e r k u n g e n zu einem V e r f a h r e n der T r a n s f o r m a t i o n s a n a l y s e . Archiv für die gesamte Psychologie 116, 9 8 - 1 0 0 . FISCHER, G . H . 1974. E i n f ü h r u n g in die T h e o r i e psychologischer Tests. G r u n d l a g e n u n d A n w e n d u n g e n . B e r n / S t u t t g a r t / W i e n : Huber. GAITO, J. & WLLEY, D . E . 1963. Univariate analysis of variance p r o c e d u r e s in t h e m e a s u r e m e n t of change. In: C.W.Harris (ed.): P r o b l e m s in measuring change. Madison, Milwaukee and L o n d o n : T h e University of Wisconsin Press, 6 0 - 8 4 . GALTON, F. 1886. Family likeness in stature. Proceedings in t h e Royal Society 15, 4 9 - 5 3 . GALTUNG, J. 1967. T h e o r y and m e t h o d s of social research. L o n d o n : Allen & Unwin. GRABITZ-GNIECH, G. 1972. Versuchspersonenverhalt e n : Erklärungsansätze aus T h e o r i e n z u m sozialen Einfluß, Psychologische Beiträge 14, 5 4 1 — 549. GRANT, D . A . 1962. Testing t h e null h y p o t h e s i s and t h e strategy and tactics of investigating theoretical models. Psychological Review 69, 54—61. GUILFORD, J . P . 1954. P s y c h o m e t r i c m e t h o d s . New Y o r k : McGraw Hill. HARRIS, C. W. 1 9 6 3 . Canonical f a c t o r m o d e l s f o r t h e description of change. In: C.W.Harris (ed.): Problems in measuring change. Madison, Milwaukee and
K n o p f & P e t e r m a n n : Einstellungsänderungen I
L o n d o n : T h e University of Wisconsin Press, 138— 155. HARTMANN, H. 1970. Psychologische Diagnostik. Stuttgart: Kohlhammer. HEISE, D. R. 1969. P r o b l e m s in p a t h analysis and causal inference. In: E. F. Borgotta & G. W. B o h r n s t e d t (eds.): Sociological m e t h o d o l o g y . San Francisco: Jossey Bass Inc., 38—73. HERRMANN, T. 1 9 6 9 . L e h r b u c h der empirischen Persönlichkeitsforschung. G ö t t i n g e n : H o g r e f e . HIMMELFARB, S. & EAGLY, A . H . (eds.) 1 9 7 4 . Readings in a t t i t u d e change. New Y o r k : Wiley. HUNTER, J . E . & COHEN, S.H. 1974. Correcting for unreliability in nonlinear models of a t t i t u d e change. P s y c h o m e t r i k a 39, 4 4 5 - 4 6 8 . INSKO, C. A. 1967. Theories of a t t i t u d e change. New York: Appleton-Century-Crofts. JÄGER, R. & GOSSLAR, H. 1975. P f a d a n a l y s e als Valid i e r u n g s m e t h o d e . Psychologie und Praxis 19, 3 0 39. JANIS, I. L. & MANN, L. 1965. Effectiveness of emotional role-playing in m o d i f y i n g s m o k i n g h a b i t s and a t t i t u d e s . J o u r n a l of e x p e r i m e n t a l Research in Personality 1, 8 4 - 9 0 . JÖRESBF.RG, K.G. 1975. F a c t o r analysis m o d e l s f o r analysis of longitudinal data. Vortrag z u m 21. Biometrischen K o l l o q u i u m der d e u t s c h e n S e k t i o n der I n t e r n a t i o n a l e n Biometrischen Gesellschaft. S t u t t gart-Hohenheim. KELLERER, H. 1970. Statistik im m o d e r n e n Wirtschafts- und Sozialleben. H a m b u r g : R o w o h l t . KERLINGER, F . N . & PEDHAZUR, E . J . 1 9 7 3 . Multiple regression in behavioral research. New Y o r k : Holt, Rinehart & Winston. KIESLER, C. A . , COLLINS, B . E . & MILLER, N . 1 9 6 9 .
A t t i t u d e change. New Y o r k : Wiley. KLAUER, K . J . 1973. Das E x p e r i m e n t in der pädagogischen Forschung. Düsseldorf: Schwann. KOGAN, L. S. 1948. Analysis of variance: R e p e a t e d m e a s u r e m e n t s . Psychological Bulletin 4 5 , 131—143. KUBIE, L. S. 1973. T h e process of evaluation of t h e r a p y in psychiatry. Archives of general p s y c h i a t r y 28, 880-884. LANA, R . E . 1969. Pretest sensitization. In: R . R o s e n thal & R . L . R o s n o w (eds): Artifact in behavioral research. New Y o r k , L o n d o n : A c a d e m i c Press. LAND, K.C. 1 9 6 9 . Principles of path analysis. I n : E . F . Borgotta & G. W. B o h r n s t e d t (eds.): Sociological m e t h o d o l o g y . San Francisco: Jossey Bass Inc., 3 — 37. LEVIN, J. 1965. T h r e e - m o d e f a c t o r analysis. Psychological Bulletin 64, 4 4 2 - 4 5 2 . LIENERT, G . A . 1973. Verteilungsfreie M e t h o d e n in der Biostatistik, Bd. 1. Meisenheim am Glan: Verlag A n t o n Hain. LORD, F . M . 1958. F u r t h e r p r o b l e m s in t h e measurement of g r o w t h . E d u c a t i o n a l and psychological Measurement 18, 4 3 7 - 4 5 4 . LORD, F . M . 1963. E l e m e n t a r y models f o r measuring change. In: C.W.Harris (ed.): Problems in measuring
Zeitschrift für Sozialpsychologie 1976, 7 , 1 2 7 - 1 4 2 change. Madison, Milwaukee and L o n d o n : T h e University of Wisconsin Press, 21—38. MANNING, W.H. & DU BOIS, P.H. 1958. Gain in proficiency as a criterion in test validation. J o u r n a l of applied psychology 4 2 , 191 — 194. MANNING, W.H. & Du B o i s , P.H. 1962. Correlational m e t h o d s in research on h u m a n learning. Perceptual and m o t o r skills 15, 1 8 7 - 2 3 1 . MARKS, E. & MARTIN, C . G . 1973. F u r t h e r c o m m e n t s relating t o t h e m e a s u r e m e n t of change. American E d u c a t i o n a l Research J o u r n a l 10, 1 7 9 - 1 9 1 . MCCALL, R.B. & APPELBAUM, M.I. 1973. Bias in t h e analysis of r e p e a t e d measures designs: s o m e alternative a p p r o a c h e s . Child d e v e l o p m e n t 4 4 , 4 0 1 415. M E F F E R D , R . B . , WIELAND, B . A . & J A M E S , W . E . 1 9 6 0 .
Repetitive p s y c h o m e t r i c measures: digit span. Psychological r e p o r t s 14, 3 — 10. MEFFERD, R . B . & WIELAND, B.A. 1965. Repetitive p s y c h o m e t r i c measures: spatial o r i e n t a t i o n . Psychological R e p o r t s 18, 9 4 9 - 955. NAMBOODIRI, N . K . 1972. E x p e r i m e n t a l designs in which each subject is used repeatedly. Psychological Bulletin 77, 5 4 - 6 4 . NEHNEVAJSA, J. 1974. Analyse von Panel-Befragungen. In: R. König (Hrsg.): H a n d b u c h der empirischen Sozialforschung, B d . 2 . S t u t t g a r t : E n k e , 1 9 1 - 2 2 7 . NESSELROADK, J . R . & BALTES, P . B . 1 9 7 0 . O n a di-
l e m m a of c o m p e r a t i v e f a c t o r analysis: a s t u d y of f a c t o r m a t c h i n g based on r a n d o m data. E d u c a t i o n a l and Psychological Measurement 30, 935—948. NESSELROADE, J . R . & Reese, H.W. (eds.) 1973. Lifespan d e v e l o p m e n t a l psychology: methodological issues. New Y o r k , L o n d o n : Academic Press. NUNNALLY, J . C . 1973. Research strategies and measurement m e t h o d s for investigating h u m a n d e v e l o p m e n t . In: J. R.Nesselroade & H.W.Reese (eds.): Life-span d e v e l o p m e n t a l psychology. New Y o r k , L o n d o n : Academic Press, 8 7 - 1 0 9 . O'CONNOR, E. F. 1972. E x t e n d i n g classical test t h e o r y t o t h e m e a s u r e m e n t of change. Review of educational Research 4 2 , 7 3 - 9 7 (a). O'CONNOR, E . F . 1972. Response t o C r o n b a c h and F u r b y ' s „ H o w we should measure .change' — or should w e ? " Psychological Bulletin 78, 1 5 9 - 1 6 0 (b). OSGOOD, C. E., S u a , G . J . & TANNENBAUM, P . E . 1 9 5 7 .
T h e m e a s u r e m e n t of meaning. Urbana, Illinois: University of Illinois Press. OVERALL, J . E . & WOODWARD, A . J . 1975. Unreliability of d i f f e r e n c e scores: a p a r a d o x for m e a s u r e m e n t of change. Psychological Bulletin 82, 8 5 - 8 6 . PAGES, R. 1974. Das E x p e r i m e n t in der Soziologie. In: R. König (Hrsg.): H a n d b u c h der empirischen Sozialforschung. S t u t t g a r t : E n k e , 2 7 3 - 3 3 7 . RENN, H. 1973. Die Messung von Sozialisierungswirkungen. München, Wien: Oldenburg. RICHARDS, J . M . 1975. A simulation study of t h e use of change measures t o c o m p a r e e d u c a t i o n a l programs. American E d u c a t i o n a l J o u r n a l 12, 2 9 9 - 3 1 1 .
141 RICHARDS, J . M . , KARWEIT, N . & PREVATT, T . W . 1 9 7 5 .
A F o r t r a n p r o g r a m f o r simulating e d u c a t i o n a l g r o w t h with varying school i m p a c t . E d u c a t i o n a l and psychological M e a s u r e m e n t 35, 1 5 3 - 1 5 8 . ROSE, C . L . 1 9 6 5 . Representativeness of v o l u n t e e r subjects in a longitudinal aging s t u d y . H u m a n Development 6, 1 5 2 - 1 5 6 . ROSENTHAL, R. 1 9 6 3 . O n t h e social psychology of t h e psychological e x p e r i m e n t : t h e e x p e r i m e n t e r ' s h y p o thesis as u n i n t e n d e d d e t e r m i n a n t of e x p e r i m e n t a l results. American Scientist 52, 2 6 8 - 283. ROSENTHAL, E. 1964. T h e e f f e c t of e x p e r i m e n t e r o n t h e results of psychological research. In: B . A . M a h e r (ed.): Progress in e x p e r i m e n t a l personality research. Vol.1. L o n d o n : A c a d e m i c Press. ROSENTHAL, R. & ROSNOW, R . L . (eds.) 1969. Artifact in behavioral research. N e w Y o r k , L o n d o n : Academic Press. SADER, M. & KEIL, W. 1 9 6 6 . Bedingungskonstanz in der psychologischen Diagnostik. Archiv für die gesamte Psychologie 118, 2 7 9 - 3 0 8 . SEIBEL, H . D . & NYGREEN, G . T . 1972. P f a d a n a l y s e Ein statistisches V e r f a h r e n zur Analyse linearer Kausalmodelle. Zeitschrift für Sozialpsychologie 3, 5-12. SIEGEL, S. 1 9 5 6 . N o n p a r a m e t r i c statistics f o r t h e behavioral sciences. New Y o r k : McGraw Hill. SIXTL, F. 1964. Ein V e r f a h r e n zur R o t a t i o n von Fakt o r e n l a d u n g e n nach einem vorgegebenen Kriterium. Archiv für die gesamte Psychologie 116, 9 2 - 9 7 . THORNDIKE, E . L . 1924. T h e i n f l u e n c e of c h a n c e imp e r f e c t i o n s u p o n t h e relationship of initial score t o gain or loss. J o u r n a l of e x p e r i m e n t a l Psychology 7, 225-232. THORNDIKE, R . L . 1966. Intellectual status and intellectual g r o w t h . J o u r n a l of e d u c a t i o n a l Psychology 57, 1 2 1 - 1 2 7 . TLMAEUS, E. 1974. E x p e r i m e n t und Psychologie. Zur Sozialpsychologie psychologischer E x p e r i m e n t e . G ö t t i n gen: Hogrefe. TRIMBLE, H.C. & CRONBACH, L . L . 1943. A practical p r o c e d u r e for t h e rigorous i n t e r p r e t a t i o n of test-retest scores in t e r m s of pupil g r o w t h . J o u r n a l of educational Research 35, 4 8 1 - 4 8 8 . TUCKER, L. R. 1963. I m p l i c a t i o n s of f a c t o r analysis of three-way-matrices f o r m e a s u r e m e n t of change. In: C.W.Harris (ed.): Problems in measuring change. Madison, Milwaukee and L o n d o n : T h e University of Wisconsin Press. TUCKER, L. R. 1 9 6 4 . T h e extension of f a c t o r analysis to t h r e e d i m e n s i o n a l matrices. In: N. F r e d e r i k s o n & H.Gulliksen (eds.): C o n t r i b u t i o n s to m a t h e m a t i c a l psychology. New Y o r k : Holt, Rinehart & Winston, 109-128. TUCKER, L. R. 1966. S o m e m a t h e m a t i c a l n o t e s o n t h e t h r e e - m o d e f a c t o r analysis. P s y c h o m e t r i k a 31, 279— 311. T U C K E R , L . R . , D A M A R I N , F . & MESSICK, S . A . 1 9 6 6 .
A Base-free measure of change. P s y c h o m e t r i k a 31, 279-311.
142 ÜBERLA, K. 1975. Die Selektion durch vorzeitig ausfallende Probanden in therapeutischen Reihen. In: S.Koller (Hrsg.): Bericht zur 19. Jahrestagung der Deutschen Gesellschaft für Medizinische Dokumentation und Statistik. München. In Vorbereitung. VAN DE GEER, J.P. 1971. Introduction to multivariate analysis for the social sciences. San Francisco: Freemann. VETTER, H. 1972. Dynamische und statistische Kausalanalyse. Zeitschrift für Sozialpsychologie 3, 13—22. WERTS, C.E. & LINN, R.L. 1970. A general linear mo-
Knopf & Petermann: Einstellungsänderungen I del for studying growth. Psychological Bulletin 73, 17-22. WILLIAMS, E. J., 1950. Experimental designs balanced for pairs of residual effects. Australian Journal of Scientific Research 3, 351—363. WINE, J. 1971. Test anxiety and direction of attention. Psychological Bulletin 76, 9 2 - 1 0 4 . WINER, B.J. 1971. Statistical principles in experimental design. New York: McGraw Hill. WOODROW, H. 1946. The ability t o learn. H I Psychological Review 53, 1 4 7 - 1 5 8 . J
Zeitschrift für Sozialpsychologie 1976, 7, 1 4 3 - 1 5 3
143
Ethnische Identifikation ARNOLD UPMEYER Technische Universität Berlin
Ergebnisse aus Experimenten zur Identifizierung ethnischer Gruppen werden mit dem Ziel diskutiert, sie in eine zweistufige soziale Urteilstheorie zu integrieren, in der die Sensitivität bei der Identifikation und die Antwortpräferenz als zwei psychologische Prozesse konzipiert sind. Danach reichen Vorurteile gegenüber ethnischen Gruppen allein nicht aus, um höhere Identifikationsgenauigkeit zu erreichen. Vielmehr müssen Aufmerksamkeit in der Urteilssituation und Vertrautheit mit den Reizmerkmalen hinzukommen. Die Antwortpräferenz kann u.a. durch Überschätzung der Gruppengröfte infolge von Bedrohung beeinflußt werden.
Experimental results on the identification of ethnic groups were reviewed from the point of view of a twostage social judgment theory which implies t w o psychological processes: sensitivity of identification and response-bias. Accordingly, prejudice towards ethnic groups is not sufficient to increase identification accuracy. Rather, attention in the judgment situation and familiarity with stimulus attributes seem to be necessary. A m o n g other conditions, over-estimation of group size as a consequence of threat may influence response-bias.
Unter der Bezeichnung „ethnische Identifikation" versteht man den Vorgang der Zuordnung von Personen zu den ethnischen Gruppen, denen sie angehören. Die Zuordnung ist oft Grundlage für die soziale Diskriminierung von Minderheiten, wobei es häufig gleichgültig ist, ob richtig oder falsch identifiziert wurde. Das schockierendste Beispiel für die politische Relevanz der ethnischen Identifikation ist die vom Nazi-Regime aufgebaute Bürokratie zur Identifikation von Deutschen mit jüdischem Glaubensbekenntnis. Es stellte sich heraus, daß die Aufgabe der Kennzeichnung von Juden mit dem Davidstern nicht in einfacher Weise, z. B. nur nach dem Aussehen, vorgenommen werden konnte. Dies ist u.a. darauf zurückzuführen, daß Juden in anthropologischer Hinsicht keine primären rassischen Unterschiede zu
als etwa bei Schwarzen. Die psychologischen Prozesse bei der Identifikation sind aber keinesfalls auf eine einzige ethnische Gruppe oder überhaupt auf ethnische Gruppen beschränkt; sie spielen vielmehr immer dann eine Rolle, wenn Personen glauben, sie könnten andere Personen an äußeren, generalisierbaren Stimulusattributen erkennen und das trifft für soziale Gruppen allgemein zu. Haartracht, Kleidung, Alter, Namen usw. werden in der Alltagsrealität benutzt, um kriminelle Neigungen, politische Einstellung, Staatsbürgerschaft und ähnliches mehr zu unterstellen.
Der typische Versuchsplan zur Untersuchung ethnischer Identifikation läßt sich wie folgt darstellen. Man zeigt Beurteilern Stimulus-Personen, deren ethnische Gruppenzugehörigkeit nur dem Versuchsleiter bekannt ist. Die Aufgabe der Be„ C h r i s t e n " zeigen (COON 1 9 4 2 ) . urteiler besteht darin herauszufinden, zu welcher ethnischen Gruppe die jeweilige Stimulus-Person In der Sozialpsychologie haben ALLPORT & gehört. Die Beurteiler können sich dadurch unKRAMER (1946) den Anstoß zu einer Reihe von terscheiden, daß sie (1) Aversionen gegenüber experimentellen Arbeiten gegeben, in denen als ethnische Gruppe fast ausschließlich Juden heran- einer Gruppe von Stimulus-Personen haben oder nicht, oder (2) teilweise selbst einer ethnischen gezogen wurden (siehe Übersichtsreferat von Gruppe angehören. Die Valenz der Einstellung TAJFEL 1 9 6 9 , S. 2 2 8 - 2 3 1 ) . Diese Bevorzugung bzw. die Gruppenzugehörigkeit der Beurteiler resultierte einerseits aus aktuellen politischen muß vom Experimentator festgestellt werden, Problemen; andererseits eigneten sich Juden für ein Vorgang, der die später zu erhebenden Urexperimentelle Zwecke deshalb gut, weil die Zuteile potentiell beeinflussen kann. Stimulus-Perordnungsleistungen wesentlich schlechter waren
144 sonen werden entweder auf Photos oder live präsentiert. ALLPORT & KRAMER (1946) z.B. boten 10 Diapositive von Juden und 10 Diapositive von NichtJuden in Zufallsreihenfolge Studenten mit unterschiedlich ausgeprägter Neigung zu Vorurteilen dar. Die a priori-Verteilung der Stimuli wurde nicht mitgeteilt. Die Versuchspersonen konnten zwischen drei Antwort-Kategorien wählen: „Jüdisch", „Nicht-Jüdisch" und „Weiß nicht". Studenten mit starker Neigung zu Vorurteilen benutzten die Antwort-Kategorie „Jüdisch" häufiger und erzielten mehr korrekte Identifikationen in dieser Kategorie als die Vergleichsgruppe mit geringer Neigung zu Vorurteilen. Dieses Ergebnis ist relativ typisch für eine Reihe von Untersuchungen, die im folgenden kritisch diskutiert werden sollen. Ziel dieses Beitrages ist es, die sehr widersprüchlichen Ergebnisse in eine zweistufige soziale Urteilstheorie neu einzuordnen, die im Problembereich „Attitüden und Gedächtnis" von UPMEYER & LAYER ( 1 9 7 3 ) vorgeschlagen wurde. Ähnlich wie in der S i g n a l - D e t e c t i o n - T h e o r i e (GREEN &
U p m e y e r : Ethnische Identifikation
gemessen. In der anglo-amerikanischen Literatur bezeichnet man Verschiebungen in Richtung auf die ethnische Gruppe, gegenüber der Vorurteile bestehen, als response-bias, ohne daß dabei auf die Signal-Detection-Theorie Bezug genommen wird. (Die einzige Ausnahme bildet die Untersuchung von DORFMAN, KEEVE & SASLOW 1 9 7 1 ) . Die formale Definition des response-bias entspricht jedoch genau dem Signal-Detection-Maß für den Fall, daß die subjektiven Verteilungen ungleiche Varianzen haben. Man kann also die response¿»/'as-Ergebnisse in Untersuchungen zur ethnischen Identifikation wie eine abhängige Variable aus einem Signal-Detection-Experiment benutzen. Leider trifft dies meist nicht auf die Art und Weise zu, in der die Sensitivität — hier: Identifikationsfähigkeit — operational erfaßt wird. Die meisten (frühen) Untersuchungen benutzen ein Analogon zu der Wahrscheinlichkeit, innerhalb der Antworten „Jude" richtig zu identifizieren, d.h. p („Jude" | Jude) (ALLPORT & KRAMER 1 9 4 6 , CARTER 1 9 4 8 , LINDZEY & ROGOLSKY 1 9 5 0 , S c o -
Der Nachteil dieser Methode besteht darin, daß das Sensitivitätsmaß p ( „ J " | J) nicht unabhängig von p („J") ist; durch Erhöhung der Antworten „ J " kann die Anzahl der Treffer in der Kategorie J erhöht werden — auf Kosten richtiger Identifikationen in der Kategorie Nicht-Jude. Alle Autoren stimmen jedoch implizit oder explizit darin überein, daß Identifikationsleistung und response-bias verschiedene psychologische Prozesse sind. DEL & AUSTRIN 1 9 5 7 ) .
SWETS 1 9 6 6 ) soll auch hier grundsätzlich zwischen Sensitivität (oder Identifikationsfähigkeit) und Antwortverzerrung (response-bias) unterschieden werden. Sensitivität ist ein Parameter der Reizanalyse, der die Genauigkeit angibt, mit der Stimuli intern repräsentiert werden. Antwortverzerrungen treten auf, wenn Personen Stellung zu der internen Repräsentation der Stimuli nehAuf diesen Sachverhalt haben zuerst ELLIOTT men müssen. & WITTENBERG ( 1 9 5 5 ) deutlich hingewiesen. Von Aus dieser theoretischen Sicht stellen sich ihnen stammt auch einer der vier Vorschläge, die vier Fragen. (1) Inwieweit sind Identifikationszur Lösung des Abhängigkeitsproblems gemacht leistung und Antwortpräferenz unabhängig? (2) wurden. Sie benutzten die absolute Anzahl korWie sind empirisch gefundene Unterschiede in rekter Urteile in den Kategorien Jude und Nichtder Identifikationsleistung zu erklären? (3) WaJude. Aus der Sicht der Signal-Detection-Theorie rum verschiebt sich die Antwortpräferenz in stellt dies zwar eine Verbesserung dar, es wird daRichtung auf die ethnische Gruppe, gegenüber bei aber nicht die Form der beiden subjektiven der Vorurteile bestehen? (4) Durch welche FakVerteilungen einbezogen, die aufgrund der Stitoren wird die Sicherheit beim Urteilen beeinmuluskategorien Jude und Nicht-Jude Zustandeflußt? kommen. Die Form der Verteilungen wird vielmehr normativ als rechteckig angenommen, was nach aller Erfahrung empirisch unrealistisch ist. Das Unabhängigkeitsproblem
Die Antwortpräferenz bei Untersuchungen zur ethnischen Identifikation wird durch die absolute oder relative Häufigkeit von Antworten in einer bestimmten Kategorie, z.B. p („JUDE")
Die zweite Lösung stammt von SAVITZ & Sie betrachten p ( „ J " | J) und p („Non-J" | Non-J) einfach getrennt. Methodisch ist dieses Vorgehen im Vergleich zu ELLIOTT & WITTENBERG eher als Rückschritt anzusehen, da
TOMASSON ( 1 9 5 9 ) .
145
Zeitschrift für S o z i a l p s y c h o l o g i e 1 9 7 6 , 7 , 1 4 3 - 1 5 3
weder das Problem der subjektiven Verteilungen gelöst wurde, noch ein einziges unabhängiges Maß für Identifizierungsgenauigkeit gefunden wurde. Glücklicherweise gestatten die von S A V I T Z & T O M A S S O N publizierten Daten eine Rückrechnung in Häufigkeiten der ursprünglichen 4-Feld-Stimulus-Response-Matrix. Eine solche S-R-Matrix ergibt einen Punkt auf einer Isosensitivitätskurve ( A b b . l ) . Die Anwendung des parameterfreien
Beurteilern nicht mehr abfallt, wie S A V I T Z & aufgrund ihres Maßes berichten, sondern gegenüber Stufe I (Aussehen allein) gleichbleibt. Jüdische Beurteiler verbessern sich sogar in Gruppe II. Die reanalysierten response-biasErgebnisse (Tabelle 2) zeigen im Gegensatz zu den Resultaten von S A V I T Z & T O M A S S O N , daß response-ft/as-Parameter und Identifikationsleistung nicht mehr durchgehend kovariieren. Beispielsweise tendierten alle Beurteiler in Stufe II, besonders aber die Nicht-Juden, dazu, die Antwort „Jude" weniger zu benutzen als in den anderen beiden Stufen. Dies spricht dafür, daß BedingunTOMASSON
T a b . 1: R e a n a l y s e d e r D a t e n v o n S A V I T Z & T O M A S S O N :
Identifikationsleistung
Jüdisch
Nicht-Jüdisch
II Aussehen und Sprechen
III Aussehen, Sprechen und N a m e
1
.24
.30
.47
2
.23
.34
.39
3
.20
.20
.37
.22
.28
.41
4
.23
.14
.34
5
.18
.36
.36
6
.26
.16
.35
.22
.22
.32
Mittel
Abb. 1: Isosensitivitätskurve oder ROC-Kurve für ein Identifikationsproblem.
I Aussehen allein
A n m e r k u n g . R O C - K u r v e n s i n d b e i SWF.TS, T A N N E R & BIRDSALL ( 1 9 6 1 ) beschrieben. Die theoretische
Kur-
ve ergibt sich aufgrund z w e i e r G a u ß v e r t e i l u n g e n mit gleichen Varianzen. Die F l ä c h e im Dreieck entspricht dem Leistungsmaß A
M O C
(siehe UPMEYER & LAYER,
1 9 7 4 ) für eine 2 x 2-Stimulus-Response-Matrix; sie approximiert die Fläche unter der t h e o r e t i s c h e n Kurve.
Mittel
Tab. 2: R e a n a l y s e der D a t e n v o n SAVITZ &
response-bias
I
Maßes A M Q C (S. Abb. 1) kann man als grobe Approximation eines Sensitivitätsmaßes ansehen, das die Form der subjektiven Verteilungen mit einbezieht. Allerdings ist die empirische Form der Verteilungen von S A V I T Z & T O M A S S O N nicht bekannt. Eine noch bessere Approximation an die tatsächliche Form könnte man dadurch erreichen, daß man die ursprünglichen KonfidenzDaten von S A V I T Z & T O M A S S O N mitberücksichtigt; diese sind jedoch leider nicht publiziert. Tabelle 1 zeigt die so reanalysierten Identifikationsindikatoren von S A V I T Z & T O M A S S O N . E S stellt sich heraus, daß die Identifikationsgenauigkeit in Stufe II (Aussehen und Sprechen) bei nicht-jüdischen
Jüdisch
Mittel
Aussehen allein
II Aussehen und Sprechen
III Aussehen, Sprechen und N a m e
1
.43
.34
.46
2
.41
.37
.46
3
.20
.25
.38
.35
.32
.43
4
.33
.26
.38
5
.55
.25
.48
6
.29
.17
.36
.39
.23
.41
Mittel Nicht-Jüdisch
THOMASSON
(Jude)
146 gen spezifiziert werden können, in denen die üblicherweise gefundene Kovariation kaum in Erscheinung tritt. Die dritte Lösung, ein vom response-bias unabhängig interpretierbares Maß für die Güte der Identifikation zu erhalten, wurde von PULOS & SPILKA (1961) praktiziert. Sie stellten eine lineare Korrelation von r = .40 zwischen response-bias und Identifikationsgenauigkeit fest und führten eine Kovarianzanalyse durch, wobei der response-bias als Kovariate fungierte. Nach dieser Korrektur zeigte die abhängige Variable „Identifikationsgenauigkeit" immer noch denselben Trend: Versuchspersonen mit starker Tendenz zu Vorurteilen können Juden besser identifizieren als solche mit geringer Tendenz. Dieses Verfahren kann den methodischen Einwand entkräften, daß das Maß für Identifikationsgenauigkeit mit dem response-bias konfundiert ist. Die Vorgehensweise ist aber nicht besonders gut als methodischer Ansatz für eine Urteilstheorie geeignet, in der zwei Prozesse enthalten sind. Korrelationen zwischen Reizanalyse und Antwortpräferenz können nämlich in der Sozialpsychologie häufig das Resultat einer einzigen Situation sein, obwohl diese Situation zwei verschiedene psychologische Mechanismen gleichzeitig in Gang setzt. Unter solchen Umständen ist es nicht aufschlußreich, den einen Mechanismus als statistische Korrektur des anderen („wesentlicheren") zu benutzen. Die Signal-Detection-Methode vermeidet, daß das Sensitivitätsmaß ein mathematisches Artefakt des responsefciai-Maßes ist. Dadurch ist die unabhängige Beobachtung beider Parameter im Prinzip möglich.
Upmeyer: Ethnische Identifikation
zeugt hat. (Positiv ist zu vermerken, daß HIMMELFARB die relative Häufigkeit der korrekten Identifikationen in beiden Antwortkategorien als Leistungsmaß benutzt hat.) DORFMAN, KEEVE & SASLOW (1971) haben von den Möglichkeiten des Signal-Detection-Paradigmas in methodisch sehr kompetenter Weise Gebrauch gemacht. Sie boten 65 jüdische und 65 nicht-jüdische Stimulus-Personen auf standardisierten Fotos zur Beurteilung dar, ohne die a priori-Verteilung der Stimuli mitzuteilen. Die Response-Kategorien waren „Jüdisch" und „Nichtjüdisch"; jede Entscheidung verlangte ein Sicherheitsurteil („möglich", „wahrscheinlich", „definitiv"). Sensitivitätsunterschiede wurden durch die Anwendung parametrischer Signal-DetectionMaße ohne die Annahme gleicher Varianzen erfaßt. Sie erhielten signifikante, jedoch in Anbetracht hoher Freiheitsgrade geringe Sensitivitätsunterschiede zwischen Gruppen mit hoher und geringer Tendenz zu Vorurteilen. Der responsebias wurde von der Tendenz des Vorurteils nicht beeinflußt. Dieses Resultat unterstützt die Auffassung von der Unabhängigkeit der beiden Prozesse.
Ergebnisse zur Identifikationsleistung
Aus der Diskussion des Unabhängigkeitsproblems sollte man — streng genommen — ableiten, daß nur die Studie von DORFMAN, KEEVE & SASLOW (1971) einen methodisch sauberen Indikator für Identifikationsleistung beibringt, und daß folglich alle anderen Arbeiten keinen Beweis erbracht Aus denselben Gründen ist es auch für den gesamten Prozeß der ethnischen Identifikation nicht haben, daß Personen mit Vorurteilen besser idensehr aufschlußreich, wenn Versuchspersonen vom tifizieren können. Auf der anderen Seite korrelieVersuchsleiter gezwungen werden, eine bestimm- ren Maße wie „relative Trefferwahrscheinlichkeit" hoch mit den Sensitivitätsmaßen der Signal-Dete Antwortverteilung zu benutzen ( S E C O R D & tection-Methode, und es ist klar, daß die schlechSAUMER, 1960; HIMMELFARB, 1966). HIMMELFARB teren Indikatoren die Sensitivität zumindest miterhielt positive Korrelationen zwischen Identifimessen. kationsgenauigkeit und Ausmaß des Vorurteils zwischen .25 und .40, wenn die AntwortverteiTAJFEL (1969) kommt daher mit Recht zu der lung den Versuchspersonen selbst überlassen blieb; Auffassung, daß Personen im allgemeinen jüdiim forced choice Verfahren, in dem paarweise sche Gruppen besser als zufällig identifizieren könJuden und Nicht-Juden zur Entscheidung gestellt nen. Eine in dieser Hinsicht durchgehend negatiwurden, sanken die Korrelationen auf praktisch ve Untersuchung wurde von ELLIOTT & WITTEN.00. In beiden Fällen wurde überzufällig richtig BERG (1955) publiziert. Ihr Maß für die Identifiidentifiziert und die Leistungen lagen auf gleichem kationsleistung muß als relativ gut angesehen Niveau. Das Ergebnis spricht dafür, daß die wenig werden. Grundsätzlich läßt sich gegen ihre Unternatürliche forced-choice-Methode ein Artefakt er- suchung einwenden, daß es nicht gelungen ist,
Zeitschrift für S o z i a l p s y c h o l o g i e 1 9 7 6 , 7, 1 4 3 - 1 5 3
Antisemiten von Neutralen oder Prosemiten zu trennen; versagt die Trennungsmethode, so sind keine Unterschiede zu erwarten. Darüberhinaus haben ELLIOTT & WITTENBERG lediglich berichtet, daß die Leistung aller Versuchspersonen zusammen nicht besser als zufällig ist; Antisemiten wurden dabei nicht von Neutralen getrennt. Dieses Vorgehen wird offensichtlich durch die (nicht explizit formulierte) Annahme gerechtfertigt, daß die neutralen bzw. prosemitischen Personen nicht systematisch schlechter als zufällig identifizieren können. In einer solchen Annahme wird jedoch übersehen, daß psychologische Gründe zu mehr oder weniger bewußten Fehlidentifikationen führen können. Prosemiten können das Experiment etwa als eine Demonstration ihrer Überzeugung benutzen, daß Juden sich im Erschein nungsbild von Nicht-Juden nicht unterscheiden lassen. Empirisch ist durchaus der Fall denkbar, daß systematische Unterschiede in der Identifikationsleistung zwischen Pro- und Antisemiten bestehen. Bildet man jedoch das arithmetische Mittel über beide Gruppen, dann entsteht der Eindruck, die Leistung wäre nicht besser als der Zufall. ELLIOTT & WITTENBERG korrelierten das „Ausmaß des Vorurteils" und die „Genauigkeit der Identifikation", benutzten dabei aber nicht das Maß „relative Trefferwahrscheinlichkeit", sondern vielmehr das alte Maß von ALLPORT & KRAMER „Anzahl korrekt erkannter Juden". (ELLIOTT & WITTENBERG taten dies mit der Absicht zu demonstrieren, daß ALLPORT & KRAMERS Maß von der a priori-Verteilung der Stimuli abhängt.) Die mittlere Korrelation über drei experimentelle Bedingungen ergab r = .04; dieses Ergebnis ist natürlich auch ungeeignet zu zeigen, daß Personen mit Vorurteilen nicht über eine bessere Identifikationsleistung verfügen als Neutrale. Alle anderen relevanten Studien zeigen zumindest teilweise positive empirische Evidenz für die Leistungsüberlegenheit der Antisemiten oder der Angehörigen der ethnischen Gruppe, gegenüber der Vorurteile bestehen. Einige Autoren übersehen bei der Interpretation negativer Ergebnisse, daß sie die objektive Stimulusschwierigkeit geändert haben. Wir wissen nämlich aus psychophysikalischen Experimenten, daß sich die Sensitivität erhöht, wenn die Signalstärke zunimmt und damit die Stimulusschwierigkeit abnimmt. CAR-
147
TER (1948) fand z.B. besser als zufallige Identifikationsleistungen, wenn er Juden und NichtJuden als Stimuluspersonen beurteilen ließ; die Leistung sank jedoch auf Zufallsniveau ab, als Juden, Mittelmeeranwohner und Nordeuropäer beurteilt werden sollten. Es erscheint möglich, daß SCODEL & AUSTRIN (1957) aus gleichem Grund keine Unterschiede zwischen Personen mit hohen und niedrigen Werten auf der F-Skala erhielten. Ihre Stimuli waren Photos von Juden, Amerikanern, Nordeuropäern und Südeuropäern. (Jüdische Beurteiler konnten diese Photos jedoch besser identifizieren als nicht jüdische.) SAVITZ & TOMASSON ( 1 9 5 9 ) benutzten additiv zusammengesetzte Behandlungsstufen, um die Attribute der Stimuluspersonen objektiv zu ändern und die Identifikation dadurch zu erleichtern. In Stufe I wurden Stimuluspersonen live gezeigt, in Stufe II kamen Sprache und Gesten hinzu und in Stufe III wurde darüber hinaus der Name jeder Stimulusperson genannt. Alle Beurteiler erhielten alle 3 Stufen (Meßwiederholung). SAVITZ & TOMASSON fanden entgegen ihrer Hypothese ein Absinken der Identifikationsleistung in Gruppe II - ein Sachverhalt, den sie nicht erklären konnten. Die oben besprochene Reanalyse ihrer Daten mit einer Approximation an das Signal-Detection-Maß A M Q C zeigt jedoch einen aufsteigenden Trend in der Gruppe der jüdischen Beurteiler und keinen Abfall der Leistung mehr bei nicht-jüdischen Beurteilern (siehe Tabelle 1). Dieses Ergebnis unterstützt unsere allgemeine Urteilstheorie: Stehen mehr charakteristische Merkmale (cues) einer Stimulussituation zur Verfügung, dann wird die subjektive Reizanalyse verbessert.
In einer älteren Arbeit von L U N D & BERG ( 1 9 4 6 ) wurde bestätigt, daß Aussehen und Sprache zu besserer ethnischer Identifikation führen als Aussehen allein. Die Ergebnisse aus Untersuchungen, in denen die Stimulusschwierigkeit variiert wurde, stehen nicht im Widerspruch zu unserer allgemeinen Urteilstheorie; sie unterstützen diese vielmehr, wenn man unabhängige Maße für Identifikationsleistung und Antwortpräferenz verwendet. Je größer die Anzahl der einem Beurteiler zur Verfügung stehenden, differentiellen Reizattribute ist, desto besser gelingt im allgemeinen die Identifikation. Diese Hypothese läßt sich auf die Variable „ Vertraut-
148
heit" (familiarity) erweitern, wenn man davon ausgeht, daß Personen mit größerer Erfahrung vorliegende Merkmale besser zur Identifizierung benutzen können. Auf dem Forschungsgebiet „Ethnische Identifikation" bietet sich eine besonders gute Möglichkeit an, diese generalisierte Hypothese zu prüfen: Man kann praktisch sicher sein, daß Mitglieder einer ethnischen Gruppe, wie z. B. Juden, über gründliche Erfahrung verfügen, die eigenen Gruppenangehörigen zu identifizieren. Eine Ausnahme würden allerdings solche Gruppenmitglieder bilden, die isoliert von ihrer ethnischen Gemeinschaft aufwachsen. In der Literatur findet man genügend positive Hinweise für die Richtigkeit dieser Hypothese. Läßt man die oben diskutierte Problematik der Leistungsmessung außer acht, dann findet man signifikant bessere Identifikationsleistungen bei jüdischen Beurteilern im Vergleich zu nicht-jüdischen (SAVITZ & TOMASSON, 1 9 5 9 ; SCODEL & Au-
Upmeyer: Ethnische Identifikation
nen auf diese Weise ihre Stereotype zum Ausdruck bringen. Auf diesen Response-Mechanismus wird noch einzugehen sein; man muß ihn jedoch getrennt sehen von der Identifikationsgenauigkeit. Die Vigilanzhypothese allein ist unseres Erachtens nicht geeignet, diesen Widerspruch aufzuheben. BRUNER & POSTMAN ( 1 9 4 8 ) stellen die Bedingungen, unter denen Vigilanz und Wahrnehmungsabwehr alternativ auftreten können, als Funktion von Bedrohung wie folgt dar: „In any given situation, the organism attempts to perceive what it assumes to be the environment's most relevant aspects — relevant to adjustment in the situation. So long as the situation is not too threatening or too exacting avoidance of threatening stimuli may be emotionally the most economical response. But in situations which are highly threatening and highly exacting, the most adaptive response is frequently the one that takes most „vigilant" account of reality" (BRUNER & POSTMAN 1948, S. 94).
Vigilanz allein reicht jedoch nicht aus, um Menschen zu identifizieren; es ist mindestens notwendig und vielleicht hinreichend, die Merkmale zu diglich LINDZEY & ROGOLSKY ( 1 9 5 0 ) fanden keine signifikanten Unterschiede in dieser Richtung. lernen, die zur Identifikation führen. Wenn dieser Lernprozeß erst einmal abgeschlossen ist, erDie Gründe dafür sind weitgehend unklar. Ihre scheint es auch möglich, ganz automatisch und Stichprobengröße für die Gruppe der Juden beohne die in dem Vigilanzkonzept enthaltene Ertrug ungefähr nur % von der der Nicht-Juden. Wichtiger erscheint, daß die Untersuchungen, de- regung sehr gut zu identifizieren. Vigilanz muß eher als ein Nebenprodukt des Identifikationsren abhängige Variablen eine enge Affinität zu Signal-Detection-Maßen hatten, am stärksten un- vorganges angesehen werden. Nach dem augensere Hypothese unterstützen. Ein Nebenergebnis blicklichen Stand der sozialen Lerntheorie muß man annehmen, daß die Merkmale zur Identifiaus dem Experiment von LUND & BERG ( 1 9 4 6 ) kation ethnischer Gruppen während des Sozialispricht ebenfalls für den starken Einfluß von Ersationsprozesses durch Modelle (Eltern, peer fahrung beim Urteilen: Lehrer konnten Juden von Nicht-Juden besser unterscheiden als Studen- groups, Lehrer, Kommunikationsmittel usw.) vermittelt werden. Bei der Anwendung dieses ten. Wissens kann Vigilanz durchaus eine Rolle spieBenutzt man als Beurteiler dagegen Personen len. Es ist z. B. denkbar, daß ein neu eingestellmit unterschiedlicher Ausprägung ihrer Vorurtes Mitglied des Lehrkörpers erst einmal herausteile, dann wird es theoretisch zunehmend schwiefinden will, wer in der Fakultät aus einer jüdischen riger, das Verhalten bei der Reizanalyse vorauszuFamilie stammt. Gegenüber allen Merkmalen, die sagen. Aus der Sicht der Vertrautheitshypothese zu einer solchen Identifikation führen, ist diese gibt es nämlich zunächst keinen Grund, warum Person dann äußerst vigilant. Sie muß die MerkPersonen mit Vorurteilen mehr Erfahrung im Ummale aber auch benutzen können. Darüberhinaus gang mit Angehörigen von abgelehnten Gruppen ist dieses Verhalten sowohl mit einer anti- als haben sollen. Es ist gut denkbar, daß Menschen auch mit einer pro-semitischen Einstellung vereinmit Vorurteilen existieren, die überhaupt kein bar! Es ist nämlich nicht plausibel, warum Aufpräzises Wissen über die Erscheinungsformen ihmerksamkeit in bezug auf Personen nur aufgrund rer Gegner besitzen, das ihnen ermöglicht, richfeindlicher Einstellungen resultieren soll. tig zu klassifizieren. Individuen ohne präzises Wissen um die Fremdgruppe können selbstverständFolglich besteht kein Grund zur Verwunderung lich ihre Antworten verzerren, wenn sie vor eine darüber, daß Experimente, in denen man VersuchsIdentifikationsaufgabe gestellt werden und könpersonen nach dem Ausmaß ihrer Vorurteile trennSTRIN, 1 9 5 7 ; TOCH, RABIN & WILKINS, 1 9 6 2 ) . L e -
149
Z e i t s c h r i f t für S o z i a l p s y c h o l o g i e 1 9 7 6 , 7 , 1 4 3 — 1 5 3
te, zu negativen Ergebnissen geführt haben. Erstens trennen die dabei verwendeten Skalen Versuchspersonen nicht nach dem Grad ihrer Vorerfahrung mit der ethnischen Gruppe. Zweitens nivellieren Pro- und Antisemiten die Ergebnisse dann, wenn beide Gruppen die Identifikationsaufgabe mit gesteigerter Aufmerksamkeit verfolgen.
Antwortpräferenz Response-bias-Ergebnisse von Personen mit unterschiedlicher Neigung zu Vorurteilen zeigen im Vergleich zur Identifikationsleistung ein wesentlich klareres Muster. Versuchspersonen mit Vorurteilen neigen dazu, die Antwort „ J u d e " bei der Identifikation zu bevorzugen. Merkwürdigerweise bildet die einzige Studie, in der die SignalDetection-Methode benutzt wurde ( D O R F M A N , KEEVE & SASLOW, 1 9 7 1 ) , eine Ausnahme: Man fand zwar Unterschiede bei der Urteilssicherheit, aber keine respo«se-öia,s-Unterschiede. DORFMAN, KEEVE & SASLOW bieten keine inhaltliche Erklärung dafür an; sie neigen generell dazu, die Anwendung der Signal-Detection-Theorie auf ethnische Identifikation unter methodologischen Gesichtspunkten zu diskutieren. Ihr Ergebnis ist deshalb erstaunlich, weil in den älteren Arbeiten ausschließlich das auch in der Signal-DetectionMethode verwendete Maß p ( „ J u d e " ) benutzt wird. Obwohl die Ergebnisse aus den meisten Untersuchungen mit der Variablen p ( „ J u d e " ) eindeutig in die gleiche Richtung weisen, ist es theoretisch nicht einfach, diesen Befund zu erklären. Wie schon bei UPMEYER & LAYER ( 1 9 7 4 ) werden drei grundsätzliche Einflußgrößen als Bestandteil einer allgemeinen sozialpsychologischen Theorie für die Antwortpräferenz diskutiert: Erwartungen, Sanktionen, Antwort-Akzentuierung.
1.
personen wurde diese Manipulation nicht mitgeteilt. In allen 3 Gruppen bezeichneten die Versuchspersonen im Durchschnitt ca. 8 der 20 Bilder als „Jüdisch". Auch andere Experimente zeigen ein p ( „ J u d e " ) = .4. Nach eigenen und fremden Erfahrungen mit der Signal-Detection-Methode ist sicher anzunehmen, daß dieser Wert der objektiven Reizverteilung angenähert wird, sobald man die Reizverteilung bekanntgibt. UPMEYER & SCHREIBER (1972) und UPMEYER & LAYER (1972) zeigten, daß Versuchspersonen die Verteilung von sinnlosen Stimuli als gleich annehmen, wenn sie vom Versuchsleiter keine Informationen erhalten und auch sonst keinen response-bias-Variablen ausgesetzt sind. Der hier beobachtete Wert, p ( „ J u d e " ) = .4, k ö n n t e als die subjektive Einschätzung des V o r k o m m e n s von Juden angesehen werden. Zweifelhaft ist allerdings, ob dies die „ w a h r e " Einschätzung ist, oder ob es sich u m einen durch das Experiment konstant verzerrten Wert handelt. Die Verzerrung k ö n n t e z. B. durch einen Kompromiß Zustandekommen, den die Vp zwischen ihren „ w a h r e n " Ansichten über den relativen Anteil von Juden in einer Population und ihren Vermutungen über die Verteilung der Stimuluspersonen im Experiment schließt. Um den Einfluß von Erwartungen auf die Antwortpräferenz von Personen mit und ohne Vorurteile festzustellen, bedarf es neuer Experimente. Dabei sollte man variieren, ob und in welcher Weise die Stimulusverteilung bekanntgegeben wird. Das Ziel, dem „ w a h r e n " p („J")-Wert näher zu k o m m e n , könnte durch folgende Instruktion erreicht werden: „In der Serie von Photos, die wir Ihnen zeigen, sind prozentual soviele Juden enthalten, wie sie in unserem Land v o r k o m m e n . " Nach dieser Instruktion gibt man entweder den Prozentsatz an, oder verschweigt ihn. Unabhängig davon kann die relative Anzahl von Juden in der Reizserie geändert werden.
Erwartungen 2.
Am einfachsten ist nachzuweisen, daß Personen bei der Auswahl von Antworten relativ feste Annahmen über die Verteilung der Reizpersonen machen. ELLIOTT & WITTENBERG (1955) boten 20 Bilder mit Stimuluspersonen dar und änderten die a priori-Häufigkeit von Juden versus Nicht-Juden (15, 10, 5 von 20). Den Versuchs-
Sanktionen
Im folgenden wird die Rolle von Sanktionen bei Antwortpräferenzen besprochen. Dabei wird sich herausstellen, daß es häufig schwierig ist festzustellen, ob das Sanktionskonzept unabhängig vom Erwartungskonzept verwendet wird. LINDZEY & ROGOLSKY (1950) schlagen zwei
U p m e y e r : Ethnische Identifikation
150
Erklärungen vor, die aus Gründen der Darstellung getrennt behandelt werden, jedoch realiter zusammenwirken können. Nach der ersten Version glauben sie, daß Antisemiten Juden als bedrohlich ansehen und deshalb mehr Juden in ihrer Umwelt vermuten als wirklich vorhanden sind. Bedrohung kann man leicht als Sanktion definieren. LINDZEY & ROGOLSKY scheinen jedoch zu behaupten, daß die Sanktion bzw. Bedrohung ihrerseits eine Erwartung über die Verteilung der Stimuluspersonen erzeugt; diese Erwartung bestimmt dann unmittelbar, wie häufig die Antwort „Jüdisch" gegeben wird. In diesem Erklärungsansatz wird die Sanktion in einen Lernprozeß vorverlegt, der dem gerade beobachteten Urteilsprozeß vorausgeht. Diese Wirkung von Sanktionen unterscheidet sich von unserer Urteilstheorie, nach der eine bestimmte Antwortpräferenz auftritt, wenn Personen andere Antworten aus Furcht vor Sanktionen vermeiden. LINDZEY & ROGOLSKY nehmen hier offenbar nicht an, daß der Versuchsleiter oder die anderen Versuchspersonen Vermittler der Bedrohung sind. Auch in dem vorgeschalteten Lernprozeß scheinen andere Personen, in deren Gegenwart man Urteile abgibt, keine Rolle zu spielen. Die Behauptung der Autoren läuft vielmehr darauf hinaus, daß die persönliche Schätzung der Häufigkeit von Stimuli sich dann erhöht, wenn die Stimuli bedrohlich sind. Um dies „plausibel" zu machen, sollte man hinzufügen, daß Feinde um so bedrohlicher sind, je größer ihre Anzahl ist, bzw. daß Bedrohlichkeit nur zu rechtfertigen ist, wenn es sich um viele Personen handelt. Dieser interessante Hypothesenkomplex über die Genese von Erwartungen müßte jedoch in gesonderten Untersuchungen getestet werden. Nach der anderen Version von LINDZEY & ROGOLSKY spielt die Anwesenheit von Personen eine zentrale Rolle; sie schlagen eine Art Antwortstrategie, mit der man Sanktionen antisemitischer Freunde vermeiden kann, vor:
Dieses Zitat weist auf ein besonders gutes Beispiel für die Wirkungsweise sozialer „pay-offs" beim Antwortverhalten hin. Man kann diese Interpretation noch weiter fassen: Die urteilende Person braucht nicht notwendigerweise selbst antisemitische Attitüden zu haben; es reicht hin, daß ihre Freunde Antisemiten sind und daß sie gegebenenfalls Sanktionen ausüben. So überzeugend diese Argumentation in bezug auf Situationen des täglichen Lebens auch sein mag, so wenig realistisch ist sie für das Experiment von LINDZEY & ROGOLSKY. Hier übte der Versuchsleiter weder tatsächliche Sanktionen aus, noch konnten die Versuchspersonen wissen, in welcher Richtung der Versuchsleiter Vorurteile hegte. Darüberhinaus wurden beide Gruppen von Versuchspersonen (mit hohen und geringen Werten auf der Vorurteilsskala) vom Versuchsleiter in der gleichen Weise behandelt. Will man die zweite theoretische Version von LINDZEY & ROGOLSKY dennoch auf das typische experimentelle Paradigma zur Untersuchung ethnischer Identifikation anwenden, dann m u ß man zusätzlich annehmen, daß diese Art der Ausübung von Sanktionen von den Versuchspersonen vor dem Experiment häufig erlebt wurde und auf die Experimentalsituation generalisierend übertragen wurde.
3.
Antwortakzentuierung
UPMEYER & LAYER ( 1 9 7 4 ) haben vorgeschlagen, daß die von TAJFEL ( 1 9 5 9 ) konzipierte Akzentuierungserklärung auf das Antwortverhalten begrenzt werden sollte. Nach TAJI-EL akzentuieren Personen ihre Urteile, wenn die beurteilte Dimension mit einer oder mehreren anderen Dimensionen kovariiert; z.B. wurden Größen von physikalischen Objekten teilweise überschätzt, wenn Größe mit einer Wertvariablen hoch korreliert ist. UPMEYER & LAYER konnten zeigen, daß wertende Aussagen dann überzufällig einem Politiker zugeordnet werden, wenn die „ S o m e w h a t m o r e speculative is t h e possibility that Aussagen für den Politiker charakteristisch sind because of t h e negative characteristics that he assigns to und wenn die in der Aussage enthaltene Valenz t h e Jew, and because of the reinforcing a t t i t u d e s of his anti-semite friends, t h e prejudiced person may expect mit der Valenz der Attitüde korrespondiert, die failure t o identify t h e Jew correctly as m o r e likely t o eine urteilende Person gegenüber dem Politiker lead t o punishment t h a n labeling a non-Jew Jewish. In hat. Solche Korrespondenzen werden während t h e light of this, his m o r e f r e q u e n t use of t h e Jewish category would seem u n d e r s t a n d a b l e as a protective device." der Sozialisation erworben und zur Strukturierung unsicherer Urteilssituationen mit herange(S. 4 2 ) zogen.
Zeitschrift für Sozialpsychologie 1 9 7 6 , 7 , 1 4 3 — 1 5 3
Diese Theorie der Antwortakzentuierung paßt zu LINDZEY & ROGOLSKYS erster Erklärungsversion. Danach korrespondiert das Image von Antisemiten über Juden mit der Überschätzung des Populationsanteils der Juden. Diese Beziehung kann an Modellen oder durch Instruktion gelernt werden. Da sie nicht unbedingt auf direkten Erfahrungen basieren muß, kann der Anwendungsbereich der Erklärung von LINDZEY & ROGOLSKY erweitert werden.
Urteilssicherheit LINDZEY & ROGOLSKY ( 1 9 5 0 ) fanden höhere Werte in der Urteilssicherheit bei Personen mit ausgeprägten Vorurteilen im Vergleich zu anderen Personen. COOPER ( 1 9 5 8 ) fand durch Fragen heraus, daß Personen mit starken Antipathien gegen ethnische Gruppen glauben, sie könnten Mitglieder dieser Gruppen leicht identifizieren. Aus Anwendungen der Signal-Detection-Methode ist bekannt, daß sich die Urteilssicherheit erhöht, wenn die Sensitivität gegenüber dem Reizmaterial sich verstärkt (UPMEYER & SCHREIBER 1 9 7 2 ) . COOPERS Ergebnis wirft daher die Frage auf, ob die Urteilssicherheit dieser Personen lediglich eine Folge der tatsächlich höheren Identifikationsleistung ist, oder ob ein so hoher Grad subjektiver Sicherheit vorliegt, daß man ihn nicht allein durch Leistung rechtfertigen kann. DORFMAN, KEEVE & SASLOW ( 1 9 7 1 ) korrigierten deshalb die abhängige Variable „Urteilssicherheit" mit der Kovariaten „Identifikationsleistung" und fanden trotz dieser Korrektur, daß antisemitische Vpn beim Urteilen sicherer waren als andere. Ihr Ergebnis zeigt erneut, daß Urteilssicherheit von sozialen Variablen beeinflußt wird. Dieser Effekt mag in der Vorgeschichte von Personen auf ähnliche Weise zustandegekommen sein, wie in Experimenten von UPMEYER & SCHREIBER ( 1 9 7 2 ) : Vpn variieren ihre Urteilssicherheit je nachdem, ob andere Personen sie unterstützen oder ihnen widersprechen. Eine weitere interessante Idee über den sozialen Einfluß auf Urteilssicherheit stammt v o n TOCH, RABIN & WILKINS ( 1 9 6 2 ) . S i e n e h -
men an, daß jüdische Versuchspersonen ihre
151
Sicherheit beim Urteilen erniedrigen, wenn sie Juden identifizieren sollen, weil dies für sie keine positive Aufgabe ist, bzw. weil sie die Aufgabe als Affront auffassen; obwohl sie also gute Identifikationsleistungen zeigen, spielen sie ihre Fähigkeiten herunter, um ihren unangenehmen Gefühlen Ausdruck zu verleihen. Ein anderer Grund, warum sie dies tun, mag auch darin bestehen, daß sie der Ansicht sind, daß Unterschiede zwischen ethnischen Gruppen gemeinhin weit überschätzt werden, und daß man sich deshalb besser zurückhaltend äußert. Wenn dies zutrifft, müßte sich eine Reduktion der Urteilssicherheit auch bei nicht-jüdischen Beurteilern ohne Vorurteile zeigen — eine Folgerung, die von TOCH, RABIN & WILKINS nicht gesehen wird.
Schlußfolgerungen Es scheint so, als ob die Ergebnisse zur ethnischen Identifikation in eine allgemeinere Urteilstheorie integriert werden können, und daß man aus ihr einige spezielle Voraussagen für dieses Gebiet ableiten kann. Die Erklärungen, die hier angeboten wurden, widersprechen teilweise dem Tenor der Literatur. Identifizierungsfähigkeiten sind wahrscheinlich bei allen Personen gut ausgeprägt, die Interesse an und Erfahrungen mit der Gruppe haben, deren Mitglieder sie identifizieren sollen. Das Interesse kann sowohl durch negative als auch durch positive Attitüden gegenüber der Gruppe motiviert sein. Stammen Beurteiler selbst aus der zu identifizierenden Gruppe, kann man im repräsentativen Durchschnitt eine positive Attitüde unterstellen; gleichzeitig sind solche Beurteiler auch wahrscheinlich sehr vertraut mit den Merkmalen der Personen ihrer Gruppe. Vertrautheit folgt nicht notwendigerweise aus negativen Attitüden gegenüber Fremdgruppen. TAJIKL, BILLIG, BIJNDY & I-'I.AMENT ( 1 9 7 1 ) haben z. B. gezeigt, daß es genügt, Personen zufällig in zwei Gruppen aufzuteilen und ihnen die Bezeichnungen ingroup und outgroup zuzuordnen, um negative Auszahlungen gegenüber der Außengruppe zu erhalten. In diesem Fall lagen keine Merkmale vor, aufgrund deren Personen als zugehörig zu Außengruppen identifiziert werden konnten. KANUNGO & D A S
152
U p m e y e r : Ethnische Identifikation
(1960) fanden, daß nicht existierende Kasten mit negativen Eigenschaften beschrieben wurden. Diese Beispiele zeigen, daß negative Einstellungen gegenüber Gruppen existieren, von denen man buchstäblich nichts weiß, und daß Attitüden per se keine Basis für die adäquate Benutzung von Merkmalen sind. Negative Attitüden stellen möglicherweise ein Motiv dar, sich mit dem Feind zu beschäftigen. Versagt die Identifikationshypothese, dann kann dies z. B. daran liegen, daß in der Kontrollgruppe die Uninteressierten und in der Experimentalgruppe die Unerfahrenen erfaßt wurden. Mit Erfahrung ist nicht gemeint, daß direkter Kontakt vorliegen m u ß ; Merkmale können vielmehr durch Modelle oder Instruktoren vermittelt werden. In Abbildung 2 werden die theoretischen Beziehungen noch einmal zusammengefaßt. Ks wird deutlich, daß bestimmte Parallelen zu der Theorie bestehen, die UPMEYER & LAYER (1973, S. 192) für die Beziehung zwischen Attitüden und Gedächtnis skizziert haben. In beiden Aufsätzen sind „Reizanalyse" und „Antwortpräfer e n z " die grundlegenden Prozesse. Für den Bereich der ethnischen Identifikation wird die Urteilsabgabe
Direkte Sanktionen
G r ö ß e der ethnischen Gruppe 1 - Bedrohung
Überschätzung der Gruppengröße
Rolle der Vertrautheit bei der Reizanalyse besonders herausgearbeitet, d.h. sowohl Aufmerksamkeit als auch Stimuluscharakteristika kommen erst zur Wirkung, wenn ein vorhergehender Lernprozeß konkrete Erfahrungen mit dem Stimulus vermittelt hat, auf die in der Urteilssituation zurückgegriffen werden kann. Im Bereich „Attitüden und Gedächtnis" besteht dafür keine ausschließliche Notwendigkeit, weil neue Information direkt gespeichert werden kann, wenn ein dazugehöriges Etikett die Aufmerksamkeit erregt. In bezug auf die Antwortpräferenz bleibt der fundamentale Einfluß sozialer Sanktion auch hier erhalten. Eine wichtige Erweiterung für den vorliegenden Spezialfall besteht darin, dem Sachverhalt der Bedrohung durch Minoritäten eine Wirkung auf die Wahrnehmung der Reizverteilung zuzuschreiben. Nach der früheren Theorie bestimmt die Wahrnehmung der Reizverteilung in Form von Erwartungen dann genauso wie hier die Antwortpräferenz. Langfristig wird dieser Aufsatz als ein Teilstück zu einer umfassenderen sozialen Urteilstheorie angesehen, die die Reizdiskrimination in verschiedenen paradigmatischen sozialen Situationen wie K o n f o r m i t ä t , Gruppenkonflikt, Klassifikation, Lernen am Modell u.a. zum Gegenstand hat. Außerdem ist beabsichtigt, Erweiterungen auf dem Gebiet der subjektiven Reizskalierung vorzunehmen. Ein theoretischer Entwurf zu diesem Programm ist in Vorbereitung.
Literatur Antwortpräferenz (response-bias)
ALLPORT, G . W . & K R A M E R , B . M . 1 9 4 6 . S o m e
roots
of prejudice. J o u r n a l of Psychology 22, 9 - 3 9 . B R U N E R , J . S . & POSTMAN, L. 1 9 4 8 . A n a p p r o a c h
Reizanalyse
Sensitivität bei Identifikation Person mit Vorurteil -* Vertrautheit mit Stimulus
Stimuluscharakteristika
chology 43,
279-286.
COON, C.S. 1942. Have t h e Jews a racial identity. In:
- Aufmerksamkeit Angehörige der ethnischen G r u p p e
to
social perception. In: DENNIS, W. ( E d . ) : Current trends in social psychology. Pittsburgh: University of Pittsburgh Press. CARTER, L. F. 1948. The identification of „racial" membership. J o u r n a l of A b n o r m a l and Social Psy-
t_
G R A B B E R , I., & BRITT, S. H . ( E d s ): J e w s in a g e n t i l e
world. New York, Mac Millian. COOPER, J.B. 1958. Prejudical a t t i t u d e s and the identification of their stimulus objects: A p h e n o m e n o logical approach. J o u r n a l of Social Psychology 48, 15-23.
Abb. 2. Z u s a m m e n f a s s u n g der theoretischen Bezüge in der zwei-stufigen sozialen Urteilstheorie.
D O R F M A N , D. D., KEEVE, S. & SASLOW, C. 1 9 7 1 .
Eth-
nic identification: A signal detection analysis. Jour-
153
Zeitschrift für Sozialpsychologie 1976, 7, 1 4 3 - 1 5 3 nal of Personality and Social Psychology 18, 373— 379. ELLIOTT, D.N. & WITTENBERG, B.H. 1955. Critique and notes: Accuracy of identification of jewish and non jewish photographs. Journal of Abnormal and Social Psychology 51, 3 3 9 - 3 4 1 . GREEN, D.M. & SWETS, J. A. 1966. Signal detection and psychophysics. New York, Wiley. HIMMELFARB, S. 1966. Studies in t h e perception of ethnic group members: I. Accuracy, response-bias, and anti-semitism. Journal of Personality and Social Psychology 4, 3 4 7 - 3 5 5 . KANUNGO, R. & DAS, J. P. 1960. Differential learning and forgetting as a f u n c t i o n of the social f r a m e of reference. Journal of Abnormal and Social Psychology 61, 8 2 - 8 6 . LINDZEY, G. & ROGOLSKY, S. 1950. Prejudice and identification of minority group membership. Journal of Abnormal and Social Psychology 45, 3 7 - 5 3 . LUND, F . H . & BERG, W.C. 1946. Identifiability of nationality characteristics. J o u r n a l of Social Psychology 24, 7 7 - 8 3 . PULOS, L. & SPILKA, B. 1961. Perceptual selectivity, m e m o r y and anti-semitism. Journal of Abnormal and Social Psychology 62, 6 9 0 - 6 9 2 . SAVITZ, D. & TOMASSON, R. F. 1959. The identifiability of Jews. American J o u r n a l of Sociology 64, 468-475. SCODEL, A. & AUSTRIN, H. 1957. The perception of jewish photographs by Non-Jews and Jews. Journal of Abnormal and Social Psychology 54, 2 7 8 - 2 8 0 . SECORD, P. F. & SAUMER, E. 1960. Identifying Jewish names: Does prejudice increase accuracy? Journal of Abnormal and Social Psychology 61, 144—145. SWETS, J. A., TANNER, W.P. & BIRDSALL, T . G . 1961. Decision processes in perception. Psychological Review 68, 3 0 1 - 3 4 0 . TAJFEL, H. 1959. Quantitative j u d g m e n t in social perception. British Journal of Psychology 50, 16—29.
TAJFEL, H. 1969. Social and cultural factors in perception. In: LINDZEY, G. & ARONSON, E. (Eds.): T h e H a n d b o o k of Social Psychology, Vol. III. Lond o n , Addison-Wesley. TAJFEL, H., BILLIG, M.G., BUNDY, R.P. & FLAMENT, C. 1971. Social categorization and intergroup behavior. E u r o p e a n Journal of Social Psychology 1, 1 4 9 - 1 7 8 . TOCH, H.H., RABIN, A.I. & WILKINS, D.M. 1962. Factors entering into ethnic identifications: An experimental study. Sociometry 25, 2 9 7 - 3 1 2 . UPMEYER, A. & LAYER, H. 1972. E f f e c t s of inferiority and superiority in groups on recognition m e m o r y and confidence. Psychologische F o r s c h u n g 35, 277— 290. UPMEYER, A. & LAYER, H. 1973. A t t i t ü d e n u n d Gedächtnis bei sozialer Urteilsbildung. Zeitschrift für Sozialpsychologie 4, 181—194. UPMEYER, A. & LAYER, H. 1974. A c c e n t u a t i o n and a t t i t u d e in social j u d g m e n t . E u r o p e a n J o u r n a l of Social Psychology 4, 4 6 9 - 4 8 8 . UPMEYER, A. & SCHREIBER, W.K. 1972. E f f e c t s of agreement and disagreement in groups o n recognition m e m o r y p e r f o r m a n c e and c o n f i d e n c e . European Journal of Social Psychology 2, 5 - 2 3 .
Zu diesem
Beitrag
Diese Arbeit ist im Sonderforschungsbereich 24 Sozial- und wirtschaftspsychologische Entscheidungsforschung der Universität Mannheim unter Verwendung der von der Deutschen Forschungsgemeinschaft zur Verfügung gestellten Mittel und mit Unterstützung des Landes Baden-Württemberg entstanden. Ich danke Sabine Lang O H für ihre kritischen Beiträge bei der Abfassung des Manuskripts. | J
154
Braune, Boden, Bortz & Franke: Einfluß von Tageszeitungen
Empirie Der Einfluß von Tageszeitungen auf die Bewertung eines aktuellen politischen Ereignisses PAUL BRAUNE, ULRIKE BODEN, JÜRGEN BORTZ & JOACHIM F R A N K E Universität Erlangen-Nürnberg
Im R a h m e n einer L ä n g s s c h n i t t u n t e r s u c h u n g zu F r a g e n der Ä n d e r u n g politischer A t t i t ü d e n w u r d e in einer Zus a t z b e f r a g u n g g e p r ü f t , in w e l c h e r Weise u n t e r s c h i e d l i c h argumentierende Tageszeitungen ( F r a n k f u r t e r Runds c h a u / D i e Welt) die B e u r t e i l u n g eines a k t u e l l e n Ereignisses d u r c h ihre Leser b e e i n f l u ß t . Der G e g e n s t a n d d e r n a c h e t w a a c h t w ö c h i g e m Z e i t u n g s b e z u g e r f o l g t e n Bef r a g u n g w a r das a m 3. S e p t e m b e r 1 9 7 1 u n t e r z e i c h n e t e V i e r m ä c h t e a b k o m m e n über Berlin. Die B e w e r t u n g des A b k o m m e n s d u r c h die Leser unt e r s c h i e d sich s o w o h l allgemein als a u c h d i f f e r e n z i e r t bezüglich der 2 1 I t e m i n h a l t e des F r a g e b o g e n s in Übere i n s t i m m u n g mit der zwischen d e n Z e i t u n g e n k o n t r o versen Beurteilung. Die Ergebnisse s t i m m e n nicht mit der A n n a h m e überein, n a c h der M a s s e n m e d i e n im w e s e n t l i c h e n n u r p r ä k o m m u n i k a t i v e Einstellungen v e r s t ä r k e n . Sie b e t o n e n die Bed e u t u n g o b j e k t i v e r A r g u m e n t a t i o n s u n t e r s c h i e d e zwis c h e n Medien als Ursache für ihre Wirkung.
During a longitudinal study (1971—1973) male students of engineering a n d e c o n o m i c s received a n e w s p a p e r daily, e i t h e r „ D i e W e l t " or „ F r a n k f u r t e r R u n d s c h a u " . At t h e c o m m e n c e m e n t of t h i s field e x p e r i m e n t t h e newsp a p e r s w e r e assigned t o t h e s t u d e n t s at r a n d o m . Besides t h e regular q u e s t i o n i n g t o m e a s u r e c h a n g e s in political a t t i t u d e s at t h e b e g i n n i n g ( 1 9 7 1 ) , in t h e m i d d l e ( 1 9 7 2 ) a n d at t h e end of t h e s t u d y ( 1 9 7 3 ) special q u e s t i o n n a i r e s were sent t o e a c h s t u d e n t t o o b s e r v e t h e m e d i a e f f e c t s which c o u l d have b e e n t h e c o n s e q u e n c e of very c o n t r o versal t r e a t m e n t of t o p i c s b e t w e e n t h e t w o n e w s p a p e r s . T h e B e r l i n - A g r e e m e n t signed o n 3. S e p t . 1 9 7 1 was t r e a t e d very d i f f e r e n t l y by b o t h n e w s p a p e r s . T h e r e f o r e , a special q u e s t i o n n a i r e of 2 1 I t e m s was c o m p o s e d a n d d i s p a t c h e d t o t h e s t u d e n t s w h o w e r e reading t h e newsp a p e r s at t h e t i m e f o r a p p r o x i m a t e l y 8 weeks. T h e e v a l u a t i o n of t h e a g r e e m e n t b y t h e r e a d e r s diff e r e n t i a t e d generally in a c c o r d t o t h e p o i n t of view e a c h n e w s p a p e r had t a k e n b e f o r e a n d d u r i n g o u r q u e s t i o n ing. F u r t h e r i n f o r m a t i o n s h o w s t h a t t h e d i f f e r e n c e s of the Berlin A g r e e m e n t e v a l u a t i o n by t h e n e w s p a p e r s stand in direct r e l a t i o n s h i p t o t h e a t t i t u d e d i f f e r e n c e s b e t w e e n the readers. T h e results r e j e c t t h e w i d e l y k n o w n c o n c l u s i o n t h a t the mass m e d i a p r i m a r l y reinf o r c e existing a t t i t u d e s a n d e m p h a s i z e o b j e c t i v e d i f f e r ences b e t w e e n m é d i a s as a cause of t h e i r e f f e c t .
Ausgangsüberlegung
Die Schwierigkeit des „Abschiedes" wird beispielhaft an der jüngsten Zusammenfassung von
Es scheint nicht leicht zu sein, in einem so komplexen Forschungsgebiet wie dem der auf Massenmedien bezogenen Wirkungsforschung von einer entlastenden Verallgemeinerung Abschied zu nehmen, wie sie KLAPPER (1960) in seinem klassischen Buch formulierte und sieben Jahre später wiederholte: ,,... that mass communication ordinarily serves as an agent of reinforcement for such attitudes, opinions, and behavioral tendencies as the individual audience members already possess" (KLAPPER 1967, S.297).
SEARS & WHITNEY i m H a n d b o o k o f
Communi-
cation deutlich. „While this conclusion (KLAPPERS) is supported by much research and must be considered the most general singular principle about media effects, there are numerous a n d i m p o r t a n t e x c e p t i o n s t o i t " (SEARS & WHITNEY
1973,
S.
256).
Ein Prinzip aber, das „zahlreiche" und „wichtige" Ausnahmen zulälit und von den Autoren kritisch diskutiert wird, ist — zumal in einem politisch so bedeutsamen Forschungsbereich — als
155
Zeitschrift für Sozialpsychologie 1 9 7 6 , 7, 1 5 4 - 1 6 7
verallgemeinernde Aussage über die Wirkungen von Massenmedien ungeeignet und irreführend. Wenn man überhaupt verallgemeinernde Aussagen innerhalb dieses komplexen Forschungsfeldes, dessen Defizite unter methodischen und theoretischen Gesichtspunkten immer wieder kritisiert wurden (z.B. LANG & LANG 1 9 5 9 , KLAPPER 1 9 6 0 u n d 1 9 6 7 , HALLORAN 1 9 6 9 , CAL-
machen will, ist BADURAS und GLOYLS Feststellung besser geeignet: „Wir vermuten im einzelnen sehr viel und wissen exakt sehr wenig" (BADURA & TON 1 9 6 9 , WEISS 1 9 7 1 , BLEDIJAN 1 9 7 2 )
GLOYL 1 9 7 2 , S . 2 4 ) .
Wir berichten im folgenden über Teilergebnisse einer Studie, in der langfristig (maximal zwei Jahre) der Einfluß von Tageszeitungen auf politische Einstellungen im Rahmen einer experimentellen Feldstudie untersucht wurde (vgl. BODEN, BORTZ, BRAUNE & FRANKE 1975). Vergleichbare Untersuchungen liegen nicht vor (vgl. BODEN 1973). Wenn bisher langfristig Einwirkungen von Massenmedien untersucht wurden, handelte es sich meistens u m Wahlkampfstudien, deren begrenzte Aussagefähigkeit für normale Kommunikationszeiten LANG & LANG verdeutlicht haben. Ihre Schlußfolgerungen scheinen uns auch heute noch sehr aktuell zu sein: „Quite naturally, campaign studies such as we have been considering, have focused on the short-range influences operating during the period of active electioneering and on how these culminate in a final voting decision. It so happens, as we have tried to point out, that this approach to the problem with emphasis on individual conversion during the .official' campaign, minimizes the important cumulative influences of the mass media1 and emphasizes instead how political communications are transmitted through personal networks and how latent tendencies are activated" ( L A N G & LANG 1959, S.469). Charakteristisches Merkmal der Massenkommunikationsmedien ist ihre Möglichkeit, langfristig kumulativ einwirken zu können (vgl. NOELLE-NEUMANN 1 9 7 3 ) . Methodisch impliziert dieses Merkmal die Realisierung langer (nach einer beliebigen Einteilung von DRÖGE et al. 1 9 6 9 , S. 1 7 , etwa 1—4 Wochen) oder langfristiger Einwirkungsmöglichkeiten (nach den genannten Autoren mehr als 30 Tage), so daß damit praktisch typi1
Auszeichnung von uns.
sehe Laboruntersuchungen als relevante Informationsquellen ausgeschlossen sind 2 . Inhaltlich bedeutet Kumulation, daß ähnliche Aussagen innerhalb verschiedener Kontexte mehr oder weniger kontinuierlich wiederholend gemacht werden (vgl. KLAPPER 1960, S. 1 1 9 f f ; DRÖGE et al. 1969, S.97). Diese Feststellung enthält natürlich die ganze Breite methodischer und theoretischer Schwierigkeiten der Wirkungsforschung. Es erscheint kaum lösbar zu bestimmen, in welcher Weise sich die Aussagen verschiedener Medien objektiv — und darauf bezogen subjektiv beim Rezipienten — ähneln. Geht man von dieser Überlegung aus, bieten sich unserer Ansicht nach - wenn politische Einstellungen Gegenstand von Wirkungsuntersuchungen sind — entgegen der üblichen Forschungspraxis gerade Presseerzeugnisse als zu untersuchendes Kommunikationsmedium an. Trotz vielfältiger Unterschiede im Hinblick auf die Bandbreite von S t a n d p u n k t e n zwischen beispielsweise regionalen und überregionalen Presseerzeugnissen dürfte insgesamt die Geschlossenheit und Profilierung der redaktionellen Linie von Presseerzeugnissen größer sein als die der öffentlich rechtlichen Rundfunkanstalten in der Bundesrepublik. Damit bieten sie aber aus der Sicht des Angebots, also von der objektiven Ähnlichkeit der inhaltlichen Nachrichtenauswahl und Kommentierung, eine größere Chance zur kumulativen Einwirkung 3 . Wir haben an anderer Stelle erste Ergebnisse über einen einjährigen Untersuchungszeitraum dargestellt ( B O D E N , BORTZ, BRAUNE & FRANKE 1975), innerhalb dessen die Einwirkung unterschiedlich argumentierender Tageszeitungen auf die Veränderung politischer Einstellungen von Lesern untersucht wurde. Die Ergebnisse ließen eine eindeutige Aussage zu: Die Einstellungen 2
Eine Polemisierung gegen „Laborforschung" ist damit nicht intendiert. Ihr Stellenwert wäre nur erheblich größer, wenn es ihr gelänge, typische Kommunikationssituationen realistischer zu simulieren und damit den häufig erhobenen Einwänden (vgl. WEICK 1 9 6 7 ) entgegnen zu können. 3 Damit ist freilich nur eine Perspektive genannt, unter der der Vergleich zwischen Massenmedien — speziell Tageszeitungen gegenüber Rundfunk und Fernsehen - im Rahmen der Organisationsform innerhalb der Bundesrepublik untersucht werden kann. Da dies jedoch nicht unser Thema ist, soll dieser Gedanke hier nicht weiter aufgenommen werden (vgl. dazu z. B. NOELLE-NEUMANN 1971).
156
Braune, Boden, Bortz & Franke: Einfluß von Tageszeitungen
der Zeitungsleser veränderten sich — global gesehen — in Übereinstimmung mit den durch die Tageszeitungen unterschiedlich vertretenen Standpunkten. Die Ergebnisse ließen insgesamt vermuten, daß die Auswirkung umso bedeutsamer ist, je deutlicher die Zeitungen für oder gegen einen Standpunkt argumentierten (a.a.O. S.776). Ein entscheidendes Problem bei Längsschnittuntersuchungen besteht darin, den Bezug zwischen objektiver Argumentation der Zeitung und der direkten Wirkungsfeststellung bei den Lesern nachzuweisen. Notwendigerweise müssen Itemformulierungen von Skalen zur Messung von politischen Einstellungen im Rahmen solcher Untersuchungen allgemeiner formuliert werden, als es der konkreten Argumentationsweise der Zeitungen entspricht. Aus diesem Grunde wurden im Rahmen der unten kurz beschriebenen Längsschnittstudie ergänzend auch die Auswirkung der unterschiedlich argumentierenden Tageszeitungen auf die Beurteilung aktueller Ereignisse untersucht. Dadurch sollte es möglich werden, ausschnittsweise die kumulierende Wirkung unterschiedlich argumentierender Tageszeitungen auch hinsichtlich der von ihnen speziell erörterten Meinungsgegenstände untersuchen zu können.
suchspersonen eine der beiden Tageszeitungen. In schriftlichen Befragungen, die zu Beginn (1971), in der Mitte (1972) und am Ende des Untersuchungszeitraumes (1973) erfolgten, wurden die politischen Einstellungen und andere Variablen (z. B. Persönlichkeitsvariablen) erhoben, denen modifizierende E f f e k t e im Wirkungsprozeß zugeschrieben werden. Die politischen Einstellungen wurden sowohl in einer allgemeinen als auch in einer auf die aktuellen Ereignisse bezogenen F o r m erfaßt. Der Längsschnittcharakter der Untersuchung machte es notwendig, die politischen Einstellungen relativ unabhängig von tagespolitischen Problemen zu erfassen. Diesem Zweck dienten zum Beispiel Skalen zur Beurteilung des marktwirtschaftlichen Systems, der staatlichen Ordnungsmaßnahmen und der Ostpolitik der Bundesregierung. Zur Erfassung der Einstellungen zu aktuellen Ereignissen wurden Zusatzbefragungen durchgeführt. Dafür konnten die Versuchspersonen allerdings nicht — wie das sonst geschah — extra aufgesucht werden. Die Fragebögen wurden ihnen aus diesem Grunde durch die Post zugeschickt.
Gegenstand der
Zusatzbefragung
Einstellungsobjekt einer zusätzlichen Erhebung im Rahmen der Längsschnittstudie ist die Beurteilung des am 3. September 1971 unterzeichneten Viermächteabkommens über Berlin 4 . Nach Im Rahmen der bereits genannten Studie wurlängeren Verhandlungen einigten sich die vier den auch die hier benutzten Daten erhoben. Siegermächte (Frankreich, Großbritannien, Daher ist es zum Verständnis der weiteren AusSowjetunion, Vereinigte Staaten von Amerika) führungen notwendig, den Rahmen der Gesamtüber allgemeine, bis dahin formal nicht geregelte, untersuchung knapp zu umreißen. den Status und die Zugangswege West-Berlins In einem sonst von uns nicht beeinflußten Informationsfeld von 7 6 0 Fachhochschulstudenten betreffende Fragen. Dieses Viermächteabkommen repräsentierte einen wichtigen Zwischenzweier Fachrichtungen (Ingenieurwesen und schritt im Zuge der „Ost- und DeutschlandpoliWirtschaftswissenschaften) wurde jeweils eine tik", die von der Bundesregierung nach der von zwei unterschiedlich argumentierenden TaBundestagswahl 1969 eingeleitet wurde (Koaligeszeitungen eingeführt: die „ F r a n k f u r t e r Rundtionsregierung aus SPD und FDP u n t e r Bundesschau" und „Die Welt" (zur Charakterisierung kanzler Brandt). Diese Politik wurde von den der Zeitungen s.u.). Den aus dem gesamten Bundesgebiet stammenden Untersuchungsteilnehmern beiden Zeitungen intensiv und kontrovers kommentiert. Als im August 1971 die Unterzeichwurde — nach einem Zufallsverteilungsplan — nung des Viermächteabkommens bevorstand, entweder die eine oder die andere Zeitung regelgewann die Bewertung des Verhandlungsergebmäßig kostenlos zugeschickt. Darüber hinaus wurde der Zeitraum der Zeitungszustellung vari4 Das Viermächte-Abkommen über Berlin vom iert. Dadurch erhielten in der hier beschriebenen 3.September 1 9 7 1 , H o f f m a n n und Campe, Hamburg Untersuchungsphase nur zwei Drittel der Ver1971. Gesamtrahmen der Untersuchung
Z e i t s c h r i f t für S o z i a l p s y c h o l o g i e 1 9 7 6 , 7, 1 5 4 — 1 6 7
nisses im Rahmen der Kommentierung der Ostpolitik durch die beiden Zeitungen einen zentralen Stellenwert. Damit bot sich für uns die Möglichkeit, schon nach einer relativ kurzen Bezugsdauer der Tageszeitungen (etwa acht Wochen) die Auswirkung der deutlich kontroversen Kommentierung des Viermächteabkommens durch die beiden Tageszeitungen auf dessen Beurteilung durch ihre Leser zu untersuchen. Eine Bundestagswahl oder Landtagswahl fand zum Untersuchungszeitpunkt nicht statt. Deshalb können wir bei der Untersuchung dieses politisch aktuellen Ereignisses davon ausgehen, daß es sich um einen stark beachteten politischen Vorgang handelte, der jedoch keine Rolle für unmittelbar bevorstehende Wahlentscheidungen der Leser spielte. Demgemäß sind die bereits zitierten Bedenken von L A N G & L A N G gegen den im allgemeinen gegebenen Untersuchungskontext berücksichtigt.
Versuchsplan Nachdem aufgrund einer zufälligen Zuweisung 253 s Personen acht 6 Wochen lang die „FrankZeitungen Frankfurter
Die Welt
Rundschau Fachrichtungen
WI
ING
130 (63)
130 (63)
123
121
(59)
(58)
A b b . 1: V e r s u c h s p l a n der Z u s a t z b e f r a g u n g . D i e Z a h l e n o h n e K l a m m e r n g e b e n die A n z a h l der U n t e r s u c h u n g s t e i l n e h m e r an, die eine Z e i t u n g b e z o g e n ( E x p e r i m e n t a l g r u p p e ) ; die Z a h l e n mit K l a m m e r n g e b e n die A n z a h l der U n t e r s u c h u n g s t e i l n e h m e r an, die n o c h k e i n e Z e i t u n g bezogen (Kontrollgruppe). Es b e d e u t e n : Wl ING
5
= Studenten von Fachhochschulen Fachrichtung Wirtschaftswesen = Studenten von Fachhochschulen Fachrichtung Ingenieurwesen
Es h a n d e l t sich u m die b e i der A u s w e r t u n g berück-
sichtigten Untersuchungsteilnehmer. 6 A u s v e r s u c h s t e c h n i s c h e n G r ü n d e n b e g a n n die Zeit u n g s z u s t e l l u n g n i c h t g l e i c h z e i t i g . D i e Z e i t a n g a b e bezieht sich auf e i n e in j e d e m Fall für alle P e r s o n e n realisierte B e z u g s d a u e r .
157 furter Rundschau", 251 Personen die Zeitung „Die Welt" erhalten hatten, wurde ihnen — und der Kontrollgruppe (243 Personen) — ein Fragebogen zur Feststellung ihrer Ansichten zum Ergebnis der Viermächteverhandlungen über Berlin zugeschickt. Die Verteilung der Untersuchungsteilnehmer im Versuchsplan ist in Abbildung 1 dargestellt. Da sich die studentischen Zeitungsleser nach zwei Fachrichtungen (Fachhochschulen, wirtschaftswissenschaftliche und ingenieurwissenschaftliche Fachrichtung) unterschieden, handelt es sich um einen 2 (Fachrichtungen) x 2 (Zeitungen) Versuchsplan. Die im Versuchsplan dargestellte Zuordnung von Personen der Kontrollgruppe auf die „Zeitungen" erfolgte ebenfalls am Beginn der Untersuchung zufällig. Es handelt sich bei diesen Personen also um solche, die erst zu einem späteren Zeitpunkt — der im Rahmen dieser Zusatzbefragung nicht interessiert — in den Zeitungsbezug einbezogen wurden, bei denen aber bereits am Beginn der Untersuchung festgelegt wurde, welche Zeitung sie später erhalten sollten. Die schriftliche Befragung der Personen erfolgte nur einmal, und zwar nach der Unterzeichnung des Viermächteabkommens. Am 13. September 1971 — also zehn Tage nach der Unterzeichnung des Abkommens — wurde allen Untersuchungsteilnehmern der Fragebogen zugeschickt, dessen Items in der Abbildung 2 (S. 162) zusammengestellt sind. Die Antworten zu den Feststellungen konnten die Personen auf einer Sstufigen Skala vor - 2 (starke Ablehnung) bis +2 (starke Zustimmung) abgeben. Bei der Konstruktion des Fragebogens gingen wir von Kommentaren und Nachrichten aus, die sich in der Zeit vom 20. August bis 1. September 1971 in den beiden Zeitungen zu dem uns interessierenden Thema fanden. Jede der Feststellungen im Fragebogen entspricht mindestens einem Bericht oder einem Kommentar in der Zeitung. Nach 14 Tagen betrug die Rücklaufquote 75%. Da die Befragung in die Semesterferien fiel, mußte mit Verzögerungen gerechnet werden. Nach erneuter Bitte um Zusendung des ausgefüllten Fragebogens waren schließlich nach vier Wochen 95% der Fragebögen ausgefüllt zurückgeschickt worden. Da nach der Versendung des Fragebogens die öffentliche Diskussion über das Viermächteabkommen zwar nach-
158
Braune, Boden, Bortz & Franke: Einfluß von Tageszeitungen
ließ, inhaltlich aber von den beiden Zeitungen weitgehend gleichbleibend kontrovers fortgeführt wurde, verzichteten wir auf eine Berücksichtigung des Rücksendedatums bei den Auswertungen.
Feststellung der Argumentationsunterschiede zwischen den Zeitungen Allgemein läßt sich der Unterschied der Zeitungen im Hinblick auf die Kommentierung des Viermächteabkommens dahingehend charakterisieren, daß die „Frankfurter Runschau" das Abkommen durchgehend positiv beurteilte, „Die Welt" demgegenüber eine erheblich negativere und kritischere Einschätzung des Abkommens in ihren Kommentaren vornahm. Dies steht in Übereinstimmung mit der in den Untersuchungsjahren grundsätzlich unterschiedlichen Beurteilung der Ost- und Deutschlandpolitik der Bundesregierung durch die beiden Zeitungen. Um im Rahmen dieser Zusatzuntersuchung die direkte Auswirkung unterschiedlich kommentierender Tageszeitungen auf die Beurteilung des Einstellungsobjektes kriteriumsbezogen untersuchen zu können, wurde ein inhaltsanalytisch ausgerichtetes Einstufungsverfahren angewandt. Aus den Tageszeitungen, die zwischen dem 20. August und dem 27. September erschienen waren, wurden die Beiträge herausgesucht, die auf das Viermächteabkommen und seine Beurteilung Bezug genommen hatten. Aus der „Frankfurter Rundschau" standen uns zunächst 20 und aus der „Welt" 26 einschlägige Beiträge zur Verfügung 7 . Sie wurden zunächst vier Beurteilern (Beürteilergruppe I) zusammen mit dem Fragebogen vorgelegt, dessen Items aus der Abbildung 2 ersichtlich sind. Nach dem Lesen jedes Artikels sollte der Beurteiler entscheiden — die Beurteiler urteilten völlig unabhängig voneinander —, ob und in welchem Grade dieser zustimmende oder ablehnende Aussagen im Hinblick auf die 21 Feststellungen des Fragebogens enthielt. Wenn zu einem Item 7 Bei einer nochmaligen kritischen Durchsicht stellte sich heraus, daß wir pro Zeitung zwei d o c h n o c h als einschlägig zu betrachtende Beiträge übersehen hatten. Hierbei handelte es sich jedoch um Beiträge, die ebenfalls gleiche Argumentationsunterschiede aufwiesen.
keine Stellungnahme erkennbar war, wurde dazu keine Einstufung vorgenommen. Die Items des Fragebogens fungierten also inhaltsanalytisch gesprochen als Kategoriensystem. Der Nachteil dieses Vorgehens liegt darin, daß eventuell ebenso wirkungsvolle oder wirkungsvollere Argumentationsketten durch den Fragebogen nicht erfaßt werden können. Der Vorteil liegt aber in der vergleichbaren, kriteriumsbezogenen Erfassung von Inhaltsaspekten der Zeitungskommentierungen. Die folgenden Beispiele erläutern das Vorgehen: Am 24. August 1 9 7 1 stand in der "Welt": „Es ist damit eine neue innerdeutsche Rechtsplattform für die Zugangswege im Entstehen, die zweifelsohne nach und nach immer größere Bedeutung erlangen und dazu führen wird, daß die Verantwortung allmählich von den Schultern der Viermächte auf deutsche Schultern übergeht. Wer k ö n n t e übersehen, um wieviel schwächer damit auf die Dauer die westliche Position in der Zugangsfrage werden wird und welche internationale Aufwertung die , D D R ' erfährt?"
Dieser Teil des Kommentars wurde von einem Beurteiler zum Beispiel dem Item 2 des Fragebogens (siehe Abb. 2, S.162) „Die internationale Aufwertung der DDR durch das Berlinabkommen ist zu begrüßen" zugeordnet und mit —2 bewertet, da der Kommentarteil nach Ansicht des Beurteilers eine ablehnende Stellungnahme im Hinblick auf die inhaltliche Formulierung des Items zum Ausdruck bringt. Am 30. August 1 9 7 1 stand in einem Kommentar der „Frankfurter Rundschau" der folgende T e x t : „Die Konsequenzen der Berlinregelung reichen noch viel weiter. Sie wirken auf das künftige Verhältnis der beiden Staaten deutscher Nation: es gilt, parallel ein inneres Arrangement (vor allem: Erleichterung im Miteinander der Menschen) und eine internationale Aufwertung der DDR zu verwirklichen - bis BRD und D D R , vielleicht im Herbst 1 9 7 2 , Sitz und Stimme in den Vereinten Nationen erhalten."
Diesen Kommentarteil ordnete ein Beurteiler wiederum dem Item 2 zu und bewertete die Stelle mit +2, d.h. er war der Ansicht, daß die „Frankfurter Rundschau" mit diesen Sätzen, selbstverständlich eingebettet in den Kontext des Artikels, die internationale Aufwertung der DDR durch das Abkommen begrüßte. In einem Kommentar stand am 30. August 1 9 7 1 in der „Welt" der folgende Satz: „Im übrigen hätte eine CDU-Regierung diesen Kompromiß jederzeit auch bek o m m e n können".
159
Zeitschrift für Sozialpsychologie 1 9 7 6 , 7 , 1 5 4 - 1 6 7
Dieser Kommentarteil wurde von einem Beurteiler dem Item 8 „Unter einer CDU-Regierung wäre ein günstigerer Berlinvertrag abgeschlossen worden" zugeordnet und die Stellungnahme der Zeitung im Hinblick auf dieses Item mit +1 eingestuft.
ten Vorzeichen gilt also immer die jeweilige Formulierung eines Items. Jeder Zeitungsartikel konnte mehreren Items, dem gleichen aber nur einmal zugeordnet werden. Das gewählte Verfahren ist im einzelnen sehr aufwendig und keineswegs frei von subjektiven Interpretationen. Um Hinweise auf die Beurteilerobjektivität zu gewinnen, wurIn der „ F r a n k f u r t e r R u n d s c h a u " stand am 9 . S e p t e m de die Einstufung durch weitere vier Beurteiler ber 1 9 7 1 der f o l g e n d e Satz im K o m m e n t a r : „ O h n e das 8 A b k o m m e n h ä t t e die E n t s p a n n u n g in E u r o p a keine Chan- (Beurteilergruppe II) erneut durchgeführt . Um ce. Es gibt nach der U n t e r s c h r i f t der vier B o t s c h a f t e r den Arbeitsaufwand der zweiten Beurteilergrupaber a u c h kein Zurück m e h r . " pe zu verringern und auch Problemen aus dem Ein Beurteiler ordnete diesen Kommentar8 Da die Beurteiler keineswegs zu allen I t e m s Z u o r d aspekt dem Item 4 „Das Berlinabkommen ist ein n u n g e n v o r n a h m e n , w u r d e n die Urteile v o n jeweils 4 Bewesentlicher Beitrag zur Entspannung der Welt" zu und bewertete die Stellungnahme der Zeitung urteilern z u s a m m e n g e f a ß t . Den B e u r t e i l u n g s v o r g a n g f ü h r t e - darauf sei n o c h einmal hingewiesen — j e d e r Bemit +1, also etwas abgeschwächte Zustimmung. urteiler alleine d u r c h . An dieser Stelle m ö c h t e n wir Frau Als Bezugspunkt für Zustimmung oder AblehDr. L ö t z für ihre Initiative d a n k e n , die u n s diese Durchführung ermöglichte. nung und damit für die weiter unten dargestellTab. 1: Beurteilung des V i e r m ä c h t e a b k o m m e n s d u r c h die Z e i t u n g e n „ F r a n k f u r t e r R u n d s c h a u " u n d „ D i e Welt". Z u s a m m e n s t e l l u n g von B e w e r t u n g e n ( B e w e r t u n g s s u m m e u n d d u r c h s c h n i t t l i c h e B e w e r t u n g ) der K o m m e n t a r e der u n t e r s u c h t e n Z e i t u n g e n d u r c h verschiedene Beurteiler hinsichtlich der i n h a l t l i c h e n Ü b e r e i n s t i m m u n g m i t d e n Feststellungen des F r a g e b o g e n s (siehe A b b . 2, S. 162). „Frankfurter Rundschau Bewertungssumme
durchschnittliche
¡1
ßll
Bewertung
0 + 8 + 2 +23 0 + 6 - 4 - 8 - 5 - 2 + 7 + 8 - 4 0 - 2 - 8 - 4 - 3 - 2 + 10 + 4
-
0 + 1.00 +2.00 + 1.53 0 + 1.40 -1.40 -2.00 -0.75 -2.00 + 1.33 + 1.50 -1.75 -0.75 -2.00 -1.90 -2.00 -1.33 -2.00 + 1.35 + 1.20
2 0 0 + 17 0 + 1 - 3 0 + 2 0 + 5 + 1 - 3 - 3 0 -13 0 - 1 0 + 9 + 2
Es b e d e u t e n :
B I B II (P) (N)
Nr. der F e s t s t e l l u n g im Fragebogen
1 (N) 2 (P) 3 (P) 4(P) 5 (N) 6(P) 7(N) 8(N) 9(N) 10 (N) U 12 13 14 15 16 17 18 19 20 21
(P) (P) (N) (N) (N) (N) (N) (N) (P) (P) (P)
„Die W e l t " Bewertungssumme
durchschnittliche
-
—
Bewertung
+6 -10 - 3 -13 + 12 + 2 + 17 + 6 + 5 - 3 -17 -11 + 18 + 13 +20 +26 + 13 +23 - 8 0 0
+ 16 - 5 0 0 + 5 - 2 + 3 + 6 + 5 0 - 6 -12 + 12 +12 + 15 + 12 + 13 + 11 - 9 + 1 0
= Beurteilergruppe I = Beurteilergruppe II = positiv f o r m u l i e r t e Feststellung z u m B e r l i n a b k o m m e n = negativ f o r m u l i e r t e Feststellung z u m B e r l i n a b k o m m e n
+ 1.04 -0.55 -1.00 -1.85 + 1.41 0 + 1.42 +1.33 + 1.25 -0.37 -1.91 -1.35 +0.90 + 1.25 + 1.84 + 1.52 + 1.44 + 1.47 -1.41 +1.00 0
160
Braune, Boden, Bortz & Franke: Einfluß von Tageszeitungen
Wege zu gehen, die sich bei der Berücksichtigung von Nachrichtenartikeln ergeben hatten, beschränkten wir uns bei der erneuten Durchführung nur auf die Vorlage der offiziell als Meinungsäußerungen deklarierten Kommentare der Zeitungen 9 . Für jede der beiden Beurteilergruppen wurde getrennt für jedes Item und jede Zeitung eine Addition der Einstufungen (Bewertungen) vorgenommen. Die unter Berücksichtigung der Vorzeichen ermittelte Bewertungssumme wird als Maß für die Argumentationsintensität und Argumentationshäufigkeit aufgefaßt und repräsentiert unserer Ansicht nach die kumulierende Argumentation der Zeitungen im Hinblick auf das untersuchte Einstellungsobjekt, spezifiziert nach verschiedenen Aspekten dieses Einstellungsgegenstandes. Die Ergebnisse dieses inhaltsanalytischen Beurteilungsverfahrens sind in Tabelle 1 zusammengefaßt. Um die Vergleichbarkeit der Werte zu gewährleisten, wurden bei der endgültigen Zusammenstellung der Werte der ersten Beurteilergruppe (B I) auch nur die Bewertungen der Kommentare berücksichtigt. Spalte 4 der Tabelle 1 enthält die Itemnummern des Fragebogens. Die Itemformulierungen sind in Abbildung 2 (s. S. 162) wiedergegeben. Der Buchstabe in Klammern hinter der Itemnummer gibt die Richtung der Itemformulierung an. Positive Aussagen zum Berlinabkommen sind durch (P) gekennzeichnet, negative Feststellungen durch ein (N). Rückwirkend ergibt sich bei einigen Items die Schwierigkeit, nachvollziehen zu können, ob es eine positive oder negative Bewertung des Abkommens impliziert. Die Entscheidung ergibt sich aus einer Kenntnis des Argumentationshintergrundes. Von einer Zeitung, die sich wiederholt eher positiv oder auch schwächer negativ zum Ergebnis der Berlinverhandlungen äußerte, erwarten wir, daß bei den Items, die durch ein (P) gekennzeichnet sind, die entsprechenden Bewertungssummen durch positive Vorzeichen (oder zumindest einen geringen negativen Wert), bei den negativen Feststellungen (N) durch ein negatives 9
14 Artikel der „Frankfurter Rundschau", 2 4 Artikel der „Welt"; dieses Verhältnis entspricht etwa der auch bei anderen inhaltsanalytischen Untersuchungen festgestellten unterschiedlichen Häufigkeit von Meinungsartikeln in den beiden Zeitungen: „Die Welt" nimmt häufiger zu den von uns untersuchten Bereichen Stellung als die „Frankfurter Rundschau".
Vorzeichen (oder kleine positive Werte) gekennzeichnet sind. Bei einer negativ Stellung nehmenden Zeitung, also in unserem Falle der „Welt", wäre ein umgekehrtes Verhältnis der Vorzeichen zu erwarten. Die dementsprechenden tatsächlichen Werte sind für die Zeitung „Die Welt" in Tabelle 1, in der Spalte 5 (Bewertungssumme der Beurteilergruppe I [B IJ) und Spalte 6 (Bewertungssumme Beurteilergruppe II [B I I ] ) aufgeführt. Zur besseren Orientierung ist in Spalte 7 zusätzlich der Mittelwert der Einstufungen aller Beurteiler angegeben (Bewertungssumme/die Anzahl der vorgenommenen Einstufungen). Die analogen Werte für die „Frankfurter Rundschau" sind in den Spalten 1 (Beurteilergruppe I) und 2 (Beurteilergruppe II) sowie 3 (Mittelwert) angegeben. Die itembezogene, inhaltliche Beschreibung der Argumentationsrichtungen der Zeitungen zeigt deutlich, daß die „Frankfurter Rundschau" das Abkommen positiv beurteilt und „Die Welt" negativ Stellung nimmt. Lediglich bei dem Item 10 ergibt sich ein - wenn auch extrem geringer — Unterschied, der der Ausgangshypothese entgegengerichtet ist. Zur Ermittlung der Beurteilerobjektivität wurde eine Rangkorrelation (SPEARMAN) zwischen den Bewertungssummen beider Beurteilergruppen über die Items für jede Zeitung getrennt berechnet. Die Bewertungssummen der beiden Beurteilergruppen korrelieren bei der Zeitung „Die Welt" mit einem Wert von r = 0.60, bei der „Frankfurter Rundschau" beträgt der analoge Wert rs = 0.41. Beide Werte sind signifikant (n = 21, p = < 0,05). Die Übereinstimmung der Beurteilergruppe im Hinblick auf „Die Welt" ist deutlich größer als im Hinblick auf die Beurteilung der „Frankfurter Rundschau". Wir sehen dies nicht als Ausdruck der unterschiedlichen Eindeutigkeit der Stellungnahmen bei den Zeitungen an, sondern als Auswirkung der unterschiedlichen Anzahl der zur Verfügung stehenden Artikel. Unabhängig davon ist durch die unterschiedliche Häufigkeit der Kommentierungen mit einer stärker kumulierenden Wirkung der Zeitung „Die Welt" zu rechnen. Die mitgeteilten Objektivitätswerte im Hinblick auf die Bewertung der Zeitungen zeugen von der Schwierigkeit, kriteriumsbezogene, objektive Beschreibungen der Kommentierungen zu erhalten. Sie sind aber ausreichend, um zu
Zeitschrift für S o z i a l p s y c h o l o g i e 1 9 7 6 , 7, 1 5 4 - 1 6 7
versuchen, itembezogene unterschiedliche Argumentationen von Zeitungen mit deren Auswirkung beim Leser in Beziehung zu setzen. Die damit begründeten Unterschiede zwischen den beiden Tageszeitungen berechtigen uns zur Hypothese, daß die Leser der „Frankfurter Rundschau" das Abkommen nach achtwöchigem Zeitungsbezug positiver beurteilen als entsprechende Leser der „Welt". Darüber hinaus wird von der Hypothese ausgegangen, daß die unterschiedliche Auswirkung der Zeitungen auf die Beurteilung des Abkommens mit der Häufigkeit und Intensität der Argumentation zunimmt.
Auswertung und Ergebnisse Zunächst wird zur Feststellung der Auswirkung der beiden Tageszeitungen der Unterschied zwischen den Stellungnahmen ihrer Leser (Experimentalgruppen) varianzanalytisch geprüft. Da sich die Zahl der Personen geringfügig innerhalb der Gruppen des Versuchsplans unterscheidet, wurde bei den für jedes Item berechneten Varianzanalysen die unweighted means Solution (vgl. W I N E R , 1972) verwendet. Die G l o b a l h y p o t h e s e , d a ß Frankfurter R u n d s c h a u b z w . Welt-Leser in ihren E i n s t e l l u n g e n zu d e m a k t u e l l e n Ereignis durch die T a g e s z e i t u n g e n b e e i n f l u ß t w u r d e n , wäre z w e i f e l l o s m e t h o d i s c h sauberer mit H o t e l l i n g s T 2 Test für z w e i u n a b h ä n g i g e S t i c h p r o b e n b z w . , u m die Gew i c h t u n g e n der e i n z e l n e n a b h ä n g i g e n Variablen zu erhalten, mit einer e n t s p r e c h e n d e n D i s k r i m i n a n z a n a l y s e überprüft w o r d e n . A u s g e h e n d v o n d e m dargestellten V o r g e h e n , die Arg u m e n t a t i o n s u n t e r s c h i e d e z w i s c h e n den Z e i t u n g e n krit e r i u m s b e z o g e n zu erfassen, waren wir j e d o c h u n t e r inhaltlichen G e s i c h t s p u n k t e n i n s b e s o n d e r e an den darauf zu b e z i e h e n d e n B e u r t e i l u n g s u n t e r s c h i e d e n z w i s c h e n den Lesern der T a g e s z e i t u n g e n interessiert. Daher war es n o t w e n d i g , für j e d e s I t e m e i n e n I n d i k a t o r für die T r e n n u n g der G r u p p e n zu e r m i t t e l n . Eine d i s k r i m i n a n z a n a l y t i s c h e V o r g e h e n s w e i s e h ä t t e in d i e s e m Falle lediglich zu Gew i c h t u n g s f a k t o r e n der e i n z e l n e n a b h ä n g i g e n Variablen geführt, die nur im K o n t e x t der hier u n t e r s u c h t e n abhängigen Variablen interpretierbar sind. A u f g r u n d möglicher S u p p r e s s i o n s e f f e k t e , die w e g e n der A b h ä n g i g k e i t e n der abhängigen Variablen u n t e r e i n a n d e r h ä t t e n auftreten k ö n n e n , wären diese G e w i c h t e nicht geeignet g e w e sen, die speziellen H y p o t h e s e n über die G r ö ß e der Unterschiede z w i s c h e n d e n Lesergruppen zu überprüfen.
Die Mittelwertunterschiede zwischen den beiden Lesergruppen und die Angabe der mit dem genannten Verfahren ermittelten signifikanten
161 Differenzen sind in Verbindung mit den Items in Abbildung 2 zusammengestellt. Aufgrund der dort zusammengefaßten Daten lassen sich die folgenden Schlußfolgerungen ziehen: (1) Unabhängig von der unterschiedlichen Beurteilung des Abkommens durch die Zeitungsleser fällt auf, daß von den erfaßten Personen das Abkommen und seine Ergebnisse allgemein recht positiv eingeschätzt wurden. (2) Geht man von den aus Tabelle 1 ersichtlichen Argumentationsunterschieden der beiden Zeitungen aus (Bewertungssummen), so ist festzustellen, daß 20 der in Abbildung 2 dargestellten Mittelwertunterschiede sich im erwarteten Sinne numerisch unterscheiden. In 20 von 21 Fällen spiegeln sich also die Argumentationsunterschiede der Zeitungen in den Meinungen der Leser wider. Lediglich bei der Feststellung 10 entspricht der sichtbare Unterschied nicht der durch die Bewertungssummen festgelegten Ausgangserwartung 10 . Die Mittelwertunterschiede innerhalb der Kontrollgruppe - hier nicht abgebildet - sind nur zufällig. Bei den nicht durch einen systematisch variierten Zeitungsbezug beeinflußten Personen weisen von den 2 L Vergleichen, die aufgrund des Versuchsplans auch bei der Kontrollgruppe durchgeführt werden können, nur 9 in die durch die Zeitungsargumentation vorgegebene Richtung. (3) Bei 12 Items ist der zwischen den beiden Zeitungslesergruppen festzustellende argumentationskonforme Mittelwertunterschied auf dem 5%-Niveau statistisch signifikant (bei 7 Items ist p < 0,01). Da zu Beginn des Zeitungsbezuges die politischen Ansichten durch die Art der experimentell manipulierten Zeitungszuweisung als gleichmäßig verteilt innerhalb der Lesergruppen angesehen werden müssen, kann man davon ausgehen, daß die Wirksamkeit der Zeitungsargumentation damit nachgewiesen ist. (4) Unterschiedliche Ausbildungseffekte bzw. 10 H i n s i c h t l i c h anderer D e s k r i p t i o n s m e t h o d e n ( B e fragung der b e t e i l i g t e n J o u r n a l i s t e n ) e n t s p r i c h t der gefundene Unterschied auch dem festgestellten Argument a t i o n s u n t e r s c h i e d . D a m i t z u s a m m e n h ä n g e n d e Prob l e m e sollen hier j e d o c h nicht v e r t i e f t w e r d e n .
162
Braune, Boden, Bortz & Franke: Einfluß von Tageszeitungen Zustimmung
Ablehnung o I 1. 2. 3. 4.
Die Beschränkung der Botschaftergespräche auf WestBerlin stellt einen Sieg der S o w j e t u n i o n dar.
6.
O h n e die Ostpolitik der SPD-Regierung wären die Berlinvereinbarungen nicht zustande g e k o m m e n .
7.
Der Zugang nach West-Berlin ist durch die Berlinvereinb a r u n g e n nicht sicherer geworden. U n t e r einer CDU-Regierung wäre ein günstigerer Berlinvertrag abgeschlossen worden. A u c h bei dem Berlinvertrag wird es der UdSSR gelingen, durch geschickte I n t e r p r e t a t i o n e n ihren E i n f l u ß weiter auszudehnen. Die innerdeutschen Gespräche ( B a h r / K o h l ) vor der Unterzeichnung der Berlinvereinbarungen waren für deren Z u s t a n d e k o m m e n bedeutungslos. Der Berlinvertrag ist ein großer Fortschritt für die innerdeutschen Beziehungen.
9. 10. 11. 12.
Durch die Vereinbarungen wurde die Berlinfrage dauerh a f t gelöst.
13.
Bei den Berlinvereinbarungen m a c h t e n die Westmächte m e h r Konzessionen als die UdSSR. Die neue Berlinregelung stellt eine S c h w ä c h u n g der Position der USA in Europa dar.
14. 15. 16. 17. 18. 19. 20. 21.
ö+
Das Ergebnis der Berlinverhandlungen hat die Position der Westmächte gegenüber dem gesamten Ostblock geschwächt. Die internationale A u f w e r t u n g der D D R d u r c h das Berl i n a b k o m m e n ist zu begrüßen. Die Besuche der drei westlichen Botschafter während der Berlingespräche bei der Bundesregierung sind ein Zeichen für die Z u s t i m m u n g dieser Länder zur Ostpolitik der Bundesrepublik. Das B e r l i n a b k o m m e n ist ein wesentlicher Beitrag zur E n t s p a n n u n g in der Welt.
5.
8.
o
Ein Generalkonsulat der UdSSR in West-Berlin wird die politische Machtposition der S o w j e t u n i o n stärken. Die Zusammengehörigkeit der Bundesrepublik und Westberlins ist durch die Berlinregelung g e f ä h r d e t . Die Berlinregelung ist eine als Sieg etikettierte Niederlage der Westmächte. Die Erleichterung der Lebensbedingungen der Berliner ist mit der Aufgabe der Bundespräsenz zu teuer bezahlt. Die Zusagen der S o w j e t u n i o n im Berlinvertrag sind vertrauenswürdig. Die Voraussetzungen für die Ratifizierung der Ostverträge ( P o l e n / S o w j e t u n i o n ) sind durch die Berlinvereinbarungen erfüllt. Die Berlinvereinbarungen werden die Wahlaussichten für die Regierungsparteien positiv beeinflussen.
Lesergruppe „ F r a n k f u r t e r R u n d s c h a u " : ^
3
Lesergruppe „Die Welt":
A b b . 2 : Durchschnittliche Beurteilung des V i e r m ä c h t e a b k o m m e n s über Berlin durch Untersuchungsteilnehmer, die die Tageszeitung „ F r a n k f u r t e r R u n d s c h a u " oder „Die Welt" erhalten haben. Ablehnung bzw. Z u s t i m m u n g beziehen sich auf den Text der 21 Feststellungen. Signifikante Mittelwertunterschiede sind durch ein x gekennzeichnet (p < 0.05).
W e c h s e l w i r k u n g e n z w i s c h e n der A u s b i l d u n g der Zeitungsleser u n d d e n Z e i t u n g e n k o n n t e n nicht n a c h g e w i e s e n w e r d e n . Wir v e r z i c h t e n deshalb auf die Wiedergabe der darauf b e z o g e n e n A u s w e r t u n gen.
Die z w i s c h e n d e n S t e l l u n g n a h m e n der b e i d e n Lesergruppen z u m V i e r m ä c h t e a b k o m m e n besteh e n d e n U n t e r s c h i e d e lassen sich s o m i t auf die A r g u m e n t a t i o n der j e w e i l s b e z o g e n e n Z e i t u n g e n zurückführen. A u s der Tabelle 1 geht d e u t l i c h
163
Z e i t s c h r i f t für S o z i a l p s y c h o l o g i e 1 9 7 6 , 7 , 1 5 4 - 1 6 7
h e r v o r , d a ß die g l o b a l zu k o n s t a t i e r e n d e Beur-
g e n s t a n d e s d u r c h ihre Leser. A m W e r t d e r b e -
teilung des A b k o m m e n s d u r c h die b e i d e n Zei-
richteten Rangkorrelationen verändert sich nichts,
tungen i m H i n b l i c k a u f b e s t i m m t e — d u r c h d e n
w e n n als S c h ä t z u n g d e r A u s w i r k u n g d e r Z e i t u n -
F r a g e b o g e n s e l b s t v e r s t ä n d l i c h n u r b e g r e n z t er-
gen a n s t e l l e der P ( F ) - W e r t e e n t s p r e c h e n d e O m e -
f a ß t e - A s p e k t e u n t e r s c h i e d l i c h a k z e n t u i e r t ist.
ga-Quadrat-Werte herangezogen werden. Damit
Der damit zum Ausdruck k o m m e n d e Unterschied
lassen s i c h über den g l o b a l e n W i r k u n g s n a c h w e i s
z w i s c h e n den Z e i t u n g e n w u r d e g e n a u e r b e s t i m m t :
hinausgehende A n n a h m e n bestätigen. J e eindeu-
Für die b e i d e n B e u r t e i l e r g r u p p e n g e t r e n n t wurde
tiger ein U n t e r s c h i e d z w i s c h e n den Z e i t u n g e n ist,
die D i f f e r e n z d e r B e w e r t u n g s s u m m e n pro I t e m
d e s t o d e u t l i c h e r zeigt s i c h ihre W i r k u n g (vgl. BO-
z w i s c h e n den Z e i t u n g e n e r m i t t e l t ( D i f f e r e n z zwis c h e n d e n B e w e r l u n g s s u m m e n der S p a l t e n 1 u n d 5 sowie 2 u n d 6 in der T a b e l l e 1 u n t e r B e r ü c k s i c h t i g u n g des V o r z e i c h e n s ) u n d in R a n g r e i h e n g e b r a c h t . Diese b e i d e n R a n g r e i h e n k o r r e l i e r t e n ( r = 0 . 6 5 ) , so d a ß eine b e f r i e d i g e n d e Ü b e r e i n s t i m m u n g in der U n t e r s c h i e d s b e u r t e i l u n g d u r c h die b e i d e n B e u r t e i l e r g r u p p e n zu k o n s t a t i e r e n ist. Als h i n r e i c h e n d b e f r i e d i g e n d e S c h ä t z u n g des Z e i t u n g s u n t e r s c h i e d e s s e h e n wir d a h e r die D i f f e r e n z e n r a n g r e i h e an, die bei e i n e r Z u s a m m e n f a s sung b e i d e r B e u r t e i l e r g r u p p e n e n t s t e h t . D a m i t k a n n n u n die U n t e r s c h i e d l i c h k e i t der A r g u m e n t a t i o n s w e i s e z w i s c h e n den Z e i t u n g e n mit der darauf bezogenen unterschiedlichen
durchschnitt-
l i c h e n B e u r t e i l u n g z w i s c h e n den L e s e r n beider Z e i t u n g e n in B e z i e h u n g g e s e t z t w e r d e n . Als S c h ä t zung der A u s w i r k u n g der Z e i t u n g e n a u f ihre Leser w u r d e die I r r t u m s w a h r s c h e i n l i c h k e i t der aus der V a r i a n z a n a l y s e sich e r g e b e n d e n F - W e r t e des H a u p t e f f e k t e s „ Z e i t u n g " g e s e h e n , da e i n f a c h e Mittelwertdifferenzen aufgrund unterschiedlicher S t r e u u n g e n n i c h t u n m i t t e l b a r verglichen werden k ö n n e n . Diese I r r t u m s w a h r s c h e i n l i c h k e i t e n , die statistisch g e s p r o c h e n also die Z u f ä l l i g k e i t der Unt e r s c h i e d e z w i s c h e n den B e u r t e i l u n g e n der beiden L e s e r g r u p p e n e r f a ß t , wurde e b e n f a l l s in eine Rangreihe g e b r a c h t . Die K o r r e l a t i o n b e i d e r R a n g r e i h e n gibt nun den m o n o t o n e n Z u s a m m e n h a n g hinsichtlich kumulierender Argumentationsunters c h i e d e z w i s c h e n den Z e i t u n g e n und der Auswirkung bei ihren Lesern w i e d e r . Die R a n g k o r r e l a tion b e i d e r M e ß r e i h e n b e t r ä g t r = + 0 . 3 7 und ist bei e i n e r e i n s e i t i g e n F r a g e s t e l l u n g , von der wir h i e r ausgehen k ö n n e n , a u f d e m 5%-Niveau signif i k a n t (n = 2 1 ) . Die a n a l o g e K o r r e l a t i o n inner-
DEN, B O R T Z , B R A U N E & F R A N K E 1 9 7 5 ,
S.776).
D e r V e r s u c h s p l a n e r m ö g l i c h t es a u c h , die Wirk u n g n u r e i n e r Z e i t u n g im V e r g l e i c h z u r K o n t r o l l g r u p p e zu u n t e r s u c h e n (vgl. V e r s u c h s p l a n , A b b i l dung 1 ) . A u s g e h e n d v o n den in d e r T a b e l l e 1 festgehaltenen Argumentationsunterschieden der Z e i t u n g e n m u ß v o n f o l g e n d e n H y p o t h e s e n ausgegangen w e r d e n : Die L e s e r d e r „ F r a n k f u r t e r R u n d s c h a u " werten A b l a u f und Ergebnis der Berlinv e r h a n d l u n g e n p o s i t i v e r als die N i c h t l e s e r . Die L e s e r der Z e i t u n g „ D i e W e l t " h i n g e g e n w e r d e n im D u r c h s c h n i t t das A b k o m m e n n e g a t i v e r beurt e i l e n als die K o n t r o l l g r u p p e . Z u r Prüfung dieser H y p o t h e s e n w u r d e n die M i t t e l w e r t u n t e r s c h i e d e z w i s c h e n den N i c h t - L e sern u n d den b e i d e n L e s e r g r u p p e n g e t r e n n t mit Hilfe des t - T e s t s v e r g l i c h e n . Die L e s e r d e r „ F r a n k f u r t e r R u n d s c h a u " u n t e r s c h i e d e n s i c h in k e i n e m Fall s i g n i f i k a n t von den N i c h t - L e s e r n . 1 3 M i t t e l w e r t d i f f e r e n z e n u n t e r s c h e i d e n sich n u m e r i s c h ges e h e n im S i n n e der f o r m u l i e r t e n H y p o t h e s e n , 8 l a u f e n dieser E r w a r t u n g e n t g e g e n . Bei den L e s e r n der Z e i t u n g „ D i e W e l t " zeigt sich ein a n d e r e s Bild. 18 der 2 1 M i t t e l w e r t d i f f e r e n z e n u n t e r s c h e i d e n sich im S i n n e d e r f o r m u lierten A u s g a n g s h y p o t h e s e n von d e n e n d e r N i c h t Leser. 9 M i t t e l w e r t d i f f e r e n z e n sind a u f d e m 5%Niveau s i g n i f i k a n t . Die d a r a u f b e z o g e n e n E r g e b nisse sind in A b b i l d u n g 3 g r a p h i s c h z u s a m m e n gestellt. Sie e r l a u b e n die w e i t e r e S c h l u ß f o l g e r u n g : ( 5 ) D i e B e w e r t u n g d e r B e r l i n v e r h a n d l u n g e n wurde v o n d e r Z e i t u n g „ D i e W e l t " s t ä r k e r b e e i n f l u ß t als von d e r Z e i t u n g „ F r a n k f u r t e r R u n d s c h a u " .
h a l b der K o n t r o l l g r u p p e b e t r ä g t rs = - 0 . 0 6 , so d a ß u n a b h ä n g i g v o m S i g n i f i k a n z n i v e a u die T e n denz e i n d e u t i g ist: Z e i t l i c h k u m u l i e r e n d e , stärkere U n t e r s c h i e d e in der A r g u m e n t a t i o n der Zeit u n g e n führen a u c h zu t e n d e n z i e l l s t ä r k e r unters c h i e d l i c h e n B e u r t e i l u n g e n des Einstellungsge-
Diskussion Die E r g e b n i s s e b e l e g e n , d a ß von T a g e s z e i t u n g e n die B e u r t e i l u n g des B e r l i n - A b k o m m e n s b e i i h r e n Lesern beeinflußt wurde. Beim u n t e r s u c h t e n Ein-
164
Braune, Boden, Bortz & Franke: Einfluß von Tageszeitungen
Zustimmung
Ablehnung