178 45 45MB
German Pages 111 [121] Year 1991
H E R A U S G E B E R RAINER GUSKI GEROLD MIKULA AMÉLIE MUMMENDEY BERN HARD ORTH
B A N D 21 1990 H EFT 4
VERLAG HANS HUBER BERN STUTTGART
TORONTO
Zeitschrift für Sozialpsychologie Gegründet von: Hubert Feger Klaus Holzkamp Carl Friedrich Graumann Martin Irle Wissenschaftlicher Beirat: Günter Albrecht Hans-Werner Bierhoff Mario von Cranach Helmut Crott Dieter Frey Volker Gadenne Franz Urban Pappi Peter Petzold John Rijsman Peter Schönbach Wolfgang Stroebe Arnold Upmeyer Rolf Ziegler
Copyright 1990 Verlag Hans Huber Bern Stuttgart Toronto Herstellung: Lang Druck AG, Liebefeld Printed in Switzerland Gedruckt mit Unterstützung der Deutschen Forschungsgemeinschaft Library of Congress Catalog Card Number 78-126626 Die Zeitschrift für Sozialpsychologie wird in Social Sciences Citation Index (SSCI) und Current Contents / Social and Behavioral Sciences erfaßt
Zeitschrift für Sozialpsychologie 1990, Band 21 Heft 4 INHALT Editorial
237
Theorie und Methode Zur Konstruktvalidität in der Einstellungsmessung: Singulare oder multiple Komponenten-Modelle 238
M E N D L E R , W . ; DOLL, J . & O R T H , B.: Construct
validity in attitude measurement:
Single-component
and multiple-component
models
H.: Zur Degeneration von Likert-Skalen bei fehlenden Werten (einige Artefakte bei Anwendung der nicht-linearen Hauptkomponentenanalyse) 252
MATSCHINGER,
On the degeneration of Likert-scales in case of missing values (Artefacts resulting from the application linear principle component analysis)
of non-
Empirie M.: Über den Zusammenhang der Ähnlichkeit von Attitüden, Interessen und Persönlichkeitsmerkmalen und der Qualität heterosexueller Paarbeziehungen 265
HASSEBRAUCK,
About the relationship marital adjustment
between similarity of attitudes, interests, and personality
attributes and the quality
of
Übersichtsbeiträge BECKER-BECK, U . & SCHNEIDER, J . F.: Small group research in german speaking
Kleingruppenforschung im deutschsprachigen Raum
274
countries
B.: Soziale Kategorisierung und differentielle Wahrnehmung von Ingroup- and Outgroup-Homogenität 298
SIMON,
Social categorization
and differential perception
of ingroup and outgroup
homogeneity
Literatur Kurzrezensionen 314 W I T T E , E.H.: Sozialpsychologie. Ein Lehrbuch. ( W . LILLI) 314 HEWSTONE, M.: Causal attribution. From cognitive processes to collective beliefs. (B. Six) 317 Sammelrezension 320 MUMMENDEY, H. D. (Hrsg.): Verhalten und Einstellung. Untersuchung der Einstellungs- und Selbstkonzeptänderung nach Änderung des alltäglichen Verhaltens 320 UPMEYER, A. (Hrsg.): Attitudes and behavioral decisions. (H.W. BIERHOFF) 320 Dissertationen 325 Titel und Abstracta 326 Neuerscheinungen 328 Nachrichten und Mitteilungen
330
Autoren Gesamtverzeichnis Band 21 (1990) Namens- und Sachregister Band 21 (1990)
334 337 340
Verlag Hans Huber, Bern Stuttgart Toronto
Zeitschrift für Sozialpsychologie 1990, 237
237
Editorial Die Fritz-Thyssen-Stiftung verlieh zum neunten Mal ihren Preis für die besten sozialwissenschaftlichen Aufsätze in deutscher Sprache für den Zeitschriftenjahrgang 1989. Mit diesem Preis soll alljährlich «der Zeitschriftenaufsatz als Mittel der wissenschaftlichen Kommunikation» hervorgehoben werden. Es ist der einzige Zeitschriftenpreis in den Sozialwissenschaften außerhalb des englischsprachigen Bereichs. Der Beitrag von Friederike HOLZ-EBELING «Zur Frage der Tri-
vialität von Forschungsergebnissen» in dieser Zeitschrift (1989, Heft 3, S. 141-156) war einer der vier Preisträger für diesen Jahrgang. Wir beglückwünschen unsere Autorin und freuen uns natürlich für die Zeitschrift für Sozialpsychologie. Die Geschäftsführung geht turnusgemäß mit Beginn des neuen Jahres an Bernhard ORTH über, der bei der Redaktion von Jörg DOLL unterstützt
238
Mendler/Doll/Orth: Zur Konstruktualidität in der Einstellungsmessung
Theorie und Methoden Zur Konstruktvalidität in der Einstellungsmessung: Singulare oder multiple Komponenten-Modelle Construct validity in attitude measurement: Single-component and multi-component models WOLFGANG MENDLER, JÖRG DOLL*, BERNHARD ORTH* Universität Hamburg Mit einer Likert-Skala, einem Semantischen Differential, einem Produktsummenmodell und einem globalen Rating werden Einstellungen zum Nachrichtenmagazin DER SPIEGEL erhoben. Für den Vergleich der vier Einstellungsmeßverfahren werden zwei Ansätze einander gegenübergestellt: Bei unterstellter Eindimensionalität der Messungen konvergieren alle vier Meßverfahren im Rahmen einer konfirmatorischen Analyse auf einen gemeinsamen Faktor im Sinne eines Ein-Komponenten-Modells. Eine Prüfung der Eindimensionalitätsannahme für die drei Mehr-Item-Verfahren ergibt, daß diese für keines der drei Verfahren gegeben ist. Die Berücksichtigung der mehrdimensionalen Meßmodelle führt bei der Untersuchung konvergenter und diskriminanter Validität zu einem Vier-Komponenten-Modell. Da sich bereits die einfaktoriellen Einstellungsskalen der Meßmodelle inhaltlich interpretieren lassen (SPIEGEL als Informationsmedium, als Unterhaltungsmagazin und als Magazin mit typischem Stil) und die Analyse der Konstruktvalidität auf diesen einfaktoriellen Einstellungsskalen basiert, läßt sich die inhaltliche Interpretation auf die Einstellungskomponenten übertragen. Die Zahl erhaltener Komponenten wird zurückgeführt auf die Spezifität der Einstellungsmeßverfahren und auf die Wissensstruktur der Einstellungsträger. Kritisiert wird die traditionelle Interpretation von Einstellungskomponenten als affektiv und kognitiv.
We measured attitudes to the magazine DER SPIEGEL with a Likert scale, a semantic differential, a product-sum model and a global rating. The correlation matrix for the four attitude measurement techniques was analyzed in two ways: First, assuming one-dimensional measurement models for each of the four techniques, a single-component model showed a good fit to the correlation matrix for the four techniques. Second, testing one- and multidimensional measurement models separately for each of the three multiple-item techniques we received acceptable fits only for multidimensional measurement models. A confirmatory factor analysis for the correlation matrix calculated from the new factor based one-dimensional scales showed convergent and discriminant validity leading to a four-component model. The four components were interpreted as a general evaluative component, and three content specific components (DER SPIEGEL as a magazine for information, for entertainment and with a characteristic style). The received number of attitudinal components was accounted for by the specificity of the measurement techniques and by the knowledge structure of individuals holding the attitudes. The traditional interpretation of attitudinal components as affective and cognitive was critically discussed.
«Es ist nun an der Zeit, multivariate Konzeptionen der Einstellung zu prüfen. Es kann gut möglich sein, daß Forscher heute im Verständnis der evaluativen Dimension der Einstellung den .Punkt des Rückschritts' erreicht haben.» (OSTROM, 1980, p. 52)
v o n ALLPORT (1935) u n d IHURSTONE (1927), w i e
1. Einleitung
Beschränkungen der Einstellungstheorie Beschränkungen der Einstellungsmessung bedingt haben und umgekehrt. Daß die zitierte Einschätzung OSTROMS auch nach knapp zehn Jahren kaum an Aktualität verloren hat, belegt die Tktsache, daß der Artikel leicht modifiziert kürzlich in einem Reader zum aktuellen Stand der Ein-
In seinem Artikel über die «Wechselseitige Beeinflussung von Einstellungstheorie und Einstel-
stellungsforschung
lungsmessung» zeigt OSTROM (1980) durch Ge-
(OSTROM, 1989). I n der Tat erweist s i c h d i e M e s -
genüberstellung der Einstellungskonzeptionen
(PRATKANIS,
BRECKLER
&
GREENWALD, 1989) erneut veröffentlicht wurde sung von Einstellungen auf einer evaluativen Di-
Zeitschrift für Sozialpsychologie 1990, 238-251
mension in den gängigen Einstellungsmeßverfahren auch heute noch als nahezu unumstößliches Paradigma. In einer Reihe von Studien wurde der Versuch unternommen, diese evaluative Dimension von Einstellungen durch den Vergleich von (möglichst unterschiedlichen) Einstellungsmeßverfahren im Sinne einer multiplen Operationalisierbarkeit des Einstellungskonstrukts (CAMPBELL & FISKE, 1959) zu bestätigen. An Hand einiger dieser Untersuchungen soll im folgenden zunächst eine Entwicklung aufgezeigt werden, die in Wechselwirkung von Methode und Theorie dazu führte, neben der Evaluationsdimension Komponenten1 von Einstellungen zu identifizieren (und zu etablieren) und den Zusammenhang verschiedener Meßverfahren durch differenziertere Analysemethoden empirisch genauer zu überprüfen.
2. Untersuchungen zum Vergleich von Einstellungsmeßverfahren Ein früher Versuch, den Zusammenhang verschiedener Einstellungsmeßverfahren empirisch zu überprüfen, findet sich bei HTTLE und HILL ( 1 9 6 7 ) . In dieser Arbeit werden fünf Einstellungsmeßverfahren (nach Likert, Guttman und Thurstone, ein Semantisches Differential und ein globales Rating) daraufhin verglichen, inwieweit sie, bezogen auf die Einstellung von Studenten, sich persönlich an studienpolitischen Aktivitäten zu beteiligen, das gleiche messen. Da die Vorhersage verschiedener Verhaltenskriterien den Fokus der Untersuchung bildet, gehen die Autoren nur sehr oberflächlich auf die Unterschiede zwischen den fünf Meßverfahren ein und interpretie-
1 «Komponente» bzw. «Komponenten-Modell» hat in dieser Arbeit nicht die Bedeutung des gleichlautenden Begriffs bei FEOER ( 1 9 7 9 ) , der damit Überzeugungen (beliefs) bezeichnet; ebenfalls soll der Begriff nicht als identisch angesehen werden mit der affektiven, kognitiven und konativen Komponente des Drei-Komponenten-Ansatzes (ROSENBERG & HOVLAND, 1960). Wir betrachten Komponenten als Bausteine der Ginstellungsstruktur einer Person zu einem Objekt, im Sinne einer Dimension, die einen abgrenzbaren inhaltlichen Bereich eines Einstellungsobjekts bezeichnet. Beispielsweise könnte man für Frauenzeitschriften (vgl. dazu DOLL, MENDLER & O R T H , 1 9 8 9 ) eine Komponente für Mode, eine für Kosmetik und eine für «Anregungen zum Selbermachen» unterscheiden.
239
ren «Presumably the variation is accounted for by error factors intrinsic to the measurement techniques» (UTTLE & HILL, 1967, p. 2 0 8 ) . Zu einem ähnlichen Schluß gelangen FISHBEIN und AJZEN ( 1 9 7 4 ) in einer Untersuchung über Einstellungen zur Kirche. Hauptgegenstand der Untersuchung ist auch hier die Vorhersage von Verhaltenskriterien aus den fünf bereits bei HTTLE und HILL verwendeten Einstellungsmeßmethoden. Bezüglich deren Interrelation konstatieren FISHBEIN und AJZEN «a high degree of convergent validity among the five verbal attitude scales» (FISHBEIN & AJZEN, 1 9 7 4 , p. 6 2 ) und nehmen damit ein allen Skalen gemeinsames Einstellungskonstrukt an. In einer Reanalyse der Daten von FISHBEIN und AJZEN ( 1 9 7 4 ) kommen BAGOZZI und BURNKRANT ( 1 9 7 9 ) mit Hilfe eines Ansatzes linearer Strukturgleichungen zu dem Schluß, daß der Interkorrelationsmatrix der fünf Einstellungsmeßverfahren nicht ein allen fünf Methoden gemeinsames Konstrukt zugrunde liegen kann. Sie können zeigen, daß ein Modell, das zwei latente Faktoren annimmt, besser an die Daten angepaßt ist als ein Modell mit einem allen Methoden gemeinsam zugrundeliegenden Faktor. Die Autoren interpretieren die beiden mit .83 hoch interkorrelierenden Faktoren als affektives (repräsentiert durch globales Rating und Semantisches Differential) bzw. kognitives (repräsentiert durch Thurstone-, Guttman- und Likert-Skala) Einstellungskonstrukt (vgl. dagegen DILLON & KUMAR, 1985, die ein alternatives Zwei-Faktoren-Modell zur Diskussion stellen, und für eine Replik BAGOZZI & BURNKRANT, 1985). Im Widerspruch zu dem Befund von BAGOZZI und BURNKRANT steht eine Studie von BURNKRANT und PAGE ( 1 9 8 2 ) zum Blutspendeverhalten. In einer Untersuchung des Verhaltens-Intentions-Modells von FISHBEIN und AJZEN ( 1 9 7 5 ) finden sie, daß ein Ein-Faktor-Modell für vier verschiedene Einstellungsmeßverfahren besser an die Daten angepaßt ist als ein Zwei-Faktoren Modell (affektiver und kognitiver Faktor). Sie folgern: «Our results support the conclusion that there is no meaningful distinction between these conceptualizations [affective vs. cognitive measures] of attitude toward the behavior. They support the conclusion that any measures of attitude toward behavior, whether based on beliefs or direct ratings of affect, may be regarded as alternative measures of
240 the same unidimensional construct.»
Mendler/Doll/Orth: Zur Konstruktualidität in der Einstellungsmessung (BURN-
KRANT & PAGE, 1982, p . 5 5 9 ) .
Nicht nur die Widersprüchlichkeit der empirischen Befunde, sondern auch theoretische Überlegungen lassen die Unterscheidung von «affektiven» und «kognitiven» Einstellungsmeßverfahren fragwürdig erscheinen. So wird der Ansicht, daß ein Semantisches Differential und ein globales Rating eine affektive Einstellungskomponente erfassen, beispielsweise von BRECKLER (1984) widersprochen. Er verwendet das Semantische Differential zur Operationalisierung der kognitiven Einstellungskomponente 2 . Diese Kritik läßt sich auch auf eine weitere Studie zum Blutspendeverhalten von BAGOZZI (1981a, 1982) ausdehnen, in der er ein multiattributives Einstellungsmodell in eine Analyse zur Validität von Einstellungen einbezieht. Hier erweist sich ein Modell, das einen Einstellungsfaktor für das multiattributive Einstellungsmodell von einem Faktor für die evaluative Dimension des Semantischen Differentials unterscheidet, als gut an die Daten angepaßt, während ein Ein-Faktor-Modell die Daten nicht adäquat reproduzieren kann. BAGOZZI identifiziert den durch das Semantische Differential gebildeten Faktor mit einer affektiven und den durch das multiattributive Einstellungsmodell gebildeten Faktor mit einer kognitiven Einstellungskomponente und interpretiert dieses Ergebnis als weiteren Beleg für die Unterscheidbarkeit dieser beiden Komponenten. Nicht die Unterscheidbarkeit von zwei Einstellungskomponenten halten wir, ausgehend von der Kritik BRECKLERS, für problematisch, sondern deren definitorische Setzung als «kognitiv» vs. «affektiv». Eine Studie aus dem deutschsprachigen Raum, die unterschiedliche Einstellungsmeßverfahren empirisch vergleicht, stammt von HILDEBRANDT (1984). Für drei Zeitschriften («test», «DM» und «Schöner Wohnen») wird untersucht, inwieweit sich drei Verfahren zur Messung 2 Nach BRECKLERS Auffassung ist das Semantische Differential ebenfalls ein Maß für Kognitionen, weil «(a) the label [ . . . ] identifies it as focusing on dimensions of meaning or perception, which are constructs that are clearly cognitive in nature; (b) the scales were administered in a way that made clear to subjects that they were to evaluate an attribute of an attitude object; (c) such use can be distinguished from the present conception of affect, which has been operationally defined in terms of the subject's own emotional state.» (BRECKLER, 1984, p. 1198 - Fußnote).
der Einstellung zu diesen Zeitschriften unterscheiden. Die Verfahren basieren auf dem Idealobjekt-Modell und auf zwei multiattributiven Einstellungsmodellen, eines zum Objekt und eines zum Verhalten gegenüber dem Objekt. Für die drei Meßverfahren wird ein Ein-FaktorModell spezifiziert. Dieses Modell ist jedoch nur nach der post hoc getroffenen Spezifizierung eines zusätzlichen Methodenfaktors, der Korrelationen der Meßfehler zwischen Messungen gleicher Methoden erfaßt, angepaßt.
3. Zur Konsistenz und Validität von Einstellungsmessungen Während die Prüfung der (Konstrukt-)Validität zunächst noch eng mit der Prüfung konvergenter und diskriminanter Validität in einer MultitraitMultimethod-(MM)-Matrix (CAMPBELL & FISKE, 1959) verbunden ist, setzt sich in den späteren Studien zunehmend die Verwendung der konfirmatorischen Faktorenanalyse durch. Nach KENNY (1976) läßt sich deren Überlegenheit im Vergleich zu den CAMPBELL-FISKE-Kriterien gut be-
gründen 3 . Er demonstriert die Reanalyse einer MM-Matrix mit Hilfe der konfirmatorischen Faktorenanalyse. Den Ausgangspunkt bildet das Modell der kongenerischen Messung (JÖRESKOG, 1971; vgl. auch FAULBAUM, 1983). Im Rahmen der Klassischen Testtheorie werden Meßwerte unterschieden von wahren Werten, wobei eine Messung kongenerisch heißt genau dann, wenn jedes Paar von wahren Werten mit 1.0 korreliert. Analog unterscheidet das Modell der Faktorenanalyse Beobachtungsvariablen x = (x\, X2, • •., xp) von Konstruktvariablen £ = (£i, £2, •.., £n). Ein kongenerisches Meßmodell läßt sich dann schreiben als Faktormodell: * = Ax£ + ö
3 KENNY nennt FISKE criteria
(1)
hier drei Hauptgründe: « [ 1 ] The CAMPBELLare only rules of thumb that do not take into account sampling error. [2] In instances in which reliabilities are not similar over measures, radically different conclusions may sometimes be drawn on the basis of confirmatory factor analysis and the CAMPBELL-FISKE criteria [ . . . ] [3] confirmatory factor analysis provides estimates of parameters, a test of the model, and tests that various parameters are equal. The general application of this analysis should therefore be encouraged.» (KENNY, 1976, p. 252).
241
Zeitschrift für Sozialpsychologie 1990, 238-251
Die Varianz-Kovarianz-Matrix des Modells ergibt sich dann aus: £ = A X $ A \ + 0«
(2)
$»: Kovarianzmatrix (Korrelationsmatrix) der Faktoren (n x n) Ax: Matrix der Faktorladungen (p x n) 0«: Diagonalmatrix der Fehlervarianzen 6 Für ein nach Gleichung (1) spezifiziertes Modell bietet das Programm LISREL VI (JÖRESKOG & SÖRBOM, 1986; vgl. auch PFEIFER & SCHMIDT, 1988) ein Maximum-Likelihood-Verfahren zur Schätzung der freien Parameter in Gleichung (2). Vier der sieben bisher referierten Arbeiten
Unterschied zu dem dreidimensionalen Modell zu Verschätzungen verschiedener Parameter in einem Strukturmodell der Vorhersage des Verhaltens aus Einstellungen führen kann. In diesem Sinn wollen wir die Notwendigkeit der gemeinsamen Prüfung der internen Konsistenz von Einstellungsmeßverfahren auf dem einen Niveau (Items) und der konvergenten bzw. diskriminanten Validität auf einem höheren Niveau (eindimensional skalierbare Summenscores) hervorheben.
4. Hypothesen
(BAGOZZI & BURNKRANT, 1979; BURNKRANT & PAGE,
1982;
BRECKLER,
1984;
HILDEBRANDT,
1984) wählen einen solchen LISREL-Ansatz zur Validitätsanalyse verschiedener Einstellungsmeßverfahren. Sämtliche dieser Arbeiten verwenden dabei als Beobachtungsvariablen die pro Meßverfahren über die Items berechneten Summenscores. Die dabei unterstellte Eindimensionalität der Messung (auch als Homogenität oder interne Konsistenz bezeichnet) wird in keinem Fall geprüft. Das Modell der kongenerischen Messung läßt sich jedoch auch auf einem «tieferen» Analyseniveau für die Einstellungsitems pro Meßverfahren als Beobachtungsvariablen prüfen". In einer Studie über die Einstellung zum Blutspenden konnte BAGOZZI (1981b) für das Einstellungsmodell nach FISHBEIN (1967) zeigen, daß ein Modell, das sämtliche Produkte aus Überzeugungsstärken und ihren Bewertungen durch einen Faktor repräsentiert (dies entspricht der im Einstellungsmodell enthaltenen Produktsummenbildung), nicht mit den Daten übereinstimmt. Für die sieben Produkte aus Überzeugungsstärke und Bewertung findet er für ein Modell mit drei - korrelierten, aber nicht identischen - Faktoren eine gute Anpassung an die Daten. In einer weiteren Reanalyse desselben Datensatzes kannBAGOZzi (1983, p. 169f.) zeigen, daß die Modellierung des Einstellungskonstrukts nach dem eindimensionalen Fishbein-Modell im 4 Ein ähnliches Vorgehen findet man im Bereich der Testkonstruktion im Rahmen der klassischen Testtheorie (als Konsistenzanalyse bezeichnet) zur Schätzung der Reliabilität eines Tests aus den Itemparametern (hier: Einstellungsitems) statt aus den Personenparametern (hier: Summenscores).
Die Ausgangsfrage, ob ein Ein- oder ein MehrKomponenten-Modell der Einstellung zutreffender ist, kann jetzt präzisiert werden. BAGOZZI (1980, p. 342) vertritt hierzu die Position, daß «the distinction between the single component and multicomponent models of attitude is not a simple, either- or question. Rather, it appears that either conceptualization may have utility, depending on the conditions associated with the formation of attitude and the attitude object itself.». Im folgenden soll für die Einstellung zum Nachrichtenmagazin DER SPIEGEL, die mit einer Likert-Skala (LS), einem Semantischen Differential (SD), einem Produktsummenmodell (PS)5 und einem globalen Rating (GR) gemessen wird, untersucht werden, ob ein singulares oder ein multiples Komponenten-Modell der Einstellung angemessener ist. Zur Beantwortung dieser Frage wählen wir ein Vorgehen in zwei Schritten: Zunächst soll ein Meßmodell geprüft werden, das ausschließlich die Konvergenz bzw. Diskriminanz der Meßverfahren untersucht, ohne gleichzeitige Berücksichtigung der internen Konsistenz für jedes einzelne Meßverfahren. In einer vergleichenden Analyse der vier Standard-Einstellungs-Skalierungsmethoden (Guttman, Thurstone, Likert und Semantisches Differential) kommen FISHBEIN und AJZEN (1975, p. 53-106) zu dem Schluß, daß neben einigen Unterschieden Übereinstimmung aller vier Skalen darin bestehe, daß sie eine Einstellung abbilden 5 Bei dem hier verwendeten Produktsummenmodell wurden die für die Bedeutsamkeit des Modells (vgl. ORTH, 1985) erforderlichen Parameter gleich 0 gesetzt.
242
Mendler/Doll/Orth: Zur Konstruktualidität in der Einstellungsmessung
als Index auf einer einzigen evaluativen Dimension. Weiterhin lasse sich zeigen, daß die Operationalisierung der Messung für alle vier Skalen der Logik einer Produktsumme aus Überzeugungsstärken und Bewertungen dieser Überzeugungen folgt. Das multiattributive Einstellungsmodell von FISHBEIN (1967) kann als Produktsummenmodell (PS-Modell) somit als Verallgemeinerung der Operationalisierungen, die in den Standardskalen vorgenommen wird, angesehen werden. Als Folgerung aus diesen Überlegungen ist eine Konvergenz dieser formal ähnlichen Meßverfahren auf einen gemeinsamen Faktor zu erwarten. Wir vollziehen damit den konventionellen Analyseansatz der oben diskutierten Studien nach (FISHBEIN & AJZEN, 1974; BAGOZZI & BURNKRANT, 1979; BURNKRANT & PAGE, 1982). I n d i e -
sen Studien erwies sich mit nur einer Ausnahme (zwei Komponenten) ein Ein-Komponenten-Modell als am besten angepaßt. Aufgrund der theoretischen Überlegungen von FISHBEIN und AJZEN und der referierten empirischen Befunde erwarten wir deshalb für die Analyse unserer Daten ebenfalls die beste Anpassung für ein Ein-Komponenten-Modell. Als zu prüfende Hypothese formulieren wir: HL: Wird die Einstellung zu einem Objekt oder Verhalten mit mehreren traditionellen Einstellungsmeßverfahren gemessen, dann weisen diese traditionell gemessene Einstellungen nur konvergente Validität auf, d.h. sie lassen sich durch ein Ein-KomponentenModell repräsentieren. In einem zweiten Schritt wird dann die interne Konsistenz bzw. die Heterogenität der einzelnen Meßverfahren bei der Prüfung der Validität berücksichtigt. Wie bereits oben ausgeführt (BAGOZZI, 1981b, 1983) konnte für die Einstellungsmessung mit einem PS-Modell und einem SD die Überlegenheit eines Zwei-Komponenten-Modells über ein Ein-Komponenten-Modell gezeigt werden, wenn der konventionellen Validitätsanalyse eine Meßmodellanalyse vorangestellt wird. Im Falle einer Erweiterung dieser Analyse auf eine LS und ein GR erwarten wir die Überlegenheit eines Modells mit zwei oder mehr Komponenten. Wir werden bei diesem zweiten Analyseschritt so vorgehen, daß wir für jedes der drei MehrItem-Verfahren (SD, LS, PS) das am besten pas-
sende Meßmodell für die Items als Variablen der Beobachtungsebene bestimmen. Im Falle eines Mehrfaktorenmodells z.B. für die LS erhielte man demnach nicht einen einzigen, sondern mehrere LS-Scores, die sich aus der Addition der Items pro Faktor ergäben. Dies entspricht der Berechnung von faktorbasierten Werten (KIM & 6 MUELLER, 1978, p. 70) . Die sich aus dieser Analyse ergebenden faktorbasierten Skalen wollen wir im folgenden als «einfaktorielle Einstellungsskalen» bezeichnen. Auf der Basis dieser einfaktoriellen Skalen wird die Prüfung konvergenter und diskriminanter Validität durchgeführt. Daraus leiten wir als weitere Hypothese ab: H2: Diese einfaktoriellen Einstellungsskalen unterschiedlicher Meßverfahren weisen sowohl konvergente als auch diskriminante Validität auf. Wir erwarten deshalb, daß bei einer gemeinsamen Strukturanalyse dieser einfaktoriellen Einstellungsskalen ein Einstellungsmodell mit mehreren Faktoren bzw. Komponenten am besten an die Daten angepaßt werden. Bei dieser Validitätsprüfung sind für die Strukturierung der einfaktoriellen Skalen drei Möglichkeiten denkbar: Erstens können sich die einzelnen Meßverfahren wiederfinden, d.h. es ergäben sich nur Methodenfaktoren. Zweitens kann sich eine, die inhaltliche Interpretierbarkeit der einfaktoriellen Skalen vorausgesetzt, inhaltsbezogene Anordnung zeigen, und drittens ist eine Mischvariante mit Inhalts- und Methodenfaktoren denkbar. Da wir diesbezüglich keine Vörannahmen treffen können, testen wir zunächst ein Modell mit reinen Methodenfaktoren. Im Falle einer nicht akzeptablen Anpassung für dieses Modell soll ein Mehr-Komponenten-Modell geprüft werden, das die Struktur der Korrelationsmatrix durch auf das Einstellungsobjekt bezogene Inhaltsaspekte erklärt. Im Falle einer akzeptablen Anpassung dieser Modellvariante wäre durch die identifizierten Inhaltsbereiche gleichzeitig eine Bedeutung von Einstellungen jenseits der Unterscheidung einer affektiven und einer kognitiven Komponente gezeigt. 6 Die regressionsanalytische Schätzung von Faktorwerten verbietet sich für den vorliegenden Fall, da die in mehreren Faktorenanalysen getrennt geschätzten Faktorwerte in einer gemeinsamen Analyse zur konvergenten Validität nicht mehr vergleichbar sind.
243
Zeitschrift für Sozialpsychologie 1990, 238-251
5. Methode
5.2
5.1 Stichprobe und Skalen
Die Hypothesen zur konvergenten bzw. diskriminanten Validität sollen durch das Modell der konfirmatorischen Faktorenanalyse formalisiert und getestet werden. Das Programm LISREL VI erlaubt die Spezifikation von konfirmatorischen Faktormodellen als Submodelle allgemeiner linearer Strukturgleichungsmodelle. Die Überführung der Hypothesen in ein Modell der konfirmatorischen Faktorenanalyse erfolgt üblicherweise in zwei Stufen: (a) Darstellung der Hypothesen in einem Pfaddiagramm, (b) Überführung der im Pfaddiagramm postulierten kausalen Zusammenhänge in ein System linearer Gleichungen. Im Pfadmodell werden die Konstruktvariablen (£) durch Kreise und die Beobachtungsvariaiben (x) durch Rechtecke dargestellt. Gerichtete Pfeile zeigen die Richtung eines kausalen Zusammenhangs an, gebogene (ungerichtete) Pfeile bedeuten einen korrelativen Zusammenhang. Fehler werden im Modell durch Pfeile ohne Ausgangspunkt dargestellt. Die zugehörigen linearen Gleichungssysteme werden entsprechend Gleichung (1) spezifiziert. LISREL VI stellt für die Prüfung der globalen Modellanpassung drei deskriptive Maße zur Verfügung: einen «Goodness-of-Fit-Index» (GFI), einen «Adjusted-Goodness-of-Fit-Index» (AGFI) und ein «Root-Mean-Square-Residual» (RMR) (für die jeweiligen Berechnungsformeln vgl. PFEIFER & SCHMIDT, 1988). Im Falle von Maximum-Likelihood-Parameterschätzungen liegt darüberhinaus mit dem Chi2-Test ein inferenzstatistisches Kriterium vor. In Hypothese Hl wird, für die traditionellen Meßverfahren die Konvergenz auf eine latente Einstellungsvariable postuliert. Das entsprechende Ein-Faktor-Modell zeigt Abbildung 1 als Pfadmodell. Die zugehörige Gleichung (3) lautet dann:
Die Datenerhebung erfolgte in den Monaten Oktober und November 1988. Befragt wurden nur Personen, die sich wenigstens als gelegentliche SPIEGEL^Leser bezeichneten. Insgesamt liegen verwertbare Daten von 116 Personen vor. Der vorgelegte Fragebogen enthielt neben Fragen zum Lesen des Nachrichtenmagazins DER SPIEGEL auch die Einstellungsfragen für die vier Einstellungsmeßverfahren LS, SD, PS und GR. In einer Voruntersuchung (MENDLER, 1989) wurde durch Trennschärfebestimmung eine LS mit 15 Items konstruiert. Für die Auswertung wurden sämtliche Items im Sinne der «favorableness» für das Einstellungsobjekt gepolt und mit den Werten 1 bis 5 codiert. Für das SD wurden in der Voruntersuchung 24 adjektivisch formulierte Gegensatzpaare analysiert. 11 dieser Adjektive, die sich im Sinne der postulierten EPAStruktur klassifizieren ließen, wurden in der Hauptuntersuchung vorgegeben. Nur die fünf Skalen, die den Evaluationsfaktor bildeten, wurden zur Einstellungsmessung verwendet. Durch ein globales Rating wurde die Meinung zum SPIEGEL von «sehr negativ» bis «sehr positiv» beurteilt. Für die ebenfalls in der Voruntersuchung ausgewählten 6 modal salienten Attribute des PS-Modells wurden Überzeugungen und Bewertungen erhoben. Die Überzeugungen erfragten das Ausmaß (von «überhaupt nicht überzeugt» bis «sehr überzeugt») in dem die Attribute auf den SPIEGEL zutreffen. Daran anschließend wurden die Attribute von «sehr schlecht» bis «sehr gut» bewertet, und zwar unabhängig vom Grad ihres Zutreffens auf den SPIEGEL, worauf ausdrücklich hingewiesen wurde. Alle Urteile wurden mit siebenstufigen Ratingskalen erhoben, die in der Auswertung bipolar codiert wurden.
Auswertungsmethode
Die Reihenfolge der drei Einstellungsmeßverfahren LS, SD und PS wurde permutiert, so daß jedes der drei Instrumente etwa gleich häufig an erster, zweiter und dritter Stelle zu bearbeiten war. Für die Annahme dieses Modells mit df= 2 setzen wir ein Signifikanzniveau von p (x 2 )^.10. Hypothese H2 bezieht sich auf die Konvergenz der einfaktoriellen Einstellungsskalen für die
244
Mendler/Doll/Orth: Zur Konstruktualidität in der Einstellungsmessung Tabelle 1: Ein Komponenten-Modell mit vier Einstellungsskalen Modell 1°
PS: Produktsummen-Modell; LS: Likert-Skala; SD: Semantisches Differential; GR: globales Rating.
Abbildung 1: Pfadmodell zum Ein-Komponenten-Modell: Ein-Faktor-Modell für vier Einstellungsskalen bei Nicht-Berücksichtigung der internen Konsistenz.
vier Einstellungsmeßverfahren bei Berücksichtigung der internen Konsistenz. Da die entsprechenden Modellvariablen erst nach den Ergebnissen zur internen Konsistenz feststehen, muß an dieser Stelle auf eine Modellspezifikation verzichtet werden. Als eine Folgerung aus H2 erwarten wir, daß das Ein-Faktor-Modell (analog zu Abbildung 1) global nicht an die Daten angepaßt ist (d.h. p(x 2 ).15.
Ähnlichkeit als Determinante der Beziehungsqualität Auf der Basis der vorstehenden Ausführungen wurden mit den beschriebenen Materialien die folgenden Ähnlichkeitsindizes als Prädiktoren der Beziehungsqualität konstruiert. SIMIOBJ: tatsächliche Einstellungsähnlichkeit von Mann und Frau SIMIFRAU: wahrgenommene Einstellungsähnlichkeit aus der Sicht der Frau SIMIMANN: wahrgenommene Einstellungsähnlichkeit aus der Sicht des Mannes VERIFRAU: Veridikalität der Einstellungsbeurteilungen der Frau VERIMANN: Veridikalität der Einstellungsbeurteilungen des Mannes SIMIFREI: Ähnlichkeit von Hobbys und Freizeitinteressen SIMIPERS: Ähnlichkeit der FPI-Standardwerte von Mann und Frau Bei allen Indizes diente jeweils die Summe der Absolutbeträge der Differenzen der entsprechenden Items als Indikator der Ähnlichkeit, wobei größere Werte mit größerer Unähnlichkeit einhergehen. Diese sieben Ähnlichkeitsindizes dienten als Prädiktoren der Beziehungsqualität in einer schrittweisen multiplen Regression. Wegen der nur mäßigen Korrelation von BQF und BQM 6 Niedrigere Werte entsprechen höherer Beziehungsqualität.
269
Zeitschrift für Sozialpsychologie 1990, 265-273
wurden die Regressionsanalysen für Frauen und Männer getrennt durchgeführt7. Beziehungsqualität aus der Sicht der Frau (BQF) Von den in die Regressionsgleichung eingehenden Prädiktoren weist die wahrgenommene Einstellungsähnlichkeit aus der Sicht der Frau (SIMIFRAU) zunächst den engsten Zusammenhang mit dem Kriterium auf (vgl. Tab. 1). Nachdem durch die schrittweise Regression die Effekte dieses Prädiktors aus den verbleibenden herauspartialisiert wurden, erreichte kein weiterer das spezifizierte Signifikanzniveau von p •
c\ Tf —.r-f-