190 118 43MB
German Pages 102 [113] Year 1985
C. F. G R A U M A N N KLAUS HOLZKAMP MARTIN IRLE
B A N D 15 1984 HEFT 1
VERLAG HANS HUBER BERN STUTTGART WIEN
Zeitschrift fiir Sozialpsychologie 1984, Bandi 5, Heft 1 INHALT Zu diesem Heft
1
Theorie und Methoden T. & Six, B.: Prototypenforschung: Ein integrativer Ansatz zur Analyse der alltagssprachlichen Kategorisierung von Objekten, Personen und Situationen ERDFELDER, E . : Zur Bedeutung und Kontrolle des ß-Fehlers bei der inferenzstatistischen Prüfung log-linearer Modelle ECKES,
2 18
Empirie Untersuchungen zum Komponentenmodell der Einstellungsobjekte : I. Theorie und nichtexperimentelle Studien BUSE, L . & PAWLIK, K.: Inter-Setting-Korrelationen und Setting-Persönlichkeits-Wechselwirkungen: Ergebnisse einer Felduntersuchung zur Konsistenz von Verhalten und Erleben LILLI, W. & R E H M , J.: Theoretische und empirische Untersuchungen zum Phänomen der Zusammenhangstäuschung. II. Entwicklung eines Modells zum quantitativen Urteil und Diskussion seiner Implikationen fiir die soziale Urteilsbildung
FEGER, H . & D O H M E N , P . :
33 44 60
Diskussion Empirie und Analytizität: Einige Bemerkungen zu BRANDTSTÄDTERS «Apriorische Elemente in psychologischen Forschungsprogrammen» STRACK, F. & R E H M , J . : Theorie testen oder Varianz aufklären? Überlegungen zur Verwendung der Effektgröße als Gütemaß für experimentelle Forschung ZELINKA, F.: Erwiderung auf WOLFS Anmerkungen zum Paarkoeffizient PZ für Kodierzuverlässigkeit: Pro PZ auch im Fall a = b = 1 REISENZEIN, R . :
74 81 86
Literatur Neuerscheinungen
94
Titel und Abstracta
95
Nachrichten und Mitteilungen
97
Autoren
Copyright 1984 Verlag Hans Huber Bern Stuttgart Wien Herstellung: Satzatelier Paul Stegmann, Bern Printed in Switzerland Library of Congress Catalog Card Number 78-126626 Die Zeitschriftfür Sozialpsychologie wird in Social Sciences Citation Index (SSCI) und Current Contents/Social and Behavioral Sciences erfaßt.
100
1
Zeitschrift für Sozialpsychologie 1984
Zu diesem Heft Da das erste Heft des 15. Jahrgangs noch von dem bisherigen geschäftsfiihrenden Herausgeber und dem bisherigen Redakteur, M A R T I N IRLE und W O L F G A N G SERVAY, vorbereitet worden ist, beschränke ich mich in diesem Editorial weitgehend darauf, mich als neuen geschäftsführenden Herausgeber und M O R U S M ARKARD als den dazugehörigen Redakteur zu annoncieren und traditionsgemäß im Namen aller Herausgeber dem ebenso effektiven wie anregenden Team IRLE/SERVAY meinen herzlichen Dank für die geleistete Arbeit zu sagen. Auch über die Zusammenarbeit mit dem Verlag habe ich letztlich nur Gutes zu berichten: Die kleineren Krisen, die als Reflex der
großen Krise des Verlagswesens auch unserer Zeitschrift nicht erspart blieben, sind (hoffentlich) erfolgreich, in jedem Fall aber in kooperativer Weise zwischen Herausgebern und Verlag ausgetragen worden. Mithin in diese Richtung ebenfalls mein herzlicher Dank. In den Diskussionen unserer letzten Herausgeberkonferenz drängte sich uns der Umstand auf, daß unter den eingereichten und akzeptierten Arbeiten methodologische Analysen immer mehr Raum und Gewicht gewinnen. Was ist davon zu halten? Ich will im nächsten Editorial einige Überlegungen zu dieser Frage beisteuern. KLAUS HOLZKAMP
I
J
2
Eckes & Six: Prototypenforschung: Ein integrativer Ansatz zur Analyse der alltagssprachlichen Kategorisierung
Theorie und Methoden Prototypenforschung: Ein integrativer Ansatz zur Analyse der alltagssprachlichen Kategorisierung von Objekten, Personen und Situationen THOMAS ECKES & B E R N D SIX E W H Landau
Im Unterschied zu den wohldefinierten künstlichen Kategorien der traditionellen psychologischen Begriflfsbildungsforschung zeichnen sich die in der Prototypenforschung betrachteten natürlichen bzw. alltagssprachlichen Kategorien dadurch aus, d a ß sich ihre Mitglieder auf ein e m K o n t i n u u m der Kategoriemitgliedschaft a n o r d n e n lassen. Die Mitglieder einer solchen Kategorie sind in unterschiedlichem M a ß e typisch oder repräsentativ für die Kategorie. D e r ideale Repräsentant einer Kategorie wird als Prototyp bezeichnet. Natürliche Kategoriensysteme lassen sich anschaulich durch eine horizontale und eine vertikale « D i m e n s i o n » beschreiben. W ä h r e n d auf der horizontalen Dimension die interne Struktur von Kategorien einer gegebenen Abstraktionsebene abgebildet wird (Prototypikalität), lassen sich auf der vertikalen Dimension Kategorien identifizieren, die ein M a x i m u m an Information bei einem M i n i m u m an kognitivem A u f w a n d zur Verfugung stellen (Basiskategorien). Nach einer Übersicht über Methoden und Ergebnisse der Prototypenforschung im Bereich der Objektwahrnehm u n g wird gezeigt, welche Vorteile dieser Forschungsansatz bei der Analyse von Prozessen der Person- und Situat i o n s w a h r n e h m u n g bietet. Weiterhin wird deutlich, daß die Prototypenforschung eine Möglichkeit eröffnet, zu einer Integration verschiedener theoretischer Konzeptionen kognitiver Kategorisierungsvorgänge zu gelangen. Eine kritische Diskussion theoretischer u n d methodischer Probleme des Prototypenansatzes beschließt diese Arbeit.
While traditional approaches to the classification of objects confine themselves to the use of well-defined artificial categories, the analysis of natural or everyday-language categories assumes a c o n t i n u u m of category membership. M e m b e r s of such a category differ in the extent to which they are typical or representative of the category. T h e ideal m e m b e r of a category is defined as prototype. Natural category systems can be conceived of as having both a horizontal and a vertical «dimension». T h e horizontal dimension describes the internal structure of categories within one level of abstraction (prototypicality), while on the vertical dimension categories can be identified, requiring a m i n i m u m of cognitive effort to obtain a m a x i m u m of information (basic-level categories). After a review of methods and results of p r o t o t y p e research in object perception, the advantages of prototypes and basic-level categories as concepts for analyzing cognitive processes in person perception as well as situation perception are outlined. In addition, it is pointed out that prototype research offers an opportunity for integrating different theoretical conceptions of cognitive categorization processes. Finally, some methodological p r o b l e m s of the prototype a p p r o a c h are discussed.
1.
integratives Konzept für all jene Prozesse fungiert, bei denen Ursachenzuschreibungen für Ereignisse und Handlungen vorgenommen werden, bietet sich das Prototypenkonzept als integratives Konzept für kognitive Kategorisierungsvorgänge an ( C A N T O R , 1 9 8 1 ; M I S C H E L ,
Einleitung
An der Schnittstelle von Sozial-, Persönlichkeits- und Kognitiver Psychologie ist vor dem Hintergrund der Begriffsbildungs- und Kategorisierungsforschung ein neuer Ansatz entstanden, der als Prototypenforschung bezeichnet wird. Ähnlich wie das Attributionskonzept als
1979,1981).
Ziel der vorliegenden Arbeit ist es, einen
3
Zeitschrift für Sozialpsychologie 1984, 1 5 , 2 - 1 7
Überblick über die Prototypenforschung zu geben. Die Darstellung folgt dabei im wesentlichen den historischen Entwicklungslinien dieses Forschungsfeldes. So wird zunächst auf Methoden und Ergebnisse der Prototypenforschung im Bereich der Objektwahrnehmung eingegangen. Im Anschluß an diese kognitionspsychologischen Erörterungen werden Perspektiven für die Personwahrnehmungsforschung aufgezeigt und Ansätze zur Analyse sozialer Situationen dargestellt. Den Anfangspunkt der Prototypenforschung markiert eine Reihe von Arbeiten Ende der sechziger und Anfang der siebziger Jahre, in denen Wissenschaftler verschiedenster Disziplinen heftige Kritik an der klassischen, in der aristotelischen Tradition stehenden Sichtweise von Kategorien übten (ZADEH, 1965; NEISSER, 1967;
FODOR,
1972;
LAKOFF,
1973;
ROSCH,
1973a). Die klassische Sichtweise ist durch die folgenden vier Voraussetzungen bzw. Annahmen gekennzeichnet: (1) Mitgliedschaft eines Objekts in einer Kategorie ist vollkommen durch den Besitz einer (meist) kleinen Menge kritischer, d. h. (einzeln) notwendiger und (gemeinsam) hinreichender Merkmale bestimmt. (2) Alle Mitglieder einer Kategorie besitzen sämtliche kritischen Merkmale und sind daher als Vertreter der Kategorie in gleichem Maße qualifiziert; ein Objekt ist oder ist nicht Mitglied einer Kategorie, es gibt keine unterschiedlichen Grade der Kategoriemitgliedschaft. (3) Alle kritischen Merkmale sind für die Kategorisierung gleich wichtig; das Fehlen bestimmter kritischer Merkmale kann nicht durch den Besitz anderer kritischer Merkmale ausgeglichen werden. (4) Zwischen Kategorien derselben Abstraktionsebene bestehen klare Grenzen; jedes Objekt gehört genau einer Kategorie an. Die traditionelle psychologische Begriffsbildungsforschung hat sich diese klassische formal-logische Betrachtungsweise zu eigen gemacht. So liegt in einem typischen Begriffsbildungsexperiment eine Menge von Objekten vor, die sich in kaum mehr als zwei Ausprägungen einer geringen Anzahl voneinander unabhängiger Merkmale wie z. B. Farbe oder Form unterscheiden. Der von der Versuchsperson zu bildende Begriff besteht aus einer vom Ver-
suchsleiter im vorhinein festgelegten Verknüpfung bestimmter Merkmalsausprägungen (z. B. «rotes Dreieck»), Ein derartiger Begriff entspricht der oben charakterisierten Sichtweise von Kategorien; es handelt sich um eine wohldefinierte Kategorie. Sobald die Versuchsperson die Regel erkannt hat, die die zum Begriff gehörende Teilmenge definiert, sind alle Objekte, die der Regel entsprechen (hier also alle roten Dreiecke), gleichermaßen qualifizierte Beispiele für den Begriff. Experimente der beschriebenen Art haben zu einer detaillierten Analyse von Strategien der Begriffsbildung ( B R U N E R , G O O D N O W & A U S T I N , 1956) und Auswirkungen der Manipulation bestimmter Aufgabenvariablen ( B O U R NE, 1966) geführt. Doch ist die Validität dieser Arbeiten vor allem im Hinblick auf die Beschäftigung mit vage definierten, natürlichen bzw. alltagssprachlichen Kategorien in Frage zu stellen. Unter natürlichen Kategorien sind dabei jene Kategorien zu verstehen, die im Alltag zur Kategorisierung von Objekten, Personen, Situationen usw. verwendet werden. Natürliche Kategorien wie z. B. «Möbel», «Fahrzeug», «Baum», «extravertierte Person» oder «Party» können im Unterschied zu den wohldefinierten künstlichen Kategorien traditioneller Begriffsbildungsexperimente durch die genannten vier Eigenschaften nur unzureichend beschrieben werden. Die interne Struktur einer natürlichen Kategorie ist entscheidend dadurch charakterisiert, daß sich ihre Mitglieder auf einem Kontinuum der Kategoriemitgliedschaft anordnen lassen; die Mitglieder einer solchen Kategorie sind in unterschiedlichem Maße typisch oder repräsentativ für die Kategorie. Der ideale Repräsentant einer Kategorie wird als Prototyp bezeichnet (ROSCH, 1973a, 1975a, b). Im alltagssprachlichen Kontext kommt dem Prototyp die Funktion eines kognitiven Bezugspunkts für die Kategorie zu. Als kognitive Schemata steuern Prototypen die Verarbeitung von Information über Objekte, Personen und Situationen (HASTIE, 1981; TAYLOR & CROCKER, 1981). Das Prototypenkonzept selbst hat den Status eines hypothetischen Konstrukts der kategorialen Repräsentation (PALMER, 1978; ROSCH, 1978) und darf daher nicht mit einem konkreten Exemplar einer Kategorie identifiziert werden.
4
Eckes & Six: Prototypenforschung: Ein integrativer Ansatz zur Analyse der alltagssprachlichen Kategorisierung
Die Mitglieder einer natürlichen Kategorie unterscheiden sich im Ausmaß, in dem sie dem Prototyp als idealem Repräsentanten ihrer Kategorie ähnlich sind. Der von Objekt zu Objekt unterschiedliche Grad der Nähe zum Prototyp bzw. unterschiedliche Grad der Kategoriemitgliedschaft wird Prototypikalität genannt. Daß es schwierig, wenn nicht gar unmöglich ist, natürliche Kategorien durch eine Menge kritischer Merkmale zu definieren, zeigen besonders eindrucksvoll die sprachphilosophischen Überlegungen WITTGENSTEINS ( 1 9 5 3 ) , aber auch die sprachpsychologischen Untersuchungen von ROSCH & MERVIS ( 1 9 7 5 ) , M I L L E R & JOHNSON-LAIRD (1976), CLARK & (1977) u n d
HAMPTON (1979).
CLARK
WITTGENSTEIN
hat für die interne Struktur natürlicher Kategorien den Begriff der Familienähnlichkeit geprägt. Damit ist gemeint, daß innerhalb einer Kategorie einander mehr oder weniger überlappende Mengen von Merkmalen vorliegen. Symbolisiert man etwa die Exemplare einer Kategorie durch eine Folge von Großbuchstaben, dann besitzt die Menge {ABCD, CDEF, FGHI, GHIJ} eine sogenannte Familienähnlichkeitsstruktur: Jedes Element hat zumindest ein Merkmal mit einem oder mehreren anderen Elementen gemeinsam, aber kein oder nur wenige Merkmale sind allen Elementen der Menge bzw. Kategorie gemeinsam. Mit der Familienähnlichkeitsstruktur natürlicher Kategorien gehen unscharfe Kategoriengrenzen einher. Für nahezu alle natürlichen Kategorien lassen sich Objekte angeben, die nicht eindeutig der einen oder anderen Kategorie zugeordnet werden können («borderline cases»). Das ist hauptsächlich darauf zurückzuführen, daß weniger typische Exemplare auch Merkmale mit Mitgliedern anderer Kategorien gemeinsam haben. Interessante Ergebnisse hierzu berichten z. B. LABOV ( 1 9 7 3 ) für die Benennung von Gefäßen, M C C L O S K E Y & G L U C K S B E R G ( 1 9 7 8 ) für semantische Kategorien und C A N T O R , SMITH, F R E N C H & M E Z Z I C H ( 1 9 8 0 ) für psychiatrische Klassifikationen. Ein formales Modell, das sich für eine differenzierte Analyse der Vagheit natürlicher Kategorien eignet, ist von ZADEH ( 1 9 6 5 ) mit der «Theorie unscharfer Mengen» («fuzzy set theory») vorgestellt worden (vgl. auch die Überblicksarbeit v o n WAGNER, 1980).
2.
Der Prototypenansatz
Die seit den frühen siebziger Jahren enorm gestiegene Zahl von Arbeiten, die sich explizit oder implizit am Prototypenansatz orientieren, belegt eindrucksvoll, daß die Analyse vage definierter Kategorien in zunehmendem Maße als ein notwendiger Schritt zu einem besseren Verständnis jener kognitiven Strukturen und Prozesse gesehen wird, die der alltagssprachlichen Kategorisierung von Objekten, Personen und Situationen zugrunde liegen. Um einen geordneten Überblick zu ermöglichen, folgen wir einer Unterscheidung von ROSCH (1978) in (1) eine horizontale und (2) eine vertikale «Dimension» natürlicher Kategoriensysteme. Die horizontale Dimension betrifft die interne Struktur von Kategorien einer Abstraktionsebene, die vertikale Dimension bezieht sich auf Gemeinsamkeiten und Unterschiede zwischen Kategorien verschiedener Abstraktionsebenen.
2.1. Die horizontale Prototypikalität
Dimension:
Der erste natürliche Objektbereich, für den die Existenz unterschiedlich typischer Kategoriemitglieder empirisch demonstriert werden konnte, war der Bereich der Farben. In einer interkulturellen Studie haben BERLIN & KAY (1969) Farben nachgewiesen, die von Angehörigen unterschiedlicher Sprachgemeinschaften übereinstimmend als beste Beispiele für (linguistisch definierte) Basis-Farbkategorien (wie z. B. weiß, schwarz, rot, grün, gelb usw.) angesehen wurden. Diese sogenannten «fokalen» Farben schienen - entgegen der linguistischen Relativitätshypothese - universeller Natur zu sein. Es zeigten sich lediglich kulturelle Unterschiede in der Anzahl der Namen für BasisFarbkategorien. In einer anderen Untersuchung ergab sich, daß die Erinnerungsleistung bei fokalen Farben höher war als bei nicht-fokalen Farben und Namen für fokale Farben schneller gelernt wurden als für nicht-fokale Farben ( H E I D E R , 1972; vgl. auch H E I D E R , 1971; H E I D E R & O L I V I E R , 1972; R O S C H , 1974, 1975c; MERVIS, CATLIN & R O S C H , 1975). Ähnliche Ergebnisse wurden auch für geometrische Formkategorien mitgeteilt (ROSCH, 1973a, b).
Zeitschrift für Sozialpsychologie 1984, 15, 2 - 17
Hatte sich die Prototypenforschung anfangs noch auf einfache perzeptuelle Kategorien wie Farben und Formen beschränkt, so rückten in den folgenden Jahren alltagssprachliche semantische Kategorien wie z. B. «Möbel», «Fahrzeug», «Sportart» oder «Vogel» immer stärker in den Mittelpunkt des Interesses. Bei solchen Prototypikalitätsstudien wurden die Versuchspersonen üblicherweise gebeten, auf Ratingskalen anzugeben, wie typisch ein Objekt ihrer Meinung nach für seine Kategorie ist. Die so gewonnenen Typikalitätsurteile haben sich als sehr reliabel erwiesen ( R O S C H , 1973b, 1975b). Eine Fülle von Untersuchungen weist die Prototypikalität von Objekten als eine wichtige psychologische Variable aus (vgl. R O S C H , S I M P SON & M I L L E R , 1976; M E R V I S Ä R O S C H , 1981): Einer der experimentell am besten abgesicherten TypikalitätsefTekte betrifft die Reaktionszeit bei Verifikationsaufgaben der Art «Ein X (Exemplar) ist ein Y (Kategorie)»: Für typische Kategoriemitglieder, wie z. B. «Spatz» im Falle der Kategorie «Vogel», ist die Reaktionszeit kürzer als für weniger typische Mitglieder, wie z. B. «Pinguin» (vgl. die Überblicksarbeiten von S M I T H , 1 9 7 8 ; D A N K S & G L U C K S BERG, 1 9 8 0 ) .
Anhand der Normdaten von BATTIG & M O N ( 1 9 6 9 ) konnten M E R V I S , C A T L I N & R O S C H ( 1 9 7 6 ) zeigen, daß die Häufigkeit der Nennung von Exemplaren zu vorgegebenen Kategorien mit der Beurteilung ihrer Prototypikalität signifikant positiv korrelierte: Die von vielen Vpn genannten Exemplare, wie z. B. «Hammer» für die Kategorie «Werkzeug», wurden in der Regel als typischer für ihre Kategorie eingestuft als die seltener genannten Exemplare. In einer linguistischen Studie hat LAKOFF (1973) aufgezeigt, daß bestimmte sprachliche Qualifikationen («hedges»), wie z.B. «eigentlich», «ziemlich» oder «beinahe», nur auf eine Teilmenge von Kategoriemitgliedern sinnvoll anwendbar sind. So ist es zwar plausibel zu sagen, «Ein Wal ist eigentlich ein Säugetier», nicht aber «Ein Pferd ist eigentlich ein Säugetier» (vgl. auch R O S C H , 1975a, 1977; O R T O N Y , 1979). Typikalitätseffekte wurden ferner bei Ähnlichkeitsratings beobachtet. In einer Reihe von TAGUE
5 Experimenten traten Asymmetrien in der Weise auf, daß weniger typische Exemplare den typischeren Exemplaren ähnlicher waren als umgekehrt ( R O S C H , 1975a; T V E R S K Y & G A T I , 1978;SADALLA, B U R R O U G H S & S T A P L I N , 1980). Dieses Ergebnis steht im Widerspruch zum sog. Symmetrieaxiom der Ähnlichkeitsmessung ( T V E R S K Y , 1977; K R U M H A N S L , 1978). R I P S (1975) berichtet von entsprechenden Asymmetrien bei induktiven Denkprozessen. Vpn erhielten die Information, daß ein gegebenes Mitglied einer Kategorie (z. B. Säugetiere) eine unbekannte, ansteckende Krankheit hat. Es zeigte sich, daß diese Information in Abhängigkeit von der Typikalität der Kategoriemitglieder asymmetrisch verallgemeinert wurde: Sagte man den Vpn z.B., daß Pferde (typische Spezies) von der neuen Krankheit befallen sind, dann waren sie viel eher geneigt zu folgern, daß auch Mäuse (untypische Spezies) von dieser Krankheit befallen sind als im umgekehrten Fall (vgl. auch K A H N E M A N & T V E R S K Y , 1973). Schließlich zeigten sich typikalitätsspezifische Asymmetrien auch in einer gedächtnispsychologischen Studie von K E L L E R & K E L L A S (1978). Die Autoren konnten nachweisen, daß der Effekt der «Befreiung von proaktiver Hemmung» größer war, wenn der Wechsel von typischen zu untypischen Exemplaren erfolgte als umgekehrt. In einer Vielzahl von Arbeiten wurde untersucht, welchen Einfluß die Variable der Prototypikalität auf den Erwerb von Kategorien hat und welche Faktoren bei der Abstraktion prototypischer Information von Bedeutung sind. Experimente zu diesem Fragenkreis wurden in der Regel nicht mit natürlichen, sondern mit experimentell hergestellten Kategorien durchgeführt, um die interessierenden Variablen systematisch variieren und ihre Effekte unbeeinflußt von früherer Erfahrung seitens der Vpn analysieren zu können. Diese Kategorien waren so konstruiert, daß sie die für natürliche Kategorien charakteristische Unscharfe («fuzziness») aufwiesen; es handelte sich also um unscharfe bzw. vage definierte künstliche Kategorien. Die Verwendung unscharfer künstlicher Kategorien hat eine relativ lange Tradition innerhalb der noch jungen experimentellen Prototy-
Eckes & Six: Prototypenforschung: Ein integrativer Ansatz zur Analyse der alltagssprachlichen Kategorisierung
penforschung. So hat bereits A T T N E A V E ( 1 9 5 7 ) von statistischen Transformationsregeln Gebrauch gemacht, um visuelle Muster zu erhalten, die um eine Standardform - den P r o t o t y p variierten. In der Folgezeit wurde eine Fülle von Experimenten mit derartigen Kategorien durchgeführt (vgl. z. B . P O S N E R & K E E L E , 1 9 6 8 , 1970;
FRANKS
&
1972; NEUMANN,
BRANSFORD, 1974,
1971;
1977; HOMA &
REED, Vos-
BURGH, 1 9 7 6 ; HOMA, 1 9 7 8 ; RHOADS & CHAMBLISS, 1 9 7 9 ; S O L S O & R A Y N I S , 1 9 7 9 ; M E R V I S & PANI, 1980).
Das für diese Experimente typische Design sieht vor, daß zunächst die Reizobjekte (z. B. Punktmuster, geometrische Figuren, schematisierte Gesichter) durch systematische Transformation oder zufallige Verzerrung ausgewählter Grundmuster (Prototypen) erzeugt werden. Der weitere Ablauf gliedert sich in zwei Phasen, eine Lernphase und einen sich anschließenden Transfertest. In der Lernphase sollen die Vpn gegebene Reizobjekte klassifizieren, wobei Variablen wie die Anzahl der Reize pro Kategorie, das Ausmaß der Transformation bzw. Verzerrung des Prototyps und die Anzahl weiterer zu lernender Kategorien manipuliert werden können. Beim Transfertest sollen die Versuchspersonen dargebotene Reizobjekte erneut klassifizieren. Üblicherweise werden dabei diejenigen Reize dargeboten, die schon in der Lernphase verwendet wurden («alte Reize»), weiterhin neue Reize, die aus denselben Grundmustern (Prototypen) wie die alten Reize gewonnen wurden und die Grundmuster selbst. Es konnte bei diesen Experimenten u.a. gezeigt werden, daß die Reaktionszeit und die Häufigkeit von Fehlklassifikationen mit der Distanz vom Prototyp zunahmen, daß die Prototypen (in der Lernphase nicht dargeboten) mit annähernd gleicher Geschwindigkeit und Genauigkeit klassifiziert wurden wie die alten Reize und daß sowohl Prototypen als auch alte Reize schneller und korrekter klassifiziert wurden als neue Reize. Ferner ergab sich, daß Prototypen nicht so sehr dem Vergessensprozeß unterlagen wie die Reize, aus denen sie während der Lernphase abstrahiert wurden. Als wichtig hat sich schließlich auch die Variabilität der Kategoriemitglieder erwiesen. Kategorien mit hoher interner Variabilität waren zwar
anfanglich schwerer zu lernen, aber die Häufigkeit, mit der selbst stark verzerrte Reize richtig klassifiziert wurden, lag höher als bei weniger variablen Kategorien. Die Vpn scheinen also nicht nur Information über die zentrale Tendenz (den Prototyp), sondern auch über die Variabilität von Kategorien zu abstrahieren und beide Arten von Information bei der Klassifikation neuer Exemplare zu berücksichtigen. Zu Experimenten mit vage definierten künstlichen Kategorien ist kritisch anzumerken, daß sie zwar zu einer Reihe neuer Erkenntnisse über Prozesse der Abstraktion prototypischer Information geführt und die Prototypenforschung um einige methodische Varianten bereichert haben, die verwendeten künstlichen Kategorien jedoch relativ einfach strukturiert sind, so daß hinreichend valide Schlüsse über natürliche Kategorien nicht ohne weiteres möglich erscheinen. So stellt sich bei natürlichen Kategorien die Frage, worauf es denn zurückzuführen ist, daß einige Exemplare bessere Beispiele für ihre Kategorie sind als andere. R O S C H & M E R V I S (1975) gingen dieser Frage nach und fanden, daß die typischen Exemplare jene sind, die viele Merkmale mit vielen anderen Exemplaren ihrer Kategorie gemeinsam haben (hohe «interne Familienähnlichkeit») und nur wenige Merkmale mit Exemplaren anderer Kategorien teilen (niedrige «externe Familienähnlichkeit»), Das von R O S C H & M E R V I S operational definierte Konzept der Familienähnlichkeit ist eng verwandt mit dem älteren Begriff der «Cue-Validität» bei B O U R N E & R E S T L E (1959) und B E A C H (1964). Cue-Validität ist definiert als die Häufigkeit, mit der ein Merkmal («cue») in einer gegebenen Kategorie auftritt, dividiert durch die Auftretenshäufigkeit dieses Merkmals über alle Kategorien. Ein typisches Exemplar ist danach durch den Besitz vieler Merkmale mit hoher Cue-Validität gekennzeichnet. Eine hierzu analoge mengentheoretische Definition eines typischen Objekts gibt T V E R S K Y (1977) im Rahmen seines Kontrastmodells der Ähnlichkeit. Familienähnlichkeit als interne Strukturvariable von Kategorien scheint jedoch nicht die einzige Determinante der Prototypikalität zu sein. Untersuchungen von A S H C R A F T (1978a, b) und M C C L O S K E Y (1980) zeigen, daß die Typikalität von Exemplaren in engem Zusam-
Zeitschrift für Sozialpsychologie 1984, 1 5 , 2 - 1 7
menhang mit ihrer «Vertrautheit» («familiarity») steht. A S H C R A F T fand z. B., daß zu untypischen Exemplaren weniger Merkmale aufgelistet wurden als zu typischen Exemplaren und daß die (mittlere) Anzahl aufgelisteter Merkmale mit Typikalitätsratings höher korrelierte als einige andere Variablen, einschließlich eines Maßes der Merkmalsüberlappung mit der zugehörigen übergeordneten Kategorie. McCLOSKEY identifizierte die Vertrautheit von Kategoriemitgliedern als eine wichtige konfundierende Variable in zahlreichen Verifikationsexperimenten. Die Bedeutung der Vertrautheit als Determinante der Typikalität wurde von M A L T & SMITH ( 1 9 8 2 ) unterstrichen, zugleich aber auch relativiert. Sie wiesen nach, daß Vertrautheit bei weitem nicht alle Varianz von Typikalitätsratings aufklären kann (vgl. auch GLASS & MEANY, 1978).
Zu diesen Experimenten ist kritisch anzumerken, daß das Konzept der Vertrautheit theoretisch nicht hinreichend geklärt und in sehr unterschiedlicher Weise operationalisiert wurde. 2.2. Die vertikale Dimension:
Basiskategorien
Betrachtet man ein hierarchisches System von Kategorien, so ist klar, daß Objekte auf unterschiedlich abstrakten Hierarchieebenen kategorisiert werden können. Man kann z. B. sagen, daß es sich bei einem gegebenen Objekt um einen Spatz, einen Vogel, ein Tier oder ein Lebewesen handelt. Unter diesen verschiedenen hierarchischen Ebenen gibt es nach ROSCH, MERVIS,
GRAY,
JOHNSON
&
BOYES-BRAEM
eine Ebene, die eine herausragende psychologische Bedeutung hat: die Ebene der Basiskategorien. Die Kategorien auf dieser Ebene unterscheiden sich von Kategorien über- oder untergeordneter Ebenen dadurch, daß sie einem Organismus ein Maximum an Information bei einem Minimum an kognitivem Aufwand zur Verfügung stellen. Im Kategoriensystem übergeordnete Kategorien besitzen zwar größere «externe Separation», d. h. die Kategorien sind besser voneinander unterscheidbar, aber geringere «interne Homogenität», d.h. für die Mitglieder einer solchen Kategorie ergibt sich eine geringere durchschnittliche Ähnlich(1976)
7
keit untereinander; bei untergeordneten Kategorien ist es umgekehrt. Basiskategorien stellen gemäß dieser Konzeption einen Kompromiß zwischen externer Separation und interner Homogenität dar, der eine ökonomische Verschlüsselung von Information erlaubt. In einer Reihe empirischer Untersuchungen konnte der besondere Status von Basiskategorien innerhalb eines hierarchischen Kategoriensystems nachgewiesen werden. Die übliche Methodik besteht darin, daß Kategorien auf drei Abstraktionsebenen ausgewählt werden, wobei sich auf der mittleren Ebene die postulierten Basiskategorien befinden. Die resultierenden Taxonomien haben z.B. das folgende Aussehen: übergeordnete Basisebene Ebene Möbel Fahrzeug
Tisch Lampe Auto Bus
untergeordnete Ebene Küchentisch, Eßzimmertisch Stehlampe, Tischlampe Sportwagen, Luxuslimousine Stadtbus, Überlandbus
Die beiden angegebenen Taxonomien sind einer Untersuchung von ROSCH et al. ( 1 9 7 6 ) entnommen. Die Autoren führten zunächst vier Experimente durch, die als konvergente operationale Definition von Basiskategorien gedacht waren. Im ersten Teilexperiment wurden Vpn gebeten, all jene Merkmale aufzulisten, die ihnen zu Exemplaren von Kategorien auf den drei verschiedenen Abstraktionsebenen einfielen. Vergleichsweise wenige Merkmale wurden für die übergeordneten Kategorien genannt. Eine sehr viel größere Anzahl wurde für Basiskategorien aufgeführt, während auf der Ebene der untergeordneten Kategorien nicht signifikant mehr Merkmale aufgelistet wurden als für die Kategorien der Basisebene. Betrachtet man die Anzahl genannter Merkmale als ein Maß für den Informationsgehalt einer Kategorie, so geht aus diesem Ergebnis hervor, daß Basiskategorien informativer sind als die zugehörigen übergeordneten Kategorien und daß nur wenig Information hinzugewonnen wird, wenn man zur untergeordneten Ebene fortschreitet. In den anderen drei Teilexperimenten ergaben sich analoge Befunde. So zeigte sich, daß die Basisebene die abstrakteste (höchste hierarchische) Ebene war, auf der Vpn
Eckes & Six: Prototypenforschung: Ein integrativer Ansatz zur Analyse der alltagssprachlichen Kategorisierung
ähnliche Bewegungsabläufe im Umgang mit verschiedenen Exemplaren der Kategorie beschrieben, auf der ferner die Exemplare ähnliche Gestalt besaßen (gemessen anhand des Überlappungsgrades der Umrißskizzen je zweier Exemplare) und auf der schließlich die Kategoriezugehörigkeit der durchschnittlichen Gestalt (Umrißskizze) je zweier Exemplare korrekt identifiziert werden konnte. In weiteren Experimenten untersuchten R O S C H et al. eine Reihe von Implikationen, die sich aus dem besonderen, empirisch untermauerten Status von Basiskategorien für kognitive Prozesse ergeben. Wenn es - wie das letzte der genannten vier Teilexperimente gezeigt hat - möglich ist, ein mentales Bild des «durchschnittlichen» Mitglieds einer Basiskategorie zu formen, dann sollte Vorausinformation bestimmte Reaktionen auf Mitglieder einer Basiskategorie erleichtern. Unter Verwendung der sogenannten «Priming-Technik» (vor der Darbietung des experimentellen Reizes wird ein Hinweisreiz gegeben) konnte das Autorenteam zeigen, daß der Basisebenen-Name eines Objekts der abstrakteste Name ist, der die Entdekkung eines Bildes dieses Objekts unter visuell erschwerten Bedingungen («noise») erleichtert. Sollten die Vpn in einem anderen Experiment die (physikalische) Gleichheit zweier visuell dargebotenen Reizobjekte beurteilen, so war der Basisebenen-Name der abstrakteste Name, der einen signifikanten Priming-Effekt auf die Reaktionszeit bei «gleich»-Urteilen ausübte. Nimmt man die Ergebnisse dieser beiden Priming-Studien und des vierten oben genannten Teilexperiments zusammen, so können sie als ein Beleg dafür interpretiert werden, daß prototypische Repräsentationen von Kategorien primär auf dem Niveau von Basiskategorien vorliegen. Alle bisher berichteten Experimente zeigten keinen signifikanten Unterschied in den jeweiligen abhängigen Variablen zwischen Basiskategorien und untergeordneten Kategorien. Daß eine Klassifikation auf dem Niveau der Basiskategorien nicht nur einer Klassifikation auf übergeordneter, sondern auch auf untergeordneter Ebene überlegen sein kann, ergab sich für ein Experiment, in dem es um das Wiedererkennen von Reizobjekten ging. Die Vpn sollten angeben, ob es sich bei einem unter Noise-Be-
dingungen dargebotenen Bild eines Objekts um ein «X» handelte, wobei «X» ein Kategorienname entweder auf übergeordneter, untergeordneter oder Basisebene war. Die Reaktionszeit für die Verifikation auf Basisebene lag signifikant niedriger als im Falle der beiden anderen Ebenen. Die herausgehobene Stellung der Basisebene innerhalb einer Taxonomie konnte auch in entwicklungspsychologischen Studien bestätigt werden. R O S C H et al. legten Vpn verschiedener Altersstufen, beginnend mit drei Jahren, Mengen farbiger Bilder von Tieren und Fahrzeugen vor, die so zusammengestellt waren, daß die jeweiligen Objekte entweder nur auf der Ebene von Basiskategorien oder nur auf der Ebene von übergeordneten Kategorien richtig klassifiziert werden konnten. Die Objekte, die nur auf Basisebene korrekt klassifizierbar waren, wurden von Kindern aller Altersstufen in der gleichen Weise wie von Erwachsenen gruppiert. Dagegen fiel die Leistung der dreijährigen Kinder deutlich ab, wenn nur eine korrekte Klassifikation auf übergeordneter Ebene möglich war. In dieser Bedingung zeigte sich der übliche altersabhängige Leistungsanstieg. Aus diesen und anderen Ergebnissen zogen R O S C H et al. den Schluß, daß Basiskategorien im Laufe der kognitiven Entwicklung vor Kategorien anderer hierarchischer Ebenen erworben werden (vgl. auch D O U G H E R T Y , 1978; D A E H L E R , L O N A R D O & B U K A T K O , 1979).
3.
Perspektiven für die Personwahrnehmungsforschung
Personwahrnehmungsprozesse bilden als Prozesse der sozialen Kategorisierung die Grundlage für die alltäglichen sozialen Interaktionen zwischen Personen und Gruppen. Insofern derartige Prozesse der kognitiven Orientierung in komplexen Umwelten dienen, sind Reaktionsmuster gefragt, die bei einem Maximum an Information ein Minimum an kognitivem Aufwand bedeuten. Gerade diese Bedingung aber erfüllen Basiskategorien. Daß die verwendeten Kategorien nicht durch scharfe Kategoriengrenzen definiert sind, ist verzichtbar, wenn nur der Kategorieinhalt möglichst eindeutig festgelegt ist. Im sozialen Kategorisierungspro-
Zeitschrift für Sozialpsychologie 1984, 1 5 , 2 - 1 7
zeß sind Prototypen, wie es scheint, optimale Kategorierepräsentanten. Unter dem Aspekt der Modellbildung in der Personwahrnehmungsforschung enthält der Prototypenansatz sowohl ein Eindrucksmodell, da Prototypen - in der Regel auf dem Niveau von Basiskategorien - Merkmale in organisierter Form gespeichert haben, als auch ein Inferenzmodell, insofern Prototypen Schemata sind, die zur Wiedererkennung aktiviert werden und bei entsprechender Identifikation einer Person die Merkmale dieses Prototyps zuschreiben. Da Personen wohl nur selten «reine» Prototypen repräsentieren, ist es sinnvoll, durch einen zusätzlichen Urteilsprozeß das Ausmaß der Prototypikalität einer gegebenen Person zu bestimmen. Aus der so gewonnenen Zuschreibung lassen sich dann weitere Schlußfolgerungen ziehen, so z. B. über das Verhalten einer Person. Der Frage, nach welchen Regeln die prototypischen Exemplare einer Personkategorie identifiziert werden und welche Rolle Prototypen in der kognitiven Organisation des Beobachters spielen, haben sich vor allem CANTOR & MISCHEL (1977, 1979a, b), TSUJIMOTO (1978) und BUXBAUM (1981, 1982) zugewendet. Wesentliches Ergebnis dieser Arbeiten ist, daß Beobachter nicht bloß einzelne konkrete Informationseinheiten bezüglich anderer Personen speichern, sondern eine abstraktere, prototypische Repräsentation bilden, die als Bezugspunkt für die Verarbeitung von Information über Eigenschaften und Verhaltensweisen anderer Personen dient. Das Ausmaß der Prototypikalität einer Person im Hinblick auf eine bestimmte Kategorie hat Einfluß auf die Leichtigkeit, mit der Information über diese Person enkodiert, interpretiert und abgerufen werden kann. So haben z.B. CANTOR & MISCHEL (1979b) gezeigt, daß die Behaltensleistung bei Information über eine konsistent agierende prototypische Person größer ist als bei Information über eine inkonsistente Person. Bei der Konstruktion von Prototypen wird in den Arbeiten von C A N T O R & MISCHEL (1979a) und CANTOR (1981b) als Ausgangsmaterial auf bereits vorliegende Taxonomien von Kategorien aus dem thematisch zu untersuchenden Bereich zurückgegriffen. Anschließend wird überprüft, inwieweit derartige Taxonomien
9 von «naiven» Personen akzeptiert werden. Der Prototyp einer Kategorie wird dann aus denjenigen Merkmalen zusammengestellt, die von einer bestimmten Anzahl von Personen übereinstimmend genannt worden sind. Entsprechend wird für sämtliche Kategorien einer Taxonomie verfahren und jeweils ein prototypisches Exemplar konstruiert. Dieser so gewonnene «konsensuelle» Prototyp weist nur selten Merkmale auf, die von sämtlichen Personen als prototypisch akzeptiert werden können. Es gibt offensichtlich viele «idiosynkratische» Prototypen - ein Ergebnis, das belegt, wie sinnvoll es ist, Prototypen als «fuzzy sets» von Merkmalen zu konzipieren. CANTOR & MISCHEL (1979a) haben bei der Beurteilung der Prototypikalität von Personen eine Unterscheidung hinsichtlich des Ausmaßes an Information getroffen, die dem Beurteiler zur Verfügung steht: (a) Unter der «füll view»-Bedingung steht dem Beurteiler viel Information zur Verfügung, weil er die Person, die er zu beurteilen hat, sehr gut kennt; (b) in der «restricted view»-Bedingung verfügt der Beurteiler über weniger Information, so wie es in natürlichen Situationen der Fall ist, in denen Eindrucksurteile über andere abgegeben werden. Prototypikalitätsurteile wurden im ersten Fall von anderen Faktoren beeinflußt als im zweiten. Beim «füll view» waren dies die Anzahl kategoriekonsistenter Merkmale, die Anzahl dieser Merkmale relativ zur Gesamtzahl und die Anzahl der kategorieinkonsistenten Merkmale. Beim «restricted view» führten vor allem zentrale Kategoriemerkmale, die über mehrere Situationen hinweg konsistent auftraten, zu einem erhöhten Maß an Prototypikalität. Wurden diese Merkmale in Situationen wahrgenommen, in denen sie üblicherweise nicht erwartet werden (nicht-normative Situationen), so erhöhte dies die Prototypikalität noch weiter. FORGAS (1980) konnte darüber hinaus zeigen, daß Prototypen durch evaluierende Merkmale gekennzeichnet sind, die sich von den «bloß kognitiven» Merkmalen der Objektklassifikation durch ihren zusätzlichen konnotativen Bedeutungsgehalt unterscheiden. FORGAS (1980) fordert aufgrund seiner Resultate unterschiedliche Modelle der Eindrucksbildung in Abhängigkeit von der Bedeutung («salience»)
10
Eckes & Six: P r o t o t y p e n f o r s c h u n g : Ein integrati ver A n s a t z z u r Analyse d e r alltagssprachlichen Kategorisierung
der zu beurteilenden Person. Die Beurteilung «salienter» Personen, definiert über ihre Prägnanz, läßt sich seiner Meinung nach am besten durch das Prototypenkonzept beschreiben, während für weniger «saliente» Personen das lerntheoretische Modell der Verarbeitungstiefe ( C R A I K & L O C K H A R T , 1 9 7 2 ) geeigneter erscheint. Erste Versuche, ein Inferenzmodell zu entwickeln, in dem der Urteilsprozeß abgebildet wird, wenn kognitiv repräsentierte Prototypen auf externe soziale Stimuli angewendet werden, stammen von C A N T O R ( 1 9 7 8 ) . Bei der Überprüfung von drei Modellen hat C O H E N ( 1 9 8 3 ) zeigen können, daß das von ihr entwikkelte Modell des differentiellen Zugriffs, wonach (Modell II) relevante Merkmale einer Kategorie sich von den übrigen Merkmalen durch eine schnellere ZugrifTszeit unterscheiden, einem Modell überlegen ist, in dem die Verknüpfung zwischen Merkmal und Kategorie nicht berücksichtigt wird (Modell I). Prototypische Merkmale werden gemäß dieses Modells nicht nur schneller, sondern auch mit einem größeren Ausmaß an Urteilssicherheit durch die Vpn abgerufen. Das dritte Modell stellt eine Erweiterung des zweiten Modells dar, insofern zusätzlich zum Ausmaß des differentiellen Zugriffs auch die (abgegebenen) Urteile über die abgelehnte Nichtzugehörigkeit eines Merkmals zu einer Kategorie berücksichtigt werden. Es zeigte sich, daß auch für die schwächer mit einem Prototyp assoziierten Merkmale die Vorhersagen mit dem Modell übereinstimmen: Ihre Ablehnung erfolgte schneller und das Vertrauen in die Richtigkeit des Ablehnungsurteils war größer als bei Merkmalen, die ein höheres Maß an Prototypen-Relevanz aufwiesen. Die Kategorisierung von Personen läßt sich auf unterschiedlichen Abstraktionsebenen vornehmen, so daß sich die Frage stellt, welches die Vor- und Nachteile derartiger Kategorisierungen sind. C A N T O R & M I S C H E L (1979a) sind in ihrer Untersuchung dieser Frage nachgegangen. Analog zu R O S C H et al. (1976) konstruierten sie Kategoriensysteme mit drei Abstraktionsebenen. Die Kategorien der mittleren Ebene (Basiskategorien) zeigten maximale Ausgewogenheit zwischen Reichhaltigkeit (Anzahl der Merkmale, die auf mindestens die Hälfte aller Kategoriemitglieder zutreffen),
Differenzierung (Ausmaß, in dem Merkmale der Mitglieder einer bestimmten Kategorie auch auf Mitglieder benachbarter Kategorien zutreffen) und Bildhaftigkeit bzw. Konkretheit der Merkmale von Kategoriemitgliedern. S E M I N & R O S C H (1981) machen darauf aufmerksam, daß Prototypen sowohl in bipolarer wie in unipolarer Version in den bisherigen Untersuchungsansätzen verwendet worden sind. Die vor allem bei C A N T O R (1978) und C A N T O R & M I S C H E L (1979a) verwendeten bipolaren Prototypen «Extraversion-Introversion» sind so konzipiert, daß Merkmale des einen Prototyps dem anderen abgesprochen werden bzw. fehlen. S E M I N & R O S C H (1981) konnten in ihrer Arbeit nachweisen, daß bei bipolaren Prototypen nur derjenige Prototyp aktiviert wird, über den Aussagen verlangt werden, d. h. daß selbst dann, wenn bipolare Prototypen vorliegen n u r derjenige Prototyp aktiviert wird, von dem aus Schlußfolgerungen über andere Personen gezogen werden. Vor allem dann, wenn die Bildung von Prototypen über Reaktionszeitexperimente vorgenommen wird (Merkmale mit kürzeren Reaktionszeiten werden als prototypenrelevant ausgewählt), ergeben sich Konstruktionsfehler innerhalb des Prototyps, da sich zur Charakterisierung eines Prototyps sehr wohl auch solche Merkmale eignen, die ihm explizit abgesprochen werden. H O F F M A N , M I S C H E L & M A Z Z E (1981) haben zeigen können, daß Beobachter mit unterschiedlichen Intentionen bei der Informationsverarbeitung auch unterschiedliche Arten von Kategorien zur Organisation der Elemente des Verhaltens einer Person verwendeten. Sie konnten z. B. nachweisen, daß dann, wenn Verhaltensepisoden erinnert werden sollten oder Empathie mit der Hauptperson in den geschilderten Verhaltensepisoden demonstriert werden sollte, zur Beschreibung des Verhaltens bestimmte Verhaltensziele (z.B. der Kauf eines teuren ausländischen Sportwagens) verwendet wurden, während dann, wenn Eindrucksurteile oder Verhaltensvorhersagen getroffen werden sollten, «traits» (z. B. Großzügigkeit) zur Kategorisierung eingesetzt wurden. Dies scheint vor allem für die Selektion von Merkmalen bei der Bildung von Prototypen wichtig zu sein. COHEN
(1981) konnte in ihrer Untersuchung
11
Zeitschrift für Sozialpsychologie 1984, 1 5 , 2 - 1 7
nachweisen, daß das Vorwissen einer Person einen nicht unbeträchtlichen Einfluß auf die Personbeurteilung hat. Waren den Vpn z. B. die Berufszugehörigkeiten der zu beurteilenden Personen bekannt, traten deutlich nachweisbare prototypenspezifische Beurteilungen auf, d.h. die Information über den beruflichen Status führte zu einer berufsprototypisch konsistenten Beurteilung. Prototypenforschung ist unter dem Aspekt sozialer Kategorisierung auch auf solche Bereiche auszudehnen, die nicht zum klassischen Repertoire der Personwahrnehmungsforschung zählen, wie z.B. auf den Bereich der Vorurteils- und Stereotypenforschung. Hier können Vorurteile und Stereotypen gegenüber anderen als Prototypen konzipiert werden (BREWER, D U L L & L U I , 1 9 8 1 ; TAYLOR, 1981).
Auch im Bereich der Selbstkonzeptforschung gibt es inzwischen eine Reihe von Arbeiten, die sich am Prototypenansatz orientier e n (vgl. z . B . MARKUS, 1 9 7 7 ; K U I P E R & D E R R Y ,
Nach M A R sind Selbst-Schemata oder Prototypen aus der Erfahrung abgeleitete kognitive Generalisierungen über das Selbst, die die Verarbeitung selbstbezogener Information organisieren und steuern. Als Invarianzen repräsentieren sie solche Verhaltensmuster, die die Funktion eines Bezugsrahmens übernehmen. Dadurch wird es möglich, selbst aus weniger Information Schlußfolgerungen über seine eigene Person zu ziehen oder möglichst schnell auch komplexe Ereignisfolgen zu überblicken und zu interpretieren. Daß das Selbst als Prototyp im übrigen nicht nur aus begrifflichen Merkmalen besteht, sondern auch bildhafte Elemente enthält, konnten Y A R M E Y & J O H N S O N ( 1 9 8 3 ) zeigen. S C H L E N K E R ( 1 9 8 2 ) verwendet in seiner Identitäts-Theorie ebenfalls das Prototypenkonzept. Unter Identität versteht er «a theory (or schéma) that is constructed about how one is and should be perceived, regarded, and treated in social life» ( S C H L E N K E R , 1 9 8 2 , p. 194). Insofern das Identitätskonzept sich ausschließlich auf Interaktionen bezieht, wird es als reduzierte Selbstkonzept-Theorie bezeichnet, da Erfahrungsaspekte «as nonsocial in nature» nicht berücksichtigt werden. Die Identitätsvorstellungen, die Personen in und für soziale Interaktionen entwickeln, enthalten 1981 ; YARMEY & JOHNSON, 1 9 8 2 ) .
KUS ( 1 9 7 7 )
nach S C H L E N K E R Prototypen, die als Standards zur Bewertung und Steuerung von Handlungen dienen.
4.
Prototypische Situationskonzepte
Taxonomien und Klassifikationen von Situationen werden sowohl deskriptiv wie prädiktiv eingesetzt. Es besteht sowohl ein Interesse daran, Situationen nach vorgegebenen Kriterien zu strukturieren, um auf diese Weise zu ermitteln, welches Verhaltenspotential unter welchen Bedingungen in welchem Situationssegment realisiert wird, als auch aufgrund der Kenntnis der Situationsstruktur Vorhersagen über individuelles oder gruppenspezifisches Verhalten zu machen. Vor allem die Forschungsprogramme der interaktionsorientierten Persönlichkeitsforschung, der Umweltpsychologie und derjenigen Teile der Organisationspsychologie, in denen die Struktur von Organisationen als Ganzes analysiert wird, benötigen für ihren Variablenpool Taxonomien und Klassifikationen von Situationen. Bislang wurden derartige Taxonomien und Klassifikationen durch zwei verschiedenartige Strategien gewonnen: Zum einen durch a-priori Klassifikationen, zum anderen durch empirische Klassifikationsverfahren, bei denen vorgegebene Merkmalslisten von Situationen durch Anwendung eines formalen Modells strukturiert wurden ( F R E D E R I K S E N , 1 9 7 2 ; W A K E N H U T , 1978; MAGNUSSON, 1981; ARGYLE, FURNHAM & GRAHAM, 1981).
Lösungen von multidimensionalen Skalierungsverfahren führen dabei in der Regel zu Situationsdimensionen, die n u r geringe transsituationale Geltung besitzen und die Variabilität der Urteiler weist auf zum Teil erhebliche individuelle Unterschiede der Situationswahrnehmung hin ( K I N G & S O R R E N T I N O , 1 9 8 3 ) . Die Analyse von Situationen mit Hilfe des Prototypen-Ansatzes ermöglicht demgegenüber, sowohl Aussagen über die konstitutiven Merkmale einer Situation zu machen als auch das Abstraktionsniveau der Situationswahrnehmung zu kennzeichnen. Ähnlichkeit o d e r U n ähnlichkeit von Situationen läßt sich dabei über die Zahl der prototypischen Merkmale
12
Eckes & Six: Prototypenforschung: Ein integrativer Ansatz zur Analyse der alltagssprachlichen Kategorisierung
und das Ausmaß ihrer Prototypikalität ermitteln. C A N T O R et al. (1982b) haben in ihrer Untersuchung vier verschiedene Taxonomien sozialer Situationen mit jeweils drei hierarchisch angeordneten Ebenen analysiert (vgl. die folgende Tabelle). Zu jeder der insgesamt neun verschiedenen Kategorien einer Taxonomie ließen die Autoren in einer Voruntersuchung Merkmalslisten erstellen, um zu prototypischen Situationsmerkmalen zu gelangen. Für jede der insgesamt 36 Kategorien wurden 7 bis 24 Merkmale als prototypisch genannt. Kritisch anzumerken ist an dieser Stelle, daß als Auswahlkriterium für die Merkmale die Übereinstimmung von je zwei der insgesamt 10 Vpn als ausreichend angesehen wurde. Eine Erhöhung der Konsensusrate hätte zu einer erheblichen Reduktion der prototypischen Merkmale geführt. Immerhin ließ sich deutlich belegen, daß das Ausmaß an Übereinstimmung der Kategorien innerhalb einer Situationstaxonomie - die Interprototypen-Ähnlichkeit - signifikant größer war als die Interprototypen-Ähnlichkeit zwischen Situationen anderer Taxonomien. U m zu überprüfen, ob sich Situations-Prototypen als brauchbare Analyseeinheiten ver-
wenden lassen, wurden in einer zweiten Untersuchung (CANTOR et al., 1982a, p.57f.) außer diesen auch Person-Prototypen und Person-Situations-Prototypen vorgegeben, zu denen die Vpn entsprechende Merkmale nennen sollten. Es zeigte sich, daß die Zahl der Merkmale, die jeweils den drei Typen zugeordnet wurden, nicht signifikant verschieden war, wohl aber ergaben sich signifikante Unterschiede hinsichtlich der Geschwindigkeit, mit der diese Merkmale genannt wurden. Am schnellsten wurden die Merkmale zu Situationen genannt. Das kann als Beleg dafür gewertet werden, daß Personen ein schnell verfügbares Inventar zur Beschreibung von Situationen besitzen. Darüber hinaus waren die genannten Merkmale für Situationen auch diejenigen, die unter inhaltlichen Aspekten die dififerenziertesten waren. Eine Inhaltsanalyse der Merkmale führte ferner zu dem erstaunlichen Ergebnis, daß signifikant häufiger solche Merkmale verwendet wurden, die Information über Personen enthielten, d.h. solche Information, die sich auf das Verhalten, die Einstellungen, den sozioökonomischen Status der Personen usw. bezog. C A N T O R et al. interpretieren dann auch ihre Ergebnisse im Sinne einer Validierung des Forschungsprogramms der interaktionistischen Persönlich-
Tab. 1: Taxonomien sozialer Situationen. Aus: N. CANTOR et al., 1982b, p. 37. Being in an ideological' situation
Being in a social situation
Being in a stressful situation
Being in a cultural situation
Being at a demonstration for a cause2 being at an antiwar demonstration 3 being at a save-the-whales sit-in being on a union picket line
Being at a party
Being
Being on a tour
being at a fraternity party
being in a county jail
being at a cocktail party
being in a state penitentiary
being at a birthday party
being in a hospital for the criminally insane
being on a tour of old English castles being on a tour of European museums being on a tour of Roman ruins Being at the performing
imprisoned
Being at a religious ceremony2 being at sunday mass 3 being at a revival meeting
Being on a date
Being at an
being on a first date being on a double date
being at a barmitzvah
being on a blind date
being at a job interview being at an admissions interview being at a psychiatric interview
1 2 3
Superordinate level Middle level Subordinate level
interview
being at the symphony being at the ballet being at the theater
arts
13
Zeitschrift für Sozialpsychologie 1984, 1 5 , 2 - 1 7
keitspsychologie: «In this sense, naive subjects seem to practice spontaneously the kind of interactionism that contemporary personologists are now recognizing as vital for a comprehensive scientific analysis of social behavior.» ( C A N T O R et al., 1982b, p. 70.) Je nach Ausmaß ihrer Prototypikalität stellen Situationen unterschiedliche Anforderungen an denjenigen, der sich in einer bestimmten Situation angemessen verhalten will. Daß dabei individuelle Differenzen bezüglich der Selektion von Information über diese Situation deutlich werden und damit auch individuelle Interpretationsmuster der Situation abgegeben werden, hat C A N T O R (1981 a, b) in ersten Untersuchungen nachzuweisen versucht. Gemäß derself-monitoring-Konzeption von S N Y D E R ( 1 9 7 9 ) wird erwartet, daß Personen, die als «high self-monitors» einzustufen sind, solche Information aus der Beobachtung von Situationen auswählen, die zur Bildung eines prototypischen Verhaltens verwendet werden kann, um schließlich das eigene Verhalten in Übereinstimmung mit dem Situationsprototyp zu realisieren. S N Y D E R & C A N T O R ( 1 9 8 0 ) gelang so z.B. der Nachweis, daß Personen, die als «high-self-monitors» klassifiziert wurden, über ein reichhaltigeres Arsenal von Situationen verfügen, in denen prototypische Verhaltensweisen gezeigt werden, als Personen, die als «low-self-monitors» eingestuft wurden. SNYDER & G A N G E S T A D ( 1 9 8 2 ) konnten zeigen, daß «high-self-monitors» eher solche Situationen bevorzugen, die eindeutig definiert sind und ihnen genügend Hinweisreize liefern, wie man sich angemessen zu verhalten hat, während «low-self-monitors» solche Situationen vermehrt aufsuchen, die es ihnen gestatten, «(to) communicate their own attitudes, feelings, and dispositions» ( S N Y D E R & G A N G E S T A D , 1 9 8 2 , p. 1 3 4 ) . W I G G I N S ( 1 9 8 0 ) hat vorgeschlagen, das Prototypenkonzept in das von ihm favorisierte Circumplex-Modell des interpersonellen Verhaltens einzubeziehen. Prototypen wären innerhalb des Circumplex-Modells im Zentrum der jeweiligen Segmente anzuordnen. Für die Prototypenforschung bestünde der Vorteil der Verwendung eines Circumplex-Modells vor allem darin, die Beziehungen der einzelnen Kategorien untereinander zu spezifizieren.
5.
Kritik und Ausblick
Die Prototypikalität von Kategoriemitgliedern hat sich als eine psychologische Variable von großer Bedeutung in unterschiedlichsten experimentellen Designs erwiesen. In gleicherweise belegt eine Fülle von Untersuchungen die zentrale Stellung von Basiskategorien innerhalb natürlicher Kategoriensysteme. Die in kaum mehr als einer Dekade angesammelte massive empirische Evidenz darf allerdings nicht darüber hinwegtäuschen, daß die Prototypenforschung eine Reihe von offenen Fragen und Problemen aufgeworfen hat. Einige grundlegende theoretische Schwierigkeiten haben O S H E R S O N & SMITH ( 1 9 8 1 ) aufgezeigt. Die Autoren haben zunächst eine Prototypentheorie formuliert, die als «typisch» für verschiedene Konzeptionen gelten kann, und unter Verwendung der Theorie unscharfer Mengen ( Z A D E H , 1 9 6 5 ) formalisiert. Die so einer kritischen Überprüfung zugänglich gemachte Prototypentheorie erwies sich als unvereinbar mit zwei Kriterien der Angemessenheit einer Begriffstheorie. Das erste Kriterium bezog sich auf die Relation zwischen komplexen Begriffen und ihren Konstituenten (konjunktive Begriffe, logisch leere und logisch universelle Begriffe, disjunktive Begriffe); das zweite Kriterium betraf die Wahrheitsbedingungen für einfache inklusive Relationen. O S H E R S O N & SMITH zogen aus ihren Ergebnissen den Schluß, daß die Prototypentheorie (Varianten der von ihnen untersuchten Konzeption fuhren zu den gleichen logischen Inkonsistenzen) unvollständig ist, weil sie nur einen ganz bestimmten Aspekt von Begriffen berücksichtigt. Um dies zu verdeutlichen, unterscheiden sie zwischen dem «Kern» und der «Identifikationsprozedur» eines Begriffs. Der Kern enthält die definierenden Merkmale eines Begriffs; die Identifikationsprozedur spezifiziert jene Art von Information, die verwendet wird, um rasche Entscheidungen über die Zugehörigkeit zum Begriff zu fallen (Oberflächen-Merkmale). Die Autoren nehmen an, daß traditionelle Begriffstheorien Identifikationsprozeduren zum Gegenstand haben. Dies könnte erklären, warum die Prototypenforschung so überzeugende empirische Resultate vor allem im Hinblick auf die Bestimmung der Kategoriemitgliedschaft
14
Eckes & Six: Prototypenforschung: Ein integrativer Ansatz zur Analyse der alltagssprachlichen Kategorisierung
(Aspekt der Identifikationsprozedur) erbracht hat, aber einer an begriffstheoretischen Kriterien orientierten logischen Analyse (Kernaspekt) nicht standhält. Unterstützung erfahrt diese Position durch eine Arbeit von BOURNE (1982), in der gezeigt werden konnte, daß Vpn einen wohldefinierten Kern-Begriff erwerben können, gleichzeitig aber Zugehörigkeitsentscheidungen von der An- oder Abwesenheit von Oberflächen-Merkmalen abhängig machen. D i e U n t e r s u c h u n g e n v o n OSHERSON & SMITH u n d BOURNE m a c h e n u . E . d e u t l i c h , d a ß
traditionelle und «prototypische» Begriffstheorien keineswegs in dem schroffen Gegensatz zueinander gesehen werden dürfen, der immer wieder konstruiert worden ist. Einfachheit und logische Struktur von wohldefinierten Kategorien scheinen das Auftreten von Typikalitätseffekten, wie sie für vage definierte Kategorien zur Genüge demonstriert werden konnten, nicht auszuschließen. Ein weiteres theoretische Problem ist in der Frage zu sehen, wie Prototypen gebildet werden. Die Mehrzahl der hierfür relevanten Untersuchungen unterstützt ein Merkmalsfre-
daß man jene Merkmale innerhalb einer Kategorie zusammenfaßte, die in einer Untersuchungsstichprobe mit einem vorher festgelegten Prozentsatz an Übereinstimmung aufgetreten waren. Daß Prototypen jedoch von Ziel, Funktion und Perspektive der Kategorisierung abhängig sind, belegen die früher schon gen a n n t e n A r b e i t e n v o n HOFFMAN, MISCHEL & MAZZE (1981) u n d COHEN (1981). D a r ü b e r h i n -
aus sind «idiosynkratische» Prototypen denkbar, die nicht weniger wirksam und handlungsleitend sein können als «konsensuelle» Prototypen. Hinsichtlich des Konzepts der Basiskategorien ergibt sich das Problem der Kultur- und Individualspezifität. Während die Prinzipien, nach denen sich eine bestimmte hierarchische Ebene als Basisebene herausbildet, als universell wirksam betrachtet werden können, variiert diese Ebene in einem gegebenen Objektbereich in Abhängigkeit von der kulturellen Bedeutung dieses Bereiches sowie dem Kenntnisstand und der Interessenlage der Individuen (ROSCH e t a l . , 1976; DOUGHERTY, 1978).
u n d r e l a t i o n a l e M e r k m a l e (GLASS, HOLYOAK &
Trotz der vielschichtigen theoretischen und empirischen Probleme des Prototypenansatzes gibt es noch viele Bereiche, auf die er mit Gewinn angewendet werden kann, so z. B. in der psychiatrischen Klassifikation. Wie CANTOR et al. (1980) gezeigt haben, weisen psychiatrische Kategorien wie «Schizophrenie» oder «affektive Störung» die gleichen prinzipiellen Eigenschaften wie natürliche Objektkategorien auf. Traditionelle Klassifikationssysteme, die auf der klassischen Sichtweise basieren und Kategoriezugehörigkeit mittels einer kritischen Merkmalsmenge zu definieren versuchen, können der klinisch-diagnostischen Praxis nicht gerecht werden. Prototypisch strukturierte Diagnosesysteme, die die natürliche Unscharfe der verwendeten Kategorien betonen und nicht verschleiern, scheinen viel eher geeignet, dem Diagnostiker die notwendigen Orientierungsund Entscheidungshilfen zu geben.
SANTA, 1979, p.329) nicht n u r zur Konstruktion, sondern auch zur Analyse von Prototypen herangezogen werden. Der Prototyp als idealer Repräsentant einer Kategorie wurde bislang überwiegend als «konsensueller» Prototyp untersucht. So wurden Prototypen in der Regel dadurch gewonnen,
Neue Perspektiven der Prototypenforschung eröffnen sich auch aufgrund des wachsenden Interesses von Sozialpsychologen an der kognitiven Repräsentation von Interaktionen (FORGAS, 1982). Kognitiv repräsentierte Alltagsinteraktionen - als Skripts, Handlungspläne, Ereignisschemata oder soziale Episoden bezeich-
quenzmodell
(vgl. z . B . GOLDMAN &
HOMA,
1 9 7 7 ; H A Y E S - R O T H , 1 9 7 7 ; CHUMBLEY, SALA & BOURNE,
1978;
KELLOGG,
BOURNE
&
EK-
STRAND, 1978). In d i e s e m M o d e l l w e r d e n P r o -
totypen durch die am häufigsten auftretenden Merkmale bzw. Merkmalsausprägungen definiert. Dabei ist allerdings umstritten, ob die Auftretenshäufigkeit eines Merkmals nur bezüglich der fraglichen Kategorie oder auch bezüglich anderer benachbarter Kategorien zu b e s t i m m e n ist (KELLOGG, 1980).
Die Verwendung von deskriptiven, meist wahrnehmungsgebundenen Merkmalen bei der Objektkategorisierung und die Verwendung dispositioneller Merkmale zur Personkategorisierung sollte nicht den Blick für andere Merkmalsklassen verstellen. So können funktionale
15
Zeitschrift fur Sozialpsychologie 1984, 1 5 , 2 - 1 7
n e t - s c h e i n e n im Sozialisationsprozeß der A k teure an Prototypikalität z u z u n e h m e n . D e r «Motor» dieser individuell ansteigenden und interindividuell konvergierenden Prototypikalität sind die Vergleichsprozesse der personintern repräsentierten Interaktionen mit den Alltagsinteraktionen.
nusson, D. (Ed.): Toward a psychology of situations: An interactional perspective. Hillsdale, N.J.: Erlbaum, 229-244. CANTOR, N . & MISCHEL, W. 1977. T r a i t s a s p r o t o t y p e s :
Effects on recognition memory. Journal of Personality and Social Psychology, 35,38—48. CANTOR, N. & MISCHEL, W. 1979a. Prototypes in person perception. In: Berkowitz, L. (Ed.): Advances in experimental social psychology (Vol. 12). New York: Academic Press, 3 — 52. CANTOR, N . & MISCHEL, W. 1979b. P r o t o t y p i c a l i t y a n d
Literatur ARGYLE, M . , FURNHAM, A . & GRAHAM, J . A . 1981. Social
situations. Cambridge: Cambridge University Press. ASHCRAFT, M. H. 1978a. Property dominance and typicality effects in property statement verification. Journal of Verbal Learning and Verbal Behavior, 17, 155— 164. ASHCRAFT, M.H. 1978b. Property norms for typical and atypical items from 17 categories: A description and discussion. Memory and Cognition, 6,227 - 232. ATTNEAVE, F. 1957. Transfer of experience with a classschema to identification-learning of patterns and shapes. Journal of Experimental Psychology, 54,81 - 8 8 . BATTIG, W. F. & MONTAGUE, W . E . 1969. C a t e g o r y n o r m s
for verbal items in 56 categories: A replication and extension of the Connecticut category norms. Journal of Experimental Psychology Monograph, 80, 1 - 4 6 . BEACH, L. R. 1964. Cue probabilism and inference behavior. Psychological Monographs, 78 (Whole No. 582). BERLIN, B. & KAY, P. 1969. Basic color terms: Their universality and evolution. Berkeley: University of California Press. BOURNE, L. E., Jr. 1966. H u m a n conceptual behavior. Boston: Allyn & Bacon. BOURNE, L.E., Jr. 1982. Typicality effects in logically defined categories. Memory and Cognition, 10,3 - 9. BOURNE, L . E . , Jr. & RESTLE, F. 1959. A m a t h e m a t i c a l t h e o -
ry of concept identification. Psychological Review, 66, 278-296. BREWER, M . , D U L L , V. & L u i , L. 1 9 8 1 . P e r c e p t i o n s o f t h e
elderly: Stereotypes as prototypes. Journal of Personality and Social Psychology, 41,656 — 670. BRUNER, J . S . , GOODNOW, J. & AUSTIN, G . 1956. A s t u d y o f
thinking. New York: Wiley. BUXBAUM, O. 1981. Prozesse der Eindrucksbildung in der Personwahrnehmung als Ähnlichkeitsvergleiche an Prototypen. Zeitschrift fur experimentelle und angewandte Psychologie, 28,205 - 224. BUXBAUM, O. 1982. Abstraktionsvorgänge in der Personwahrnehmung. Zeitschrift für experimentelle und angewandte Psychologie, 29, 397 - 416. CANTOR, N. 1978. Prototypicality and personality judgements. Unpublished doctoral dissertation, Stanford University. CANTOR, N. 1981a. A cognitive-social approach to personality. In: Cantor, N. & Kihlstrom, J.F. (Eds.): Personality, cognition, and social interaction. Hillsdale, N.J.: Erlbaum,23-44. CANTOR, N. 1981b. Perceptions of situations: Situation prototypes and person-situation prototypes. In: Mag-
personality: Effects on free recall and personality impressions. Journal of Research in Personality, 13, 187 — 205. CANTOR, N „
MISCHEL, W . &
SCHWARTZ, J . C .
1982a.
A
prototype analysis of psychological situations. Cognitive Psychology, 14,45 - 77. CANTOR, N . , MISCHEL, W . & SCHWARTZ, J. 1 9 8 2 b .
Social
knowledge: Structure, content, use, and abuse. In: Hastorf, A. H. & Isen, A. M. (Eds.): Cognitive social psychology. New York: Elsevier, 33 — 72. CANTOR, N . , SMITH, E . E . , FRENCH, R . D . & MEZZICH, J.
1980. Psychiatric diagnosis as prototype categorization. Journal of Abnormal Psychology, 89, 181 - 193. C H U M B L E Y , J . I., S A L A , L . S . & B O U R N E , L . J . , J r . 1 9 7 8 . B a s e s
of acceptability ratings in quasinaturalistic concept tasks. Memory and Cognition, 6 , 2 1 7 - 226. CLARK, H . H . , & CLARK, E . V .
1977. Psychology a n d
lan-
guage. New York: Harcourt Brace Jovanovich. COHEN, C. E. 1981. Person categories and social perception: Testing some boundaries of the processing effects of prior knowledge. Journal of Personality and Social Psychology, 40,441 - 4 5 2 . COHEN, C. E. 1983. Inferring the characteristics of other people: Categories and attribute accessibility. Journal of Personality and Social Psychology, 44, 34 — 44. CRAIK, F. I . M . & LOCKHART, R . S . 1972. L e v e l s o f p r o c e s s -
ing: A framework for memory research. Journal of Verbal Learning and Verbal Behavior, 1 1 , 6 7 1 - 684. DAEHLER,
M.W.,
LONARDO,
R.
&
BUKATKO,
D.
1979.
Matching and equivalence judgments in very young children. Child Development, 50, 1 7 0 - 179. DANKS, J . H . & GLUCKSBERG, S. 1980. E x p e r i m e n t a l
cholinguistics. 391 - 4 1 7 .
Annual
Review of Psychology,
psy-
31,
DOUGHERTY, J . W . D . 1978. S a l i e n c e a n d r e l a t i v i t y in clas-
sification. American Ethnologist, 5,66 — 80. FODOR, J. 1972. Some reflections on L.S. Vygotsky's «Thought and Language». Cognition, 1,83 — 95. FORGAS, J. P. 1980. Person prototypes in impression formation. Sidney: University of New South Wales. FORGAS, J. P. 1982. Episode cognition: Internal representations of interaction routines. In: L. Berkowitz (Ed.): Advances in experimental social psychology (Vol. 15). New York: Academic Press, 59 — 101. FRANKS, J . J .
&
BRANSFORD,
J.D.
1971.
Abstraction
of
visual patterns. Journal of Experimental Psychology, 90,65-74. FREDERIKSEN, N. 1972. Toward a taxonomy of situations. American Psychologist, 27, 114— 123. GLASS, A . L . & MEANY, P . J . 1978. E v i d e n c e f o r t w o k i n d s
of low-typical instances in a categorization task. Memory & Cognition, 6,622 - 628.
16
Eckes & Six: Prototypenforschung: Ein integrativer Ansatz zur Analyse der alltagssprachlichen Kategorisierung
G L A S S , A . L . , H O L Y O A K , K . J . & SANTA, J . L . 1 9 7 9 . C o g n i -
tion. Reading, Mass.: Addison-Wesley. GOLDMAN, D . & HOMA, D . 1977. I n t e g r a t i v e a n d m e t r i c
properties of abstracted information as a function of category discriminability, instance variability, and experience. Journal of Experimental Psychology: Human Learning and Memory, 3, 375 - 385. HAMPTON, J. A. 1979. Polymorphous concepts in semantic memory. Journal of Verbal Learning and Verbal Behavior, 1 8 , 4 4 1 - 4 6 1 .
HASTIE, R. 1981. Schematic principles in h u m a n memory. In: Higgins, E.T., Herman, C.P. & Zanna, M.P. (Eds.): Social cognition: The Ontario Symposium (Vol. 1). Hillsdale, N. J.: Erlbaum, 3 9 - 8 8 . HAYES-ROTH, B. & HAYES-ROTH, F. 1977. C o n c e p t l e a r n -
ing and the recognition and classification of exemplars. Journal of Verbal Learning and Verbal Behavior, 16, 321-338. HEIDER, E. R. 1971. «Focal» color areas and the development of color names. Developmental Psychology, 4, 447-455. HEIDER, E. R. 1972. Universals in color naming and memory. Journal of Experimental Psychology, 93, 1 0 - 2 0 . HEIDER, E . R . & OLIVER, D . C .
1972. T h e s t r u c t u r e of the
color space in naming and m e m o r y for two languages. Cognitive Psychology, 3, 337 - 354. HOFFMAN, C , MISCHEL, W . & MAZZE, K . 1981. T h e r o l e o f
purpose in the organization of information about behavior: Trait based versus goal-based categories in person cognition. Journal of Personality and Social Psychology, 4 1 , 2 1 1 - 2 2 5 . HOMA, D. 1978. Abstraction of ill-defined form. Journal of Experimental Psychology. H u m a n Learning and Memory, 4 , 4 0 7 - 4 1 6 .
HOMA, D . & VOSBURGH, R . 1976. C a t e g o r y b r e a d t h a n d t h e
abstraction of prototypical information. Journal of Experimental Psychology: H u m a n Learning and Memory, 2,322-330. H O M A , D . , RHOADS, D . & CHAMBLISS, D . 1 9 7 9 .
Evolution
of conceptual structure. Journal of Experimental Psychology: H u m a n Learning and Memory, 5, 11 —23. K A H N E M A N , D . & TVERSKY, A . 1 9 7 3 . O n t h e p s y c h o l o g y o f
prediction. Psychological Review, 80,237 — 251. KELLER, D . & KELLAS, G . 1978. T y p i c a l i t y a s a d i m e n s i o n
of encoding. Journal of Experimental Psychology: Human Learning and Memory, 4 , 7 8 — 85. KELLOGG, R.T. 1980. Simple feature frequency versus feature validity models of formation of prototypes. Perceptual and Motor Skills, 51,295 - 306. KELLOGG, R . T . , BOURNE, L . J . Jr. & EKSTRAND, B . R .
1978.
Feature frequency and the acquisition of natural concepts. American Journal of Psychology, 91,211 - 2 2 2 . K I N G , G . A . & SORRENTINO, R . M . 1 9 8 3 . P s y c h o l o g i c a l d i -
mensions of goal-oriented interpersonal situations. Journal of Personality and Social Psychology, 44, 140-162.
KRUMHANSL, C. L. 1978. Concerning the applicability of geometric models to similarity data: The interrelationship between similarity and spatial density. Psychological Review, 8 5 , 4 4 5 - 4 6 3 . KUIPER, N . A . & DERRY, P. A . 1981. T h e self a s a c o g n i t i v e
prototype: An application to person perception and de-
pression. In: Cantor, N. & Kihlstrom, J.F. (Eds.): Personality, cognition, and social interaction. Hillsdale, N. J.: Erlbaum, 2 1 5 - 2 3 2 . LABOV, W. 1973. The boundaries of words and their meanings. In: Bailey, C . J . N . & Shuy, R.W. (Eds.): New ways of analyzing variation in English. Washington, D.C.: Georgetown University Press, 340 — 373. LAKOFF, G. 1973. Hedges: A study in meaning criteria and the logic of fuzzy concepts. Journal of Philosophical Logic, 2 , 4 5 8 - 5 0 8 . MCCLOSKEY, M. 1980. T h e stimulus familiarity problem in semantic memory research. Journal of Verbal Learning and Verbal Behavior, 19,485 - 502. MCCLOSKEY, M . E . & GLUCKSBERG, S. 1978. N a t u r a l c a t e -
gories: Well defined or fuzzy sets? Memory and Cognition, 6 , 4 6 2 - 4 7 2 . MAGNUSSON, D. (Ed.) 1981. Toward a psychology of situations: An interactional perspective. Hillsdale, N. J.: Erlbaum. MALT, B . C . & SMITH, E . E . 1982. T h e r o l e o f f a m i l i a r i t y in
determining typicality. Memory and Cognition, 10, 69-75. MARKUS, H. 1977. Self-schemata and processing information about the self. Journal of Personality and Social Psychology, 3 5 , 6 3 - 7 8 . MERVIS, C . B . & PANI, J . R . 1980. A c q u i s i t i o n o f b a s i c o b -
ject categories. Cognitive Psychology, 12,496 - 522. MERVIS, C . B . & ROSCH, E. 1981. C a t e g o r i z a t i o n o f n a t u r a l
objects. Annual Review of Psychology, 32,89 - 115. MERVIS, C . B . , CATLIN, J. & ROSCH, E. 1 9 7 5 .
Development
of the structure of color categories. Developmental Psychology, 1 1 , 5 4 - 6 0 . MERVIS, C . B . , CATLIN, J . & ROSCH, E . 1 9 7 6 . R e l a t i o n s h i p s
among goodness-of-example, category norms, and word frequency. Bulletin of the Psychonomic Society, 7, 283-284. MILLER, G . A .
& JOHNSON-LAIRD,
P.N.
1976.
Language
and perception. Cambridge, Mass.: Harvard University Press. MISCHEL, W. 1979. On the interface of cognition and personality: Beyond the person-situation debate. American Psychologist, 34,740 - 754. MISCHEL, W. 1981. Personality and cognition: Something borrowed, something new? In: Cantor, N. & Kihlstrom, J.F. (Eds.): Personality, cognition, and social interaction. Hillsdale, N. J.: Erlbaum, 3 - 1 9 . NEISSER, U. 1967. Cognitive psychology. New York: Meredith. NEUMANN, P.G. 1974. An attribute frequency model for the abstraction of prototypes. Memory and Cognition, 2,241-248.
NEUMANN, P.G. 1977. Visual prototype formation with discontinous representation of dimensions of variability. Memory and Cognition, 5 , 1 8 7 - 197. ORTONY, A. 1979. Beyond literal similarity. Psychological Review, 8 6 , 1 6 1 - 1 8 0 . OSHERSON, D . N . , SMITH, E . E .
1981. O n t h e a d e q u a c y
of
prototype theory as a theory of concepts. Cognition, 9, 35-58.
17
Zeitschrift für Sozialpsychologie 1984, 1 5 , 2 - 1 7 PALMER, S. E. 1978. Fundamental aspects of cognitive representation. In: Rosch, E. & Lloyd, B.B. (Eds.): Cognition and categorization. Hillsdale, N.J.: Erlbaum, 2 5 9 303.
An identity-analytic approach to the explanation of social conduct. In: Berkowitz, L. (Ed.): Advances in experimental social psychology (Vol. 15). New York: Academic Press, 194 — 247.
POSNER, M . I . & KEELE, S . W . 1 9 6 8 . O n t h e g e n e s i s o f a b -
SEMIN, G . R . & ROSCH, E. 1981. A c t i v a t i o n o f b i p o l a r p r o -
stract ideas. Journal of Experimental Psychology, 77,
totypes in attribute inferences. Journal of Experimental Social Psychology, 1 7 , 4 7 2 - 4 8 4 . SMITH, E.E. 1978. Theories of semantic memory. In: Estes, W. K. (Ed.): Handbook of learning and cognitive processes (Vol. 6). Hillsdale, N.J.: Erlbaum, 1 —56. SNYDER, M. 1979. Self-monitoring processes. In: Berkowitz, L. (Ed.): Advances in experimental social psychology (Vol. 12). New York: Academic Press, 8 5 - 128. SNYDER, M. & CANTOR, N. 1980. Thinking about ourselves and others: Self-monitoring and social knowledge. Journal of Personality and Social Psychology, 3 9 , 2 2 2 - 2 3 4 . SNYDER, M. & GANGSTAD, S. 1982. Choosing social situations: Two investigations of self-monitoring processes. Journal of Personality and Social Psychology, 4 3 , 1 2 3 — 135.
353-363. POSNER, M . I . & KEELE, S . W . 1 9 7 0 . R e t e n t i o n o f a b s t r a c t
ideas. Journal of Experimental Psychology, 8 3 , 3 0 4 308.
REED, S. K. 1972. Pattern recognition and categorization. Cognitive Psychology, 3, 3 8 2 - 4 0 7 . RIPS, L.J. 1975. Inductive judgements about natural categories. Journal of Verbal Learning and Verbal Behavior, 14,665-681. R I P S , L . J . , SHOBEN, E . J . & S M I T H , E . E .
1973.
Semantic
distance and the verification of semantic relations. Journal ofVerbal Learningand Verbal Behavior, 12, 1 - 2 0 . ROSCH, E. 1973a. Natural categories. Cognitive Psychology, 4, 3 2 8 - 3 5 0 . ROSCH, E. 1973b. On the internal structure of perceptual and semantic categories. In: Moore, T.E. (Ed.): Cognitive development and the acquisition of language. New York: Academic Press, 111 - 144. ROSCH, E. 1974. Linguistic relativity. In: Silverstein, A. (Ed.): Human communication: Theoretical explorations. Hillsdale, N.J.: Erlbaum, 9 5 - 121. ROSCH, E. 1975a. Cognitive reference points. Cognitive Psychology, 7, 5 3 2 - 5 4 7 . ROSCH, E. 1975b. Cognitive representations of semantic categories. Journal of Experimental Psychology: General, 104, 1 9 2 - 2 3 3 . ROSCH, E. 1975c. The nature of mental codes for color categories. Journal of Experimental Psychology: Hum a n Perception and Performance, 1,303 - 322. ROSCH, E. 1977. H u m a n categorization. In: Warren, N. (Ed.): Studies in cross-cultural psychology (Vol. 1). London: Academic Press, 1 —49. ROSCH, E. 1978. Principles of categorization. In: Rosch, E. & Lloyd, B.B. (Eds.): Cognition and categorization. Hillsdale, N.J.: Erlbaum, 2 7 - 4 8 . ROSCH, E. & MERVIS, C . B . 1975. F a m i l y
resemblances:
Studies in the internal structure of categories. Cognitive P s y c h o l o g y , 7, 5 7 3 - 6 0 5 . R O S C H , E „ SIMPSON, C . & M I L L E R , R . S .
1976.
Structural
bases of typicality effects. Journal of Experimental Psychology: H u m a n Perception and Performance, 2,491 — 502. ROSCH, E., MERVIS, C . B . , GRAY, W . D . , JOHNSON, D . M .
&
BOYES-BRAEM, P. 1976. Basic objects in natural categories. Cognitive Psychology, 8, 3 8 2 - 4 3 9 .
SOLSO, R . L . & R A Y N I S , S . A .
1979. P r o t o t y p e
formation
from imaged, kinesthetically, and visually presented geometric figures. Journal of Experimental Psychology: H u m a n Perception and Performance, 5,701 —712. TAYLOR, S.E. 1981. A categorization approach to stereotyping. In: Hamilton, D.L. (Ed.): Cognitive processes in stereotyping and intergroup behavior. Hillsdale, N.J.: Erlbaum, 8 3 - 1 1 4 . TAYLOR, S . E . & CROCKER, J. 1981. S c h e m a t i c b a s e s of s o -
cial information processing. In: Higgins, E.T., Herman, C.P. & Zanna, M.P. (Eds.): Social cognition: The O n tario symposium (Vol. 1). Hillsdale, N.J.: Erlbaum, 89-134. TSUJIMOTO, R.N. 1978. Memory bias toward normative and novel trait prototypes. Journal of Personality and Social Psychology, 36, 1391 - 1401. TVERSKY, A. 1977. Features of similarity. Psychological Review, 8 4 , 3 2 7 - 3 5 2 . TVERSKY, A . & GATI, I. 1978. S t u d i e s of s i m i l a r i t y . I n :
Rosch, E. & Lloyd, B.B. (Eds.): Cognition and categorization. Hillsdale, N.J.: Erlbaum, 7 9 - 9 8 . WAGNER, W. 1980. «Fuzzy Sets» als formales Modell kognitiver Strukturen. Archiv für Psychologie, 133, 85 — 115. WAKENHUT, R. 1978. Über die Einbeziehung von Situationen in psychologische Messungen. Frankfurt: Lang. WIGGINS, J.S. 1980. Circumplex models of interpersonal behavior. In: Wheeler, L. (Ed.): Review of personality and social psychology. Beverly Hills: Sage, 265 — 294. WITTGENSTEIN, L. 1953. Philosophical investigations. New York: Macmillan.
1980.
YARMEY, A . D . & J O H N S O N , J . 1 9 8 2 . E v i d e n c e f o r
Reference points in spatial cognition. Journal of Experimental Psychology: H u m a n Learning and Memory, 6,
the self as an imaginal prototype. Journal of Research in Personality, 16,238—246. ZADEH, L.A. 1965. Fuzzy sets. Information and Control, 8 , 3 3 8 - 3 5 3 .
SADALLA, E . K . , BURROUGHS, W . J . & STAPLIN, L . J .
516-528.
SCHLENKER, B.R. 1982. Translating actions into attitudes:
^ ^ ^ ^ ^ H |
J
18
Erdfelder: Zur Bedeutung und Kontrolle des ß-Fehlers
Zur Bedeutung und Kontrolle des ß-Fehlers bei der inferenzstatistischen Prüfung log-linearer Modelle 1 EDGAR ERDFELDER2 Universität Trier
Bei der Analyse qualitativer Daten mittels log-linearer oder logit-linearer Modelle wird sehr häufig nicht beachtet, daß die Annahme einer Modellgeltungshypothese inferenzstatistisch nicht zu rechtfertigen ist, wenn lediglich der sog. a-Fehler kontrolliert wird. In der Arbeit wird gezeigt, unter welchen Prämissen und auf welche Weise die unbedingt notwendige Kontrolle des sog. ß-Fehlers bei x 2 -Modellgeltungstests erfolgen kann. Schließlich wird auf das Problem der Kumulierung von a und ß bei multiplen Tests im Rahmen hierarchischer log-linearer Modelle eingegangen, und es werden Strategien zur Adjustierung der Fehlerwahrscheinlichkeiten empfohlen.
When analysing qualitative data by means of log-linear or logit-linear models, it is very often overlooked that the acceptance of a given model cannot be justified statistically if only the so-called a error is controlled. In this paper it is shown how the necessary control of the so-called p error can be accomplished in the case of %2 goodness of fit tests. Finally the problem of cumulating error probabilities in multiple tests of hierarchical log-linear models is discussed, and strategies for adjusting for probabilities of error are recommended.
1. Einführung
gend kommt hinzu, daß die erforderlichen Rechenarbeiten inzwischen mit Hilfe von benutzerfreundlichen und fast überall verfügbaren Computerprogrammen durchgeführt werden können
Die statistische Analyse mehrdimensionaler Kontingenztabellen auf der Grundlage des generellen log-linearen Modells nach GOODMAN ( Z . B . 1970) stellt eine historisch relativ «junge» Verfahrensgruppe dar, die nach dem Wissen des Verfassers erst durch SHAFFER (1973) in die psychologische Fachliteratur eingeführt wurde (vgl. MILLIGAN, 1980). Mit nur geringer zeitlicher Verzögerung haben sich im deutschsprachigen Raum ARMINGER (1976, 1979), K Ü C H L E R (1976, 1978, 1979) und vor allem LANGEHEINE (1979, 1980a, 1980b, 1982a, 1982b, 1983) um die Verbreitung des Ansatzes verdient gemacht. Es scheint, als ob insbesondere die formale Ähnlichkeit zur mehrfaktoriellen Varianzanalyse (i.e. beobachtete Daten werden durch Hauptund Wechselwirkungseffekte «erklärt») log-lineare und logit-lineare Modelle auch für Anwender zunehmend attraktiv werden läßt. Begünsti-
' Überarbeitete Fassung eines Vortrages, der auf der 25. Tagung experimentell arbeitender Psychologen in Hamburg gehalten wurde (27. - 31. 3. 1983). 2 Der Verfasser dankt Herrn Dr. R. Langeheine, der diese Arbeit angeregt und kritisch kommentiert hat.
(z.B. DIXON, 1981).
Wie immer, wenn eine statistische Verfahrensgruppe populär zu werden verspricht, ist jedoch Vorsicht geboten. Die formale Ähnlichkeit zur Varianzanalyse darf nicht als komplette Analogie fehlgedeutet werden. STEYER (1983) hat beispielsweise gezeigt, daß die experimentelle Kontrolltechnik der Randomisierung im generellen regressiv-linearen Modell der Varianzanalyse eine ganz andere Bedeutung hat als im generellen logit-linearen Modell. Die vorliegende Arbeit behandelt ein weiteres Problem log-linearer und logit-linearer Datenanalysen, das bei der Prüfung von statistischen Hypothesen über bestimmte Modelle relevant wird. Wenn es sich hierbei auch um eine Problem handelt, das bei statistischen Hypothesentests generell bedacht werden muß, so stellt es sich jedoch für Modellgeltungstests im Rahmen log-linearer und logit-linearer Modelle in besonderer Weise. Bevor hierauf näher eingegangen wird, soll kurz der Grundgedanke von GOODMANS generellem log-linearen Modell rekapituliert wer-
18
Erdfelder: Zur Bedeutung und Kontrolle des ß-Fehlers
Zur Bedeutung und Kontrolle des ß-Fehlers bei der inferenzstatistischen Prüfung log-linearer Modelle 1 EDGAR ERDFELDER2 Universität Trier
Bei der Analyse qualitativer Daten mittels log-linearer oder logit-linearer Modelle wird sehr häufig nicht beachtet, daß die Annahme einer Modellgeltungshypothese inferenzstatistisch nicht zu rechtfertigen ist, wenn lediglich der sog. a-Fehler kontrolliert wird. In der Arbeit wird gezeigt, unter welchen Prämissen und auf welche Weise die unbedingt notwendige Kontrolle des sog. ß-Fehlers bei x 2 -Modellgeltungstests erfolgen kann. Schließlich wird auf das Problem der Kumulierung von a und ß bei multiplen Tests im Rahmen hierarchischer log-linearer Modelle eingegangen, und es werden Strategien zur Adjustierung der Fehlerwahrscheinlichkeiten empfohlen.
When analysing qualitative data by means of log-linear or logit-linear models, it is very often overlooked that the acceptance of a given model cannot be justified statistically if only the so-called a error is controlled. In this paper it is shown how the necessary control of the so-called p error can be accomplished in the case of %2 goodness of fit tests. Finally the problem of cumulating error probabilities in multiple tests of hierarchical log-linear models is discussed, and strategies for adjusting for probabilities of error are recommended.
1. Einführung
gend kommt hinzu, daß die erforderlichen Rechenarbeiten inzwischen mit Hilfe von benutzerfreundlichen und fast überall verfügbaren Computerprogrammen durchgeführt werden können
Die statistische Analyse mehrdimensionaler Kontingenztabellen auf der Grundlage des generellen log-linearen Modells nach GOODMAN ( Z . B . 1970) stellt eine historisch relativ «junge» Verfahrensgruppe dar, die nach dem Wissen des Verfassers erst durch SHAFFER (1973) in die psychologische Fachliteratur eingeführt wurde (vgl. MILLIGAN, 1980). Mit nur geringer zeitlicher Verzögerung haben sich im deutschsprachigen Raum ARMINGER (1976, 1979), K Ü C H L E R (1976, 1978, 1979) und vor allem LANGEHEINE (1979, 1980a, 1980b, 1982a, 1982b, 1983) um die Verbreitung des Ansatzes verdient gemacht. Es scheint, als ob insbesondere die formale Ähnlichkeit zur mehrfaktoriellen Varianzanalyse (i.e. beobachtete Daten werden durch Hauptund Wechselwirkungseffekte «erklärt») log-lineare und logit-lineare Modelle auch für Anwender zunehmend attraktiv werden läßt. Begünsti-
' Überarbeitete Fassung eines Vortrages, der auf der 25. Tagung experimentell arbeitender Psychologen in Hamburg gehalten wurde (27. - 31. 3. 1983). 2 Der Verfasser dankt Herrn Dr. R. Langeheine, der diese Arbeit angeregt und kritisch kommentiert hat.
(z.B. DIXON, 1981).
Wie immer, wenn eine statistische Verfahrensgruppe populär zu werden verspricht, ist jedoch Vorsicht geboten. Die formale Ähnlichkeit zur Varianzanalyse darf nicht als komplette Analogie fehlgedeutet werden. STEYER (1983) hat beispielsweise gezeigt, daß die experimentelle Kontrolltechnik der Randomisierung im generellen regressiv-linearen Modell der Varianzanalyse eine ganz andere Bedeutung hat als im generellen logit-linearen Modell. Die vorliegende Arbeit behandelt ein weiteres Problem log-linearer und logit-linearer Datenanalysen, das bei der Prüfung von statistischen Hypothesen über bestimmte Modelle relevant wird. Wenn es sich hierbei auch um eine Problem handelt, das bei statistischen Hypothesentests generell bedacht werden muß, so stellt es sich jedoch für Modellgeltungstests im Rahmen log-linearer und logit-linearer Modelle in besonderer Weise. Bevor hierauf näher eingegangen wird, soll kurz der Grundgedanke von GOODMANS generellem log-linearen Modell rekapituliert wer-
19
Zeitschrift für Sozialpsychologie 1984, 15, 1 8 - 3 2
den. Eine vertiefende und erweiternde Behandlung findet der Leser in den bereits erwähnten Einführungslehrbüchern und Artikeln.
lineare Modell nun direkt für die py oder für die aufgrund der py und N zu erwartenden Zellhäufigkeiten ey formulieren: e
2. Log-lineare und logit-lineare Modelle für qualitative Daten Gegeben sei eine p-dimensionale Kontingenztabelle, die durch p qualitative Variablen mit prinzipiell beliebig vielen Kategorien aufgespannt wird. Reparametrisieren wir nun die den einzelnen Zellen zugeordneten Wahrscheinlichkeiten derart, daß sie als multiplikative Verknüpfung von latenten Parametern dargestellt werden können, so haben wir ein log-lineares Modell formuliert. Dies wird deutlich, wenn die Modellgleichung logarithmiert wird: die Logarithmen der Zellwahrscheinlichkeiten werden dann als Summe (und damit als lineare Funktion) von latenten Parametern ausgedrückt. Üblicherweise - aber nicht notwendigerweise - indizieren die latenten Parameter die Größe von Haupt- und Wechselwirkungseffekten der p Variablen. Ähnlich wie bei der Varianzanalyse besteht die Möglichkeit, durch Wahl geeigneter Designmatrizen die Parameter mit anderen Effekten (z.B. einfachen Haupteffekten) zu identifizieren. Da dieses Vorgehen jedoch nicht dem Standardanwendungsfall entsprechen dürfte, soll hierauf nicht näher eingegangen werden. Ebenfalls ausklammern wollen wir das mathematisch recht komplexe Kapitel der Schätzung von latenten Parametern aus den Stichprobendaten, die in der Regel über eine maximum likelihood Prozedur (ausgehend von multinomialverteilten Zellhäufigkeiten) vorgenommen wird (vgl. dazu BISHOP, FIENBERG & HOLLAND, 1 9 7 5 ) . Zur Konkretisierung des Gesagten betrachten wir den einfachsten Fall eines log-linearen Modells für zwei dichotome Variablen. Wir bezeichnen die Kategorien der ersten Variablen A mit Aj (i = 1, 2), die der zweiten Variablen B mit BJ (j = 1, 2), den Umfang der aus der Population nach einem Zufallsprinzip gezogenen Stichprobe mit N und die Wahrscheinlichkeit, daß ein Element der Population die Merkmale Aj und Bj zeigt, mit pjj. Stellen wir das Analysedesign als 2x2-Kontingenztafel dar, so steht Py somit für die der Zelle (i, j) zugeordnete Wahrscheinlichkeit. Es ist prinzipiell gleichgültig, ob wir das log-
ij = Pij*N.
(1)
Da die ey einen direkten Vergleich mit den empirisch beobachteten Zellhäufigkeiten ny erlauben, empfiehlt sich allerdings letzteres Vorgehen. Wir können uns nun aufgrund theoretischer Vorüberlegungen entschließen, ein log-lineares Modell mit einem, zwei, drei oder vier latenten Parametern zu formulieren. Die Obergrenze x für die Anzahl latenter Parameter ist notwendig mit der Anzahl der Zellen der zu analysierenden Kontingenztabelle identisch, da sich x Zellhäufigkeiten immer perfekt aus x latenten Parametern «erklären» lassen. Dies bedeutet, daß die aufgrund eines solchen sog. saturierten Modells vorhergesagten Zellhäufigkeiten ey zwangsläufig mit den tatsächlichen Zellhäufigkeiten ny übereinstimmen und das Modell damit nicht direkt testbar ist (vgl. KRAUTH, 1 9 8 0 ) . Die Formulierung eines saturierten Modells ist somit nur insofern sinnvoll, als dadurch implizit ausgesagt wird, daß alle sparsameren Modelle mit weniger Parametern so große Abweichungen zwischen den ny und den ey zur Folge haben, daß sie verworfen werden müssen. In der multiplikativen Version sieht das saturierte Modell für unser Beispiel einer 2x2-Kontingenztafel wie folgt aus: A B AB e..ij = Y'Y 1 1 «Y 'Y i j ij -
(2)
Durch Logarithmieren zur Basis e erhalten wir das log-lineare Modell M 2 : A B AB M,: I = lne..ij = X+X i +X j +X IJ , wobei
(3)
A A B AB AB b X = In Y, " X, i = In y' i , Xj = In YJ und X u = In y 'j .
Damit log-lineare Modelle - wie z.B. (3) identifizierbar werden, müssen wir Nebenbedingungen über die Parameter formulieren. Zweckmäßigerweise wählt man wie bei der Varianzanalyse: 2 2 2 2 E
i• = li
XA= 1
Z
j• = li
J
L
•i = il
>-AB= X 1J
•] = i1
XAB=0. 1J
(4)
20
E r d f e l d e r : Z u r Bedeutung und K o n t r o l l e des ß-Fehlers
Von besonderem Interesse im Modell M j ist der Wechselwirkungsparameter Er indiziert den Grad der stochastischen Abhängigkeit zwischen den Variablen A und B. Liegt eine solche «Assoziation» (LANGEHEINE 1980a, p.23) vor, so bedeutet dies, daß die den einzelnen Zellen zugeordneten Wahrscheinlichkeiten p¡j nicht aus den Kategoriewahrscheinlichkeiten p(A¡) bzw. p(Bj) erklärbar sind. Die durch die Parameter und A.® repräsentierten Haupteffekte der Variablen A und B würden in diesem Fall die empirische Datenstruktur nicht angemessen beschreiben. Postulieren wir dagegen stochastische Unabhängigkeit der Variablen A und B ( A A b = 0), so entspricht dies dem log-linearen Haupteffektmodell M 2 : M ,: = lne,. = a.+A. A +X B . 2 ij i j
v(5)
Dieses Modell läßt ungleiche Kategoriewahrscheinlichkeiten p(A¡) bzw. p(Bj) zu, jedoch muß für alle bedingten Wahrscheinlichkeiten p(Bj/A¡) bzw. p(A/Bj) gelten, daß sie gleich den entsprechenden unbedingten Kategoriewahrscheinlichkeiten sind: viJ:p(Bj/Ai)=p(Bj)bzw. V i , j : p ( A i / B j ) = p(A i ).
W
Das Modell M 2 kann weiter verschärft werden durch die Annahme, daß einer der beiden Haupteffekte X A oder XB den Wert Null annimmt. Das i
j
Haupteffektmodell geht dann in das restriktivere Modell M 3 bzw. M 4 über: M 3J: = lne..=A,+X B ij j
v(7) '
M4:=lne..=X+X*
(8)
Wie M 2 fordern M 3 und M 4 stochastische Unabhängigkeit von A und B; M 3 fordert darüberhinaus gleiche Kategoriewahrscheinlichkeiten p(A x ) = p(A 2 ) und M 4 fordert entsprechend p(Bj) = p(B 2 ). Das restriktivste Modell für unser Beispiel ist das Modell M 5 ohne Effekte. M 5 : = lne i j =X.
(9)
Es verlangt stochastische Unabhängigkeit von A und B sowie gleiche Kategoriewahrscheinlichkeiten für A und B; dies impliziert, daß alle Zell-
wahrscheinlichkeiten Pjj gleich sein müssen. Als Beispiel mag man sich ein einfaches Münzwurfexperiment mit zwei «fairen» Münzen vorstellen, die jeweils mit der Wahrscheinlichkeit .50 auf « K o p f » bzw. « Z a h l » fallen. Den log-linearen Modellen M j bis M 5 - so verschieden sie auch ausfallen - ist gemeinsam, daß die beiden dichotomen Variablen A und B auf derselben theoretischen Ebene angesiedelt werden. Hier liegt - wenn man so will - eine gewisse Analogie zum korrelationsanalytischen Vorgehen in der parametrischen Statistik vor. Wie sieht es aber aus, wenn beispielsweise B explizit den theoretischen Status einer abhängigen und A den Status einer unabhängigen Variablen annimmt? Als Beispiel stelle man sich vor, daß A zwei experimentelle Bedingungen und B die (dichotomen) Meßwerte der experimentellen Einheiten unter diesen beiden Bedingungen repräsentiert. Im parametrischen Fall wäre hier ein varianz- bzw. regressionsanalytisches Vorgehen geboten. Das log-lineare Analogon zum regressionsanalytischen Vorgehen wird als Logitanalyse bezeichnet. Dabei legt man eine Reparametrisierung von Quotienten der Zellwahrscheinlichkeiten Pjj bzw. der entsprechenden Erwartungswerte eSj durch multiplikativ verknüpfte latente Parameter zugrunde. Bezogen auf unser Beispiel (B abhängig, A unabhängig) sieht das saturierte logit-lineare Modell L j in der logarithmierten Version wie folgt aus: L i : = ln
+
(10)
Die logarithmierten Quotienten der Erwartungswerte für die i-te Stufe der unabhängigen Variablen, welche man als «logits» bezeichnet, werden somit als Linearkombination latenter Parameter ausgedrückt. Der Parameter ß ist dabei eine Konstante analog dem X in den log-linearen Modellen M i bis M 5 , und der Parameter indiziert den Effekt der i-ten Stufe von A auf die logits. Das saturierte Modell enthält nur zwei Parameter, da lediglich zwei logits (für die erste und für die zweite Stufe von A ) vorliegen. Das Rationale hinter dem logit-linearen Modell L : ist leicht zu durchschauen: wenn die unabhängige Variable A einen « E f f e k t » auf die abhängige Variable B ausübt, dann muß der Quotient e 12 /e n für A j anders ausfallen als der Quotient e22/e2i für A 2 ; eben dies wird durch Li aus-
21
Zeitschrift für Sozialpsychologie 1984, 15, 1 8 - 3 2
gedrückt. Um es negativ zu formulieren: das Modell L,: = In
C!) "
(ii)
welches unterschiedliche logits für die beiden Stufen von A nicht vorsieht, muß falsch sein, wenn A auf B «wirkt». Wir werden im folgenden nicht näher auf logit-lineare Modelle eingehen. Dies bedeutet deshalb keinen gravierenden Verzicht, weil sich logit-lineare Modelle immer als Spezialfälle log-linearer Modelle auffassen lassen. Da gilt: In 0 ^ = l n e i 2 - l n e i l ,
(12)
kann das saturierte logit-lineare Modell für eine dichotome unabhängige und eine dichotome abhängige Variable unter Benutzung des log-linearen Modells M j auch wie folgt geschrieben werden: Li:: = ln 0 ^ = l n e i 2 - l n e i l v
i
2
]2 '
v
(13) i
1
il '
X®^ sowie einen Dreifachwechselwirkungsparameter XA?kc enthalten. Das saturierte logit-lineare Modell würde in diesem Fall (C abhängig, A und B unabhängig) neben ß und den Haupteffektparametern ß A sowie ß® den Wechselwirkungsparameter ßA® enthalten. Da alle Probleme, die mit der inferenzstatistischen Prüfung log-linearer oder logit-linearer Modelle verbunden sind, bereits am Beispiel einer 2x2-Kontingenztafel demonstriert werden können, wollen wir diesen Fall im folgenden in den Mittelpunkt stellen. 3. Modellgeltungstests Soll die statistische Nullhypothese (H 0 ), daß ein bestimmtes nicht-saturiertes log-lineares Modell M oder logit-lineares Modell L in der Population gilt, gegen die entsprechende Alternativhypothese (Hj) der Nicht-Gültigkeit von M bzw. L getestet werden, so kann man eine der beiden folgenden Prüfstatistiken heranziehen:
2
V
r = I z= 1
A B A B = X 2B - X B1 + X i2 - X ¡1
— — Cz
(14)
= 2X®2 + 2 X i2a b . Bei der letzten Umformung haben wir von den Reparametrisierungsbedingungen (4) Gebrauch gemacht. Die Logit-Parameter ß und ß A können somit offensichtlich aus den Parametern des loglinearen Modells M j errechnet werden: ß = 2 ß
A
a = 2 XAB
(14)
Man sieht, daß der Effektparameter im logitlinearen Modell dem Wechselwirkungsparameter im log-linearen Modell entspricht. Die Verallgemeinerung log-linearer und logitlinearer Modelle auf mehr als zwei qualitative Variablen mit möglicherweise mehr als zwei Kategorien schafft keine neuen Probleme (vgl. dazu z. B. LANGEHEINE, 1980a; 1983). Bei drei dichotomen Variablen A, B und C würde das saturierte loglineare Modell neben der Konstanten X drei Haupteffektparameter X® und drei Zweifachwechselwirkungsparameter
und
(15) Um die Darstellung möglichst generell zu halten, wurde in (14) und (15) eine leichte Veränderung der Indizierung vorgenommen: z ist ein Zähler für die insgesamt x Zellen einer beliebigen p-dimensionalen Kontingenztafel; n z steht für die empirische Häufigkeit in Zelle z und e z steht für die erwartete Häufigkeit in Zelle z bei Gültigkeit des zu testenden Modells. Diese erwarteten Häufigkeiten lassen sich ohne großen Aufwand errechnen, wenn die Parameter des Modells aus den Stichprobendaten geschätzt wurden. Es läßt sich zeigen, daß sowohl die Prüfstatistik ( 1 4 ) , welche üblicherweise als « P E A R S O N - X 2 » bezeichnet wird, wie auch die sog. LikelihoodQuotienten-x 2 -Statistik (15) bei Gültigkeit des Modells M bzw. L und nicht zu kleinem Stichprobenumfang N approximativ zentral x 2 -verteilt sind. Die Freiheitsgrade der x 2 -Verteilung ergeben sich aus der Summe der Freiheitsgrade für die
22
Erdfelder: Zur Bedeutung und Kontrolle des ß-Fehlers
Effekte, die im Modell nicht enthalten sind. Bezeichnen wir mit I, J und K die Anzahl der Kategorien dreier Variablen A, B und C, so zählt ein im log-linearen Modell M fortgelassener A-Haupteffekt beispielsweise (1-1) Freiheitsgrade, eine fortgelassene AxB-Wechselwirkung (1-1) • ( J - l ) Freiheitsgrade, eine auf Null fixierte A x Bx C-Dreifachwechselwirkung entsprechend (I-1)'(J-1)>(K-1) Freiheitsgrade usw. 3 . Man sieht, daß einem saturierten Modell kein Freiheitsgrad zugeordnet ist, da kein Effekt auf Null fixiert wird; ein solches Modell ist daher nicht direkt testbar (s.o.). Die bekannten %2- und 2I-Tests für die Vierfeldertafel (vgl. z . B . BLÖSCHL, 1966): 2 2
2
X = L E i= l j = l
(e - n ) 2 e
(16)
ij
2 2 21 = 2 £ I n¡jln i= l j = l
(17) \eij/
stellen Spezialfälle von (14) bzw. (15) dar. In ihrer Standardanwendung testen sie das bereits explizierte Haupteffektmodell M 2 (vgl. (5)) mit einem Freiheitsgrad [df = (2-1) • (2-1) = 1]. Für die praktische Anwendung stellt sich das Problem, welche der beiden Prüfstatistiken %2 oder A 2 der statistischen Entscheidung zugrunde gelegt werden soll. Die Tatsache, daß x 2 und A 2 für wachsendes N asymptotisch äquivalent sind, besagt selbstverständlich nichts über ihr Verhalten im Falle «kleiner» Stichprobenumfänge. Nach den vorliegenden Monte-Carlo-Studien kann kaum mehr bezweifelt werden, daß die %2Approximation für die Likelihood-QuotientenStatistik im Vergleich zur PEARSON-Statistik wesentlich schlechter ausfällt (vgl. z . B . KRAUTH,
4. Fehlerwahrscheinlichkeiten bei der statistischen Entscheidung Soll eine statistische Entscheidung über die Gültigkeit oder Ungültigkeit der zu testenden Nullhypothese herbeigeführt werden, so wird üblicherweise nur eine Fehlerwahrscheinlichkeit nämlich die sog. a-Fehlerwahrscheinlichkeit kontrolliert. Von einem a-Fehler oder «Fehler l . A r t » spricht man bekanntlich dann, wenn fälschlich die Alternativhypothese eines statistischen Tests angenommen wird, obwohl die Nullhypothese zutrifft. Im Falle der vorgestellten % 2 -Prüfstatistiken (14) und (15) erfolgt die Kontrolle von a ganz einfach dadurch, daß man für die entsprechende zentrale x 2 -Verteilung mit df Freiheitsgraden einen sog. «kritischen Wert» *(df-a) definiert, der die oberen (a • 100) Prozent der Verteilung abtrennt. Überschreitet ein empirisch ermittelter 5c2-Wert diesen kritischen Wert, so wird die Nullhypothese, daß das Modell gilt, verworfen und die Alternativhypothese der Ungültigkeit des Modells wird angenommen; andernfalls wird die statistische Nullhypothese «beibehalten». Die «Beibehaltung» einer statistischen Nullhypothese ist nun aber eine äußerst problematische Angelegenheit. Sie darf nicht mit der Annahme einer Nullhypothese gleichgesetzt werden, wenn die Fehlerwahrscheinlichkeit für eine derartige Entscheidung nicht bekannt ist. Man bezeichnet die Wahrscheinlichkeit f ü r die fälschliche Annahme einer statistischen Nullhypothese bei Gültigkeit der Alternativhypothese als ß-Fehlerwahrscheinlichkeit oder auch «Fehlerwahrscheinlichkeit 2.Art». Tabelle 1 veranschaulicht noch einmal beide Arten von Fehlerwahrscheinlichkeiten sowie die dazu komplementären Wahrscheinlichkeiten (1-a) und (1-ß) für richtige Entscheidungen.
1 9 8 0 , p . 2 4 1 ; MILLIGAN, 1 9 8 0 , p . 2 4 2 ) . D a d i e v o n
genannten technischen Argumente für A 2 diesen Nachteil nicht aufwiegen können, wird hier die generelle Verwendung der PEARSON-Prüfstatistik (14) empfohlen. LANGEHEINE ( 1 9 8 0 C )
Tab. 1: Fehlerwahrscheinlichkeiten bei statistischen Entscheidungen. Statistische Entscheidungen für:
J
Testet man ein logit-lineares Modell L, so ist zu bedenken, daß logit-lineare Haupteffekte Wechselwirkungen in log-linearen Modellen entsprechen, logit-lineare n-fach Wechselwirkungen (n-t-l)-fachen log-linearen Wechselwirkungen usw. Die Freiheitsgrade für den Effekt der unabhängigen Variablen sind daher jeweils mit der um 1 verringerten Anzahl von Kategorien der abhängigen Variablen zu multiplizieren!
Es gilt in der Population
H0 H[
H0
HJ
p(H 0 -Annahme/H 0 gilt) = ( 1 - a ) p(H 0 -Annahme/H! gilt) = ß
p(HrAnnahme/H0 gilt) = a p(H 1 -Annahme/H, gilt) = (1-ß)
23
Zeitschrift für Sozialpsychologie 1984, 15, 1 8 - 3 2
Da im Rahmen des traditionellen Signifikanztestens die ß-Fehlerwahrscheinlichkeit unbekannt bleibt, läßt sich folglich die Annahme einer statistischen Nullhypothese inferenzstatistisch nicht rechtfertigen. Für die vorgestellten Modellgeltungstests zieht das die fatale Konsequenz nach sich, daß log-lineare oder logit-lineare Modelle - wie auch immer die empirischen %2-Werte ausfallen - niemals angenommen werden können. Dieser Sachverhalt hat den Proponenten des log-linearen Ansatzes eine Menge Kritik eingebracht. K R A U T H (1980) beispielsweise, der einen Vergleich des log-linearen Ansatzes mit Varianten der Konfigurationsfrequenzanalyse (KFA, HKFA, ISA) vorgenommen hat, kritisiert in erster Linie diese «Schwäche»: «Bei der Methode der log-linearen Modelle versucht man, das zu den Daten am besten passende Modell zu finden, ohne die Wahrscheinlichkeit für einen Fehler 2.Art kontrollieren zu können. Bei der HKFA bzw. ISA versucht man, Modelle als nicht mit den Daten verträglich nachzuweisen bei kontrollierter Wahrscheinlichkeit für einen Fehler l.Art.» ( K R A U T H , 1980, p.240; Hervorhebungen vom Verfasser). Bei Licht besehen muß man allerdings zu der Auffassung gelangen, daß diese Kritik - so berechtigt sie auch in bezug auf die gängige Praxis log-linearer Datenanalysen ist - falsch adressiert wurde. Sie trifft selbstverständlich nicht «die Methode der log-linearen Modelle», sondern sie trifft die inferenzstatistische Strategie, nach der über derartige Modelle entschieden wird. Indirekt trifft sie damit natürlich auch die übliche inferenzstatistische Vorgehensweise im Rahmen von KFA-Techniken, denn diese - daran lassen KRAUTHS (1980) Ausführungen keinen Zweifel entspricht ebenfalls dem traditionellen Signifikanztesten.
Für Wissenschaftler, die sich einem deduktivistischen Falsifikationsprinzip verpflichtet fühlen, ist es generell unakzeptabel, auf die Kontrolle des ß-Fehlers zu verzichten; dies gilt unabhängig davon, ob nun die statistische Nullhypothese oder die statistische Alternativhypothese der interessierenden wissenschaftlichen Hypothese entspricht bzw. durch diese impliziert wird (vgl. BREDENKAMP,
1 9 7 2 , 1 9 8 0 ; HAGER &
WESTER-
1983a; WESTERMANN & H A G E R , 1982). Ist die Nullhypothese durch die wissenschaftliche Hypothese impliziert - wie dies bei log-linearen Modellgeltungstests in der Regel der Fall ist - , so läßt sich jene immerhin bei kontrollierter Fehlerwahrscheinlichkeit a verwerfen, nicht jedoch annehmen. Das kann natürlich zu exzessiv vielen fälschlichen «positiven» Instanzen für die wissenschaftliche Hypothese führen. Wird umgekehrt die Alternativhypothese eines statistischen Tests durch die interessierende wissenschaftliche Hypothese impliziert - wie z.B. bei Typ-Hypothesen im Rahmen der KFA - , so kann jene zwar bei kontrollierter Fehlerwahrscheinlichkeit a angenommen, nicht aber verworfen werden. Dies ist fast noch schlimmer, da damit alle wissenschaftlichen Hypothesen, welche Alternativhypothesen von Signifikanztests implizieren, prinzipiell nicht kritisierbar sindl So oder so: will man Nullhypothesen von Signifikanztests bei kontrollierter Fehlerwahrscheinlichkeit annehmen können, dann führt kein Weg an der Kontrolle des ß-Fehlers vorbei. Aber ist eine solche Kontrolle überhaupt möglich? Die bereits zitierte Aussage von K R A U T H (1980, p.240) suggeriert, daß dies nicht der Fall ist. An anderer Stelle unterstreicht er seine Auffassung: «Mit statistischen Methoden zumindest kann man allenfalls die Ungültigkeit von Modellen (bei kontrollierter Fehlerwahrscheinlichkeit l.Art) nachweisen» ( K R A U T H , 1980, p.240).
MANN,
Tab.2: Wahrscheinlichkeiten pSj für eine 2x2-Kontingenztafel. a) pH nach Modell M 5
b) Tatsächliche p;j in der Population A
1 B
1
2
1
.250000000001
.249999999999
2
.249999999999
.250000000001
2
1
.25
.25
2
.25
.25
B
24 KRAUTH hat mit seinen Äußerungen dann und nur dann Recht, wenn man ein Modell - und damit die Nullhypothese eines statistischen Tests - als Punkthypothese sozusagen «wörtlich nimmt». Das in Abschnitt 2 formulierte log-lineare Modell M 5 für eine 2x2-Kontingenztafel postuliert beispielsweise Wahrscheinlichkeiten py, wie sie in Tabelle 2a dargestellt sind. Nehmen wir nun an, daß die tatsächlichen py in der Population wie in Tabelle 2b veranschaulicht ausfallen. Dann ist das Modell M 5 - streng genommen - falsch. Dennoch wird wohl niemand auf die Idee kommen, eine statistische Entscheidung für das Modell M 5 zu kritisieren; im Gegenteil: eine Ablehnung des Modells ist geradezu irreführend, da die Abweichung vom Modell in keiner Weise praktisch bedeutsam ist. Wir wissen nur zu gut, daß die Rechengenauigkeit unserer Taschenrechner/Computer begrenzt ist, daß Meß- bzw. Klassifikationsfehler wahrscheinlich sind, daß auch Fehler bei der Datenaufbereitung nicht auszuschließen sind usw. Vernünftigerweise wird man sich daher bei der Formulierung einer Modellgeltungshypothese damit begnügen, eine «ungefähre» oder «approximative» Gültigkeit des Modells zu postulieren. Natürlich ist die maximal tolerierbare Abweichung vom Modell genauer zu präzisieren, als es bisher geschehen ist. Wer sich dieser Auffassung anschließt, der wird bei der (notwendigen!) Kontrolle des ß-Fehlers allenfalls auf organisatorische, nicht aber auf konzeptuelle und rechnerische Probleme stoßen. In Anbetracht dieser Tatsache ist es geradezu unverständlich, warum von der Möglichkeit der Kontrolle des ß-Fehlers in der Praxis so gut wie kein Gebrauch gemacht wird. Dies gilt im übrigen auch für varianz- bzw. regressionsanalytische Standardverfahren, bei denen - anders, als BONETT & BENTLER (1983, p. 149) es behaupten die Beachtung des ß-Fehlers ebenfalls nicht «commonplace» ist. Für log-lineare Modellgeltungstests hat zwar LANGEHEINE (1983) auf das ß-Problem hingewiesen, aber nur sehr grobe und für eine ß-Kontrolle nicht ausreichende Empfehlungen gegeben. Ihm scheint das Dilemma «... schließlich nur durch Replikationen lösbar ...» (LANGEHEINE, 1983, p. 45 im Manuskript). Diese Auffassung ist aber wie wir noch sehen werden - äußerst problematisch. Wenn der Stichprobenumfang in den Re-
Erdfelder: Zur Bedeutung und Kontrolle des ß-Fehlers
plikationsstudien nicht geplant wird, sondern aufgrund der zufällig verfügbaren Untersuchungseinheiten zustande kommt, dann werden Replikationsstudien mehr Verwirrung als Klarheit stiften (vgl. BREDENKAMP, 1980). Erst in einigen neueren Arbeiten (MILLIGAN, 1980;
KRISKA &
MILLIGAN,
1982;
BONETT
&
1983) wird klar die Position vertreten, daß die Kontrolle von ß bzw. der dazu komplementären Wahrscheinlichkeit (1-ß), die als «Power» bezeichnet wird, nicht nur notwendig, sondern auch leicht durchführbar ist: «Fortunately, power calculation for chi-square tests are fairly simple» (KRISKA & MILLIGAN, 1982, p.196). Da jedoch auch in diesen Arbeiten keine explizite Formulierung des Vorgehens zu finden ist, wollen wir dies im folgenden nachholen. BENTLER,
5. Der Devianzindex W Die Power oder « Macht» eines statistischen Tests ist - wie bereits erwähnt - die Wahrscheinlichkeit (1-ß) für eine korrekte Zurückweisung der Nullhypothese bei Gültigkeit einer bestimmten Alternativhypothese. Die Power - und damit auch die ß-Fehlerwahrscheinlichkeit - hängt bei x 2 -Tests ab von (a) der Freiheitsgraden df der Referenzverteilung, (b) dem spezifizierten «Signifikanzniveau» a, (c) dem globalen Stichprobenumfang N und schließlich (d) der sog. «Effektgröße» im Sinne der H l t d. h. dem Grad der Abweichung der spezifisch zu betrachtenden Alternative von der H 0 . Je größer diese Abweichung - gemessen durch einen geeigneten Devianzindex W - ausfällt, je größer N und je größer («liberaler») a , desto größer wird auch (1-ß) sein. Will man die Power für gegebenes df, a , N und W numerisch exakt bestimmen, so muß man sich die sog. nonzentrale Verteilung der gewählten Prüfstatistik unter der definierten Alternative (W 0) ansehen. Der Anteil der Gesamtfläche unter dieser Wahrscheinlichkeitsfunktion, der «oberhalb» des zugrunde gelegten kritischen Wertes x(2df;a) liegt, entspricht der Power (1-ß); natürlich entspricht dann der Anteil «unterhalb» des kritischen Wertes der ß-Fehlerwahrscheinlichkeit bei Gültigkeit dieser Alternative. MILLIGANS (1980) Monte-Carlo-Studien zeigen, daß speziell die nonzentralen Verteilungen für die P E A R S O N - X 2 Statistik (14) «... even with the fairly low sample
25
Zeitschrift für Sozialpsychologie 1984, 15, 1 8 - 3 2
sizes used ...» (MILLIGAN, 1980, p . 2 4 0 ) sehr gut durch die Familie der sog. nonzentralen ^-Verteilungen approximiert werden können. 4 Eine nonzentrale x2-Verteilung ist durch die Freiheitsgrade df und den sog. Nonzentralitätsparameter L eindeutig definiert: xx
L
= N
(TJ> (p
z -p z ) ———.
E Z= 1
(18)
PZ
In (18) wurde wie in (14) und (15) von dem Zellenzähler z für die insgesamt x Zellen der Kontingenztafel Gebrauch gemacht; p° steht für die Wahrscheinlichkeit für Zelle z wie sie von der Nullhypothese postuliert wird, p' steht entsprechend für die der Zelle z zugeordnete Wahrscheinlichkeit nach einer bestimmten Alternativhypothese. Ausgehend von L können wir nun nach einem vernünftigen Devianzindex für die Abweichung der Wahrscheinlichkeiten von der Nullhypothese suchen. Da dieser Index (a) aus Vergleichbarkeitsgründen unabhängig von der Stichprobengröße N sein sollte und (b) aus rechenökonomischen Gründen eine möglichst enge Beziehung zu L aufweisen sollte, empfiehlt sich W2=
X z=l
h2 (Pü-Pi)'
(19)
Maß entscheiden, sofern W (und damit L) als Funktion dieses Maßes darstellbar ist. Alternative (Kontingenz-)Indizes und ihre Beziehung zu W werden beispielsweise bei COHEN (1977, p.222224) und FRIEDMAN (1982) diskutiert. Wählt man W als Maß für die Devianz vom Modell, so sollte man dessen Eigenschaften kennen. W kann theoretisch zwischen 0 und + 0 0 variieren, wobei allerdings schon W>.9 sehr große Devianzen reflektiert (vgl. COHEN, 1977, p.218). Für den speziellen Fall gleicher H0-Wahrscheinlichkeiten (z. B. bei Modell M5) ist die Obergrenze von W durch die Quadratwurzel aus der um Eins verringerten Anzahl von Zellen (^ x-1) gegeben. Damit wird eine wenig schöne Eigenschaft von W deutlich: die Abhängigkeit von der Anzahl der Zellen in der Kontingenztafel. Die W-Indizes für zwei Kontingenztafeln mit verschiedener Anzahl von Zellen sind daher nur bedingt vergleichbar. Wenn erwünscht, kann W natürlich als Funktion der Ä,-Parameter - oder besser: der multiplikativen y-Parameter - ausgedrückt werden. Die p j einer 2x2-Kontingenztafel können beispielsweise wie folgt nach dem saturierten log-linearen Modell Mx reparametrisiert werden (vgl. (2)): ei;
Nach dem Haupteffektmodell M2 muß dagegen gelten (vgl. (5)): e°
oder W=
(21)
1/I
1\2 (P-P)
(20)
Obwohl die leichtere Interpretierbarkeit für W 2 spricht («x2-Statistik für die H 0 vs. ^ - W a h r scheinlichkeiten») entscheidet man sich am besten für das von COHEN (1977, p. 2 1 6 - 2 2 7 ) vorgeschlagene «Effekt»- bzw. Devianzmaß W, da bezüglich dieses Maßes bereits extensive Powertabellen vorliegen ( C O H E N , 1 9 7 7 , p . 2 2 8 - 2 6 7 ) . Natürlich kann man sich auch für irgendein anderes 4 Für sehr kleine erwartete Häufigkeiten muß MILLIGANS Aussage allerdings bezweifelt werden (vgl. z.B. OVERALL, 1980). Dieser Sachverhalt dürfte jedoch für die Praxis der Poweranalysen kaum relevant sein, da derjenige, welcher sie ernsthaft durchführt, ganz andere Sorgen als die zu kleiner erwarteter Häufigkeiten haben wird.
(22)
Wollen wir nun die Devianz W vom Modell M2 als Funktion der y-Parameter ausdrücken, so müssen wir lediglich (21) und (22) in (20) einsetzen. Es resultiert: W
(M2)
-
2 2 (l/N)-y I £ i=lj=l
Y
A B
ij
)
2
(23)
Man sieht, daß die Devianz vom Modell M2 dann und nur dann W = 0 wird, wenn alley^® = 1 bzw. alle = 0 sind; dies impliziert, daß das Modell M 2 exakt zutrifft. Völlig analog lassen sich die Devianzen für andere log-lineare oder logit-lineare Modelle als Funktion der Parameter ableiten.
26 Für die praktische Durchführung der Poweranalysen stellt sich das Problem, welche Devianzen vom zu testenden Modell man noch tolerieren sollte und welche nicht. Diese Entscheidung kann selbstverständlich dem Forscher nicht abgenommen werden. Er sollte unter Erwägung der Konsequenzen, die eine falsche/richtige statistische Entscheidung nach sich zieht, einen bestimmten numerischen Wert für W festlegen, der mit der Power (1-ß) entdeckt werden soll. Ist das nahezu exakte Zutreffen eines Modells theoretisch oder praktisch gefordert, dann muß W auf einen sehr kleinen Wert fixiert werden; lassen sich dagegen auch größere Abweichungen unter theoretischen oder praktischen Gesichtspunkten noch akzeptieren, dann kann man sich mit einem liberaleren W-Kriterium begnügen. Als Orientierungsmaßstab mag C O H E N S (1977, p . 2 2 4 - 2 2 6 ) Klassifikation der Devianzen bzw. «Effekte» in kleine (W=.10), mittlere (W=.30) und große (W=.50) dienen. Ein «strenger» Teist des Modells sollte daher nach C O H E N von W=.10 ausgehen. Es kann jedoch nicht überbetont werden, daß die Wahl
Erdfelder: Zur Bedeutung und Kontrolle des ß-Fehlers
von W dem Forscher überlassen bleiben muß. Es ist zu hoffen, daß C O H E N S Klassifikation der W-Indizes sich nicht in ähnlicher Weise verselbständigen wird wie die traditionellen Signifikanzniveaus a=.05, ct=.025 u n d a = . 0 1 (vgl. C O W L E S & DAVIS, 1982).
Um einen Eindruck davon zu erhalten, was Devianzen von W = 0 bis W = .4 für das Verhalten der PEARSON-X2-Statistik bedeuten, wurde für den speziellen Fall eines x2-Tests des Haupteffektmodells M 2 (vgl. (5)) mit d f = l , a = 0 . 5 und N=100 eine kleine Simulationsstudie - basierend auf jeweils 10000 Zufallsstichproben aus der Population - durchgeführt. Die insgesamt 5 untersuchten Populationsmodelle für die Vierfeldertafel sind in der Legende zu Abbildung 1 einschließlich der zugeordneten W-Indizes und Nonzentralitätsparameter L aufgeführt. Schon rein anschaulich legt der Polygonzug der Häufigkeiten empirisch ermittelter x 2 -Werte für W = 0 (i.e. Gültigkeit der H 0 ) eine gute Übereinstimmung mit der zentralen x 2 -Verteilung bei d f = l nahe. Der zugrunde gelegte kritische Wert
Abb.l: Polygonzug der Häufigkeiten empirischer PEARSON-x2-Werte in bestimmten Intervallen bei Zufallsentnahme von 10000 Stichproben aus einer definierten Population; für verschiedene Populationsmodelle.
Zeitschrift für Sozialpsychologie 1984, 15, 1 8 - 3 2
X(i ; 05) = 3 - 8 4 w u r d e b e i 4 . 7 8 % d e r 1 0 0 0 0 g e z o g e nen Stichproben überschritten. Im nonzentralen Fall ( W > 0 ) wird die Verteilung - anschaulich ausgedrückt - zunehmend nach rechts verschoben. Der kritische Wert 3.84 wurde bei W = . l in 21,66%, bei W = . 2 in 49,94%, bei W = .3 in 87,65% und schließlich bei W = . 4 in 98,46% der untersuchten Fälle überschritten. Nach der auf der nonzentralen x 2 -Verteilung basierenden Tabelle 7.3.15 bei COHEN (1977, p.235) ist für d f = l , a=.05, N=100 und W = . l bis W = . 4 eine Power von .17, .52, .85 und .98 zu erwarten. W i e bereits MILLIGANS (1980) Befunde nahelegen, ist die Übereinstimmung mit den empirischen Powerschätzungen relativ gut.
27 2) A priori Poweranalysen Nur bei a priori Poweranalysen kann von einer Kontrolle des ß-Fehlers im engeren Sinne die Rede sein: der Stichprobenumfang N wird als Funktion von W , a und ß ausgedrückt. A u f diese Weise läßt sich vor Durchführung einer empirischen Untersuchung für fixiertes W , a und ß der notwendige Stichprobenumfang N errechnen. Dieses Vorgehen ist im Sinne der hier vertretenen inferenzstatistischen Strategie ideal zu nennen. Die a priori Festlegung von N kann für ausgewählte df, a und (1-ß) mit Hilfe von COHENS (1977, p.253-267) «sample size tables» vorgenommen werden. 3) Kompromiß-Poweranalysen
6. Poweranalysen Da die Power eines x2-Test bei gegebenen Freiheitsgraden vollständig durch a, N und W determiniert ist, lassen sich prinzipiell vier Arten von Poweranalysen unterscheiden, wobei jeweils eine der vier Größen (1-ß), a , N und W als Funktion der anderen drei ausgedrückt wird. Praktisch relevant dürften jedoch nur drei der möglichen Varianten sein. 1) Post hoc Poweranalysen Hierbei wird (1-ß) als Funktion von a, N und W ausgedrückt. Diese Art der Analyse ist angezeigt, wenn bereits durchgeführte Modellgeltungstests für log-lineare Modelle daraufhin evaluiert werden sollen, wie groß die ß-Fehlerwahrscheinlichkeit bei einer zu entdeckenden Devianz von z.B. W = .1 ausfällt. Ist ß für ein bestimmtes angenommenes Modell exzessiv groß, so kann die statistische Entscheidung nachträglich problematisiert werden. Für ausgewählte Werte von df, a, W und N können post hoc Poweranalysen anhand von COHENS (1977, p.228-248) Powertabellen vorgenommen werden.5
1 COHEN (1977) weist merkwürdigerweise nicht darauf hin, daß seine Tabellen für beliebige x2-Tests im Rahmen von p-dimensionalen Kontingenztafeln verwendet werden können . Gegen eine derartige Verwendung spricht jedoch absolut
n i c h t s ( v g l . M I L L I G A N , 1980; BONETT & BENTLER, 1983).
Das ideale Vorgehen einer a priori Poweranalyse wird sicher nicht selten sehr große Stichprobenumfänge verlangen. Obwohl dies auch im Sinne einer möglichst guten x 2 -Approximation nur zu begrüßen ist, werden dennoch ökonomische Gründe die Realisierung des errechneten Stichprobenumfangs häufig nicht zulassen (vgl. Fußnote 4). Für dieses Problem gibt es nur eine vernünftige Lösung: man legt das maximal vertretbare N sowie die zu entdeckende Devianz W fest und überlegt sich, in welchem Ausmaß a- und ß-Fehler unterschiedlichen «Schaden» anrichten. Diese Überlegungen sollten in der Spezifizierung eines Quotienten q=ß/a münden, der angibt, wieviel Mal größer die ß- im Vergleich zur a-Fehlerwahrscheinlichkeit sein darf. Der Quotient q = l würde indizieren, daß man die Konsequenzen von a- und ß-Fehlern für gleichermaßen gravierend erachtet, während q > 1 dem a-Fehler und q < l dem ß-Fehler gravierendere Konsequenzen zuschreibt. Für festgelegte Koeffizienten N , W und q lassen sich dann die vernünftigerweise zu verwendenden Irrtumswahrscheinlichkeiten a und ß (sowie natürlich der kritische Wert X2DF.0)) errechnen. Selbstverständlich hat dieses Vorgehen zur Konsequenz, daß man sich in der Regel von dem 5%-Signifikanzniveau verabschieden muß. Aber was hindert den Forscher daran, wo es sich doch lediglich um ein wissenschaftshistorisch zu verstehendes « D e n k m a l » handelt (vgl. COWLES & DAVIS, 1982)?
Wer das hier als «Kompromiß-Poweranalyse» bezeichnete Vorgehen wählen will bzw. wählen
28
Erdfelder: Zur Bedeutung und Kontrolle des ß-Fehlers
muß, dem werden COHENS (1977) Tabellen leider kaum weiterhelfen. D a diese aufgrund ihres ausschnitthaften Charakters auch nur bedingt für post hoc und a priori Poweranalysen einsetzbar sind, wurde vom Verfasser ein interaktives BAS I C - P r o g r a m m « C H I P O W E R » erstellt, das alle drei beschriebenen Arten von Poweranalysen für X 2 -Modelltests durchführt." C H I P O W E R berechnet kritische Werte X2DF.A) für beliebige Signifikanzniveaus a nach einem iterativen Algorithm u s von O'GRADY (1981) und approximative Po-
werwerte nach d e m von MILLIGAN (1979) be-
schriebenen Verfahren. Ein Vergleich der approximativen Powerwerte mit denen COHENS (1977) ergab recht gute Übereinstimmung (vgl. MILLIGAN, 1979, p.683). Da C H I P O W E R in jeder Hinsicht selbstinstruktiv ist, kann eine detaillierte Beschreibung unterbleiben.
7. Poweranalysen für drei Beispiele aus LANGEHEINE (1983) LANGEHEINE ( 1 9 8 3 ) h a t D a t e n v o n KRIZ ( 1 9 7 3 ) , KOBELT ( 1 9 7 4 ) u n d FEGER ( 1 9 7 8 ) m i t t e l s log-li-
nearer Modelle für 2x2x2-Kontingenztabellen reanalysiert. Diese drei Beispiele sind in unserem Zusammenhang deshalb besonders interessant, weil bei ihnen gleiche Analysedesigns aber ungleiche Stichprobenumfänge vorliegen. Die Daten v o n KOBELT ( 1 9 7 4 ) b a s i e r e n a u f N K O = 1 0 0 0 ,
die
v o n KRIZ (1973) a u f N K R = 2 7 7 u n d d i e v o n FEGER (1978)
auf
NFE=161
Untersuchungseinheiten.
Bedenken wir, daß die Power des x 2 -Modelltests unter sonst gleichen Bedingungen mit dem Stichprobenumfang wächst (vgl. Abschnitt 5), so ist zu folgern, daß Abweichungen von der Nullhypothese für ein bestimmtes log-lineares Modell bei den KoBELT-Daten mit der größten und bei den FEGER-Daten mit der geringsten Wahrscheinlichkeit entdeckt werden. Allein aufgrund der ungleichen Stichprobenumfänge können wir somit die Prognose ableiten, daß das akzeptierte loglineare Modell für die FEGER-Daten vermutlich die wenigsten und das für die KoBELT-Daten ver6 Ein Ausdruck des Programms kann beim Verfasser angefordert werden. Für Benutzer von Commodore-Tischcomputern besteht darüberhinaus die Möglichkeit, bei Übersendung einer Kassette eine Kopie von C H I P O W E R zu erhalten. Das Programm benötigt 6 Kbyte R A M .
mutlich die meisten Parameter enthalten wird. Anders ausgedrückt: das akzeptierte log-lineare Modell für die FEGER-Daten kann schon allein deshalb sehr restriktiv sein, weil es aufgrund des geringen Stichprobenumfanges nicht streng prüfbar ist! Eine Inspektion der Tabelle 14 bei LANGEHEINE (1983) zeigt, daß wir mit unserer Prognose richtig liegen. Für die KoBELT-Daten konnte lediglich das saturierte Modell, für die KRiz-Daten das Modell: Ine. = ljk
+
]
i
k
lk
jk
(24)
bei d f = 2 und für die FEGER-Daten schließlich das einfache Wechselwirkungsmodell a b ab Ine... ijk = 5 I + Xi + A ,j + X ij
(25)
bei d f = 4 akzeptiert werden. Die Bestätigung der Prognose besagt natürlich nicht, daß die ungleichen Stichprobenumfänge für die gefällten statistischen Entscheidungen ursächlich gewesen sein müssen; sehr wohl besteht aber die Möglichkeit, daß ausschließlich die unterschiedlichen N ' s zu verschiedenen statistischen Entscheidungen geführt haben. E s kann keinen Zweifel daran geben, daß dieser Zustand völlig inakzeptabel ist! Wenn die statistische Entscheidung über eine Datenstruktur nicht mehr von der Datenstruktur, sondern von N abhängt, dann hat sie o f f e n b a r ihren Sinn verloren. Dies ist insbesondere zu bedenken, wenn man Replikationsstudien durchführt. Ist dabei N eine « Z u f a l l s g r ö ß e » , dann sind sie zumindest aus inferenzstatistischer Perspektive wertlos (vgl. Abschnitt 4). Idealerweise ist N immer a priori zu planen! Zu welchem Ergebnis würde das für unsere drei Beispiele führen? Nehmen wir an, das primäre Interesse sei bei allen drei Datensätzen auf den Test des Modells ohne Dreifachwechselwirkung gerichtet: In e. = X + X A + \ B + X ( r + X A B + X A c + \ B c ijk l j k ij lk jk
(26)
Der PEARSON-x2-Test wird mit d f = l durchgeführt. Wollen wir schon eine «kleine» Devianz von W = . 1 nicht mehr tolerieren und a = ß = . 0 5 sicherstellen, so können wir der Tabelle 7.4.6 bei COHNEN (1977, p.258) unter u = d f = l , W = . l und
Zeitschrift fur Sozialpsychologie 1984, 15, 1 8 - 3 2
29
Tab.3: Approximative P o w e r des PEARSON-x2-Tests bei d f = l und a = .05 für verschiedene Devianzen und Stichprobenumfänge. Devianz W Stichprobenumfang
.05
.10
.15
.20
.25
.30
.35
N k o = 1000
-335
^05
^999
TÖÖ
JLOO
TÖÖ
TÖÖ
L00
NKR =
277
.123
.367
.711
.934
.993
1.00
1.00
1.00
Nfe
161
-091
.229
.465
. 726
.907
=
( 1 - ß ) = .95 einen notwendigen Stichprobenumfang von N ^ o = N ^ R = N p E = 1 3 0 0 entnehmen. Für einen derart strengen Modelltest wäre also sogar N k o = 1 0 0 0 ZU klein! Sehen wir uns die mit H i l f e des Programms « C H I P O W E R » erstellte Tabelle 3 an, in der die Ergebnisse von post hoc Poweranalysen für die empirisch realisierten Stichprobenumfänge sowie d f = l und a = . 0 5 bei verschiedenen Devianzen abgetragen sind, so wird klar, daß das 5%-Signifikanzniveau - zumindest im Falle der KRIZ und der FEGER-Daten - einen viel zu hohen ß-Fehler nach sich zieht, wenn man von einem zu entdeckenden W = . l ausgeht. Sofern die realisierten Stichprobenumfänge die Obergrenze des ökonomisch Vertretbaren repräsentieren, sollte man daher andere a - und ß-Irrtumswahrscheinlichkeiten zugrunde legen. Wollen wir Devianzen von W = . l bei gleichen a - u n d ß-Werten [ q = ( ß / a ) = 1] entdecken, so zeigt die mit H i l f e von « C H I P O W E R » durchgeführte K o m p r o m i ß - P o w e r analyse, daß bei N K O = 1 0 0 0 vernünftigerweise a = ß = . 0 6 9 (X(I. a )=3.309), bei N K R = 2 7 7 dagegen a = ß = .262 (xfi a )=1-260) und bei N F E = 1 6 1 schließlich a = ß ' = . 3 3 7 ( x * ; a ) = . 9 2 1 ) zu wählen ist. Sicherlich kann man letztere Irrtumswahrscheinlichkeiten als «indiskutabel h o c h » kritisieren. M a n sollte jedoch die Konsequenzen einer solchen Kritik reflektieren: es muß entweder eine größere Devianz der Daten v o m Modell toleriert werden ( z . B . W = . 3 ) oder eine inferenzstatistische Beurteilung des Modells muß unterbleiben!
8 . K a n n N zu g r o ß sein? Nach den bisherigen Ausführungen mag der Eindruck entstanden sein, daß Stichprobenumfänge allenfalls zu klein aber niemals zu groß sein können. Dieser Eindruck ist falsch. Nicht immer wird nämlich vor der Durchführung eines M o -
.981
.997
.40
1.00
dellgeltungstests die Gültigkeit der Nullhypothese postuliert; manchmal steht auch die Ungültigkeit eines zu testenden Modells im Einklang mit der wissenschaftlichen Hypothese, welche die Untersuchung geleitet hat. Nehmen wir beispielsweise an, daß eine bestimmte wissenschaftliche Hypothese einen starken Wechselwirkungseffekt zweier dichotomer Variablen impliziert. Formal hieße dies, daß das saturierte log-lineare M o d e l l M i (vgl. ( 3 ) ) oder auch das saturierte logit-lineare M o d e l l L j (vgl. (10)) zutreffen muß. Saturierte M o d e l l e sind aber - wie bereits erwähnt - nicht direkt, sondern allenfalls indirekt testbar. Eine Möglichkeit der indirekten Prüfung besteht darin, die um einen Parameter reduzierten M o d e l l e M 2 (vgl. ( 5 ) ) bzw. L 2 (vgl. (11)) zu testen, wobei eine starke Devianz der Daten v o m M o d e l l behauptet wird. Ein signifikanter % 2 -Wert stünde hier also im Einklang mit der wissenschaftlichen Hypothese! Anders als bei den zuvor behandelten Beispielen sind aber « k l e i n e » und vielleicht auch « m i t t l e r e » Devianzen v o m zu testenden M o d e l l nicht von Interesse. Erst « g r o ß e » Abweichungen ( z . B . W = .4) sind im Sinne der wissenschaftlichen Hypothese praktisch bedeutsam. Liegt eine solche Situation vor, so würde die a priori Spezifikation des Stichprobenumfangs zu einem entsprechend kleineren Wert führen. Größere Werte für N sollten vermieden werden, damit nicht schon kleine, praktisch unbedeutende Abweichungen v o m reduzierten M o d e l l einen signifikanten Ausgang des Modellgeltungstests mit großer Wahrscheinlichkeit nach sich ziehen. Exzessiv große Stichprobenumfänge können somit dazu führen, daß die zugrunde liegende wissenschaftliche Hypothese wiederholt als bestätigt angesehen wird, o b w o h l der behauptete « g r o ß e E f f e k t » de facto nicht vorliegt.
30
Erdfelder: Zur Bedeutung und Kontrolle des ß-Fehlers
9. Zur Adjustierung von a und ß bei multiplen Tests Die Analyse einer empirischen Kontingenztafel mittels log-linearer Modelle wird sicher in den wenigsten Fällen nach der Durchführung eines Modellgeltungstests beendet sein. Immer dann, wenn mehrere Tests durchgeführt werden, wird ein weiteres Problem relevant: das Problem der Kumulierung von a - u n d / o d e r ß-Fehlerwahrscheinlichkeiten. Wohl bedingt durch die traditionelle Fixierung auf «Signifikanzniveaus» ist in der Literatur nur die erste Seite des Problems extensiv behandelt worden. Zumeist wird die Empfehlung gegeben, die a-Fehlerwahrscheinlichkeit bei multiplen Tests nach der aus der sog. B O N F E R RONI-Ungleichung ableitbaren Formel a* = a / t
(27)
zu adjustieren (vgl. z . B L A N G E H E I N E , 1980a, pp. 83-84; 1983). Gleichung (27) ist folgendermaßen zu interpretieren: legt man bei insgesamt t Tests jeweils ein Signifikanzniveau a* zugrunde, so ist die maximale Wahrscheinlichkeit für mindestens einen Fehler 1. Art gleich a . Die Kumulierung von a kann auf diese Weise kontrolliert werden. Erst jüngst haben allerdings W E S T E R M A N N (1982) und H A G E R & WESTERMANN (1983b) zu Recht betont, daß die a-Adjustierung nach (27) in vielen Fällen nicht nur unnötig, sondern sogar kontraindiziert ist. Die a-Adjustierung führt nämlich zwangsläufig zu einem verringerten a*-Niveau und damit zu größerer ß-Wahrscheinlichkeit. U . U . ist es aber viel wichtiger, den ß-Fehler klein zu halten bzw. eine ß-Kumulierung zu kontrollieren! Vor einer «blinden» Anwendung der B O N F E R RONI-Adjustierung (27) kann daher nur gewarnt werden. Erst wenn man sich die logische Struktur der statistischen Metahypothese ansieht, über die mittels t Modellgeltungstests entschieden werden soll, läßt sich klären, welche der beiden Fehlerwahrscheinlichkeiten in welcher Weise zu adjustieren ist. Wenn beispielsweise für eine2x2-Kontingenztafel ein log-lineares Modell M 4 mit nur einem Haupteffekt formuliert wird (vgl. (8)) und die statistische Metahypothese M H getestet werden soll, daß dieser und nur dieser Haupteffekt in der
Population von Null abweicht, so kann die Prüfung von M H mittels zweier Modellgeltungstests vorgenommen werden: MH A H ^ ' ) M
M
[2 +
A
+ ßM,
M3 +
A
M4 + "M,
wird und der Datensatz schlicht auf das «sparsamste» der möglichen hierarchischen log-linearen Modelle exploriert werden soll, lassen sich die maximalen Irrtumswahrscheinlichkeiten bestimmen und entsprechende Adjustierungsregeln ableiten. Allerdings wird dies in der Regel zu so kleinen adjustierten a*- und ß*-Werten führen, daß ein für diese Werte notwendiges N astronomische Ausmaße annehmen dürfte. Aus inferenzstatistischer Perspektive muß das exploratorische Vorgehen daher als sinnlos bezeichnet werden. Tabelle 4, in der die maximalen Irrtumswahrscheinlichkeiten für die fünf in einer 2x2-Kontingenztafel möglichen hierarchischen Modelle zusammengestellt sind, soll lediglich das Prinzip demonstrieren. Es wird davon ausgegangen, daß das «sparsamste» Modell Mj ( i = l , . . . , 5 ) per «backward elimination» gesucht wird: man beginnt mit dem Test wenig restriktiver Modelle und schreitet nur dann zu restriktiveren Modellen fort, wenn die vorherigen Tests insignifikant ausgefallen sind(vgl. z.B. K R I S K A & M I L L I G A N , 1982, p.196). Die Hypothese M H h daß das Modell Mj das sparsamste passende Modell ist, kann dann (unabhängig vom Wert i) in eine Konjunktion von Null- und/oder Alternativhypothesen der vier möglichen Modellgeltungstests für M 2 , M 3 , M 4 und M 5 übersetzt werden. Für jede der 5 möglichen Populationssituationen lassen sich dann die maximalen Irrtumswahrscheinlichkeiten wie bereits demonstriert - bestimmen. Wiederum zeigt sich, daß die Kontrolle der O M H I " Wahrscheinlichkeit für eine fälschliche Annahme der
Hypothese MH¡ keine Adjustierung erfordert, wohl aber die Kontrolle der ß M H i - Wahrscheinlichkeiten für die fälschliche Ablehnung derartiger Hypothesen. Von der Adjustierung sind dabei keineswegs nur a - sondern auch ß-Wahrscheinlichkeiten für die einzelnen Modellgeltungstests betroffen! Es bleibt zu hoffen, daß die kritische Reflexion der a - u n d ß-Fehlerwahrscheinlichkeiten bei der statistischen Entscheidung eine Abwendung vom exploratorischen und eine Hinwendung zum hypothesentestenden Vorgehen nach sich ziehen wird.
" Zur Definition von hierarchischen Modellen vgl. z.B.
of statistical significance. American Psychologist, 37,553558.
LANGEHEINE ( 1 9 8 0 a , p . 2 8 ) .
Literatur ARMINGER, G. 1976. Einführung in loglineare Modelle zur Analyse von nominal skalierten Variablen. Format 1, 5287. ARMINGER, G. 1979. Loglineare Modelle zur Analyse des Zusammenhangs zwischen nominalen Variablen. In: Holm, K. (Hrsg.): Die Befragung 6. München: Francke. BISHOP, Y . M . M . , F I E N B E R G , S . E . & H O L L A N D , P . W .
1975.
Discrete multivariate analysis: Theory and practice. Cambridge: MIT Press. BLÖSCHL, L. 1966. Kullbacks 2I-Test als ökonomische Alternative zur x 2 -Probe. Psychologische Beiträge 9, 390-406. BONETT, D . G . & BENTLER, P . M . 1 9 8 3 . G o o d n e s s - o f - f i t p r o -
cedures for the evaluation and selection of log-linear models. Psychological Bulletin, 93,149-166. BREDENKAMP, J . 1 9 7 2 . D e r S i g n i f i k a n z t e s t i n d e r p s y c h o l o -
gischen Forschung. Frankfurt: Akademische Verlagsgesellschaft. BREDENKAMP, J. 1980. Theorie und Planung psychologischer Experimente. Darmstadt: Steinkopff. COHEN , J. 1977 2 . Statistical power analysis for the behavioral sciences. New York: Academic Press. C O W L E S , M . & DAVIS, C . 1 9 8 2 . O n t h e o r i g i n s o f t h e . 0 5 l e v e l
32 DIXON, W. J. (Ed.) 1981. BMDP - Biomedical Computer Programs. Berkeley: University of California Press. FEGER, H. 1978. Konflikterleben und Konfliktverhalten. Psychologische Untersuchungen zu alltäglichen Entscheidungen. Bern/Stuttgart/Wien: Huber. FRIEDMAN, H. 1982. Simplified determinations of statistical power, magnitude of effect and research sample sizes. Educational and Psychological Measurement, 42, 521526. GOODMAN, L.A. 1970. The multivariate analysis of qualitative data: interactions among multiple classifications. Journal of the American Statistical Association, 65, 226256. HAGER, W. & WESTERMANN, R. 1983a. P l a n u n g u n d A u s w e r -
tung von Experimenten. In: Bredenkamp, J. & Feger, H. (Hrsg.): Hypothesenprüfung (= Enzyklopädie der Psychologie. Themenbereich B. Serie 1. Band 5). Göttingen: Hogrefe, 24-238. HAGER, W . & WESTERMANN, R. 1983b. E n t s c h e i d u n g ü b e r
statistische und wissenschaftliche Hypothesen: Probleme bei mehrfachen Signifikanztests zur Prüfung einer wissenschaftlichen Hypothese. Zeitschrift für Sozialpsychologie, 14, 106-117. KOBELT, >H. 1974. Die Beurteilung multivariater Zusammenhänge bei nominalskalierten Daten. Dargestellt anhand von Beispielen aus den Wirtschaftswissenschaften. Münster: Westfälische Wilhelms-Universität zu Münster. (Dissertation, Photodruck.) KRAUTH, J. 1980. Ein Vergleich der Konfigurationsfrequenzanalyse mit der Methode der log-linearen Modelle. Zeitschrift für Sozialpsychologie, 11, 233-247. KRISKA, S . D . & MILLIGAN, G . W . 1982. M u l t i p l e regression
analysis for categorical data with an illustrative application in personnel selection. Psychological Bulletin, 92, 193-202. KRIZ, J. 1973. Statistik in den Sozialwissenschaften. Reinbek: Rowohlt. KÜCHLER, M. 1976. Multivariate Analyse nominalskalierter Daten. Zeitschrift für Soziologie, 5, 237-255. KÜCHLER, M. 1978. Alternativen in der Kreuztabellenanalyse. - Ein Vergleich zwischen Goodmans «General Model» (ECTA) und dem Verfahren gewichteter Regression nach Grizzle et al. (NONMET II). Zeitschrift für Soziologie, 7, 347-365. KÜCHLER, M. 1979. Multivariate Analyseverfahren. Stuttgart: Teubner.
Erdfelder: Z u r Bedeutung und Kontrolle des ß-Fehlers LANGEHEINE, R. 1979. Multivariate Analyse nominalskalierter Daten via Goodmans Modell: Sehr wohl eine Alternative. Zeitschrift für Soziologie, 8, 380-390. LANGEHEINE, R. 1980a. Log-lineare Modelle zur multivariaten Analyse qualitativer Daten. Eine Einführung. München: Oldenbourg. LANGEHEINE, R. 1980b. Multivariate Hypothesentestung bei qualitativen Daten. Zeitschrift für Sozialpsychologie, 11, 140-151. LANGEHEINE, R. 1982a. Rekursive Pfadmodelle für multivariate Kontingenztabellen. Zeitschrift für Sozialpsychologie, 13,2-12. LANGEHEINE, R. 1982b. Kausalanalyse qualitativer Daten mit manifesten und latenten Variablen. Zeitschrift für Sozialpsychologie, 13,163-176. LANGEHEINE, R. 1983. Log-lineare Modelle. In: Koolwijk, J.v.&Wieken-Mayser, M. (Hrsg.): Techniken der empirischen Sozialforschung, Band 8: Kausalanalyse. München: Oldenbourg. (Im Druck.) MILLIGAN, G.W. 1979. A computer program for calculating power of the chi-square test. Educational and Psychological Measurement, 39, 681-684. MILLIGAN, G.W. 1980. Factors that affect type I and type II error rates in the analysis of multidimensional contingency tables. Psychological Bulletin, 87, 238-244. O'GRADY, K.E. 1981. Probabilities and critical values for z, chi-square, r, t, and F. Behavior Research Methods & Instrumentation, 13, 55-56. OVERALL, J.E. 1980. Power of chi-square tests for 2x2 contingency tables with small expected frequencies. Psychological Bulletin, 87, 132-135. SHAFFER, J.P. 1973. Defining and testing hypotheses in multidimensional contingency tables. Psychological Bulletin, 79, 127-141. STEYER, R. 1983. Randomization in the reg-linear and logitlinear models: a farewell to a good old believe. Trier: Fachbereich I - Psychologie - der Universität Trier. (Unveröffentlichtes Manuskript.) WESTERMANN, R. 1982. Zur Wahl der Fehlerwahrscheinlichkeiten bei mehrfachen Signifikanztests. Göttingen: Psychologisches Institut der Universität Göttingen. (Unveröffentlichtes Manuskript.) WESTERMANN, R . & H A G E R , W . 1 9 8 2 . E n t s c h e i d u n g
über statistische und wissenschaftliche Hypothesen: Zur Differenzierung und Systematisierung der Beziehungen. Zeitschrift für Sozialpsychologie, 13,13-21.
^ ^ H I
J
Zeitschrift für Sozialpsychologie 1984, 1 5 , 3 3 - 4 3
33
Empirie Untersuchungen zum Komponentenmodell der Einstellungsobjekte: I. Theorie und nichtexperimentelle Studien HUBERT FEGER & PAUL DOHMEN Universität H a m b u r g
In einer Feldstudie zu einer ersten Ü b e r p r ü f u n g des Komponentenmodells untersuchten wir die Struktur der Einstellung von 11 Studenten zu 12 psychologischen Tätigkeitsfeldern. Die durch Generalisierbarkeitsstudien und als Kendalls W bestimmte Reliabilität der globalen Ähnlichkeitsurteile und der Zuschreibungen der Komponenten zu den Einstellungsobjekten erwies sich als sehr zufriedenstellend. Wir konnten zeigen, daß Komponenten zwar als unterschiedlich charakteristisch den einzelnen Objekten zugeschrieben werden, ihre Bewertung jedoch über die Einstellungsobjekte weitgehend konstant ist. Globale Ähnlichkeitsurteile über die Objekte lassen sich zutreffend aus den Zuschreibungen der K o m p o n e n t e n ableiten. Präferenzen für Objekte lassen sich gut aus den Bewertungen der K o m p o n e n t e n vorhersagen.
In a field study towards a first test of the C o m p o n e n t Model of Attitude Objects, the attitudinal structures of 11 students toward 12 areas of professional psychological work were analysed. T h e reliability of the global judgments of similarity between attitude objects, and that of the component ratings for specific attitude objects, proved to be very satisfactory. We were able to show that, although components are differentially attributed to specific objects as characteristic, their evaluation in regard to the attitude objects themselves remains largely constant. Global similarity judgments about the objects can be effectively derived f r o m the attribution of components. Preferences for various objects can be predicted from the preference ratings of the components.
1.
Gegensatz zu Persönlichkeitsmerkmalen i. e. S. wie etwa Intelligenz, läßt sich eine Einstellung kennzeichnen als Bezug auf ein spezifisches Objekt, auf etwas, das - und sei es auch noch so vage, abstrakt und global - dadurch zu konkretisieren ist, daß ihm Eigenschaften, Beziehungen zu anderen Gegebenheiten, u.ä. zugeschrieben werden. Es gibt einen Träger dieser Merkmale, das, was THURSTONE (1946, 1959, p. 320f.) als «psychologisches Objekt» bezeichnet und umschreibt als «any symbol, person, phrase, slogan, or idea toward which people can differ as regards positive or negative affect». Wir argumentieren also ganz im Sinne von KATZ & STOTLAND (1959, p.429): «In evaluating the object some elements of cognition are necessary; the object must be recognized and must be related at least implicitly to other objects and beliefs.»
Theorie
Das Komponentenmodell der Einstellungsobjekte, vom ersten Autor (FEGER, 1979) zur posthoc-Erklärung eigener und in der Literatur berichteter Befunde eingeführt, wird hier zunächst in erweiterter Form vorgestellt. Das Modell soll Entstehen und Änderung von Einstellungsstrukturen und Präferenzen für Einstellungsobjekte erklären. In dieser und weiteren Arbeiten soll es direkt getestet werden, indem aus den Grundvorstellungen empirisch prüfbare Annahmen abgeleitet werden. Wir entwickeln als erstes diese Vorstellungen und dann die Annahmen.
1.1. Grundlegende
Vorstellungen
Die theoretischen Grundbegriffe des Modells sind Einstellungsobjekt und Komponente. Im
Man kann verschiedene Kriterien rechtfertigen, mit deren Hilfe man feststellen könnte, ob
34
Feger& Dohmen: Untersuchungen zum Komponentenmodell der Einstellungsobjekte
ein Einstellungsobjekt «vorhanden» ist. Uns scheint erforderlich, daß die Person das Objekt identifizieren und wiedererkennen kann; sie muß also ein Minimum an Merkmalen fest mit dem Objekt verbinden. (Beim empirischen Vorgehen kann man dementsprechend Einstellungen erheben, wenn man sicher weiß, daß die Einstellungsobjekte wenigstens rudimentär bekannt sind, wie den meisten Wählern der Bundesrepublik die im Bundestag vertretenen Parteien, oder man kann die Einstellungsobjekte im Experiment herstellen. Beide Vorgehensweisen bieten ihre eigenen Schwierigkeiten und Vorteile, weshalb wirbeide anwenden wollen.) Zum Minimum an zugeschriebenen Merkmalen kommt hinzu, ganz im Sinne T H U R STONES, daß diese Objekte Gegenstand einer Präferenzbeurteilung oder einer affektiven Orientierung sind, und z w a r - wie wir ergänzen - aufgrund der zugeschriebenen Merkmale. Die Merkmale können unterschiedlich stark zugeschrieben werden, für mehr oder weniger typisch gehalten werden. (Wir quantifizieren also diese Variable, im Gegensatz zur früheren Veröffentlichung.) Einstellungsobjekte interessieren uns in diesem Modell als Zusammenhänge von Merkmalen mit einem Merkmalsträger. Dem Begriff des Einstellungsobjektes möchten wir den des Einstellungsbereiches gegenüberstellen, dem mehrere Objekte angehören, die aus der Sicht einer bestimmten Person zwar unterschieden werden, jedoch untereinander stärker zusammengehören als Objekte außerhalb des Bereichs mit denen innerhalb verbunden sind. Betont sei auch, daß ein Einstellungsobjekt, das von der einen Person oder bei der einen Gelegenheit als Einheit gesehen wird, in einer anderen Situation oder bei einer anderen Person eine gegliederte Binnenstruktur aufweist. Am Objekt können verschiedene Aspekte, Teile, Repräsentationsarten abgehoben werden - an einer Partei beispielsweise programmatische Aussagen, ihre führenden Vertreter, Ereignisse der Parteigeschichte u.ä. Es ist möglich, daß diese Teile und Aspekte selbst wieder zu Einstellungsobjekten gemacht werden (etwa die jeweiligen Politiker) und sich eine hierarchische Ordnung von Objekten ergibt. Manche Teile können den unten näher charakterisierten Komponenten entsprechen (z. B.
«Partei X tritt für den Mittelstand ein»); mit solchen Prozessen der Gliederung oder Entdifferenzierung befaßt sich das Komponentenmodell hier nicht. Betrachtet man jene Objekte, auf die sich üblicherweise Einstellungsmessung bezieht, wie Minderheiten aller Art, Institutionen, Parteien, Atomkraftwerke und Todesstrafe, so wird deutlich, daß diese Objekte selten als Mittel zu Zwecken durch den einzelnen Einstellungsträger eingesetzt werden können. Es gilt also zwar im Prinzip: «. . . dasselbe Objekt kann stark oder schwach präferiert werden, wenn es für ein Ziel hohe Instrumentalität besitzt, für ein anderes aber niedrige» ( U P M E Y E R , 1980), jedoch ist die Zielinstrumentalität der üblicherweise untersuchten Einstellungsobjekte kaum variabel, oder die Personen können von ihr abstrahieren, wenn man sie um Einstellungsurteile bittet. Die Erfassung von Präferenzen in einem eher handlungstheoretischen Kontext - mit welchem Auto fahre ich nach Finnland; was erreiche ich, wenn ich Partei X wähle - ist in dieser Hinsicht von der klassischen Einstellungsmessung verschieden. Wenn ein Forscher ausdrücklich Absichten und Handlungen erfassen möchte, so wäre dies bei der Auswahl der Objekte und Komponenten zu berücksichtigen. Komponenten können auch Verhaltensmöglichkeiten darstellen; dann kann man sowohl danach fragen, wie sie allgemein vom Einstellungsträger bewertet werden, als auch danach, als wie wahrscheinlich er es ansieht, daß er diese Verhaltensmöglichkeit gerade gegenüber jenem Objekt verwirklicht. In einer späteren Arbeit möchten wir darstellen, wie mit Hilfe dieser Art von Komponenten Verhalten gegenüber Einstellungsobjekten vorhergesagt werden kann. Als Bezeichnung für die oben erwähnten Merkmale führen wir den Begriff Komponenten ein, zum einen, um jeden Inhalt und jede Art der Zuschreibung zu erfassen, zum anderen, um zu betonen, daß Komponenten notwendigerweise zum Einstellungsobjekt gehören. Eine Komponente ist eine Aussage, die eine Person prinzipiell über ein Einstellungsobjekt machen könnte, und die mit ihrer tatsächlichen Zuschreibung zu einem bestimmten Einstellungsobjekt zur subjektiven Annahme über dieses Objekt und zur Komponente in der
35
Zeitschrift für Soziaipsychologie 1984, 15, 3 3 - 4 3
Einstellungsstruktur des Zuschreibenden wird. Ohne Komponenten gibt es kein Einstellungsobjekt, wenn auch das Einstellungsobjekt über ein Auswechseln und Sichändern aller seiner Komponenten als identisch geblieben erlebt werden kann. Wir stellen uns Komponenten als die kleinsten, meist bewußten oder bewußt zu machenden Einheiten vor, die mit einem Einstellungsobjekt verbunden sind. Sie unterscheiden sich von den Komponenten des «Dreikomponenten-Modells» von K R E C H & C R U T C H F I E L D (1948), das mit seiner Unterscheidung zwischen beliefs, attitudes und intentions auch dem Ansatz von FISHBEIN & A J Z E N (Z. B. 1975) zugrunde liegt. Aus der Sicht dieses Modells sind Komponenten allgemeine Aspekte einer bestimmten, als Einstellung bezeichneten psychischen Struktur. Diese Komponenten stellen als Aspekte eine analytische Unterscheidung dar, und es ist durchaus offen, ob diese analytische Trennung auch empirisch, beispielsweise als Muster in Korrelationen zwischen Einstellungsitems, nachgewiesen werden kann. Wir verwenden hingegen den Begriff Komponente eher im Sinne von «attributed qualities» bei K A T Z & S T O T L A N D (1959, p. 429) oder von «beliefs» bei T H U R S T O N E (1928) und FISHBEIN & A J Z E N (1975). Typische Items aus Einstellungsfragebogen umfassen meist mehrere Komponenten. Wie gut man das Komponentenmodell überprüfen kann, hängt von der Identifizierbarkeit der Komponenten ab. Unser Modell hat diese Schwierigkeit mit den feature-Modellen der Ähnlichkeit gemeinsam, die SJÖBERG & T H O R S L U N D (1979, p.225) folgendermaßen umschreiben: «A theory of this type deals with subjective properties, those properties that are taken into account by the subject, often actively constructed by him on the basis of complex pattern or Gestalt characteristics of the stimulus v a l u e s . . . The independent variables in the theory necessarily become mentalistic in character which makes it quite difficult to conduct a clear cut test of the model.» In den später zu berichtenden Experimenten haben wir Komponenten vorgegeben und sie von den Vpn lernen lassen. Aber auch diese Art der experimentellen Kontrolle ist nicht perfekt, setzt sie doch voraus, daß die Vpn die Komponenten so ler-
nen, wie es der Experimentator plant, und auch keine anderen Komponenten mit dem jeweiligen Einstellungsobjekt verbinden. Das Modell nimmt an, mit jeder Komponente sei eine Bewertung verbunden, die von extrem positiv bis extrem negativ reichen kann. Diese Bewertungen können inter- und intraindividuell variieren, jedoch nicht in Abhängigkeit vom Einstellungsobjekt. Wenig Freizeit wäre demnach für jedes Berufsbild gleich negativ. Die Bewertung der Komponenten und das Ausmaß, in dem sie einem Einstellungsobjekt zugeschrieben werden, bestimmen nun die Einstellung zum Objekt. Aus den Bewertungen der zugeschriebenen Komponenten ergibt sich die Präferenz, wobei der Beitrag jeder Komponente zur Gesamtpräferenz nach dem Grad gewichtet wird, mit dem sie dem jeweiligen Objekt zugeschrieben wird. Die Ähnlichkeit zwischen zwei Objekten ergibt sich aus dem Ausmaß, in dem ihnen die gleichen Komponenten zugeschrieben werden.
1.2.
Annahmen
Aus diesen Vorstellungen lassen sich einige empirisch prüfbare Annahmen ableiten, die im Methodenteil in Hypothesen und Operationalisierungen übersetzt werden. (1) Zur gegebenenfalls vorläufigen Vereinfachung des Modells nehmen wir an, Komponenten würden unabhängig vom Einstellungsobjekt bewertet; wenn also beispielsweise eine Minderheit als «schmutzig» angesehen werde, so wirke das bei jeder beliebigen Minderheit gleichermaßen negativ. Für einen kurzen Verweisbenennen wir diese Annahme als «Objektunabhängigkeit der Komponentenbewertung». Diese Annahme ist nicht zentral; müßte man sie jedoch aufgeben, würde die Datenerhebung wesentlich aufwendiger und die Berechnungen zur Vorhersage von Einstellungsstruktur, Gesamt-Bewertungen und Einstellungsänderung komplizierter. (2) Urteile von Vpn über die Ähnlichkeit von Einstellungsobjekten (im folgenden «globale Ähnlichkeitsurteile» genannt) führen zur gleichen Einstellungsstruktur wie jene, die sich aus den Zuschreibungen der Komponenten zu den Objekten berechnen läßt. Wir bezeichnen diese
36
Feger & D o h m e n : Untersuchungen zum Komponentenmodell der Einstellungsobjekte
zentrale Annahme als die der «Strukturgleichheit». Sie behauptet die Äquivalenz von zwei Ähnlichkeitsdefinitionen: «similarity in the eye of the subject» und «similarity in the mind of the researcher». Diese Äquivalenz sei vorhanden, weil sich die globalen Ähnlichkeitsurteile bei jeder Person aus einer Berücksichtigung der den Objekten zugeschriebenen Komponenten ergeben. Um diese Annahme prüfen zu können, muß man globale Ähnlichkeitsurteile erheben («Wie ähnlich sind sich FDP und SPD» - z. B. auf einer Schätzskala), muß für die Komponenten erheben, als wie charakteristisch sie für jedes Einstellungsobjekt eingestuft werden, muß diese Zuschreibungen irgendwie objektweise zusammenfassen und dann mit den globalen Ähnlichkeitsurteilen vergleichen. (3) Die Präferenz für ein Einstellungsobjekt ergibt sich aus der Bewertung der Komponenten, die ihm zugeschrieben werden. Schreibt man einem Objekt nur sehr positiv bewertete Komponenten zu und stuft man zugleich sehr negativ bewertete als untypisch ein, so muß das Objekt insgesamt bei einer unabhängigen Globalbeurteilung als positiv bewertet werden. Wir bezeichnen diese Annahme als «Präferenzgleichheit». Zu ihrer Prüfung benötigen wir globale Präferenzurteile sowie Information darüber, wie stark welche Komponenten zugeschrieben und wie diese Komponenten im einzelnen bewertet werden. Die Komponentenbewertungen müssen dann objektweise zusammengefaßt und mit den globalen Präferenzen verglichen werden. Ein abgeleitetes Präferenzmaß für ein Objekt kann man also berechnen aus den Zuschreibungen und Bewertungen für dieses Objekt. Wenn, wie in der folgenden Erhebung, die Vpn ein «Idealobjekt» beurteilen, ergibt sich eine weitere Möglichkeit der Operationalisierung, die in Abschnitt 3.4 gewählt wurde. (4) Der Vollständigkeit halber sei auch eine Folgerung aus diesen Annahmen erwähnt, die erst in den Experimenten untersucht werden soll. Das Komponentenmodell stellt eine im einzelnen vorhersagbare Beziehung zwischen Einstellungsstruktur und Einstellungsänderung her. Einstellungen ändern sich, wenn Komponenten anders bewertet werden und wenn sich die Zuschreibungen von Kompo-
nenten zu Objekten ändern. Wir kürzen diese Annahme als «komponentenbewirkte Einstellungsänderung» ab.
2.
Datenerhebung
An der Untersuchung nahmen 11 Psychologiestudenten freiwillig t e i l - j e d e Person stellt eine vollständige und unabhängige Gelegenheit dar, das Modell zu prüfen, da Einstellung ein Individualkonstrukt ist (siehe FEGER, 1974). Erhoben wurde die Einstellung zu folgenden, mit den Vpn zuvor als für sie relevant diskutierten und definierten Tätigkeitsbereichen von Psychologen: A B C D E F G H I J K L
Betriebspsychologie Drogen- und Suchtberatung Ehe- und Familienberatung Erziehungsberatung Forschungstätigkeit Freie Praxis Gefängnispsychologie «die für mich ideale Tätigkeit» Psychologe im Kinderheim Markt- und Meinungsforschung Psychologische Tätigkeiten in der Psychiatrie Schulpsychologie
Die Erhebung erfolgte an zwei, eine Woche auseinander liegenden Zeitpunkten. Beim erstenmal wurden die Vpn gebeten, die Tätigkeitsbereiche paarweise hinsichtlich ihrer (globalen) Unähnlichkeit einzustufen, und zwar auf einer 21 -Punkte Schätzskala, die folgendermaßen verankert war: 1 = außerordentlich ähnlich, 21 = überhaupt nicht ähnlich. Alle Paare wurden dreimal beurteilt, jeweils in verschiedener Reihenfolge. Außerdem baten wir jede Vp, «Einfälle, Merkmale, Gesichtspunkte . . . alles, was Ihrer Meinung nach mit dem Tätigkeitsbereich zusammenhängt» für jede einzelne Tätigkeit aufzulisten. (Pro Bereich erwähnte eine Vp durchschnittlich etwa 6 Merkmale, die allerdings interindividuell recht verschieden waren.) In anschließenden Gesprächen wurden weitere Charakterisierungen gewonnen, die zusammengefaßt 68 Komponenten ergaben. Hier einige Beispiele: -
therapeutische Verfahren müssen oft eingesetzt werden, Tätigkeit ist relativ selbständig, Zusammenarbeit mit Ärzten ist erforderlich, Entwicklungsdiagnostik ist üblich, Tätigkeit erfordert Geduld, Arbeit überwiegend mit Jugendlichen, feste Arbeitszeit.
Die 68 Komponenten wurden zum 2. Erhebungszeitpunkt, getrennt für jedes Objekt, auf zwei Schätzskalen eingestuft. Die eine Skala bezog sich auf das Ausmaß, in dem eine Komponente dem jeweiligen Bereich zugeschrieben wurde und lautete: «Wie sehr trifft dieses Merkmal für diesen Tätigkeitsbereich zu?» 1 = «trifft s e h r z u » b i s 9 = «trifft gar nicht zu». Die andere Skala erfaßte die Bewertung der Komponenten: «Wie ist dieses Merkmal Ihrer Meinung
37
Zeitschrift für Sozialpsychologie 1984, 15, 3 3 - 4 3 nach zu bewerten?» 1 = «sehr positiv» bis 9 = «sehr negativ». A m 2. Zeitpunkt wurden auch die globalen Ähnlichkeitsurteile - nach den Einstufungen der Komponenten vollständig wiederholt.
3.
Ergebnisse
Wir werden uns zunächst mit der Reliabilität der Urteile befassen müssen. Da das Komponentenmodell sich auf individuelle Strukturen bezieht und starke interindividuelle Unterschiede möglich sind, sollen sich alle Analysen auf Beobachtungen an je einer Person beziehen. Weil Daten nur einer Person oftunreliabel sind, erscheinen Prüfungen der Reliabilität geboten. Danach werden die Annahmen des Modells untersucht, und zwar in der Reihenfolge, wie sie abgeleitet wurden. Bisweilen erweist es sich dabei als notwendig, zusätzliche Hypothesen zu prüfen, die eine Operationalisierung stützen oder alternative Deutungen ausräumen sollen.
3.1. Zur
Reliabilität
Drei Variablen wurden erhoben: globale Ähnlichkeitsurteile, Zuschreibungen und Bewertungen von Komponenten. Für diese Variablen wurden Generalisierbarkeitsstudien (CRONBACH et al., 1972) berechnet. Die Reliabilität der Komponentenbewertungen wird ebenfalls in 3.2 behandelt, da sie in dergleichen Varianzanalyse geprüft wird, die auch die Objektunabhängigkeit dieser Bewertungen untersucht. Die Generalisierbarkeitsstudie der globalen Ähnlichkeitsurteile basiert auf drei Faktoren.
Der Faktor A besteht aus den 6 Replikationen (3 zum ersten, 3 zum zweiten Erhebungszeitpunkt). Der Faktor B bezieht sich auf die 66 Paare der 12 Objekte, deren Ähnlichkeit eingeschätzt wurde. Die 11 Vpn bilden Faktor C. Die Ergebnisse der Analyse sind in Tabelle 1 enthalten. 1 In der Restvarianz ist die Tripelinteraktion und der Fehler enthalten. Da sie insgesamt nur 11% der erklärten Varianz ausmacht, kann der Fehler nicht groß sein, selbst wenn die in diesem Versuchsplan nicht bestimmbare Tripelinteraktion Null sein sollte. In diesem Sinn können wir die globalen Ähnlichkeitsurteile als reliabel bezeichnen. Von den Interaktionen zwischen zwei Faktoren erklärt nur die zwischen Personen und Paaren einen nennenswerten Varianzteil, und zwar 26%. Dies bedeutet, daß es eine starke interindividuelle Variation der Auffassungen gibt, als wie ähnlich die Objektpaare anzusehen sind. Diese Auffassungen sind jedoch über die Replikationen stabil. Der mit 56% bei weitem deutlichste Effekt entfallt auf die Paare. Die Vpn sind also eindeutig der Meinung, daß sich die Paare von Tätigkeitsbereichen in ihrer Ähnlichkeit stark unterscheiden. Die mit 5% nur mäßig ausgeprägten paar- und replikationsunabhängigen Unterschiede zwischen den Vpn lassen sich als Unterschiede im Skalengebrauch erklären, der in den folgenden Einzelanalysen nicht interessiert. ' Wir danken Herrn D. Leutner, Aachen, für die Überlassung des von ihm entwickelten Programms fiir Generalisierbarkeitsstudien.
Tab. /. Generalisierbarkeitsstudie fiir die globalen Ähnlichkeitsurteile. Quelle der Variation
QS
df
MS
F
% erklärte Varianz
(A) Replikationen (B) Paare (C) Vpn
199,15 79.175,57 6.796,67
5 65 10
39,83 1.218,09 679,67
8,74 267,44 149,22
0,14 56,35 4,84
A x B A x C BxC
1.631,73 1.642,75 36.252,79
325 50 650
5,02 32,86 55,77
1,10 7,21 12,25
1,16 1,17 25,80
Rest
14.802,70
3.250
4,55
Gesamt
140.501,36
4.355
10,54 100,00
38
Feger & Dohmen: Untersuchungen zum Komponentenmodell der Einstellungsobjekte
Die Stabilität der Ähnlichkeitsurteile läßt sich auch nichtparametrisch als Kendalls W bestimmen. Berechnet wurde für jede Vp die Übereinstimmung zwischen den aus 66 Rängen bestehenden 6 Rangreihen aller Objektpaare. Die in Tabelle 2 berichteten Koeffizienten sind für Rangplatzbindungen korrigiert, alle Werte sind auf dem 1%-Niveau von Null verschieden und substantiell. Für die Zuschreibungen wurde eine vergleichbare Generalisierbarkeitsstudie berechnet. Ihre drei Faktoren sind die 12 Bereiche, die 68 vorgegebenen Komponenten und die 11 Vpn. Die Ergebnisse finden sich in Tabelle 3. Aus der Größe der Residualvarianz schließen wir, daß die Zuschreibungen weniger reliabel sein könnten als die Ähnlichkeitsurteile. Der größte Varianzanteil entfallt auf die Interaktion zwischen Bereichen und Komponenten: Die Komponenten sind nach Meinung der Vpn für verschiedene Bereiche unterschiedlich typisch. Es hätte sein können, daß einige Vpn einige Bereiche als durch die Komponenten insgesamt als gut charakterisiert ansehen, andere Bereiche als weniger gut beschrieben. Die
Tab. 2: Kendalls W als Maß der Stabilität der globalen Ähnlichkeitsurteile. Vp
W
Vp
W
1 2 3 4 5 6
0,906 0,892 0,883 0,908 0,800 0,757
7 8 9 10 11 Mittel
0,832 0,900 0,896 0,894 0,904 0,870
Interaktion Bereiche x Vpn fallt jedoch gering aus (2%). Nicht ausgeprägt (7%) ist auch die Interaktion zwischen Komponenten und Vpn; es besteht also eine deutliche Übereinstimmung zwischen den Vpn in den Zuschreibungen, die sich auch, wie der geringe HauptefFekt «Vpn» zeigt, in der Skalenverankerung nicht stark unterscheiden. Die Komponenten selbst sind für die ausgewählten Bereiche unterschiedlich typisch, und die Bereiche werden durch die Komponenten unterschiedlich treffend charakterisiert.
3.2. Zur Objektunabhängigkeit Komponentenbewertung
der
Hauptsächlich um zu prüfen, ob die Bewertung der Komponenten auf dem Positiv-NegativKontinuum unabhängig von den 12 Einstellungsobjekten vorgenommen wird, berechneten wir eine Varianzanalyse mit den Bewertungsurteilen als der abhängigen Variable. Klassifikationsvariablen waren (A) die 12 Tätigkeitsbereiche, (B) die 68 Komponenten und (C) die 11 Vpn. Die beiden Faktoren (A) und (B) weisen wiederholte Messungen auf. Alle Faktoren betrachten wir als fest («fixed»). In jeder der A x B x C Zellen befindet sich nur eine Beobachtung (zum Modell siehe W I N E R , 1971, p. 394 und p. 539 oder M C N E M A R , 1962, p.318). Die Effekte sind so ausgeprägt hoch oder niedrig (s.u.), daß man auch bei mäßigen Verstößen gegen die Modellannahmen keine anderen Ergebnisse erwarten kann. Alle F-Werte sind bei a = 1% signifikant, was bei den schwachen
Tab. 3: Generalisierbarkeitsstudie für die Zuschreibungen. QS
df
MS
F
% erklärte Varianz
(A) Bereiche (B) Komponenten (C) Vpn
5.149,08 10.490,28 963,53
11 67 10
468,10 156,57 96,35
226,28 75,69 46,58
8,40 17,11 1,57
A x B A x C B x C
23.987,00 1.179,76 4.279,53
737 110 670
32,55 10,73 6,39
15,73 5,18 3,09
39,13 1,92 6,98
Rest
15.245,91
7.370
2,07
Gesamt
61.295,09
8.975
Quelle der Variation
24,87 100,00
39
Zeitschrift für Sozialpsychologie 1984, 1 5 , 3 3 - 4 3
Effekten an der großen Zahl der Freiheitsgrade liegt. Wir werden uns bei der Interpretation wie schon zuvor und im folgenden auf die Effektstärken beziehen. Die Ergebnisse der Varianzanalyse sind in Tabelle 4 wiedergegeben. Gleichzeitig mit der Prüfung der Objektunabhängigkeit der Bewertungen lassen sich Rückschlüsse auf die Reliabilität der Urteile ziehen, da bei Bestätigung der ersten Annahme der Faktor A - die 12 Tätigkeitsbereiche - als Replikation verstanden werden muß. Reliabilität setzt dann voraus, daß die Interaktionen, an denen A beteiligt ist, keine nenneswerte Varianz auf sich ziehen. Die Ergebnisse der Varianzanalyse lassen folgende Schlüsse zu: 1. Die Erhebung kann im oben erläuterten Sinn als reliabel angesehen werden: Die Interaktionen A x B u n d A x C sind zu vernachlässigen, die Restvarianz, die wegen der einfachen Zellbesetzung nicht weiter in Fehler und Tripelinteraktion zu zerlegen ist, beträgt lediglich 12%, was für sozialwissenschaftliche Untersuchungen sehr gering ist. Die Erhebung ist also präzise in dem Sinne, daß wenig unerklärte Varianz verbleibt. 2. Von den Interaktionen ist die zwischen Bereichen und Komponenten theoretisch die wichtige. Mit nur 1,5% Varianzerklärung besagt sie, daß - wie vom Komponentenmodell angenommen - Komponenten unabhängig vom jeweiligen Einstellungsobjekt bewertet werden. Nicht gemeint und nicht geprüft wurde die Annahme, Komponenten würden im Kontext unterschiedlicher anderer Komponenten inhaltlich verschieden interpretiert.
3. Die Interaktion zwischen Bereichen und Vpn ist zu vernachlässigen. Dies bedeutet nicht, daß alle Vpn die Bereiche gleich stark präferieren, denn die Globalpräferenzen hängen nach dem Komponentenmodell auch von den Zuschreibungen ab. Diese gering ausgeprägte Interaktion muß sich vielmehr dann einstellen, wenn alle Vpn objektunabhängig bewerten. 4. Die Interaktion zwischen Vpn und Komponenten ist ausgeprägt. Wie zu erwarten, bewerten verschiedene Personen die Komponenten unterschiedlich - dem einen bedeutet z. B. mehr Freizeit viel, dem anderen relativ wenig. 5. Der Faktor Bereiche vereinigt weniger als 1% Varianz auf sich. Da zu jedem Bereich die gleichen 68 Komponenten bewertet wurden, darf dem Modell entsprechend kein Unterschied bestehen. 6. Hingegen sind Komponenten (stärkster Effekt) ausgesprochen verschieden - es gibt sehr positive und sehr negative, über alle Vpn und Bereiche hinweg. 7. Die Unterschiede zwischen den Vpn sind gering. Möglicherweise handelt es sich auch hier um die oft nachgewiesenen Unterschiede im Skalengebrauch. Einige Vpn betrachten die Komponenten insgesamt als eher positiv, andere verankern sie stärker an negativen Pol. Da unsere Analysen ohnehin überwiegend intraindividuell angelegt sind, braucht dieser wenig ausgeprägte Unterschied nicht weiter verfolgt zu werden. Faßt man die 12 Bereiche als Replikationen auf, dann läßt sich die Reliabilität der Bewertungen als Konkordanzkoeffizient berechnen.
Tab, 4: Ergebnisse der Varianzanalyse zur Prüfung der Objektunabhängigkeit der Komponentenbewertungen. Quelle der Variation
QS
df
MS
F
% erklärte Varianz
(A) Bereiche (B) K o m p o n e n t e n (C) Vpn
62,36 21.643,29 2.282,15
11 67 10
5,67 323,03 228,21
8,89 506,72 357,98
0,16 54,27 5,72
A x B A x C B x C
595,15 174,33 10.427,16
737 110 670
0,81 1,58 15,56
1,27 2,49 24,41
1,49 0,44 26,14
4.698,91
7.370
0,64
39.883,35
8.975
Rest Gesamt
11,78
100,00
40
Feger & Dohmen: Untersuchungen zum Komponentenmodell der Einstellungsobjekte
Tab. 5: Konkordanzkoeffizienten für die Bewertungen.
Tab. 6: Zusammenhänge zwischen abgeleiteter und eingeschätzter Ähnlichkeit der Bereiche.
Vp
W
Vp
W
Vp
r
^2
Vp
r
1 2 3 4 5 6
0,863 0,820 0,639 0,901 0,920 0,832
7 8 9 10 11 Mittel
0,820 0,873 0,893 0,748 0,934 0,840
1 2 3 4 5 6
0,886 0,877 0,832 0,850 0,745 0,627
0,974 0,987 0,951 0,954 0,899 0,819
7 8 9 10 II Mittel
0,804 0,547 0,867 0,759 0,810 0,782
W bezieht sich pro Vp auf 12 Rangreihen mit 68 Rängen. Die hinsichtlich der zahlreichen Rangplatzbindungen korrigierten Koeffizienten in Tabelle 5 sind alle sehr signifikant und substantiell.
3.3. Prüfung der Annahme der Strukturgleichheit Diese Annahme setzt direkte Ähnlichkeitsurteile mit abgeleiteten Ähnlichkeitsmaßen in Beziehung. Die globalen Ähnlichkeitsurteile, die wir für die folgende Analyse berücksichtigen, beziehen sich lediglich auf die ( y ) Paare, die sich aus allen Bereichen außer dem idealen Tätigkeitsbereich bilden lassen. Die Paare, die den Idealbereich einbeziehen, werden in 3.4. analysiert, wenn es um die Prüfung der Annahme der Präferenzgleichheit geht. Die Auswertung geschah einzeln für jede Vp in folgenden Schritten. Zunächst wurden die ( 2 ) globalen Ähnlichkeitsurteile über die 6 Replikationen gemittelt. Um die abgeleiteten Ähnlichkeiten zu bestimmen, berechneten wir pro Paar von Bereichen das D-Maß (OSGOOD, 1955) aus den Zuschreibungen der Komponenten zu den beiden Bereichen; es ergaben sich pro Vp ( y ) D-Maße. Den Zusammenhang zwischen den Mittelwerten und den D-Maßen berechneten wir sowohl als Produkt-MomentKorrelation als auch als |a.2-Koefflzient. |x2 ist ein verteilungsfreies Maß für den monotonen Zusammenhang, das Rangplatzbindungen nicht berücksichtigt und auch den nichtlinearen monotonen Anteil des Zusammenhanges erfaßt (siehe M A I M O N , 1978). Beide Koeffizienten sind in Tabelle 6 wiedergegeben.
0,938 0,729 0,979 0,913 0,937 0,916
Alle Werte sind gesichert von Null verschieden, alle sind substantiell, bis auf diejenigen von Vp 8. Wir halten die Annahme der Strukturgleichheit für in dieser Studie empirisch bewährt. - Zu den hier und später berechneten D-Maßen sei angemerkt, daß das Komponentenmodell keinen bestimmten Koeffizienten für den Profilvergleich fordert. Wir haben einen bekannten Koeffizienten gewählt, der alle drei Hinsichten beim Profilvergleich (scatter, elevation, profile) berücksichtigt (siehe DIEHL & SCHÄFER, 1975).
3.4. Prüfung der Annahme der Präferenzgleichheit Das Komponentenmodell nimmt an, die globale Präferenz für ein Einstellungsobjekt ergebe sich aus der Bewertung der Komponenten nach dem Grad, in dem die Komponenten zugeschrieben würden. Als globale Präferenz für einen Bereich interpretieren wir das Urteil über die Ähnlichkeit zwischen diesem Bereich und dem idealen Tätigkeitsbereich. Wir berechneten an dieser Stelle die abgeleitete Präferenz nicht wie in Abschnitt 1 als möglich ausgeführt aus den Zuschreibungen und Bewertungen, weil sich dabei Standardisierungsprobleme (Zentrierung der Rohwerte führte zu den gleichen Ergebnissen wie den unten berichteten) ergaben, auf die wir hier nicht eingehen möchten, vielmehr ermitteln wir die indirekt bestimmte Präferenz als D-Maß zwischen den Zuschreibungen der Komponente zum Ideal und ihrer Zuschreibung zum jeweiligen Objekt. Pro Vp ergeben sich 11 globale Präferenzen aus den (gemittelten) Ähnlichkeitsurteilen und 11 D-Maße, die wir in Tabelle 7 vergleichen, und
41
Zeitschrift für Sozialpsychologie 1984, 15, 33 - 4 3 Tab. 7: Zusammenhänge zwischen globalen und abgeleiteten Präferenzen. Vp
r
^2
Vp
r
H2
1 2 3 4 5 6
0,902 0,921 0,844 0,763 0,898 0,868
0,974 0,989 0,919 0,890 0,977 0,979
7 8 9 10 11 Mittel
0,610 0,688 0,860 0,492 0,788 0,785
0,785 0,880 0,961 0,592 0,944 0,899
zwar wieder mit Hilfe des Produkt-Momentund des (j.2-Koeffizienten. Die in Tabelle 7 berichteten Koeffizienten fallen im Durchschnitt genügend hoch aus, allerdings etwas niedriger als die zur Prüfung der Strukturgleichheit. Ein Grund könnte darin liegen, daß die in Tabelle 7 vorgenommene Prüfung voraussetzt, die Vpn schrieben dem Idealobjekt Komponenten um so eher als typisch zu, je positiver sie diese bewerten. Die in Tabelle 8 berichteten Korrelationen der Bewertungen und Zuschreibungen aller Komponenten zum idealen Bereich - Produkt-Moment und |j.2 - zeigen, daß dies weitgehend, jedoch nicht vollkommen der Fall ist. Zum Vergleich berechneten wir diese Korrelationen zwischen Zuschreibungen und Bewertungen auch für die übrigen Bereiche und fanden als Mittelwerte f = 0,171 undjl 2 = 0,268. Die in Tabelle 8 berichteten hohen Zusammenhänge sind also, wie zu erwarten, spezifisch für das Idealobjekt. Wenn man die Ähnlichkeit zwischen irgendeinem Objekt und einem Ideal als Präferenz deutet, geht man von der Existenz nur eines Idealobjektes aus. Das Komponentenmodell nimmt das jedoch nicht als den allgemeinen Fall an. Vielmehr können sich mehrere gleichhoch positiv bewertete Einstellungsobjekte in Tab. 8: Korrelationen zwischen den Bewertungen und den Zuschreibungen der Komponenten zum Idealobjekt. Vp
r
1 2 3 4 5 6
0,777 0,794 0,860 0,876 0,922 0,895
0,934 0,946 0,982 0,978 0,994 0,972
Vp
r
1*2
7 8 9 10 11 Mittel
0,744 0,816 0,899 0,701 0,648 0,812
0,897 0,965 0,974 0,861 0,869 0,943
einem Bereich befinden, die einander unähnlicher sind als einige sehr positiv und sehr negativ bewertete Objekte. Dies entspricht in etwa den Ergebnissen von ABELSON ( 1 9 5 4 ) mit mehreren positiven und negativen Regionen in einem kognitiven Raum. 4.
Diskussion
Bei einigen Modellprüfungen hätten wir die erwarteten Zusammenhänge dann als noch stärker ausgeprägt darstellen können, wenn wir etwa über Minderungskorrekturen oder durch Pfadanalysen - die Unreliabilität der Messungen für «bereinigte» Zusammenhangsschätzungen berücksichtigt hätten. Die dabei zugrundezulegenden Modelle gehen jedoch von statistischen Annahmen aus, die wir nicht treffen wollten. Die Ergebnisse erscheinen uns ohnehin eindeutig. Bei einigen Auswertungen haben wir, um die Reliabilität zu erhöhen, Beobachtungen gemittelt, die zu verschiedenen Zeitpunkten erhoben wurden. BORG (1981, p.283) hat dieses Vorgehen mit dem Hinweis kritisiert, die Mittelwertsbildung liefere für Daten dieses Skalenniveaus keine invarianten Aussagen und sei somit unsinnig. BORG schlägt stattdessen vor, eine MDS-Lösung mit einem so erweiterten Optimierungskriterium zu bestimmen, daß statt nur einer Datenmatrix eine Menge solcher Matrizen durch nur eine Konfiguration erklärt wird. Dieser Weg ist dann u. E. der richtige, wenn ein bestimmtes Repräsentationsmodell angezielt wird, etwa in der MDS, was in unseren hier berichteten Auswertungen jedoch nicht der Fall ist. Ansonsten gilt allgemein, daß von mehreren Messungen deren zentrale Tendenz die beste Schätzung liefert, wenn - wie anzunehmen - die Fehler zufallsverteilt sind. In dieser Studie haben die Vpn die Einstellungsobjekte in einer der Erhebung vorausgehenden Besprechung selbst ausgewählt und definiert, weil wir sichergehen wollten, daß wir uns auf eine tatsächlich bestehende Einstellungsstruktur beziehen konnten. Auch die Komponenten wurden von den Vpn erfragt, und die große Anzahl von 68 Komponenten ergab sich aus dem Zusammenfassen aller- und sei es nur von einer einzigen Person und zu nur
42
Feger & D o h m e n : Untersuchungen zum K o m p o n e n t e n m o d e l l der Einstellungsobjekte
einem Bereich g e ä u ß e r t e n - P u n k t e . Die Ergebnisse der späteren Experimente erhärten jedoch die Vermutung, wesentlich weniger Komponenten seien pro Vp ausreichend, um Ähnlichkeitsstruktur und Präferenzen vorherzusagen. Zu den Vorläufern des Komponentenmodelles kann man Arbeiten von R O S E N B E R G (1956) zählen. Er sagte Richtung und Stärke des affektiven Aspektes einer Einstellung vorher, und zwar aus der Summe der Produkte der Wichtigkeit der Werte für eine Person und der Möglichkeit, daß das Einstellungsobjekt die Verwirklichung dieser Werte fördert oder hindert. Über ROSENBERG und ähnliche Ansätze geht das Komponentenmodell insofern hinaus, als mit wenigen Grundvorstellungen Präferenzen und kognitive Struktur und deren Änderung zugleich erklärt werden soll. Von R O S E N B E R G wie auch von FISHBEINS verschiedenen Arbeiten unterscheidet sich das Komponentenmodell in der Auffassung, aus welchen Gegebenheiten man die Struktur der Präferenzen und Kognitionen herleiten soll. R O S E N B E R G argumentiert eher funktionalistisch (oder handlungstheoretisch) von der Vorstellung aus, eine Person wolle mit Hilfe von Einstellungsobjekten Werte verwirklichen. Wir schließen dies im Modell nicht aus - wenn das für eine Person der Fall ist, sollte sich das in ihrer Wahl der relevanten Komponenten zeigen. Wenn eine Vp wie in dieser Studie selbst die Komponenten wählt oder, wie in späteren Experimenten, überhaupt n u r wenige zur Verfügung hat, dürften jene Komponenten untersucht werden, die für ihre Urteile wichtig sind. Es ist deshalb nicht verwunderlich, wenn in einer hier nicht dargestellten Auswertung eine zusätzliche Berücksichtigung der von Vpn eingestuften Wichtigkeit von Komponenten die Modellbestätigung nicht deutlich verbesserte. U m die Gesamtpräferenz aus den Bewertungen der Komponenten zu berechnen, benutzen wir als Formel die Summe der Produkte aus Zuschreibungen und Bewertungen über alle Komponenten. Auch diese Festlegung, die aus der Forschung zur Personwahrnehmung, Eindrucksbildung und aus den Arbeiten FISHBEINS bekannt ist, wird nicht vom Komponentenmodell zwingend nahegelegt. Sie ist aus meßtheoretischer Sicht problematisch und dient hier
nur als erste Annäherung. Das Komponentenmodell müßte erweitert werden, wenn man Kontexteffekte folgender Art nachweisen könnte: Die Zuschreibung der Komponente X wirkt sich auf die Gesamtpräferenz je nachdem aus, als wie typisch Komponente Y zugeschrieben wird, u. ä. Allerdings lassen sich Ergebnisse über Kontexteinflüsse aus dem Bereich der Personwahrnehmung nicht ohne weiteres übertragen. Dort wird der Prozeß der Informationsintegration zu einem einzelnen Objekt modelliert. Hier steht der Vergleich zwischen Objekten im Vordergrund. Wir erwarten, daß bei einer detaillierteren Analyse sich auch für das Komponentenmodell eine Formel besser als die Produktsumme bewähren könnte, die Kontexteffekte veranschlagt. Die Produktsumme ist eine kompensatorische Formel: Einige schwach negativ bewertete, wenig typische Komponenten werden durch wenige sehr positive und sehr typische aufgewogen. Wir haben auch ein disjunktives Vorgehen erprobt, nach dem die Gesamtpräferenz nur von den als extrem stark zugeschriebenen Komponenten abhängt. Die disjunktive Formel sagt jedoch die Präferenzen deutlich schlechter vorher als die kompensatorische. Das Komponentenmodell nimmt nicht an, Bewertungen und Zuschreibungen seien unabhängig. Im Gegensatz zu FISHBEIN und in Übereinstimmung mit SJÖBERG (1982) sollte der über die Komponenten pro Objekt berechnete Zusammenhang zwischen Zuschreibungen und Bewertungen von der globalen Präferenz der jeweiligen Person für ein spezifisches Objekt abhängig sein. SJÖBERG führte mehrere Studien mit verschiedenen Einstellungsobjekten durch, beispielsweise eine, in der die Folgen des Alkoholkonsums die Rolle der Komponenten unseres Modells spielen. Seine Vpn bewerteten diese Folgen und schätzten die Eintretenswahrscheinlichkeit ein. SJÖBERG stellte fest, daß die Orientierung gegenüber Alkohol den Zusammenhang zwischen Wahrscheinlichkeiten und Bewertungen bestimmte: Positive Korrelation bei positiver Gesamteinstellung, günstige Folgen sind wahrscheinlich, negative Korrelationen bei ablehnender Einstellung. Auch SJÖBERGS andere Studien erbrachten vergleichbare Ergebnisse. Wir halten dies für eine unabhängige Bestätigung eines Teils des Komponenten-
Zeitschrift für Sozialpsychologie 1984, 15, 33 - 4 3
modells, zugleich die der Wichtigkeit intraindividueller Analysen in diesem Bereich.
43 to a theory of attitude structure and change. In: Koch, S. (Ed.): Psychology: A study of a science. Vol. 3. New York: McGraw-Hill, pp. 4 2 3 - 4 7 5 . KRECH, D . & CRUTCHFIELD, R . S . 1948. T h e o r y a n d p r o b -
NAM, N. 1972. T h e dependability of behavioral measurements: Theory of generalizability for scores and profiles. New York: Wiley.
lems in social psychology. New York: McGraw-Hill. MAIMON, Z. 1978. The choice of ordinal measures of association. Quality and Quantity, 1 2 , 2 5 5 - 264. MCNEMAR, Q. 19623. Psychological Statistics. New York: Wiley. ROSENBERG, M.J. 1956. Cognitive structure and attitudinal affect. Journal of Abnormal and Social Psychology, 53, 367-372. SJÖBERG, L. 1982. Beliefs and values as attitude components. In: Wegener, B. (Hrsg.): Social attitudes and psychophysical measurement. Hillsdale, N.J.: Erlbaum, pp. 1 9 9 - 2 1 7 .
DIEHL, B. & SCHÄFER, B. 1975. T e c h n i k e n d e r D a t e n a n a l y -
SJÖBERG, L. & THORSLUND, C . 1979. A c l a s s i f i c a t o r y t h e o -
se beim Eindrucksdifferential. In: Bergler, R. (Hrsg.): Das Eindrucksdiflerential. Bern: Huber, pp. 157 - 211. FEGER, H. 1974. Die Erfassung individueller Einstellungsstrukturen. Zeitschrift für Sozialpsychologie, 5, 242 — 254. FEGER, H. 1979. Einstellungsstruktur und Einstellungsänderung: Ergebnisse, Probleme und ein Komponentenmodell der Einstellungsobjekte. Zeitschrift für Sozial-
ry of similarity. Psychological Research, 40,223 — 247. THURSTONE, L.L. 1928. Attitudes can be measured. American Journal of Sociology, 33,529 — 554. THURSTONE, L.L. 1959. Comment. American Journal of Sociology, 1946, 52, 3 9 - 4 0 . Nachdruck in: Thurstone, L. L.: T h e measurement of values. Chicago: Univ. of Chicago Press, pp. 320 — 322. UPMEYER, A. 1980. Protokoll des ersten Rundgespräches des Schwerpunktes «Einstellung und Verhalten». Berlin, 25. 1. 80. ^ H WINER. B.J. 19712. Statistical principles in experimental design. New York: McGraw-Hill. I A
Literatur ABELSON, R. P. 1954. A technique and a model for multidimensional attitude scaling. Public Opinion Quarterly, 18,405-418. BORG, I. 1981. Anwendungsorientierte Multidimensionale Skalierung. Berlin: Springer. CRONBACH, L . J . , GLESER, G . C . , N A N D A , H . &
RAJARAT-
psychologie, 10,331 - 3 4 9 .
FISHBEIN, M. & AJZEN, I. 1975. Belief, attitude, intention and behavior: An introduction to theory and research. Reading, Mass.: Addison-Wesley. KATZ, D . & STOTLAND, E. 1959. A p r e l i m i n a r y s t a t e m e n t
Buse & Pawlik: Inter-Setting-Korrelationen und Setting-Persönlichkeit-Wechselwirkungen
44
Inter-Setting-Korrelationen und Setting-Persönlichkeit-Wechselwirkungen: Ergebnisse einer Felduntersuchung zur Konsistenz von Verhalten und Erleben1 LOTHAR BUSE & K U R T PAWLIK Universität H a m b u r g
Es werden die Ergebnisse einer Felduntersuchung zur intersituativen Konsistenz von Erleben und Verhalten berichtet. Datenbasis sind die Selbstprotokolle von 104 Versuchspersonen bezüglich Umgebung, Verhalten und Stimmung zum Zeitpunkt der Aufzeichnung. Protokolle wurden a n h a n d von Item-Inventaren zu 130 unregelmäßig über zwei einwöchige Erhebungsphasen verteilten Terminen gefuhrt. Die Realisierung der Zeitstichprobe und die Registrierung der Daten erfolgte rechnergestützt («Verhaltensdatenrecorden> auf Mikroprozessor-Basis). Ergebnisse an fünfzehn- bis siebzehnjährigen Oberschülern d o k u m e n tieren zufriedenstellende Stabilität über einen Zeitraum von 6 Monaten. Inter-Setting-Korrelationen (Korrelationen zwischen verschiedenen Wohn-, Publikums- und Durchgangssettings; teilweise differenziert nach Tageszeit und Anwesenheit anderer Personen) belegen hohe Konsistenz von Stimmungen und kognitivem Verhalten. Der Befund wird durch die geringe Anzahl statistisch bedeutsamer Wechselwirkungen zwischen Setting- und Persönlichkeitsvariablen unterstrichen. Die Ergebnisse entsprechen der Alltagserfahrung und widersprechen jenen aus Fragebogen* und Experimentaluntersuchungen. Methodische und logische Einwände werden diskutiert. Das Erfordernis ökologischer Repräsentativität wird betont.
Inter-setting-correlations and setting-personality-interactions: results of a field study on behavioral and emotional consistency. Ecological and psychological data were recorded by n = 104 subjects on a total of 130 occasions distributed over two one-week periods. Time-sampling and data recording was achieved through a newly developed computer-based ¥] + n~ n *
Der Erwartungswert Ü e mit Sicherheitsfaktor X
je Analyseeinheit stellt sich bei allei-
niger Betrachtung seiner Obergrenze ein zu
Tab.3: Bei a = b = l u n d bei n = 500, W = 100 : W e r t e von P Z b c o b PZ C a = 0 , 0 5 , a = 0 , 0 1 , a = 0 , 0 0 1 u n d e n t s p r e c h e n d e X D -Werte. bei n = 5 0 0 , W=400,
Ü
i= l
sich in diesem Fall die beobachtete Übereinstimmung einstellt zu
W O L F konstatiert nun, daß in einem Sample von n Analyseeinheiten W Analyseeinheiten nach Möglichkeit A) und ( n - W ) Analyseeinheiten nach Möglichkeit B) verkodet werden können, wobei beiden Möglichkeiten das gleiche Ka-
Kategorien
zugrunde liegt und folgert,
kz-2k + 2
1 • 1 + (k-l) (k-1) U c =
n
max,
Xmax, obere Vertrauensgrenzen
a
n o von P Z e
max
bei
0,05no
0,0ino
0,001 n o
0,05^-0
0,01
0,001^-0
^"rnax.o
k= 2 k= 3 k= 4 k= 5 k= 6 k= 7 k= 8 k= 9 k = 10 k = 11 k = 12 k = 13 k = 14 k = 15 k = 16 k = 17 k = 18 k = 19 k = 20 k = 21 k = 22 k = 23 k = 24 k = 25
0,800 0,866 0,900 0,920 0,933 0,943 0,950 0,956 0,960 0,964 0,967 0,969 0,971 0,973 0,975 0,976 0,978 0,979 0,980 0,981 0,982 0,983 0,983 0,984
0,500 + 0,556+ 0,625 + 0,680 + 0,722+ 0,755+ 0,781 + 0,802+ 0,820 + 0,835+ 0,847+ 0,858 + 0,867 + 0,876 + 0,883 + 0,889+ 0,895 + 0,900 + 0,905 + 0,909 + 0,913+ 0,917+ 0,920+ 0,923+
0,354X o 0,287X o 0,242X o 0,209X o 0,183X o 0,163X o 0,146X o 0,133X o 0,121X o 0,112X o 0,104X o 0,097X o 0,091X 0 0,085 X0 0,080X o 0,076X o 0,072X o 0,069X o 0,066X o 0,063 X0 0,060X o 0,058X o 0,055X o 0,053X o
1,414 1,549 1,549 1,539 1,519 1,507 1,497 1,488 1,482 1,476 1,471 1,467 1,463 1,460 1,457 1,455 1,453 1,451 1,449 1,447 1,446 1,445 1,443 1,442
0,975 0,960 0,954 0,957 0,962 0,965 0,968 0,970 0,973 0,975 0,977 0,979 0,980 0,981 0,982 0,982 0,983 0,983 0,984 0,984 0,985 0,986 0,986 0,987
0,995 0,990 0,985 0,986 0,987 0,988 0,988 0,989 0,990 0,991 0,991 0,992 0,992 0,993 0,993 0,993 0,993 0,993 0,993 0,993 0,994 0,995 0,995 0,996
0,999 0,999 0,997 0,997 0,997 0,997 0,997 0,997 0,997 0,998 0,998 0,998 0,998 0,998 0,998 0,998 0,998 0,998 0,998 0,998 0,998 0,998 0,998 0,998
1,344 1,408 1,359 1,328 1,312 1,292 1,279 1,265 1,259 1,251 1,251 1,250 1,245 1,234 1,232 1,221 1,218 1,206 1,205 1,195 1,198 1,199 1,210 1,212
1,400 1,513 1,487 1,467 1,449 1,433 1,416 1,408 1,399 1,394 1,386 1,384 1,377 1,375 1,369 1,365 1,356 1,351 1,342 1,338 1,348 1,355 1,356 1,369
1,411 1,544 1,537 1,467 1,504 1,489 1,477 1,468 1,457 1,456 1,453 1,446 1,443 1,434 1,431 1,431 1,426 1,424 1,418 1,418 1,415 1,408 1,407 1,407
k=
0,992
0 , 9 9 6 + 0,003 X0
1,414
0,9998
0,99997
1,000
1,347
1,407
1,414
1,000
1,000 + 0,000X o
1,414
1,000
1,000
1,000
1,414
1,414
1,414
500
k == (00-1)
92
Zelinka: Erwiderung auf Wolfs A n m e r k u n g e n z u m Paarkoeffizienten PZ
k -2k + 2 PZ„
:
+
/
Xc —
(k - 2 k + 2) ( 2 k - 2 )
w X PZ
=
PZE
i=l
X
n i=W+l
i=l
—
PZ„
I
PZC
w
n-W
In Anlehnung an W O L F S Überlegungen und bei n=500 und W=400 treten für k = 2 bis k=25 die in Tabelle 3 wiedergegebenen Werte für PZ b e o b und PZe.max e i n .
Tabelle 3 bestätigt die Beobachtung von W O L F , daß in dem hier betrachteten Fall a = b = l , PZ b e o b die Eigenschaft hat, mit wachsendem k gegen 1 zu streben. Dieser Effekt geht in der Tat auf die Berücksichtigung der Null-Transformationen zurück, ob er aber unerwünscht ist, mag offen bleiben, da im ähnlichen Maß auch die Prüfgröße PZ e max die auftretenden Null-Transformationen berücksichtigt und ebenfalls mit steigendem k gegen 1 strebt. Von Bedeutung ist in diesem Zusammenhang jedoch W O L F S Anmerkung, daß in diesem Extremfall die Berechtigung bestritten werden kann, die Standardnormalvariable für X - selbst bei k > 25 - zu setzen. Da der wahrscheinlichkeitstheoretische Ansatz bei der Bestimmung von Ü e bzw. PZ e max nicht zuläßt, daß einer dieser Werte größer als 1 wird, ist der Spielraum von X in Abhängigkeit von Ü e und k im allgemeinen Fall - durch die vorgegebene Anzahl der verkodbaren Kategorien vorgegeben: X kann nur zwischen 0 und X m a X i 0 bei der Berechnung von PZ e max variieren. Im vorliegenden Fall bestimmt sich
Ä i /f l v * r
k -2k + 2
unabhängig davon, wie sich n auf W und auf (n-W) verteilt. Die vorgeschlagene Setzung von X als Standardnormalvariable ( Z E L I N K A , p.143) kann nur dann vorgenommen werden - und das sind nicht die wenigsten bei konkreten Fragestellungen vorkommenden Fälle - wenn k Ü e > 5 und k ( 1 - Ü e ) > 5
(vgl.
SACHS,
p.259).
Eine noch kompaktere Einschränkung wird durch die Bedingung getroffen, daß bei
k üe (l-Üe)« 9
(vgl. S A C H S , p. 134 mit anderen Symbolen)
nicht mehr von einer Normalverteilung, sondern von einer Binomialverteilung ausgegangen werden muß. Mit guter Annäherung an die exakten oberen Vertrauensgrenzen für Ü E (vgl. D O C U M E N T A G E I GY, pp.85-105) lassen sich die oberen Schranken a n 0 der Konfidenzintervalle um Ü e und je nach angestrebtem Signifikanzniveau allgemein berechnen nach (kÜ e + 1 ) F an
°
=
k-kü e + (küe + l ) F m l t a F h = 2(kÜ = +1);v ^ 2(kkÜ e»l
(vgl. S A C H S , p.258 mit anderen Symbolen). 3 Für alle Fälle, bei denen binomialverteilte Grundgesamtheiten vorliegen, gilt somit Üe(l-Üe)
(kÜ e + 1 ) F k-kUe + (kUe
= Üe + A +l)F
=PZe,max
und der Vollständigkeit halber kÜ, kÜc+(k-kÜe+l)F aK*aK.
0Xu
=
„ U e (l-U e ) 1/
" f
k
=PZ„
aX0beikÜe(l-Üc)>9.
Für den von -P^E.MAX ~ F Z
= U cC - 0uX U
EJMAX
diskutierten Extremfall gilt
WOLF
1
W
-e.max=
DA— X PZE W :i = l
MAX
_ L„
^
R
"
n-W i=W+l
PZE
MAX —
= PZ.
die berechneten oberen Schranken a n o für den diskutierten Fall a = b = l bei k = 2 bis k=25 sind in Tabelle 3 für die drei gängigen Signifikanzniveaus a=0,05, a = 0,01 und a=0,001 eingetragen. Um eine Reliabilitätsentscheidung nach PZbeob > PZe,
3
PZE,
MAX
(1
PZE
MAX)
Ordnungshalber sei auch die Formel zur Berechnung der
unteren Schranke a n u des Konfidenzintervalls angegeben: "
kÜ„ -mit „Fl a r lvj k U e + ( k - k U e + 1) F
-2 (k-klle + 1); » 2 = 2kUJ •
Die Schranken der F-Verteilung bei a % Irrtumswahrscheinlichkeit sind z . B . zu entnehmen VAN DER WAERDEN, pp.340-344,
DOCUMENTA
GEIOY,
pp. 116-124 u.a. Standardwerken.
pp.40-41
oder
SACHS,
Zeitschrift für S o z i a l p s y c h o l o g i e 1984, 1 5 , 8 6 - 9 3
treffen zu können, ist die Anzahl n der verkodeten Analyseeinheiten in das Kalkül mit einzubeziehen; auchJiier gilt, daß die Standardnormalvariable für Z nur gesetzt werden darf, wenn
im von W O L F angeführten Beispiel ist dies nicht gerechtfertigt, da bei k = 2 5 , n=500, W=400, a = b = l und PZ e m a x = 0,987 bei a = 0 , 0 5 nPZe.maxü-PZe.maxHMie^.*
PZe.max (1 PZe.max)
( " PZe.max+ D F
PZe.max+ (nPZe,max + l)F b e
'
F(v
l = 2nPZe
max
+ 2; v2 = 2n - 2nPZc
max
)
ist die Obergrenze des Konfidenzintervalls und mit (pze,max-z]/
PZ„
wurde seitens der Konstanzer Ar-
99
Zeitschrift f ü r Sozialpsychologie 1984, 1 5 , 9 7 - 9 9
beitsgruppe auf anscheinende Widersprüche in verschiedenen Berichten hingewiesen. Diesen Anmerkungen wurde entnommen, daß sich die Operationalisierung des Faktors , i. e. die Variation unterschiedlicher schädigender Folgen, in den einzelnen Untersuchungen unterscheidet und diesem bei der Darstellung und Interpretation der Ergebnisse Rechnung getragen werden muß. In diesem Zusammenhang wurde ergänzend angemerkt, daß einige Münsteraner Formulierungen Alternativen implizieren (z. B. zur Beurteilungsdivergenz «nicht angemessen» vs. «angemessen»), die dem Ansatz entsprechend als Relationen formuliert werden sollten und zwar sowohl in aufgestellten Hypothesen als auch Interpretationen der Ergebnisse. Im Anschluß daran wurden Möglichkeiten der Versuchsanlage zur Überprüfung verschiedener Hypothesen zur Perspektivendivergenz zwischen Akteur und Betroffenem in aggressiven Interaktionen (insbesondere bei mehreren aufeinanderfolgenden Ereignissen) erörtert. Im Hinblick auf die Arbeitsphasen und -ergebnisse des Konstanzer Projektes wurden vor allem Fragen bezüglich der geplanten Arbeitsphase der Modifikation aggressionsbezogener Berufstheorien erörtert. Von besonderem Interesse war dabei, anhand welcher Kriterien
unangemessene und einer Änderung bedürftige aggressionsbezogene Berufstheorien erkannt werden und wie die Festlegung des Zieles einer Veränderung des Unterrichtshandelns von Lehrern entsprechend der Berufstheorie aussieht. ad 3 Aufgrund der Fülle gemeinsam interessierender Diskussionspunkte und der größeren Anzahl teilnehmender Projekte als bei der letzten Arbeitstagung in Konstanz blieb kaum noch Zeit, gesondert einen Gedankenaustausch zu Perspektiven der weiteren Arbeit vorzunehmen. Dies erwies sich allerdings insofern als unproblematisch, als schon während der Darstellung von Ergebnissen und Diskussion einzelner Aspekte Schlußfolgerungen für die weitere Arbeit jeweils vorgenommen wurden. Insbesondere wird in den Projekten, die in Zukunft noch weitergeführt werden, die Auswertung verbaler Daten erfolgen. Zu damit verbundenen Reliabilitäts- und Validitätsproblemen erwies sich ein Gedankenaustausch als fruchtbar. AMÉLIE MUMMENDEY, G A B I LÖSCHPER, VOLKER LINNEWEBER
100
Autoren LOTHAR BUSE
Dipl.-Psych. 1970 (Hamburg) Dr.phil. 1975 (Hamburg) Professor, Psychologisches Institut I der Universität Hamburg Wichtige Veröffentlichungen Response-Set-Forschung (1976,1980) Interessen- und Intelligenzforschung (1975, 1982) Gültigkeit des EigenschaftsbegrifFs (1980) Überprüfung von Eysencks Astrologie-Persönlichkeitskorrelationen (1979, zusammen mit K . PAWLIK)
Rechnergestützte Verhaltensregistrierung im Feld (1982, zusammen mit K. PAWLIK) Derzeitige Forschungsarbeiten Attributionsforschung Umweltpsychologie Adresse: Prof. Dr. L. Buse Psychologisches Institut I der Universität Hamburg Von-Melle-Park 11 D - 2 0 0 0 Hamburg 13 PAUL DOHMEN
Dipl.-Psych. 1977 (Aachen) Dr.phil. 1983 (Aachen) Wiss. Mitarbeiter am Psychologischen Institut I der Universität Hamburg Derzeitige Forschungsarbeiten Arbeiten zum Komponentenmodell Beziehung zwischen Einstellung und Verhalten Adresse: Dr. Paul Dohmen Psychologisches Institut I Universität Hamburg Von-Melle-Park 5 D - 2 0 0 0 Hamburg 13 THOMAS ECKES
Dipl.-Psych. 1977 (Saarbrücken) Dr.phil. 1981 (Saarbrücken) Wissenschaftlicher Angestellter in einem DFG-Projekt (Erziehungswissenschaftliche Hochschule Rheinland-Pfalz, Abteilung Landau)
Wichtige Veröffentlichungen Clusteranalysen (mit ROSSBACH, H., 1980) Ein nonparametrischer Test für die Ähnlichkeit zwischen Aufteilungen einer Objektmenge (1982) Zwei diskrete Modelle zu Ähnlichkeitsstrukturen im Vergleich: Das hierarchische und das additive Cluster-Modell (1982) Derzeitige Forschungsarbeiten Methoden der statistischen Beurteilung von Clusterlösungen Prototypikalität in der Personwahrnehmung Faktoren der Typikalität von Objekten: Familienähnlichkeit versus Vertrautheit Adresse: Dr. Thomas Eckes EWH Landau Seminar für Psychologie Industriestraße 15 D - 6 7 4 0 Landau E D G A R ERDFELDER
Dipl.-Psych. 1980 (Göttingen) Wiss. Angestellter am Fachbereich I - Psychologie der Universität Trier Derzeitige Forschungsarbeiten Hypothesentestende Ordinalstatistik in der experimentellen Psychologie Wahrnehmungstäuschungen Adresse: Dipl.-Psych. Edgar Erdfelder Fachbereich I - Psychologie der Universität Schneidershof D — 5500 Trier HUBERT FEGER
Dipl.-Psych. 1964 (Bonn) Dr.phil. 1968 (Bonn) Habilitation 1971 (Bonn) Ordentlicher Professor am Fachbereich Psychologie der Universität Hamburg Wichtige Veröffentlichungen Konflikterleben und Konfliktverhalten (1978) Arbeiten zur Einstellungsmessung und Strukturanalyse sozialer Beziehungen Derzeitige Forschungsarbeiten Ordinale Netzwerkskalierung
101
Zeitschrift fur Sozialpsychologie 1984, 15, 1 0 0 - 1 0 2 Adresse: Prof. Dr. Hubert Feger Universität Hamburg Psychologisches Institut I Von-Melle-Park 6 D —2000 Hamburg 13 WALDEMAR LILLI
Dipl.-Kaufmann 1964 (Mannheim) Dr.rer.pol. 1968 (Mannheim) Habilitation 1978 (Mannheim) Professor an der Fakultät für Sozialwissenschaften, Universität Mannheim Wichtige Veröffentlichungen Sozial Akzentuierung (1975) Grundlagen der Stereotypisierung (1982) Derzeitige Forschungsarbeiten Empirische und theoretische Arbeiten zum Labeling-Approach und Urteilsheuristiken Adresse: Prof. Dr. Waldemar Lilli Fakultät für Sozialwissenschaften Universität Mannheim Schloß D - 6 8 0 0 Mannheim 1 K U R T PAWLIK
Dr.phil. 1959 (Wien) Habilitation 1965 (Wien) Ordentlicher Professor für Psychologie, Psychologisches Institut I der Universität Hamburg Wichtige Veröffentlichungen Personality Factors in Objective Test Devices (1965, zusammen mit HUNDLEBY & C A T TELL)
Dimensionen des Verhaltens (1968) Diagnose der Diagnostik (1976) Multivariate Persönlichkeitsforschung (1982) Derzeitige Forschungsarbeiten Multivariate Persönlichkeitsforschung Neuropsychologie des Lernens Umweltpsychologie Adresse: Prof. Dr. K. Pawlik Psychologisches Institut I der Universität Hamburg Von-Melle-Park 11 D —2000 Hamburg 13 JÜRGEN R E H M
Student der Psychologie Universität Mannheim Adresse: Jürgen Rehm N 4,10 D - 6 8 0 0 Mannheim 1
RAINER REISENZEIN
Dr.phil. 1980 (Salzburg) Wiss. Mitarbeiter FU Berlin Wichtige Veröffentlichungen Zum Begriff der sekundären Verstärkung (1980) The Schachter theory of emotion: Two decades later(1983) Adresse: Dr. Rainer Reisenzein Ulmenallee 32 D - 1000 Berlin 19 BERND SIX
Dipl.-Psych. 1970 (Bonn) Dr.phil. 1974 (Bonn) Habilitation 1980 (Bonn) Lehrstuhl für Sozial- und Organisationspsychologie Wichtige Veröffentlichungen Sozialpsychologie des Vorurteils (zusammen m i t B.SCHÄFER, 1978)
Motivationstheorie und Handlungstheorie (zusammen mitB.HocKE-PÖRZGEN, 1983) Effektivität der Werbung (1983) Derzeitige Forschungsarbeiten Einstellung und Handlung Soziale Dichte und Soziale Enge, Personwahrnehmung Attributionsforschung; Stereotype und Vorurteile; Einstellungsänderung Adresse: Prof.Dr. Bernd Six EWH Landau Seminar für Psychologie Industriestraße 15 D - 6 7 4 0 Landau
F R I T Z STRACK
Dipl.-Psych. 1974 (Mannheim) M.A. 1976 (Stanford) Dr.phil. 1983 (Mannheim) Wichtige Veröffentlichungen Manipulating salience: causal assessment in natural settings (zusammen mit N . SCHWARZ, 1981) Effects of salience and time pressure on ratings of social causality (zusammen mit R. ERBER u n d R . A . W I C K L U N D , 1982) Derzeitige Forschungsarbeiten Soziale Kognition, Bildhafte Repräsentation sozialer Ereignisse, Glück und Zufriedenheit
102 Adresse: Dr. Fritz Strack Universität Mannheim Sozialpsychologie Schloß D - 6 8 0 0 Mannheim 1 FRITZ ZELINKA
Dipl.-Soz. 1968 (München) Dr.soc.wiss. 1973 (Bielefeld) Venia legendi 1975 (Wuppertal, Bielefeld) Wiss. Direktor und Leiter des Projektbereichs «Organisation, Kommunikation, Information» am Sozialwissenschaftlichen Institut der Bundeswehr (SOWI), München Wichtige Veröffentlichungen Präferenzen sozialwissenschaftlicher Militärforschung in der Bundesrepublik Deutschland - Ein inhaltsanalytisches Modell zur Forschungsplanung (1979)
Erziehung zur Wehrpflicht? Eine Inhaltsanalyse sicherheitspolitischen Lehrstoffs in Sozialkundebüchern der Bundesrepublik Deutschland ( 1 9 8 0 , zusammen mit A N K E R ) Konflikt und Herrschaft im Luftverkehr. Organisationssoziologische Erinnerungen an die antiquierte Flugsicherung (1981) Derzeitige Forschungsarbeiten Vermittlung sicherheitspolitischer Inhalte durch Lehrer in den Schulen der Bundesrepublik Deutschland Wandel der Offiziersqualifikation vom Kaiserheer bis zur Bundeswehr. Dokumentenanalyse Inhaltsanalyse der Bundeswehrzeitschrift «Information für die Truppe» Adresse: Dr. Fritz Zelinka Sozialwissenschaftliches Institut Postfach 401609 Winzererstraße 52 D - 8 0 0 0 München 40
im
7
• ' i f *
""'
'•"khm
h
ein?
illh wom
">gon
Änderungen «»rbchaltcn
hhi
'"«lu«s
s
Birkhäuser I Verlag Basel BOMOII »«»girt
Kurt-Lewin-Werkausgabe herausgegeben von C.-F. Graumann
Band 6: Psychologie der Entwicklung und Erziehung Herausgegeben von Franz E. Weinert und Horst Gundlach. 1982, 520 Seiten, 4 Tafeln, 108 Abbildungen, 5 Tabellen, gebunden Fr. 104.— Dieser Band enthält Lewins Beiträge zur modernen Entwicklungs- und Erziehungspsychologie.
Band 2: Wissenschaftstheorie II Herausgegeben von Alexandre M6traux. 1983, 531 Seiten, 55 Abbildungen, 4 Tabellen, gebunden Fr. 104.— In der 1922 erstmals veröffentlichten Monographie über den Genesebegriff unternimmt Lewin den Versuch, das Problem der unterschiedlichen Gegenstandsarten unter dem Gesichtspunkt ihrer Entstehung zu thematisieren. Subskriptionspreis pro Band: Fr. 8 8 . - (Die Subskription verpflichtet zur Abnahme des Gesamtwerkes und endet mit dem Erscheinen des letzten Bandes)
Verlag Hans Huber Bern Stuttgart Wien
Mario von Cranach / Urs Kalbermatten / Katrin Indermühle / Beat Gugler (Herausgeber)
Zielgerichtetes Handeln 1 9 8 0 , 3 3 9 Seiten, Abbildungen, Tabellen, kartoniert Fr. 3 2 . - / D M 3 5 . A u f der Grundlage der naiven Verhaltenstheorie, der Systemtheorie und des Interaktionismus w i r d eine Handlungstheorie entwickelt und in ersten Ansätzen empirisch überprüft. Dazu werden konkrete, zielorientierte Handlungen systematisch beobachtet; die subjektiven Erlebnisse der Handelnden werden erfragt und inhaltsanalytisch erfasst, und die soziale Bedeutung der Handlung w i r d von naiven Beobachtern interpretiert.
Winfried Hacker / Walter V o l p e r t / Mario von Cranach (Herausgeber)
Kognitive und motivationale Aspekte der Handlung 1 9 8 3 , 1 9 0 Seiten, 7 2 Abbildungen, 1 3 Tabellen, kartoniert Fr. 2 7 . - / D M 2 9 .
Kurt Pawlik (Herausgeber)
Multivariate Persönlichkeitsforschung 1 9 8 2 , 3 8 2 Seiten, 4 0 Abbildungen, 7 0 Tabellen, kartoniert Fr. 6 6 . - / D M 73.-
Spezielle Arbeitsund Ingenieurpsychologie in Einzeldarstellungen Herausgeber: W. Hacker Band 1 W. Hacker
Psychologische Bewertung von Arbeitsgestaltungsmaßnahmen Ziele und Bewertungsmaßstäbe Unter Mitarbeit von P. Richter 2., veränderte und ergänzte Auflage 1984. Etwa 130 Seiten. Gebunden D M 24,80; approx. US $ 9.70. ISBN 3-540-12523-X
Aufbauend auf einer Konzeption zur psychischen Regulation von Arbeitstätigkeiten werden die psychologischen Ziele und Bewertungskriterien von arbeitsgestalterischen Lösungen vorgestellt. Im Mittelpunkt der Arbeit stehen die Bewertungsmerkmale, d.h. wichtige einschlägige Normen und Vorgehensweisen für die unterschiedlichen Bewertungsebenen wie Ausführbarkeit von Arbeitsaufträgen bzw. mit der Arbeitstätigkeit verbundene Kriterien wie Erhaltung der Gesundheit, Beeinträchtigungslosigkeit sowie persönlichkeitsfördemde Gestaltung. Band 2 W. Hacker, P. Richter
Psychische Fehlbeanspruchung: Psychische Ermüdung, Monotonie, Sättigung und Streß 2., veränderte und ergänzte Auflage 1984. Etwa 230 Seiten. Gebunden D M 42,80; approx. U S $ 16.70. ISBN 3-540-12524-8
Dieser Band der Reihe Spezielle Arbeits- und Ingenieurpsychologie beschäftigt sich mit der Analyse und Bewertung psychischer Beanspruchung im Arbeitsbereich. Ausführlich erörtert werden Symptomatik und Entstehungsbedingungen psychischer Ermüdung, Monotonie, psychischer Sättigung und Streß. Die Autoren informieren über neurophysiologische Grundlagen psychischer Beanspruchung sowie über Maßnahmen der Arbeitsinhalts- und Trainingsgestaltung zur Vermeidung psychischer Über- oder Unterforderung. Darüberhinaus wird auf Langzeitfolgen psychischer Fehlbeanspruchung im Arbeitsbereich sowie auf ein tätigkeitsorientiertes Streßkonzept eingegangen. Band 3 B. Matern
Psychologische Arbeitsanalyse Walter V o l p e r t (Herausgeber)
Beiträge zur psychologischen Handlungstheorie M i t einem V o r w o r t von E. Ulich. 1 9 8 0 , 2 3 2 Seiten, Abbildungen und Tabellen, kartoniert Fr. 3 8 . - / D M 4 2 . -
Verlag Hans Huber Bern Stuttgart Wien
1984. Etwa 250 Seiten. Gebunden D M 44,80; approx. US $ 17.40 ISBN 3-540-12525-6
Die Autorin stellt Methoden der psychologischen Arbeitsanalyse vor, mit dem Ziel der Arbeitsgestaltung. Als Schlüssel für die psychologische Arbeitsgestaltung wird die Ermittlung der psychischen Regulation von Arbeitstätigkeiten sowie deren Bedingung betrachtet. Das Buch enthält Anleitungen zur Planung, Durchführung, Auswertung und Interpretation psychologischer Arbeitsanalysen.
Springer-Verlag Berlin Heidelberg New York Tokyo Tiergartens«. 17, D-6900 Heidelberg 1, 175 Fifth Ave., New York, NY 10010, USA, 37-3, Hongo 3-chome, Bunkyo-ku, Tokyo 113, Japan
Zeitschrift für Sozialpsychologie Geschäftsfuhrender Herausgeber (1984/85):
Redaktion:
Prof. Dr. Klaus Holzkamp
Dipl.-Psych. Morus Markard
Freie Universität Berlin Psychologisches Institut, WE 3 Habelschwerdter Allee 45 D - 1 0 0 0 Berlin 33 Tel. 030/8384806
Eylauer Straße 23 D - 1 0 0 0 Berlin 61 Tel. 030/7858186
Die Zeitschrift für Sozialpsychologie ist für den deutschen Sprachraum das erste Organ, welches Forschungsarbeiten aus den Gebieten der Sozialpsychologie sowie der Sprachpsychologie und der politischen Psychologie an einem Ort vereinigt, und das der wissenschaftlichen Kontroverse zwischen verschiedenen theoretischen Standpunkten das ihr gemäße F o r u m schafft. Dieses F o r u m ist ebenso offen für die Methodologie der empirischen Sozialforschung, für Beiträge sozialpsychologischer Forschung zu jeglichen Anwendungsfeldern, wie für Beiträge zu interdisziplinären Positionen der Sozialpsychologie in Sozial-(Wirtschafts-, Politik- und Rechts-)Wissenschaften und Bio-Wissenschaften. Eine weitere Aufgabe sehen die Herausgeber in der Dokumentation von Neuerscheinungen, von Artikeln aus anderen deutschsprachigen Zeitschriften, von Dissertationen und Diplomarbeiten und von Nachrichten über den Status der Sozialpsychologie, repräsentiert durch - auch interdisziplinäre - wissenschaftliche Veranstaltungen. Die Autoren werden gebeten, ihre Manuskripte in 5facher Ausfertigungbeim geschäftsführenden Herausgeber einzureichen. Für die Manuskriptgestaltung sind die im Auftrag der Deutschen Gesellschaft für Psychologie von Prof. Dr. Günther Reinert verfaßten Richtlinien maßgebend, die der geschäftsführende Herausgeber den Autoren auf Anfrage zusendet. Der Umfang der eingesandten Arbeiten darf 20 Schreibmaschinenseiten (l'/2 Zeilenabstand, 32 Zeilen á 60 Anschläge) nicht übersteigen. - Den Arbeiten sind Abstracta in deutscher und englischer Sprache von je 10 Zeilen voranzustellen. - Beizufügen ist der Hinweis, d a ß der Beitrag nicht bereits an anderer Stelle publiziert wurde. - Die Autoren werden um maximal 5 Stichwörter zur Kennzeichnung ihrer Arbeit und schließlich um biographische Daten gebeten: Jahr und Ort akademischer Prüfungen, das jetzige Arbeitsverhältnis, die wichtigsten Veröffentlichungen (Titel, Jahr) sowie derzeitige Forschungsarbeiten. Über die A n n a h m e von Manuskripten entscheidet das Kollegium der Herausgeber. Bezüglich der Anforderungen, die an empirische Arbeiten gestellt werden, informiert der Artikel von Bredenkamp/Feger «Kriterien zur Entscheidung über die Aufnahme empirischer Arbeiten in die Zeitschrift für Sozialpsychologie» in Bd. 1, H. 1,43 - 47 dieser Zeitschrift. Mit der A n n a h m e des Manuskripts zur Veröffentlichung erwirbt der Herausgeber im Namen des Verlages das volle und exklusive Copyright für alle Länder und alle Sprachen (im Rahmen gesetzlicher Schutzfristen für Zeitschriftenaufsätze). Autorkorrekturen, die 10% der Satzkosten überschreiten, werden den Urhebern in Rechnung gestellt. 20 Sonderdrucke erhält der Autor (oder erhalten die Autoren zusammen) für jeden Artikel kostenlos. Weitere können gegen Rechnung angefordert werden, spätestens wenn die Korrekturabzüge zurückgeschickt werden. Die Zusendung von Besprechungsexemplaren veranlaßt die Herausgeber lediglich zur Dokumentation, nicht aber zur Rezension.
Anzeigenannahme:^rlag
Hans Huber, Länggaßstraße 76, CH — 3000 Bern 9
Erscheinungsweise:4 Hefte jährlich Abonnementspreise pro Band: SFr. 88. - / D M 98. - ; für Studenten SFr. 44. - / D M 49. Porto und Versandgebühren: Schweiz SFr. 3. — ; übrige Länder SFr. 13. —/DM 14.50 Einzelheft: SFr. 28. - / D M 32. — ; für Studenten SFr. 1 4 . - / D M 1 6 . Einbanddecke: SFr. 1 3 . - / D M 1 5 . -
Springer Series in Social Psychology Advisory Editor: R.F. Kidd Sports Violence
Attitudinal Judgment
Editor: I.H. Goldstein 1983. 6 figures. XII, 226 pages. Cloth DM 6 2 , - ; approx. US J 24.10 ISBN 3-540-90828-5 In this volume, an international, interdisciplinary group of distinguished contributors examines all facets of violence surrounding sports. The topics they discuss include:
Editor: I.R. Eiser 1984. Approx. 13 figures. Approx. 275 pages. Cloth DM 78,-; approx. US $ 26.90 ISBN 3-540-90911-7
— definitions of sports violence — the historical emergence of violence in sports, and — social and psychological aspects of violence among athletes and spectators. In presenting original research, up-todate literature reviews and new theoretical conceptions of this issue, Sports Violence elucidates the interrelationships between violence in sports, violence in society, and the social, psychological, economic and political nature of sports and of violence. In addition to providing fresh insights into the causes and correlates of sports violence, this volume offers suggestions for the reduction of violence in sports.
Attitudinal judgments are cognitive mechanisms that help people simplify, organize, and categorize complex information about others — individually, or in groups. As a form of judgment, attitudes both reflect and influence the fundamental nature of social relationships. In this most recent volume in the "Springer Series in Social Psychology", an international group of researchers investigates the issues related to the formation and maintenance of social attitudes. The central thesis of Attitudinal Judgment is that attitudes are closely interrelated with cognitive, judgmental processes. The book is contented specifically with these interrelations. The research reported shows that how we judge the attitudes of others has direct implications for a variety of important social issues, including prejudice, abortion, and ethnic stereotyping.
I.R. Averill
Basic Group Processes
Anger and Aggression An Essay on Emotion 1982. 3 figures. XIV, 402 pages. Cloth DM 80,-; approx. US $ 31.10 ISBN 3-540-90719-X In addition to drawing upon historical, legal crosscultural, biological, evolutionary, clinical, and social psychological sources, Anger and Aggression presents a wealth of new data on the every day experience of anger, both from the angry person's and the target's point of view. Comparisons are made between anger and related emotions, between shortterm and long-term anger, and between anger as experienced by men and by women.
Editor: P.B. Paulus 1983. 11 figures. XII, 356 pages. Cloth DM 78,-; approx. US $ 30.30 ISBN 3-540-90862-5 Basic Group Processes presents innovative and comprehensive reviews of a broad range of topics including leadership, persuasion, bargaining, self-disclosure, and justice. Representing the work of leading researchers in the field, this book thoroughly assesses social influence processes in groups, group influence on task performance and information processing, exchange processes in groups, and interaction within groups. Overall, Baric Group Processes is a significant contribution to group dynamics literature. It not only provides a broad overview of the area, but will aid in further stimulating theoretical and empirical development.
M.L. Patterson
Nonverbal Behavior A Functional Perspective 1983. 13figures.XI, 216 pages. Cloth DM 68,-; approx. US $ 26.40 ISBN 3-540-90846-3 This monograph presents an innovative, scholarly approach to nonverbal communication by analyzing coordinated patterns of behavior. In contrast to previous research, which focuses primarily on gaze, facial expression, and other isolated channels of nonverbal exchange, the author introduces a comprehensive functional model of nonverbal behavior. Utilizing this theoretical model as a foundation for the book, Patterson provides an integrative analysis of the role of nonverbal behavior in social interactions. T.M. Anubile
The Social Psychology of Creativity 1983. 12 figures. XV, 245 pages. Cloth DM 72,-; approx. US $ 28.00 ISBN 3-540-90830-7
The Social Psychology of Creativity represents a major contribution to our understanding of the creative process. Examining social and environmental influences on creativity, this volume provides the reader with a unique framework for analyzing creative behavior. Unlike previous research, which focused primarily on personality variables, The Social Psychology of Creativity outlines many important external factors that influence creative activity. The practical implications of the data receive thorough discussion. The scholarly review of existing literature on creativity, as well as the account of an extensive program, provide fresh insights into the field.
Springer-Verlag Berlin Heidelberg New York Tokyo Tiergartens». 17, D-6900 Heidelberg 1, 175 Fifth Ave., New York, NY 10010, USA, 37-3, Hongo 3-chome, Buiikyo-ku, Tokyo 113, Japan