193 66 25MB
German Pages 64 [72] Year 1983
HERAUSGEBER HUBERT FEGER C. F. G R A U M A N N KLAUS HOLZKAMP MARTIN IRLE
BAND
13 1 9 8 2 H E F T 1
VERLAG HANS HUBER BERN STUTTGART WIEN
Zeitschrift für Sozialpsychologie 1982, Band 13, Heft 1 INHALT
Zw diesem Heft
1
Theorie und Methoden LANGEHEINE, R.: Rekursive Pfadmodelle für multivariate Kontingenztabellen W H S T F . R M A N N , R. & H A G E R , W.: Entscheidung über statistische u n d wissenschaftliche Hypothesen: Z u r Differenzierung u n d Systematisierung der Beziehungen
2
13
Empirie A.: Eine additiv v e r b u n d e n e Messung des Sozialprestiges M. & M O N T A D A , L . : D e t e r m i n a n t e n erlebterGerechtigkeit MARX, W.: Subjektive Strukturen des politischen Parteiensystems der Bundesrepublik Deutschland DIEK M ANN, SCHMITT,
22 32 45
Literatur Neuerscheinungen
52
Titel u n d Abstracta
55
Nachrichten und Mitteilungen
57
Autoren
63
C o p y r i g h t 1982 Verlag H a n s H u b e r Bern Stuttgart W i e n Herstellung: Satzatelier Paul S t e g m a n n , Bern Printed in Switzerland Library of Congress Catalog C a r d N u m b e r 78-126626 Die Zeitschrift für Sozialpsychologie wird in Social Sciences Citation Current Contents / Social and Behavioral Sciences erfaßt.
Index (SSCI) u n d
Zeitschrift für Sozialpsychologie 1982
1
Zu diesem Heft Dieses erste Heft des dreizehnten Jahrganges der Zeitschrift für Sozialpsychologie ist noch vom bisherigen geschäftsführenden Herausgeber vorbereitet worden. Turnusgemäß wird der Unterzeichnete gemeinsam mit Dipl.-Soz. W O L F G A N G SERVAY (Redaktion) diese Aufgabe 1982 und 1983 wahrnehmen. H U B E R T F E G E R und Dipl.-Psych. R O S W I T H A P L U M gebührt der herzliche Dank der übrigen Herausgeber für ihre aufopferungsvolle Arbeit.
Dem Verlag gilt herzlicher Dank für die gewohnt hervorragende Zusammenarbeit. Die Ergebnisse einer Diskussion auf der jüngsten Herausgeberkonferenz über den Status der Zeitschrift für Sozialpsychologie in den publizierten Verhaltens- und Sozialwissenschaften findet einen Niederschlag in der Neufassung der Ziele dieser Zeitschrift, wie sie auf der dritten Umschlagseite jeder Ausgabe dokumentiert werden. ^ ^ Martin Irle I — J
2
Langeheine: Rekursive Pfadmodelle fur multivariate Kontingenztabellen
Theorie und Methoden Rekursive Pfadmodelle für multivariate Kontingenztabellen R O L F LANGEHEINE Institut für die Pädagogik der Naturwissenschaften an der Universität Kiel
In einer vorangegangenen Arbeit wurde GOODMANS allgemeines log-lineares Modell zur multivariaten Hypothesentestung bei qualitativen Daten vorgestellt. In dieser Arbeit wird anhand von Daten aus der Einstellungs- und Vorurteilsforschung sowie mit einem Beispiel aus der Soziometrie demonstriert, welche Möglichkeiten GOODMANS Ansatz zur Testung rekursiver Pfadmodelle bietet. Dabei wird zugleich auf Differenzen eingegangen, die gegenüber der regulären Pfadanalyse für kontinuierliche Daten bestehen.
In a previous paper, we have presented GOODMANS general log-linear model for the multivariate analysis of qualitative data. The aim of the present paper is to demonstrate the merits of the GOODMAN system in testing recursive causal systems for discrete variables by using data from attitude and prejudice research as well as a sociometric example. In addition, we note some places where the analogy to regular path analysis for continuous data breaks down.
«During the past decade a revolution in contingency table analysis has swept through the social sciences, casting aside most of the older forms for determining relationships among variables measured at discrete levels» ( K N O K E & BURKE, 1 9 8 0 , p. 7 )
1.
Einführung
K N O K E & B U R K E konzentrieren sich in ihrer Darstellung auf den in vieler Hinsicht flexibelsten Ansatz zur Analyse diskreter/qualitativer Daten in Form multivariater Kontingenztabellen, auf G O O D M A N S (1970, 1971,1972a, 1972b) allgemeines log-lineares Modell. In den Grundzügen wurde dieser Ansatz von LANGEHEINE (1980a) in dieser Zeitschrift dargestellt. Dabei wurde zunächst vom allgemeinen log-linearen Modell ausgegangen, das keine Unterscheidungen zwischen unabhängigen und abhängigen Variablen vornimmt. Analog zur Korrelationsanalyse bei kontinuierlichen Daten wurde dies als symmetrische Betrachtungsweise oder assoziationsanalytischer Ansatz bezeichnet. Im zweiten Schritt wurde gezeigt, wie sich spezifische log-lineare Modelle - sog. Logitmodelle aus dem allgemeinen log-linearen Modell ab-
leiten lassen, wenn eine (oder mehrere) Variab l e ^ ) als explizit abhängig von einer (oder mehreren) Variable(n) angesehen werden. Diese asymmetrische Betrachtungsweise bietet eine Parallele zur Regressions- bzw. Varianzanalyse bei kontinuierlichen Daten. Damit liegt bereits die Möglichkeit in der Luft, in Analogie zur Pfadanalyse bei quantitativen Daten simultane Gleichungssysteme auch für diskrete Daten zu testen, und in der Tat hat G O O D M A N (1972a, 1973a, 1973b) dazu eine Reihe von Vorschlägen gemacht. In der Folge ist jedoch deutlich geworden, daß die Analogie zur regulären Pfadanalyse in einer Reihe von Punkten nicht haltbar ist. Ziel dieser Arbeit ist es daher, (a) G O O D M A N S Prozedur zur Testung von Kausalhypothesen bei diskreten Daten vorzustellen, wobei (b) kritische Anmerkungen aus der Literatur berücksichtigt werden sollen.
Zeitschrift für Sozialpsychologie 1982, 1 3 , 2 - 12
2.
Rekursive und nicht-rekursive Systeme
Im folgenden wird angenommen, daß der Leser mit Logitmodellen sowie mit pfadanalytischen Fragestellungen bei quantitativen Daten vertraut ist. Grundlegende Einführungen für letztere geben DUNCAN (1975a), O P P & SCHMIDT (1976) und WEEDE( 1977). Der Schlüssel zu einem Kausalmodell besteht in einem Pfaddiagramm, mit dem Abhängigkeitsbeziehungen zwischen den Variablen eines Systems spezifiziert werden. Ein solches Diagramm läßt sich in eine Reihe von Strukturgleichungen übersetzen, wobei für jede Variable, auf die ein Pfeil zugeht, eine Gleichung aufzustellen ist. Dabei wird zugleich deutlich, daß der Forscher ex ante theoretische Entscheidungen zu treffen hat, welche Variable(n) einen Einfluß auf welche andere(n) Variable(n) haben. Derartige Abhängigkeitsbeziehungen sind für sozialwissenschaftliche Variablensysteme häufig schwierig zu bestimmen. Relativ einfach ist die Situation, wenn eine zeitliche Abfolge spezifiziert werden kann (der Sohn eines Grafen ist ebenfalls ein Graf; nicht unbedingt, werden vielleicht einige hinzufügen). Schwieriger wird es in der Regel bereits, wenn man eine Variable einer anderen als logisch vorgeordnet zu definieren versucht. HOMANS ( 1 9 6 0 , p. 2 4 1 ) stellt z. B. folgende asymmetrische (Abhängigkeits-)Struktur fest: «Was unter der einen Reihe von Bedingungen angemessen ist, tendiert unglücklicherweise dazu, auch unter allen anderen befolgt zu werden, und besonders auf Schiffen und in Armeen wird die autoritäre Beziehung auf Situationen übertragen . . . ». Die Randbemerkung eines kritischen Lesers «Aber: Dienst ist Dienst und Schnaps ist Schnaps» zeigt, daß man sich über die Richtung von Pfeilen in dieser Beziehungsstruktur sehr wohl streiten kann. Bevor wir zu einigen konkreten Beispielen übergehen, wollen wir zunächst kurz ein rekursives und ein nicht-rekursives System betrachten.
2.1. Ein rekursives
System
(1972a) stellt zunächst Hypothesen und Daten aus einem Projekt vor, in dem der GOODMAN
3 Die 4 dichotomen Variablen haben folgende inhaltliche Bedeutung: A: Nähe zu schwarzen Familien B: Kontakt mit Schwarzen C: Lokale Normen gegenüber Schwarzen D: Einstellung zu Schwarzen im allgemeinen Abb. 1: Ein rekursives System.
Effekt segregierten und integrierten Wohnens von Weißen und Schwarzen auf Einstellungen gegenüber Menschen anderer Rassen Forschungsgegenstand war. Zur Demonstration eines rekursiven Systems (vgl. Abb. 1) nehmen wiranGooDMANsFigure 1 zunächst einige Modifikationen vor. Den Pfeilen in Abbildung 1 entsprechen folgende Hypothesen: Nähe (Variable A) zu einer schwarzen Familie erhöht den Kontakt (B) mit ihr und dies führt zu einer positiveren Einstellung (D) gegenüber Schwarzen im allgemeinen; Nähe (A) führt zur Entwicklung lokaler Normen (C) und diese haben ebenfalls einen Einfluß auf die Einstellung (D). Dieses System ist, wie rekursive Systeme im allgemeinen, dadurch gekennzeichnet, daß es keine kausalen Rückkoppelungen, also weder direkte gegenseitige Beeinflussungen noch indirekte Rückwirkungen gibt. Will man (a) testen, ob dieses System mit vorliegenden Daten verträglich ist, und (b) die Pfadkoeffizienten bestimmen, so sind drei Strukturgleichungen aufzustellen, je eine für die Variablen B, C und D, auf die Pfeile zugehen. Nehmen wir an, daß die Daten jeweils in dichotomer Form vorliegen, und daß wir loglineare Modelle zur Testung heranziehen wollen, so entsprechen den drei Gleichungen folgende Logitmodelle 1 :
1 Um möglicher Verwirrung hinsichtlich der Verwendung griechischer Symbole vorzubeugen, soll angemerkt werden, daß wir uns an die von L A N G E H E I N E (1980a) verwendeten Symbole halten. Wir arbeiten also mit der additiven (logarithmischen) Version des eigentlich multiplikativen Modells und drücken die Logits y als Summe einer Anzahl von Effekten (Parametern A) aus. G O O D M A N verwendet - sofern er mit der logarithmischen Version arbeitet - in der Regel die Symbole und ß anstelle von und A und benutzt ß = A zur Quantifizierung der numerischen Größe von Effekten.
4
Langeheine: Rekursive Pfadmodelle für multivariate Kontingenztabellen
A A
(1) Vi
B , A BA + A I
für den Einfluß von A auf B, (2) v|/iÜ = A Ü + A Ü t für den Einfluß von Aauf Cund D
. DB (3) it/ ijk " = A D + A"+A j
DC k
für die Effekte von B und C auf D. Zur Testung von (1) wird die über die Variablen C und D zusammengefaßte 4-Felder Tabelle (AB) benutzt. Entsprechend wird bei (2) über die Variablen B und D zusammengefaßt. Für (3) wird die 4-Variablen Tabelle (ABCD) benötigt. Es sei angemerkt, daß es sich bei (1) und (2) jeweils um saturierte Modelle handelt. Ob die zwischen den Variablen spezifizierte Beziehung statistisch bedeutsam ist, läßt sich z. B. durch das Modell auf Unabhängigkeit der beiden Variablen prüfen. Das Gesamtsystem wird somit in Komponenten zerlegt, wobei sich (a) jede Komponente (jedes Untermodell) über einen Modelltest auf Verträglichkeit mit den Daten prüfen läßt und (b) durch Summation der Likelihood Ratio Testgrößen sowie der Freiheitsgrade die Angemessenheit des Gesamtsystems beurteilt werden kann. Im Prinzip ist es ebenfalls möglich, anstelle des Wegs über die Komponenten das kombinierte System auf Kongruenz mit den Daten zu testen, wie F I E N BERG (1977) an einem konkreten Beispiel zeigt (vgl. auch G O O D M A N , 1973a). An dem mit Absicht so gewählten Beispiel dürfte klar geworden sein, daß die Gesamttabelle im Fall von (1) und (2) über bestimmte Variablen zusammengefaßt wird. REYNOLDS (1977) hat nun Theoreme zur Zusammenfassung von Tabellen über Variablen (vgl. BISHOP et al., 1975) benutzt, um GOODMANS Ansatz zur Analyse rekursiver Systeme von diskreten Variablen einer Kritik zu unterziehen. In Antworten daraufhaben GILLESPIE (1978) und G O O D MAN (1979) diese Kritik jedoch als unhaltbar zurückgewiesen. Beide zeigen vielmehr, daß GOODMANS Prozedur im Fall rekursiver Systeme eine direkte Analogie zur OLS-Schätzung (OLS = ordinary least squares) in der regulären Pfadanalyse für kontinuierliche Daten ist. Al-
lerdings soll bereits hier auf einen Unterschied zur regulären Pfadanalyse hingewiesen werden (vgl. G O O D M A N , 1973a, Fußnote 75; SWAFFORD, 1980). In Abbildung 1 gibt es z.B. einen Effekt von A auf B und einen Effekt von B auf D. In der Terminologie der regulären Pfadanalyse heißt dies: der Score in A beeinflußt den Score in B, und der Score in B wiederum hat einen Einfluß auf den Score in D. In der Logitanalyse hingegen hat der Status von A einen Einfluß auf die Logits von B, und der Status von B (nicht deren Logits) beeinflußt die Logits von D. Die Konsequenz daraus ist, daß die Kriteriumsvariable in der ersten Gleichung (1) nicht zugleich unabhängige Variable in der Gleichung (3) ist. Damit wird die Abschätzung des indirekten Einflusses von A auf D unmöglich, der in der regulären Pfadanalyse dem Produkt der standardisierten Pfadkoeffizienten p^B und pg^ entspricht. Zurück zur inhaltlichen Bedeutung der Variablen in Abbildung 1. Jeder, der mit den Arbeiten von HOMANS (z.B. 1960) vertraut ist, wird den Pfeil von B (Kontakt) nach D (Einstellung, Sympathie) akzeptieren, aber zugleich einwenden, daß er einen Pfeil zurück von D nach B (Sympathie erhöht die Wahrscheinlichkeit des Kontakts) vermißt. Mit diesem Pfeil wird das System nicht-rekursiv.
2.2. Ein nicht-rekursives
System
Außer dem Pfeil von D nach B finden sich in Abbildung 2 zwei weitere Doppelpfeile, die den Hypothesen entsprechen, daß (a) die Einstellung (D) die Entwicklung lokaler Normen (C) verstärken wird, und (b) daß es eine gegenseitige Beziehung zwischen den Variablen B und C gibt (vgl. G O O D M A N , 1972a). Im Gegensatz zur regulären Pfadanalyse nicht-rekursiver Systeme zeigt sich hier ein weiteres Spezifikum von GOODMANS Ansatz:
Abb. 2: Ein nicht-rekursives System. Zur inhaltlichen Bedeutung der Variablen vgl. Abbildung 1.
5
Zeitschrift für Sozialpsychologie 1982, 13, 2 — 12
kennzeichnet direkte Rückkoppelungen zwischen zwei Variablen durch einen Pfad mit zwei Pfeilen. In der regulären Pfadanalyse arbeitet man hingegen mit zwei Pfaden, z. B. einem von B nach D und einem von D nach B, da es in der Regel keine theoretische Rechtfertigung für die Annahme gibt, daß die beiden Effekte identisch sind. Der Doppelpfeil in GOODMANS System resultiert daraus, daß es sich bei den Parametern eines jeden log-linearen Modells, das einem Logitmodell zugrundeliegt, um als symmetrisch definierte Parameter handelt. Der Effekt von B auf D ist also per Definition identisch mit dem Effekt von D auf B. Mit anderen Worten: reziproke Effekte lassen sich in GOODMANS System nicht trennen, wie BRIER (1978) ausführlicher gezeigt hat. Daraus folgt (vgl. SWAFFORD, 1980), daß die Testung nichtrekursiver Strukturen via GOODMANS Ansatz nur dann einen Sinn macht, wenn die Symmetriebedingung substantiell gerechtfertigt ist. Und dies ist bekanntlich selten der Fall. GOODMAN
Zum Schluß dieses Abschnitts wollen wir kurz auf ein System eingehen, in dem Rückkoppelung einen Sinn macht. 2.3. Ein reku rsives System m it Rückkoppelung Das hypothetische Beispiel in Abbildung 3A zeigt, daß es direkte Effekte von R auf V und von V und S auf W gibt, während für R und S eine eindeutige Kausalordnung nicht spezifiziert werden kann. Eine derartige Beziehung wird häufig durch einen gebogenen Pfad wie in Abbildung 3B gekennzeichnet. Trotz Rückkoppelung läßt sich dieses System als rekursiv bezeichnen, sofern angenommen wird, daß R und S «exogene», statistisch nicht unabhängige 3B
> W
R
• V
s
• w
Abb. 3: Ein rekursives System mit Rückkoppelung.
Variablen sind. Da die Beziehung zwischen R und S für die Kausalstruktur ohne Bedeutung ist, läßt sich das Gesamtsystem als rekursives System auf Angemessenheit testen (vgl. G O O D MAN, 1973a, p. 1164 ff.). Im folgenden wollen wir GOODMANS Prozedur zur Testung von Kausalsystemen anhand einiger Beispiele demonstrieren. Dabei wird sich zeigen, daß es gegenüber der regulären Pfadanalyse einige weitere Restriktionen gibt. 3.
Beispiele
3.1. Einstellungen zu Job-Chancen für Schwarze und Weiße (1980) analysiert unter einer spezifischen methodologischen Fragestellung2 die in Tabelle 1 wiedergegebenen Daten mit den Variablen Jahr (A), Region (B), Ausbildung (C)3 ALLISON
Tab. I: Daten von
ALLISON.
A
B
C
+ + + +
+ +
+ -
-
+
-
—
+ +
—
—
+
-
-
-
-
• -
D + 52 42 311 204 71 55 148 201
206 51 365 83 44 14 61 8
Bedeutung der Variablen: A = Jahr(+: 1946, - : 1963) B = Region ( + : Südstaat, - : Nicht-Südstaat) C = Ausbildung ( + : Grundschule, —: College) D = Einstellung ( + : positiv, - : negativ) zu der Frage, ob Schwarze ebenso gute Chancen wie Weiße haben sollten, irgendeinen Job zu erhalten.
2 A L L I S O N S Ziel war es zu zeigen, daß man - wie der Titel seiner Arbeit sagt - zusammengefaßte Kontingenztabellen analysieren kann, ohne tatsächlich zusammenzufassen. Die relevanten Parameter sind identisch, egal ob man zusammenfaßt oder nicht, und die Likelihood Ratio Testgrößen lassen sich durch eine einfache Modifikation bestimmen. Man kann sich also die Arbeit des Zusammenfassens und neuerliche Analyse reduzierter Tabellen sparen. Bei den in dieser Arbeit berichteten Analysen wurde von dieser Möglichkeit allerdings kein Gebrauch gemacht. 3 Da wir zunächst nur mit dichotomen Variablen arbeiten wollen, wurde die mittlere Kategorie der bei A L L I S O N trichotomen Variable Ausbildung nicht berücksichtigt.
6
Langeheine: Rekursive Pfadmodelle für multivariate Kontingenztabellen
für Hypothese H 2 in Tabelle 2 und ( 5 ) Vijk
Abb. 4: Pfaddiagramm zu Einstellungen zu Job-Chancen für Schwarze.
und Einstellung zu Job-Chancen für Schwarze (D). Eigenartigerweise nimmt ALLISON an, daß die Variablen ein rekursives Kausalsystem mit kausaler Priorität entsprechend der alphabetischen Reihenfolge der Variablen bilden. Das in Abbildung 4 wiedergegebene System erscheint dagegen sinnvoller. Wir erwarten somit direkte Effekte von den Variablen Jahr und Region auf Ausbildung und von diesen dreien auf die Einstellung zu Job-Chancen für Schwarze. Diesem System entsprechen folgende Gleichungen : (4)
Vij
Ü
= A Ü + A C f + AÜ®
D
=
. D
A
+
A
.DA , i +
a A
DB , j +
A
.DC k
für Hypothese H 5 in Tabelle 2. Die entsprechenden Modelltests zeigen, daß H 2 paßt, H5 jedoch nicht 4 . Der Test für das Gesamtsystem weist ebenfalls auf Unangemessenheit hin: 2.31 + 15.24 = 17.55 bei 1 + 4 = 5 df. Die Berücksichtigung von Interaktionen höherer Ordnung scheint also angemessen. Zur Klärung der Frage, um welche Effekte höherer Ordnung (5) erweitert werden muß, um einen akzeptablen Fit zu erhalten, sind mehrere Wege möglich (vgl. LANGEHEINE, 1980b). Hinweise können z.B. die Parameter des saturierten Modells geben. In der Tat zeigt sich für die vorliegenden Daten, daß die Effekte DBC und T5ABC entsprechende kritische Werte leicht übersteigen. Da andererseits deutlich wird, daß durch H 5 96% der Variation von H 4 ( = D ist unabhängig von A, B und C) erklärt werden 5 , wollen wir das postulierte System akzeptieren. Durch den Vergleich der Hypothesen H3, und H3 2 mit H2 und H6,, H6 2 und H 6 3 mit H 5 erweisen sich alle Effekte als si4
Wir arbeiten hier wie im folgenden mit Alpha = .05. (H4 —H5)/H4 = (414.57 - 15.24)/414.57 = .963 ist ein Maß für die proportionale Reduktion des Fehlers (vgl. 5
LANGEHEINE, 1980b).
Tab. 2: Modelltests zu Daten von ALLISON. Tabelle
Hypothese
Angepaßte Randverteilungen
(CBA)
Hl H2 H3, H3 2 saturiertes Modell
(C), (AB) (AC), (BC), (AB) (AC), (AB) (BC), (AB) (CAB)
(CBAD)
H4 H5 H6, H6 2 H6, saturiertes Modell
(D), (CD), (BD), (AD), (CD), (BD), (CD), (AD), (BD), (AD), (CBAD)
(ABC) (ABC) (ABC) (ABC) (ABC)
L2
df
P
62.96 2.31 57.45 9.49 .0
3 1 2 2 0
.000 .129 .000 .009
.0 .0321 .0028 .0285 .0337
414.57 15.24 183.00 100.85 135.25 .0
7 4 5 5 5 0
.000 .004 .000 .000 .000
.0 .1910 .1150 .1528 .1362 .1913
In dieser wie in allen weiteren Tabellen bedeuten: L2: Likelihood Ratio Chi-Quadrat df: Freiheitsgrade p: Fehlerwahrscheinlichkeit für L2 bei gegebenen df 2 T| : Erklärte Varianz nach MAGIDSON (1976; vgl. LANGEHEINE, 1980b) Angepaßte Randverteilungen: es wird nur der Minimalset der angepaßten Randverteilungen angegeben (vgl. LANGEHEINE, 1980b).
7
Zeitschrift für Sozialpsychologie 1982, 13, 2 - 12
gnifikant. Wenngleich wir also nach rein statistischen Kriterien mit dem Ergebnis nicht zufrieden sein können, sollte berücksichtigt werden, daß mit H 5 substantiell massive Haupteffekte konstatiert werden können, gegenüber denen die Residualvariation von knapp 4% für vier potentielle Interaktionen höherer Ordnung tatsächlich als marginal angesehen werden muß. Zu diesem Ergebnis führt ebenfalls der Vergleich von r|2 für H 5 mit dem entsprechenden Wert für das saturierte Modell. Dieser Koeffizient ist ein direktes Analogon zur aufgeklärten Varianz in der regulären Regressionsanalyse.
Es sei schließlich daraufhingewiesen, daß es sich hier offensichtlich um eine vergleichbare Datenerhebung zu zwei Zeitpunkten handelt. Obwohl die Personen nicht identisch sind (wie in einer Panel-Studie), eignet sich G O O D M A N S System in natürlicherweise zur Analyse derartiger Daten, sofern identische Variablen zu beiden Zeitpunkten erfaßt wurden (vgl. z.B. KNOK E & B U R K E , 1980)6.
Zur Interpretation der Logitparameter, die ebenfalls in Abbildung 4 eingetragen wurden. Formal lautet die Interpretation z. B. für den Effekt von A auf C: der Logarithmus des Verhältnisses der unter Modell H 2 erwarteten Häufigkeiten für Grundschulausbildung zu Collegeausbildung ist positiv für das Jahr 1946. Mit anderen Worten: im Vergleich zum Jahr 1963 ist Grundschulausbildung für das Jahr 1946 wahrscheinlicher. Ebenso weisen Personen aus den Südstaaten eher eine Grundschulausbildung auf als solche aus anderen Staaten (Effekt B auf C). Geordnet nach der Stärke der Effekte zeigt sich schließlich, daß die Frage, ob Schwarze gleiche Job-Chancen wie Weiße erhalten sollten, 1946 negativer als 1963, von Personen mit Grundschulausbildung negativer als von Personen mit Collegeausbildung und von Südstaatlern negativer als von Personen aus anderen Staaten beantwortet wurde. Der Effekt Ü A entspricht somit einer Hebung des Ausbildungsniveaus von 1946 nach 1963. Der Effekt ÜB spricht deutlich für eine geringere Ausbildung der US-Südstaatler. Daß Personen mit höherer Ausbildung eine positivere Einstellung gegenüber Schwarzen haben, wurde mehrfach festgestellt (vgl. Abschnitt 3.2.). In der Tat können sie sich dies im vorliegenden Fall zudem eher leisten, da ihre potentiellen Arbeitsplätze von Schwarzen weniger bedroht sind (Effekt DC). Umgekehrt paßt in dieses Bild, daß sich Südstaatler eher durch Schwarze in ihren Arbeitsmöglichkeiten eingeschränkt fühlen (Effekt DB). Ob man diese Einstellung für angemessen hält, ist eine andere Frage. Zumindest zeigt sich allgemein ein deutlicher Trend zugunsten der Schwarzen für 1963 im Vergleich zu 1946 (Effekt D A ) .
GILES
3.2. Rassen- und Klassenvorurteile Rassentrennung in Schulen
gegen
et al. (1976) haben das Protestverhalten (P) weißer US-amerikanischer Eltern gegen die Aufhebung der Rassentrennung in Schulen in Abhängigkeit von den Variablen 7 Ausbildung (E), Einkommen (I) und Klassen- sowie Rassenvorurteilen (C und R ) untersucht. Die 5-Weg
Tab. 3: D a t e n v o n GILES et al.
R
C
I
E
P
P
+ —
—
—
—
+
—
-
—
-
-
+
+ +
-
-
+
-
-
•
+ +
+ + +
-
-
-
+
-
-
•
+
+ +
-
-
+
-
-
-
+
+ +
-
+ + + +
-
+ + + + + + + +
204 174 93 118 51 38 48 50 31 17 39 22 44 21 49 37
23 47 21 36 9 18 5 24 6 10 5 8 10 1 13 19
.90 .79 .82 .77 .85 .68 .91 .68 .84 .63 .89 .73 .82 .96 .79 .66
Bedeutung der Variablen: R = Racism = Rassenvorurteile ( - : niedrig, + : hoch) C = Classism = Klassenvorurteile ( - : niedrig, + : hoch) I = Income = Einkommen ( — : niedrig, + : hoch) E = Education = Ausbildung ( - : non-college,+: College) P = Protest = Protestverhalten ( — : nein, + : ja) p: konditionale Wahrscheinlichkeit für die Kategorie P -
6 Auf echte Zeitreihenanalysen gehen BISHOP et al. (1975) ausfuhrlich ein. 7 Vgl. Tabelle 3 zur Codierung der Variablen.
8 5A: erwartete
Langeheine: Rekursive Pfadmodelle für multivariate Kontingenztabellen Effekte +
> R
5B: beobachtete
plus Interaktionen ICP, IRP, ECP, ERP
Effekte .254
.710
-.246
> R
Abb. 5: Pfaddiagramm zum Protestverhalten gegen Rassentrennung in Schulen. Effekte in Klammern sind nicht statistisch signifikant.
Kontingenztabelle ist in Tabelle 3 wiedergegeben 8 . Die Arbeit von G I L E S et al. bietet folgende Vorteile: (a) Auf der Basis theoretischer Überlegungen sowie aufgrund von Ergebnissen empirischer Arbeiten wurden sehr detaillierte Hypothesen formuliert. Die entsprechenden direkten Effekte sind in ein Pfaddiagramm gemäß Abbildung 5 A übersetzt. Da die beiden Variablen E und I als Indikatoren für den sozioökonomischen Status herangezogen wurden, betrachten wir sie als «exogene», positiv korrelierte Variablen. Zusätzlich stellten die Autoren folgende Hypothesen fiir Interaktionen höherer Ordnung auf: für hohen Status (E und I) ist der Effekt von C auf P stärker als für niedri8 In die Untersuchung von G I L E S et al. ging mit «% Black» noch eine weitere unabhängige Variable ein. Wir beschränken uns hier auf die Stichprobe «no change», d. h. auf Eltern, deren Kinder in Schulen gingen, bei denen der Anteil schwarzer Kinder in den Schuljahren 1 9 7 1 / 1 9 7 2 und 1 9 7 2 / 1 9 7 3 nicht wechselte. Obwohl allen unabhängigen Variablen zumindest Rangskalenniveau zugrunde liegt, wurden Dichotomisierungen vorgenommen. Es sei daher auf die heftige Kritik verschiedener Autoren (z.B. G I L L E S P I E , 1 9 7 7 ; S W A F F O R D , 1 9 8 0 ) zu diesem Vorgehen hingewiesen.
gen Status, während das Gegenteil für den Effekt von R auf P erwartet wurde, (b) Aus dem theoretischen Teil von G I L E S et al. lassen sich gerichtete Hypothesen ableiten. Entsprechend sind in Abbildung 5 A Plus- und Minuszeichen eingetragen, (c) Die Autoren geben an, daß es sich um eine Zufallsstichprobe handelt. Damit ist die bekanntlich einzige Voraussetzung für die Anwendung log-linearer Modelle erfüllt. Wir betonen dies, da in der Regel eher mit Geoder Verlegenheitsstichproben gearbeitet wird. In Tabelle 4 sind die Ergebnisse9 einer Reihe von Modelltests zusammengestellt. Zur Testung des postulierten Gesamtsystems sind folgende Hypothesen zu kombinieren: Tabelle (IE) (CIE) (RIE) (RCIEP)
sat. Modell L2 .0 df 0 H2 1.31 1 H5 .11 1 H11 18.05 7 19.47
9
Die Anpassung des Gesamtsystems an die Daten ist nicht zufriedenstellend. Dies geht deutlich zu Lasten von H 11. In H 11 sind übrigens - da wir mit hierarchischen 10 Modellen arbeiten - zwei Effekte (IF, EP) automatisch enthalten, die nach den theoretischen Überlegungen als irrelevant angesehen wurden. Wie der Vergleich von H11 mit H 8 zeigt, sind die von G I L E S et al. spezifizierten Hypothesen zu Interaktionen höherer Ordnung allesamt zu verwerfen. Dem Verlust von 4 Freiheitsgraden steht 9
Vergleicht man die Ergebnisse für die Gesamttabelle (RCIEP), so sind gegenüber G I L E S et al. einige Differenzen festzustellen, die wie folgt begründet sein können: (a) Wir haben nur die Stichprobe «% no change» analysiert, also eine weitere Variable aus der Analyse ausgeschlossen, für die G I L E S et al. allerdings lediglich einen Haupteffekt auf P feststellten, (b) G I L E S et al. haben die Analyse mit dem nach G R I Z Z L E , S T A R M E R & K O C H (1969) benannten GSKAnsatz gewichteter Regression durchgeführt. Bekanntlich differieren die Ergebnisse auf der Basis von log-linearen Modellen und GSK-Ansatz mit zunehmender Anzahl konditionaler Wahrscheinlichkeiten außerhalb des Bereichs von etwa .2 bis .8 (vgl. Tab. 3). Zur Streitfrage loglineare Modelle oder GSK siehe im übrigen G O O D M A N (1975), KRITZER(1978, 1979), KÜCHLER(1978, 1980), LANG E H E I N E (1979, 1980c), M A G I D S O N (1976) und S W A F F O R D (1980). 10 Zur Möglichkeit der Testung nicht-hierarchischer Modelle siehe z.B. LANGEHEINE(1980b).
9
Zeitschrift für Sozialpsychologie 1982, 13, 2 - 12 Tab. 4: Modelltests zu Daten von GILES et al. Tabelle
Hypothese
(IE)
saturiertes Modell
(IE)
.0
(CIE)
Hl H2 H3, H3 2 saturiertes Modell
(C), (IE) (CI), (CE), (IE) (CI), (IE) (CE), (IE) (CIE)
45.51
H4 H5 H6,
14.40
.003
.11
>5 .001 >.5
saturiertes Modell
(R), (IE) (RI), (RE), (IE) (RI), (IE) (RE), (IE) (RIE)
H7
(P),
(RCIE)
52.01
15
.000
H8
( R P ) , (CP), (IP), (EP),
(RCIE)
18.58
11
.069
.0259
H9,
( R P ) , (CP), (IP),
(RCIE)
19.34
12
.081
.0253
(RIE)
H62 (RCIEP)
Angepaßte Randverteilungen
H92
(RP), (CP),
H9J
(RP),
H94
df
.000 .253 .000 .000
1.31 15.62
18.01 .0
.0 .0341 .0232 .0213 .0351
13.37 .13
.0
.0110 .0008
.0110 .0110
.0
.0
(EP),
(RCIE)
20.68
12
.055
.0242
(IP), (EP),
(RCIE)
20.40
12
.060
.0244
(CP), (IP), (EP),
(RCIE)
45.06
12
.000
.0054
13
.048
.0228
.012
HI0
(RP), (CP),
(RCIE)
22.46
H11
( R I P ) , ( R E P ) , (CIP), (CEP), ( R C I E )
18.05
7
SATURIERTES MODELL
(RCIEP)
.0
0
ein Gewinn von L 2 = 18.58 - 18.05 = .53 gegenüber. Wir gehen daher zu Modell H10 zurück, das die beiden erwarteten Effekte von R und C auf P enthält. Der Modelltest zeigt, daß wir uns am Rande der kritischen Grenze bewegen. Aus dem Vergleich der vier Modelle zu H9 mit H 8 ergibt sich allerdings, daß nur der Effekt von R auf P bedeutsam ist. Dies gilt ebenfalls für den Effekt von E auf R (vgl. die beiden Modelle H6mitH5). Die den Modellen H10, H5, H 2 sowie dem saturierten Modell für die Tabelle (IE) entsprechenden Logitparameter sind in das Pfaddiagramm der Abbildung 5 B eingetragen. Das Fazit unserer Analyse lautet also, daß wir die von GILES et al. erwarteten Effekte nur zum Teil als haltbar ansehen können. Zwischen den beiden Indikatoren I und E für den sozioökonomischen Status besteht eine hohe Assoziation. Mit Ausnahme des Effekts von I auf R entsprechen alle Vorzeichen der Erwartung. Die Effekte von I auf R und von C auf P erweisen sich allerdings als statistisch nicht bedeutsam. Der L 2 -Wert von 52.01 für das Modell H7 macht zudem deutlich, daß nicht viel Musik in der Gesamttabelle steckt. In der Tat werden lediglich knapp 4% der Varianz von P durch die Variablen R, C, I und E erklärt (vgl. T|2 für das saturierte Modell). Dies dürfte ein eher ernüchterndes Ergeb-
.0262 .0395
nis sein, so daß wir uns weitere Interpretationen ersparen.
3.3. Ein Problem aus der Soziometrie Mit dem dritten Beispiel soll anhand eines scheinbar einfachen Datensatzes verdeutlicht werden, daß für GOODMANS Ansatz im Vergleich zur regulären Pfadanalyse eine weitere Restriktion gilt. In der Soziometrie gibt es das bekannte Phänomen des «sex cleavage». Untersucht man z. B. Schulklassen, so stellt man fest, daß Mädchen den größten Teil ihrer Wahlen an Mädchen vergeben und Jungen eher ablehnen (und Tab. 5: Wahlverhalten in einer soziometrischen Untersuchung. A
B
C 1
2
3
1
1
188
98
56
2
1
31
60
80
1
2
20
61
90
2
2
38
12
22
Bedeutung der Variablen: A = Sender und B = Empfänger (1: Mädchen, 2: Jungen) C = Wahlverhalten (1: Wahl, 2: Indifferenz, 3: Ablehnung)
10
Langeheine: Rekursive Pfadmodelle für multivariate Kontingenztabellen
vice versa für Jungen). In die Terminologie von Kontingenztabellen übersetzt heißt dies: wenn wir das Wahlverhalten (Variable C, vgl. Tab. 5) in Abhängigkeit von Sendern und Empfangern (Variablen A und B) untersuchen, so erwarten wir eine starke Interaktion AB auf C. Ist ein Geschlecht in der Klasse überrepräsentiert, dann erwarten wir zusätzlich Haupteffekte von A undBaufC 1 1 . Tabelle 5 enthält die entsprechenden Häufigkeiten für eine Schulklasse mit 19 Mädchen und 9 Jungen zum Wahlkriterium Sitznachbar. Es konnten Wahlen, Indifferenzen und Ablehnungen vergeben werden, so daß die abhängige Variable drei Kategorien hat. Das den drei Hypothesen entsprechende Pfaddiagramm ist in Abbildung 6 wiedergegeben, wobei die Interaktion AB dadurch gekennzeichnet ist, daß A und B in einem Knoten zusammenlaufen, von dem aus ein Pfeil nach C weist. Da wir drei Effekte auf C spezifiziert haben, wird lediglich die Gesamttabelle analysiert. Ergebnisse für eine Reihe von Modelltests finden sich in Tabelle 6. Wie sich unzweideutig zeigt, reicht das Haupteffektmodell H 2 nicht zur Erklärung der Daten. Sein Anteil an der Gesamtvariation von H1 beträgt (H1 - H 2 ) / H 1 = (160.26-106.18)/ 160.26 = .325. Gut 67% gehen also zu Lasten der Interaktion. Dies heißt zugleich, daß nur das saturierte Modell mit allen Effekten die Datenkonstellation hinreichend wiedergibt. Im Vergleich zu den vorangegangenen Beispielen haben wir somit eine komplexere Situation da-
Abb.6: Pfaddiagramm zum Wahlverhalten in einer soziometrischen Untersuchung.
11
Dies kann zum Problem der Verzerrung soziometri-
scher Statusindizes fuhren, w i e LANGEHEINE & ANDRESEN
(1981) gezeigt haben.
Tab. 6: Modelltests und Logitparameter zu den Daten in Tabelle 5. Modelltests HypoAngepaßte these Randverteilungen H1 H2 H3, H32 saturiertes Modell
(C), (AB) (AC), (BC), (AB) (AC), (AB) (BC),(AB) (ABC)
Logitparameter Effekt
L2
df
P
V
160.26 106.18 144.39 124.77
6 2 4 4
.000 .000 .000 .000
.0 .0366 .0109 .0242
.0
0
.1025
Verhältnis 1 zu 3
2 zu 3
A,C
.027
.266
B,C
.305
.316
1.052
.157
A,B,C
durch, daß ein Interaktionseffekt mit einbezogen werden muß. Wenngleich dies im vorliegenden Fall für die Darstellung in Form eines Pfaddiagramms kein Problem mit sich bringt, lassen sich doch andere Situationen denken, in denen ein solches Diagramm bei notwendigem Einbezug mehrerer Interaktionen höherer Ordnung kaum noch übersichtlich darzustellen ist. Wir stehen jedoch vor einem weiteren Problem. Die abhängige Variable C hat im Gegensatz zu den ersten beiden Beispielen drei Kategorien. Folglich gibt es nicht nur einen Logitparameter für das Verhältnis von Kategorie 1 zu Kategorie 2, sondern Vektoren von Logitparametern. Wählen wir die Kategorie 3 als Basis12, so ergeben sich die in Tabelle 6 zusammengestellten Logitparameter. Da es nun wenig Sinn macht, den Pfeilen eines Diagramms ganze Vektoren von Parametern zuzuordnen, wurde in Abbildung 6 darauf verzichtet. Der Parameter von 1.052 für das Verhältnis von Kategorie 1 zu 3 zeigt übrigens deutlich, daß sich die Wahlen im Vergleich zu den Ablehnungen innerhalb der Geschlechter konzentrieren.
12
Zur Berechnung der Logitparameter in diesem Fall
vgl. LANGEHEINE (1980b).
11
Zeitschrift für Sozialpsychologie 1982, 1 3 , 2 - 1 2
4.
Einige abschließende Bemerkungen
Zur Demonstration von GOODMANS Prozedur zur Testung rekursiver Pfadmodelle bei diskreten Daten wurden einige Beispiele mit Absicht so ausgewählt, daß daran die Unterschiede zur regulären Pfadanalyse möglichst deutlich herausgestellt werden konnten. Obwohl die ersten beiden Beispiele Rassenprobleme der USA behandeln, dürfte die Relevanz derartiger Fragen angesichts der Ausländerproblematik für die Bundesrepublik unzweideutig sein. Dies gilt für den Arbeitsbereich gleichermaßen wie für die Schule. Ob sich die Vorzeichen entsprechend POTHS (1979) düsterer Vision für das Deutschland im Jahr 2030 umkehren, werden wir - wie in der Wissenschaft eher üblich - erst hinterher wissen. In folgenden Punkten haben wir für G O O D Prozedur zum Teil wesentliche Unterschiede zur regulären Pfadanalyse bei kontinuierlichen Daten festgestellt: MANS
a) Es ist nicht möglich, indirekte Effekte innerhalb eines Variablensystems zu erfassen. b) Nicht-rekursive Systeme sind nicht behandelbar, da sich gegenseitige Effekte nicht trennen lassen. Eine Ausnahme wäre die Annahme, daß der Effekt von A auf B dem von B auf A entspricht. Aufgrund der Logik log-linearer Modelle besteht jedoch keine Möglichkeit, diese Annahme einem kritischen Test zu unterwerfen. c) Die Existenz von Interaktionen höherer Ordnung kann zu einer Komplexität fuhren, die die übersichtliche Darstellung in Form eines Pfaddiagramms außerordentlich schwierig macht. Der Einbezug von Interaktionen höherer Ordnung durch GOODMANS Ansatz wird zuweilen als Pluspunkt gegenüber der regulären Pfadanalyse verbucht. GILLESPIE (1977) hat jedoch zu Recht daraufhingewiesen, daß die Vernachlässigung derartiger Interaktionen in der Regressionsanalyse eher ein Bild des Forschungsstandes gibt. In der Tat gibt es theoretisch wie praktisch in beiden Ansätzen keine inhärenten Beschränkungen auf Effekte erster Ordnung. d) Hat eine (unabhängige oder abhängige) Variable des Systems mehr als zwei Kategorien, so gibt es Parametervektoren. Folglich müßte ein Pfad eines Diagramms durch mehrere
Koeffizienten gekennzeichnet werden. Die Situation wird noch komplexer bei zwei oder mehr polytomen Variablen. In diesem Fall resultieren ganze Parametermatrizen. Dies ist ein Grund, ganz auf die Zuordnung von numerischen Werten zu Pfeilen eines Diagramms zu verzichten, wie wir dies in Abbildung 6 getan haben. Eine Lösung dieses Problems ließe sich eventuell durch Partitionierung polytomer Variablen erreichen, wie dies D U N C A N (1975b) in anderem Zusammenhang vorgeschlagen hat. FIENBERG (1977) verzichtet grundsätzlich auf die Zuordnung von Koeffizienten, da er die Analogie zur Berechnung von Pfadkoeffizienten in der regulären Pfadanalyse anzweifelt. Obwohl damit einige Grenzen von G O O D Prozedur deutlich geworden sind, wollen wir doch mit SWAFFORD (1980, p. 684) festhalten: «These shortcomings are not due to any lack of imagination on GOODMAN'S part. He has explored the possibilities further than anyone else.» MANS
Literatur ALLISON, P. D. 1980. Analyzing collapsed contingency tables without actually collapsing. American Sociological Review, 45, 1 2 3 - 130. BISHOP, Y . M . M . , FIENBERG, S . E . & HOLLAND, P . W . 1975.
Discrete multivariate analysis: Theory and practice. Cambridge: MIT Press. BRIER, S.S. 1978. The utility of systems of simultaneous logistic response equations. In: Schuessler, K.F. (Ed.): Sociological methodology 1979. San Francisco: JosseyBass. DUNCAN, O.D. 1975a. Introduction to structural equation models. New York: Academic Press. DUNCAN, O.D. 1975b. Partitioning polytomous variables in multiway contingency analysis. Social Science Research, 4, 1 6 7 - 182. FIENBERG, S.E. 1977. The analysis of cross-classified categorical data. Cambridge: MIT Press. GILES, M . W . , GATLIN, D . S . & CATALDO, E . F . 1976. R a c i a l
and class prejudice: Their relative effects on protest against school desegregation. American Sociological Review, 4 1 , 2 8 0 - 2 8 8 .
GILLESPIE, M.W. 1977. Log-linear techniques and the regression analysis of dummy dependent variables. Further bases for comparison. Sociological Methods and Research, 6 , 1 0 3 - 1 2 2 .
GILLESPIE, M.W. 1978. The application of log-linear techniques to recursive models: Comment on Reynolds. American Journal of Sociology, 84, 718 — 722.
12
Langeheine: Rekursive Pfadmodelle fur multivariate Kontingenztabellen
GOODMAN, L.A. 1970. The multivariate analysis of qualitative data: Interactions among multiple classifications. Journal of the American Statistical Association, 65, 226-256. GOODMAN, L.A. 1971. The analysis of multidimensional contingency tables: Stepwise procedures and direct estimation methods for building models for multiple classifications. Technometrics, 13,33 — 61. GOODMAN, L. A. 1972a. A general model for the analysis of surveys. American Journal of Sociology, 77, 1 0 3 5 1086. GOODMAN, L.A. 1972b. A modified multiple regression approach to the analysis of dichotomous variables. American Sociological Review, 37,28 — 46. GOODMAN, L.A. 1973a. Causal analysis of data from panel studies and other kinds of surveys. American Journal of Sociology,78, 1 1 3 5 - 1191. GOODMAN, L.A. 1973b. The analysis of multidimensional contingency tables when some variables are posterior to others: a modified path analysis approach. Biometrika, 60, 1 7 9 - 1 9 2 . GOODMAN, L.A. 1975. The relationship between modified and usual multiple regression approaches to the analysis of dichotomous variables. In: Heise, D. R. (Ed.): Sociological methodology 1976. San Francisco: Jossey-Bass. GOODMAN, L.A. 1979. A brief guide to the causal analysis of data from surveys. American Journal of Sociology, 84,
1078-1095.
G R I Z Z L E , J . E . , STARMER, C . F . & K O C H , G . G . 1 9 6 9 . A n a l y -
sis of categorial data by linear models. Biometrics, 25, 489-504.
HOMANS, C.G. 1960. Theorie der sozialen Gruppe. Koln: Westdeutscher Verlag. KNOKE, D. & BURKE, P.J. 1980. Log-linear models. Beverly Hills: Sage. KRITZER, H.M. 1978. Analyzing contingency tables by weighted least squares: An alternative to the G o o d m a n approach. Political Methodology, 5,277 — 326. KRITZER, H.M. 1979. Approaches to the analysis of complex contingency tables: A guide for the perplexed. Sociological Methods and Research, 7,305 - 329.
KÜCHLER, M. 1978. Alternativen in der Kreuztabellenanalyse - Ein Vergleich zwischen G o o d m a n s «General Model» (ECTA) und dem Verfahren gewichteter Regression nach Grizzle et al. ( N O N M E T II). Zeitschrift für Soziologie, 7, 347 - 365. KÜCHLER, M. 1980. K o m m e n t a r zu Rolf Langeheine, «Multivariate Analyse nominalskalierter Daten via G o o d m a n s Modell: Sehr wohl eine Alternative». Zeitschrift für Soziologie, 9 , 2 1 3 - 2 1 4 . LANGEHEINE, R. 1979. Multivariate Analyse nominalskalierter Daten via G o o d m a n s Modell: Sehr wohl eine Alternative. Zeitschrift für Soziologie, 8, 380 - 390. LANGEHEINE, R. 1980a. Multivariate Hypothesentestung bei qualitativen Daten. Zeitschrift für Sozialpsychologie, 11, 1 4 0 - 151. LANGEHEINE, R. 1980b. Log-lineare Modelle zur multivariaten Analyse qualitativer Daten. Eine Einführung. München: Oldenbourg. LANGEHEINE, R. 1980c. Antwort auf Manfred Küchler. Zeitschrift für Soziologie, 9 , 2 1 4 - 2 1 5 . LANGEHEINE, R . & ANDRESEN, N . 1 9 8 1 . A s o c i o m e t r i c s t a -
tus index without subgroup membership bias. Unveröff. Manuskript. MAGIDSON, J. 1976. The multivariate analysis of qualitative variance: Analyzing the probability of an event as a function of observable variables. Phil. Diss. Evanston: Northwestern University. OPP, K.D. & SCHMIDT, P. 1976. Einführung in die Mehrvariablenanalyse. Reinbek: Rowohlt. POTH, C. 1979. Das darf nie passieren. Titanic, 11/79, 16-17. REYNOLDS, H.T. 1977. Some comments on the causal analysis of surveys with log-linear models. American Journal ofSociology, 83, 1 2 7 - 1 4 3 . SWAFFORD, M. 1980. Three parametric techniques for contingency table analysis: A nontechnical commentary. American Sociological Review, 45,664-690. WEEDE, E. 1977. Hypothesen, Gleichungen und Daten. Kronberg: Athenäum. I J
13
Zeitschrift für Sozialpsychologie 1982, 13. 1 3 - 2 1
Entscheidung über statistische und wissenschaftliche Hypothesen: Zur Differenzierung und Systematisierung der Beziehungen R A I N E R WESTERMANN u n d W I L L I H A G E R Institut für Psychologie der Universität Göttingen
Es wird eine dreistufige Strategie entwickelt und vorgestellt, mit der man von der Entscheidung über statistische Hypothesen (1. Stufe) zur Entscheidung über Bewährung oder Nicht-Bewährung der vorgeordneten wissenschaftlichen Hypothese gelangen kann (2. Stufe). Durch Zusammenfassen der Ergebnisse mehrerer Untersuchungen wird die Basis für Falsifikationsentscheidungen geschaffen (3. Stufe).
A procedure is developed and described by means of which scientific hypotheses can be evaluated. A decision on statistical hypotheses (stage 1) leads to a decision on the confirmation of the scientific hypothesis (stage 2). After accumulating the results of several studies a basis is given for deciding whether the scientific hypothesis has to be falsified (stage 3).
1. Zur Beziehung zwischen statistischen und wissenschaftlichen Hypothesen
reicht jedoch nicht aus, um die Abhängigkeiten zwischen den Entscheidungen über statistische und wissenschaftliche Hypothesen einigermaßen umfassend zu analysieren und zu systematisieren: (1) Auch bei einer Annahme der statistischen Hypothese HS sollen und müssen Aussagen über die wissenschaftliche Hypothese HW möglich sein. Für diese Schlüsse gibt es aber keine logische Rechtfertigung von der Art des «modus tollens». (2) Aus einer wissenschaftlichen Hypothese sind in aller Regel verschiedene statistische Hypothesen ableitbar, deren Überprüfung u.U. zu unterschiedlichen Ergebnissen führen kann. Die Wahl zwischen den möglichen Überprüfungsinstanzen kann nicht nach logischen Analysen erfolgen, vielmehr sollte der Forscher diejenige statistische Hypothese auswählen, bei der seine wissenschaftliche Hypothese der «strengsten Prüfung» im Sinne P O P P E R S ( 1 9 7 6 ) ausgesetzt wird. Dabei werden vor allem Gesichtspunkte der «statistischen Validität» eine gewichtige Rolle spielen, also z. B. die Frage, ob die Voraussetzungen in ausreichendem Maße erfüllt sind, die für die Anwendung und Interpretation des zur Prüfung der HS geeigneten statistischen Verfahrens notwendig sind (Einzelheiten siehe HAGER & W E S T E R M A N N , 1 9 8 2 ) . (3) Der «modus tollens» kann schon allein deswegen nur zu einer stark idealisierten Rekonstruktion wissenschaftlicher Tätigkeit fuhren, weil es unmög-
In einem sehr hohen Prozentsatz der publizierten empirischen Arbeiten in den Sozialwissenschaften werden statistische Hypothesen überprüft, d.h. Aussagen über bestimmte Zahlenwerte (Parameter) oder (Verteilungs-)Funktionen. Im Zentrum des Interesses der empirischen Forschung stehen jedoch i.a. inhaltliche substanzwissenschaftliche Aussagen (d. h. Hypothesen oder Theorien) über psychische, soziale oder andere Phänomene, Merkmale, Beziehungen usw. Wir wollen derartige Aussagen global als «wissenschaftliche Hypothesen» (abgekürzt: HW) bezeichnen (vgl. BOLLES, 1 9 6 2 ) . Diese beziehen sich typischerweise nicht auf Zahlenwerte usw., sind also nicht mit den geprüften statistischen Hypothesen (abgekürzt: HS) identisch. Dies hat zur Folge, daß die Entscheidung über eine HS nicht ohne weiteres auf eine HW übertragen werden kann. Insbesondere
und B R E haben ausführlich dargelegt, daß der angestrebte Schluß von der HS auf die HW nur möglich ist, wenn die Beziehung zwischen beiden die der logischen Implikation ist. In diesem Fall nämlich kann aus der Falschheit der HS logisch auf die Falschheit der HW geschlossen werden («modus tollens»): ((HW —• HS) A — HS) - HW. Diese Beziehung MEEHL (1967, 1978)
DENKAMP ( 1 9 7 2 )
14
Westermann & Hager: Entscheidung über statistische und wissenschaftliche Hypothesen
lieh ist, zweifelsfrei festzustellen, ob eine statistische Hypothese wahr oder falsch ist. Man kann sich vielmehr nur aufgrund der verfügbaren empirischen Information dafür entscheiden, eine geprüfte HS beizubehalten oder abzulehnen. In dieser Arbeit wollen wir eine Strategie beschreiben, mit der man auf der Basis solcher Entscheidungen über statistische Hypothesen unter möglichst weitgehender Ausnutzung der relevanten empirischen Information zu adäquaten Entscheidungen über wissenschaftliche Hypothesen gelangen kann. Zur Entwicklung dieser Vorgehensweise betrachten wir zunächst diefürSozialwissenschaftlerwichtigsten Strategien zur Entscheidung über statistische Hypothesen.
2. Strategien zur Entscheidung über statistische Hypothesen Die Prüfung statistischer Hypothesen erfolgt in der überwiegenden Mehrzahl der Fälle durch Signifikanztests (vgl. die Auszählungen etwa
MAN, 1 9 7 4 ,
1 9 7 8 ; HARNATT,
1 9 7 5 ; CARLSON,
1 9 7 6 ; K R A U S E & METZLER, 1 9 7 8 ) .
(a) Nach FISHER (1925, 1935, 1956) wird ausschließlich die Stichprobenverteilung («sampling distribution», s. HAYS, 1977, p. 263) der Teststatistik T unter Annahme der Gültigkeit der «exakten» Nullhypothese betrachtet (im Beispiel H0E: N, — (J.2 = 0). In Abbildung 1 symbolisiert die linke Kurve die Dichtefunktion dieser Verteilung. Ein kritischer Wert T cr j t der Teststatistik wird so gewählt, daß extremere Werte als T cr j t nur mit der sehr geringen Wahrscheinlichkeit a auftreten, wobei a per Konvention gleich 0,05,0,01 oder0,001 gesetzt wird (im Beispiel: a = 0,05, t c r j t = 1,66). Ergibt sich nun ein solches, bei Gültigkeit der Nullhypothese unwahrscheinliches Ereignis T e m p ^ T cr j t , wird die Nullhypothese abgelehnt und die Alternativhypothese angenommen. In allen anderen Fällen enthält man sich eines Urteils, indem man allenfalls sagt, die Nullhypothese sei (vorläufig) noch nicht verworfen. Diese Entscheidungsstrategie ist unter Rubrik (a) in Abbildung 1 dargestellt.
(b) Nach N E Y M A N & PEARSON (1933a, b, 1936, 1938a, b) soll nicht nur die Wahrschein1980a). Dabei beruht die Entscheidung zwi- lichkeit a für eine falschliche Ablehnung der schen der statistischen Null- und der statisti- Nullhypothese klein sein (Kontrolle von Fehschen Alternativhypothese stets auf dem empi- lern 1. Art), sondern auch die Wahrscheinlichrischen Wert T e m p einer Teststatistik T. Je nach keit ß für die falschliche Beibehaltung der NullArt der zugrundeliegenden Testtheorie sind auf hypothese (Kontrolle von Fehlern 2. Art). Ausdieser Basis im einzelnen allerdings unter- sagen über die Fehlerwahrscheinlichkeit ß und schiedliche Entscheidungsstrategien vorge- ihr Komplement, die Teststärke («power») 1 -ß, schlagen worden, von denen wir einige wesent- lassen sich aber nur machen, wenn man eine der liche im folgenden kurz ansprechen wollen. unter H, zusammengefaßten Parameterwerte Die Erläuterung dieser Strategien erfolgt bei- (z.B. (i, — (i2 = 8) als «wahren» Populationsspielhaft für einen Signifikanztest mit einer ge- wert annimmt, d.h. wenn man von einer ganz richteten Alternativhypothese in positiver bestimmten Abweichung von der Erwartung Richtung, also etwa einen gerichteten t-Test unter der Nullhypothese ausgeht ( H A Y S , 1977, mit H 0 : n, — |i 2 ^ 0 und H,: |i, — > 0.1 Auf p. 357). Diese Abweichung bezeichnet man alleine ausführliche Darstellung des Signifikanz- gemein als die «Effektgröße» (EG) oder auch als tests und seines Gebrauchs in den Sozialwis- den «experimentellen Effekt» ( C O H E N , 1977). senschaften können wir hier verzichten, weil zu Sie kann entweder in absoluten Einheiten (z. B. diesem Thema in den letzten Jahren eine ganze Differenzen von Mittelwerten oder WahrReihe von grundlegenden Arbeiten erschienen scheinlichkeiten), durch Maße der statistischen i s t ( B A K A N , 1 9 6 6 ; BREDENKAMP, 1 9 7 2 ; SPIELAssoziation (z.B. die Varianzverhältnisse CD2, T|2, oder R 2 ) oder durch Nichtzentralitätsparameter (z. B. X ,