218 97 6MB
German Pages 188 Year 1974
Techniken der empirischen Sozialforschung
Techniken der empirischen Sozialforschung Ein Lehrbuch in 8 Bänden Bearbeitet von G. Albrecht H.v. Alemann K.R. Allerbeck C. Besozzi D. Betz B. Bierverl G. Brinkmann G. Buttler M. Dierkes R. Dolíase PDrewe E. Erbslöh H.Esser E. Helten W. Herkner
Th. Herz Ρ Höhmann F Huber H. J. Hummell H.D. Klingemann K. Knorr J. v. Koolwijk H. Kreutz H.Lück W. Manz E. Mochmann H.Nowotny G. Ortlieb FU. Pappi Κ. Roghmann
Κ. R. Scherer E. Κ. Scheuch H.Schmerkotte W. Schulz 1. Stelzl M. Sturm E. Timaeus S. Titscher Th. Vajna R. Wegner A.Weidmann K. Wieken G.Wiendieck H. Zehnpfennig R. Ziegler
Herausgegeben von Jürgen van Koolwijk und Maria Wieken-Mayser
(f^f)
R. Oldenbourg Verlag München Wien
Techniken der empirischen Sozialforschung 4. Band Erhebungsmethoden: Die Befragung dargestellt von Jürgen van Koolwijk/Henrik Kreutz und Stefan Titscher/ Eberhard Erbslöh und Gerd Wiendieck/Hartmut Esser/ Klaus Wieken/Paul Drewe
Iii
R. Oldenbourg Verlag München Wien
(Ç) 1974 R. Oldenbourg Verlag GmbH, München Das Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die der Übersetzung, des Nachdrucks, der Funksendung, der Wiedergabe auf photomechanischem oder ähnlichem Wege sowie der Speicherung und Auswertung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Werden mit schriftlicher Einwilligung des Verlags einzelne Vervielfältigungsstücke für gewerbliche Zwecke hergestellt, ist an den Verlag die nach § 54 Abs. 2 UG zu zahlende Vergütung zu entrichten, über deren Höhe der Verlag Auskunft gibt. Umschlagentwurf: Günter Mittermeier, München ISBN
3-486-44851-X
Inhaltsverzeichnis
1.
Die Befragungsmethode
von Jürgen van Koolwijk
9
1.1
Zur Grundlegung der Befragungsmethode
9
1.2
Die Methodologie der Befragungsmethode
12
1.3
Formen der Befragung
15
1.4
Die Befragung als Meßinstrument
18
Literaturverzeichnis
20
2.
Die Konstruktion von Fragebögen
von Henrik Kreutz und Stefan Titscher
24
Die Konzeption von Befragungsstudien Klärung der Begriffe und ihrer Dimensionen Die Bedeutung des Forschungszieles Die Thematik der Untersuchung Die Messung von Einstellungen Fragen über beobachtbares Verhalten Die Populationsabhängigkeit von Instrumenten
25 26 30 32 33 36 38
2.2 Zentrale Probleme der Fragebogenkonstruktion 2.2.1 Die Reihenfolge der Fragen 2.2.1.1 Die Stellung heikler oder persönlicher Fragen 2.2.1.2 Die Verlaufskurve der Antwortbereitschaft 2.2.1.3 Themenwechsel und Mischung der Frageformen 2.2.1.4 Das "Trichtern" von Fragen 2.2.1.5 Die Rekonstruktion von Sachverhalten 2.2.1.6 Die Anwendung von Fragebatterien und Listenfragen 2.2.2 Die Formulierung der Fragen 2.2.2.1 Die Wahl der Frageform 2.2.2.2 Probleme der Frageformulierung 2.2.3 Funktionen von Fragen 2.2.3.1 Die Kontrollfrage
40 40 41 43 44 45 46 47 49 49 53 62 63
2.1 2.1.1 2.1.2 2.1.3 2.1.3.1 2.1.3.2 2.1.4
6
Inhaltsverzeichnis
2.2.3.2 Die Filterfrage 2.2.3.3 Fragen mit psychologischen Funktionen
64 65
2.3. 2.3.1 2.3.2
Prüfung und Beurteilung von Fragebögen Überprüfung der Fragenabfolge und Frageformulierung Berücksichtigung von Thematik und Zielsetzung
66 66 69
Literaturverzeichnis
72
3.
Der Interviewer
von Eberhard Erbslöh und Gerd Wiendieck
83
3.1
Das Interview als dyadische soziale Beziehung
83
3.2
Der Interviewer als Forschungsinstrument
85
3.3 3.3.1 3.3.2 3.3.3
Quellen und Kontrollmöglichkeiten des Interviewerfehlers Der Einfluß sichtbarer Merkmale Die Wirkung von Persönlichkeitsmerkmalen Die Wirkung von Einstellungen und Erwartungen
89 90 94 96
3.4
Strategie und Kosten des Interviewereinsatzes
100
Literaturverzeichnis
103
4.
Der Befragte
von Hartmut Esser
107
4.1
Der Befragte in der Forschungspraxis
107
4.2 4.2.1 4.2.2
Anforderungen an den Befragten durch die Untersuchungsanordnung Die Untersuchungsanordnung beim Interview Die Anforderungen, an den Befragten
109 109 109
4.3 4.3.1 4.3.2 4.3.3
Probleme der untersuchten Populationen Erreichbarkeit von Befragten Verweigerung der Befragung Zur Selektivität von Populationen
112 112 114 116
4.4 4.4.1 4.4.2 4.4.3
Probleme Die Rolle Elemente Probleme
118 118 119 121
4.5 4.5.1 4.5.2 4.5.3
Fehlreaktionen des Befragten Nichtbeantwortung von Fragen (non—response) Falschantworten Antwortstile (response set; response style)
123 123 124 126
Literaturverzeichnis
129
des Interaktionsverhältnisses im Interview des Befragten des Befragtenverhaltens im Interview der sprachlichen Kommunikation
,
Inhaltsverzeichnis
5.
7
Die schriftliche Befragung von Klaus Wie ken
146
Die schriftliche Befragung als Sonderform des Interviews
146
5.2
Die Gestaltung schriftlicher Fragebögen
147
5.3 5.3.1 5.3.2 5.3.3 5.3.4 5.3.5 5.3.6
Möglichkeiten zur Beeinflußung der Rücksendequote Die Gestaltung des Begleitschreibens Die Kontaktaufnahme vor Versand der Fragebögen Die Postkartentechnik Die Wirkung finanzieller Anreize Die F o r m des Postversands Die Wirkung von Erinnerungsschreiben
148 149 150 151 151 151 152
5.4
Die Dauer der Feldarbeit bei schriftlichen Umfragen
153
5.5
Möglichkeiten zur Kontrolle der Stichprobe
155
5.6
Die Zuverlässigkeit schriftlicher Befragungen im Vergleich zu Interviews
157
Literaturverzeichnis
159
Methoden zur Identifizierung von Eliten von Paul Dre we
162
6.1
Elitebegriff und Elitetheorien
162
6.2 6.2.1 6.2.2 6.2.3 6.2.4
Identifizierungstechniken Reputationstechnik Entscheidungstechnik Positionstechnik Sonstige Techniken
163 163 164 166 167
6.3
Dimensionaler Vergleich
168
6.4
Zuverlässigkeit
169
6.5
Gültigkeit
174
Literaturverzeichnis
177
5.1
6.
Namenregister
181
Sachwortregister
187
1.
Die Befragungsmethode von Jürgen van Koolwijk
1.1
Zur Grundlegung der Befragungsmethode
Befragung als methodisches Instrument taucht in der Geschichte der Sozialwissenschaften zweimal auf. Zuerst im Griechenland des fünften vorchristlichen Jahrhunderts unter dem Namen "Dialektik"; dann zu Beginn des zwanzigsten Jahrhunderts unter der Bezeichnung "Interview". Dialektik entwickelte sich zu einer der bedeutsamsten Denkfiguren der europäischen Philosophie, und das Interview gilt als Königsweg der Sozialforschung. Kern der Idee von einer Methode "Befragung" ist die Vorstellung, daß die Antworten auf eine geregelte Abfolge von Fragen — eine Fragenbatterie — Aufschluß über eine Realität geben können, die sich von den psychischen Vorgängen des Fragens und Antwortens, von der sozialen Situation des Fragenden und Antwortenden und von dem sprachlichen Inhalt der Frage und Antwort ablösen und in allgemeinen Regeln fixieren läßt. Aus der Kombination der Fragen und der Konstellation der tatsächlich gegebenen Antworten sollen Aussagen über die Konstruktion der sozialen Wirklichkeit erschlossen werden. Die Gründe für dieses Vertrauen in die Befragungsmethode, für die gleichsam paradigmatische Bedeutung der Befragung innerhalb des sozialwissenschaftlichen Methodenkatalogs und für die eigenartige Faszination, die vom "Ausfragen" ausgeht, sind — soweit sie sich auf empirische Vorgänge beziehen — unbekannt. Sofern sie sich auf die methodischen Grundlagen der Sozialwissenschaften beziehen, sind sie seit der Begründung der dialektischen Methode durch die Griechen kontrovers. Die antike Dialogbefr'agung verstand sich als Technik, dem Befragten Meinungen zu entlocken, die dann im Licht philosophischer Überlegungen auf ihre Stichhaltigkeit hin untersucht wurden. Häufig sollte eine These so bewiesen werden, daß sie als allgemein gültig akzeptiert werden mußte. Die Erfindung der Dialektik wird der eleatischen Schule zugesprochen, deren bedeutendster Vertreter Parmenides ist. Zenon von Elea, ein Schüler des Parmenides, soll der erste gewesen sein, der solche Dialogbefragungen aufgezeichnet hat. Einen guten Einblick in die sehr formalistische Befragungslehre des mutmaßlichen Erfinders des Interviews gibt der platonische Dialog ' T a n n e nides". Eine Dialogbefragung verlief nach bestimmten Regeln. Es gab einen Gesprächsführer, der die Fragen stellte, und einen oder mehrere "Antworter", die gemäß ihrer Einsicht zu antworten hatten. Der Gesprächsführer formulierte die Fragen so, daß nur eine begrenzte Zahl von Antwortmöglichkeiten zur Verfügung stand. Die "Ja-Nein-
10
4. Band: Erhebungsmethoden: Die Befragung
Frage" ist die primäre Form, die Auswahlfrage entwickelte sich später. Durch diese Strukturierung war der Gesprächsführer in der Lage, das Gespräch gleichsam automatisch dem angestrebten Ziel, z.B. dem Beweis, zuzuführen. Ein guter Gesprächsführer zeichnete sich dadurch aus, daß seine Fragen einfach waren und leicht verständlich, ohne Zwang auseinander folgten und in möglichst eleganter Weise zum Ziel führten. Man muß sich die Verbreitung der dialektischen Methode einigermaßen dramatisch vorstellen. Sie trug den Charakter einer sozialen Bewegung, die man sich angewöhnt hat, griechische Aufklärung zu nennen. Denn zugleich mit der dialektischen Methode wurde ein ganz neuer Typ von Philosophie und Weltanschauung — die relativistische Sprachphilosophie der Sophistik — verbreitet. Sie setzte sich zum Ziel, die traditionellen Vorstellungen von Mensch, Staat und Moral von Grund auf zu revidieren, und ist verbunden mit der Entwicklung der ersten großen sozialwissenschaftlichen Systemtheorien durch Piaton und Aristoteles. Die dialektische Befragung war Medium und Motor dieser Bewegung. Medium insofern, als durch den Dialog die Theorie vermittelt wurde, die ihrerseits die Dialogmethode rechtfertigte; die Wirksamkeit der Methode diente zugleich als Beweis für den Wahrheitsgehalt der Theorie. Motor war sie insofern, als sich die zunächst auf philosophische Zirkel und philosophische Themen beschränkende Dialektik zur "öffentlichen Fragenstellerei" über aktuelle Themen und Tabus verwandelte, die sich explizit als Provokation verstand. Dialektik galt deshalb Traditionalisten als zersetzend, unmoralisch und politisch gefährlich. Kaum anders wird zunächst die moderne Befragungsmethode von Fachwelt und Öffentlichkeit aufgenommen. Das trifft vor allem auf die durch Sigmund Freud begründete Methode der Tiefenbefragung zu, der ersten voll ausgebildeten Interviewtheorie. Sie ist noch heute umstritten. Ablehnung erfuhr aber auch — wenngleich nicht in demselben Maße — die mit dem Namen Gallup verbundene Meinungsbefragung. Als Paradigma für die zunehmend positive Beurteilung der Befragungsmethode und der durch sie vermittelten wissenschaftlichen Ergebnisse gilt Sozialforschern der Sexualreport von Kinsey und seinen Mitarbeitern. Er wurde zunächst heftig angegriffen und zählt heute zu den Klassikern der Befragungsforschung. Ähnlich wie bei der antiken Befragungsmethode resultiert auch die Forschung mithilfe des modernen Interviews in einer Umstrukturierung der theoretischen und praktischen Grundlagen der Sozialwissenschaft. Die Psychoanalyse, deren letzte Konsequenzen hinsichtlich der Beziehung von Krankheit und Erkenntnis noch kaum akzeptiert worden sind, ist in ihrem sozialwissenschaftlichen Gehalt noch längst nicht historisch. Die Test- und Auslesemethoden der Psychotechnik, die sich fast ausschließlich der Befragungsmethode bedienen, stehen erst am Beginn ihrer allgemeinen Verbreitung. Und die Meinungsforschung ist nicht nur der wichtigste Lieferant empirischer Daten für die theoretische Sozialforschung, in der Form der Markt- und Politikforschung ist sie zu einem einflußreichen ökonomisch-politischen Faktor geworden. Hatte die antike Auffassung die Befragungsmethode als Instrument betrachtet, das einen direkten Zugang zu wissenschaftlichen Erkenntnissen öffnet, kann ihr nach moderner Auffassung ein solcher unmittelbarer Erkenntniswert nicht zukommen. Zwischen die Daten der durch Frage und Antwort gewonnenen Erfahrung und die wissenschaftliche Erkenntnis tritt einerseits der Eigenwert des Instruments und andererseits die Theorie als Bezugsrahmen, innerhalb dessen Frage und Antwort einen bestimmten
1. Kapitel: Die Befragungsmethode
11
Stellenwert zugeordnet bekommen. Frage und Antwort gelten als Indikatoren eines theoretisch interpretierten Sachverhalts, fìir den sie das empirische Äquivalent sind. Der Befragungsablauf ist deshalb nicht allein vertikal strukturiert, sondern zugleich horizontal gegliedert. Neben die Batterie auseinander folgender Fragen tritt die Batterie nebeneinander geschalteter Fragen, die den gleichen Sachverhalt durch parallel angeordnete Indikatoren zu erfassen sucht. Die Mehrfachindizierung von theoretischen Konzepten und die sich daraus ergebenden empirischen und meßtheoretischen Probleme ist eines der wichtigsten Themen der modernen Befragungslehre. So unterschiedlich antike Dialektik und modernes Interview in Erscheinungsform und Zielsetzung sind, gemeinsam ist ihnen die Überzeugung, daß allein die Frage in der Lage ist, die wirklich wichtigen sozialwissenschaftlichen Konstanten aufzudecken, seien es "Denkgesetze", wie sie durch die dialektische Befragungsmethode ans Licht gebracht, oder seien es "Kovariationen von inferierten Eigenschaften", wie sie durch die Interviewforschung aufgedeckt werden sollen. Der Mensch als Produzent aller Bewußtseinsinhalte sei am besten mit dieser, seiner Natur am meisten entsprechenden Methode zu erforschen. Die Sicherheit, mit der die Befragung als beste sozialwissenschaftliche Methode postuliert wird, überträgt sich auf die Theorie, die durch diese Methode gewonnen und gestützt wird. In Sophistik und Sozialforschung ist die neue wissenschaftliche Methode mit einem aufklärerischen Impetus verbunden, der radikal mit traditionellen wissenschaftstheoretischen und weltanschaulichen Vorstellungen brechen will. Ist die Methode optimal, muß auch die auf ihr aufbauende und sie rechtfertigende Theorie optimal sein. Diese strukturelle Parallelität von antiker und moderner Befragungsmethode ist sicher nicht zufällig. Sie leitet sich einerseits aus der sozialen Situation ab, in der ihre Verbreitung fällt. Denn Sophistik und Sozialforschung entwickeln sich in Epochen, in denen Selbstverständlichkeiten - auch im Bereich der Wissenschaft — verloren gehen, in denen metaphysische Verankerungen gelöst werden und das kollektive Bewußtsein mehr Fragen stellt, als beantwortet werden können. Hier ist es nicht verwunderlich, wenn sozialwissenschaftliche Theorien an die Stelle von Weltanschauungen treten und das Fragen als wissenschaftliche Methode institutionalisiert wird. Diese Parallelität liegt aber auch in der Sache selbst. Denn die Frage ist mehr als nur ein Hilfsmittel der Kommunikation. Neben ihrer grammatischen Funktion signalisiert sie psychische Zustände, deren Wurzeln in die Tiefenschichten der Person reichen. Sozialartefakte wie "Rätsel", "Orakel" und "Fragespiele" machen sich den spielerischen Reiz zunutze, der vom Fragenstellen ausgeht. Sie lassen sich auf religiös-mythische Ursprünge zurückführen, und ihre ungebrochene Beliebtheit heute deutet auf eine sehr tiefliegende Verankerung im menschlichen Bewußtsein hin. Der Reiz des Interviews und die Emotionen, die es hervorruft, lassen sich u.a. auf diese Tatsache zurückführen. So ist es nicht verwunderlich, daß es in der europäischen Geistesgeschichte "berühmte" Fragen gibt, die gleichsam den Inhalt der Epoche, in der sie entstanden, schlagwortartig kennzeichnen: "Was ist Wahrheit? ", "Sein oder Nichtsein? ", "Wer hat Angst vor Virginia Woolf? ". Solche Fragen erreichen jene Persönlichkeitsschichten, die auch durch religiös-philosophische Vorstellungen berührt werden. Das Wissen um die "Richtigkeit" solcher Fragen ist die irrationale Wurzel für den Einsatz der Befragungsmethode als rationalem Instrument zur Erforschung des Menschen.
12
1-2
4. Band: Erhebungsmethoden: Die Befragung
Die M e t h o d o l o g i e der Befragungsmethode
Unbestritten ist die Befragungsmethode heute das wichtigste Erhebungsinstrument der empirischen Sozialforschung. In allen humanwissenschaftlichen Einzeldisziplinen, von der Ethnologie bis zur Medizin, von der Kriminalistik bis zur zeitgeschichtlichen Forschung und von der psychiatrischen Diagnostik bis zur statistischen Erhebung, zählen Befragungsmethoden zu den bedeutendsten F o r m e n der Datensammlung. Dieser Breite an Anwendungsmöglichkeiten steht eine Vielzahl differenzierter Interviewtechniken gegenüber, die nebeneinander und z.T. unabhängig entwickelt wurden oder sich aus der allgemeinen Befragungsmei/iode ausgegliedert haben und nun als spezielle Erhebungsmethoden den Kanon sozialwissenschaftlicher Forschungstechniken ergänzen. Der Spezialisierung und Differenzierung des Befragungsinstrumentariums ist die methodische Literatur gefolgt. Neben der Umfrageforschung stehen als relativ abgeschlossene Forschungsbereiche die Methoden der Testkonstruktion, der Soziometrie, der psychiatrischen Interviewtechnik, der Motivforschung usw. Jedes Anwendungsgebiet der Befragungsmethode hat eigene, spezifische Methoden und Techniken entwickelt, und die Ergebnisse methodischer Untersuchungen gelten in der Regel nur für eng begrenzte Bereiche. Gegenüber dieser Spezialisierung der Befragungsmethode und der Vielfalt von Einzelergebnissen der Befragungsforschung erfolgt die terminologische Abgrenzung gegenüber anderen Techniken meist auf einer abstrakten, umfassenden Ebene, die die Einheitlichkeit dieser Erhebungsmethode kennzeichnen soll. Hierbei spielen die Unterschiede zu Kommunikationsformen, wie sie das Alltagsverständnis als "Befragung" interpretiert, eine besondere Rolle (vgl. ANGER 1969; SCHEUCH 1962): der zweckgerichtete Charakter und die wissenschaftliche Zielsetzung der Befragung, die Asymmetrie der Kommunikationsbeziehung, die Fixierung des Befragungsinhalts und des Befragungsverlaufs, die Einmaligkeit und soziale Folgenlosigkeit der Kommunikation usw. Diese Disparität zwischen der komplexen Realität des wissenschaftlichen Instrumentariums und der Auffassung von der Befragung als einheitlicher Erhebungstechnik hat zu der Tatsache geführt, daß die Befragungslehre zwei nahezu getrennte Bereiche urafaßt. Auf der einen Seite steht die Vielzahl der Forschungsergebnisse aus empirischen Untersuchungen über die Befragungsmethode, deren interessanteste Teilstücke technologisch kaum verwertbar sind. Auf der anderen Seite findet sich eine Vielzahl von allgemeinen Regeln und Anhaltspunkten zur Befragungsmethode, die helfen soll, die Durchführung beliebiger Befragungen zu erleichtern und die Praxis gegen offensichtliche Mißgriffe abzusichern. Theorie und Praxis der Befragungslehre schneiden sich in den Konstrukten Zuverlässigkeit und Gültigkeit, die für den Begriff des Fehlers stehen. Erforschung der Fehlerarten, Fehlerursachen und Fehlerwirkungen ist der Hauptinhalt der methodischen Literatur über die Befragungsmethode. In keinem anderen Gebiet der Techniken der empirischen Sozialforschung ist die Konzeption der Fehlermethodologie so sehr mit der empirischen und theoretischen Forschung verbunden wie bei der Befragungsmethode. Erst in neuerer Zeit — vor allem in der psychiatrisch-klinischen Interviewforschung — hat der fehlerorientierte Forschungsansatz einem generelleren, kommunikationsorientierteren Forschungsansatz Platz gemacht.
1. Kapitel: Die Befragungsmethode
13
Die überragende Bedeutung des Interviews für die Sozialforschung, die Heterogenität der Forschungs- und Anwendungsbereiche, die Nähe der Befragungsmethode zu Verhaltensweisen, die die alltägliche Kommupikation bestimmen, die Diskrepanz zwischen empirischem Wissen und technologisch verwertbaren Ergebnissen, das Fehlen einer Meßtheorie des Interviews ebenso wie die Anfälligkeit gegenüber einer Vielzahl von verzerrenden Einflüssen: das sind die kontrastierenden Bedingungen, unter denen die Interviewforschung steht. Bedingungen, die einerseits die o f t unkritische Verwendung dieses Instruments und die meist zu hoch gesteckten Erwartungen in seine Leistungsfähigkeit und andererseits die in der Regel wenig gehaltvolle Kritik der Öffentlichkeit an der Interviewmethode erklären. Diese Bedingungen treffen vor allem auf die Umfrageforschung, die Testforschung und die psychiatrische Interviewforschung zu, die die wichtigsten Beiträge zur Theorie und Methode der Befragungstechnik geliefert haben. Der Umfrageforschung verdankt die Befragungsmethode die wohl bedeutsamsten Einsichten in Struktur und Prozeß des Interviews. Als wichtigstes Gebiet der angewandten Sozialforschung hat sie darüber hinaus die allgemeine Reflexion über Sinn und Ziel der empirischen Verhaltensforschung nachhaltig beeinflußt. Die Institutionalisierung der Meinungsforschung in den dreißiger und vierziger Jahren führte in den USA zu einem wachsenden Bedarf an gesicherten Erhebungs- und Auswertungstechniken, der zuerst von der kommerziellen, später von der akademischen Forschung gedeckt wurde. Dieses sample survey movement führte zu den ersten umfangreichen methodischen Untersuchungen über Auswahlverfahren, Fragebogenkonstruktion und Intervieweinsatz im Rahmen von nationalen Bevölkerungsumfragen. Insbesondere die Erfolge und Mißerfolge bei der Vorhersage von Wahlergebnissen waren Anlaß zu methodischer Kritik der eingesetzten Befragungstechniken. Einen Abschluß dieser frühen Entwicklung bildete einerseits die grundlegende Publikation von CANTRIL ( 1 9 4 4 ) , in der die wichtigsten Ergebnisse der Umfragemethodologie zusammengefaßt wurden, und andererseits die umfassende Kritik von MCNEMAR ( 1 9 4 6 ) , die als eine erste akademische Stellungnahme zu den methodischen Problemen der Meinungsforschung gedacht war. Nach dem zweiten Weltkrieg wuchs dann die methodische Literatur über die Umfrageforschung schnell an. In zahlreichen Sammelaufsätzen und Büchern sind die wichtigsten Ergebnisse dieser Untersuchungen zusammengefaßt (BINGHAM UND MOORE 1 9 5 9 ; CANNELL UND KAHN 1 9 5 3 ; 1 9 6 8 ; GALLUP 1 9 4 8 ; HYMAN 1 9 5 1 ; HYMAN 1 9 5 4 ; KAHN UND CANNELL 1 9 5 7 ; MACCOBY UNDMACCOBY 1 9 5 4 ; PARTEN 1 9 5 0 ; PAUL 1 9 5 3 ; PAYNE 1 9 5 1 ; RICHARDSON, DOHRENWEND UND KLEIN 1 9 6 5 ; SHEATSLEY 1 9 5 1 ; STEPHAN UND MCCARTHY 1958).
In Deutschland wurde die Umfrageforschung des sample survey movement während des zweiten Weltkrieges (NOELLE 1 9 4 0 ) , vor allem aber in der Zeit danach bekannt. Höhepunkt der ersten methodischen Bemühungen um Theorie und Technik der Umfragemethode in Deutschland war die Weinheim tagung 1951, auf der über die Rezeption der amerikanischen Meinungsforschung diskutiert wurde (Empirische Sozialforschung 1 9 5 2 ) . Trotz einer Reihe wichtiger Publikationen über die Befragungsmethode läßt sich jedoch eine dem amerikanischen Niveau vergleichbare Diskussion in Deutschland nicht nachweisen (ANGER 1 9 6 9 ; HAEDRICH 1 9 6 4 ; HOFSTÄTTER 1 9 4 9 ; KÖNIG 1 9 5 2 ; NOELLE 1 9 6 3 ; SCHEUCH 1 9 6 7 ; STROSCHEIN 1 9 6 5 ) .
14
4. Band: Erhebungsmethoden: Die Befragung
In seiner Kritik an den Methoden der Meinungsforschung übertrug M C N E M A R ( 1 9 4 6 ) die Kriterien reliability (Zuverlässigkeit) und validity (Gültigkeit), die im Bereich der psychologischen Testtheorie entwickelt wurden, auf die Umfragemethode der Meinungsforschung. Wurde hier einerseits die bereits vorherrschende Tendenz zur Fehlerforschung durch testtheoretische Maßstäbe verstärkt, so schien sich in dieser Übertragung andererseits eine vorteilhafte Konvergenz der methodischen Forschung über Testverfahren der Psychologie und Befragungstechniken der Sozialforschung zu zeigen. Zwar sind die klassischen Themen der Testforschung — Motivationseffekte, Testangst, Testleitereffekt, Situationswirkungen, Testerfahrenheit, Ehrlichkeit, Antwortenhabitus usw. — in der Regel nicht unmittelbar auf andere Formen der Befragung übertragbar, dafür betonen sie aber den kommunikativen Charakter der Befragung in viel stärkerem Maße, als es in der Meinungsforschung üblich ist (vgl. ANASTASI 1 9 6 1 ; CRONBACH 1 9 6 1 ; HEISS 1 9 6 4 ) .
Insbesondere die von CRONBACH ( 1 9 4 6 ; 1 9 5 0 ) systematisierten und in den letzten Jahren heftig diskutierten response-set Theorien haben zu einer Transformation des Fehlerleransatzes in der Befragungsmethologie geführt (vgl. BERG 1 9 6 7 ) . In dem Ausmaß, in dem heute Fragenbatterien und Statementkataloge, bei denen response-set Effekte zu erwarten sind, bei allen Formen der Befragung Anwendung finden (BONJEAN, HILL UND M C L E M O R E 1 9 6 7 ; MILLER 1 9 6 4 ; SHAW UND WRIGHT 1 9 6 7 ) , sind die Ergebnisse dieser Theorien für die Interpretation von Befragungsdaten von erheblicher methodischer Konsequenz. Obwohl die Forschung über Testformen und Testkonstruktion weitgehend auf diagnostische Beeiche beschränkt blieb und nur einen sehr geringen Einfluß auf die allgemeine Befragungslehre ausgeübt hat, ist es in einem Teilbereich der Testmethodik zu einer weitgehenden Konvergenz soziologischer und psychologischer Befragungsforschung gekommen: die indirekten und projektiven Testmethoden fanden schnell Eingang in die sozialpsychologische Verhaltensforschung, die Einstellungs- und Meinungsforschung, die Motivforschung und die Kulturanthropologie (ATKINSON 1 9 5 8 ; CAMPBELL 1 9 5 0 ; LEONARD 1 9 5 5 ; LINDZEY 1 9 6 1 ; WESCHLERUND BERNBERG 1 9 5 0 ) .
Die Verschmelzung von Umfragemethodologie und Testmethodik steht bis heute noch aus. Dies liegt einerseits an der unterschiedlichen Zielsetzung, hat aber andererseits auch strukturelle Gründe. Der überwiegend analytisch orientierte Umfragesektor stellt methodisch andere Probleme als der diagnostisch orientierte Testbereich, sofern die Ausrichtung an der Fehlermethodologie dominant ist. In der projektiven Testmethodik, wo der traditionelle Fehlerbegriff versagt bzw. Zuverlässigkeit und Gültigkeit problematisch sind, lassen sich die trennenden Faktoren am leichtesten beseitigen. So umstritten diese Befragungsmethoden seit Beginn ihrer Erforschung sind, für die Methodologie der Befragung haben sie Erhebliches geleistet. Neben Umfrageforschung und Testmethodik hat die Psychotherapie als dritte Quelle die Befragungsmethode nachhaltig beeinflußt. F R E U D ( 1 9 4 3 ) gibt in "Ratschläge für den Arzt bei der psychoanalytischen Behandlung" ausführliche Anweisungen für die Befragung der Patienten. Neben der Freud'schen Konzeption sind vor allem die Befragungstechniken von R O G E R S ( 1 9 5 1 ) und SULLIVAN(1954)einflußreichgewesen. Die auf diesen Konzeptionen aufbauenden Interviewtechniken sind allerdings auf das psychotherapeutische Interview beschränkt geblieben und haben nur die theoretische Diskussion über Interviewstile angeregt. Wo sie auf das Masseninterview übertragen
1. Kapitel: Die Befragungsmethode
15
wurden, z.B. in der von Rogers beeinflußten dynamischen Interviewlehre von KAHN UND CANNELL (1957), ergab sich bald eine Konvergenz mit den Problemen der herkömmlichen Umfragemethodologie. Hatte die ältere psychotherapeutische Befragungslehre die terminologischen und theoretischen Akzente gesetzt, so erfolgte in den letzten Jahren durch die Übernahme linguistisch-inhaltsanalytischer Kategorien in den Prozeß der Interviewanalyse eine Neuorientierung der psychotherapeutischen Befragungsforschung. Ziel dieser Untersuchungen ist die Aufgliederung des Befragungsprozesses in kleinste linguistische und paralinguistische Einheiten, die dann zur Deskription des Interviewvorganges herangezogen werden oder die Basis für weitere analytische Auswertungen bilden (-»· Bd. III: Scherer, Sprachforschung 4.4). Dieser neue Ansatz der Analyse von verbalen und non-verbalen Verhaltensweisen im Interview fällt mit dem wachsenden Interesse an sozio- und psycholinguistischen Theorien über Kommunikationsprozesse zusammen. Diese Neuorientierung ist deshalb weder auf das therapeutische Interview beschränkbar noch auch auf die Befragung überhaupt. Es zeichnet sich vielmehr eine generelle Theorie kommunikativer Verhaltensweisen ab, die durch einheitliche Terminologie, Methode und Technik der Analyse zu einem neuen Verständnis des klassischen sozialwissenschaftlichen Erhebungs- und Auswertungsinstrumentatiums f u h r t . O Bd. III: Manz, Beobachtung non-verbaler Kommunikation und ->· Bd. III: Scherer, Non-verbale Verhaltensweisen). Die methodologischen Grundprobleme der Befragungstechnik sind heute weitgehend geklärt, und es besteht kaum noch ein Zweifel an der allgemeinen Brauchbarkeit dieses Erhebungsinstruments. In der Grundlagenforschung behauptet die Befragungsmethode seit 40 Jahren mit Abstand den ersten Platz unter den Techniken der empirischen Sozialforschung, in der angewandten Sozialforschung ist dieses Übergewicht noch erheblich stärker. Auf die Gefahren einer solchen Einseitigkeit des methodischen Instrumentariums weisen WEBB U.A. (1966) hin: eine ausschließlich intervieworientierte Sozialforschung führt zu Schwierigkeiten bei der Interpretation von verhaltenswissenschaftlichen Theorien. Denn das Meßinstrument determiniert den Rahmen, in dem sich eine empirisch abgesicherte Theorie erst entfalten kann.
1.3
Formen der Befragung
Die Flexibilität der Befragungsmethode und die Vielfalt der Anwendungsmöglichkeiten haben eine Fülle von unterschiedlichen Formen der Befragung entstehen lassen. Ihr gemeinsames Merkmal besteht darin, durch gesteuerte Kommunikation mit Personen Informationen zu vermitteln und zu gewinnen, die anders nicht oder nur mit größerem Aufwand vermittelt oder ermittelt werden können. Unter Interview versteht man in der methodischen Literatur überwiegend das ermittelnde Interview. Die Befragungsperson wird hier als Träger abrufbarer Informationen verstanden. Das vermittelnde Interview, bei dem die Befragungsperson Zielobjekt einer informatorischen oder beeinflussenden Kommunikation ist, ist nur selten Gegenstand empirischer Analysen gewesen (z.B. MAIER 1958). Mischformen zwischen ermittelndem und vermittelndem Interview sind das sozialfürsorgerische Interview, sowie alle Formen des therapeutischen Interviews.
16
4. Band: Erhebungsmethoden: Die Befragung
Das ermittelnde Interview wird in der Regel in die drei Formen des informatorischen, des analytischen und des diagnostischen Interviews klassifiziert. Das informatorische Interview dient dazu, Tatsachen deskriptiv zu erfassen, wobei die Befragungsperson als Experte bewertet wird. Typische Formen des Informationsinterviews sind das journalistische Interview, das Zeugeninterview und das Hearing. In der Sozialforschung wird das Experteninterview bei der Identifikation von Eliten (->· Bd. IV: Drewe, Identifizierung von Eliten) und in der Form Ass Informanteninterviews bei ethnologischen Feldstudien (-»· Bd. III: Weidmann, Feldbeobachtung) oder Gemeindeuntersuchungen eingesetzt. Das analytische Interview ist die Hauptform der Befragungsmethode. In dieser Form dient die Befragung als Erhebungsinstrument zur Erfassung sozialwissenschaftlicher Sachverhalte, die aufgrund theoretischer Überlegungen beschrieben oder analysiert werden sollen. Im Gegensatz zum informatorischen Interview, bei dem die Wahrheit der Information zum methodischen Problem wird, stellt sich im analytischen Interview die Frage nach der Zuverlässigkeit und Gültigkeit, mit der die erfragte Information den theoretisch intendierten Sachverhalt trifft. Deshalb ist das analytische Interview in der Regel massenhaft, da nach den verschiedenen Zuverlässigkeits- und Gültigkeitskriterien die Quantifizierung der Datenmenge konstituierendes Element ist. Die Vielzahl gleichartiger Interviewsituationen, die Standardisierung des Interviewinhalts und die gleichförmige Administration sind für das analytische Interview typisch. Das diagnostische Interview dient zur Ermittlung eines fest definierten Merkmalsprofils der Befragungsperson, das als Grundlage für den Einsatz von Behandlungsmethoden herangezogen wird. Das diagnostische Interview baut auf ausgebildeten Theorien auf, die ihre technologische Brauchbarkeit bereits unter Beweis gestellt haben müssen. Je nach zugrundeliegender Theorie reicht das diagnostische Interview von streng standardisierten und geeichten Testverfahren bis zu unstrukturierten, anamnetischen Befragungen, deren Ablauf der Gesprächsführung durch den Interviewer überlassen bleibt. Die Grenzen zwischen informatorischem, analytischem und diagnostischem Interview sind fließend. Nicht selten werden Informationsinterviews analytisch interpretiert (z.B. beim reputational approach der Eliteidentifizierungstechnik). Bei analytischen Interviews wird der Befragte häufig als Experte behandelt, und diagnostische Befragungen werden für die Beurteilung therapeutischer Maßnahmen analytisch ausgewertet. Die wissenschaftliche Befragung ist in der Regel als persönliche Kommunikation zwischen einem Interviewer und einem Befragten konzipiert. Wenn von Befragung gehandelt wird, stellt diese Form den Ausgangsfall dar, und der größte Teil der methodischen Literatur bezieht sich auf diesen Interviewtyp. Die beiden wichtigsten Sonderformen des Interviews neben der persönlichen Befragung sind die schriftliche Befragung und die Gruppenbefragung. Die schriftliche bzw. postalische Befragung (->• Bd. IV: Wieken, Schriftliche Befragung) wird bei Großbefragungen (z.B. bei Volkszählungen, Totalerhebungen von Bevölkerungssubgruppen) und bei leicht erreichbaren Teilgruppen (z.B. Mitgliedern einer Organisation, Abonnenten einer Zeitschrift) eingesetzt. Voraussetzung für die postalische Befragung ist neben einer zuverlässigen Adressenkartei die Erwartung einer überdurchschnittlichen Beantwortungsmoral, die meist nur für Subgruppen gelten wird. Aus diesem Grund werden repräsentative Querschnitte nur selten mit Hilfe postalischer Befragungen angegangen.
1. Kapitel: Die Befragungsmethode
17
Über die Kombination von mündlicher und schriftlicher Befragung berichten CANNELL UND FOWLER ( 1 9 6 4 ) und M A G I D . G O T I O N UND G O L D ( 1 9 6 2 ) . Kaum untersucht ist die Wirkung der räumlichen Trennung zwischen Interviewer und Befragtem beim telephotischen Interview (vergi. ASSAEL UND EASTLACK 1 9 6 6 ; COOMBS UND FREEDMAN 1 9 6 4 ; J U D D 1966). Uber telegraphische Interviews berichtet PARTEN (1950, S. 421). Gruppenbefragungen oder Kollektivinterviews werden vor allem dort eingesetzt, wo natürliche Gruppen, z.B. Schulklassen, militärische Einheiten oder Kursusteilnehmer, räumlich zusammengefaßt werden können. Durch die simultane Befragung werden einerseits Kosten gespart, andererseits wird die Befragungssituation für alle Befragungspersonen vereinheitlicht. Allerdings besteht die Gefahr, daß die Gruppensituation einen unerwünschten Effekt ausübt. Durch die Konstruktion besonderer Fragebogenformen (z.B. Parallelformen) und durch spezifische Administrationsformen (z.B. Sukzessivdarbietungen) wird versucht, den Gruppeneffekt zu vermindern. Die Probleme standardisierter Gruppenbefragungen werden vor allem in der psychologischen Testliteratur behandelt. Eine Sonderform des Kollektivinterviews ist das
Gruppendiskussionsverfahren Die Gruppendiskussion ist ein freies Gespräch zwischen den Gruppenmitgliedern über das Befragungsthema, in das der Interviewer nur steuernd eingreift. Die Gruppenmitglieder sind so ausgewählt, daß ihre Meinungen als Äußerungen von Rollenträgern in einem Meinungsbildungsprozeß interpretiert werden können. Ziel der Untersuchungstechnik ist es, Material über Struktur und Variationsbreite von Meinungen und Einstellungen zu erhalten, das als Grundlage für die Analyse eines Meinungsbildungsprozesses dienen kann. Werden den Gruppenmitgliedern explizit Rollen zugewiesen, nähert sich das Gruppendiskussionsverfahren dem Soziodrama. (ABRAMS 1 9 4 9 ; BANKS 1 9 5 7 ; MANGOLD 1 9 6 7 ; POLLOCK 1 9 5 5 ) .
Befragungen mit mehreren Interviewern gleichzeitig sind selten. In der Umfrageforschung spricht man von Tandeminterviews (KINCAID UND B R I G H T 1 9 5 7 ) , bei Befragungen in Form eines Hearings von Board-Interviews ( O L D F I E L D 1 9 5 1 , S . 1 1 7 ) . Aus dem vorgegebenen Interviewerverhalten leitet sich die Unterscheidung in weiches, hartes und neutrales Interview her (DOHRENWEND UND RICHARDSON 1 9 6 3 ; SCHEUCH 1967). Das weiche oder nichtdirektive Interview strebt eine Interaktion an, die im wesentlichen vom Befragten selbst bestimmt wird. Der Interviewer soll eine passive Rolle spielen und nur bei Themenwechsel eingreifen. Das harte Interview verlangt eine ständig herausforderndes Eingreifen des Interviewers. Er soll dem Befragten seine Skepsis gegenüber dem Wahrheitsgehalt der Antworten deutlich machen und den Eindruck erwecken, daß Ausweichen und Ableugnen sinnlos ist. In der Form der Widerspruchstechnik und des Stressinterviews wird das harte Interview zum Kreuzverhör. Die Konzeption des neutralen Interviews betont den unpersönlich sachlichen Charakter der Befragung, die Einmaligkeit der Kommunikation und die soziale Distanz zwischen den Befragungspartnern. Modifikationen des neutralen Interviews werden heute den meisten Befragungsformen unterlegt. (-»· Bd. IV: Esser, Der Befragte 4.2) Von großer praktischer Bedeutung für die Differenzierung der Befragungsformen ist der Grad der Standardisierung und Strukturierung des Befragungsablaufs. Unter Standardisierung wird die Festlegung des Wortlauts und der Reihenfolge der Fragen bzw. der Stimuli, unter Strukturierung die Festlegung zulässiger oder möglicher Antworten und Reaktionen verstanden.
18
4. Band: Erhebungsmethoden: Die Befragung
Vollständig standardisiert und strukturiert sind vor allem Testverfahren, Persönlichkeitsfragebogen und Einstellungsskalen. Uber die Entwicklung, Analyse und Beurteilung solcher Standardisierter und strukturierter Verfahren unterrichtet eine umfangreiche Literatur (z.B. LIENERT 1967). Weitgehend standardisiert und strukturiert sind die Massenumfragen der akademischen und kommerziellen Sozialforschung. Befragungsformen, bei denen keine Interviewer eingesetzt werden, z.B. postalische Befragungen, weisen einen höheren Strukturierungsgrad auf als Interviews, bei denen ein Interviewer ausgleichend und erklärend eingreifen kann. Bei der Befragung spezifischer Bevölkerungssubgruppen verzichtet man häufig auf manifeste Standardisierung und Strukturierung, um Widerstände zu vermeiden. Nicht-standardisierte und unstrukturierte Befragungsmethoden werden bei den meisten Formen des informatorischen Interviews, bei explorativen Formen des analytischen Interviews und bei therapeutischen Befragungen eingesetzt. Ist der Forscher selbst Interviewer, z.B. bei ethnologischen Felduntersuchungen oder bei der therapeutischen Befragung, wird der Gesprächsablauf dem Geschick des Interviewers überlassen. In allen anderen Fällen wird dem Interviewer ein Leitfaden vorgegeben, der die Themen der Befragung und notfalls die Reihenfolge, in der sie abgefragt werden sollen, enthält. In ihrer klassischen Form wurde die Interviewleitfadentechnik bei den Befragungen des Kinsey-Reports verwendet (vgl. COCHRAN U.A. 1954). Als Tiefeninterview, das das Aufdecken tieferliegender Motivstrukturen des Befragten anstrebt, war die nicht-standardisierte und unstrukturierte Befragungsmethode zeitweise heftig umstritten (CAMPBELL 1 9 4 8 ; GÖRDEN 1 9 5 6 ; LAZARSFELD 1 9 4 4 ; METZNER UNDMANN 1 9 5 2 .
1-4
Die Befragung als Meßinstrument
In der methodischen Literatur über die Befragungsmethode wird seit langem der soziale Charakter des Interviews hervorgehoben. Die wissenschaftliche Befragung wird als besondere Form der Kommunikation interpretiert, deren Eigenschaften die Grenzen des Interviews als Meßinstrument bestimmen (CAPLOW 1956; GETZELS 1954; RIESMAN UND BENNEY 1956; SCHEUCH 1967). Die Probleme, die sich durch den kommunikativen Charakter des Interviews ergeben, wurden zu Beginn der Umfrageforschung vor allem als Sprachprobleme begriffen. Daß Sprache als wichtigster Träger der Interviewinformation ein problematisches Medium sein kann, ist wesentlicher Inhalt der frühen methodischen Untersuchungen. Wortwahl, Frageformulierung und Satzbau werden mithilfe der Methode der gegabelten Fragebogen (split-ballot technique) auf ihren Effekt für die Antworten des Befragten getestet. Die Ladung (loading) einer Frage ist das wichtigste Kriterium für ihre Brauchbarkeit als Indikator. Die ergebnislose Suche nach neutralen Formulierungen und ungeladenen Fragen führt schließlich zur Umdefinition dieses Problems: aus der Tatsache, daß Sprache nicht allein der Übermittlung sachlicher Information dient, jede Frage also ein gewisses Maß an Suggestivwirkung entfaltet, folgt für die Konstruktion eines optimalen
1. Kapitel: Die Befragungsmethode
19
Meßinstruments die Lehre von der richtigen Dosierung der Ladung (PAYNE 1951, S . 1 7 7 ; RICHARDSON,DOHRENWEND UND KLEIN 1 9 6 5 , S . 1 7 1 ) . Die Konzeption der Neutralität des Instruments wird zugunsten einer gesteuerten Objektivität aufgegeben. Sprache wirkt aber zwischen Bevölkerungsgruppen unterschiedlich. Sowohl der kognitive als auch der emotionale Gehalt von Worten verändert sich mit der sozialen Umgebung (STRAUSS UND SCHATZMANN 1 9 5 5 ) . Bei international vergleichenden Untersuchungen mit mehrsprachigen Fragebogen wurde diese Differenz zwischen Wortäquivalenz und Bedeutungsäquivalenz zuerst sichtbar. Innerhalb der gleichen Sprachgemeinschaft zeigen sich Unterschiede nur bei SpezialSprachen für tabuierte Sachverhalte oder im Jargon von Extremgruppen. Die ungleich wichtigeren Bedeutungsverschiebungen und unterschiedlichen Tönungen von Worten und Satzkonstruktionen zwischen Bevölkerungsgruppen sind meist unerkannt. Nachgewiesen wurden diese Unterschiede für abstrakte Begriffe (SIMPSON 1 9 4 4 ) . In starkem Maße spielt hierbei auch die individuelle Erfahrung des Befragten eine Rolle. So zeigt sich z.B., daß der Stimuluswert einer Frage von der Antwort, die der Befragte gibt, abhängig ist (van KOOLWIJK 1 9 6 9 ) . Diese Wirkung von Sprache läßt sich kaum neutralisieren. Hier d i e ' Forderung nach kommunikativer Äquivalenz des Instruments für alle Befragten zu erheben, hieße die Befragungsmethode als einheitliches Instrument zu zerstören, abgesehen von den technischen Schwierigkeiten, die nahezu unlösbar sind. Für die Probleme, die die Sprache als Träger der Interviewinformation aufwirft, gibt es keine grundsätzliche Lösung. In der Praxis beschränkt man sich darauf, im Einzelfall die Vieldeutigkeit und Ungenauigkeit der Befragungssprache durch geeignete Wortwahl und Satzkonstruktion auszugleichen. Die Kasuistik der Fehlermöglichkeiten und das System der Erfahrungsregeln zur Vermeidung dieser Fehler ist in diesem Problembereich besonders ausgefeilt (-• Bd. IV: Kreutz und Titscher, Fragebogenkonstruktion 2.2.2). Der zweite Problemkomplex, der die Befragung als Meßinstrument betrifft, ergibt sich aus den Einflüssen, die aus der sozialen Beziehung zwischen Interviewer und Befragtem entstehen. Zunächst vermutete man einen direkten Einfluß des Befragers auf den Befragten. Meinungen und Einstellungen des Interviewers wirken nach dieser Vorstellung direkt auf die Meinungen und Einstellungen des Befragten. Durch die Arbeiten von H Y M A N ( 1 9 5 4 ) wurde diese einfache Einflußthese revidiert und die Komplexität des Beeinflussungsprozesses nachgewiesen. Es wurde festgestellt, daß durch die Interaktion bei den Interviewpartnern ein System von Erwartungen und Einstellungen entsteht, das sich auf sichtbaren Merkmalen, z.B. Geschlecht, Alter, Rasse, Schicht, aufbaut oder sich an vermuteten Eigenschaften orientiert. Interviewer und Befragter konstruieren sich also aus minimalen Informationsstücken ein konsistentes Persönlichkeitsbild des anderen und adressieren ihre fragenden und antwortenden Kommunikationen an den so konstruierten Rollenträger. Ein solches als real empfundenes System scheint notwendig zu sein, um den sozialen Bedürfnissen der Interaktionspartner Rechnung zu tragen und um d e m Interview auch bei schwierigen Themen oder in unangenehmen Situationen eine stabile, für den Befragten akzeptable Basis zu geben. (-• Bd. IV: Erbslöh und Wiendieck, Der Interviewer 3.2 und Esser, Der Befragte 4.4) Innerhalb dieser Dyade, die teils aus realen, teils aus fiktiven Elementen zusammengesetzt ist, kann es zu einer Reihe von Fehlhaltungen kommen, die daraus entstehen,
20
4. Band: Erhebungsmethoden: Die Befragung
daß die Interviewbeziehung zwar eine reale soziale Grundlage haben muß, diese aber in der kurzen zur Verfügung stehenden Zeit und bei der Punktualität der Informationen über den Partner kaum auf die Richtigkeit der zugrundeliegenden Annahmen hin untersucht werden kann. Der Kürze der Interaktionsbeziehung wegen sind auch die verzerrenden Wirkungen der Interviewdyade kaum generalisierbar. Die als "typisch" isolierten Effekte, z.B. Höflichkeitsverhalten, das Konditionieren von Antworten, Erwartungshaltungen, sind nur der sichtbare Teil einer Fülle von unerkannten Einflüssen, die durch die Zufälligkeit der Situation, die speziellen Eigenarten der Interviewer-Befragterkonstellation oder anderer Randbedingungen zustande kommen. Der dritte Problembereich für die Beurteilung der meßtheoretischen Neutralität der Befragungsmethode ergibt sich aus der Tatsache, daß die Befragung ein soziales Artefakt ist und von den Interviewpartnern als Kunstprodukt empfunden wird. Die Probleme von "Sprache" und "Interaktion" werden erst vor diesem Hintergrund sinnvoll interpretierbar. Welchen Grad an Stilisierung die Befragungsmethode erreicht hat, zeigt sich vor allem an dem der Interviewtechnik eigentümlichen Befragungsjargon. Durch systematische empirische Untersuchungen weniger als durch tradierte Erfahrungsregeln der Praxis beeinflußt, hat sich die Interviewsprache zu einem System typischer Formeln ausgebildet, die für einen Großteil von Informationsarten bzw. Frageformen das Optimum an Eindeutigkeit und Einfachheit garantieren. Diese SpezialSprache wird durch ihre Verbreitung, z.B. in den Massenmedien, zu einem Erkennungszeichen für das soziale Artefakt "Interview". Nicht anders ist es mit der Interaktion zwischen Interviewer und Befragtem, wenngleich hier die individuellen Elemente ausgeprägter sind. Die als Artefakt begriffene Interviewsituation, von der Befragungslehre und Befragungspraxis in den optimalen Rahmen gefaßt, steht in Wechselwirkung zu der realen Situation des Interviews, diese zugleich relativierend. Mit dieser Institutionalisierung schafft sich die Befragungsmethode eine eigene meßtheoretische Realität, deren Wirkung auf die Neutralität des Instruments von größerer Bedeutung ist als die der vielen Einzelfaktoren, die in der Befragungsmethodologie bislang identifiziert wurden. Langfristig wird die Konvergenz der Normierung des Instruments mit der Normierung der Erwartungen über das Instrument den Rahmen bestimmen, innerhalb dessen Zuverlässigkeit und Gültigkeit der Befragungsmethode das empirische Optimum erreichen.
Literatur
ABRAMS.M., Possibilities and Problems of Group Interviewing, in: Public Opinion Quarterly 13, 1949, S. 502 - 506. ANASTASI,
Α., Psychological Testing, New York 2. Auflage 1961.
H., Befragung und Erhebung, in: C . F . GRAUMANN U.A. (Hrsg.), Sozialpsychologie, 1. Halbbd., Handbuch der Psychologie, Bd. 7, Göttingen 1969, S. 567 - 619.
ANGER,
1. Kapitel: Die Befragungsmethode
21
Better Telephone Surveys through Centralized Interviewing, in: Journal of Advertising Research 6, 1966, S. 2 — 7.
A S S A E L . H . UND J . O . EASTLACK,
ATKINSON, J. W., (Hrsg.), Motives in Fantasy, Action and Society: A Method of Assessment and Study, Princeton 1958, BANKS, J . Α., The Group Discussion as an Interview Technique, in: The Sociological Review 5, 1957, S. 75 - 84. BERG,I. A. (Hrsg.), Response Set in Personality Assessment, Chicago 1967. BINGHAM,W. UND Β . V . MOORE,
How t o Interview, New York 4 . Auflage 1 9 5 9 .
R. J. H I L L U N D S . DALEMCLEMORE,Sociological Measurement of Scales and Indices, San Francisco 1967.
BONJEAN,CH.M.,
CAMPBELL, Α., Polling, Open Interviewing, and the Problem of Interpretation, in: Journal of Social Issues 2, 1948, S. 67 - 7 1 . CAMPBELL, D. T., The Indirect Assessment of Social Attitudes, in: Psychological Bulletin 47, 1950, S. 1 5 - 3 8 . J. FOWLER, A Note on Interviewer Effect in Self-enumerative Procedures, in: American Sociological Review 29, 1964, S. 270.
CANNELL, CH. F. UND F .
CANNELL,CH. F. UND R. L. KAHN, The Collection of Data by Interviewing, in: L . F E S T I N G E R U N D D . KATZ(Hrsg.), Research Methods in the Behavioral Sciences, New York 1953, S. 327 - 380. Interviewing, in: G . LINDZEY U N D E . ARONSON (Hrsg.), The Handbook of Social Psychology, Bd. 2, Reading 2. Auflage 1968, S. 526 - 595.
CANNELL, CH. F . UND R . L . K A H N ,
CANTRIL,H., Gauging Public Opinion, Princeton 1944. The Dynamics of Information Interviewing, in: American Journal of Sociology 62, 1956, S. 165 - 171.
CAPLOW, TH.,
W. G., F . MOSTELLER UND J. W. TUCKEY, Statistical Problems of the Kinsey Report on Sexual Behavior in the Human Male, Washington 1954.
COCHRAN,
COOMBS, L. UND R. FREEDMAN, Use of Telephone Interviews in a Logitudinal Fertility Study, in: Public Opinion Quarterly 28, 1964, S. 1 1 2 - 117. CRONBACH, L. J., Response Sets and Test Validity, in: Educational and Psychological Measurement 6, 1946, S. 475 - 494. J., Further Evidence on Response Sets and Test Design, in: Educational and Psychological Measurement 10, 1950, S. 3 - 31.
CRONBACH, L .
CRONBACH, L. J., Essentials of Psychological Testing, New York 2. Auflage 1961. DOHRENWEND, B . S . UND ST. A . RICHARDSON, D i r e c t i v e n e s s a n d N o n - D i r e c t i v e n e s s i n
Research Interviewing: A Reformulation of the Problem, in: Psychological Bulletin 60, 1963, S. 475 - 485. - Meinungs- und Marktforschung. Probleme und Methoden, herausgegeben vom Institut zur Förderung öffentlicher Angelegenheiten, F r a n k f u r t 1952.
EMPIRISCHE SOZIALFORSCHUNG
Ratschläge für den Arzt bei der Psychoanalytischen Behandlung, Gesammelte Werke, Bd. 8, London 1943, S. 376 - 387.
FREUD, S . ,
22
4. Band: Erhebungsmethoden: Die Befragung
GALLUP, G .
H., A Guide to Public Opinion Polls, Princeton 2. Auflage 1948.
GETZELS, J. W., The Question-Answer Process: A Concept and Some Hypotheses, in: Public Opinion Quarterly 18, 1954, S. 80 - 91. GÖRDEN, R. L., Dimensions of the Depth Interview, in: American Journal of Sociology 62, 1956, S. 158 - 164. Der Interviewereinfluß in der Marktforschung, Wiesbaden 1964.
HAEDRICH, G . ,
HEISS, R . (Hrsg.), Psychologische Diagnostik, Handbuch der Psychologie, Bd. 6, Göttingen 1964. HOFSTÄTTER, P. R., Psychologie der öffentlichen Meinung, Wien 1949. HYMAN,
H.
H.,
LASSWELL HYMAN, H . H . ,
Interviewing as a Scientific Procedure, in: D. LERNER UND H . D. (Hrsg.), The Policy Sciences, Stanford 1951, S. 203 - 216. Interviewing in Social Research, Chicago 1954.
JUDD, R. C., Telephone Usage and Survey Research, in: Journal of Advertising Research 6, 1966, S. 38 - 39. KAHN, R. L. UND CH. F. CANNELL, The Dynamics of Interviewing, New York 1957. The Tandem Interview: A Trial of the Two-InterviewerTeam, in: Public Opinion Quarterly 21, 1957, S. 304 - 3 1 2 .
KINCAID, H . V . UND M . BRIGHT,
(Hrsg.), Praktische Sozialforschung I. Das Interview, Köln 1957, 8. ergänzte Auflage 1972.
KÖNIG, R .
2.
Auflage
KOOLWIJK, J. VAN, Unangenehme Fragen. Paradigma für die Reaktionen des Befragten im Interview, in: Kölner Zeitschrift für Soziologie und Sozialpsychologie 21, 1969, S. 864 - 875. LAZARSFELD, P. F., The Controversy over Detailed Interviews — An Offer for Negotiation, in: Public Opinion Quarterly 8, 1944, S. 38 - 6 0 . LEONARD, D . ,
Consumer Research with Projective Techniques, Shenandoah
1955.
LIENERT, G. Α., Testaufbau und Testanalyse, Weinheim 2. Auflage 1967. LINDZEY, G., Projective Techniques and Cross-Cultural Research, New York 1961. E. UND Ν. MACCOBY, The Interview: A Tool of Social Science, in: G. LINDZEY (Hrsg.), Handbook of Social Psychology, Bd. I, Reading und London 1. Auflage 1954, S. 449 - 487.
MACCOBY,
A Mail Questionnaire Adjunct to the Interview, in: Public Opinion Quarterly 26, 1962, S. 111 - 114.
MAGID, F . Ν . , Ν . G . GOTION U N D D . GOLD,
MAIER, N. R. F., The Appraisal Interview, New York 1958. Gruppendiskussion, in: R . KÖNIG (Hrsg.), Handbuch der Empirischen Sozialforschung, Bd. I, Stuttgart 2. Auflage 1967, S. 209 - 225; Bd. 2, 3. umg. u. erw. Auflage 1973.
MANGOLD, W . ,
MCNEMAR.Q., Opinion-Attitude Methodology, in: Psychological Bulletin 43, 1946, S. 2 8 9 -
374.
H. UND F. MANN, A Limited Comparison of Two Methods of Data Collection: The Fixed Alternative Questionnaire and the Open-ended Interview, in: American Sociological Review 17, 1952, S. 486 — 491.
METZNER,
1. Kapitel: Die Befragungsmethode
23
MILLER, D. C., Handbook of Research Design and Social Measurement, New York 1967. NOELLE, E., Meinungs- und Massenforschung in den USA, F r a n k f u r t 1940. NOELLE.E., Umfragen in der Massengesellschaft, Hamburg 1963. OLDFIELD, R .
C., The Psychology of the Interview, London 4 . Auflage 1 9 5 1 .
PARTEN, M., Surveys, Polls, and Samples, New York 1950. Interview Techniques and Field Relationships, in: A. L . KROEBER (Hrsg.), Anthropology Today, Chicago 1953, S. 430 - 4 5 1 .
PAUL, B . D . ,
PAYNE, ST.
L., The Art of Asking Questions, Princeton 1951.
C. F. HOCKETT UND J . J . DANEHY, The First Five Minutes: A Sample of Microscopic Interview Analysis, Ithaca 1960.
PITTINGER, R . E . ,
POLLOCK, F., Gruppenexperiment, F r a n k f u r t 1955. RICHARDSON, ST. Α . , Β . S . DOHRENWEND UND D . KLEIN,
Interviewing, Its F o r m s and
Functions, New York 1965. The Sociology of the Interview, in: Midwestern Sociologist 18. 1956, S. 3 - 14.
RIESMAN.D. UND M BENNEY,
ROGERS,C. R., Client-Centred Therapy, Boston 1951. Das Interview in der Sozialforschung, in: R . KÖNIG (Hrsg.), Handbuch der Empirischen Sozialforschung, Bd. I, Stuttgart 2. Auflage 1967, S. 136 - 196; Bd. 2, 3. umg. und erw. Auflage 1973, S. 66 - 190.
SCHEUCH, Ε . Κ . ,
S H A W . M . E . UND
J. M . WRIGHT, Scales for the Measurement of Attitudes, New York
1967. The Art of Interviewing and a Guide to Interviewer Selection and Training, in: M. JAHODA, M. DEUTSCH UND S. W . COOK (Hrsg.), Research Methods in Social Relations, Bd. II, New York 1951, S. 4 6 3 - 492.
SHEATSLEY, P . B . ,
STEPHAN, F . F . UND PH. J . M C C A R T H Y ,
Sampling Opinions, New York 1 9 5 8 .
Α. UND L. SCHATZMANN, Cross-Class Interviewing: An Analysis of Interaction and Communication Styles, in: Human Organization 14, 1955, S. 28 — 31.
STRAUSS,
STROSCHEIN,
F.-R., Die Befragungstaktik in der Marktforschung, Wiesbaden 1965.
SULLIVAN, H. S., The Psychiatric Interview, New York 1954. R. D . SCHWARZ UND L . SECHREST, Unobtrusive Measures: Nonreactive Research in the Social Sciences, Chicago 1966.
WEBB, E . J . , D . T . CAMPBELL,
WESCHLER, I. R. UND R. E. BERNBERG, Indirect Methods of Attitude Measurement, in: International Journal of Opinion and Attitude Research 4, 1950, S. 209 - 228.
2.
Die Konstruktion von Fragebögen von Henrik Kreutz und Stefan Titscher
Vorbemerkung Bereits 1909 hat M A X W E B E R in seiner Arbeit "Zur Methodik sozialpsychologischer Enquêten und ihrer Bearbeitung" begonnen, wissenschaftliche Kriterien für die Konstruktion von Fragebögen zu entwickeln. Obwohl Befragungstechniken mittlerweile die am häufigsten verwendeten Instrumente der Datengewinnung in der Soziologie geworden sind, gibt es noch immer fast keine tiefgehenden Arbeiten zur Konstruktion von Fragebögen. Dieses Thema wird vorwiegend in Publikationen abgehandelt, die sich mit der Planung, Durchführung und Auswertung von Befragungen insgesamt beschäftigen, so daß naturgemäß für die Probleme der Erstellung des Erhebungsinstruments nur wenig Raum bleibt. Eine umfassende Darstellung fehlt im deutschen Sprachbereich völlig, und auch die einzige neuere den Autoren bekannte spezielle angelsächsische Arbeit größeren Umfangs, nämlich die von O P P E N H E I M ( 1 9 6 6 ) , beschäftigt sich hauptsächlich mit der Konstruktion von Einstellungsskalen. Das Fehlen genauerer Darstellungen mag daran liegen, daß empirische Untersuchungen methodischer Art zu diesem Thema dem Forscher weniger Reputation verschaffen als beispielsweise die Beschäftigung mit quantitativen Auswertungsverfahren oder die Behandlung aktueller gesellschaftlicher Probleme. Die schrittweise Rezeption der mittlerweile überholten klassischen psychologischen Testtheorie hat zudem nicht nur dazu geführt, daß Faustregeln, ad-hoc-Generalisierungen etwa über richtige Frageformulierung sich seltener in der Literatur finden (vgl. H A R T M A N N 1970, S. 170), sondern auch dazu, eine systematische und problemorientierte Behandlungsweise, die soziologischen Fragestellungen adäquat ist, erst gar nicht entstehen zu lassen. Diese Situation erfordert nach Meinung der Autoren, daß ein Lehrbuchartikel nicht allein eine Übersicht über die einschlägige Literatur gibt, sondern darüber hinaus die technisch nur punktuell vorhandenen Ergebnisse problemorientiert zusammenfaßt und von daher Gesichtspunkte und Empfehlungen für die Forschungspraxis ableitet. Dieses Anliegen bedingt allerdings, daß man öfters den Bereich gesicherten Wissens verlassen muß und eigene Forschungserfahrungen zur Diskussion stellt. Die Autoren sind sich darüber im klaren, daß ein solches Verfahren mehr Ansatzpunkte für Kritiken liefert als ein bloßes Referieren von publizierten Forschungsergebnissen. Die
2. Kapitel: Die Konstruktion
von Fragebögen
25
Gliederung des vorliegenden Artikels richtet sich daher primär nach praktischen Erfordernissen der Fragebogen-Konstruktion. In Abschnitt 2.2 wird vor allem die deutschsprachige Literatur eingehender besprochen, wobei über bloße Hinweise hinausgehend kritisch auf die einzelnen Thesen der Autoren Bezug genommen wurde. Die fremdsprachige Literatur wird dabei in Verweisen berücksichtigt, soweit es sich um abweichende Ergebnisse und Stellungnahmen handelt, die eine genauere Auseinandersetzung verlangen. Auf ältere Arbeiten wird explizit nur dann verwiesen, wenn dies sachlich unbedingt erforderlich ist, da sie teilweise nur noch von historischem Interesse sind und überdies in den vorliegenden deutschsprachigen Standardwerken angeführt werden. Zu diesen gehören vor allem die Arbeiten folgender Autor e n : SCHEUCH ( 1 9 6 7 ) u n d ANGER ( 1 9 6 9 ) , d i e j e e i n e n H a n d b u c h a r t i k e l ü b e r B e f r a g u n g
geschrieben haben; KÖNIG (1952), der eine Sammlung 'klassischer' angelsächsischer Arbeiten herausgegeben hat; NOELLE (1963) mit ihrer in manchen Abschnitten heute bereits überholten Arbeit über Umfragen; sowie die ausführlicheren Darstellungen spezieller Techniken bzw. Themen von ROEDE(1968) über mündliche Befragungen u n d RICHTER ( 1 9 7 0 ) ü b e r s c h r i f t l i c h e B e f r a g u n g e n .
2.1
Die Konzeption von Befragungsstudien
Die Konstruktion eines Fragebogens als einen rein technischen Vorgang zu sehen, hieße einen schwerwiegenden Fehler begehen. Die Formulierung von Einzelfragen und ihre Zusammensetzung zu einem Fragebogen stellt einen zentralen Schritt bei der Operationalisierung des Forschungsvorhabens dar und muß daher in erster Linie von inhaltlichen Erwägungen geleitet sein. Je nach dem gewählten Untersuchungsziel ergeben sich verschiedenartige Probleme. Bei epidemiologischen Untersuchungen, bei denen es um die Feststellung der Verbreitung eines an sich wohlbekannten Phänomens in einer gegebenen Population geht, kommt es 'lediglich' darauf an, die Befragten zu genauen, vollständigen und richtigen Angaben zu bringen. Dies ist an sich bereits kein geringes Problem, insbesondere dann, wenn nicht direkt erfaßbare Dispositionen auf ihre Verbreitung hin untersucht werden sollen. In diesem Fall muß der Forscher, um Fragen formulieren zu können, indirekte Indikatoren ausfindig machen, die eine Messung erlauben. Solche Indikatoren können Ursachen, Folgen oder bloße Korrelate des zu messenden Sachverhalts sein. Sehr häufig findet man Listen von Indikatoren, die wahllos zusammengesetzt sind und bei denen die Autoren nicht spezifizieren, ob der jeweilige Indikator eine Ursache, eine Folge oder ein Korrelat ist. Ein solcher Mangel an Klarheit kann dann bei der statistischen Auswertung und vor allem bei der Interpretation der Ergebnisse verheerende Folgen haben. Wenn der Sachverhalt, der Gegenstand der Untersuchung ist, nur indirekt erschließbar ist, bedarf es zumindest einer rudimentären Theorie', um abzuklären, wie er sich auswirkt, welche Ursachen er hat und an welchen äußeren 'Anzeichen' (Symptomen) er erkennbar ist. Da man aber fast nie von vornherein annehmen kann, eine bestimmte beobachtbare Verhaltensweise sei von einem einzigen nicht direkt meßbaren Sachverhalt (z.B. psychische Disposition oder strukturelles Merkmal eines sozialen Aggregats) zur Gänze bestimmt, ist es angebracht, jeden Indikator als mit einem spezifi-
26
4. Band: Erhebungsmethoden: Die Befragung
sehen 'Fehler' b e h a f t e t anzusehen und daher auch jede Frage als eine mehr oder minder fehlerhafte Messung des Sachverhaltes zu betrachten. Es ist schlechthin illusorisch zu glauben, man könne fehlerfreie Einzelfragen, die neben dem intendierten Sachverhalt nicht auch noch andere Umstände 'mitmessen', konstruieren. Andere Strategien sind hier angebracht: Man kann entweder versuchen, die Fehler jedes Indikators durch Aggregation einer größeren Zahl von Fragen zu Skalen oder Indices a b zugleichen oder durch parallele Verwendung mehrerer Indikatoren ('multiple Indikatoren') die Größe des Fehlerspielraumes abzuschätzen und damit zu kontrollieren. Neuerdings sind daneben Verfahren entwickelt worden, die die 'Unsicherheit der Antw o r t ' mit Hilfe von mindestens dreimaliger Durchführung der Befragung abzuschätzen versuchen (vgl. COLEMAN 1964b; HEISE 1969). Ein nur indirekt faßbares Konzept kann entweder a) Teil einer explizit ausformulierten Theorie sein, b) eine aus der Praxis oder der Forschungserfahrung genommene ad-hoc-Generalisierung oder c) eine 'intuitive' Idee des Forschers, deren H e r k u n f t nicht eindeutig rekonstruierbar ist. In jedem Fall ist als erster Schritt eine logisch-deduktive Klärung des Konzeptes notwendig (vgl. auch LAZARSFELD UND BARTON 1 9 5 5 u n d LAZARSFELD 1 9 6 8 ; OPP
2.1.1
1970).
Klärung der Begriffe und ihrer Dimensionen
Im Falle einer expliziten Theorie ist eine solche Klärung relativ leicht: man kann sie daraufhin abfragen, welche kausalen Verknüpfungen oder Wechselwirkungen zwischen den Konzepten postuliert werden und welche Rahmenbedingungen oder intervenierenden Umstände für das Bestehen oder Fehlen von Ursache-Wirkung-Beziehungen bzw. von Wechselwirkungen angenommen werden. Mit Hilfe der empirischen Erfassung jener Konzepte, die direkt beobachtbare Sachverhalte abbilden, und jener, die zwar nur indirekt erfaßbar sind, aber bereits erfolgreich gemessen wurden, können dann rein theoretische Begriffe indirekt getestet werden (vgl. C A R N A P 1956). In der Forschungspraxis stellt sich allerdings leider sehr häufig heraus, daß die vorhandenen Theorieansätze nur sehr wenige Konzepte beinhalten, die bereits operationalisiert worden sind. Steht keine explizite Theorie zur Verfügung, so ist ein ad-hoc-Theoretisieren des Forschers notwendig, und die Wahl von Indikatoren gleicht in diesem Fall mehr einem Tappen im Dunkeln als einem systematischen wissenschaftlichen Arbeitsgang. Da sich die Soziologie bei vielen Problemstellungen auf die Begriffe und Verknüpfungsregeln der Alltagssprache stützen muß und noch keine präzisen Erklärungsansätze entwickelt hat, ist eine konzeptuelle Analyse der Alltagsbegriffe beim heutigen Stand der Forschung fast durchgehend unabdingbare Voraussetzung für das Gelingen empirischer Forschungen. Die begriffliche Klärung erfolgt richtigerweise in zwei aufeinanderfolgenden Arbeitsgängen. Zunächst sollte man klären, welche verschiedenen Bedeutungen der Begriff umschließt und ob es notwendig ist, ihn genauer zu fassen. Man sollte sich fragen, welche Aspekte unterschieden werden können und welche davon im Interesse eines möglichst eindeutigen Gehaltes nicht in die wissenschaftliche Begriffsbildung mitauf-
2. Kapitel: Die Konstruktion von Fragebogen
27
genommen werden. Die Bildung eines solchen Begriffes bedeutet, daß man unter ihn eine Reihe von bekannten und /oder vermuteten Sachverhalten subsumieren kann. Diese unterscheiden sich nun trotz ihrer Gleichheit bzw. Ähnlichkeit nach einer Reihe von Gesichtspunkten voneinander. Die begriffliche Klärung verlangt, daß man nicht nur die Gemeinsamkeiten festhält, sondern auch die Merkmale, hinsichtlich derer graduelle Abstufungen bestehen. Das heißt, die Variablen, die eine differenzierte Beschreibung des Sachverhalts erlauben sollen, müssen definiert werden. Sofern es sich nicht um rein deskriptive Untersuchungen handelt, wird man bei der konzeptuellen Arbeit eine begriffliche Fassung möglicher Ursachen und Folgen eines Sachverhalts anschließen müssen und so zu einer sukzessiven 'Auffaltung' eines theoretischen Ansatzes kommen (vgl. z.B. LANDECKER 1 9 5 1 ; HILL UND HANSEN 1 9 6 0 ; BLAU 1 9 6 2 ) . Im zweiten Arbeitsgang sind konkrete Meßverfahren, also z . B . Fragen oder Fragebatterien zu entwickeln, die es erlauben, den abstrakten und relativ allgemein gehaltenen Dimensionen empirische Daten zuzuordnen. Es dürfte ohne weiteres einsichtig sein, daß der Forscher, der Neuland betritt und als erster versucht, bestimmte Begriffe zu klären und operational zu fassen, meist nur einen vorläufigen und relativ groben Ansatz findet, der noch erheblich verbessert werden kann. Nun findet man leider fast durchgehend, daß die von einem Forscher probeweise durchgeführte Operationalisierung eines Konzeptes und die von ihm entwickelte Skala bzw. Fragebatterie nicht weiter theoretisch kritisiert und abgeklärt, sondern mehr oder minder mechanisch übernommen werden. Die bereits entwickelte Skala wird einfach in die neue Untersuchung eingebaut, ohne daß eine methodische Überprüfung oder Verbesserung vorgenommen wird. Ein eklatantes Beispiel haben EHRLICH UND RINEHART ( 1 9 6 5 ; 1966) auf dem Gebiet der Erforschung nationaler S t e r e o t y p e aufgezeigt: hier w u r d e beispielsweise eine Fragebatterie, die 1932 auf Grund der A n t w o r t e n von 32 (!) S t u d e n t e n auf o f f e n e Fragen in den USA entwickelt w u r d e , jahrzentelang o h n e neuerliche Ü b e r p r ü f u n g als gültig vorausgesetzt u n d angewendet. Die von den genannten A u t o r e n v o r g e n o m m e n e Ü b e r p r ü f u n g an einer k o n k r e t e n P o p u l a t i o n zeigte, d a ß nur ein kleiner Teil der in der Batterie a u f t a u c h e n d e n Begriffe bei A n t w o r t e n auf o f f e n e Fragen zu dem gleichen T h e m a benützt w u r d e und daß das Instrument die Vorurteile sowohl quantitativ als auch als qualitativ völlig verzerrt erfaßte.
Umgekehrt hat die verständliche Unzufriedenheit mit den vorhandenen Instrumenten (sicherlich unterstützt von dem Wunsch nach Originalität und der bestehenden Form der Organisation der Forschung) dazu geführt, daß immer wieder gleichsam am Nullpunkt begonnen wird, indem die vorhandenen Instrumente nicht überprüft und adaptiert, sondern einfach durch neue, ebenfalls mangelhaft abgesicherte, ersetzt werden. Diese Art der Forschung hat dazu geführt, daß heute Hunderte, ja Tausende von verschiedenen Skalen und Indices in der Sozialforschung gebräuchlich sind, von denen kaum eine theoretisch abgeklärt ist, ja selbst eine empirisch saubere Uberprüfung nach konventionellen Gütekriterien fehlt in vielen Fällen. (Sammlungen solcher Skalen finden sich u.a. bei: BONJEAN, HILL UND MCLEMORE 1 9 6 7 ; SHAW UND WRIGHT 1 9 6 7 ; CATTELL UND WARBURTON 1 9 6 7 ; ROBINSON U.A. 1 9 6 8 ; STRAUSS 1 9 6 9 ) . Vom mechanischen Übernehmen einer Skala wie vom 'Selbstbasteln' neuer Fragebatterien muß daher in aller Entschiedenheit abgeraten werden. Wissenschaftliche Replikation eines Versuches erfordert im Unterschied zum schematischen test-retest-Verfahren die Beachtung der Randbedingungen, die für den ursprünglichen und den neuen Versuch
28
4. Band: Erhebungsmethoden:
Die Befragung
gelten. Das Problem, das sich dabei insbesondere fur die Befragungsmethode ergibt, besteht darin, daß gerade die adäquate populations- und situationsspezifische Formulierung von Fragen die Replikation einer Messung erschwert, da der Wortlaut der Fragebatterien entweder aufgegeben werden muß oder im neuen Versuch stark verzerrt wirken kann, wenn sich eben die Population und/oder die Situation ändern (vgl. FRIEDRICH 1 9 7 0 , S. 5 1 ) . Die einzige Möglichkeit zu kumulativer Forschung ist in einer solchen Situation daher, die theoretische Arbeit gleichzeitig mit der empirischen voranzutreiben und Fragebatterien flexibel zu gestalten, so daß je nach Randbedingungen und intervenierenden Umständen andere Frageformulierungen, ja sogar u. U. andere Indikatoren eingesetzt werden können. Für die Konstruktion von Fragebögen ergibt sich daraus die Forderung, nicht allein eine optimale Anpassung des Frageprogramms an die aktuell gegebene Situation zu versuchen, sondern gleichzeitig auf die Replizierbarkeit der Befragung unter geänderten Bedingungen zu achten. Zugegebenermaßen wirken die beiden Forderungen fast durchgehend in entgegengesetzte Richtungen, es kommt aber auch hier wie bei statistischen Schlußfolgerungen darauf an, nicht einen Fehler auf Kosten des anderen zu minimalisieren. Die Notwendigkeit, Instrumente zu entwickeln, die sich für Replikationen in äußerst verschiedenen Situationen eignen und die generalisierbare Ergebnisse liefern, hat nicht nur die experimentelle sozialpsychologische Forschung beeinflußt (bereits HOVLAND 1 9 5 9 ) , sondern sich bereits auf die Theorie sozialwissenschaftlichen Messens ausgewirkt (vgl. z.B. CRONBACH U.A. 1 9 6 3 ; RAJARATNAM U.A. 1 9 6 5 ; RAATZ 1 9 6 8 ; FLETCHER 1 9 7 0 ) .
Akzeptiert man neuere wissenschaftstheoretische Auffassungen, nach denen weder Verifikation noch Falsifikation einer theoretischen Aussage durch eine einzige Untersuchung möglich ist (QUINE 1 9 5 3 ; ALBERT 1 9 6 8 ) , so ergibt sich, daß Replikationen von größter Bedeutung sind. Handelt es sich bei der Beurteilung der Wahrheit von Theorien um Wahrscheinlichkeitsaussagen, so ist entscheidend, wie oft unter welchen verschiedenen Bedingungen eine Theorie bereits getestet wurde. Kann der Forscher auf keinen noch so rudimentären theoretischen Ansatz zurückgreifen, so steht er gleichsam am Nullpunkt und muß daher versuchen, zunächst hypothetisch das zur Frage stehende Phänomen genauer abzugrenzen und Annahmen über mögliche Ursachen und mögliche Folgen machen. Insbesondere dann, wenn die Forschung direkt zur Lösung eines vorgegebenen praktischen Problems dienen soll, werden die Begriffe und das Vokabular der Praktiker (die häufig die Auftraggeber sind) kritiklos übernommen, und es wird verabsäumt, diese einer wissenschaftlichen Analyse und Kritik zu unterziehen. Ein solches Versäumnis kann bereits den Erfolg einer derartigen praxisorientierten Studie verhindern, da die Probleme des Praktikers nicht selten durch die falsche Konzeptualisierung der Situation, in der er entscheiden muß, verursacht werden. Man kann also entgegen einer landläufigen Meinung zusammenfassend sagen, daß die logisch-begriffliche Klärung der Konzepte, die man der Untersuchung unterlegt, umso wichtiger ist, je weniger man sich auf vorhandene Theorien stützen kann und je pragmatischer, praxisbezogener das Ziel der Forschung ist. Beispiele für völliges Versagen von Befragungsstudien, die durch Außerachtlassen dieser Notwendigkeit hervorgerufen wurden, gibt es leider zur Genüge. Extrem werden solche Fehler, wenn sie bereits in die Anlage von Untersuchungen eingehen; so
2. Kapitel: Die Konstruktion von Fragebögen
29
z.B. wenn die Belastung von Frauen durch Berufstätigkeit mit einer Befragung festgestellt werden soll, bei der nur berufstätige Frauen erfaßt werden (z.B. ROSENMAYR U.A. 1969), oder Aussagen über jugendspezifische Probleme mit Untersuchungen gewonnen werden sollen, die nur die Befragung von Jugendlichen vorsehen usw. Bei all diesen Befragungen ist das Ubergehen der grundlegenden konzeptionellen Klärung des praktischen Problems offensichtlich, und konsequenterweise liefern solche Studien auch für die praktischen Probleme, für deren Lösung sie initiiert wurden, wenig brauchbare Hinweise. Wird dieser erste Schritt der konzeptuellen Klärung übergangen, so ist es gerade bei praxisorientierten Studien naheliegend, auch die zweite Aufgabe außer acht zu lassen, nämlich das Forschungsanliegen adäquat zu operationalisieren. Wie bei theoretischen Begriffen, so muß der Forscher auch bei Fragestellungen, die etwa aus der Verwaltung, der Wirtschaft oder der Politik kommen, die Begriffe und Probleme gleichsam übersetzen, um Fragen stellen zu können, die zwar in der Alltagssprache formuliert, aber doch genau sind. Dieser Übersetzungsvorgang ist äußerst komplex und kann selten eindeutig und absolut richtig durchgeführt werden. Zu ein und demselben Sachverhalt lassen sich — auch wenn es sich um einfache Handlungsvollzüge des Alltags handelt — eine große Zahl verschieden formulierter Fragen stellen; die Gültigkeit der vorgenommenen Operationalisierung ist a priori immer zweifelhaft und muß daher in jedem Fall erst positiv bewiesen werden. Ohne eingehende Validitätsprüfungen kann die Frage, ob man tatsächlich gemessen hat, was man messen wollte, fast nie beantwortet werden. Ist die Gültigkeit der vorgenommenen Übersetzung bei der Erfassung manifesten Verhaltens bereits schwierig zu bestimmen, so wird sie bei der Messung von direkt nicht beobachtbaren Dispositionen oder sozial abgeschirmten Sachverhalten zu einem nicht immer lösbaren Problem. Generell empfiehlt es sich, bereits bei der Entwicklung eines Instrumentes selbst den advocatus diaboli zu spielen und die Ursachen möglicher Ungültigkeit der Messung durchzuspielen. Heuristisch gesehen dürfte die Kritik an der gewählten bzw. geplanten Operationalisierung mehr Gesichtspunkte liefern und daher wesentlich fruchtbarer sein als das Nachdenken über positive Möglichkeiten der Sicherung des Verfahrens. Die theoretisch oder praktisch interessierende Frage direkt zu stellen, ist - von seltenen Ausnahmen abgesehen — das schlechteste Vorgehen, obwohl es auch heute noch immer wieder gewählt wird (vgl. R O E D E 1968, S.16 ff.). Die geringe theoretische Fruchtbarkeit des Großteils der Befragungsstudien dürfte in erster Linie damit zusammenhängen, daß von den theoretischen Begriffen der Soziologie bis heute kaum allgemein akzeptierte Indikatoren abgeleitet wurden, die in Fragen gekleidet werden könnten. Man kann daher bei soziologischen Befragungen das Vorherrschen populärpsychologischer Denkformen und Fragestellungen beobachten, die für die soziologische Theorie wenig Relevanz besitzen. Die Versuche, soziologische Begriffe operational zu fassen, sind selten und die wenigen vorhandenen sind dazu in der Durchführung kaum befriedigend. Selbst so grundlegende Konzepte wie 'Sanktion' (vgl. die Kritik von DAHRENDORF 1959 an G R O S S U.A. 1958 oder den problematischen Versuch von SCHUMANN 1968) sind bisher nur sehr vage und angreifbar operationalisiert. Systematische Theorieansätze, wie etwa der von Parsons, sind bis heute kaum empirischen Tests unterworfen worden (vgl. z . B . die Ansätze von BLAU 1 9 6 2 ; M C K I N L E Y
30
4. Band: Erhebungsmethoden: Die Befragung
1964 oder von PARK 1967). Versuche zur Operationalisierung marxistischer Begriffe wie etwa Entfremdung (DEAN 1961; SEEMANN 1963, 1967; BLAUNER 1964) sind kaum begonnen worden. Anomie wird unterschiedlich gemessen (Übersicht bei CLINARD 1964), und selbst der Begriff der sozialen Rolle hat bis heute wenig Bezug zu empirischen Forschungen gewonnen (vgl. BIDDLE UND THOMAS 1966). Seit den Arbeiten von Dürkheim sind auf diesem Gebiet sehr wenige Fortschritte erzielt worden. Es bleibt daher abzuwarten, wieviel Befragungstechniken überhaupt zur Testung soziologischer Theorieansätze beitragen können. Eine vergleichende Untersuchung der 'empirischen Signifikanz' (CARNAP 1956) von verschiedenen soziologischen Theorieansätzen ist daher heute ebenfalls nicht möglich. Die Forderung nach theoretischem Pluralismus bei der empirischen Sozialforschung (ALBERT 1968) ist vorläufig kaum realisierbar, da die Erhebungstechniken und die vorhandenen Theorieansätze in keine stringente Beziehung miteinander gebracht wurden. (Ein Beispiel, das die Interdependenz zwischen Theorie und ihrer empirischen Überprüfung aufzeigt, d.h. die Schwierigkeit — wenn nicht Unmöglichkeit - der unabhängigen Testung der Theorie an einer konkreten Forschung geben HAYES U.A. 1970.)
2.1.2
Die Bedeutung des Forschungszieles
Eine brauchbare Operationalisierung muß auf eine Reihe von Gesichtspunkten Rücksicht nehmen, dazu gehören vor allem: 1. Merkmale der Untersuchungspopulation (wie etwa Sprachgewohnheiten, Wissen und Denkweisen usw.); 2. Merkmale der Erhebungssituation (Zeitpunkt, Ort, Dauer der Erhebung, Anwesenheit von dritten Personen, institutioneller Rahmen usw.); 3. Mittel, die zur Durchführung zur Verfügung stehen (Zeit, Geld, Mitarbeiterstab usw.) und 4. Thematik und Forschungsziel der Befragung. Paradoxerweise wird gerade der vierte der aufgezählten Gesichtspunkte bei der Operationalisierung häufig außer acht gelassen, so daß eine eingehendere Darstellung gerechtfertigt erscheint. Der Forscher sollte bei der Konstruktion eines Fragebogens zunächst sein eigenes Untersuchungsziel möglichst explizit machen. Zu empfehlen ist eine vor der Befragung durchgeführte Simulation des Auswertungsvorganges und der Interpretation mit Hilfe von hypothetischen Antwortverteilungen. Insbesondere sollte er sich auch darüber im klaren sein, welche Funktion die Befragung übernehmen soll. Einige solcher möglichen Funktionen seien — ohne den Anspruch auf Vollständigkeit — aufgezählt: 1. Rigorose Testung von theoretischen Hypothesen, 2. Prognose von künftigen (bzw. unbekannten) Sachverhalten oder Vorgängen, 3. Bewertungsstudien, Überprüfen und/oder Herbeiführen von Entscheidungen mittels iterativer Befragung unter Rückkoppelung von Information an die Befragten (Delphi-Technik; z.T. Gruppendiskussionsverfahren), 4. Bewertung von getroffenen Maßnahmen (evaluation research), 5. differenzierende Feststellung der Verbreitung eines bekannten Phänomens in einer Bevölkerung und in den relevanten Teilpopulationen, 6. globale Verbreitungsstudien, bei denen lediglich die Verteilungen in der Gesamtbevölkerung von Interesse sind, 7. explorative Klassifikationsstudien, bei denen es zunächst nur um die Erfassung aller vorkommenden Spielarten und Formen eines operational zunächst nicht exakt gefaßten Phänomens geht.
2. Kapitel: Die Konstruktion von Fragebögen
31
Ein und dieselbe Erhebung kann, ohne überfordert zu werden, gleichzeitig kaum mehrere dieser Funktionen erfüllen, obwohl dies Befragungen immer wieder zugemutet wird. Insbesondere werden Studien, die als rein explorative Klassifikationserhebungen aufgefaßt werden müssen, häufig als Verbreitungsstudien mißbraucht, ja sogar zum Testen von (ex post formulierten) Hypothesen herangezogen. Ein fast noch häufigerer Mißbrauch wird in der kommerziellen Meinungsforschung mit Befragungen betrieben, die ihrer Anlage nach nur Globalergebnisse liefern können, aber zu differenzierenden Deskriptionen herangezogen werden. Bei sachlich fundiertem Vorgehen ergibt sich aus der Wahl eines der genannten möglichen (formalen) Forschungsziele eine Reihe von Konsequenzen für die Operationalisierung. Vor allem werden die Anzahl der Variablen, die einzubeziehen sind, und die Genauigkeit bzw. Ausführlichkeit der Messung davon zentral berührt. Ist das Testen von Hypothesen oder das Stellen von Prognosen Ziel der Untersuchung, so wird man trachten, möglichst wenige, aber sehr genau gemessene Variablen zu verwenden. Dies ist in der empirischen Sozialforschung freilich nur dann möglich, wenn man durch sorgfältige Planung der Anlage und quasi-experimentelle Designs eine Reihe von Randbedingungen und von intervenierenden Variablen so unter Kontrolle gebracht hat, daß das Frageprogramm durch diese nicht belastet wird. Man wird in beiden Fällen im vorhinein genau angeben müssen, welche Variablen als abhängig, welche als unabgängig angesehen werden bzw. wo Interdependenz angenommen werden muß. Der Unterschied zwischen beiden Arten von Studien liegt vor allem darin, daß man bei Prognosen die Wahl der einzubeziehenden Variablen in der Regel pragmatischer vornehmen und unter Umständen auf die Messung einer schwer zu erfassenden ursächlichen Variablen verzichten kann, wenn man ein einigermaßen brauchbares Korrelat von ihr zur Verfügung hat. Ebenso können bei Prognosen eine Reihe von Randbedingungen, die nicht weiter durchvariiert werden müssen, als gegeben vorausgesetzt werden (vgl. dazu die Beiträge zu Heft 3/4 der Zeitschrift 'Angewandte Sozialforschung' 1970). In beiden Fällen wird man möglichst standardisierte Instrumente zur Anwendung bringen, die relativ präzis und zuverlässig sind und die eine Quantifizierung der Variablen erlauben. Bei Entscheidungsstudien wird man dagegen zunächst mit relativ vielen offenen und qualitativ gehaltenen Fragen operieren und erst sukzessive in den nachfolgenden Befragungswellen zu Quantifizierungen kommen wollen. Bei solchen Untersuchungen läuft man leicht in Gefahr, die Probleme zu eng zu sehen und vor allem unerwünschte Nebeneffekte nicht zu erfassen. Da die Befragung in diesem Fall den Nachweis erfolgter oder nichterfolgter Veränderungen zu erbringen hat, ist das Problem der Stabilität des Meßverfahrens besonders heikel. Häufig wird bei solchen Arbeiten übersehen, daß der Nachweis einer Veränderung nicht viel nützt, wenn man nicht die ursächlichen Faktoren des Wandels isolieren kann. Der Forscher muß also nicht nur Kontrollgruppen, die verschieden "behandelt' werden, zur Verfügung haben, sondern auch die vorgenommenen 'Behandlungen' sehr genau kennen und theoretisch analysieren, damit er seine Fragen adäquat formulieren kann. Ein zusätzliches Problem entsteht bei solchen Studien dadurch, daß zumeist nicht nur kurzfristige Wirkungen erstrebt werden, sondern auch, oder sogar vor allem, langfristige. Die Wirkung eines kontrollierten Eingriffes ist aber umso schwerer zu
32
4. Band: Erhebungsmethoden: Die Befragung
fassen, je länger er zurückliegt, da eine Reihe von intervenierenden Faktoren wirksam wird. Die daher erklärliche Tendenz, kurzfristige Erfolgsbestimmungen vorzunehmen, kann aber zu erheblicher Minderung der Gültigkeit der Aussagen für praktische Zwecke führen (vgl. HYMAN U.A. 1962; RIEGEL 1965 ; SUCHMAN 1967; HYMAN UNDWRIGHT 1967; CARO 1969). In manchen Fällen eignen sich Gruppendiskussionen besonders gut für Bewertungsstudien (BELSON1963 und 1967a), und möglicherweise kann unter bestimmten Bedingungen eine Modifikation der Delphi-Technik brauchbare Ergebnisse liefern. Bei Verbreitungsstudien stehen jeweils nur wenige abhängige Variablen im Mittelpunkt der Befragung; die Unterteilung der Bevölkerung bei der differenzierenden Deskription geschieht mittels einiger unabhängiger Variablen in relativ grober Form. Die abhängigein) Variable(n) ist (sind) genau bekannt, und es ist lediglich nach der relativen Häufigkeit ihrer verschiedenen Ausprägungen gefragt. Bei globalen Erhebungen dieser Art liegt dabei das Schwergewicht auf einer exakten, möglichst genau quantifizierten Erfassung der betreffenden Merkmale in der Gesamtbevölkerung, unabhängige Variablen spielen so gut wie keine Rolle. Bei differenzierenden Erhebungen wird man dagegen von der Genauigkeit Abstriche machen müssen, um unabhängige Variable einigermaßen genau miterfragen zu können. Dagegen gewinnen die Vorkehrungen zur Bestimmung der Zuverlässigkeit und Gültigkeit erheblich an Bedeutung, da man bei Schätzungen, die sich auf qualitativ verschiedene Teilpopulationen beziehen, weit weniger darauf vertrauen kann, daß die Meßfehler unsystematisch streuen und sich gegenseitig aufheben. Insbesondere bei globalen Verbreitungsstudien wird man Fragebatterien mit einfachen Vorgaben vorziehen und offene Fragen nur selten verwenden. Hingegen werden explorative Klassifikationsstudien besser mit halbstrukturierten oder noch offeneren Techniken durchgeführt, um alle qualitativen Details herausarbeiten zu können; die relativen Häufigkeiten der beobachteten Phänomene spielen dabei ja von vornherein keine Rolle. Bei solchen Erhebungen sollte man nach Möglichkeit neben der Individualbefragung auch Gruppendiskussionen durchführen (vgl. MANGOLD 1960, 1967; ROHASZKY 1968; KREUTZ 1971a) und die Technik des 'Rollenspiels' einsetzen (vgl. zu den Problemen dieser Technik: BEM 1967, 1968; PILIARIN 1969;KELMAN 1966; GREENBERG 1967; FREEDMAN 1 9 6 9 ) .
2.1.3
D i e T h e m a t i k der Untersuchung
Die Konstruktion des Fragebogens hat nicht nur auf das formale Untersuchungsziel, sondern auch auf die inhaltlich zur Frage stehenden Verhaltensformen Rücksicht zu nehmen. Die wohl grundlegendste Unterscheidung, die allgemein akzeptiert wird, ist die Differenzierung zwischen äußerem und innerem Verhalten, zwischen beobachtbaren Handlungen einerseits und psychischen Dispositionen andererseits. Diese beiden Formen erfordern jeweils etwas andere Befragungstechniken, werden aber von einer Reihe von Autoren noch weiter unterteilt (vgl. KORNHAUSER 1951; MOSER1958; ATTESLANDER 1969). So läßt sich in Hinsicht auf die Erfordernisse der Frageformulierung zwischen Gewohnheiten und Einzelentscheidungen bzw. singulären Handlungen unterscheiden. Bei psychischen Dispositionen ist wohl ein Unterschied zwischen kognitiven und evaluativen Elementen zu machen, die jedoch faktisch kaum voneinander
2. Kapitel: Die Konstruktion von Fragebögen
33
getrennt werden können und mit unterschiedlichem Gewicht in Werthaltungen, Einstellungen, Vorstellungen, Meinungen und Wissen eingehen. Bei der Untersuchung von Dispositionen lassen sich zwei verschiedene Fragestellungen voneinander unterscheiden: auf der einen Seite wird versucht, die Art und Weise der Verknüpfung zwischen kognitiven und evaluativen Elementen aufzuzeichnen, also die strukturellen Zusammenhänge aufzuzeigen (vgl. die Ansätze von HEIDER 1 9 5 8 ; FESTINGER 1 9 5 7 ) , andererseits legt man Wert darauf, die Richtung und Intensität von Einstellungen und Meinungen und das Ausmaß an 'objektivem' Wissen zu messen. Wie GALTUNG ( 1967 S. 150 ff.) festgestellt hat, ist die Anwendung von Befragungstechniken in der Soziologie mit dem Nachteil verbunden, Daten, die soziale Aggregate charakterisieren, nur indirekt gewinnen zu können. Zwar haben sich die Techniken der Mehrebenenanalyse, der Kontext- und Relationsanalyse im letzten Jahrzehnt erheblich verfeinert, sie machen aber doch eine Reihe von Annahmen erforderlich, deren inhaltliche Gültigkeit keineswegs nachgewiesen ist. Man m u ß heute auf Grund der gesammelten Erfahrungen mit den verschiedenen Erhebungstechniken davon ausgehen, daß sich selbst die einfachste Interaktion in wohlvertrauten Gruppen verschieden darstellt, je nachdem, ob sie direkt beobachtet oder mit Hilfe von audiovisuellen Hilfsmitteln festgehalten wird, oder ob sie auf Grund der Aussagen der Beteiligten rekonstruiert wird (-* Bd. III: Manz, Beobachtung verbaler Kommunikation). 2.1.3.1 Die Messung von
Einstellungen
Die Einstellungsmessung, so wie sie vor allem von der Sozialpsychologie entwickelt wurde, geht von der Annahme aus, daß sich Einstellungen mittels latenter Dimensionen charakterisieren lassen. Obwohl sich im Prinzip sehr verschiedenartige Dimensionen konzipieren lassen, konzentriert sich die bisherige Forschung auf die Messung der Intensität von Einstellungen. Es wird mithin angenommen, daß die in verbal geäußerten Meinungen und Handlungen indirekt sichtbar werdenden, äußerst verschiedenartigen Einstellungen von Personen mittels einer begrenzten Zahl von latenten Dimensionen charakterisiert werden können, so daß die Kenntnis der Werte, die das betreffende Individuum auf den zur Erfassung dieser Dimensionen konstruierten Skalen erhält, eine gute Rekonstruktion seiner geäußerten Meinungen und/oder seiner Handlungen erlaubt. Wenn man eine solche Konzeption akzeptiert, so folgt daraus, daß man versucht, die Position der Individuen auf jeder der hypothetisch angenommenen latenten Dimensionen möglichst genau zu messen. Es empfiehlt sich daher, zur Messung dieser Dimensionen eine große Zahl von Fragen, Fragebatterien, zu stellen. Man beginnt die Konstruktion solcher Skalen - wenn nicht bereits brauchbare Meßinstrumente vorliegen — mit einer sorgfältigen Auswahl von Fragen, die alle die intendierte latente Dimension mehr oder minder zentral berühren. Voraussetzung ist natürlich, daß bereits in theoretisch-konzeptueller Arbeit abgeklärt wurde, welche latenten Dimensionen in Hinblick auf das Forschungsproblem relevant sein können. Dabei geht man davon aus, daß jede einzelne Frage die latente Dimension fehlerhaft mißt, d.h. nicht allein auf die zu messende Dimension, sondern auch auf andere anspricht und zudem von spezifischen Meßfehlem (MißVerständnissen, Ungenauigkeiten der Formulierungen usw.) berührt wird. Jede Frage läßt sich daher in bezug auf die latente Dimension durch eine Häufigkeitsregression (trace line) charakterisieren.
34
4. Band: Erhebungsmethoden: Die Befragung
Wenn wir z.B. den einfachen Fall einer Alternativfrage mit forced choice nehmen, so kann man von den Personen, die einen bestimmten Wert auf der latenten Dimension haben, den Anteil, die diese Frage bejaht haben, feststellen. T u t man dies für alle Personen (bzw. Werte auf der latenten Dimension), so erhält man eine Kurve, die anzeigt, ob und wie stark die Antworten auf die Frage mit der latenten Dimension konkomittant variieren. Dabei sind zwei Momente für die Beurteilung der Frage von größter Bedeutung: die 'relative' Schwierigkeit und ihre Trennschärfe. Wenn wir bei unserem Beispiel der 'Ja-Nein-Fragen' bleiben, so läßt sich die 'Schwierigkeit' einer Vorgabe leicht erklären: eine Frage kann so formuliert sein, daß nur jemand, der eine extreme Einstellung hat, diese bejaht, sie kann aber auch so gefaßt sein, daß bereits jene, die mit einer bestimmten Auffassung sympathisieren, ihr zustimmen werden usw. Es läßt sich also sagen, d a ß die Position jeder Frage sowie die jedes Respondenten auf der latenten Dimension bestimmt werden kann. Soll daher die latente Dimension adäquat erfaßt werden, so braucht man eine Reihe von Fragen sehr unterschiedlicher Schwierigkeit, um auch extremere Einstellungen unterscheiden zu können. Verwendet man nur eine oder wenige Fragen zur Feststellung eines Sachverhalts, so ist auch dann das Konzept zumindest als heuristisches Prinzip äußerst brauchbar (vgl. dazu LITWAK 1956 und DAMARIN 1970). Hat nämlich der Forscher überhaupt bewußt überlegt, welche 'Schwierigkeit' bzw. Häufigkeitsregression seine Frage haben dürfte, so wird er einerseits z.B. durchaus in kontrollierter Weise auch Suggestivfragen verwenden können und andererseits viele Fehler bei der Interpretation seiner Fragen vermeiden, da er sich dann darüber im klaren sein wird, daß die Linearverteilung der Antworten, die er erhält, abhängig ist auch von der 'Schwierigkeit' der von ihm verwendeten Frage(n). Von diesen Überlegungen her sollte einsichtig sein, daß es beim gegenwärtigen Stand der Befragungstechnik (mit einigen trivialen Ausnahmen) viel schwerer ist, die Verteilung der Merkmalsausprägungen einer nicht beobachtbaren Disposition in einer Population so genau festzustellen, daß die exakten Werte für jedes einzelne Individuum angegeben werden können, als mittels relativ grober Messungen unter Zuhilfenahme der multivariaten Analyse oder anderer statistischer Techniken korrelative Zusammenhänge aufzudecken. Die Aufgabe, z.B. die Verteilung der Bevölkerung hinsichtlich autoritärer Einstellungen in gültiger Weise zu ermitteln, um so letzten Endes sagen zu können, wie autoritär diese Population ist, ist somit ungleich schwerer, als Korrelate relativ autoritärer oder relativ toleranter Einstellungen festzustellen. Die Trennschärfe einer Frage gibt an, wie sauber bzw. eindeutig sie die Population hinsichtlich der latenten Dimension unterteilt. Wenn z.B. bei einer Alternativfrage etwa die Hälfte mit Ja bzw. mit Nein antwortet, dann ist die Trennschärfe dann am größten, wenn jeder Ja-Antwortende einen höheren (bzw. tieferen, je nach der Ausrichtung der Skala) Wert auf der latenten Dimension hat als der Nein-Antwortende mit dem höchsten Skalenwert. Unterscheidet sich der durchschnittliche Skalenwert der Ja-Antwortenden nicht von dem der Nein-Sager, so ist die Frage für die intendierte Messung wertlos und daher überflüssig. Die Trennschärfe einer Frage m u ß aber nicht für die gesamte Dimension gleich gut sein. Eine Frage, die die Gesamtbevölkerung nur schlecht unterscheidet, kann in einem Teilbereich der Skala ganz ausgezeichnet funktionieren. Die in vielen älteren Lehrbüchern vorkommende Empfehlung, die Fragen nicht so zu konstruieren, d a ß der Großteil der Antwortenden eine einzige Antwortkategorie wählt, ist daher abzulehnen, da gerade Fragen mit extremer
2. Kapitel: Die Konstruktion von Fragebögen
35
Schwierigkeit notwendig sein können, um bestimmte Teilbereiche der latenten Dimension adäquat zu erfassen. In der gleichen Weise können u.U. Fragen, die mit hohen Nichtbeantwortungsquoten belastet sind, neben anderen Fragen zum gleichen Thema, eine positive Funktion übernehmen. Die latente Einstellungsdimension, zu der die einzelnen Fragen in Bezug gesetzt werden, ist freilich zu Beginn der Forschung empirisch nicht erfaßt, sie soll ja erst durch die zu konstruierende Skala abgebildet werden. Um diese konstruieren zu können, behilft man sich daher damit, in einer Voruntersuchung eine sehr große Zahl von Einzelfragen zu stellen und aus diesen eine erste grobe Rohàkala zu erstellen. Die einzelnen Fragen werden nun in einem zweiten Schritt, der 'Item-Analyse', darauf geprüft, wie gut sie in ihren Ergebnissen mit dieser Rohskala übereinstimmen. Dabei werden bei verschiedenen Skalierungsverfahren verschiedene Gesichtspunkte berücksichtigt, ob etwa Transitivität gegeben ist, oder es werden nur Korrelationen und Häufigkeitsregressionen berechnet usw. Ziel aller dieser Verfahren ist es aber, die Anzahl der endgültig verwendeten items so zu verringern, daß alle möglichst weitgehend ein und dieselbe Dimension messen. Abgesehen davon, daß dieses Verfahren, wenn es schematisch betrieben wird, eine inhaltliche Verlagerung der Skala bewirken und somit die Validität der Messung in Frage stellen kann, sind neuerdings ernsthafte Zweifel darüber aufgetaucht, ob ein solches Verfahren überhaupt zulässig sei, da die Beantwortung der einzelnen Fragen nicht unabhängig voneinander erfolgt und zudem auch populationsabhängig ist (vgl. z.B. HIRSCHI UND SELVIN 1967, S . 207 f., FISCHER 1968, S . 65 f.). Eine Reihe von Autoren zweifelt überhaupt daran, daß die grundlegende theoretische Konzeption, auf der dieses Verfahren basiert, haltbar ist. Man geht dabei davon aus, daß man ähnlich wie bei der Auswahl der Befragten aus der Grundgesamtheit eine Wahrscheinlichkeitsstichprobe ziehen könne. Übertragen auf die Probleme der Fragebogenkonstruktion bedeutet das, daß man von der praktisch unendlich großen Zahl von möglichen Fragen, mit deren Hilfe man die zu messende Dimension erfassen könnte, eine relativ kleine Zahl auswählt, die repräsentativ sein soll für die Gesamtheit (vgl. dazu die Darstellung bei HOLM 1970a). Diese theoretische Konzeption ist aber in der Tat kaum.zu verwirklichen, und die Wahl der Fragen entspricht eher einer Auswahl nach Gutdünken als einer Wahrscheinlichkeitsstichprobe, da man nicht einmal in der Lage ist, die Gesamtheit, aus der ausgewählt werden soll, exakt zu definieren. An dieser Stelle sei angemerkt, d a ß die herkömmlichen Ansätze der Skalierungstechniken heute mit großen Schwierigkeiten zu kämpfen haben und die Anwendung der herkömmlichen Testtheorie auch in der Psychologie kaum zu letztlich befriedigenden Erfolgen geführt hat. Von den Arbeiten, die sich kritisch mit einzelnen Annahmen beschäftigen, auf denen diese Techniken beruhen, seien hier beispielhaft jene von HIMMELFARB (1969), FISHBURN(1970) und OFSKE UND O F S K E ( 1970) angeführt. Mit anderen Worten kann man sagen, daß quantitatives Messen in der Soziologie sich in den Anfangen befindet (das einfache Abzählen von Individuen oder auch die willkürliche Zuordnung von Zahlen zu Antwortkategorien liefern zwar Zahlen und werden auch häufig als Quantifizierung bezeichnet, sie erfüllen aber nicht die Bedingungen eines Meßvorganges (vgl. dazu COLEMANN 1964a, S. 62 f.)). Die herkömmlichen Verfahren werden häufig unkritisch in allzu großer Methodengläubigkeit angewendet, die bis heute herausgearbeiteten Modelle und Techniken sind aber vor allem von heuristischem Wert, und zwar auch dann, wenn man Einzelfragen verwendet, und keine Skalen konstruiert. Dies gilt selbst für den Fall, daß man nicht psychische Dispositionen, sondern manifestes Verhalten zu erfassen sucht.
36
4. Band: Erhebungsmethoden:
Die Befragung
Die Versuche, auf Grund von Einstellungsmessungen tatsächliches Verhalten zu erfassen bzw. vorherzusagen, haben bis heute nur zu bescheidenen Ergebnissen geführt, und es bleibt fraglich, ob die bisher üblichen Verfahrensweisen sich dazu überhaupt eignen. Wie TITTLE UND HILL ( 1 9 6 7 ) , WARNER UND D E F L E U R ( 1 9 6 9 ) , HIMMELSTRAND ( 1 9 6 9 ) , WICKER ( 1 9 7 1 ) und andere wahrscheinlich machen konnten, kommt es sehr stark auf die Situation des Befragten an, ob gemessene Einstellungen auf tatsächliche Verhaltensweisen schließen lassen. Geht man vom Einstellungskonzept aus, so macht man von vornherein nicht den Versuch, kognitive und evaluative Aspekte der Stellungnahme zu bestimmen Sachverhalten voneinander zu trennen. Inwieweit ein solcher Versuch mit Befragungsmethoden überhaupt durchführbar ist, bleibt eine offene Frage (vgl. KREUTZ 1969b). Die analytische Unterscheidung in 'beliefs' und 'values' (BARTON 1962) läßt sich nur schwer operationalisieren, und es bleibt abzuwarten, inwieweit sich Ansätze zu neuen Techniken auf diesem Gebiet (so z.B. der statement—Katalog zur Feststellung von 'Vorstellungen', den KELLERMANN 1969 entwickelt hat) bewähren werden. Da man annehmen kann, daß kognitive bzw. evaluative Elemente sich gegenseitig bedingen und miteinander verzahnt sind, scheinen Verfahren angebracht, die die Struktur dieser Zusammenhänge aufzudecken in der Lage sind; das dürfte allerdings mit Batterien von geschlossenen Einzelfragen nur schwer möglich sein. Es ist daher überhaupt erst nachzuweisen, daß mit Hilfe von standardisierten Befragungstechniken mehr als eine globale Erfassung von 'Einstellungen' oder 'Meinungen' erreicht werden kann. 2.1.3.2 Fragen über beobachtbares
Verhalten
Bei der Erfassung von manifesten Verhaltensweisen ist zu berücksichtigen, ob man Handlungen des Respondenten selbst zu erfragen sucht oder ob man von ihm die Angabe von Beobachtungen über das Verhalten anderer oder über allgemeine Zustände erbittet. Bezieht sich das Verhalten auf die eigene Person, so ist mit der besonderen Wirksamkeit von Tabus einerseits, von Vorstellungen über sozial positiv bewertetes Verhalten (social desirability) andererseits zu rechnen. Man wird daher bei der Erfassung einer Reihe von Verhaltensweisen ohne die Anwendung projektiver Verfahren nicht auskommen, und der Gebrauch von geschlossenen Fragen muß durch eingehende Voruntersuchungen gerechtfertigt werden. unterscheidet bei Variablen, die sich auf Individuen beziehen, einerseits zwischen solchen, die privat oder relativ 'öffentlich' bekannt sind (zu letzteren gehören u.a. Alter, Geschlecht, Beruf, ungefähre sozio-ökonomische Lage, und andererseits zwischen solchen, hinsichtlich derer die Individuen relativ langfristig (oder ständig) festgelegt sind oder kurzfristig schwanken.
GALTUNG ( 1 9 6 7 , S . 2 9 4 )
Merkmale, die öffentlich sind und langfristig bestehen, sind — sofern nicht tabuisiert — relativ leicht zu erfassen. Zu ihnen gehören die in fast allen Untersuchungen berücksichtigten statistischen Kopfdaten (background variables). Die Messung dieser Variablen wird in fast jeder soziologischen Feldforschung notwendig. Für den praktischen Gebrauch sei auf eine Reihe von Inventaren hingewiesen, die über die verschiedenen Fragen, Skalen und Indices, die auf diesem Gebiet entwickelt wurden, informieren (vgl. z . B . OPPENHEIM 1 9 6 6 ; BONJEAN, HILL UNDMCLEMORE 1 9 6 7 ; MILLER 1 9 7 0 ) . Die heute gebräuchlichen Techniken sind selbst auf diesem relativ einfachen Gebiet noch nicht voll befriedigend, vor allem wird immer wieder der Fehler gemacht, die
2. Kapitel: Die Konstruktion von Fragebögen
37
Angaben nur punktuell zu erheben, ökonomische Daten wie Einkommen, Vermögen, Steuerverhalten sind zwar auch fur die soziologische Forschung von zentraler Bedeutung, ihre Erfassung durch Befragungstechniken ist aber noch äußerst mangelhaft. Welch enormen Aufwand eine genaue Erfassung solcher ökonomischer Daten voraussetzt, läßt sich am besten an den Studien von LANSING U.A. ( 1 9 6 1 ) und von HAUCK UND STEINKAMP ( 1 9 6 4 ) ersehen. Private, aber langfristig gleichbleibende Merkmale werden von Galtung als Persönlichkeits-Merkmale bezeichnet. Zu den kurzfristig sich ändernden und privaten Merkmalen zählen Variablen, die die Einstellungen und nicht gewohnheitsmäßig festgelegten Verhaltensweisen charakterisieren. Insbesondere bei letzteren ergeben sich große Probleme bei der Anwendung von Befragungstechniken. Auch bei normativ nicht belegten Verhaltensweisen setzt der Forscher vom Befragten bei Angaben über dessen eigene Person letzten Endes die Fähigkeit zu Selbstbeobachtung voraus. Nun haben aber jahrzehntelange Erfahrungen gezeigt, daß selbst die kontrollierte Selbstbeobachtung, die ausgebildete Wissenschaftler an sich durchführten, wissenschaftlich nur bedingt brauchbares Material liefert. Auf Grund dieser Erfahrungen sollte man beim normalerweise ungeschulten Befragten äußerste Vorsicht bezüglich seiner Angaben insbesondere über sein eigenes Verhalten walten lassen. Vor allem dann, wenn Interaktionen mit anderen Personen erfragt werden sollen, ist sehr bald die Grenze erreicht, die durch die bewußte Wahrnehmung des eigenen, des Verhaltens der Interaktionspartner und durch die Verbalisierbarkeit von Beziehungen gegeben ist (vgl. dazu KREUTZ 1971a, insbesondere S. 170 f.). Auf jeden Fall sollte man sich als Soziologe ständig des Umstandes bewußt sein, daß der Großteil des empirischen Materials, das man zur Verfügung hat, auf relativ unkontrollierten Selbstbeobachtungen des Respondenten beruht. Ist man sich dessen bewußt, so wird man so gewonnene empirische 'Fakten' nicht buchstäblich nehmen und im Zweifelsfall z.B. bei der Testung von Theorien das Nichtzutreffen von Vorhersagen u.U. den Erhebungstechniken und nicht der Theorie anlasten. Es empfiehlt sich, die Vorgänge, die sich in sozialen Aggregaten abspielen, genauso wie psychische Dispositionen des einzelnen als höchstens indirekt erfaßbare Vorgänge in einer 'black box' anzusehen (zumindest wenn man Befragungstechniken anwendet). Die Angaben der Untersuchungspersonen sind dann als indirekte Indikatoren über die Vorgänge in dem jeweiligen Aggregat anzusehen und können daher keineswegs wörtlich genommen werden. Wie GEIGER (1950) in einem Selbstversuch aufzeigen konnte, ist sich auch das reflektierte und selbstkritische Individuum nur eines Bruchteiles seiner tatsächlichen Interaktionen bewußt und kann daher auch von sozialen Vorgängen, die es selbst direkt betreffen, höchstens ein subjektiv gefärbtes Protokoll liefern. Extensive Techniken wie Zeitbudgets oder Aufstellungen der Haushaltsausgaben sind daher mit größter Vorsicht anzuwenden und zu interpretieren, da die heute gängigen Verfahren, abgesehen davon, daß dabei die Messung selbst auf die festzustellenden Verhaltensweisen massiv einwirkt, eine glatte Überforderung der Befragten darstellen. Es erscheint daher mehr als fraglich, ob solch aufwendige Erhebungstechniken ein geeignetes Mittel darstellen, um Verhaltensweisen in gültiger Weise zu erheben.
38
4. Band: Erhebungsmetncden: Die Befragung
2.1.4
Die Populationsabhängigkeit von instrumenten
Zu den besonders schwerwiegenden Problemen, die sich bei der Konstruktion von Fragebögen ergeben, gehört der Umstand, daß mar. kaum je eine Bevölkerung voraussetzen kann, die hinsichtlich ihrer äußeren Situation und Lebensumstände, ihrer Sprach- und Denkgewohnheiten, ihrer Antwortbereitschaft usw. homogen ist. Standardisierte Fragebögen müssen daher so konstruiert weraen, daß sie von sehr verschiedenen Bevölkerungsteilen verstanden und beantwortet werden können, was de facto bedeutet, daß die Fragen nicht spezifisch auf die jeweilige Situation des Befragten zugeschnitten sein können. Daher ist von vornherein eine Tendenz zur Normierung und Vereinheitlichung der bestehenden Unterschiede gegeben. Diese Stereotypisierung stellt eine echte Gefahr dar und führt nicht selten dazu, daß das Resultat insbesondere von repräsentativen Umfragen der gesamten Bevölkerung eines Staates aus Klischees besteht. Aufgabe der Standardisierung und die Anwendung von halbstrukturierten Interviews (focused interviews im Sinne von Merton) setzen jedoch einen sehr hochqualifizierten Interviewerstab voraus, erhöhen die Kosten der Auswertung beträchtlich und schließen billigere Formen der Datenerhebung, wie etwa die schriftliche Befragung, von vornherein aus. In der klassischen Testtheorie wird die Populationsabhängigkeit der Ergebnisse eines Meßinstrumentes und damit auch seiner Réhabilitât und Validität übergangen (vgl. dazu FISCHER 1968, S. 23 ff.). Man spricht daher völlig unberechtigt und unkritisch von der Zuverlässigkeit und Gültigkeit eines Tests allein auf Grund bereits einer einzelnen eingehenden Untersuchung an einer einzigen Population (vgl. die völlig unkritische Rezeption dieser Ansichten bei HOLM 1970a). Dies ist selbstverständlich nicht zulässig, und die Möglichkeit der Anwendung eines solchen Instrumentes muß bei jeder neuen Untersuchung in eingehenden Voruntersuchungen überprüft werden. (-· Bd. V I : Stelzl, Experimentelle Versuchsanordnungen 5.2). Auch in diesen Fällen empfiehlt es sich, Parallel-
48
4. Band: Erhebungsmethoden: Die Befragung
formen zu verwenden. Vorteile dieses Verfahrens sind, daß die Skalen auf Transitivität getestet werden können und sich der Übergang zu mehrdimensionalen Maßen zwanglos ergibt (vgl. COOMBS 1 9 6 4 ; zur Einführung SIXTL 1 9 6 8 ) . Die Vorgabe einer größeren Zahl von Fragen über ein und denselben Sachverhalt stellt einen großen Aufwand dar, der nur dann wirklich zu rechtfertigen ist, wenn die Beantwortung der einzelnen Fragen unabhängig voneinander erfolgt. Wie aber das Auftreten des Positionseffektes zeigt, ist eine vollständige Unabhängigkeit keinesfalls gegeben, und die aus dem Bemühen, konsistent und 'vernünftig' zu antworten, sich ergebenden Verzerrungen können dazu führen, daß Korrelationen zwischen den 'items' auftreten, die einzig und allein durch das Instrument bedingt sind (vgl. auch CAMPBELL UNDFISKE 1 9 5 9 u n d WIRTS UND LINN 1 9 7 0 ) .
Wie HAYES ( 1 9 6 4 ) nun empirisch nachgewiesen hat, wird die Problematik noch dadurch kompliziert, daß solche Positionseffekte nur bei einem (allerdings großen) Teil der Befragten auftreten. Ob somit die Anwendung von Fragebatterien die Gültigkeit der Ergebnisse überhaupt erhöht und nicht vielleicht sogar verringert, kann beim gegenwärtigen Stand der Forschung nicht gesagt werden. Ähnlich wie bei Fragebatterien kann man auch bei Listenfragen versuchen, das Problem der Reihenfolge durch zufällige Anwendung und Verwendung von Parallelformen zu lösen (vgl. CANNELL UND KAHN 1 9 6 8 ; MOSER 1 9 5 8 , S. 2 3 2 f.). Listenfragen finden überall Anwendung, wo eine große Zahl einfacher Sachverhalte oder Tatsachen nur auf Zutreffen oder Nichtzutreffen abgefragt werden. Solche Listen können auf Grund des Umfanges nicht mündlich abgefragt werden, sondern müssen dem Befragten schriftlich vorgelegt werden. Die schriftliche Vorgabe kann dabei in Form einer zusammenhängende, überschaubaren Liste oder auf einzelne Karten mit jeweils nur einem Objekt erfolgen. Welches Vorgehen gewählt wird, hängt davon ab, ob man das Zutreffen oder Nichtzutreffen jedes Objektes isoliert oder im Gesamtkontext erfragen will. MÖBIUS ( 1 9 6 6 , S. 8 1 ff.) zeigt, d a ß Listenvorgaben weniger a u f m e r k s a m gelesen werden, A n t wortvorgaben mit einem gemischten Kartensatz eine erhöhte A u f m e r k s a m k e i t erzwingen; außerdem stellt dieses Verfahren die gleichen Wahrnehmungschancen für alle A n t w o r t k a t e g o r i e n her. Seine Daten d e u t e n a u c h darauf hin, d a ß die letzten Positionen der Liste auf Kosten d e r mittleren bevorzugt w e r d e n ; dieser Effekt verstärkt sich mit z u n e h m e n d e m Alter und geringerer Schulbildung der Befragten. Im Gegensatz dazu referiert SCHEUCH ( 1 9 6 7 , S. 184) eine Untersuchung aus dem J a h r e 1958, die seiner Meinung nach zwei charakteristische Ergebnisse bringt: " 1 . die relative Wahl von Vorgaben s t i m m t bei Karten- u n d Listenfragen weitgehend überein; 2. insgesamt w u r d e n mehr Nennungen bei der Listenfrage abgegeben". Scheuch gibt fünf sehr allgemein gehaltene Faustregeln, die bei der Aufstellung von Vorgaben zu berücksichtigen sind (S. 145). Als groben Richtsatz erwähnt er, " d a ß bei Vorgaben, die nicht mehr einzelne Stimulusworte sind, bereits die Verwendung von fünf Kategorien problematisch sein k a n n " . Bei einer Liste liegt seiner Meinung nach die Grenze zwischen fünf bis zehn Kategorien, w e n n die Stimulussätze k o m p l e x sind. "Dagegen erwies sich bei einer Untersuchung d e s Kölner Forschungsinstitutes über Hörgewohnheiten eine Karte mit 25 Programmbezeichnungen als u n p r o b l e m a t i s c h " (S. 184). Einige A u t o r e n finden bei Vorgabe von check-lists keine empirischen Hinweise auf mögliche R e i h e n f o l g e n e f f e k t e (vgl. z . B . CAMPBELL UND MOHR 1 9 5 0 ; KREUTZ UND FÜRNSCHUSS 1 9 7 1 ) ,
andere wiederum sehen die an den ersten o d e r auch die an den letzten Positionen angeführten stark bevorzugt (vgl. zu dieser Diskussion PAYNE 1951, S. 80 f f . ; KORNHAUSER 195 1, S. 4 6 0 ff.; G Ö R D E N 1 9 6 9 , S. 2 6 5 f f . ) .
2. Kapitel: Die Konstruktion
von
Fragebögen
49
Diese Hinweise zeigen ganz deutlich die kontroversen Auffassungen, die in der Literatur zu diesem T h e m a bestehen; die Autoren scheinen manchmal sogar ihren eigenen empirischen Ergebnissen nicht zu trauen. ANGER weist noch darauf hin, daß beim Listenverfahren grundsätzlich mit stärkeren Verzerrungswirkungen durch Positionseffekte gerechnet werden muß. Daher sei die Reihenfolge der Vorgaben besonders wichtig. Kürzere Listen liefern seiner Meinung nach in der Regel verläßlichere Ergebnisse als längere, was aber auf Kosten der Gültigkeit gehen kann, " d e n n mit abnehmender Zahl der gebotenen Alternativen wird es immer fraglicher, ob die vorgegebenen A n t w o r t e n auch einen genügend großen Spielraum e r ö f f n e n , so daß jeder Befragte seine persönliche Stellungsnahme auch vertreten f i n d e t " ( 1969, S. 578 f.). STROSCHEIN (1965, S. 105 f.) erwähnt, daß auch die Vorlagengestaltung (Farbdruck, Schriftbild) einen Einfluß auf die Beantwortung haben kann. Generalisierungen über die Auswirkung der Reihenfolge der Vorgaben dürften deshalb vorläufig kaum möglich sein, da die G r ö ß e der Verzerrungen dieser E f f e k t e zumindest auch von der Länge der Voigabenliste, der Länge des Fragebogens, der Untersuchungspopulation und der Situation des Interviews nicht unabhängig ist. Wie BECKER ( 1 9 5 5 ) ausführt, haben die üblichen Versuche, den Reihenfolgeneffekt empirisch zu fassen, deshalb nicht zum Ziel geführt, weil sie die große Variabilität der Erhebungssituationen bei Feldforschungen nicht berücksichtigen. 2.2.2
Die Formulierung der Fragen
2.2.2.1 Die Wahl der Frageform Sprachliche Mitteilungen, ob geschrieben oder gesprochen, können zweierlei Zwecken dienen: 1. zur Abbildung bzw. Beschreibung von Sachverhalten und 2. als implizite oder explizite Aufforderungen zum Handeln, wobei die implizite Form durch Werturteile gegeben ist. In Erkenntnis der möglichen Suggestivwirkung von Werturteilen, die durch eine bestimmte Form der Frageformulierung (Wortwahl und Wortabfolge) gewollt oder ungewollt zum Ausdruck kommen, hat die ältere sozialwissenschaftliche Methodenlehre versucht, sich strikt auf neutrale Fragen zu beschränken und alle wertenden Ausdrücke bzw. Redewendungen zu vermeiden. Abgesehen davon, ob man diese Forderung in der erwähnten unbedingten Form überhaupt als berechtigt ansieht oder nicht, läßt sich eindeutig nachweisen, daß sie in der Praxis der Forschung einfach nicht eingehalten werden kann. Daher hat sich in der Methodologie eine neuere Position durchgesetzt, die den Gebrauch von 'loaded' bzw. 'leading questions' zuläßt. Allerdings dürfen solche wertenden Fragen nicht einseitig verwendet werden, d.h. es müssen zum gleichen Sachverhalt mehrere Fragen gestellt werden, die verschieden 'geladen* sind und sich daher in ihrer wertenden Wirkung insgesamt aufheben. Wie LITWAK (1956) gezeigt hat, bringt diese Methode überdies den Vorteil mit sich, daß die Intensität der relevanten Werthaltungen bzw. Einstellungen genauer erfaßt werden kann. Die verschieden stark 'geladenen' Fragen lassen sich in bezug auf die zu Grunde liegende Disposition durch unterschiedliche Häufigkeitsregressionen ('trace-lines') charakterisieren und entsprechen somit Aufgaben unterschiedlicher 'Schwierigkeit', wie sie bei herkömmlichen Tests verwendet werden. Die Verwendung wertender Fragen setzt jedenfalls voraus, daß die Richtung der Bewertung dem Forscher bekannt ist. Prinzipiell ist zwischen der Suggestivwirkung von Frageformulierungen zu einem Sachverhalt und der Wertigkeit zu unterscheiden, die der Befragte dem erfragten Sachverhalt ohnehin zuweist.
50
4. Band: Erhebungsmethoden: Die Befragung
Die vor allem in der Meinungsforschung gängige Praxis, in der öffentlichen Diskussion besonderst strittige oder stark tabuisierte Probleme so zu erfragen, daß man durch eine Einleitung Gegensätze bzw. Tabus abschwächt ("Sind Sie nicht auch der Ansicht, daß . . . " oder "Man hört heute manchmal,. . ."), wird allgemein als ein Beispiel neutraler Frageformulierung zitiert. In Wirklichkeit stellt ein solches Vorgehen aber nur den Versuch einer Neutralisierung dar und kann — abhängig von der Einstellung des Befragten — verzerrend wirken. Als Konsequenz der Suggestion einer scheinbar rationalen und emotionsfreien Grundhaltung kann sich entweder eine Uberbetonung der Rationalität ergeben, oder die unterstellte Neutralität wirkt auf den Befragten als Provokation und somit ebenfalls verzerrend. Auf jeden Fall muß der Forscher bemüht sein, die in seinem Fragebogen auftretenden Wertungen durch gezielte Vorerhebungen in den Griff zu bekommen. An besonderen Techniken bieten sich hier an: Semantische Differentiale (vgl. OSGOOD U.A. 1 9 5 7 ; JENKINS, RÜSSEL UND SUCI 1 9 5 9 ; M C C R O S K E Y . P R I C H A R D UND A R N O L D 1 9 6 7 ) , einige projektive Verfahren, wie Wortassoziationen (vgl. z . B . LINDZEY 1 9 6 1 ; OPPENHEIM 1 9 6 6 ) und Inhaltsanalysen der wörtlichen Antworten von Mitgliedern der Zielpopulation. Daneben besteht die Möglichkeit, durch Verwendung eines 'gegabelten Fragebogens' (split ballot) die spezifischen Auswirkungen verschiedener Formulierungen zu testen. Jede Frage legt ganz bestimmte Antworten nahe und macht eine Reihe anderer verbaler Reaktionen unwahrscheinlich. Diese Abhängigkeit wird nicht allein durch den Sinn oder Bedeutungsinhalt der Frage hergestellt, sondern beruht zum Teil auf rein sprachlichen Gewohnheiten; sie können bewirken, daß der Fragesatz allein durch die getroffene Wortwahl bei offenen Fragen bestimmte Wendungen und Worte, bei geschlossenen bestimmte Alternativen wahrscheinlich macht. Man kann davon ausgehen, daß jede Befragung einen Kommunikationsprozeß darstellt, bei dem Informationen ausgetauscht werden und bei dem die Sprache, geschrieben oder gesprochen, den wichtigsten Informationskanal darstellt. Dabei darf aber nicht übersehen werden (was leider häufig geschieht), d a ß sprachliche Mitteilungen auch von formalen Eigengesetzlichkeiten bestimmt werden, also den gemeinten Sinn nicht unverzerrt vermitteln. Der Informationskanal 'Sprache' ist mithin mit 'Geräuschen' (im Sinne der Informationstheorie) verbunden, die den Austausch von Informationen belasten. In diesem Zusammenhang sei hier auch auf die Bedeutung verwiesen, die bei mündlicher Befragung der Sprechweise (Betonung, Setzen von Pausen etc.) des Interviewers zuk o m m t (vgl. z . B . HAEDRICH 1 9 6 4 , S. 3 5 f. und RICHARDSON, DOHRENWEND UND KLEIN 1965;-Ι- Bd. I I I : Scherer, Sprachforschung).
Auf Grund dieser Überlegungen dürfte ersichtlich sein, daß auch offene Fragen, ja sogar projektive Vorgaben, den Antwortenden in einer bestimmten Weise lenken. Die traditionelle Dichotomie 1 offene-geschlossene' Frage ist daher eine Simplifizierung, die den graduellen Charakter der 'Offenheit' verkennt. Der Forscher sollte sich bei der Formulierung jeder Frage von vornherein darüber im klaren sein, wie viele Informationen ('bits') er mit Hilfe dieser Vorgabe erhalten will. So ist es nicht zielführend, bei einem Tatbestand, bei dem der Forscher alle prinzipiell möglichen Merkmalsausprägungen kennt, offen zu fragen oder umgekehrt zu viel vorauszusetzen und in ungeklärten Situationen Alternativfragen zu verwenden. Die große Bedeutung, die der Entscheidung, ob man ' o f f e n e ' oder 'geschlossene' Fragen verwenden soll, zugeschrieben wurde, ist aus den genannten Gründen heute sicherlich nicht mehr angebracht; dafür muß die Aufmerksamkeit aber auf andere Aspekte der äußeren Form von Fragen gelenkt werden.
2. Kapitel: Die Konstruktion von Fragebögen
Wenn beispielsweise ANGER ( 1969, S. 577) o f f e n e und geschlossene Fragen, so wie im folgenden wiedergegeben, charakterisiert, dann übersieht er, daß durch das formale Offenlassen aller möglichen A n t w o r t e n eine Beeinflussung des R e s p o n d e n t e n durch die Frage keineswegs ausgeschaltet ist. Anger schreibt: "Bei offenen Fragen unterliegt der R e s p o n d e n t keinerlei Beschränkungen; e r g i b t eine frei formulierte A n t w o r t , deren Inhalt, F o r m , Spezifität und Ausführlichkeit ganz in seinem Ermessen liegt." Empirisch zeigt sich hingegen, d a ß der Fragesatz bereits den Wortschatz, die Redewendungen und auch die Richtung der Beantwortung weitgehend festlegen kann, o h n e daß Beantwortungsmöglichkeiten vorgegeben werden. Umgekehrt bricht ein nicht zu vernachlässigender Anteil der Befragten aus dem starren Schema geschlossener Fragen aus und gibt abweichende A n t w o r t e n , die dann aber v o n flexiblen Interviewern d o c h irgendwie eingestuft o d e r von den Kodierern als 'nicht auswertbar' klassifiziert werden. Zudem sollte man bedenken, daß die Festlegung der A n t w o r t e n nicht d u r c h die einzelne Frage geschieht, sondern durch den gesamten Ablauf des Interviews. Dieser E f f e k t ist bei Verwendung von o f f e n e n Fragen ebenso gegeben wie bei einem vollstandardisierten Verfahren. Selbst projektive Techniken wie etwa Satzergänzungen schränken die Antwortmöglichkeiten formal ein.
Sind somit die Unterschiede zwischen offenen und geschlossenen Fragen nur graduell, so sind sie doch so wichtig, daß bei Erstellung eines Fragebogens genau bedacht werden muß, wann welche Frageform für welchen Zweck eingesetzt wird. Die Hauptnachteile offener Fragen sind (vgl. auch CANNELL UND KAHN 1968, S. 65 ff.; SCOTT 1 9 6 8 , S. 2 1 0 ff.): 1. E r h ö h t e Kosten. Die nachträgliche Auswertung der wörtlichen A n t w o r t e n bedeutet einen erheblichen Mehraufwand, auch wenn heute d u r c h den Einsatz von C o m p u t e r n eine wesentliche Abkürzung der Auswertungszeit erreicht werden kann (vgl. SUDMAN 1967; FRISBIE UND SUDMAN 1968; BALAN U.A. 1969). Die kostensparende Möglichkeit, die A n t w o r t e n auf o f f e ne Fragen durch Interviewer während der Befragung gemäß vorgegebener Kategorien einstufen zu lassen, ist nur bei einfachen Sachverhalten gegeben, da der Interviewer bei komplexeren Problemen überfordert wird. Bei schriftlichen Befragungen fällt diese Möglichkeit natürlich ganz weg. 2. Die Sammlung der A n t w o r t e n ist wesentlich erschwert. Bei schriftlichen Befragungen werden hohe A n f o r d e r u n g e n an die Ausdrucksgewandtheit der Respondenten gestellt. Die Scheu vor Rechtschreibfehlern kann ebenfalls zu Nichtbeantwortung oder kurzen, stereotypen Aussagen u n t e r Wiederholung d e r in der Frage verwendeten Worte führen. Bei Interviews ist eine wörtliche Notation zwar fast immer verlangt, aber für die meisten Interviewer eine unerfüllbare Forderung, d a nur wenige Stenographie beherrschen. In beiden Fällen kann das Lesen der verschiedenen Handschriften große Schwierigkeiten bereiten und ist zumindest äußerst zeitraubend (vgl. auch ROEDE 1968, S. 28 ff.). Die Verwendung von T o n b ä n d e r n ist zwar technisch gesehen ideal, bringt aber eine Reihe von Gefahren für die Validität der Ergebnisse. 3. Insofern o f f e n e Fragen dem Respondenten mehr Freiheit bei der Wahl seiner A n t w o r t e n lassen, ist immer mit der Möglichkeit zu rechnen, daß verschiedene Befragte in ihren Antworten verschiedene Gesichtspunkte vor Augen haben. Die Untersuchungspersonen können in einem solchen Fall nur hinsichtlich des Bezugsrahmens, in dem sie die Frage gesehen haben, verglichen werden. O b w o h l dies an sich ein wichtiges F a k t u m ist, gehen so doch sehr viele interessante Einzelheiten verloren (vgl. z.B. MOSER 1958, S. 229 ff.; ANGER 1969, S. 577 f.). Diese Nachteile sind aber nicht so schwerwiegend, d a ß sie einen weitgehenden Verzicht auf o f f e n e Fragen rechtfertigen. Der Nachteil, daß auf verschiedenen Dimensionen geantwortet wird, w e n n man o f f e n fragt, kann leicht dadurch ausgeglichen werden, d a ß man zum gleichen Thema mehrere o f f e n Fragen stellt und die A n t w o r t e n in ihrer Gesamtheit auswertet, wie es etwa bei Satzergänzungstests oder bei der Messung der Leistungsmotivation mit dem T A T der Fall ist. Wenn man Baterien von 50 u n d mehr geschlossenen Fragen verwenden k a n n , u m eine Dimension zu messen, so sollte es doch auch möglich sein, zu einem T h e m a mehrere o f f e n e Fragen zu stellen. Der Einsatz von technischen Hilfsmitteln bei d e r D a t e n a u f n a h m e
51
52
4. Band: Erhebungsmethoden: Die Befragung
und der Auswertung ermöglicht es, ein ungeheuer reiches Material zu erfassen und auszuwerten, was bei Verwendung von geschlossenen Fragen von vornherein ausgeschlossen ist. Eine Mischung der Frageformen kann zudem dazu benützt werden, den Vorbericht weitgehend auf die Ergebnisse geschlossener Fragen zu stützen und während dieser Zeit die Auswertung der offenen Fragen weiterzutreiben. Z.B. ist es unmöglich, den Beruf durch geschlossene Fragen genau zu erheben. Verwendet man nun gleichzeitig mehrere offene Fragen, um eine genaue Erfassung der Berufsposition, der Branche usw. zu gewährleisten und daneben eine oder mehrere geschlossene Fragen, die eine Einordnung in grob abgegrenzte Berufsgruppen ermöglichen, so kann man Schnelligkeit bei der Erstellung der ersten Übersicht mit der größtmöglichen Genauigkeit beim Endbericht verbinden.
Während über offene und geschlossene Fragen ausführlich diskutiert wurde und wird, ist der formale Unterschied zwischen Behauptungen (statements) und Fragen noch gar nicht recht bewußt geworden. Dennoch kann man annehmen, daß es für den Befragten einen großen Unterschied macht, ob ihm positive Aussagen vorgesetzt werden oder ob der Forscher durch die Frageform die prinzipielle Unentschiedenheit eines Problèmes betont. Die äußerst starke Tendenz bei psychologischen Tests, die vorgegebenen Aussagen zu bejahen, könnte z.T. darauf zurückzuführen sein, daß nicht Fragen, sondern Behauptungen vorgelegt wurden. Jedenfalls sollte man bei der Vorlage von langen Listen von Behauptungen sehr vorsichtig vorgehen und sich darüber im klaren sein, daß man ein sehr rigides Verfahren benützt, das inhaltliche Zustimmung des Befragten aus formalen Gründen sehr nahelegt. Eine ebenso wesentliche Entscheidung ist es, in welcher Person man die Fragen formuliert. Je nachdem, ob man die Anrede 'Sie' oder 'Du', die Ichform oder das unpersönliche 'man' verwendet, wird man damit rechnen müssen, andere Ergebnisse zu bekommen. Systematische Arbeiten über die tatsächlich auftretenden Unterschiede fehlen, sind aber dringend notwendig. Bei Verwendung des unpersönlichen 'man' von projektiven Fragen zu sprechen, scheint jedenfalls weit übertrieben. Eine weitere folgenreiche Entscheidung, die teilweise mit der Frageformulierung verbunden ist, wird durch die Wahl der Vergleichsbasis gefällt. Die Intensität einer Einstellung, die Häufigkeit eines Verhaltens, die Wichtigkeit eines Umstandes usw. kann jeweils nur im Vergleich zu bestimmten anderen Personen, Ereignissen oder Zuständen bzw. zu abstrakten sprachlich, numerisch oder graphisch ausgedrückten Einteilungen erhoben werden. Je nachdem welche Vergleichsbasis man wählt, so erhält man ganz bestimmte Daten. Wird der Befragte z.B. aufgefordert zu sagen, ob er im Vergleich zu seinen Freunden, Bekannten usw. eine bestimmte Handlung relativ häufig oder selten vollzieht, so hat man nur eine relative Einstufung im Vergleich zu seiner Bezugsgruppe, und die Bezugsgruppen der verschiedenen Respondenten können sich sehr stark voneinander unterscheiden. Fordert man die Untersuchungsperson auf, verschiedene Objekte, Meinungen oder Personen untereinander zu vergleichen und zu reihen, so gewinnt man zwar Angaben über intraindividuelle Präferenzordnungen, diese sind aber interindividuell nicht vergleichbar, da für zwei Personen zwar die gleiche Präferenzordnung gelten kann, für den einen das am positivsten bewertete Element aber das kleinste Übel, für den anderen aber das absolute Optimum darstellen kann. Die Vorlage abstrakter Abstufungen führt zwar nicht zu solchen Restriktionen der Interpretierbarkeit der Antworten, ist aber mit der Gefahr verbunden, daß die Antworten inhaltsleer und schematisch gegeben werden, da der Befragte mit der vorgelegten abstrakten Skala nichts anfangen kann (vgl. auch COOMBS 1 9 6 4 ; HICKS 1 9 7 0 ) .
2. Kapitel: Die Konstruktion von Fragebögen
53
Man kann annehmen, daß die Abhängigkeit der Antworten von den rein sprachlichen Merkmalen der Frage umso größer ist, je weniger der erfragte Sachverhalt präsent ist. Besondere Vorsicht ist daher bei der Vorgabe hypothetischer Situationen und bei retrospektiven oder prospektiven Fragen geboten. Andererseits sollte man nicht übersehen, daß alltägliche Selbstverständlichkeiten allgemein nicht als erwähnenswert gelten und daher in der Beantwortung nicht aufscheinen, wenn nicht besondere Vorkehrungen getroffen werden. 2.2.2.2 Probleme
der
Frageformulierung
In den folgenden Unterabschnitten soll nun versucht werden, einige grundlegende Überlegungen zur Vermeidung von Verzerrungen zusammenzustellen. Eine gewisse Hilfe bei der Lösung von Problemen der Frageformulierung kann der Sozialwissenschaftler von den Resultaten der Arbeit der Sprachpsychologen erwarten (-»· Bd. III: Scherer, Sprachforschung). Eine deutschsprachige E i n f u h r u n g in diesen Forschungsbereich b i e t e n HERRMANN UND STACKER ( 1 9 6 9 ) . Darin sind auch Techniken wie semantisches Differential, Inhaltsanalyse etc. eingehender beschrieben u n d grundlegende wie w e i t e r f ü h r e n d e Literatur behandelt. Neuere Darstellungen sprachsoziologischer A n s ä t z e und Ergebnisse f i n d e n sich z.B. bei OEVERMANN ( 1 9 6 8 ) , FLSHMAN ( 1 9 6 8 ) , GIGLIOLI ( 1 9 6 8 ) .
Die weiter o b e n aufgestellte B e h a u p t u n g , die F o r d e r u n g , alle w e r t e n d e n Ausdrücke b e i der Formulierung von Fragen zu vermeiden, sei u n d u r c h f ü h r b a r , läßt sich mit d e n Ergebnissen von OSGOOD UND SUCI ( 1 9 5 0 ) empirisch u n t e r m a u e r n , w o n a c h " a n die 70% aller Wörter bewertenden C h a r a k t e r (evaluativen C h a r a k t e r ) " haben (zitiert n a c h SIXTL UND KÖRTE 1969, S. 198; bereits auch SKINNER 1957). SCHEUCH ( 1 9 6 7 , S. 143) referiert auch, d a ß m a n seit geraumer Zeit d a z u übergeht, suggestive Wendungen bei der Frageformulierung b e w u ß t zu verwenden. ANGER b e r u f t sich ebenso wie S c h e u c h auf die Arbeit von KAHN UND CANNELL ( 1 9 5 7 ) und k o m m t zu dem S c h l u ß , daß d e r geplante Einsatz von Suggestivfragen "z.B. b e n u t z t w e r d e n k ö n n t e , um die Standfestigkeit eines B e f r a g t e n bzw. die Intensität einer b e s t i m m t e n Einstellung zu prüfen. Das ist das gleiche Prinzip, nach d e m seit langem bereits b e s t i m m t e F o r m e n von Skalen konstruiert w o r d e n s i n d " ( 1969, S. 577). Daß die R i c h t u n g , in der die Frage 'geladen' ist, b e k a n n t sein m u ß , wird in der zitierten Literat u r bestätigt, es finden sich j e d o c h k a u m Hinweise d a r a u f , wie m a n die Wertungen in den Griff b e k o m m e n k a n n : "Massive Suggestionen . . . sind leicht vermeidbar. Hierher g e h ö r e n aber auch weniger leicht e r k e n n b a r e Fälle, z.B. Fragen, die n u r die positiven oder nur die negativen Konseq u e n z e n einer M a ß n a h m e ins Bewußtsein r u f e n , sowie die Vorgabe gängiger Clichés oder allgemein ähnlicher stereotyper W e n d u n g e n " (ANGER 1969, S. 577). RICHTER bringt n o c h einen Aspekt hinzu: " J e k o m p l e x e r der notwendige Vorstellungsrahmen zur B e a n t w o r t u n g einer Frage ist, j e m e h r die Befragungsgruppe verinnerlichend und sich d i e soziale bzw. die d e n allgemeinen Befragungsrahmen b e t r e f f e n d e S i t u a t i o n vergegenwärtigen m u ß , um so m e h r sind die A n t w o r t e n vom jeweiligen sozialen Feld abhängig und suggestiv b e l a s t e t " ( 1 9 7 0 , S. 223). Neuere A r b e i t e n h a b e n gezeigt, d a ß sich die d e n einzelnen Worten a n h a f t e n d e n Wertungen innerhalb v o n Sätzen nicht addieren Ussen, d a ß sie a b e r d o c h d e n einzelnen Sätzen bzw. Aussagen einen k o m p l e x e n Wertgehalt verleihen. Die U n t e r s u c h u n g dieser d i f f e r e n z i e r t e n Wertungen erfolgt u n t e r Z u h i l f e n a h m e sozialpsychologischer Gleichgewichtstheorien (vgl. HEIDER 1967; G O L L O B 1 9 6 8 ; HEISE 1 9 6 9 ) .
Notwendigkeit und Technik der K o n t r o l l e der gewählten Formulierung drücken RUGG UND CANTRIL am deutlichsten aus: "Die klare E r k e n n t n i s v o n der B e d e u t u n g der F o r m u l i e r u n g einer Frage f ü h r t e vor längerer Zeit zur Einführung der mehrschichtigen E r h e b u n g e n , bei d e n e n z u
54
4. Band: Erhebungsmethoden: Die Befragung
Vergleichszwecken verschieden formulierte Fragebogen b e n u t z t w e r d e n . Diese T e c h n i k ist seit j e n e r Zeit immer wieder verwendet w o r d e n . Sie b e s t e h t im wesentlichen darin, d a ß jeder Fragebogen in zwei F o r m e n aufgestellt wird, d i e vergleichbaren Q u e r s c h n i t t e n d e r Bevölkerung vorgelegt werden. M a n c h e F r a g e n sind auf d e n b e i d e n Fragebogen verschieden ausgedrückt, u m d e n E i n f l u ß verschiedener F o r m u l i e r u n g e n und verschiedener Darstellungen des G e g e n s t a n d e s zu kontrollieren. A n d e r e F r a g e n bleiben dagegen gleich und dienen zur K o n t r o l l e " ( 1 9 5 2 , S. 8 6 ) . Sie folgern daraus: " D i e Technik der doppelten Fragebogen sollte, w e n n i m m e r möglich, verw e n d e t w e r d e n , u m die Stabilität u n d Konsistenz der Meinung zu p r ü f e n . " (S. 113 f.) u n d zählen in der F o l g e n e u n verschiedene Wirkungen von F r a g e f o r m u l i e r u n g e n auf, die mit diesem Vorgehen e r k a n n t w e r d e n k ö n n e n . Die Meinung von SCHEUCH ( 1 9 6 7 , S. 141) über die Wahl der Frageformulierung wird a u c h von ANGER zitiert und d ü r f t e für die bisherigen deutschsprachigen A r b e i t e n repräsentativ sein: " D i e Formulierung von Fragen ist auch heute n o c h d e r Abschnitt einer B e f r a g u n g , in d e m persönliches Geschick u n d E r f a h r u n g , weniger aber m e t h o d i s c h e Schulung entscheidend sind. I m m e r hin gibt es eine nicht geringe Zahl von Regeln, d e r e n K e n n t n i s zum Aufstellen 'guter' Fragen zwar nicht ausreicht, aber ausgesprochene Fehler vermeiden h i l f t " ( 1 9 6 9 , S. 576). Eine geringfügige Hilfe, die aber in jedem Fall in A n s p r u c h g e n o m m e n w e r d e n sollte, bieten Wortstatistiken, die eine g r o b e Abschätzung der Gebräuchlichkeit von Worten erlauben (im D e u t s c h e n : MEIER 1964), S y n o n y m e n l e x i k a (DUDEN 1964) und Übersichten über b e s o n d e r s schwierige S p r a c h p r o b l e m e (DUDEN 1965).
1. Der Befragte wird überfragt. Abgesehen davon, daß dies entstehen kann, wenn der Respondent den zur Frage stehenden Sachverhalt nicht oder nur ungenau kennt, kann sich ein Überfragen einstellen, wenn bei der Wortwahl ihm nicht geläufige Vokabeln verwendet werden. Besonders störend wirkt sich dies aus, wenn das Verstehen der Frage systematisch mit bestimmten, für die Untersuchung relevanten Merkmalen variiert. In diesem Fall ist man ständig in Gefahr, diese durch rein sprachliche Gewohnheiten gegebene Variation inhaltlich, d.h. als tatsächliche Verhaltens-, Einstellungs- oder Wissensunterschiede zu interpretieren. Eine zumindest minimale Kontrolle dieses Effekts kann durch das Einfügen von Kontrollfragen erreicht werden, deren Funktion es dann ist, die Geläufigkeit der verwendeten Formulierungen zu überprüfen. Bei schriftlichen Befragungen kann so zumindest im nachhinein der Anteil der nicht auswertbaren Antworten eruiert werden; bei Interviewstudien besteht darüber hinaus die Möglichkeit, bei Nichtverständnis andere, einfachere Formulierungen - die freilich im Fragebogen vorgesehen sein müssen — zur Anwendung zu bringen. Andererseits eignet sich dieses Verfahren dazu, Ubersimplifikationen zu vermeiden, die einen Teil der Befragten (vor allem jene mit höherer Schulbildung) verärgern und somit gegen die Untersuchung stimmen könnten (vgl. zu letzterem K R E U T Z 1 9 7 la, S. 1 1 1 ff.). Die Bereitschaft des Respondenten, lieber trotz Unkenntnis oder Nichtverstehens des Sachverhaltes irgendeine Antwort zu geben, als Unkenntnis einzugestehen, kann durch Fragen fiktiven Inhalts getestet werden. Systematische Quert abulie rung der so gebildeten Variablen mit allen für die Erhebung relevanten Angaben kann als zusätzliche methodische Uberprüfung empfohlen werden. Ein U m s t a n d , d e r bei der Formulierung v o n Fragen vorausgesetzt w e r d e n m u ß , a b e r der Realität nicht entspricht, ist, " d a ß zumindest eine einheitliche Sprache mit gleichartigem Stimuluscharakter für die E m p f ä n g e r von Mitteilungen e x i s t i e r t " (SCHEUCH 1967, S. 141). Es ist bek a n n t , d a ß die B e d e u t u n g sprachlicher Stimuli u.a. schichtenspezifisch differiert. Der Sozialwissenschaftler steht in diesen Fällen i m m e r vor dem P r o b l e m , daß eine für alle Befragten gleichlautende F r a g e f o r m u l i e r u n g Kommunikationsschwierigkeiten hervorrufen k a n n , eine A n -
2. Kapitel:
Die Konstruktion
von
Fragebögen
55
passung an d e n unterschiedlichen Wortschatz der einzelnen G r u p p e n aber auf K o s t e n der Standardisierung des E r h e b u n g s i n s t r u m e n t e s geht. Die Entwicklung von Lexika für verschiedene S u b k u l t u r e n steht in den A n f ä n g e n (vgL z.B. FRIENDLY UND GLUCKSBERG 1970; HAEBERLIN 1970), o b w o h l im d e u t s c h e n S p r a c h r a u m volkskundliche A r b e i t e n d a z u seit längerer Zeit vorliegen. Wenn die F o r m u l i e r u n g d a s Verständnis d e s Befragten ü b e r f o r d e r t , so kann d a s nach ANGER auch Folgen für die Motivation d e s Befragten h a b e n : " D a s Erlebnis d e s eigenen Nichtverstehens führt u.U. zu d e m G e f ü h l , sich mit j e m a n d zu u n t e r h a l t e n , der a u c h ihn niemals wirklich verstehen k a n n ; die K o m m u n i k a t i o n s b e r e i t s c h a f t s c h w i n d e t ; der soziale A b s t a n d zum Interviewer w ä c h s t " ( 1 9 6 7 , S. 5 7 6 ) . SCHEUCH ( 1 9 6 7 , S. 144) weist n o c h auf die von KAHN UND CANNELL ( 1 9 5 7 , S. 110 ff.) aufgef ü h r t e G e f a h r der Unterschätzung hin: " , . . . eine mit d e n R o l l e n e r w a r t u n g e n des Befragten in bezug auf den Interviewer nicht vereinbare übergroße Einfachheit der S p r a c h e k a n n als Anbiederung oder Herablassung e m p f u n d e n w e r d e n " .
2. Die Formulierung ist mehrdeutig. Dabei kann die auftretende Unklarheit für alle Befragten in der gleichen Weise bestehen oder es kann der Fall eintreten, daß bestimmte Teile der Population eine jeweils andere Bedeutung mit dem Wortlaut verbinden. Im erstgenannten Fall treten Unterschiede auf, die rein zufällig entstanden sind, bei unkritischem Vorgehen aber leicht inhaltlich interpretiert werden. Dieser Effekt wird höchstens durch einen Retest sichtbar; insofern nämlich, als er unter anderem dafür verantwortlich sein kann, daß große Stabilität der Antwortverteilung im Aggregat bei gleichzeitiger Instabilität der individuellen Antworten auftritt. Zur Lösung dieses Problems kann die 'Bedeutungsanalyse' (analytische Definition) empfohlen werden, die im Sinne von HEMPEL( 1 9 5 2 ) als Präventivmaßnahme vor dem Beginn der Feldarbeit vorgenommen werden soll. Im Rahmen von Vorerhebungen lassen sich daran anschließend populationsspezifisch variierende Bedeutungsinhalte der im Fragebogen verwendeten Worte feststellen, wenn man verschiedene projektive Techniken wie Wortassoziationen oder Fehlerauswahl anwendet. Die Mehrdeutigkeit von Fragen kann durch den Gebrauch bestimmter Worte, aber auch durch den Satzbau hervorgerufen werden. Bei der Wortwahl ist zu beachten, daß abstrakte Oberbegriffe fast ausnahmslos unterschiedlich aufgefaßt werden. Selbst in der Alltagssprache so geläufige Begriffe wie 'Freund', 'Freundin', beinhalten völlig verschiedene Beziehungsformen (vgl. dazu KREUTZ 1 9 6 3 ) . Dasselbe gilt in noch stärkerem Maße für den Gebrauch von Fremdwörtern. Ein häufig zu beobachtendes Phänomen ist, daß der Befragte sich in seiner Wortwahl an die Frageformulierung anpaßt, ja sogar ihm vorher nicht geläufige Ausdrücke und Wendungen übernimmt. Gerade bei einer solchen Übernahme neuer Worte dürfte es häufig geschehen, daß die Antwort weit stärker durch die sprachliche Formulierung als inhaltlich geprägt ist. Allzu häufig findet man in sozialwissenschaftlichen Untersuchungen theoretische, aus dem Wissenschaftsgebrauch stammende Begriffe, die nicht operationalisiert sind, sondern direkt in Fragen verwendet werden. Solche Erhebungen können daher die Ebene tatsächlichen Verhaltens von vornherein nicht erreichen (vgl. dazu BANCROFT UND WELCH 1 9 4 6 ; PAYNE 1 9 5 1 ; EDWARDS 1 9 5 7 , S. 9 f f . ) .
Um eine größtmögliche Eindeutigkeit zu erreichen, sollten Fragen außerdem kurz sein und Nebensätze vermieden werden; ebenso doppelte Verneinungen und Vergleiche, die sich auf mehr als zwei Elemente beziehen. Allerdings ergibt sich bei ganz bestimmten Fragestellungen (etwa der Präferenz für mögliche Koalitionen) die Notwendigkeit, drei oder mehr Elemente gleichzeitig vergleichen zu lassen.
56
4. Band: Erhebungsmethoden:
Die Befragung
Zu erheblichen Irrtümern führt ein leider häufig anzutreffendes Vorgehen, bei dem man den selbst verbal ungenauen Häufigkeitsabstufungen im nachhinein Zahlenwerte arbiträr zuordnet und diese mathematisch dann so weiterbehandelt, als ob es sich mindestens um Intervallskalen handelte. Unter Zuhilfenahme von Computern hat L A B O V I T Z ( 1 9 7 0 ) mit der Monte Carlo-Technik nachzuweisen versucht, daß die mathematisch-statistische Behandlung von Ordinalskalen mit Methoden, die eigentlich Intervallskalen voraussetzen, nur zu geringen Verzerrungen führt. Obwohl dies im höchsten Maße wünschenswert wäre (vgl. auch W I L S O N 1 9 7 1 ) , ist ein solches Verfahren keineswegs allgemein gerechtfertigt und durchführbar (vgl. die Kritik von M A Y E R 1 9 7 1 ) . Außerdem sei daraufhingewiesen, daß auch durch die Abfolge der Fragen Mehrdeutigkeiten entstehen können. Die Notwendigkeit der Bedeutungsanalyse beschreibt OPPund kommt zu folgendem Schluß: "Eine analytische Definition vieler Wörter der Alltagssprache ergibt häufig zweierlei: 1. Manche Wörter werden von verschiedenen Personen in unterschiedlicher Weise - d.h. inkonsistent v e r w e n d e t . . . 2. Eine Reihe von Wörtern ist unpräzise, d.h. es ist nicht klar, welche Designata sie haben . . . Wenn nun Wörter inkonsistent verwendet werden oder unpräzise sind, folgt, daß eine analytische Definition die Bedeutung für mehrere Personengruppen jeweils verschieden spezifizieren wird oder feststellen muß, daß bestimmte Designata nicht eindeutig einem Wort zugeordnet werden k ö n n e n " (1970, S. 103 f.). Daß die Fragen möglichst klar formuliert sein sollen und grammatikalisch schwierige Konstruktionen vermieden werden müssen, zählt zu den Forderungen, die überall in gleicher Weise erhoben werden (vgl. SCHEUCH 1967, S. 142; ANGER 1969, S. 576). Bei vielen Fragebögen, die zusammen mit der Untersuchung veröffentlicht werden, kann man jedoch feststellen, daß dieser Punkt in der Praxis nicht genügend Beachtung findet. Ein Beispiel für viele: "Es gibt immer Dinge (Sachen), bei denen man mit der Regierung unzufrieden ist. Wenn Ihnen und Ihren Bekannten etwas nicht gefällt (paßt), was können Sie dann, wenn auch nicht gleich, aber auf lange Sicht dagegen tun? " (SCHARMANN UND ROTH 1967, S. 291).
3. Die gewünschte Genauigkeit wird nicht spezifiziert. Ein elementarer Fehler liegt vor, wenn Fragen nach der Häufigkeit, nach der Intensität, nach der Dauer, nach der Größe und ähnlichem gestellt werden, ohne daß die Einheiten angegeben werden, in denen die Antwort erfolgen soll, und der Forscher an der Erfassung tatsächlicher Verhaltensgewohnheiten interessiert ist. Wenn man etwa nach der Häufigkeit des Kinobesuches, der Buch- und Zeitschriftenlektüre fragt, ohne einen Zeitraum vorzugeben, so wird man von vielen Befragten Antworten erhalten, wie 'oft', 'viel', 'kaum', 'manchmal', 'wenn es sich ergibt'. Zur Beschreibung des tatsächlichen Verhaltens sind solche Antworten wertlos, da die verschiedenen Befragten den genannten vagen Begriffen unterschiedliche Frequenzen zuschreiben werden. In diesem Zusammenhang sei auf die Faustregel von P A Y N E ( 1 9 5 1 ) hingewiesen: Bei der Formulierung jeder Frage sind fünf Punkte zu beachten, nämlich 'wo', 'wann', 'wer', 'wie', 'warum'. Bei Fragen nach anderen Personen muß durch besondere Hinweise sichergestellt sein, daß nicht Vornamen genannt werden, sondern die Beziehung des Befragten zu dieser Person spezifiziert wird. Die Beachtung solcher pragmatischer Empfehlungen stellt aber keineswegs sicher, daß die optimale Formulierung erzielt wird. Dies kann nur erreicht werden, wenn man überdies die inhaltlichen Zielsetzungen als wesentliches Bestimmungskriterium ansieht. Die Genauigkeit bzw. Ungenauigkeit einer Frage läßt sich nur in Relation zum Untersuchungsziel beurteilen. Handelt es sich um die Erfassung z.B. von Vorurteilen oder sprachlichen Stereotypen, so können auch vage
2. Kapitel: Die Konstruktion von Fragebögen
57
formulierte Fragen durchaus ihren Zweck erfüllen (vgl. zur Frage, inwieweit globale Fragen brauchbare Ergebnisse liefern können, LITWAK 1 9 5 6 und als empirisches Beispiel PATCHEN 1 9 6 3 ) . Der wohl häufigste Fall der Verzerrung durch Verkennung der tatsächlich erreichten Genauigkeit ist, daß Daten, die nur Gewohnheiten und dominante Verhaltenstendenzen beschreiben, so interpretiert werden, als ob sie konkrete Handlungen abbilden würden. HESS ( 1 9 6 6 b ) referiert eine M e t h o d e z u r ' U m r e c h n u n g von Verbalaussagen in numerische Aussagen' aus der L e s e r f o r s c h u n g : Man bringt in E r f a h r u n g , o b eine Z e i t s c h r i f t / Z e i t u n g 'regelmäßig', 'ziemlich häufig', 'gelegentlich' o d e r 'nie' gelesen wird u n d weist auf G r u n d einer Voruntersuchung j e d e r K a t e g o r i e d u r c h s c h n i t t l i c h e n u m e r i s c h e H ä u f i g k e i t e n zu. Da dieses V o r g e h e n aber einen g r o ß e n A u f w a n d bedingt, scheint es der A u t o r i n nicht o p t i m a l . D a ß d a b e i auch eine g r o b e Ungenauigkeit b e s t e h e n bleibt und systematische U n t e r s c h i e d e zwischen T e i l p o p u l a t i o n e n verd e c k t w e r d e n , ist evident. Leider wird in d e r d e u t s c h s p r a c h i g e n Literatur wenig auf so detaillierte P r o b l e m e eingegangen. Den A u s f ü h r u n g e n zu diesem P u n k t sei nur eine — a u c h von SCHEUCH ( 1 9 6 7 , S. 144) zitierte — Regel von PAYNE ( 1 9 5 1 , S. 114) hinzugefügt, w o n a c h zwar präzise Fragen n o t w e n d i g sind, Spezifität andererseits aber verwirrend sein k a n n und o f t a u c h u n n ö t i g ist. Der Genauigkeit der E r h e b u n g w e r d e n häufig d u r c h die N o t w e n d i g k e i t , d e m B e f r a g t e n A n o n y mität zu gewährleisten, enge G r e n z e n gesetzt. Man sollte d a b e i b e d e n k e n , d a ß die Zusicherung der A n o n y m i t ä t d u r c h a u s nicht bereits sicherstellt, daß der Befragte si^i. subjektiv sicher fühlt u n d auch g l a u b t , d a ß seine Angaben vertraulich b e h a n d e l t w e r d e n (vgl. z.B. RLESMAN 1958). In vielen Fällen sollte m a n d a h e r versuchen, durch b e s o n d e r e V o r k e h r u n g e n Beweise dafür zu erbringen, d a ß die A n t w o r t e n tatsächlich a n o n y m bleiben. Ein solcher E f f e k t k o n n t e z.B. bei einer F o r s c h u n g d a d u r c h erreicht w e r d e n , d a ß bei E r h e b u n g e n in Schulklassen j e d e m Schüler ein fiktiver V o r n a m e z u g e o r d n e t , ein Sitzplan mit diesen V o r n a m e n erstellt w u r d e u n d für d e n soziometrischen Test nur diese fiktiven V o r n a m e n v e r w e n d e t w u r d e n (KREUTZ 197 l b ) .
4. Einengung durch einseitige Formulierung. Es ist zu beachten, daß durch bestimmte Formulierungen die einzelnen Antwortmöglichkeiten verschieden 'attraktiv' gemacht werden können. Solche Tendenzen stellen sich gewollt oder ungewollt ein, wenn man etwa bei offenen Fragen einige Antwortbeispiele vorgibt. Eine andere Gefahr der Beeinflussung besteht darin, daß bei Vorgabe von Antwortkategorien die formale (logische und sprachliche) Übereinstimmung zwischen Frage und Antwortmöglichkeit die Wahl einer bestimmten Alternative nahelegt. MAX WEBER hat bereits 1909 auf diese Möglichkeit, Antworten zu suggerieren, aufmerksam gemacht und gleichzeitig daraufhingewiesen, daß solche Suggestivwirkungen auch lediglich bei einem Teil der Population auftreten können. Grobe Verzerrungen der Antwortverteilung können dadurch erzeugt werden, daß eine Antwortmöglichkeit präsentiert wird unter Berufung auf eine allgemein anerkannte Persönlichkeit, auf die Meinung von Fachleuten oder auf die Haltung der Mehrheit. So wurde z.B. bei einer schriftlichen Befragung von leitenden Angestellten, die erst 1 9 7 1 ( ! ) veröffentlicht wurde, folgende Frage gestellt: "Die Berufspädagogen meinen, daß fast jeder Mensch nach seinen Neigungen und Begabungen für mehrere Berufe geeignet sei und in ihm erfolgreich sein könne. Was meinen Sie dazu? Meinen Sie, Sie hätten auch in einem anderen Beruf reüssiert? " 98% der Befragten widersetzten sich diesem Ansinnen nicht (PROSS UND BOETTICHER 1 9 7 1 , S. 9 7 f.). Ein gutes Beispiel für eine solche kaum bemerkbare Beeinflussung durch die Frageformulierung findet sich in der ZDF Wahlstudie (INSTITUT FÜR DEMOSKOPIE 1969,
58
4. Band: Erhebungsmethoden: Die Befragung
S. 82): "Sind Sie mit den Verhältnissen hier bei uns in der Bundesrepublik im allgemeinen zufrieden, oder wünschen Sie sich vieles grundlegend anders? " Die eine Alternative 'vieles grundlegend anders* ist offensichtlich viel extremer formuliert als die andere; mit der Formulierung 'mit den Verhältnissen . . . im allgemeinen zufrieden' können auch Personen, die in sehr vielen Hinsichten unzufrieden sind, einverstanden sein. Die Verzerrung liegt hier offensichtlich darin, daß auf der einen Seite von 'grundlegend', auf der anderen Seite von 'im allgemeinen' gesprochen wird. Eine neuere und methodisch besonders interessante Studie von D I L L E H A Y UND J E R N I G A N ( 1 9 7 0 ) zeigt, daß einseitig formulierte Befragungsinstrumente die verbal geäußerten Einstellungen zumindest kurzfristig stark verändern können. Drei zufällig ausgewählten Gruppen von Befragten wurden drei verschieden abgefaßte Fragebogenformen über die Behandlung von Kriminellen vorgelegt (ein autoritär abgefaßter, ein neutraler und ein liberaler). Nach dem Ausfüllen der Bögen wurden den Befragten zwei neutral gehaltene Skalen gleichen Inhalts, die aber völlig unabhängig vom Fragebogen entwickelt worden waren, vorgelegt. Von jenen Befragten, die autoritär gehaltene Fragebögen erhalten hatten, ließen sich danach 67% als autoritär klassifizieren, von jenen, die neutrale erhalten hatten, 39% und von jenen, die die liberal gehaltene Form erhalten hatten, nur 14%. 5. Die Frage basiert auf unbegründeten Voraussetzungen. Jede nicht projektive Frage gibt einen Bezugsrahmen vor, innerhalb dessen sich die Antworten des Befragten bewegen werden. Bei Projektiv fragen wird im Gegensatz dazu versucht, durch die Verwendung verschiedenartig deutbarer Vorgaben wie etwa Tintenkleckse bei Rorschachtests die fur den Befragten subjektiv relevanten Gesichtspunkte und Beurteilungskriterien herauszufinden. Neben projektiven Verfahren, die Bildmaterial als Vorgaben verwenden, gibt es eine Reihe von Techniken, die mit rein sprachlichen Mitteln auskommen (z.B. Satzergänzung und Wortassoziationen). Solche Fragen sollten auf jeden Fall Verwendung finden, wenn der Forscher mit den Sprach- und Denkgewohnheiten der Zielpopulation und/oder dem erfragten Themenbereich wenig vertraut ist (vgl. OPPENHEIM 1 9 6 6 ) . Unterläßt man dies, so besteht die Gefahr, daß der Fragebogen den Sprach- und Denkgewohnheiten der Befragten nicht entspricht. Eine mögliche Folge ist, daß die Formulierung Assoziationen weckt, die auf einer anderen als der vom Forscher intendierten Dimension liegen. Ein solches Mißverständnis muß dabei gar nicht offenkundig werden, da ein und dieselbe Formulierung mit verschiedenen Sinngehalten verbunden werden kann. Forscher und Befragter werden in einem solchen Fall aneinander vorbeireden, ohne sich dessen bewußt zu werden. Eine andere Möglichkeit besteht darin, daß dem Befragten erst durch die Frageformulierung ein Zusammenhang bewußt wird, dessen Kenntnis fälschlicherweise als selbstverständlich vorausgesetzt wurde (Beispiel: B R A U N UND F U H R M A N N 1 9 7 0 , S. 5 3 8 , Frage 3 2 ) . Mit besonders schwerwiegenden Verzerrungen muß man dann rechnen, wenn in der Fragestellung so viele Voraussetzungen enthalten sind, daß die konkrete Situation des Befragten nicht einordenbar ist. Wie schon angedeutet, setzt jede Frage nicht nur einen gewissen Kenntnisstand beim Befragten voraus, sondern auch das Zutreffen bestimmter situativer Bedingungen. Selbst wenn die objektiv gegebenen Bedingungen im Fragebogen adäquat berücksichtigt wurden, kann die Untersuchungsperson insofern doch überfordert sein, als sie nicht in der Lage ist, ihre eigene Situation in all ihren Zusammenhängen voll zu überblicken.
2. Kapitel: Die Konstruktion von Fragebögen
59
Sehr häufig wird in Fragebögen rationales Verhalten der Befragten vorausgesetzt (z.B. Bedenken von allen Folgen und Nebenfolgen von Handlungen, Erkennen von Entscheidungssituationen, Berücksichtigung aller objektiv gegebenen Alternativen, Entwicklung einer in sich konsistenten Präferenzordnung etc.). Insbesondere bei komplexen Problemen und/oder inhomogenen Populationen bereitet die adäquate Erfassung der situativen Bedingungen aller Befragten größte technische Probleme. In diesen Fällen kann der hier besprochene Fehler nur mit einer großen Zahl von Fragen vermieden werden. Das wiederum schmälert meist jedoch deshalb die Aussagekraft der Untersuchung, weil der Umfang des Fragebogens und die teilweise pedantische Fragestellung die Konzentration zu sehr strapazieren. Normalerweise wird man daher einen Kompromiß zwischen der Ausführlichkeit der Befragung einerseits und der Interpretierbarkeit der Antworten andererseits suchen müssen. Eine vor allem in der sozialpsychologischen Attitüdenforschung fast durchgehend gemachte unberechtigte Unterstellung besteht darin anzunehmen, daß die Antworten auf Fragen mehr oder ausschließlich von den Dispositionen der Respondenten abhängig sind. Die Abhängigkeit des Verhaltens und der verbal geäußerten Meinungen können aber ebenso durch die äußere Lebenssituation, in die die Befragten weitgehend zufällig geraten sind, bedingt sein. Eine gesicherte Erfassung der Dispositionen muß daher auch auf die situativen Bedingungen eingehen und deren Einfluß kontrollieren. Die bisherigen Frageformen eignen sich dazu aber kaum. Die Entwicklung 'quasi-experimenteller Frageformen' ( K R E U T Z 1971a) könnte in dieser Hinsicht zumindest für bestimmte Fragestellungen brauchbare Ergebnisse liefern. Auf einen besonderen, immer wieder vorkommenden Fall, daß der Forscher zuviel voraussetzt, sei abschließend noch kurz hingewiesen: Oft wird übersehen, daß der Antwortende die Tendenz hat, ihm als 'natürlich', selbstverständlich erscheinende Sachverhalte nicht zu erwähnen. Berücksichtigt man dies nicht von vornherein, so erfaßt man gerade grundlegende Tatbestände nicht. Da andererseits die Vorgabe solcher 'Selbstverständlichkeiten' als Antwortkategorien auf viele Befragten lächerlich wirkt oder sie verärgert, ist es angebracht, sie bereits in die Frageformulierung einfließen zu lassen. SCHEUCH sieht projektive T e c h n i k e n als einen Spezialfall indirekter Fragen an: "Als indirekt kann m a n solche Fragen bezeichnen, deren für d e n A u ß e n s t e h e n d e n o f f e n b a r e B e d e u t u n g abweicht v o n ihrer B e n u t z u n g im F o r s c h u n g s p r o z e ß " ( 1 9 6 7 , S. 148 f.). ANGER hält d e m entgegen: "Reserviert m a n die Bezeichnung ' d i r e k t ' j e d o c h für solche Fragen, deren offensichtliche B e d e u t u n g für den R e s p o n d e n t e n m i t i h r e m I n d i k a t o r w e r t für d e n Untersuchungsleiter zusammenfällt, dann m ü ß t e n fast alle, j e d e n f a l l s die überwiegende Mehrzahl der faktisch gestellten Interviewfragen, als m e h r oder m i n d e r ' i n d i r e k t ' bezeichnet w e r d e n " ( 1 9 6 9 , S. 5 8 2 ) . Seiner Ansicht nach k o m m e n indirekte Fragen bei tabuisierten Sachverhalten z u r A n w e n d u n g , u n d w e n n ein Sachverhalt einer d i r e k t e n Erfassung nicht zugänglich ist, "weil der zu einer relevanten B e a n t w o r t u n g erforderliche Grad von B e w u ß t h e i t , Einsicht, abstrahierender Reflexion u n d u n v o r e i n g e n o m m e n e r Selbstkritik k a u m zu erwarten i s t " (S. 5 8 1 f.). S c h e u c h u n d Anger zählen eine R e i h e von K u r z t e s t s auf und stellen fest, d a ß die A n w e n d u n g dieser Techniken j e d o c h problematisch ist, da die Qualifikation des E r h e b u n g s t e a m s meist nicht ausreicht. NOELLE(1963, S. 7 6 ff.) bringt ein« Reihe von solchen Beispielen, die nach SCHEUCH ( 1 9 6 7 , S. 149) "jenseits ihres legitimen A n w e n d u n g s b e r e i c h s schon zur M o d e g e w o r d e n " sind.
60
4. Band: Erhebungsmethoden: Die Befragung
6. Die Vorgaben sind unvollständig oder inkonsistent. Eine grundlegende Regel ist, daß die Antwortvorgaben bei geschlossenen Fragen das ganze Spektrum der möglichen Antworten erfassen müssen. Da eine erschöpfende Aufzählung häufig nicht möglich ist, m u ß in den meisten Fällen zumindest die Antwortkategorie 'Sonstiges' vorgegeben werden. Diese Forderung, der nur allzu oft nicht entsprochen wird, ist natürlich ein (nicht zu umgehender) Notbehelf, da die im Wortlaut angeführten Vorgaben allein dadurch, daß sie explizit gemacht werden, eine viel größere Wahrscheinlichkeit besitzen, gewählt zu werden, als die Nichterwähnten. Da die A n t w o r t 'Sonstiges' zu wenig Information bietet, wird der Befragte meist um eine nähere Spezifizierung gebeten 'Sonstiges, und z w a r . . . . ' . Dieses Vorgehen ist insofern problematisch, als die Untersuchungsperson im Verlaufe der Befragung lernt, sich an die Vorgaben anzupassen, um nicht selbst eine Antwort formulieren zu müssen. Dieser Effekt dürfte bei schriftlichen Befragungen noch stärker ins Gewicht fallen, da in weiten Kreisen der Bevölkerung Angst vor Rechtschreibfehlern und Schwierigkeiten bei der schriftlichen Formulierung bestehen. Das allgemein anerkannte Verfahren zur Entwicklung geschlossener Fragen, Vorerhebungen durchzufuhren und damit einen Überblick über die häufigen Nennungen zu bekommen, hat eine (meist übersehene) Beeinflussung zur Folge: die (meist nicht repräsentative) Vorerhebung legt den Rahmen der möglichen Resultate der Hauptuntersuchung im oben genannten Sinne fest. Wenn man jedoch von vornherein nicht beabsichtigt, mit einer einzigen Frage sämtliche Möglichkeiten zu erfassen, und die Antworten dementsprechend interpretiert, sondern nur einen Teilbereich ordnen will, so ist es durchaus akzeptabel, auf die Vorgabe 'Sonstiges, und zwar . . . .' zu verzichten, wenn man nur eine andere Restkategorie vorsieht, wie etwa: 'Trifft nicht zu', W e i ß nicht' oder ähnliches. Bei der Konstruktion von geschlossenen Fragen m u ß man der Tatsache Rechnung tragen, daß immer wieder Fragen von einem Teil der Untersuchungspersonen nicht beantwortet werden. Dabei sollte durch die Vorgabe entsprechender Kategorien festgestellt werden, ob die Nichtbeantwortung auf Nicht-Zutreffen der Frage, auf Antwortverweigerung oder auf Nicht-Wissen zurückzuführen ist. Ein Teil der Autoren wendet sich gegen die explizite Vorgabe solcher Kategorien, da dies die Nichtbeantwortungsquote empfindlich erhöhe. Dem läßt sich entgegenhalten, daß diese Vorgaben bei mündlichen Interviews erst dann Verwendung finden, wenn eine Nichtbeantwortung bereits erfolgte, und daß bei schriftlichen Befragungen das Fehlen von Restkategorien entweder zu arbiträrer Beantwortung führt oder aber dazu, daß der Grund der Nichtbeantwortung nicht spezifiziert werden kann. Dieselbe Schwierigkeit tritt auf, wenn nur die Vorgabe 'Keine Antwort' vorgesehen ist. Werden keine Mehrfachnennungen zugelassen, so müssen sich die vorgegebenen Kategorien logisch ausschließen, so daß für jeden Befragten eine und nur eine Antwort zutrifft. Werden Mehrfachnennungen zugelassen, so ergeben sich bereits bei der statistischen Auswertung große Schwierigkeiten, da die Anzahl der als zutreffend deklarierten Möglichkeiten nicht nur inhaltlich, sondern auch durch den Antwortstil des Respondenten bestimmt wird. Insbesondere bei Listenvorgaben kann man nachweisen, daß gleichartige Respondenten unterschiedlich viele Angaben machen; dazu k o m m t noch, daß man den E f f e k t , den allein schon die Reihung verursacht, nicht genau abschätzen kann.
2. Kapitel: Die Konstruktion von Fragebögen
61
7. Die Form der Intensitätsabstufungen verzerrt. Bei geschlossenen Fragen, die die Intensität von Dispositionen oder Verhaltensweisen messen sollen, spielt die Formulierung der vorgegebenen Abstufungen eine zentrale Rolle. Bereits die Anzahl der zur Beantwortung vorgelegten Intensitätsgrade beeinflußt die Verteilung der Antworten erheblich. Verwendet man z.B. fünf Vorgaben (oder allgemeiner: eine ungerade Anzahl), so lassen sich eindeutige Präferenzen für die mittlere Kategorie nachweisen, und die Verteilung der Antworten entspricht weit stärker der Normalverteilung als bei der Vorgabe einer geraden Anzahl. Die Formulierung der Endpunkte der vorgegebenen Intensitätsskalen ist besonders heikel; die Verwendung extremer Ausdrücke (nie, immer, sicher etc.) läßt den Befragten meist zur Mitte hintendieren. Abschwächende Formulierungen (fast nie, fast immer; so sicher, wie etwas überhaupt sein kann usw.) erscheinen daher fast immer angebracht. Eine Reihe von Forschern bevorzugt graphisch oder numerisch abgebildete Abstufungen (vgl. z.B. HESS 1966a) und verzichtet auf verbale Formulierungen der Intensität, Größe, Häufigkeit u.ä. Solche Verfahren (vgl. auch CANTRIL 1947, S. 54) basieren aber entweder auf Analogien — wie etwa bei der Verwendung der Abbildung eines Thermometers oder bei der Verteilung von Schulnoten —, die dem Befragten eine ganz spezifische Form der Betrachtungsweise nahelegen, die für ihn in seinem Alltagsverhalten irrelevant sein können, oder verlangen abstrakte Einordnungen, die wieder zumindest einem Teil der Befragten nicht geläufig sind. Insbesondere sind Häufigkeitsangaben problematisch und erweisen sich als wenig zuverlässig (vgl. z.B. SCHYBERGER 1966). Fragt man allgemein nach der Häufigkeit von Verhaltensweisen, so ergeben sich andere Ergebnisse als bei Vorgabe eines spezifischen Zeitraumes. Bei Verhaltensweisen, die saisonal bedingt bzw. periodischen Schwankungen unterworfen sind, weichen die Ergebnisse der beiden Frageformen stark voneinander ab, und man wird daher gut daran tun, sowohl allgemeine wie auch auf bestimmte Zeiträume bezogene Fragen zu stellen. Sollten bei der Auswertung Kategorien zusammengefaßt werden, so ist eine genaue inhaltliche Begründung anzugeben, da sonst die Daten fast willkürlich manipuliert werden können. Bei der Formulierung von Intensitätsabstufungen ist zu bedenken, daß in manchen Bereichen persönliche Präferenzen nicht punktuell festgelegt sind, so daß die Vorgabe von Intervallen eine realistische Beantwortung erleichtert. Die von den Befragten subjektiv akzeptierten Präferenzspielräume lassen sich oft am besten dadurch erfassen, daß die Minimal- und Maximalanforderungen unabhängig voneinander in getrennten Fragen erfaßt werden. Sehr häufig wird unterstellt, daß Präferenzen sich durch monoton ansteigende und fallende Funktionen abbilden lassen. So wird etwa angenommen, daß die Bejahung einer Behauptung innerhalb einer statement-Batterie immer auch die Zustimmung zu den davorliegenden schwächeren Behauptungen impliziert (vgl. dazu die theoretische Begründung der Skalogrammanalyse). Diese Annahme ist aber hinsichtlich einer Reihe von Dispositionen bzw. Verhaltensweisen unrealistisch. In diesen Fällen ist daher ein Verfahren angebracht, das nicht einfach eine einzige Intensitätszuordnung verlangt, sondern darüber hinaus die Zustimmung bzw. die Ablehnung jeder einzelnen Abstufung erfragt (vgl. dazu FLAMENT 1963).
62
4. Band: Erhebungsmethoden:
2.2.3
Funktionen von Fragen
Die Befragung
Die Stellung einer Frage im Fragebogen und der Wortlaut ihrer Formulierung sind in Abhängigkeit von ihrer Funktion zu sehen, d.h. ob sie unmittelbar dem Erhebungsziel dient oder ob ihr eine eher psychologische Funktion zugedacht ist. Inhaltlich intendierte Fragen müssen je nachdem, welchen Wirklichkeitsbereich sie erfassen sollen, unterschiedlich formuliert werden. Der Natur der Sache nach sind die in der Literatur vorfindbaren diesbezüglichen Einteilungen je nach theoretischer Grundorientierung der Autoren unterschiedlich (vgl. z.B. MOSER 1958; GALTUNG 1967; PHILLIPS 1 9 6 6 ; ATTESLANDER 1 9 6 9 ) .
Es scheint aber fraglich, ob es überhaupt sinnvoll ist, für jeden einzelnen Bereich der psychischen und sozialen Wirklichkeit eine eigene Frageart zu konzipieren, da auf diese Weise nicht viel mehr als relativ inhaltsarme und arbiträre Oberbegriffe gebildet werden. Eine Differenzierung des Forschungsansatzes je nach Thematik ist selbstverständlich, sie erfolgt aber bereits weitgehend vor der Konstruktion des Fragebogens und ist als wichtiger Teil der Forschungsstrategie zu betrachten, der sogar für die Entscheidung über die Wahl der anzuwendenden Methoden relevant ist (->• Bd. I: Schulz, Forschungsprozeß). Ein Fragebogen, insbesondere dann, wenn er die Grundlage für Interviews bildet, kann nicht ausschließlich aus Einzelfragen bestehen, sondern muß Teile beinhalten, die der Kontrolle der Antworten, der Gesprächslenkung bzw. der Anleitung dienen. Darüber hinaus kann es zu verschiedenen Zeitpunkten der Befragung notwendig sein, Hemmungen abzubauen bzw. die Antwortbereitschaft zu steigern. GÖRDEN (1969) spricht in diesem Zusammenhang von der Erstellung eines taktischen Planes für das Interview. Die Fragen, die der Gesprächsleitung dienen, können demnach unterschieden werden in solche, die sachlich-logischen Erfordernissen gerecht werden, wie etwa die Filterfragen, und in solche, die psychologischen Momenten Rechnung tragen, wie etwa Einleitungs-, Uberleitungs- und Pufferfragen. Sind die methodologischen Grundlagen schon für die Formulierung relativ gering entwickelt, so muß sich der Forscher bei der Planung der Funktionsfragen fast ausschließlich auf seine eigene Erfahrung und Intuition verlassen. Eine ausführliche Einteilung der Funktionsfragen bringt ANGER (1969, S. 575). Er unterscheidet sieben Arten mit insgesamt elf verschiedenen Begriffen, die 'wichtige befragungstechnische' bzw. 'psychologische Funktionen erfüllen', wobei aber der Kontroll- und der Filterfrage sicherlich keine 'psychologischen' Aufgaben zukommen. Einen noch umfangreicheren Katalog von Fragetypen bietet STROSCHEIN (1965, S. 46 f.) an. Die gängigsten Typen, die auch von den meisten anderen Autoren genannt werden, sind: Einleitungs-, Übergangs; und Filterfragen. SCHEUCH (1967, S. 147) definiert die Funktion solcher Fragen folgendermaßen: "Sie sollen primär einen gewünschten Bezugsrahmen für die Beantwortung der folgenden Fragen herstellen, Fragegruppen im Bewußtsein der Befragten voneinander trennen und die Motivation des Befragten zur Mitarbeit sichern." Die einzelnen Typen werden in den deutschsprachigen Arbeiten nicht genauer dargestellt und außer bei NOELLE (1963, S. 60 ff.), die aber auch nur kasuistische Hinweise von fraglichem Wert vermittelt, gibt es keine konkreten Anweisungen für die Verwendung von 'Funktionsfragen'. Die Verwendung von Fragen mit psychologischen Funktionen ist an sich nicht unumstritten. Wie solche Fragen eingesetzt werden, ist von weitreichender Konsequenz für die gesamte Erhebung. Plant man ein starres Gerüst solcher Fragen im vorhinein, so akzeptiert man zumindest implizit eine Auffassung, nach der die Befragung nach einem festen Programm, das für den Befragten
2. Kapitel: Die Konstruktion von Fragebögen
63
nicht eindeutig ist, erfolgen soll. Der Befragte darf in diesem Fall die Abfolge und Struktur des Fragebogens nicht durchschauen (vgl. CAPLOW 1956). Solche 'direktiven' Interviews können im Extremfall Kreuzverhören ähneln (vgl. KINSEY 1964, S. 43, der eine solche Intention explizit ausspricht). Eine Alternative zu diesem Vorgehen besteht vor allem dann, wenn qualifizierte Interviewer zur Verfügung stehen. In diesem Fall kann man sich mit einem Leitfaden begnügen, der einen Rahmen festlegt, innerhalb dessen der Interviewer Fragen mit psychologischen Funktionen den situationeilen Erfordernissen entsprechend abwandeln kann und so besser in der Lage ist, auf den individuellen Befragten einzugehen (vgl. dazu CICOUREL 1970, S. 110 ff.; KREUTZ 1971a, S. 135 ff.).
2.2.3.1 Die
Kontrollfrage
Eine Frage eigenen Typs stellt die 'Kontrollfrage' dar, mit deren Hilfe die gewonnene Information überprüft und abgesichert werden soll. Bei schriftlichen Befragungen in unkontrollierten Erhebungssituationen ist die Verwendung von Kontrollfragen allerdings äußerst problematisch und kann höchstens in indirekter Weise erfolgen, da sie u.U. für den Befragten vor der Beantwortung der Ermittlungsfrage einsichtig ist. Ansonsten ergibt sich die Stellung derartiger Fragen im Erhebungsinstrument aus ihrer Funktion. Aufgabe der Makroplanung ist es, die Kontrollfrage von der zu überprüfenden Aussage so weit entfernt (räumlich oder psychologisch) zu stellen, d a ß eine echte Unabhängigkeit der Antworten gewährleistet ist. Die Ergebnisse von psychologischen Arbeiten über das Kurzzeitgedächtnis sind in dieser Hinsicht von größter Relevanz (vgl. HILGARD UND BOWER 1 9 7 1 , S . 6 0 6
ff.).
Ist die Kontrolle als solche dem Befragten ersichtlich, so verliert sie nicht nur ihre Wirkung, sondern verschlechtert überdies den Kontakt und u.U. die Gültigkeit der weiteren Aussagen. Dieses Risiko wird weitgehend übersehen, was sich in der geringen Sorgfalt bei der Planung von Kontrollen äußert. Erweist es sich als möglich, die Ermittlungsfrage in unverändertem Wortlaut an einer späteren Stelle im Fragebogen zu wiederholen, so kann damit die Zuverlässigkeit der Frage bzw. die Stabilität der Antwort erfaßt werden. Ein derartiges Wiederholen einer Frage sollte aber nie ohne den expliziten Hinweis, daß man auf ein bereits behandeltes Thema zurückkommt, geschehen, um dem Befragten das Gefühl der Überprüfung zu nehmen und ihm die Möglichkeit zu geben, die gedankliche Verbindung herzustellen (was natürlich nicht die Erinnerung an die Antwort auf die zu kontrollierende Frage bedeutet). Weicht die Kontrolle von dem Wortlaut der Ermittlungsfrage ab, was in den meisten Fällen notwendig ist, so gibt es mehrere Möglichkeiten, doch eine annähernde Äquivalenz zu erreichen. Dabei bietet sich an: die Umkehrung der Fragerichtung, das Erfragen von logischen Implikationen der Ermittlungsfrage oder von sehr wahrscheinlichen empirischen Korrelaten des erfragten Sachverhaltes. In all diesen Fällen stellt sich aber das Problem der Gültigkeit solcher Kontrollen, da man sicherstellen muß, daß der zu Kontrollzwecken umformulierte Wortlaut dieselbe Dimension erfaßt wie die ursprüngliche Ermittlungsfrage. Hat die Umkehrung der Fragerichtung z.B. nachweislich einen Einfluß auf den Inhalt der Antworten, so ist nicht entscheidbar, ob die Abweichung auf eine geringe Zuverlässigkeit der Frage oder auf eine grundsätzliche Ambivalenz der gemessenen Einstellung zurückzuführen ist. Letzteres würde aber bedeuten, daß die Operationalisierung zwar möglicherweise zuverlässig ist, nicht aber valid, da in diesem Fall eine eindeutige positive oder negative
64
4. Band: Erhebungsmethoden: Die Befragung
Einstellung erfragt wird, die real gegebene Ambivalenz aber von der Frage nicht erfaßt werden kann. Es wäre eine ungerechtfertigte Vereinfachung, wollte man allein die Übereinstimmung zwischen Kontroll- und Ermittlungsfrage als ausreichendes Beurteilungskriterium für die Glaubwürdigkeit des Respondenten ansehen. Eine gewisse Kontrolle der Richtigkeit der Antworten läßt sich auch dadurch erzielen, daß man unmittelbar an die Erhebungsfrage Zusatzfragen, die Widerspruch herausfordern, stellt. Versuche mit solchen Fragen erbrachten nennenswerte Revisionen des ursprünglichen Urteils. Eine Weiterführung dieses Ansatzes, die allerdings kaum weitere Verbreitungschancen hat, besteht in der Verwendung von 'Lügendetektoren' bzw. in der Ankündigung, solche Apparate zur Überprüfung einzusetzen. Diesbezügliche Experimente von CLARK U N D T I F F T (1966) erbrachten erhebliche Änderungen der ursprünglichen Angaben. Vor allem bei Anwendung sozialpsychologischer Tests wurde der Versuch gemacht, durch die Vorgabe einer Batterie von Fragen, deren Antworten fast eindeutig festliegen, inhaltsunabhängige Antworttendenzen des betreffenden Individuums festzustellen. Solche Versuche werden aber der erwiesenen Tatsache nicht gerecht, daß die Antworten auf verschiedenartige Fragen weitgehend unabhängig voneinander erfolgen und einige davon zutreffend, andere bewußt oder unbewußt irreführend sein können. Aus dem gleichen Grund hat das Verfahren, objektiv bekannte Sachverhalte zusätzlich zu erfragen, um die Glaubwürdigkeit der Respondenten zu testen, nur beschränkte Beweisauf alle anderen ist sicherlich unzulässig. Dennoch stellt das Abfragen bekannter Sachverhalte ein wichtiges Kontrollverfahren dar, das nach Möglichkeit eingesetzt werden sollte. 2.2.3.2 Die Filterfrage Die Filterfrage dient zur Ausschaltung von Fragekomplexen, die für bestimmte Befragtengruppen nicht relevant sind. Diese Funktion übernimmt zumeist eine relativ allgemein gestellte Frage. Die Art der Beantwortung entscheidet darüber, ob die nachfolgenden detaillierten Fragen der Untersuchungsperson vorgelegt werden oder nicht. Eine anspruchsvollere Form sieht alternative Formen der spezifischen Fragen je nach der gegebenen Antwort vor. Bei schriftlichen Befragungen ist diese Technik nur begrenzt einsetzbar, bei Interviewstudien ist die Grenze der Anwendbarkeit von der Qualität des Interviewerstabes abhängig. Noch mehr als beim übrigen Fragebogen ist bei der Verwendung von Filterfragen auf eine übersichtliche graphische Gestaltung und sorgfältige Anordnung zu achten. - Da Filterfragen strategische Bedeutung für die gesamte Befragung haben und die Vorlage weiterer Fragen von der Antwort auf die Filterfrage abhängig gemacht wird, sind sie besonders sorgfältig zu formulieren und durch Kontrollfragen bzw. Zusatzfragen abzusichern (vgl. SCOTT 1968). Ein anspruchsloseres Verfahren, das fast immer verwendet werden kann, ist mit der Möglichkeit, Zusatzfragen zu stellen, gegeben. Hierbei handelt es sich darum, die Stelle einer oder höchstens zweier spezifischer Fragen von der Beantwortung der Hauptfrage abhängig zu machen. Bei beiden Techniken muß man darauf achten, daß man die Exploration mittels solcher genauerer Fragen nicht einseitig oder für den Befragten leicht durchschaubar gestaltet, da man ansonsten Gefahr läuft, daß sich die Untersuchungsperson dadurch einer aufwendigeren Befragung entzieht, daß sie sich
2. Kapitel: Die Konstruktion von Fragebögen
65
bei Filterfragen uninformiert stellt bzw. jene Alternative wählt, von der sie erwartet, daß sie keine weiteren Fragen nach sich zieht (vgl. dazu CANNELL UND KAHN 1968). 2.2.3.3 Fragen mit psychologischen
Funktionen
Zu diesen zählt man üblicherweise: Einleitungs-, Überleitungs-, Rangier- oder Konzentrations-, Pufferfragen und Fragen, die das Selbstvertrauen der Untersuchungsperson stärken bzw. Antworthemmungen abbauen sollen. Solche Funktionen müssen nicht unbedingt von eigenen Fragen übernommen werden, sondern können durch kurze Texte, Erklärungen, Behauptungen oder auch nur vorausgestellte Nebensätze erfüllt werden. Will man die psychologische Lenkung unauffällig gestalten — was mit zunehmender Standardisierung schwieriger wird - so empfiehlt es sich, Fragen zu verwenden, die nicht rein rhetorischen Charakter haben, sondern scheinbar dem Ermittlungszweck dienen. Bei schriftlichen Befragungen sind Einleitungs- oder Überleitungsfragen, Konzentrations-, Puffer- sowie motivierende Fragen insofern nur beschränkt anwendbar, als jeweils eine einzige von ihnen nicht genügt, um den gewünschten Effekt zu erreichen und daher der notwendige Aufwand nicht mehr praktikabel ist. Der Einsatz von Fragen bzw. Ζ wischen texten, die zur psychologischen Beeinflussung des Befragten dienen sollen, ist in seinem Wert häufig angezweifelt worden. Manche Autoren nehmen sogar nachteilige Wirkungen an (vgl. z.B. CRESPI 1948). Von grundsätzlicher Bedeutung ist es, ob man den Versuch, den Respondenten durch psychologische Fragen unmerkbar zu lenken, akzeptiert oder nicht. GALTUNG (1967, S. 148 f.) hat die Frage, was der Forscher im Tausch gegen die Antwortbereitschaft der Untersuchungsperson überhaupt bieten kann, eingehend behandelt und dabei aufgezeigt, daß der Versuch, den Befragten so zu manipulieren, daß man ohne Gegenleistung von ihm relevante Informationen erhält, sich u.U. negativ auf die Antworten auswirken kann. Er empfiehlt daher ein offenes Vorgehen des Forschers und das Anbieten von Gegenleistungen. Diese können primär nicht materieller Natur sein (obwohl z.B. eine ausgefallene Schulstunde oder Befragen während der Arbeitszeit bereits Kompensationen bieten), sondern müssen vor allem in Informationen bestehen. Die Anwendung iterativer Befragungstechniken ergibt besonders günstige Möglichkeiten zu einem solchen 'Informationstausch' zwischen Forscher und Untersuchungsperson (vgl. R O E D E 1968, S. 34 ff.; K R E U T Z 1971a, S. 113 ff.). Je nachdem, welcher Auffassung man sich anschließt, wird man Fragen, die zur Gesprächslenkung notwendig sind, in einer bestimmten Weise abfassen: strebt man eine offene Gesprächssituation an, so wird man dem Befragten relativ viel Spielraum lassen müssen und kann daher die Abfolge der Fragen nicht streng standardisieren. Psychologische Fragen haben daher primär den Zweck, die Situation zu klären, zusammenzufassen, neue Gedanken in die Diskussion zu bringen. Rückbezüge auf früher Gesagtes, Appelle, beim Thema der Untersuchung zu bleiben, einen neuen Gesichtspunkt ins Auge zu fassen, werden explizit gemacht und durch den Zweck der Erhebung begründet. Versucht man hingegen den Befragten unbemerkt zu lenken, so bilden solche expliziten Hinweise schwere Fehler, und die Steuerung erfolgt mit scheinbar inhaltlich gemeinten Fragen, die den Bezugsrahmen und die Antwortbereitschaft der 'Versuchsperson' beeinflussen sollen.
66
4. Band: Erhebungsmethoden:
Die
Befragung
Der Umstand, daß offene Gesprächsführung, z.B. der ungeschminkte Hinweis auf einen Widerspruch in den Aussagen, provozierend wirkt, ist dabei nicht unbedingt nachteilig, solange die Provokation nicht ein gewisses Ausmaß überschreitet. Nicht nur die Alltagserfahrung, sondern auch empirische Arbeiten zeigen nämlich, daß Provokationsfragen zu erheblichen Revisionen und Spezifizierungen von bereits gemachten Aussagen fuhren und in manchen Fällen überhaupt erst unverbindliche Aussagen u n d Gefälligkeitsantworten durchbrechen können. Bei Befragung von Tiliten', also Entscheidungsträgern und Experten, ergibt sich häufig die Gelegenheit, eine solche Technik mit Erfolg anzuwenden (vgl. z.B. SMIGEL 1958), und die Information, die der Forscher auf Grund seiner Erhebung zu geben in der Lage ist, kann gerade bei diesen Gruppen ein besonders nichtiger Anreiz für die Gewährung eines Interviews sein (-»- Bd. IV: Drewe, Identifizierung von Eliten).
2.3
Prüfung und Beurteilung von Fragebögen
Um die Konzeption des endgültigen Fragebogens zu testen, bietet sich als eine häufig erwähnte Möglichkeit die Methode des "gegabelten Fragebogens" (split ballot) an, bei der unterschiedliche Frageformulierungen, verschiedene Reihenfolgen der Fragen etc. auf ihre Brauchbarkeit hin überprüft werden. Der Konstrukteur eines Fragebogens sollte auf jeden Fall sicherstellen, daß er durch Vortests (unter Anwendung von Item-Analyse, Erstellung von Fragebogenprofilen etc.) das von ihm schließlich gewählte Vorgehen kontrolliert und die Möglichkeit zu intersubjektiver Uberprüfung einräumt. Außer diesen Vortests sollten gleichzeitig mit der Haupterhebung oder auch nachträglich Überprüfungen durchgeführt werden, die allerdings schon bei der Erhebungsplanung fixiert sein müssen, da die Möglichkeit der Anwendung eines bestimmten Verfahrens von der Form des zu testenden Erhebungsinstruments abhängig ist. Zur Beurteilung von Erhebungsinstrumenten haben sich eine Reihe von Gütekriterien, wie Objektivität, Réhabilitât und Validität und diesen entsprechende Prüfverfahren eingebürgert. Im Rahmen dieses Beitrags ist es nicht möglich, die inhaltliche Problematik und die Kontroversen in der Literatur kritisch zu referieren; angemerkt sei jedoch, daß die von der klassischen Testpsychologie übernommenen Konventionen der Situation soziologischer Feldforschung (-» Bd. II: Nowotny und Knorr, Feldforschung) nicht voll entsprechen und ihre Brauchbarkeit in zunehmendem Maße angezweifelt wird. 2.3.1
Überprüfung der Fragenabfolge und Frageformulierung
Die üblicherweise verwendeten Uberprüfungsverfahren erlauben nicht, eventuell vorhandene Verzerrungen einer der beiden Komponenten (Formulierung oder Reihenfolge) zuzuschreiben. Die Techniken der Parallelform und des split-half bzw. des split ballot lassen lediglich globale Reliabilitätsbestimmungen zu. Die Konsistenzanalyse, die häufig unter der Bezeichnung 'Item-Analyse* in der Voruntersuchung durchgeführt wird, untersucht zwar jede einzelne Frage in Beziehung zu allen anderen, gestattet aber keine getrennte Erfassung des Reihenfolgeeffektes.
2. Kapitel: Die Konstruktion von Fragebögen
67
Die auf solchen Vortests beruhende Eliminierung von Einzelfragen kann daher zur irrtümlichen Ablehnung von an sich validen und reliablen Fragen einfach auf Grund der Auswirkung der gewählten Reihenfolge fuhren. Dies bedeutet andererseits, daß die neue verkürzte Skala durch die veränderte Abfolge der Fragen u.U. stärker verzerrt sein kann als die ursprüngliche Rohskala (vgl. auch LOEVINGER 1 9 6 5 ; HIRSCHI UNDSELVIN 1 9 6 7 ) .
Versuche, durch eine Faktorenanalyse die Güte eines Tests nachzuweisen und damit die 'faktorielle Validität' zu überprüfen, sind lediglich verfeinerte Formen der Konsistenzanalyse ( V E R N O N 1 9 6 4 ) . Daher treffen auf sie auch alle bereits erläuterten Vorbehalte zu. Inwieweit die Gültigkeit der Antworten auf Fragebatterien durch Formulierungsfehler oder durch die ungünstig gewählte Reihenfolge beeinträchtigt wird, läßt sich mit den vorhandenen Techniken nicht einmal annähernd feststellen. Der derzeitige Stand der Forschungen legt daher leider nahe, wenn überhaupt dann nur global von Réhabilitât und Validität einer Skala zu sprechen und nicht weiter nach den im Instrument liegenden Ursachen der Verzerrung zu suchen. Eine solch undifferenzierte Betrachtung von Tests oder Fragebatterien führt aber zu erheblichen Schwierigkeiten bei der Unterscheidung von Gültigkeit und Zuverlässigkeit. Geht man davon aus, daß ein Test eine nicht weiter aufspaltbare Einheit darstellt und als solche die für richtig erachtete Operationalisierung ist, so wird selbst durch die geringfügigste Veränderung einer einzigen Frage oder der Reihenfolge nicht nur die Standardisierung aufgegeben, sondern man m u ß dann eigentlich von einem neuen Instrument sprechen. Wird in einer solchen Weise eine eindeutige Beziehung zwischen theoretischem Konzept und dem (einmal) entwickelten Instrument angen o m m e n , so kann eine Variation oder gar die Entwicklung einer Parallelform nicht zur Überprüfung der Zuverlässigkeit der Messung herangezogen werden. Man kann vielmehr nur von einem Vergleich zwischen zwei verschiedenen Tests sprechen, die dasselbe messen sollen. Damit lassen sich aber keine Aussagen über die Zuverlässigkeit, sondern nur solche über die Gültigkeit machen. Eine derartig strikte Auffassung schließt sprachliche Modifikationen eines Instrumentes (von vornherein) aus; damit sind — wie bereits erwähnt — eine Reihe von Überprüfungsverfahren unmöglich. Replikationen werden erheblich erschwert, da eine Anpassung der Formulierung an die Sprachgewohnheiten unterschiedlicher Befragungsgruppen und an Erfordernisse der Erhebungssituation nicht zulässig ist. Im Endeffekt fuhrt dies aber dazu, daß eine kumulative Erhöhung des Wissensstandes durch die empirische Sozialforschung, wenn überhaupt, so nur sehr langsam erreicht werden kann und methodischer Fortschritt ausgeschlossen bleibt (vgl. dazu z.B. CARNAP 1 9 5 6 ; BLALOCK 1 9 6 8 ) .
In der bisherigen Forschungspraxis hat die wiederholte Anwendung derselben (unveränderten) Instrumente immer wieder zu inkonsistenten Ergebnissen geführt. Dies hat o f t die Verwerfung des Instrumentes oder sogar des zugrundeliegenden theoretischen Konzeptes zur Folge. Eine solche Ablehnung kann aber insofern ungerechtfertigt erfolgen, als aus der nachgewiesenen Tatsache, daß das Instrument u n t e r verschiedenen Bedingungen andere Ergebnisse erbringt, zunächst nur geschlossen werden kann, daß die Anwendbarkeit möglicherweise auf spezifische Situationen beschränkt ist.
68
4. Band: Erhebungsmethoden: Die Befragung
Ein Ausweg aus diesem Dilemma bietet sich damit an, daß man mit dem zur Frage stehenden Konzept lediglich bestimmte, erfragbare Sachverhalte eindeutig verbindet und die sprachliche Formulierung der Fragen in kontrollierter Weise variiert. Von einem solchen Standpunkt aus genügen die herkömmlichen Verfahren zur Bestimmung der Gütekriterien nicht (vgl. dazu COOMBS 1964; FISCHER 1968). Konkret bedeutet dies z.B. bei split-half oder Parallelform (so man sie überhaupt akzeptiert), daß es nicht genügt, lediglich zwei Formen gegeneinander zu testen, da man auf diese Weise den Einfluß von Fragenabfolge und Formulierung nicht isoliert feststellen kann; damit ist aber eine gezielte und kontrollierte Verbesserung des Instrumentes ausgeschlossen. Es sind zumindest vier Formen notwendig, von denen sich je zwei lediglich durch Reihenfolge bzw. Wortlaut unterscheiden. Die,1 verschiedenen Verzerrungen, die sich aus der gewählten Abfolge und Formulierung der Fragen ergeben können, wurden in den Abschnitten 2.2.1 und 2.2.2 bereits eingehend dargestellt. Zusammenfassend soll aber betont werden, d a ß eine globale Feststellung der Validität und Réhabilitât wenig nützt und durch spezifische Angaben ersetzt werden sollte. Diese müßten nicht nur den relativen Einfluß von Formulierung einerseits und Abfolge andererseits für die gesamte Population aufweisen, sondern auch die Brauchbarkeit des Instruments für relevante Untergruppen getrennt angeben. Da zur Prüfung der Reihenfolge sehr wenige konkrete Empfehlungen gegeben werden, die über eine generelle Behandlung der Problematik des Positions- und Ausstrahlungseffektes hinausgehen, können in diesem Zusammenhang nur Angaben über die 'Güte' von Frageformen gemacht werden. Allgemein wird die Behauptung vertreten, geschlossene Fragen seien reliabler als offene. Eine Reihe von Autoren überträgt diese Feststellung, ausgehend von dem Argument, die Validität könne nie größer sein als die Réhabilitât, auch auf die unterschiedliche Gültigkeit dieser Frageformen. Verallgemeinert man die Unterscheidung, die LIENERT(1967, S. 13 f.) für einen Aspekt der Zuverlässigkeit, nämlich die Objektivität, vorgenommen hat, so kann man sagen, daß dies für die Durchführungszuverlässigkeit sicherlich zutrifft. Bei der Zuverlässigkeit der Auswertung dürften die Unterschiede bereits geringfügiger sein, die Réhabilitât der Interpretation der Ergebnisse von geschlossenen Fragen wird wahrscheinlich kaum besser sein als jene von offenen. Die nachträgliche Klassifizierung von offenen Fragen erlaubt eine wesentlich größere Flexibilität in der Anzahl und im Bedeutungsumfang der Kategorien als die Vorgabe von bereits formulierten Antwortmöglichkeiten. Die Anwendung neuer inhaltsanalytischer Auswertungsverfahren mit Computern gestattet es, dabei sehr genau vorzugehen und den notwendigen Aufwand doch in vertretbaren Grenzen zu halten (-> Bd. III: Mochman, Automatisierte Textanalyse). Da man umso gültigere Ergebnisse erwarten kann, je besser das Erhebungsinstrument dem Befragten eine klare Stellungnahme in ihm geläufigen Formulierungen ermöglicht, sollten Fragen mit wenigen Vorgaben oder gar reine Alternativfragen nur mit äußerster Vorsicht angewendet werden. BELSER(1967, S. 151 f.) weist auf eine Untersuchung von SYMONDS(1928!) hin, in der für die verschiedene Anzahl von Antwortvorgaben folgende Zuverlässigkeitskoeffizienten festgestellt wurden:
2. Kapitel: Die Konstruktion von Fragebögen
2 3 5 7
Wahlantworten Wahlantworten Wahlantworten Wahlantworten
r r r r
69
= 0.84 = 0.89 = 0.88 = 0.91
Belser spricht sich jedoch gegen eine zu große Anzahl von Antwortvorgaben aus, da es nicht nur schwierig ist, jeweils Alternativen mit gleicher Anziehungskraft zu finden, sondern auch die Auswahl aus Gründen der Übersichtlichkeit schwierig wird, womit wieder die Zufälligkeit der Antwortauswahl zunimmt. "Aus diesen Überlegungen ergibt sich, daß fünf Antworten wohl — aufs Ganze gesehen — das Optimum darstellen." — Leider lassen aber die Ergebnisse von Symonds keine Aussage über den Grad der Zuverlässigkeit von einer etwas größeren geraden Anzahl (4 oder 6) von Antwortvorgaben zu. Die Gültigkeit und Zuverlässigkeit geschlossener Fragen ist bei sehr wenigen Antwortvorgaben ebenso zweifelhaft wie bei allzu vielen. Um nun bei der Befragung nicht zu viel vorauszusetzen und doch mit geschlossenen Fragen und einer begrenzten Anzahl von Wahlmöglichkeiten operieren zu können, ist man vor allem in der psychologischen Forschung dazu übergegangen, zum gleichen Sachverhalt relativ umfangreiche Fragebatterien (nicht selten mehr als fünfzig) vorzugeben. Zwecks besserer Auswertbarkeit strebt man dabei für alle Fragen gleichlautende Antwortmöglichkeiten an. Dieses Verfahren erreicht zwar eine höhere Meßgenauigkeit, es bringt aber neue Quellen möglicher Fehler; die gleichlautenden Vorgaben können sehr leicht ermüdend wirken und zu inhaltsunabhängigen, mechanischen Antworten führen (response set-Problem), sie machen aber auch neue theoretische Annahmen nötig, will man die einzelnen Antworten zu brauchbaren Skalen aggregieren. Eine weitere Möglichkeit, die sich vor allem für die soziologische Feldforschung empfiehlt, besteht in der Verwendung mehrerer Fragen zum gleichen Sachverhalt, die aber getrennt ausgewertet und nicht zu einem einheitlichen Instrument vereinigt werden (multiple indicator approach: LAZARSFELD 1 9 5 9 ; CURTIS UND JACKSON 1 9 6 2 ; WEBB U.A. 1 9 6 6 ; SIEGEL UND HODGE 1 9 6 8 ; B L A L O C K 1 9 6 8 , 1 9 6 9 ; COSTNER 1 9 6 9 ) .
2.3.2
Berücksichtigung von Thematik und Zielsetzung
Der unbefangene Leser könnte mit den bisherigen Ausführungen insofern unzufrieden sein, als er nach der Lektüre dieses Beitrags noch immer keine eindeutigen Angaben darüber erhalten hat, wie gültig und zuverlässig die Ergebnisse bisheriger Forschungen sind und wie 'gut' welche Form des Fragebogens und welche Frageformulierung sind. Das verständliche Anliegen nach einem 'Kochbuch' zur Herstellung von Fragebögen kann aus zwei Gründen nicht erfüllt werden: Erstens ist die sozialwissenschaftliche Methodologie noch nicht so weit entwickelt, daß gesicherte Generalisierungen überhaupt gemacht werden können. Zweitens stellt der Versuch, die Gültigkeit eines Instrumentes schlechthin zu bestimmen, eine Reifikation dar. Dies insofern, als die Validität definitionsgemäß immer nur in Beziehung zu den jeweiligen Konzepten bzw. Forschungszielen bestimmt werden kann. Das bedeutet aber nicht, daß sich der Grad der Gültigkeit erst im nachhinein aus der Interpretation der Resultate ergibt (vgl. dazu die Kritik von HARTMANN ( 1970) an
70
4. Band: Erhebungsmethoden: Die Befragung
Scheuch). Wenn man davon ausgeht, Jaß sich die Validität eines Instrumentes danach bestimmt, ob man tatsächlich das ι η Λ , was zu messen beabsichtigt, so ist es eine triviale Folgerung, daß die Konzepte bzw. Zielsetzungen und ihre Operationalisierung ex ante festgelegt werden müssen und nachträgliche Korrekturen und 'Uminterpretationen' nicht zulässig sind. In der Literatur findet sich eine Reihe von Versuchen, Gesichtspunkte herauszuarbeiten, nach denen die Güte von Erhebungstechniken und Untersuchungsergebnissen bestimmt werden soll. Die am häufigsten genannten sind: 1. 2. 3. 4. 5.
nach nach nach nach nach
der Art und Qualität der erfragten Dimension, dem Medium der Erhebung und dem Ausmaß der Kontrolle der Erhebungssituation, formalen Kriterien des Fragebogenaufbaus und der Frageformulierung, der Untersuchungspopulation, der Art, wie die Daten festgehalten werden.
Eine umfassende Systematisierung aller relevanten Aspekte steht noch aus; der Ansatz von SUMMERS (1969) ist in dieser Hinsicht zwar anregend, aber letztlich nicht befriedigend. Die von den Autoren dieses Beitrags vorgenommene Unterteilung ist daher lediglich als vorläufige Gliederung der für die Fragebogenkonstruktion relevanten Kriterien aufzufassen. Es soll aber noch einmal daraufhingewiesen werden, daß die herkömmliche Trennung in Fehler des Instrumentes und solche der Befragten weder theoretisch haltbar, noch von pragmatischem Nutzen ist. Ebenso kann man nicht annehmen, daß sich die Wirkungen dieser Fehlerarten einfach addieren oder sogar gegenseitig aufheben. Die Brauchbarkeit eines bestimmten Fragebogentyps kann daher z.B. nur in einer bestimmten Erhebungssituation, nur bei einer ganz speziellen Erhebungspopulation und nur hinsichtlich einer bestimmten Thematik gegeben sein. Nach der Art und Qualität der erfragten Dimension hat sich die Einteilung von KAHN UND CANNELL (1957) eingebürgert, nach der die Gültigkeit folgendermaßen abnimmt: Tatsachen-, Beurteilungs-, Einstellungs-, Meinungsfrage. Diese Auffassung beruht aber darauf, daß die Vorhersage beobachtbaren Verhaltens als Gültigkeitskriterium genommen wird, was bei SCHEUCH (1967) am deutlichsten zum Ausdruck kommt. Nun hat sich aber als Resultat der sehr intensiven methodischen Untersuchungen auf dem Gebiet der Einstellungsmessung gezeigt, daß die Verhaltenswirksamkeit von psychischen Dispositionen sehr stark von Umweltsbedingungen abhängig ist, ohne daß deshalb an der Existenz und generellen Wirksamkeit solcher Dispositionen gezweifelt werden müßte (vgl. z.B. HIMMELSTRAND 1969; T I T T L E UND H I L L 1967;ROKEACH 1967a,b; WARNER UND D E F L E U R 1969; LASTRUCCI 1970; WICKER 1971;LAUER 1971). Die Güte der Vorhersage künftigen Verhaltens ist daher ein denkbar schlechtes Instrument zur Bestimmung der Gültigkeit der Messung psychischer Dimensionen, und die Generalisierung von Kahn und Cannell erscheint daher nicht haltbar. Die plausible Annahme, in jenen Erhebungssituationen, die der Forscher weitgehend kontrolliert, würden gültigere Ergebnisse erzielt, läßt sich, wie empirische Befunde zeigen, nicht verallgemeinern. So konnten z.B. K R E U T Z UND FÜRNSCHUSS ( 1 9 7 1 ) zeigen, daß die Angaben über Verhaltensweisen in kontrollierten Erhebungssituationen stärker von gruppenspezifischen Einflüssen bestimmt werden. SUDMAN ( 1 9 6 7 , S . 5 8 ) weist nach, daß in bestimmten Situationen telephonische Interviews vollwertige Er-
2. Kapitel:
Die Konstruktion
von Fragebögen
71
gebnisse liefern. FRIEDRICH (1970, S. 38 ff.) versucht zu belegen, daß das Interview eher Antworten erbringt, die in Anpassung an die herrschenden gesellschaftlichen Vorstellungen gegeben werden, und die schriftliche Befragung daher vorzuziehen ist (vgl. auch KNUDSEN, POPE UND IRISH 1967). Die Anwesenheit dritter, nicht befragter Personen ist allerdings, wie bereits erwähnt, eine erhebliche Verzerrungsursache, sie kann aber z.B. auch bei Hausinterviews nicht durchgehend ausgeschaltet werden (TAIETZ 1962; KOOMEN UND RAVESTEIJN 1968). Die konkrete Form der Erhebungssituation kann mit den Merkmalen, die untersucht werden sollen, variieren und die Ergebnisse dadurch entscheidend beeinflussen. So hat z.B. RIESMAN ( 1958, S. 283 ff.) bei einer Untersuchung an amerikanischen Colleges nachweisen können, daß in kleinen, armen und relativ autoritär geführten Anstalten für die Erhebung meist kein eigener Raum bereitgestellt wurde, in dem ungestört hätte befragt werden können. Von entscheidender Bedeutung dürfte es sein, inwieweit dem Befragten Anonymität zugesichert wird und inwieweit diese Zusicherung dem Befragten in der Erhebungssituation glaubhaft erscheint. Wie bereits ausgeführt wurde, genügt die Zusicherung der Anonymität allein keinesfalls. Wie GETZELS (1954), der versucht hat, den Prozeß der Beantwortung eines Fragebogens konzeptuell genauer zu fassen, ausführt, sollte man davon ausgehen, daß die Verbalisierung der Reaktion auf die vorgelegten Fragen immer bereits die Auffassung miteinbezieht, die der Befragte sich über die Erhebungssituation an sich gebildet hat. Situative Elemente können daher auch als intervenierende Variable, die zwischen Stimulus (Frage) und beobachtbarer Reaktion (Antwort) treten, aufgefaßt werden. Die Vorstellung, die der Befragte über die Verwendung der Daten durch den Forscher bzw. Auftraggeber entwickelt, dürfte aber ein entscheidendes Element der subjektiv wahrgenommenen Situation darstellen. Auch wenn er sich selbst durch die zugesicherte Anonymität unmittelbar geschützt sieht, kann er doch mittelbare Auswirkungen der Publikation oder Anwendung der Ergebnisse fürchten (vgl. RIESMAN 1958, S. 282; KREUTZ 1969a, 1971a). Arbeiten darüber, wie Befragte die Erhebungssituation subjektiv auffassen, sind aber relativ selten und lassen keine sicheren Generalisierungen zu (vgl. MERTON 1947 ; SHEATSLEY 1948; HYMAN 1 9 5 4 , S. 7 2 f f . ; CANNELL UND AXELROD 1 9 5 6 , S . 1 8 1 ; S J O B E R G 1 9 5 5 ; SCHWARTZ 1 9 6 4 ;
1968; VANÌCOOLWIJK 1969). Diese Arbeiten zeigen aber immerhin, daß Optimismus hinsichtlich des Ausmaßes an Verzerrung durch die Erhebungssituation keineswegs am Platz ist, sondern daß negative Beurteilungen, geringes Interesse und mehr oder weniger großes Mißtrauen während des ganzen Interviews oder zumindest zeitweise vorwiegen (vgl. auch BORKENFELD 1965). Wie stark die Erhebungssituation die Art der Angaben beeinflußt, zeigt auch die experimentelle Arbeit von CLARK UND T I F F T (1966). Die Untersuchungspersonen wurden bei diesem Versuch veranlaßt, einen Fragebogen über delinquentes Verhalten zunächst schriftlich auszufüllen und nach einiger Zeit erneut befragt, diesmal aber mündlich. Bei den Interviews wurde zunächst um eventuelle Revisionen der schriftlich gegebenen Antworten gebeten, sofern diese ungenau seien; diese Bitte wurde wiederholt, nachdem die Anwendung eines Lügendetektors angekündigt worden -war, und noch einmal, nachdem der Polygraph tatsächlich zur Anwendung gebracht worden war. Alle Befragten nahmen irgendwelche Änderungen vor, bei manchen Fragen änderten bis zu 2/3 der Befragten ihre ursprüngliche Aussage im nachhinein ab. HARTMANN U.A.
72
4. Band: Erhebungsmethoden:
Die Befragung
Die Qualität der Interviewer spielt bei mündlichen Befragungen selbstverständlich eine zentrale Rolle. (-»• Bd. IV: Erbslöh und Wiendieck, Der Interviewer). Angemerkt sei, daß Interviewerfehler bei bestimmten Frageformen, Fragestellungen und Untersuchunaspopulationen wahrscheinlicher sind als bei anderen und daß statistische Interaktionei zwischen den Wirkungen der verschiedenen Fehlerfaktoren angenommen werden miis Dieser Umstand muß natürlich ebenso beachtet werden, wenn man über die Abhängigkeit der Güte der Daten in Abhängigkeit von der Untersuchungspopulation spricht Nicht alle Untersuchungspopulationen können mit dem gleichen Erhebungsverfahren erfaßt werden, und die Einwilligung zur Befragung ist bei manchen Bevölkerungsteilen relativ leicht, bei anderen n u r sehr schwer zu erlangen. Ebenso variieren — wie bereits erwähnt — die Geläufigkeit sprachlicher Wendungen und die Präferenz für bestimmte sprachliche Ausdrucksformen. Ein und derselbe Interviewer kann in der einen Population relativ gut Kontakt finden, in der anderen aber wenig erfolgreich sein. Ebenso ist die Bereitschaft, überhaupt über bestimmte Themen o f f e n zu sprechen, verschieden verteilt. Die verbalen Reaktionen, die der Forscher auf seine Fragen erhält und die ihm somit für die Erstellung wissenschaftlicher Daten zur Verfügung stehen, können mit sehr verschiedenen Bedeutungen verknüpft sein und sich mehr oder minder für die Vorhersage künftigen Verhaltens eignen. Je nach Beschaffenheit der Untersuchungspopulation sind daher andere Vorgehensweisen bei der Erhebung erforderlich. Aussagen der Art, daß die Angaben, die von bestimmten Gruppen gegeben werden, etwa von Erwachsenen oder von Mittelschichtangehörigen, zuverlässiger und gültiger sind als von anderen (etwa alte Leute oder Unterschichtangehörige), können daher höchstens in bezug auf eine bestimmte Erhebung gemacht werden. Generalisierungen wären beim gegenwärtigen Stand der Forschung zumindest verfrüht, wenn sie nicht überhaupt ausgeschlossen sind. Die Form der A u f n a h m e der Antworten des Befragten durch den Interviewer spielt ebenfalls eine große Rolle bei der Definition der Erhebungssituation und ist in verschiedenen Populationen unterschiedlich vorzunehmen. Der Gebrauch eines Tonbandgerätes, der vom technischen Gesichtspunkt aus gesehen optimal ist, hat aber seinerseits Rückwirkungen auf die Antworten. In manchen Fällen muß man daher u.U. auf die maximal erreichbare Genauigkeit der Aufnahme der Antworten zugunsten der Gültigkeit der Daten verzichten (vgl. BÜCHER U.A. 1956a, 1956b; BELSON 1967b). (Abschluß des Manuskripts: September 1971)
Literatur AIAS, Zur Theorie sozialwissenschaftlicher Prognosen, in: Angewandte Sozialforschung 1, 1970, S. 185 - 205. ALBERT, H., Traktat über kritische Vernunft, Tübingen 1968. ANGER, H . , B e f r a g u n g u n d E r h e b u n g , i n : C . F . GRAUMANN 1 9 6 9 , S . 5 6 7 -
619.
ATTESLANDER, P., Methoden der empirischen Sozialforschung, Berlin 1969. BALAN, J. U.A., A Computerized Approach t o the Processing and Analysis of Life Histories Obtained in Sample Surveys, in: Behavioral Science 14, 1969, S. 1 0 5 - 1 2 0 .
2. Kapitel:
Die Konstruktion
von
Fragebögen
73
BANCROFT, G. UND Ε. H. WELCH, Recent Experience with Problems of Labor Force Measurement, in: Journal of the American Statistical Association 41, 1946, S. 303 - 312. BARTON, A. H., Measuring the Values of Individuals, in: Religious Education, Juli/ August 1962, S. 62 - 9 7 . BECKER, S. L., Why an Order Effect, in: Public Opinion Quarterly 18, 1955, S. 271 - 278. BELSER, H . ,
Testentwicklung, Weinheim 1967.
BELSON, W. Α., Group Testing in Market Research, in: Journal of Advertising Research 3, 1963, S. 39 - 43. BELSON, W. Α., The Impact of Television. Methods and Findings in Program Research, London 1967a. Tape Recording: its Effect on Accuracy of Response in Survey Interviews, Nr. 38, The Reprint Series of The Survey Research Centre, The London School of Economics and Political Sciences, 1967b.
BELSON, W . Α . ,
BEM, D. J., Self-Perception: An alternative interpretation of cognitive dissonance phenomena, in: Psychological Review 74, 1967, S. 183 — 200. BEM, D. J., The epistemological status of interpersonal simulations, in: Journal of Experimental Social Psychology 14, 1968, S. 270 - 274. BIDDLE, Β . UND E . J . THOMAS
(Hrsg.), Role Theory: Concepts and Research, New
York 1966. BLALOCK, H. M., The Measurement Problem: A Gap between the Languages of Theory and Research, in: Η. M. BLALOCK UND A. BLALOCK (Hrsg.), Methodology in Social Research, New York 1968, S. 5 - 27. Multiple Indicators and the Causal Approach to Measurement Error, in: American Journal of Sociology 75, 1969, S. 264 — 272.
BLALOCK, H . M . ,
M., Operationalizing a Conceptual Scheme: The Universalism - Particularism Pattern Variable, in: American Sociological Review 27, 1962, S. 159 - 169.
BLAU, P .
BLAUNER, R . ,
Alienation and Freedom, Chicago/London
C. M . , R . J . HILL San Francisco 1967.
BONJEAN,
UND
S.
D . MCLEMORE,
1964.
Sociological Measurement,
Der Kommunikationsprozeß beim demoskopischen Interview in der Marktforschung und seine Beeinflussung durch situative Faktoren, Berlin 1965.
BORKENFELD, H . ,
BRAUN, S . UND J . FUHRMANN,
Angestelltenmentalität, Neuwied
1970.
R., Ch. E . FRITZ, E . L . QUARANTELLI, Tape Recorded Research: Some Field and Data Processing Problems, in: Public Opinion Quarterly 20, 1956a, S. 427 — 439.
BÜCHER,
BÜCHER, R. U.A., Tape Recorded Interviews in Social Research, in: American Sociological Review 21, 1956b, S. 359 - 364. Convergent and discriminant validation by the multitrait — multimethod matrix, in: Psychological Bulletin 56, 1959, S. 229 - 321.
CAMPBELL, D . T . UND D . W . FISKE,
74
4. Band: Erhebungsmethoden:
Die
Befragung
Ο. T. UND P. J. MÖHR, The Effect of Ordinal Position upon Response to Items in a Check List, in: Journal of Applied Psychology 34, 1950, S. 62 — 67.
CAMPBELL,
The Respondent Reports on the Interview, in: American Journal of Sociology 62, 1956, S. 177 - 181.
CANNELL, C . F . UND M AXELROD,
R. F . KAHN, Interviewing, in: G . LINDZEY UND E . ARONSON (Hrsg.), The Handbook of Social Psychology, Bd. 2, Reading, Mass. 2. Auflage, 1968, S. 526 - 595.
CANNELL, C . F . UND
CANTRIL, H . ,
Gauging Public Opinion, Princeton
1947.
CAPLOW, T., The Dynamics of Information Interviewing, in: American Journal of Sociology 62, 1956, S. 165 - 171. R„ The Methodological Character of Theoretical Concepts, in: H. FEIGL UND M. SCRIVEN (Hrsg.), The Foundation of Science and the Concepts of Psychology and Tsychoanalysis, Minneapolis 1956, S. 38 — 76.
CARNAP,
CARO, F. G., Approaches to Evaluative Research: A Review, in: Human Organization 28, 1969, S. 87 - 9 9 . CATTELL, R. B. UND F. W. WARBURTON, Objective Personality and Motivation Tests, Urbana 1967. CHAMPION, D. J. UND A. M. SEAR, Questionnaire Response Rate: A Methodological Analysis, in: Social Forces 47, 1969, S. 335 - 339. CHAPOULŒ, J. M., Kausale Erklärungen der Beziehung zwischen Variablen mittels statistischer Analyse, in: Angewandte Sozialforschung 2, 1971, S. 186 — 212. CICOUREL, Α. V., Methoden und Messung in der Soziologie, Frankfurt 1970. CLARK, J. P. UND L. L.TIFFT, Polygraph and Interview Validation of Self-Reported Deviant Behavior, in: American Sociological Review 31, 1966, S. 516 — 523. CLINARD, M. B., Anomie and Deviant Behavior: A Discussion and Critique, New York/London 1964. COLEMAN, J. S., Introduction to Mathematical Sociology, London 1964a. COLEMAN, J. S., Modes of Change and Response Uncertainty, Englewood Cliffs 1964b. COOMBS, C .
H., A Theory of Data, New York 1964.
COSTNER, H. L., Theory, Deduction, and Rules of Correspondence, in: American Journal of Sociology 75, 1969, S. 245 - 263. CRESPI, L. P., The Interview Effect in Polling, in: Public Opinion Quarterly 12, 1948, S. 9 9 - 1 1 1 . L. J., N. RAJARATNAM UND G . C . GLESER, Theory of generalizability: A liberalization of reliability theory, in: British Journal of Statistical Psychology 16, 1963, S. 137 - 163.
CRONBACH,
CURTIS, R. F. UND E. F. JACKSON, Multiple Indicators in Survey Research, in: American Journal of Sociology 68, 1962, S. 195 - 204. DAHRENDORF, R., Homo Sociologicus, Köln/Opladen 1959. DAMARIN, F., A Latent-Structure Model for Answering Personal Questions, in: Psychological Bulletin 73, 1970, S. 23 - 4 0 .
2. Kapitel: Die Konstruktion von Fragebögen
75
Alienation: Its Meaning and Measurement, in: American Sociological Review 26, 1961, S. 7 5 3 - 758.
DEAN, D . ,
C. UND L . R . JERNIGAN, The Biased Questionnaire as an Instrument of Opinion Change, in: Journal of Personality and Social Psychology 15, 1970, S. 1 4 4 - 150.
DILLEHAY, R .
DUDEN, Vergleichendes Synonymwörterbuch, Der Große Duden, Bd. 8, bearbeitet von P. GREBE, M a n n h e i m 1 9 6 4 .
DUDEN, Wörterbuch sprachlicher Zweifelsfälle, Der Große Duden, Bd. 9, bearbeitet von G. DROSDOWSKI U.A., Mannheim 1965. EDWARDS, A. L., Techniques of Attitude Scale Construction, New York 1957. EDWARDS,
A. L . , Social desirability and personality test construction, in: Β . M . BASS (Hrsg.), Objective Approaches to Personality, New York 1 9 5 9 ,
UND I . Α . BERG
S. 1 0 1 -
116.
H. UND J. W. RINEHART, A Brief Report on the Methodology of Stereotype Research, in: Social Forces 43, 1965, S. 564 - 575.
EHRLICH,
On Checklists and Open-Ended Questions, in: Social Forces 44, 1966, S. 4 2 0 - 421.
EHRLICH, H . UND J . W . RINEHART,
O. SAVELLS, Factors Associated With Attitudinal Shifts During the Course of the Interview, in: Proceedings of the South-Western Sociological Association 19, 1969, S. 1 1 3 - 1 1 7 .
ENOCH, J . R U N D J .
FESTINGER, L., A Theory of Cognitive Dissonance, Evanston 1957. FISCHER, G. H., Neue Entwicklungen in der psychologischen Testtheorie, in: G. H. FISCHER 1 9 6 8 , S . 15 -
158.
FISCHER, G. H. (Hrsg.), Psychologische Testtheorie, Bern/Stuttgart 1968. FISHBURN, P. C., The Irrationality of Transitivity in Social Choice, in: Behavioral Science 15, 1970, S. 1 1 9 - 123. FISHMAN, J. A. (Hrsg.), Readings in the Sociology of Language, Den Haag 1968. FLAMENT, C., Modèle à caractéristiques non-monotones dans l'étude d'un questionnaire, in: Revue française de Sociologie 4, 1963, S. 172 — 194. FLETCHER, C., On Replication, in: Sociology 4, 1970, S. 51 - 69. FREEDMAN, J. L., Role Playing: Psychology by Consensus, in: Journal of Personality and Social Psychology 13, 1969, S. 107 - 114. FRIEDRICH, W. (Hrsg.), Methoden der marxistisch-leninistischen Sozialforschung, Berlin 1970. L. UND S. GLUCKSBERG, On the Description of Subcultural Lexicons, in: Journal of Personality and Social Psychology 14, 1970, S. 55 — 65.
FRIENDLY, M .
B. UND S. SuDMAN, The Use of Computers in Coding Free Response, in: Public Opinion Quarterly 32, 1968, S. 216 - 232.
FRISBIE,
The Quintamensional Plan of Question Design, in: Public Opinion Quarterly 12, 1947, S. 385 ff.
GALLUP, G . ,
GALTUNG, J . ,
Theory and Method of Social Research, Oslo 1 9 6 7 .
76
4. Band: Erhebungsmethoden: Die Befragung
GEIGER, T . ,
Demokratie ohne Dogma, München 1 9 5 0 .
GETZELS, W., The Question-Answer Process: A Conceptualization and Some Derived Hypotheses for Empirical Examination, in: Public Opinion Quarterly 18, 1954, S. 8 0 - 9 1 . GJGLIOLI, P. P., Direzioni di Ricerca in Sociolinguistica, in: Rassegna Italiana di Sociologia 9, 1968, S. 329 - 381. Impression formation and word combination in sentences, in: Journal of Personality and Social Psychology 10, 1968, S. 341 - 353.
GOLLOB, H . F . ,
GOODE, W . J . UND P . K . HATT, KÖNIG 1 9 5 2 , S . 1 1 5 GÖRDEN, R . L . ,
Beispiel fur den A u f b a u eines Fragebogens, in: R .
125.
Interviewing, Strategy, Techniques and Tactics, Homewood 1 9 6 9 .
(Hrsg.), Sozialpsychologie, 1. Halbband: Theorie und Methoden, Handbuch der Psychologie, Bd. 7, Göttingen 1969.
GRAUMANN, C . F .
GREENBERG, M. S., Role playing: An alternative t o deception? , in: Journal of Personality and Social Psychology 7, 1967, S. 152 - 157. GROSS, Ν . , W . S . MASON UND
A. W . MCEACHERN, Explorations in Role Analysis, New
York 1958. HAEBERLIN, U., Sozialbedingte Wortschatzstrukturen von Abiturienten, Konstanz 1970, mimeo. HAEDRICH, G., Der Interviewer-Einfluß in der Marktforschung, Wiesbaden 1964. Public Reaction to Public Opinion Surveying, in: Public Opinion Quarterly 32, 1968, S. 295 - 298.
HARTMANN, E . L . , H . L . ISAACSON UND C . Μ . JURGELL,
HARTMANN, H . ,
Empirische Sozialforschung, München 1970.
HAUCK, M . UND S . STEINKAMP,
Survey Reliability and Interviewer Competence,
Urbana 1964. Item Order and Guttman Scales, in: American Journal of Sociology 7 0 , 1964, S. 51 - 5 8 .
HAYES, Ο . P . ,
D. P., L. MELTZER UND G. WOLF, Substantive conclusions are dependent upon techniques of measurement, in: Behavioral Science 15, 1970, S. 265 - 2 7 3 .
HAYES,
HEIDER, F., The Psychology of Interpersonal Relations, New York/London 1958. HEIDER, F., On social cognition, in: American Psychologist 22, 1967, S. 25 - 3 1 . R., Separating Reliability and Stability in Test-Retest Correlation, in: American Sociological Review 34, 1969, S. 93 - 101.
HEISE, D .
HEMPEL, C. G., Fundamentals of Concept Formation in Empirical Science, Chicago 1952. Einige Fragen des Aufbaus von Interviewfragebogen und der Interviewerausbildung, in: W . FRIEDRICH 1 9 7 0 , S . 7 4 - 9 0 .
HENNIG, W . ,
Sprachpsychologische Beiträge zur Sozialpsychologie, in: C. F. GRAUMANN 1969, S. 398 - 475.
HERRMANN, TH. UND K . H . STÄCKER,
2. Kapitel: Die Konstruktion von Fragebögen
77
Befragungsexperimente in der deutschen Leseranalyse für Publikumszeitschriften und daraus resultierende methodische Änderungen, in: metra 5, 1966a, S. 73 - 7 8 .
HESS, E . M . ,
HESS, E. M., Neuere Entwicklungen in der Leserschaftsforschung: Die Erfassung der Kumulation der Leserschaften, in: metra 5, 1966b, S. 619 — 630. Some Properties of Ipsative, Normative, and Forced-Choice Normative Measures, in: Psychological Bulletin 74, 1970, S. 167 - 184.
HICKS, L . E . ,
H I L G A R D . E . R . UND HILL,
G. Η.
BOWER,
Theorien des Lernens, Stuttgart 1971.
R. UND D. A. HANSEN, The Identification of Conceptual Frameworks Utilized in Family Study, in: Marriage and Family Living 22, 1960, S. 299 - 311. S., The Stability of Attitude Item Scale Values, in: The Journal of Social Psychology 77, 1969, S. 107 - 111.
HIMMELFARB,
U., Verbal Attitudes and Behavior: A Paradigm for the Study of Message Transmission and Franformation, in: Public Opinion Quarterly 34, 1969, S. 224 - 250.
HIMMELSTRAND,
HIRSCHI, T . UND Η . C . SELVIN,
Delinquency Research, New York
1967.
HOLM, K., Zuverlässigkeit von Skalen und Indizes, in: Kölner Zeitschrift für Soziologie und Sozialpsychologie 22, 1970a, S. 356 — 385. K., Gültigkeit von Skalen und Indizes, in: Kölner Zeitschrift für Soziologie und Sozialpsychologie 22, 1970b, S. 693 - 714.
HOLM,
C. I . , Reconciling Conflicting Results Derived from Experimental and Survey Studies of Attitude Change, in: The American Psychologist 14, 1959, S. 8 - 17.
HOVLAND,
HYMAN, H. H., Interviewing in social research, Chicago 1954. C. WRIGHT Berkeley 1962.
HYMAN, H . H . ,
H.
UND
T.
HOPKINS,
Applications of Methods of Evaluation,
C. WRIGHT, Evaluating Social Action Programs, in: P. LAZARSFELD, H. WILENSKY (Hrsg.), Uses of Sociology, New York 1967, S. 741 - 788.
HYMAN,
H . UND
W . SEWELL UND
INSTITUT FÜR DEMOSKOPIE ALLENSBACH
(Hrsg.), Wählermeinung - nicht geheim,
Allensbach 1969. G., W . A RÜSSEL UND G. J . SUCI, A Table of Distances for the Semantic Atlas, in: American Journal of Psychology 72, 1959, S. 623 — 625.
JENKINS, J .
KAHN,
R. L.
UND C . F . CANNELL,
The Dynamics of Interviewing, New York
1957.
Versuch über den Statementkatalog als Instrument der Umfrageforschung, European Coordination Centre for Research and Documentation in Social Sciences, Wien 1969, mimeo.
KELLERMANN, P . ,
KELMAN, KINSEY,
H. C., Deception in social research, in: Transaction 3, 1966, S. 20 — 24.
A. C., Das sexuelle Verhalten des Mannes, Frankfurt 1964.
D. D., H . POPE UND D. P . IRISH, Response Differences to Questions on Sexual Standards: An Interview-Questionnaire Comparison, in: Public Opinion Quarterly 31, 1967, S. 290 - 297.
KNUDSEN,
78
4. Band: Erhebungsmethoden: Die Befragung
κ . (Hrsg.), Praktische Sozialforschung 1, Das Interview, Köln/Berlin 1952, 8. Auflage 1972.
KÖNIG,
(Hrsg.), Handbuch der Empirischen Sozialforschung, Bd. 2. Auflage 1967.
KÖNIG, R .
I,
Stuttgart
Fragebogenprofile, in: Kölner Zeitschrift für Soziologie und Sozialpsychologie 20, 1968, S. 780 - 791.
KOOLWIJK, J . VAN,
Unangenehme Fragen, in: Kölner Zeitschrift für Soziologie und Sozialpsychologie 21, 1969, S. 864 - 875.
KOOLWIJK, J . VAN,
De Aanwezigheid van een ander Tijdens Interviews, in: Mens en Maatschappij 43, 1968, S. 533 - 536.
KOOMEN, W . UND L . VAN RAVESTEIJN,
Constructing Questionnaires and Interview Schedules, in: M . S. W. COOK (Hrsg.), Research Methods in Social Relations, New York 1951, Teü II, S. 423 - 462, dtsch. Neuwied 1972.
KORNHAUSER, Α . ,
JAHODA, M . DEUTSCH UND
Spargewohnheiten, Jugend in Wirtschaft und Gesellschaft, Bd. Wien 1963, mimeo.
KREUTZ, H . ,
III,
Teil
2,
Der prognostische Wert von subjektiven Erwartungen, Zielen und Plänen, in: Angewandte Sozialforschung 1, 1969a, S. 206 — 227.
KREUTZ, H . ,
H., Some Considerations on the Empirical Significance of the Value Concept, Wien 1969b, mimeo.
KREUTZ,
KREUTZ, H . ,
Soziologie der empirischen Sozialforschung, Stuttgart 1971a.
KREUTZ, H . ,
Jugend und Zukunft, Wien
KREUTZ, H . UND G . FÜRNSCHUSS,
1 9 7 LB.
Chancen der Weiterbildung, Wien
1971.
S., The Assignment of Numbers to Rank Order Categories, in: American Sociological Review 35, 1970, S. 515 - 524.
LABOVITZ,
W. S., Types of Integration and their Measurement, in: American Journal of Sociology 56, 195 1, S. 332 - 340.
LANDECKER,
J. B . , G . P. GINSBURG Urbana 1961.
LANSING,
UND
Κ.
BRAATEN,
An Investigation of Response Error,
C. L . , Looking forward: the case for hard-nosed methodology, in: American Sociologist 5, 1970, S. 273 - 275.
LASTRUCCI,
R. H . , The Problems and Values of Attitude Research, in: The Sociological Quarterly 12, 1971, S. 247 - 251.
LAUER,
P. F . UND A . H. BARTON, Some General Principles of Questionnaire Classification, in: P. F . LAZARSFELD UND M. ROSENBERG (Hrsg.), The Language of Social Research, New York/London 1955, S. 83 - 93.
LAZARSFELD,
P. F . , Problems in Methodology, in: R . K . MERTON UA. (Hrsg.), Sociology Today, Bd. 1, New York/Evanston 1959, S. 39 - 80 .
LAZARSFELD,
F., Measurement, in: T. York 1968, S. 93 - 106.
LAZARSFELD, P .
PARSONS
(Hrsg.), American Sociology, New
LIENERT,
G. Α., Testaufbau und Testanalyse, Weinheim/Berlin 2. Auflage 1967.
LINDZEY,
G., Projective Techniques and Cross-Cultural Research, New York 1961.
2. Kapitel:
Die Konstruktion
von
79
Fragebögen
E., A Classification of Biased Questions, in: American Journal of Sociology 62, 1956, S. 182 - 186.
LITWAK,
J., Person and perception as psychometric concepts, in: Psychological Bulletin 72, 1965, S. 143 - 155.
LOEVINGER,
S. V . O . PRICHARD UND W . E . ARNOLD, Attitude Intensity and the Neutral Point on Semantic Differential Scales, in: Public Opinion Quarterly 31, 1967, S. 640 - 645.
MCCROSKEY, J . C . ,
Social Class and Family Life, London 1 9 6 4 . Gegenstand und Methode des Gruppendiskussionsverfahrens, Frankfurt 1960.
MCKINLEY, D . G . , MANGOLD, W . ,
MANGOLD,
W., Gruppendiskussion, in: R.
KÖNIG
1967, S. 209 - 225 und 719 - 723.
L. S., A Note on Treating Ordinal Data as Interval Data, in: American Sociological Review 36, 1971, S. 519 - 520.
MAYER,
K. HOLM UND K . HÜBNER, Einführung in die Methoden der empirischen Soziologie, Köln/Opladen 1969.
MAYNTZ, R . ,
MEIER,
H., Deutsche Sprachstatistik, Hildesheim
1964.
R. K . , Problems of Field Work in the Planned Community, in: American Sociological Review 12, 1947, S. 304 - 312.
MERTON,
D. C., Handbook of Research Design and Social Measurement, New York 2. Auflage 1970.
MILLER,
G., Zur Genauigkeit standardisierter Verbraucherbefragungen, Wiesbaden 1966.
MÖBIUS,
MOSER, NAGL,
C. Α . , Survey Methods in Social Investigation, London
1958.
W., Die Definition des 'random sample', in: Angewandte Sozialforschung
1 9 7 1 , S.
2,
224-241.
E., Umfragen in der Massengesellschaft, Reinbek 1963. OEVERMANN, U., Schichtenspezifische Formen des Sprachverhaltens und ihr Einfluß auf die kognitiven Prozesse, in: H. ROTH (Hrsg.), Begabung und Lernen, Stuttgart 1968, S. 297 - 350. NOELLE,
A Comparative Study of Two Scaling Models: Paired Comparisons and Scalogram Analysis, in: Sociometry 33, 1970, S. 401 — 426.
OFSKE, R . UND L . OFSKE,
OPP, K. D., Methodologie der Sozialwissenschaften, Reinbeck 1970. OPPENHEIM,
Α. Ν., Questionnaire Design and Attitude Measurement, London 1966.
C. E. UND G. J. Suoi, Factor analysis of meaning, in: Journal of Experimental Psychology 1950, S. 325 - 338.
OSGOOD,
C. E., G. J . Suci UND P . Urbana, 111. 1957.
OSGOOD,
H . TANNENBAUM,
The measurement of meaning,
P., Measurement of the Pattern Variables, in: Sociometry 30, 1967, S. 187 213.
PARK,
M., Alternative Questionnaire Approaches to the Measurement of Influence in Organisations, in: American Journal of Sociology 69, 1963, S. 41 — 52.
PATCHEN,
80
4. Band: Erhebungsmethoden: Die Befragung
PAYNE,
S. L., The Art of Asking Questions, Princeton 1951. S., Social Research: Strategy und Tactics, New York
PHILLIPS, B .
1966,
dtsch. Wien
1970.
J. A. U.A., An Observer's Reproduction of Dissonance Effects, in: Journal of Personality and Social Psychology 13, 1969, S. 98 - 106.
PILIARIN,
PROSS, H . UND Κ . W . BOETTICHER, QUINE,
Manager des Kapitalismus, Frankfurt
1971.
W., From a Logical Point of View, Cambridge, Mass. 1953. Neuere Ansätze zur Theorie der Réhabilitât, in:
RAATZ, U . ,
S. 1 5 9 -
G . H . FISCHER
1968,
176.
G. C . GLESER, Generalizability of stratified parallel tests, in: Psychometrika 30, 1965, S. 39 — 56.
RAJARATNAM, Ν . , L . J . CRONBACH UND
RICHARDSON, S . Α . , Β . S . DOHRENWEND UND D . KLEIN,
Interviewing. Its Forms and
Functions, New York 1965. RICHTER,
H. J., Die Strategie schriftlicher Massenbefragungen, Bad Harzburg 1970.
Κ. F . , Age and cultural differences as determinants of word associations: Suggestions for their analysis, in: Psychological Reports 16, 1965, S. 75 - 78.
RIEGEL,
Some Observations on the Interviewing in the Teacher Apprehension Study, in: P . F . LAZARSFELD UND W. THIELENS, JR., The Academic Mind, Glencoe 1958, S. 266 - 370.
RIESMAN, D . ,
J. P., J. G. Arbor 1968.
ROBINSON,
ROEDE, H . ,
RUSK UND
Κ. B. HEAD, Measures of Political Attitudes, Ann
Befrager und Befragte, Berlin
1968.
M., A csopoytos vita es a szakertöi velemeny szerepe a velemeny alakulasaban, in: MTA, Pszichologiai Tanulmanyak 11, Budapest 1968.
ROHASZKY,
Authoritarianism scales and response bias, in: Psychological Bulletin 67, 1967a, S. 349 - 355.
ROKEACH, M . ,
Attitude change and behavioral change, in: Public Opinion Quarterly 30, 1967b, S. 529 - 550.
ROKEACH, M . ,
ROSENMAYR,
L. U.A., Die junge Frau und ihre berufliche Zukunft, Wien 1969 mimeo.
D. UND
RUGG,
S. 8 6 -
H . CANTRIL,
Die Formulierung von Fragen, in:
R . KÖNIG
1952
115.
Attitude Measurement, in: G . LINDZEY UND E . ARONSON (Hrsg.), The Handbook of Social Psychology, Bd. 2, Reading 2. Auflage 1968, S. 204 - 273.
SCOTT, W . Α . ,
M., Alienation and Social Learning in a Reformatory, in: American Journal of Sociology 69, 1963, S. 270 - 284.
SEEMAN,
SEEMAN, M . ,
M. E. 1967.
SHAW,
Poweriessness and Knowledge, in: Sociometry UND
3 0 , 1967, S. 105 -
123.
J. M. WRIGHT, Scales for the measurement of attitudes, New York
P. B., The Public Relations of the Polls, in: International Journal of Opinion and Attitude Research 2, 1948, S. 453 - 468.
SHEATSLEY,
2. Kapitel:
Die Konstruktion
von Fragebögen
81
R. W . HODGE, A Causal Approach to the Study of Measurement Error, in: H. M. BLALOCK, J R . UND A. B . BLALOCK (Hrsg.), Methodology in Social Research, New York 1968, S. 28 - 59.
SIEGEL, P . M . UND
Beiträge zur Explikation und Kritik der klassischen Testtheorie, in:
SIXTL, F . ,
FISCHER 1 9 6 8 , S . SIXTL, F . UND W. KÖRTE,
G . H.
191-212.
Der lerntheoretische Ansatz in der Sozialpsychologie, in:
C . F . GRAUMANN U.A. 1 9 6 9 , S . 1 0 8 -
204.
G., A Questionnaire on Questionnaires, in: Public Opinion Quarterly 18, 1955, S. 423 - 4 2 7 .
SJOBERG,
B. F . , Verbal Behavior, New York
SKINNER,
1957.
E. O., Interviewing a Legal Elite, in: American Journal of Sociology 64, 1958, S. 159 - 164.
SMIGEL,
SUCHMAN,
Ε. Α., Evaluative Research, New York 1967. Reducing the Cost of Surveys, Chicago 1967.
SUDMAN, S . ,
SÜLLWOLD, F . ,
1969,
S.
Theorie und Methodik der Einstellungsmessung, in: 475 - 514.
C . F . GRAUMANN
G. F., Toward a Paradigm for Respondent Bias in Survey Research, in: Sociological Quarterly 10, 1969, S. 113 - 121.
SUMMERS,
Factors Influencing Test Reliability, in: Journal of Educational Psychology 1928.
SYMONDS, P . M . ,
SCHARMANN, T . UND E . ROTH,
Lebensplanung und Lebensgestaltung junger Arbeiter,
Bern/Stuttgart 1967. E. K . , Das Interview in der Sozialforschung, in: R. 197 und 707 - 716.
SCHEUCH,
SCHOEFIELD,
KÖNIG
1967,
S.
136 -
M., The Sexual Behavior of Young People, London 1965.
K. F., Zeichen der Unfreiheit. Zur Theorie und Messung sozialer Sanktionen, Freiburg 1968.
SCHUMANN,
Α., Interviewing and the Public, in: Public Opinion Quarterly 28, 1964, 135 - 142.
SCHWARTZ, S.
B. W., A Case Against Direct Questions on Reading Habits, in: Journal of Advertising Research 6, 1966, S. 25 — 30.
SCHYBERGER,
Μ. Α., Family Measurement Techniques: Abstracts of Published Instruments, 1935 - 1965, Minneapolis 1969. STROSCHEIN, F . R., Die Befragungstaktik in der Marktforschung, Wiesbaden 1 9 6 5 .
STRAUSS,
TAIETZ, P., Conflicting Group Norms and the Third' Person in the Interview, in: American Journal of Sociology 68, 1962, S. 97 - 104. TITTLE, C. R. UND R. J . HILL, The Accuracy of Self-Reported Data and Prediction of Political Activity, in: Public Opinion Quarterly 31, 1967, S. 103 - 106. TURNER,
R., The Social Context of Ambition, San Francisco 1964.
82
4. Band: Erhebungsmethoden: Die Befragung
VERNON, P. E., Personality Assessment; A Critical Survey, London 1964. Attitude as an interactional concept: social constraint and social distance as intervening variables between attitude and action, in: American Sociological Review 34, 1969, S. 153 - 169.
WARNER, L . G . UND M . DEFLEUR,
WEBB, E . U.A.,
Unobtrusive Measures, Chicago
1966.
M., Zur Methodik sozialpsychologischer Enqueten und ihrer Bearbeitung, in: Archiv für Sozialwissenschaft und Sozialpolitik 29, 1909, S. 949 - 958.
\VFEBER,
WICKER, A. W., An Examination of the O t h e r Variables' Explanation of AttitudeBehavior Inconsistency, in: Journal of Abnormal and Social Psychology 19, 1971, S. 18 - 30. WILSON, T . ,
Critique of Ordinal Values, in: Social Forces
49, 1971,
S.
432 -
444.
WIRTS, C. E. UND R. L. LINN, Cautions in Applying Various Procedures for Determining the Reliability and Validity of Multiple-Items Scores, in: American Sociological Review 35, 1970, S. 757 - 759.
3.
Der Interviewer von Eberhard Erbslöh und Gerd Wiendieck
3.1.
Das Interview als dyadische soziale Beziehung
Eine Untersuchungsmethode ist so gut, wie das schwächste Glied in der Kette der eingesetzten Instrumente. Zweifellos wird bei der empirischen Umfrageforschung an entscheidender Stelle im Prozeß der Datenerhebung ein Instrument ungewisser Neutralität und Zuverlässigkeit eingesetzt: Der Interviewer (SCHEUCH 1967). Die Ursache dieser Unzuverlässigkeit liegt letztlich in der banalen Tatsache, daß es sich bei dem "Instrument" Interviewer um ein menschliches Wesen handelt, das während des Interviews mit dem Respondenten eine soziale Zweiergruppe bildet. Auch wenn diese Dyade wegen ihrer Künstlichkeit, Asymmetrie und zeitlichen Begrenzung eine gewisse Sonderstellung einnimmt, sollten bei der Analyse der Interview(er)situation einzelne Ergebnisse der Kleingruppenforschung beachtet werden. So konnte O ' D E L L (1968) nachweisen, daß sich die Dyade von größeren Gruppen vor allem durch höhere interpersonelle Spannung und geringeres Maß an Feindseligkeit unterscheidet. Dies deutet auf eine höhere gegenseitige Abhängigkeit hin, die sich mitunter in einer hohen Korrelation von bei Interviewer und Respondent simultan abgeleiteten physiologischen Meßgrößen manifestiert (DIMASCIO U.A. 1957). CANNELL U A . (1968a) ließen in einer neueren Studie zum Interview zusätzlich zu den Antworten des Befragten die Entwicklung des verbalen und nicht-verbalen Verhaltens beider Beteiligten anhand eines eigens konstruierten Interaktionsschemas fortlaufend aufzeichnen. Es zeigte sich u.a., daß spannungsreduzierendes Verhalten (FLÜGEL 1954), wie z.B. Lachen oder humorvolle Bemerkungen (vor allem beim Befragten), unerwartet häufig auftraten, was auf ein gewisses Maß an Stress für den Befragten schließen läßt. Dies ist durchaus olausibei, wenn man die Seltenheit und Künstlichkeit der Situation, die Unkenntnis der eigenen Rolle (SCHEUCH 1967) und der speziellen Aufgabe (CANNELL U.A. 1968 a) sowie die daraus resultierende Verhaltensunsicherheit des Befragten in Betracht zieht. Dieser Befund läßt sich aber auch im Sinne der "social facilitation" -Hypothese von ZAJONC (1965; 1966) diskutieren, wonach bloße Anwesenheit von Personen (mere presence) Erregung (arousal) im Individuum erzeugt, was entsprechend der "drive level"-Theorien von HULL (1951) und SPENCE (1956) die Abgabe dominanter Reaktionen begünstigen soll (LÜCK 1969; CANNELL U.A. 1968a). Danach müßten relativ einfache, häufig geäußerte — fast läßt sich sagen — stereotype Antworten zu Lasten der komplexeren und selteneren allein durch die physische Anwesenheit des Interviewers häufiger abgegeben werden, so daß diese Meinungen in den reinen Befragungsergebnissen unvermeidbar überrepräsentiert wären. Dieser Hinweis macht deutlich, daß Befragungsergebnisse das Produkt von Befragten- und Interviewerverhalten sind, daß
84
4. Band: Erhebungsmethoden: Die Befragung
aber das Interviewerverhalten nicht lediglich in der Abgabe geplanter und erwünschter Stimuli — nämlich dem Verlesen der Fragen —, sondern auch in der Produktion unerwünschter, die Untersuchungsergebnisse verzerrender Reize gesehen werden m u ß (MAYNTZ U.A. 1 9 6 9 , S. 1 1 8 ) . Verzerrungen dieser Art sind nicht auszumerzen, da sie unabdingbar mit dem Forschungsinstrument Interview(er) verbunden sind. Hier k o m m t es darauf an, diese Einflüsse zu identifizieren, um sie bei der Interpretation der Daten entsprechend berücksichtigen zu können (MAYNTZ U.A. 1969, S. 119). Von diesen unvermeidbaren Quellen unerwünschter Beeinflussung sind diejenigen abzuheben, die sich bei Kenntnis der Zusammenhänge durch entsprechende Auswahl und Schulung der Interviewer sowie adäquate Einsatz strategie umgehen lassen. Hier sind als Einflußgrößen vor allem einzelne sozialgraphische Merkmale zu nennen, wie z.B. Geschlecht, Hautfarbe, Altersgruppe usw., die den Interviewer für den Befragten leicht erkennbar als Angehörigen einer bestimmten Gruppe ausweisen.
Neben diesen groben, leicht faßbaren Kategorien, wirken andere subtilere, meist schwer meßbare Variable auf Befragten und Interviewer ein. So konnte RICE bereits 1929 nachweisen, daß Interviewer mit unterschiedlicher Einstellung zum Untersuchungsgegenstand bei vergleichbaren Befragtengruppen auch unterschiedliche Antworten erhielten. Neben den Einstellungen sind die Erwartungen der Interviewer interessant, denn auch hier lassen sich Einflüsse auf den Befragten nachweisen (vgl. HYMAN 1954). Freilich darf bei diesen Untersuchungen, die im Prinzip auf eine Korrelation von Interviewermerkmalen mit den Befragungsergebnissen hinauslaufen, nicht übersehen werden, daß auch der Befragte eine wesentliche Variable in diesem System darstellt. A N G E R (1969) betont daher, daß die Person des jeweiligen Fragestellers in ihrem Verhältnis zum jeweiligen Befragten eine bedeutsame Variable ist (-»• Bd. IV: Esser, Der Befragte 4.2 und 4.4). Entsprechend dieser Sicht wurde verschiedentlich versucht, ein Modell des Interviews aufzustellen, das die Interaktion demographischer und psychologischer Variablen zwischen Befragten und Interviewern berücksichtigt und das Intervieweigebnis als Folge dieser spezifischen Variablenkonstellation deutet (BLUM UND NAYLOR 1968, S. 1 4 8 ; C A N N E L L U N D KAHN 1968b; CANNELL U.A. 1968a). Diese, im wesentlichen rollenorientierten Modelle betonen, daß das Interviewergebnis das unmittelbare und gemeinsame Produkt von Interviewer- und Befragtenverhalten ist, daß das Verhalten beider Personen durch ihre Einstellungen, Erwartungen und Perzeptionen geprägt wird und daß diese wiederum die demographischen und psychischen Charakteristika von Befragten und Interviewer reflektieren (CANNELL UND KAHN 1968b). Auch wenn diese Überlegungen einstweilen noch hypothetischen Charakter haben, da die empirische Überprüfung wegen der Komplexität dieser Modelle noch nicht gelungen ist, deuten Einzelergebnisse auf die Richtigkeit dieses Ansatzes hin. STEMBER UND HYMAN (1949) konnten zeigen, daß der verzerrende Einfluß der Interviewererwartungen durch die Interessen der Respondenten modifiziert wurde. CANNELL U.A. (1968a) haben nachgewiesen, daß die Verhaltensmuster von Befragten und Interviewer während des Interviews nahezu parallel laufen, was wiederum auf die bereits erwähnte Abhängigkeit in der Dyade hinweist. Der Nachweis dieser verschiedenen Fehlerquellen gibt jedoch noch keinen Aufschluß darüber, wie diese Fehler während des Interviews zustande kommen. Experimentelle Ansätze (GUEST UND NUCKOLS 1950) scheinen für die Überprüfung der Bedingungen sinnvoll, u n t e r denen Fehler bei der Feldverkodung auftreten. Die experimentelle Analyse der Faktoren,
3. Kapitel: Der Interviewer
85
die eine Beeinflussung der Respondenten selbst bewirken und vor allem die Untersuchung der Kanäle, in denen solche Einflüsse übertragen werden, ist kaum ohne den Mangel erheblicher Künstlichkeit und der damit verbundenen Änderung der Interviewsituation durchfuhrbar. Ein zwar nicht idealer, aber doch erfolgversprechender Weg scheint darin zu liegen, den Interaktionsprozeß während des Feldinterviews beobachten und erfassen zu lassen. Um zu vermeiden, daß durch die zusätzliche Anwesenheit eines teilnehmenden Beobachters wiederum die Interviewsituation verzerrt würde, könnte der Interviewer selbst mit dieser Beobachtung beauftragt werden. Im einfachsten Falle würde sich diese Beobachtung auf einzelne Details, wie z.B. Lautstärke der Stimme, Mienenspiel, Sitzhaltung usw., beziehen ( R I N G 1967); aufschlußreicher wäre es, relevante Aspekte des gesamten Interaktionsprozesses anhand eines geeigneten Kategoriensystems zu erfassen, was allerdings leicht zu einer unerwünschten Überforderung des Interviewers führen könnte. Dieses Kategoriensystem müßte also trotz Einfachheit und Schnelligkeit der Anwendung die wesentlichen Interaktionen zuverlässig und gültig erfassen. CANNELL U.A. (1968a) haben ein entsprechendes Beobachtungsschema entwickelt, das vier Verhaltensbereiche erfaßt: 1. respondent 2. interviewer 3. respondent 4. interviewer
interpersonal behavior interpersonal behavior task behavior task behavior
Die Anwendung dieses Beobachtungssystems in einer Umfrage bei 412 Personen ergab unerwartete Ergebnisse: Die Beeinflussung von Antworten scheint keine unmittelbare Folge von demographischen Merkmalen, Persönlichkeitsfaktoren, Einstellungen, Erwartungen und Perzeptionen, sondern vielmehr durch die spezifische Verhaltensaktivität beider Interviewpartner bestimmt zu sein, wobei eine hohe Korrelation zwischen "task" und "interpersonal behavior" und eine auffällige Ähnlichkeit der Verhaltensmuster beider Interviewpartner beobachtet wurden. Allerdings dürften diese Ergebnisse zumindest teilweise einer gewissen Homogenität der Situation zuzuschreiben sein.
3.2
Der Interviewer als Forschungsinstrument
Die Funktionen des Interviewers bestimmen sich durch Art und Ziel des Interviews (->· Bd. IV: van Koolwijk, Befragungsmethode 1.3). Die folgenden Überlegungen beschränken sich auf das persönliche, standardisierte Informationsinterview mit wissenschaftlicher Zielsetzung (SCHEUCH 1 9 6 7 ) . Die Definition des standardisierten Interviews ergibt sich nach MACCOBY UND MACCOBY ( 1 9 5 4 ) durch folgende Kriterien: (a) Festlegung der Fragen vor dem Interview, (b) identische Fragenformulierung und (c) identische Reihenfolge der Fragen für alle Befragten. Die Funktionen des Interviewers im therapeutischen Interview (vgl. BUGENTAL 1 9 5 4 ) , im Einstellungsinterview (vgl. BLUM UND NAYLOR 1 9 6 8 ) sowie in Hilfs- oder Ergänzungsinterviews bleiben hier unbeachtet.
86
4. Band: Erhebungsmethoden: Die Befragung
Die Befragung einer größeren Stichprobe gestattet es dem Untersuchungsleiter nicht mehr, die Vielzahl der Einzelbefragungen selbst durchzuführen. Er überläßt dies einer Gruppe von Interviewern, die stellvertretend für ihn die Fragen stellt und Antworten notiert. Die einzelnen Interviewer sind also ebenso wie die Befragten prinzipiell austauschbar, was ihren instrumentellen Charakter unterstreicht. Ein Grunderfordernis aller in wissenschaftlichen Untersuchungen eingesetzten Instrumente ist das der Invarianz; d.h. die eingesetzten Erhebungsinstrumente müssen untereinander vergleichbar sein (Interindividuelle Invarianz) und dürfen sich nicht im Verlauf der Untersuchungen verändern (Intraindividuelle Invarianz). Diese Idealforschung ist für das Instrument Interviewer schlechterdings nicht erfüllbar. Unerwünschtes, variantes Interviewerverhalten läflt sich nicht völlig beseitigen. In der Literatur finden sich unterschiedliche Termini zur Beschreibung dieses unerwünschten Interviewerverhaltens, die nicht immer einheitlich definiert werden. SCHEUCH (1967) verwendet den Begriff Interviewerfehler im Sinne eines "unerwünschten Einflusses auf die Resultate". Dieser allgemeinen Definition entspricht der Terminus "interviewer effect" in der angloamerikanischen Literatur. HYMAN (1954) bemüht sich, diesen groben Begriff weiter zu präzisieren und untergliedert in "gross interviewer effect" (Brutto-Fehler) und "net interviewer effect" (Netto-Fehler). Der gross-effect entspricht einer Addition aller Interviewerfehler unabhängig von ihrer Richtung, während beim net-effect, die sich in ihrer Wirkung auf das Gesamtergebnis gegenseitig aufhebenden Fehler unbeachtet bleiben, so daß nur der Fehlerüberhang berücksichtigt wird.
Ein weiteres Konzept von HYMAN (1954) ist das der inter-interviewer-variation. Ausgangspunkt seiner Überlegungen ist die Antwortverteilung, die man bei einer bestimmten Population auf bestimmte Fragen erhalten würde, wenn diese Population von allen nur denkbaren Interviewern befragt würde. Diese hypothetische, als richtig unterstellte Antwortverteilung wäre dann zu vergleichen mit der durch einen bestimmten Interviewerstab tatsächlich ermittelten Verteilung. Dieser Vergleich ist zwar in der Praxis nicht durchführbar, erlaubt aber als Denkmodell einen Einblick in mögliche Fehlerquellen, die die Zuverlässigkeit einer Befragung beeinträchtigen können. Die Begriffe interviewer bias und interviewer error werden von HYMAN (1954) synonym gebraucht, während KAHN UND CANNELL (1963) den Begriff des interviewer bias nur zur Kennzeichnung der unerwünschten und ungeplanten — demnach unerkannten — Einflußnahme verwenden. KUNZ (1969) unternimmt den Versuch, die Begriffe bias und error voneinander abzugrenzen: Bias liegt dann vor, wenn Fehler systematischen Charakter haben, also in eine Richtung gehen und sich nicht gegenseitig verstärken. Error ist dann gegeben, wenn Fehler zufällig auftreten und die Tendenz haben, sich gegenseitig aufzuheben. Schließlich besteht die Möglichkeit, daß der Interviewer einen Teil oder das ganze Interview bewußt fälscht. Dieses Verhalten wird übereinstimmend als interviewer cheating bezeichnet (BENNETT 1949; EVANS 1961). Aus der Erkenntnis, daß der Interviewer einen unerwünschten Einfluß auf die Befragungsergebnisse ausüben kann und in der Regel ausübt, ergibt sich die Forderung, diesen Einfluß zu kontrollieren und falls möglich zu minimieren. Beide Forderungen sind nicht unabhängig voneinander, da die Minimierung des Fehlers - etwa durch Auswahl der "guten" Interviewer - die Kenntnis von Ausmaß und Richtung des Ein-
3. Kapitel: Der Interviewer
87
flusses durch einzelne Interviewer oder bestimmte Interviewergruppen als Auswahlkriterium voraussetzt. Es bleibt jedoch zu beachten, daß es den guten, d.h. wenig verzerrenden, Interviewer schlechthin nicht gibt. Die Frage der Interviewerqualität bzw. des Interviewereinflusses muß stets im Zusammenhang mit dem Untersuchungsgegenstand und dem Untersuchungsziel gesehen werden. Das von ROBINSON UND RHODE (1946) ermittelte und oft zitierte Ergebnis eines Interviewereinflusses durch jüdisch aussehende bzw. jüdisch heißende Interviewer ist nur auf dem Hintergrund des Untersuchungsthemas "Einfluß der Juden in den USA" verständlich. Der Vergleich des besseren Interviewers mit dem schlechteren erfordert jedoch in jedem Falle einen Maßstab, mit dem, und einen Ausgangspunkt, von dem die interviewerbedingte Abweichung gemessen werden kann. Dieser Ausgangspunkt ist die "wahre" unverzerrte Antwort des Befragten, die allerdings in der Regel nicht ermittelt werden kann. Im Idealfall können Zuverlässigkeit und Gültigkeit der Interviewertätigkeit dadurch gemessen werden, daß objektiv gewonnene Daten zum Vergleich zur Verfügung stehen (HYMAN 1 9 5 4 ) . Die Aussagen der Befragten können zum Beispiel anhand einer amtlichen Kartei überprüft werden. Abweichungen können dann der Zwischenschaltung des Interviewers zugeschrieben werden, wenn man der amtlichen Kartei hinreichende Genauigkeit unterstellt. Solche Vergleichsmöglichkeiten sind allerdings nur beschränkt verfügbar. Schließlich wird das Interview ja vor allem dort eingesetzt, wo die Daten mit anderen Methoden nicht erhoben werden können. Eine weitere Möglichkeit besteht darin, vergleichbares Material aus anderen Erhebungen heranzuziehen. Der Vergleich mit Ergebnissen aus einer schriftlichen Befragung dürfte zumindest Aussagen über die Zuverlässigkeit ermöglichen. Die Gültigkeit der Ergebnisse läßt sich dann allerdings nicht mehr ohne weiteres nachprüfen (CANNELL UND FOWLER 1 9 6 4 ) .
Aussagen über die Zuverlässigkeit der Interviewer lassen sich dann, wenn ein Vergleich mit Außenkriterien nicht möglich ist, dadurch machen, daß die Daten der einzelnen Interviewer in einer Befragung miteinander verglichen werden. Voraussetzung ist die zufällige Zuordnung der Interviewer zu den Befragten. Es ist anzunehmen, daß der Interviewer, sofern er den standardisierten Instruktionen folgt, Daten erhält, die nicht wesentlich von denen anderer Interviewer abweichen. In der Annahme, das Schulung der Interviewer und standardisierte Instruktion bei der Befragung die Streuung der Daten der einzelnen Interviewer gering halten, neigt man dazu, einzelnen abweichenden Interviewern ungenaue Arbeit zu unterstellen (vgl. HYMAN 1954). Die Schulung der Interviewer ist allerdings problematisch. Es ist umstritten, wieweit der Interviewer im demoskopischen Interview Einblick in die psychologischen Aspekte erhalten soll. Nach der Auffassung von KAHN UND CANNELL ( 1 9 6 3 ) liegt die Aufgabe des Interviewers in der Kontrolle und Steuerung des Kommunikationsprozesses auf relevante Äußerungen des Befragten. Um den Interviewer auf diese Aufgabe optimal vorzubereiten, sei es erforderlich, ihn auch psychologisch ausreichend zu schulen. HAEDRICH ( 1 9 6 4 ) widerspricht dieser Auffassung. Er glaubt, daß der Interviewer aufgrund der standardisierten Befragungsprozedur ohne psychologische Schulung hinreichend exakt arbeiten kann. Die Schulung sollte sich allein auf technische Aspekte
88
4. Band: Erhebungsmethoden: Die Befragung
beziehen. Im übrigen sei durch die geringe Zahl von Interviews (10 — 15 pro Befragungsauftrag) p r o Interviewer eine Verzerrungsgefahr des Gesamtergebnisses weitgehend reduziert. Diese letzte Annahme wäre sicherlich berechtigt, wenn die Fehler zufällig auftreten, ohne systematischen Charakter anzunehmen. HYMAN (1954) meint, daß es wohl wünschenswert sei, Interviewer mit den Qualitäten eines Sigmund Freud zu haben, daß die Zahl derjenigen mit solcher Befähigung aber naturgemäß gering sei. So gibt auch SHEATSLEY (1951) zu bedenken, daß der Arbeitsmarkt eine Grenze zieht, die eine beliebige Erhöhung des Anspruchsniveaus bei der Auswahl der Interviewer schnell irreal werden läßt. Problematisch ist aber nicht nur der Standardisierungsgrad von Instruktionen, sondern ebenso die Art und Weise der Schulung. SCHEUCH (1967) gibt einen Uberblick über Schulungsmethoden von kommerziellen Sozialforschungsinstituten in Deutschland. Danach erfolgt die Schulung in der Regel schriftlich. Besonders ausgearbeitete Probeinterviews sind zu absolvieren. Ergänzt wird dieses Material meist durch kleine Handbücher, in denen Verhaltensregeln kasuis t i s c h d a r g e s t e l l t w e r d e n (ADAMS 1 9 5 8 ; SIDNEY 1 9 6 1 ; NOELLE 1 9 6 7 ) . E i n w e i s u n g e n
durch Chefinterviewer und mit ihnen gemeinsam durchgeführte Probeinterviews sind selten. Hier bereiten besonders geschulte "dummy"-Respondenten dem Interviewer absichtlich große Schwierigkeiten. Darüber hinaus werden Tonbandgeräte eingesetzt, um den Interviewern Fehler anschaulich zu machen (SCHEUCH 1967, S. 158). Obwohl also eine Anzahl unterschiedlicher Meinungen existieren, ist wenig empirische Forschung zu diesem Problem bekannt geworden. Unseres Wissens sind bisher erst zwei empirisch-experimentelle Bearbeitungen dieses Problems publiziert worden, und z w a r d i e A r b e i t e n v o n CANTRIL ( 1 9 4 7 , S . 8 3 - 9 7 ) u n d v o n GUEST ( 1 9 5 8 ) . C a n t r i l
vergleicht die Qualität der Interviewerstäbe zweier Institute, die eine unterschiedliche Interviewerschulung durchführen. Das American Institute of Public Opinion schult seine Interviewer gewöhnlich schriftlich, während das National Opinion Research Center (NORC) neben der Ausgabe eines kleinen Handbuchs zusätzlich jeden neuen Interviewer durch einen Chefinterviewer einweisen läßt, der außerdem noch vor der eigentlichen Feldarbeit einzelne Probeinterviews gemeinsam mit ihm durchführt. Cantril wählte für sein Experiment zufällig jeweils 60 Interviewer aus den beiden Instituten aus und ließ sie eine Befragung mittels eines besonders konstruierten Fragebogens durchführen. Anhand eines Expertenratings wurde anschließend die Qualität der Interviewerleistung ermittelt. Statistisch signifikante Leistungsunterschiede, die der Schulungsmethode hätten zugeschrieben werden können, wurden nicht festgestellt. In dem Experiment von GUEST (1958) sollten unterschiedliche Trainingsmethoden bezüglich ihrer Effektivität, d.h. Auswirkung auf die Fehlerquote der Interviewer, überprüft werden. Insbesondere wollte er dabei untersuchen, ob die Tätigkeit als Verkoder vor der eigentlichen Feldarbeit einen günstigen Einfluß auf die Interviewerleistung hatte. Eigene gelegentliche Beobachtungen sowie eine Anregung von PARTEN (1950) hatten ihn auf diese Idee gebracht. Seine Hypothesen lauteten: (1) (2) (3)
Höchste Fehlerquote bei herkömmlichem Interviewertraining; Mittlere Fehlerquote bei herkömmlichem Training + Probeinterviews; Geringste Fehlerquote bei herkömmlichem Training + Verkodungsarbeit.
3. Kapitel: Der Interviewer
89
In einem insgesamt sechs Tage umfassenden Schulungsprogramm hatten drei hinsichtlich demographischer Variablen vergleichbare Gruppen von je 20 Interviewern ohne bisherige Interviewererfahrung die entsprechenden Trainingsprogramme zu absolvieren. Darstellung 1 zeigt die Ergebnisse in den Hauptfehlerarten. Gruppe 2
1
3
Auslassungen, ohne Auswahlinformationen
58%
47%
55%
Unklare Antworten (3 Kategorien)
20%
25%
25%
Auswahlfehler (3 Kategorien)
18%
27%
16%
4%
1%
3%
100%
100%
100%
383
313
307
Unzulängliche Behandlung von Antworten auf offene Fragen ( 1 Kategorie)
Ν=
Darstellung 1: Relative Fehlerzahl bei verschiedenen Arten der Inteviewerschulung (Quelle: G U E S T 1958, S. 297) Die Unterschiede zwischen den Gruppen gehen innerhalb der einzelnen Fehlerkategorien nicht in eine bestimmte Richtung. Guest selbst meint, daß die unterschiedlichen Fehlerquoten möglicherweise eher auf einen Mangel an Erfahrung in der Anwendung der einzelnen Methoden als auf die Methoden selbst zurückzuführen seien. Trotzdem bleibt zu beachten, daß in der Addition aller genannten Fehler die Gruppe 1 wesentlich schlechter abschneidet als die Gruppen 2 und 3. Durch Addition von Fehlern aus zwanzig, allerdings nicht näher aufgeführten, Fehlerkategorien erhielt er ein weiteres Gruppenvergleichsmaß. Die Differenz der Durchschnittsfehlerzahl pro Interviewer in den drei Gruppen wurde hier mittels des t-Testverfahrens auf Signifikanz überprüft. Zwar gingen die Unterschiede in die vorausgesagte Richtung, signifikant war aber nur der Unterschied zwischen Gruppe 1 und Gruppe 3. Eine Erklärung für die mangelnde Signifikanz sucht Guest in der möglicherweise zu geringen Zahl von Interviewern. Es ist aber wohl auch nicht auszuschließen, daß Gruppen 2 und 3 ihre bessere Leistung nur der Tatsache zu verdanken haben, daß sie jeweils vier Stunden länger geschult wurden als die Gruppe 1. 3.3
Quellen und Kontrollmöglichkeiten des Interviewerfehlers
Die Ermittlung des Interviewerfehlers als solchen — etwa durch den Vergleich einzelner Interviewer — ermöglicht zwar Angaben über den Zuverlässigkeitsgrad des Instruments Interviewer, erlaubt aber noch keine Aussagen über die eigentlichen Quellen
90
4. Band: Erhebungsmethoden: Die Befragung
der Fehler. Eine Möglichkeit der Zuverlässigkeitsanalyse im Hinblick auf potentielle Quellen des Interviewerfehlers besteht z.B. in dem Vergleich der Befragungsergebnisse von Interviewern als Angehörigen bestimmter Gruppen. Dieser Ansatz stützt sich zwar auch auf einen internen Vergleich der Befragungsergebnisse von Interviewern, ist aber insofern als Weiterfuhrung zu betrachten, als Gruppen von Interviewern miteinander verglichen werden, die sich durch gemeinsame Persönlichkeits- oder soziographische Merkmale auszeichnen, die einerseits ein bestimmtes unerwünschtes Verhalten der Interviewer begünstigen oder andererseits eine bestimmte unerwünschte Wahrnehmung bei den Befragten auslösen können. 3.3.1
Der Einfluß sichtbarer Merkmale
Sichtbare unveränderliche Merkmale wie Rassenzugehörigkeit, Alter oder Geschlecht der Interviewer sind nach den vorliegenden Ergebnissen offenbar vor allem dann Einflußfaktoren, wenn eine Beziehung zwischen dem Inhalt der Fragen und den entsprechenden Merkmalen der Interviewer besteht (MAYNTZ 1 9 6 9 ; SCHEUCH 1 9 6 7 ) . ERBSLÖH ( 1 9 7 3 ) k o n n t e nachweisen, d a ß bei der Anwendung eines standardisierten verbalen Intelligenz-Kurztests systematische, vom Alter des Interviewers abhängige Antwortverzerrungen auftraten. In den USA sind eine Anzahl von Studien veröffentlicht worden, die sich mit dem Einflußfaktor Rassenzugehörigkeit von Interviewern und Befragten beschäftigen. Eine Zusammenfassung lieferten zuletzt SCHUMANN UND CONVERSE ( 1 9 7 1 ) . CANTRIL ( 1 9 4 7 ) konnte zeigen, daß Antworten eher in Richtung auf soziale Erwünschtheit geäußert werden, wenn Neger von Weißen befragt werden, als wenn sie von Negern befragt werden. führt in diesem Zusammenhang die Hypothese an, daß die Antworten wesentlich vom potentiellen Furchterregungsgrad der Frage beeinflußt werden und daß unterschiedliche Rassenzugehörigkeit keine Einflußgröße mehr darstellt, wenn der Furchterregungsgrad von Fragen niedrig ist.
WILLIAMS ( 1 9 6 4 )
Neben der Rassenzugehörigkeit ist in der sozioökonomischen Distanz zwischen Interviewer und Respondent eine weitere wesentliche Variable zu sehen. LENSKI ( 1 9 6 0 ) weist nach, daß Unterschiede zwischen weißen und farbigen Interviewern nicht signifikant sind, wenn Interviewer und Respondent die gleiche Schichtzugehörigkeit aufweisen. Diese Ergebnisse deuten d a r a u f h i n , daß der Rassenzugehörigkeit nur bedingt eine verzerrende Wirkung zuzuschreiben ist. Leider ist eine systematische Untersuchung der Bedeutung der Schichtzugehörigkeit für den Interviewereinfluß nur beschränkt möglich, da die meisten Interviewer der Mittelschicht angehören (NOELLE 1 9 6 7 ) . Unter der Annahme, daß sowohl Interviewer als auch Respondent aus drei sozioökonomischen Schichten stammen können, sind neun verschiedene Kombinationen möglich, von denen jedoch bisher nur vier untersucht wurden: Interviewer Unterschicht Mittelschicht Mittelschicht Mittelschicht
Respondent Unterschicht (KATZ 1942) Unterschicht (KATZ 1942) Mittelschicht (HYMAN 1954) Oberschicht (RIESMAN 1958)
Der Einfluß des Geschlechts der Interviewer kann unter bestimmten Umständen eine Verzerrung der Daten begünstigen. HYMAN ( 1 9 5 4 ) fuhrt einige Untersuchungen zu diesem Problem an. Den Ergebnissen läßt sich entnehmen, daß Antworten in Rieh-
3. Kapitel: Der Interviewer
91
tung auf soziale Erwünschtheit verzerrt werden, wenn Interviewerund Befragte unterschiedliches Geschlecht aufweisen. Die Befunde deuten insgesamt darauf hin, daß die Gültigkeit der Befragungsergebnisse wesentlich von der Ähnlichkeit der Gruppenzugehörigkeit von Interviewer und Befragtem abhängt. HYMAN (1954, S. 154) vermutet, daß ähnliche Gruppenzugehörigkeit "the feeling of mutual warmth and sociability usually characterized by the term rapport" fördere. Diese Atmosphäre begünstige optimale Antwortbereitschaft der Befragten, ohne verfälschend zu wirken. Interessant ist dabei die Frage, ob generell eine solche Tendenz zu erwarten ist oder nur in dem Bereich der genannten Spezialfälle. Die Bedeutung dieser Überlegung wird klar, wenn man berücksichtigt, daß selbst trotz großer Sorgfalt der Schulung die objektiv sichtbaren Merkmale wie Alter, Geschlecht und Rasse nicht verborgen werden können (HYMAN 1954, S. 153). Ein Großteil der Literatur beschäftigt sich mit diesem Problem des Rapports. Auffällig ist dabei, daß der Überprüfung der Hypothese beträchtliche Operationalisierungsschwierigkeiten entgegenstehen. BROWN (1954) versucht, die Intensität des Rapports dadurch zu erfassen, daß er Interviewern und Befragten gleichlautend die Frage stellte, ob ihnen das Interview Spaß gemacht habe ("enjoyed the interview? "). In der Annahme, daß der Rapport am größten sei, wenn Interviewer und Respondent gleichzeitig Spaß am Interview hatten, wurde diese Konstellation mit Hilfe von drei Kriterien zur Gruppenzugehörigkeit in Beziehung gesetzt (Darstellung 2). Die Ergebnisse erlauben nicht den Schluß, daß generell eine deutliche Beziehung zwischen Rapport und ähnlicher Gruppenzugehörigkeit besteht. Während bei männlichen Interviewern ein Zusammenhang nicht auszuschließen ist, gilt dies nicht für weibliche Interviewer. Befragte mit niedrigem sozioökonomischen Status haben offenbar in jedem Fall den größten Mangel an Rapport zu verzeichnen. Die Interviewer der jüngsten Altersgruppe haben den größten Rapport mit Befragten mittleren Alters. Bei älteren Interviewern scheint das Alter des Befragten keinen Einfluß auf den Rapport zu haben. Selbst, wenn eine hinreichende Operationalisierung der Rapport-Hypothese unterstellt wird, können diese Aussagen nur als richtungsweisend angesehen werden, zumal offenbar keine Signifikanz-Tests durchgeführt wurden. HYMAN (1954) äußert die Vermutung, daß Rapport nicht zuletzt von der Interviewererfahrung beeinflußt werde. Folgt man dieser Argumentation, so wird auch plausibel, daß weibliche Interviewer und ältere Interviewer wegen ihrer größeren Erfahrung gleichbleibenden Rapport erzielen (NOELLE (1967). Zur weiteren Unterstützung sollen einige Studien skizziert werden. DURBIN UND STUART (1951) konnten zeigen, daß Berufsinterviewer eine geringere Verweigerungsquote erzielten als Studenten. SMITH UND HYMAN (1950) konnten nachweisen, daß Interviewererfahrung sich günstig auf die für den Befragten schwierige Aufgabenstellung auswirkt, Antworten in ein vorgegebenes Kategorienschema einzuordnen. HYMAN (1954) führt diese Ergebnisse auf einen Selektionsprozeß zurück: Gute Interviewer verbleiben länger in einem Interviewerstab als schlechte. Die gute Leistung ist also möglicherweise nicht ein Ergebnis der Erfahrung, sondern eine Wirkung der Auswahl. Es kann also angenommen werden, daß die Beziehung zwischen Rapport und ähnlicher Gruppenzugehörigkeit von Interviewer und Respondent von der Interviewererfahrung intervenierend beeinflußt wird, wobei bisher nicht ohne weiteres festzustellen ist, welche Faktoren den Wert der Interviewererfahrung bestimmen.
92
4. Band: Erhebungsmethoden: Die Befragung
Proportion of combination where enjoyment of interview was rated Respondent-Interviewer Combination
By Interviewer By Respondent
Low Low
Number
Low High
High Low
High High
Percentages
Sex Male Interviewers: Male Respondents Female Respondents Female Interviewers: Male Respondents Female Respondents
98 91
28 43
27 23
14 16
31 18
476 512
26 29
23 24
17 14
34 33
Socio-Economic Status' ) A and Β Interviewers: A and Β Respondents C Respondents D Respondents
77 221 114
29 28 39
16 17 27
23 18 12
32 37 22
C and D Interviewers: A and Β Respondents C Respondents D Respondents
92 378 179
19 24 36
20 26 32
24 17 8
37 33 24
55 47 90
42 32 39
31 22 32
4 10 5
23 36 24
31 33 78
39 27 28
16 27 31
22 15 14
23 31 27
167 224 431
23 30 24
27 17 23
16 22 17
34 31 36
Age Interviewers under 30: Respondents under 30 Respondents 30 — 39 Respondents 40 and over Interviewers 30 — 39: Respondents under 30 Respondents 30 - 39 Respondents 40 and over Interviewers 40 and over: Respondents under 30 Respondents 30 - 39 Respondents 40 and over
1) Die Buchstaben A, B, C und D kennzeichnen die Schichtzugehörigkeit in absteigender Reihenfolge
Darstellung 2: Die Beziehung zwischen Ähnlichkeit der Gruppenzugehörigkeit und Rapport zwischen Interviewer und Respondent (Quelle: H Y M A N 1954, S. 155)
3. Kapitel: Der Interviewer
93
Um weiteren Aufschluß über einen möglichen Zusammenhang zwischen ähnlicher Gruppenzugehörigkeit von Interviewer und Respondent und Validität der Antworten zu erhalten, wurden in der zitierten Untersuchung von B R O W N die Interviewer aufgefordert, den Grad der Aufrichtigkeit der Antworten zu schätzen. Die Bereitschaft, den Befragten Aufrichtigkeit zuzutrauen, wurde in Abhängigkeit von ähnlicher Gruppenzugehörigkeit gemessen. Die Befunde zeigen eine auffällige Übereinstimmung mit den Ergebnissen zur Frage des Rapports. Allerdings sind die Unterschiede in den einzelnen Altersgruppen zu gering, um eine schlüssige Interpretation zu ermöglichen. Dennoch zeigen die älteren Interviewer insgesamt eine leichte Tendenz, ihren Befragten eher Aufrichtigkeit zuzugestehen, als die jüngeren Interviewer. B E N N E Y U.A. (1956) versuchten in einer weiteren vergleichenden Studie, einer Lösung des Rapport-Problems näherzukommen. Grundsätzlich vertreten sie die Hypothese, daß ähnliche Gruppenzugehörigkeit von Interviewern und Respondent den Rapport begünstigt, geben aber im Falle des Alters zu bedenken, daß nicht das tatsächliche, sondern das wahrgenommene Alter entscheidend sei; darüberhinaus sei die Bedeutung des Alters für die Geschlechter unterschiedlich. Zur Überprüfung der Rapport-Hypothese greifen sie auf zwei Arbeiten zurück, in denen gleichlautend die Aufrichtigkeit erfragt worden war: Eine Studie von S T A R in Zusammenarbeit mit dem NORC (1950) über Geisteskrankheit und zum anderen die oben zitierte Studie von B R O W N über politische Meinungen. Dieser Vergleich sei insofern bedeutsam gewesen, als die Gesamtergebnisse aus den beiden Bevölkerungsbefragungen vermuten ließen, daß Politik eher die Männer und Geisteskrankheit eher die Frauen interessierte. Hier konnte also überprüft werden, ob das Interesse des Respondenten am Befragungsthema Einfluß auf die geschätzte Aufrichtigkeit gehabt hatte. Es zeigte sich eine deutliche Übereinstimmung zwischen beiden Studien. Die Aufrichtigkeitseinschätzung scheint also unabhängig vom Interesse des Befragten am Befragungsgegenstand zu erfolgen. Weibliche Interviewer mittleren Alters mit wahrscheinlich größerer Interviewererfahrung unterlagen in ihren Schätzungen den geringsten Schwankungen. Es bestätigte sich auch, daß jüngere Interviewer ihren Befragten gegenüber kritischer waren als ältere Interviewer. Solange keine umfangreichen Vergleichsuntersuchungen vorliegen, können die aufgezeigten Tendenzen lediglich richtungsweisend sein. Nach dem derzeitigen Wissensstand erscheint es notwendig, die Auswirkungen "sichtbarer" Merkmale der Interviewer in jeder Befragung neu abzuschätzen. Ein besonderes Problem ist in diesem Zusammenhang auch in dem Auftraggebereffekt (sponsorship bias) zu sehen. Man versteht darunter eine Antwortverzerrung, die dadurch entsteht, daß der Befragte hinter dem Interviewer einen Auftraggeber mit einer bestimmten Interessenlage vermutet und seine Antworten entsprechend modifiziert (vgl. H Y M A N 1954, S. 185 - 189). Es ist dabei unerheblich, ob die Mutmaßungen des Befragten den Tatsachen entsprechen oder nicht. C R E S P I (1950) konnte zeigen, d a ß erhebliche Antwortverzerrungen im Sinne sozialer Erwünschtheit dann auftraten, wenn sich der Befragte von der auftraggebenden Instanz bedroht oder sich ihr unterlegen fühlte. Crespi setzte nämlich für eine Umfrage im seinerzeit amerikanisch besetzten Teil Deutschlands zwei Gruppen von Interviewern ein. Die einen gaben sich als Beauftragte der amerikanischen Besatzung, die anderen als Mitarbeiter eines deutschen Meinungsforschungsinstitutes zu erkennen. H Y M A N (1954, S. 187) betont, daß diese Ergebnisse von Crespi als extremer Einzelfall anzusehen seien. Als Beleg
94
4. Band: Erhebungsmethoden: Die Befragung
fuhrt er eine Studie des NORC und der OWI Survey Division an, die mit der gleichen experimentellen Anordnung während des Krieges in den USA durchgeführt worden war und bei insgesamt 29 Einstellungsfragen nur in zwei Fällen zu signifikanten Unterschieden geführt hatte. Dennoch sei das Problem des Auftraggebereffektes nicht zu unterschätzen, weil die Wahrnehmung des Befragten und eine eventuell daraus folgende Antwortverzerrung nicht ohne weiteres im voraus hinsichtlich Richtung und Ausmaß abgeschätzt werden könne.
3.3.2
D i e W i r k u n g v o n Persönlichkeitsmerkmalen
Verschiedene A u t o r e n versuchen, der Verzerrung von Forschungsdaten dadurch zu begegnen, daß sie geeignete Persönlichkeitsmerkmale suchen, die von vornherein gute von schlechten Interviewern trennen sollen. Die Ergebnisse sind aber bisher nicht ermutigend, was einerseits auf die mangelnde Validität der eingesetzten Tests zurückzuführen sein mag, andererseits auf die Schwierigkeiten, brauchbare Effektivitätskriterien zu entwickeln. Meist hilft man sich mit einem Expertenrating, das allerdings nur von beschränktem Wert sein kann, da es sich lediglich auf die Qualität des bereits ausgefüllten Fragebogens stützt und daher die wesentliche Phase der Datenerhebung im Interview nicht erfaßt. Ein Rating zum Verhalten des Interviewers in der Interviewsituation ist jedoch schwer durchführbar und überdies nur von ungenügender Zuverlässigkeit, wie ein entsprechendes Feldexperiment von GUEST (1947) gezeigt hat. Schließlich m u ß angenommen werden, daß in der Regel Interviewerstäbe getestet werden, die bereits durch eine gewisse Homogenität gekennzeichnet sind, weil bestimmte Aufnahmeprüfungen gering qualifizierte Kräfte schon vorher ausgeschlossen haben. Typisch für diese Datenkonstellation ist eine Arbeit von AXELROD UND CANNELL ( 1 9 5 9 ) . Den 1 7 5 Interviewern des Survey Research Centers der University of Michigan wurden drei Tests vorgelegt, von denen die Autoren Diskriminierung bezüglich guter und schlechter Interviewer erwarteten (Strong Vocational Interest Inventory; Kenn-Speroff E m p a t h y Trest; Guilford-Zimmerman Temperament Survey). Effektivitätskriterium war ein Expertenrating zur "overall-ability". "Although these ratings have the weakness of any impressionistic or judgemental ratings, the field supervisors have ample opportunity to form such judgments and test them against reality" (AXELROD UND CANNELL
1959).
Obgleich die Autoren damit die eindrucksmäßige Gültigkeit ("face validity") dieser Methode betonen, sollte nicht vergessen werden, daß ein Expertenrating lediglich in Ermangelung eines geeigneten Außenkriteriums gewählt wurde und keinesfalls den Idealfall darstellt. Die drei aufgestellten Tests erweisen sich als ungeeignet, " g u t e " von "schlechten" Interviewern zu unterscheiden. Die Autoren nennen selbst die Gründe dieses Mißerfolges: a) Ungeeignetes Effektivitätskriterium (Rating), b ) Homogenität des Interviewerstabes hinsichtlich, demographischer Merkmale und Interviewerfahrung, c) zu geringe Stichprobengröße, d ) ungeeignete Tests.
3. Kapitel: Der Interviewer
95
Ein weiter zurückliegendes Experiment von GUEST UND NUCKOLS( 1950) zeigt ebenfalls, daß Persönlichkeitsmerkmale von Interviewern zur Voraussage der Effektivität nur bedingt brauchbar sind. 24 College-Studenten wurden drei konstruierte Tonbandinterviews vorgespielt, die dann analog einem Feldinterview aufgezeichnet werden sollten. Anschließend wurden die Aufzeichnungen mit den Tonbandoriginalen auf Fehler verglichen. Die Zahl der "recording errors" (Effektivitätskriterium) wurde mit den Werten einiger Persönlichkeitstests korreliert, die die Vpn vor dem Experiment absolviert hatten. Die Korrelationen waren niedrig und sollten daher nur mit Vorsicht interpretiert werden. Lediglich die statistisch bedeutsame Korrelation zwischen Fehlerzahl und Intelligenz (r = - . 5 2 ) erlaubt Schlußfolgerungen, zumal dieser Befund auch mit einer Beobachtung von HYMAN (1954, S. 293) übereinstimmt, wonach Interviewer des NORC, die eine gute Leistung beim California Test of Mental Maturity erzielt hatten, in einer Expertenbeurteilung bezüglich guter Interviewerleistung durchschnittlich höher eingestuft wurden als die übrigen Interviewer. DVORAK U.A. ( 1 9 5 2 ) s e t z t e n b e i d e r A u s w a h l v o n 1 . 2 0 0 I n t e r v i e w e r n f ü r d i e B e f r a -
gung über Unterhaltskosten von Häusern in den USA acht verschiedene Tests ein. Die vier wichtigsten betrafen (1) intelligence, (2) verbal ability, (3) clerical perception und (4) personality. Für jeden dieser Tests wurden Mittelwerte und Standardabweichung berechnet. Als potentiell gute Interviewer wurden diejenigen bezeichnet, die in diesen vier Tests gleichzeitig nicht mehr als eine Standardabweichung nach unten vom Durchschnitt abwichen. Diejenigen, die dieses Kriterium nicht erfüllten, wurden als potentiell schlechte Interviewer bezeichnet. Per Zufall wurden insgesamt 130 Interviewer aus dem Gesamtsample für die Feldarbeit ausgewählt. Anschließend wurde die Qualität ihrer Interviews von einem Expertenteam eingestuft und mit der Testleistung in Beziehung gesetzt. Während bei nicht ausreichender Testleistung die Feldarbeit jeweils zur Hälfte zufriedenstellend bzw. unbefriedigend eingeschätzt wurde, hatte von den Interviewern mit guter Testleistung nur ein sehr geringer Anteil bei der Feldarbeit versagt (Darstellung 3).
Gesamtzahl
schlechte Testleistung
gute Testleistung
zufriedenstellende Interviewelleistung
22
73
95
nicht zufriedenstellende Interviewerleistung
21
14
35
Gesamtzahl
43
87
130
Darstellung 3: Beziehung zwischen Testergebnis und Expertenkartei (Quelle: DVORAK U.A. 1 9 5 2 )
96
4. Band: Erhebungsmethoden: Die Befragung
Ein Mangel der meisten Untersuchungen besteht darin, daß als Effektivitätskriterium lediglich ein mehr oder minder genaues und umfassendes Expertenrating diente. Eine neuere Studie von STEINKAMP (1966) vermeidet diesen Nachteil, da hier ein objektives Außenkriterium zur Verfügung stand. Im Interview sollte u.a. die Höhe bestimmter Sparbeträge der Respondenten erfragt werden, die bereits durch exakte Angaben der Geldinstitute bekannt waren. Wichtigstes Effektivitätskriterium war die "account-mention (AM) rate", der relative Anteil der Interviews, in denen die Befragten richtige Angaben über die Höhe ihrer Sparbeträge machten. Von 141 Bewerbern wurden 50 für die Interviewerschulung ausgewählt und 21 schließlich bei der Feldarbeit eingesetzt; den Interviewern war nicht bekannt, daß die Validität ihrer Interviews überprüft werden sollte. Als Persönlichkeitstest diente das Edwards Personal Preference Schedule (EPPS) sowie die Reference Evaluation Check List (RECL). Die Ergebnisse zeigen, daß effektive Interviewer einen höheren "dominance"· und "intraception"-Wert und einen niedrigeren "succorance"- und "change"-Wert auf dem EPPS erreichten und auf der RECL einen höheren "selfconfidence" und höheren "attention to detail"-Wert erzielten. (Der "dominance" -Wert charakterisiert die Neigung, andere Menschen zu überzeugen und zu überwachen, "intraception" erfaßt Verständnis und Einfühlungsvermögen; der "succorance"-Wert gibt einen Hinweis über die soziale Abhängigkeit und Unterwürfigkeit und "change" erfaßt Flexibilität und Umstellungsfreudigkeit). Steinkamp vergleicht seine Ergebnisse mit denen von G U E S T (1947), der keine Beziehung zwischen Effektivität und dominance fand, und vermutet, daß diese Unterschiede durch den Untersuchungsgegenstand bedingt sind. 'These results suggest that dominance may or may not be a desirable interviewer characteristic, depending whether the study is basically factual or attitudinal." ( S T E I N K A M P 1966). Dieses Ergebnis unterstreicht wiederum, daß die Interviewereffektivität nicht das Ergebnis einzelner Determinanten ist, sondern durch ein ganzes Bündel verschiedener interpendenter Einflußfaktoren bestimmt wird.
3.3.3
Die Wirkung von Einstellungen und Erwartungen
Die Diskussion eines weiteren Gruppenphänomens, nämlich der verzerrenden Wirkung von Einstellungen und Erwartungen der Interviewer, hat sein HYMAN (1954) eine entscheidende Akzentverschiebung erfahren. Ausgehend von der Überlegung, daß in der älteren Literatur jeweils eine bestimmte Modellvorstellung von der Interviewsituation vorgeherrscht und einseitig die Hervorhebung eines Problems gefördert habe, bekannte er sich zu einer mehr phänomenologischen Betrachtungsweise des Interviews. So setzt er sich beispielsweise recht kritisch mit einer der ersten Studien zum Interviewereinfluß von RICE (1929) auseinander. Rice habe zu sehr den Kommunikationsprozeß im Interview betont und angenommen, daß der Interviewer, wenn auch unbewußt, seine eigene Meinung auf den Befragten übertrage. Dieses enge Konzept habe dazu geführt, daß kognitive Elemente, wie etwa die "beliefs about the true sentiment of the population" ( H Y M A N 1954, S. 35) des Interviewers und deren möglicher Einfluß auf die Ergebnisse vernachlässigt wurden. Zur Bekräftigung seiner Annahme, daß bisher zuviel Gewicht auf die Einstellungen der Interviewer gelegt wurde, zitierte er die Ergebnisse einer schriftlichen Befragung von Interviewern des NORC, durchgeführt von SHEATSLEY (zit. bei HYMAN 1954, S. 74). Die Interviewer
3. Kapitel: Der Interviewer
97
sollten angeben, welche Vorstellungen sie von der Aufgabe von Umfragen hatten. Ein Drittel des Stabes glaubte zwar, daß eine sehr wichtige Aufgabe von Umfragen darin bestehe, Befragte zu erziehen; mehr als die Hälfte der Interviewer sah es aber nicht als ihre Aufgabe an, einen schlecht informierten Befragten zu belehren, selbst wenn dieser eine Diskussion nach Abschluß des Interviews wünschte. 80% des Stabes schließlich sahen ihre Aufgabe nicht darin, einen mit Vorurteilen behafteten Befragten — auch nicht nach Abschluß des Interviews - aufzuklären. HYMAN (1954) glaubt daraus schließen zu können, daß bei den Interviewern Aufgabenorientierung bei weitem soziales Interesse überlagere, und die Gefahr einer Verzerrung durch die Übertragung von Einstellungen geringer, als in der Vergangenheit gesehen, einzustufen sei. Die Gefahr, daß die Einstellungen verzerrend wirken könnten, sei wahrscheinlich dann gegeben, wenn unvorhergesehene Schwierigkeiten in der Interviewsituation auftauchen. RIJKSEN UND VAN B E R G E N ( 1 9 5 9 ) versuchten experimentell zu überprüfen, ob Interviewer dazu neigen, wörtlich aufzuzeichnende Interviews in Richtung auf die eigene Einstellung zu verzerren. Die Befragten waren ohne Wissen der Interviewer auf dieses Experiment vorbereitet und in zwei Gruppen eingeteilt worden. Die Befragten der einen Gruppe äußerten konsistent negative Ansichten zu dem Befragungsthema, während die Respondenten der zweiten Gruppe eine eher neutrale Haltung zeigten und sowohl positive als auch negative Äußerungen machten. Es zeigte sich, daß die Interviewer die Befragungsergebnisse nicht in Richtung auf die eigene - vorher erfaßte Einstellung verzerrten, wohl aber dazu neigten, neutrale Antworten in eine einheitliche Linie zu bringen. Die Autoren interpretieren dieses Ergebnis im Sinne von FESTINGERS ( 1 9 5 7 ) Theorie der kognitiven Dissonanz und vermuten, daß die Interviewer vom Befragten einheitliche Angaben erwarten. Neutrale (inkonsistente) Angaben erzeugen Dissonanz, die dann durch Verfälschung der Äußerungen in Richtung auf stärkere Einheitlichkeit vermindert wird.
konnte allerdings zeigen, daß bei der Verschlüsselung von Antworten auf schwierige offene Fragen die Interviewer in einem Laboratoriumsexperiment dazu neigten, die Antworten in Richtung auf ihre eigene Einstellung zu verkoden. (Die Einstellungen der Interviewer waren vor dem Experiment erfaßt worden). Darüber hinaus konnte HAEDRICH ( 1 9 6 4 , S . 9 1 ) zeigen, daß bei heiklen politischen Fragen auch im demoskopischen Interview die Einstellungen der Interviewer verzerrend auf die Antworten der Befragten wirken. FISHER ( 1 9 5 0 )
Der Schwerpunkt der Betrachtung liegt bei HYMAN ( 1954) allerdings auf Interviewererwartungen. Er unterscheidet dabei folgende Erwartungshaltungen: 1") attitude structure expectations, 2) role expectations und 3) probability expectations (1950) konnten in einem Laborexperiment deutlich den verzerrenden Einfluß eines künstlich erzeugten Bezugsrahmens auf die Verkodung von unklaren Antworten nachweisen. HAEDRICH (1964) leugnet zwar nicht grundsätzlich die Wirkung eines solchen Prozesses, glaubt aber, dessen Gefahr im demoskopischen Interview geringer einstufen zu können. Einerseits werde durch komplizierte Mehrthemenbefragen eine generelle Erwartungsbildung erschwert, andererseits sei auch die Zahl offener Fragen in diesen Interviews sehr klein. Die verzerrende Wirkung von unterschiedlichen Rollenerwartungen der Interviewer konnte HYMAN (1954, S. 112) in einer 1948 in Cleveland durchgeführten Untersuchung eindrucksvoll demonstrieren. In dieser Studie waren jedem Interviewer vergleichbare Befragungsgruppen zugeordnet worden, um experimentell "interviewer-variation" zu überprüfen. Bei einer SMITH UND HYMAN
98
4. Band: Erhebungsmethoden: Die Befragung
Frage zum Kaufverhalten ergaben sich zwischen den Interviewern hochsignifikante Unterschiede in der Antwortverteilung. Es handelte sich darum zu erfahren, ob die Ehefrau Benzin und Autoersatzteile und der Ehemann Haushaltsartikel gekauft hatte. In der Mehrzahl der Fälle war die Ehefrau befragt worden. Hyman erklärt die Unterschiede damit, daß bei den Interviewern unterschiedliche Rollenerwartungen zum typischen Kaufverhalten von Mann und Frau wirksam waren. Eine genaue Analyse der Daten zeigte, daß die Unterschiede jeweils signifikant waren, wenn von dem Befragten das für ihn ungewöhnliche Kaufverhalten erfragt wurde. Außerdem stellte sich heraus, daß die Gruppe von Interviewern, die in einer schriftlichen Befragung berichtet hatten, daß in ihren eigenen Haushalt "ungewöhnliches" Kaufverhalten getätigt werde, auch einen höheren Prozentsatz entsprechender Antworten erzielt hatten. Hyman glaubt in dieser Untersuchung auch feststellen zu können, daß die beobachteten stereotypen Erwartungen Indikator für ein allgemeines stereotypes Verhalten darstellen; denn diejenigen Interviewer, die in geringerem Ausmaß ungewöhnliches Verhalten aufzeichneten, waren auch weniger als andere bereit, Neger zu interviewen. Die Tatsache, daß in dieser Untersuchung nur bei 5 von 45 Fragen insgesamt signifikante Unterschiede in den Antwortverteilungen auftraten, deutet nach H Y M A N (1954) daraufhin, daß Rollenerwartungen kein generelles Gefahrenmoment darstellen, sondern nur in bestimmten Situationen wirksam werden. H A E D R I C H (1964) kann ebenfalls zeigen, daß Fragen aus verschiedenen Themenbereichen im standardisierten Interview bei studentischen männlichen und weiblichen Interviewern fast ausnahmslos zu nicht signifikanten Unterschieden in den Antwortverteilungen führen. Den Wahrscheinlichkeitserwartungen (probability expectations) der Interviewer glaubt H Y M A N (1954) geringere Bedeutung beimessen zu können. Er vermutet, daß sich im allgemeinen der Interviewer weniger von Erwartungen über die Antwortverteilungen von allen seinen Befragten leiten läßt, als individuell bei jedem einzelnen Befragten Erwartungen hegt. Er schließt aber nicht aus, daß der Interviewer bei einem Thema, das sehr aktuell und von allgemeinem Interesse sei, etwa eine Präsidentenwahl, ausgeprägte probability expectations entwickeln könne. Es wäre möglich, daß er beispielsweise zu Beginn einer Befragung Ergebnisse erzielt, die seinen Erwartungen zuwider laufen. Für diesen Fall sei nicht auszuschließen, daß er versuchen würde, die Ergebnisse seiner weiteren Befragten in irgendeiner Weise zu korrigieren. O L M S T E D T (1962) versucht, diese Frage experimentell zu überprüfen und kommt zu dem Schluß, daß ein solcher Effekt keinesfalls generell wirksam ist. Hyman vermutet im übrigen, daß verschiedene Interviewer kaum die gleichen Erwartungen hegen und daß systematische Verzerrungen deshalb nicht zu erwarten seien. Diese Annahme mag in der Regel für Meinungsumfragen Gültigkeit besitzen; für den Fall, daß Denk- oder Wissensleistungen vom Befragten verlangt werden, kann das Auftreten von Wahrscheinlichkeitserwartungen auch im demoskopischen Interview nicht ausgeschlossen werden. H A E D R I C H (1962) veröffentlichte eine Studie, deren Ergebnisse diese Vermutung stützen und darüber hinaus zeigen, daß das Phänomen durchaus Gruppencharakter haben kann. Bei einer Umfrage war den Befragten im Laufe des Interviews eine kleine Karte mit einer Fantasiemarke vorgelegt worden. Sie wurden gebeten zu sagen, ob sie sich unter der Markenbezeichnung eher Zigaretten, Rasierwasser, Gesichtscreme, ein elektrisches Gerät oder Schokolade vorstellen würden. Interviewer, die selbst den Markennamen mit Rasierwasser in Verbindung gebracht hatten, erzielten signifikant mehr Nennungen in dieser Richtung als andere Interviewer. Eine weitere Gruppe von Interviewern
3. Kapitel: Der Interviewer
99
hatte den Namen mit Zigaretten in Verbindung gebracht und erzielte ebenfalls mehr Nennungen in dieser Richtung als andere Interviewer. Haedrich bezeichnet das beobachtete Phänomen zwar ohne nähere Begründung als "Einfluß der Assoziationsrichtung der Interviewer"; es erscheint aber plausibel, von Wahrscheinlichkeitserwartungen zu sprechen. Wenn der Interviewer eine genaue Vorstellung von objektiv nicht richtigen bzw. falschen Antworten hat, muß ernsthaft befürchtet werden, daß Wahrscheinlichkeitserwartungen wirksam werden. Ein Experiment von STANTON UND BAKER (1942), in dem die Autoren allerdings nicht explizit von Wahrscheinlichkeitserwartungen sprechen, zeigt die vermuteten Ergebnisse. Fünf hauptberufliche Interviewer wurden instruiert, daß sie die Gedächtnisleistung von 200 Studenten testen sollten. Den Studenten war vorher eine Serie von 12 geometrischen Figuren mit dem Hinweis gezeigt worden, es handele sich um Zeichen einer antiken Sprache. Diese Zeichen wurden ihnen anschließend zweimal — im Abstand von einer Woche bzw. 14 Tagen - zusammen mit jeweils einem anderen Zeichen zur Prüfung des Wiedererkennungsvermögens erneut vorgelegt. Versteckt wurden Wahrscheinlichkeitserwartungen der Interviewer geweckt, da ihnen ein Schlüssel zum Fragebogen hinzugegeben wurde, der angeblich zeigte, welches Symbol dem Befragten ursprünglich vorgelegen habe. Der "Schlüssel" enthielt sowohl richtige als auch falsche Informationen. Die Antworten der Befragten wurden in zwei Gruppen eingeteilt: 1. korrekte und in Übereinstimmung mit der Erwartung des Interviewers und 2. korrekte, aber gegen die Erwartung des Interviewers. Die Ergebnisse zeigen, daß signifikant mehr richtige Antworten in Übereinstimmung mit der Interviewererwartung als gegen ihre Erwartung gegeben wurden. Die Signifikanz erhöhte sich beim zweiten Interview noch wesentlich gegenüber dem ersten nach einer Woche. Eine Replikation dieses Experiments in etwas abgewandelter Form von FRIEDMAN (1942) konnte die Ergebnisse von Stanton und Baker jedoch nicht bestätigen. Einen Anhaltspunkt für das Zustandekommen dieser Verzerrungen im Sinne einer direkten Einflußnahme auf den Responden ten liefern zwei Arbeiten von FIELD (1955) und HILDUM UND BROWN (1956). Field ging bei ihren Untersuchungen von der Frage aus, ob Lob und Ermunterung durch den Interviewer den Rapport im Interview und damit die Gültigkeit der Antworten fördern könne. Es ergaben sich tatsächlich bei einzelnen Fragen Antwortunterschiede, je nachdem, ob die Interviewer die Respondenten durch Bemerkungen wie "that's fine", "that's a good answer" usw. lobten oder nicht. So nahm vor allem unter der experimentellen Bedingung " L o b " die Häufigkeit der "weiß nichf'-Antworten ab, während Originalität und Zahl der Antworten auf offene Fragen zunahmen. Während Field in dieser Form der systematischen verbalen Konditionierung ein Mittel der Gültigkeitserhöhung sieht, betrachten Hildum und Brown die verbale Konditionierung als möglichen verzerrenden Einflußfaktor. Sie beauftragten eine Linguisten, telefonisch Studenten zu befragen. Der Fragebogen enthielt Erziehungsfragen, zu denen man bei den Studenten keine ausgeprägte Meinung im vorhinein erwartete. Nach Ansicht der Autoren waren die Fragen so angeordnet worden, daß insgesamt eher eine geschlossene Stellungnahme als einzelne Meinungen geäußert werden konnten. Durch die Bemerkungen "gut" bzw. "Mm-hmm" versuchte der Interviewer die Äußerungen der Befragten in eine vorgegebene Richtung zu lenken. Von den 40 zufällig ausgewählten Studenten wurden jeweils 10 folgende Reizen ausgesetzt:
100
1. 2. 3. 4.
4. Band: Erhebungsmethoden: Die Befragung
Befürwortung d u r c h " g u t " Ablehnung d u r c h " g u t " Befürwortung d u r c h " M m - h m m " Ablehnung d u r c h " M m - h m m "
Eine signifikante Einflußnahme konnte nur bei " g u t " nachgewiesen werden und zwar in beiden Richtungen. Bei einer zusätzlichen Befragung der Studenten stellte sich heraus, daß nur 2 der insgesamt 40 Versuchspersonen überhaupt die Konditionierung wahrgenommen hatten. Der Unterschied zwischen diesem Feldexperiment und dem Feldinterview besteht darin, daß hier der Interviewer die erklärte Aufgabe hatte, den Befragten zu konditionieren. Daß das prinzipiell möglich ist, war jedoch bereits aufgrund der Ergebnisse früherer verbal-conditioning Experimente zu erwarten (GREENSPOON 1 9 5 5 ; TAFFEL 1 9 5 5 ; vgl. dazu auch die Sammelreferate von KRASNER 1 9 5 8 und TIMAEUS 1 9 6 7 ) . Die grundsätzliche Frage, ob die Beeinflussung im Interview tatsächlich über das Medium der Konditionierung oder durch ein anderes zustandekommt, ist damit noch nicht beantwortet. Die Ergebnisse einer neueren Studie von MARQUIS UND CANNELL ( 1 9 7 1 ) sprechen allerdings für diese Annahme. Das Ziel der bisher vorgetragenen Arbeiten bestand darin, Beiträge zur Verminderung des "gross effects" zu liefern. Die Ergebnisse zeigen aber, daß die Forschung keineswegs ein befriedigendes Stadium erreicht hat. Es kann zwar als gesichert angesehen werden, daß sichtbare Merkmale der Interviewer vielfach eine Verzerrung der Antworten auslösen, wenn die Befragten einen Zusammenhang zwischen dem Thema der Befragung und einem Merkmal des Interviewers sehen. Richtung und Ausmaß der Verzerrung lassen sich aber (noch) nicht im voraus abschätzen. Bei der Suche nach einer umfassenden Lösung dieses Problems war die Hypothese aufgestellt worden, ähnliche Gruppenzugehörigkeit zwischen Interviewer und Befragten erzeuge eine Atmosphäre im Interview, die ein Höchstmaß an Gültigkeit der Antworten fördere. Diese Hypothese konnte nicht hinreichend bestätigt werden, wobei noch angenommen wurde, daß HYMAN ( 1 9 5 4 ) und BENNEY U.A. ( 1 9 5 6 ) eine Operationalisierung gelungen ist und daß Rapport tatsächlich die Gültigkeit der Antworten fördert, was aber auch nicht als gesichert angesehen werden kann. Schulung und Persönlichkeitsfaktoren der Interviewer erlauben ebenfalls keine genauen Aussagen über die Effektivität der Interviewerleistung. Schließlich können Einstellungen und Erwartungen der Interviewer Verzerrungen der Befragungsergebnisse auslösen, die ebenfalls nicht zufriedenstellend kontrolliert werden können.
3.4
Strategie und Kosten des Interviewereinsatzes
Um dem Problem des unerwünschten Interviewereinflusses einigermaßen begegnen zu können, haben sich verschiedene Strategien herausgebildet, die durch geeigneten Einsatz der Interviewer mögliche Verzerrungen mildern sollen. Dabei können grundsätzlich zwei Wege eingeschlagen werden: 1. Gezielter Einsatz der Interviewer. Nach dem derzeitigen Stand der wissenschaftlichen Entwicklung erscheint der gezielte Einsatz von Interviewern, wie ihn etwa
3. Kapitel: Der Interviewer
Insgesamt
101
Institut f. Demoskopie Allensbach
Amerikanische Institute
1963
Gallup
Ν ore
Roper
800
1.198
1.161
277
69% 31%
40% 60%
15% 85%
3% 97%
100%
100%
100%
100%
32%
21% 27%
43% 42% 12% 3%
1
)
darunter Männer Frauen
Alter: Unter 30 Jahren 30 - 39 Jahre 40 - 49 Jahre 50 Jahre u. älter
Schulbildung: Volksschule Höhere Schule (College)
Beruf: Berufstätige sind darunter: Landwirtsch. Berufe Arbeiter Büroberufe (Angest., Beamte) Selbständige, freie Berufe) Hausfrauen Rentner
22%
28% 24%
32% 36% 23% 9%
100%
100%
100%
100%
41% 59%
23% 77%
20% 80%
Χ 100%
100%
100%
100%
100%
26% 20%
75% 2% 21% 52%
18% 7% 100%
1) (Quelle: HYMAN1954, S. 152, Tabelle 28) Während die Stäbe untereinander größten teils beträchtliche Homogenität aufweisen, wichen Sie mit Ausnahme des Kriteriums Rassenzugehörigkeit von der Gesamtbevölkerung ab.
Darstellung 4: Die demographische Zusammensetzung von Interviewer-Organisation e n ( Q u e l l e : NOELLE 1 9 6 7 , S. 1 7 8 )
102
4. Band: Erhebungsmefoderi: Die Befragung
MOSER (1961) vorschlägt, recht problem? isch. Verzerrende Wirkung der Interviewer wird dadurch nicht mit Sicherheit beseitigt (SCHEICH 1967, S. 159;HAEDRICH 1964, S. 5 5 -
56).
2. Zufällige Zuordnung der Interviewer auf die Befragten. SCHEUCH (1967) glaubt in Anlehnung an HYMAN (1954), die zufällige Aufteilung der Interviewer auf die Befragten als die geeignete Methode ansehen zu können, die es erlaube, die systematische Einwirkung von Interviewern in einen berechenbaren Zufallsfehler umwandeln zu können. Es erscheint plausibel, daß der "net-effect" durch diese Maßnahme vermindert wird. Dabei muß aber eine entscheidende Variable berücksichtigt werden, die SCHEUCH ( 1 9 6 7 ) u n d HYMAN ( 1 9 5 4 ) n i c h t genügend herausstellen: Es m u ß n ä m l i c h
der Grad der Homogenität des Interviewerstabes bedacht werden, d.h. wieviele Interviewermerkmale überhaupt für eine Zufallsordnung zur Verfügung stehen. Wenn ein Interviewerstab nur aus Männern besteht, dann kann es schon sehr wichtig sein, daß diese ihren Befragten zufällig zugeordnet werden, um zum Beispiel zu verhindern, daß sich junge Interviewer eher junge Befragte und ältere Interviewer eher ältere Befragte aussuchen. Hierdurch kann aber noch nicht ein möglicher Effekt ausgeschaltet werden, der dadurch hervorgerufen wird, daß nur Männer als Interviewer eingesetzt werden. Wenn nun zusätzlich Frauen als Interviewer eingesetzt werden, so ist noch nicht ein möglicher Effekt beseitigt, der etwa dadurch entsteht, daß alle Interviewer der Mittelschicht angehören. Allzu große Homogenität des Interviewerstabes kann also negative Auswirkungen haben, die zwar sicherlich durch Zufallsordnung gemindert, aber nicht ausgeschaltet werden können (vgl. auch SHEATSLEY 1950). Wie berechtigt diese Überlegungen sind, läßt sich aus einer Übersicht der Verteilung demographischer Merkmale von Interviewern verschiedener demoskopischer Institute in den USA und Deutschland ersehen (Darstellung 4). Die Homogenität der Interviewerstäbe erklärt sich u.a. aus den Anforderungen, die an die Interviewer gestellt werden (vgl. SHEATSLEY 1951). Wollte man andere Populationen für die Interviewertätigkeit gewinnen, müßte wahrscheinlich das derzeit relativ niedrige Honorar erhöht werden. Neben dem Interviewerhonorar entstehen Kosten, die in ihrer Höhe von der Art der Stichprobe, der Dauer des Interviews sowie dem Standardisierungsgrad des Fragebogens abhängen. In der Praxis werden diese Kosten ziemlich grob nach einzelnen Erfahrungssätzen kalkuliert. Die Möglichkeiten einer systematischen Kostenanalyse wurden von MAYER (1964) durch Computer-Simulation untersucht. Das Interviewerhonorar ist dabei nicht nur kostentechnisch als Schlüsselgröße anzusehen. ADAMS (1963) konnte nämlich experimentell nachweisen, daß die Interviewerleistungen und damit die Aussagekraft von Befragungsergebnissen entscheidend von der Höhe des Honorars beeinflußt werden können.
3. Kapitel:
Der Interviewer
103
Literatur J., Toward an Understanding of Inequity, in: Journal of Abnormal and Social Psychology 67, 1963, S. 422 - 436.
ADAMS, ST.
Interviewing procedure Hill 1958.
ADAMS, S T . J . ,
A
manual for survey interviewers, Chapel
H., Befragung und Erhebung, in: C . F . GRAUMANN (Hrsg.), Sozialpsychologie, 1. Halbband, Handbuch der Psychologie, Bd. 7, Göttingen 1969, S. 567 - 617.
ANGER,
M. UND CH. F . CANNELL, A research note on an attempt to predict interviewer effectiveness, in: Public Opinion Quarterly 23, 1959, S. 571 — 576.
AXELROD,
S., Observations on the so-called cheater problem among field interviewers, in: International Journal of Opinion and Attitude Research 2, 1948, S. 89 - 96.
BENNETT, A.
A. STAR, Age and Sex in the Interview, in: American Journal of Sociology 62, 1956, S. 143 - 152.
BENNEY, M . , D . RIESMAN UND SH.
BLUM, M . L . UND J . C . NAYLOR, I n d u s t r i a l P s y c h o l o g y , N e w Y o r k
1968.
BROWN, M . , z i t . b e i H . HYMAN, I n t e r v i e w i n g i n S o c i a l R e s e a r c h , C h i c a g o
1954,
S. 154 ff. Explict Analysis: A Design for the Study and Improvement of Psychological Interviewing, in: Educational and Psychological Measurement 14, 1954, S. 552 - 565.
BUGENTAL, J . F . T . ,
A note on interviewer effect in self-enumerative procedures, in: American Sociological Review 29, 1964, S. 270.
CANNELL, CH. F . UND F . FOWLER,
The Influence of Interviewer and Respondent. Psychological and Behavioral Variables on the Reporting in Household Interviews, in: National Center for Health Statistics, Series 2, 26, Washington 1968a.
CANNELL, CH.F., F . J . FOWLER U N D K . H. MARQUIS,
Interviewing, in: G . LINDZEYUND E . ARONSON (Hrsg.), The handbook of Social Psychology, Bd. 2, Reading 2. Auflage 1968b, S. 526 - 595.
CANNELL, CH. F . UND R . L . KAHN,
CANTRIL, H . ,
Gauging public opinion, Princeton
1947.
L. P., The influence of military government sponsorship in German opinion polling, in: International Journal of Opinion and Attitude Research 4, 1950, S. 151 - 177.
CRESPI,
Α., R. W. BOYD UND M. GREENBLATT, Psychological correlates of tension and antagonism during psychotherapy, in: Psychosomatic Medicine 19, 1957, S. 99 - 104.
DIMASCIO,
DURBIN, J. UND A. STUART, Differences in response rates of inexperienced and experienced interviewers, in: Journal of the Royal Statistical Society 114, 1951, S. 163 - 206. J., F. L . Fox UND C H . MEIGHT, Tests for field interviews, in: The Journal of Marketing 16, 1952, S. 301 - 306.
DVORAK, B .
104
4. Band: Erhebungsmethoden: Die Befragung
ERBSLÖH, E., Die unkontrollierte Einflußnahme des Interviewers im Forschungsinterview, in: Studien zum Interview, Meisenheim a. Glan 1973, S. 1 — 67. EVANS, F., On interviewer cheating, in: Public Opinion Quarterly 25, 1961, S. 126 — 127. FESTÍNGER, ι . , A T h e o r y of Cognitive Dissonance, Evanston 1957. FIELD, J. B., T h e effects of praise in a public opinion poll, in: Public Opinion Quarterly 19, 1955, S. 85 - 9 1 . FISHER, H., Interviewer bias in the recording operation, in: International Journal of Opinion and A t t i t u d e Research 4 , 1950, S. 391 - 411. FLUGEL, J. C., H u m o r and laughter, in: G. LINDZEY (Hrsg.), The H a n d b o o k of Social Psychology, Bd. 2, Reading 1954, S. 7 0 9 - 734. FRIEDMAN, P., A second experiment o n interviewer bias, in: Sociometry 5, 1942, S. 378 - 381. GREENSPOON, J. T., T h e reinforcing effect of two spoken sounds on the f r e q u e n c y of two responses, in: American Journal o f Psychology 68, 1955, S. 4 0 9 — 4 1 6 . GUEST, L., A s t u d y of interviewer competence, in: International Journal of Opinion and A t t i t u d e Research 1, 1947, S. 17 - 30. GUEST, L., A new training m e t h o d for opinion interviewers, in: Public Opinion Quarterly 18, 1958, S. 287 - 299. GUEST, L. UND R. NUCKOLS, A laboratory experiment in recording in public opinion interviewing, in: International Journal of Opinion and A t t i t u d e Research 4, 1950, S. 3 3 6 - 352. HAEDRICH,G., Empirische Studien über den Interviewereinfluß in der demoskopischen Marktforschung, in: GfM-Mitteilungen 3/4, 1962, S. 106 - 109. HAEDRICH, G., Der Interviewer-Einfluß in d e r Marktforschung, Wiesbaden 1964. HILDUM, D. C. UND R. W. BROWN, Verbal reinforcement and interviewer bias, in: Journal of A b n o r m a l and Social Psychology 53, 1956, S. 108 - 111. HULL, C. L., A behavior system, New Haven 1952. HYMAN, H. H. Interviewing in Social Research, Chicago 1954. KAHN,R. UND CH. F. CANNEL, T h e Dynamics of Interviewing, 7. Auflage New York 1963. KATZ, D., DO interviewer bias poll results?, in: Public Optinion Quarterly 6, 1942, S. 2 4 8 -
268.
KRASNER, L., Studies in the conditioning of verbal behavior, in: Psychological Bulletin 55, 1958, S. 148 - 170. KUNZ.G., Interview, in: W. BERNSDORF (Hrsg.), Wörterbuch der Soziologie, Stuttgart 2. Auflage 1969, S. 4 9 8 - 514. LENSKI, G. E. UND J. C. LEGETT, Cast, class, and difference in t h e research interview, in: American Journal of Sociology 65, 1960, S. 4 6 3 - 467.
3. Kapitel: Der Interviewer
105
Soziale Aktivierung, Untersuchungen zur Gültigkeit der modifizierten Social-Facilitation-Hypothese von Robert B. Zajonc, Diss. Köln 1969.
LOCK, H . E . ,
MACCOBY, E. E. UND N. MACCOBY, The Interview: A Tool of Social Science in: G. LINDZEY (Hrsg.), Handbook of Social Psychology, Bd. 1, Reading 1 9 5 4 , S. 4 4 9 - 4 8 7 . MARQUIS, Κ. Η. UND CH. F. CANNEL, Effect of some experimental interviewing techniques on reporting in the health interview survey, in: National Center for Health Statistics, Series 2, 41, Washington 197 1. MAYER, C H .
S., Interviewing Costs in Survey Research, Ann Arbor, Mich. 1964.
MAYNTZ, R . , K . HOLM UND P . HÜBNER,
Einführung in die Methoden der empirischen
Soziologie, Köln/Opladen 1969. MOSER, C., Survey methods in social investigation, London 1961. NOELLE, E., Umfragen in der Massengesellschaft, Hamburg 2. Auflage 1967. O'DELL, J. W., Group size and emotional interaction, in: Journal of Personality and Social Psychology 8, 1968, S. 75 - 78. OLMSTEDT, D.W., The accuracy of the impression of survey interviewers, in: Public Opinion Quarterly 26, 1962, S. 635 - 647. PARTEN, M . ,
Surveys, polls, and samples, New York
1950.
Α., Contagious bias in the interview, in: American Journal of Sociology 35, 1929, S . 420 - 423.
RICE, ST.
Some observations on the interviewing in the teacher apprehension study, in: P . F . LAZARSFELD UND W. THIELENS (Hrsg., The Academic Mind, Glencoe 1958, S. 266 - 370.
RIESMAN, D . ,
RIJKSEN, P. UND A. VAN BERGEN, Interviewverslagen, in: Nederlands tijdschrift voor de psychologie en haav grensgebieden 14, 1959, S. 58 - 69. RING, E., Ausdrucksbeobachtungen in der Demoskopie, in: Psychologie und Praxis 11, 1967, S. 1 - 1 1 . S. RHODE, T W O experiments with an antisemitism poll, in: Journal of Abnormal and Social Psychology 41, 1946, S. 136 - 144.
ROBINSON, D . UND
Das Interview in der Sozialforschung, in: R . KÖNIG (Hrsg.), Handbuch der Empirischen Sozialforschung, Bd. I, Stuttgart 2. Auflage 1967, S. 136 - 196; Bd. 2, 3. umg. u. erw. Auflage 1973.
SCHEUCH, Ε . Κ . ,
H. UND J. M. CONVERSE, The Effects of Black and White Interviewers on Black Responses, in: Public Opinion Quarterly 35, 1971, S. 44 - 68.
SCHUMAN,
SHEATSLEY, P. Β., An analysis of interviewer characteristics and their relationship to performance, in: International Journal of Opinion and Attitude Research 4, 1950, S . 473 - 4 9 8 . SHEATSLEY, P. B., An analysis of interviewer characteristics and their relationship t o performance, Part II, in: International Journal of Opinion and Attitude Research 5, 1951, S. 79 - 9 3 .
106
4. Band: Erhebungsmethoden: Die Befragung
SIDNEY, E . UND M . BROWN,
The skills of interviewing, London
1961.
The biasing effect of interviewer expectations on survey results, in: Public Opinion Quarterly 14, 1950, S. 491 — 506.
SMITH, H . L . UND H . H . HYMAN,
SPENCE, K. W., Behavior theory and conditioning, New York 1956. STANTON, F. UND Κ. H. BAKER, Interview - bias and the recall of incomplete learned materials, in: Sociometry 5, 1942, S. 123 - 134. STAR, SH. Α . , z i t . b e i M . BENNEY, Ο. RIESMAN UND SH. A . STAR, A g e a n d s e x i n t h e
interview, in: American Journal of Sociology 62, 1956, S. 143 - 152. W., Some characteristics of effective interviewers, in: Journal of Applied Psychology 50, 1966, S. 487 - 492.
STEINKAMP, ST.
interviewer effects operate through question form, in: International Journal of Opinion and Attitude Research 3, 1949, S . 4 9 3 - 511. TAFFEL, C . , Anxiety and the conditioning of verbal behavior, in: Journal of Abnormal and Social Psychology 51, 1955, S. 496 - 501. STEMBER, H . UND H . H . HYMAN, HOW
Verbale Konditionierung und Personvariablen, in: Zeitschrift für experimentelle und angewandte Psychologie 14, 1967, S. 155 - 184.
TIMAEUS, E . ,
Interviewer-respondent interaction: A study of bias in the information interview, in: Sociometry 27, 1964, S. 338 — 352.
WILLIAMS, A . J . JR.,
ZAJONC, R. B., Social facilitation, in: Science 149, 1965, S. 269 - 274. ZAJONC, R. B., Social psychology; an experimental approach, Belmont, Calif. 1966.
4.
Der Befragte von Hartmut Esser
4.1
Der Befragte in der Forschungspraxis
Die in der einschlägigen Literatur zur Methodik des Interviews immer wieder vertretene Feststellung, die Lehre vom Befragten sei im Vergleich zum Wissen über andere Elemente der Befragung in den Sozialwissenschaften am geringsten entwickelt (vgl. SCHEUCH 1967a) impliziert zweierlei: Einmal das Eingeständnis der Sozialforschung, über ihr "Objekt" bislang weder hinreichend empirische noch theoretisch befriedigend interpretierbare Kenntnisse zu besitzen, und zum zweiten — damit eng verbunden — hinsichtlich der bei der Datensammlung eingesetzten Verfahren über nur unzureichende Maßstäbe der Interpretation und Einschätzung der als Basisaussagen in der soziologischen Theoriebildung verwendeten Daten aus Befragungen zu verfügen. Zwar ist allgemein bekannt, daß der Befragte — ablesbar etwa an dem asymmetrischen Charakter der Interaktionsbeziehung im Interview und seiner Unterlegenheit in Wissen und Vorbereitung über das geforderte Verhalten — zur wichtigsten Begrenzung der Anwendung des Interviews wird, und Strategien, Regeln und Taktiken der Interviewdurchführung allgemein doch auf "Unterstellungen über den Befragten" beruhen (SCHEUCH 1967a). Den Mangel an Wissen über das Verhalten des Befragten im Meßvorgang jedoch für verwunderlich zu halten, hieße wissenschaftssoziologisch interpretierbare soziale Vorgänge zu unterschätzen, in denen sich im Verlauf der Institutionalisierung von Wissenschaften und dem damit zusammenhängenden Bemühen nach theoretischer Deutung und Standortflndung das Augenmerk von der Erhebungsebene der Daten mehr und mehr der Interpretationsebene zuwendet (vgl. K R E U T Z 1970/71): Das Wissen um methodische Unklarheiten schon auf der Meßebene ist mit der Etablierung von Sozialforschung als schon gleichermaßen empirisch fundierte, theoretisch gehaltvolle wie praktisch anwendbare Wissenschaft nur schwer vereinbar. Die offensichtliche Vernachlässigung der Verhaltensweisen des Befragten im Erhebungsvorgang ergibt sich dabei aus einer Reihe in der Praxis der Forschung liegenden Gründen. Der meistgenannte Grund ist die im Vergleich zu anderen Maßnahmen bei Vorbereitung und Durchführung von Befragungen (Fragebogenkonstruktion, Frageformulierung, Interviewerrekrutierung und -einsatz etc.) nur geringe Möglichkeit, auf den Befragten im Sinne eines "optimalen" Interviewverhaltens einzuwirken (SCHEUCH 1967a). Eine Lösung der Frage nach der Herstellung geeigneter Abrufbedingungen durch Einwirkung auf den Befragten versuchten die unterschiedlichen Konzeptionen der opti-
108
4. Band: Erhebungsmethoden: Die Befragung
malen Interviewerstrategie in Form der "weichen" ( R O G E R S 1 9 4 5 ) , der " h a r t e n " (KINSEY 1 9 4 8 ) und schließlich der "neutralen" Vorgehensweise (HYMAN 1 9 5 4 ; SCHEUCH 1967a; ->· Bd. IV: van Koolwijk, Die Befragungsmethode; Bd. IV: Erbslöh und Wiendieck, Der Interviewer), wobei zu beachten ist, daß diese Strategien jeweils aus unterschiedlichen Annahmen über das typische Befragtenverhalten und auf dem Hintergrund bestimmter Untersuchungsziele und Forschungsansätze entwickelt und dann generalisiert wurden: Der Befragte interessiert in jedem Fall lediglich als Datenträger, nur die unterstellten Voraussetzungen zum Datenabruf und die daraus resultierenden Befragungstaktiken variieren, wobei z.T. bewußt gewisse Informationsverzerrungen durch provozierte "Fehlreaktionen" in Kauf genommen bzw. als zusätzliche Daten gewertet werden. Die volle Berücksichtigung der unterschiedlichen Reaktionen der Befragten auf den Meßvorgang selbst stößt weiterhin auf eine immer deutlicher werdende Schwierigkeit, die bislang auch durch die Weiterentwicklung und Anpassung des Instrumentariums nur teilweise aufgefangen werden konnte: Die zunehmende Verwendung standardisierter Verfahren und die Ausdehnung der Anwendung sozialwissenschaftlicher Erhebungsinstrumente auf immer mehr unterschiedliche und heterogene Populationen (besonders etwa bei interkulturellen Vergleichen) setzt die Einkalkulierung bestimmter Unschärfen des Instruments voraus. Damit sei nicht auf eine prinzipielle Unangemessenheit dieser Verfahren verwiesen, sondern nur daran erinnert, daß Standardisierung — auf die aus Gründen der Vergleichbarkeit und Forschungsökonomie nicht verzichtet werden kann — allerdings Kenntnisse über etwa auftretende systematisch-verzerrende Wirkungen durch das Instrument selbst auf die inhaltlichen Ergebnisse voraussetzt. Schließlich würde die Auswertung der erhaltenen Daten nahezu undurchführbar, könnte nicht von der Annahme der prinzipiellen Vergleichbarkeit der Daten ausgegangen werden. Für die Auswertung bedeutet die Unterstellung der Konstanz, Konsistenz und Veigleichbarkeit der Reaktionen der Befragten im Meßvorgang eine notwendige Erleichterung unter der Gefahr von Fehlinterpretationen etwa derart, daß Reaktionen auf den Meßprozeß zu inhaltlichen Aussagen über die Befragten werden, ohne d a ß die Reaktionen sich primär auf die vom Forscher gesetzten Stimuli beziehen. Hinzu k o m m t , daß die Entdeckung von systematischen Fehlinterpretationen durch unberücksichtigte Verhaltensweisen der Befragten im Erhebungsvorgang — zumindest gelegentlich — bis dahin zum Wissenschafts-"paradigma" gehörenden theoretischen Aussagen die Grundlage entzieht und schon von daher auch die praktische Berücksichtigung der Ergebnisse der empirischen Auslotung des Meßvorgangs auf Widerstand trifft (vgl. z.B. die regelmäßigen Warnungen vor verbalen Messungen von "Persönlichkeitsvariablen" und deren ebenso regelmäßige Ignorierung: MCNEMAR 1 9 4 6 ; LENSKI UND LEGGETT 1 9 6 0 ; WICKER 1 9 6 9 ; C A R R 1 9 7 1 ; PHILLIPS 1 9 7 1 ) .
Von daher kann es nicht verwundern, daß vom Befragten meist nur im Zusammenhang der "Vermeidung punktuell hervorgehobener Fehlermöglichkeiten" gesprochen wird, wobei diese Erörterungen oftmals Erfahrungen der Forschungsfolklore verallgemeinern — etwa in dem Standard der notwendigen Einhaltung "natürlicher Gesprächssituationen". "Fehlverhalten" des Befragten in vielerlei Spielarten bildet somit auch den Hauptteil der Kenntnisse über den Befragten.
4. Kapitel: Der Befragte
109
4.2
Anforderungen an den Befragten durch die Untersuchungsanordnung
4.2.1
Die Untersuchungsanordnung beim Interview
Die überwiegend geübte Praxis des sozialwissenschaftlichen Interviews unterlegt zumindest implizit ein bestimmtes Modell, das in Entsprechung zu analogen Meßanordnungen in den Naturwissenschaften für die Untersuchungsanlage von Befragungen auf eine möglichst weitgehende Trennung und wechselseitige Autonomie von Meßsystem und Untersuchungsobjekt abzielt: Das Untersuchungsobjekt interessiert nur als Informationsträger für bestimmte, im jeweiligen Forschungszusammenhang relevante Daten; das Meßinstrument selbst ist autonom (wenn auch nicht unabhängig) von den jeweiligen Eigenschaften der Meßobjekte; Meßobjekte und Meßinstrument sollen sich durch den Meßvorgang selbst hinsichtlich der für die jeweilige Forschungszielsetzung wichtigen Merkmale nicht verändern. Aus dieser Konzeption leitet sich die allgemeine Forderung nach einer "neutralen" Beziehung zwischen Interviewer und Befragtem ab; die Feststellung des genuin sozialen Charakters des Befragungsvorgangs gilt als Hinweis auf potentielle Fehlerquellen oder u.U. auf ethische Fragen sozialwissenschaftlicher Forschungspraxis (vgl. F U C H S 1971). Die geforderte Neutralität von Interaktionsbeziehung und Selbstverständlichkeit der Rolle des Befragten durch den Befragten setzt für die Befragung eine Reihe von Verhaltensvorschriften, für die zu untersuchen ist, inwieweit sie einmal nur durchsetzbar ist auf dem Hintergrund ganz bestimmter, abgrenzbarer kultureller Bedingungen bzw. welche Auswirkungen eine (möglicherweise unvermeidbare) Nichteinhaltung der Vorschriften hinsichtlich der Eigenschaftszuweisung auf die Befragten hat, ohne daß diese Eigenschaftszuweisung gemäß bestimmter Kriterien von "Gültigkeit" gerechtfertigt wäre. Die der unterlegten Wissenschaftslogik am ehesten entsprechende Vorgehensweise des neutralen Interviews enthält sich z.B. zwar weitgehend der Einwirkung auf die Autonomie des Befragten, doch ist damit noch keineswegs sichergestellt, daß der Datenabruf auch so verläuft, daß sich die Reaktion des Befragten allein oder vorwiegend auf die vom Forscher präsentierten und intendierten Stimuli bezieht. Ansätze, die anstreben, gerade dem sozialen Charakter der Befragung Rechnung zu tragen, etwa in Form des "action research", auch auf der Grundlage der Erweiterung der Forschung um eine explizit politische Dimension, sollen hier nicht weiter verfolgt werden, wenngleich die Ergebnisse der "Fehlerforschung" gerade für deren Zielsetzung ungemein aufschlußreich sein dürften, wie umgekehrt die Interpretation von "Fehlverhalten" als neben anderen sozialen Merkmalen gleichwertige Information über den Befragten (vgl. M A N N I N G 1966/67) dem nur an Daten interessierten Forscher Ansatzpunkte für die Entwicklung einer spezifisch sozialwissenschaftlichen Meßtheorie geben könnte, ohne die Wissenschaftslogik naturwissenschaftlichen Messens endgültig aufgeben zu müssen. 4.2.2
Die Anforderungen an den Befragten
Die aus der oben dargestellten Untersuchungsanordnung der Befragung resultierenden Anforderungen sollen im folgenden dargestellt werden zunächst ohne Rücksicht darauf, ob etwa diese Anforderungen in der praktischen Forschung durchsetzbar sind
110
4. Band: Erhebungsmethoden: Die Befragung
oder auch tatsächlich durchgesetzt werden oder ob es bereits (erfolgreiche) Gegenstrategien bei Befragtenfehlverhalten gibt - wie etwa Randomisierung möglicher Fehlerfaktoren (CAMPBELL 1 9 6 6 ) , Versuchsanordnung mit mehreren Kontrollgruppen, Mehrmethoden-Ansätze, mathematische Wichtungsverfahren zur Entzerrung von Populationen (PÖLITZ UND SIMMONS 1 9 4 9 ; BIRNBAUM UND SIRKEN 1 9 5 0 ) . Anschließend werden die tatsächliche Entsprechung dieser Anforderungen und die feststellbaren Auswirkungen von Abweichungen darzustellen sein. Die Beschreibung der Anforderungen an den Befragten kann fur drei unterschiedliche, wenngleich nur analytisch zu trennende Ebenen des Befragtenverhaltens vorgenommen werden: Die Ebene der verfugbaren Populationen aus dem Teilnahmeverhalten der Befragten, die Ebene des Interaktionsvorganges "Befragung" mit dem Interviewer und die Ebene des Datenabrufs, der Bedingungen der erfolgreichen Informationssammlung in sprachlicher und kognitiver Hinsicht. 1. Einmal hat für die Befragten als Auswahlobjekte — und nahezu jede Befragung ist mit irgendeinem systematischen Rekrutierungs- bzw. Auswahlverfahren gekoppelt zu gelten, daß sie — analog zum Urnenmodell - grundsätzlich mit gleicher oder bekannter, von 0 verschiedener Wahrscheinlichkeit in die Stichprobe gelangen können. Das heißt, die Befragten sind — soweit im Auswahlplan vorgesehen — grundsätzlich erreichbar und bereit, an der Befragung teilzunehmen. Zumindest aber wird angenommen, daß Vorgänge, die unter der Bezeichnung "Ausfälle" in der Regel den "nonsampling-errors" zugerechnet werden (DEMING 1950; 1968; SCHEUCH 1967b; MOSTELLER 1968), keinerlei Konsequenzen fur die Interpretation der erhaltenen Daten haben (z.B. wegen "Nichtrepräsentativität der Ist-Auswahl"), da Nichterreichbarkeit und Verweigerung der Teilnahme als zufällig auftretende Ereignisse betrachtet werden, die mit anderen, für das Untersuchungsziel relevanten Sachverhalten und Befragteneigenschaften nicht korreliert sind (->- Bd. VI: Sturm und Vajna, Zufallsstichproben). Neben das Erfordernis der Vollständigkeit der für die Untersuchung vorgesehenen Populationen tritt — etwa für Panel-Studien — die Anforderung der Nicht-Selektivität der Teilnahme in der Zeit bzw. nach Erfahrungen in den Vorbefragungen. Sogenannte natürliche Verluste (Tod, Wanderung etc.) sind zwar unvermeidbar, doch damit die Ergebnisse vergleichbar bleiben, dürfen selektive Veränderungen der Ausgangspopulation keine unmittelbare Beziehung zur jeweiligen Forschungsfrage bzw. z u m Î x p e r i m e n t a l f a k t o r haben, es sei denn, Ausmaß und Richtung dieser Beziehungen seien bekannt oder kontrollierbar. Andernfalls besteht die Gefahr des Fehlschlusses von Veränderungen der Gesamtreaktion auf das Meßinstrument durch Populationsselektivität auf Veränderungen in den interessierenden Variablen. 2. Für die Ebene des Interaktionsprozesses im Interview ergeben sich einige Anforderungen an den Befragten, die sich unmittelbar aus der typischen Interaktionsbeziehung als kurzfristiger, konsequenzenloser Begegnung einander i.d.R. fremder Personen in dyadischer Form ableiten, wobei die Zielsetzung dieser Begegnung nicht aus der Interaktion der Personen selbst motiviert ist. Diese Kennzeichnung verweist bereits auf die kulturelle Verankerung des geforderten Interaktionsverhaltens: Die Abstraktion von der aktuellen Beziehung, das Vorherrschen kognitiver Kommunikationsinhalte gegenüber der Herstellung und Aufrechterhaltung persönlicher Solidarität (vgl. SCHEUCH 1967a), was in der Folge keine Probleme der Anonymität, tabuisierter The-
4. Kapitel: Der Befragte
111
men, unangenehmer Fragen oder der sozialen Erwünschtheit von Äußerungen bedingen soll, fordert vom Befragten ein Rollenverständnis, das seinerseits nicht untypisch ist für das gesellschaftliche Selbstverständnis von Sozialwissenschaftlern (vgl. SJOBERG 1 9 5 7 ) . Sinnverständnis für das gesamte Unternehmen der Befragung, die Selbstdefinition des Befragten nicht als "Person", sondern als austauschbares Untersuchungsobjekt sind weitere Bedingungen, die o.a. Interpretation nahelegen: Der Befragte hat sich im Interaktionsprozeß selbst so zu sehen, wie er den Sozialforscher interessiert, als Datenträger; seine Motivation zur Teilnahme beschränkte sich auf die Sachorientierung (vgl. "task involvement" bei H Y M A N 1 9 5 4 ; "instrumental motivat i o n " bei R I C H A R D S O N U.A. 1 9 6 5 ) . Zur Rolle des Befragten gehört, daß er zwar — um ein relevanter Informant für den Forscher zu sein — selbst im Netz der sozialen Beziehungen steht, jedoch in der Lage ist, für die Dauer der Befragung aus diesen Alltagsbezügen herauszutreten. Seine Reaktionen in der Befragung haben sich zu beschränken auf die Stimuli, die der Forscher in Gestalt der Fragen (soweit nicht auch nicht-verbale Stimuli vorgesehen sind) setzt. Eine weitergehende Reaktivität, etwa schon auf den Vorgang der Befragung selbst (Meerschweinchen-Effekte, Interview-Effekte), Vorwissen über die Untersuchungssituation und -absichten (pretest sensitization), Reaktion auf andere als die gesetzten verbalen Stimuli (z.B. Gesten), auf bestimmte Frageformen (response set), Interviewsituation, Interviewerauftreten und -eigenschaften (Interviewer-Effekte, Rapport), auf bestimmte Merkmale der Forschungsinstitution (sponsorship bias), Rücksichtnahme auf Normen der eigenen Bezugsgruppe oder allgemeine soziale Vorschriften beim Meßvorgang (social desirability) gelten als fehlererzeugendes und mithin zu eliminierendes oder zu umgehendes Verhalten (vgl. hierzu W E B B U.A. 1 9 6 6 ; sowie -»· Bd. IV: Erbslöh und Wiendieck, Der Interviewer). 3. Auf der Ebene des Datenabrufs selbst, die eng mit dem geforderten Interaktionsverhalten verbunden ist, läßt sich gleichfalls die engumgrenzte kulturelle Grundlage des Instruments der Befragung ausmachen: Es muß zu den sozial eingeübten Verhaltensweisen gehören, in einer dyadischen Beziehung mit Fremden mitteilbare und als mitteilenswert angesehene Meinungen und Informationen zu besitzen und sich zu ihrer Äußerung fähig und kompetent zu fühlen. Daneben m u ß sozial vorgeschrieben sein, daß die verbale Mitteilung von Sachverhalten in einer dyadischen Beziehung mit Fremden entweder mit dem tatsächlichen eigenen Verhalten oder dem Verhalten anderer übereinstimmt oder aber zumindest Regelmäßigkeiten der auftretenden Abweichungen bekannt sind ( ->• Bd. III: Weidmann, Feldbeobachtung 1.1). Bei Fehlen dieser Bedingungen würde sich die Befragung auf die Stützung von Theorien beschränken müssen, die overtes Verhalten nicht umfassen. Neben diese Bedingungen des erfolgreichen und zutreffenden Datenabrufs treten weitere Anforderungen der sprachlichen Kommunikationsfähigkeit. Der Befragte m u ß in der Lage sein, die verbalen Stimuli so zu decodieren, wie es vom Forscher beabsichtigt war und gleichzeitig seine Reaktionen in eine sprachlich und sematisch äquivalente F o r m kleiden können. Dazu m u ß sichergestellt sein, d a ß alle Befragten (außer in ganz bestimmten Versuchsanordnungen) nach Inhalt und Ambiguität gleiche Stimuli in gleicher oder vergleichbarer Weise wahrnehmen. Zur Äquivalenz der Stimuli in semantischer Hinsicht m u ß in Rechnung gestellt werden, d a ß sich die Reaktion des Befragten, je nach Kontext, in dem die Stimuli präsentiert werden, ändern kann: Die sematische Äquivalenz beinhaltet situative Äquivalenz der Stimulusvorgabe, sollen die
112
4. Band: Erhebungsmethoden: Die Befragung
Ergebnisse vergleichbar und so handhabbar sein, wie es die Untersuchungsanordnung unterstellt. Mit diesen zum Datenabruf notwendigen Anforderungen der zumindest teilweisen Übereinstimmung von Kognitions-, Sprach- und Symbolsystem zwischen Befragtem, Interviewer und Sozial forscher sind je nach besonderer Anlage der Untersuchungsanordnung weitere Anforderungen gesetzt, deren Entsprechung ebenfalls nach kulturellen Kontexten nicht invariabel ist, wie etwa die Fähigkeit, Paarvergleiche durchzuführen oder Statements in eine vertikale Rangfolge einzuordnen. Die Beziehungen zwischen Befragung und Befragten sind vielfältiger als die formalen Anforderungen vorschreiben, die Auswirkungen dieser Beziehungen oft anders als das angestrebte Interviewprodukt. Für den Sozialforscher können diese Abweichungen, Reaktionsüberschüsse, Verhaltenseinseitigkeiten in mehrfacher Hinsicht interessant sein: als Hindernis zur Erlangung gültiger Daten, als Hinweise auf Überwindung oder Umgehung von Fehlreaktionen und — nicht zuletzt - als eigenständige Information über den Befragten und das Verhältnis zwischen der Institution Sozialforschung und ihrem Forschungsgegenstand. Die Vorstellung vom Befragten als Datenträger unterschlägt jedenfalls, daß der Befragte an den Vorgang der Befragung und an die Forschungsinstitution Erwartungen und Befürchtungen knüpft, deren Existenz Grundelement sozialer Interaktion jeder Art ist: Aus dem Erhebungsvorgang können die Prozesse nicht entlassen werden, die soziologische Theorie selbst zum Inhalt hat.
4.3
Probleme der untersuchten Populationen
Die Beziehung zwischen Befragten und Befragung setzt nicht erst während einer Befragung ein. Schon bei der Schaffung des Rahmens der Interaktion zwischen Interviewer und Befragtem, d.h. der Auswahl der Population und der K o n t a k t a u f n a h m e mit dem Befragten werden Vorgänge wirksam, die den Gesetzmäßigkeiten mit unterliegen, die häufig erst durch die Befragung ermittelt werden sollen. In erster Linie interessiert in diesem Zusammenhang, ob durch den Einschluß bzw. Ausschluß bestimmter Populationen in Verteilung und Relation von Variablen bestimmte Einseitigkeiten produziert werden, die selbst durch sorgfältigste technische Handhabung von Auswahloperationen nicht eliminierbar, wohl aber durch Analyse der Reaktionen der Befragten auf den " Z u g r i f f ' des Forschers kontrollierbar werden können ( v g l . CORNFIELD 1 9 4 2 ; SUCHMAN 1 9 6 2 ; ROSNOWUND ROSENTHAL 1 9 6 6 ; ROSENTHAL UND ROSNOW 1 9 6 9 ) . 4.3.1
Erreichbarkeit v o n Befragten
Üblicherweise wird bei der Analyse von Ausfällen bei Stichprobenbefragungen grob zwischen Nichterreichbarkeit und Verweigerung der Befragung unterschieden, wobei die Nichterreichbarkeit dadurch abgegrenzt wird, daß eine eigene Reaktion des Befragten auf den Befragungsvorgang noch nicht erfolgt ist (PARTEN 1950; MADGE 1953; SCHEUCH 1967b). Der Anteil der nichterreichten Personen einer Befragung hängt zwar stark vom jeweiligen Auswahlverfahren ab, für Zufallsauswahlen auf Karteibasis wird jedoch mit einem Anteil von 3 — 14% gerechnet (vgl. auch die Aufstellung bei STEPHAN UND M C C A R T H Y 1963). Problematischer als das Ausmaß der Sampleverluste, das lediglich auf der Ebene der induktiven Statistik eine Rolle spielt, ist die Frage, ob der Vor-
4. Kapitel: Der Befragte
113
gang der Nichterreichbarkeit zufallig unter den Einheiten der Ausgangsauswahl verteilt ist oder ob nur eine bestimmte, nach demographischen und sozialen Merkmalen genauer zu beschreibende Teilmenge der Ausgangsauswahl betroffen ist (vgl. HILGARD UND PAYNE 1 9 4 4 ; CROSSLEY UND FINK 1 9 5 1 ) .
Bei der Analyse der besonderen Charakteristika der Nichterreichbaren ergibt sich das Problem, daß einmal leicht eine Konfundation mit anderen Ausfallgruppen auftritt und zweitens nur schwer vollständige Informationen über die Ausfallpersonen zu erlangen sind. Insbesondere die Vernachlässigung der Trennung der Ausfälle nach Ausfallgründen hat gelegentlich zu erheblichen Verwirrungen beigetragen (vgl. z.B. LUNDBERG UND LARSON 1949; Ross 1963). Die Schwierigkeit des Mangels an Informationen über die Nichterreichten versucht man durch eine Analyse der Veränderung der Befragtenpopulation nach mehrmaligen Kontaktversuchen und Extrapolation auf den "harten Kern", sowie durch Vergleich mit verfügbaren Karteiunterlagen zu umgehen (WILLIAMS 1950; CROSSLEY UND FINK 1951; SHARP UND FELDT 1959). Obwohl Korrelate der Nichterreichbarkeit den Ergebnissen der Studien zufolge, die den o.a. Kriterien entsprachen, stark nach Survey-Anlage und Untersuchungsstrategien (z.B. nach Kontaktzeitpunkt, telephonische oder schriftliche Vorkontakte u.a.) variieren, lassen sich dennoch einige stabile Tendenzen ausmachen. Dazu gehört die leichtere Erreichbarkeit von Personen in ländlichen Gegenden (Ross 1963), von Frauen, insbesondere wenn sie nicht berufstätig sind, von Personen deren Haushalt relativ klein ist, von verheirateten und älteren Personen ( H I L G A R D UND PAYNE 1944; L U N D BERG UND LARSON 1 9 4 9 ; WILLIAMS 1 9 5 0 ; CROSSLEY UND FINK 1 9 5 1 ; SHARP UND FELDT
1959; STEPHAN UND MCCARTHY 1963). Die Erreichbarkeit scheint demnach abzuhängen von dem Netto-Effekt der mit den verschiedenen Alltagsaktivitäten der Befragten verbundenen Aufenthaltsdauer am vermuteten Wohnort, wobei sich die Rollenstruktur dieser Alltagsaktivitäten an den genannten demographischen Regelmäßigkeiten aufweist. Beispielsweise verschwinden in der Regel Unterschiede nach dem Merkmal "Schichtzugehörigkeit" (obere Schichten sind im allgemeinen leichter erreichbar, CROSSLEY UND FINK 1951), nach Alter, Geschlecht und Familienstand, wenn die Variable "Berufsausübung" konstant gehalten wird; hierin liegt ein Hinweis auf den "ökologischen" Charakter des Erreichbarkeitsproblems (SHARP UND FELDT 1959). Für unterste Sozialschichten ergibt sich daneben eine besonders hohe Neigung zur Nichterreichbarkeit — z.B. durch überaus hohe geographische Mobilität innerhalb von Stadtteilen und Nichteinhaltung von Terminabreden, Sachverhalte, die selbst Censuserhebungen in hohem Maße betreffen (vgl. WILNER U.A. 1962; WEISS 1966; ANONYMUS 1968). Ähnliches gilt allerdings auch für die K o n t a k t a u f n a h m e bei Elitebefragungen (vgl. MACCOBY 1947; LERNER 1956; SMIGEL 1958; ROBINSON 1960). Nicht die Tatsache, daß Ausfälle auftreten, ist problematisch, sondern, daß es offenbar bestimmte Teilpopulationen gibt, die für den Sozialforscher aus inhaltlichen wie methodischen Gründen unentbehrlich, jedoch kaum erfaßbar sind. Für die wichtige Frage, ob festgestellte demographische Unterschiede zwischen Erreichbaren und Nichterreichten sich in anderen Interviewangaben fortsetzen, gibt es keine eindeutige Antwort. Dennoch scheint sich abzuzeichnen, daß der "demographischen" Verzerrung keine parallele inhaltliche Verzerrung der Ergebnisse folgt: am ehesten sind Informations- und Sachfragen betroffen, am geringsten korrelieren sog. Einstellungsfragen (STEPHAN UND MCCARTHY 1 9 6 3 ) , wobei bei der Wertung dieser Feststellung zu berücksichtigen ist, daß die erwähnten Informationsbereiche sich unter-
114
4. Band: Erhebungsmethoden:
Die
Befragung
einander nach der Möglichkeit der Anlegung von externen Gültigkeitskriterien unterscheiden. Auch der Feststellung folgend, daß Verzerrungen bezüglich demographischer Merkmale nicht auch unbedingt in zumindest feststellbare Abweichungen des Interviewprodukts selbst münden müssen, dürften quantitative Maßnahmen zur Korrektur des Ist-Samples nur mit einiger Vorsicht anwendbar sein. Mit Sicherheit abzulehnen ist jedoch das "Nachziehen" nichterreichter Personen, da durch den Ersatz nichterreichter durch besser erreichbare Personen die Verzerrung eher noch verstärkt wird (MADGE 1953; DEMING 1968; SCHEUCH 1,967b). Grundlegende Voraussetzung einer Vervollständigung der Auswahl ist daher die genaue Kenntnis der demographischen Daten der Ausfallspersonen. Dies gilt für Strategien, die eine Erweiterung der Ausgangsauswahl um Personen mit "Ausfallmerkmalen" von vornherein vorsehen, so daß die "gefährdete" Gruppe zunächst überrepräsentiert ist, dann aber durch den Ausfall wieder auf den "richtigen" Anteil gelangt (KISH UND HESS 1959; SOBOL 1959); es gilt in noch erheblicherem Maße für nachträgliche mathematische Wiegeoperationen, wie sie vor allem für postalische Befragung entwickelt wurden (PÖLITZ UND SIMMONS 1949), und in extremem Maße für Extrapolationsmaßnahmen von den tatsächlich befragten Personen auf Ergebnisse unter fiktivem Einschluß der Nichterreichten. Methoden der Vervollständigung der Auswahl wie Kontaktversuche zu verschiedenen Tageszeiten und Wochentagen (vgl. CROSSLEY UND FINK 1 9 5 1 ; BRUNNER UND CARROLL 1 9 6 9 ) , vorherige Brief- oder Telephonkontakte (BRUNNER UND CARROLL 1 9 6 7 ; C A R T WRIGHT UND TUCKER 1 9 6 7 ) sind wegen der Gefahr von Nebeneffekten, wie erhebliche Steigerung der Verweigerungen mit starker Selektivität nach Teilpopulationen (vgl. GVRTWRIGHT UND TUCKER 1 9 6 7 ) oder mögliche unerwünschte Sensiblisierung der Befragten (etwa vergleichbar den "pretestsensitizazion" —Effekten bei Experimenten) problematisch. Außerdem steigen die Aufwendungen zur Erreichung der Befragten in der Regel nach dem dritten Kontaktversuch in einem für die meisten Untersuchungen nicht mehr vertretbaren Maße an. Dies scheint andererseits aber auch die Grenze zu sein, von der ab sich die objektiven Verzerrungen im Rahmen der zulässigen Fehlergrenzen halten (WILLIAMS 1 9 5 0 ) . Das Problem des Totalausschlusses extrem marginaler Teilpopulationen ist durch Aufwand in der Administration der Feldarbeit ohnehin kaum lösbar. 4.3.2
Verweigerung der Befragung
Im Unterschied zur Nichterreichbarkeit ist die Verweigerung der Befragung eine unmittelbare Reaktion des Befragten noch vor Beginn des eigentlichen Meßvorgangs, bei der eine Anzahl von Faktoren mitwirken, die auch beim Interviewvorgang selbst von Bedeutung sind (Motivation zur Teilnahme, Probleme der Rollenfindung, Bekanntheit des Interaktionsverhältnisses mit Fremden u.a.), Ebenso wie die Nichterreichbarkeit gehört der Ausfall durch Verweigerung zu den üblichen Feldarbeitsproblemen, sein Anteil an der Ausgangsauswahl beträgt i.d.R. zwischen 7 und 14% (vgl. auch hier die Aufstellung bei STEPHAN UND MCCARTHY 1 9 6 3 , S . 2 6 3 ) . Auch bei der Verweigerung ist die Hauptfrage, ob sie ein mehr zufälliges Ereignis ist oder ob bestimmte Gruppen in feststellbarem Ausmaß besonders betroffen sind. Bei Praktikern der Survey-Forschung besteht die Tendenz, Verweigerung (wie Nichterreichbarkeit) als zufällige Ereignisse zu betrachten (GALLUP 1 9 4 8 ; SHEATSLEY 1 9 4 8 ;
4. Kapitel: Der Befragte
115
SCHEUCH 1967b). Andererseits scheint der Einfluß des Erfahrungsgrades des Interviewers von Bedeutung zu sein (BENSON, BOOMAN UND CLARK 1951 ; DURBIN UND STUART 1951; CAPLOW 1956; POMEROY 1963). Durch eine intensive Schulung und Kontrolle des Interviewerstabes sei die Verweigerungsquote bedeutend reduzierbar (HENEMAN UND PATERSON 1949; STEPHAN UND M C C A R T H Y 1963). Die Auswahl von Interviewern mit bestimmten Persönlichkeitsmerkmalen (HOFFMAN - NOWOTNY 1965) und die Manipulation der Dyadenkonstellation Interviewer-Befragter in Richtung besonders kooperationsfördernder Merkmalszusammenstellungen (BENNEY, RIESMAN UND STAR 1956) hat sich indessen als wenig erfolgreich erwiesen. Dennoch scheint sicher, daß allein der persönliche Kontakt des Interviewers - jedenfalls in wesentlichen Kulturen — einen unmittelbaren "Zwang zu I n t e r a k t i o n " setzt, der nur schwer durchbrochen wird: Vorherige Brief- und Telefonkontakte ohne unmittelbare Interaktion erhöhen die Verweigerungsrate erheblich und dies besonders bei Teilpopulationen, denen Interaktionen im "Sekundärbereich" ungewohnt sind (vgl. CARTWRIGHT UND TUCKER 1967; BRUNNER UND CARROLL 1967; 1969).
Demgegenüber scheint die Ansicht, d a ß die Verweigerungsneigung der Befragten unmittelbar aus deren Alltagsbezügen resultiere, eher die feststellbaren Merkmalsunterschiede zwischen Verweigerern und Kooperativen zu erklären. Nach dieser Interpretation hängt die Kooperationsbereitschaft davon ab, inwieweit die Rolle des Informanten auch im Alltag eingeübt ist und allgemein Kontakte zu Fremden nioht ungewöhnlich und somit nicht bedrohlich erscheinen (vgl. ROSE 1 9 5 0 , HYMAN 1 9 5 4 ; SJOBERG 1 9 5 7 ; SCHWARTZ 1 9 6 4 ; WEISS 1 9 6 6 ) . Wird Befragung und Sozialforschung als Bestandteil der dominanten Kultur angesehen (DOHRENWEND UND DOHRENWEND 1 9 6 8 ) , dann ergibt sich der Widerstand zur Teilnahme aus der Selbsteinschätzung des Befragten als marginal zum umgebenden Kontext. Die Ergebnisse der Analyse der Merkmale von Verweigerern gegenüber kooperativen Befragten sind dahingehend interpretierbar, daß in erster Linie solche Bevölkerungsteile durch Verweigerung ausfallen, deren Beziehungen zu ihrer Umwelt mehr oder weniger eindeutig mit "Disengagement" umschreibbar sind: Bei den Verweigerern sind durchweg alte Menschen, Frauen, Personen mit niedrigem sozio-ökonomischen Status und geringer Schulbildung und "Randpersönlichkeiten" überrepräsentiert, wobei die jeweiligen Ursachen des Fehlens bzw. Abbruchs von Kontakten und normativen Verbindungen zur dominanten Kultur freilich nach sozialer Zugehörigkeit höchst verschieden sind. Dennoch kann die Interviewverweigerung als Ausdruck einer geringen Intensität der sozialen Verflechtung mit der dominanten Kultur im Alltag angesehen werden (vgl. GAUDET UND WILSON 1 9 4 0 ; MERTON 1 9 4 7 ; HARDING 1 9 4 7 ; BENSON, BOOMAN UND CLARK 1 9 5 1 ; BERELSON U.A. 1 9 5 4 ; VIDICH UND BENSMAN 1 9 5 4 ; LOWE UND MCCORMICK 1 9 5 5 ; SHARP UND FELDT 1 9 5 9 ; ROBINS 1 9 6 3 ; GERGEN UND BACK 1 9 6 6 ; MERCER UND BUTLER 1 9 6 7 ; BEBBINGTON
1970).
Aufschlußreich dürfte dabei die Feststellung sein, d a ß Verweigerer üblicherweise stark zur Äußerung von Vorurteilen neigen (BENSON, BOOMAN UND CLARK 1 9 5 1 ; KRUGLOV UND DAVIDSON 1 9 5 3 ) .
Gelegentliche Beobachtungen, daß etwa obere Sozialschichten eine starke Reserve gegenüber der Teilnahme an Befragungen zeigen (MACCOBY 1 9 4 7 ; SCHEUCH 1 9 5 3 ; LERNER 1 9 5 6 ) weisen d a r a u f h i n , daß noch zusätzliche Prozesse, die z.T. stark mit dem jeweiligen Befragungsthema zusammenhängen, wirksam sind; die Mehrzahl der Ergebnisse und die geringe Auswirkung von kooperationsfördernden Eingriffen des Sozialforschers (vgl. DOHRENWEND 1 9 7 0 ) lassen es jedoch sehr wahrscheinlich erschei-
116
4. Band: Erhebungsmethoden: Die Befragung
nen, daß sich in der Verweigerung die geringere rollenmäßige Verflechtung von Personen mit der dominanten Kultur niederschlägt: In Befragungsdaten sind jedenfalls in der Regel Personen umso weniger wahrscheinlich vertreten, je deutlicher sie in Merkmalen und sozialer Position von der Mittelschichtkultur (in westlichen Industriegesellschaften) abweichen. Betrachtet man die gesamten Ausfälle, so erweisen sich die Netto-Verzerrungen hinsichtlich der feststellbaren Merkmale meist als äußerst gering (vgl. RUGG 1 9 4 7 ; WALLIN 1 9 4 9 ; W I L S O N 1 9 5 0 ; SCHEUCH 1 9 5 6 ; SHARP UND F E L D T 1 9 5 9 ; STEPHAN UND MCCARTHY 1 9 6 3 ) . Begründet wird dies gelegentlich damit, daß sich Nichterreichbare und Verweigerer hinsichtlich der grundlegenden demographischen Merkmale "spiegelbildlich" unterscheiden und der Ausfall beider Gruppen gewissermaßen für die Balance der Repräsentation dieser Merkmale sorgt (vgl. GAUDET UND WILSON 1 9 4 0 ; SOBOL 1 9 5 9 ; STEPHAN UND MCCARTHY 1 9 6 3 ) . Damit ändert sich jedoch nicht der Sachverhalt, daß in den wirklich befragten Populationen Personen mit mindestens den Merkmalen der Nichtauffindbarkeit und der abwehrenden Reaktion gegen die Befragung nicht vertreten sind. Auch wenn nicht sicher — aber doch sehr wahrscheinlich — ist, daß diese Merkmale mit den jeweils untersuchten Sachverhalten in Beziehung stehen, ist der Schluß vom Ausgleich der Verzerrung demographischer Merkmale auf die Repräsentation aller anderen relevanten Merkmale nicht ohne weiteres gerechtfertigt.
4.3.3
Zur Selektivität von Populationen
Eine Selektivität von Auswahlen ist so gut wie nicht zu vermeiden; von daher wird es für die Interpretation von Interviewdaten bedeutsam, die Richtung systematischer selektiver Vorgänge bei der Populationsrekrutierung zu kennen. Allgemein kann gesagt werden, daß die Selektivität von Populationen durch Ausfälle umso größer ist, je weniger auf die Durchhaltung der Bedingungen einer Zufallsauswahl geachtet wird bzw. je weniger dies möglich ist. Für Quotenbefragungen m u ß allgemein mit einer Homogenisierung der Befragtengesamtheit in Richtung auf den "aktiven Teil" der Bevölkerung durch Selektion durch den Interviewer und den Befragten selbst gerechnet werden (vgl. KATZ 1 9 4 8 ; MOSER UND STUART 1 9 5 3 ; sowie die Diskussion um den Fehlschlag der Wahlprognosen von 1948 in den USA im International Journal of Opinion und Attitude Research, Bd. 2 ( 1 9 4 8 ) und Bd. 3 ( 1 9 4 9 ) ; ebenso -* Bd. V I : van Koolwijk, Quotenverfahren). Ähnliches kann für die Selektivität der Ausfälle bei schriftlichen Befragungen gesagt werden: wieder scheinen insbesondere untere sozio-ökonomische Schichten, Frauen und ältere Menschen weniger vertreten, als es die Repräsentativität erforderte (PACE 1 9 3 9 ; REUSS 1 9 4 3 ; FERRISS 1 9 5 1 ; PAN 1 9 5 1 ; WALLACE 1 9 5 4 ; LEVINE UND GORDON 1 9 5 8 ; SCOTT 1 9 6 1 ). Der Hinweis auf die Bedeutung des "Themeninteresses" zur Rücksendung von postalischen Befragungen (vgl. EDGERTON, BRITT UND NORMAN 1 9 4 7 ; MADGE 1 9 5 3 ; LARSON UND CATTON 1 9 5 9 ; DONALD 1 9 6 0 ; FERBER 1 9 6 6 ;
Β LAINE 1 9 6 6 ) m u ß dem nicht widersprechen, daß die Ausfälle zumindest nach sozio-ökonomischen Merkmalen stark selektiv verlaufen, da Involviertheit mit üblicherweise befragten Themen sozial nicht gleich verteilt sein dürfte. In einer ähnlichen Richtung gestaltet sich im Verlauf von Panel-Befragungen die verbleibende Untersuchungspopulation durch die "drop-outs". Zwar ist ebenfalls "Interesse am Untersuchungsgegenstand" bedeutsam für das Verbleiben über mehrere Befragungswellen hinweg (vgl. PARTEN 1 9 5 0 ; GLOCK 1 9 5 2 ; LAZARSFELD U.A. 1 9 6 5 ) , jedoch setzt sich auch hier üblicherweise die "mortality g r o u p " aus PerMAYER UND PRATT 1 9 6 6 ; SCHWIRIAN UND
4. Kapitel: Der Befragte
117
sonen mit niedrigem sozio-ökonomischen Status, Marginalpersonen und älteren Menschen zusammen (BERELSON U.A. 1 9 5 4 ; SOBOL 1 9 5 9 ; NEUGARTEN, HAVIGHURST UND TOBIN 1 9 6 1 ; M A D D O X 1 9 6 5 ; MOSTELLER 1 9 6 8 ) .
Im Bereich der psychologischen und sozialpsychologischen Experimentforschung und bei der Konstruktion und Validierung von Skalen zur Messung der verschiedensten theoretischen Konstrukte von Persönlichkeitsdimensionen wird meist auf Populationen zurückgegriffen, deren Selektivität einmal vom Forscher bewußt in Kauf genommen wird, zum anderen aber diese Selektivität durch die üblichen Rekrutierungstechniken von Versuchspersonen innerhalb des verfügbaren Universums noch verstärkt ist: Einer Studie von SMART ( 1 9 6 6 ) zufolge bestanden die Populationen von Arbeiten, die in zwei renommierten sozialpsychologischen Zeitschriften veröffentlicht wurden, zu 73% bzw. 86% aus College-Studenten; weniger als 1% der Studien verwendete Repräsentativauswahlen. Dazu muß — wie erwähnt — davon ausgegangen werden, daß die betreffenden Ausgangspopulationen sich weiter in der Rekrutierung homogenisieren hinsichtlich der Merkmale "Psychologiestudenten" und "Interesse an Sozialwissenschaften" (ROSEN 1 9 5 1 ) , "Interesse am Forschungsthema" ( B E L S O N 1 9 6 0 ) und Beziehung zum Forscher (NORMAN 1 9 4 8 ; WALLIN 1 9 4 9 ; ROSENTHAL 1 9 6 6 ) . In einer Zusammenstellung der wichtigsten Forschungsergebnisse zu den besonderen Merkmalen freiwilliger Versuchspersonen wurde festgestellt, daß sich die "volunteers" von den Nichtfreiwilligen deutlich unterscheiden: Sie sind gekennzeichnet durch relativ höhere Ausbildung und höheren sozio-ökonomischen Status, Aufstiegsmobilität, höhere Intelligenz, niedrigeren Grad an Autoritarismus, geringeren Grad an Konventionalität u.a. (ROSENTHAL UND ROSNOW 1 9 6 9 ) . Die Verwendung ausschließlich freiwilliger Befragter (auch außerhalb von Studentenpopulationen) war einer der Hauptkritikpunkte an den Untersuchungen von KINSEY ( 1 9 4 8 ) : Gerade bei Untersuchungen über tabuisierte Themenbereiche wird deutlich, daß sich freiwillige (oder: nicht verweigernde, kooperative, Rücksender, in Panel verbleibende) Personen hinsichtlich der erfragten Sachverhalte und Verhaltensweisen erheblich von anderen Populationssegmenten unterscheiden. Für Sexualverhalten zumindest kann gelten, daß an Befragungen teilnehmende Personen erheblich unkonventionellere Sexualpraktiken angeben als schwerer zum Interview zu gewinnende Personen (MASLOW UNDSAKODA 1 9 5 2 ; COCHRAN, MOSTELLER UND TUCKEY 1 9 5 3 ; LOCKE 1954).
Die Frage, ob nicht nur die Verteilung von Merkmalen in eingeschlossenen und ausgeschlossenen Populationsteilen unterschiedlich ist, sondern auch die Relation zwischen Variablen, ist bislang nicht eindeutig geklärt (vgl. SUCHMAN 1 9 6 2 ) . Es steht aber zu befürchten, daß innerhalb der oben beschriebenen Homogenisierung der untersuchten Populationen, mit der für nahezu jede Rekrutierungstechnik gerechnet werden muß, und zwar allgemein in Richtung auf die überproportionale Teilnahme solcher Personen, deren Involviertheit mit Sozialforschung und der dominanten Kultur hoch ist, tendenziell solche Personen in den Untersuchungspopulationen eingeschlossen werden oder verbleiben, die den Verhaltensanforderungen der Untersuchungsanordnung am ehesten entsprechen und überdies von ihren Eigenschaftskonstellationen her von Sozialforschern (des gleichen kulturellen Kontexts) formulierte Hypothesen stärker zu stützen scheinen als andere Populationsteile (vgl. MADDOX 1 9 6 5 ; R O S E N THAL UND ROSNOW 1 9 6 9 ) .
118
4. Band: Erhebungsmethoden: Die Befragung
4.4
Probleme des Interaktionsverhältnisses im Interview
Auch in solchen Kulturen, in denen die sozialwissenschaftliche Befragung inzwischen zu einer institutionalisierten Einrichtung avanciert ist, herrschen zumindest in einigen Teilgruppen der Bevölkerung unterschiedliche Vorstellungen, Erfahrungen und Bewertungen über das im Interaktionsprozeß der Befragung geforderte Rollenverhalten vor (vgl. SJOBERG UND N E T T 1 9 6 8 ) . Damit eng verbunden variieren die Auswirkungen der unterschiedlichen Rollenverständnisse auf das Befragungsprodukt, ohne daß einstweilen sichergestellt ist, daß bei der Datenanalyse unterschiedliche Reaktionen auf das Instrument allgemein isolierbar sind von den eigéntlichen Reaktionen auf die gesetzten Stimuli. 4.4.1
Die Rolle des Befragten
Neutralität oder " D e t a c h m e n t " des Interaktionsverhältnisses zwischen Befrager und Befragten, die Fähigkeit zur Trennung kognitiver Inhalte der Kommunikation von solchen der Herstellung und Stabilisierung persönlicher Solidarität, die Fähigkeit der Abstraktion von der aktuellen Sozialbeziehung, der Interaktion in einer Dyade, der Übernahme der Informantenrolle, eine Meinung als Einzelperson zu haben und Fremden mitzuteilen, sind die wesentlichen Elemente der von Befragten geforderten Rolle (vgl. HYMAN 1954; SCHEUCH 1967a; KUNZ 1969). Gestützt wird diese Forderung durch Hinweise darauf, daß dieses Rollenverständnis in westlichen Kulturen ausreichend sozialisiert werde (SJOBERG 1957; Ross 1963; SCHWARTZ 1963; KUNZ 1969), die Bevölkerung zur Befragung selbst ein "leicht positiv-detachiertes" Verhältnis habe (GOLDMAN 1944; HYMAN 1954; SJOBERG 1954; CANNELL UND AXELROD 1956), sowie, daß bei anfänglicher Unsicherheit über das geforderte Verhalten ein rascher und erfolgreicher Lernprozeß ablaufe, der etwa spätere Befragungen und Rollenübernahmen als Versuchsperson weniger problematisch werden lasse (vgl. WAX UND SHAPIRO 1956; SCHEUCH 1967a). Dennoch m u ß davon ausgegangen werden, daß die Motivationen zur Teilnahme und das Rollenverständnis selbst innerhalb westlicher Industriekulturen, in denen Sozialforschung nicht mehr unbekannt ist, stark variieren. Die sehr kasuistischen Beiträge zur Beschreibung des Rollenverständnisses der Befragten mögen dies verdeutlichen. Die Reihe der aufgeführten Motivationen zur Interviewteilnahme und die daraus abgeleiteten Rollendefinitionen durch die Befragten reicht von der Annahme, beim Befragten werden keine besondere Motivation wirksam (CAPLOW 1 9 5 6 ) , über die Betonung der Rolle des "guten Staatsbürgers" (MERTON 1 9 4 7 ; VIDICH UND BENSMAN 1 9 5 4 ) und "Dieners der Wissenschaft" (MERTON UNDHATT 1 9 4 9 ; SLOCUM.EMPEY UND SWANSON 1 9 5 6 ; KAHN UND CANNELL 1 9 6 8 ; vgl. auch O R N E 1 9 6 6 ) , anderer mehr altruistischer Motive (KINSEY 1 9 4 8 ; RICHARDSON 1 9 6 5 ) , mehr auf die soziale Erfahrung einer Begegnung mit einer fremden Person gerichtete Gründe (BENNEY UND HUGHES 1 9 5 6 ; SCHWARTZ 1 9 6 4 ; RICHARDSON 1 9 6 5 ) bis hin zum Verweis auf mögliche erwartete Katharsiserlebnisse durch eine Befragung (MERTON 1 9 4 7 ; CANNELL UND AXELROD 1 9 5 6 ) . Neutralität in der Rollenbeziehung beschränkt sich offenbar auf die Fälle, in denen die erfragte Information keine zentralen, emotionsgeladenen Bereiche beim Befragten berührt (vgl. DEXTER 1 9 5 6 ) ; völlige Emotionsfreiheit von Frageinhalten besteht allerdings selbst für sog. Sachfragen nicht (VAN KOOLWIJK 1 9 6 8 ; 1 9 6 9 ) .
4. Kapitel: Der Befragte
119
Die Mannigfaltigkeit und Unterschiedlichkeit der Interpretation der Interviewsituation und der Befragtenrolle durch den Befragten erhöht sich in Bereichen außerhalb westlicher Industriekulturen ganz erheblich — selbst wenn man von Sprachproblemen, die zwar nicht abtrennbar sind, einmal absieht. Sowohl der Grad an Erfahrung mit dem Instrument der Befragung (WILSON 1 9 5 0 ; HUNT, CRANE UND WAHLKE 1 9 6 4 ) , schon die Form standardisierter Kommunikation (BADENHORST UND UNTERHALTER 1 9 6 1 ) , kulturelle Vorschriften über das Interaktionsverhalten mit Fremden, etwa in Form des "courtesy bias" (JONES 1 9 6 3 , MITCHELL 1 9 6 5 ) oder der Abwehr gegen das Eindringen Fremder in den Privatbereich (LERNER 1 9 5 6 ; HUNT,CRANE UND WAHLKE 1 9 6 4 ) , wie insbesondere auch der Bereich der Dinge, die für mitteilenswert und mitteilbar angesehen werden bzw. überhaupt als Sachverhalte bewußt sind (BLUMER 1 9 4 8 ; BRACEY 1 9 4 8 ; RUDOLPH UND RUDOLPH 1 9 5 8 ; MITCHELL 1 9 6 5 ) , variieren zwischen verschiedenen Kulturen wie auch innerhalb von kulturellen Kontexten ganz erheblich (vgl. zur unterschiedlichen Perzeption des Befragungsvorganges auch GOLDTHORPE 1 9 5 2 ; BLANC 1 9 5 6 ; HOFFMAN UNDCASSIDY 1 9 5 6 ; LEZNOFF 1 9 5 6 ; FREY
1963;
Die Schwierigkeiten zur Rollenübernahme in der geschilderten Weise reduzieren sich allerdings offenbar in dem Maße, wie durch Publikation und Institutionalisierung von Sozialforschung die entsprechenden Rollenvorschriften zu Teilen des sozialen Rollensystems werden und etwa in einigen Kulturen bereits nahezu zur Alltagserfahrung der Bevölkerung gehören (vgl. HARTMANN, ISAACSON UND JURGELL 1 9 6 8 ) . Andererseits ist jedoch nicht zu übersehen, daß angesichts der bestehenden inter- und intrakulturellen Barrieren der Übernahme der geforderten Befragtenrolle Umfrageforschung einstweilen auf den Bereich festgeschrieben ist, dessen direktes kulturelles Produkt sie ist und innerhalb dessen sie überwiegend veranstaltet wird: die westliche Mittelschichtkultur (vgl. MANNING 1 9 6 6 / 6 7 ) . GEISMAR UND LASORTE 1 9 6 3 ; DEUTSCHER 1 9 6 8 ; BERK UND ADAMS 1 9 7 0 ) .
4.4.2
Elemente des Befragtenverhaltens im Interview
Daß das Interviewergebnis ein Produkt der Reaktion des Befragten auf die vom Forscher gesetzten Stimuli und der sozialen Beziehung im Interview ist, bleibt in dieser Form eine wenig informative Aussage (vgl. hierzu etwa die Modelle der Entstehung des Interviewprodukts bei KAHN UND CANNELL 1 9 5 7 ; 1 9 6 8 ; CANNELL UND KAHN 1 9 6 8 ; WEISS 1 9 6 6 ; einen vielversprechenden Ansatz zum Ausbau der auf Lew in'sc hen feldtheoretischen Vorstellungen beruhenden Deutung der Befragten-Sozialforscher Interaktion versucht RICHTER 1 9 7 0 für die schriftliche Befragung). Obwohl erst relativ geringe Kenntnisse über Anteil und Ausmaß der Beteiligung der einzelnen Interaktionskomponenten am Interviewprodukt zur Verfügung stehen, ist doch bereits einiges über die Art der Reaktionen des Befragten auf den gesamten Stimuluskomplex Befragung bekannt; einige dieser Kenntnisse finden Berücksichtigung bei der Festlegung der Forschungsstrategie der Befragung (-» Bd. IV: Erbslöh und Wiendieck, Der Interviewer und -»· Bd. IV: Kreutz und Titscher, Fragebogenkonstruktion). Schon die Ankündigung und das Bewußtsein, Objekt einer Untersuchung zu sein, hat Auswirkungen auf das Verhalten des Befragten (vgl. z.B. den "HawthorneE f f e k t " bei ROETHLISBERGER UND DICKSON 1964;vgl. auch-» Bd. II: Albrecht, Nichtreaktive Methoden). Rollenübernahme und "richtiges" Befragtenverhalten scheinen durch die Kenntnis der Situation, etwa durch Erfahrungen in früheren Interviews, erleichtert zu werden (CRESPI 1948), andererseits kann Vorerfahrung eine experimentel-
120
4. Band: Erhebungsmethoden: Die Befragung
le Anordnung insofern stören, als der Befragte Vermutungen über das vom Forscher gewünschte Ergebnis anstellt und in das Befragungsverhalten einfließen läßt (vgl. auch O R N E 1 9 5 9 ; 1 9 6 6 ; SARBIN 1 9 5 0 ; ROSENTHAL 1 9 6 1 ) , und experimentelle Manipulationen des Befragten hinsichtlich der Wirkung der Experimentalfaktoren zunächst unkontrollierbar werden (vgl. LANA 1 9 6 6 ; ENTWISLE 1 9 6 1 ; NOSANCHUK UND H A R E 1 9 6 6 ; NOSANCHUK 1 9 7 0 ) .
DerEinfluß von Eigenschaften, Verhaltensweisen, Einstellungen und Erwartungen des Interviewers auf das Befragtenverhalten m u ß nicht betont werden; die Interviewforschung ist hier am weitesten fortgeschritten. Allgemein kann gesagt werden, daß der Interviewer (bzw. der Experimentator) dem Befragten durch besondere Merkmale seiner Erscheinung und seines Verhaltens Anhaltspunkte für die vermuteten Verhaltenserwartungen gibt, die der Befragte - besonders, wenn es eine typische Befragtenrolle nicht gibt - mit bekannten Alltagsrollenerwartungen verbindet und seine Reaktion auf den Frageinhalt mit dieser (kurzfristig hergestellten) Definition der Interaktionssituation zu vereinbaren sucht. Dies gilt zumindest für solche Merkmale, die als Prädiktoren für Alltagsverhalten allgemein gelten: Geschlecht, Rasse, Alter und — soweit ersichtlich - Religionszugehörigkeit und sozialer Status (KATZ 1 9 4 2 ; R O B I N S O N UND ROHDE 1 9 4 6 ; HYMAN 1 9 5 4 ; RANKIN UND CAMPBELL 1 9 5 5 ; BENNEY, RIESMAN UND STAR 1 9 5 6 ; A T H E Y U A . 1 9 6 0 ; LENSKIUND LEGGETT 1 9 6 0 ; EHRLICH UND RIESMAN 1 9 6 1 ; WILLIAMS 1 9 6 4 ; 1 9 6 8 ; ROSENTHAL 1 9 6 6 ; SUMMERS UND HAMMONDS 1 9 6 6 ; CAHALAN 1 9 6 8 ; DOHRENWEND, OOLOMBOTOS UND DOHRENWEND 1 9 6 8 ; SCHUMAN UND CONVERSE 1 9 6 8 ; WEISS 1 9 6 8 ; DOHRENWEND, WILLIAMS UND WEISS 1 9 6 9 ) . Aus den vorgelegten Ergebnissen läßt sich ableiten, daß eine Strukturierung der Antwort in Abweichung von (in zu definierender Weise) gültigen Antworten dann erfolgt, wenn der Frageinhalt bedrohend ist, sich auf Inhalte bezieht, die das Interaktionsverhältnis zwischen Befrager und Befragtem unmittelbar betreffen (z.B. Fragen zu Rassenkonflikten, Sexualverhalten) und die soziale Distanz der Interaktionspartner hoch ist. Die Richtung der Strukturierung bestimmt sich dabei i.d.R. aus der für die jeweilige Dyade geltenden "sozialen Erwünschtheit" der Antwort (vgl. CROWNE UND MARLOWE 1 9 6 1 ; sowie Abschnitt 4.5.3 "Antwortstile") und dem Bestreben, dem Interviewer zu gefallen (RIECKEN 1 9 6 2 ; ROSENBERG 1 9 6 5 ; 1 9 6 9 ) : Es wird das angegeben, was mit der sozialen Rolle des Befragten unter Berücksichtigung seines Interaktionspartners vereinbar ist und wovon vermutet wird, daß der Interviewer (oder Experimentator) es hören möchte.
Mit in diesen Komplex gehören die A uswirkungen von Vermutungen des Befragten über die Verwendung der Interviewdaten bzw. allgemeiner: die Konsequenzen der Befragung. Diese Vermutungen werden einmal an der Forschungsinstitution orientiert, von der der Befragte weiß oder annimmt, daß sie für die Befragung verantwortlich ist (sponsorship bias; vgl. CRESPI 1 9 5 0 ; SCHEUCH 1 9 5 3 ; HYMAN 1 9 5 4 ) . Zwar ist keine eindeutige Richtung einer solchen Antwortstrukturierung feststellbar, allgemein scheint eine systematische Antwortausrichtung jedoch umso stärker zu sein, je eindeutiger die soziale Definition der betreffenden Institution, je eindeutiger eine Zuordnung des Frageinhalts zu dieser Institution möglich und je geringer die Überlagerung durch andere bias-Faktoren ist (HOFSTEIN 1 9 4 5 ; HYMAN 1 9 5 4 ) . Die Wirkung allgemeiner sozialer Vorschriften für "angemessenes" Verhalten und der soziale Druck, den der Interviewer durch seine bloße Anwesenheit in diese Richtung ausübt, wird aus Vergleichen zwischen den Ergebnissen aus selbstadministrierten Be-
4. Kapitel: Der Befragte
121
fragungen und persönlichen Interviews bezüglich der gleichen Fragestellung ersichtlich: Angaben bei selbstadministrierten Befragungen scheinen gelegentlich "sozial unerwünschter", offener, abweichender und differenzierter zu sein als bei persönlichen Befragungen (ELLIS 1 9 4 7 ; MARKS UND MAULDIN 1 9 5 0 ; WEDELL UND SMITH 1 9 5 1 ; METZNER UND MANN 1 9 5 2 ) . Zur Aufwertung der persönlichen Befragung muß allerdings gesagt werden, daß der Interviewer selbst bestimmte Verhaltenseinseitigkeiten auf seiten des Befragten korrigieren kann. Ähnlich wie bei der schriftlichen Befragung scheint sich die dem Befragten glaubhafte Sicherstellung der Anonymität der Angaben so auszuwirken, daß seine Äußerungen sich weniger stark an geltenden sozialen Normen orientieren (BENSON 1 9 4 1 ; FISHER 1 9 4 6 ; ELINSON UND HAINES 1 9 6 0 ) , obgleich gelegentlich auch keine Unterschiede zwischen anonymen und nichtanonymen Befragungen festgestellt werden können (COREY 1 9 3 7 ; GERBERICH UND MASON 1 9 4 8 ; ROSEN 1 9 6 0 ) ; offenbar hängen die Auswirkungen ab von Befürchtungen über eine persönliche Gefährdung des Befragten bzw. von der jeweiligen Beziehung zwischen Fragethema und sozialer Position des Befragten, (z.B. sind Aussagen über militärische Angeigenheiten von Soldaten bei Anonymität kritischer, Aussagen zu anderen Themen unterscheiden sich kaum). Schließlich muß beachtet werden, daß die Anwesenheit dritter Personen bei der Befragung die Antworten mitbeeinflußt (vgl. TAIETZ 1 9 6 2 ; KOOMEN UND RAVESTEIJN 1968) und selbst Eigenschaften der physischen Umgebung Einfluß auf die Art der Aussagen ausüben (vgl. dazu die Bemerkungen bei PHILLIPS 1 9 7 1 ) . Die zitierten Ergebnisse legen die Vermutung nahe, daß der Befragte seine Angaben jeweils an bestimmte Umwelten richtet, wobei seine Orientierung der Auswahl des Adressaten durch Eigenschaften von Interviewer, Forschungsinstitution, Frageinhalt und Stil der Interviewdurchführung nahegelegt wird. Die Ausrichtung der Antworten erfolgt dann i.d.R. nach der je nach gemeinter "Umwelt" unterschiedlichen kulturellen Definition der "sozialen Erwünschtheit" von Angaben. (-»• Bd. III: Weidmann, Feldbeobachtung). 4.4.3
Probleme der sprachlichen Kommunikation
Daten, die durch Befragung erhoben werden, müssen für die Verwendung als empirische Grundlage untereinander vergleichbar sein und einen zumindest abschätzbaren Grad an Gültigkeit aufweisen. Die Schwierigkeit der Sicherstellung beider Bedingungen wurde bereits bei der Erörterung der Probleme aus dem Interaktionsverhältnis deutlich. Wurden dort zunächst auch Sprachprobleme ausgeklammert, der Datenabruf im Interview hat seine wichtigste Begrenzung in Problemen der sprachlichen Kommunikation. Das hauptsächlichste Problem hinsichtlich der Vergleichbarkeit von Interviewdaten ist die Frage nach der Äquivalenz der ausgetauschten verbalen Äußerungen angesichts der ubiquitären Differenzierung sozialer Gruppierungen in unterschiedliche Vokabularien, Grammatiken, Sprach- und Kognitionsstile. Zur Äquivalenz der Stimuli reicht die lexikalische Äquivalenz bekanntermaßen nicht aus; zur semantischen Äquivalenz gehört andererseits nicht lediglich das bloße sprachliche Zeichen, sondern der gesamte Stimuluskomplex der Befragungssituation, da sich die Bedeutung des Zeichens auf alle seine Nebenassoziationen bezieht (BROWN 1962; CARROLL UND CASAGRANDE 1 9 5 8 ; ANDERSON 1 9 6 7 ; DEUTSCHER 1 9 6 8 ; vgl. auch Ab-
122
4. Band: Erhebungsmethoden: Die Befragung
schnitt 4 . 4 . 2 ) . Ebenso m u ß die Äquivalenz der gesetzten Stimuli von einer semantischen Äquivalenz der Reaktionen (der A n t w o r t e n ) begleitet sein (ANDERSON 1967). Meist wird überdies nicht berücksichtigt, daß sich die Äquivalenz der Stimuli auch auf deren Grad an Komplexität und Ambiguität beziehen muß (und nicht nur auf die mitgeteilten Bedeutungen) und die gleichen Probleme für nichtverbale Stimuli ebenso gelten. Diese Probleme werden im interkulturellen Bereich überdeutlich; weniger sichtbar, aber ebenso wirksam sind linguistische Differenzierungen im intrakulturellen Bereich eines Sprachraumes (Dialekte, Sondersprachen etc.): Soziale Differenzierung (etwa in soziale Schichten, Berufsrollen, Geschlechts- und Altersrollen u.ä.) geht mit linguistischer Differenzierung einher. Unterschiede im Sprachgebrauch sind nachweisbar in Phonetik, syntaktischem Stil (SCHATZMAN UND STRAUSS 1955) und in Semantik auch innerhalb von Sprachbereichen (vgl. dazu insbesondere die Arbeiten von BERNSTEIN u n d OEVERMANN,sowie
Bd. III: Scherer, Sprachforschung 4.3 und 4.5).
Das Problem der sprachlichen Vergleichbarkeit von Stimuli und Antworten ist überlagert von der Frage der Differenzierung in der Kognition von Objekten, d.h. die Art und Weise, wie Objekte in der Wahrnehmung unterschiedlich strukturiert werden. Für die Befragung ergeben sich in diesem Zusammenhang Probleme der Anwendbarkeit kognitiver "Schemata", die einem bestimmten kulturellen Kontext entstammen (dem des Sozialforschers) bei Befragten aus anderen kulturellen Kontexten, in denen diese Schemata möglicherweise nicht oder nicht in der Form geläufig sind. Als Beispiel seien genannt die unterschiedliche Interpretation einfacher affirmativer Konnotationen (DEUTSCHER 1 9 6 6 ; 1 9 6 8 ) , die unterschiedliche Interpretation von Intensitäten bei der Vorgabe von Zustimmungs- und Ablehnungskontinua (BLANC 1 9 5 6 ; PHILLIPS 1 9 5 9 / 6 0 ; vgl. auch SJOBERG UND NETT 1 9 6 8 ) , Unterschiede im Zahlenverständnis und in der Anwendbarkeit von Rangskalen, etwa derart, daß in bestimmten Kulturen zwar horizontale Differenzierungen von Objekten geläufig sind, nicht aber vertikale Bewertungen in "besser-schlechter"-Relationen o.ä. (vgl. UNTEREINER 1 9 5 2 , zit. bei SJOBERG UND NETT 1 9 6 8 ; CARROLL UND CASAGRANDE 1 9 5 8 ) , und schließlich kulturelle Variationen der Verbindung zwischen Sprechen und tatsächlichem Verhalten. Vorgeschlagene Überbrückungen dieser Barrieren zur Anwendung der Befragungsforschung in unterschiedlichen Kulturen scheinen einstweilen noch zu sehr neue Probleme zu bringen: Die Verwendung von "bilinguals" — gelegentlich neben der Technik der Rückübersetzung als beste Überbrückung genannt — könnte etwa deshalb nicht angebracht sein, weil die Annahme, es seien zwei Sprach- und Kognitionsstile gleichwichtig vertreten, kaum durchzuhalten ist (vgl. ANDERSON 1967). Durch die Vorgabe von sprachlichen und kognitiven Konfigurationen eines Kulturkontextes durch Fragebogen und auch Interviewerverhalten (Interviewerstäbe sind überwiegend homogen aus Mittelschichtpersonen zusammengesetzt) wird die Befragung, geht sie über den eigenen kulturellen Bereich der Sozialforschung hinaus und bleibt nicht auf College-Populationen beschränkt, zu einem Sonderfall von "crossculture"- bzw. "cross-class"-Kommunikation. Die Gegenüberstellung von "hostculture stimuli" mit "home-culture meaning" (ANDERSON 1967) läßt, selbst wenn wann man dies auch nicht als eine Art unangemessenen soziologischen Ethnozentrismus versteht (vgl. etwa FEIN 1970/71), zusammen mit den genannten Erscheinungen der unterschiedlichen Definition der Befragtenrolle im interkulturellen wie intrakul-
4. Kapitel:
Der Befragte
123
turellen Kontext westlicher Industriegesellschaften die Befragung als Datengrundlage äußerst problematisch erscheinen hinsichtlich der Interpretation der Daten als Reaktion auf die gemeinten Stimuli - deutlich etwa bei Befragungen "abweichender" und unterprivilegierter Teilpopulationen (vgl. T E R R I S 1 9 4 9 ; LENSKIUND LEGGETT 1 9 6 0 ; WEISS 1 9 6 6 ; BERK UND ADAMS 1 9 7 0 ; CARR 1 9 7 1 ; PHILLIPS 1 9 7 1 ) . Die Entscheidung über die Annahme der Befragungsdaten als Basisaussagen durch den Forscher setzt jedenfalls spezielle Kenntnisse über die besondere Reaktion von Befragtenteilgruppen bei (sprachlicher) Kommunikation mit fremden Sprach- und Symbolsystemen voraus.
4.5
Fehlreaktionen des Befragten
Die genannten Faktoren aus Interaktionsbeziehung, Rollen Verständnis, sprachlichen und kognitiven Kommunikationsbarrieren schlagen sich im Interviewprodukt meist nicht als sichtbare "Fehlreaktionen" des Befragten nieder, sondern gehen o f t unbemerkt in die Daten ein. Fehlbeschreibungen von Bevölkerungsgruppen und Fehlprognosen auf der Grundlage von Befragungsdaten haben die Entwicklung des Instrumentes der Befragung immer begleitet. Diese Gefahren werden nicht völlig auszuschließen sein; aus der Analyse offenbarer Fehlreaktionen der Befragten lassen sich jedoch möglicherweise Regeln dafür ableiten, unter welchen Umständen Befragungsdaten in ihrer Geltung besonders problematisch erscheinen müssen, ganz abgesehen von der Möglichkeit, diese Reaktionen des Befragten als gleichwertige und wertvolle Informationen zu behandeln und nicht nur als zu eliminierende Störfaktoren einer ohnehin nur fiktiven Meßanordnung.
4.5.1
Nichtbeantwortung v o n Fragen (non-response)
Die nicht vollständige Beantwortung von Fragebögen, die Weigerung, bestimmte Fragen zu beantworten, das Äußern von Meinungslosigkeit ist eine der in der Forschungspraxis geläufigsten und sichtbarsten Fehlreaktionen von Befragten. Erstaunlicherweise existiert zu diesem Problem jedoch nur geringes empirisches Wissen (ROPER 1937; LAZARSFELD UND ROBINSON 1 9 4 0 ; ROSEN UND ROSEN 1 9 5 5 ; UPHOFF UND AYLWARD 1 9 5 6 ; FERBER 1 9 5 6 ; 1 9 6 6 ; GERGEN UND BACK 1 9 6 6 ; GLENN 1 9 6 9 ; SICINSKI 1 9 7 0 ) . I n d e r b i s -
lang intensivsten Untersuchung des Problems der Meinungslosigkeit von LEVERKUSBRÜNING ( 1 9 6 4 ) wird zwischen Frageverweigerem, Nichtinformierten, Meinungslosen und Unentschiedenen unterschieden, eine ähnliche Einteilung findet sich bei DUNNETTE, UPHOFF UND A Y L W A R D ( 1 9 5 6 ) u n d b e i BOGART ( 1 9 6 7 ) .
Danach läßt sich die Nichtbeantwortung von Fragen auf drei Grundlagen zurückführen: Einmal werden die Stimuli nicht verstanden, non-response ist in diesem Fall eine der möglichen Reaktionsarten auf Stimuli mit hoher Ambiguität (vgl. Abschnitt 4 . 5 . 3 ) . Zweitens kann non-response den für den Befragten einzig akzeptablen Ausweg aus cross-pressure- oder Dissonanzsituationen bedeuten (vgl. VAN KOOLWIJK 1 9 6 9 ) und drittens kann die Nichtbeantwortung als Ersatz für eine (in den Vorgaben nicht vorgesehene) Neutralkategorie gelten (DUNNETTE U.A. 1 9 5 6 ) . Das Ausmaß von non-response schwankt nach jeweils untersuchter Teilpopulation und Themenstellung, wobei 'Themenstellung" bei der Bestimmung des non-response-Anteils offenbar den höchsten Anteil hat (vgl. FERBER 1 9 6 6 ) . Dennoch lassen sich
124
4. Band: Erhebungsmethoden:
Die
Befragung
auch relativ eindeutige Muster der Verteilung des Vorkommens von non-response bei Befragten mit bestimmten Merkmalen feststellen. Daß die Ambiguität der Stimuli — etwa durch den Schwierigkeitsgrad, die intellektuelle Verständlichkeit von Fragen — die Hauptursache des non-response ist, läßt sich daran ablesen, daß in unteren sozio-ökonomischen Schichten, bei Personen mit geringer Schulbildung die non-response-Rate am höchsten ist (KNUPFER 1 9 4 7 ; LEVERKUS-BRÜNING 1 9 6 4 , FERBER 1 9 6 6 ) . Zwar korrelieren auch andere demographische Variablen wie Alter (GERGEN UND BACK 1 9 6 6 ) , Geschlecht (Frauen weisen höheren non-response auf als Männer), Umweltkontakte und soziales Involvement (LEVERKUS-BRÜNING 1964) mit Nichtbeantwortung von Fragen, doch gibt es starke Hinweise dafür, daß es sich hier überwiegend um Überlagerungen der Variable Schulausbildung handelt (vgl. GLENN 1 9 6 9 ) . Dieses Muster wird jedoch durchbrochen, wenn das Thema der Befragung einen unmittelbaren Bezug zum Befragten hat: Kann der Befragte seine Rolle als Informant durch verfugbares Wissen wahrnehmen, reduzieren sich seine "Fehlreaktionen" i.d.R. erheblich, — verfügbares Wissen ist aber im Universum der Befragten nach allgemeiner Ausbildung und nach " T h e m e n " unterschiedlich verteilt und das Hauptsegment der "Meinungslosen" gibt deshalb keine Antwort, weil es zum erfragten Sachverhalt nicht genügend zu wissen glaubt (vgl. DUNNETTE U.A. 1 9 5 6 ) . Bei der Bestimmung des non-response-Anteils und der Verteilung auf Teilpopulationen spielen zwar auch andere Faktoren eine Rolle, wie die Neigung von Personen höherer sozio-ökonomischer Schichten, lieber irgendeine als keine Antwort zu geben (FERBER 1 9 5 6 ) , oder non-response als gemilderte Form der Frage- bzw. Interviewverweigerung. Insbesondere der zuletzt genannte Faktor — bei LEVERKUS-BRÜNING ( 1 9 6 4 ) "Reserviertheitskomponente" genannt —, die Reserve gegen die Befragung allgemein, sei es aus Gründen des sozialen Disengagements (vgl. GERGEN UND BACK 1 9 6 6 ; MERCER UND BUTLER 1 9 6 7 ) , sei es aus negativer Einstellung zur Umfrageforschung (SCHEUCH 1 9 5 3 ) besonders von Eliten (vgl. SMIGEL 1 9 5 8 ; H U N T , C R A N E UND WAHLKE 1 9 6 4 ) oder der Unangenehmheit der Fragen (VAN KOOLWIJK 1 9 6 9 ) , ist sicher an der Bestimmung des non-response-Anteils beteiligt. Ambiguität der Stimuli und die intellektuelle Uberforderung von Befragtenteilgruppen, die sich bei Standardisierung nicht umgehen läßt, scheinen jedoch die Hauptgründe zu sein (vgl. T E R R I S 1 9 4 9 ; PAYNE 1 9 5 0 ) . Der dramatische Anstieg von Nichtbeantwortung etwa bei interkulturell-vergleichenden Untersuchungen mit zunehmender (unvermeidlicher) Stimulusambiguität (MITCHELL 1 9 6 5 ; SICINSKI 1 9 7 0 ) weist jedenfalls deutlich d a r a u f h i n . Die Nichtberücksichtigung dieser Bestimmungsgründe des non-response und die übliche Praxis der Vernachlässigung der non-response-Kategorie in der Auswertung der Daten können dementsprechend fatale Folgen für die Beschreibung von Bevölkerungsteilgruppen hinsichtlich bestimmter Merkmale haben (vgl. etwa MILLER UND RIESSMAN 1961).
4.5.2
Falschantworten
Die Richtigkeit der Angaben oder die Gültigkeit der Interviewdaten ist Grundbedingung fur die Akzeptierung von Interviewdaten als Basisaussagen im Begründungsprozeß theoretischer Aussagen. Obwohl jedoch die Befragung in der Sozialforschung den Hauptanteil der Erhebungsverfahren stellt, m u ß grundsätzlich die Validität von Interviewangaben bezweifelt werden (soweit sich Kriterien der Validität angeben lassen), wenn auch diese nicht ungeläufige Feststellung (vgl. bereits M C N E M A R I 9 4 6 ) meisten-
4. Kapitel: Der Befragte
125
teils nur in Nebenbemerkungen Erwähnung findet (vgl. z . B . SCHEUCH 1967; ANGER 1969). Die Begründung für die Annahme einer überwiegenden Ungültigkeit von Interviewdaten ergibt sich aus einer Ubersicht bei PHILLIPS ( 1 9 7 1 ) über die wichtigsten Gültigkeitsstudien, kontrolliert an verfügbaren Außenkriterien (wie Wahlunterlagen, Kundenkarteien, Anwesenheitslisten, amtlichen Statistiken etc.), die freilich ihrerseits Fehlangaben erheblichen Ausmaßes unterliegen können (vgl. z.B. HAMBRIGHT 1 9 6 9 ; sowie Bd. II: Albrecht, Nichtreaktive Methoden), so d a ß nur Aussagen über Abweichungen von Angaben, nicht aber über die Lokalisierung der Fehlerangaben möglich sind. Für Angaben über Wahlverhalten schwankt der Anteil der Falschantworten beispielsweise zwischen 6 , 9 % (CLAUSEN 1 9 6 8 ) und 3 0 % ( B E L L UND BUCHANAN 1 9 6 6 ; weitere Gültigkeitsstudien zu Wahlverhalten: DODD 1 9 4 8 ; K I T T UND GLEICHER 1 9 5 0 ; PARRY UNDCROSSLEY 1 9 5 0 ; TITTLE UND HILL 1 9 6 7 ; C A H A L A N 1 9 6 8 ; WEISS 1 9 6 8 ; STEINER 1 9 6 5 ) . Zahlreiche Arbeiten des "National Center for Health Statistics" und des "Survey-Research Center" der Universität von Michigan befassen sich mit dem Problem der Richtigkeit von Angaben zu Gesundheitsverhalten; eine Studie von CANNELL UND FOWLER ( 1 9 6 3 ) berichtet z . B . von nahezu 6 0 % Falschangaben (vgl. auch CANNELL, FOWLER UND MARQUIS 1 9 6 8 ) . Nahezu ebenso ungenau sind offenbar Angaben über Vergangenheitsdaten (ROBINS 1 9 6 3 ; LARSEN UND D E F L E U R 1 9 5 5 ; WEISS 1 9 6 8 ) , z.T. ähnlich die Nichtübereinstimmung von Angaben zu abweichendem Verhalten und wirklichem Verhalten (CLARK UND T I F F T 1 9 6 6 ; BALL 1 9 6 7 ; GOULD 1 9 6 8 ; PARRY, BALTER UND CISIN 1 9 7 0 ) , wobei zu bemerken ist, daß die " A n d r o h u n g " der Nachkontrolle durch Lügendetektoren in der Studie von CLARK UND TIFFT und von Urinproben zum Nachweis von Rauschmittelneinnahme bei Ball als Gültigkeitskontrolle genommen wurde, also nicht die sicher stark verzerrten amtlichen Unterlagen.
Weitere Studien zu den verschiedensten Themenbereichen wie Altersangaben (MYERS 1 9 4 0 ) Verkauf von Kriegsanleihen (HYMAN 1 9 4 4 ) , finanzielle Angelegenheiten ( F E R B E R 1 9 5 9 ; LANSING U.A. 1 9 6 1 ) , Kaufgewohnheiten (JENKINS UND CORBIN 1 9 3 8 ) , Teilnahme an Bildungsprogrammen (HAGBURG 1 9 6 8 ) , Angaben zur eigenen Ausbildung ( H A B E R MAN UND SHEINBERG 1 9 6 6 ) und zu Einkommensverhältnissen (BORUS 1 9 6 6 ) ergeben insgesamt einen je nach erfragter Information unterschiedlich hohen Gültigkeitsgrad verbaler Angaben bei Befragungen. Die Diskussion u m die Gültigkeit verbaler Äußerungen wird bei der Auseinandersetzung um das Attitüdenkonzept als Grundlage einer sozialpsychologischen Verhaltenstheorie besonders intensiv geführt. In einer eingehenden Arbeit kommt WICKER ( 1 9 6 9 ) in einem Resümee der wichtigsten Arbeiten — u.a. der Studien von LAPIERE ( 1 9 3 4 ) , DEFLEUR UND WESTIE ( 1 9 5 8 ) und WARNER UND DE FLEUR ( 1 9 6 9 ) — ebenso wie PHILLIPS ( 1 9 7 1 ) nach einer Übersicht über 1 3 Studien zu dem Schluß, daß die Beziehung zwischen verbalem und overten Verhalten zu unbestimmt sei, um ein furchtbares theoretisches Konzept zur Erklärung faktischen Verhaltens begründen zu können (vgl. dazu insbesondere BENNINGHAUS 1 9 7 3 ) . Allerdings m u ß — vor allzu voreiligen Schlüssen — gesagt werden, daß die meisten Gültigkeitsprüfungen zu wenig systematisch und vergleichbar sind. Insbesondere wird nur selten explizit, welche Gründe für die Falschantworten angebbar sind, und es wird weiter von der (irrigen) Annahme ausgegangen, daß andere Fehlerkomponenten empirischer Studien (wie Sampling-, Interviewer-, Auswertungsfehler) neben den Befragtenfehlern zufallig verteilt seien (vgl. SUMMERS UND HAMMONDS 1 9 6 9 ) .
126
4. Band: Erhebungsmethoden: Die Befragung
In grober Einteilung lassen sich zwei Klassen von Ungültigkeitsfaktoren von verbalen Äußerungen auf Seiten des Befragten angeben: 1. Kognitive Prozesse des Vergessens und Informationsverlusts, wobei die wissensmäßige Präsenz von Sachverhalten und Ereignissen von der Zeit zwischen Ereignis und Bericht und von der Bedeutung des Ereignisses für den Befragten abhängt (auf die theoretischen Kontroversen zum Vorgang des Veigessens sei hier nicht eingegangen). 2. Faktoren aus der Kommunikation des Befragten mit dem Interviewer und der Forschungsinstitution, also etwa Anwesenheit des Interviewers, Art der Befragung, Frageinhalt und Bedrohungspotential, Anonymität der Befragung, Statusunterschiede zwischen Befrager und Befragten u.a. (vgl. die Klassifikation bei SUMMERSUND HAMMONDS 1969). Generell scheinen Befragte dazu zu neigen, ihr Verhalten zu idealisieren, eine Erscheinung, die jedoch nicht invariant, sondern nach den jeweiligen kulturellen Vorstellungen über "Idealverhalt e n " unterschiedlich ist (vgl. dazu und zu materiellen Auswirkungen auf die Befragungsergebnisse insbesondere die Arbeiten von DOHRENWEND UND DOHRENWEND 1965; DOHRENWEND 1 9 6 6 ; PHILLIPS UND SEGAL 1 9 6 9 ; PHILLIPS UND CLANCY 1 9 7 0 ; PHILLIPS
1971). Allgemein scheinen Befragungsergebnisse umso gültiger zu sein, je stärker die Fragestellung und deren richtige Beantwortung geltende soziale Vorschriften verletzt und je weniger der Richtigkeitsgehalt von Angaben unmittelbar nachprüfbar erscheint (vgl. SCHEUCH 1967a; CLAUSEN 1968). Von daher sind auch kaum einheitliche Aussagen darüber möglich, welche Teilpopulationen besonders valide bzw. ungültige Antworten geben. Nimmt man die Stabilität von Aussagen über die Zeit hinweg als ein (wenngleich problematisches) Gültigkeitskriterium, so scheint es, daß zwar Antwortinkonsistenzen von der vergangenen Zeit und der Art der erfragten Information mitabhängen, durchweg aber sehr stark bei Personen mit geringem Einkommen und niedriger Schulausbildung auftreten (HOCHSTIM UND RENNE 1 9 7 1 ). Dennoch gestalten sich je nach sozialer Verflechtung des Befragten und je nach Frageinhalt die Beziehungen zwischen sozialer Stellung und Fehlangaben anders (vgl. etwa, daß aufstiegsorientierte Unterschichtpersonen ungültigere Angaben zu Wahlverhalten (overreporting) machen als solche Unterschichtpersonen, die offenbar jede Beziehung mit der "Mittelschichtswelt" aufgegeben haben und dies auch bei der Befragung in der richtigen Angabe des "Nichtwählens" angeben (WEISS ( 1 9 6 8 ) . ) Meist wird allerdings übersehen, daß Befragte — insbesondere solche unterer und unterster sozio-ökonomischer Schichten - häufig höchst reale Gründe für Falschangaben haben: Falschheit von Angaben gehört gewissermaßen zur eingeübten und lebensnotwendigen Alltagsauseinandersetzung mit Behörden und Sozialämtern (vgl. BANCROFT 1 9 4 0 ; DAVID 1 9 6 2 ; CAPLOVITZ 1 9 6 3 ) . 4.5.3
A n t w o r t s t i l e (response set; response style)
Eine der am intensivsten untersuchten und in der Praxis am wenigsten berücksichtigten Fehlverhaltensweise des Befragten ist der sog. response set. Schon die Beobachtung, daß weite Bereiche des Alltagsverhaltens in völlig unstrukturiert scheinenden Situationen stark von statistischen Zufallserwartungswerten abweichen (vgl. z.B. "Rechtspräferenz", "KopP'-Präferenz bei Münzwurf u.ä.; BERG 1967) ließe es wenig plausibel erscheinen, wenn die in der psychologischen und sozialpsychologischen Theorie formulierten Gesetzmäßigkeiten über Perzeption, Wahrnehmung, Lern-, Denk-, und Problemlösungsstile nicht auch im Meßvorgang selbst wirksam wären (MCGEE 1967).
4. Kapitel: Der Befragte
127
machte als erster eindringlicher auf die Gefahren des response set aufmerksam, der als Phänomen in der psychologischen Forschung lange bekannt war (vgl. LORGE 1 9 3 7 ; LENTZ 1 9 3 8 ) . Response set wird dabei definiert als Tendenz, in einer bestimmten Richtung zu reagieren, unabhängig vom Inhalt eines Stimulus. Die Bedeutung der Kenntnis von response set-Vorgängen ergibt sich dabei daraus, daß einerseits die Gültigkeit einer (inhaltsbezogenen) Messung immer betroffen ist, andererseits aber leicht höhere Zuverlässigkeitswerte entstehen können, die der Messung u . U . einen ungerechtfertigten Schein an Meßsicherheit verleihen (vgl. NUNNALLY CRONBACH ( 1 9 4 6 )
1967).
Response set tritt in vielfältiger Weise auf: Als mechanische Ankreuztendenz, definiert als unterproportionaler Wechsel in der Beantwortung von Kategorien im Vergleich zu Zufallserwartungswerten; Bevorzugung von Neutral- und Mittelkategorien, Bevorzugung von Extremkategorien oder besonders gekennzeichneten Kategorien (z.B. bei Vorgabe von Skalenwerten nur "gerade" Zahlenwerte anzukreuzen); Bevorzugung von "Geschwindigkeit" in der Aufgabenlösung gegenüber "Genauigkeit" und vice versa; Tendenz zum Raten; Zustimmungstendenz; Neigung zur Angabe "sozial erwünschter" Antworten; Ablehnungstendenz (vgl. auch CRONBACH 1 9 4 6 ; 1 9 5 0 ; NUNNALLY 1 9 6 7 ) .
Zu besonderer Bedeutung ist dabei die Zustimmungstendenz (acquiescence response set, agreeing response set) und die Neigung zu sozial erwünschten Antworten (social desirability response set) gelangt. Die Literatur insbesondere zu diesen beiden Arten von Antwortstilen ist zu umfangreich, um vollständig berücksichtigt zu werden; deshalb sei hier niir auf die wichtigsten Ergebnisse verwiesen, Ergebnisse zu einer Diskussion, die zwar abgeebt ist, ohne allerdings die Kontroversen gelöst zu haben (vgl. die Gesamtübersichten bei MCGEE 1 9 6 2 ; EDWARDS 1 9 6 4 ; DAMARIN UND MESSICK 1 9 6 5 ; BERG 1 9 6 7 ; zur neueren Diskussion: CLOUD UND VAUGHAN 1 9 7 0 ; kritisch zur gesamten response set-Diskussion: ROKEACH 1 9 6 3 ; RORER 1 9 6 5 ; NUNNALLY 1 9 6 7 ) . Schon bald wurde beispielsweise festgestellt, daß ein großer Teil der Varianz von Werten bei Persönlichkeitsmessungen mit Hilfe von Skalen durch response set-Erscheinungen erklärbar war. Unter anderen bei der California F-Skala (ADORNO UÀ. 1950), den Dogmatismus-Skalen (ROKEACH 1960; ROGHMANN 1966), Anomie-Skalen (SCROLE 1965), Skalen zur Messung des Eltern-Kind-Verhältnisses (PARI) und den MMPI—Skalen erwies sich, daß ein erheblicher Teil von Befragten deshalb zu hohen (beispielsweise "Faschismus"-)Werten kam, weil die Items in einer Richtung formuliert waren und bestimmte Befragte eine überproportionale Neigung zur stereotypen, nichtinhaltsbezogenen Zustimmung zu diesen Items aufwiesen (z.B. für die F-Skala: COHN 1953; BASS 1 9 5 5 ; CHAPMAN UND CAMPBELL 1 9 5 7 ; 1 9 5 9 ; CHAPMAN UND BOCK 1 9 5 8 ; CHRISTIE, HAVEL UND SEIDENBERG
1958;
BROWN UND DATTA 1959;PEABODY
1961; für MMPI-Ska-
l e n : ELLIS 1 9 4 6 ; MEEHLUND HATHAWAY 1 9 4 6 ; G O U G H 1 9 4 7 ; F R I C K E 1 9 5 6 ; BARNES
1956; für die Srole-Anomie-Skala: LENSKI UND LEGGETT 1960; CARR 1971). Von anderen wurde als Erklärung für offensichtliche Antworteinseitigkeiten und festgestellte Korrelationen der betreffenden Eigenschaften mit Intelligenz und Ausbildungsgrad der Verweis auf die Bedeutung der Neigung zu sozial erwünschten Angaben eingebracht (vgl. insbesondere die Arbeiten von EDWARDS 1957, 1961 ; sowie MARLOWE UNDCROWNE 1961; TAYLOR 1961a, 1961b); in beiden Interpretationen war man sich allerdings einig, daß durch response set die Skalen überwiegend nicht die gemeinten Eigenschaften messen.
128
4. Band: Erhebungsmethoden: Die Befragung
Die Kontroverse entzündete sich vor allem an der Frage, ob Zustimmungstendenz die einzig relevante Art des response set sei (z.B. COUCH UND KENISTON 1960, 1961) oder ob Zustimmungstendenz und social desirability-Tendenz zwei zu unterscheidende und unabhängig wirkende response set-Arten seien (EDWARDS UND WALKER 1961a, 196 lb), wobei jeweils darauf verwiesen wurde, über Instrumente zur Messung einer vom Inhalt der jeweiligen Skalen unabhängigen Antworttendenz zu verfügen. Damit in engem Zusammenhang wurde weiter diskutiert, ob response set als eine eigenständige Persönlichkeitsvariable anzusehen ist (vgl. die "Yeasayers" und "Naysayers" bei CbucH UND KENISTON 1960; sowie BASS 1956; JACKSON UND MESSICK 1958) oder als zu eliminierendes Fehlverhalten. Insbesondere im Verlauf der Dogmatismusforschung wurde, als die Unangemessenheit der Messung der Konstrukte "Autoritarismus", "Dogmatismus" etc. mit Hilfe von Skalen wegen response set unübersehbar wurde, darauf verwiesen, daß inkonsistente und inhaltsunabhängige Reaktionen auf Skalenvorgaben zum Syndrom eines "geschlossenen" Persönlichkeitssystems gehöre (LEAVITT, H A X UND ROCHE 1 9 5 5 ; GAGE, LEAVITT UND STONE 1 9 5 7 ; G A G E UND CHATTERJEE
1960;
JACKSON, MESSICK UND SOLLEY
1957).
Die Frage, ob Zustimmungstendenz oder social desirability-Tendenz die Hauptquelle der Meßstörungen ist, ist nicht unentscheidbar; offenbar gibt es mindestens zwei eigenständige Arten der Reaktionskonstanz von Befragten. Weist ein Stimulus eine hohe Ambiguität auf bzw. sind dem Befragten die Referenten nicht ersichtlich, dann dürfte es zu Zustimmungstendenz als typischer Reaktionsart in unstrukturierten Situationen kommen (vgl. BERG UND RAPAPORT 1 9 5 4 ; GAGE, LEAVITTUND STONE 1 9 5 7 ; BANTA 1 9 6 1 ; PEABODY 1 9 6 6 ) . Und dies besonders, wenn es sich um Befragte handelt, die bereits in Alltagskontexten zur "Ergebenheit" bei Kontakten mit Fremden neigen (vgl. KUETHE 1 9 5 9 ; 1 9 6 0 ) , vor allem, wenn der Sinn der Befragung nicht verstanden wird; Befragte antworten auch dann, wenn sie nichts verstehen (PAYNE 1 9 5 0 ) , nur sind diese Antworten nicht zufällig auf die Vorgaben verteilt. Bei gleichbleibender Stimulusambiguität ist es daher kaum verwunderlich, wenn bei Skalenumkehrungen Originalform und Umkehrform kaum miteinander korrelieren (vgl. BASS 1 9 5 5 ; CHAPMAN UND CAMPBELL 1 9 5 7 ; CHRISTIE, HAVEL UND SEIDENBERG 1 9 5 8 ; PEABODY 1 9 6 1 ;
Andererseits werden aber durch Reduktion der Stimulusambiguität und "balancing" von Skalen (in einer Skala gleichermaßen positiv wie negativ formulierte Items) die Auswirkungen von Zustimmungstendenzen teilweise kontrollierbar und auch in gewissem Maße reduzierbar (CLOUD UND VAUGHAN 1 9 7 0 ) . Social desirability-Tendenzen treten dagegen erst dann hinzu, wenn eine Frage oder ein Item verstanden wird (vgl. O ' N E I L L 1 9 6 7 ) , wobei Ausmaß und Richtung der Neigung meist erst bei ganz massiven Interessenlagen (z.B. bei Einstellungstests) deutlich identifizierbar werden (DESOTO, KUETHE UND BOSLEY 1 9 5 9 ) . ROGHMANN 1 9 6 6 ) .
Diese Interpretation läßt auch die Frage nach response set als Persönlichkeitsvariable (response style) anders erscheinen: Stimulusambiguität und soziale Erwünschtheit von Antworten sind sozio-kulturell nach Vermittlung kognitiver Fähigkeiten und der Geltung sozialer Normen unterschiedlich verteilt. Die Annahme, daß es sich um ein stabiles Persönlichkeitsmerkmal handelt, ist sowohl wegen der Ungültigkeit der verwendeten Messungen für response set — gemessen an tatsächlichem Zustimmungsverhalten (vgl. FOSTER 1961 ; MCGEE 1962a; FOSTER UND GRIGG 1963) - wie an der unterschiedlichen Auftretenshäufigkeit je nach Inhalt und Item-Ambiguität der jeweiligen Skalen kaum durchzuhalten (MCGEE 1962b, 1962c). Überdies verweist die gesamte
4. Kapitel: Der Befragte
129
Diskussion des response set, die erst allmählich vom sozialpsychologischen Bereich (unter der Verwendung von fast ausschließlich College-Populationen) auf die soziologische Befragungsforschung mit heterogeneren Populationen übergreift (LANDSBERGER UND SAAVEDRA 1 9 6 7 ) , auf die Fragwürdigkeit der Versuche, Persönlichkeitsvariablen mit Hilfe der verbalen Beantwortung von Skalen empirisch aufzuweisen. Das Hauptproblem bei der Erscheinung der Antwortstile im Meßvorgang ist dabei die Gefahr der falschen Eigenschaftszuweisung zu Objekten dadurch, daß die Reaktion auf das Meßinstrument für eine Reaktion auf den Inhalt angesehen wird. Für untere sozio-ökonomische Schichten etwa ist im allgemeinen die Ambiguität von Stimuli und die Neigung zum response set in der Form der Zustimmungstendenz höher als bei anderen Schichten. Außerdem gelten dort andere soziale Vorschriften der sozialen Erwünschtheit von Eigenschaften. Die Mißachtung dieser auf den Meßvorgang selbst bezogenen Faktoren hat z.B. zur (voreiligen) Beschreibung von unteren Schichten als faschistoid, dogmatisch, autoritär, anomisch und geistig nicht gesund geführt (vgl. zu dieser Kritik LENSKI UND LEGGETT 1 9 6 0 ; MILLER UND RIESSMAN 1 9 6 1 ; D O H R E N WEND 1 9 6 6 ; PHILLIPS 1 9 7 1 ; CARR 1 9 7 1 ) .
Die Zustimmungsneigung (ebenso wie die Tendenz zu Falschantworten) ist dabei jedoch wahrscheinlich weniger blindes Reagieren als ein der Situation nach rationales, im Alltag eingeübtes Verhalten von Angehörigen unterer Schichten in der Kommunikation und Auseinandersetzung mit Personen privilegierter Herkunft (vgl. BROWN UND DATTA 1 9 5 9 ; HARE 1 9 6 0 ; CARR 1 9 7 1 ) . Von "Fehlverhalten" kann bei diesen Befragtenreaktionen daher nur unter Anlegung des engen Maßstabes der vom Sozialforscher in der Untersuchungsanordnung gestellten Verhaltensanforderungen gesprochen werden: Die Forschung über "ethnozentristische" Persönlichkeitsdimensionen (etwa) unterliegt offenbar selbst einem höchst ausgeprägten Ethnozentrismus, nähmlich dem der Sozialforschergemeinde ihren Forschungsobjekten gegenüber.
Literatur ADORNO, T H . W . , E . FRENKEL-BRUNSWIK, D . J . LEVINSON UND R . N . SANFORD, T h e
Authoritarian Personality, New York 1950. ANDERSON, R. Β. W., On the Comparability of Meaningful Stimuli in Cross-Cultural Research, in: Sociometry 30, 1967, S. 124 - 136. Befragung und Erhebung, in: C. F . GRAUMANN (Hrsg.), Sozialpsychologie, 1. Halbbd., Handbuch der Psychologie, Bd. 7, Göttingen 1969, S. 567 - 617.
ANGER, Η . ,
ANONYMUS,The Census - What's Wrong With It, What Can Be Done? , in: Transaction 6, 1968, S. 49 - 56. K. R., J. E. COLEMAN, A . P. REITMAN UND J. T A N G , Two Experiments Showing the Effects of the Interviewer's Racial Background on Responses to Questionnaires Concerning Racial Issues, in: Journal of Applied Psychology 44, 1960, S. 2 4 4 - 2 4 6 .
ATHEY,
A Study of Fertility and Infant Mortality in an Urban African Community, in: Population Studies 15, 1961, S. 70 — 86.
BADENHORST, L . T . UND Β . UNTERHALTER,
130
4. Band: Erhebungsmethoden: Die Befragung
J.C., The Reliability and Validity of Interview Data Obtained f r o m 5 9 Narcotic Drug Addicts, in: American Journal of Sociology 72, 1967, S. 6 5 0 — 654.
BALL,
BANCROFT, G., Consistency of Information from Records and Interviews, in: Journal of the American Statistical Association 35, 1940, S. 377 — 381. Social Attitudes and Response Styles, in: Educational and Psychological Measurement 21, 1961, S. 5 4 3 - 557.
BANTA, TH. J . ,
BARNES, Ε. H., Response Bias in the MMPI, in: Journal of Consulting Psychology 20, 1956, S. 371 - 374. Authoritarianism or Acquiescence ? , in: Journal of Abnormal and Social Psychology 51, 1955, S. 616 - 6 2 3 .
BASS, B . M . ,
M., Development and Evaluation of a Scale for Measuring Social Acquiescence, in: Journal of Abnormal and Social Psychology 53, 1956, S. 296 — 299.
BASS, B .
BEBBINGTON, A. C., The E f f e c t of Non-Response in the Sample Survey with an Example, in: Human Relations 23, 1970, S. 169 - 180. BECKER, H. S., Interviewing Medical Students, in: American Journal of Sociology 62, 1956, S. 199 - 201. BELL, C. G., UND W. BUCHANAN, Reliable and Unreliable Respondents: Party Registration and Prestige Pressure, in: Western Political Quarterly 29, 1966, S. 37 — 43. Volunteer Bias in Test-Room Groups, in: Public Opinion Quarterly 24, 1960, S. 115 - 126.
BELSON, W . Α . ,
C. HUGHES, Of Sociology and the Interview, in: American Journal of Sociology 62, 1956, S. 137 - 142.
BENNEY, M . , UND E .
A. STAR, Age and Sex in the Interview, in: American Journal of Sociology 62, 1956, S. 143 - 152.
BENNEY, M . , D . RIESMAN UND SH.
BENNINGHAUS, H., Soziale Einstellungen und soziales Verhalten. Zur Kritik des Attitüdenkonzepts, in: G. ALBRECHT, H. J . DAHEIM UND F. SACK (Hrsg.), Soziologie. Sprache, Bezug zur Praxis, Verhältnis zu anderen Wissenschaften, Festschrift für R. König zum 65. Geburtstag, Opladen 1973, S. 671 - 707. BENSON, L. E., Studies in the Secret-Ballot Technique, in: Public Opinion Quarterly 5, 1941, S. 79 - 8 2 . P. BOOMAN UND Κ . E . CLARK, A Study of Interview Refusals, in: Journal of Applied Psychology 35, 1951, S. 1 1 6 - 119.
BENSON, SH., W .
BERELSON, B . R . , P . F . LAZARSFELD UND W . N . MCPHEE, BERG, I .
Voting, Chicago 1 9 5 4 .
A. (Hrsg.), Response Set in Personality Assessment, Chicago 1 9 6 7 .
Response Bias in an Unstructured Questionnaire, in: Journal of Psychology 38, 1954, S. 475 - 4 8 1 .
BERG, I. Α . , UND G . M . RAPAPORT,
BERK, R. Α., UND J. Μ. ADAMS, Establishing Rapport with Deviant Groups, in: Social Problems 18, 1970, S. 102 - 117. Language and Social Class, in: British Journal of Sociology 11, 1960, S. 271 - 2 7 6 .
BERNSTEIN, B . ,
BIRNBAUM, Z. P., UND M. G. SIRKEN, Bias Due to Non-Availability in Sampling Surveys, in: Journal of the American Statistical Association 45, 1950, S. 98 — 110.
4. Kapitel: Der Befragte
131
H., Multilingual Interviewing in Israel, in: American Journal of Sociology 62, 1956, S. 205 - 209.
BLANC,
Public Opinion and Public Opinion Polling, in: American Sociological Review 13, 1948, S. 542 - 549.
BLUMER, H . ,
Opinion, Don't Know and Maybe No Answer, in: Public Opinion Quarterly 31, 1967, S. 331 - 345.
BOGART, L . , N O
M. E., Response Error in Survey Reports of Earnings Information, in: Journal of the American Statistical Association 61, 1966, S. 729 — 738.
BORUS,
Β RACE Υ, Η. E., Neighbours, Baton Rouge 1964. R., UND L . E . DATTA, Authoritarianism, Verbal Ability, and Response Set, in: Journal of Abnormal and Social Psychology 58, 1959, S. 131 — 134.
BROWN, D .
BROWN,
R., Language and Categories, in: J. S. BRUNER, J. J. GOODNOW Study of Thinking, New York 1962, S. 247 - 3 1 2 .
UND G .
Α.
AUSTIN, A
The Effect of Prior Telephone Appointments on Completion Rates and Response Content, in: Public Opinion Quarterly 31, 1967, S . 652 - 654.
BRUNNER, G . Α . , UND ST. J . CARROLL, JR.,
J. CARROLL, JR., The Effects of Prior Notification on the Refusal in Fixed Address Surveys, in: Journal of Advertising Research 9, 1969, S . 42 - 4 4 .
BRUNNER, G . Α . , UND ST.
G. Α., UND ST. J. CARROLL, JR., Weekday Evening Interviews of Employed Persons Are Better, in: Public Opinion Quarterly 33, 1969, S. 265 - 267.
BRUNNER,
D., Correlates of Respondent Accuracy in the Denver Validity Survey, in: Public Opinion Quarterly 32, 1968, S. 607 - 621.
CAHALAN,
CAMPBELL,
in: S.
D. T., Factors Relevant to the Validity of Experiments in Social Settings, (Hrsg.), Problems in Social Psychology, New York 1 9 6 6 ,
C . W . BACKMAN 3 - 1 3 .
F., UND M. AXELROD, The Respondent Reports on the Interview, in: American Journal of Sociology 62, 1956, S. 177 - 181.
CANNELL, CH.
F., UND F . J. FOWLER, Comparison of a Self-Enumerative Procedure and a Personal Interview: A Validity Study, in: Public Opinion Quarterly 27, 1963, S. 250 - 264.
CANNELL, C H .
R. L . KAHN, Interviewing, in: G . LINDZEY UND E . ARONSON (Hrsg.), The Handbook of Social Psychology, Bd. 2, Reading, Mass. 2. Aufl. 1968, S. 526 - 595.
CANNELL,CH. F . , UND
The Influence of Interviewer and Respondent Psychological and Behavioral Variables on the Reporting in Household Interviews, National Center for Health Statistics, in: Vital and Health Statistics, Washington 1968.
CANNELL, CH. F . , F . J . FOWLER UND K . H . MARQUIS,
CAPLOVITZ,
D., The Poor Pay More, New York
1963.
Th., The Dynamics of Information Interviewing, in: American Journal of Sociology 62, 1956, S. 165 - 171.
CAPLOW,
L. G., The Srole Items and Acquiescence, in: American Sociological Review 36, 1971, S. 287 - 293.
CARR,
132
4. Band: Erhebungsmethoden:
Die
Befragung
T. CAMPBELL, The Effect of Acquiescence Response Set Upon Relationships Among the F-Scale, Ethnocentrism, and Intelligence, in: Sociometry 22, 1959, S. 153 - 161.
CHAPMAN, L . J . , UND D .
CARROLL, J . B . , UND J . B . CASAGRANDE, T h e F u n c t i o n o f L a n g u a g e C l a s s i f i c a t i o n i n
Behavior, in: E . MACCOBY.TH. M . NEWCOMB UND E . L. in Social Psychology, New York 1958, S. 18 - 31.
HARTLEY
(Hrsg.), Readings
Α., UND W. TUCKER, An Attempt to Reduce Calls on an Interview Inquiry, in: Public Opinion Quarterly 31, 1967, S. 299 - 3 0 2 .
CARTWRIGHT,
CHAPMAN, L . J . , UND R . D . BOCK, C o m p o n e n t s o f V a r i a n c e D u e t o A c q u i e s c e n c e a n d
Content in the F-Scale Measure of Authoritarianism, in: Psychological Bulletin 55, 1958, S. 328 - 333. CHAPMAN, L . J . , UND D . T . CAMPBELL, R e s p o n s e S e t i n t h e F - S c a l e , i n : J o u r n a l o f A b -
normal and Social Psychology 54, 1957, S. 129 - 132 . R., J. HAVEL UND Β. SEIDENBERG, Is The F-Scale Irreversible? , in: Journal of Abnormal and Social Psychology 56, 1958, S. 143 - 159.
CHRISTIE,
CLARK, J. P., UND L. L. TIFFT, Polygraph and Interview Validation of Self-Reported Deviant Behavior, in: American Sociological Review 31, 1966, S. 516 — 523. CLAUSEN, A. R., Response Validity: Vote Report, in: Public Opinion Quarterly 32, 1968, S. 588 - 606. CLOUD, J., UND G. M. VAUGHAN, Using Balanced Scales to Control Acquiescence, in: Sociometry 33, 1970, S. 193 - 2 0 2 . W. G., F. MOSTELLER UND J. W. TUCKEY, Statistical Problems of the Kinsey Report, in: Journal of the American Statistical Association 48, 1953, S. 673 — 716.
COCHRAN,
COHN, T. S., The Relation of the F-Scale to a Response Set to Answer Positively, in: American Psychologist 8, 1953, S. 335 (Abstract). COREY, S. M., Signed Versus Unsigned Attitude Questionnaires, in: Journal of Educational Psychology 28, 1937, S. 144 - 148. CORNFIELD, J., On Certain Biases in Samples of Human Populations, in: Journal of the American Statistical Association 37, 1942, S. 63 — 68 . Yeasayers and Naysayers: Agreeing Response Set as a Personality Variable, in: Journal of Abnormal and Social Psychology 60, 1960, S. 150 - 174.
COUCH, Α . , UND Κ . KENISTON,
Agreeing Response Set and Social Desirability, in: Journal of Abnormal and Social Psychology 62, 1961, S. 175 - 179.
COUCH, Α . , UND Κ . KENISTON,
CRESPI, L. P., The Interview Effect in Polling, in: Public Opinion Quarterly 12, 1948, S. 9 9 - 111. CRESPI, L. P., The Influence of Military Government Sponsorship in German Opinion Polling, in: International Journal of Opinion and Attitude Research 4, 1950, S. 151 - 178. J., Response Sets and Test Validity, in: Educational and Psychological Measurement 6, 1946, S. 475 - 4 9 4 .
CRONBACH, L .
4. Kapitel:
Der Befragte
133
L. J., Further Evidence on Response Sets and Test Design, in: Educational and Psychological Measurement 10, 1950, S. 3 — 31.
CRONBACH,
Response and Non-Response in a Probability Sample, in: International Journal of Opinion and Attitude Research 5, 1951, S. 1 — 19. C h o w N E , D . P., UND D. MARLOWE, The Approval Motive, New York 1 9 6 4 . CROSSLEY, H . M . , UND R . FINK,
S. J . MESSICK, Response Styles as Personality Variables: A Theoretical Integration of Multivariate Research, in: Research Bulletin Nr. 5 6 - 1 0 , Princeton, N. J., 1965.
DAMARIN, F . L . , UND
DAVID,M., The Validity of Income Reported by a Sample of Families Who Received Welfare Assistance During 1959, in: Journal of the American Statistical Association 57, 1962, S. 680 - 685. R. WESTIE, Verbal Attitudes and Overt Acts: An Experiment on the Salience Attitudes, in: American Sociological Review 23, 1958, S. 667 673.
DEFLEUR, M . L . , UND F .
DEFLEUR, M . L . , UND F . R . WESTIE,
Attitude as a Scientific Concept, in: Social Forces
42, 1963, S. 1 7 - 3 1 . DEMING,
W. E., Some Theory of Sampling, New York 1950.
E., Sample Surveys, I. The Field, in: International Encyclopedia of the Social Sciences, Bd. 13, New York 1968, S. 594 - 612 .
DEMING, W .
J. L. KUETHE UND J. H. BOSLEY, A Redefinition of Social Desirability, in: Journal of Abnormal and Social Psychology 58, 1959, S. 273 - 275.
DESOTO, C . B . ,
Words and Deeds: Social Science and Social Policy, in: Social Problems 13, 1966, S. 235 - 265.
DEUTSCHER,I.,
I., Asking Questions Cross-Culturally: Some Problems of Linguistic Comparability, in: H . S. BECKER, B . GEER, D . RIESMAN UND R . S. WEISS (Hrsg.), Institutions and the Person, Chicago 1968, S. 318 - 341.
DEUTSCHER,
Looking Backward: Case Studies on the Progress of Methodology in Social Research, in: American Sociologist 4, 1969, S. 35 — 41.
DEUTSCHER, I . ,
L. Α., Role Relationships and Concepts of Neutrality in Interviewing, in: American Journal of Sociology 62, 1956, S. 153 — 157.
DEXTER,
DEXTER, L . A .
(Hrsg.), Elite and Specialized Interviewing, Evanston,
111., 1 9 7 0 .
On Predicting Elections and Other Public Behavior, in: International Journal of Opinion and Attitude Research 2, 1948, S. 494 - 502.
DODD, S T . C . ,
P., Social Status and Psychological Disorder: An Issue of Substance and an Issue of Method, in: American Sociological Review 31, 1966, S. 14 — 34.
DOHRENWEND, B .
S., An Experimental Study of Payments to Respondents, in: Public Opinion Quarterly 34, 1970, S. 621 - 624.
DOHRENWEND, B .
S., UND Β . P. DOHRENWEND, Sources of Refusals in Surveys, in: Public Opinion Quarterly 32, 1968, S. 74 - 83. DOHRENWEND, B . P., UND Β . S. DOHRENWEND, The Problem of Validity in Field Studies of Psychological Disorder, in: Journal of Abnormal and Social Psychology 70, 1965, S. 52 - 6 9 . DOHRENWEND, B .
134
4. Band: Erhebungsme 'hoden: Die Befragung
S., D. COLOMBOTOS UND 3 . P . DOHRENWEND, Social Distance and Interviewer Effects, in: Public Opinion Quarterly ¿ I , 1968, S. 410 - 4 2 2 .
DOHRENWEND, Β .
B. S., J. A. WILLIAMS, JR., UND C . H. WEISS, Interviewer Biasing Effects: Toward a Reconciliation of Findings, in: Public Opinion Quarterly 33, 1969, S. 121 - 129.
DOHRENWEND,
DOLLARD, J., Under What Conditions D o Opinions Predict Behavior, in: Public Opinion Quarterly 12, 1948, S. 623 - 6 3 2 . Implications of Non-Response for the Interpretation of Mail-Questionnaire Data, in: Public Opinion Quarterly 24, 1960, S. 99 - 114.
DONALD, M . H . ,
M. D . , W. H. UPHOFF UND M. AYLWARD, The Effect of Lack of Information on the Undecided Response in Attidude Surveys, in: Journal of Applied Psychology 40, 1956, S 150 - 153.
DUNNETTE,
DURBIN, J., UND A. STUART,Differences in Response Rates of Experienced and Unexperienced Interviewers, in: Journal of the Royal Statistical Society, Series A, 114, 1951, S . 163 - 195. R. D. NORMAN, Objective Differences Among Various Types of Respondents to a Mailed Questionnaire, in: American Sociological Review 12, 1947, S. 435 - 4 4 4 .
EDGERTON, Η . Α . , ST. H . BRITT UND
EDWARDS, A. L., The Social Desirability Variable in Personality Assessment and Research, New York 1957. EDWARDS, A. L., Social Desirability or Acquiescence in the MMPI? , Case Study with the SD Scale, in: Journal of Abnormal and Social Psychology 63, 1961, S. 351 — 359. EDWARDS, A. L., UND J. N. WALKER, A Note on the Couch and Keniston Measure of Agreement Response Set, in: Journal of Abnormal and Social Psychology 62, 1961a, S. 173 - 174. EDWARDS, A. L., UND J. N. WALKER, Social Desirability and Agreement Response Set, in: Journal of Abnormal and Social Psychology 62, 1961b, S. 180 — 183. J. S . , U N D D . RIESMAN.Age and Authority in the Interview, in: Public Opinion Quarterly 25, 1961, S. 39 - 5 6 .
EHRLICH,
ELINSON, J., UND V. T. HAINES, Role of Anonymity in Attitude Surveys, in: American Psychologist 5, 1960. Questionnaire vs. Interview Methods in the Study of Human Love Relationships, in: American Sociological Review 12, 1947, S. 541 — 553.
ELLIS, Α . ,
ELLIS, R. S., Validity of Personality Questionnaires, in: Psychological Bulletin 43, 1 9 4 6 , S. 3 8 5
- 4 4 0 .
ENTWISLE, D. R., Interactive Effects of Pretesting, in: Educational and Psychological Measurement 21, 1961, S. 607 - 6 2 0 . FEIN, E., Inner-City Interviewing: Some Perspectives, in: Public Opinion Quarterly 34, 1970, S. 625 - 629. FERBER, R., Collecting Financial Data by Consumer Panel Techniques: A Pilot Study, Urbana, 111. 1959.
4. Kapitel:
Der Befragte
13 5
R., The Effect of Respondent Ignorance on Survey Results, in: Journal of the American Statistical Association 51, 1956, S. 576 - 586.
FERBER,
R., Item Nonresponse in a Consumer Survey, in: Public Opinion Quarterly 30, 1966, S. 399 - 4 1 5 .
FERBER,
A. L . , A Note on Stimulating Response to Questionnaires, in: American Sociological Review 16, 1951, S. 247 - 249.
FERRISS,
R. F . , Signed vs. Unsigned Questionnaires, in: Journal of Applied Psychology 30, 1946, S. 2 2 0 - 225.
FISHER,
R. F . , Acquiescent Response Set as a Measure of Acquiescence, in: Journal of Abnormal and Social Psychology 63, 1961, S. 155 - 160.
FOSTER,
R. F., UND A. E. GRIGG, Acquiescent Response Set as a Measure of Acquiescence: Further Evidence, in: Journal of Abnormal and Social Psychology 67, 1963, S. 303 - 306.
FOSTER,
D. M., A Note on Interviewing Mexican-Americans, in: Social Science Quarterly 49, 1969, S. 909 - 918.
FREEMAN,
W., Surveying Peasant Attitudes in Turkey, in: Public Opinion Quarterly 27, 1963, S. 335 - 355.
FREY, F .
Response Set as a Suppressive Variable in the OAIS and MMPI, in: Journal of Consulting Psychology 20, 1956, S. 161 - 169.
FRICKE, B . G . ,
FRIEDMAN,
N., The Social Nature of Psychological Research, New York/London
1967.
W., Empirische Sozialforschung als politische Aktion, in: Soziale Welt 20, 1971, S. 1 - 17.
FUCHS,
L., UND B . P. CHATTERJEE, The Psychological Meaning of Acquiescence Set: Further Evidence, in: Journal of Abnormal and Social Psychology 60, 1960, S. 280 - 283.
GAGE, N .
N. L., G . S . LEAVITT UND G . C. STONE, The Psychological Meaning of Acquiescence Set for Authoritarianism, in: Journal of Abnormal and Social Psychology 55, 1957, S . 98 - 103.
GAGE,
GALLUP,
G., A Guide to Public Polls, Princeton, N. J. 1948 .
E. C. WILSON, Who Escapes the Personal Investigator? , in: Journal of Applied Psychology 24, 1940, S. 773 - 777.
GAUDET, H . , UND
Research Interviewing with Low-Income Families, in: Social Work 8, 1963, S. 10 - 13 .
GEISMAR, L . L . , UND M . A . LASORTE,
J. B . , UND J. M . MASON, Signed Versus Unsigned Questionnaires, in: Journal of Educational Research 42, 1948, S. 122 - 126. GERGEN, K., UND Κ. W. BACK, Communication in the Interview and the Disengaged Respondent, in: Public Opinion Quarterly 30, 1966, S. 385 - 398. GERBERICH,
D., Aging, Disengagement, and Opinionation, in: Public Opinion Quarterly 33, 1969, S. 1 7 - 3 3 .
GLENN, N .
Participation Bias and Re-Interview Effects in Panel-Studies, unv. Diss. Columbia University, 1952, zit. in: BERELSON, B . u.a., Voting, Chicago 1954.
GLOCK, C H . Y . ,
136
4. Band: Erhebungsmethoden:
GOLDMAN, E . F . ,
Die
Befragung
Poll on the Polls, in: Public Opinion Quarterly
8, 1 9 4 4 , S. 4 6 1 -
467.
GOLDTHORPE, J. E., Attitudes to the Census and Vital Registration in East Africa, in: Population Studies 6, 1952, S. 163 - 171. GOUGH, H. G., Simulated Patterns on the MMPI, in: Journal of Abnormal and Social Psychology 42, 1947, S. 215 - 225. GOULD, L. C., Who Defines Delinquency. A Comparison of Self-Reported and Officially-Reported Delinquency for Three Radical Groups, in: Social Problems 16, 1968, S. 325 - 3 3 6 . HABERMAN, P. W., UND J. SHEINBERG, Education Reported in Interviews: An Aspect of Survey Content Error, in: Public Opinion Quarterly 30, 1966, S. 295 - 301. Validity of Questionnaire Data: Reported and Observed Attendance in an Adult Education Program, in: Public Opinion Quarterly 32, 1968, S. 453 — 456.
HAGBURG.E. C.,
HAMBRIGHT, T. Z., Comparison of Information on Death Certificates and Matching 1960 Census Records: Age, Marital Status, Race, Nativity and Country of Origin, in: Demography 6, 1969, S. 4 1 3 - 423. Refusals as a Source of Bias, in: H. CANTRIL, U.A. (Hrsg.), Gauging Public Opinion, Princeton und London 1947, S. 119 — 123.
HARDING, J . ,
HARE, P., Interview Responses: Personality or Conformity, in: Public Opinion Quarterly 24, 1960, S. 679 - 685. L., H . L . ISAACSON UND C. M . JURGELL, Public Reaction to Public Opinion Surveying, in: Public Opinion Quarterly 32, 1968, S. 295 - 298.
HARTMANN,E.
Refusai Rates and Interviewer Quality, in: International Journal of Opinion and Attitude Research 3, 1949, S. 392 — 398.
HENEMAN, H . G . , UND D . G . PATERSON,
HILGARD, E. H., UND S. L. PAYNE, Those Not At Home: A Riddle For Pollsters, in: Public Opinion Quarterly 8, 1944, S. 254 - 261. R., UND Κ . S. RENNE, Reliability of Response in a Socio-Medical Population Study, in: Public Opinion Quarterly 35, 1971, S. 69 - 79.
HOCHSTIM, J .
R., Medical Needs of the Rural Population of Michigan, in: Rural Sociology 12, 1947.
HOFFER, CH.
V., UND S. W. CASSIDY, Interviewing Negro Pentecostals, in: American Journal of Sociology 62, 1956, S. 195 - 197.
HOFFMAN, Ν .
J., Interviewerleistung und Interviewerwertorientierung, unv. Diplom-Arbeit Köln 1965.
HOFFMANN-NOWOTNY, H .
Military Counseling as Practice by the Personnel Consultant, in: Family 25, 1945, S . 337 - 344.
HOFSTEIN, S . ,
J. C . WAHLKE, Interviewing Political Elites in CrossCultural Comparative Research, in: American Journal of Sociology 70, 1964, S. 59 - 6 8 .
HUNT, W . H . , W . W . CRANE UND
HYMAN, H . H . , D O S. 5 5 7 HYMAN, H . H . ,
They Tell The Truth? , in: Public Opinion Quarterly
559.
Interviewing in Social Research, Chicago 1954.
8,
1944,
4. Kapitel:
Der Befragte
13 7
JACKSON, D. N., Acquiescence Response Styles: Problems of Identification and Control, in: I. A . B E R G 1 9 6 7 , S. 7 1 - 1 1 4 . JACKSON, D. N., UND S. J. MESSICK, Content and Style in Personality Assessment, in: Psychological Bulletin 55, 1958, S. 243 - 252 . D. N., S . J. MESSICK UND C . M . SOLLEY, H O W "Rigid" is the Authoritarian? , in: Journal of Abnormal and Social Psychology 54, 1957, S. 137 - 1 4 0 .
JACKSON,
Dependability of Psychological Brand Barometers, II. The Problem of Validity, in: Journal of Applied Psychology 22, 1938, S. 252 - 2 6 0 .
JENKINS, J . G . , UND Η . H . CORBIN, JR.,
JONES, E. L., T h e Courtesy Bias in South East Asian Surveys, in: International Social Science Journal 15, 1963, S. 70 - 7 6 . JOSEPHSON, E., Resistance to Community Surveys, in: Social Problems 18, 1970, S. 117 - 129. KAHN, R. L., UND CH. F. CANNELL, The Dynamics of Interviewing: Theory, Technique and Cases, New York 1957. KAHN, R. L., UND CH. F. CANNELL, Interviewing, I. Social Research, in: International Encyclopedia of the Social Sciences, Bd. 8, New York 1968, S. 149 - 161. KATZ, D., Do Interviewers Bias Polls?, in: Public Opinion Quarterly 6, 1942, S. 248 — 268. KATZ, D., Psychological Barriers t o Communication, in: T h e Annals 250, 1947, S. 17 - "25. KATZ, D., Polling Methods and 1948 Polling Failure, in: International Journal of Opinion and Attitude Research 2, 1948, S. 469 - 4 8 0 . KINSEY, A. C., U.A., Sexual Behavior in the Human Male, London/Philadelphia 11. Auflage 1953, zuerst 1948. A " R e p l a c e m e n t " Procedure for Reducing the Bias of NonResponse, in: The American Statistician 13, 1959, S. 17 — 19.
KISH, L . , UND I . HESS,
B. G L E I C H E R , D e t e r m i n a n t s of Voting Behavior, in: Public Opinion Quarterly 14, 1950, S. 3 9 3 - 412 .
KITT, A . S . , U N D D .
KNUPFER.G., Portrait of the Underdog, in: Public Opinion Quarterly 11, 1947, S. 103 - 1 1 4 . KOOLWIJK, J. VAN, Fragebogenprofile, in: Kölner Zeitschrift für Soziologie und Sozialpsychologie 20, 1968, S. 780 - 7 9 1 . KOOLWIJK, J. VAN, Unangenehme Fragen, in: Kölner Zeitschrift für Soziologie u n d Sozialpsychologie 21, 1969, S. 864 - 8 7 5 . De aanwezigheid van en ander tijdens interviews, in: Mens en Maatschappij 43, 1968, S. 533 - 536 .
KOOMEN, W . , U N D L . V . RAVESTEIJN,
KREUTZ, H., Die tatsächliche Repräsentativität von soziologischen Befragungen, in: AIAS-Informationen 1970/71, S. 242 - 262 . P., UND H . H . DAVIDSON, The Willingness to be Interviewed: A Selective Factor in Sampling, in: Journal of Social Psychology 38, 1953, S. 3 9 — 4 7 .
KRUGLOV, L.
138
4. Band: Erhebungsmethoden: Die Befragung
KuETHE, J. L., The Positive Response Set as Related t o Task Performance, in: Journal of Personality 27, 1959, S. 87 - 9 4 . KUETHE, J. L., Acquiescence Response Set and the Psychasthenia Scale. An Analysis via the Aussage Experiment, in: Journal of Abnormal and Social Psychology 61, 1960, S. 319 - 3 2 2 . H., The Interview and the Professional Relationship, in: A . M . ROSE (Hrsg.), Human Behavior and Social Processes, Boston 1962, S. 193 — 2 0 6 .
KUHN, M .
G., Interview, in: W . BERNSDORF (Hrsg.), Wörterbuch der Soziologie, Stuttgart 2. Auflage 1969, S. 498 - 514 .
KUNZ,
E., Inhibitory Effects of a Pretest on Opinion Change, in: Educational and Psychological Measurement 26, 1966, S. 139 — 1 5 0 .
LANA, R .
Response Set in Developing Countries, in: Public Opinion Quarterly 3 1 , 1 9 6 7 , S. 214 - 229.
LANDSBERGER, Η . Α . , UND A . SAAVEDRA,
J. Β., G . P. GINSBURG UND Κ. BRAATEN, An Investigation of Response Error, Urbana, 111. 1961.
LANSING,
LAPŒRE, R. T., Attitude vs. Actions, in: Social Forces 13, 1934, S. 230 - 237. O., U N D M . D E F L E U R , Validity and Reliability in Measurement of Message Diffusion, in: Proceedings of the Pacific Sociological Society 1955, S. 110 - 120.
LARSEN,
R. F . , UND W . R. CATTON, JR., Can the Mail-Back Bias Contribute t o a Study's Validity? , in: American Sociological Review 24, 1959, S. 243 - 2 4 5 .
LARSON,
P. F . , M . ROSENBERG UND W . THIELENS, Die Panel-Befragung, in: R . (Hrsg.), Das Interview, Köln/Opladen 4. Aufl. 1965, S. 253 - 268.
LAZARSFELD, KÖNIG
LAZARSFELD, P. F., UND W. S. ROBINSON, Some Properties of the Trichotomy "Like, No Opinion, Dislike" and their Psychological Interpretation, in: Sociometry 3, 1940, S. 151 - 179. J., H . HAX UND J. H . ROCHE, "Authoritarianism" and Agreement with Things Authoritative, in: Journal of Psychology 4 0 , 1955, S. 215 - 2 2 1 .
LEA VITT, H .
LENSKI, G. E., UND J. C. LEGGETT, Caste, Class and Deference in the Research Interview, in: American Journal of Sociology 65, 1960, S. 4 6 3 - 4 6 7 . F., Acquiescence as a Factor in the Measurement of Personality, in: Psychological Bulletin 35, 1938, S. 6 5 9 .
LENTZ, T .
Interviewing Frenchmen, in: American Journal of Sociology 6 2 , 1 9 5 6 , S. 1 8 7 - 1 9 4 .
LERNER, D . ,
Die Meinungslosen, in: G. SCHMÖLDERS (Hrsg.), Beiträge zur Verhaltensforschung Heft 6, Berlin 1 9 6 6 .
LEVERKUS-BRÜNING, I . ,
Maximizing Returns on Mail Questionnaires, in: Public Opinion Quarterly 22, 1958, S. 568 - 5 7 5 .
LEVINE, S . , UND G . GORDON,
LEZNOFF, M . ,
Interviewing Homosexuals, in: American Journal of Sociology 6 2 ,
1956,S. 202 -
204.
LOCKE, H. J., Are Volunteer Interviewees Representative? , in: Social Problems 1, 1953, S. 143 - 146.
4. Kapitel: Der Befragte
LORGE,
I., Gen-Like: Halo or Reality, in: Psychological Bulletin
3 4 , 1 9 3 7 , S. 5 4 5
139
-
546.
Some Survey Sampling Biases, in: Public Opinion Quarterly 19, 1955, S. 303 - 315.
LOWE, F . E . , UND T H . E . MCCORMICK,
G. Α., UND O.N. LARSEN, Characteristics of Hard-to-Reach Individuals in Field Surveys, in: Public Opinion Quarterly 13, 1949, S. 487 - 494.
LUNDBERG,
R. K . , The Relationship Between Response Style and Personality Variables: I. The Measurement of Response Acquiescence, in: Journal of Abnormal and Social Psychology 64, 1962a, S. 229 - 233 .
MCGEE,
R. K . , The Relationship Between Response Style and Personality Variables: II. The Prediction of Independent Conformity Behavior, in: Journal of Abnormal and Social Psychology 65, 1962b, S. 347 - 351.
MCGEE,
R. K . , Response Style as a Personality Variable: By What Criterion? , in: Psychological Bulletin 59, 1962c, S. 284 - 295.
MCGEE,
MCGEE,
R. K., Response Set in Relation to Personality: An Orientation, in: I. A.
BERG 1 9 6 7 , S . 1 MCNEMAR, Q . , S. 2 8 9 -
31.
Opinion-Attitude Methodology, in: Psychological Bulletin
43,
1946,
374.
Interviewing Problems in Financial Surveys, in: International Journal of Opinion and Attitude Research 1, 1947, S. 31 - 39-
MACCOBY, Ε . E . ,
MACCOBY, Ε .
in: R.
E.,
Das Interview: Ein Werkzeug der Sozialforschung, (Hrsg.), Das Interview, Köln/Opladen 4. Aufl. 1965, S. 37 - 85 .
UND Ν . MACCOBY,
KÖNIG
G. L., Fact and Artifact. Evidence Bearing on Disengagement Theory from the Duke Geriatrics Project, in: Human Development 8, 1965, S. 117 — 130.
MADDOX,
MADGE, J . ,
The Tools of Social Science, London/New York/Toronto
1953.
P. K . , Problems in Interpreting Interview Data, in: Sociology and Social Research 50, 1966/67, S. 302 - 316.
MANNING,
E. S., UND W . P . MAULDIN, Response Errors in Census Research, in: Journal of the American Statistical Association 45, 1950, S. 424 - 438 .
MARKS,
MARLOWE,D., UND D. P. CROWNE,Social Desirability and Response to Perceived Situational Demands, in: Journal of Consulting Psychology 25, 1961, S. 109 115. MASLOW, A. H., UND J. M . SAKODA, Volunteer Error in the Kinsey Study, in: Journal of Abnormal and Social Psychology 47, 1952, S. 259 - 262 . S., UND R . W . PRATT, JR., A Note on Nonresponse in a Mail Survey, in: Public Opinion Quarterly 30, 1966, S. 637 - 646.
MAYER, CH.
P. E . , UND S . R . HATHAWAY, The K-Factor, in: Journal of Applied Psychology 30, 1946, S . 525 - 564.
MEEHL,
R., U N D E . W . BUTLER, Disengagement of the Aged Population and Response Differentials in Survey Research, in: Social Forces 46, 1967, S. 89 - 9 6 .
MERCER, J .
R. K . , Selected Problems of Field Work in the Planned Community, in: American Sociological Review 12, 1947, S. 304 - 312 .
MERTON,
140
4. Band: Erhebungsmethoden: Die Befragung
MERTON, R. Κ., UND P. K. HATT, Election Polling Forecasts and Public Images of Social Science, in: Public Opinion Quarterly 13, 1949, S. 185 - 2 2 2 . The Attitudes of Subject in Personality Testing, in: Journal of Applied Psychology 18, 1934, S. 165 - 177.
MERTON, R . K . , UND PH. E . VERNON,
F. MANN, A Limited Comparison of Two Methods of Data Collection: The Fixed Alternative Questionnaire and the Open-Ended Interview, in: American Sociological Review 17, 1952, S. 486 — 491 ·
METZNER, H . , UND
MILLER, S. M., UND F. RIESSMAN, "Working Class Authoritarianism": A Critique of Upset, in: British Journal of Sociology 12, 1961, S. 263 - 276 . MITCHELL, R. E., Survey Materials Collected in the Developing Countries: Sampling, Measurement and Interviewing Obstacles to Intra- and International Comparisons, in: International Social Science Journal 17, 1965, S. 665 — 6 8 5 . An Experimental Study of Quota Sampling, in: Journal of the Royal Statistical Society, Series A, 116, 1953, S. 349 - 394.
MOSER, C . Α . , UND Α . STUART,
MOSTELLER.F., Errors, I. Nonsampling Errors, in: International Encyclopedia of the Social Sciences, Bd. 5, New York 1968, S. 113 - 132 . MYERS, R. J., Error and Bias in the Reporting of Age in Census Data, in: Transactions of the Actuarial Society o f A m e r i c a 4 1 , 1940,S. 395 - 415. The Measurement of Life Satisfaction, in: Journal of Gerontology 76, 1961, S. 134 - 143 .
NEUGARTEN, Β . , R . HAVIGHURST UND SH. TOBIN,
NORMAN, R. D., A Review of Some Problems Related to the Mail Questionnaire Technique, in: Educational and Psychological Measurement 8, 1948, S. 235 — 247. NOSANCHUK.T. Α., Pretesting Effects: An Inductive Model, in: Sociometry 33, 1970, S. 12 - 19. R. D. HARE, Word Recognition-Threshold as a Function of Pretest Sensitization, in: Psychonomic Science 6, 1966, S. 51 — 52 .
N O S A N C H U K . T . Α . , UND
NUNNALLY, J. P., Psychometric Theory, New York 1967. Schichtungsspezifische Formen des Sprachverhaltens und ihr Einfluß auf die kognitiven Prozesse, in: H . ROTH (Hrsg.), Begabung und Lernen, Stuttgart 1968, S. 297 - 3 5 0 .
OEVERMANN, U . ,
W., Response Style Influence in Public Opinion Surveys, in: Public Opinion Quarterly 31, 1967, S. 95 - 102 .
O'NEILL, H.
T., The Nature of Hypnosis: Artifact and Essence, in: Journal of Abnormal and Social Psychology 58, 1959, S. 277 - 299.
ORNE, M .
ORNE, M. T., On the Social Psychology of the Psychological Experiment: With Particular Reference to Demand Characteristics and their Implications, in: C. W. BACKMAN (Hrsg.), Problems in Social Psychology, New York 1 9 6 6 , S. 1 4 - 2 1 . PACE, C., Factors Influencing Questionnaire Returns from Former University Students, in: Journal of Applied Psychology 23, 1939, S. 388 - 397. PAN, J. S., Social Characteristics of Respondents and Non-Respondents in a Questionnaire Study of Later Maturity, in: Journal of Applied Psychology 35, 1951, S. 1 2 0 - 121.
4. Kapitel: Der Befragte
141
H. J., UND H. M. CROSSLEY, The Validity of Response to Survey Questions, in: Public Opinion Quarterly 14, 1950, S. 6 1 - 8 0 .
PARRY,
H. J., M. B . BALTER UND I. H. CISIN, Primary Levels of Underreporting Psychotropic Drug Use, in: Public Opinion Quarterly 34, 1970, S. 582 - 592 .
PARRY,
PARTEN,
M., Surveys, Polls, and Samples, New York 1950.
L., Thoughts About Meaningless Questions, in: Public Opinion Quarterly 12, 1950, S . 687 - 6 9 6 .
PAYNE, ST.
D., Attitude Content and Agreement Set in Scales of Authoritarianism, Dogmatism, Anti-Semitism and Economic Conservatism, in: Journal of Abnormal and Social Psychology 63, 1961, S. 1 - 11.
PEABODY,
Authoritarianism Scales and Response Bias, in: Psychological Bulletin 65, 1966, S. 1 1 - 2 3 .
PEABODY, D . ,
PHILLIPS,
D. L., Knowledge From What?, Chicago 1971.
D. L., UND Κ . J. CLANCY, Response Biases in Field Studies of Mental Illness, in: American Sociological Review 35, 1970, S. 503 — 515.
PHILLIPS,
D. L., UND Β. E. SEGAL, Sexual Status and Psychiatric Symptoms, in: American Sociological Review 34, 1969, S. 58 - 72 .
PHILLIPS,
H. P., Problems of Translation and Meaning in Field Work, in: Human Organization 18, 1959/60, S. 184 - 192.
PHILLIPS,
Α., UND W . SIMMONS, An Attempt to Get the "Not-at-Homes" into the Sample Without Call-Backs, in: Journal of American Statistical Association 44, 1949, S. 9 - 31 .
PÖLITZ,
POMEROY, W . B . , S. 2 8 7
The Reluctant Respondent, in: Public Opinion Quarterly
27,
1963,
- 2 9 3 .
M., E. A. SUCHMAN UND R . Κ. GOLDSEN, Applicability of Survey Techniques in Northern India, in: Public Opinion Quarterly 22, 1958, S. 245 - 2 5 0 .
RALIS,
D. T . CAMPBELL, Galvanic Skin Response to Negro and White Experimenters, in: Journal of Abnormal and Social Psychology 51, 1955, S. 30 — 33.
RANKIN, R . E . , UND
F., Differences between Persons Responding and not Responding to a Mailed Questionnaire, in: American Sociological Review 8, 1943, S. 433 — 438.
REUSS, C .
RICHARDSON, ST. Α . , B . S . DOHRENWEND UND D . K L E I N ,
Interviewing Its Forms and
Functions, New York/London 1965. RICHTER,
H. J., Die Strategie schriftlicher Massenbefragungen, Bad Harzburg 1970.
Program for Research on Experiments in Social Psychology, in: Ν. F. WASHBURNE (Hrsg.), Decisions, Values, and Groups, Bd. 2, New York 1962, S. 2 5 - 4 1 .
RIECKEN, H . W . , A
L. N., The Reluctant Respondent, in: Public Opinion Quarterly 27, 1963, S. 276 - 2 8 6 .
ROBINS,
J. Α., Survey Interviewing Members of Congress, in: Public Opinion Quarterly 24, 1960, S. 127 - 138.
ROBINSON,
142
4. Band: Erhebungsmethoden: Die Befragung
ROBINSON, Ο., UND S. RHODE, TWO Experiments with an Anti-Semitism Poll, in: Journal of Abnormal and Social Psychology 41, 1946, S. 136 - 144. ROEDE, H., Befrager und Befragte, Berlin 1968. ROETHLISBERGER, F. J., UND W. J. DICKSON, Management and the Worker, Cambridge, Mass. 13. Aufl. 1964, zuerst 1939. ROGERS, C. R., The Nondirective Method as a Technique in Social Research in: American Journal of Sociology 50, 1945, S. 279 ^ 283. ROGHMANN, K., Dogmatismus und Autoritarismus, Meisenheim/Glan 1966. ROKEACH, M., The Open and the Closed Mind, New York 1960 · ROKEACH, M., The Double Agreement Phenomenon: Three Hypotheses, in: Psychological Review 70, 1963, S. 304 - 309. ROKEACH, M., Authoritarianism Scales and Response Bias, in: Psychological Bulletin 67, 1967, S. 349 - 355. ROPER,Ε. B., JR., Neutral Opinion on the Court Proposal, in: Public Opinion Quarterly 1, 1937, S. 1 7 - 2 0 . RORER, L. G., The Great Response Style Myth, in: Psychological Bulletin 63, 1965, S. 129 - 156. ROSE, A. M., Public Opinion Research Techniques Suggested by Sociological Theory, in: Public Opinion Quarterly 14, 1950, S. 205 - 214 . ROSEN, H., UND R. ROSEN,The Validity of "Undecided" Answers in Questionnaire, Responses, in: Journal of Applied Psychology 39, 1955, S. 178 - 181. ROSEN, Ν. Α., Anonymity and Attitude Measurement, in: Public Opinion Quarterly 24, 1960, S. 675 - 679. ROSENBERG, M., The Conditions and Consequences of Evaluation Apprehension, in: R. ROSENTHAL UND R. L. ROSNOW (Hrsg.), Artifact in Behavorial Research, New York/London 1969, S. 279 - 349. ROSENTHAL, R., On the Social Psychology of the Psychological Experiment: The Experimenter's Hypotheses as Unintended Determinant of Experimental Results, in: American Scientist 51, 1963, S. 268 — 2 8 3 . ROSENTHAL, R., The Volunteer Subject, in: Human Relations 18, 1965, S. 389 - 4 0 6 . ROSENTHAL, R., Experimenter Effects in Behavorial Research, New York 1966. ROSENTHAL, R . , UND R . L . ROSNOW, T h e V o l u n t e e r S u b j e c t , i n : R . ROSENTHAL UND
R. L. ROSNOW (Hrsg.), Artifact in Behavbrial Research, New York und London 1969, S. 5 9 - 1 1 8 . ROSNOW, R. L., UND R. ROSENTHAL, Volunteer Subjects and the Results of Opinion Change Studies, in: Psychological Reports 19, 1966, S. 1183 - 1187. Ross, H. L., The Inaccessible Respondent: A Note on Privacy in City and Country, in: Public Opinion Quarterly 27, 1963, S. 269 - 275. RUDOLPH, L., UND S. H. RUDOLPH, Surveys in India: Field Experience in Madras State, in: Public Opinion Quarterly 22, 1958, S. 235 - 244.
4. Kapitel: Der Befragte
143
Representative are "Representative Samples"? , in: H . CANTRIL (Hrsg.), Gauging Public Opinion, Princeton/London 1947, S. 143 - 149.
R U G G . D . , HOW
T. R., Contributions to the Role-Taking Theory, I. Hypnotic Behavior, in: Psychological Review 57, 1950, S. 255 - 270.
SARBIN,
Research on Mail Survey, in: Journal of the Royal Statistical Society, Series A, 124, 1961, S. 143 - 205.
SCOTT,CH.,
A. FELDT, Some Factors in a Probability Sample Survey of a Metropolitan Community, in: American Sociological Review 24, 1959, S. 650 - 661.
SHARP, H . , UND
P. B., Public Relations of the Polls, in: International Journal of Opinion and Attitude Research 2, 1948, S. 461 - 465.
SHEATSLEY,
Α., "Don't Know" Answers in Cross-National Surveys, in: Public Opinion Quarterly 34, 1970, S. 126 - 129.
SICINSKI,
SJOBERG, G . ,
1954,
A Questionnaire on Questionnaires, in: Public Opinion Quarterly 18, 423 - 4 2 7 .
S.
The Interviewee as a Marginal Man, in: Southwestern Social Science Quarterly 38, 1957, S. 124 - 132.
SJOBERG, G . ,
R. NETT, A Methodology for Social Research, New York/Evanston/ London 1968.
SJOBERG, G . , UND
R. G . , Subject Selection Bias in Psychological Research, in: Canadian Psychologist 7a, 1966, S. 115 - 121.
SMART,
E. O., Interviewing a Legal Elite, in: American Journal of Sociology 64, 1958, S . 1 5 9 - 164.
SMIGEL,
M. G . , Panel Mortality and Panel Bias, in: Journal of the American Statistical Association 54, 1959, S. 52 - 68 .
SOBOL,
L., Social Integration and Certain Corollaries: Explanatory Study, in: American Sociological Review 21, 1956, S. 709 - 716.
SROLE,
Ε. Α., An Analysis of "Bias" in Survey Research, in: Public Opinion Quarterly 26, 1962, S. 1 0 2 - 1 1 1 .
SUCHMAN,
Who Answers Questionnaires? , in: Journal of Applied Psychology 24, 1940, S. 758 - 769.
SUCHMAN, Ε . Α . , UND Β . MCCANDLESS,
F., UND A . D . HAMMONDS, Effect of Racial Characteristics of Investigator on Self-Enumerated Responses to a Negro-Prejudice Scale, in: Social Forces 44, 1966, S. 515 - 5 1 8 .
SUMMERS, G .
Toward a Paradigm for Respondent Bias in Survey Research, in: Sociological Quarterly 10, 1969, S. 113 - 121.
SUMMERS, G . F . , UND A . D . HAMMONDS,
A. STRAUSS, Social Class and Modes of Communication, in: American Journal of Sociology 60, 1955, S. 329 - 338. SCHEUCH, Ε . Κ., Ein Interview über das Interview, Diplom-Arbeit Köln 1 9 5 3 . SCHATZMAN, L . , UND
E. K., Die Anwendung von Auswahlverfahren bei Repräsentativbefragungen, Diss. Köln 1956.
SCHEUCH,
144
4. Band: Erhebungsmethoden:
Die
Befragung
Das Interview in der Sozialforschung, in: R . KÖNIG (Hrsg.), Handbuch der Empirischen Sozialforschung, Bd. I, Stuttgart 2. Aufl. 1967a, S. 136 196 u. S. 707 - 715, 3. umgearb. und erw. Aufl. 1973, Bd. 2, S. 66 - 190.
SCHEUCH, Ε . Κ . ,
Auswahlverfahren in der Sozialforschung, in: R . KÖNIG (Hrsg.), Handbuch der Empirischen Sozialforschung, Bd. I, Stuttgart 2. Aufl. 1967b, S. 309 - 347 u. S. 728 - 734.
SCHEUCH,E. K . ,
H., UND J. M. CONVERSE, The Effects of Black and White Interviewers on Black Responses in 1 9 6 8 , in: Public Opinion Quarterly 3 5 , 1 9 7 1 , S . 4 4 - 6 8 .
SCHUMAN,
Α., Interviewing and the Public, in: Public Opinion Quarterly 28, 1964, 135 - 142.
SCHWARTZ, S.
P., UND H . R. BLAINE, Questionnaire-Return Bias in the Study of BlueCollar Workers, in: Public Opinion Quarterly 30, 1966, S. 656 - 663.
SCHWIRIAN, K .
J., Überprüfung von Interview-Ergebnissen über die Stimm- und Wahlbeteiligung durch amtliche Angaben, in: Kölner Zeitschrift für Soziologie und Sozialpsychologie 17, 1965, S. 234 - 244.
STEINER,
H., Which Respondents are Reliable? , in: International Journal of Opinion and Attitude Research 5, 1951, S. 475 - 479.
STEMBER,
STEPHAN,
F. J.,
UND PH.
J.
MCCARTHY,
Sampling Opinions, New York 1963.
Cross-Class Interviewing. An Analysis of Interaction and Communicative Styles, in: R. N . ADAMS UND J . J . PREISS (Hrsg.), Human Organization Research. Field Relations and Techniques, Homewood, 111. 1960, S. 205 - 213.
STRAUSS, Α . , UND L . SCHATZMAN,
P., Conflicting Group Norms and the 'Third" Person in the Interview, in: American Journal of Sociology 68, 1962, S. 97 - 104.
TAIETZ,
J. Β., Social Desirability and MMPI Performance: The Individual Case, in: Journal of Consulting Psychology 23, 1959, S. 514 - 516.
TAYLOR,
The "Yeasayer" and Social Desirability: A Comment on the Couch and Keniston Paper, in: Journal of Abnormal and Social Psychology 62, 1961a, S. 172.
TAYLOR, J . B . ,
J. B . , What do Attitude Scales Measure? The Problem of Social Desirability, in: Journal of Abnormal and Social Psychology 62, 1961b, S. 386 — 390.
TAYLOR,
Are Poll Questions too Difficult? , in: Public Opinion Quarterly 13, 1949, S. 314 - 319.
TERRIS, F . ,
R., UND R. I. HILL, The Accuracy of Self Reported Data and Prediction of Political Activity, in: Public Opinion Quarterly 31, 1967, S. 103 - 106.
TITTLE, CH.
W. W., Self and Society. Orientations in Two Cultural Value Systems, unv. Diss., Harvard University 1952.
UNTEREINER,
VIDICH, A . J . , UND J . BENSMAN,
The Validity of Field Data, in: Human Organization
13, 1954, S. 20 - 2 7 . A Case For- and Against- Mail Questionnaires, in: Public Opinion Quarterly 18, 1954, S. 4 0 - 5 2 .
WALLACE, D . ,
4. Kapitel:
Der Befragte
14 5
P., Volunteer Subjects as a Source of Sampling Bias, in: American Journal of Sociology 54, 1949, S. 539 - 544.
WALLIN,
L. G., UND M. L. D E F L E U R , Attitude as an Interactional Concept: Social Constraint and Social Distance as Intervening Variables between Attitudes and Action, in: American Sociological Review 34, 1969, S. 153 — 169.
WARNER,
WAX, M . , UND L .
J.
SHAPIRO,
6 2 , 1 9 5 6 , S. 2 1 5 -
Repeated Interviewing, in: American Journal of Sociology
217.
Unobstrusive Measures: Non—Reactive Research in the Social Sciences, Chicago 1966.
WEBB, E . J . , U . A . ,
W E D E L L , C . , U N D K . SMITH, Consistency
of Interview Methods in Appraisal of Attitudes, in: Journal of Applied Psychology 35, 1951, S. 392 - 396.
Wfeiss, C. H., Interviewing Low-Income Respondents, in: Welfare in Review 1966, S. 1 - 9 . WEISS, C. H . ,
Validity of Welfare Mothers' Interview Responses, in: Public Opinion Quarterly 32, 1968, S. 622 - 633. A. W . , Attitudes versus Actions: The Relationship of Verbal and Overt Behavioral Responses to Attitude Objects, in: J. D. SNOEK (Hrsg.), The Journal of Social Issues, Selected Papers: 1969, 25, 1969, S. 4 1 - 7 8 .
WICKER,
Interviewer-Respondent Interaction: A Study of Bias in the Information Interview, in: Sociometry 27, 1964, S. 338 - 352.
WILLIAMS, J . Α . , JR.,
J. Α., JR., Interviewer Role Performance: A Further Note on Bias in the Information Interview, in: Public Opinion Quarterly 32, 1968, S. 287 — 294.
WILLIAMS,
Sampling in the Field: S. 3 1 6 - 3 3 0 .
WILLIAMS, R . , 1950,
A
Case History, in: Public Opinion Quarterly
C. PINKERTON UND vironment and Family Life, Baltimore 1962.
WILNER, D . M . , R . P . WALKLEY, T H .
M . TAYBACK,The
14,
Housing En-
E. C., Adapting Probability Sampling to Western Europe, in: Public Opinion Quarterly 14, 1950, S. 215 - 223.
WÌLSON,
WUELKER, G . , 1963,
S.
Questionnaires in Asia, in: International Social Science Journal 35 - 4 7 .
15,
5.
Die schriftliche Befragung von Klaus Wieken
5.1
Die schriftliche Befragung als Sonderform des Interviews
Der Wunsch nach einfach zu handhabenden, zeit- und kostensparenden Erhebungsinstrumenten führte zu Methoden der Datenerfassung, die nicht der Mitwirkung von Beobachtern oder Interviewern bedürfen. Zwischen mündlichem Interview und schriftlicher Befragung sind Erhebungsformen entstanden, die in unterschiedlichem Umfang den Einsatz von Versuchsleitern und Interviewern bedingen. Diese Erhebungsformen kommen besonders in der psychologischen und in der sozial-psychologischen Forschung in großem Umfang zum Einsatz. Allen Methoden ist gemeinsam, daß die Befragten oder die Versuchspersonen die Erhebungsbögen selbst markieren und die vom Interviewer oder Versuchsleiter ausgehenden Effekte entweder völlig verschwinden oder aber möglichst gering gehalten werden. Die schriftliche Befragung wurde in den Anfangszeiten der empirischen Sozialforschung wegen ihrer Kostenvorteile und leichten Handhabbarkeit häufig eingesetzt. Die Kritik an diesem Instrument begann nach einigen eklatanten Fehlschlägen zugleich mit der Entwicklung der Stichprobentheorie (RICHTER 1970). Neuerdings wird diese Methode der Datengewinnung jedoch wieder häufiger eingesetzt, da man die methodischen und technischen Probleme erkannt hat und Kostenüberlegungen eine zunehmende Rolle spielen ( E R D O S 1970; RICHTER 1970). Technische und wirtschaftliche Vorteile schriftlicher Befragungen. Schriftliche Befragungen sind billiger als andere Erhebungsmethoden, administrativ leichter zu bewältigen und auch mit einem kleinen Mitarbeiterstab durchzuführen. Daher wurde diese Methode relativ häufig von Zeitschriftenverlagen (WALLACE 1 9 5 4 ; R O B I N S O N UND AGISIM 1950/5 1) und Organisationen, die nur über eine kleinere Forschungsabteilung verfügen (BAUR 1947), angewandt. Die behauptete größere Schnelligkeit bei der Datenerfassung (MOSER 1958) ist in der Praxis fast nie gegeben. Bei einer Untersuchungsplanung, die von zwei Erinnerungsschreiben an die Befragten ausgeht, muß für die Feldarbeit mit einer Dauer von einem Monat (BAUR 1947; ROBINSON UND AGISIM 1950/ 51 ) bis zu vier Monaten (ADINA 1951 ) gerechnet werden. Bei einer Beschränkung auf zwei Wellen liegt das Minimum der für die Feldarbeit benötigten Zeit bei 14 Tagen (Cox 1966). Diese Zeiten werden bei gut organisiertem Interviewereinsatz mit mündlichen Interviews ebenfalls erreicht oder sogar unterboten. Kommerzielle Markt- und Meinungsforschungsinstitute legen meist sechs Wochen nach Beginn der Feldarbeit Daten auf maschinenlesbaren Trägern vor. Bei der Entscheidung für die schriftliche
5. Kapitel: Die schriftliche Befragung
147
Befragung dürften meistens Kostenrücksichten entscheidend sein. Allerdings ist zu beachten, daß schriftliche Befragungen nicht in allen Fällen mit Kostenvorteilen gegenüber mündlichen Interviews verbunden sind. Wenn in Erwartung niedriger Rücksendequoten Ausgangsstichproben besonders großen Umfangs gewählt werden müssen, so können die Kostenvorteile des Verfahrens verschwinden. Unabhängig von der durch niedrige Rücksendequoten eintretenden Stichprobenverzerrung können in diesen Fällen allein Kostenvergleiche die Anwendung der schriftlichen Befragung verbieten. Anwendungsgebiete. Die Veröffentlichungen über schriftliche Befragungen zeigen, daß es kaum einen thematischen Bereich der empirischen Sozialforschung gibt, in dem Daten noch nicht mit dieser Methode gewonnen worden sind. Trotzdem lassen sich sowohl hinsichtlich der Personengruppen, bei denen die schriftliche Befragung angewandt werden kann, als auch hinsichtlich der Themenbereiche eindeutige Schwerpunkte festlegen. Grundsätzlich ist es lediglich erforderlich, daß die Personengruppe, die untersucht werden soll, des Lesens und Schreibens kundig ist. Wir werden aber bei der Diskussion über die Probleme der Ausfälle und der Stichprobenfehler sehen, daß der Erfolg schriftlicher Befragungen entscheidend von den Merkmalen und der Homogenität des untersuchten Personenkreises abhängt. Unterschiedliche Rücksendequot e n , d i e z w i s c h e n 2 0 % (FRAZIER UND BIRD 1 9 5 8 / 5 9 ) u n d ü b e r 8 0 % (GRAY UND
CORLETT 1950) schwanken, sind hauptsächlich durch Unterschiede zwischen den untersuchten Populationen erklärbar. Während niedrige Rücksendequoten charakteristisch für Bevölkerungsstichproben sind, sind höhere Rücksendequoten fast nur dann zu erwarten, wenn es sich um Befragtengruppen handelt, die relativ homogen und zumindest an den Umgang mit geschriebenen Texten gewöhnt sind. Bei der Betrachtung der Themen, die mit Hilfe von schriftlichen Fragebögen untersucht worden sind, zeigt sich, daß nur dann mit einer hohen Rücksendequote gerechnet werden kann, wenn das Thema der Untersuchung von aktuellem Interesse für die Befragten ist; andererseits erbringen Befragungen, für deren Thematik erst das Interesse geweckt werden muß, regelmäßig niedrigere Rücklaufquoten. RICHTER(1970) führt Rücklaufunterschiede von 10 bis 90%, die sich bei gleicher Gestaltung, aber unterschiedlichen Befragungsinstitutionen und Befragungsgruppen ergeben haben, im wesentlichen auf die "sozialen Feldkonstellationen, zwischen Befragungsgruppe und Umfrageträger zurück; vgl. auch ->• Bd. IV: Esser, Der Befragte.
5.2
Die Gestaltung schriftlicher Fragebögen
Allgemein gültige Kriterien für die Güte eines Fragebogens sind nur schwer zu formulieren; wenn Objektivierungen versucht werden, zeigt es sich meist, daß die Rechtfertigungen für ein bestimmtes Vorgehen nicht mehr sind als eine Mischung aus Institutsfolklore, Faustregeln und einigen Experimentbefunden. Da an anderer Stelle — -* Bd. IV: Kreutz und Titscher, Die Konstruktion von Fragebögen - die allgemeinen Probleme ausführlich behandelt werden, können wir uns im Rahmen dieses Kapitels auf einige technische Hinweise zur Gestaltung schriftlicher Fragebögen beschränken.
148
4. Band: Erhebungsmethoden: Die Befragung
Der Umfang der Erhebungsbögen, die in schriftlichen Umfragen benutzt worden sind, bewegt sich zwischen einer und 35 Seiten. Bei Versuchen mit Bögen unterschiedlichen Umfangs ergab sich, d a ß der Unterschied in der Rücksendequote bei Fragebögen von 10 Seiten und solchen von 35 Seiten lediglich 5% betrug (SLETTO 1940). Die Länge eines Bogens hat nach den vorliegenden Erfahrungen keinen entscheidenden Einfluß auf die Rücksendungen. Ebenso wie bei mündlichen Interviews dürfte auch bei schriftlichen Fragebögen beim Vorhandensein einer grundsätzlichen Bereitschaft zur Teilnahme an einer Untersuchung der Umfang des Bogens ohne große Wirkung sein. Ein größerer Einfluß scheint von der Gestaltung des Erhebungsbogens auszugehen. Da bei einem schriftlichen Fragebogen die Möglichkeit der Erklärung und Hilfestellung durch den Interviewer entfällt, müssen die Fragen knapp formuliert, leicht verständlich und eindeutig beantwortbar sein. Auf Filterfragen und komplizierte Verweise sollte man dabei — wenn es möglich ist — verzichten. Der Gestaltung und Typografie der Bögen m u ß große Aufmerksamkeit gewidmet werden; allgemein wird die Ansicht vertreten, dies sei ein wichtiger Punkt, um die Bereitschaft zur Rücksendung zu erhöhen und vollständig ausgefüllte Erhebungsbögen zu erhalten. Darüber hinaus sollten o f f e n e Fragen und Meinungsfragen vermieden werden; die Antworten a u f g e schlossene und Faktfragen besitzen eine größere Zuverlässigkeit. Allerdings gründen sich diese Empfehlungen fast ausschließlich auf persönliche Erfahrungen und adhoc-Entscheidungen der jeweiligen Autoren. Die Plazierung der Fragen. Es ist wenig bekannt, wie Fragebögen ausgefüllt werden. Während man bei einem Interview davon ausgehen kann, daß der Interviewer die einzelnen Fragen hintereinander stellt, besteht diese Möglichkeit, den Ablauf einer Befragung zu planen, bei schriftlichen Interviews nicht. BAUER UND MEISSNER (1963) kamen bei der Überprüfung des Plazierungseffektes in schriftlichen Fragebögen zu dem Ergebnis, daß die Anordnung von logisch voneinander abhängenden Fragen auf einer einzigen Seite des Fragebogens im Vergleich zur Verteilung auf drei verschiedene Seiten mehr logisch sinnvolle Antworten erbringt. Einigkeit besteht auch darüber, daß man bei schriftlichen Fragebögen auf eingebaute Kontrollen und den späteren Rekurs auf früher gegebene Antworten verzichten muß.
5.3
Möglichkeiten zur Beeinflußung der Rücksendequote
Der Erfolg von Untersuchungen mit schriftlichen Fragebögen ist entscheidend von der Höhe der erzielten Rückläufe abhängig. Dieses Problem gehört daher zu der am gründlichsten untersuchten Fragestellung. Die Wirkungen der einzelnen Verfahren zur Erhöhung der Rücksendequote sind fast alle in mehreren experimentellen Studien überprüft und abgesichert worden. Es ist daher möglich, bis zu einer gewissen Grenze, die im Einzelfall durch die Thematik der Untersuchung und die Zusammensetzung der Stichprobe bestimmt wird, die Höhe der Rücksendequote durch Anwendung oder Kombination der verschiedenen Techniken selbst zu bestimmen.
5. Kapitel: Die schriftliche Befragung
5.3.1
149
Die Gestaltung des Begleitschreibens
Es besteht bei der Mehrzahl der Autoren, die sich mit diesem Thema beschäftigt haben, Einigkeit darüber, daß das Anschreiben, das den Fragebogen begleitet, von größter Bedeutung für den Erfolg einer schriftlichen Befragung ist. Gesicherte Erkenntnisse über die Gestaltung dieses Anschreibens liegen nur in Ansätzen vor. Das Anschreiben sollte den Aufforderungscharakter des Fragebogens erhöhen und daher in ansprechender, freundlicher und Vertrauen erweckender Sprache abgefaßt sein (ROBINSON UND AGISIM 1950/51 ). Darüber hinaus lassen sich durch die Lektüre von Begleitschreiben von Erhebungen mit besonders hoher Rücksendequote einige weitere Anhaltspunkte für die Gestaltung dieses Anschreibens finden. Wenn der befragte Personenkreis nicht von vornherein eine Beziehung zu der Institution hat, die die Untersuchung durchführt (Seminar-Mitglieder, Vereins-Mitglieder, Abonnenten einer Zeitschrift, Kunden etc.), so sollte die Hauptaufgabe bei der Formulierung des Briefes darin bestehen, eine solche Interesse weckende Beziehung herzustellen. Dies geschieht meist durch ausführliche Hinweise auf die Bedeutsamkeit der Studie und durch Verweis auf die Verzerrungen, die durch Nichtbeantwortung eintreten. Außerdem fehlen in keinem Anschreiben Hinweise auf die Vertraulichkeit der Antworten oder aber auf die völlige Anonymität der Befragung. Es gibt auch Studien, in denen es sich als vorteilhaft erwiesen hat, auf ein gesondertes Anschreiben zu verzichten, und den Brief auf den Erhebungsbogen zu drucken. Chappie berichtet von einer Studie, in der der Fragebogen zusammen mit dem Brief auf einen Bogen gedruckt 62% Rücklauf erbrachte, während bei getrenntem Versand nur eine Quote von 26% erreicht wurde (CHAPPLE 1956). Bei Überprüfung verschiedener Formulierungen für das Anschreiben zeigte sich, daß eine Formulierung, die an den Altruismus der Befragten appellierte, die höchste Rücksendequote erbrachte (SLETTO 1940). Für eine Untersuchung bei 1600 ehemaligen College-Studenten wurden drei Brieffassungen verwendet. In der ersten bat man mitzuhelfen, die Ausbildungsbedingungen für Tausende junger Menschen zu verbessern; in der zweiten wurde der Befragte gebeten, sich an dem Versuch zu beteiligen, den sozialen Wandel in die richtigen Bahnen zu lenken; während in der dritten an den Sportgeist appelliert wurde (etwas in Angriff nehmen, wovon die Leute meinen, daß es nicht geschafft werden kann). Die jeweiligen Rücksendequoten betrugen 67%, 64% und 60%. Weiterhin wird die Ansicht vertreten, daß die Angabe eines letzten Rücksendetages die Antwortquote günstig beeinflusse ( F E R R I S 1 9 5 1 ) . Allerdings liegen darüber keine empirischen Daten vor. Einige Autoren haben den Einfluß handschriftlicher Einfügungen in den Begleitbrief untersucht. Persönliche Ansprache des Empfängers soll eine Möglichkeit zur Steigerung der Rücksendequote darstellen (PARTEN 1950). FRAZIER UND B I R D (1958/59) erzielten durch die Hinzufügung eines handschriftlichen Postskripts ("Wir brauchen Ihre Hilfe bei dieser Untersuchung. Könnten Sie den Fragebogen bitte pünktlich zurücksenden?") eine Steigerung der Rücklaufquote von 24% auf 31%. Dem stehen die Ergebnisse anderer Studien entgegen, bei denen handschriftliche Zusätze zum Anschreiben keine signifikant höheren Rücksendequoten erbrachten (CLAUSEN UND FORD 1947). WEILBACHER UND WALSH (1951/52) kamen nach einer Befragung ehemaliger Studenten der Columbia-Universität mit einem Postkarten-Fragebogen zu dem Ergebnis, daß persönliche Anrede und Unterschrift sogar niedrigere Rücksendequoten ergaben. Im Hinblick auf diese kontroversen Ergebnisse
150
4. Band: Erhebungsmethoden: Die Befragung
scheint der Aufwand handschriftlicher Zusätze zum Anschreiben nicht lohnend zu sein. Wesentlich wichtiger ist es, durch die A r t der Abfassung des Anschreibens die Motivation zur Rücksendung der Bögen zu erhöhen. 5.3.2
Die Kontaktaufnahme vor Versand der Fragebögen
Bei den vielen Versuchen, die Antwortquote bei schriftlichen Befragungen zu erhöhen, hat man der Methode der vorherigen Kontaktaufnahme durch einen Ankündigungsbrief oder telefonische Anmeldung bisher wenig Beachtung geschenkt (ROBIN 1965). Dabei scheint nach den veröffentlichten Erfahrungen mit dieser Methode gerade ein solches Vorgehen die Kooperationsbereitschaft stark zu erhöhen. Es ist nur eine Untersuchung bekannt, bei der Ankündigungsbriefe nicht zu einer Erhöhung der R ü c k l a u f q u o t e f ü h r t e n (KEPHARTUND BRESSLER 1 9 5 8 ) . A l l e ü b r i g e n V e r ö f f e n t l i c h u n -
gen zeigen übereinstimmend, daß mit dieser Methode die Antwortquoten signifikant e r h ö h t w e r d e n k ö n n e n (WAISANEN 1 9 5 4 ; ERDOS 1 9 5 7 ; STAFFORD 1 9 6 6 ; FORD 1 9 6 7 ) .
Darstellung 1 zeigt den Umfang der durch vorherigen K o n t a k t erzielten Verbesserungen. Der Grund fur den Erfolg dieser Methode, die bei persönlichen Interviews ganz üblich ist, ist darin zu sehen, daß die untersuchende Institution sich zunächst einführt, ohne eine Leistung von der Befragungsperson zu erbitten und ohne ihre Zeit in Anspruch zu nehmen. Es ist aber bei diesen Ergebnissen zu berücksichtigen, daß in allen Studien auf weitere Befragungswellen verzichtet wurde. Gegenüber einer nochmaligen Zusendung des Fragebogens hat die Methode der vorherigen Kontaktaufnahme aber den Vorteil, daß der Fragebogen nicht Bekannt ist und sich daher zunächst keine Möglichkeit ergibt, sich wegen des Inhalts einer Untersuchung gegen die Teilnahme zu entscheiden. Die noch persönlichere Methode der telefonischen Kontaktaufnahme dürfte allerdings nur bei speziellen, regional begrenzten Stichproben u n d bei Befragtengruppen, die auf diese Art und Weise erreichbar sind, anwendbar sein. Auf die Schnelligkeit der Rücksendung der Bögen bleibt die vorherige Kontaktaufn a h m e o h n e E i n f l u ß (FORD 1 9 6 7 ) .
Rücksendequote ohne Kontakt Schriftlicher Kontakt
Rücklauf innerhalb 10 Tagen (WAISANEN 1954)
Rücklauf innerhalb 14 Tagen (STAFFORD 1966)
28,0%
-
Studie I (FORD 1967)
Studie II (FORD 1967)
20,5%
32,9%
15,3%
43,7%
39,6%
21,0%
Telefonischer Kontakt
47,8 %
68,2%
-
Ν =
150
1 178
949
-
1 573
Darstellung 1 : Erhöhung der Rücksendequoten durch vorherige Kontakte ( Q u e l l e : WAISANEN 1 9 5 4 ; STAFFORD 1 9 6 6 ; FORD 1 9 6 7 )
5. Kapitel: Die schriftliche Befragung
5.3.3
151
Die Postkartentechnik
Wenn man nach einer gewissen Zeit diejenigen Befragten, die noch nicht zurückgesandt haben, erneut anschreiben möchte, so ist dies nur möglich, wenn die Erhebungsbögen eine Identifikation gestatten. Da in den Anschreiben an die Befragten auf die Vertraulichkeit oder Anonymität der Angaben hingewiesen wird, kann ein neuerliches Anschreiben bei den Personen, die bisher nicht geantwortet haben, Zweifel an dem Wahrheitsgehalt dieser Versprechung aufkommen lassen. Um diesen unerwünschten Effekt zu vermeiden, trennte man Erhebungsbögen und Identifikation. Zusammen mit dem nicht gekennzeichneten Fragebogen wird bei dieser Technik eine Postkarte versandt, die getrennt vom Erhebungsbögen zurückgesandt wird. Dadurch ist einmal eine Identifikation deijenigen Personen möglich, die zurückgesandt haben, zum anderen bleibt die Anonymität der Fragebögen völlig gewahrt (BRADT 1955). Bei einer Untersuchung des Personals des Gesundheitsamtes des Staates New York (BOEK UND LADE 1963) erzielten die Autoren mit dieser Methode ohne Mahnung einen Rücklauf von 86%, der nach zusätzlichen Anschreiben auf fast 100% gesteigert werden konnte. Die Methode der getrennten Identifikation ist bei geringem Aufwand geeignet, das Vertrauen der Befragten in die anonyme Behandlung ihrer Angaben erheblich zu erhöhen. Die dadurch bedingte Kostenerhöhung pro Interview ist unter dieser Rücksicht als gering anzusetzen. 5.3.4
Die Wirkung finanzieller Anreize
Um die Antwortquote bei Befragten, bei denen man nur wenig Interesse am Thema der Studie erwartet, zu erhöhen, ist wiederholt mit finanziellen Anreizen gearbeitet worden. Durch Beigabe eines Viertel-Dollar-Stückes konnte der Anteil der Rücksend u n g e n v o n 5 - 1 0 % a u f 7 0 - 8 0 % g e s t e i g e r t w e r d e n (ROBINSON UND AGISIM 1 9 5 0 / 5 1 ) .
Dadurch ergab sich eine Senkung der Gesamtkosten für 1 000 Interviews um ein Drittel. Bei einem Vergleich zwischen mitgeschicktem Geldbetrag (25 Cent), der Versprechung, nach Rücksendung des Bogens 50 Cent zu senden, und normalem Anschreiben ergab sich, daß lediglich die erste Methode signifikant höhere Rücksendequoten erbrachte (WOTRUBA 1966). Bei Teilgruppen einer Stichprobe, denen mit dem Erhebungsbögen Kriegssparmarken (War Savings Stamps) unterschiedlichen Wertes geschickt wurden, zeigte sich, daß eine Erhöhung über den Betrag von 25 Cent hinaus keinen weiteren Einfluß auf die Höhe der Rücksendungen hatte (BEVIS 1948). In Columbien erreichte man bei der Befragung von Familien mit mittlerem Einkommen durch die Beilage einer Ein-Peso-Note (damaliger Wert ca. DM 0,25) eine Erhöhung d e r R ü c k s e n d e q u o t e v o n 2 2 a u f 4 0 % (LAURENT UND PARRA 1 9 6 8 ) . B e i d e r B e u r t e i -
lung dieser Beispiele ist davon auszugehen, daß diese Methode nur bei solchen Stichproben eingesetzt werden sollte, bei denen man annehmen kann, daß finanzielle Anreize überhaupt wirksam sind und ohne einen solchen Anreiz wenig Motivation zur Beantwortung der Fragebögen besteht. 5.3.5
Die Form des Postversands
Durch Beachtung einiger einfacher und leicht durchzuführender Regeln bei der technischen Gestaltung der Erhebungsbögen ist es möglich, eine weitere Erhöhung der Rücksendequoten zu erzielen. Schriftliche Fragebögen sollten in jedem Falle nur in Verbindung mit einem beigefugten Rücksendeumschlag versandt werden. FERRIS
152
4. Band: Erhebungsmethoden:
Die Befragung
berichtet von einer Studie bei Universitätslehrern, bei der sich durch den Verzicht auf einen frankierten Rücksendeumschlag eine Verringerung der Rücklaufquote um 64,3% ergab. Bei Fehlen eines frankierten Rücksendeumschlags geht ein entscheidender Anreiz zum Ausfüllen des Erhebungsbogens verloren. Eine einfache Freistempelung, mit dem Vermerk "Gebühr bezahlt" oder "Nicht freimachen, Gebühr bezahlt Empfänger", erbringt wesentlich geringere Rückläufe als die Freimachung mit einer normalen Briefmarke. ROBINSON UND AGISIM ( 1 9 5 0 / 5 1 ) erhielten bei einer Freistemplung 66,3% Rücklauf, während die Frankierung mit einer Briefmarke 73,8% ergab. C L A U S E N UND F O R D ( 1 9 4 7 ) erhielten in einer Untersuchung bei Veteranen durch die Verwendung von Luftpost- und Express-Umschlägen eine deutliche Erhöhung der Rücksendequote. (1951)
Versuche, den Aufmerksamkeitseffekt durch Fragebogendruck auf farbigem Papier zu erhöhen, brachten keine signifikant besseren Rückläufe. Eine Überprüfung des Effekts der Variablen: First-Class-Mailing, Third-Class-Mailing, Frankierung mit Briefmarke, freigestempelte Rücksendeumschläge, grünes Papier, weißes Papier, brachte lediglich für die Variablen "Art des Postversands" und "Art der Frankierung" signifikant höhere Rücklaufquoten. Die Farbe des Fragebogens hatte keinen Einfluß. Die Zusammenhänge der Variablen untereinander waren ebenfalls nicht signifikant ( G U L L A H O R N U N D G U L L A H O R N 1 9 6 3 ) . Obwohl nicht genau angegeben werden kann, welchen Einfluß die Gestaltung des Fragebogens auf die Rücklaufquoten hat, sollte immer versucht werden, die Erhebungsbögen so einfach und ansprechend wie möglich zu gestalten. 5.3.6
Die Wirkung von Erinnerungsschreiben
Ebenso selbstverständlich wie das wiederholte Aufsuchen schwer erreichbarer Personen bei mündlichen Interviews sollte das Erinnerungsschreiben bei schriftlichen Befragungen sein. Zweck einer zweiten Welle ist es, den Befragten an die Ausfüllung des
Rücklauf
nach:
Hebammen
Hebammen
(GRAY UND CORTLETT)
( G R A Y UND CORTLETT)
Soziologen (FERRIS)
Krankenhäuser (GOLDSTEIN UND KROLL)
1. Welle
42,8%
2. Welle
48,4% (Erinnerungsschreiben)
50,6% (Erinnerungsschreiben)
54,7% (Erinnerungsschreiben)
63,6% (Fragebogen)
3. Welle
41,4% (Fragebogen)
24,1% (Fragebogen)
41,7% (Fragebogen)
56,3% (Fragebogen)
4. Welle
Ν =
-
250
38,0%
-
16 124
62,4%
-
218
Darstellung 2: Rückläufe in den einzelnen Befragungswellen (Quelle: C O R T L E T T 1 9 5 0 ; F E R R I S 1 9 5 1 ; G O L D S T E I N UND K R O L L
68,1%
72,8% (Fragebogen) 3 154 G R A Y UND 1957/58)
5. Kapitel: Die schriftliche Befragung
153
Fragebogens zu erinnern und ihn nochmals auf die Bedeutsamkeit seiner Mithilfe für den Erfolg der Studie hinzuweisen. Aus den Beispielen in Darstellung 2 sieht man, daß die Rücksendung durch ein Erinnerungsschreiben in erheblichem Maße stimuliert werden kann. Der Prozentsatz der Rückläufe nach dem ersten Erinnerungsschreiben ist etwa ebenso hoch oder sogar noch höher als bei der ersten Welle der Untersuchung. Es ist nicht nötig, schon beim ersten Erinnerungsschreiben erneut einen Fragebogen mit Rückantwortumschlag zuzusenden. Zunächst ist es ausreichend, ein neues Schreiben, den Originalbrief versehen mit einem auffälligen Hinweis oder aber eine Erinnerungspostkarte (SLETTO 1940) zu senden. Erst in einer dritten Befragungswelle sollten dann e m e u t Fragebögen mit Rückantwortumschlägen zum Versand kommen. Obwohl der prozentuale Anstieg der Antworten auch nach der dritten Befragungswelle meist noch erheblich ist, verzichtet man zumeist auf weitere Versuche, zusätzliche Antworten zu erhalten. Die Entscheidung darüber, ob es notwendig ist, bei einer Untersuchung noch weitere Befragungswellen anzuschließen, sollte von dem Ergebnis eines Vergleichs zwischen der Struktur der Ausgangsstichprobe und den zurückerhaltenen Bögen abhängig gemacht werden.
5.4
Die Dauer der Feldarbeit bei schriftlichen Umfragen
Dem Aspekt der Zeit, die für die Durchführung schriftlicher Umfragen benötigt wird, ist in der Literatur bis jetzt wenig Aufmerksamkeit geschenkt worden. Die Antwort auf die Frage, wann die Feldarbeit einer Erhebung abgeschlossen werden kann, ist ein wichtiger Gesichtspunkt bei der Zeitplanung einer Untersuchung. Speziell im Falle der schriftlichen Befragung gewinnt die Frage nach der Dauer der Rückläufe an Bedeutung einmal für eine frühzeitige Schätzung des gesamten zu erwartenden Rücklaufs der Studie und zum anderen für die Wahl des richtigen Zeitpunkts zum Start der zweiten Befragungswelle. Aus Aufzeichnungen über den täglichen Eingang von Rücksendungen erkennt man, daß die zeitliche Verteilung der Rückläufe bei den unterschiedlichsten Studien in ähnlicherWeise verläuft. Die Angaben über Rücklaufquoten aus verschiedenen Untersuchungen sind so k o n f o r m , daß es möglich ist, schon nach kurzer Zeit relativ genau den Gesamtrücklauf einer Studie zu prognostizieren. Darstellung 3 zeigt die kumulierten Rücklaufquoten von 15 verschiedenen Studien. Große Unterschiede in den Rückläufen waren nur bis zum 4. oder 5. Tag erkennbar. Dies kann seinen Grund darin haben, daß drei der Studien, von denen Cox berichtet, regionale Samples umfaßten. Ein Teil der Abweichungen kann daher sicherlich mit unterschiedlichen Postlaufzeiten erklärt werden (Cox 1966). Ohne so differenzierte Daten zu veröffentlichen, wie sie Darstellung 3 zeigt, berichten noch andere Autoren von ähnlichen Gleichförmigkeiten des Rücklaufs (LAWSON 1949; MANFIELD 1948). Aufgrund des vorliegenden Materials kann bei der Annahme, daß ein Erinnerungsschreiben gesandt wird, damit gerechnet werden, d a ß am 10. Tag nach Versand 75% bis 85% aller zu erwartenden Bögen zurückgekommen sind. Über den Zeitpunkt, zu dem Erinnerungsschreiben versandt werden sollen, bestehen unterschiedliche Ansichten. Eine Gruppe von Autoren vertritt die Meinung, man solle mit einem Erinnerungsschreiben warten, bis sich die tägliche Rücklaufquote dem Wert 0 angenähert habe (SUCHMAN UND MCCANDLESS 1 9 4 0 ; TALLENT UND R E I S S 1 9 5 9 ; SCOTT
1961;BOYDUND
154
4. Band: Erhebungsmethoden: Die Befragung
Tage nach Versand
Durchschnitt aus 9 Untersuchungen bei Zeitschriftenabonnenten 1 )
Durchschnitt aus 6 Untersuchungen bei Ingenieuren, Einkäufern und Kreditfachleuten 2 )
% des Gesamt-Rücklaufi % des Gesamt-Rücklaufs 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 Gesamt-Rücklaufquote 1
) ROBINSON UND AGISIM
_
0,2 13,3 26,1 41,9 56,0 64,8 72,3 77,1 81,4 84,8 87*4 90,0 90,9 92,2 93,8 94,6 95,2 96,4 97,1 97,7 98,2 98,6 98,7 98,8 98,9 98,9 99,2 99,3
1,0 4,5 11,8 16,2 24,1 54,4 62,4 69,8 76,1 81,1 82,7 85,0 90,5 92,0 93,7 94,9 95,6 96,0 96,5 97,6 98,1 98,5 99,0 99,2 99,2 99,4 100,0
28,8 %
72,2 % 1950/51
2
) C o x 1966
Darstellung 3: Kumulierte Rücklaufquoten verschiedener Studien (Quelle: ROBINSON UND AGISIM 1950/51 ; Cox 1966)
5. Kapitel: Die schriftliche Befragung
15 5
Dies bedeutet, daß bis zum Versand der ersten Erinnerung mindestens drei Wochen gewartet werden muß. Im Gegensatz dazu haben ROBINSON UND AGISIM ( 1 9 5 0 / 5 1 ) schon nach jeweils drei bis vier Tagen eine Erinnerung geschickt; CLAUSEN UND F O R D ( 1 9 4 7 ) schlagen vor, die Intervalle zwischen den einzelnen Wellen auf 5 bis 7 Tage zu verkürzen, und betonen, daß der einzige Nachteil dieser Methode in einem eventuellen Mehraufwand an Erhebungsbögen und Porto bestünde. Basierend auf den Daten der Darstellung 3 macht Cox ( 1 9 6 6 ) den Vorschlag, als "objektiven" Maßstab für den Beginn der zweiten Welle den Variationskoeffizienten für die Abweichung (Standardabweichung als Prozentsatz des arithmetischen Mittels) zugrunde zu legen. Wenn man für diesen Variationskoeffizienten einen Wert unter 10% fordèrt, so würde das bedeuten, daß bei den Rücklaufquoten der Studien in Spalte 1 nach 10 Tagen mit der zweiten Welle begonnen werden könnte, bei den Studien in Spalte 2 schon nach 7 Tagen. Da sich gezeigt hat, daß die Rückläufe einer zweiten Welle identisch zu denen der ersten Welle sind (MANFIELD 1 9 4 8 ; GRAY 1 9 5 7 ) , kann bei einer Untersuchung mit drei Befragungswellen die Dauer der Feldarbeit auf einen Monat begrenzt werden. Außer den niedrigeren Kosten spricht kein anderer Grund für eine längere Ausdehnung der Feldarbeit. WESTFALL 1 9 6 4 ) .
5.5
Mögl ichkeiten zur Kontrolle der Stichprobe
Auch bei sorgfältigster Planung einer Untersuchung und Beachtung aller Regeln wird die Stichprobe fast niemals völlig ausgeschöpft werden können. Ebenso wie bei mündlichen Interviews entsteht daher die Notwendigkeit, die Reststichprobe im Hinblick auf Verzerrungen zu untersuchen (-»· Bd. VI: Sturm und Vajna, Zufallsstichproben 2.6). Ergebnisse von schriftlichen Befragungen, in denen dies nicht geschehen ist, sollten von vornherein mit Skepsis behandelt werden (FRANZEN UND LAZARSFELD 1945). Den einfachsten Vorschlag zu einer solchen Überprüfung hat FERBER (1948) gemacht: Er nimmt an, daß sich das Interesse an dem Gegenstand einer Untersuchung in der Bereitwilligkeit zur Teilnahme und auch in der Schnelligkeit der Rücksendung äußert. Wenn sich bei der Analyse der nach Rücksendedatum aufgeteilten Bögen ergibt, daß Unterschiede in der Beantwortung bestehen, wird angenommen, daß die Stichprobe verzerrt ist und weitere Prüfungen nötig sind. Bei diesem Verfahren hofft Ferber, mit einer einzigen Befragungswelle auszukommen. Die Schwierigkeit dieser Methode liegt in der Notwendigkeit, eine logisch sinnvolle Aufgliederung des Universums vorzunehmen. Der Autor empfiehlt Rangordnungskoeffizienten als ein solches objektives Kriterium, mit dem sich die angestrebte Prüfung vornehmen läßt. Dabei werden die Erhebungsbögen nach ihrem Ausfülldatum geordnet; falls sich bei Berechnung des Korrelationskoeffizienten (für Rücksendetermin und zu prüfende Variable) ergibt, daß keine Korrelation vorliegt oder aber die Korrelation mit der Schwankungsbreite der Stichprobe erklärt werden kann, so nimmt man an, die Stichprobe sei für die untersuchte Variable unverzerrt. Ford und Zeisel bezweifeln, ob die von Ferber vorgeschlagene Methode überhaupt eine Möglichkeit zur Aufdeckung einer Stichprobenverzerrung biete, da die Ergebnisse, die man bei ihrer Anwendung erhält, nicht eindeutig interpretierbar seien ( F O R D UND ZEISEL 1949). Bei einer Überprüfung der Methode an zwei Untersuchungen kommen sie zu dem Ergebnis, daß dieser Test
156
4. Band: Erhebungsmethoden: Die Befragung
nicht genau genug sei, um Verzerrungen festzustellen, und daß zum anderen die Grundannahme über die Qualität der Antworten nicht zutreffe, was sie durch einen Vergleich der Erhebungsbögen aus verschiedenen Befragungswellen zeigen können. Dabei ergibt sich nämlich, daß bei jeder einzelnen Befragungswelle die letzten eingehenden Bögen schlechter als die vorhergehenden sind. Bei einer Überprüfung der Verzerrung von fünf Variablen durch Aufteilung der Stichprobe nach dem Datum der Rücksendung zeigte es sich, daß die größte Verzerrung durch das unterschiedliche Interesse an dem Gegenstand der Untersuchung (Fortbildungsprogramm für ehemalige Kriegsteilnehmer) entstand (BAUR 1 9 4 7 ) . Diejenigen, die keine Pläne für ihre berufliche Weiterbildung hatten, waren in der ersten Phase der Rückläufe deutlich unterrepräsentiert. Daraus wird geschlossen, daß die Höhe der Verzerrung bei einer gegebenen Untersuchung in direkter Abhängigkeit zur Rücksendequote steht. Um diese Art der Verzerrung möglichst gering zu halten, empfiehlt der Autor, das Interesse an einer Untersuchung durch Aufnahme auch anderer thematischer Bereiche zu erweitern. CLAUSEN UND F O R D ( 1 9 4 7 ) berichten von einer erfolgreichen Anwendung dieser Methode. Eine nicht eindeutige Identifizierung der Institution, die eine Studie ausführt, führt ebenfalls zu Verzerrungen der Stichprobe. Desweiteren waren die Variablen Schulbildung und Familienstand verzerrt. Von denjenigen, die den Fragebogen nicht beantwortet haben, hatte ein signifikant größerer Anteil niedrige Schulbildung oder war unverheiratet. Für die Annahme, daß diejenigen, die einen Fragebogen erst sehr spät beantworten hinsichtlich der Merkmalsverteilung mit den Antwortverweigerern gleichzeitig seien, ergab sich in der von BAUR ( 1 9 4 7 ) durchgeführten Studie kein Anhaltspunkt. Reuss kam bei der Überprüfung einer Stichprobe von Studenten zu einem ähnlichen Ergebnis und stellte darüber hinaus fest, daß Personen mit eher ländlichem Hintergrund häufiger nicht zurücksandten. Außerdem waren Verzerrungen sowohl in der obersten als auch in der untersten sozialen Schicht aufgetreten (REUSS 1 9 4 3 ) . Aus der Auswertung verschiedener anderer Studien ergibt sich, daß eine sorgfältige Planung mehrerer Befragungswellen die Verzerrung der Stichprobe erheblich verringern kann (EDGERTON, BRITT UND NORMAN 1 9 4 7 ) . Technisch gibt es für die Kontrolle der Verzerrungen einer schriftlichen Befragung nur zwei Möglichkeiten. Sofern vorhanden, sollten schon in der Phase der Stichprobenermittlung Daten festgestellt werden, die eine spätere Kontrolle der Verzerrungen zumindest hinsichtlich dieser Merkmale erlauben (CLAUSEN UND F O R D 1 9 4 7 ) . Falls solche Angaben nicht erhältlich sind, kann man versuchen, durch nachträgliche Zusendung eines neuen kurzen Erhebungsbogens, auf dem nur um wenige Angaben gebeten wird, die für eine Kontrolle benötigten Daten zu erhalten (EDSALL 1 9 5 8 / 5 9 ) . Die aufwendigste Möglichkeit, um die Verzerrung einer Stichprobe zu überprüfen, sind mündliche Interviews, die man bei den Personen, die den Erhebungsbögen nicht zurückgesandt haben, durchführt (HIGMANN 1 9 5 5 / 5 6 ) . SUCHMAN ( 1 9 6 2 ) weist daraufhin, daß man Verzerrungen in den demografischen Daten, auf die sich die Prüfung meist beschränkt, nicht überbewerten sollte. Entscheidend sei es zu prüfen, welchen Effekt die Verzerrung auf den Untersuchungsgegenstand habe. Hinweise auf weitere Korrektur- und Prüfverfahren gibt RICHTER ( 1 9 7 0 , S. vgl. allgemein auch -* Bd. V I : Buttler, Statistische Testverfahren.
225
ff.),
5. Kapitel: Die schriftliche Befragung
5.6
157
Die Zuverlässigkeit schriftlicher Befragungen im Vergleich zu Interviews
Der Wert der schriftlichen Befragung wird häufig daran gemessen, inwieweit diese Methode in der Lage ist, die gleichen Ergebnisse wie Interviews zu liefern. Bei einer Untersuchung über Sexualverhalten von College-Studenten, bei der ein Jahr nach mündlichen Interviews schriftliche Fragebögen folgten, stellte ELLIS ( 1 9 4 7 ) bei einem Vergleich der Antworten auf 60 verschiedene Statements fest, daß sich für 10 Statements signifikante Unterschiede ergaben. Bei einem interpersonellen Vergleich ergab sich, daß bei allen 60 Fragen etwa die Hälfte aller Personen bei der schriftlichen Befragung anders antworteten als im Interview. Verschiebungen fanden zumeist in Richtung auf größere Offenheit statt. Der Autor kommt zu dem Schluß, daß bei der großen Mehrzahl der Befragten die Antworten auf den schriftlichen Fragebogen offener seien. In einer Studie, in der die Antworten auf 77 verschiedene Fragen aus den unterschiedlichsten Bereichen bei einer Stichprobe von 7w2e-Beziehern verglichen wurden, ergaben sich keine signifikanten Unterschiede zwischen den beiden Methoden (WALLACE 1 9 4 7 ) . In einer weiteren Vergleichsstudie, in der der gleiche Autor mit schriftlichen Befragungen in mehreren Wellen und Interviews arbeitete, ergaben sich folgende Ergebnisse (WALLACE 1 9 5 4 ) : Obwohl bei dem Vergleich zwischen der schriftlichen Befragung und den Interviews die Angaben zu fast allen untersuchten Variablen identisch waren, zeigte sich bei der Analyse der Antworten auf mehrmalige schriftliche Befragung, daß trotz der gleichen Antwortverteilung Unterschiede aufgetreten waren, die mit der generellen Bereitschaft zur Beantwortung schriftlicher Fragebögen erklärt werden. Die Methode der schriftlichen Befragung ist daher nur in solchen Fällen in der Lage, gleich gute Ergebnisse wie Interviews zu liefern, in denen die Variable "Bereitschaft zur Mitarbeit" keinen Einfluß auf die Verteilung der sonstigen Untersuchungsmerkmale hat. Dies ist am ehesten bei der Untersuchung von homogenen Gruppen der Fall. Der Autor empfiehlt daher, die Anwendung schriftlicher Befragungen nach Möglichkeit auf solche Gruppen zu beschränken. Bei einem Produkttest, in dem eine Stichprobe von Frauen gebeten wurde, Lippenstifte hinsichtlich der Qualität zu beurteilen, ergaben sich bei den Antworten aus schriftlicher Befragung und Interview ebenfalls keine signifikanten Unterschiede (GREENBERG UND MANFIELD 1956/57).
In allen bisher geschilderten Vergleichen ging man von der grundsätzlichen Überlegenheit der mündlichen Interviews aus und betrachte diese Angaben als Richtwert, an dem die Qualität der schriftlichen Befragung gemessen wurde. Es sind nur wenige Untersuchungen bekannt, in denen auf diese Annahme verzichtet wurde und beide Methoden an "objektiven" Daten, wie amtlichen Akten, Verträgen oder dergleichen, überprüft wurden. NUCKOLS ( 1 9 6 4 ) unternahm einen Vergleich der Daten über Lebensversicherungen, die durch schriftliche Befragung und Interview gewonnen wurden; Darstellung 4 zeigt die Zuverlässigkeit der Angaben bei beiden Methoden. Die naheliegendste Erklärung für diese Differenzen und die größere Genauigkeit der schriftlichen Befragung liegt in der Möglichkeit, die Angaben anhand der Unterlagen vor dem Ausfüllen zu überprüfen. Aber auch, wenn man die Gruppe der mündlich Interviewten betrachtet, die während des Interviews in den Unterlagen nachschauten, bleiben die Unterschiede zumindest bei Angaben über die Höhe der Versicherungspolicen bestehen. Besonders erwähnenswert ist, daß ein Drittel der Interviewten, die vorher in den Unterlagen nachgesehen haben, einen zu hohen Versicherungsbetrag anga-
158
4. Band: Erhebungsmethoden: Die Befragung
Interviews Ν = 218
Schriftliche Befragung Ν = 206
Richtige Angaben über alle Versicherungen 1 )
52%
62%
Richtige Angaben über Höhe der Versicherungspolice (± 1 0 % ) ' )
65%
80%
Richtige Angaben über Prämienhöhe (± 1 0 % ) ' )
65%
75%
' ) Überprüfung erfolgte durch Kontrolle der Unterlagen der Versicherungsgesellschaft Darstellung 4: Zuverlässigkeit der Angaben in Interviews bzw. bei schriftlicher Befragung (Quelle: NUCKOLS 1 9 6 4 ) ben. Die größere Genauigkeit bei den schriftlichen Angaben kann daher nicht mit der zusätzlichen Möglichkeit, sich zunächst zu informieren, erklärt werden. Die Gesamtsumme der Versicherungspolicen wurde von den Interviewten um 12% zu hoch angegeben; von den schriftlich Befragten nur um 1%. Ein Vergleich der Struktur der beiden Stichproben mit Census-Daten ergab, d a ß die Gruppen mit der niedrigsten Schulbildung und die der jüngeren Befragten in der schriftlichen Befragung unterrepräsentiert sind. Ein weiteres Ergebnis dieser Studie war, daß die schriftliche Befragung signifikant höhere Nennungen bei Fragen nach nicht allgemein akzeptierten Verhaltensweisen (eigene Versicherung als niedrig bewerten, beleihen der Versicherung) erbrachte. Die Ergebnisse dieser Studie führen zu der Annahme, daß schriftliche Befragungen bei relativ homogenen Gruppen zumindest bei Fragen nach überprüfbaren Fakten mehr Antworten erbringen, die einer Nachprüfung standhalten, als mündliche Interviews. Dies zeigt, daß es in bestimmten Fällen günstiger sein kann, mit schriftlichen Befragungen zu arbeiten, und ein Vergleich der Angaben aus schriftlichen Befragungen mit Interview-Angaben keine geeignete Methode darstellt, um die Tauglichkeit der schriftlichen Befragung zu überprüfen. Abschließend sei betont, daß es nicht in erster Linie darum geht, einen Gegensatz und grundsätzlichen Qualitätsunterschied zwischen schriftlicher und mündlicher Befragung herauszustellen. Beide Erhebungstechniken haben ihre spezifischen Vor- und Nachteile, die es je nach Untersuchungsthema, Population, Zeit- und Kostengesichtspunkten gegeneinander abzuwägen gilt; die umfangreiche Sammlung praktischer Beispiele bei RICHTER ( 1 9 7 0 ) liefert hierzu zahlreiche Anregungen. Zum anderen sollte auch stets geprüft werden, welche erhebungstechnischen Vorteile aus einer Kombination von schriftlicher und mündlicher Befragung gewonnen werden können.
5. Kapitel: Die schriftliche
Befragung
159
Literatur ADINA, R., Die Stellung des Akademikers in Gesellschaft und Beruf, Zürich 1951. BARNETTE, W., The Non-Respondent Problem in Questionnaire Research, in: Journal of Applied Sociology 1950. Structure of Mail Questionnaires: Test of Alternatives, in: Public Opinion Quarterly 27, 1963, S. 307 - 311. BAUR, E . J . , Reponse Bias in a Mail Survey, in: Public Opinion Quarterly 1 1 , 1 9 4 7 , S. 594 - 600. BAUER, R . K.,UND F . MEISSNER,
Economical Incentive Used For Mail Questionnaire, in: Public Opinion Quarterly 12, 1948, S. 492 - 495. BOEK, W. E . , UND J . H . LADE, The Test of the Usefulness of the Post-Card Technique in a Mail Questionnaire Study, in: Public Opinion Quarterly 27, 1963, S. 303 - 306. BEVIS, J . C.,
BOYD, R. W. JR. UND WESTFALL, Marketing Research, Homewood, III. 1964. BRADT, K., The Usefulness of Post Card Technique in a Mail Questionnaire Study, in: Public Opinion Quarterly 19, 1955, S. 218 - 222. and Dont's for Increasing Response in Industrial Mail Surveys, in: Printers Ink, May 4, 1946, S. 60.
CHAPPLE, A . W . , D O ' S
CLAUSEN, J. Α., UND R. Ν. FORD, Controlling Bias in Mail Questionnaires, in: Journal of the American Statistical Association 42, 1947, S. 497 - 511. Cox, E., Response Pattern to Mail Surveys, in: Journal of Marketing Research 3, 1966, S. 392 - 397. S. H . BRITTUND R. D. NORMAN, Objective Differences Among Various Various Types of Respondents to a Mailed Questionnaire, in: American Sociological Review 12, 1947, S. 435 - 444.
EDGERTON Η . Α . ,
EDSALL, R. L., Getting "Not At Homes" To Interview Themselves, in: Journal of Marketing 23, 1958/59, S. 184 - 185. Questionnaire vs. Interviews Methods in the Study of Human Love Relationships, in: American Sociological Review 12, 1947, S. 541 — 543.
ELLIS Α . ,
ERDOS, P. L., Professional Mail Surveys, New York, 1970. FERBER, R., The Problem of Bias in Mail Returns: A Solution, in: Public Opinion Quarterly 12, 1948, S. 669 - 676. FERBER, R., Order Bias in a Mail Survey, in: Journal of Marketing 17, 1952/53, S. 171 - 178. FERRIS, A. C., A Note on Stimulating Response to Questionnaires, in: American Sociological Review 16, 1951, S. 247 - 249. FORD, Ν . M., The Advance Letter in Mail Surveys, in: Journal of Marketing Research 4, 1967, S. 202 - 204. FORD, R. N., UND Η. ZEISEL, Bias in Mail Surveys Cannot be Controlled by One Mailing, in: Public Opinion Quarterly 13, 1949, S. 495 - 501.
160
4. Band: Erhebungsmethoden:
Die
Befragung
Mail Questionnaire as a Research Problem, in: Journal of Psychology 20, 1945, S. 293 - 310.
FRANZEN, Κ . , UND P . F . LAZARSFELD,
Increasing the Response of a Mail Questionnaire, in: Journal of Marketing 23, 1958/59, S. 186 - 187.
FRAZIER, G . , U N D K . BIRD,
of Increasing Mail Response, in: Journal of Marketing 22, 1957/58, S. 55 - 57.
GOLDSTEIN, H . , U N D B . H . K R O L L , M e t h o d s
GRAY, P. G., A Sample Survey with Both a Postal and an Interview Stage, in: Applied Statistics 6, 1957, S. 139 - 153. GRAY, P. G., UND T. CORLETT, Sampling for The Social Survey, in: Journal of the Royal Statistical Society 113, 1950, S. 184 - 187. Α., U N D M . N. MANFŒLD, On the Reliability of Mail Questionnaire in Product Tests, in: Journal of Marketing 21, 1956/57, S. 342 - 345.
GREENBERG,
GULLAHORN, J . E . , UND J . T . GULLAHORN, A n I n v e s t i g a t i o n o f t h e E f f e c t s o f T h r e e
Factors on Response to Mail Questionnaires, in: Public Opinion Quarterly 27, 1963, S. 294 - 2 9 6 . HIGHMANN, Α., The Audited, Self Administered Questionnaire, in: Journal of Marketing 20, 1955/56, S. 155 - 159. Increasing the Response to Mail Questionnaire, in: Public Opinion Quarterly 22, 1958, S. 123 - 132.
K E P H A R T . W . M . , UND M . BRESSLER,
LAWSON, F., Varying Group Responses t o Postal Questionnaires, in: Public Opinion Quarterly 13, 1949, S. 1 1 4 - 1 1 6 . LAURENT, C . Α . , UND A . PARRA, U s e o f M a i l Q u e s t i o n n a i r e s i n C o l u m b i a , i n : J o u r n a l
of Marketing Research 5, 1968, S. 101 - 103. LUNDBERG, G . Α . , UND Ο . Ν . LARSEN, C h a r a c t e r i s t i c s o f H a r d - t o - R e a c h I n d i v i d u a l s i n
Field Surveys, in: Public Opinion Quarterly 13, 1949, S. 487 - 4 9 4 . MANFŒLD, Μ. Ν., A Pattern of Response to Mail Surveys, in: Public Opinion Quarterly 12, 1948, S. 4 9 3 - 4 9 5 . MOSER,C. Α . ,
Survey Methods in Social Investigation, London 1 9 5 8 .
NUCKOLS, R. C., Personal Interview Versus Mail Panel Survey, in: Journal of Marketing Research 1, 1964, S. 11 - 16. PARTEN,M.,
Surveys, Polls and Samples, New York 1950.
REUSS.C. F., Differences between Persons Responding and Not Responding to a Mailed Questionnaire, in: American Sociological Review 8 , 1 9 4 3 , S. 4 3 3 —438. RICHTER, H. J., Die Strategie schriftlicher Massenbefragungen, Bad Harzburg 1970. ROBIN, S. S., Procedure for Securing Returns t o Mail Questionnaires, in: Sociology and Social Research 1965, S. 24 - 35. Making Mail Surveys More Reliable, in: Journal of Marketing 15, 1950/51, S. 415 - 4 2 4 .
ROBINSON, R . Α . , UND P . AGISIM,
Research on Mail Survey, in: Journal of the Royal Statistical Society, Series A, 124, 1961, S. 143 - 205.
SCOTT, C . ,
Notes on the Validity of Mail Questionnaire Returns, in: Journal of Applied Psychology 23, 1939, S. 95 - 104.
SLANTON, F . ,
5. Kapitel: Die schriftliche Befragung
161
SLETTO, R. F., Pretesting of Questionnaires, in: American Sociological Review 5, 1940, S . 193 - 2 0 0 . SucHMAN, Ε. Α., UND Β. MCCANDLESS, Who Answers Questionnaires ?, in: Journal of Applied Psychology 24, 1940, S. 758 - 769. SUCHMAN, Ε. Α., The Analysis of Bias in Survey Research, in: Public Opinion Quarterly 26, 1962, S. 102 - 111. STAFFORD, J. E., Influence of Preliminary Contact on Mail Returns, in: Journal of Marketing Research 3, 1966, S. 4 1 0 - 4 1 1 . N., UNDW. J. REISS, A Note on an Unusually High Rate of Returns for a Mail Questionnaire, in: Public Opinion Quarterly 23, 1959, S. 579 - 581.
TALLENT,
WAISANEN, F. B., A Note on the Response t o a Mailed Questionnaire, in: Public Opinion Quarterly 18, 1954, S. 210 - 2 1 2 . Mail Questionnaires Can Produce Good Samples of Homogeneous Groups, in: Journal of Marketing 12, 1947/48, S. 53 - 6 0 .
WALLACE, D . ,
A Case For and Against Mail Questionnaires, in: Public Opinion Quarterly 18, 1954, S. 4 0 - 5 2 .
WALLACE, D . ,
M., UND Η . R. WALSH, Mail Questionnaires and the Personalized Letter of Transmittal, in: Journal of Marketing 16, 1951/52, S. 331 - 336.
WEILBACHER, W .
WOTRUBA, T. R., Monetary Inducements and Mail Questionnaire Response, in: Journal of Marketing Research 3, 1966, S. 3 9 8 - 4 0 0 .
6.
Methoden zur Identifizierung von Eliten von Paul Drewe
6.1
Elitebegriff und Elitetheorien
Eliten werden in der empirischen Sozialforschung unterschiedlich definiert. Die vielfältigen Definitionen haben als gemeinsamen Nenner, daß zur Elite gehören gleichbedeutend ist mit Einfluß ausüben bzw. mit Einfluß ausüben können. Einfluß äußert sich darin, daß eine Person das Verhalten anderer Personen ändert, indem sie diese zu einem Tun oder zu einem Unterlassen veranlaßt ( D A H L 1963). Diese umfassende Definition wird aber in der Elitetheorie eingeschränkt bzw. konkretisiert. Das heißt, es interessiert nur die Einflußausübung in einem spezifischen sozialen Kontext: in einer Gemeinde, in einer Organisation, in der Gesamtgesellschaft (als politisches System gesehen). Zur Elite gehören bedeutet dann, Einfluß nehmen auf eine angebbare Entscheidung, sei es dadurch, daß eine Person ihren Vorschlag durchsetzt, sei es, daß sie die Vorschläge anderer blockiert. Aller Alltagserfahrung nach ist dieses Merkmal nicht normal verteilt. Es wird auch nicht bestritten, daß es Einflußreiche und Einflußlose gibt. Kontrovers ist hingegen das Maß an Ungleichheit in der Einflußverteilung. In der sogenannten Power Elite-Kontroverse stehen sich die Verfechter einer oligarchischen und einer pluralistischen Elitetheorie gegenüber. In neuerer Zeit tendiert man eher dazu, diese Dichotomie von Oligarchie und Pluralismus aufzugeben. Die neuere Elitetheorie geht von einem Kontinuum der Einflußverteilung aus, wonach Oligarchie bzw. Pluralismus als Gradfrage anzusehen sind. Da die Diskussion über die Einflußverteilung in Begriffen wie "demokratisch versus undemokratisch" bzw. "mehr oder weniger demokratisch" geführt wird, handelt es sich hierbei um Beiträge zur politischen Soziologie, genauer, um Beiträge zur Soziologie der Demokratie. Das kann sein Demokratie in Gesamtgesellschaften, in erster Linie aber Demokratie in Gemeinden (MILLS 1 9 5 8 ; 1 9 6 4 ; DAHL 1 9 5 8 ; D ' A N T O N I O UND EHRLICH 1 9 6 1 ; HUNTER 1 9 5 9 ) . Außerdem stellt sich das Oligarchie-Problem auch in Organisationen mit einer demokratischen Verfassung (MICHELS 1 9 5 7 ; LIPSET U.A. 1 9 5 6 ) . Als empirisches Problem wurde die Eliteforschung zunächst bei Analysen gesamtgesellschaftlicher Eliten behandelt. Neben der vergleichenden Eliteforschung (LASSWELL U.A. 1952; LERNER 1966) steht eine Fülle von Einzelstudien, darunter in Deutschland vor allem die Arbeiten von Z A P F (1965a; 1965b). Der stärkste Anstoß für die methodische Entwicklung ging jedoch von der Gemeindeforschung aus.
6. Kapitel: Methoden zw Identifizierung von Eliten
163
Waren die lokalen Eliten anfänglich nur ein Aspekt der sozialen Totalerscheinung Gemeinde, die man möglichst umfassend in Monographien zu beschreiben versuchte ( L Y N D UND LYND 1 9 2 9 ; 1 9 3 7 ) , so wurden sie unter der Bezeichnung "community power structures" vor allem in den USA und hier vor allem seit 1953 zu einem speziellen Forschungsgegenstand (PRESS 1 9 6 2 ) . In den fünfziger Jahren war die Forschung in den USA durch eine stark polemisch gefärbte Kontroverse (die bereits erwähnte Power Elite-Kontroverse) gekennzeichnet. Diese elitetheoretische Kontroverse (Oligarchie versus Pluralismus) ist gleichzeitig eine methodische Streitfrage (Reputationstechnik versus Entscheidungstechnik) und wird zwischen den "Oligarchen" der Hunter-Schule und den "Pluralisten" der Dahl-Schule ausgetragen (FOLSBY U.A. 1 9 6 2 ) . Erst in jüngster Zeit tritt die Power.Elite-Kontroverse in den Hintergrund. Man tendiert eher zu einer Elitetheorie, die die Ungleichheit der Einflußverteilung als Gradfrage ansieht (CLARK 1 9 6 5 ) , und meist zu einem Methodenpluralismus (FREEMANN U.A. 1 9 6 0 ,
1962,1963).
In Deutschland zeichnet sich eine Rezeption der amerikanischen Community-PowerForschung seit Mitte der 60er Jahre ab (AMMON 1967; KÖNIG 1967). Eine wesentliche Anregung hierzu ging von Scheuch aus (SCHEUCH Υ Λ. 1965, SCHEUCH 1965; DREWE 1968a). Während man bisher Gemeinden und ihre Machtstrukturen weitgehend isoliert betrachtet hat, stellt eine der neuesten Entwicklungen auf die räumliche Machtverteilung innerhalb der Gesamtgesellschaft ab; so Friedmanns 'Theorie der polarisierten Entwicklung", die wechselnde Zentren und Peripherien der Macht im sozio-ökonomischen Entwicklungsprozeß unterscheidet (FRIEDMANN 1 9 6 9 ) . Auf dergleichen Linie (wenn auch theoretisch kaum fundiert) liegt der Versuch von IBLHER ( 1 9 7 0 ) , die Machtzentren ("Hauptstädte") der Bundesrepublik zu identifizieren.
6.2
Identifizierungstechniken
6.2.1
Reputationstechnik
Sicherlich die umstrittendste Forschungstechnik ist die Reputationstechnik Ceputational approach" oder "reputational technique"). Wird diese Technik im Anfang noch recht impressionistisch gehandhabt — z.B. in der Atlanta-Studie von HUNTER (1953), so beginnen seine Nachfolger ( D ' A N T O N I O UND ERICKSON 1962) unter dem Einfluß der rivalisierenden Dahl-Schule, die Reputationstechnik kritisch auf ihren methodischen Wert hin zu prüfen. Ein weiterer bedeutender Beitrag stammt von MILLER, FORM UND HANSON (HANSON 1959). Sie entwickelten auf der Basis der Reputationstechnik ein erfolgreich erprobtes Prognosemodell. Die verschiedenen Versionen der Reputationstechnik lassen sich auf folgenden einfachen Nenner bringen. Als einflußreich oder mächtig werden diejenigen Bewohner einer Gemeinde identifiziert, die entweder im Urteil der Gemeindebevölkerung oder aber im Urteil lokaler Experten einflußreich sind. Man befragt also entweder einen repräsentativen Querschnitt der Gemeindebewohner oder — und das ist wohl der Regelfall — einen ausgewählten Kreis lokaler Experten über die Einflußverteilung in einer Gemeinde. Lokale Experten sind Personen, von denen der Forscher annimmt, daß sie besonders gut über
164
4. Band: Erhebungsmethoden: Die Befragung
Machtstrukturen im lokalen Bereich informiert sind. Es sind "Bescheidwisser", die "knowledgeables" oder "expert informants", manchmal auch "judges" genannt werden. In der Regel wird danach gefragt, wen man als allgemein einflußreich ansieht. Es kann aber auch nach Einfluß in ganz bestimmten Bereichen des Gemeindelebens gefragt werden ("leadership by domain"). Schon aus der Schilderung des Grundprinzips geht hervor, daß die Reputationstechnik vor allem wegen ihrer Gültigkeit problematisch ist. Die wichtigsten Kritikpunkte sind erstens,daß die Reputationstechnik nur die Reputation des Einflusses, nicht jedoch seine tatsächliche Geltendmachung mißt, und zweitens, daß es keine allgemeinen und operationalen Kriterien für die Auswahl der lokalen Experten gibt. Die Stärken der Reputationstechnik sind hingegen darin zu sehen, daß diese Technik relativ einfach und billig gehandhabt werden kann. Die bisherigen Erfahrungen lassen außerdem auf hohe Zuverlässigkeit schließen, d.h. auf eine Reproduzierbarkeit der Ergebnisse. Kennzeichnend für den Streit um den methodischen Wert der Reputationstechnik ist vielfach das Anspruchsniveau eines Forschers, der lokale Eliten mit Hilfe der Reputationstechnik identifiziert. Diese Technik kann nur eine bestimmte Dimension lokaler Machtstrukturen messen: die Reputation des Einflusses von Personen oder Gruppen in Gemeinden. Die praktische Ausgestaltung des Verfahrens entscheidet darüber, wie spezifisch bzw. wie differenziert die Reputation, d.h. der Ruf einflußreich zu sein, erfaßt wird. 6.2.2
Entscheidungstechnik
Die Entscheidungstechnik ("decision making" oder "issue-approach") wurde zuerst von politischen Wissenschaftlern eingesetzt. Klassischer Anwendungsfall ist die New Haven-Studie von DAHL ( 1 9 6 1 ) . Die zur Dahl-Schule rechnenden Autoren Polsby und Wolfinger haben sich stark in der polemischen Auseinandersetzung mit den Verfechtern der Reputationstechnik engagiert (POLSBY U.A. 1 9 6 2 ) . Ihre Beiträge dienten aber weniger einer Weiterentwicklung der Entscheidungstechnik. Nicht nur was die Anzahl der untersuchten gemeindepolitischen Streitfragen betrifft, sondern auch in bezug auf die Auswertung stellt die Syracuse-Studie des Freeman-Teams hingegen eine echte Weiterentwicklung der Entscheidungstechnik dar (FREEMANN U.A. 1960; 1962; 1 9 6 3 ) . Eine neue Variante, die mehr als nur eine technische Weiterentwicklung der Entscheidungstechnik sein soll, wurde in der Untersuchung der lokalen Eliten von Cambridge (Massachusetts) eingesetzt. Diese Variante trägt den Namen "process approach " oder Prozeßtechnik (SCHEUCH U A . 1 9 6 5 ; GORDON 1 9 6 5 ) . Allgemein läßt sich die Entscheidungstechnik wie folgt charakterisieren: Als einflußreich gilt, wer erfolgreich an einem Entscheidungsprozeß in bezug auf eine konkrete Streitfrage teilgenommen hat, d.h. wer entweder einen eigenen Lösungsvorschlag für diese Streitfrage durchgesetzt hat oder aber wer einen entsprechenden Vorschlag anderer erfolgreich blockieren konnte. Es werden also Entscheidungsprozesse, wie sie von konkreten Streitfragen in Gemeinden ausgelöst werden, mehr oder weniger ausführlich rekonstruiert. Weniger ausführlich ist diese Rekonstruktion zu nennen, wenn sie primär auf die "entscheidende" Phase des Prozesses abstellt, d.h. auf den offenen Entscheidungsprozeß ("Engaging in the Overt Decision-Making Processes"). Darunter fällt z.B. die Ab-
6. Kapitel: Methoden zur Identifizierung von Eliten
165
Stimmung über eine Vorlage im Stadtrat. In ausführlicheren Rekonstruktionen wird zusätzlich auch das Vorspiel zum offenen Entscheidungsprozeß berücksichtigt. Dieses Vorspiel umfaßt: 1. die Identifikation einer sozialen Problemsituation, die zu ersten • Lösungsvorschlägen führt ("Structuring and Defining of Ideas as Proposals")·, 2. eine Bewertung von Lösungsalternativen ( " I d e n t i f y i n g the Properties of Alternatives") und 3. die Abschätzung der Erfolgsaussichten von Lösungsversuchen sowie eine Identifizierung und eine Beeinflussung der Gegner und Befürworter von Plänen ("Structuring the Social Field"). In einer ausfuhrlichen Rekonstruktion des Entscheidungsprozesses wird — wie es für die Prozeßtechnik kennzeichnend ist — aber nicht nur das Vorspiel, sondern auch das Nachspiel der offenen Entscheidung erfasst: die Durchführungsphase ("Carrying out the Consequences of the Decisionmaking Process"). Die Datensammlung ist beim Einsatz der Entscheidungstechnik nicht auf das Interview, d.h. nicht auf eine Umfrage u n t e r lokalen Experten beschränkt. Aus der Tradition der politischen Wissenschaften heraus zu verstehen ist insbesondere die Auswertung von Berichten, die den Ablauf von Entscheidungen bei gemeindlichen Konflikten dokumentieren wie z.B. Sitzungsprotokolle, u.ä.. Neben einer solchen Inhaltsanalyse von "eingefrorenen" Informationen über Entscheidungsprozesse, die vor allem bei einer Analyse früherer Streitfragen wichtig ist, kann die Entscheidungstechnik methodisch auch als Beobachtung ausgeprägt sein. Eine nichtteilnehmende, unter Umständen auch eine teilnehmende Beobachtung empfehlen sich bei Streitfragen, die zum Untersuchungszeitpunkt noch nicht ausgetragen sind, die noch die einzelnen Phasen bis hin zur offenen Entscheidung durchlaufen (-> Bd. III: Weidmann, Feldbeobachtung). Auch die Entscheidungstechnik birgt methodische Probleme in sich: Sie kann 1. nur dann erfolgreich eingesetzt werden, wenn Konflikte in der Gemeindepolitik "sichtbar" sind; sei es, daß Eingeweihte darüber sprechen dürfen und wollen; sei es, daß der Entscheidungsprozeß in Berichten festgehalten ist und diese Berichte dem Forscher zugänglich sind; sei es schließlich, daß Konflikte offen ausgetragen werden und so beobachtbar sind. 2. Dem Problem, bei der Reputationstechnik, Kriterien für die Auswahl der Experten ("knowledgeables") zu finden, entspricht hier das Problem, Kriterien für die Auswahl der zu analysierenden Streitfragen aufzustellen. Als vorteilhaft beim Einsatz der Entscheidungstechnik ist andererseits zu vermerken, daß die tatsächliche Geltendmachung von Einfluß in einem konkreten Einzelfall erfaßt werden kann. Damit läßt sich empirisch entscheiden, ob deqenige, dem der Ruf vorausgeht, einflußreich zu sein, bzw. ob der Inhaber einer bestimmten Position (siehe die anschließend behandelte Positionstechnik), auch tatsächlich Einfluß ausübt. Bei Durchsicht der neueren Literatur zeigt sich, daß über den methodischen Wert der Entscheidungstechnik weitgehend Einigkeit herrscht. Dennoch bedarf der Anspruch ihrer Vertreter , die tatsächliche Geltendmachung von Einfluß durch Personen oder Gruppen in bezug auf konkrete Streitfragen zu messen, einer Einschränkung. Der auf diese Weise festgestellte Einfluß ist immer "issue" -bezogen oder "issue" -spezifisch. Die Forschungsergebnisse hängen von der Auswahl der untersuchten Streitfragen ab.
166
4. Band: Erhebungsmethoden:
6.2.3
Positionstechnik
Die Befragung
Eine dritte wichtige Technik der Eliteforschung stellt aie Positionstechnik ("positional approach") dar. Zur Entwicklung dieser Technik hat vor allem Samuel Stouffer wesentlich beigetragen. Ein Teil seiner Untersuchung "Comunism, Conformity and Civil Liberties"besteht aus Interviews bei lokalen Eliten, die positionell ermittelt worden sind (STOUFFER 1965). In einem Projekt der "National Commission On C o m m u n i t y Health Services" wird der Versuch unternommen, die für amerikanische Gemeinden typischen und "einflußreichen" Positionen zu standardisieren. Aus der Themenstellung verständlich ist, daß dabei Positionen aus dem Gesundheitswesen überrepräsentiert sind (NATIONAL COMMISSION ON COMMUNITY HEALTH SERVICES 1964). Für Deutschland hat ZAPF ( 1 9 6 5 b ) die nationale Elite mit Hilfe der Positionstechnik identifiziert. Er vergleicht die positioneile Elite von Deutschland in drei historisch aufeinanderfolgenden politischen Systemen: Weimarer Republik, Drittes Reich und Bundesrepublik (Darstellung 1 ). KABINETT:
die Reichsregierungen, die Bundesregierung die Ministerpräsidenten der deutschen Länder, für das LÄNDERREGIER UNGEN: Dritte Reich zusätzlich die Reichsstatthaltung Präsidenten des Reichs- bzw. Bundestages; für 1919 PARLAMENT: 1961 die Fraktionsvorsitzenden der großen Parteien und Vorsitzende wichtiger Parlamentsausschüsse; dasselbe für den Reichstag nur beispielhaft 1923 PARTEIEN: Vorsitzende der größten Parteien, für 1933 - 1945 die Reichsleitung der NSDAP OBERE GERICHTE: Präsidenten der oberen Reichs- bzw. Bundesgerichte, für 1919 - 1935 zusätzlich die Senatspräsidenten des Reichsgerichts VER WAL TUNGSSPITZE: die Staatssekretäre der Reichs- und Bundesministerien DIPLOMATISCHER DIENST. Botschafter in wichtigen Ländern GENERALITÄT: die Inhaber der höchsten Kommandostellen in Reichswehr, Wehrmacht und Bundeswehr WIRTSCHAFTSVERBÄNDE: Präsidenten der großen Wirtschaftsverbände bzw. der Reichswirtschaftskammer und der Reichsgruppen; zusätzlich die Präsidenten der wichtigsten Fachgruppen der Industrie GROSSUNTERNEHMEN: Vorstandsvorsitzende und Aufsichtsratvorsitzende der größten deutschen Unternehmen GEWERKSCHAFTEN: Vorsitzende der größten Gewerkschaften zusätzlich wichtiger Berufsverbände; für das Dritte Reich die Fachleiter der Deutschen Arbeiterfront KIRCHEN: Spitzen der Evangelischen Kirche, Landesbischöfe der größten Kirchenprovinzen, katholische Erzbischöfe großer Diözesen Kultusminister der Länder; für 1933 — 45 die AbteiKUL TUR VER WA L TUNG: lungsleiter des Reichsministeriums für Erziehung und Volksbildung sowie die Präsidenten der Kaiser-WilhelmGesellschaft und der Deutschen Forschungsgemeinschaft Chefredakteure der größten Zeitungen und die IntenKOMM UNI KA TION: danten der Rundfunksender Darstellung 1 :
Ausgewählte Positionen der deutschen Machtstruktur im Zirkulationsmodell (Quelle: ZAPF 1965b, S. 75 - 76)
6. Kapitel: Methoden zur Identifizierung von Eliten
167
Im Grundprinzip läßt sich die Positionstechnik wie folgt umschreiben: Einflußreiche Personen werden aufgrund der Positionen bestimmt, die sie besetzen. Dabei handelt es sich um Positionen, die mit legalen Einflußmöglichkeiten ausgestattet sind. Nachdem in einer ersten Stufe eine Auswahl aus den für wichtig angesehenen Positionen getroffen wird, wird in der zweiten Stufe festgestellt, wer diese Positionen zur Zeit besetzt, wer sie früher einmal besetzt hat u.ä. Auf der zweiten Stufe sind wegen der legal definierten Positionen und des Öffentlichkeitscharakters der meisten Ämter günstige Voraussetzungen für eine Informationssammlung gegeben. Problematisch ist hingegen die erste Stufe des Vorgehens. Nach welchen Kriterien sollen die Organisationen und Positionen ausgewählt werden, deren Besetzung dann die lokale Elite ausmacht? Dieses Entscheidungsproblem besteht in ähnlicher Weise bei der Reputationsund bei der Entscheidungstechnik. Der Auswahl von Positionen entspricht dort die Auswahl von lokalen Experten bzw. von Streitfragen. Offen ist ferner folgende Frage: Welches Ausmaß an tatsächlichem Einfluß ist mit den untersuchten Organisationen und Positionen verbunden? Diese Frage ist mithilfe der Positionsteclinik allein nicht mit Sicherheit zu beantworten. Aus dem Zuletztgesagten läßt sich unmittelbar eine Vorsichtsmaßregel ableiten: Die legale Ausstattung einer Organisation bzw. einer Position mit Einüu&möglichkeiten umreißt nur ein Potential der Machtausübung, begründet sozusagen einen "Einflußverdacht". Die tatsächliche Einflußnahme der Positionsinhaber kann aber die legalen Möglichkeiten überschreiten. Andererseits können die Positionsinhaber auch ihre rechtlichen Möglichkeiten nicht voll nutzen oder sogar unausgeschöpft lassen. 6.2.4
Sonstige Techniken
Mit der Reputations-, der Entscheidungs- und der Positionstechnik sind die wichtigsten Ansätze zur Identifizierung von Eliten skizziert. Dies sind gleichzeitig die am häufigsten eingesetzten Forschungstechniken. Daneben sind noch der "cleavage approach" und der "socialactivity approach" zu erwähnen. Der Name Stouffers ist nicht nur mit der Entwicklung der Positionstechnik verbunden. Von ihm stammt auch der cleavage approach (CRAMER 1963): Als einflußreich werden die Führer oder Sprecher konkurrierender bzw. konfligierender Gruppen in einer Gemeinde angesehen. Den theoretischen Hintergrund liefert also die Konflikttheorie, wobei insbesondere die Bedingungen für den Übergang von latenten zu manifesten Konflikten relevant sind (DAHRENDORF 1957). In der Gemeindesoziologie ist in diesem Zusammenhang der Beitrag von COLEMAN (1957) zu nennen. Es fragt sich allerdings, ob die theoretische Grundidee der Konflikttheorie ausreichend ist, um den cleavage approach zu einer eigenständigen Identifizierungstechnik zu stempeln. In gewisser Weise liegt diese Grundidee eigentlich der gesamten Eliteforschung zugrunde. Die bekannte Operationalisierung des cleavage approach (CRAMER 1963) bestärkt die Zweifel an der Eigenständigkeit dieses Ansatzes. Wird nach den Führern oder Sprechern konfligierender Gruppen gefragt, so wird dieser Ansatz zu einer Variante der Reputationstechnik. In diesem Sinne wenden auch Hanson und seine Mitarbeiter einen cleavage approach an (HANSON 1959). Grundsätzlich können "Konfliktführer" positions- bzw. entscheidungstechnisch ermittelt werden. Ähnliches gilt auch für den social activity approach. Auch hier entscheidet die Operationalisierung über die Zurechnung zu einer der drei Grundtechniken. Maßstab für
168
4. Band: Erhebungsmethoden: Die Befragung
den Einfluß ist hier die A nzahl der Organisationen ( Vereine auf freiwilliger Basis u. ä. ), in denen eine Person Mitglied ist (FREEMAN 1 9 6 0 ; 1 9 6 2 ; 1 9 6 3 ) . Dieser Ansatz enthüllt sich also bei näherer Betrachtung als ein verkürzter "gregariousness"-lndex, wie Lazarsfeld ihn verwendet ( K A T Z UND LAZARSFELD 1 9 6 4 ) . Man kann den social activity approach auch als eine spezielle Variante der Positionstechnik auffassen, speziell in dem Sinne, daß hier im Gegensatz zu den "gebräuchlichen" Machtpositionen sehr spezielle Positionen ausgewählt wurden. Auch soziometrische Fragen (STEWARD 1957) stellen keine eigenständige Identifizierungstechnik dar, vielmehr ergänzen sie die Reputationstechnik. Soziometrische Fragen ermöglichen es, anzugeben, inwieweit einflußreiche Akteure (Individuen) Gruppen bilden. Man gewinnt Einsicht in die Kommunikationsverbindungen zwischen einflußreichen Individuen, daneben auch zwischen "Führern" und "Geführten". Soziometrische Wahlen können auf soziale Kontakte, Meinungsführerschaft u.ä. Formen sozialer Beziehungen oder Formen der Kommunikation bezogen werden. Orientiert an der Cambridge-Studie (SCHEUCH U.A. 1965) ist dieser Ansatz auch in Deutschland erprobt worden. Er diente einmal dazu, die Struktur der Führungsgruppe eines Landkreises zu identifizieren. Zum andern war es möglich, die Kommunikationskanäle bzw. -lücken zwischen der Führungsgruppe des Kreises und einzelnen Gemeinden festzustellen (DREWE 1968a).
6.3
Dimensionaler Vergleich
Zusammengefaßt ergibt sich also, daß die derzeitig am häufigsten eingesetzten Identifizierungstechniken im wesentlichen drei, allerdings variantenreiche Instrumente — die Reputations-, die Entscheidungs- und die Positionstechnik — umfassen. Bei der Beschreibung dieser Techniken sind bereits ihre wichtigsten Vor- und Nachteile genannt und miteinander verglichen worden. Dieser Vergleich kann nun in zwei Richtungen erweitert werden. Betrachtet man die Identifizierungstechniken zunächst dimensional, d.h. im Hinblick auf die ihnen zugrundeliegenden Nominaldefinitionen, so stellen sich ihre Aussagenbereiche wie folgt dar. Jede Methode mißt eine andere Dimension der Einflußausübung. Die Positionstechnik zielt auf den institutionellen Rahmen oder auf die "sehr handgreifliche institutionellorganisatorische Außenseite" (KÖNIG 1967) von Gemeinden: die legal definierten Einflußmöglichkeiten oder Max Webers "legale Herrschaft kraft Satzung". Aus diesem Grunde kommt die Positionstechnik auch der herkömmlichen politikwissenschaftlichen Orientierung beim Studium von Gemeinden am nächsten. Über die beiden von der Reputations- und von der Entscheidungstechnik erfaßten Dimensionen der lokalen Einflußverteilung informiert eine dimensionale Analyse von NUTALL U.A. ( 1 9 6 8 ) . Die Autoren trennen den tatsächlichen Zugang ("actual access") vom perzipierten Zugang zu Ressourcen ("perceived access"). Der tatsächliche Zugang zu Ressourcen ist dichotomisiert: ein Akteur im Entscheidungsprozeß kann über eine Ressource verfügen - oder er hat keinen Zugang dazu. Beim perzipierten Zugang werden folgende beiden Möglichkeiten unterschieden: einem Akteur wird von andern der Zugang zu
6. Kapitel: Methoden zur Identifizierung von Eliten
169
Ressourcen nachgesagt — die andern können aber auch glauben, daß er keinen Zugang zu Ressourcen hat. Aus der Kombination dieser dichotomisierten Dimensionen resultiert dann eine Typologie in Form einer Vierfeldertafel (Darstellung 2). Die beiden Dimensionen decken sich mit dem Aussagenbereich der Reputations- bzw. der Entscheidungste chnik.
Tatsächlicher Zugang zu Ressourcen
Perzipierter Zugang zu Ressourcen Ja nein
ja
(A) Direkter Einfluß
(Β)
nein
(C)
(D) Ohne Einfluß
Reputation des Einflusses
Potentieller Einfluß
Darstellung 2: Eine Typologie einflußreicher Personen (Quelle: NUTTALL HA. 1965, S. 10)
Will man also die Dimension des perzipierten Zugangs zu Ressourcen messen, so empfiehlt sich hierfür in erster Linie die Reputationstechnik mit ihren zahlreichen Varianten. Alle Techniken, die auf Interviews aufbauen, können im strengen Sinne nur das "belief system" der Akteure in bezug auf den Einfluß anderer Akteure in Entscheidungsprozessen erfassen. Die Dimension des tatsächlichen Zugangs zu Ressourcen kann andererseits gültig wohl nur außerhalb des Interviews gemessen werden. Dafür erscheint vor allem die Entscheidungstechnik geeignet, besonders dann, wenn sie Inhaltsanalysen (-»• Bd. III: Herkner, Inhaltsanalyse) und eigentliche Beobachtungstechniken umfaßt. In welcher Beziehung stehen nun die Dimensionen des tatsächlichen und des perzipierten Zugangs zu Ressourcen zur Dimension der 'legalen Herrschaft". Mangelndes theoretisches Wissen legt nahe, die Beziehung dieser Dimensionen zueinander offen zu lassen. Die Frage, inwieweit legale Positionen mit einem tatsächlichen Zugang zu Ressourcen verbunden sind, wird ebenso als empirische Frage aufgefaßt wie die Frage, inwieweit mit Positionen im "belief system" ein Zugang zu Ressourcen assoziiert wird. Eine erste Antwort auf diese Frage ergibt sich aus Studien, in denen die verschiedenen T e c h n i k e n k o m b i n i e r t eingesetzt w u r d e n (SCHEUCH U.A. 1965; FREEMAN UA. 1960; 1 9 6 2 ; 1 9 6 3 ; BRINKMANN 1968).
6.4
Zuverlässigkeit
Während der Methodenstreit in erster Linie die Gültigkeit der Reputationstechnik zum Gegenstand hatte, sollen im folgenden nicht nur die Reputations-, sondern auch die Entscheidungs- und Positionstechnik auf ihre Zuverlässigkeit und ihre Gültigkeit untersucht werden.
170
4. Band: Erhebungsmethoden: Die Befragung
Die Zuverlässigkeit der Methoden zur Identifizierung von Eliten bestimmt sich einmal nach der Kongruenz von Reputations-, Entscheidungs- und Positionstechnik, zum andern unter dem Aspekt der Präzision jedes einzelnen Verfahrens (ZETTERBERG 1965). 1. Präzision. Ein Test der Präzision setzt voraus, daß derselbe Forscher dasselbe Forschungsobjekt wiederholt mit derselben Technik mißt. Nur bei Konstanz des Objekts ist es möglich, von den Forschungsergebnissen auf die Präzision der Meßtechnik zu schließen. Wenn JENNINGS (1964) also für Atlanta ( 10 Jahre nach Hunters Untersuchung) eine weniger oligarchische und mehr pluralistische Machtstruktur nachweist, so kann dies schon allein aus der Tatsache resultieren, daß das Objekt nicht konstant geblieben ist. Ein endgültiges Urteil über die Gültigkeit der Ergebnisse aus Jennings "Replikation" kann erst abgegeben werden, nachdem außer der Konstanz auch alle übrigen Aspekte der Zuverlässigkeit untersucht worden sind. Alternativ kann die Präzision dadurch geprüft werden, daß verschiedene Forscher dasselbe Forschungsobjekt zur gleichen Zeit unter Anwendung derselben Methoden untersuchen. Ein Schluß von den Testergebnissen auf die Präzision der Forschungsinstrumente ist aber nur möglich bei Objektivität der Forscher. Bei den beiden oben genannten Versionen eines Präzisionstests ist es wichtig, daß dasselbe Instrument eingesetzt wird. Das setzt eine Standardisierung dieses Instruments voraus. Die Standardisierung ist aber bei Reputations·, Entscheidungs- und Positionstechnik noch nicht weit gediehen. Standardisierung bedeutet bei der Reputationstechnik, daß dieselben Fragen an dieselben Befragten oder an vergleichbare Befragte gerichtet werden. Vergleichbar bedeutet hier, daß die Befragten nach denselben Kriterien ausgewählt wurden. Soll die Reputation des lokalen Einflußes durch Befragung eines repräsentativen Querschnitts der Gemeindebewohner ermittelt werden, so ist unter Anwendung derselben Auswahlkriterien ein Austausch der Befragten möglich. Bei einer Befragung von lokalen Experten hingegen ist ein Auswechseln der ursprünglich Befragten durch gleichgute Informanten problematisch. Es ist unwahrscheinlich, daß das Merkmal, in bezug auf die lokale Einflußverteilung Bescheid zu wissen, "normalverteilt" ist. Die Reputationstechnik kann in diesem Falle nur dadurch standardisiert werden, daß man eine Panelbefragung der lokalen Experten durchführt. Diese Möglichkeit besteht auch bei einer Befragung der Gemeindebewohner. Damit wird unmittelbar die methodische Forschung auf dem Gebiet der Panelbefragung für den Reputationstechniker relevant. Die Präzision der Reputationstechnik wird so zu einem Unterfall der Präzision von Interviewtechniken allgemein. Relativ leicht dürfte eine Standardisierung und damit ein Präzisionstest bei der Positionstechnik fallen, wenn einmal eine Entscheidung über die zu analysierenden Organisationen und Positionen getroffen ist. Eine Standardisierung der Entscheidungstechnik setzt voraus, daß dieselben Streitfragen anhand desselben Analyseschemas untersucht werden. Ein Austausch vergleichbarer Kontroversen scheint hier kaum möglich, selbst wenn die Auswahlkriterien dafür standardisiert sind. Den Versuch, Kriterien für die Auswahl der Streitfragen aufzustellen, haben FREEMAN U.A. (1963) unternommen. Die Standardisierung des Analyseschemas entspricht der des Fragenbogens bei der Reputationstechnik. Stützt man sich bei der Untersuchung von Streitfragen auf Experten, so ergibt sich, zusätzlich, wie schon zuvor bei der Reputationstechnik, das Panelproblem, es sei denn, verschiedene Forscher untersuchen simultan dieselbe Gemeinde. Bei einer Inhaltsanalyse von Berichten, die abgelaufene
6. Kapitel: Methoden zur Identifizierung von Eliten
171
Entscheidungsprozesse dokumentieren, müßte diese Inhaltsanalyse weitgehend strukturiert sein, damit ein Präzisionstest durchführbar ist. Eine wiederholte Beobachtung derselben Streitfrage ist allerdings nicht möglich. Abgelaufene Entscheidungsprozesse können nur noch anhand von Berichten oder Befragungen Eingeweihter rekonstruiert werden. Der Aufwand für einen Präzisionstest ist nicht gerade gering. Deshalb kann es auch nicht verwundern, daß Gemeindestudien mit einer solchen methodischen Absicht selten sind. Bisher haben allein D ' A N T O N I O UND ERICKSON (1962), sowie BOOTH UND ADRIAN (1961) die Präzision der Reputationstechnik mit einigem Erfolg getestet. Für die Entscheidungs- sowie für die Positionstechnik fehlen entsprechende Untersuchungen. 2. Kongruenz. Günstiger steht es mit der Erforschung der Kongruenz. Voraussetzung für einen Kongruenztest ist, daß derselbe Forscher dasselbe Objekt gleichzeitig mit den verschiedenen Techniken mißt. Für einen solchen kombinierten Einsatz von Techniken bei der Identifizierung lokaler Eliten liegen bereits Beispiele vor. Da ist die Cambridge-Studie (SCHEUCH U.A. 1965) mit einer Kombination von Reputationstechnik (einschließlich "leadership by domain"), Positionstechnik und Entscheidungstechnik, diese einmal als "involvement in past issues", zum andern als Prozeßtechnik. Diese Kombination ergab, methodisch gesehen, eine starke Korrelation zwischen der Reputationstechnik einerseits und den übrigen Techniken andererseits, während die Interkorrelation bei den Ergebnissen der übrigen Techniken beträchtlich niedriger lag. Maßstab für die Korrelation ist der Grad, zu dem sich die unter Einsatz verschiedener Techniken identifizierten einflußreichen Personen überschneiden. In der Syracuse-Studie haben Freeman und seine Mitarbeiter die drei Grundtechniken und den "social activity approach" miteinander kombiniert (FREEMAN U.A. 1960; 1962; 1963). Der Grad der Überschneidung von Namen einflußreicher Personen der in einem Korrelationskoeffizienten ausdrückbar ist - ist ein Indikator für die Substituierbarkeit der verschiedenen Techniken bzw. für den Grad ihrer Kongruenz (Darstellung 3). Die Syracuse-Untersuchung hat ergeben, daß die Kongruenz zwischen der Reputations- und der Positionstechnik am größten ist. Beide Techniken sind im Verhältnis zur Entscheidungstechnik relativ inkongruent.
Entscheidung 25 33 39
"Social Activity" 25 22
Reputation 74
Position
Darstellung 3: Prozentsatz der Übereinstimmung in der Bestimmung von " F ü h r e r n " bei der Verwendung von vier traditionellen Techniken (Quelle: FREEMAN U.A. 1963, S. 796) (1968) hat für die Bundesrepublik versucht, einen solchen Kongruenztest zu wiederholen. Die Ergebnisse seiner Untersuchung in den westfälischen Kleingemeinden Niederense und Bremen stimmen nicht mit den Ergebnissen von Syracuse bzw. nur teilweise mit denen von Cambridge überein (Darstellung 4). Brinkmann erklärt diese Unterschiede aus der Gemeindestruktur, präzisiert in den Variablen StruktuBRINKMANN
172
4. Band: Erhebungsmethoden: Die Befragung
Vergleich zwischen Techniken
untersuchte Gemeinde Niederense
Bremen
Entscheidungs-Reputation
.73
.76
Entscheidungs-Position
.53
.41
Reputation-Position
.39
.41
Darstellung 4: Kongruenz von Entscheidungs-, Reputations- und Positionstechnik in Niederense und Bremen (NRW) (Quelle: BRINKMANN 1968, S, 78). riertheit bzw. Sichtbarkeit ( B O N J E A N UND C A R T E R 1 9 6 5 ) . Der Grad an Strukturiertheit und infolgedessen Sichtbarkeit der Machtpositionen in der amerikanischen Großstadt erklärt dort die hohe Kongruenz von Positions- und Reputationstechnik. Die westfälischen Kleingemeinden sind in ihren Positionen hingegen in weit stärkerem Maße unstrukturiert, wodurch die Sichtbarkeit der Positionen vermindert wird. Hier spielt aber die Reputation der eigentlichen Akteure im Entscheidungsprozeß eine größere Rolle bzw. diese sind in höherem Maße sichtbar. Teilweise ist die Kongruenz von Entscheidung und Reputation aber auch darauf zurückzuführen, daß die angewandte Version (Bremen) der Entscheidungstechnik eine Variante der Reputationstechnik war. Damit wird die ermittelte Uberschneidung in diesem Fall zu einem methodischen Artefakt. Welche Konsequenzen lassen sich nun aus dem Vergleich des amerikanischen und deutschen Kongruenztests ziehen? Die einander widersprechenden Ergebnisse lassen auf jeden Fall weitere Untersuchungen (Kongruenztests) notwendig erscheinen sowohl in ähnlich als auch in unterschiedlich strukturierten Gemeinden. Neben der Sichtbarkeit können auch noch andere Faktoren, etwa kulturelle Variablen (amerikanische bzw. deutsche Einstellung zu Konflikten in Gemeinden) den Grad der Überschneidung bei den drei Grundtechniken beeinflussen. Möglich ist auch, daß sich strukturelle Anwendungsbedingungen der Forschungstechniken entdecken lassen. Das wird z.B. besonders deutlich bei der Entscheidungstechnik, die geradezu auf die Sichtbarkeit in der Austragung von gemeindlichen Konflikten "angewiesen" ist. Berücksichtigt man strukturelle Erklärungen und strukturelle Anwendungsbedingungen, stellen ferner die angewandten Identifizierungstechniken unabhängige Operationalisierungen des lokalen Einflusses dar, dann bedeutet Kongruenz gleichzeitig Substituierbarkeit von Identifizierungstechniken. Kann der inkongruente Rest vernachlässigt werden — davon kann weder bei Brinkmann noch bei Freeman u.a. die Rede sein - so wird man auf diejenige Technik verzichten können, deren Einsatz am aufwendigsten ist. Das ist im Kongruenz- und Zweifelsfalle primär die " e c h t e " Entscheidungstechnik. 3 . Struktur oder Artefakt? Die Studie von BRINKMANN ( 1 9 6 8 ) weist auf eine grundlegende Diskussion hin. Wir finden in der Untersuchung der westfälischen Gemeinden sowohl theoretisch erklärte Ergebnisse als auch ein methodisches Artefakt (die weitgehende Identität von Reputations- und Entscheidungstechnik in Bremen). Waltons Analyse läßt es fraglich erscheinen, ob der Versuch, lokale Machtstrukturen struktu-
6. Kapitel: Methoden zur Identifizierung von Eliten
173
rell oder substantiell zu erklären, in den bisherigen Einzelfallstudien gelungen ist (WALTON, 1966). Seine Sekundäranalyse von 33 Studien, in denen 41 Gemeinden untersucht wurden, ergibt, daß die Untersuchungsergebnisse zu einem Großteil als Artefakt der eingesetzten Technik anzusehen sind (Darstellung 5). Daneben enthalten die 33 analysierten Studien j e d o c h auch A n h a l t s p u n k t e für strukturelle Erklärungen der Machtverhältnisse.
F o r m der M a c h t s t r u k t u r
Technik Reputation Entscheidung
pyramidenförmig (oligar-
parteiförmig 1 )
koalitionsförmig oder amorph 2 )
Anzahl der Gemeinden insgesamt
13
7
7
27
2
4
8
14
15
11
15
41
' ) "fractional", d.h. e s gibt mindestens z w e i dauerhafte Parteigruppierungen 2
) Koalitionsförmige und amorphe Machtstrukturen sind wegen ihrer geringen Anzahl z u s a m m e n gefaßt. Dies erscheint vertretbar, da in beiden Fällen eine Konzentration der Macht nicht b e s t e h t .
Darstellung 5: Form d e r gemeindlichen M a c h t s t r u k t u r und Art der eingesetzten Forschungstechnik (Quelle: WALTON 1966, S. 4 3 6 )
Bei Einsatz der Reputationstechnik ist eine oligarchische M a c h t s t r u k t u r als Ergebnis wahrscheinlicher als eine pluralistische Machtstruktur. Bei Einsatz der Entscheidungstechnik ist es umgekehrt wahrscheinlicher, daß eine pluralistische F o r m der Einflußverteilung identifiziert wird. Dies gilt ungeachtet struktureller Unterschiede der Untersuchungsgemeinden. Welcher Ansatz ist d e r "richtige"? Läßt sich hierüber schon etwas sagen? Die Artefakt-Hypothese wird von Waltons Analyse bestätigt. Sie kann aber nicht generell gelten, da die bisher durchgeführten Einzelfallstudien keine repräsentative Auswahl von Gemeinden darstellen. Repräsentativität ist aber unerläßlich, soll die Artefakt-These statistisch streng getestet werden. Die Sekundäranalyse von Walton kann den Anspruch eines solchen Tests nicht erfüllen. Sie zeigt eher die Tendenz der bisherigen Forschungsarbeiten auf. Sollte sich die Artefakt-Hypothese j e d o c h auch u n t e r strengeren Testbedingungen bewähren, sollte also allgemein gelten, daß sich der Gemeindeforscher im Forschungsprozeß seine eigene Realität schafft, so ließe sich daraus lediglich folgern, d a ß die eingesetzten Identifizierungstechniken u n b r a u c h b a r sind. Die "Substanz oder A r t e f a k t " Fragestellung weist in jedem Falle auf die Notwendigkeit methodischer Forschung, d.h. Verläßlichkeitsforschung hin.
174
4. Band: Erhebungsmethoden: Die Befragung
6.5
Gültigkeit
1. Voraussetzungen eines Gültigkeitstests. Nach der formellen Genauigkeit des Messens interessiert die materielle Richtigkeit der Ergebnisse, d.h. die Richtigkeit der Information über gemeindliche Machtstrukturen. Die Diskussion war gerade im Hinblick auf die Gültigkeit der Techniken lokaler Eliteforschung von einem Mißverständnis geprägt. Fast das einzige Kriterium für die Gültigkeit lieferte das vorwissenschaftliche Verständnis der Forscher vom demokratischen oder vom oligarchischen Charakter amerikanischer Gemeinden. Bei denjenigen, die das demokratische Credo verinnerlicht haben, löst der Nachweis oligarchischer Machtstrukturen in der "civic culture" amerikanischer Gemeinden kognitive Dissonanz aus. Die Frage der Gültigkeit ist also untrennbar verbunden mit der Power Elite-Kontroverse. Das vorwissenschaftliche Verständnis allein und zudem in " R o h f o r m " reicht aber nicht aus, um die Gültigkeit zu testen. Von den bisher vorliegenden Untersuchungen über Machtstrukturen im lokalen Bereich kann kaum eine den Anspruch erheben, die Gültigkeit der Techniken zur Identifizierung lokaler Eliten empirisch zu belegen. Hierzu fehlen ganz einfach die notwendigen Voraussetzungen. Eine erste wesentliche Voraussetzung besteht darin, daß falsifizierbare generelle Hypothesen entwickelt werden, d.h. daß wissenschaftliche Behauptungen zur Erklärung gemeindlicher Machtstrukturen vorliegen. Solch ein theoretischer Ansatz findet sich z.B. bei CLARK (1965). Er entwickelt 3 4 nomologische Hypothesen, die zum Teil aus einer Synthese und aus einer Generalisierung bisheriger Forschungsergebnisse entstanden sind. Abhängige Variablen (und das ist sicherlich nur eine mögliche abhängige Variable) ist die F o r m der lokalen Machtstruktur, die vorsichtig als ein Kontinuum von Oligarchie und Pluralismus charakterisiert wird. Alternative Klassifikationen der abhängigen Variablen " F o r m der lokalen Machtstruktur" finden sich auch bei anderen Autoren (vgl. z.B. Rossi 1960). Bei den unabhängigen Variablen unterscheidet Clark demographische, kulturelle, rechtlich-politische und ökonomische Variablen. Hinzu kommen noch Variablen wie politische Parteien und Organisationen auf freiwilliger Basis. Die Hypothesensammlung von Clark gibt somit ein Beispiel für eine empirische Auflösung der Power Elite-Kontroverse, d.h. für eine empirische Beantwortung der Frage, unter welchen Bedingungen amerikanische Gemeinden oder Gemeinden ganz allgemein oligarchisch bzw. pluralistisch strukturiert sind. Der oben beschriebene Versuch einer Theoriebildung ist später noch weiter entwickelt worden ( C L A R K 1968). Dieses Arsenal von generellen Hypothesen erfüllt die erste Bedingung für einen Gültigkeitstest der Techniken lokaler Eliteforschung. Ein grundsätzlich anderer Erklärungsansatz ist im Rahmen der Cambridge-Studie aufgestellt worden (SCHEUCH U.A. 1965; GORDON 1965). Zunächst besteht dieser Ansatz nur in einer dimensionalen Analyse verbunden mit einem Programm oder mit einer Strategie der Theoriebildung. Die Forscher entscheiden sich für eine "Prozeßorientierung". Das heißt: der Entscheidungsprozeß wird als ein allgemeiner Prozeß gesehen, der vielen Institutionen gemeinsam ist, nicht nur als ein Prozeß in Gemeinden ("creating a model of decision-making as a general process common to many institutions"). Vorbereitend für die Theoriebildung ist die Entwicklung der relevanten Dimensionen
6. Kapitel: Methoden zur Identifizierung von Eliten
175
des Entscheidungsprozesses. Dabei handelt es sich 1. um eine Sequenz von Phasen und Stufen im Entscheidungsprozeß, 2. um die Eigenschaften von Streitfragen ("issues"), 3. um soziale Rollen, die im Prozeß relevant sind, und 4. um die persönlichen Merkmale der Inhaber entscheidungsrelevanter Positionen. Die Strategie der Theoriebildung besteht darin, die vier Dimensionen hypothetisch miteinander zu verknüpfen. Ein Beispiel für eine prozeßorientierte Hypothesenbildung gibt BOLAN (1969), der den aus der Cambridge-Studie bekannten Elementen (Prozeßstufen und -rollen, Attribute von Streitfragen) zwei neue Elemente, "Kennzeichen des Entscheidungsfelds" und "Planungs- und Aktionsstrategien", hinzufugt. Das Ergebnis eines Entscheidungsprozesses ist dann abhängig von der jeweiligen Konstellation der genannten Elemente, wofür Bolan drei Beispiele anführt. Er formuliert eine Reihe von Hypothesen über den Einfluß des Entscheidungsfelds, der Planungsstrategien und der Attribute von Streitfragen auf das Ergebnis des Entscheidungsprozesses. Diese Hypothesen enthalten gleichzeitig eine gewisse Synthese des bisher in verschiedenen Untersuchungen gewonnenen Wissens. Einen wichtigen Beitrag zur Theoriebildung liefert auch COLEMAN (1957), der ein Forschungsprogramm entwirft, das in manchen Punkten den skizzierten Ansätzen ähnlich ist. 2. Überprüfung. Ist die Hypothesenbildung nun wie bei Clark oder Bolan schon abgeschlossen, so bieten sich folgende Möglichkeiten, die Techniken lokaler Eliteforschung einem Gültigkeitstest zu unterziehen: eine Uberprüfung der Hypothesen, ihre Verwendung zur Prognose und schließlich ihre Verwendung zur Kontrolle der Realität (Sozialtechnik). Eine Überprüfung setzt zunächst einmal geeignete Testbedingungen voraus. Für den Clarkschen Ansatz werden verschiedene Gemeinden in unterschiedlichen geographischen und zeitlichen Räumen benötigt (intra- und interkultureller Gemeindevergleich, siehe auch CLARK 1968). Eine Prüfung des in Cambridge entwickelten Ansatzes (Harvard-Modell) bzw. des Bolan-Ansatzes hingegen setzt eine Selektion von Entscheidungsprozessen aus verschiedenen Institutionen (z.B. Haushalten, Unternehmungen usw.) sowie aus verschiedenen Gemeinden voraus, wiederum nach Raum-Zeitgebieten gestreut. Im Ansatz sprengt dieses Modell den Rahmen der Gemeinde. Die Methoden zur Identifizierung von Eliten erhalten dadurch wieder ihre ursprüngliche, weitere Bedeutung, die durch die Hochkonjunktur in der Soziologie lokaler Machtstrukturen etwas verdrängt worden ist. 3. Prognose. Was die Überprüfung allgemein b e t r i f f t , so ist sie bisher weitgehend im Programmatischen stecken geblieben. Günstiger liegen die Dinge bei der Prognose. Der Ansatz von Miller, Form und Hanson (HANSON 1959; MILLER 1957; 1962; RJRM UND SAUER 1961) gibt ein Beispiel für einen erfolgreichen Gültigkeitstest der Reputationstechnik (Vorhersage-Gültigkeit). Die Autoren behaupten, daß die Entscheidung über eine allgemeine Streitfrage (das ist z.B. eine Streitfrage, über die durch ein Referendum entschieden wird) vom Zusammenspiel dreier Faktoren abhängt, die mit Hilfe der Reputationstechnik gemessen werden: 1. die kritisch aktivierten Teile der institutionellen Machtstruktur ( " t h e critically activated parts of the institutional power structure"), 2. der Grad der Strukturiertheit der oppositionellen Gruppen ( " t h e po-
176
4. Band: Erhebungsmethoden:
Die
Befragung
wer arrangement of the community power complex") und 3. die Solidarität und Aktivität der Führungsspitzen ("top influential solidarity and activity"). Auf der Basis ihrer Informationen über diese drei Faktoren gelingt es, die Ergebnisse zweier Referenden in Seattle und in Denver richtig vorherzusagen. Im zweiten Falle wird sogar das Verhältnis der Ja- zu den Nein-Stimmen annähernd richtig prognostiziert. MILLER ( 1 9 6 2 ) berichtet über einen dritten erfolgreichen Anwendungsfall des Prognosemodells: den Streit um ein Stadtemeuerungsprojekt in einer kleinen amerikanischen Universitätsstadt. 4. Kontrolle (Sozialtechnik). Folgt man der Devise "savoir pour prévoir, et prévoir pour agir", so zeigt sich in besonders deutlicher Weise, was der Forscher zuverlässig über lokale Machtstrukturen weiß bzw. wie gültig seine Techniken zur Identifizierung lokaler Eliten sind. Wissen über lokale Eliten kann auch sozialtechnisch, im Sinne eines "piecemeal social engineering" verwendet werden. So ist z.B. die Zustimmung lokaler Eliten zu einem Regional- oder Stadtplan sowie die Mitarbeit dieser Gruppen an der Planung eine notwendige, wenn auch nicht hinreichende Bedingung für einen Planungserfolg. Informationen über Entscheidungsprozesse bilden aber nicht nur einen wesentlichen soziologischen Bestandteil der Regional- und Stadtplanung (DREWE 1968b; 1971), sondern in zunehmendem Maße auch allgemein für die Planung sozialen Wandels in den verschiedensten Bereichen und auf den verschiedensten Entscheidungsebenen (BENNIS U.A. 1969). Der Einsatz der Methoden zur Identifizierung von Eliten für praktischen Zwecke ist bisher in den USA am weitesten fortgeschritten. Inwieweit solche Forschungen als wissenschaftlicher Gültigkeitstest angesehen werden können, ist allerdings unterschiedlich. Auf der einen Seite finden wir Studien, die mehr oder weniger auf eine individuelle Beratung einzelner Gemeinden abzielen (SCHEUCH 1965; SALISBURY 1964; ELAZAR 1961). Daneben gilt es aber auch Untersuchungen, in denen man Vergleiche verschiedener Gebiete anstellt und aus einer Reihe von Einzelfallen verallgemeinert (ADVISORY COMMISSION ON INTERGOVERNMENTAL RELATIONS 1962). Hawley schließlich testet eine Hypothese über den Zusammenhang zwischen lokaler Machtkonzentration und dem Erfolg von Stadtsanierungsprojekten (HAWLEY 1962). In Europa ist man dieser Hinsicht bisher über Vorstudien mehr beschreibenden Charakters noch nicht hinausgelangt (DREWE 1968a; 1970). Immerhin hat hier der sozialtechnische Einsatz der Methoden zur Identifizierung von Eliten die Rezeption dieser amerikanischen Forschungsrichtung miteingeleitet. Die Literatur über Methoden zur Identifizierung von Eliten (vor allem in Kontext der Gemeinde) ist inzwischen stark angewachsen. Allein in der Zeit von 1950 bis 1 9 6 1 sind etwa 1 6 0 Artikel und 1 1 0 Bücher erschienen (PRESS 1 9 6 2 ) . Diese Fülle an Material kann aber nicht darüber hinwegtäuschen, daß noch vieles zu tun bleibt. Zuverlässigkeit und Gültigkeit der Identifizierungstechniken bilden die beiden eng verbundenen Arbeitsfelder.
6. Kapitel: Methoden zur Identifizierung von Eliten
177
Literatur Factors Affecting Voter Reactions to Government Reorganization in Metropolitan Areas, Washington 1962.
ADVISORY COMMISSION ON INTERGOVERNMENTAL RELATIONS,
Α., Eliten und Entscheidungen in Stadtgemeinden. Die Amerikanische "Community Power"-Forschung und das Problem ihrer Rezeption in Deutschland, Berlin 1967.
AMMON,
BENNIS,
W. G„ U.A. (Hrsg.), The Planning of Change, New York 2. Aufl. 1969.
R. S., Community Decision Behavior: The Culture of Planning, in: Journal of the American Institute of Planners 35, 1969,S.301 - 3 1 0 . BONJEAN, C . M . UND L. F. CARTER, Legitimacy and Visibility of Leadership Structures Related to Four Community Systems, in: Pacific Sociological Review 8, 1965, S. 16 - 20. BOLAN,
D. Α., UND C . R . ADRIAN, Simplifying the Discovery of Elites, in: American Behavioral Scientist 1961, S. 1 4 - 1 6 .
BOOTH,
Was messen die verschiedenen Methoden zur Ermittlung lokaler Machtstrukturen? Eine vergleichende Untersuchung im Gemeindeverband Amt Bremen, unveröffentl. Diplomarbeit, Köln 1968. CLARK, Τ. N., Who Governs, Where, and When? Páper presented at the Annual Meeting of the American Sociological Association, Chicago 1965. BRINKMANN, F . ,
Community Structure and Decision-Making: Comparative Analysis, San Francisco 1968.
CLARK, T . N . ,
COLEMAN,
J. S., Community Conflict, New York 1957.
R. M., Report on Project GA SS 5899, vervielfältigtes Manuskript, Harvard University 1963. D A H L , R . Α . , A Critique of the Ruling Elite Model, in: American Political Science Review 52, 1958, S. 463 - 469.
CRAMER,
R. Α., Who Governs? Democracy and Power in an American City, New Haven/ London 1961.
DAHL,
DAHL, R . Α . ,
Modern Political Analysis, Englewood Cliffs
1963.
Soziale Klassen und Klassenkonflikt in der industriellen Gesellschaft, Stuttgart 1957.
DAHRENDORF, R . ,
H. J . EHRLICH (Hrsg.), Power and Democracy in America, Notre Dame 1961. D'ANTONIO, W . V . , U N D E . C. ERICKSON, The Reputational Technique as Measure of Community Power. An Evaluation Based on Comparative and Longitudinal Studies in: American Sociological Review 27, 1962, S. 362 — 376.
D'ANTONIO, W . V . , UND
Ein Beitrag der Sozialforschung zur Regional und Stadtplanung, Meisenheim 1968a.
DREWE, P . ,
P., Sozialwissenschaftliche Aspekte der Stadtentwicklung, in: Amt für Statistik und Wahlen Leverkusen (Hrsg.), Urbanität - Plan oder Zufall? Beiträge zur Stadtforschung 3, 1968b, S. 9 - 47.
DREWE,
178
4. Band: Erhebungsmethoden: Die Befragung
Großräumige Monostrukturen im Raum Twente-Oost Gelderland-Westmiinsterland, in: Zeitschrift für Allgemeine und Textile Marktwirtschaft 2, 1970, S. 139 - 157.
DREWE, P . ,
P., Regionale Politiek als Sociale Planning, in: L. H. KLAASEN (Hrsg.), Het Ruimtelijke Element in de Economie, Groningen 1971.
DREWE,
ELAZAR.D. J., A Case Study of Failure in Attempted Metropolitan Integration: Nashville and Davidson County, Tennessee, Chicago 1961. FORM, W . H . , UND W .
L.
SAUER,
Community Influential in a Middle-Sized City, East
Lansing 1961. FREEMAN, L. C. U.A., Local Community Leadership, Syracuse 1960. FREEMAN, L. C. U.A., Further Analyses from the Syracuse Study of Local Community Leadership, Syracuse 1962. FREEMAN, L. C. U.A., Locating Leaders in Communities: A Comparison of Some Alternative Approaches, in: American Sociological Review 28, 1963, S. 791 — 798. A General Theory of Polarized Development, University of California Los Angeles, School of Architecture and Urban Planning 1969 mimeo.
FRIEDMANN, J . ,
GORDON, C., Analyzing Community Action through Use of the Harvard Model of Political Decision-Making Processes, Harvard University 1965 mimeo. HANSON, R. C., Predicting a Community Decision: A Test of the Miller-Form Theory, in: American Sociological Review 24, 1959, S. 662 — 671. Community Powerand Urban Renewall Succès, in: American Journal of Sociology 68, 1962, S. 422 - 431.
HAWLEY, Α . Η . ,
HUNTER, F., Community Power Structure, A Study of Decision-Makers, Chapel Hill 1953. HUNTER, F . ,
Top Leadership,
U.S.A.,
Chapel Hill
1959.
IBLHER.P., Hauptstadt oder Hauptstädte? Die Machtverteilung zwischen den Großstädten der BRD, Opladen 1970. JENNINGS, Μ . Κ . ,
Community Influentials. The Elites of Atlanta, London
1964.
KATZ, Ε. UNDP. F. LAZARSFELD, Personal Influence. The Part Played by People in the Flow of Mass Communications, Glencoe 1964, zuerst 1955. R., Gemeinde, in: R. KÖNIG (Hrsg.), Handbuch der empirischen Sozialforschung, Bd. I, Stuttgart 2. Aufl. 1967, S. 763 - 772.
KÖNIG,
LASSWELL, H . D . , D . LERNER U N D E .
C.
ROTHWELL,
The Comparative Study of Elites,
Stanford 1952. LERNER, D., Interviewing European Elites, in: Polls 2, 1966, S. 1 - 7. LIPSET,
S.
M., M.
A.
TROWUND J .
S.
COLEMAN,
Union Democracy, Glencoe
1956.
S., UND H . M. LYND, Middletown, A Study in Contemporary American Culture, New York 1929.
LYND, R .
LYND, R. S., UND Η. M. LYND, Middletown in Transition. A Study in Cultural Conflict, New York 1937.
6. Kapitel: Methoden zur Identifizierung von Eliten
MICHELS, R . ,
179
Soziologie des Parteiwesens, Stuttgart 1957.
MILLER, D. C., The Prediction of Issue Outcome in Community Decision-Making, in: Proceedings of the Pacific Sociological Society 1957, S. 137 - 147. MILLER,D. C., Town and Gown, The Power Structure of a University Town, in: American Journal of Sociology 68, 1962, S. 432 - 443. MILLS, C. W., The Power Elite, New York 1964. W., The Structure of Power in American Society, in: The British Journal of Sociology 19, 1958, S. 29 - 41.
MILLS, C .
NATIONAL COMMISSION ON COMMUNITY HEALTH SERVICES
(Hrsg.), Process Analysis,
Bethesda 1964 mimeo. R. L., E. K. SCHEUCH UND C. GORDON, The Structure of Influence, Revision of a Paper first Presented at the Eastern Sociological Society's Annual Meeting, New York 1965.
NUTTALL,
POLSBY, N . W . , R . E . WOLFINGER, W . C . D'ANTONIO, H . J . EHRLICH UND E . C . ERICKSON,
Discussion ,in: American Sociological Review 27, 1962, S. 838. PRESS, C., Main Street Politics. Policy Making at the Local Level, East Lansing 1962. ROSSI, P. H., Power and Community Structure, in: Midwest Journal of Political Science 4, 1960, S. 390 - 4 0 1 . SALISBURY, R. H., Governmental, Reorganization: Prospects for Action, Hartford 1964. SCHEUCH, Ε . Κ . ,
Power and Decision-Making in Greater Hartford, Hartford
1965.
Ε. Κ., R. L. NUTTALL UND C. GORDON, A Process Approach to Metropolitan Decision-Making Paper presented at the Annual Meeting of the Eastern American Sociological Society, Boston 1965.
SCHEUCH,
STEWARD, E., A Sociometric Study of Influence in Southtown, in: Sociometry 10, 1957, S. 11 —31 und S. 273 - 286. STOUFFER.S. Α., Communism, Conformity and Civil Liberties, New York 1955. WALTON, J., Substance and Artifact: The Current Status of Research on Community Power Structure, in: American Journal of Sociology 71, 1966, S. 430 - 438. ZAPF, W. (Hrsg.), Beiträge zur Analyse der deutschen Oberschicht, München 2. erw. Aufl. 1965a. ZAPF, W., Wandlungen der deutschen Elite, Ein Zirkulationsmodell deutscher Führungsgruppen 1919 - 1961, München 1965b. ZETTERBERG, H. L., On Theory and Verification in Sociology, Totowa 3. Aufl. 1965.
Namenregister
Abrams, M. 17 Adams, J. M. 119,123 Adams, S. J. 88, 102 Adina, R. 146 Adorno, T.W. 127 Adrian, C. R. 171 Agisim, P. 146,149,151,152, 152, 154, 155 Albert, H. 28,30 Ammon, A. 163 Anastasi, A. 14 Anderson, R. B. 121,122 Anger, H. 1 2 , 1 3 , 2 5 , 4 0 , 4 4 , 4 5 , 4 9 , 5 1 , 5 3 , 55,59, 62, 84, 125 Arnold, W. E. 50 Assael, H. 17 Athey, K. R. 120 Atkinson, J. W. 14 Atteslander, P. 3 2 , 4 4 , 6 2 Axelrod, M. 71,94, 118 Aylward, M. 123 Back, K. W. 115, 123, 124 Badenhorst, L. T. 119 Baker, K. H. 99 Balan, J. 51 Ball, J.C. 125 Balter, M.B. 125 Bancroft, G. 55,126 Banks, J. Α. 17 Banta, T. J. 128 Barnes, Ε. H. 127 Barnette, W. 159 Barton, Α. H. 26,36 Bass, Β. M. 127,128 Bauer, R. Κ. 148 Baur.E. J. 146,156 Bebbington, A. C. 115 Becker, Η. S. 130 Becker, S. L. 49 Bell, C.G. 125 Belser, H. 68
Bern, D. J. 32 Bennett, A. S. 86 Benney, M. 18,93,100,115, 118, 120 Benninghaus, H. 125 Bennis, W. G. 176 Bensman, J. 115,118 Benson, L. E. 121 Benson, S. 115 Berelson, B. R. 115,117 Berg, I.A. 1 4 , 1 2 6 , 1 2 7 , 1 2 8 Bergen, A. van 97 Berk, R. A. 119,123 Bernberg, R. E. 14 Bernstein, B. 122 Bevis, J. C. 151 Biddle, B. 30 Bingham, W. 13 Bird, K. 147,149 Birnbaum, Z. P. 110 Blaine, H. R. 116 Blalock, H. M. 67,69 Blanc, H. 119,122 Blau, P. M. 27,29 Blauner, R. 30 Blum, M. L. 8 4 , 8 5 Blumer, H. 131 Bock, R. D. 127 Boek.W. 151 Boetticher, K. W. 57 Bogart, L. 123 Bolan, R. S. 175 Bonjean, C. M. 14, 27, 36, 172 Booman, W. P. 115 Booth, D. A. 171 Borkenfeld, H. 71 Borus, M. E. 125 Bosley, J. H. 128 Bower, G. H. 63 Boyd, R. W. 103, 153 Braaten, K. 78,138 Bracey, H. E. 119
Braun, S. 58 Bressler, M. 150 Bright, M. 17 Brinkmann, F. 169,171,172 Britt, S. H. 116,156 Brown, D. R. 121,125,129 Brown, M. 91f. Brown, R.W. 99 Brunner, G. Α. 114,115 Buchanan,W. 125 Bücher, R. 72 Bugental, J. F. 85 Butler, E.W. 115,124 Cahalan, D. 120,125 Campbell, A. 18 Campbell, D. T. 1 4 , 2 3 , 4 8 , 110,120,127,128 Canne 11, C. F. 1 3 , 1 5 , 1 7 , 3 9 , 41,42,43,46,47,48,51, 53, 5 5 , 6 5 , 7 0 , 7 1 , 8 3 , 8 4 , 8 5 , 8 6 , 8 7 , 9 4 , 100,118, 119,125 Cantril,H. 13, 53f, 61, 88, 90 Caplovitz, D. 126 Caplow, T. 1 8 , 6 3 , 1 1 5 , 1 1 8 Carnap, R. 2 6 , 3 0 , 6 7 Caro, F. G. 74 Carr, L. G. 108,123,127, 129 Carroll, J . B . 121,122 Carroll, S. J. Jr. 114,115 Carter, L. F. 172 Cartwright, Α. 114,115 Casagrande, J. Β. 121,122 Cassidy, S.W. 119 Cattell, R. B. 27 Catton, W. R. Jr. 116 Champion, D. J. 74 Chapman, L . J . 127,128 Chapoulie, J . M . 38 Chappie, A. W. 149
182
Namenregister
Christie, R. 127, 128 Cicourel, Α. V. 63 Cisin, I. Η. 125 Clancy Κ. J. 126 Clark, Κ. E. 115 Clark, J. P. 64,71, 125 Clark, Τ. Ν. 163,174,175 Clausen, A. R. 125,126 Clausen, J. Α. 149,152,155, 156 Clinard, Μ. Β. 30 Cloud, J. 127,128 Cochran, W. G. 18,117 Cohn, T. S. 127 Coleman, J. E. 129 Coleman, J. S. 2 6 , 3 5 , 1 6 7 , 175 Colombotos, D. 120 Converse, J. M. 90, 120 Coombs, C. H. 48, 52, 68 Coombs, L. 17 Corbin, H. H. Jr. 125 Corem, S. M. 121 Corlett, T. 147,152 Cornfield, J. 112 Costner, H. L. 69 Couch, H . A . 128 Cox, E. 146, 153, 154, 155 Cramer, R. M. 167 Crane, W. W. 119,124 Crespi, L. P. 65,93, 119, 120 Cronbach, L. J. 1 4 , 2 8 , 1 2 7 Crossley, H. M. 113,114,125 Crowne, D. P. 120,127 Curtis, R. F. 69
Dunette, M. D. 123,124 Durbin, J. 91, 115 Dvorak, Β. J. 95 EastlackJ. O. 17 Edgerton, H . A . 116,156 Edsall, R. L. 156 Edwards, A. L. 55, 127, 128 Ehrlich, H. 2 7 , 1 6 2 Ehrlich, J. S. 120 Elazar, D. J. 176 ElinsonJ. 121 Ellis, A. 121, 157 Ellis, R. S. 127 Enoch, J. R. 43 Entwisle, D. R. 120 Erbslöh, E. 90 Erdos, P. L. 146,150 Erickson, E. C. 163,171 Evans, F. 86
Fritz, C. E. 73 Fuchs, W. 109 Fiirnschuss, G. 48, 70 Fuhrmann, J. 58
Gage, N. L. 128 Gallup, G. H. 1 0 , 1 3 , 4 5 , 4 6 , 114 Gattung, J. 3 3 , 3 6 , 4 4 , 6 2 , 65 Gaudet, H. 115,116 Geiger, T. 37 Geismar, L. L.119 Gerberich, J. B. 121 Gergen, K. 115,123,124 Getzels, J. W. 18,71 Giglioli, P. P. 53 Ginsburg, G. P. 78, 138 Gleicher, D. B. 125 Glenn, N.D. 123,124 Gleser, G. C. 74,80 FeinE. 122 Glock, C. Y. 116 Feldt, A. 113, 115, 116 Glücksberg, S. 55 Ferber, R. 116,123,124, Gold, D. 17 125,155 Goldman, E. F. 118 Ferris, A. L. 116, 149, 151,152 Goldsen, R. K. 141 Festinger, L. 33, 97 Goldstein, H. 152 Field, J.B. 99 Goldthorpe, J. E. 119 Fink, R. 113, 114 Gollob, H. F. 53 Fischer,G. H. 3 5 , 3 7 , 6 8 Goode, W. J. 42 Fishburn, P. C. 35 Görden, R.L. 18, 46,47, 48, 62 Fisher, H. 97 Gordon, C. 164, 174 Fisher, R. F. 121 Gordon, G. 116 Fishman, J. A. 53 Gotion, N. G. 17 Fiske, D. W. 48 Cough, H. G. 127 Flament, C. 61 Gould, L. C. 125 Fletcher, C. 28 Dahl, R. A. 162,164 Gray, P. G. 147, 152, 155 Flugel, J. C. 83 Dahrendorf, R. 29, 167 Greenberg, A. 157 Ford, N.M. 150 Damarin, F. 34, 127 Greenberg, M. S. 32 Ford, R. N. 149,152,155, Danehy, J. J. 23 Greenblatt, M. 103 156 D'Antonio, W. V. 162, 163, Greenspoon, J. T. 100 171 Grigg, A. E. 128 Form, W. H. 163,175 Datta, L. E. 127, 129 Gross, N. 29 Foster, R. F. 128 David, M. 126 Guest, L. 84, 88, 94, 95, 96 Fowler, F. J. 17,87,125 Davidson, H. H. 115 Gullahorn, J. E. 152 Fox, F. L. 103 Dean, D. 30 Gullahorn, J. T. 152 Franzen, R. 155 De Fleur, M. 36, 70, 125 Frazier, G. 147,149 Deming, W. E. 110,114 Freedman, J. L. 32 Haberman, P. W. 125 De Soto, C. Β. 128 Freedman, R. 17 Haeberlin, U. 55 Deutscher, I. 119,121,122 Freeman, D. M. 135 Haedrich, G. 13,50, 87,97, Dexter, L. Α. 118 Freeman, L. C. 163, 164, 98, 102 Dickson, W.J. 119 168,169, 170, 171 Hagburg, E. C. 125 Dillehay, R. C. 58 Frenkel-Brunswik, E. 129 Haines, V.T. 121 Dimasco, A. 83 Freud, S. 10, 14 Hambright, T. Z. 125 Dodd.S. C. 125 Frey, F. W. 119 Hammonds, A. P. 120, 125 f., Dohrenwend, B. P. 115,120, Fricke, B. G. 127 Hansen, D. A. 27 125 Friedman, J. 163 Hanson, R. C. 163, 167, 175 Harding, J. 115 Dohrenwend, B. S. 13, 17, 19, Friedman, N. 135 Hare, P. 129 42, 50, 115, 120, 125, 129 Friedman, P. 99 Friedrich, W. 28,71 Hare, R. D. 120 Dollard, J. 134 Friendly, M. L. 55 Hartmann, E. L. 71, 119 Donald, M. H. 116 Frisbie, B. 51 Hartmann, H. 24, 69 Drewe, P. 163,168,176
Namenregister
Hathaway, S. R. 127 Hatt, P. K. 42, 118 Hauck, M. 37 Havel, J. 127, 128 Havighurst, R. 117 Hawley, Α. H. 176 Hax, H. 128 Hayes, D. P. 3 0 , 4 8 Head, Κ. Β. 80 Heider, F. 33, 53 Heise, D. R. 26, 53 Heiss, R. 14 Hempel, C. G. 55 Heneman, H. G. 115 Hennig, W. 41,42, 4 4 , 4 6 , 4 7 Herrmann, T. 53 Hess, Ε. M. 57,61 Hess, I. 114 Hicks, L. E. 52 Highmann, A. 156 Hildum, D. C. 99 Hilgard, E. R. 63, 113 Hill, R. 27 Hill, R. J. 14, 36, 70, 125 Himmelfarb, S. 35 Himmelstrand, U. 36, 70 Hirschi, T. 35, 67 Hochstim, J. R. 126 Hockett, C. F. 23 Hodge, R. W. 69 Hoffer, C. R. 136 Hoffman, Ν. V. 119 Hoffmann-Nowotny H. J. 115 Hofstätter, P. R. 13 Hofstein, S. 120 Holm, Κ. 35, 37,79, 105 Hopkins, T. 77 Hovland, C. I. 28 Hübner, Κ. 79, 105 Hughes, E. C. 118 Hull, C. L. 83 Hunt, W. H. 119,124 Hunter, F. 162, 163 Hyman, H. H. 13, 19, 32,71, 84, 86, 8 7 , 8 8 , 9 0 , 9 1 , 9 3 , 9 5 , 9 6 , 97,98, 100, 102, 108, 111, 115, 118,120, 125 Iblher, P. 163 Irish, D. P. 71 Isaacson, H. L. 76, 119 Jackson, D. N. 128 Jackson, E. F. 69 Jenkins, J. G. 50, 125 Jennings, M. K. 170 Jernigan, L. R. 58 Jones, E. L. 119 Josephson, E. 137 Judd, R. C. 17 Jurgell, C. M. 76,119
Kahn, R. L. 13, 1 5 , 3 9 , 4 1 , 4 2 , 43,46,47,48,51,53,55, 6 5 , 7 0 , 8 4 , 8 6 , 8 7 , 116, 119 Katz, D. 104, 116, 120 Katz, E. 168 Kellermann, P. 36 Kelman, H. C. 32 Keniston, K. 128 Kephart, W. M. 150 Kincaid, H. V. 17 Kinsey A. C. 63, 108, 117,118 Kish, L. 114 Kitt, A. S. 125 Klein, D. 13, 19, 42, 50 Knudsen, D. D. 71 Knupfer, G. 124 König, R. 13, 25, 163, 168 Koolwijk, J. van 19,42f, 71, 118, 123, 124 Koomen,W. 71, 121 Kornhauser, A. 3 2 , 4 8 Korte, W. 53 Krasner, L. 100 Kreutz, H. 32, 36, 37, 39,44, 48, 54, 55, 57, 59, 63, 65, 7 0 , 7 1 , 107 Kroll, Β. H. 152 Kruglov, L. P. 115 Kuethe, J. L. 128 Kuhn, M. H. 138 Kunz, G. 86, 118 Labovitz, S. 56 Lade, J. H. 151 Lana, R. E. 120 Landecker, W. S. 27 Landsberger, H. A. 129 Lansing, J. B. 37, 125 LaPiere, R. T. 138 Larsen, O. N. 125, 160 Larson, R. F. 113, 116 LaSorte, M. A. 119 Lasswell, H. D. 162 Lastrucci, C. L. 70 Lauer, R. H. 70 Laurent, C. A. 151 Lawson, F. 153 Lazarsfeld, P. F. 1 8 , 2 6 , 6 9 , 116, 123, 155, 168 Leavitt, G. S. 128 Legett, J. C. 104, 108, 120, 123,127,129 Lentz.T. F. 127 Leonard, D. 14 Lerner, D. 113, 115, 119, 162 Leverkus-BrUning, I. 123, 124 Levine, S. 116 Levinson, D. J. 129 Leznoff, M. 119 Lienert, G. A. 18,68 Lindzey G. 14, 50
183
Linn, R. L. 48 Lipset, S. M. 162 Litwak, E. 3 4 , 4 9 , 57 Locke, H. J. 117 Loevinger J. 67 Lorge, I. 127 Lowe, F. E. 115 Liick, H. E. 105 Lundberg G. A. 113, 160 Lynd, H. M. 163 Lynd, R. S. 163 Maccoby E. 13,85, 113, 115 Maccoby, N. 13,85, 139 Maddox, G. L. 117 Madge, J. 112, 114, 116 Magid, F. N. 17 Maier, N. R. 15 Man field, M. N. 153, 155, 157 Mangold, W. 17, 32 Mann, F. 18, 121 Manning, P. K. 109, 119 Marks, E. S. 121 Marlowe, D. 120, 127 Marquis, K. H. 100, 125 Maslow, A. H. 117 Mason, J. M. 121 Mason, W. S. 76 Mauldin, W. P. 121 Mayer, C. S. 102, 116 Mayer, L. S. 56 Mayntz, R. 40, 46, 84, 90 Me Candless, B. 143, 153 Me Carthy P. J. 13, 112, 113, 114,115, 116 Me Cormick, T. E. 115 Me Croskey J. C. 50 Me Eachem, A. W. 76 Me Gee, R. K. 126, 127, 128 Me Kinley D. G. 29 Me Lemore, S. D. 14, 27, 36 McNemar, 13, 14, 108, 124 Me Phee, W. N. 130 Meehl, P. E. 127 Meier, H. 54 Meight, C. 103 Meissner, F. 148 Meitzer, L. 76 Mercer, J. R. 115, 124 Merton, R. Κ. 38, 71, 115, 118 Messick, S. J. 127, 128 Metzner, H. 18, 121 Michels, R. 162 Miller, D. C. 14, 36, 163, 175, 176 Miller, S. M. 124, 129 Mills, C. W. 162 Mitchell, R. E. 119, 124 Möbius, G. 4 4 , 4 7 , 48 Möhr, P. J. 48 Moore, Β. V. 13
184
Namenregister
Raatz, U. 28 Salisbury, R. H. 176 Rajaratnam, N. 28 Sanford,R. N. 129 Ralis, M. 141 Sarbin, T. R. 120 Rankin, R. E. 120 Sauer, W. L. 175 Rapaport, G. M. 128 Savells, J. 0 . 43 Ravestijn, L. van 7 1 , 1 2 1 Scott, C. 153, 116 Nagl, W. 38 Reiss, W. J. 153 Scott, W. A. 4 7 , 5 1 , 6 4 Naylor, J. C. 84, 85 Reitman, A. P. 129 Sear, A. M. 74 Nett, R. 118, 122 Renne, K. S. 126 Sechrest, L. 23 Neugarten, B. 117 Reuss, C. F. 116,156 Seeman, M. 30 Noelle, E. 13, 25,44, 4 5 , 5 9 , Rhode, S. 87, 120 Segal, Β. E. 126 62, 88, 9 0 , 9 1 , 101 Rice, S. A. 8 4 , 9 6 Seidenberg, Β. 127, 128 Norman, R. D. 116, 117, 156 Richardson, St. A. 13, 17, 19. Selvin, H. C. 35, 67 Nosanchuk, T. A. 120 Shapiro L. J. 118 Nuckols, R. C. 84, 9 5 , 1 5 7 , 1 5 8 42,50, 111,118 Sharp, H. 113, 115, 116 Nunnally, J. P. 127 Richter, H. J. 25, 4 1 , 4 2 , 4 3 , Shaw, M. E. 14, 27 Nuttall, R. L. 168 f. 44,45,53,119,146,147, Sheatsley P. Β. 13, 71, 88, 96, 156,158 O'Dell, J. W. 83 102, 114 Riecken, H. W. 120 Oevermann, U. 53, 122 Sheinberg, J. 125 Riegel, Κ. F. 32 Ofske, L. 35 Sicinski, Α. 123, 124 Riesman, D. 18, 5 7 , 7 1 , 115, Ofske, R. 35 Sidney, E. 88 120 Oldfield, R. C. 17 Siegel, P. M. 69 Riessman, F. 124, 129 Olmstedt, D. W. 98 Simmons, W. 110, 114 Rijksen, P. 97 O'Neill, H. W. 128 Sirken, M. G. 110 Rinehart, J. W. 27 Opp, Κ. D. 26 Six ti, F. 48, 53 Ring, E. 85 Oppenheim, Α. Ν. 24, 3 6 , 4 2 , 50, Robin, S. S. 150 Sjoberg, G. 71, 111, 115, 118, Robins, L. N. 115, 125 58 122 Robinson, D. 87, 120 Orne, Μ. Τ. 118, 120 Skinner, Β. F. 53 Robinson, J. A. 113 Osgood, C. E. 50, 53 Slanton, F. 161 Robinson, J. P. 27 Sletto, R. F. 1 4 8 , 1 4 9 , 1 5 3 Robinson, R. A. 146, 149, Smart, R. G. 117 Pace, C. 116 151,152,154,155 Smigel, E. 0 . 6 6 , 113, 124 Pan, J. S. 116 Robinson, W. S. 123 Smith, H. L. 9 1 , 9 7 Park, P. 30 Roche, J. H. 128 Smith, K. 121 Parra, Α. 151 Roede, H. 2 5 , 2 9 , 4 0 , 5 1 , 6 5 , 142 Sobol, M. G. 114. 116, 117 Parry, H . J . 125 Roethlisberger, F. J. 19 Solley, C. M. 128 Parten, M. 13, 17,88, 112, Rogers, C. R. 14, 108 Spence, K. W. 83 116, 149 Roghmann, K. 127, 128 Srole, L. 127 Patchen, M. 57 Rohaszky, M. 32 Suchman, E. A. 3 2 , 1 1 2 , 1 1 7 , Paterson, D. G. 115 Rokeach, M. 70, 127 153, 156 Paul, B.D. 13 Suci, G. J. 50, 53 Payne, S. L. 13, 1 9 , 4 6 , 4 8 , 5 5 , Roper, Ε. B. 123 Rorer, L. G. 127 Sudman, S. 51, 70 56, 57, 113, 124, 128 Rose, A. M. 115 Süllwold, F. 47 Peabody D. 127, 128 Sullivan, H. S. 14 Philips, D. L. 108, 121, 122, 123 Rosen, H. 123 Rosen, N. A. 117, 121 Summers, G. F. 70, 120, 125f 125, 126, 129 Rosen, R. 123 Symonds, P. M. 68 Phillips, B. S. 62 Rosenberg, M. 120 Phillips H. P. 141 Rosenmayr, L. 29 Piliarin, J. A. 32 Scharmann, T. 56 Rosenthal, R. 112,117, 120 Pittinger, R. E. 23 Schatzmann, L. 19, 122 Rosnow, R. L. 112, 117 Pölitz, A. 110, 114 Scheuch, E. K. 12, 13, 17, 18, Ross, H. L. 113, 118 Pollock, F. 17 25, 4 0 , 4 2 f , 4 4 , 4 5 , 4 6 , 48, Rossi, P. 174 Polsby, N. W. 163,164 53, 54, 55, 56, 57, 59, 62, Rothe, E. 56 Pomeroy W. B. 115 70, 83, 85,86, 88, 90, 102, Rothwell, E. C. 178 Pope, H. 71 107, 110,112, 114f, 116, Rudolph, L. 119 Pratt, R. W . I . 116 118, 120, 124, 125, 126, Rudolph, S. H. 119 Press, C. 163, 176 163,164, 169, 171, 174, Rugg, D. 53 f, 116 Prichard, S. V. 50 176, 168 Rusk, J. G. 80 Pross, H. 57 Schoefield, M. 43 Rüssel, W. Α. 50 Schuman, H. 90, 120 Schumann, Κ. F. 29 Quarantelli, E. L. 73 Schwartz, Α. 71, 115, 118 Quine, W. 28 Saavedra, Α. 129 Schwarz, R. D. 23 Sakoda, J. M. 117 Moser, C. A. 3 2 , 4 8 , 5 1 , 6 2 , 102, 116, 146 Mosteller, F. 21, 110, 117 Myers, R. J. 125
Namenregister
Schwirian, K.P. 116 Schyberger, B. W. 61 Stacker, Κ. Η. 53 Stafford, J. E. 150 Stanton, F. 99 Star, S. Α. 93, 115, 120 Steiner, J. 125 Steinkamp, S. W. 3 7 , 9 6 Stember, H. 84, 144 Stephan, F. F. 13, 112, 113, 114, 115, 116 Steward, E. 168 Stone,G. C. 128 Stouffer, S. A. 166 Strauss, A. L. 19, 122 Strauss, M. A. 27 Stroschein, F. h 1 3 , 4 4 , 4 5 , 49,62 Stuart, A. 91, 115, 116 Taffel, C. 100 Taietz, P. 71,121 Tallent, N. 153 Tang, J. 129 Tannenbaum, P. H. Taylor, J. B. 127 Terris, F. 123, 124 Thielens, W. 138
Thomas, E. J. 30 Tifft, L. L. 6 4 , 7 1 , 125 Timaeus, E. 100 Tittie, C. R. 36, 70, 125 Tobin, B. 117 Trow, M. A. 178 Tucker, W. 114, 115 Tuckey, J. W. 21, 117 Turner, R. 46 Untereiner, W. W. 122 Unterhalter, Β. 119 Uphoff, W. H. 123 Vaughan, G. M. 127, 128 Vernon, P. E. 67 Vidich, A. J. 118 Wahlke, J. C. 119, 124 Waisanen, F. B. 150 Walker, J. N. 128 Wallace, D. 116, 146, 157 Wallin, P. 116, 117 Walsh, H. R. 149 Walton, J. 173 Warburton, F. W. 27 Warner, L. G. 36, 70, 125 Wax, M. 118 Webb, E. J. 15,69, 111
Weber, M. 24, 57 Wechsler, I. R. 14 Wedell, C. 121 Weilbacher, W. M. 149 Weiss, C. H. 113, 115, 119, 123, 125, 126 Welch, Ε. H. 55 Westfall, R. 155 Westie, F. R. 125 Wicker, A. W. 36, 70, 108, 125 Williams, J. A. Jr. 90, 120 Williams, R. 113,114 Wilner, D. M. 113 Wilson, E. C. 115, 116, 119 Wilson, T. 56 Wirts, C. E. 48 Wolf, G. 76 Wolfinger, R. E. 179 Wotruba, T. R. 151 Wright, C. 32, 77 Wright, J. M. 14, 27 Wuelker, G. 145 Zajonc, R. B. 83 Zapf, W. 162, 166 Zeisel, H. 155 Zetterberg, H. L. 170
185
Sachwortregister
Anrede 52, 149 Anonymität 110, 121, 149 Antwortbereitschaft 43f„ 54, 11, 114, 151 Antwortstile 1 2 6 - 1 2 9 Auftraggebereffekt 71, 93f„ 120 Ausstrahlungseffekt 40f., 68 Auswahlverfahren 110, 112, 116, 155, 162 Befragung 9 - 20, 107 s. auch Interview - Schriftliche 121, 146- 159 Befragungsablauf 11, 17, 43f. Befragungsstudien 23 - 39 Befragter 9, 15, 19f., 83 - 85, 107 - 129 - Fehlverhalten 1 0 8 , 1 2 3 - 129 - Rolle im Interview 109 - 1 1 2 , 118ff. Begriffsklärung 2 6 - 3 0 Elitebefragung 1 6 2 - 1 7 6 Entscheidungsstudie 31 Entscheidungstechnik 164f., 169 Erhebungssituation 30, 39, 59, 70f. Erinnerungsschreiben 152f. Erreichbarkeit 1 1 0 , 1 1 2 - 1 1 4 Erwiinschheit, soziale 11, 120, 127 Experteninterview 16, 163 Falschantworten 1 2 4 - 1 2 6 Fehlerbegriff 12, 14, 70, 108 Fehlverhalten 89 - 102, 108, 123 - 129 Feldverkodung 84 Filterfrage 64, 148 Fragebogen - gegabelter 1 8 , 5 0 , 6 8 - Überprüfung von 66 - 72 Fragebogenkonstruktion 2 4 - 7 2 , 122, 147f. Frageform 4 4 f . , 4 9 - 5 3
Frageformulierung 18ff., 49 - 6 1 , 6 6 , 111, 121 Fragen - Funktion von 40, 52, 62 - 66 - geschlossene 50f., 69, 147f. - offene 5Of., 148 - persönliche 4 1 - 4 3 - retrospektive 46 - Suggestivwirkung 18,49 - Stimuluswert 19, 11 f., 128 - Trennschärfe 34 - Ungenauigkeit 55ff., 121- 123 Fragenbatterie 47 - 49 Fragenfolge 40 - 49, 66 funnelling s. Trichtern Gültigkeit 12, 14, 20,29, 38, 67,69f., 87, 121, 124f., 127, 169, 174- 176 Gruppenbefragung 17 halo-effect s. Ausstrahlungseffekt Interview s. auch Befragung - als Erhebungsinstrument 1 2 , 8 3 , 1 0 9 - 112 - als Meßinstrument 1 8 - 2 0 , 1 2 9 - als soziale Beziehung 12,19f., 83 - 85, 109ff. - Formen 15 - 18, 108, 146, 166 Intervieweffekt 111 Interviewer 8 3 - 1 0 3 - als Forschungsinstrument 85 - 89 - Beziehung zum Befragten 12, 83 - 85, 90 Interviewereinfluß 19, 86f„ 90 - 100 Interviewereinsatz 1 0 0 - 1 0 2 Interviewereinstellungen 19,84, 9 6 - 1 0 0 Interviewererfahrung 91 Interviewererwartungen 8 4 , 9 6 - 100 Interviewerfehler 7 2 , 8 6 , 8 9 - 102, 125 Interviewerkontrolle lOOff., 115
18 8
Sachwortregister
Interviewermerkmale 90 - 96 Interviewerschulung 43, 87 - 89 Kollektivinterview 17 Kontrollfrage 63f. Kosten — bei Interviewereinsatz 1 0 0 - 1 0 2 - bei Schriftlicher Befragung 146, 151,158 Listenfrage 47 - 49 Mehrfachnennung 60 Meinungslosigkeit 123f. Nichtbeantwortungsproblem 123f., 148 Nichterreichbarkeit 110, 112 - 114, 116 Operationalisierung 30ff. overreporting 126 Positionstechnik 166f., 169 Postkartentechnik 151 Projektivfrage 58 Rapport 91ff., 111 Reaktivität 111
reliability s. Zuverlässigkeit Reputationstechnik 16, 163f„ 169, 173 respondent s. Befragter response set 1 4 , 1 1 1 , 1 2 6 - 1 2 9 Rücksendequote 147, 148 - 155 social desirability s. Erwünschheit split-ballot technique 18 sponsorship bias s. Auftraggebereffekt statements 52 Tandeminterview 17 Tiefeninterview 18 Trichtern 45f. Umfrageforschung 13f. Untersuchungspopulation 30, 38f., 59, 112- 117,129, 147, 155f. validity s. Gültigkeit Verhalten, beobachtbares 36f. Verweigerung 1 1 0 , 1 1 2 , 1 1 4 - 1 1 6 , 1 2 3 Zustimmungstendenz 1 2 7 - 1 2 9 Zuverlässigkeit 12,14, 20, 38, 69, 87, 89, 124,127, 157f., 1 6 9 - 1 7 3