217 87 39MB
German Pages 458 [460] Year 1989
de Gruyter Lehrbuch Hüttner • Grundzüge der Marktforschung
Manfred Hüttner
Grundzüge der Marktforschung 4., völlig neubearbeitete und erweiterte Auflage
w DE
Walter de Gruyter • Berlin • New York 1989
Dr. Manfred Hüttner Professor a m Fachbereich Wirtschaftswissenschaft der Universität Bremen D i e 1.-3. Auflage des Werkes erschien bei Betriebswirtschaftlicher Verlag Dr. Th. Gabler, Wiesbaden. Mit 85 Darstellungen
CIP-Titelaufnahme
der Deutschen
Bibliothek
Httttner, Manfred: Grundzüge der Marktforschung / Manfred Hüttner. - 4., völlig neubearb. u. erw. Aufl. - Berlin ; New York : de Gruyter, 1989 (De-Gruyter-Lehrbuch) Bis 3. Aufl. im Betriebswirtschaft!. Verl. Gabler, Wiesbaden ISBN 3-11-011792-4 brosch. ISBN 3-11-011981-1 geb.
© Copyright 1988 by Walter de Gruyter & Co., Berlin 30. Alle Rechte, insbesondere das Recht der Vervielfältigung und Verbreitung sowie der Übersetzung, vorbehalten. Kein Teil des Werkes darf in irgendeiner Form (durch Photokopie, Mikrofilm oder ein anderes Verfahren) ohne schriftliche Genehmigung des Verlages reproduziert oder unter Verwendung elektronischer Systeme verarbeitet, vervielfältigt oder verbreitet werden. Printed in Germany. Satz und Druck: W. Tutte, Druckerei GmbH, Salzweg. - Bindung: Dieter Mikolai, Berlin.
Vorwort
Seit dem Erscheinen der 1. Auflage ist bald ein Vierteljahrhundert vergangen. Das Buch hat in dieser Zeit eine außerordentlich weite Verbreitung erfahren, sowohl in der Praxis und an den Fachhochschulen, den damaligen Höheren Wirtschaftsfachschulen, als auch an Universitäten. Ein wesentlicher Grund hierfür ist wohl in der Anlage des Lehrbuches zu suchen. Aus sachlichen Gründen erschien eine grundlegende Neubearbeitung nunmehr unabdingbar. Sie wurde unter dem Gesichtspunkt durchgeführt, Bewährtes in der bisherigen Konzeption zu erhalten. So ist an der didaktischen Grundkonzeption einer einfahrenden Darstellung, an der praxisbetonten Ausrichtung und an der Demonstration durch drucktechnisch hervorgehobene Beispiele festgehalten worden. Mehr Raum wurde der in den letzten Jahren im Zusammenhang mit der Entwicklung immer leistungsfähigerer Computer bzw. entsprechender Software stark hervorgetretenen Datenanalyse gegeben. Dies macht zugleich die wesentlichste Änderung im formalen Außau des Buches aus. Didaktischen Zielen dient die Aufnahme von Fragen und Aufgaben. Zum Teil bringen diese auch inhaltliche Erweiterungen; zumindest dann finden sich Lösungen im Anhang des Lehrbuchs. (Alle weiteren Lösungen können interessierte Dozenten vom Autor direkt abrufen.) Neu ist auch ein im Anhang enthaltenes Glossarium. Zu erwähnen bleibt, daß insbesondere in Kapitel 3 gewisse - zumeist mathematisch-statistische - Grundlagen vorab behandelt werden, da auf sie später des öfteren zurückgegriffen werden muß. Leser mit entsprechenden Vorkenntnissen können diese bewußt knapp gehaltenen Ausführungen überschlagen. Das kann auch mit den im Text eingeschobenen und typographisch abgesetzten Ergänzungen und Erweiterungen geschehen. Dem Verfasser ist es eine angenehme Pflicht, denen zu danken, die zur Entstehung des Buches beigetragen haben. Naturgemäß können hier nicht alle aufgeführt werden, die dem Zustandekommen förderlich waren. Hervorgehoben werden sollen nur einerseits die zahlreichen Marktforschungsinstitute, die den Praxisbezug unter anderem durch Überlassung von Material unterstützten. Andererseits seien diejenigen namentlich genannt, die ganz unmittelbar die Drucklegung förderten: Herr Dipl.-Ök. Torsten Czenskowsky hat in manch grundsätzlicher Diskussion und bei der Durchsicht verschiedener Fassungen wertvolle Anregungen gegeben. Hilfe in vielfältiger Hinsicht leistete auch Dipl.-Ök. Hans-Uwe Sicks. Frau Schardelmann brachte beim Schreiben des Manuskripts in seinen unterschiedlichen Stadien große Geduld auf.
VI
Vorwort
Da trotz aller Sorgfalt Mängel verblieben sein mögen, bin ich für Hinweise und Verbesserungsvorschläge jederzeit dankbar. Frühsommer 1988
Manfred
Hüttner
Inhaltsverzeichnis
Teil I
Grundlagen
Die Entwicklung der Marktforschung und ihr heutiger Stand Literaturhinweise
1
Kapitel 1
1 7
Kapitel 2 Meßtheoretische Grundlagen 2.1 Messung und „Meßniveau" („Skalenniveau") 2.2 Das Problem der Genauigkeit 2.2.1 Die Arten von Fehlern 2.2.2 Réhabilitât und Validität 2.3 Forschungsprozeß und „Research Design" 2.3.1 Die Stadien des Marktforschungsprozesses 2.3.2 Die verschiedenen „Research Designs" Exkurs: Meta-Analyse Literaturhinweise Aufgaben
9 9 11 11 13 15 15 20 22 24 24
Kapitel 3 Inferenzstatistische Grundlagen 3.0 Einführung: Statistische Deskription - Der statistische „Schluß" bzw. die statistische Bestätigung 3.1 Das Schätzen der Parameter 3.2 Das Testen von Hypothesen Literaturhinweise Aufgaben
24 25 27 33 37 37
Teil II
39
Methoden der Datengewinnung in der Marktforschung
Kapitel 4 Die Befragung 4.1 Arten der Befragung 4.1.1 Einteilung nach dem Adressatenkreis 4.1.2 Einteilung nach dem Erhebungsmodus 4.1.3 Einteilung nach der Zahl der Untersuchungsthemen 4.2 Befragungsstrategie und -taktik 4.2.1 Arten des Interviews Exkurs: Die Interviewer-Organisation 1. Aufbau und Unterhaltung der InterviewerOrganisation 2. Einsatz der Interviewer-Organisation 4.2.2 Indirekte Befragung (und psychologische Tests)
39 39 39 41 49 51 51 52 52 54 56
VIII
Inhaltsverzeichnis
4.3 Das Frageinstrumentarium 4.3.1 Einteilung nach der Antwortmöglichkeit 4.3.1.1 Offene und geschlossene Fragen 4.3.1.2 Die „Skalierung" 4.3.2 Andere Einteilungen 4.3.3 Die Entwicklung des Fragebogens 4.4 Die „Stichprobe" 4.4.1 Die Arten der Auswahl der Befragten 4.4.1.1 Auswahlverfahren und-techniken im Überblick 4.4.1.2 Die Zufallsauswahl 4.4.1.3 Die Quotenauswahl 4.4.1.4 Besondere Formen und Probleme 4.4.2 Hochrechnung - Fehlerrechnung - Der Umfang der Stichprobe Literaturhinweise Aufgaben Appendix: Fragebogen
64 65 66 71 81 84 85 86 86 89 93 97 99 103 104 105
Kapitel 5 Die Beobachtung 5.1 Begriff und Arten 5.2 Die Form der Datenkollektion 5.2.1 Datenerhebung durch Beobachter 5.2.2 Der Einsatz von technischen Einrichtungen 5.2.3 Bestandsaufnahmen und „Spurenanalysen" 5.3 Methodische Probleme 5.3.1 Die Repräsentanz 5.3.2 Beobachtereinfluß und „Beobachtungseffekt" Literaturhinweise Aufgaben
115 115 117 117 118 120 121 121 121 122 122
Kapitel 6
122
Das Experiment
6.1 Begriff und Arten 6.2 Das Problem der Versuchsanlage 6.2.1 „Klassische" Experimente 6.2.1 „Erweiterte" Experimente Literaturhinweise Aufgaben
122 125 125 129 134 134
Kapitel 7
135
Das Panel
7.1 Begriff und Arten 7.2 Technische Durchführung 7.3 Methodische Probleme Literaturhinweise Aufgaben
135 138 141 142 142
Inhaltsverzeichnis
IX
Kapitel 8 Sekundärmaterial 8.1 Begriff und Bedeutung 8.2 Quellen 8.2.1 Externe Informationen 8.2.2 Interne Informationen 8.3 Probleme der technischen Durchführung Literaturhinweise Aufgaben
143 143 144 144 148 149 152 153
Teil III
154
Methoden der Datenanalyse in der Marktforschung
Einführung: Datenaufbereitung und Datenanalyse - D i e Datenmatrix (und ihre „Partitionierung")
154
Kapitel 9 Ein- und mehrdimensionale Auszählungen 9.1 Die einfache Häufigkeitsanalyse 9.2 Kreuztabulierung Exkurs: „Kohortenanalyse" Literaturhinweise Aufgaben
159 159 166 169 173 174
Kapitel 10 Korrelation u n d Assoziation: grundlegende Verfahren 10.1 Regressions-und Korrelationsanalyse 10.1.1 Lineare und nicht-lineare Einfach-Regression 10.1.2 Multiple Regression 10.2 Kontingenzanalyse 10.3 Möglichkeiten der Regression bei „Nominaldaten" Literaturhinweise Aufgaben
175 176 176 182 188 193 195 196
Kapitel 11 Weitere M e t h o d e n der D e p e n d e n z - A n a l y s e 11.1 Varianzanalyse 11.1.1 Begriff und Arten 11.1.2 ANOVA und experimentelle Designs 11.2 Diskriminanzanalyse 11.2.1 Begriff und Arten 11.2.2 (Lineare) Diskriminanzanalyse im Zwei-Gruppen-Fall 11.2.2.1 Die Extraktion der Diskriminanzfunktion 11.2.2.2 Die Berechnung von Diskriminanzwerten 11.3 AID-Verfahren 11.4 Kanonische Analyse Literaturhinweise Aufgaben
198 199 199 201 207 207 208 208 213 215 218 221 222
X
Inhaltsverzeichnis
Kapitel 12
Methoden der Interdependenz-Analyse
224
12.1 Faktorenanalyse 12.1.1 Begriff und Arten 12.1.2 Faktorenextraktion und -rotation 12.1.3 Die Berechnung von Faktorenwerten 12.2 Multidimensionale Skalierung 12.2.1 Begriff und Arten 12.2.2 Die Skalierung von Ähnlichkeitsdaten 12.2.3 Die Skalierung von Präferenzdaten 12.3 Clusteranalyse 12.3.1 Begriff und Abgrenzung 12.3.2 Die Wahl des Proximitätsmaßes 12.3.3 Die Wahl der Clustertechnik (Clusteranalyse-Algorithmen) 12.3.4 Die Cluster-,,Beschreibung" (und die Kombination mit anderen Verfahren) Literaturhinweise Aufgaben
224 224 228 232 233 233 235 240 242 242 244 247
Kapitel 13
258
Allgemeine Ansätze
13.1 Das Conjoint Measurement 13.1.1 Begriff und Abgrenzung 13.1.2 Datengewinnung (und -aggregation) 13.1.3 Die Wahl des Schätzverfahrens - Anwendungsbeispiele 13.2 Die Kovarianzstrukturanalyse 13.2.1 B e g r i f f - D i e Entwicklung der Modelle 13.2.2 Identifikation, Schätzung und Überprüfung der Modelle 13.2.3 Anwendung: Beispiele und Probleme Literaturhinweise Aufgaben
Teil IV
Sachgebiete der betriebswirtschaftlichen Marktforschung
251 254 254
258 258 259 264 266 266 271 275 277 278
279
Einführung: Zur Systematik der Anwendungsbereiche der Marktforschung
279
Kapitel 14
280
Analyse und Prognose der Entwicklung des Marktes
14.1 Die Ermittlung der Größe des Marktes 14.2 Der Marktanteil und seine Analyse 14.3 Die Heranziehung von Marktindikatoren 14.4 Markt- und Absatzprognosen Aufgaben
281 284 288 289 291
Inhaltsverzeichnis
XI
Kapitel 15 Produkttest - Verkaufstest - Testmarkt 15.0 Der Einsatz der Marktforschung in den verschiedenen Stadien des Produktentwicklungsprozesses 15.1 Der Produkttest 15.1.1 Begriff und Arten 15.1.2 Beispiele für Produkt- bzw. Preistests 15.2 Simulierte und reale Markttests 15.2.1 Der Ladentest und das „klassische" Testmarktverfahren 15.2.2 Testmarkt-Simulation und Mini-Testmarktverfahren Aufgaben
291
Kapitel 16 Die Werbeforschung 16.1 Begriff und Abgrenzung - Die Werbeziele und ihre Realisierung 16.2 Werbeträgerforschung (Mediaforschung) 16.3 Werbemittelforschung Aufgaben
303 303 306 309 312
Kapitel 17 Besondere Bereiche der M a r k t f o r s c h u n g 17.1 Die Marktforschung für Investitionsgüter 17.2 Die Auslandsmarktforschung 17.3 Die Marktforschung im Dienstleistungssektor Exkurs: Umfragen und Gewerblicher Rechtsschutz Aufgaben
313 313 319 328 333 336
Teil V
Die Organisation der betriebswirtschaftlichen Marktforschung
Betriebliche M a r k t f o r s c h u n g D a s „Marketing-Informations-System" 18.1 Umfang der betrieblichen Marktforschung 18.2 Aufgaben und organisatorische Stellung der Marktforschung im Betrieb 18.3 Das „Marketing-Informations-System"
292 293 293 296 299 299 301 303
337
Kapitel 18
Kapitel 19 Institute u n d sonstige Träger der M a r k t f o r s c h u n g 19.1 Instituts-Marktforschung 19.2 Sonstige Träger Die Kosten der M a r k t f o r s c h u n g „ M a r k t f o r s c h e r " als Beruf 20.1 Die Kosten der Marktforschung 20.2 Die Ausbildung des Marktforschers 20.3 Berufsverbände auf dem Gebiet der Marktforschung
337 338 339 349 351 352 355
Kapitel 20
358 358 363 365
XII
Inhaltsverzeichnis
Anhang A. Statistische Tafeln B. Einige Regeln für Matrizen und Vektoren C. Aufgaben-Lösungen D. Glossarium E. Vokabularium englisch/deutsch
367 367 372 380 395 414
Literaturverzeichnis Sachregister
416 432
Verzeichnis der Darstellungen
Darsi. 1-1: Darst. 2-1: Darsi. 2-2: Darst. 2-3: Darst. 3-1: Darst. 3-2: Darst. 3-3: Darst. 4-1: Darst. Darst. Darst. Darst. Darst. Darst. Darst. Darst.
4-2: 4-3: 4-4: 4-5: 4-6: 4-7: 4-8: 4-9:
Darst. Darst. Darst. Darst. Darst. Darst. Darst.
4-10: 4-11: 4-12: 4-13: 4-14: 4-15: 4-16:
Darst. Darst. Darst. Darst. Darst. Darst. Darst. Darst. Darst. Darst. Darst. Darst. Darst. Darst.
4-17: 4-18: 5-1: 6-1: 6-2: 6-3: 6-4: 7-1: 7-2: 8-1: 8-2: IIIE-1: II1E-2: 9-1:
Entwicklungsphasen der Marktforschung Arten von Fehlern Veranschaulichung von Reliabilität und Validität Stadien des Marktforschungsprozesses („Die 5 D's der Marktforschung") Normalverteilung (n und a) Normalverteilung (z) Schritte beim Hypothesen-Test Vor- und Nachteile der Grundformen der Befragungsarten nach dem Erhebungsmodus Personen-Zuordnungstest Satzergänzungstest „Assoziations-Wahltest" Thematischer Apperzeptions-Test Einteilung der Fragen nach der Antwortmöglichkeit Stapel-Skala „Thermometer"-Skala a) rein graphische Skala b) dto. (Unterweisungs-Beispiel) Beispiel eines (vorgegebenen) Semantischen Differentials Beispiel eines (graphisch ausgewerteten) Polaritätsprofils Einteilung der Fragen nach der Verwendung von Vorlagen Einteilung der Fragen nach dem Zweck Auswahlverfahren (und Auswahltechniken) Quotenanweisung (Beispiel) Fragebogen (Auszug aus einer Mehr-Themen-Umfrage des EMNID-Instituts) „Liste 75" zum EMNID-Fragebogen „Liste 14" zum EMNID-Fragebogen Arten der Beobachtung Vollständiger Zufallsplan Zufälliger Blockplan Lateinisches Quadrat (Beispiel) Vollständiger bifaktorieller Zufallsplan Arten des Panels Auszug aus dem „Einkaufsbericht" des G&I-Haushaltspanels Externe Informationsquellen (Übersicht) Fachserien des Statistischen Bundesamtes Datenmatrix Multivariate Methoden (einfache) Häufigkeitsverteilung
6 12 13 16 30 31 34 47 59 60 61 62 65 73 73 74 79 80 82 82 87 94 106 110 112 116 130 131 132 133 136 139 144 145 155 158 160
XIV
Verzeichnis der Darstellungen
Darsi. 9-2: Darsi. 9-3: Darsi. 9-4: Darsi. 9-5: Darsi. 10-1: Darst. Darsi. Darst. Darst. Darst. Darst. Darst. Darst. Darst. Darst. Darst. Darst. Darst. Darst. Darst. Darst. Darst. Darst.
10-2: 10-3: 10-4: 11-1: 11-2: 11-3: 11-4: 11-5: 12-1: 12-2: 12-3: 12-4: 12-5: 12-6: 13-1: 13-2: 13-3: 13-4:
Darst. Darst. Darst. Darst. Darst. Darst. Darst.
14-1: 14-2: 14-3: 14-4: 14-5: 15-1: 15-2:
Darsi. 16-1: Darst. 17-1: Darst. 17-2: Darst. 17-3: Darst. 17-4: Darst. 17-5: Darst. 18-1: Darst. 18-2: Darst. 18-3:
Zweidimensionale Häufigkeitsverteilung Querschnitts-Sequenz zur Kohortenanalyse (Schema) dto. Beispiel Alternativrechnungen (Beispiel) Arbeitstabelle zur Berechnung der linearen Einfach-Regression (1. Berechnungsart) Arbeitstabelle zur Berechnung der linearen Mehrfach-Regression Vierfeldertafel 9 • 2-Tabelle (Beispiel) „klassische" Diskriminanzanalyse bei 2 Gruppen und Prediktoren . . . Arbeitstabelle zur Berechnung der Diskriminanzfunktion Konfusionsmatrix (Beispiel) AID-Baum Konzept von „Redundanz" und „Redundanz-Index" Korrelationsmatrix (Beispiel) Euklidische und city block-Metrik MDS-Konfiguration (Beispiel) Cluster und (Q)-Faktoren Vierfeldertafel für Ähnlichkeitskoeffizienten Dendrogramm CM-Rangfolge (1. Beispiel) Konfirmatorisches Faktorenmodell (Beispiel) Kovarianzstrukturmodell Zusammenstellung der Variablen und Matrizen in einem vollständigen LISREL-Modell Marktwachstum und Marktsättigung Bestand und Nachfrage im Pkw-Markt Marktwachstum-Marktanteil-Matrix Regionale Analyse des Marktanteils (1. Beispiel) Systematik der Prognosemethoden Produkttest im engeren und im weiteren Sinne Preisschätzung als Kurve der kumulierten relativen Häufigkeiten (Beispiel) Messung des Werbeerfolgs Export des Landes A und der Unternehmung a nach 5 Gebieten (Beispiel) Gesamtexport und Export des Landes A nach 5 Gebieten (Beispiel) Organisation der Auslandsmarktforschung Fragebogen der Kundenumfrage der Zürcher Nationalbank Bildvorlage zur Verkehrsgestaltung des Warenzeichens von „Schinkenhäger" Durchführung bestimmter Marktforschungstätigkeiten „Research Activities" - in der BRD und den USA (in %) Checklist zur Überprüfung des Marktforschungsprozesses Aufgaben einer Marketing-Informationszentrale
166 170 171 172 177 182 189 191 208 210 213 215 220 225 236 241 243 245 248 263 269 271 272 283 284 286 287 290 294 298 305 325 326 327 332 334 343 346 349
Verzeichnis der Darstellungen Darst.20-1: Darsi. T-l: Darsi. T-2: Darst. Irl: Darsi. L-2: Darst. Darst. Darst. Darst.
L-3: L-4: L-5: L-6:
Marktforschungs-Budget in den USA in % vom Umsatz Quantile der t- und der Verteilung (sowie der Normalverteilung).. Quantile der F-Verteilung Arbeitstabelle zur Streuungszerlegung bei der Regression Arbeitstabelle zur Berechnung der linearen Einfachregression (2. Berechnungsart) Dendrogramm (2. Beispiel) Konfirmatorisches Faktorenmodell (2. Beispiel) Regionale Analyse des Marktanteils (2. Beispiel) Testverfahren im Produktentwicklungsprozeß
XV 361 368 370 376 376 384 385 385 386
Teil I
Grundlagen
Kapitel 1
Die Entwicklung der Marktforschung und ihr heutiger Stand
In den früheren Auflagen dieses Buches ist Marktforschung definiert worden als die „systematische Untersuchung eines konkreten Teilmarktes" (S. 21). Während der erste Teil dieser Definition, die „systematische Untersuchung" - in Abhebung zur Markterkundung, dem „bloß zufälligen, gelegentlichen Abtasten des Marktes" (S. 29) - auch heute noch volle Gültigkeit hat, mag dies für den zweiten Teil etwas zweifelhaft erscheinen: Intendiert war ja damals, mit dem Abstellen auf den „konkreten Teilmarkt", einerseits die Differenzierung zum abstrakten Markt der Markttheorie (S. 21), andererseits die zum allgemeinen Begriff der Forschung („Wahrheitsfindung im Dienste der Wissenschaft" - S. 29, mit Literaturverweis). Diese Abgrenzungen erscheinen heute nicht mehr notwendig. (S. aber auch unten.) Zum anderen muß die Festlegung auf den „konkreten Teilmarkt" als etwas eng anmuten. Sinnvoll scheint deshalb heute folgende Definition: „Marktforschung ist der systematische Prozeß der Gewinnung und Analyse von Daten für Marketing-Entscheidungen." Diese Ausrichtung kommt auch im Titel des 1979 herausgekommenen Buches d. Verf.: „Informationen für Marketing-Entscheidungen", mit dem Untertitel: „Ein Lehr- und Arbeitsbuch der Marktforschung", zum Ausdruck. Dieser Titel enthält zwar den Begriff „Informationen" statt hier „Daten"; wie aber dort (S. 19) erwähnt, kann beides im Prinzip gleichgesetzt und ein Unterschied allenfalls darin gesehen werden, daß man bei ersterem mehr an die Output-Seite, bei „Daten" dagegen mehr an die /wput-Seite denkt. Schon wegen der etablierten Ausdrücke „Datenerhebung" bzw. „-gewinnung" und „Datenanalyse" erscheint die obige Formulierung besser.
Die Orientierung am Begriff „Marketing" bedeutet zunächst, daß eine Unterscheidung zwischen ,,Marketing Research" und „Market Research" - und damit auch „Marktforschung" und „/Ifoaizforschung" - nicht (mehr) sinnvoll erscheint. Sie ist ohnehin offenbar historisch bedingt; so wird in Europa bzw. speziell Großbritannien eher letztere Bezeichnung verwandt (s. etwa „Journal of the Market Research Society"), in den USA, wo das Marketing entstand, erstere (s. „Journal of Marketing Research").
Zu fragen bleibt allerdings, ob dann nicht auf die Bezeichnung „Marktforschung" (die LEITHERER [1985, S. 76] ohnehin für falsch hält, einmal, weil es nicht nur um Märkte, sondern Entscheidungen in Haushalten usw. geht, zum anderen wegen der unangemessenen Übersetzung des englischen „research" - vom französischen
2
Teil I
Grundlagen
„recherches") verzichtet werden sollte, zugunsten des Begriffs Marketingforschung. D a f ü r spricht, daß dies eigentlich konsequent wäre. (Tatsächlich wird dies auch von einigen Autoren, insbesondere solchen mit „Marketing" als Buchtitel, z.B. NIESCHLAG/DICHTL/HÖRSCHGEN [ 1 9 8 5 ] , getan.) DAgegen spricht einerseits der Sprachgebrauch, insbesondere auch in der Praxis (Benennung von Verbänden, Institutionen usw. - s. Teil V). Andererseits besteht die Gefahr der Deutung als „Forschung" schlechthin (wie bei der Unterscheidung in Universitäten zwischen „Lehre" und „Forschung" und wohl auch dem seit einiger Zeit existierenden „Journal of Research in Marketing" - wo offensichtlich durchaus auch theoretische Beiträge erscheinen [sollen]). Der empirische und auch der AnwendungsBezug gingen dann verloren; „Marketingforschung" stünde für alle Bemühungen um Erkenntnis - auf irgendeine Weise und durchaus auch im Bereich der „Grundlagen-Forschung" - des Marketing schlechthin. Der Verf. zieht es deshalb vor, beim etablierten Ausdruck „Marktforschung" zu bleiben. Allerdings heißt das nicht, daß eine inhaltliche Festschreibung erfolgt ist: Die Orientierung am „Marketing" bedeutet auch, daß insoweit der Begriff der „Marktforschung" enger wird: Arbeits- und i-Y«a«zmarktforschung - als auf die Beschaffung von personellen und finanziellen Mitteln ausgerichtet - gehören nun nicht mehr dazu. Selbst die „eigentliche" ÄeicAa/fwwgsmarktforschung (im engeren Sinne, als Beschaffung von Roh-, Hilfs- und Betriebsstoffen) kann nur dann als eingeschlossen angesehen werden, wenn man die Funktion „Beschaffung" nicht als eigenständig, sondern als untergeordnet der des „Absatzes" (und nicht etwa der „Produktion"!) ansieht. Ein solcher Einbezug mag zwar insofern begründbar erscheinen, als es sich beim Beschaffungsmarkt um einen dem Absatzmarkt nahe verwandten Markt - in gewissem Sinne nur sein Spiegelbild - handelt. Im folgenden wird aber darauf verzichtet (zumal auch offenbar eine professionelle Ausprägung als „Beschaffungsmarktforscher" kaum stattgefunden hat). Auf der anderen Seite kann man eine inhaltliche Ausweitung konstatieren. So skizziert etwa BERGSMA (1983,1984) ein „Vier-Phasen-Schema": Auf die Stadien „Market Research" und „Marketing Research" folgen „Competitive Research" und „Business Research". Dazu ist festzuhalten: 1. Die (Wieder-)Aufnahme der alten Unterscheidung in „Market Research" und „Marketing Research" erscheint nicht zweckmäßig - noch dazu als zeitlich aufeinanderfolgende Phasen, „Marketingforschung" quasi als höhere Stufe der „Marktforschung" (also inhaltlich gegenüber der oben diskutierten eher umfangmäßigen Abgrenzung). 2. Competitive Research - schlagwortartig gekennzeichnet durch den Übergang der Untersuchung von „where to compete" („wo soll konkurriert werden?") zu „how to compete" („wie soll konkurriert werden?") - steht in Zusammenhang mit der Konzeption der „Wettbewerbsstrategie" (PORTER 1 9 8 0 , HINTERHUBER 1 9 8 2 ) .
Kapitel 1
Die Entwicklung der Marktforschung und ihr heutiger Stand
3
Nun ist die „Erforschung der Konkurrenz (Angebot)" nichts Neues; schon SCHÄFER (1940, S. 12) wies der Marktforschung diese Aufgabe, neben der Erforschung des Bedarfs (Nachfrage) und der „der Absatzwege", zu; auch für den - speziell betrieblichen - Marktforschungs-Praktiker gehört sie gewissermaßen „zum täglichen Brot". Neu ist allerdings ihre Einbettung in den Kontext der Strategischen Unternehmensführung. Insofern wachsen der „Konkurrenzforschung" nicht nur möglicherweise neue Aufgaben zu (die auch die gelegentlich verwendete Bezeichnung als „Konkurrenz-" oder Wettbewerbsana/yse" gerechtfertigt erscheinen lassen mögen), sondern es sind eventuell auch neue Methoden erforderlich (MEFFERT 1985). 3. Das Konzept des Strategischen Managements soll im vierten Stadium voll zur Geltung kommen. Ob dafür allerdings die Bezeichnung „Business Research" glücklich erscheint - die deutsche Übersetzung „Geschäftsforschung" ist es sicher nicht! - , mag offen bleiben. Bereits seit längerem gibt es Bücher unter diesem oder verwandtem Titel (z. B.: EMORY 1980); auch die Zeitschrift gleichen Namens erschien 1987 bereits im 15. Jahrgang.
Ferner sei darauf aufmerksam gemacht, daß im Zuge dieser inhaltlichen Erweiterung - immer aber letztlich im Rahmen des (Strategischen) Marketing - die oben ausgegrenzten Märkte wieder ins Blickfeld kommen (können), und zwar im Zuge der „Umweltanalyse" (environmental analysis/research). Der Verf. möchte dafür lieber den Begriff Strategische - oder „strategisch orientierte" Marktforschung verwenden. (S. HÜTTNER 1986a und HÜTTNER/CZENSKOWSKY 1986.) Darauf wird im V. Teil, in Kapitel 18, näher eingegangen. Der Aufbau des Buches insgesamt - und eine andere, mehr methodisch orientierte „Periodisierung" der Entwicklung - wird im folgenden dargelegt. Vorher sei noch auf einige Einteilungs- und Abgrenzungsprobleme hingewiesen. In den früheren Auflagen dieses Buches fanden sich (im I. Teil unter B) folgende „Arten der Marktforschung": 1. demoskopische und ökoskopische Marktforschung. Auf diese Einteilung wird verzichtet, da sie sich - zumal international (und im Hinblick auf die Bezeichnung „ökoskopisch") - nicht durchgesetzt hat. Wie erwähnt, werden nunmehr die Methoden der Marktforschung nach solchen der Datengewinnung und -analyse gegliedert. Zu „qualitativen Verfahren" (als Gegensatz zu „quantitativen") s. auch in Kap. 2. 2. Instituts- und betriebliche S. dazu Teil V.
Marktforschung.
3. betriebswirtschaftliche und volkswirtschaftliche Marktforschung. Auch hier scheint eine Hervorhebung entbehrlich. Obwohl von „volkswirtschaftlicher Marktforschung" heute kaum noch gesprochen wird, bleibt in den Teilen IV und V - der Betonung halber - die Kennzeichnung als „betriebswirtschaftlich" erhalten.
4
Teil I
Grundlagen
4. primäre und sekundäre Marktforschung. S. dazu (sowie zu ,field" und,,desk research ") kurz unten, in Kap. 2, in der Einführung zu T. III und speziell in Kap. 8. 5. Binnen- und /iHj/ancfamarktforschung. S. Kap. 17. 6. Konsumgüter- und /«tie.vi//;o«5gütermarktforschung (sowie Marktforschung für Dienstleistungen). S. Kap. 17. 7. prospektive und retrospektive Marktforschung. Entfällt. S. aber zum „Kontrollaspekt" der Marktforschung bzw. dem „Marktforscher als Controller" in T. V.) 8. Beschaffungs- und ^¿jaizmarktforschung. S. oben. 9. Introduktions- und Ökonomisierungsmurktforschung. Entfallt. Die Begriffe haben sich in der Praxis nicht durchgesetzt. (S. aber zur Einführung neuer Produkte speziell in Kap. 16.) Auf folgende „Abgrenzung der Marktforschung" war in den früheren Auflagen abgestellt worden: 1. Markterkundung. S. oben. 2. Marktanalyse und -beobachtung. Hier gilt nach wie vor das früher Gesagte: Diese von Schäfer eingeführte und - trotz Einwänden - aufrechterhaltene Einteilung der Marktforschung in Analyse (statisch) und Beobachtung (dynamisch) läßt sich praktisch kaum durchführen und ist auch logisch schwer haltbar. („Veränderungen stellen nichts anderes dar als die Unterschiede zwischen einzelnen Zuständen an verschiedenen Zeitpunkten", so daß Marktbeobachtung „letztlich eine Kette von Marktanalysen" ist - BEHRENS 1966, S. 26f.) Der Terminus „Marktanalyse" wird lediglich im Sinne einer Tätigkeit, der Durchführung einer „Marktanalyse" (nicht einer „Marktforschung"), gebraucht. 3.
Absatzforschung. Entfällt, gemäß oben.
4.
Verbrauchsforschung. Die Bezeichnungen „Verbrauchsforschung" bzw. „Konsumforschung" entstanden im Kontext der Nürnberger Schule. (S. dazu unten.) Historisch gewachsen, werfen sie jedoch im Hinblick auf die heutige Terminologie mannigfache Abgrenzungsprobleme auf und werden deshalb heute auch nur wenig (explizit) benutzt. Dafür hat sich jedoch in jüngerer Zeit ein anderer Begriff entwickelt: der der Verbraucheroder - häufiger - Konsumentenforschung („Consumer Research"; s. auch das entsprechende amerikanische „Journal"). Es steht im Zusammenhang mit der Lehre vom Konsumentenverhalten („Consumer Behaviour") und bezeichnet im Grunde dessen Erforschung. Insoweit, als auch die (betriebswirtschaftliche) A/arfc/forschung sich zu großen Teilen mit dem Verhalten der Verbraucher beschäftigt, besteht vom Gegenstand her Übereinstimmung; ein Unterschied kann allerdings in der möglicherweise anderen Zweck Setzung (Verbraucherpolitik, Konsumentenschutz - früher oft: „Konsumerismus") liegen.
Kapitel 1 Die Entwicklung der Marktforschung und ihr heutiger Stand
5
Andererseits existieren jedoch auch (Buch-)Titel wie: Consumer Research for Management Décisions (PRINCE 1982). Auf den Begriff wird im folgenden verzichtet. 5. Meinungsforschung und Mo/i'uforschung. Auch der Begriff „Aiem«ng5forschung" ist historisch gewachsen, im Hinblick auf die Erforschung der „öffentlichen Meinung" bzw. „Wählermeinung" (Wahlforschung). Im Bereich der eigentlichen Marktforschung sollte er - da unklar bzw. mißverständlich keine Verwendung finden. (Zum - allerdings geringen - Umfang s. auch in Kap. 19). Dies gilt auch für die Bezeichnung „Mofwforschung", einmal wegen der Vielfältigkeit des Begriffes „Motiv" bzw. seiner Abgrenzung zu den Stichworten „Motivation", „Antrieb", „Beweggrund" etc., zum zweiten deshalb, weil die - im Zuge des „Methodenstreits", zwischen „Nasenzählern" auf der einen und den mehr psychologisch ausgerichteten „Tiefenboys" auf der anderen Seite, entstandene - Entgegensetzung von „Marktforschung" und „Motivforschung" heute wohl als überwunden gelten kann. (Zur Berücksichtigung psychologischer Gesichtspunkte s. insbesondere in Kap. 4.)
Die Geschichte der Marktforschung ist zwar noch nicht geschrieben. Immerhin kann man aber, stellt man auf die in der eingangs gegebenen Definition der Marktforschung enthaltene Unterscheidung zwischen Datengewinnung und Datenanalyse ab, zu einer - primär methodisch ausgerichteten - „Periodisierung" kommen. Innerhalb der Datengewinnung vermag nämlich wieder danach eingeteilt zu werden, ob es sich um SekundärioTSchxmg oder Pr/wärforschung, d. h. originäre Datenerhebung, handelt. Dabei kann weiter danach differenziert werden, ob sie auf „repräsentativer" Basis geschieht und eine,,psycho taktisch-zweckmäßige'' ' Datenermittlung erfolgt. Damit ergibt sich eine dreifache Unterteilung: 1. originäre Datenermittlung, 2. (originäre und) repräsentative Datenermittlung, 3. (originäre, repräsentative und) psychotaktisch-zweckmäßige Datenermittlung. Diese Unterscheidung und Bezeichnungsweise wurde - in Weiterentwicklung der Gedanken (1958) - von BEHRENS (1966, S. 29f.) herausgearbeitet.
NOELLE-NEUMANNS
Hinsichtlich der Daten analyse lassen sich ebenfalls 3 Möglichkeiten unterscheiden: 1. Auswertung vorwiegend im Sinne der einfachen Häufigkeitsanalyse („univariat"), 2. dto. mittels bivariater (statistischer) Methoden, 3. dto. mittels multivariater Methoden. Damit ergibt sich das Schema gemäß Darstellung 1-1 (S. 6). Die einzelnen Phasen entwickelten sich aber durchaus nicht simultan. Theoretisch lassen sich deshalb zunächst alle miteinander kombinieren; das ergäbe 3 2 = 9. In der tatsächlichen Entwicklung sind allerdings mehr nur 5 Perioden festzustellen: 1. Übergang zur originären Datenermittlung bei Auswertung vorwiegend mittels (einfacher) Häufigkeitsanalysen;
6
Teil I
Grundlagen
Phasen
I. Datengewinnung
II. Datenanalyse
1
originär
(einfache) Häufigkeitsanalyse
2
repräsentativ
bivariate Methoden
3
psychotaktisch-zweckmäßig
multivariate Methoden
Darst. 1-1:
Entwicklungsphasen der Marktforschung
2. Auswertung von Primär- und Sekundärdaten mittels bivariater statistischer Methoden; 3. Übergang zu Teilerhebungen, bei Auswertung mittels Häufigkeitsanalysen und (vorwiegend) bivariaten statistischen Methoden; 4. Anwendung der psychotaktischen Befragungsweise, bei Auswertung vornehmlich mit (Häufigkeitsanalysen und) bivariaten statistischen Methoden; 5. (zunehmende) Anwendung multivariater statistischer Analyse-Methoden. Die erste Periode ist gekennzeichnet durch Befragung von möglichst großen Massen. Da man die auf der Wahrscheinlichkeitsrechnung aufbauende Theorie der Stichproben nicht kannte, glaubte man, ein um so genaueres Ergebnis zu erhalten, je größer die Befragungsmasse ist - eine auch heute noch gelegentlich anzutreffende Vorstellung! - , und bemerkte umgekehrt nicht, daß auch schon ein relativ kleiner Ausschnitt zu befriedigenden Resultaten führen kann. Der Beginn dieser Periode geht zurück bis auf das 17. Jahrhundert, in dem der Engländer Petty bereits Umfragen unter der Bevölkerung zur Sammlung von Informationen über die Lebensweise des Volkes anstellte. Der Beginn der eigentlichen Marktforschung dagegen liegt erst zu Anfang unseres Jahrhunderts, und zwar vornehmlich in den USA. Er wird dort allgemein mit 1911 datiert: Aufbau einer Marktforschungsabteilung innerhalb der Curtis Publishing Company durch Parlin. Allerdings stammt die erste bekanntgewordene systematische Marktanalyse bereits aus dem Jahr 1879; die Firma „N.W. Ayer and Son" fertigte damals für einen ihrer Kunden eine Untersuchung über die Erzeugung von Getreide an.
In Deutschland wurde ein entscheidender Schritt zur Herausbildung einer eigenständigen Marktforschung mit der 1925 nach mancher Vorarbeit erfolgten Gründung des Instituts für Wirtschaftsbeobachtung (später: Institut für Wirtschaftsbeobachtung der deutschen Fertigware, aus dem 1934 die Gesellschaft für Konsumforschung - noch heute in Nürnberg - hervorging) getan. Einige Zeit darauf begann eine zweite Gruppe von Marktforschern mit ihrer Tätigkeit in Köln, woraus sich später die Gesellschaft für Marktforschung - in Hamburg - entwickelte.
Kapitel 1
Die Entwicklung der Marktforschung und ihr heutiger Stand
7
Heute kann man vielleicht schon vom Übergang zu einer 6. Periode sprechen, „gekennzeichnet durch eine zunehmende Verknüpfung von apparativ-, medialbzw. computergestützter Datengewinnung einerseits ... und computergestützter Datenanalyse andererseits". (ZENTES 1984, S. 2 - wobei hier allerdings unter Bezugnahme auf die obigen jeweils drei Phasen von einer „4. Phase" die Rede ist.) Darauf wird später, insbesondere in Kap. 4, noch näher eingegangen. Hier soll noch einmal der grundsätzliche Aufbau des Buches* hervorgehoben werden. Entsprechend der einleitend gegebenen Definition der Marktforschung: Datengewinnung, Datenanalyse, Anwendungsbezug folgt diesem einführenden bzw. grundlegenden I. Teil (auf den „Prozeß-Charakter" wird in Kap. 2 eingegangen) als Teil II\ „Methoden der Datengewinnung in der Marktforschung", als Teil III: „Methoden der Datenanalyse in der Marktforschung" und als Teil IV: „Sachgebiete der betriebswirtschaftlichen Marktforschung". Daran schließt sich noch ein Teil V: „Die Organisation der betriebswirtschaftlichen Marktforschung" an. Zu Beginn eines jeden Teiles wird ein Überblick über dessen Inhalt - die Gliederung in Kapitel - gegeben (so daß hier darauf verzichtet werden kann).
Literaturhinweise Nachstehend erfolgen, ohne Anspruch auf Vollständigkeit, einige Hinweise zu neueren Büchern, die sich allgemein mit „Marktforschung" beschäftigen. Auf die Nennung von Zeitschriften wird verzichtet. Es kommen dafür zu viele in Betracht. Andererseits wäre die Beschränkung auf diejenigen mit einem einschlägigen Titel - auch unter dem Gesichtspunkt der Relevanz - eher irreführend. Indirekt kann die Erschließung über das Literaturverzeichnis geschehen.
Vorstehend bereits - mit Kurzzitat - erwähnte Bücher werden gegebenenfalls wiederholt. Auch wird, im Unterschied zu den Literaturhinweisen in späteren Kapiteln, der volle Titel angegeben, in der gleichen Schreibweise wie im „Literaturverzeichnis". Es erfolgt eine Trennung nach deutsch- und englischsprachigen Schriften. (Als „neueren" Datums gilt bei ersteren ein Erscheinungsjahr ab etwa 1975, bei letzteren 1980 - oder früher, sofern bei HÜTTNER 1979 noch nicht enthalten.) Die Aufführung geschieht chronologisch nach dem Erscheinungsjahr und innerhalb dessen alphabetisch.
* Eine detaillierte Darstellung, in Form einer Synopse der inhaltlichen Stoff-Gliederung und der formalen Gliederung dieser und der früheren Auflagen, findet sich im „Lösungsheft" (bzw. kann direkt vom Verf. angefordert werden).
8
Teil I
Grundlagen
1. deutschsprachige Schriften HAMMANN, P./ERICHSON, B. (1978): M a r k t f o r s c h u n g , S t u t t g a r t 1978
SCHÄFER, E./KNOBLICH, H. (1978): Grundlagen der Marktforschung, 5. Aufl., Stuttgart 1978 (1. Aufl. 1928 - Schäfer,... Marktbeobachtung - , 2. Aufl. 1940 - ders.,... Marktforschung) HÜTTNER, M. (1979): Informationen für Marketing-Entscheidungen. Ein Lehr- und Arbeitsbuch der Marktforschung, München 1979 BÜNING, H./HAEDRICH, G./KLEINERT, H./KUSS, A./STREITBERG, B.
(1981):
Operationale
Verfahren der Markt- und Sozialforschung, Berlin 1981 Innovative Marktforschung (hrsg. v. d. Forschungsgruppe Konsum und Verhalten), Würzburg 1983 GREEN, P.E./TULL, D.S. (1982): Methoden und Techniken der Marketingforschung, Stuttgart 1982 (dt. Übers. - v. R. KÖHLER und Mitarbeitern - von: Research for Marketing Decisions, 4th ed., Englewood Cliffs 1978) BÖHLER, H . (1985): M a r k t f o r s c h u n g , S t u t t g a r t 1985 MEFFERT, H . (1986): M a r k t f o r s c h u n g , W i e s b a d e n 1986 BEREKOVEN, L./ECKERT, W./ELLENRIEDER, P. (1987): M a r k t f o r s c h u n g . . . , 3. A u f l . , W i e s b a -
den 1987 2. englischsprachige Schriften Cox, E.P. III (1979): Marketing Research, New York 1979 MCGOWN, K.L. (1979): Marketing Research, Cambridge/Mass. 1979 BROWN, F. E. (1980): Marketing Research, Reading 1980 DODGE, H./FULLERTON, S./RINK, D . (1982): M a r k e t i n g R e s e a r c h , C o l u m b u s 1982
KRESS, G. (1982): Marketing Research, 2nd ed., Boston 1982 NELSON, J. E. (1982): The Practice of Marketing Research, Boston 1982 HARTLEY, R . F./PROUGH, G . E./FLASCHNER, A . B. (1983): E s s e n t i a l s o f M a r k e t i n g R e s e a r c h ,
Tulsa 1983 WEIERS, R.M. (1984): Marketing Research, Englewood Cliffs 1984 BOYD, H . W . jr./WESTFALL, R./STASCH, S. F. (1985): M a r k e t i n g R e s e a r c h , 6 t h e d . , H o m e -
wood 1985 LEHMANN, D . R . (1985): Market Research and Analysis, 2nd ed., Homewood 1985 AAKER, D. A./DAY, G . S . (1986): Marketing Research, 3rd ed., New York 1986
PARASURAMAN, A. (1986): Marketing Research, Reading 1986 WORCESTER, R. M./DOWNHAM, J. (ed.) (1986): Consumer Market Research Handbook, 3rd ed., Amsterdam 1986 ZIKMUND, W.G. (1986): Exploring Marketing Research, 2nd ed., Hinsdale 1986 CHURCHILL, G. A. jr. (1987): Marketing Research, 4th ed., Chicago 1987 DILLON, W. R./MADDEN, T.J./FIRTLE, N . H . (1987). M a r k e t i n g R e s e a r c h in a M a r k e t i n g
Environment, St. Louis 1987 KINNEAR, T. C./TAYLOR, J. R. (1987): Marketing Research, 3rd ed., New York 1987 LUCK, D. J./RUBIN, R.S. (1987): Marketing Research, 7th ed., Englewood Cliffs 1987 TULL, D.S./HAWKINS, D.I. (1987): Marketing Research, 4th ed., New York 1987 CHURCHILL, G. A. jr. (1988): Basic Marketing Research, Chicago 1988
Kapitel 2
Kapitel 2
Meßtheoretische Grundlagen
9
Meßtheoretische Grundlagen
In Abschnitt 1 dieses Kapitels werden einige „meßtheoretische Grundlagen" im engeren Sinne behandelt: die Definition von „Messung" und verschiedener „Meßniveaus". Der Abschnitt 2 wendet sich dann dem Problem der Genauigkeit zu; die verschiedenen Arten von „Fehlern" werden diskutiert und Klärungen der Begriffe „Reliabilität" und „Validität" vorgenommen. Im Abschnitt 3 sind zunächst die Stadien des (Markt-)Forschungsprozesses und sodann die verschiedenen Research Designs zu erörtern. Den Abschluß bildet ein Exkurs über die „MetaAnalyse".
2.1 Messung und „Meßniveau" („Skalenniveau") Als „Messung" kann man die - nach bestimmten Regeln vorzunehmende - Zuordnung von Symbolen (Zahlen oder Zeichen) zu Objekten bezeichnen. Das Ergebnis der Messung sind also die Daten. (S. dazu auch die Einführung zu T. III.). Man könnte diese auch als „Meßwerte" bezeichnen. Dieser Begriff ist jedoch in verschiedener Hinsicht mißverständlich; in gewisser Weise gilt dies auch für den Ausdruck „tatsächliche Werte"; im folgenden wird deshalb - obwohl auch nicht ganz eindeutig; s. dazu Kap. 5 - von „Beobachtungsv/eiten" (observed values) gesprochen.
Diese „Objekte" werden im folgenden als Elemente bezeichnet. Das entspricht dem - zwar nicht unbedingt schönen, aber doch treffenden - Sprachgebrauch. Der Begriff „Objekte" ist insofern mißverständlich, als dies (zumal in der Marktforschung!) oft „Subjekte", insbesondere Personen, sind. Auch auf den in diesem Zusammenhang oft verwendeten Ausdruck „Einheit" wird verzichtet. Er scheint mehrdeutig: „Da die benutzte Einheit in jeder Phase der praktischen .. Arbeit wechseln kann, ist zwischen Erhebungs-, Aufbereitungs- und Darstellungseinheiten ... zu unterscheiden." (HÜTTNER 1973, S. 47.) Traditionell findet in der Statistik allerdings auch die Bezeichnung Merkmalsträger Anwendung.
Diese Elemente oder Merkmalsträger sind durch eine Reihe von Merkmalen gekennzeichnet, die jeweils in mindestens 2 Ausprägungen vorkommen. (Andernfalls wären es keine Merkmale!) Im folgenden wird dafür die Bezeichnung Variable gebraucht. Früher herrschte die Einteilung dieser Merkmale in quantitative und qualitative vor. Erstere wurden dann noch unterteilt in diskrete und kontinuierliche („stetige"). Das Kriterium dafür ist, ob die einzelnen Ausprägungen nur bestimmte oder alle möglichen Werte annehmen können. Letzteres wird in vielen Verfahren der insbesondere „multivariaten" - Datenanalyse (in Gestalt von „Normalverteilung") oft angenommen, obwohl in der Praxis im strengen Sinne rein kontinuierliche Merkmale selten vorkommen.
10
Teil I
Grundlagen
So werden bestimmte Zwischenwerte schon durch die Festlegung der Maßeinheit oder aus erhebungstechnischen Gründen ausgeschlossen. Selbst wenn man etwa das Merkmal „Umsatz" bis hinunter auf die Maßeinheit „Pfennige" erfassen würde, so sind dadurch einerseits weitergehende Zwischenwerte ausgeschlossen; andererseits wird vor allem aus praktischen Erwägungen eine Rundung auf z.B. volle 1000 DM erfolgen. Dennoch bleibt der Unterschied (man spricht deshalb bisweilen auch von „fast stetig") zu eindeutig diskreten Merkmalen, wie etwa Anzahl der Beschäftigten, unverkennbar. Heute erscheint diese Einteilung als nicht mehr ausreichend; vielmehr ist es, nach STEVENS (1946), üblich geworden, 4 verschiedene Meßniveaus - häufig als „Skalenniveaus" bezeichnet - zu unterscheiden: 1. Nominalskala Hierbei erfolgt eine Klassifizierung, ten.
d. h. Z u o r d n u n g von Kategorien bzw.
Attribu-
Beispiel 2-1 1. Familienstand (z.B. „verheiratet"); 2. Attribute bei der Qualitätskontrolle: „gut"/„schlecht" bzw. „brauchbar"/„nicht brauchbar" (dichotomes oder alternatives Merkmal: Ausprägung 0 oder 1); 3. Beruf. In dem zuletzt genannten Falle, bei vielen Merkmalsausprägungen, entsteht das Problem einer sinnvollen „Reihung", da die alphabetische Anordnung in der Regel unbefriedigend sein wird. Es muß nach einem sachlich sinnvollen Ordnungsprinzip gesucht werden, einer „systematischen" Ordnung (etwa: Metallberufe, Holzberufe usw.). Eine solche bezeichnet man als ,,Systematik" oder ,,Klassifikation". Formal wird dabei heute zumeist das Prinzip der Dezimalklassifikation verwandt.Diese Zuordnung von Zahlen ändert aber nichts am Charakter der Messung. Es sei allerdings daraufhingewiesen, daß eine 0/1-Variable - abhängig vom konkreten Fall - auch als auf einem höheren Niveau skaliert angesehen werden kann. Nominalskalierte Variable erlauben n u r eine sehr eingeschränkte statistische Verarbeitung. Neben der Auszählung der absoluten und relativen Häufigkeit k o m m t als Mittelwert nur der Modus (die Kategorie mit der höchsten Anzahl von Elementen) in Frage. Ferner können, bei bi- u n d multivariaten Verfahren, bestimmte Kontingenzmaße berechnet u n d mittels der Chi-Quadrat-Analyse „Signifikanztests" vorgenommen werden; s. dazu III. Teil. 2. Ordinalskala Es erfolgt lediglich die Zuweisung von Rangziffern;
sie ermöglicht eine „ A n o r d -
n u n g " (allerdings ohne Definition der Intervalle). Beispiel 2-2 1. die herkömmliche Notenskala. (Der „Besitzer" einer „2" kann nicht als „doppelt so klug" wie der einer „4" bezeichnet werden!) 2. Produkteinschätzungen (A wird gegenüber B präferiert).
Kapitel 2
Meßtheoretische Grundlagen
11
Die Ordinalskala erlaubt bereits weitergehende statistische Auswertungen: Zentralwert, Perzentile usw.; s. Kap. 3. Im III. Teil werden ferner darüber hinausgehende Techniken erörtert (auch solche, die die Verwandlung in einen „metrischen" Output erlauben). Sofern die Anzahl der zu vergebenden Rangplätze geringer ist als die der vorhandenen Elemente (z. B. 25 Examenskandidaten) ergeben sich allerdings Probleme; die Ränge müssen dann aufgeteilt werden (Bindungen „ties"). 3. Intervallskala Die Messung erfolgt in konstanten Einheiten (allerdings ohne festen Nullpunkt). 4. Verhältnisskala („Ratio-Skala") Die Messung erfolgt in konstanten Einheiten und mit festem Nullpunkt. Verhältnisskalen (z. B. Temperaturmessung in Grad Celsius) bilden die „höchste" Form und erlauben sämtliche statistischen Berechnungen. Das gilt auch z. B. für das harmonische und geometrische Mittel sowie den Variationskoeffizienten. Diese Maße sind bei intervallskalierten Daten gegebenenfalls irreführend. Ansonsten bestehen hinsichtlich der Auswertbarkeit kaum Unterschiede: So sind arithemische Mittel, Standardabweichungen, Maßkorrelationskoeffizienten usw. berechenbar. Man kann deshalb die letztgenannten beiden Formen zusammenfassen und sie als „kardinales Meßniveau" dem „ordinalen" und „nominalen" gegenüberstellen. Faßt man die beiden zuletzt genannten ebenfalls zusammen unter der Bezeichnung „nicht-metrisch" - bisweilen, so bei bestimmten Verfahren der Interdependenzanalyse (s. Kap. 12), wird allerdings darunter auch explizit nur eine Rangordnung verstanden! - , so ergibt sich lediglich noch eine Zweiteilung, in der Gegenüberstellung zu „metrisch". S. dazu A(ufgabe) 2-1.
2.2 Das Problem der Genauigkeit Im Laufe des Marktforschungsprozesses kann - wie bei jeder empirischen Untersuchung - eine Vielzahl von Fehlern entstehen. Darauf muß in der Sach-Diskussion in späteren Kapiteln noch jeweils hingewiesen werden. Hier geht es zunächst mehr nur um die grundsätzlichen Arten von Fehlern.
2.2.1 Die Arten von Fehlern Messungen - selbst an nur einem Element - erbringen in der Regel nicht den „wahren Wert" („true" oder - weiter unten - auch „actual value"). Vielmehr ist dieser überlagert durch den Fehler („error", symbolisch oft e oder e). Dieser kann
12
Teil I
Grundlagen
nun - was häufig angenommen wird - einem Zufallsprozeß folgen, „white noise" („weißes Rauschen") darstellen; er mag aber auch systematisch verzerrt sein, einen „bias" aufweisen. Die erste Art, der Zufallsfehler, kann - im weiteren Sinne - auch die „zufallsähnlichen Meßfehler" einschließen (die zumeist auch bei wiederholten Messungen eines einzigen Tatbestandes entstehen und auf vielerlei „Meßungenauigkeiten" zurückzuführen sind). Im engeren Sinne kann er aber auch nur darauf abstellen, daß statt der Grundgesamtheit im Gesamtumfange N nur eine (Zufalls-) Stichprobe von n untersucht wird; dieser Fehler ist mittels der Formeln der mathematischen Statistik berechenbar (s. Kap. 3) und kann auch als „Stichprobenfehler" - im engeren Sinne („sampling error") - bezeichnet werden. Im weiteren Sinne kann man hierzu aber auch diejenigen Fehler rechnen, die durch fehlerhafte Handhabung des Auswahlverfahrens bzw. der Auswahltechnik und falsche Behandlung der Stichprobe entstehen; sie werden im folgenden als Auswahlfehler bezeichnet. Dabei handelt es sich im Prinzip um systematische Fehler (von zufallsähnlich verlaufenden Fehlern wird abgesehen); solche kommen vor allem aber auch im weiten Bereich des „nonsampling error" vor. Von einer Aufzählung oder Systematisierung der vielen möglichen Fehlerquellen im Bereich des „nonsampling error" oder allgemeiner des systematischen Fehlers wird, wie angedeutet, abgesehen. S. dazu aber etwa ENIS/YU (1983) mit einer 3 x 3-Matrix (in den Zeilen: ProjektDesign, Datengewinnung, Datenanalyse, in den Spalten: Marktforscher, Instrument, Auskunftsperson). Auch muß daraufhingewiesen werden, daß die Terminologie in der Literatur sehr uneinheitlich ist. Das trifft auch für die Werke d. Verf. zu; so war in den früheren Auflagen dieses Buches der Gegenpol zum systematischen Fehler als „Auswahlfehler" bezeichnet worden.
Eine Zusammenfassung gibt Darst. 2-1. Zufallsfehler i.w.S. (random error) zufallsähnliche Meßfehler
systematischer Fehler (bias)
Zufallsfehler i.e.S. Stichprobenfehler i.e.S. (sampling error)
Auswahlfehler
Stichprobenfehler i.w.S. Darst. 2-1:
Arten von Fehlern
sonstiger „non-sampling error"
Kapitel 2
Meßtheoretische Grundlagen
13
2.2.2 Reliabilität und Validität Es ist üblich geworden, bezüglich der Genauigkeit empirischer Meßinstrumente zwischen der im formalen Sinne, der Reliabilität oder „Zuverlässigkeit" („reliability"), und der im materiellen Sinne, der Validität oder „Gültigkeit" („validity"), zu unterscheiden. Dabei kann der Bezug zur Differenzierung der Fehler in „zufällige" und „systematische" hergestellt werden: Ein Meßinstrument ist reliabel, wenn es bei wiederholten Messungen das gleiche Ergebnis erbringt; Reliabilität liegt also in dem Maße vor, in dem die Messungen frei von „Zufallsfehlern" sind. Dagegen gilt ein Meßinstrument dann als valide, wenn es gerade das mißt, was gemessen werden soll; Validität liegt also in dem Maße vor, in dem die Messungen frei von „systematischen Fehlern" sind. Darst. 2-2 gibt eine anschauliche Zusammenstellung der Zusammenhänge. Reliability? Yes
No
14
Teil I
Grundlagen
Sowohl Validität als auch Reliabilität liegt vor im Fall A, weder das eine noch das andere bei D. C zeigt Reliabilität, aber keine Validität, B umgekehrt Validität bei fehlender Reliabilität. Es ist zu beachten, daß bei B der „wahre Wert" - als Durchschnitt - getroffen wird, obgleich alle 4 Einzelmessungen „daneben gehen". Obwohl auch etwa HARTLEY/PROUGH/ FLASCHNER ( 1 9 8 3 ) Validität ohne das Vorliegen von Reliabilität als möglich erachten, wird hieraus verständlich, daß man mitunter Reliabilität als zwar noch nicht hinreichende, aber doch notwendige „Bedingung für das Vorhandensein von Validität" (HILDEBRANDT 1984, S. 42) ansieht. Dann müßte allerdings Validität auch anders definiert werden, als Ausmaß der Freiheit von systematischen und Zufallsfehlern. (So etwa KINNEAR/TAYLOR 1 9 8 7 , S. 6 9 4 . )
Die Erfassung kann nun jeweils in verschiedenen Formen erfolgen. Bei der Reliabilität sind diese bzw. die dafür verwendeten Bezeichnungen noch einigermaßen übersichtlich. Es sind das im wesentlichen: 1. Test-Retest-Reliabilität. Hierunter versteht man die Korrelation mit einer Wiederholungsmessung zu einem späteren Zeitpunkt, Damit entspricht diese Form unmittelbar der allgemeinen Definition der Reliabilität. Sie hat aber auch ihre Grenzen: Die Ergebnisse hängen von der Länge der dazwischenliegenden Zeit ab (zumal externe Faktoren nicht kontrolliert werden), und durch die Wiederholung können bei den einzelnen Elementen „Lerneffekte" auftreten.
2. Parallel- Test-Reliabilität. Hierbei erfolgt die Vergleichsmessung mit einem zweiten - äquivalenten - Meßinstrument zum gleichen Zeitpunkt. 3. Interne-Konsistenz-Reliabilität. „Internal Consistence" (oder „Interitem Consistency") wird nachgewiesen durch die Korrelation zwischen Teilen eines Meßinstruments; geprüft wird also die Einheitlichkeit eines - z. B. in zwei Hälften („split h a l f ) - geteilten Instruments. Empirisch erfolgt die Berechnung von sog. Reliabilitätskoeffizienten; im Kern handelt es sich dabei um Korrelationskoeffizienten (s. Kap. 10). Sie sollten vergleichsweise hoch sein(jedenfalls höher, als man das bei „normalen" Korrelationskoeffizienten üblicherweise erwartet). Außerordentlich divergierend sind die Formen und die Bezeichnungen dafür bei der Validität. H O S S I N G E R (1982, S. 16ff.) gibt einen Literaturüberblick, aus dem hervorgeht, daß beinahe jeder Autor andere Ausdrücke verwendet; er faßt sie später (S. 12, Abb. 35, mit Synonyma) zusammen in vier Gruppen. Eine Gruppenbildung wird auch im folgenden vorgenommen, in 3 Gruppen mit jeweils 2 Unterformen: 1. Inhalts-Validität („content validity"). Hierbei geht es darum, inwieweit die Meßinstrumente inhaltlich, d.h. sachlich und logisch, geeignet sind. Dies kann entweder einfach durch eine Art „Plausibilitäts-Prüfung" geschehen (Augenschein- bzw. ,,Face"-Validität) oder, etwas strenger, mittels der Beurteilung durch Experten (Experten-WValidität).
Kapitel 2
Meßtheoretische Grundlagen
15
2. Konstrukt-Validität („construct validity"). Als Konstrukt- Validität kann man das Ausmaß der Beziehungen zwischen einem theoretischen Konstrukt und dem Konzept seiner empirischen Messung bezeichnen. Diese Beziehung kann in zweifacher Hinsicht erfaßt werden: einerseits als der Grad, in dem die Meßkonzeption in Richtung des Konstruktes „konvergiert" (man spricht dann auch von Konvergenz- Validität), zum zweiten - umgekehrt - als der Grad, in dem andere Konstrukte bei der Messung ausgeschlossen sind (Diskriminanz-Walidität). Die Messung der Konvergenz- und Diskriminanz- Validität (und damit der Konstrukt- Validität) kann durch Auswertung der Korrelationen zwischen den Elementen einer „MM-Matrix" erfolgen (s. CAMPBELL/FISKE 1959). Eine solche „Multitrait-Multimethod-Matrix" (oder „Multimerksmals-MultimethodenMatrix") enthält in der einen Richtung - etwa den Zeilen - die verschiedenen Konstrukte (oder Merkmale), in der anderen die unterschiedlichen Meß-Methoden. In der praktischen Marktforschungstätigkeit wird das aus Kostengründen schwer durchzuführen sein; man sollte dann zumindest nach einer anderen Form der empirischen Validierung streben: 3. Kriteriums-Walidität („criterion validity"). Auch diese Form kann in zwei unterschiedlichen Ausprägungen auftreten: Bei der Prognose- oder Vorhersage-Validität („predictive validity") wird auf die Übereinstimmung mit zeitlich später erfolgenden Messungen abgestellt. (Von der Validierung von Prognose-Modellen an den damit erstellten Prognosen für eine bestimmte Prognosedistanz und mit einem definierten Fehlermaß - ist z.B. ausführlich im Buch d. Verf.: Prognoseverfahren und ihre Anwendung [HÜTTNER 1986c] Gebrauch gemacht worden.) Werden dagegen mehrere Messungen zum gleichen Zeitpunkt verglichen, so spricht man auch von Konkurrent-Validität („concurrent validity"). Hierzu kann man auch die Kreuz-Validierung Kap. 10 und 13.
(„cross-validation") rechnen; s. dazu in
2.3 Forschungsprozeß und „Research Design" 2.3.1 Die Stadien des Marktforschungsprozesses Oben, in Kap. 1, wurde Marktforschung als der „systematische Prozeß der Gewinnung und Analyse von Daten für Marketing-Entscheidungen" definiert. Als Prozeß ist sie damit durch verschiedene „Stadien" (oder „Phasen" oder „Schritte") gekennzeichnet. Über diesen Prozeß-Charakter besteht im Grunde Einmütigkeit; die einzelnen Stadien werden jedoch teils verschieden beschrieben. So wird in der amerikanischen Literatur (in Anleh-
16
Teil I
Grundlagen
nung an die „berühmten" 4 P's des Marketing-Instrumentariums - „Product", „Price", „Promotion", „Place") von den „5 P's of Marketing Research: Purpose, Plan, Performance, Processing, Presentation" (HARTLEY/PROUGH/FLASCHNER 1983) gesprochen. NIESCHLAG/DICHTL/HÖRSCHGEN ( 1 9 8 5 , S . 6 3 3 ) unterscheiden folgende Phasen: Definitionsphase (Problemformulierung), Designphase (Konzeptualisierung), Feldphase (Datenerhebung), Analysephase (Auswertung und Interpretation der Ergebnisse), Kommunikationsphase (Transfer der Ergebnisse).
Hier soll ebenfalls von 5 Phasen ausgegangen werden. Drei davon sind bereits in der obigen Definition enthalten, zunächst ganz explizit „Datengewinnung" und „Datenanalyse", schließlich aber auch „Dokumentation, Interpretation und Anwendung". Diesen Phasen voran geht die „Definition und Klärung des Problems" und das „Design". Damit ergeben sich insgesamt die „5 D's der Marktforschung", gemäß Darst. 2-3. Definition
I Design
I Datengewinnung
I Datenanalyse
I Dokumentation Darst. 2-3:
Stadien des Marktforschungsprozesses („Die 5 D's der Marktforschung")
Die Phasen 3 (Datengewinnung) und 4 (Datenanalyse) werden in Teil II und III ausführlich behandelt. Etwas zu sagen bleibt hier zunächst zur letzten Phase, der Dokumentation: Sie besteht zuvörderst aus der Abfassung des Forschungsberichts. Seine Bedeutung liegt darin, daß er Schlußstein und Krönung der gesamten Erhebung ist und schließlich auch die sichtbare Leistung, die dem Auftraggeber als Gegenwert für eine u. U. nicht unerhebliche Zahlung zur Verfügung gestellt wird. Die Abfassung des Forschungsberichts sollte deshalb grundsätzlich nur ersten Kräften, insbesondere guten Stilisten (Allgemeinverständlichkeit, wenigstens in bezug auf das Management!) überlassen werden, wenngleich natürlich - zumindest auf die Dauer noch so gut geschriebene bzw. aufgemachte Berichte einen Mangel an sachlichen
Kapitel 2
Meßtheoretische Grundlagen
17
Leistungen nicht auszugleichen vermögen. Bestandteile des Forschungsberichts sind: 1. Titelseite, Inhaltsverzeichnis und Vorwort. Die Titelseite enthält neben dem Titel selbst weitere Angaben, wie D a t u m , Auftraggeber usw. Das Inhaltsverzeichnis kann ergänzt werden durch eine Liste der Tabellen und sonstigen Darstellungen. D a s Vorwort schließlich wird kurze Angaben über Zweck und U m fang des Auftrages, die grundsätzliche Anlage der Untersuchung usw. enthalten.
2. Zusammenfassung der Resultate. Die Zusammenfassung der Resultate erfolgt vielfach nicht am Ende, sondern am A n f a n g des Berichts (und oft dazu noch auf andersfarbigem Papier). Dabei empfehlen sich straffe Gliederung und Übersichtlichkeit.
3. Hauptteil. Der Hauptteil enthält neben den Ergebnissen oft - sofern nicht im A n h a n g - Ausführungen über die Methodik.
4. Anhang. Der A n h a n g sollte die verwendeten Formulare - Fragebogen usw. - enthalten, ferner notwendige methodische Erörterungen und evtl. die detaillierte Wiedergabe von im Hauptteil zusammengefaßten Material etc.
Die Dokumentation, im Sinne der bisher diskutierten schriftlichen Niederlegung (bei der in zunehmenden Maße, speziell auch hinsichtlich der Ergebnisdarstellung in Tabellen und „Charts", EDV-Unterstützung erfolgt) kann verbunden sein mit einer mündlichen Präsentation. Sie ist generell von großer Bedeutung. (Bei H Ü T T NER [1986c, S. 301] findet sich deshalb eine „Präsentations-Checklist", die - obzwar ausgehend von der Literatur zur Prognose und auf diese abstellend - sinngemäß auch für die Marktforschung allgemein verwandt werden kann.) Ferner ist darauf hinzuweisen, daß grundsätzlich zwischen der reinen Darstellung der Ergebnisse und deren Interpretation unterschieden werden sollte. (Deshalb wird hier auch auf den Begriff „Auswertung" - weil mißverständlich; s. dazu A 2-2 - verzichtet:) Beispiel 2-3 (Quelle: LUCK/RUBIN 1987, S. 377f. - freie Übersetzung d. Verf.) Bezüglich der Daten aus einer Umfrage über die Einstellungen von Hausfrauen zu Gasund Elektroherden (s. auch Beisp. 4-14 - d. Verf.) ergab sich folgender Disput zwischen Marktforscher und zuständigem Manager: Marktforscher: Sehen Sie diese Antworten auf die Frage: „Falls Sie einen - komplett modern ausgestatteten - Elektroherd kaufen würden, wie hoch könnte der Preis d a f ü r vermutlich sein? Desgleichen für einen entsprechenden Gasherd?" Der durchschnittliche Preis für Elektroherde war 258 $ und für Gasherde 205 $. Ich würde meinen, d a ß dies einen Vorteil für G a s zum Ausdruck bringt. Manager: Ich meine dies überhaupt nicht. Es scheint mir, daß es vielmehr zeigt, d a ß die meisten Frauen sich gerade keinen Gasherd vorstellen können, der alle Eigenschaften eines modernen Elektroherdes hat. Deshalb ist dies ein Zeichen gegen Gas.
18
Teil I
Grundlagen
Die Analyse des Marktforschers allein aufgrund der Daten war zweifellos angemessen. (Von einer eventuellen Unklarheit in der Fragestellung wird hier abgesehen. D. Verf.) Sie war jedoch unangemessen im Lichte zusätzlicher Information, wie sie vom Manager in die Diskussion eingeführt wurde.
Daraus folgt schon, daß die Frage, in wessen Bereich - den des Erstellers von Marktforschungsergebnissen („Doer") oder des Nutzers („User") - AnwendungsEmpfehlungen fallen, umstritten ist. (Probleme der Anwendung werden im Teil IV - „Sachgebiete" - und V - „Organisation" - behandelt. Im letzteren wird auch, hinsichtlich des „Erstellers", zwischen betrieblicher und Instituts-Marktforschung unterschieden. Auf diesen Unterschied sollte auch bei den folgenden Ausführungen - wie auch den vorausgegangenen, zum „Forschungsbericht" - geachtet werden.) Diese Frage der „Empfehlungen" bzw. der dafür notwendigen - zusätzlichen Information gilt zunächst für den Forschungsbericht selbst: Soll dieser sich auf die reine Dokumentation beschränken oder aber Vorschläge zur künftigen Betriebspolitik enthalten? Einerseits wird man es für richtig halten können, daß ein Institut - und noch stärker vielleicht ein betrieblicher Marktforscher - nicht bei der reinen Deskription stehen bleibt, sondern auch Schlußfolgerungen aus den ermittelten Sachverhalten zu ziehen und damit Empfehlungen zu geben versucht. Andererseits wird man einwenden müssen, daß das Institut mit den Belangen des Betriebes nur insoweit vertraut ist, als es zur Durchführung der Erhebung erforderlich war, einen tiefergehenden Einblick aber in der Regel nicht hat und die Erarbeitung der Konsequenzen deshalb besser dem Betrieb selbst überläßt. Auf jeden Fall aber sollten solche Empfehlungen abgesetzt von der reinen Dokumentation vorgebracht werden. Diese Trennung kann formal soweit gehen, daß dafür ein besonderes, zusätzliches Honorar vereinbart wird - ein Ausdruck für die Tatsache, daß der Marktforscher (als „Doer") die Funktion eines Betriebsberaters (als „User") übernimmt. Diese Frage eventueller zusätzlicher Informationen hat auch Bedeutung für die beiden ersten Phasen des Marktforschungsprozesses, die der Definition und des Designs. Eher ,,technisch" - und zusammenfassend - kann man hierzu folgendes sagen: 1. Die sehr wichtige und häufig in ihrer grundsätzlichen Bedeutung unterschätzte Definition und Klärung des Problems ist der erste Schritt bei der Vornahme einer Marktanalyse. Dabei ist es wesentlich, daß das Problem in seiner vollen Größe und Tragweite erkannt wird, d.h. eingebettet in den größeren und umfassenden Rahmen des Marketingproblems, innerhalb dessen es auftritt. Diesen Unterschied zwischen ( M a r k t ^ / w i c / ; wigsproblem und (Marketing-) Entscheidungsproblem demonstriert CHURCHILL (1987, S. 35) an folgendem Fall:
Kapitel 2
Meßtheoretische Grundlagen
19
Beispiel 2-4 Eine renommierte Chicagoer Tageszeitung mußte in den 70er Jahren ihr Erscheinen einstellen, letztlich als Folge von Marktforschungsresultaten. („Yes, it was market research that ultimately killed the ,Chicago Daily News"' - Cappo in „Marketing News" vom 11.1.1980.) Offensichtlich war jedoch das generelle Entscheidungsproblem falsch definiert worden, nämlich: wie die Auflage zu vergrößern sei - anstatt: wie man sich noch besser auf das Marktsegment ausrichten könne, das bisher bedient wurde. Im Ergebnis verschob die Zeitung ihre Orientierung, was zu ihrem Niedergang führte.
Ist das grundsätzlich Marktforschiingsproblem - im Rahmen des allgemeinen Marketingproblems - definiert und geklärt, so muß es in die Einzelprobleme zerlegt, d. h. festgestellt werden, welche Informationen im einzelnen zu beschaffen sind. Eng damit verbunden ist die Durchführung einer Leitstudie: 2. Unter einer Leitstudie („pilot study") versteht man eine formlose Untersuchung, die - gewissermaßen im „vorstatistischen Bereich" - durch Heranziehung alles geeigneten Materials (Branchen-, Firmen-, Marktberichte, Material der amtlichen Statistik, der Handelskammern und Verbände usw.), aber auch durch Befragung von leitenden Angestellten, von Experten, vielleicht auch von einigen Verbrauchern, zur Klärung des Problems beiträgt und feststellt, welche Aufgaben im Rahmen dieses Problems für die Marktforschung entstehen. Damit wird zugleich die Grundlage für die Aufstellung des Forschungsplanes gewonnen: 3. -
Der Forschungsplan besteht aus drei Teilplänen: Arbeitsplan Zeitplan Kostenplan
Der Arbeitsplan enthält die erforderlichen Arbeiten (soweit sie sich in diesem Stadium bereits übersehen lassen) und die Zuteilung dieser an die einzelnen Mitarbeiter. Aus dem Arbeitsplan ergibt sich unmittelbar der Zeitplan, der die Termine festlegt. Grundsätzlich muß dabei sehr vorsichtig verfahren werden, da im Laufe der Untersuchung neue Probleme auftreten können, die zu einer entsprechenden Verzögerung führen. Ein formales Hilfsmittel hierfür ist die Netzplantechnik. Sie existiert in verschiedenen Varianten', die Literatur darüber ist umfangreich. Deshalb muß auf eine Darstellung hier verzichtet werden. S. aber zum Verfahren grundsätzlich etwa SCHWARZE 1986, zu einem Anwendungsbeispiel im Rahmen der Marktforschung LUCK/RUBIN 1987, S. 325ff.)
Aus Arbeits- und Zeitplan zusammen wiederum ergibt sich der Kostenplan. Für den Fall der Durchführung einer Umfrage durch ein Marktforschungsinstitut ist er insbesondere dann von Bedeutung, wenn nicht, wie teilweise üblich, mit Pauschalpreisen gearbeitet, sondern jeder Auftrag individuell kalkuliert wird. Auf die Kalkulationsmethoden der Institute kann hier nicht näher eingegangen werden. Es sei
20
Teil I
Grundlagen
nur soviel festgehalten, daß ein großer Teil der Kosten Fixkosten sind, nämlich insbesondere die auf die Phasen der Vorbereitung, der Datengewinnung sowie der Datenanalyse entfallenden Gehaltskosten und die Kosten für die maschinellen Anlagen im Rahmen hauptsächlich der Analyse. Dagegen sind die Aufwendungen für die Interviewer, die einen erheblichen Teil der Gesamtkosten ausmachen, dem Grundsatz nach variable Kosten. Es liegt deshalb nahe, die Preise nach der Anzahl der Interviews zu bilden: (Kosten pro Interviews + Erfahrungssatz für sonstige Kosten) x Anzahl der Interviews bzw. Kosten pro Interview x Anzahl der Interviews x Faktor für sonstige Kosten. Statt dieser sehr vereinfachten Kalkulation bemühen sich nicht wenige Institute um eine detaillierte Kostenrechnung mit möglichst weitgehender Trennung von Einzel- und Gemeinkosten und damit möglichst genauer Zurechnung der Kosten auf den einzelnen Auftrag.
2.3.2 Die verschiedenen „Research Designs" Begrifflich k a n n m a n als „Research Design" dic grundsätzliche Anlage von Untersuchungen bezeichnen, die maßgeblich ist f ü r die A r t u n d Weise der Datengewinn u n g u n d Datenanalyse. Die verschiedenen Arten lassen sich in 2 G r u p p e n zusammenfassen: experimentelle u n d deskriptive Designs. Auf die - bisweilen anzutreffende - Übersetzung von Research Design mit „Forschungsdesign" wird verzichtet (nicht zuletzt wegen der - in Kap. 1 diskutierten - Problematik des Ausdrucks „Forschung"). Nicht selten wird eine dritte Gruppe hinzugefügt: „explorative" Studien. (S. zum Begriff „explorativ" und speziell „explorative Datenanalyse" auch unten.) WEIERS 1984 nennt sogar eine vierte Gruppe: „predictive". 1. Experimentelle Designs sind nach M e i n u n g d. Verf. (derzeit noch?) die einzigen, die im strengen Sinne die Zurechnung von „ W i r k u n g e n " gestatten. D a r a u f wird ausführlich in Kap. 6 eingegangen. Insofern hätte hier auch die - von verschiedenen Autoren verwendete - Bezeichnung „kausale" Studien benutzt werden können. Der Begriffist jedoch etwas mißverständlich. So kann auch die sog. Kausalanalyse allenfalls der „konfirmatorischen Analyse" (s. dazu unten) zugerechnet werden; vgl., unter einer etwas weniger mißverständlichen Bezeichnung, 13.2. 2. Bei den deskriptiven Designs k a n n m a n zunächst zwischen Primär- u n d Sekund ä r f o r s c h u n g unterscheiden. Primärforschung liegt vor, wenn Material eigens f ü r die U n t e r s u c h u n g erhoben wird; bei der Sekundärforschung wertet m a n lediglich bereits vorhandenes Material f ü r die U n t e r s u c h u n g aus; s. dazu K a p . 8. Abzulehnen ist jedoch die vielfach anzutreffende Gleichsetzung dieser Begriffe mit der Unterscheidung in Feldforschung (field research) und Schreibtischforschung (desk research), da auch bei der Primärerhebung „Schreibtischarbeit" zu leisten ist, ja, umgekehrt, die „Feldarbeit", die Tätigkeit der Interviewer etc., im technischen Ablauf sogar nicht einmal den größten Teil ausmacht. Andererseits bleibt fraglich, was unter „Feldforschung" eigentlich genau zu verstehen ist (nur die Tätigkeit der Interviewer, auch Probebefragungen, die Kon-
Kapitel 2
Meßtheoretische Grundlagen
21
trolle der Interviews usw.?), so daß auch aus diesem Grunde auf das Begriffspaar im gegebenen Zusammenhang besser ganz verzichtet wird. Insofern ist der Begriff „Datengewinnung" (oder -kollektion) weiter als der der „Datener/zebung": Er umfaßt auch die Sekundärforschung.
Bei der Pn'märforschung kann man wieder zwischen qualitativen und quantitativen Methoden differenzieren. Die Definition dessen, was „qualitative Forschung" (im Unterschied zu „quantitative research") ausmacht, ist schwierig. So nennen bzw. diskutieren - und stellen sie z.T. in Frage - COOK/REICHARDT (1979) 11
„Attributes of the Qualitative and Quantitative Paradigms", darunter „subjetiv vs. objektiv", „valid vs. reliabel"; gelegentlich wird auch nur auf die Zahl der Fälle - „einer bzw. wenige" vs. „viele" - abgestellt (und von „weichen" resp. „harten" Methoden oder Daten gesprochen). Wegen dieser Vielfalt und weil die Aufnahme bzw. Nichtberücksichtigung bestimmter Kriterien in der Definition die „Ladung" in Richtung von Vorurteilen bedeutet, wird hier auf einen Versuch dazu verzichtet. Statt dessen seien lediglich Beispiele für qualitative Verfahren genannt, die in der Marktforschung schon seit langem Verwendung finden. Es sind dies vor allem das ,.qualitative Interview" („Tiefeninterview" - s. dazu 4.2.1) und die „Gruppendiskussion" (s. 4.2.2). Auf die Bedeutung von „Case Research" (und grundsätzliche Fragen - s. im übrigen auch die Literaturhinweise am Schluß dieses Kapitels) ist in jüngerer Zeit BONOMA (1985) eingegangen. Zur „teilnehmenden Beobachtung" und überhaupt „unobtrusive measures" - s. auch in Kap. 6. (Zur Inhaltsanalyse, die explizit in beiden Spielarten, eben auch als „qualitative Inhaltsanalyse" - so schon der Titel von MAYRING [1983] - auftritt, s. in Kap. 9.)
Ansonsten wird in diesem Buch eher - dem „mainstream" folgend - auf die traditionellen („harten") Methoden der empirischen Sozialforschung abgestellt. Ehe dies, schon im folgenden Kapitel, geschieht, sei jedoch - wie bereits angedeutet auf einen anderen, erst in jüngster Zeit hervorgetretenen Begriff eingegangen: den der explorativen Datenanalyse (und, als Entgegensetzung, die „konfirmatorische Analyse"). Er geht auf J.W. Tukey zurück und stellt darauf ab, allein aus den Daten - ohne a priori-Annahmen - verborgene Strukturen und/oder Anomalien aufzudecken. (TUKEY selbst [1977, S. 1] spricht in diesem Zusammenhang von „detective work", LEAMER [1978, S. 7, 286], in etwas anderem Kontext, von „Sherlock Holmes inference"). Insofern geht der Begriff über den der deskriptiven Statistik, in der Gegenüberstellung zur schließenden (inferentiellen) Statistik - s. Kap. 3 - , hinaus. Andererseits folgt der Gegenbegriff der „konfirmatorischen Analyse" dem Schema der „inferentiellen Statistik" (in seiner einfachsten Form - s. die Ableitungen und Beispiele in Kap. 3 - dem Testen von Hypothesen über die Gesamtheit aufgrund der Ergebnisse einer Stichprobe). Es sind also insgesamt 3 Begriffspaare zu unterscheiden, die zwar eng miteinander verwandt, aber eben nicht identisch sind (s. dazu A 2-3): 1. deskriptive und kausale Designs,
22
Teil I
Grundlagen
2. deskriptive und schließende (inferentielle) Statistik, 3. explorative und konfirmatorische Analyse. „Explorative" und „konfirmatorische Modelle" unterscheiden sich nicht nur in bezug auf relativ komplizierte - speziell multivariate - Analyse-Verfahren. (S. dazu etwa die - „herkömmliche" - Faktorenanalyse, in Kap. 12, und die „konfirmatorische Faktorenanalyse", unter 13.2.) Vielmehr hat TUKEY (1977) eine Fülle von Verfahren im Rahmen einfacher Häufigkeitsauszählungen vorgeschlagen. Sie sind allerdings bisher nur wenig in der (statistischen Lehrbuch-)Literatur rezipiert worden; auch in Datenanalyse-Programmsystemen finden sie sich eher selten.
Exkurs: M e t a - A n a l y s e Mit der Z u n a h m e der Zahl empirischer Untersuchungen wächst das Bedürfnis n a c h deren integrierender Darstellung, nach Generalisierung - dies u m so mehr, als sich die Resultate der einzelnen Studien o f t zu widersprechen scheinen. D a s „klassische" Mittel dazu ist der Literaturüberblick-, G L A S S / M C G A W / S M I T H 1981 kennzeichnen diesen „literature review" auch als „ n a r r a t i v " (erzählend); jedenfalls ist er, im Sinne der oben diskutierten Gegenüberstellung, qualitativ. D a s quantitative „ G e g e n s t ü c k " dazu bildet die Meta-Analyse. M a n versteht d a r u n t e r die statistische Analyse der Ergebnisse von Einzel-Studien, die - statistische - „Analyse von Analysen". Der Ausdruck und sein Inhalt wurden von GLASS (1976) geprägt, in Abhebung von der Primär-Analyse, der Original-Untersuchung, und der,,Sekundär-Analyse", der Re-Analyse der Original-Daten. Die Bezeichnung „Re-Analyse" ist wohl zu präferieren. (S. auch A 2-4.) Im Unterschied dazu bezeichnet Replikation die Wiederholung einer Studie (oder einer Messung), liegt also zeitlich später und differiert deshalb, je nach der Länge des dazwischen liegenden Zeitraumes bzw. der sich darin vollziehenden Wandlungen, zwangsläufig in ihren Ergebnissen. D a die Meta-Analyse im G r u n d e nichts anderes darstellt als die Vornahme des (Markt-) Forschungsprozesses auf einer höheren Stufe - deshalb erscheint auch die Bezeichnung so treffend - , gelten d a f ü r auch die oben diskutierten 5 Stadien oder Schritte: 1. Definition. N a c h der K l ä r u n g des grundsätzlichen Forschungsproblemes gehört dazu vor allem die Definition der Variablen, deren Werte in den einzelnen Studien verglichen werden sollen. Folgt man der oft anzutreffenden Auffassung der Meta-Analyse als vornehmlich Dependenz-Analyse, so handelt es sich hierbei um die Festlegung der abhängigen Variablen. In den - im Rahmen des Marketing - noch nicht so sehr zahlreichen Fällen von durchgeführten Meta-Analysen war diese meist von vornherein metrisch (z. B.: Mittelwerte)', theoretisch sind auch Proportionen möglich.
Kapitel 2
Meßtheoretische Grundlagen
23
2. Design. Vielfach wird ein - im formalen Sinne - experimentelles Design vorgeschlagen (s. dazu in Kap. 6), mit eben den Befunden der einzelnen Studien als abhängige Variablen und deren „Besonderheiten" (z. B. in bezug auf Modellspezifikation, Schätzprozedur, Erhebungsmethode) als unabhängige. 3. Datengewinnung. Dieser Schritt beginnt mit der Identifikation der den Gegenstandsbereich betreffenden Studien (z.B. mittels Literaturdatenbank-Recherchen). Sodann muß deren Inspektion erfolgen (die in den Datenbanken möglicherweise enthaltenen „Abstracts" werden oft nicht ausreichen!) und nach der Entscheidung über die Aufnahme in die Analyse die Sammlung der Befunde in bezug auf die abhängigen und unabhängigen Variablen (z. B. in einer - zu dokumentierenden - Liste). 4. Datenanalyse. Grundsätzlich bieten sich, entsprechend der obigen Definition, sämtliche Methoden der Datenanalyse an, so etwa, wie von HUNTER/SCHMIDT/JACKSON ( 1 9 8 2 ) besonders betont, die Korrelationsanalyse. Folgt man jedoch der oben angedeuteten Beschränkung auf die Dependenz-Analyse und legt die Meta-Analyse formal als Experiment an, so kann eine Auswertung mittels ANOVA oder MANOVA erfolgen. (Will man einen RegressionsAnsatz bilden, so könnte die Darstellung der unabhängigen Variablen als 0/1Dummies geschehen.) 5. Dokumentation. Die gewonnenen Ergebnisse sind zusammenzufassen und zu interpretieren. Dabei zeigt sich, inwieweit jetzt schon generalisierende Aussagen möglich sind und/oder die Notwendigkeit weiterer Untersuchungen angezeigt erscheint. Insoweit trägt die Meta-Analyse wesentlich zum Überblick über den Stand der Forschung und der Anregung von deren weiterer Entwicklung bei. Sie ist jedoch auch auf Kritik gestoßen. Eine davon, das „Äpfel- und Birnen-Argument", kann wohl heute als widerlegt gelten: Definiert man als Elemente der Meta-Analyse die einzelnen Studien, dann „vergleicht sie Unvergleichbares" genausowenig oder -soviel wie die Einzel-Analyse, mit - üblicherweise - den Personen als Elementen (die auch durchaus verschieden sind). Damit ist als Grundgesamtheit aber die Anzahl aller Studien über den betreffenden Gegenstand bestimmt. Sie muß zeitlich und räumlich abgegrenzt und ein Auswahlverfahren installiert werden; unveröffentlichte Studien haben dabei aber kaum eine Auswahlchance. Beschränkt man sich zudem - wie wegen der Zugänglichkeit vielfach üblich - auf Veröffentlichungen in Büchern und Zeitschriften, so ergibt sich ferner, wie Untersuchungen zeigten, ein - mit der „Veröffentlichungspolitik" zusammenhängender - systematischer Fehler. Insofern muß wohl auch - zumal, zumindest im deutschen Schrifttum und im Bereich des Marketing, noch kaum Erfahrungen vorliegen - die „Nützlichkeit" des Approach sich erst in Zukunft erweisen. (Vgl. dazu den Schluß bei G L A S S / M C G A W / S M I T H [1981]; s. zu weiterer Literatur auch nachstehend.)
24
Teil I
Grundlagen
Literaturhinweise Im folgenden sollen nur noch einige ergänzende Literaturhinweise - zusätzlich zu denen im Text - gegeben werden. Ganz grundsätzlich mit Fragen der wissenschaftlichen Erkenntnis befaßt sich etwa POPPER (1984). Zu prinzipiellen, mehr formalen Fragen der „Theorie des Messens"
s. PFANZAGL (1971).
Ein Werk, das sich explizit mit der - stark vernachlässigten - Auswertung von qualitativen Daten beschäftigt, ist MILES/HUBERMAN (1984). Neuere Beiträge zur Anwendung qualitativer Methoden in der Marktforschung enthält: ESOMAR (ed.) 1986. Zur
Meta-Analyse
sei noch
hingewiesen
auf
FAIRLEY/LEHMANN
(1986),
HEDGES/OLKIN (1985), ROSENTHAL (1984) u n d WOLF (1986).
Aufgaben 2-1:* Sind, in bezug auf das Meßniveau, die Begriffe „ordinal" und „nicht-metrisch" gleichbedeutend? Oder handelt es sich bei der Ordinal-Skala sogar um eine solche metrischer Art? 2-2:* Wieso ist der Begriff „Auswertung" mißverständlich? 2-3:
Wodurch unterscheiden sich die Begriffspaare a) „deskriptive/kausale Designs" und „deskriptive/schließende (inferentielle) Statistik", b) „deskriptive/schließende (inferentielle) Statistik" und „explorative/ konfirmatorische Analyse"?
2-4:
Wodurch unterscheidet sich die „Sekundärforschung" von der „Sekundäranalyse" (im Sinne von GLASS)?
Kapitel 3
Inferenzstatistische Grundlagen
Im allgemeinen kann die Datengewinnung im Wege der Primärerhebung nicht bei allen in Betracht kommenden Elementen erfolgen; vielmehr muß statt einer Vollmeist nur eine Teilerhebung stattfinden. Auf die damit im Zusammenhang stehenden - theoretischen und praktischen - Probleme der Auswahl der Elemente, also der „Stichproben-Ziehung", wird bei den einzelnen Methoden jeweils eingegangen. (S. dazu für die „Befragung" unter 4.4.) Neben dem „Auswahlfehler" ent* Zu den so gekennzeichneten Aufgaben finden sich Lösungen - gemäß Vorwort - im Anhang (C).
Kapitel 3
Inferenzstatistische Grundlagen
25
steht dabei, wie im vorigen Kapitel dargelegt, ein „Zufallsfehler" (i. e. S. - s. Darst. 2-1); er ist nach den Formeln der mathematischen Statistik berechenbar. Wahrscheinlichkeitstheoretische Überlegungen sind aber - eben weil es sich zumeist um Teilerhebungen handelt - auch für weite Bereiche der Datenanalyse erforderlich. Es wird deshalb für zweckmäßig erachtet (obwohl in den früheren Auflagen noch - wie auch in vielen anderen Lehrbüchern- anders vorgegangen wurde), statt der separaten Behandlung im jeweiligen Sachgebiet in diesem Kapitel eine zusammenfassende Darstellung der „inferenzstatistischen Grundlagen" zu geben. Dies hat auch den Vorteil, daß der statistisch versierte Leser das gesamte Kapitel überschlagen kann. In einem einführenden Abschnitt erfolgt die Definition einiger grundlegender statistischer Begriffe. Im nächsten Abschnitt wird dann auf die Schätzung von Parametern eingegangen; der letzte hat das Testen von Hypothesen zum Gegenstand.
3.0 Einführung: Statistische Deskription - Der statistische „Schluß" bzw. die statistische „Bestätigung" Die Statistische Methodenlehre hat verschiedene „Maßzahlen" zur Beschreibung einer statistischen Masse entwickelt. Eine erste Gruppe bilden solche zur Charakterisierung der zentralen Tendenz {„Mittelwerte" oder „Lokalisationsparameter"). Der bekannteste („berechnete") Mittelwert ist das arithmetische Mittel: 1 » x = - I x, n ¡=i
(3.1)
Die Summierungsgrenzen (hier mit n für die Anzahl der Werte) werden im folgenden sofern eindeutig - ganz fortgelassen oder zumindest verkürzt ( £ ) geschrieben. i
Beispiel 3-1
xt x2 x3 x4 x5
=3 = = = =
5 6 2 4
*6(=n) = 1 !>• = 21 x
=
3,5
(S. dazu auch A 3-1 und -2.)
Die berechneten Mittelwerte (andere sind das „geometrische" und das „harmonische" Mittel) können für nominal- und ordinalskalierte Daten nicht benutzt werden; hierfür finden solche der Lage Verwendung: Der Modus (auch: „dichtes Mittel") ist der häufigste Wert.
26
Teil I
Grundlagen
Das heißt auch, daß der Modus gar nicht oder sogar mehrmals vorhanden sein kann. (S. A 3-3.) Bei gruppierten Daten entspricht er definitionsgemäß der Klasse mit der größten Besetzungszahl. D e r Median ( „ Z e n t r a l w e r t " ) ist d e r mittlere g e o r d n e t e n Werte.
in d e r R e i h e d e r n a c h d e r G r ö ß e
Beispiel 3-2 In der - bereits geordneten - Reihe: 1; 2; 4; 6; 7; ist der Median der Wert des dritten Elements: 4. Bei einer Reihe mit einer geraden Anzahl von Elementen wird als Median üblicherweise das arithmetische Mittel der beiden mittleren Werte genommen. (S. A 3-4.) Für den Fall des Vorliegens bereits gruppierter Daten gilt eine Näherungsformel für die „Berechnung" des Medians. (Streng genommen existiert er dann, wie auch schon im vorgenannten Fall, gar nicht!) In manchen Datenanalyse-Programmsystemen finden diese grundsätzlich Verwendung. A u c h bei d e n M a ß e n z u r K e n n z e i c h n u n g d e r Streuung ( „ d e v i a t i o n " DispersionsParameter) m u ß m a n auf das Skalenniveau achten. N u r für metrische D a t e n a n w e n d b a r ist die Wurzel a u s d e r Varianz, die Standardabweichung: (3.2) ( w i e d e r u m m i t n f ü r die A n z a h l d e r Werte; z u r V e r w e n d u n g v o n n — 1 als D i v i s o r s. u n t e n ) Beispiel 3-3 Für die Werte von Beisp. 3-1 ergibt sich: X;
X: — X
3 5 6 2 4 1
-0,5 1,5 2,5 -1,5 0,5 -2,5
21
0
(Xi - X)2 0,25 2,25 6,25 2,25 0,25 6,25 17,5
(x = 3,5)
(S. auch A 3-5 und 11-1.)
Kapitel 3
Inferenzstatistische Grundlagen
27
Die folgenden beiden Maße können auch zur Kennzeichnung der Streuung bei ordinalem Skalenniveau verwandt werden: Die Spannweite („ränge") ist einfach die Differenz zwischen größtem und kleinstem Einzelwert. (S. dazu auch A 3-6). Der Quartilsabstand („interquartile ränge") dagegen beinhaltet die Differenz zwischen „oberem" (3.) und „unterem" (1.) Quartil; dieses umfaßt 25% der Werte. (Damit baut es auf dem Prinzip des Zentralwerts auf; er trennt die untere von der oberen Hälfte und bildet damit das 2. Quartil. Eine Verallgemeinerung stellen „Perzentile" bzw. überhaupt „Quantile" [„Fraktile"] dar. - S. dazu auch A 3-7.) Arithmetisches Mittel und Standardabweichung entsprechen dem 1. und 2. „Moment" (einer Verteilung). „Höhere" Momente sind Schiefe und Wölbung. Auf deren Darstellung wird hier verzichtet. In manchen Datenanalyse-Programmsystemen werden einschlägige Maßzahlen bereitgestellt; in diesen Fällen sollte dann in dazugehörigen Manuals usw. die Definition erfolgt sein.
Bisher wurde nur von der Beschreibung einer statistischen Masse schlechthin gesprochen. Ausgangspunkt war jedoch, daß statt der Voll- nur eine Teilerhebung stattfindet. Es muß also von dieser „Stichprobe" auf die „Gesamtheit" geschlossen werden - das ist Gegenstand des folgenden Abschnitts 3.1 - bzw., in einer gewissen Drehung des Problems, aufgrund der Ergebnisse der Stichprobe der Test von Hypothesen über die Grundgesamtheit erfolgen - Abschnitt 3.2. Mit dieser Unterscheidung zwischen Stichprobe und Grundgesamtheit wird es notwendig, auch zwischen Stichprobenergebnissen und den „wahren" Werten der Grundgesamtheit („Parameter") zu differenzieren. Zumeist werden für letztere griechische (oder Groß-)Buchstaben benutzt, was etwa folgende Schreibweise ergibt: Mittelwert Standardabweichung Varianz
Grundgesamtheit ¡J. a o1
Stichprobe X s s2
Gelegentlich wird die Differenzierung von der reinen Symbolik auch auf die Bezeichnung ausgedehnt; darauf ist hier verzichtet worden. (So steht etwa „Standardabweichung" synomym für „mittlere quadratische Abweichung".) Begrenzt man die Verwendung der „normalen" Buchstaben im obigen Sinne ausschließlich auf Stichproben (und verwendet sie nicht, wie vorher, gewissermaßen ganz allgemein für die Deskription einer statistischen Masse), so muß in Formel (3.2) - aus Gründen, die später darzulegen sind - als Divisor n — 1 statt n benutzt werden.
3.1 Das Schätzen der Parameter Wie erwähnt, geht es in diesem Abschnitt zunächst darum, aus den Stichprobenergebnissen auf die Parameter der Grundgesamtheit zu schließen, diese zu „schätzen". Infolge des Wirkens des Zufallsfehlers kann aber das aus der Stichprobe
28
Teil I
Grundlagen
berechnete Ergebnis nicht einfach auf die Grundgesamtheit übertragen werden; vielmehr ist nur eine Intervallschätzung möglich. Ein solches Vertrauens- oder Konfidenzintervall kann etwa folgende Form haben: „Mit einer Wahrscheinlichkeit von 95 % liegen die durchschnittlichen Ausgaben für den Artikel A zwischen 8 und 11 D M " (oder, etwas exakter formuliert: In 95 von 100 Fällen wird der „wahre Wert" vom Vertrauensintervall umschlossen). Es enthält also zwei Elemente: das Intervall selbst (auch als Fehlerspanne bezeichnet) und den „Konfidenzgrad" (Genauigkeits- oder Sicherheitsgrad). Er gibt an, mit welcher Wahrscheinlichkeit erwartet werden kann, daß das Ergebnis zutrifft. Im obigen Falle beträgt - salopp ausgedrückt - die Wahrscheinlichkeit dafür, daß der Parameter innerhalb des Intervalls liegt, 95% („ f^riraMe«iwahrscheinlichkeit"). Das bedeutet aber auch, daß mit einer Wahrscheinlichkeit von nur 5% damit zu rechnen ist, daß die durchschnittlichen Ausgaben außerhalb des Bereichs zu finden sind („/rriwwiwahrscheinlichkeit"). Zum Verständnis dieses Sachverhalts sollte man sich zunächst vergegenwärtigen, daß theoretisch aus einer Grundgesamtheit jeweils mehrere - zumeist sehr viele verschiedene Stichproben gezogen werden können. Ihre Anzahl berechnet sich nach den Formeln der Kombinatorik, hier: N! n! (N — n)!
(3.3)
(mit N für den Umfang der Grundgesamtheit und n den der Stichprobe) ! heißt „Fakultät" und bedeutet bei N ! das Produkt aller ganzen Zahlen von 1 bis N. Die angegebene Formel könnte kürzer auch als Binomialkoeffizient (sprich: ,,N über n") geschrieben werden.
Beispiel 3-4 Umfaßt die Grundgesamtheit (nur) 6 Elemente und die Stichprobe 2, so können 6•5 • 4•3 • 2•1
2-1•4•3•2•1
=
6-5
1 -2
= 15
Stichproben gezogen werden.
Diese Anzahl ist oft so groß, daß der ,,zentrale Grenzwertsatz" zur Geltung kommt. Das gilt nicht nur, weil sich bei großem N und im Verhältnis dazu kleinem n eine große Zahl ergibt (s. A 3-8), sondern auch schon für den absoluten Umfang der Stichprobe: Je größer dieser ist, um so höher ist auch die Anzahl der möglichen Stichproben (s. A 3-9).
Der zentrale Grenzwertsatz besagt im Kern, daß sich die Verteilung des Mittelwerts aller möglichen Stichproben, die sog. Stichprobenverteilung („sampling distribution" - des arithmetischen Mittels) asymptotisch - mit wachsender Anzahl
Kapitel 3
Inferenzstatistische Grundlagen
29
der möglichen Stichproben, also auch, wie dargelegt, wachsendem absoluten Stichprobenumfang - einer Normalverteilung nähert. Das bedeutet, daß der Mittelwert der Stichprobenverteilung des arithmetischen Mittels mit dem der Grundgesamtheit übereinstimmt: ¡i^ = ß. Für die Standardabweichung der Stichprobenverteilung des arithmetischen Mittels ergibt sich nach den Formeln der mathematischen Statistik: (3.4) Der zweite Ausdruck auf der rechten Seite ist der sog. Korrektions- oder Korrekturfaktor. Er wird theoretisch dann erforderlich, wenn man - was zumeist der Fall ist - „ohne Zurücklegen "arbeitet. Im Unterschied zur „Ziehung mit Zurücklegen" stehen dabei jeweils die bereits gezogenen Elemente für den nächsten Zug nicht mehr zur Verfügung, wodurch sich quasi „Zug um Zug" die Auswahlwahrscheinlichkeit für die verbliebenen Elemente ändert. Praktisch kann jedoch bei kleinen Auswahlsätzen - Faustregel: unter 5 % - die eigentlich erforderliche Korrektur unterbleiben. (Der Faktor liegt dann nahe bei 1, hat also auf das Ergebnis keinen beachtenswerten Einfluß. S. dazu A 3-10.) Das ist in der Marktforschung meist der Fall. Die obige Formel vereinfacht sich dann zu: a
(3.5)
Dies wird auch als Standardfehler („Standard error") des arithmetischen Mittels bezeichnet. Die vorstehende Formel gilt für den Fall metrischer Werte. Speziell bei nominalskalierten Daten ist jedoch, wie in Kap. 2 dargelegt, im Grunde nur die absolute und relative Häufigkeit berechenbar. Bezeichnet man letztere als den Anteil oder die Proportion, mit p für die Stichprobe und entsprechend n oder auch P für die Grundgesamtheit (speziell in der deutschen Literatur sprach man früher auch vom „homograden Fall" - im Unterschied zum „heterograden", dem oben dargestellten), so kann dafür die Streuung wie folgt angegeben werden: (3.6) Q ist das Komplement von P zu 1 (also etwa, wie unten in Beisp. 3-6, P = 0,3, Q = 0,7). Damit handelt es sich im Grunde um eine Ämow/a/verteilung. Somit ist auch deutlich, daß - infolge des zentralen Grenzwertsatzes - die Normalverteilung der Stichprobenverteilung sich unabhängig von der Verteilung der Grundgesamtheit ergibt.
30
Teil I
Grundlagen
Darst.3-1:
Normalverteilung (ß und a)
Eine Normalverteilung ist nun charakterisiert durch nur 2 Parameter, fi und a, gemäß Darst. 3-1. Der Anteil der schraffierten Fläche in der Abbildung ist berechnet und tabelliert worden. Er beträgt 68,3%. Da es im Grunde, je nach der Größe von p und o, viele Normalverteilungen gibt, bezieht man sich üblicherweise auf Standardgrößen, nämlich = 0 und a = 1; man spricht dann von Standard-Normalverteilung oder N(0,1). Die Tabellierung kann auf verschiedene Weise erfolgen; s. dazu unten. Werden empirische Werte auf solche Standard-Werte („Standard scores", z-Werte) umgerechnet, so bezeichnet man dies als Standardisierung; formal: s
Die Standardabweichung dient also als Einheitsmaß: 2 Standardabweichungen umfassen bereits 99,7% usw. In der Praxis haben sich einige wichtige solcher Schritte - jeweils um er weg von /i - herausgebildet; sie werden, entsprechend der Symbolik bei der Standardisierung, zumeist mit z bezeichnet: z z z z z
= = = = =
1 (1 c-Regel): 1,96 : 2 (2er/e«befragungen der Fall; bei Verbraucherbefiagangen kann man sich dagegen ein frei geführtes Gespräch ohne „tiefenpsychologische" Absicht weniger denken.) Man könnte auch von „Intensiv- "oder schlechthin „qualitativen Inverviews" sprechen. Diese Gleichsetzung erschien jedoch zweckmäßig, um die beiden, im Zuge des in Kap. 1 erwähnten „Methodenstreits", insbesondere in den späten 50er und frühen 60er Jahren, miteinander ringenden „Richtungen" besser hervortreten zu lassen. Denn im Grunde war es ein Streit um die Frage der zweckmäßigeren Form des Interviews: Während die Verfechter des standardisierten Interviews die Meinung vertraten, daß nur ein Interview mit festgelegtem Wortlaut und vorgeschriebener Reihenfolge der Fragen eine Vergleichbarkeit der Ergebnisse gewährleistet und deshalb allgemeingültige Schlüsse zuläßt, glaubten die Anhänger der Motivforschung, daß nur ein - teilweise oder, besser noch, völlig - frei geführtes Gespräch die tieferen, vielfach unbewußten Strebungen des Käufers zutage bringen könnte. Dieser „Methodenstreit" kann heute als überwunden gelten. Das steht im Zusammenhang damit, daß „Einstellungsuntersuchungen in den meisten Fällen die ... Erforschung von Motiven ersetzt" haben (WISWEDE 1973, S. 13). Es hat sich weitgehend eine Annäherung der Standpunkte durchgesetzt - in dem Sinne, daß dem
52
Teil II
Methoden der Datengewinnung in der Marktforschung
standardisierten Interview der Vorzug zu geben ist, und zwar aus folgenden Gründ e n (BEHRENS 1966, S. 50):
„(1) Die ,Tiefe" eines Interviews hängt nicht von der Befragungsstrategie, sondern von der Befragungstaktik ab. (2) Die Quantifizierbarkeit nicht standardisiert gewonnener Untersuchungsmaterialien ist problematisch. (3) Bei nicht standardisierten Interviews besteht die besondere Gefahr, daß der Interviewer das Gespräch bewußt oder unbewußt in Richtung auf die Bestätigung bestimmter Erwartungen lenkt. (4) Nicht standardisierte Befragungsformen überlasten den Interviewer." Die Notwendigkeit der Einbeziehung psychologischer Überlegungen ist also nicht mehr umstritten. (Dies kann man, gemäß Kap. 1, sogar als Kennzeichen einer neuen Periode der Marktforschung ansehen.) Sie erfolgt aber im Rahmen der BefragungstafcnA:. Bevor darauf (in Abschnitt 4.2.2) eingegangen wird, sei zunächst noch auf eine Sonderform im Rahmen des „unorthodox interviewing", das verdeckte Interview („disguised interview"), hingewiesen. Man versteht darunter ein - unter irgendeinem Vorwand begonnenes - Gespräch, bei dem der Auskunftsperson gar nicht bewußt wird (oder werden soll), daß es sich um ein Interview handelt. Diese Form ist berufsethisch problematisch. Innerhalb der ESOM AR (s. dazu in Kap. 20) wird sie denn auch für unzulässig gehalten.
Ferner erscheint es im hier gegebenen Zusammenhang zweckmäßig, im folgenden - als „Exkurs" - den Aufbau sowie Einsatz der Interviewer-Organisation zu erörtern: Exkurs: Die Interviewer-Organisation Ähnlich wie zur Durchführung des Absatzes eine Verkaufs(außen)organisation sofern es sich nicht um ein reines Versandunternehmen handelt - , braucht man für mündliche (und telefonische) Befragungen eine Interviewer-Organisation. Dies gilt in erster Linie für - zumeist kommerzielle - Institute, die „Umfrageforschung" ständig betreiben. Für die betriebliche Marktforschung dürfte die Unterhaltung einer eigenen Interviewer-Organisation allerdings, schon wegen der damit verbundenen Kosten, eher die Ausnahme sein. Daneben haben sich in jüngerer Zeit „Feldorganisationen" etabliert, die im Grunde eben gerade Interviewerstäbe unterhalten und diese quasi den Auftraggebern (das kann die betriebliche Marktforschung, aber auch ein Institut sein) „gegen Berechnung" zur Verfügung stellen. 1. Aufbau und Unterhaltung der Interviewer-Organisation Ehe Interviewer angeworben werden können, ist zunächst zu klären, welchen Anforderungen diese genügen müssen. Zumindest beim standardisierten Interview
Kapitel 4
Die Befragung
53
hängt offenbar der Erfolg einer Umfrage nicht vorrangig von der geistigen Leistungsfähigkeit der Interviewer ab: Es sind nicht in erster Linie Begabung, Bildungsstand und geistige Beweglichkeit für die Auswahl entscheidend, sondern „Kontaktfahigkeit,,blinde Pendanterie' und Interesse für Menschen" sowie „moralische Widerstandskraft" ( N O E L L E [ - N E U M A N N ] 1 9 6 3 , S . 1 6 7 ) . NOELLE (S. 165) bezieht sich dabei auf einen Ausspruch von Erp Ring: „Der ideale Interviewer ist ,ein kontaktfahiger Pedant'". An anderer Stelle (S. 60) zitiert sie SCHMIDTCHEN (1962): „Nicht der Interviewer, der Fragebogen muß schlau sein."
Aufgrund dieser Anforderungen und anderer Überlegungen (Ungleichmäßigkeit in der Beschäftigung, Erreichbarkeit der Befragten, Auswechselung der Interviewer usw.) hat sich weitgehend die Auffassung durchgesetzt, daß im allgemeinen nebenberufliche Interviewer den festangestellten vorzuziehen seien. Die Anwerbung der Interviewer scheint wegen der speziellen Anforderungen an diese von besonderer Bedeutung. Das Vorgehen dabei ist nicht einheitlich; manche Institute bevorzugen grundsätzlich die Empfehlung durch bereits mitarbeitende Interviewer, andere legen mehr Wert auf Anwerbung mittels Zeitungsanzeige. Dabei kommt es wesentlich darauf an, weniger diejenigen Personen anzusprechen, denen es primär um einen (beliebigen) Nebenverdienst geht. Für sich genommen, sind die Honorare mit derzeit etwa 10 bis 15 DM für ein Interview durchschnittlicher Länge bzw. Schwierigkeit (gegebenenfalls zusätzlich Spesen), kaum sonderlich attraktiv - noch dazu angesichts möglicher größerer Intervalle in der Beschäftigung. Obwohl von den Instituten zumeist eher nicht erwünscht bzw. sogar untersagt, muß man davon ausgehen, daß mancher Interviewer für mehrere Institute gleichzeitig tätig ist. (Dies kann sich speziell bei Anwendung des Quotenverfahrens - s. 4.4.1.3- recht negativ auswirken.)
Im übrigen sorgt eine Reihe von Testverfahren dafür, daß ungeeignete Personen möglichst von vornherein ausgeschieden werden. Die Quote derjenigen, die schließlich Annahme finden, wird von einzelnen Instituten mit nur zwischen 5 und 15% beziffert. Große Bedeutung kommt auch der Aus- und Fortbildung der Interviewer zu, da eine Verzerrung des Umfrageergebnisses nur dann vermieden werden kann, wenn alle Interviewer nach einheitlichen Grundsätzen vorgehen. Die Praxis hinsichtlich des Vorherrschens von mündlicher oder schriftlicher Schulung ist verschieden (und hängt auch mit dem anschließend zu behandelnden Problem der Organisation des Interviewernetzes zusammen). Es ist jedoch allgemein üblich, daß - zumeist schon mit der Annahme als Interviewer - Übungsinterviews durchzuführen sind. Zudem werden in der Regel, unabhängig von den speziellen Anweisungen bei den einzelnen Umfragen, schriftlich grundsätzliche Hinweise über die Durchführung von Interviews etc. gegeben (mitunter in Form von „Interviewer-Handbüchern" etc.).
54
Teil II
Methoden der Datengewinnung in der Marktforschung
Große Unterschiede ergeben sich in der Praxis hinsichtlich der Leitungsorganisation. Grundsätzlich kann diese zentral oder dezentral sein. Für die zentrale Leitung sprechen so gewichtige Argumente wie straffe Steuerung und einheitliche Ausrichtung, für die dezentrale solche wie besserer persönlicher Kontakt, erleichterte mündliche Schulung usw. Einen anderen Aspekt hat die Frage „zentral/dezentral" bei der telefonischen Befragung, den der Stationierung: Sollen alle Anrufe von der Zentrale aus erfolgen (höhere Telefonkosten usw.) oder von verschiedenen Orten in der Nähe der Befragten (erschwerte Interviewerkontrolle usw.)?
2. Einsatz der Interviewer-Organisation Als Probleme der Vorbereitung des Interviewer-Einsatzes sind insbesondere zu nennen: 1. die Einteilung der Interviewer. Der Aufwand hierfür steht im Zusammenhang mit dem angewandten Auswahlverfahren (s. 4.4.1): Beim (Adressen-)Randomverfahren geht die oft recht langwierige Ermittlung der Anschriften, die den Interviewern zu nennen sind, voraus, während beim Quotenverfahren einfach die ermittelten Quoten den Interviewern bekanntgegeben werden, meist mittels besonderer Formblätter (s. Darst. 4-15). In jedem Falle entsteht natürlich die Frage, wieviel Interviews von einem Interviewer zweckmäßigerweise durchgeführt werden sollen. Während beim Randomverfahren ein gewisser Zusammenhang mit der räumlichen Lage der ermittelten Anschriften besteht, ist beim Quotenverfahren die Anzahl im Prinzip beliebig. Es hat sich jedoch allgemein die Auffassung durchgesetzt, daß aus rein methodischen Erwägungen (geringerer Interviewereinfluß - s. dazu unten Vermeidung des „selektiven Hörens": das zu hören, was man, insbesondere nach einer gewissen „Konditionierung" durch die bisherigen Interviews, zu hören erwartet) die Zahl der Interviews pro Interviewer relativ klein gehalten werden sollte. Das Optimum dürfte bei 5-10 Interviews liegen, daß Maximum bei etwa 15. 2. die Erarbeitung spezieller Interviewer-Anweisungen. Wenngleich grundsätzlich der Fragebogen so gehalten werden sollte, daß besondere Erläuterungen durch den Interviewer nicht notwendig sind, so werden sich doch in der Praxis gewisse zusätzliche Anweisungen kaum vermeiden lassen. Außerdem müssen Vorschriften über den Termin der Erhebung usw. vorliegen. Die Durchführung des Interviewer-Einsatzes wirft ebenfalls verschiedene Probleme auf, etwa: 1. Gewinnung der Auskunftspersonen für ein Interview. Oben wurde bereits darauf hingewiesen, daß die Honorierung der Auskunftsperson im allgemeinen abgelehnt wird. Diese ist deshalb auf andere Weise zur Mitarbeit zu gewinnen, etwa durch eine - schriftliche oder mündliche - Einführung in
Kapitel 4
Die Befragung
55
das Wesen von Umfragen; zumindest muß sie davon überzeugt werden, daß es sich tatsächlich um eine solche handelt (zumal nicht wenige Fälle vorgekommen sind, in denen sich Vertreter als Interviewer tarnten). Der Arbeitskreis Deutscher Marktforschungsinstitute, der gegen solche Fälle auch gerichtlich vorzugehen pflegt, hat deshalb ein besonderes „Siegel" - mit Merkblatt - entwickelt, vermittels dessen sich die Interviewer als zu einem Mitgliedsinstitut gehörend ausweisen können. „Echte" Verweigerer machen übrigens nur einen Teil der Ausfalle aus. Da dieses Problem, jedenfalls die Form seinen Auftretens, mit der Art der Auswahl der Befragten zusammenhängt, wird es dort (unter 4.4.1) näher behandelt.
2. Ausschaltung des Interviewereinflusses. Unter Interviewereinfluß oder Interviewer-Bios („interviewer error") versteht man im engeren Sinne die Gefahr, daß der Interviewer völlig unbewußt, allein durch sein Auftreten, sein Aussehen usw., Gefalligkeits- oder Prestige-Antworten etc. hervorruft (a). Im weiteren Sinne zählen hierzu - neben a - auch unsachgemäße oder völlig falsche Aufzeichnungen bzw. Einstufungen von Antworten (b). Im weitesten Sinne kann man - neben a und b - dazu ferner die bei der Quotenauswahl bestehende Gefahr, daß der Interviewer „immer dieselben Personen" befragt, rechnen (c - s. unten, 4.4.1.3). Zum Problemkreis a gehört etwa die Frage, ob z. B. junge weibliche Interviewer bei älteren Männern andere Antworten hervorrufen, ob gutes Aussehen vielleicht zu Prestige-Antworten verleitet usw. Von mancher Seite wird diesen Fragen außerordentliches Gewicht beigemessen und immer wieder die grundsätzliche Problematik von „Feldeinflüssen" betont. Insbesondere natürlich aus Kreisen der Institute wird dem entschieden widersprochen und hervorgehoben, daß bei richtiger Schulung der Interviewer die von diesen ausgehenden Einflüsse außerordentlich gering sind im Verhältnis zu anderen Fehlermöglichkeiten. Tatsächlich scheinen entsprechend angelegte Experimente (mittels Teilgruppen usw.) gezeigt zu haben, daß sich speziell der Interviewereinfluß i.e.S. in Grenzen halten kann. Wie oben erwähnt, sucht man das darüber hinaus durch die Beschränkung der Anzahl der vorzunehmenden Interviews zu erreichen. Das wirkt auch auf den Effekt c. Einfluß b schließlich läßt sich zudem durch Kontrolle der Interviewer begrenzen. Darauf ist nunmehr einzugehen: Die Kontrolle des Interviewer-Einsatzes bezieht sich in erster Linie auf das Fälscherproblem. Nur zu leicht könnten manche Interviewer geneigt sein, auf ein Interview ganz zu verzichten, den Fragebogen also „in Heimarbeit" auszufüllen, oder aber zwar ein Interview zu beginnen, einen gewissen Teil der Fragen aber zumal bei partieller Antwortverweigerung - selbst zu beantworten (7e//fälschung). Da durch Fälschungen u. U. der ganze Zweck der Untersuchung in Frage gestellt werden kann, hat man schon seit langem Verfahren zu deren Ent-
56
Teil II
Methoden der Datengewinnung in der Marktforschung
deckung entwickelt. Dazu gehört etwa die Aufnahme von „Fangfragen" in den Fragebogen. (Es ist allerdings darauf hinzuweisen, daß eine offenbare Widersprüchlichkeit in den Angaben eines Befragten noch keinen Beweis für das Vorliegen einer Fälschung bietet; eher kann - umgekehrt - ein allzu glattes Ineinanderpassen der einzelnen Antworten auf eine solche hindeuten.) Eine weitere Möglichkeit ist die Kontrollbefragung eines Teiles der Auskunftspersonen, entweder in Form einer nochmaligen Befragung - etwa mit dem Hinweis, der Fragebogen sei verloren gegangen - oder lediglich der Bitte um Bestätigung. So wird bei manchen Instituten routinemäßig ein bestimmter Prozentsatz der Befragten um eine Bestätigung über das Stattfinden des Interviews und dessen Dauer, als Anhaltspunkt für das eventuelle Vorliegen einer Teilfälschung, gebeten. Um eine solche Kontrolle bei der Quotenauswahl überhaupt durchführen zu können, ist es notwendig, den Interviewer auf dem Fragebogen die Anschrift der Auskunftsperson angeben zu lassen. Dadurch geht ein Vorteil dieses Verfahrens, die größere Anonymität, verloren.
Ein besonderes Problem der Kontrolle der Interviewer ist, ob im Fragebogen offen gelassene bzw. anscheinend falsche Antworten im Institut ergänzt werden sollen oder nicht. Grundsätzlich wird man hier sehr vorsichtig sein müssen; eine eigenmächtige Ergänzung wird nur dann angebracht sein, wenn es sich um offensichtliche Fehler handelt. Beispiel 4-3 Bei einer Untersuchung erscheint als Antwort bezüglich der bevorzugten Marke eine gar nicht existierende Spirituosensorte „Förstergold"; alle übrigen Anzeichen - Geschmacksrichtung, Aufmachung usw. - deuten aber darauf hin, daß nur die bekannte Marke „Jägergold" gemeint sein kann.
Auch ist zu berücksichtigen, daß Einstellungen und Verhalten nicht übereinzustimmen brauchen. Beispiel 4-4 Auf die Frage, ob er für den Weg zur Arbeit lieber ein öffentliches Verkehrsmittel oder den eigenen Pkw benutzen würde, erscheint als Antwort des Befragten, daß er ein öffentliches Verkehrsmittel bevorzuge; in Wirklichkeit - was also im Zweifel nicht geändert werden dürfte! - fahrt er aber mit dem Auto.
4.2.2 Indirekte Befragung (und psychologische Tests) Die direkte Befragung stand lange Zeit im Vordergrund; ihr Vorherrschen charakterisiert eine ganze Periode der Entwicklung der Marktforschung. (S. Kap. 1.) Sie ist dadurch gekennzeichnet, daß die zu ermittelnden Sachverhalte ohne Umschweife erfragt werden. Einige vereinfacht formulierte Beispiele mögen dies veranschaulichen:
Kapitel 4
Die Befragung
57
Beispiel 4-5 „Wie hoch ist Ihr Einkommen?" Beispiel 4-6 „Besitzen Sie ein Auto?" Beispiel 4-7 „Haben Sie gestern Zahnpasta benutzt?" Beispiel 4-8 „Wann haben Sie zuletzt ihre Haare gewaschen?"
Erst allmählich erkannte man die Mängel dieser Verfahrensweise und versuchte, durch indirekte Befragung mehr in Erfahrung zu bringen. Darunter soll hier lediglich das Vorgehen verstanden werden, welches darauf abzielt, durch entsprechende Formulierung bzw. Gestaltung der Fragen zu Resultaten zu gelangen, die bei direkter Befragung aus unterschiedlichen Gründen (Prestige, aber auch Unbewußt-Sein) nicht zu erhalten gewesen wären. Der Begriff ist also im engeren Sinne zu verstehen. Ausgeschlossen werden soll insbesondere die Art der „indirekten" Befragung, die darin besteht, daß man einen Dritten, etwa einen Händler, über das Verhalten des eigentlich Interessierenden, des Verbrauchers, befragt.
Vielfach kann dies bereits durch psychotaktisch-zweckmäßige Befragungsweise geschehen: Beispiel 4-9 (Forts, v. Beisp. 4-5) Die Ermittlung des Einkommens (meist als „Haushalts-Nettoeinkommen") wird üblicherweise als äußerst wichtig angesehen - zumal als mit vielen anderen Größen korrelierendes Merkmal ist aber auf direktem Wege (aus Prestige- und anderen Gründen) meist schwer erreichbar. Sie könnte ersetzt werden durch die Frage nach bzw. Beobachtung von Kaufkraft-Indizien, wie z. B. Art der Wohnung, Vorhandensein von Gegenständen des gehobenen Bedarfs. Allerdings besteht hier kein eindeutiger Zusammenhang - man denke nur an die Verschuldungsmöglichkeit durch den Konsumentenkredit. In der Praxis wird deshalb meist eine Liste mit lediglich Einkommensstufen verwandt. (S. dazu auch Liste D zu dem im „Appendix" wiedergegebenen Fragebogen-Auszug.) Erfolgt darauf keine - spontane - Antwort und auch keine „Schätzung" durch den Befragten selbst, so wird diese durch den Interviewer oder notfalls den Sachbearbeiter im Institut vorgenommen. (Daß auch dies alles mit einer gewissen Skepsis betrachtet werden muß, geht aus einer Veröffentlichung der Verlagsgruppe Bauer hervor; s. etwa „Planung und Analyse" 10/85.) Beispiel 4-10 (Forts, v. Beisp. 4-6) Die aus Prestige-Gründen vielleicht etwas problematische Frage nach dem Besitz eines Personenkraftwagens ist in dem bereits erwähnten, vom Verf. betreuten Projekt (s. HÜTTNER [Hrsg.] 1977 oder ders. 1979) so formuliert worden: „Wer besitzt in Ihrem Haushalt einen Wagen?"
58
Teil II
Methoden der Datengewinnung in der Marktforschung
Antwortvorgaben waren: „1 Ich selbst 2 Zusätzlich meine Frau bzw. meine Kinder (Zweitwagen)" Es hatten also nur die Besitzer eines Autos ausdrücklich zu antworten, wogegen der Nicht-Besitz nicht explizit erklärt zu werden brauchte. (Die Frage erfüllte damit auch „Ablaufordnungsfunktionen" - s. dazu, unter 4.3.2 - , indem die beiden Gruppen an unterschiedlicher Stelle des Fragebogens fortzusetzen hatten, die Nichtbesitzer also einige Fragen „überspringen" sollten.) Beispiel 4-11 (Forts, v. Beisp. 4-7) Die Frage, ob gestern Zahnpasta benutzt wurde, kann z. B. psychologisch geschickt folgendermaßen formuliert werden: „Bekanntlich gibt es verschiedene Methoden der Mundpflege: Zahnpulver, Zahnpasta, Zahnseife, Mundwasser, Alkohol und andere Mittel. Haben Sie vielleicht im Laufe des gestrigen Tages Zahnpasta benutzt - oder haben Sie es gestern anders gehalten?" (Aus einer Untersuchung des EMNID-Instituts, Bielefeld.) Beispiel 4-12 (Forts, v. Beisp. 4-8) Durch folgende Formulierung kann einer Prestige-Antwort auf die im Rahmen einer Marktuntersuchung für Haarwaschmittel zu stellende Frage, wann man sich zuletzt die Haare gewaschen habe, entgegengewirkt werden: „Würden Sie mir noch ein paar Fragen über Ihre Gewohnheiten bei der Haarwäsche beantworten? Viele Menschen sagen ja, daß es schädlich für das Haar und die Kopfhaut ist, wenn man allzu häufig den Kopf wäscht. Könnten Sie mir sagen, wann Sie zum letzten Mal Ihre Haare gewaschen haben?" (Aus einer Untersuchung des Instituts für Demoskopie, Allensbach; vgl. NOELLE[-NEUMANN] 1 9 6 3 , S. 5 8 . )
In vielen Fällen wird die Anwendung der psychotaktisch-zweckmäßigen Befragungsweise, die Formulierung der Fragen in indirekter Form bzw. überhaupt ihre geschickte psychologische Umkleidung, hinreichend sein, um die gewünschten Ergebnisse zu erlangen. In anderen Fällen bedarf es dazu der Anwendung psychologischer Tests. Meist handelt es sich dabei um projektive Verfahren. Man versteht hierunter Tests, die so angelegt sind, daß die Reaktion der Versuchsperson auf die vorgegebenen Reize ihre eigenen Einstellungen etc. erkennen läßt, ohne daß sie sich dessen bewußt ist. Das geschieht, indem der Testperson unklare, mehrdeutige Situationen usw. vorgegeben werden, die sie zu beschreiben oder wofür sie die Reaktion Dritter zu „erfinden" hat (Third-Person-Technique), in die sie also gewissermaßen ihre subjektiven Gegebenheiten „hineinprojiziert". Die Bedeutung mancher solcher Tests hat sich in der Praxis der Marktforschung doch nicht als so groß erwiesen, wie man zunächst geglaubt hatte. Die folgende Aufzählung und Beschreibung ist deshalb - im Vergleich zu früheren Auflagen relativ kurz. Sie folgt dem „Alter" der einzelnen Verfahren (und wird ergänzt
Kapitel 4
Die Befragung
59
durch einige neuere, erst in den letzten Jahren im gegebenen Zusammenhang entstandene Methoden). 1. Der Foto- oder Personen-Zuordnungstest stellt eine verhältnismäßig alte Form dar. Er hat seinen Ursprung in denphysiognomischen Tests der klinischen Psychologie. Beim sog. Szondi-Test wird der Versuchsperson eine Reihe von Porträts gezeigt, und zwar von Leuten, die - was verschwiegen wird - an einer geistigen Störung (Verfolgungswahn und dgl.) leiden. Man bittet den Probanden, die Person herauszusuchen, mit der er am liebsten Kontakt haben würde. Dabei wird angenommen, daß er sich zu derjenigen Person am meisten hingezogen fühlt, deren geistige Störung er im leichten Ansatz ebenfalls aufweist.
In der Marktforschung findet das Verfahren in der Weise Anwendung, daß Abbildungen oder Beschreibungen von Personen vorgegeben werden mit der Bitte, den Verwender bzw. Käufer eines bestimmten Produkts diesen zuzuordnen. Beispiel 4-13 In einer Schweizer Untersuchung (der Gesellschaft für Marktforschung in Zürich) über die beiden Substitutionsgüter Gasherd und Elektroherd wurde den Befragten ein Bildblatt vorgelegt mit folgender Frage: „Hier zeige ich Ihnen die Bilder von verschiedenen Frauen. Nehmen wir an, alle diese Frauen müßten jetzt denselben Entscheid treffen zwischen Gas und elektrisch, den Sie jetzt gerade angegeben haben. Was würden diese Frauen wählen?"
Darst. 4-2: Personen-Zuordnungstest ( g e m ä ß BORSCHBERG 1963, S. 307)
60
Teil II
Methoden der Datengewinnung in der Marktforschung
2. Der Satzergänzungstest („sentence completion test") wird in der Marktforschung ebenfalls schon recht lange verwandt. Formal handelt es sich dabei um nichts anderes als „offene Fragen", also solche, bei denen die Antwortmöglichkeit nicht vorgegeben ist. (S. dazu unten, 4.3.1.1.) Die Besonderheit liegt darin, daß man die Auskunftsperson bittet, einen bereits begonnenen Satz zu vervollständigen - wobei der Eindruck erweckt wird (jedenfalls soweit es sich um ein projektives Verfahren handelt), als ob sie die Antwort für eine dritte Person „erfinden" müßte. Es ist deshalb erforderlich, letztere relativ wenig zu konturieren, um der Projektion freien Raum zu lassen. Deshalb und auch der Veranschaulichung halber wird der Satzergänzungstest meist in graphischer Form durchgeführt: Abbildung von zwei Personen, von denen die eine etwas sagt (in Gestalt einer „Sprechblase", eines über ihr schwebenden „Ballons" - Ballonfrage), worauf die andere (in gleicher Form) zur Antwort ansetzt, diese - mit dem eigentlichen Sinngehalt jedoch von der Auskunftsperson ergänzt werden muß. Beispiel 4-14 In einer Untersuchung des Instituts für Demoskopie, Allensbach, sollten die Vorurteile gegen das Brillentragen geklärt werden. Den männlichen Befragten wurde dazu der linke Teil, den weiblichen der rechte Teil von Darst. 4-3 vorgelegt.
Darst. 4-3: Satzergänzungstest ( g e m ä ß NOELLE[-NEUMANN] 1963, S. 76)
Die dazugehörige Frage lautete für Frauen (für Männer entsprechend): „Sehen Sie hier - da unterhalten sich gerade zwei Frauen. Die eine ist eben im Satz unterbrochen worden. Was meinen Sie, wie könnte dieser Satz zu Ende gehen?" (S. dazu auch A 4-2). Eine besondere Form des Satzergänzungstests ist der sog. Bildenttäuschungstest (..picture frustration test", Rosenzweig-Test). Im Grunde handelt es sich dabei um einen Persönlichkeitstest, da er versucht, durch die Abbildung eines frustrierenden Ereignisses und die vom Befragten zu ergänzende Antwort des Betroffenen zur Analyse der Persönlichkeit der Aus-
Kapitel 4
Die Befragung
61
kunftsperson - ob etwa aggressiv oder zurückhaltend - beizutragen. (Wegen Beispielen sei verwiesen auf die in den früheren Auflagen - S. 52 - enthaltene Abbildung aus SMITH 1955, S. 138, und die bei NOELLE[-NEUMANN] 1963, S.77, angeführte „PF-Studie".)
3. Der Wortassoziationstest („wordassociation test") ist ebenfalls schon recht lange in Gebrauch. Hierbei werden dem Befragten Wörter präsentiert mit der Bitte, möglichst rasch und ohne Überlegen anzugeben, woran er dabei denkt, welche Vorstellungen er also mit den genannten Stimuli assoziiert. Die Verwendungsmöglichkeit ist überaus vielfaltig. So kann man damit z. B. Namenstests durchführen, also festzustellen suchen, welche Vorstellungen mit einer bestimmten Produktbezeichnung assoziiert werden (oder auch umgekehrt, welche Namensvorstellungen ein bestimmtes - neues - Produkt hervorruft). In etwas abgewandelter Weise wurden in einer Untersuchung des Instituts für Demoskopie auch die mit der Verwendung von Frischfisch verbundenen Assoziationen getestet. Das Beispiel zeigt gleichzeitig die Nähe zum „Semantischen Differential" (s. unter 4.3.1.2): Beispiel 4-15
10
Es dachten an:
20
30
40
60
50
70
80
90
Schmackhaft
1 p
Gesund Nahrhaft Kühl
•
A
P--
Knusprig Fein
f
Leckerbissen
/
Weiß
>
/
Würzig Kraftvoll
4
Silbrig
s
Salzig Gräten
5>
>
Geschmeidig Blau Winter Grün Sanft
{
/
Verdorben Ersticken
y
Grob
i
Schleimig Eklig
a i
Labberig 0
>
N
s
»
V 10
20
30
40
50
60
70
80
90
100
Frauen, die im Sommer und Winter ziemlich viel Frischfisch zubereiten Frauen, die hauptsächlich im Winter Frischfisch zubereiten Fischgegnerinnen
Darst. 4-4: „Assoziations-Wahltest" ( g e m ä ß NOELLE[-NEUMANN] 1963, S . 2 8 4 )
62
Teil II
Methoden der Datengewinnung in der Marktforschung
4. Der TAT (Thematischer Apperzeptions-Test - Thematic Apperception Test) besteht in seiner Grundform aus einer Serie sorgfaltig ausgewählter Bildtafeln, die der Auskunftsperson vorgelegt werden mit der Aufforderung, dazu jeweils eine Geschichte zu erfinden bzw. zu erklären, was ihrer Meinung nach auf dem Bild vor sich geht. Es handelt sich also um ein typisch projektives Verfahren, indem angenommen wird, daß der Erzähler seine geheimen Wünsche, Vorstellungen usw. in die Geschichte hinein„projiziert". Die Frage dabei ist, ob sich diese Projektion besser erreichen läßt durch stärker strukturierte Bilder - wie sie Murray, auf den der TAT zurückgeht, entwickelte - oder durch mehr vage gehaltene Vorlagen. Grundsätzlich wird man sagen können, daß, je strukturierter die Bilder sind, um so mehr auch die Stellungnahmen sich auf präzise Einzelfragen beziehen. Der TAT war so in erster Linie ein Persönlichkeitstest, der der Persönlichkeitsanalyse diente. Er läßt sich jedoch in verschiedener Weise variieren, über den „Vier-BilderTest" zum Ein-Bild-Test. Letztere Form findet am ehesten in der Marktforschung Verwendung: Beispiel 4-16 In einer amerikanischen Untersuchung (von Social Research International - in „Chicago Tribüne") über Autos sollte auch die Einstellung der Verbraucher zur Geschwindigkeit ermittelt werden, um daraus Schlüsse für die Konstruktion, Werbung usw. ziehen zu können. Den Auskunftspersonen wurde deshalb das folgende Bild vorgelegt - das deutlich eine Geschwindigkeit von fast 70 Meilen pro Stunde (und damit mehr als die damals üblicherweise zugelassene Höchstgeschwindigkeit) zeigt - mit der Aufforderung, sich in die Rolle des Fahrers hineinzuversetzen und davon zu berichten.
Put yourself HERE Darst. 4-5: Thematischer Apperzeptions-Test (gemäß BERTH 1959, S.174)
5. Das Gruppendiskussionsverfahren („Gruppeninterview") besteht darin, daß eine - meist kleinere - Gruppe von Personen zu einer Diskussion über ein bestimmtes Thema (unter der Leitung eines „Moderators") gebeten wird. Man geht dabei von der Annahme aus, daß im Zuge der Diskussion gewisse Hemmungen beseitigt werden und die Teilnehmer sich gegenseitig zu Äußerungen anregen bzw. hinreißen lassen. Die Analyse der (Tonband- oder Video-)Aufzeichnungen kann dann
Kapitel 4
Die Befragung
63
Hinweise auf - unbewußte - Strebungen und Motive geben, die andernfalls nur sehr schwer aufzudecken gewesen wären. Dieses billige und schnelle, aber auch stichprobentheoretisch und in manch anderer Hinsicht problematische Verfahren wird in der Marktforschung sehr häufig angewandt, etwa einerseits in Situationen, in denen man „noch gar nichts weiß" (also zur Entwicklung eines standardisierten Fragebogens kaum in der Lage wäre), andererseits bei Produkttests (s. Kap. 15). Dies geschieht vielfach mittels besonderer „Test-Studios", die evtl. auch Passanten auf der Straße ansprechen („Baggern") und zur u.U. sofortigen Mitarbeit bewegen. Während die vorstehend genannten Verfahren im Grunde schon recht lange bekannt sind und angewandt werden, traten zwei andere Methoden im Zusammenhang „indirekter" - im weitesten Sinne - Messung von Sachverhalten erst in jüngster Zeit verstärkt in Erscheinung: 1. die Messung der Antwortzeit, 2. das „Randomized Response Model". Zu: Die Antwortzeit („response latency") ist die Zeit zwischen Fragestellung und Antwort. Sie gilt als ein Maß für die Sicherheit oder Überzeugung, mit der eine Antwort gegeben wird (und somit für die Beeinflußbarkeit und die Prognose des Verhaltens). So wird angenommen, daß die Antwortzeitmessung die Prognose wesentlich verbessern kann. AAKER et al. (1980) haben dies im Vergleich zu anderen Indikatoren für Präferenzdaten (bezüglich der Markenwahl) untersucht. MacLACHLAN/MYERS (1983) wandten das Verfahren zur Identifikation von „motivierender Werbung" an. Die Antwortzeitmessung ist natürlich am genauesten und vom Befragten unbemerkt („nichtreaktiv", gemäß Kap. 5) bei der Computer-Befragung, unter Verwendung eines Timers, möglich.
Zu 2: Mit der Technik des „Randomized Response" wird versucht, Verzerrungen durch Verweigerung oder bewußt falsches Antworten bei sensitiven Fragen dadurch entgegenzuwirken, daß - dem Interviewer verborgen bleibende - Zufallsmechanismen die Antwort des Befragten steuern und damit seine Anonymität gewährleisten. Beispiel 4-17 (1986, S. 12f.) demonstrieren das Prinzip am Thema „Gewalt gegen (Ehe-)Frauen": Angenommen, eine Versammlung von 100 Ehemännern sollte darüber befragt werden. (Von Problemen der Repräsentanz wird abgesehen.) „Natürlich würde die einfache Bitte, diejenigen Männer sollten die Hand heben, die ihre Frau schon geschlagen haben, höchstwahrscheinlich einen Raum voller Hälseverrenker (,rubbernecks') produzieren, aber nur wenige erhobene Hände." Stattdessen könne man jeden bitten, für sich d.h. unbemerkt von den anderen - eine Münze zu werfen und seine Hand zu heben, falls das Ergebnis „Kopf' zeigt oder er seine Frau schon geschlagen hat. Von den 100 Männern müßten dann 50 die Hand allein aufgrund des Münzwurfs heben; die darüber hinausgeFOX/TRACY
Teil II
64
Methoden der Datengewinnung in der Marktforschung
hende Zahl indiziert also diejenigen, die die sensitive Frage bejahen müßten; zur Berechnung ihres Anteils ist diese Zahl auf 50 zu beziehen (und nicht auf 100, weil es nur diejenigen sind, die nicht schon aufgrund des Münzwurfs ihre Hand zu heben hatten). Wurden also 58 Hände gehoben, so folgt daraus ein Anteil von 16%, die die GewaltFrage bejahen müßten - und zwar ohne daß Identifikation möglich wäre.
Das Prinzip des „Randomized Response" geht auf WARNER ( 1 9 6 5 ) zurück. Es bezog sich ursprünglich, wie im Beispiel, lediglich auf - dichotome - Nominaldaten, und zwar dergestalt, daß - etwas anders als im Beispiel - der Zufallsmechanismus nur bewirkte, daß dem Befragten die sensitive Frage selbst oder deren Verneinung vorgelegt wurde. Im Laufe der Zeit hat sich eine ganze Reihe von Varianten entwickelt, die man etwa wie folgt zusammenfassen kann: 1. Variation des Randomized-Response-/)e«g«.s. Hierzu gehört vor allem das - gegenüber dem „Warner-Modell" wohl präferierte - „Simmons-" oder „Unrelated Question-Modell" (HORVITZ/SHAH/ SIMMONS 1967): Die beiden Frage-Varianten sind voneinander unabhängig, eine davon ist nicht-sensitiv. Eine Extension in anderer Richtung - zu weiteren s. auch in der angegebenen Literatur - bezieht sich auf die Anwendungsmöglichkeit von telefonischer und schriftlicher Befragung (STEM/STEINHORST 1984). 2. Ausdehnung - von dichotomen - auf multitome (polytome) Messungen (ABULELA/GREENBERG/HORVITZ 1967). 3.
Erweiterung auf metrische Daten („quantitatives Modell" - GREENBERG et al. 1971)
4. Verbindung von „qualitativem" und „quantitativem Modell" („Two-Stage Model" - RJEINMUTH/GEURTS 1975) Anwendungen sind - im Vergleich zu methodischen Beiträgen - eher rar. Das gilt speziell für den Bereich Marketing. Im wesentlichen ist hierzu nur 1 Studie zu rechnen: die über Ladendiebstähle - und anderes „abweichendes (Konsumenten-)Verhalten" - von GEURTS/ANDRUS/REINMUTH 1975. (Deshalb auch wurde hier auf die im Einzelfall nicht unbeträchtliche Mathematik und die bisherigen Validierungsversuche nicht eingegangen; s. dazu ausführlich FOX/TRACY 1 9 8 6 und DEFFAA 1982.) Diese geringe Praxis-Anwendung mag u.a. damit zusammenhängen, daß ähnlich „sensitive" Fragen wie in anderen Bereichen (z. B. Drogenkonsum!) in der Marktforschung nicht auftreten. Andererseits ist zu bedenken, daß dem Schutz der Privatsphäre und damit dem „Randomized Response" auch hier in Zukunft steigende Bedeutung zukommen kann.
4.3 Das Frageinstrumentarium Im Laufe der Entwicklung, insbesondere mit der zunehmenden Verwendung des standardisierten Interviews, hat sich eine große Zahl von verschiedenen Arten der Fragen herausgebildet (die zudem noch teilweise unterschiedliche Benennungen
Kapitel 4
Die Befragung
65
tragen). Zur Klassifikation dieser zahlreichen Arten empfiehlt sich der Rückgriff a u f die U n t e r s c h e i d u n g v o n BEHRENS ( 1 9 6 6 , S . 9 4 ) :
„(1) nach der bestehenden oder fehlenden Vorgabe von Antwortkategorien, (2) nach der Verwendung oder Nicht-Verwendung von Vorlagen, (3) nach dem Zweck, der mit einer Frage verbunden ist." Die erste Einteilung, nach der Antwortmöglichkeit, ist die wichtigste; sie wird deshalb in einem eigenen Abschnitt (mit weiterer Untergliederung) behandelt. Im zweiten Abschnitt erfolgt die zusammengefaßte Erörterung der beiden anderen Einteilungen. Im letzten Abschnitt werden noch einige Probleme der zweckmäßigen Gestaltung des Fragebogens diskutiert.
4.3.1 Einteilung nach der Antwortmöglichkeit Die Einteilung der Fragen nach der Antwortmöglichkeit kann gemäß Darst. 4-6 vorgenommen werden. Fragen (nach der Antwortmöglichkeit)
Offene Fragen
Geschlossene Fragen
Alteraa tivfragen
Normalform
Ja-Nein-Frage
Spezialform: Dialogfrage
Neutrale Fassung
Mehrfach-Auswahl- Fragen (Selektivfragen)
Normalform
Unbegrenzte Anzahl von Nennungen
Spezialform: Skalafrage
Begrenzte Anzahl von Nennungen
in unbestimmter Weise | I ' 1 I I nach unten nach oben begrenzt begrenzt
Darst. 4-6: Einteilung der Fragen nach der Antwortmöglichkeit
in bestimmter Weise (nach unten und oben begrenzt)
66
Teil II
Methoden der Datengewinnung in der Marktforschung
Im nächsten Unterabschnitt erfolgt zunächst die Diskussion der grundlegenden Einteilung in offene und geschlossene Fragen und sodann die der Unterformen der letzteren, mit Ausnahme der „Skalafrage"; diese ist, wegen ihrer großen Bedeutung, einem besonderen Unterabschnitt vorbehalten. 4.3.1.1 Offene und geschlossene Fragen Die offene Frage (,,open-ended/response question") ist dadurch gekennzeichnet, daß der Auskunftsperson die Formulierung der Antwort überlassen wird - entweder vollständig oder nur hinsichtlich der Ergänzung eines bereits angefangenen Satzes („Satzergänzungstest", s. oben). Die Aufzeichnung durch den Interviewer soll so originalgetreu wie möglich erfolgen, da jede Veränderung des Wortlauts, auch in der besten Absicht, zu Verzerrungen führen kann; allenfalls unbedeutende Einzelheiten können weggelassen werden. Die offene Frage erscheint auf den ersten Blick als das allein angemessene Verfahren, da offenbar nur sie - so zumindest die Vertreter der stärker psychologisch orientierten Richtung - der Auskunftsperson zu sagen erlaubt, was sie sagen will. Dem stehen jedoch verschiedene Nachteile gegenüber: 1. die Antworten gehen möglicherweise am Kern dessen, was man eigentlich wissen wollte, vorbei („Multidimensionalität der offenen Frage"); 2. sie hängen wesentlich vom Ausdrucksvermögen der Befragten ab; 3. die Auswertung ist schwierig. Dies gilt nicht nur in technisch-formaler Hinsicht - insofern, als die Codezahlen nicht schon im Fragebogen vorgegeben und evtl. vom Interviewer sogleich maschinenlesbar markiert werden können. (S. dazu den im Appendix zu diesem Kapitel wiedergegebenen Fragebogen. Vgl. im übrigen zu Aufbereitung und Codierung die Einführung zum III. Teil.) Vielmehr ist die Verschlüsselung auch inhaltlich schwierig, insbesondere dann, wenn nicht, wie etwa bei der - „offen" gestellten - Frage nach dem Alter, quantitative Merkmale vorliegen und deshalb Zuordnung und Gruppenbildung in vergleichsweise einfacher Art erfolgen können. Die bei qualitativen Merkmalen notwendige Bildung von Kategorien kann offensichtlich in verschiedener Weise geschehen. Grundsätzlich lassen sich dabei zwei Vorgehensweisen unterscheiden: Einmal ist die Bildung von Kategorien nach interpretativen („evaluativen") Gesichtspunkten möglich; die Antworten werden „bewertet" nach ihrem positiven, negativen und eventuell neutralen Gehalt. In der Regel wird man allerdings deskriptive (beschreibende) Kategorien bevorzugen, die auch Begründungen enthalten. Beispiel 4-18 Die Einstellung junger Mädchen zu pfeiferauchenden jungen Männern (vgl. hierzu und
Kapitel 4
Die Befragung
67
zum folgenden SOMMER 1 9 6 3 ) kann nach interpretativen Kategorien gemäß folgendem einfachen Code verschlüsselt werden: 1 - positive Äußerungen 2 - negative Äußerungen 3 - neutrale Äußerungen 4 - Äußerungen, die das Thema verfehlen 5 - ohne Antwort Am Thema vorbeigehende Antworten lassen sich noch als solche ohne Stellungnahme, also unter „ohne Antwort", einordnen, so daß nur 4 Kategorien zu bilden sind. Nach deskriptiven Gesichtspunkten könnte sich z. B. folgender Code ergeben: 1 - allgemein positive Aussagen (z. B. prima, fein, in Ordnung) 2 - sieht gut aus; steht ihnen gut 3 - sieht männlich aus, wirkt männlich 4 - ist gesünder als Zigaretten rauchen 5 - sonstige positive Aussagen 6 - entschiedene Ablehnung (z. B. widerlich, mit denen will ich nichts zu tun haben, dieser dämliche Mensch) 7 - lächerlich, komisch, albern 8 - ist etwas für ältere Männer 9 - ist Angabe, wollen sich wichtig tun 10 - Pfeife ist ungesund 11 - sonstige negative Aussagen 12 - gleichgültige, neutrale Aussagen (z.B.: muß jeder selbst wissen, stört mich nicht, kommt darauf an) 0 - ohne Angabe, weiß nicht
Es ist hierbei auch noch zu beachten, daß die Antwortkategorien homogen sein müssen, d. h. trennscharf, auf einer logischen Ebene liegend usw. Zwei Beispiele sollen dies demonstrieren. Beispiel 4-19 Die Antworten auf die Frage nach den Gründen für den Kauf eines neuen Haarwassers, insbesondere für den Markenwechsel, können (vgl. dazu ausführlicher SOMMER 1 9 6 3 ) katalogisiert werden nach den Eigenschaften des neuen Haarwassers - wiederum unterteilt z. B. nach Geruch und Erfolg - und nach den Informationsquellen und Werbeträgern. Beispiel 4-20 Die Antworten auf die Frage nach den Hoffnungen für das nächste Jahr (vgl. dazu ausführlicher NOELLE[-NEUMANN] 1963. S. 208ff.) können gegliedert werden nach dem persönlichen Bereich - unterteilt nach den finanziellen-wirtschaftlichen Wünschen, solchen nach Gesundheit usw. - und dem öffentlichen Bereich, mit mehreren Unterteilungen.
Die geschlossene Frage („closed-ended/response question") ist dadurch gekennzeichnet, daß die Antwortkategorien dem Befragten vorgegeben werden. Technisch geschieht dies - sofern sich die Antwortmöglichkeiten nicht bereits aus dem Wortlaut ergeben - durch Vorlage von „Listen" usw.
68
Teil II
Methoden der Datengewinnung in der Marktforschung
Die Bekanntgabe der Antwortkategorien nur - mittels des Fragebogens - an die Interviewer (die die offenen Antworten der Befragteh dann in diese Kategorien einzuordnen haben „Feldverschlüsselung") genügt also nicht, um den Charakter als „geschlossene Frage" zu begründen. Umgekehrt macht die Tatsache, daß die Befragten den Fragebogen üblicherweise nicht selbst ausfüllen, sondern die Interviewer die den Antwortkategorien entsprechenden Zahlen eintragen oder gar nur „markieren", die geschlossene Frage nicht zur „offenen". S. dazu auch den als Appendix wiedergegebenen Fragebogen und die dazugehörigen Listen.
Nachteile der geschlossenen Frage sind: 1. die „Selbstentfaltung" der Befragten wird verhindert. Dieser - umgekehrt betrachtet - Urteil der offenen Frage, die volle „Selbstentfaltung" des Befragten, kann aber auch bei ihr verschwinden, indem sie subjektiv wirkt bzw. implizite Antwortvorgaben enthält. Andererseits kann es aber auch so sein, daß ein Nachteil der offenen Frage, ihre „Multidimensionalität", bei der geschlossenen Frage nur nicht in Erscheinung tritt. Dies hängt mit den folgenden beiden Nachteilen zusammen:
2. es besteht die Gefahr, daß sich Antwortkategorien überschneiden; 3. solche können für einzelne Fälle überhaupt fehlen. Insbesondere letzteres ist wohl manchem aus eigener Erfahrung „schmerzlich" geläufig. Dem kann durch zweierlei vorzubeugen versucht werden: a) sorgfältiger Test des Fragebogens (s. dazu unten, „Probebefragung") bzw., noch weitergehend, in einer „Vorabbefragung" offene Formulierung zur Gewinnung der dann vorzugebenden Kategorien. b) „Öffnung" des Fragebogens durch eine Restkategorie „Sonstiges" (mit beliebiger Antwortmöglichkeit). Beispiel 4-21 Aus einer Untersuchung des Instituts für Demoskopie, Allensbach: Interviewer, jetzt gelbe Liste 10 bereitlegen! „Es kann ja verschiedene Gründe geben, warum man ein bestimmtes Geschäft bevorzugt. Hier ist einiges aufgeschrieben - was davon trifft bei Ihnen für dieses Geschäft zu?" (Interviewer überreicht gelbe Liste 10! Mehreres kann eingekreist werden!) /1/2/3/4/5/6/7/8/9/10/ /11/12/13/14/15/16/17/18/ Anderes, und zwar: (S. dazu auch A 4-3).
Die Antwortkategorien dienen hier mehr nur als Gedächtnishilfe. Insofern kann man - umgekehrt - das Vorgehen auch als partielle „Schlüsselung" einer Frage, durch Eingrenzung der Variationsmöglichkeit der Antworten (Vorgabe der Antwortkategorien, die als die wichtigsten angesehen, werden bzw. derjenigen, welche die Antwortrichtung bestimmen) betrachten. Die „Restkategorie" kann dabei auch - formal - vollständig „geschlossen" sein:
Kapitel 4
Die Befragung
69
Beispiel 4-22 Aus der EMNID-Untersuchung „Einkaufsverhalten 1985": „Auf diesem Vorlageblatt stehen verschiedene Dinge des täglichen und längerfristigen Bedarfs. Sagen Sie mir bitte, wo Sie diese Dinge überwiegend einkaufen." Die Antwortmöglichkeiten waren vorgegeben. Es handelt sich dabei zunächst um 9 „Arten des Geschäfts" (vom „Laden um die Ecke/Tante Emma-Laden" bis zum „Wochenmarkt"), ferner aber auch - neben einer Art Filter: „kaufe nicht/selten ein" - eine Restkategorie: „nichts davon". Alternativfragen sind d a d u r c h gekennzeichnet, d a ß nur zwei Möglichkeiten der Beantwortung - von „weiß nicht", „unentschieden" u n d dergleichen abgesehen bestehen. Die einzelnen F o r m e n unterscheiden sich darin, wie diese Alternative formuliert ist: Die einfache Ja-Nein-Frage läßt dem Befragten nur die Antwortmöglichkeiten „ j a " oder „nein". Von der dritten Möglichkeit („weiß nicht" etc.) wird hier, wie gesagt, abgesehen. Diese Kategorie darf jedoch im konkreten Fall nicht unberücksichtigt bleiben, zumal oft nur die Beziehung der einzelnen Antworten auf die Gesamtzahl der Befragten - also einschließlich der „Unentschiedenen" - ein zutreffendes Bild geben kann. (Das spielt z. B. eine große Rolle bei den „Wahlprognosen"!) Diese F o r m besticht durch ihre Kürze: Beispiel 4-23 „Rasieren Sie sich elektrisch?" Beispiel 4-24 „Besitzen Sie einen Pkw?" Letztere Frage ist allerdings zweckmäßigerweise indirekt zu stellen. Sie ermöglicht dann sogar eine Aufspaltung der - in diesem Falle: positiven - Antworten in mehrere Kategorien: Beispiel 4-25 Formal ist die Frage in Beisp. 4-10: „Wer besitzt in Ihrem Haushalt einen Wagen?" keine Ja-Nein-Frage, allerdings die Umformulierung: „Besitzt in Ihrem Haushalt jemand einen Wagen?", mit den gleichen Antwortmöglichkeiten. Insgesamt hätten sich so 3 Kategorien ergeben: „niemand", „ich selbst", „zusätzlich meine Frau bzw. meine Kinder (Zweitwagen)". Die neutrale Fassung der Alternativfrage soll vermeiden, d a ß durch die N e n n u n g nur einer Alternative diese bevorzugt wird; die andere Antwortmöglichkeit ist also ebenfalls a u f z u f ü h r e n . Dabei k a n n die Reihenfolge der N e n n u n g der beiden M ö g lichkeiten eine Rolle spielen. (Ein Ausweg wäre ein Splitting, indem der einen Hälfte der Befragten die eine Folge, der zweiten die andere genannt wird.) A u c h bereitet die Formulierung der Alternative o f t gewisse Schwierigkeiten:
70
Teil II
Methoden der Datengewinnung in der Marktforschung
Beispiel 4-26 Soll man fragen: „Rasieren Sie sich elektrisch oder nicht?" oder: „Rasieren Sie sich elektrisch, oder rasieren Sie sich nicht elektrisch?" oder schließlich: „Rasieren Sie sich elektrisch oder auf eine andere Weise?" Letzteres dürfte vielleicht vorzuziehen sein, zumal es den Anschluß weiterer Fragen unmittelbar ermöglicht. Andererseits ist es fraglich, ob dadurch nicht wiederum eine Möglichkeit, hier die negative, begünstigt wird. D a b e i b r a u c h t es sich d u r c h a u s nicht n u r u m einen ( M e i n u n g s - ) G e g e n s t a n d , ein „Item", zu h a n d e l n . I m folgenden Beispiel geht es u m d a s Z u t r e f f e n o d e r N i c h t Z u t r e f f e n einer ganzen Batterie v o n „ S t a t e m e n t s " (Aussagen, B e h a u p t u n g e n ) : Beispiel 4-27 Aus der EMNID-Untersuchung „Einkaufsverhalten 1985": „Ich lese Ihnen zunächst einige Sätze über das Einkaufs verhalten vor und Sie sollen mir dann bitte sagen, ob der Inhalt dieser Sätze auf Sie zutrifft oder nicht. Also z. B.: ,Ich achte beim Einkauf vor allem auf günstige Sonderangebote.' Trifft das auf Sie zu oder nicht?" Insgesamt waren 15 solcher Statements vorgegeben. (Z.B. auch - N r . 6 - : „Ich kaufe lieber in Fachgeschäften ein als in Warenhäusern, Supermärkten usw." und - Nr. 8 - : „Ich kaufe sehr gern in einem Warenhaus ein, weil ich dort alles unter einem Dach bekommen kann".) Die Dialogfrage ist insofern eine Spezialform der A l t e r n a t i v f r a g e , als d e m Befragten die beiden Möglichkeiten in der Weise präsentiert w e r d e n , d a ß sie - rein textlich o d e r in F o r m v o n b e s o n d e r e n Vorlagekarten oder, n o c h anschaulicher, in Gestalt v o n Bildern (ähnlich der Ballonfrage bzw. d e m Satzergänzungstest) - zwei D i s k u s s i o n s p a r t n e r n in d e n M u n d gelegt w e r d e n u n d der Befragte einem d a v o n z u s t i m m e n soll. Beispiel 4-28 Aus einer Untersuchung des Instituts für Markt- und Verbrauchsforschung der Freien Universität Berlin (STROSCHEIN 1965, S. 113): „Zwei junge Männer unterhalten sich über Verlobungsringe. Der eine heißt Weiß, der andere Schwarz. Weiß sagt: Wenn ich mich verlobe, werde ich teure Ringe aus massivem Gold kaufen. Das ist mir der Anlaß wert. Schwarz sagt: Ich finde es vernünftiger, einfache Ringe zu nehmen. Dann ist mehr Geld für andere Anschaffungen übrig. Wem würden Sie eher zustimmen: Weiß oder Schwarz?" G e g e n die D i a l o g f r a g e in Gestalt v o n S y m b o l e n ( H e r r W e i ß / H e r r Schwarz etc.) a u c h Symbolfrage g e n a n n t - ist der E i n w a n d e r h o b e n w o r d e n , d a ß grundsätzlich keine zwei S y m b o l e gleichwertig seien, also allein s c h o n d u r c h deren V e r w e n d u n g die B e v o r z u g u n g einer b e s t i m m t e n Möglichkeit gegeben wäre. Es f r a g t sich allerdings, o b es ü b e r h a u p t eine völlig „ n e u t r a l e " F a s s u n g geben k a n n (z. B.: H e r r A -
Kapitel 4
Die Befragung
71
Herr Z?). Hier könnte wiederum nur ein Splitting, mit Vertauschen der Symbole, helfen. Die Eigenart der Mehrfach-Auswahl-Frage („multiple-choice question") besteht darin, daß dem Befragten die Auswahl zwischen mehreren Antwortmöglichkeiten gelassen wird. Dabei mag eine unbegrenzte Zahl von Nennungen zulässig sein; der Befragte kann also im Extrem sämtliche oder auch gar keine der ihm vorgegebenen Möglichkeiten auswählen. (Eine gewisse „Begrenzung" liegt lediglich in der beschränkten Anzahl von Antwortvorgaben, entsprechend dem Wesen der geschlossenen Frage.) Die Anzahl der Nennungen kann aber auch begrenzt sein. Dies ist einerseits in unbestimmter Weise möglich, durch Begrenzung also entweder nach unten oder nach oben. Beispiel 4-29 Aus einer Untersuchung von EMNID, Bielefeld: „Was von dieser Liste könnte wohl gerade zu dieser Marke" (von der vorhergehenden Frage) „passen? Bitte lesen Sie diese Liste zunächst ganz durch, bevor Sie einen oder zwei Gesichtspunkte auswählen!"
Andererseits kann die Begrenzung in bestimmter Weise (nach oben und unten) erfolgen, die Anzahl der Nennungen also genau festgelegt sein. Beispiel 4-30 Aus einer Untersuchung von INTERMARKET, Düsseldorf: „Wenn Sie sich jetzt ein gutes Kleid" (bzw. bei Männern: „einen guten Anzug") „für den Sonntag kaufen: Nach welchen zwei dieser Gesichtspunkte suchen Sie sich dann das Kleid" (bzw. bei Männern: „den Anzug") „am ehesten aus?" (Vorgabeliste!)
,,Mehrfachnennungen" - m i t der Konsequenz, daß Prozente auf „über 100" addieren - sind also nur bei Begrenzung auf genau 1 Antwort ausgeschlossen. Dies wird sich allerdings oft aus der Natur der Sache heraus ergeben, nämlich bei sich gegenseitig ausschließenden Antwortmöglichkeiten.
4.3.1.2 Die „Skalierung" Die Skalafrage ist eine Sonderform der Mehrfach-Auswahl-Frage (mit der Möglichkeit nur einer Nennung). Sie soll nicht nur das Vorhandensein eines Sachverhalts, sondern auch dessen Intensität messen. Beispiel 4-31 In Kap. 3 wurde das „Schätzen" und „Testen" am Anteil der Raucher bzw. Nichtraucher exemplifiziert (Beisp. 3-6 und -10). Dieser wäre über die einfache - allerdings, in Anbetracht der Diskussion um die Problematik des Rauchens, vielleicht zweckmäßigerweise neutral oder indirekt zu formulierende - Alternativfrage „Rauchen Sie?" zu ermitteln gewesen. Sie läßt sich aufspalten in mehrere Vorgaben, die eine Art Skala bilden:
72
Teil II 0 Ich 1 Ich 2 Ich 3 Ich
Methoden der Datengewinnung in der Marktforschung
rauche rauche rauche rauche
nicht selten bzw. gelegentlich oft sehr stark
Der im vorstehenden Beispiel zu ermittelnde Sachverhalt ist offensichtlich weitgehend objektiver Art. Allerdings enthält die Skala sehr viel subjektiven Spielraum (Selbsteinschätzung als z. B. sehr stark rauchend) und ist zudem unausgewogen. Eine „Objektivierung" - im Sinne der Einschränkung des subjektiven Spielraums - ließe sich dadurch erreichen, daß nach dem mengenmäßigen Verbrauch pro Zeiteinheit (etwa in einer Woche) gefragt wird. Dies läuft dann allenfalls auf ein Problem der statistischen Gruppenbildung hinaus.
Die eigentliche Bedeutung liegt jedoch im Bereich der subjektiven Sachverhalte. So kann es sich etwa darum handeln, den Grad der Zufriedenheit mit einem bestimmten Produkt oder der Zustimmung zu einem Statement zum Ausdruck zu bringen. Beispiel 4-32 Die Frageformulierung von Beisp. 4-27 beschränkte sich im Grunde auf die beiden Kategorien „Ja, trifft zu" und „Nein, trifft nicht zu". Möglich wären jedoch auch folgende Vorgaben gewesen: o trifft voll und ganz zu o trifft zu o trifft teils zu, teils nicht o trifft eher nicht zu o trifft ganz und gar nicht zu
Solche „subjektiven" Skalen sind im Laufe der Zeit in sehr verschiedenen (und teilweise recht umstrittenen) Ausprägungen entwickelt worden. Einige - wichtige - davon sollen im folgenden diskutiert werden. 1. Rating-Skalen (und Magnitude-Skalierung) Hierbei handelt es sich um eine £7wordnungs-Skala (gelegentlich findet sich auch der Ausdruck „Schätzskala"): Der Befragte hat seine Position in einer Anzahl von Kategorien oder einem Kontinuum anzugeben. Die Ausgestaltung - und damit auch das „Meßniveau" - kann sehr verschieden sein. In den vorstehenden beiden Beispielen handelte es sich um rein verbale Skalen. Sie ergeben - inhaltlich bezeichnete - Kategorien. („Itemized Category Scale".) Beispiel 4-33 (Forts, v. Beisp. 4-31) Es resultieren folgende „Raucher-"Kategorien. 0 Nichtraucher 1 schwacher Raucher 2 starker Raucher 3 sehr starker Raucher
Kapitel 4
Die Befragung
73
Die Messung geschieht also auf Afo/wiMa/skalenniveau. (Die Zuordnung von Zahlen zu den Kategorien im vorstehenden Beispiel dient nur der Verschlüsselung.) Zugleich liegt in den Kategorien jedoch eine gewisse Reihung. Das tritt hervor bei der Messung des Grades der Zufriedenheit oder Zustimmung. Besonders klar wird es bei rein numerischen Skalen. Eine „klassische" Form ist die sog. Stapel-Skala (gemäß Darst. 4-7). Sie bedarf der „ Verankerung", z. B. mit „sehr unzufrieden" für den unteren Minuswert. Zusätzlich kann - da ohnehin „diskretisiert" und damit „geschlossen" - der obere Pluswert mit z.B. „sehr zufrieden" bezeichnet werden. Die Messung geschieht hier nicht mehr auf Nominalskalen-Niveau (zumal die Kategorien gar nicht ausformuliert sind), sondern zumindest dem von Ordinalskalen. Strittig ist jedoch, ob man auch metrisches Niveau annehmen kann (was sehr viel weitergehende Auswertungen, etwa Berechnung von Mittelwerten - auch für verschiedene Gruppen, z. B. Jüngere und Ältere, Männer und Frauen - und letztlich multivariate Analysen, ermöglichen würde). Das hängt sicher auch mit der Ausgestaltung zusammen. So beinhaltet die Skala gemäß Darst. 4-8 (s. auch Darst. 4-18 im Appendix) nicht nur keinen „Nullpunkt", im Sinne von Indifferenz, sondern überhaupt keinen negativen Bereich.
• • • • • N • a
+5 +4 +2 +1 0 -1 -2
Ü
-3
M
-4
H
-5
Darst. 4-7:
Ausgezeichnet
+3
Stapel-Skala
Nicht so gut
Darst. 4-8:
„Thermometer"-Skala
Eine große Rolle spielt zweifellos auch die Anzahl der Intensitätsstufen. In der Praxis werden sehr oft 5er-Skalen (s. Beisp. 4-32 oben) und 7er-Skalen (etwa beim „Semantischen Differential" - s. unten, auch Beisp. 4-39) verwandt. Bezüglich der zweckmäßigen Anzahl von Skalenpunkten liegt eine beträchtliche Anzahl von Untersuchungen vor. Für den angloamerikanischen Raum referieren WIDRICK/ISSELHARDT/MOSS (1983) solche, mit Empfehlung von nur 2 bis zu 20 oder 30, allerdings mit der
74
Teil II
Methoden der Datengewinnung in der Marktforschung
Mehrzahl im Bereich 5 bis 9. In Auswertung einer großangelegten Methoden-Studie für den deutschen Raum konnte STADTLER (1985) feststellen, daß die „Flucht aus dem Nein-Bereich" stark deutlich wird, wenn dem Befragten - bei einer 2er-Skala - nur eine „negative" Kategorie zur Verfügung steht, jedoch bis zu 5 Skalenpunkten anhält; die Erhöhung auf 6 und 7 Punkte wird voll zur Differenzierung genutzt; bei weiterer Erhöhung auf 8 oder 9 trifft dies kaum noch zu, vielmehr entsteht wieder eine gewisse Unsicherheit und Neigung zu den Extrempositionen. Im übrigen kam Stadtler zu dem Schluß, daß es keine Rolle spielt, ob der zahlenmäßig höchste Extrempunkt inhaltlich positiv oder negativ „geladen" war; auch andere Variationen der Darbietungsform hatten offenkundig keinen Einfluß auf die - faktorenanalytisch (s. Kap. 12) gemessene - „Urteilsstruktur".
Der Verf. hält zwar die „metrische Behandlung" einer gemischt-verbal-numerischen Skala (wie sie etwa entstehen würde, wenn man die „Zustimmungsgrade" laut Beisp. 4-32 mit Zahlen versehen und diese dem Befragten bekanntgeben würde - s. auch zur „Likert-Skala" unten) für nicht ganz unbedenklich. Einer rein numerischen Skala würde er dagegen Bedenken - wenn nicht andersgeartete Evidenz vorliegt - kaum entgegenbringen. Das gilt noch stärker für rein graphische Skalen. Beispiel 4-34 In dem bereits erwähnten, vom Verf. federführend betreuten Projekt war auch - zur Gewinnung von „Proximitätsdaten", s. Kap. 1 2 - n a c h der Ähnlichkeit von (Paaren von) Benzinmarken gefragt worden, gemäß Darst. 4-9a und dem folgenden Text.
Esso/Shell
(ähnlich) t
(unähnlich)
I
Shell/Jet Darst. 4-9:
a) rein graphische Skala
Falls Sie ¿te/jzi/i-Verbraucher sind, Ihr Auto also nicht mit Diesel betrieben wird (falls doch, bitte weiter mit Frage 34), würde uns Ihr Urteil über einige Benzinmarken interessieren. Hier wird ja oft gesagt, daß diese weitgehend gleichartig seien; andere wieder „schwören auf ihre Marke". Wir wollen Sie deshalb auch nicht danach fragen, was Sie an der einzelnen Marke gut oder schlecht finden. Vielmehr bitten wir Sie nur, auf den folgenden Skalen zu markieren, für wie ähnlich Sie die einzelnen Marken halten. (Dabei bleibt es selbstverständlich Ihnen überlassen, nach welchen Gesichtspunkten Sie dies beurteilen). Dem ging ein Unterweisungs-Beispiel - für Zigaretten-Marken - voraus, gemäß Darst. 4-9b und dem folgenden Text. Sie halten die Reyno und die Stuyvesant für ziemlich unähnlich. Ihre Markierung könnte dann etwa so aussehen: (unähnlich)
(ähnlich)
Î Darst. 4-9:
b) dto. (Unterweisungs-Beispiel)
Kapitel 4
Die Befragung
75
In dieser Form wird der Unterschied zur - neuerdings stärker diskutierten (LODGE 1981; BEHRENS 1983; G R U N E R T 1983; NEIBECKER 1983a und b) - Magnitude-Skalierung vergleichsweise gering. Auch hierbei erfolgt die Kennzeichnung der Reaktion auf einen Reiz, z. B. durch unterschiedlich hohe Zahlen und verschieden lange Linien, in einem Kontinuum. Allerdings ist dieses im Prinzip nicht, wie oben, geschlossen, sondern offen. Andererseits wird dadurch - da ja jeder Befragte im Grunde sein „Reaktionskontinuum" individuell festlegt - eine Standardisierung erforderlich. (Sie geschieht durch Definition eines „Standardreizes" - z.B. des ersten - und Zuordnung einer willkürlichen Zahl - z.B. 10 - zur Reaktion darauf.) Auch hier bedarf es in der Regel eines Unterweisungs-Beispiels bzw. „Übungsteiles". Das Verfahren stammt aus der „Psychophysik" (STEVENS 1975). Dort ging es darum, sog. psychophysische Funktionen zu gewinnen, d.h. solche, die die Beziehungen wiedergeben zwischen der Ausübung eines physikalischen Reizes („Stimulus" = S) - z. B. Schalldruck und dessen Wahrnehmung - in Gestalt der Lautstärke - , gemessen an der Reaktion („Response" R), etwa in Gestalt unterschiedlich hoher Zahlen oder verschieden langer Linien. Diese Messungen erwiesen sich als recht stabil und führten zum sog. Potenzgesetz'. R = a S ' (mit a als einer Proportionalitätskonstante und ß dem „stimulusspezifischen Exponenten"). Damit waren für eine ganze Reihe solcher Stimuli die Koeffizienten bekannt. Somit konnte eine direkte, „kreuzweise" Validierung erfolgen (indem z. B. ein Reiz als Laut dargeboten wurde und seine Wahrnehmung durch die Auskunftsperson als „Helligkeit" etwa einer einstellbaren Lampe - darzustellen war; s. dazu A 4-4). Durch dieses „Cross Modality Matching" (CMM) ergab sich so letztlich eine Reihe weiterer, validierter „Modalitäten" zur Magnitude-Messung. Für sozialwissenschaftliche Stimuli - wie die Zustimmung zu Statements oder Produkten sind die „wahren" Exponenten natürlich nicht bekannt (nicht einmal die Existenz der Potenzfunktion als solcher). Verwendet man jedoch zwei Modalitäten gleichzeitig, deren „wahre" Exponenten ßx aus der Psychophysik bekannt sind, so kann man den daraus ableitbaren „theoretischen Koeffizienten" ßi/ß2 dem „empirischen Koeffizienten" b = b j/b 2 - mitunter wird auch dieser bereits als „Exponent" bezeichnet - gegenüberstellen und damit zumindest die Konsistenz der Messung überprüfen („Indirect Cross Modality Matching" - ICMM). Beispiel 4-35 GRUNERT (1983) berichtet von einer Untersuchung, bei der insgesamt 59 Personen 12 Statements vorgelegt wurden mit der Bitte, einen „Intensitätsgrad" magnitude-skaliert, mit Linien und mit Zahlen, auszudrücken. Nach Aggregierung, durch „Standardisierung" und anschließender Berechnung des - hier in der Regel: geometrischen - Mittelwertes, ergaben sich für die beiden Modalitäten je 12 Werte. Damit konnte der Regressionskoeffizient b ermittelt werden. Da die aus Psychophysik bekannten „wahren" Exponenten sowohl für Linien als auch Zahlen 1 betragen, war diese Zahl damit auch der zu erwartende „theoretische Koeffizient". Die Abweichung von b gegenüber 1 (als ß) läßt sich auch auf Signifikanz testen. Interessant sind natürlich die Beziehungen zwischen den Ergebnissen von Magnitude- und Kategorien-Skalierung. NEIBECKER (1983a und b) hat diese, in Gestalt des Korrelationskoef-
76
Teil II
Methoden der Datengewinnung in der Marktforschung
fizienten (und für 2 unterschiedliche - und nichtlineare - „Anpassungsmodelle"), berechnet. In allen Fällen - mit verschiedenen Modalitäten bei der Magnitude-Messung - ergaben sich dabei hohe Korrelationskoeffizienten. Sie beruhen allerdings, wie gesagt, auf einem nichtlinearen Anpassungsmodell: der Ansicht der Psychophysiker, „daß Ratingskalen nicht über den gesamten Meßbereich Intervallniveau messen und die Endpunktintervalle gedehnt bzw. gestaucht werden" (NEIBECKER 1983a, S. 228). Diese ungleichmäßige .Stauchung" konnte auch GRUNERT (1983), durch Eintragung der 1 2 Mittelwerte für die Kategorien-Skala auf der einen und der Magnitude-Skala auf der anderen Achse, zeigen. Allerdings wurden dabei diskrete Rating-Skalen - einmal 5, zum anderen 11 stufig - verwandt. (Bei NEIBECKER ist die Art der Rating-Skalen nicht ersichtlich.) Offen bleibt damit die Beziehung zur graphischen Rating-Skala, in der oben dargestellten Form, und damit auch letztlich die Bedeutung der Magnitude-Skalierung für die Praxis:
Vorteile der Magnitude-Messung sind: 1. Die Ergebnisse können am ehesten als metrisch skaliert interpretiert und entsprechenden Prozeduren (insbesondere auch der multivariaten Datenanalyse) unterworfen werden. 2. Die Validität der Skalierung läßt sich prüfen. Als Nachteile müssen angesehen werden: 1. Die Anwendung von Modalitäten wie Helligkeit, Lautstärke usw. erfordert Geräte, kann also vielfach nur in „Studios" durchgeführt werden und wirft damit Repräsentanzprobleme auf. 2. Die Modalitäten „Zahl" und „Linie" können zwar auch in umfangmäßig großen Befragungen angewandt werden. Da ihr psychophysikalischer Exponent aber 1 beträgt, spricht insofern nichts gegen ihre Verwendung in entsprechenden Rating-Skalen. Insbesondere gegen die graphische Rating-Skala lassen sich nicht leicht Argumente vorbringen. 3. Einer der gegen die graphische Rating-Skala möglichen Einwände ist die Erhöhung des Befragungsaufwandes (durch die Einfügung von Unterweisungs-Beispielen); dies trifft aber für die Magnitude-Skalierung generell in noch weit höherem Maße zu. Insgesamt mag deshalb für die Praxis die Verwendung der Magnitude-Skalierung noch offen bleiben. Selbst aber dem gegenüber der graphischen Rating-Skala theoretisch bestehenden Vorteil, daß bei dieser das „Reaktionskontinuum" geschlossen, bei der Magnitude-Skalierung aber oifen ist, sind praktische Grenzen gesetzt, durch das bei der Befragung mittels schriftlichen Fragebogens gegebenen Begrenzung durch das Papierformat. Bei der telefonischen Befragung sind beide ohnehin nicht anwendbar. Dabei ist allerdings auch die Verwendung einer einfachen Rating-Skala nicht ohne weiteres möglich. Beispiel 4-36 (nach ANDERS O. J. - unter Bezugnahme auf: B. Kuhn/C. Charbonnier: Some Aspects of Quantitative Telephone Surveys ... [1978])
Kapitel 4
Die Befragung
77
Im mündlichen Interview ist die Abfrage der Einordnung des Produktes X in die Polarität „modern/altmodisch" durch Vorlage einer Liste mit den Kategorien: „sehr stark (modern) - stark - etwas - weder noch - etwas (altmodisch) - stark - sehr stark" möglich (bei der schriftlichen Befragung durch entsprechende Gestaltung des Fragebogens). Die Abfrage im telefonischen Interview erfordert eine Aufspaltung in zwei Fragen: 1. „Halten Sie das Produkt X für eher modern oder eher altmodisch?" (mit den Antwortkategorien: „eher modern" - „weder noch" - „eher altmodisch") 2. bei der Antwort „eher altmodisch" - bei „eher modern" analog - : „Finden Sie es ausgesprochen altmodisch, ziemlich altmodisch oder nur etwas altmodisch?"
2. Ranking (und Paarvergleich) Ranking setzt d a s Vorhandensein mehrerer Stimuli v o r a u s ; diese w e r d e n n a c h ihrer „ D o m i n a n z " - häufig: P r ä f e r e n z - a n g e o r d n e t , in eine Rangordnung gebracht: Beispiel 4-37 In dem bereits mehrfach erwähnten, vom Verf. federführend betreuten Projekt wurden die Befragten (Nr. 35 des Fragebogens) gebeten, 14 Automodelle in eine Rangordnung zu bringen: „... nennen Sie an 1. Stelle das Modell, das Sie am meisten bevorzugen, danach das in Ihren Augen zweitbeste usw., bis zuletzt das Modell steht, dem Sie am wenigsten zuneigen." Es sei daraufhingewiesen, daß der Vergleich mehrerer Objekte auch durch Rating möglich ist. (,,Comparative Rating Scale".) Es muß sich dabei auch nicht zwangsläufig um Präferenzen handeln; auch „Ähnlichkeitsratings" sind möglich. Hinwiederum lassen sich solche Änlichkeitsdaten auch durch Ranking ermitteln (indem einer der Stimuli als „anchor point", als Referenzreiz dient, nach dem die anderen in abnehmender Ähnlichkeit zu ordnen sind). D i e d u r c h R a n k i n g e n t s t a n d e n e R a n g o r d n u n g ist n a t u r g e m ä ß ordinal skaliert. D u r c h M i t t e l u n g - etwa ü b e r die P e r s o n e n - e n t s t a n d e n e „ D u r c h s c h n i t t s r ä n g e " sind im G r u n d e allenfalls f o r m a l „ m e t r i s c h " . D a g e g e n erlaubt der Paarvergleich bei e n t s p r e c h e n d e r A u s g e s t a l t u n g die „ e c h t e " T r a n s f o r m a t i o n in eine Intervallskala. (S. zu T h u r s t o n e ' s „ L a w of C o m p a r a t i v e J u d g e m e n t " z. B. KAAS 1980.)
3. „Konstantsummenskala" A u c h die Konstantsummenskala setzt d a s V o r h a n d e n s e i n m e h r e r e r Stimuli v o r a u s . J e d o c h wird ein weiterer Schritt zur „ M e t r i s i e r u n g " (s. a u c h z u m K o n z e p t der „ D o l l a r - M e t r i k " u n t e r 13.1) d a d u r c h getan, d a ß auf die einzelnen P r o d u k t e , M a r ken usw. ein b e s t i m m t e r G e l d b e t r a g o d e r eine gegebene A n z a h l v o n P u n k t e n zu verteilen ist. Bei einer g r o ß e n A n z a h l v o n Stimuli sind die Befragten allerdings
78
Teil II
Methoden der Datengewinnung in der Marktforschung
schnell überfordert. Die „Fractination Scale" verfolgt das gleiche Ziel auf etwas anderem Wege: Für einen „Referenzreiz" wird eine bestimmte Anzahl von Punkten vorgegeben; die - in der Summe freie - Zahl von Punkten für die anderen Stimuli soll sich daran ausrichten. (Damit ähnelt diese Form eher der „Magnitude-Skalierung"; s. oben.) Beispiel 4-38 Die Frage nach der Präferenz für Automobile (Beisp. 37) hätte in die Form der, fractination scale " etwa dadurch gebracht werden können, daß der VW 1200 als Standardreiz mit 100 Punkten versehen worden wäre. (S. dazu A 4-5a.) Für die „Konstantsummenskala" hätte man eben diese 100 Punkte insgesamt vergeben können. (S. dazu A 4-5b.)
4. „Likert-Skala" Die Likert-Skala wird vielfach erst (wie auch z. B. die - hier nicht behandelte „Guttman-Skalierung") zu den „eigentlichen", „echten" Skalierungstechniken gerechnet, weil hinter ihr eine Art Meßmodell steht: Es wird eine ganze Fülle von Indikatoren für zu messende Variable gesucht, dann die Messung durchgeführt und daraus ein Gesamtwert berechnet. Es kommt also zu den bereits oben (s. auch Beisp. 27) erwähnten „Statement-Batterien": Für die einzelnen Items hat der Befragte den Grad seiner Zustimmung anzugeben. Dazu wird meist eine 5stufige Rating-Skala verwandt: „starke Zustimmung" = + 2 , (mäßige) „Zustimmung" =+1; „unentschieden" = 0; (mäßige) „Ablehnung" = — 1; „starke Ablehnung" = — 2. (Zur Formulierung der Kategorien s. Beisp. 4-32.) Diese Ratings werden dann, über die verschiedenen Statements, summiert.
5. Semantisches Differential Das Semantische Differential (Polaritätsproiii nach Hofstätter) besteht in seiner Grundform darin, daß die Befragten für eine ganze Serie von Gegensatzpaaren (Polaritäten) - zumeist jeweils auf einer 7stufigen Ratingskala - anzugeben haben, wie sie einen Meinungsgegenstand, z.B. ein Produkt, einordnen. Das Verfahren wurde ausführlich dargestellt in OSGOOD/SUCI/TANNENBAUM (1957 - Neudruck 1967), nach einem Aufsatz von OSGOOD 1952. HOFSTÄTTER führte es unter der Bezeichnung „Polaritätsprofil" in die deutsche Literatur ein und nahm eigene Untersuchungen dazu vor (1955 und - mit LÜBBERT - 1958). Im Aufbau und in der äußeren Gestaltung sind die beiden Verfahren weitgehend identisch; in der psychologischen Konzeption und der Ausrichtung im Detail können allerdings gewisse Unterschiede gesehen werden (s. dazu auch etwa MAGENS 1963).
Kapitel 4
Die Befragung
79
Beispiel 4-39 Aus einer Untersuchung über Haarpflegemittel.
0 interessant
langweilig
nutzlos
nützlich
billig
teuer
chemisch
pflanzlich
kraftvoll
kraftlos
kosmetisch
medizinisch
wässerig
alkoholisch
scharf
mild
praktisch
unpraktisch
schwer duftend
frisch duftend
einwandfrei
fragwürdig
für Männer
für Frauen
gewöhnlich
fein
künstlich
natürlich
stark riechend
schwach riechend
dezent
auffällig
süßlich
herb
ausländisch
deutsch
modern
konservativ
verschwenderisch
sparsam
Darst. 4-10:
Beispiel eines (vorgegebenen) Semantischen Differentials
80
Teil II
Methoden der Datengewinnung in der Marktforschung
Beispiel 4-40 Aus einer Untersuchung von Benzinmarken:
sicher / unsicher
o billig / teuer
ririíN
t n m 00„©„S©„ rniSisO
60 C 3
£ •O u
1 0,95 0,975 0,99
0,95 0,975 0,99
0,95 0,975 0,99
0,95 0,975 0,99
0,95 0,975 0,99
0,95 0,975 0,99
00
Os
© «N
v> Cl
o m
S
© m
© r-
I
0,95 0,975 0,99
1 0,95 1 0,975 0,99
r-
0,95 0,975 0,99
0,95 0,975 0,99
sO
0,95 0,975 0,99
0,95 0,975 0,99
m
1 0,95 1 0,975 i; 0,99
0,95 0,975 0,99
?
8 Cl
8
X
H
e c 4> 00 c a 3 _ • i-i ta
W C3 wS C5 .
372
Anhang
B. Einige Regeln für Matrizen und Vektoren* Im folgenden sollen zunächst einige Definitionen für Matrizen und Vektoren gegeben und Rechenregeln dafür angeführt werden. Danach geht es um einige spezielle Formen von Matrizen und besondere Probleme, die mit der Berechnung verbunden sind. Eine Gliederung in dieser Richtung (etwa: Definitionen, Rechenregeln, Sonderprobleme) erweist sich jedoch als zumindest darstellungsmäßig unzweckmäßig. Nachstehend erfolgt deshalb mehr eine — formal ungeordnete — Aufzählung einiger Punkte. 1. Definition von Matrizen. Unter einer Matrix versteht man ein rechteckiges, aus m Zeilen und n Spalten bestehendes Schema von Zahlen (Elementen): an 321
a 12 a22
. .. a,j • .. a ?j
. • • aln . • • a 2n
a,i
aj2
. • - aü
• • • a in
ami
am2 • • • a m j
• • a mn
m x n ist die Dimension einer Matrix. Ist m = n, so handelt es sich um eine quadratische Matrix. Sie hat eine Hauptdiagonale; deren Summe heißt die Spur der Matrix. Beispiel 1 A=
" 2
3
1 "
4
ist eine quadratische Matrix; die Elemente der Hauptdiagnonalen sind 2 und 4, ihre Spur beträgt 6.
B=
4 1
1 7
2 3
ist eine 2 x 3-Matrix.
Quadratische Matrizen können symmetrisch sein; in diesem Fall sind alle Elemente oberhalb der Hauptdiagonalen (obere Dreiecksmatrix) spiegel* E r g ä n z t e r N a c h d r u c k a u s HÜTTNER 1986C. (S. a u c h HÜTTNER 1 9 7 9 . )
B. Einige Regeln für Matrizen und Vektoren
373
bildlich identisch mit denen unterhalb dieser (untere Dreiecksmatrix): ay = ajj für alle i und j. Eine Matrix aus Korrelationskoeffizienten zwischen k Variablen ist immer symmetrisch (mit jeweils 1 in der Hauptdiagonalen); für eine solche Korrelationsmatrix genügt deshalb die — obere oder untere — Dreiecksmatrix. Sind die Elemente ober- und unterhalb der Diagonalen alle 0, so spricht man von einer Diagonalmatrix. Sind zusätzlich die Elemente der Diagonalen alle 1, so liegt eine Einheitsmatrix vor. (Im folgenden mit I — Identifäfsmatrix — bezeichnet.) Sind andererseits auch die Elemente der Diagonalen 0, oder, allgemeiner — da nicht nur für quadratische Matrizen geltend -, alle Elemente 0, so ist eine 7Vu//matrix (0) gegeben. 2. Addition und Subtraktion von Matrizen. Zwei (oder mehr) Matrizen mit gleicher Dimension — also nicht notwendigerweise quadratisch — kann man addieren und subtrahieren. Dabei werden die Elemente der einzelnen Matrizen addiert oder subtrahiert. Beispiel 2 "4 1 2" 4 1 2" 7 3_ _1 7 3 + 2 1 3 4J
"2 1" 3 4
"8 2 4 _ 2 14 6
"0 0" 0 0
Das letzte Beispiel zeigt, daß gilt: A —A = 0 =A+0=A = 0+ A= A d. h., Addition wie Subtraktion sind kommutativ (und auch assoziativ); die Reihenfolge spielt keine Rolle. 3. Multiplikation von Matrizen. Zwei Matrizen werden miteinander multipliziert, indem man die Elemente der i-ten Zeile der ersten Matrix mit denen der j-ten Spalte der zweiten multipliziert und die Produkte jeweils addiert: an a2i
a12 a22 _
B
bu b12 = C . t>21 b22 _
an bn + ai2b2i a^ bj2 + ai2b22 a2i b n + a22 b 2 j a2] b12 + a22 b22
374
Anhang
Daraus folgt zunächst, daß die Matrizenmultiplikation nur vorgenommen werden kann, wenn die Anzahl der Spalten der ersten Matrix gleich der der Zeilen der zweiten ist, Dagegen mag die Zeilenzahl der ersten und die Spaltenzahl der zweiten beliebig sein; beide ergeben die Dimension der neuen Matrix. Allgemein: zwei Matrizen der Dimensionen ni] x n! und m 2 x n 2 können miteinander multipliziert werden, wenn n! = m 2 ; die Dimension der neuen Matrix ist dann n^ x n2. Beispiel 3 Gegeben seien die beiden Matrizen aus Beispiel 1: A=
2 3
1. A • B =
1" 4 9 16
B= 9 31
"4 1
1 7
2" 3_
7 18
2. BA ist nicht möglich.
Daraus folgt, daß die Matrizenmultiplikation nicht kommutativ ist. Man muß deshalb zwischen iVä-und Poii-Multiplikation unterscheiden: AB bedeutet einerseits, daß B mit A prämultipliziert wird, wie auch umgekehrt die Postmultiplikation von A mit B. 4. Vektoren. Transponieren. Besteht eine Matrix nur aus einer Spalte - Dimension also m x 1 so spricht man von einem Spaltenvektor:
a=
ai a2 ^ am
Entsprechend liegt ein Zeilenvektor dann vor, wenn die Dimension 1 x n beträgt: a' = [a!
a2...aj...an].
a' entsteht aus a durch Transponieren. Entsprechend bezeichnet A' die transponierte Matrix („Transpose").
B. Einige Regeln für Matrizen und Vektoren
375
Beispiel 4 4 1 2 1 7 3
B (aus Beispiel 1) = B' =
4 1 1 7 2 3
Die iVämultiplikation eines Spaltenvektor mit einem Zeilenvektor — von gleicher Dimension — ergibt einen Skalar (d. h. eine einzelne Zahl), das Umgekehrte eine Matrix: i'b=
ab' =
a, bi +
a 2 b2 +
+ ajbj +
. . . + anbm
ai b, a2b,
ai b2 a2 b2
aibj a 2 bj
aibn
aib.
a,b 2
aj bj
ajb„
amb.
amb2
a m bj
ambn_
a2bn
Die iVämultiplikation einer m x n-Matrix mit einem Zeilenvektor der Dimension m ergibt einen Zeilenvektor der Dimension n, die Pos/multiplikation einer m x n- Matrix mit einem Spaltenvektor einen Spaltenvektor der Dimension m: a'B = c' = [c,
c2...cj...c„] Cl C2
Ba = c =
Ci Cm
Dagegen ist die /Vämultiplikation einer Matrix mit einem Spaltenvektor wie auch deren Posfmultiplikation mit einem Zeilenvektor nicht möglich. 5. Inverse, Determinante und Rang einer Matrix. Eine Division von Matrizen, die den üblichen Rechenregeln entsprechen würde, ist nicht definiert. Jedoch läßt sich bei quadratischen Matrizen unter bestimmten Voraussetzungen (s. auch unten) für eine Matrix A eine Matrix A _ 1 so finden, daß AA"1 = I wird. Es gilt auch: l.A-'A-I l.CA-y^A
376
Anhang
MAr^íA-1)' 4. (AB)- 1 = B- , A" 1 . Die rechnerische Durchführung der Inversion ist aufwendig. (Eine Ausnahme bildet die Diagnonalmatrix; die Inversion erfolgt hier einfach durch Einsetzen der reziproken Werte der Hauptdiagonale in diese.) Es existieren dafür verschiedene Rechentechniken, die etwa dem Gauß'schen Algorithmus zum Lösen simultaner Gleichungssysteme bzw. der SimplexMethode beim Linearen Programmieren ähneln resp. darauf zurückgehen. Eine davon wird — da sie die „Determinante" benutzt — im Anschluß an den nächsten Abschnitt vorgestellt. In der Praxis erfolgt allerdings (eben wegen des Aufwandes, zumal bei größeren Matrizen) die Inversion mittels Computerroutinen. Quadratischen Matrizen läßt sich weiterhin eine einfache Zahl — eine Skalar — zuordnen, die als Determinante bezeichnet wird. Sie ergibt sich aus der — mit alternierendem Vorzeichen gebildeten* — Summe der m-( = n-) gliedrigen Produkte der Elemente ay mit den — m! („m-Fakultät") — Permutationen der Zahlen i = 1 bis m und j = 1 bis m. Bei m = 2 gibt es also 2! = 2 • 1 = 2 solcher Permutationen; folglich ist: I AI =
an a2i
a12 a22
= ana 22 —a12a2i.
Beispiel 5 A=
2 1 3 4
I AI = 8 — 3 = 5.
Die Zahl der Glieder steigt sehr rasch an; bei m = 3 ergibt sich bereits: I AI =a 11 a 22 a33 - a,, a23 a32 + a12 a23 a31 - a12 a21 a33 + a13 a21 a32 - a13 a22 a31. Je größer die Dimension einer (quadratischen) Matrix, desto aufwendiger wird also die Berechnung der Determinante und kann dann praktisch nur noch mittels Computern erfolgen. Darauf braucht hier nicht weiter eingegangen zu werden. Festzuhalten bleibt nur, daß Voraussetzung für die Möglichkeit der Inversion einer Matrix ist, daß deren Determinante nicht 0 wird. Ist dies der Fall, „verschwindet" also die Determinante, dann nennt * Exakter formuliert: Das Vorzeichen resultiert aus der Anzahl der Inversionen (gerade+, ungerade-); eine Inversion liegt dann vor, wenn in einem Index eine höhere Ziffer einer niedrigeren vorangeht.
B. Einige Regeln für Matrizen und Vektoren
377
man eine solche Matrix singulär. (Eine nicht-singuläre Matrix heißt auch regulär.) In einem derartigen Falle sind die Zeilen(vektoren) oder Spalten(vektoren) nicht — linear — voneinander unabhängig. (Von linearer Abhängigkeit wird dann gesprochen, wenn sich Vektoren als Linearkombination von anderen ausdrücken lassen.) Der Rang(r) einer quadratischen Matrix ist die Zahl der voneinander unabhängigen Vektoren (Zeilen oder Spalten). Er ist also maximal gleich m (und zwar, wie dargelegt, eben dann, wenn die Determinante nicht verschwindet und damit auch eine Inverse existiert). Andernfalls spricht man von einer Matrix mit reduziertem Rang. Wie bereits erwähnt, soll nun ein Verfahren zur Matrizeninversion kurz vorgestellt werden. Danach ergibt sich die Inverse von A als A - 1 = C ' / I AI. Darin bedeutet C die Matrix der Cofaktoren von A (bezeichnet als: cof A) und C' die Transpose von C, auch Adjunkte (adj A) genannt. Cofaktoren sind die Unterdeterminanten oder Minoren von A (der Ordnung n; n entspricht da es sich voraussetzungsgemäß um quadratische Matrizen handelt, der Anzahl der Reihen in jeder Richtung — Zeilen wie Spalten), die sich ergeben (mit der Ordnung n —1) durch Streichung der i-ten Zeilen und j-Spalte und der Zuordnung eines Vorzeichens, durch Multiplikation mit ( — l)'+i.** Beispiel 6 Gegeben sei die Matrix: A=
4 1 5
1 2 7 3 6 2
Der Wert der Determinante IAI kann nach den früher angegebenen Formeln oder auch über die Cofaktoren berechnet werden. Letzteres bedeutet, daß z. B. bei einer „Entwicklung" nach der 1. Zeile — die Entwicklung nach anderen Reihen würde das gleiche Resultat erbringen! —, also sukzessiver Streichung der 1. bis 3. Spalte bei jeweiliger Streichung der 1. Zeile, die so entstehenden Determinanten zu multipli** Minoren (Unterdeterminanten) und Cofaktoren unterscheiden sich also dadurch, daß letzteren ein Vorzeichen zugeordnet ist. Ferner wurde hier der angloamerikanischen Literatur gefolgt, die streng zwischen cofactor und adjoint Matrix differenziert (s.z.B. Bolch/Huang — 1974). Demgegenüber definiert etwa E. Weber Adjunkte im Sinne der oben für Cofaktoren gegebenen Kennzeichnung und bemerkt konsequenterweise: „Für Adjunkte wird auch der Ausdruck Cofaktor gebraucht" (1974, S.174).
378
Anhang
zieren sind mit den Elementen der 1. Zeile (unter Beachtung der aus obiger Regel resultierenden Vorzeichen). Das ergibt: 7 6
I AI = 4
1 5
3 2
3 2
+2
1 5
7 6
= 4- (14 —18) —(2 —15) + 2-(6 —35) -16 +13 -58 =
-61.
Damit liegt auch bereits die 1.Zeile der Matrix der Cofaktoren fest; nach entsprechender Ermittlung ergibt sich letztere insgesamt als:
C =
7 6
3 2
1 3 5 2
1 5
7 6
1 6
2 2
4 5
2 2
4 5
1 6
1 2 7 3
4 1
2 3
4 1
1 7
-4 10 -11
13 -2 -10
-29 -19 27
(Beispiel für die Vorzeichen: Bei Streichung der 2. Zeile (i) und 3. Spalte (j), also i + j = 5, erhält — da eine ungerade Potenz — der entsprechende Cofaktor: 4 5
1 6
das Minuszeichen.)
Daraus folgt dann einfach:
A-, = C'/-61 =
4 61
10 61
11 61
13 61
2 61
10 61
29 61
19 61
27 61
Diese Rechenschritte sind auch in „Kurzformeln" gefaßt worden. Für eine 2 x 2 Matrix ergibt sich etwa als Inverse von A = 6 1 a
a
a
311 22 — )2 21
a 22 -a 21
311
a 2) -a n a n
a 2
' a 22
B. Einige Regeln für Matrizen und Vektoren
379
6. Eigenstruktur einer Matrix. Eine quadratische Matrix kann mittels der sog. charakteristischen Gleichung beschrieben werden. Diese erhält man dadurch, daß von jedem Element in der Hauptdiagonalen ein Wert X so subtrahiert wird, daß die Determinante verschwindet (p = m = n): au IA — AI| =
a
21
*pl
• X a12 a
a
2 2
p2
'
*lp *2p
= 0
app-/l
Es handelt sich hier also um die Anwendung der Technik der Lagrange-Multiplikatoren', als Lösung ergeben sich so viele solcher X- Werte, wie die Dimension der zugrunde liegenden Matrix beträgt (wobei Xx > Xi+1). Diese Werte bezeichnet man als Eigenwerte. Jedem solchen Eigenwert ist ein Vektor - genannt Eigenvektor - so zugeordnet, daß er die Gleichung Av = Av erfüllt. Die komplette Eigenstruktur einer Matrix wird beschrieben durch die Gleichung AV = VL Darin ist L die Diagonalmatrix der Eigenwerte, und die Matrix V enthält in jeder Spalte den jedem Eigenwert entsprechenden Eigenvektor.
380
Anhang
C. Aufgaben-Lösungen 2-1: Beide Fragen sind zu verneinen. Zu den nicht-metrischen Skalen gehört auch die Nominal-Skala. Lediglich bei bestimmten multivariaten Verfahren (s.Kap. 11 und speziell 12) wird - im Falle von Rangdaten - die Bezeichnung „nicht-metrisch" gerade zur Unterscheidung von „metrischen" Verfahren verwandt.
2-2: Der Begriff „Auswertung" ist deshalb mißverständlich, weil man darunter einmal die im formalen Sinne (d.h. der Verfahren der Datenanalyse), zum andern die inhaltliche Auswertung - die Interpretation - verstehen kann. 3-1:
Ey 81 — = — = 13,5. n 6
n "I-1
3-4: Die Formel für die Lage des Medians lautet: —-—; im Beispiel ergibt sich 6 + 1 = 3,5, d.h., der Median muß als (arithmetisches) Mittel aus also —-— dem 3. und 4. Wert berechnet werden. Da die Reihe in aufsteigender Ordnung lautet: 10; 11; 12; 13; 17; 18 ergibt sich: (12 + 13)/2 = 12,5. 3-11: Bei HARTUNG/ELPELT/KLÖSENER (1987) sind die t-Werte auf 3 Stellen angegeben, allerdings nicht für 500 (bzw. genau: 499), sondern nur für 400 und 600 Freiheitsgrade; Interpolieren ergibt 1,965, gegenüber z = 1,960. (Das stimmt überein mit der - allerdings anders aufgebauten und allein nach den bisherigen Ausführungen schwer verständlichen - Tabelle bei SACHS [1984], die 500 direkt ausweist.) Zunächst ergibt bei Rundung auf nur 2 Stellen die Anwendung der „Gerade-Zahl-Regel" auch für 11,96, und damit das Gleiche. Selbst bei Rechnen mit 3 Dezimalen folgt jedoch als Resultat der Multiplikation 0,0255 (gegenüber 0,0263), d.h. bei Runden auf „ganze" Pfennige wiederum das Gleiche! 3-14: a) t0,95(300) = emp
to,975(300)e
~ 1>96.
|0,80-0,77|
^03_
0.3/1/3ÖÖ
0,017
'
'
Die Nullhypothese kann nicht verworfen werden; das Ergebnis ist nicht signifikant, b) t 0 , 9 5 ( 3 0 0 ) ~ 1,64; t emp unverändert 1,76. Die Nullhypothese kann verworfen werden; das Ergebnis ist signifi-
C. Aufgaben-Lösungen
381
kant. Die Änderung der „Testanlage" hat also zu einer anderen Konsequenz geführt! 4-1: Eine „Omnibus"- oder „Mehr-Themen"-Befragung ist eine - meist von Marktforschungsinstituten in bestimmtem Turnus durchgeführte - Umfrage mit mehreren Themenkomplexen. (S. dazu den als „Appendix" zu Kap. 4 wiedergegebenen Fragebogen-Auszug.) 4-3: a) Nr. 70, 71 und 74. 4-6: Die Auswahlchancen sind extrem ungleich. Das 1. Element hat überhaupt keine Chance, ausgewählt zu werden, das 7. dagegen mehrere: 1-6; 2-5; 3 - 4 (und umgekehrt - die erste Zahl steht für den einen Würfel, die zweite für den anderen). 4-9:
Bei proportionaler Aufteilung ist der Auswahlsatz für alle Schichten i gleich; der Stichprobenumfang jeder Schicht verhält sich also zum Gesamtumfang der Schicht wie der Stichprobenumfang insgesamt zum Umfang der Grundgesamtheit: n; H n
n =
(L.la)
N
i = £ ' N,
Z.B.: also:
(L.lb) 1000 12000 = 160 75000
n.1 nt n2 n3 n4 n,
= = = = =
160 200 280 240 120 1000
4-12: a) Einschränken ja, völlig beseitigen aber natürlich nicht! b) Nein. Solche werden in der Praxis auch kaum angewandt. (Welche Unterschiede sich bei der Zusammensetzung einer Stichprobe ergeben können, wenn die Quotenbedingungen nur „im Total" erfüllt zu sein brauchen, zeigt an einem Beispiel REHORN 1 9 8 7 , S. 8 3 . ) 4-13: a) x ^ . = Y + n b) 700000 +
(x-y)
1000000 1000
(800 -
(L.2) 750) =
(x folgt, als n • x, aus Beisp. 60)
750000
382
Anhang
4-14: a) x^ uo , = ^ • Y
(L.3)
4-15: n = x + t-
(L.4)
Aus:
G e = t- — folgt: t 2 (T2
(L.5)
(L.6)
5-1: Die teilnehmende Beobachtung ist dadurch gekennzeichnet, daß der Beobachter, auf der gleichen Ebene wie der Beobachtete, aktiv am Ablauf des Geschehens teilnimmt. Sie wird unterschiedlich beurteilt. Von den meisten Vertretern der - primär auf die statistische Vergleichbarkeit, wegen der Möglichkeit verallgemeinerungsfähiger Resultate, gerichteten - empirischen Sozialforschung wird sie gerade wegen dieser Beeinflussung abgelehnt. Gelegentlich findet sich auch eine Befürwortung, mit verschiedener Begründung: Während etwa FRIEDRICHS/LÜDTKE ( 1 9 7 3 ) mehr in die Richtung argumentieren, daß sie den „traditionellen", „harten" Methoden tendenziell gleichwertig an die Seite zu stellen sei, entwickeln Anhänger der „Aktionsforschung" (vgl. etwa MOSER 1 9 7 5 ) ein Gegenkonzept, das explizit von der Mitwirkung der „Betroffenen" ausgeht. 6-1: a) Nein. Die Ergebnisse könnten auch als „Lern-Effekt", von einem Interview zum nächsten, erklärt werden, b) Ja. Die Studenten hätten in 3 Gruppen eingeteilt werden können, mit zufälliger Zuordnung jedes Studenten zu einer davon. (Vgl. Norusis, M. J., SPSSX Advanced Statistics Guide, New York 1985, S. 487.)
2 3
7-1:
1. In der neuen Fassung wird deutlich, daß es weniger um die Definition eines Personenkreises als um die einer Methode geht. 2. In der neuen Fassung wird explizit auch von Beobachtung gesprochen. Die alte Fassung ist jedoch deshalb nicht falsch, weil sie sich, wie oben gesagt, auf den PersonenArm bezieht. Streng genommen wird jedoch
C. Aufgaben-Lösungen
383
nicht dieser beobachtet, sondern lediglich zur Erhebung bestimmter Daten die Methode der Beobachtung eingesetzt. (S. „technische Durchführung".) Insofern ist auch die neue Fassung nicht ganz exakt. 3. Die Alternative „oder in gewissen Abständen" ist entfallen. Das kann geschehen, weil sie undeutlich war. Aus den Ausführungen im Text geht hervor, daß eine streng kontinuierliche Durchführung praktisch nicht erfolgt, sondern immer „in gewissen Abständen"; diese sind andererseits sehr verschieden. 4. Die Einschränkung „im Prinzip" ist nunmehr beim „Gleichbleiben" des Personenkreises angebracht (und könnte, gemäß den Erörterungen im Text, auch auf „repräsentativ" bezogen werden), dagegen entfallen beim Gleichbleiben des Untersuchungsgegenstandes. „Über einen längeren Zeitraum hinweg" trifft das jedoch - jedenfalls auf lange Sicht auch nicht zu. Insofern ist der Entfall hier mehr auf sprachliche Gründe zurückzuführen. Aus dieser Sicht dürfte die alte Fassung in jedem Falle vorzuziehen sein. 8-1: „Branchendatenbanken" enthalten, wie der Name schon sagt, Material speziell für eine Branche. Es kann sich dabei um vorwiegend numerische Datenbanken handeln, in denen für eine bestimmte Branche relevantes statistisches Material zusammengestellt ist. Weiterhin kann es um die Aufarbeitung von branchenbezogener Literatur (im Volltext oder nur als Referenz) gehen. Schließlich können Hinweise auf Marktstudien bzw. Produktanwendungen gespeichert sein. Insbesondere die Sammlung und Bereitstellung statistischen Materials ist jetzt schon ein Aufgabengebiet vieler Wirtschaftsverbände. (S. auch in Kap. 19 zur „Verbandsmarktforschung".) Es liegt deshalb nahe, daß diese sich - zunehmend - um den Aufbau von Branchendatenbanken bemühen. Ein erster Versuch, mit der Datenbank ELTRODAT des ZVEI (Zentralverband der Elektrotechnischen Industrie), gilt heute als wenig geglückt. „Der Verband der Chemischen Industrie (VCI) hat aus diesen Erfahrungen gelernt und hat sich ... vor allem auf die Entwicklung einer einfach zu handhabenden Software konzentriert." (REINHARD 1987, S. 137f.) 8-2: Datenbank/!