Grundzüge der Marktforschung [überarbeitete Auflage] 9783486700688, 9783486259179

Lehrbuch für Betriebswirtschaftsstudenten im Fach Marketing an Universitäten und Fachhochschulen und für den Marktforsch

213 29 60MB

German Pages 604 Year 2002

Report DMCA / Copyright

DOWNLOAD PDF FILE

Table of contents :
Darstellungsverzeichnis
Teil I Grundlagen
Kapitel 1: Die Entwicklung der Marktforschung und ihr heutiger Stand
Literaturhinweise
Kapitel 2: Meßtheoretische und verhaltenswissenschaftliche Grundlagen
2.1 Meßtheoretische Grundlagen
2.1.1 Messung und „Meßniveau“ („Skalenniveau“)
2.1.2 Das Problem der Genauigkeit
2.1.3 Forschungsprozeß und „Research Design“
Exkurs: Meta-Analyse
2.2 Verhaltenswissenschaftliche Grundlagen
2.2.1 Modelle zum Käuferverhalten als Basis von Marktforschungsaktivitäten
2.2.2 Bestimmungsfaktoren des Konsumentenverhaltens
2.2.3 Grundlegende psychologisch orientierte Konstrukte und Erklärunesansätze zum Konsumentenverhalten
Literaturhinweise
Aufgaben
Kapitel 3 Inferenzstatistische Grundlagen
3.0 Einführung: Statistische Deskription - Der statistische Schluß bzw. die statistische „Bestätigung“
3.1 Das Schätzen der Parameter
3.2 Das Testen von Hypothesen
Literaturhinweise
Aufgaben
Teil II Methoden der Datengewinnung in der Marktforschung
Kapitel 4: Die Befragung
4.1 Grundformen der Befragung
4.1.1 Einteilung nach dem Adressatenkreis
4.1.2 Einteilung nach dem Erhebungsmodus
4.1.3 Einteilung nach der Zahl der Untersuchungsthemen
4.2 Befragungsstrategie und -taktik
4.2.1 Arten des Interviews
Exkurs: Die Interviewer-Organisation
4.2.2 Indirekte Befragung (und psychologische Tests)
4.3 Das Frageinstrumentarium
4.3.1 Einteilung nach der Antwortmöglichkeit
4.3.2 Andere Einteilungen
4.3.3 Die Entwicklung des Fragebogens
4.4 Die “Stichprobe”
4.4.1 Die Arten der Auswahl der Befragten
4.4.2 Hochrechnung - Fehlerrechnung - Der Umfang der Stichprobe
Literaturhinweise
Aufgaben
Appendix: Fragebogen
Kapitel 5 Die Beobachtung
5.1 Begriff und Arten
5.2 Die Form der Datenkollektion
5.2.1 Datenerhebung durch Beobachter
5.2.2 Der Einsatz von technischen Einrichtungen
5.2.3 Bestandsaufnahmen und “Spurenanalysen”
5.3 Methodische Probleme
5.3.1 Die Repräsentanz
5.3.2 Beobachtereinfluß und “Beobachtungseffekt”
Literaturhinweise
Aufgaben
Kapitel 6 Das Experiment
6.1 Begriff und Arten
6.2 Das Problem der Versuchsanlage
6.2.1 “Klassische” Experimente
6.2.2 “Erweiterte” Experimente
Literaturhinweise
Aufgaben
Kapitel 7 Das Panel
7.1 Begriff und Arten
7.2 Technische Durchführung
7.3 Methodische Probleme
Literaturhinweise
Aufgaben
Kapitel 8 Sekundärmaterial
8.1 Begriff und Bedeutung
8.2 Quellen
8.2.1 Interne Informationen
8.2.2 Externe Informationen
8.3 Technische Durchführung / „Online-Dienste“ und „Internet“
Literaturhinweise
Aufgaben
Teil III Methoden der Datenanalyse in der Marktforschung
Einführung: Datenaufbereitung und Datenanalyse - Die Datenmatrix (und ihre “Partitionierung”)
Kapitel 9 Ein- und mehrdimensionale Auszählungen
9.1 Die einfache Häufigkeitsanalyse
9.2 Kreuztabulierung
Exkurs: “Kohortenanalyse”
Literaturhinweise
Aufgaben
Kapitel 10 Korrelation und Assoziation: grundlegende Verfahren
10.1 Regressions- und Korrelationsanalyse
10.1.1 Lineare und nicht-lineare Einfach-Regression
10.1.2 Multiple Regression
10.2 Kontingenzanalyse
10.3 Möglichkeiten der Regression bei “Nominaldaten”
Literaturhinweise
Aufgaben
Kapitel 11 Weitere Methoden der Dependenz-Analyse
11.1 Varianzanalyse
11.1.1 Begriff und Arten
11.1.2 ANOVA und experimentelle Designs
11.2 Diskriminanzanalyse
11.2.1 Begriff und Arten
11.2.2(Lineare) Diskriminanzanalyse im Zwei-Gruppen-Fall
11.3 AID-Verfahren
11.4 Kanonische Analyse (und Korrespondenzanalyse)
Literaturhinweise
Aufgaben
Kapitel 12 Methoden der Interdependenz-Analyse
12.1 Faktorenanalyse
12.1.1 Begriff und Arten (Die Vorgehensweise im grundsätzlichen)
12.1.2 Der Ablauf im einzelnen
12.2 Multidimensionale Skalierung
12.2.1 Begriff und Arten
12.2.2 Die Skalierung von Ähnlichkeitsdaten
12.2.3 Die Skalierung von Präferenzdaten
12.3 Clusteranalyse
12.3.1 Begriff und Abgrenzung
12.3.2 Die Wahl des Proximitätsmaßes
12.3.3 Die Wahl der Clustertechnik (Clusteranalyse-Algorithmen)
12.3.4 Die Cluster-“Beschreibung” (und die Kombination mit anderen Verfahren)
Literaturhinweise
Aufgaben
Kapitel 13 Allgemeine Ansätze
13.1 Das Conjoint Measurement
13.1.1 Begriff und Abgrenzung
13.1.2 Datengewinnung (und- aggregation)
13.1.3 Die Wahl des Schätzverfahrens - Anwendungsbeispiele
13.2 Die Kovarianzstrukturanalyse
13.2.1 Begriff - Die Entwicklung der Modelle
13.2.2 Identifikation, Schätzung und Überprüfung der Modelle
13.2.3 Anwendung: Beispiele und Probleme
Literaturhinweise
Aufgaben
Teil IV Sachgebiete der betriebswirtschaftlichen Marktforschung
Einführung: Zur Systematik der Anwendungsbereiche der Marktforschung
Kapitel 14 Analyse und Prognose der Entwicklung des Marktes
14.1 Die Ermittlung der Größe des Marktes
14.2 Der Marktanteil und seine Analyse
14.3 Die Heranziehung von Marktindikatoren
14.4 Markt- und Absatzprognosen
Aufgaben
Kapitel 15 Produkttest - Verkaufstest - Testmarkt
15.0 Der Einsatz der Marktforschung in den verschiedenen Stadien des Produktentwicklungsprozesses
15.1 Der Produkttest
15.1.1 Begriff und Arten
15.1.2 Beispiele für Produkt- bzw. Preistests
15.2 Simulierte und reale Markttests
15.2.1 Der Ladentest und das “klassische” Testmarktverfahren
15.2.2 Testmarkt-Simulation und Mini-Testmarktverfahren
Exkurs: Die Messung der “Kundenzufriedenheit”
Aufgaben
Kapitel 16 Die Werbeforschung
16.1 Begriff und Abgrenzung - Die Werbeziele und ihre Realisierung
16.2 Werbeträgerforschung (Mediaforschung)
16.3 Werbemittelforschung
Aufgaben
Kapitel 17 Besondere Bereiche der Marktforschung
17.1 Die Marktforschung für Investitionsgüter
17.2 Die Auslandsmarktforschung
17.3 Die Marktforschung im Dienstleistungssektor
Exkurs: Umfragen und Gewerblicher Rechtsschutz
Aufgaben
Teil V Die Organisation der betriebswirtschaftlichen Marktforschung
Kapitel 18 Betriebliche Marktforschung
18.1 Umfang der betrieblichen Marktforschung
18.2 Aufgaben und organisatorische Stellung der Marktforschung im Betrieb
Kapitel 19 Institute und sonstige Träger der Marktforschung
19.1 Instituts-Marktforschung
19.2 Sonstige Träger
Kapitel 20 Die Kosten der Marktforschung - “Marktforscher” als Beruf
20.1 Die Kosten der Marktforschung
20.2 Die Ausbildung des Marktforschers
20.3 Berufsverbände auf dem Gebiet der Marktforschung
Anhang
A. Statistische Tafeln
B. Einige Regeln für Matrizen und Vektoren
C. Aufgaben-Lösungen
D. Glossarium
E. Vokabularium englisch/deutsch
Literaturverzeichnis
Stichwortverzeichnis
Recommend Papers

Grundzüge der Marktforschung [überarbeitete Auflage]
 9783486700688, 9783486259179

  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

Grundzüge der Marktforschung Von Universitätsprofessor

Dr. Manfred Hüttner und

Dipl.-Ök. Ulf Schwarting

7., überarbeitete Auflage

R. Oldenbourg Verlag München Wien

Die Deutsche Bibliothek - CIP-Einheitsaufnahme Hüttner, Manfred: Grundzüge der Marktforschung / von Manfred Hüttner und Ulf Schwarting. - 7., überarb. Aufl.. - München ; Wien : Oldenbourg, 2002 ISBN 3-486-25917-2

© 2002 Oldenbourg Wissenschaftsverlag GmbH Rosenheimer Straße 145, D-81671 München Telefon: (089) 45051-0 www.oldenbourg-verlag.de Das Werk einschließlich aller Abbildungen ist urheberrechtlich geschützt. Jede Verwertung außerhalb der Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere fur Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Bearbeitung in elektronischen Systemen. Gedruckt auf säure- und chlorfreiem Papier Druck: R. Oldenbourg Graphische Betriebe Druckerei GmbH ISBN 3-486-25917-2

Vorwort Die vorliegende Überarbeitung gehört nicht zu den großen Revisionen; solche erfolgten bei der 5. und insbesondere der 4. Aufl.; s. dazu die nachstehenden Auszüge aus den jeweiligen Vorworten. Gleichwohl wurde auch diesmal der gesamte Text durchgearbeitet; dazu gehörte nicht zuletzt die Überarbeitung der zahlreichen Literaturangaben. So kam es an vielen Stellen zu Änderungen bzw. Ergänzungen. Dabei ist über die letzten drei Auflagen der Anteil von Ulf Schwarting so groß geworden, daß er in dieser siebten nun - über die bisherige Nennung als Mitarbeiter schon im Titelblatt hinaus - als Mitverfasser aufzuführen ist. Möge auch der neue „Hüttner/Sch waiting" eine so freundliche Aufnahme wie die bisherigen Auflagen dieses Buches erfahren!

Aus dem Vorwort zur 4. Auflage Seit dem Erscheinen der 1. Auflage ist ein Viertel)ahrhundert vergangen. Das Buch hat in dieser Zeit eine außerordentlich weite Verbreitung erfahren, sowohl in der Praxis und an den Fachhochschulen, den damaligen Höheren Wirtschaftsfachschulen, als auch an Universitäten. Ein wesentlicher Grund hierfür ist wohl in der Anlage des Lehrbuches zu suchen. Aus sachlichen Gründen erschien eine grundlegende Neubearbeitung nunmehr unabdingbar. Sie wurde unter dem Gesichtspunkt durchgeführt, Bewährtes in der bisherigen Konzeption zu erhalten. So ist an der didaktischen Grundkonzeption einer einführenden Darstellung, an der praxisbezogenen Ausrichtung und an der Demonstration durch drucktechnisch hervorgehobene Beispiele festgehalten worden. Mehr Raum wurde der in den letzten Jahren im Zusammenhang mit der Entwicklung immer leistungsfähigerer Computer bzw. entsprechender Software stark hervorgetretenen Datenanalyse gegeben. Dies macht zugleich die wesentlichste Änderung im formalen Aufbau des Buches aus. Didaktischen Zielen dient die Aufnahme von Fragen und Aufgaben. Zum Teil bringen diese auch inhaltliche Erweiterungen ... Neu ist auch ein im Anhang enthaltenes Glossarium. Zu erwähnen bleibt, daß insbesondere in Kapitel 3 gewisse - zumeist mathematisch-statistische - Grundlagen vorab behandelt werden, da auf sie später des öfteren zurückgegriffen werden muß. Leser mit entsprechenden Vorkenntnissen können diese bewußt knapp gehaltenen Ausführungen überschlagen. Das

VI

Vorwort

kann auch mit den im Test eingeschobenen und typographisch abgesetzten Ergänzungen und Erweiterungen geschehen. Dem Verfasser ist es eine angenehme Pflicht, denen zu danken, die zur Entstehung des Buches beigetragen haben. Naturgemäß können hier nicht alle aufgeführt werden, die dem Zustandekommen förderlich waren. Hervorgehoben werden sollen nur .. die zahlreichen Marktforschungsinstitute, die den Praxisbezug unter anderem durch Überlassung von Material unterstützten. ...

Aus dem Vorwort zur 5. Auflage Seit dem Erscheinen der 4. Auflage um die Jahreswende 1989/90 haben sich im methodischen Bereich der Marktforschung Entwicklungen nicht so sehr bei der Datenanalyse als vielmehr der Datengewinnung vollzogen. Diese wie auch die Veränderungen in den Sachgebieten waren jedoch nicht so groß, als daß sie die - bewährte - Anlage des Buches hätten sprengen müssen. Sie gaben jedoch Anlaß zu einer vollständigen Überarbeitung aller Teile, die - neben gelegentlichen Kürzungen - auch zu zahlreichen Erweiterungen führte. So wurden ζ. B. neu eingefügt - oft nur kürzere - Betrachtungen zum „Markenwert", zur „Kundenzufriedenheitsmessung" und zur „Korrespondenzanalyse0. Neu ist auch, daß nunmehr zu sämtlichen - teils nicht unbeträchtlich vermehrten - Aufgaben im Anhang Lösungen gegeben wurden. Bei dieser Neubearbeitung hat mich Herr Dipl.-Ok. Ulf Schwarting in so vielfältiger Weise unterstützt, daß es geboten ist, ihn schon im Titelblatt als Mitarbeiter zu nennen. Namentlich erwähnen möchte ich hier nur Frau Dr. Anette von Ahsen. ...

Inhaltsübersicht Teil I

Grundlagen

Kapitel 1 Kapitel 2 Kapitel 3

Die Entwicklung der Marktforschung und ihr heutiger Stand Meßtheoretische und verhaltenswissenschaftliche Grundlagen Inferenzstatistische Grundlagen

Teil II

Methoden der Datengewinnung in der Marktforschung

Kapitel Kapitel Kapitel Kapitel Kapitel

4 5 6 7 8

Teil III

Die Befragung Die Beobachtung Das Experiment Das Panel Sekundärmaterial

Methoden der Datenanalyse in der Marktforschung

Einführung: Datenaufbereitung und Datenanalyse - Die Datenmatrix (und ihre "Partitionierung") Kapitel 9 Ein- und mehrdimensionale Auszählungen Kapitel 10 Korrelation und Assoziation: grundlegende Verfahren Kapitel 11 Weitere Methoden der Dependenz-Analyse Kapitel 12 Methoden der Interdependenz-Analyse Kapitel 13 Allgemeine Ansätze

Teil IV

Sachgebiete der betriebswirtschaftlichen Marktforschung

Einführung: Zur Systematik der Anwendungsbereiche der Marktforschung Kapitel 14 Analyse und Prognose der Entwicklung des Marktes Kapitel 15 Produkttest - Verkaufstest - Testmarkt Kapitel 16 Die Werbeforschung Kapitel 17 Besondere Bereiche der Marktforschung

Teil V

Die Organisation der betriebswirtschaftlichen Marktforschung

Kapitel 18 Betriebliche Marktforschung Kapitel 19 Institute und sonstige Träger der Marktforschung Kapitel 20 Die Kosten der Marktforschung - "Marktforscher" als Beruf

Inhaltsverzeichnis Darstellungsverzeichnis

Teil I Grundlagen Kapitel 1 Die Entwicklung der Marktforschung und ihr heutiger Stand

1

Kapitel 2 Meßtheoretische und verhaltenswissenschaftliche Grundlagen

8

Literaturhinweise

2.1 Meßtheoretische Grundlagen 2.1.1 Messung und „Meßniveau" („Skalenniveau") 2.1.2 Das Problem der Genauigkeit 2.1.2.1 Die Arten von Fehlern 2.1.2.2 Réhabilitât und Validität 2.1.3 Forschungsprozeß und „Research Design" 2.1.3.1 Die Stadien des Marktforschungsprozesses 2.1.3.2 Die verschiedenen „Research Designs" Exkurs: Meta-Analyse 2.2 Verhaltenswissenschaftliche Grundlagen 2.2.1 Modelle zum Käuferverhalten als Basis von Marktforschungsaktivitäten 2.2.2 Bestimmungsfaktoren des Konsumentenverhaltens 2.2.3 Grundlegende psychologisch orientierte Konstrukte und Erklärungsansätze zum Konsumentenverhalten 2.2.3.1 Aktivierung 2.2.3.1.1 Spezifische und unspezifische Aktivierung 2.2.3.1.2 Emotion und Motivation 2.2.3.1.3 Einstellung 2.2.3.2 Kognition Literaturhinweise Aufgaben

Kapitel 3 Inferenzstatistische Grundlagen

3.0 Einführung: Statistische Deskription - Der statistische Schluß bzw. die statistische „Bestätigung" 3.1 Das Schätzen der Parameter 3.2 Das Testen von Hypothesen Literaturhinweise Aufgaben

7

8 8 11 12 13 16 16 21 24 27 27 28 32 32 32 33 37 43 48 48

49 49 52 59 65 65

χ

Teil II

Inhaltsverzeichnis

Methoden der Datengewinnung in der Marktforschung

Kapitel 4 Die Befragung

67

Kapitel 5 Die Beobachtung

158

Kapitel 6 Das Experiment

168

4.1 Grundformen der Befragung 68 4.1.1 Einteilung nach dem Adressatenkreis 68 4.1.2 Einteilung nach dem Erhebungsmodus 70 4.1.3 Einteilung nach der Zahl der Untersuchungsthemen 82 4.2 Befragungsstrategie und -taktik 83 4.2.1 Arten des Interviews 83 Exkurs: Die Interviewer-Organisation 86 4.2.2 Indirekte Befragung (und psychologische Tests) 91 4.3 Das Frageinstrumentarium 99 4.3.1 Einteilung nach der Antwortmöglichkeit 100 4.3.1.1 Offene und geschlossene Fragen 101 4.3.1.2 Die "Skalierung" 107 4.3.2 Andere Einteilungen 119 4.3.3 Die Entwicklung des Fragebogens 122 4.4 Die "Stichprobe" 123 4.4.1 Die Arten der Auswahl der Befragten .. 124 124 4.4.1.1 Auswahlverfahren und -techniken im Uberblick 4.4.1.2 Die Zufallsauswahl 126 4.4.1.3 Die Quotenauswahl 131 4.4.1.4 Besondere Formen und Probleme 135 4.4.2 Hochrechnung - Fehlerrechnung - Der Umfang der Stichprobe .. 139 Literaturhinweise 143 Aufgaben 144 Appendix: Fragebogen 148 5.1 Begriff und Arten 5.2 Die Form der Datenkollektion 5.2.1 Datenerhebung durch Beobachter 5.2.2 Der Einsatz von technischen Einrichtungen 5.2.3 Bestandsaufnahmen und "Spurenanalysen" 5.3 Methodische Probleme 5.3.1 Die Repräsentanz 5.3.2 Beobachtereinfluß und "Beobachtungseffekt" Literaturhinweise Aufgaben 6.1 Begriff und Arten 6.2 Das Problem der Versuchsanlage 6.2.1 "Klassische" Experimente 6.2.2 "Erweiterte" Experimente Literaturhin weise Aufgaben

158 160 160 162 164 165 165 165 166 167 168 171 171 176 182 182

Inhaltsverzeichnis

XI

Kapitel 7 Das Panel

183

Kapitel 8 Sekundärmaterial

194

7.1 Begriff und Arten 7.2 Technische Durchführung 7.3 Methodische Probleme Literaturhinweise Aufgaben 8.1 Begriff und Bedeutung 8.2 Quellen 8.2.1 Interneinformationen 8.2.2 Externe Informationen 8.3 Technische Durchführung / „Online-Dienste" und „Internet" Literaturhinweise Aufgaben

Teil III

183 186 191 193 193

194 196 196 197 203 208 209

Methoden der Datenanalyse in der Marktforschung

Einführung: Datenaufbereitung und Datenanalyse - Die Datenmatrix (uncfihre "Partitionierung")

211

Kapitel 9 Ein- und mehrdimensionale Auszählungen

217

Kapitel 10 Korrelation und Assoziation: grundlegende Verfahren

236

Kapitel 11 Weitere Methoden der Dependenz-Analyse

261

9.1 Die einfache Häufigkeitsanalyse 9.2 Kreuztabulierung Exkurs: "Kohortenanalyse" Literaturhinweise Aufgaben

10.1 Regressions-und Korrelationsanalyse 10.1.1 Lineare und nicht-lineare Einfach-Regression 10.1.2 Multiple Regression 10.2 Kontingenzanalyse 10.3 Möglichkeiten der Regression bei "Nominaldaten" Literaturninweise Aufgaben

11.1 Varianzanalyse 11.1.1 Begriff und Arten 11.1.2 ANOVA und experimentelle Designs 11.2 Diskriminanzanalyse 11.2.1 Begriff und Arten 11.2.2 (Lineare) Diskriminanzanalyse im Zwei-Gruppen-Fall 11.2.2.1 Die Extraktion der DiskriminanzfunKtion 11.2.2.2 Die Berechnung von Diskriminanzwerten 11.3 AID-Verfahren 11.4 Kanonische Analyse (und Korrespondenzanalyse)

217 224 228 233 234

236 237 243 250 256 258 259 262 262 265 271 271 273 273 278 281 284

Inhaltsverzeichnis

XII Literaturhinweise Aufgaben

292 293

Kapitel 12 Methoden der Interdependenz-Analyse

296

Kapitel 13 Allgemeine Ansätze

339

12.1 Faktorenanalyse 296 12.1.1 Begriff und Arten (Die Vorgehensweise im grundsätzlichen) ... 296 12.1.2 Der Ablauf im einzelnen 301 12.1.2.1 Kommunalitätenschätzung 301 12.1.2.2 Faktorenextraktion 302 12.1.2.3 Faktorenrotation 304 12.1.2.4 Die Berechnung von Faktorenwerten 306 12.2 Multidimensionale Skalierung 309 12.2.1 Begriff und Arten 309 12.2.2 Die Skalierung von Ahnlichkeitsdaten 311 12.2.3 Die Skalierung von Präferenzdaten 317 12.3 Clusteranalyse 319 12.3.1 Begriff und Abgrenzung 319 12.3.2 Die Wahl des Proximitätsmaßes 322 12.3.3 Die Wahl der Clustertechnik (Clusteranalyse-Algorithmen) .... 325 12.3.4 Die Cluster-"Beschreibung" (und die Kombination mit anderen Verfahren) 330 Literaturhinweise 334 Aufgaben 334 13.1 Das Conjoint Measurement 13.1.1 Begriff und Abgrenzung 13.1.2 Datengewinnung (und-aggregation) 13.1.3 Die Wahl des Schätzverfanrens - Anwendungsbeispiele 13.2 Die Kovarianzstrukturanalyse 13.2.1 Begriff - Die Entwicklung der Modelle 13.2.2 Identifikation, Schätzung und Uberprüfung der Modelle 13.2.3 Anwendung: Beispiele und Probleme Literaturhinweise Aufgaben

Teil IV

339 339 342 348 351 351 358 361 363 364

Sachgebiete der betriebswirtschaftlichen Marktforschung

Einführung: Zur Systematik der Anwendungsbereiche der Marktforschung

365

Kapitel 14 Analyse und Prognose der Entwicklung des Marktes

368

14.1 Die Ermittlung der Größe des Marktes 14.2 Der Marktanteil und seine Analyse 14.3 Die Heranziehung von Marktindikatoren 14.4 Markt- und Absatzprognosen Aufgaben

368 372 376 378 380

Inhaltsverzeichnis

Kapitel 15 Produkttest - Verkaufstest - Testmarkt

15.0 Der Einsatz der Marktforschung in den verschiedenen Stadien des Produktentwicklungsprozesses 15.1 Der Produkttest 15.1.1 Begriff und Arten 15.1.2 Beispiele für Produkt- bzw. Preistests 15.2 Simulierte und reale Markttests 15.2.1 Der Ladentest und das "klassische" Testmarktverfahren 15.2.2 Testmarkt-Simulation und Mini-Testmarktverfahren Exkurs: Die Messung der "Kundenzufriedenheit" Aufgaben

XIII

382 382 383 383 387 391 391 394 395 400

Kapitel 16 Die Werbeforschung

401

Kapitel 17 Besondere Bereiche der Marktforschung

416

16.1 Begriff und Abgrenzung - Die Werbeziele und ihre Realisierung 16.2 Werbeträgerforschung (Mediaforschung) 16.3 Werbemittelforschung Aufgaben 17.1 Die Marktforschung für Investitionsgüter 17.2 Die Auslandsmarktrorschung 17.3 Die Marktforschung im Dienstleistungssektor Exkurs: Umfragen und Gewerblicher Rechtsschutz Aufgaben

Teil V

401 404 410 414

416 424 433 439 441

Die Organisation der betriebswirtschaftlichen Marktforschung

Kapitelle Betriebliche Marktforschung

18.1 Umfang der betrieblichen Marktforschung 18.2 Aufgaben und organisatorische Stellung der Marktforschung im Betrieb

443 444

446

Kapitel 19 Institute und sonstige Träger der Marktforschung

455

Kapitel 20 Die Kosten der Marktforschung "Marktforscher" als Beruf

465

19.1 Instituts-Marktforschung 19.2 Sonstige Träger

20.1 Die Kosten der Marktforschung 20.2 Die Ausbildung des Marktforscners 20.3 Berufsverbände auf dem Gebiet der Marktforschung

Anhang

A. Statistische Tafeln B. Einige Regeln für Matrizen und Vektoren C. Aufgaben-Lösungen D. Glossarium E. Vokabularium englisch/deutsch Literaturverzeichnis Stichwortverzeichnis

455 460

465 471 473 477 482 490 523 546 548 572

Darstellungsverzeichnis Darst. 1-1:

Entwicklungsphasen der Marktforschung

5

Dar st. 2-1:

Arten von Fehlern

13

Darst. 2-2:

14

Darst. 2-3:

Veranschaulichung von Réhabilitât und Validität (nach W E I E R S 1 9 8 8 , S. 1 6 4 ) Stadien des Marktforschungsprozesses

Darst. 2-4:

("Die 5 D's der Marktforschung") Grundmethoden der Datengewinnung

17 23

Darst. 2-5:

Determinanten des Käuferverhaltens und deren Beziehungsgeflecht

30

Darst. 2-6:

Maslow'sche Bedürfnispyramide

36

Darst. 2-7:

Die drei Einstellungskomponenten und ihre möglichen Beziehungen

38

Darst. 3-1:

Normalverteilung (μ und σ)

55

Darst. 3-2:

Normalverteilung (z)

56

Darst. 3-3:

Arten statistischer Tests

61

Darst. 3-4:

Schritte beim Hypothesen-Test

62

Darst. 4-1: Darst. 4-2:

Arten der Befragung Vor- und Nachteile der Grundformen der Befragung nach dem Erhebungsmodus

68

Darst. 4-3:

"Assoziations-Wahltest" (nach NOELLE-NEUMANN/PETERSEN 1996, S. 522) Einteilung der Fragen nach der Antwortmöglichkeit

96 100

Darst. 4-5:

Stapel-Skala

110

Darst. 4-6:

Thermometer-Skala

110

Darst. 4-7:

a) rein graphische Skala b) dto. (Unterweisungs-Beispiel) Beispiel eines (vorgegebenen) Semantischen Differentials Beispiel eines (graphisch ausgewerteten) Polaritätsprofils

111 111 116 117

Darst. 4-4:

Darst. 4-8: Darst. 4-9:

77

Darst. 4-10: Einteilung der Fragen nach der Verwendung von Vorlagen

119

Darst. 4-11: Einteilung der Fragen nach dem Zweck Darst. 4-12: Auswahlverfahren (und Auswahltechniken) Darst. 4-13: Fragebogen (Auszug aus einer Mehr-Themen-Umfrage des EMNID-Instituts) Darst. 4-14: Skala zum EMNID-Fragebogen

120 124 149 155

Darstellungsverzeichnis

XVI Darst. 5-1:

Arten der Beobachtung

159

Darst. 6-1: Darst. 6-2:

Vollständiger Zufallsplan Zufälliger Blockplan

177 178

Darst. 6-3:

Lateinisches Quadrat (Beispiel)

179

Darst. 6-4:

Vollständiger bifaktorieller Zufallsplan

180

Darst. 7-1: Darst. 7-2:

grundsätzliche Arten des Panels wichtige Panels nach der technischen Durchführung

184 188

Darst. 7-3:

Auszug aus dem "Einkaufsbericht" eines GfK-Panels

189

Darst. 7-4:

Nielsen-Gebiete

191

Darst. 8-1:

externe Informationsquellen (Ubersicht)

197

Darst. 8-2:

Fachserien des Statistischen Bundesamtes

198

Darst. 8-3:

Möglichkeiten der Marktforschung im Internet (modifiziert nach

LAMPE 1 9 9 8 )

208

Darst. IIIE-1: Datenmatrix Darst. IIIE-2: multivariate Methoden

213 215

Darst. 9-1: Darst. 9-2:

(einfache) Häufigkeitsverteilung zweidimensionale Häufigkeitsverteilung

217 225

Darst. 9-3: Darst. 9-4: Darst. 9-5:

Querschnitts-Sequenz zur Kohortenanalyse (Schema) dto. Beispiel Alternativrechnungen (Beispiel)

230 230 232

Darst. 10-1: Arbeitstabelle zur Berechnung der linearen Einfach-Regression (1. Berechnungsart) 238 Darst. 10-2: Arbeitstabelle zur Berechnung der linearen Mehrfach-Regression .... 244 Darst. 10-3: Vierfeldertafel 251 Darst. 10-4: 9 · 2-Tabelle (Beispiel) 254 Darst. 11-1: Klassifizierung von Methoden der Dependenz-Analyse Darst. 11-2: "klassische" Diskriminanzanalyse bei 2 Gruppen und 2 Prediktoren (nach COOLEY/LOHNES 1971, S. 245) Darst. 11-3: Arbeitstabelle zur Berechnung der Diskriminanzfunktion Darst. 11-4: Konfusionsmatrix (Beispiel) Darst. 11-5: AID-Baum Darst. 11-6: Konzept von "Redundanz" und "Redundanz-Index" (nach ALPERT/PETERSON 1972, S. 188)

262 273 275 279 281 287

Darstellungsverzeichnis

XVII

Darsi. 12-1: Korrelationsmatrix (Beispiel)

297

Darsi. 12-2: Positionierungsmodell für Produkte des Haushaltsreinigermarktes Darst. Darst. Darst. Darst.

12-3: 12-4: 12-5: 12-6:

(modifiziert nach BÖHLER 1977, S. 236)

309

Euklidische und City-Block-Metrik Cluster und (Q-)Faktoren (nach B A U M A N N 1971) Vierfeldertafel für Ahnlichkeitskoeffizienten Dendrogramm ( 1 . Beispiel - nach FAHRMEIER/HAMERLE [Hrsg.]

313 321 324

1984, S. 395)

326

Darst. 13-1: CM-Rangfolge (Beispiel)

346

Darst. 13-2: konfirmatorisches Faktorenmodell (1. Beispiel) Darst. 13-3: Kovarianzstrukturmodell (nach FÖRSTER et al. 1984) Darst. 13-4: Zusammenstellung der Variablen und Matrizen in einem vollständigen LISREL-Modell

354 357 357

Darst. 14-1: Marktwachstum und Marktsättigung (4-Phasen-Schema des Produktlebenszyklus)

371

Darst. 14-2: Bestand und Nachfrage im PKW-Markt (nach

SIEBKE

1963, S. 44) .... 372

Darst. 14-3: Marktwachstum-Marktanteil-Portfolio

374

Darst. 14-4: regionale Analyse des Marktanteils (1. Beispiel)

376

Darst. 14-5: Systematik der Prognosemethoden

379

Darst. 15-1: Produkttest im engeren und im weiteren Sinne

384

Darst. 15-2: Verfahren der Kundenzufriedenheitsmessung

397

Darst. 16-1: Messung des Werbeerfolgs (nach

HUTH/PFLAUM

1993, S. 220)

Darst. 17-1: Organisation der Auslandsmarktforschung (in Anlehnung an LANTERMANN 1 9 8 4 , S. 7 )

403

432

Darst. 17-2: Fragebogen der Kundenbefragung eines Geldinstituts

438

Darst. 18-1: Checklist zur Überprüfung des Marktforschungsprozesses

450

Darst. 19-1: Die SAMPLE/INRA-Unternehmensgruppe

460

Darst. T-l:

2

Quantile der t- und der χ -Verteilung (sowie der Normalverteilung)

478

Darst. T-2-.

Quantile der F-Verteilung

480

Darst. L-l:

"stub and banner"-Tabelle (Beispiel)

499

Darstellungsverzeichnis

XVIII

Darst. L-2:

Alternativrechnungen (Beispiel - Forts.)

500

Darst. L-3:

Arbeitstabelle zur Streuungszerlegung bei der Regression

502

Darst. L-4:

Arbeitstabelle zur Berechnung der linearen Einfachregression

Darst. L-5:

Dendrogramm

(2. Berechnungsart) (2.

Beispiel - nach

502 FAHRMEIER/HAMERLE

S. 397)

[Hrsg.]

1984,

517

Darst. L-6:

konfirmatorisches Faktorenmodell (2. Beispiel)

519

Darst. L-7:

regionale Analyse des Marktanteils (2. Beispiel)

520

Darst. L-8:

Testverfahren im Produktentwicklungsprozeß

521

Teil I Grundlagen Kapitel 1 Die Entwicklung der Marktforschung und ihr heutiger Stand Es erscheint zweckmäßig, von folgender Definition auszugehen: "Marktforschung ist der systematische Prozeß der Gewinnung und Analyse von Daten für Marketing-Entscheidungen." Diese Definition enthält: - die Betonung des systematischen Charakters der Marktforschung und damit die Unterscheidung zur Markterkundung, dem bloß zufälligen, gelegentlichen Abtasten des Marktes; - die Hervorhebung des /Vozç/f'-Charakters (s. dazu ausführlicher im nächsten Kapitel - unter 2.3); - die Verdeutlichung des Zweckes der Marktforschung, nämlich der Unterstützung der Entscheidungsvorbereitung im Bereich des Marketing. Marktforschung dient also zwar dem Marketing, ist aber nicht dieses selbst, schon gar nicht im Sinne des unmittelbaren Verkaufs, wie etwa beim Telefonmarketing. Formal unterscheidet es sich von diesem auch dadurch, daß die Daten nicht personenbezogen verwertet werden. Die Orientierung am "Marketing" beinhaltet zugleich einige Abgrenzungen. Einerseits scheint damit eine Unterscheidung zwischen Marketing Research und Market Research - und somit auch Afor&tforschung und A fo^ízforschung - nicht (mehr) sinnvoll. Sie ist ohnehin offenbar historisch bedingt; so wird in Europa bzw. speziell Großbritannien eher letztere Bezeichnung verwandt (s. etwa „The Journal of the Market Research Society" - nunmehr Subtitel von „International Journal of Market Research"), in den USA, wo das Marketing entstand, erstere (s. Journal of Marketing Research").

Zu fragen bleibt allerdings, ob dann nicht auch die Bezeichnung "Marktforschung" (die LEITHERER [ 1 9 8 9 , S. 7 4 ] ohnehin für falsch hält, einmal, weil es nicht nur um Märkte, sondern Entscheidungen in Haushalten usw. geht, zum anderen wegen der unangemessenen Ubersetzung des englischen "research" - vom französischen "récherches") verzichtet werden sollte, zugunsten des Begriffs Marketingforschung. Dafür spricht, daß

2

Teil I

Grundlagen

dies eigentlich konsequent wäre. (Tatsächlich wird es auch von einigen Autoren, insbesondere solchen mit "Marketing" als Buchtitel, z.B. NIESCHLAG/DICHTL/HÖRSCHGEN [ 1 9 9 4 ] , getan.) Dagegen spricht zum einen der Sprachgebrauch, insbesondere auch in der Praxis (Benennung von Verbänden, Institutionen usw. - s. Teil V). Zum anderen besteht die Gefahr der Deutung als "Forschung" schlechthin (wie bei der Unterscheidung in Universitäten zwischen "Lehre" und "Forschung" und wohl auch dem seit einiger Zeit existierenden "Journal of Research in Marketing" wo offensichtlich durchaus auch theoretische Beiträge erscheinen [sollen J). Der empirische und auch der Anwendungs-Rezug gingen dann verloren; "Marketingforschung" stünde für alle Bemühungen um Erkenntnis auf irgendeine Weise und durchaus im Bereich der "Grundlagen-Forschung" - des Marketing schlechthin. Der Verf. zieht es deshalb vor, beim etablierten Ausdruck "Marktforschung" zu bleiben. Andererseits bedeutet die Orientierung am "Marketing" auch, daß insoweit der Begriff der "Marktforschung" enger wird: Arbeits- und Finanzmarktforschung - als auf die Beschaffung von personellen und finanziellen Mitteln ausgerichtet - gehören nun nicht mehr dazu. Selbst die "eigentliche" itesc^d^ngsmarktforschung (im engeren Sinne, als Beschaffung von Roh-, Hilfs- und Betriebsstoffen) kann nur dann als eingeschlossen angesehen werden, wenn man die Funktion der "Beschaffung" nicht als eigenständig, sondern als untergeordnet der des "Absatzes" (und nicht etwa der "Produktion"!) betrachtet. Ein solcher Einbezug mag zwar insofern begründbar erscheinen, als es sich beim Beschaffungsmarkt um einen dem Absatzmarkt nahe verwandten Markt - in gewissem Sinne nur sein Spiegelbild - handelt. Im folgenden wird aber darauf verzichtet (zumal auch offenbar eine professionelle Ausprägung als "Beschaffungsmarktforscher" kaum stattgefunden hat). Inhaltlich kann jedoch durchaus eine Ausweitung festgestellt werden. So wird heute - im Zusammenhang mit der Konzeption der "Wettbewerbsstrategie" (PORTER 1 9 8 0 ; HINTERHUBER 1 9 9 0 ) - viel von Konkurrenzforschung gesprochen. Im Grunde ist dies allerdings nichts Neues: Schon SCHÄFER ( 1 9 4 0 , S. 1 2 ) wies der Marktforschung die Aufgaben der Erforschung der Konkurrenz (Angebot), des Bedarfs (Nachfrage) und der Absatzwege zu. Neu scheint allerdings die Einbettung dieser Aufgabe in den Kontext der Strategischen Unternehmensführung; damit verbunden ist auch die Diskussion um die Erweiterung zur Strategischen Marktfor-

Kapitel 1 Die Entwicklung der Marktforschung und ihr heutiger Stand

schung. (Vgl. etwa HÜTTNER 1986a und dazu auch in Kap. 18.)

HÜTTNER/CZENSKOWSKY

3

1986, s.

sprach zunächst (1928) von der Marktbeobachtung; erst später ging er zur Bezeichnung Marktforschung über (und stellte der Marktbeobachtung die Marktanalyse gegenüber). Eine solche Einteilung der Marktforschung in statische Analyse und dynamische Beobachtung ist von BEHRENS (1966 - 1. Aufl. 1961) angegriffen worden. Tatsächlich wird heute - wenn überhaupt - der Terminus "Marktanalyse" lediglich im Sinne einer Tätigkeit, der Durchführung einer "Marktanalyse" (nicht einer "Marktforschung") gebraucht. SCHÄFER

Andererseits hat sich auch das von BEHRENS propagierte Begriffspaar demoskopische und ökoskopische Marktforschung (zumal im Hinblick auf letztere: die Untersuchung der ökonomischen Größen des Marktes als "Objektivationen menschlichen Handelns") nicht durchsetzen können. Auch der Ausdruck Verbrauchsforschung muß als obsolet erscheinen. Die Bezeichnungen "Verbrauchsforschung" bzw. "Konsumforschung" entstanden im Kontext der Nürnberger Schule. (S. dazu unten.) Historisch gesehen, werfen sie jedoch im Hinblick auf die heutige Terminologie mannigfache Abgrenzungsprobleme auf und werden deshalb heute auch nur noch wenig (explizit) benutzt. Dafür hat sich jedoch in jüngerer Zeit ein anderer Begriff entwickelt: der der Verbraucher- oder - häufiger - Konsumentenforschung ("Consumer Research"; s. auch das entsprechende amerikanische "Journal"). Es steht im Zusammenhang mit der Lehre vom Konsumentenverhalten ("Consumer Behaviour") und bezeichnet im Grunde dessen Erforschung. Insoweit, als auch die Mzr&rforschung sich zu großen Teilen mit dem Verhalten der Verbraucher beschäftigt, besteht vom Gegenstand her Übereinstimmung·, ein Unterschied kann allerdings in der möglicherweise anderen Zwecksttzung (Verbraucherpolitik, Konsumentenschutz - früher oft: "Konsumerismus") liegen. Andererseits existieren jedoch auch (Buch-)Titel wie: Consumer Research for Management Decisions (PRINCE 1982). Auf den Begriff wird im folgenden verzichtet. Auch der Begriff Meinungsforschung ist historisch gewachsen, im Hinblick auf die Erforschung der "öffentlichen Meinung" bzw. "Wählermeinung" (Wahlforschung). Im Bereich der eigentlichen Marktforschung

4

Teil I

Grundlagen

sollte er - da unklar bzw. mißverständlich - keine Verwendung finden. (Zum - allerdings relativ geringen - Umfang s. auch in Kap. 19.) Dies gilt auch für die Bezeichnung Motivforschung, einmal wegen der Vielfältigkeit des Begriffes "Motiv" bzw. seiner Abgrenzung zu den Stichworten "Motivation", "Antrieb", "Beweggrund" etc., zum zweiten deshalb, weil die - im Zuge des "Methodenstreits", zwischen "Nasenzählern" auf der einen und den mehr psychologisch ausgerichteten "Tiefenboys" auf der anderen Seite, entstandene - Entgegensetzung von "Marktforschung" und "Motivforschung" heute wohl als überwunden gelten kann. (Zu grundlegenden psychologischen Konstrukten und Erklärungsansätzen s. auch in Kap. 2, zur Berücksichtigung psychologischer Gesichtspunkte insbesondere in Kap. 4.) Die Geschichte der Marktforschung insgesamt ist zwar noch nicht geschrieben. (Vgl. dazu jedoch KAPFERER 1 9 9 4 . ) Immerhin kann man aber, stellt man auf die in der eingangs gegebenen Definition der Marktforschung enthaltenen Unterscheidung zwischen Datenauswertung und Datenanalyse ab, zu einer - primär methodisch ausgerichteten - Periodisierung kommen. Innerhalb der Datengewinnung vermag nämlich wieder danach eingeteilt zu werden, ob es sich um Sekundär- oder Primäriorschung, d.h. originäre Datenerhebung, handelt. Dabei kann weiter danach differenziert werden, ob sie auf "repräsentativer" Basis geschieht und eine "psychotaktisch-zweckmäßige" Datenermittlung erfolgt. Damit ergibt sich eine dreifache Unterteilung: 1. originäre Datenermittlung, 2. (originäre und) repräsentative Datenermittlung, 3. (originäre, repräsentative und) psychotaktisch-zweckmäßige Datenermittlung. Diese Unterscheidung und Bezeichnungsweise wurde - in Weiterentwicklung der Gedanken NOELLE-NEUMANNS (1958) - von BEHRENS (1966, S. 29f.) herausgearbeitet.

Hinsichtlich der Datei\analyse lassen sich ebenfalls 3 Möglichkeiten unterscheiden: 1. Auswertung vorwiegend im Sinne der einfachen Häufigkeitsanalyse (univariat), 2. dto. mittels bivariater (statistischer) Methoden, 3. dto. mittels multivariater Methoden. Damit ergibt sich das Schema gemäß Darst. 1-1.

Kapitel 1 Die Entwicklung der Marktforschung und ihr heutiger Stand

Phasen

I. Datengewinnung

1

originär

5

Π. Datenanalyse (einfache) Häufigkeitsanalyse

2

repräsentativ

bivariate Methoden

3

psychotaktisch-zweckmäßig

multivariate Methoden

Darsi. 1-1: Entwicklungsphasen der Marktforschung Die einzelnen Phasen entwickelten sich aber durchaus nicht simultan. Theoretisch lassen sich deshalb zunächst alle miteinander kombinieren; das ergäbe 3 2 = 9. In der tatsächlichen Entwicklung sind allerdings mehr nur 5 Perioden festzustellen: 1. Ubergang zur originären Datenermittlung bei Auswertung vorwiegend mittels (einfacher) Häufigkeitsanalysen; 2. Ausweitung von Primär- und Sekundärdaten mittels bivariater statistischer Methoden; 3. Ubergang zu Teilerhebungen, bei Auswertung mittels Häufigkeitsanalysen und (vorwiegend) bivariaten statistischen Methoden; 4. Anwendung der psychotaktischen Befragungsweise, bei Auswertung vornehmlich mit (Häufigkeitsanalysen und) bivariaten statistischen Methoden; 5. (zunehmende) Anwendung multivariater statistischer Analyse-Methoden. Die erste Periode ist gekennzeichnet durch Befragung von möglichst großen Massen. Da man die auf der Wahrscheinlichkeitsrechnung aufbauende Theorie der Stichproben nicht kannte, glaubte man, ein um so genaueres Ergebnis zu erhalten, je größer die Befragungsmasse ist - eine auch heute noch gelegentlich anzutreffende Vorstellung! - , und bemerkte umgekehrt nicht, daß auch schon ein relativ kleiner Ausschnitt zu befriedigenden Resultaten führen kann. Der Beginn dieser Periode geht zurück bis auf das 17. Jahrhundert, in dem der Engländer Petty bereits Umfragen unter der Bevölkerung zur Sammlung von Informationen über die Lebensweise des Volkes anstellte. Der Beginn der eigentlichen Marktforschung dagegen liegt erst zu Anfang unseres Jahrhunderts, und zwar vornehmlich in den USA. Er wird dort

6

Teil I

Grandlagen

allgemein mit 1911 datiert: Aufbau einer Marktforschungsabteilung innerhalb der Curtis Publishing Company durch Parlin. Allerdings stammt die erste bekannt gewordene systematische Marktanalyse bereits aus dem Jahr 1879; die Firma "N.W. Ayer and Son" fertigte damals für einen ihrer Kunden eine Untersuchung über die Erzeugung von Getreide an.

In Deutschland wurde ein entscheidender Schritt zur Herausbildung einer eigenständigen Marktforschung mit der 1925 nach mancher Vorarbeit erfolgten Gründung des Instituts für Wirtschaftsbeobachtung (später: Institut für Wirtschaftsbeobachtung der deutschen Fertigware, aus dem 1934 die Gesellschaft für Konsumforschung - noch heute in Nürnberg - hervorging) getan. Einige Zeit darauf begann eine zweite Gruppe von Marktforschern mit ihrer Tätigkeit in Köln, woraus sich später die Gesellschaft für Marktforschung - in Hamburg - entwickelte. Heute kann man vielleicht schon vom Ubergang in eine 6. Periode sprechen, "gekennzeichnet durch eine zunehmende Verknüpfung von apparativ-, medial- bzw. computergestützter Datengewinnung einerseits ... und computergestützter Datenanalyse andererseits". (ZENTES 1 9 8 4 , S. 2 wobei allerdings unter Bezugnahme auf die obigen jeweils drei Phasen von einer "4. Phase" die Rede ist.) Darauf wird später, insbesondere in Kap. 4, noch näher eingegangen. Hier soll noch einmal der grundsätzliche Aufbau des Buches hervorgehoben werden. Entsprechend der einleitend gegebenen Definition der Marktforschung: Datengewinnung, Datenanalyse, Anwendungsbezug folgt diesem einführenden bzw. grundlegenden I. Teil als Teil II: "Methoden der Datengewinnung in der Marktforschung", als III: "Methoden der Datenanalyse in der Marktforschung" und als IV: "Sachgebiete der betriebswirtschaftlichen Marktforschung". Daran schließt sich noch ein Teil V: "Die Organisation der betriebswirtschaftlichen Marktforschung" an. Zu Beginn eines jeden Teiles wird ein Uberblick über dessen Inhalt - die Gliederung in Kapitel - gegeben (so daß hier darauf verzichtet werden kann).

Kapitel 1 Die Entwicklung der Marktforschung und ihr heutiger Stand

7

Literaturhinweise Nachstehend erfolgen, ohne Anspruch auf Vollständigkeit, einige Hinweise zu neueren deutschprachigen Büchern, die sich allgemein mit "Marktforschung" beschäftigen. Auf die Nennung von Zeitschriften wird verzichtet. Es kommen dafür zu viele in Betracht. Andererseits wäre die Beschränkung auf diejenigen mit einem einschlägigen Titel - auch unter dem Gesichtspunkt der Relevanz - eher irreführend. Indirekt kann die Erschließung über das Literaturverzeichnis geschehen. (Die führenden englischsprachigen Zeitschriften wurden im Text bereits erwähnt.)

Als solche mehr oder weniger umfassenden Lehrbücher können - neben HÜTTNER 1 9 7 9 - g e n a n n t w e r d e n : BEREKOVEN/ECKERT/ELLENRIEDER

2001;

BÖHLER 1 9 9 2 ; GREEN/TULL 1 9 8 2 ; HAMMANN/ERICHSON 1 9 9 4 b z w .

2000;

HERRMANN/HOMBURG ( H r s g . ) 2 0 0 0 ; MEFFERT 1 9 9 2 ( u n d SCHÄFER/KNOBLICH 1978).

Kapitel 2 Meßtheoretische und verhaltenswissenschaftliche Grundlagen Im ersten Hauptabschnitt dieses Kapitels werden einige meßtheoretische Grundlagen behandelt, im Unterabschnitt 1 dabei solche quasi im engeren Sinne: die Definition von "Messung" und verschiedener "Meßniveaus". Der Unterabschnitt 2 wendet sich dem Problem der Genauigkeit zu; die verschiedenen Arten von "Fehlern" werden diskutiert und Klärungen der Begriffe "Réhabilitât" und "Validität" vorgenommen. Im Unterabschnitt 3 sind zunächst die Stadien des (Markt-)Forschungsprozesses und sodann die verschiedenen "Research Designs" zu erörtern. Den Abschluß dieses ersten Hauptabschnittes bildet ein Exkurs über die "MetaAnalyse". Der zweite Hauptabschnitt widmet sich dem Käuferverhalten. Dabei werden in erster Linie Modelle zur Erklärung des Konsumentenverhaltens betrachtet, da sie auf den Konstrukten und Ansätzen aufbauen, welche im wesentlichen als Grundlage der Operationalisierung marketingpolitisch relevanter Sachverhalte dienen, die mittels Marktforschung zu untersuchen sind. Der Unterabschnitt 1 behandelt die Relevanz des Käuferverhaltens im Kontext der Marktforschung, während Unterabschnitt 2 auf die Bestimmungsfaktoren des Konsumentenverhaltens eingeht. Im Unterabschnitt 3 werden dann wesentliche psychologisch orientierte Erklärungsmodelle und Konstrukte zum Konsumentenverhalten vorgestellt.

2.1 Meßtheoretische Grundlagen 2.1.1 Messung und "Meßniveau" ("Skalenniveau") Als Messung kann man die - nach bestimmten Regeln vorzunehmende Zuordnung von Symbolen (Zahlen oder Zeichen) zu Objekten bezeichnen. Das Ergebnis der Messung sind also die Daten. (S. dazu auch die Einführung zu T. III.) Man könnte sie auch als Meßwerte bezeichnen. Dieser Begriff ist jedoch in verschiedener Hinsicht mißverständlich; in gewisser Weise gilt das auch für den Aus-

Kapitel 2 Meßtheoretische und verhaltenswissenschaftliche Grundlagen

9

druck tatsächliche Werte; im folgenden wird deshalb - obwohl auch nicht ganz eindeutig; s. dazu Kap. 5 - von Beobachtungswerten (observed values) gesprochen.

Diese Objekte werden im folgenden als Elemente bezeichnet. Das entspricht dem - zwar nicht unbedingt schönen, aber doch treffenden - Sprachgebrauch. Der Begriff "Objekte" ist insofern mißverständlich, als dies - zumal in der Marktforschung! - oft "Subjekte", insbesondere Personen, sind. Auch auf dem in diesem Zusammenhang oft verwendeten Ausdruck Einheit wird verzichtet. Er scheint mehrdeutig: "Da die benutzte Einheit in jeder Phase der praktischen ... Arbeit wechseln kann, ist zwischen Erhebungs-, Aufbereitungs- und Darstellungseinheiten ... zu unterscheiden." (HÜTTNER 1973, S. 47.) Traditionell findet in der Statistik allerdings auch die Bezeichnung Merkmalsträger Anwendung.

Diese Elemente oder Merkmalsträger sind durch eine Reihe von Merkmalen gekennzeichnet, die jeweils in mindestens 2 Ausprägungen vorkommen. (Andernfalls wären es keine Merkmale!) Im folgenden wird dafür einheitlich die Bezeichnung Variable gebraucht. Früher herrschte die Einteilung dieser Merkmale in quantitative und qualitative vor. Erstere wurden dann noch unterteilt in diskrete und kontinuierliche (stetige). Das Kriterium dafür ist, ob die einzelnen Ausprägungen nur bestimmte oder alle möglichen Werte annehmen können. Letzteres wird in vielen Verfahren der - insbesondere "multivariaten" Datenanalyse (in Gestalt von "Normalverteilung") oft angenommen obwohl in der Praxis im strengen Sinne rein kontinuierliche Merkmale selten vorkommen. So werden bestimmte Zwischenwerte schon durch die Festlegung der Maßeinheit oder aus erhebungstechnischen Gründen ausgeschlossen. Selbst wenn man etwa das Merkmal "Umsatz" bis hinunter auf die Maßeinheit "Pfennige" erfassen würde, so sind dadurch einerseits weitergehende Zwischenwerte ausgeschlossen; andererseits wird vor allem aus praktischen Erwägungen eine Rundung auf z.B. volle 1000 DM erfolgen. Dennoch bleibt der prinzipielle Unterschiede (man spricht deshalb bisweilen auch von "fast stetig") zu eindeutig diskreten Merkmalen, wie etwa Anzahl der Beschäftigten, unverkennbar.

Heute erscheint diese Einteilung als nicht mehr ausreichend; vielmehr ist es, nach STEVENS ( 1 9 4 6 ) üblich geworden, 4 verschiedene "Skalenniveaus" zu unterscheiden:

10

Teil I Grundlagen

1. Nominalskala Hierbei erfolgt eine Klassifizierung, d.h. Zuweisung zu Kategorien bzw. von Attributen. Beispiel 2-1 1. Familienstand (z.B. "verheiratet"); 2. "Attribute" bei der Qualitätskontrolle: "gut "/"schlecht" bzw. "brauchbar"/"nicht-brauchbar" (dichotomes oder alternatives Merkmal: Ausprägung 0 oder 1); 3. Beruf. In dem zuletzt genannten Falle, bei vielen möglichen Merkmalsausprägungen, entsteht das Problem einer zweckmäßigen "Reihung", da die alphabetische Anordnung in der Regel unbefriedigend sein wird. Es muß nach einem sachlich sinnvollen Ordnungsprinzip gesucht werden, einer "systematischen" Ordnung (etwa: Metallberufe, Holzberufe usw.). Eine solche bezeichnet man als Systematik oder Klassifikation. Formal wird dabei heute zumeist das Prinzip der Dezimalklassifikation verwandt. Diese Zuordnung von Zahlen, ändern aber nichts am Charakter der Messung. Es sei allerdings noch darauf hingewiesen, daß eine 0/ 1-Variable - abhängig vom konkreten Fall - auch als auf einem höheren Niveau skaliert angesehen werden kann.

Nominalskalierte Variable erlauben nur eine eingeschränkte statistische Verarbeitung. Neben der Auszählung der absoluten und relativen Häufigkeit kommt als Mittelwert nur der Modus (die Kategorie mit der höchsten Anzahl von Elementen) in Frage. Ferner können, bei bi- und multivariaten Verfahren, bestimmte Kontingenzmaße berechnet und mittels der Chi-Quadrat-Analyse "Signifikanztests" vorgenommen werden; s. dazu und zu anderen Auswertungsmöglichkeiten Teil III. 2. Ordinalskala Es erfolgt lediglich eine Zuweisung von Rangziffern\ sie ermöglicht eine "Anordnung" (allerdings ohne Definition der "Intervalle"). Beispiel 2-2 1. die herkömmliche Notenskala. (Der "Besitzer" einer "2" kann nicht als "doppelt so klug" wie der einer "4" bezeichnet werden!) 2. Produkteinschätzungen (A wird gegenüber Β präferiert).

Die Ordinalskala erlaubt bereits weitergehende statistische Auswertungen: "Zentralwert" ("Median") und "Perzentile" (z.B. "Quartile") usw. Im III. Teil werden ferner darüber hinausgehende Techniken erörtert (auch solche, die die Verwandlung in einen "metrischen" Output

Kapitel 2 Meßtheoretische und verhaltenswissenschaftliche Grundlagen

11

erlauben). Sofern die Anzahl der zu vergebenden Rangplätze geringer ist als die der vorhandenen Personen (z.B. 25 Examenskandidaten), ergeben sich allerdings Probleme bei der Bildung der Rangordnung (Bindungen "ties"). 3. Intervallskala Die Messung erfolgt in konstanten Nullpunkt).

Einheiten (allerdings ohne festen

4. Verhältnisskala Die Messung erfolgt in konstanten Einheiten und mit festem Nullpunkt. Verhältnisskalen bilden die "höchste" Form und erlauben sämtliche statistischen Berechnungen. Das gilt auch z.B. für das harmonische und geometrische Mittel sowie den Variationskoeffizienten. Diese Maße sind bei intervallskalierten Daten gegebenenfalls irreführend. Ansonsten bestehen hinsichtlich der Auswertbarkeit kaum Unterschiede: So sind arithmetische Mittel, Standardabweichungen, Maßkorrelationskoeffizienten usw. berechenbar. Man kann deshalb auch die letztgenannten beiden Formen zusammenfassen und sie als kardinales Meßniveau dem ordinalen und nominalen gegenüberstellen. Faßt man die beiden zuletzt genannten ebenfalls zusammen unter der Bezeichnung nicht-metrisch - bisweilen, so bei bestimmten Verfahren der Interdependenzanalyse (s. Kap. 12), wird allerdings darunter auch explizit nur eine Rangordnung verstanden! -, so ergibt sich lediglich noch eine Zweiteilung, in der Gegenüberstellung zu metrisch. S. dazu A(ufgabe) 2-1.

2.1.2 Das Problem der Genauigkeit Im Laufe des Marktforschungsprozesses kann - wie bei jeder empirischen Untersuchung - eine Vielzahl von Fehlern entstehen. Darauf muß in der Sach-Diskussion in späteren Kapiteln noch jeweils hingewiesen werden. Hier kann es zunächst mehr nur um die grundsätzlichen Arten von Fehlern gehen.

12

Teil I

Grundlagen

2.1.2.1 Die Arten von Fehlern Messungen - selbst an nur einem Element - erbringen in der Regel nicht den "wahren Wert" ("true value"). Vielmehr ist dieser "überlagert" durch den Fehler ("error", symbolisch oft e oder ε). Dieser kann nun - was oft angenommen wird - einem Zufallsproztñ folgen, "white noise" (weißes Rauschen) darstellen; er mag aber auch systematisch verzerrt sein, einen "bias" aufweisen. Die erste Art, der Zufallsfehler, kann - im weiteren Sinne - auch die "zufallsähnlichen Meßfehler" einschließen (die zumeist auch bei wiederholten Messungen eines einzigen Tatbestandes entstehen und auf vielerlei "Meßungenauigkeiten" zurückzuführen sind). Im engeren Sinne kann er aber auch nur darauf abstellen, daß statt der Grundgesamtheit im Gesamtumfange Ν lediglich eine (Zufalls-)Stichprobe von η untersucht wird; dieser Fall ist mittels der Formeln der mathematischen Statistik berechenbar (s. Kap. 3) und kann auch als Stichprobenfehler - im engeren Sinne ("sampling error") - bezeichnet werden. Im weiteren Sinne kann man hierzu aber auch diejenigen Fehler rechnen, die durch fehlerhafte Handhabung des Auswahlverfahrens bzw. der Auswahltechnik und falsche Behandlung der Stichprobe entstehen; sie werden im folgenden als Auswahlfehler bezeichnet. Dabei handelt es sich im Prinzip um systematische Fehler (von zufallsähnlich verlaufenden Fehlern wird abgesehen); solche kommen vor allem aber auch erst im weiten Bereich des "nonsampling error" vor. Von einer Aufzählung oder Systematisierung der vielen möglichen Fehlerquellen im Bereich "nonsampling error" oder allgemeiner des systematischen Fehlers wird, wie angedeutet, abgesehen. (Vgl. dazu aber etwa ENIS/YU [1983] mit einer 3 Χ 3-Matrix - in den Zeilen: Projekt-Design, Datengewinnung, Datenanalyse, in den Spalten: Marktforscher, Instrument, Auskunftsperson.) Auch muß darauf hingewiesen werden, daß die Terminologie in der Literatur sehr uneinheitlich ist.

Eine Zusammenfassung gibt Darst. 2.-1.

Kapitel 2 Meßtheoretische und verhaltenswissenschaftliche Grundlagen

Zufallsfehler i.w.S. (random error) zufallsähnliche Meßfehler

Zufallsfehler i.e.S.

13

systematische Fehler (bias)

Auswahlfehler

Stichprobenfehler i.e.S. (sampling error)

sonstiger 'non-sampling error"

Stichprobenfehler i.w.S.

Darst. 2-1: Arten von Fehlern 2.1.2.2 Reliabilität und Validität Es ist üblich geworden, bezüglich der Genauigkeit empirischer Meßinstrumente zwischen der im formalen Sinne, der Reliabilität oder "Zuverlässigkeit" ("reliability"), und der im materiellen Sinne, der Validität oder "Gültigkeit" ("validity") zu unterscheiden. Dabei kann der Bezug zur Differenzierung der Fehler in "zufällige" und "systematische" hergestellt werden: Ein Meßinstrument ist reliabel, wenn es bei wiederholten Messungen das gleiche Ergebnis erbringt; Reliabilität liegt also in dem Maße vor, in dem die Messungen frei von Zufallsfehlem sind. Dagegen gilt ein Meßinstrument dann als valide, wenn es gerade das mißt, was gemessen werden soll; Validität liegt also in dem Maße vor, in dem die Messungen frei von systematischen Fehlern sind. Darst. 2-2 gibt eine anschauliche Zusammenstellung der Zusammenhänge. Sowohl hohe Validität als auch hohe Reliabilität liegen vor im Fall A, weder das eine noch das andere bei D. C zeigt hohe Reliabilität, aber kaum Validität, D umgekehrt Validität bei mangelnder Reliabilität. Es ist zu beachten, daß bei Β der "wahre Wert" - als Durchschnitt - getroffen wird, obwohl alle 4 Einzelmessungen "daneben gehen". Obwohl auch etwa HARTLEY/ PROUGH/FLASCHNER (1983) Validität ohne das Vorliegen von Reliabilität als möglich erachten, wird hieraus verständlich, daß man mitunter Reliabilität als zwar noch nicht hinreichende, aber doch notwendige "Bedingung für das Vorhandensein von Validität" (HILDEBRANDT 1984, S. 42) ansieht. Dann müßte allerdings auch Validität anders definiert werden, als Ausmaß der Freiheit von systematischen und Zufallsfehlern.(So etwa KINNEAR/TAYLOR 1996, S. 232.)

14

Teil I

Grandlagen

Reliability?

hoch

A ,

s /,/' ''

f , I i ,

1

_

SV V

,



:

;



;

wahrer Weit

Messung

;

y ι Ά , . _



^ S

Ν

'

i j ,

ι

Messung

1



V V X > < ι ι 1

wahrer Weit C

niedrig

1

Messung

'

S

S

^

'

y

wahrer Weit

,

,

7

*- - ··\ » -

'

-

"

'

*

Messung



wahrer Weit

Dar st. 2-2: Veranschaulichung von Réhabilitât und Validität (nach WEIERS 1988, S. 164)

Die Erfassung kann nun jeweils in verschiedenen Formen erfolgen. Bei der Réhabilitât sind diese bzw. die dafür verwendeten Bezeichnungen noch einigermaßen übersichtlich. Es sind das im wesentlichen: 1. Test-Retest-Reliabilität. Hierunter versteht man die Korrelation mit einer Wiederholungsmessung zu einem späteren Zeitpunkt. Damit entspricht diese Form unmittelbar der allgemeinen Definition der Reliabilität. Sie hat aber auch ihre Grenzen: Die Ergebnisse hängen von der Länge der dazwischenliegenden Zeit ab (zumal externe Faktoren nicht kontrolliert Werden),

Kapitel 2 Meßtheoretische und verhaltenswissenschaftliche Grundlagen

15

und durch die Wiederholung können bei einzelnen Elementen Lerneffekte auftreten.

2. Parallel-Test-Reliabilität. Hierbei erfolgt die Vergleichsmessung bei einem zweiten Satz von Messungen zum gleichen Zeitpunkt. 3. Interne-Konsistenz-Reliabilität. "Internal Consistence" (oder "Interitem Consistency") wird nachgewiesen durch die Korrelation zwischen Teilen eines Meßinstruments; geprüft wird also die Einheitlichkeit eines - z.B. in zwei Hälften: "split half" - geteilten Instruments (also eines Fragebogens, dessen eine Version der ersten Hälfte der Befragten, die andere der zweiten vorgelegt wird. Empirisch erfolgt die Berechnung von sog. Reliabilitätskoeffizienten; im Kern handelt es sich dabei um Korrelationskoeffizienten (s. Kap. 10). Sie sollten vergleichsweise hoch sein (jedenfalls höher, als man das bei "normalen" Korrelationskoeffizienten üblicherweise erwartet). Außerordentlich divergierend sind die Formen und die Bezeichnungen dafür bei der Validität. HOSSINGER (1982, S. 16ff.) gibt einen Literaturüberblick, aus dem hervorgeht, daß beinahe jeder Verfasser andere Ausdrücke verwendet; er faßt sie später (S. 12, Abb. 35, mit Synonyma) zusammen in vier Gruppen. Eine Gruppenbildung wird auch im folgenden vorgenommen, in 3 Gruppen mit jeweils 2 Unterformen: 1. Inhalts-Validität ("content validity"). Hierbei geht es darum, inwieweit Meßinstrumente inhaltlich, d.h. sachlich und logisch, geeignet sind. Dies kann entweder einfach durch eine Art Plausibilitäts-Prühiag geschehen (Augenschein- bzw. "Face"Validität) oder, etwas strenger, mittels der Beurteilung durch Experten {Experten-Validität). 2. Konstrukt-Validität ("construct validity"). Als Konstrukt-Validität kann man das Ausmaß der Beziehungen zwischen einem theoretischem Konstrukt und dem Konzept einer empirischen Messung bezeichnen. Diese Beziehung kann in zweifacher Hinsicht erfaßt werden: einerseits als Grad, in dem die Meßkonzeption in Richtung des Konstruktes "konvergiert" (man spricht auch von Konvergenz-Validität), zum zweiten - umgekehrt - als der Grad, in dem andere Konstrukte bei der Messung ausgeschlossen sind (.DiskriminanzValidität).

16

Teil I

Grundlagen

Die Messung der Konvergenz- und Diskriminanz-V aliditzt (und damit der Konstrukt-Validität) kann durch Auswertung der Korrelation zwischen den Instrumenten einer MM-Matrix erfolgen (vgl. CAMPBELL/FISKE 1 9 5 9 ) . Eine solche "Multitrait-Multimethod-Matrix (oder "Multimerkmals-Multimethoden-Matrix") enthält in der einen Richtung - etwa den Zeilen - die verschiedenen Konstrukte (oder Merkmale), in der anderen die unterschiedlichen Meß-Methoden. In der praktischen Marktforschungstätigkeit wird das aus Kostengründen schwer durchzuführen sein; man sollte dann zumindest nach einer anderen Form der empirischen Validierung streben: 3. Kriteriums-Validität ("criterion validity"). Auch diese Form kann in zwei unterschiedlichen Ausprägungen auftreten: Bei der Prognose- oder Kor/rmdge-Validität ("predictive validity") wird auf die Ubereinstimmung mit zeitlich später erfolgenden Messungen abgestellt. (Von der Validierung von Prognose-Modellen an den damit erstellten Prognosen - für eine bestimmte Prognosedistanz und mit einem definierten Fehlermaß - ist z.B. ausführlich im Buch d. Verf.: Prognoseverfahren und ihre Anwendung [HÜTTNER 1986c] Gebrauch gemacht worden.) Werden dagegen Messungen zum gleichen Zeitpunkt verglichen, so spricht man von Konkurrent-Validität ("concurrent validity"). Hierzu kann man auch die Kreuz-Validierung Kap. 11 und 13.

("cross validation") rechnen; s. dazu in

2.1.3 Forschungsprozeß und "Research Design" 2.1.3.1 Die Stadien des Marktforschungsprozesses Oben, in Kap. 1, wurde Marktforschung als der "systematische Prozeß der Gewinnung und Analyse von Daten für Marketing-Entscheidungen" definiert. Als Prozeß ist sie damit durch verschiedene Stadien (oder "Phasen" oder "Schritte") gekennzeichnet. Uber diesen /Voze/?-Charakter der Marktforschung besteht im Grunde Einmütigkeit; die einzelnen Stadien werden jedoch teils verschieden beschrieben. So wird in der amerikanischen Literatur (in Anlehnung an die "berühmten" 4 P's des MarketingInstrumentariums - "Product", "Price", "Promotion", "Place") von den "5 P's of Marketing Research: Purpose, Plan, Performance, Processing, Presentation" (HARTLEY/PROUGH/FLASCHNER 1 9 8 3 ) gesprochen. NIESCHLAG/DICHTL/HÖRSCHGEN ( 1 9 9 4 ,

Kapitel 2 Meßtheoretische und verhaltenswissenschaftliche Grundlagen

17

S. 684) unterscheiden folgende Phasen: Definitionsphase (Problemformulierung), Designphase (Konzeptualisierung), Feldphase (Datenerhebung), Analysephase (Auswertung und Interpretation der Ergebnisse), Kommunikationsphase (Transfer der Ergebnisse).

Hier soll ebenfalls von 5 Phasen ausgegangen werden. Drei davon sind bereits in der obigen Definition enthalten, zunächst ganz explizit "Datengewinnung" und "Datenanalyse", schließlich aber auch "Dokumentation, Interpretation und Anwendung". Diesen Phasen voran geht die "Definition und Klärung des Problems" und das "Design". Damit ergeben sich insgesamt die 5 D's der Marktforschung, gemäß Darst. 2-3.

Dar st. 2-3: Stadien des Marktforschungsprozesses ("Die 5 D's der Marktforschung") Die Phasen 3 (Datengewinnung) und 4 (Datenanalyse) werden in Teil II und III ausführlich behandelt. Etwas zu sagen bleibt hier zunächst zur letzten Phase, der Dokumentation. Sie besteht zuvörderst aus der Abfassung des Forschungsberichts. Seine Bedeutung liegt darin, daß er Schlußstein und Krönung der gesamten Erhebung ist und schließlich auch die sichtbare Leistung, die dem Auftraggeber als Gegenwert für seine u.U. nicht unerhebliche Zahlung zur Verfügung gestellt wird. Die Abfassung des Forschungsberichts sollte deshalb grundsätzlich nur ersten Kräften, insbesondere guten Stilisten (Allgemeinverständlichkeit - wenigstens in bezug auf das Management!) überlassen werden, wenngleich natürlich - zumindest auf die Dauer -

18

Teil I Grandlagen

noch so gut geschriebene bzw. gemachte Berichte einen Mangel an sachlichen Leistungen nicht auszugleichen vermögen. Bestandteile des Forschungsberichts sind: 1. Titelseite, Inhaltsverzeichnis und Vorwort. Die Titelseite enthält neben dem Titel selbst weitere Angaben, wie Datum, Auftraggeber usw. Das Inhaltsverzeichnis kann ergänzt werden durch eine Liste der Tabellen und sonstigen Darstellungen. Das Vorwort schließlich wird kurze Angaben über Zweck und Umfang des Auftrages, die grundsätzliche Anlage der Untersuchung usw. enthalten. 2. Zusammenfassung der Resultate. Die Zusammenfassung der Resultate erfolgt vielfach nicht am Ende, sondern am Anfang des Berichts (und oft dazu noch auf andersfarbigem Papier). Dabei empfehlen sich straffe Gliederung und Übersichtlichkeit. 3. Hauptteil. Der Hauptteil enthält neben den Ergebnissen oft - sofern nicht im Anhang - Ausführungen über die Methodik. 4. Anhang Der Anhang kann die verwendeten Formulare - Fragebogen usw. - aufweisen, ferner methodische Erörterungen und evtl. die detaillierte Wiedergabe von im Hauptteil zusammengefaßten Material etc. Die Dokumentation im Sinne der bisher diskutierten schriftlichen Niederlegung (in zunehmenden Maße werden die zahlenmäßigen Ergebnisse auch EDV-gestützt zugänglich gemacht) kann verbunden sein mit einer mündlichen Präsentation. Sie ist generell von großer Bedeutung. (Bei HÜTTNER [ 1 9 8 6 C , S. 3 0 1 ] findet sich deshalb eine "Präsentations-Checklist", die - obzwar ausgehend von der Literatur zur Prognose und auf diese abstellend - sinngemäß auch für die Marktforschung allgemein verwandt werden kann.) Ferner ist darauf hinzuweisen, daß grundsätzlich zwischen der reinen Darstellung der Ergebnisse und deren Interpretation unterschieden werden sollte. (Deshalb wird auch hier auf den Begriff "Ausweitung" - weil mißverständlich, s. dazu A 2-2 - verzichtet.) Beispiel 2-3 (Quelle: LUCK/RUBIN 1987, S. 377f. - freie Übersetzung d. Verf.) Bezüglich der Daten aus einer Umfrage über die Einstellungen von Hausfrauen zu Gas- und Elektroherden (s. auch Bsp.. 4-13 - d. Verf.) ergab sich folgender Disput zwischen Marktforscher und zuständigem Manager: Marktforscher·. Sehen Sie diese Antworten auf die Frage: "Falls Sie einen - komplett modern ausgestatteten - Elektroherd kaufen würden, wie hoch könnte sein Preis vermutlich sein? Desgleichen für einen entsprechenden Gasherd?" Der durchschnittliche Preis für Elektroherde war $ 258 und für Gasherde $ 205. Ich würde meinen, daß dies einen Vorteil für Gas zum Ausdruck bringt.

Kapitel 2 Meßtheoretische und verhaltenswissenschaftliche Grundlagen

19

Manager: Ich meine dies überhaupt nicht. Es scheint mir, daß es vielmehr zeigt, daß die meisten Frauen sich gerade keinen Gasherd vorstellen können, der alle Eigenschaften eines modernen Elektroherdes hat. Deshalb ist dies ein Zeichen gegen Gas. Die Analyse des Marktforschers allein aufgrund der Daten war zweifellos angemessen. (Von einer eventuellen Unklarheit in der Fragestellung wird hier abgesehen. D. Verf.) Sie war jedoch unangemessen im Lichte zusätzlicher Information, wie sie vom Manager in die Diskussion eingeführt wurde.

Daraus folgt schon, daß die Frage, in wessen Bereich - den des Erstellers von Marktforschungsergebnissen ("Doer") oder des Nutzers ("User") Anwendungs-Empfehlungen fallen, umstritten ist. (Probleme der Anwendung werden im Teil IV - "Sachgebiete" - und V - "Organisation" behandelt. Im letzteren wird auch, hinsichtlich des "Erstellers", zwischen betrieblicher und Instituts-Marktforschung unterschieden. Auf diesen Unterschied sollte auch bei den folgenden Ausführungen - wie auch den vorausgegangenen - zum "Forschungsbericht" geachtet werden.) Diese Frage der "Empfehlungen" bzw. der dafür notwendigen - zusätzlichen - Information gilt zunächst für den Forschungsbericht selbst: Soll dieser sich auf die reine Dokumentation beschränken oder aber Vorschläge zur künftigen Betriebspolitik enthalten? Einerseits wird man es für richtig halten können, daß ein Institut - und noch stärker vielleicht ein betrieblicher Marktforscher? - nicht bei der reinen Deskription stehen bleibt, sondern auch Schlußfolgerungen aus den ermittelten Sachverhalten zu ziehen und damit Empfehlungen zu geben versucht. Andererseits wird man einwenden müssen, daß das Institut mit den Belangen des Betriebes nur insoweit vertraut ist, als es zur Durchführung der Erhebung erforderlich war, einen tiefergehenden Einblick aber in der Regel nicht hat und die Erarbeitung der Konsequenzen deshalb besser dem Betrieb selbst überläßt. Auf jeden Fall aber sollten solche Empfehlungen abgesetzt von der reinen Dokumentation vorgebracht werden. Diese Trennung kann formal soweit gehen, daß dafür ein besonderes, zusätzliches Honorar vereinbart wird - ein Ausdruck für die Tatsache, daß der Marktforscher (als "Doer") die Funktion eines Betñebsberaters (als "User") übernimmt. Diese Frage eventueller zusätzlicher Informationen hat auch Bedeutung für die beiden ersten Phasen des Marktforschungsprozesses, die der Definition und des Designs. Eher "technisch" - und zusammenfassend - kann man hierzu folgendes sagen:

20

Teil I

Grundlagen

1. Die sehr wichtige und häufig in ihrer grundsätzlichen Bedeutung unterschätzte Definition und Klärung des Problems ist der erste Schritt bei der Vornahme einer Marktanalyse. Dabei ist es wesentlich, daß das Problem in seiner vollen Tragweite erkannt wird, d.h. eingebettet in den größeren und umfassenden Rahmen des Marktetingproblems, innerhalb dessen es auftritt. Diesen Unterschied zwischen (Markt-)Forschungsproblem und (Markeûng)Entscheidungsproblem demonstrierte CHURCHILL (1987, S. 35) am folgenden Fall: Beispiel 2-4 Eine renommierte Chicagoer Tageszeitung mußte in den 70er Jahren ihr Erscheinen einstellen, letztlich als Folge von Marktforschungsresultaten. ("Yes, it was market research that ultimately killed the 'Chicago Daily News' " - Cappo in Marketing News vom 11.1.1980.) Offensichtlich war jedoch das generelle Entscheidungsproblem falsch definiert worden, nämlich: wie die Auflage zu vergrößern sei - anstatt: wie man sich noch besser auf das Marktsegment ausrichten könne, das bisher bedient wurde. Im Ergebnis verschob die Zeitung ihre Orientierung, was zu ihrem Niedergang führte.

Ist das grundsätzliche Marktforschungsproblem - im Rahmen des allgemeinen Marktetingproblems - definiert und geklärt, so muß es in die Einzelprobleme zerlegt, d.h. festgestellt werden, welche Informationen im einzelnen zu beschaffen sind. Eng damit verbunden ist die Durchführung einer Leitstudie: 2. Unter einer Leitstudie {pilot study) versteht man eine formlose Untersuchung, die - gewissermaßen im "vorstatistischen Bereich" - durch Heranziehung alles geeigneten Materials (Branchen- und Firmenberichte, Marktberichte, Material der amtlichen Statistik, der Handelskammern und Verbände usw.), aber auch durch Befragung von leitenden Angestellten, von Experten, vielleicht auch von einigen Verbrauchern, zur Klärung des Problems beiträgt und feststellt, welche Aufgaben im Rahmen dieses Problems für die Marktforschung entstehen. Damit wird zugleich die Grundlage für die Aufstellung des Forschungsplanes gewonnen. 3. Der Forschungsplan besteht aus drei Teilplänen: - Arbeitsplan - Zeitplan - Kostenplan

Kapitel 2 Meßtheoretische und verhaltenswissenschaftliche Grundlagen

21

Der Arbeitsplan enthält die erforderlichen Arbeiten (soweit sie sich in diesem Stadium bereits übersehen lassen) und die Zuteilung dieser an die einzelnen Mitarbeiter. Aus dem Arbeitsplan ergibt sich unmittelbar der Zeitplan, der die Termine festlegt. Grundsätzlich muß dabei sehr vorsichtig verfahren werden, da im Laufe der Untersuchung neue Probleme auftreten können, die zu einer entsprechenden Verzögerung führen. Ein formales Hilfsmittel hierfür ist die Netzplantechnik. Sie existiert in verschiedenen Varianten; die Literatur darüber ist umfangreich. Deshalb muß auf eine Darstellung hier verzichtet werden. Vgl. aber zum Verfahren grundsätzlich etwa SCHWARZE 1 9 9 4 , zu einem Anwendungsbeispiel im Rahmen der Marktforschung LUCK/RUBIN 1 9 8 7 , S. 325£f.

Aus Arbeits- und Zeitplan zusammen wiederum ergibt sich der Kostenplan. Für den Fall der Durchführung einer Umfrage durch ein Marktforschungsinstitut ist er insbesondere dann von Bedeutung, wenn nicht, wie teilweise üblich, mit Pauschalpreisen gearbeitet, sondern jeder Auftrag individuell kalkuliert wird. Auf die Kalkulationsmetboden der Institute kann hier nicht näher eingegangen werden. Es sei nur soviel festgehalten, daß ein großer Teil der Kosten Fixkosten sind, nämlich insbesondere die auf die Phasen der Vorbereitung, der Datengewinnung sowie der Datenanalyse entfallenden Gehaltskosten und die Kosten für die Hard- und Software im Rahmen hauptsächlich der Analyse. Dagegen sind die Aufwendungen für die Interviewer, die einen erheblichen Teil der Gesamtkosten ausmachen, dem Grundsatz nach variable Kosten. Es liegt deshalb nahe, die Preise nach der Anzahl der Interviews zu bilden: (Kosten pro Interview + Erfahrungssatz für sonstige Kosten) χ Anzahl der Interviews bzw. Kosten pro Interview χ Anzahl der Interviews χ Faktor für sonstige Kosten. Statt dieser sehr vereinfachten Kalkulation bemühen sich nicht wenige Institute um eine detaillierte Kostenrechnung mit möglichst weitgehender Trennung von Einzel- und Gemeinkosten und damit möglichst genauer Zurechnung der Kosten auf den einzelnen Auftrag.

2.1.3.2 Die verschiedenen "Research Designs" Begrifflich kann man als "Research-Design" die grundsätzliche Anlage von Untersuchungen bezeichnen, die maßgeblich ist für die Art und Weise der Datengewinnung und Datenanalyse. Die verschiedenen Arten

22

Teil I Grundlagen

lassen sich in zwei Gruppen zusammenfassen: experimentelle und deskriptive Designs. Auf die bisweilen anzutreffende Ubersetzung von Research Design mit "Forschungsdesign" wird verzichtet (nicht zuletzt wegen der - in Kap. 1 diskutierten - Problematik des Ausdrucks "Forschung"). Nicht selten wird eine dritte Gruppe hinzugefügt: "explorative" Studien (S. zum Begriff "explorativ" und speziell "explorative Datenanalyse" auch unten. WEIERS 1988 nennt sogar eine vierte Gruppe: "predictive".

1. Experimentelle Designs sind nach der Meinung d. Verf. (derzeit noch?) die einzigen, die im strengen Sinne die Zurechnung von "Wirkungen" gestatten. Darauf wird ausführlich in Kap. 6 eingegangen. Insofern hätte hier auch die - von verschiedenen Autoren verwendete - Bezeichnung "kausale" Studien benutzt werden können. Der Begriff ist etwas mißverständlich. So kann auch die sog. Kausalanalyse allenfalls der "konfirmatorischen Analyse", (s. dazu unten) zugerechnet werden; s., unter einer etwas weniger mißverständlichen Bezeichnung, 13.2.

2. Bei den deskriptiven Designs kann man zunächst zwischen Primärund Sekundärforschung unterscheiden. Primärforschung liegt vor, wenn Material eigens für Untersuchung erhoben wird; bei der Sekundärforschung wertet man lediglich bereits vorhandenes Material (aus internen und insbesondere externen Quellen) aus; s. dazu Kap. 8. Etwas problematisch ist die vielfach anzutreffende Gleichsetzung dieser Begriffe mit der Feldforschung (field research) und Schreibtischforschung (desk research), da auch bei der Primärforschung "Schreibtischarbeit" zu leisten ist, ja, umgekehrt die Feldarbeit, die Tätigkeit der Interviewer etc., im technischen Ablauf sogar nicht einmal den größten Teil ausmacht. Andererseits bleibt fraglich, was unter "Feldforschung" eigentlich genau zu verstehen ist (nur die Tätigkeit der Interviewer, auch Probebefragungen, die Kontrolle des Interviews usw.?), so daß auch aus diesem Grunde auf das Begriffspaar im gegebenen Zusammenhang besser ganz verzichtet wird.

Insofern ist der Begriff "Datengewinnung" (oder -kollektion) weiter als der der "Datenerhebung": Er umfaßt auch die Sekundärforschung. Die Grundmethoden der Primärforschung sind Beobachtung und Befragung, so daß sich insgesamt das Schema gemäß Darst. 2-4 ergibt.

Kapitel 2 Meßtheoretische und verhaltenswissenschaftliche Grundlagen

23

Grundmethoden der Datengewinnung Sekundärforschung intern

extern

Primärforschung Befragung

Beobachtung

Darst. 2-4: Grundmethoden der Datengewinnung

Bei der Primärforschung kann man weiter zwischen qualitativen und quantitativen Methoden differenzieren. Die Definition dessen, was "qualitative Forschung" (im Unterschied zu "quantitative research") ausmacht, ist schwierig. "Niemand kennt die genaue Bedeutung des Wortes 'qualitative Forschung'" (U. Reuter in Context 2 5 / 9 5 , S. 20). COOK/REICHHARDT ( 1 9 7 9 ) n e n n e n b z w . d i s k u t i e r e n - u n d stellen sie z . T . in F r a g e - 11

"Attributes of the Qualitative and the Quantitative Paradigms", darunter "subjektiv vs. objektiv", "valid vs. reliabel"; gelegentlich wird auch nur auf die Zahl der Fälle "einer bzw. wenige" vs. "viele" - abgestellt (und von "weichen" resp. "harten" Methoden oder Daten gesprochen).

Wegen dieser Vielfalt und weil die Aufnahme bzw. Nichtberücksichtigung bestimmter Kriterien in die Definition der "Ladung" in Richtung von Vorurteilen bedeutet, wird hier auf einen Versuch dazu verzichtet. Statt dessen seien lediglich Beispiele für qualitative Verfahren genannt, die in der Marktforschung schon seit langem Verwendung finden. Es sind dies vor allem das qualitative Interview (s. dazu 4 . 2 . 1 ) und die Gruppendiskussion (s. 4 . 2 . 2 ) . Auf die Bedeutung von Case Research (und grundsätzliche Fragen - s. im übrigen auch die Literaturhinweise am Schluß dieses Kapitels) ist etwa B O N O M A ( 1 9 8 5 ) eingegangen. Zur teilnehmenden Beobachtung - und überhaupt "unobtrusive measures" - s. auch in Kap. 6. (Zur Inhaltsanalyse, die explizit die beiden Spielarten, eben auch als "qualitative Inhaltsanalyse" - so schon der Titel von M A Y R I N G [ 1 9 9 3 ] - auftritt, s. in Kap. 9.) Ansonsten wird in diesem Buch eher - dem "mainstream" folgend - auf die traditionellen ("harten") Methoden der empirischen Sozialforschung

24

Teil I

Grundlagen

abgestellt. Ehe dies, schon im folgenden Kapitel, geschieht, sei jedoch wie bereits angedeutet - auf einen anderen, erst in jüngerer Zeit hervorgetretenen Begriff eingegangen: den der explorativen Datenanalyse (und, als Entgegensetzung, die "konfirmatorische Analyse"). Er geht auf J. W. Tukey zurück und stellt darauf ab, allein aus den Daten - ohne aprioriAnnahmen - verborgene Strukturen und/oder Anomalien aufzudecken. (TUKEY selbst [ 1 9 7 7 , S. 1 ] spricht in diesem Zusammenhang von "detective work", LEAMER [ 1 9 7 8 , S. 7 , 2 8 6 ] , in etwas anderem Kontext, von "Sherlock Holmes inference"). Insofern geht der Begriff über den der deskriptiven Statistik, in der Gegenüberstellung zur schließenden (inferentiellen) Statistik - s. Kap. 3 -, hinaus. Andererseits folgt der Gegenbegriff der "konfirmatorische Analyse" dem Schema der "inferentiellen Statistik" (in seiner einfachsten Form - s. die Ableitungen und Beispiele in Kap. 3 - dem Testen von Hypothesen über die Gesamtheit aufgrund der Ergebnisse einer Stichprobe). Es sind also insgesamt 3 Begriffspaare zu unterscheiden, die zwar eng miteinander verwandt, aber eben nicht identisch sind: 1. deskriptive und kausale Designs, 2. deskriptive und schließende (inferentielle) Statistik, 3. explorative und konfirmatorische Analyse. "Explorative" und "konfirmatorische Modelle" unterscheiden sich nicht nur in bezug auf relativ komplizierte - speziell multivariate - Analyse-Verfahren. (S. dazu etwa die "herkömmliche" - Faktorenanalyse, in Kap. 12, und die "konfirmatorische Faktorenanalyse", unter 13.2.) Vielmehr hat TUKEY (1977) eine Fülle von Verfahren im Rahmen einfacher Häufigkeitsauszählungen vorgeschlagen. Sie wurden allerdings eher nur zögerlich bzw. partiell in die allgemeine statistische (Lehrbuch-)Literatur und selbst in die Datenanalyse-Programmsysteme (s. dazu in der "Einführung" vor Kap. 9) integriert. Es existieren jedoch besondere Darstellungen, etwa POLASEK 1994 (und auch spezielle Programme - z.B. P S - E X P L O R E ) .

Exkurs: Meta-Analyse Mit der Zunahme der Zahl empirischer Untersuchungen wächst das Bedürfnis nach deren integrierender Darstellung, nach Generalisierung dies um so mehr, als sich die Resultate der einzelnen Studien oft zu widersprechen scheinen. Das "klassische" Mittel dazu ist der Literaturüberblick·, GLASS/MCGRAW/SMITH 1 9 8 1 kennzeichnen diesen "literature review" auch als "narrativ" (erzählend); jedenfalls ist er, im Sinne der

Kapitel 2 Meßtheoretische und verhaltenswissenschaftliche Grundlagen

25

oben diskutierten Gegenüberstellung, qualitativ. Das quantitative "Gegenstück" dazu bildet die Meta-Analyse. Man versteht, darunter die statistische Analyse der Ergebnisse von Einzel-Studien, die - statistische "Analyse von Analysen". Der Ausdruck und sein Inhalt wurden von GLASS (1976) geprägt, in Abhebung von der Primär-Analyse, der Original-Untersuchung, und der "Sekundär-Analyse", der ReAnalyse der Original-Daten. Die Bezeichnung "Re-Analyse" ist wohl zu präferieren. (S. auch A. 2-3.) Im Unterschied dazu bezeichnet Replikation die Wiederholung einer Studie (oder einer Messung), liegt also zeitlich später und differiert deshalb, je nach Länge des dazwischen liegenden Zeitraumes bzw. der sich darin vollziehenden Wandlungen, zwangsläufig in ihren Ergebnissen.

Da die Meta-Analyse im Grunde nichts anderes darstellt als die Vornahme des (Markt-)Forschungsprozesses auf einer höheren Stufe - deshalb erscheint die Bezeichnung so treffend -, gelten dafür auch die oben diskutierten 5 Stadien oder Schritte. 1. Definition. Nach der Klärung des grundsätzlichen Forschungsproblemes gehört dazu vor allem die Definition der Variablen, deren Werte in den einzelnen Studien verglichen werden sollen. Folgt man der oft anzutreffenden Auffasssung der Meta-Analyse als vornehmlich Dependenz-An&lyse, so handelt es sich hierbei um die Festlegung der abhängigen Variablen. In den im Rahmen des Marketing durchgeführten Meta-Analysen war diese meist von vornherein metrisch (z.B. Mittelwerte); allerdings sind z.B. auch Proportionen möglich.

2. Design. Vielfach wird ein - im formalen Sinne - experimentelles Design vorgeschlagen (s. dazu auch in Kap. 6), mit eben den Befunden der einzelnen Studien als abhängige Variablen und deren "Besonderheiten" (z.B. in bezug auf Modellspezifikation, Schätzprozedur, Erhebungsmethode) als unabhängige. 3. Datengewinnung. Dieser Schritt beginnt mit der Identifikation der den Gegenstandsbereich betreffenden Studien (z.B. mittels Literaturdatenbank-Recherchen). Sodann muß deren Inspektion erfolgen (die in den Datenbanken möglicherweise enthaltenen "Abstracts" werden oft nicht ausreichen!) und nach der Entscheidung über die Aufnahme in die Analyse die Sammlung der Befunde in bezug auf die abhängigen und unabhängigen Variablen (z.B. in einer - zu dokumentierenden - Liste).

26

Teil I

Grundlagen

4. Datenanalyse. Grundsätzlich bieten sich, entsprechend der obigen Definition, sämtliche Methoden der Datenanalyse an, so etwa, wie von HUNTER/SCHMIDT (1990) besonders betont, die Korrelationsanalyse. Folgt man jedoch der oben angedeuteten Beschränkung auf die DependenzAnalyse und legt die Meta-Analyse formal als Experiment an, so kann eine Auswertung mittels ANOVA oder MANOVA - s. dazu in Kap. 11 erfolgen. (Will man einen Regressions-Ansatz bilden, so könnte die Darstellung der unabhängigen Variablen auch als 0/1-Dummies - s. in Kap. 10 - geschehen.) 5. Dokumentation. Die gewonnenen Ergebnisse sind zusammenzufassen und zu interpretieren. Dabei zeigt sich, ob jetzt schon generalisierende Aussagen möglich sind und/oder die Notwendigkeit weiterer Untersuchungen angezeigt erscheint. Insoweit trägt die Meta-Analyse wesentlich zum Uberblick über den Stand der Forschung und der Anregung von deren weiterer Entwicklung bei. Sie ist jedoch auch auf Kritik gestoßen. Eine davon, das "Apfel- und Birnen-Argument", kann wohl heute als widerlegt gelten: Definiert man als Elemente der Meta-Analyse die einzelnen Studien, dann "vergleicht sie Unvergleichbares" genausowenig oder - soviel wie die Einzelanalyse, mit - üblicherweise - den Personen als Elementen (die auch durchaus verschieden sind). Damit ist als Grundgesamtheit aber die Anzahl aller Studien über den betreffenden Gegenstand bestimmt. Sie muß zeitlich und räumlich abgegrenzt und ein Auswahlverfahren installiert werden; unveröffentlichte Studien haben dabei aber kaum eine Auswahlchance. Beschränkt man sich zudem - wie wegen der Zugänglichkeit vielfach üblich - auf Veröffentlichungen in Büchern und Zeitschriften, so ergibt sich ferner, wie Untersuchungen zeigten, ein (mit der "Veröffentlichungspolitik" zusammenhängender) systematischer Fehler. Insofern muß wohl auch - zumal, zumindest im deutschen Schrifttum und im Bereich des Marketing, nur wenig Erfahrungen vorliegen - die "Nützlichkeit" des Approach sich erst in Zukunft erweisen. (Vgl. dazu den Schluß bei GLASS/MCGRAW/SMITH [1981]; s. zu weiterer Literatur auch am Kapitelende.)

Kapitel 2 Meßtheoretische und verhaltenswissenschaftliche Grundlagen

27

2.2 Verhaltenswissenschaftliche Grundlagen 2.2.1 Modelle zum Käuferverhalten als Basis von Marktforschungsaktivitäten Der Begriff Käuferverhalten kennzeichnet das Verhalten von privaten Haushalten im Zusammenhang mit dem Kauf und letztlich auch dem Geund Verbrauch von stofflichen Gütern und Dienstleistungen sowie das Beschaffungsverhalten gewerblicher und öffentlicher Abnehmer. Für den zuerst genannten Bereich wird der Ausdruck Konsumentenverhalten oder seltener Verbraucherverhalten - verwendet, wobei der Begriff "Konsument" bzw. "Verbraucher" die Person bezeichnet, welche den Letztverbrauch eines Gutes vornimmt. Der zweite Bereich wird unter der Benennung Organisationales Beschaffungsverhalten abgehandelt, wobei als Organisationen mehr oder weniger strukturierte Zusammenschlüsse mehrerer Personen verstanden werden, die bestimmte - ökonomische und/oder sachliche - Zielsetzungen verfolgen, wie Unternehmen, Behörden, Institutionen etc. Damit ist das Käuferverhalten (die Bedeutungsinhalte von Käufer, Abnehmer, Kunde oder Nachfrager werden dabei gleichgesetzt) als Oberbegriff zu verstehen, welcher die Bereiche des Konsumentenverhaltens und des Organisationalen Beschaffungsverhaltens umschließt, deshalb also die gesamte Nachfrageseite betrifft. Die auf dem Wege der Marktforschung bereitgestellten Informationen für Marketing-Entscheidungen betreffen letztlich die Ursachen, den Charakter sowie die faktischen Quantitäten von Käufen. In allen Fällen untersucht man damit im Grunde Verhaltens*ußerungen von Menschen im Hinblick auf Märkte. Konkret gewonnen und analysiert werden dabei Daten über Wünsche, Bedürfnisse, Einstellungen, Wahrnehmungen, Verhaltensmuster, gekaufte Menge, personenbezogene Charakteristika etc. Vor diesem Hintergrund ist leicht nachvollziehbar, daß für die Definition von Marktforschungszielen, die Operationalisierung der mittels Marktforschung zu untersuchenden Sachverhalte sowie der Entwicklung einzelner Marktforschungsinstrumente Theorien, Modelle sowie konkrete Erkenntnisse über Gesetzmäßigkeiten und Einflußgrößen des Verhaltens von Käufern auf Märkten ein zentrale gedankliches Basis für die Marktforschung darstellen. Im Bereich der theoretischen und empirischen Fundierung von Methoden der Marktforschung ergeben sich damit zahlreiche Überschneidungen zwischen Marktforschung und der Theorie zum Käuferverhalten, da beide wesentlich durch die Erkenntnisse und

28

Teil I

Grundlagen

Konzepte der empirischen Sozialforschung sowie Psychometrie untermauert werden. (Vgl. zum Zusammenhang zwischen Marketing und verhaltenswissenschaftlichen Theorien auch HÜTTNER/VON AHSEN/SCHWARTING 1999, S. 13ff.) Der folgende kurze Abriß zum Käuferverhalten konzentriert sich in erster Linie auf Konzepte im Bereich des Konsumentenverhaltens, da die wesentlichen verhaltenswissenschaftlichen Modelle, welche es im Kontext der Marktforschung zu beachten gilt, vor allem hier anzusiedeln sind. Um die Ausführungen knapp zu halten, werden dabei nur solche Aspekte des Konsumentenverhaltens angesprochen, welche für die Marktforschung eine besondere Relevanz haben.

2.2.2 Bestimmungsfaktoren des Konsumentenverhaltens Ein wesentliches Anliegen der Marktforschung ist es, betrieblichen Entscheidern Erkenntnisse über den Einfluß von Marketingaktivitäten auf Verhaltensäußerungen der Käufer zu liefern. Ausgangspunkte können in diesem Zusammenhang vor allem Modelle im Bereich des Konsumentenverhaltens sein, welche versuchen, das Beziehungsgeflecht zwischen marketingpolitischen Maßnahmen und einzelnen Bestimmungsfaktoren offenzulegen und dabei letztlich intendieren, Kausalbeziehungen zwischen Marketingaktivitäten und Verhaltensreaktionen der Käufer herzustellen. Im Rahmen solcher Modelle können bestimmte kaufrelevante Verhaltensweisen von Nachfragern als Output aufgefaßt werden, der sich aus dem Input von Marketingaktionen eines Unternehmens ergibt. Allerdings trüge man der Realität nur unzureichend Rechnung, wenn man das Verhalten der Kunden allein als Resultat von Marketingaktivitäten betrachtete, da daneben selbstverständlich noch weitere Einflußfaktoren wirksam werden. Die verschiedenen Einflußgrößen des Konsumentenverhaltens lassen sich in zwei Hauptgruppen, in extra- und intraindividuelle Faktoren, unterteilen. Als extraindividuelle Faktoren sind alle Größen zu betrachten, die von außen auf den einzelnen Konsumenten einwirken und daher Inputgrößen darstellen. Da sie das menschliche Verhalten von außen anregen stimulieren -, verwendet man hier auch den Begriff Stimulus. Im Gegensatz dazu wirken intraindividuelle Faktoren gewissermaßen von innen

Kapitel 2 Meßtheoretische und verhaltenswissenschaftliche Grundlagen

29

her und können deshalb nicht als Inputgrößen aufgefaßt werden. Durch sie sollen jene Einflüsse gekennzeichnet werden, die auf psychische und physiologische Vorgänge innerhalb des menschlichen Organismus zurückzuführen sind. Der gravierendste Unterschied zwischen extra- und intraindividuellen Einflußfaktoren ergibt sich aus dem Umstand, daß erstere einer Beobachtung zugänglich sind, während dieses für letztere nicht zutrifft. Das Wirkungsgeflecht extra- und intraindividueller Faktoren im Hinblick auf die gemeinsame Resultante, die Verhaltensreaktionen der Kunden, illustriert Darst. 2-5 (folgende Seite). Wie in dieser Abbildung gezeigt, können extraindividuelle Einflüsse sowohl endogener (innerhalb eines Erklärungsmodelles vorgegebener) als auch exogener (nicht vorgegebener) Natur sein. Aus der Gruppe der exogenen Faktoren sind für den Marketingentscheider jedoch allein die eigenen Marketingmaßnahmen kontrollierbare Stimuli. Aus seiner Perspektive sind daher allein diese der eigentliche Modell-Input, während der Marketing-Input der Konkurrenz und die Umweltstimuli nur indirekt - eventuell als Reaktion auf eigene Aktivitäten - Eingang finden können. Der Einfluß intraindividueller Faktoren kann sowohl durch hypothetische Konstrukte als auch durch intervenierende Variablen berücksichtigt werden (MÜLLER-HAGEDORN 1986, S. 73ff.). Auf hypothetische Konstrukte wird zumeist dann zurückgegriffen, wenn die zu berücksichtigenden Einflüsse nicht durch operationalisierbare Variablen erklärt werden können, so daß man sich nur auf gedankliche Hilfskonstruktionen stützen muß. Intervenierende Variablen liegen hingegen dann vor, wenn im Rahmen der Erklärung auf Größen zurückgegriffen werden kann, die einer Operationalisierung zugänglich sind. Je nachdem, ob sich Erklärungsmodelle zum Konsumentenverhalten allein auf beobachtbare Größen stützen oder weitergehend sind, können Black-Box-Modelle von echten Verhaltensmodellen unterschieden werden. Black-Box-Modelle bescheiden sich damit, einen Zusammenhang zwischen Input (z.B. Werbeaufwendungen) und Output (z.B. Häufigkeit realisierter Käufe) herzustellen, ohne den eigentlichen - einer Beobachtung nicht zugänglichen - Entscheidungsprozeß im menschlichen Organismus zu durchleuchten. Dieser bleibt eine unerklärte "Black-Box", die zwischen die einwirkenden Stimuli und resultierenden Verhaltensantworten geschaltet wird. Man nennt derartige Modelle, die sich letztlich

30

Teil I

Grundlagen

an dem Paradigma des psychologischen Behaviorismus orientieren, daher auch S-R-Modelle (Stimulus-Response-Modelle).

Darst. 2-5: Determinanten des Käuferverhaltens und deren Beziehungsgeflecht Echte Verhaltensmodelle hingegen versuchen - an die neobehavioristische Forschungstradition anknüpfend -, die intraindividuellen Vorgänge (innerhalb der Black-Box) durch das Heranziehen hypothetischer Kon-

Kapitel 2 Meßtheoretische und verhaltenswissenschaftliche Grundlagen

31

strukte oder/und intervenierender Variablen zu berücksichtigen. Sie werden deshalb auch als S-O-R-Modelle (Stimulus-Organismus-Response-Modelle) bezeichnet. Nach der Herkunft der in diesem Zusammenhang verwendeten gedanklichen Erklärungshilfen kann zwischen solchen unterschieden werden, die eher in der ökonomischen Theorie (z.B. Nutzen), der Psychologie (z.B. Motiv, Einstellung) oder Soziologie (z.B. Zugehörigkeit zu sozialen Gruppen) angesiedelt sind. Da das neobehavioristische Paradigma im Rahmen der heutigen Konsumentenforschung deutlich im Vordergrund steht, werden die wichtigsten Erklärungsansätze des Konsumentenverhaltens nachhaltig durch eine S-O-R-Orientierung bestimmt. Nach dem grundsätzlichen Typ lassen sich Modelle zum Käuferverhalten in Strukturmodelle, stochastische Modelle und Simulationsmodelle unterscheiden. Das Ziel von Strukturmodellen ist die Aufdeckung der Zusammenhänge und Wirkungsinterdependenzen zwischen den verschiedenen Einflußfaktoren des Konsumentenverhaltens. Je nach Komplexität können Partial- von Totalmodellen unterschieden werden. Während Partialmodelle nur einzelne Aspekte des Konsumentenverhaltens berücksichtigen und daher nur auf einzelne Variablen und hypothetische Konstrukte zur Erklärung der Vorgänge innerhalb der "Black-Box" zurückgreifen, zielen Totalansätze - zumindest dem Anspruch nach - auf eine möglichst umfassende Erklärung des Zusammenwirkens aller Größen ab. Strukturmodelle des Käuferverhaltens haben - sowohl im Sinne von Partial· als auch von Totalansätzen - den Charakter echter Verhaltensmodelle, da sie eine Erklärung der Vorgänge innerhalb der "Black-Box" bezwecken. Stochastische Modelle sind dagegen keine echten Verhaltensmodelle, da sie den Gesetzen der Wahrscheinlichkeit folgend allein Beziehungen zwischen Input- und Outputgrößen herstellen und damit an das S-R-Schema anknüpfen. Der dritte Modelltyp, die Simulationsmodelle, können im strengen Sinne gar nicht als eigene Kategorie aufgefaßt werden, da sie letztlich die Umsetzung von stochastischen Modellen oder Strukturmodellen in Form von Computersimulationen darstellen. Allerdings besitzt nicht jedes Strukturmodell eine hinreichende Tauglichkeit, um als Grundlage für ein Simulationsmodell zu dienen, da letzteres geeignete Formen im Hinblick auf die Quantifizierbarkeit der modellinternen Größen voraussetzt.

32

Teil I Grundlagen

Vor diesem Hintergrund sollen im folgenden allein Strukturmodelle betrachtet werden, während Simulationsmodelle und stochastische Modelle unberücksichtigt bleiben. Da der Komplex des Käuferverhaltens nur sehr kurz umrissen werden soll, können nachstehend aus dem weiten Spektrum von Strukturmodellen nur jene Ansätze herausgegriffen werden, die für die Marktforschung von zentraler Bedeutung sind. Als solche gilt es in der Hauptsache psychologische Partialmodelle vorzustellen. Im Mittelpunkt der Darstellung müssen dabei die grundlegenden Konstrukte stehen, auf die sich diese Modelle beziehen, da bei diesen konkrete Operationalisierungen im Zuge der Marktforschung ansetzen.

2.2.3 Grundlegende psychologisch orientierte Konstrukte und Erklärungsansätze zum Konsumentenverhalten 2.2.3.1 Aktivierung 2.2.3.1.1 Spezifische und unspezifische Aktivierung Das Konsumentenverhalten als menschliche Verhaltensreaktion auf bestimmte Stimuli bedingt zum einen die innere Bereitschaft und Vorbereitung zur Aufnahme spezifischer Umweltreize, die Aktivierung des Individuums, sowie zum anderen die eigentliche Verarbeitung dieser Reize durch Wahrnehmung, Denken, Lernen etc., durch kognitive Vorgänge. In diesem Abschnitt soll nun zunächst der Aspekt der Aktivierung näher betrachtet werden. Unter Aktivierung kann man die innere Reaktionsbereitschaft des physiologischen Systems eines Individuums verstehen, einen Spannungszustand, der die Hirn- und Körperfunktionen mit Energie versorgt, so daß ein Individuum in die Lage versetzt wird, Umweltreize aufzunehmen. (Vgl. dazu auch L A N C 1 9 8 8 ; SCHUB V O N BOSSIATZKY 1 9 9 2 , S. 2 4 f.) Aktivierende Prozesse sind damit als innere Antriebskräfte zu interpretieren, die menschliches Verhalten überhaupt erst zustande kommen lassen. Dabei kann eine unspezifische oder allgemeine Aktivierung, die den gesamten Funktionsablauf im Organismus stimuliert, von einer spezifischen Aktivierung, die nur bestimmte Funktionen anregt und damit psychische Energie nur bestimmten Verhaltensweisen zugute kommen läßt, unterschieden werden (vgl. KROEBER-RIEL 1 9 9 2 , S. 55ff.). Eine spezifische

Kapitel 2 Meßtheoretische und verhaltenswissenschaftliche Grundlagen

33

Aktivierung des menschlichen Organismus hängt mit einzelnen Antriebskräften, wie z.B. Hunger, Durst, Liebe, Angst etc., zusammen und erlangt erst im Verbund mit kognitiven Vorgängen Bedeutung für das Individuum. Im Hinblick auf den Aspekt der Aktivierung konzentrieren sich die Erklärungsansätze zum Konsumentenverhalten auf die spezifischen und komplexen Antriebe, die aus einem derartigen Beziehungsgeflecht resultieren. Im Vordergrund stehen dabei drei psychologische Konstrukte, die nicht eindeutig voneinander zu trennen sind - mithin fließende Ubergänge aufweisen - und in enger Verknüpfung mit kognitiven Abläufen hervorgerufen und wirksam werden: - Emotion, - Motivation, - Einstellung.

2.2.3.1.2 Emotion und Motivation Emotionen lassen sich umschreiben als vorübergehende, nicht regelmäßige - mit der (kognitiven) Wahrnehmung verknüpfte - Empfindungszustände, die als positiv oder negativ erlebt werden, und dementsprechend das Aktivitätsniveau des Organismus positiv (erhöhend) oder negativ (reduzierend) erregen. (Vgl. dazu etwa DEBUS 1 9 7 7 , S. 1 6 4 , REYKOWSKI 1 9 7 3 , S. 2 9 ff.) KROEBER-RŒL ( 1 9 9 2 , S. 5 3 ; vgl. auch S. 9 7 ff.) nimmt eine formale Beschreibung von Emotionen durch folgende Gleichung vor: Emotion = zentralnervöse Erregungsmuster + (kognitive) Wahrnehmung

(2.1)

Für die Konzeptionierung von Marketingmaßnahmen sind menschliche Emotionen wichtige Anknüpfungspunkte; zum einen, weil emotionale Aktivierungszustände spontane Verhaltensreaktionen auslösen können, und zum anderen, da Emotionen kognitive Prozesse beeinflussen, z.B. in Form einer Hemmung, Lenkung, Auslösung oder Beschleunigung von Lern-, Wahrnehmungs- oder Problemlösungsprozessen. Auslöser für Emotionen können alle physischen Einwirkungen auf den Organismus sein, die zu Reizungen des Sinnes-Nerven-Systems führen. Als Reizmodalitäten stehen non-verbale Formen im Vordergrund, die bei rechtshändigen Personen die rechte Gehirnhälfte ansprechen und deren Verarbeitung kognitiv wenig kontrolliert wird. Für die Marketingpolitik bieten sich in erster Linie Bilder, Farben, Musik und Gerüche an. Eine besondere Form der Auslösung menschlicher Emotionen ist der Einsatz angeborener

34

Teil I Grundlagen

Auslösemechanismen, sog. Schlüsselreize. Bekannte Beispiele hierfür sind gezielt eingesetzte erotische Inhalte von Werbebotschaften oder die Verwendung des "Kindchenschemas" bei der Botschaftsgestaltung. Das psychologische Konstrukt Emotion kann für Aktivitäten im Rahmen der Marktforschung vielgestaltige Formen annehmen. Eine zentrale Aufgabe der Marktforschung ist hier vor allem die Messung der emotionalen Wirkung von Produkten bzw. einzelner Marketing-Maßnahmen. Häufig gilt es in diesem Zusammenhang etwa festzustellen, in welchem Umfang bestimmte Bestandteile von Produkten wie etwa Farbe, Design, Markenname, Verpackung als Stimuli potentielle Käufer emotionalisieren und wie die entsprechenden Gefühlsäußerungen gerichtet ist (positiv oder negativ). Ahnliche Untersuchungen betreffen Bilder, Farben, Musik, sexuelle Reize etc. als Gestaltungselemente von Werbebotschaften. Das klassische Untersuchungsdesign für die Marktforschung ist hier das Experiment, bei dem - zumeist in Labors bzw. Studios - Testpersonen Marketingstimuli in Form von Werbespots, Werbeanzeigen, Verpackungen, Produkten etc. ausgesetzt werden. Als Verfahren der Emotionsmessung sind psychobiologische Messungen, subjektive Erlebnismessungen und solche des Ausdrucksverhaltens zu nennen. Eine systematische Darstellung speziell der psychobiologischen Meßmethoden kann bei GRINGS/ DAWSON (1978) gefunden werden. Im wesentlichen messen sie die Stärke/ Intensität von Emotionen bei Einwirkung einzelner oder mehrere Stimuli über Indikatoren wie den elektrischen Hautwiderstand, die Stärke der Atmung, den Blutdruck, die Herzaktivität, Gehirnwellen etc. Insofern spielen die in 5.2.2 angesprochenen apparativen Verfahren eine herausragende Rolle. Subjektive Erlebnismessungen können auf Befragungen, aber auch Beobachtungen zurückgreifen. Ein wichtiges Meßinstrument ist in diesen Zusammenhang das Semantische Differential (s. dazu unter 4 . 3 . 1 . 2 ) . Derartige Skalierungen lassen auch Rückschlüsse auf die Richtung (positiv oder negativ) und das inhaltliche Entstehungsmuster der Gefühlsregungen zu, so daß in der Praxis psychologische Meßverfahren mit derartigen Skalierungen - zumeist auf der Basis von Befragungen kombiniert werden. Bei Messungen des Ausdrucksverhaltens steht die Beobachtung der Körpersprache im Mittelpunkt. Andere Untersuchungen können sich darauf beziehen, wie Marketingmaßnahmen über die emotionale Beeinflussung von Käufern spontane Verhaltensreaktionen wie etwa Impulskäufe auslösen. Auch die Einwir-

Kapitel 2 Meßtheoretische und verhaltenswissenschaftliche Grundlagen

35

kung emotionalisierender marketingpolitischer Aktivitäten auf kognitive Prozesse bei den Konsumenten können Gegenstand der Marktforschung sein. Beispiel 2-5 In einer empirischen Untersuchung konnten MITCHELL/OLSON (1981) nachweisen, daß positiv emotionalisierende Bildbestandteile einer Werbeanzeige ohne direkten Bezug zum dargestellten Erzeugnis (wie etwa ein Sonnenuntergang an einem tropischen Strand als Hintergrundmotiv für ein Automobil) die Testpersonen zu einer stärker gefühlsbetonten Bewertung veranlassen und ihre sachliche Produktbeurteilung verändern.

Ein weiterer, ebenfalls aktivierender Einflußfaktor des Konsumentenverhaltens kommt durch das psychologische Konstrukt Motivation, welches in sehr enger Beziehung zur oben beschriebenen Größe Emotion steht, zum Ausdruck. Zumeist wird als wesentliches Unterscheidungsmerkmal zwischen Emotionen und Motivationen hervorgehoben, daß erstere ungerichtete Aktivitäten mobilisieren, während letztere ein Verhalten hervorrufen, welches ein bestimmtes Ziel intendiert (vgl. z.B. REYKOWSKI 1973, S. 42ff.). Durch den Begriff Motivation werden also die Beweggründe für zielorientiertes menschliches Verhalten gekennzeichnet. Daher kommt diesem Konstrukt in der Marktforschung eine herausragende Rolle zu, wenn versucht wird, die Ursachen für bestimmte Kaufverhaltensäußerungen von Konsumenten durch die Gewinnung und Verarbeitung markt- und kundenbezogener Daten zu ergründen. (S. dazu auch Kap. 4.) In vereinfachter Formalisierung läßt sich der Zusammenhang von Emotion und Motivation folgendermaßen beschreiben (vgl. dazu wiederum KROEBER-RIEL 1992, S. 53 und S. 135 ff.): Motivation = Emotion + (kognitive) Zielorientierung

(2.2)

Eng verbunden mit Motivationen sind Motive, die zuweilen von ersteren unterschieden werden. Dabei wird unter Motiv zumeist die erworbene situationsbezogene Handlungsdisposition, die Bereitschaft zu einem bestimmten emotional aktivierten und zielorientierten Verhalten, verstanden, während man durch den Begriff Motivation den Prozeß der Auslösung entsprechender Handlungstendenzen kennzeichnet (vgl. H E R B E R 1976, S. 16). Eine vergleichsweise häufig zitierte motivationstheoretische Bezugnahme ist die Bedürfnishierarchie von M A S L O W (1954). Das von ihm im Sinne der dynamischen Motivtheorie entwickelte Modell geht von einer in fünf

36

Teil I

Grandlagen

Kategorien unterteilten Hierarchie menschlicher Bedürfnisse aus. Dabei sind Bedürfnisse nicht direkt mit Motiven gleichzusetzen, da sie als Entstehungsgrund für letztere aufzufassen sind: Motive entstehen dann aus Bedürfnissen, wenn ein subjektiv empfundener Mangelzustand (Deprivation) emotional oder kognitiv verarbeitet wird und das Bestreben zur Beseitigung dieses Mangels den Wunsch nach Befriedigung des entsprechenden Bedürfnisses hervorruft, so daß hieraus ein zielgerichteter Antrieb für menschliches Verhalten erwächst. Nach Maslow entsteht die Motivation für Verhaltensweisen im Hinblick auf die Befriedigung der jeweils folgenden Bedürfniskategorie erst dann, wenn für die vorausgehende Kategorie ein bestimmtes Anspruchsniveau erreicht wird. Allerdings gab dieses Modell immer wieder Anlaß zu grundsätzlicher Kritik, da die darin implizierte Annahme einer "natürlichen", stets gültigen Rangordnung von Bedürfnisklassen empirisch nicht belegbar ist (vgl. dazu z.B. WISWEDE 1973, S. 70ff.). Die Hierarchie der Bedürfnisse kann durch die sog. Bedürfnispyramide gemäß Darst. 2-6 illustriert werden.

Wachstumsmotive

Defizitmotive

Darst. 2-6: Maslow'sehe Bedürftiispyramide

Wenn man den Grundthesen dieses Modells - der Existenz einer gewissen Rangordnung der Bedürfnisse und einer daran anknüpfenden dynami-

Kapitel 2

Meßtheoretische und verhaltenswissenschaftliche Grundlagen

37

sehen Entwicklung der Verbrauchermotive - eine tendenzielle Bestätigung durch die Entwicklung der westlichen Volkswirtschaften nach dem Weltkriege zubilligt, kann man hierin zumindest einen nützlichen Bezugsrahmen für die Analyse des Konsumentenverhaltens sehen. Bezugnehmend auf die Grundaussage des Modells ist letztlich davon auszugehen, daß das Verhalten der Verbraucher mit wachsendem Wohlstand durch immer abstraktere und komplexere Motive gekennzeichnet ist. (S. dazu auch die Ausführungen zum Wertewandel unten.)

2.2.3.1.3 Einstellung Ein Konstrukt, welchem in der Konsumentenverhaltenstheorie eine herausragende Beachtung geschenkt wird, ist die Einstellung. Sie kann charakterisiert werden als im Zuge von Erfahrungen verfestigte Ansicht über die wahrgenommene Beschaffenheit sowie über den damit verbundenen subjektiv eingeschätzten Nutzen und die Bedeutung eines Objektes. Die hierdurch zum Ausdruck gebrachte Objektbeurteilung bedingt in der Regel eine relativ dauerhaft angelegte Bereitschaft zur positiven bzw. negativen Reaktion auf die betreffenden Objekte. Dafür kommen sowohl Sachen - vor allem angebotene Produkte - als auch Personen oder immaterielle Objekte (z.B. Gesprächsthemen, Schlagworte etc.) in Frage. Insbesondere bei Produkten resultiert die Einstellung aus der subjektiven Wahrnehmung ihrer Eignung zur Befriedigung bestimmter Käuferbedürfnisse. Damit stehen Motivationen und Einstellungen in einer engen Beziehung zueinander, die KROEBER-RIEL (1992, S. 5 3 ; vgl. auch S. 161ff.) wie folgt formalisiert: Einstellung = Motivation + (kognitive) Gegenstandsbeurteilung

(2.3)

Einstellungen sind daher sowohl auf emotionale als auch kognitive Reaktionen auf Umweltstimuli (Objekte) zurückzuführen. Wie bereits angedeutet wurde, ist das durch eine Einstellung implizierte kognitive Element das Ergebnis mittelbarer oder unmittelbarer objektbezogener Erfahrungen des Individuums und damit das Resultat von Lernprozessen. Darüber hinaus geht man davon aus, daß Personen je nach dem Grad der Ausprägung der Einstellung zu einem bestimmten Verhalten tendieren. Damit umfaßt die Einstellung neben den zwei o.a. stimulusbezogenen Reaktionskategorien Emotion und Kognition eine dritte, die Verhaltenstendenz. Diesen Umstand bringt das weit verbreitete Drei-Komponenten-

38

Teil I

Grundlagen

Konzept der Einstellung zum Ausdruck (vgl. z.B. TRIANDIS 1975). Danach umfaßt die Einstellung: 1. eine emotionale oder affektive Komponente im Sinne der durch ein Objekt (Stimulus) hervorgerufenen gefühlsmäßigen Aktivierung, 2. eine kognitive Komponente im Sinne des objektbezogenen Wissens, 3. eine intentionale oder konative Komponente im Sinne einer sich aus der Einstellung ergebenden Handlungstendenz (z.B. Kaufabsicht). Die Art der Beziehung zwischen diesen drei Komponenten und vor allem die Frage nach dem Zusammenhang von (erfragten) Einstellungen und (beobachtbaren) Verhalten hat in der Literatur zahlreiche Kontroversen ausgelöst, auf welche an dieser Stelle allerdings nicht weiter eingegangen werden kann. (Vgl. dazu z.B. MEINEFELD 1 9 7 7 , insbesondere S. 23ff.; vgl. weiterhin BENNINGHAUS 1 9 7 6 und LINDENLAUB 1 9 8 4 . ) Eine mögliche Interpretation der Drei-Komponenten-These, welcher hier gefolgt werden soll, zeigt Darst. 2-7. Danach setzt sich die Einstellung im engeren Sinne allein aus den ersten zwei Komponenten zusammen und ist deshalb als objektbezogene Emotion auf kognitiver Grundlage zu verstehen. Aus dieser Einstellung im engeren Sinne geht jedoch unmittelbar eine Verhaltensabsicht hervor, so daß im Gesamtergebnis hieraus die Einstellung im weiteren Sinne resultiert.

Darst. 2-7: Die drei Einstellungskomponenten und ihre möglichen Beziehungen

Der Schwerpunkt der neueren Einstellungsforschung liegt deutlich auf dem engeren Einstellungsbegriff. Zur Erfassung der damit fokussierten

Kapitel 2 Meßtheoretische und verhaltenswissenschaftliche Grundlagen

39

Beziehung zwischen emotionalen und kognitiven Einstellungsbestandteilen werden in der Literatur verschiedene (indirekte) Meßmodelle vorgeschlagen. Großer Verbreitung - in Lehrbüchern - erfreut sich das sog. kognitive Strukturmodell von FISHBEIN (1966), welches formal folgendermaßen beschrieben werden kann: A¡j = ¿ B i j k - a ¡ j k

(2.4)

(mit A|j für die Einstellung von Person i gegenüber Objekt j, B¡jk als der Wahrscheinlichkeit, die Person i für gegeben hält, daß Objekt j ein Merkmal k besitzt, a¡jk für die Bewertung des Vorhandenseins von Merkmal k bei Objekt j durch Person i und η für die Anzahl der relevanten Merkmale). Durch den Faktor a¡¡k, welcher als Gewichtungsfaktor zu interpretieren ist, soll die Motivstruktur des Konsumenten, also die affektive Komponente der Einstellung, abgebildet werden, während durch den Faktor B¡j k der ^ogmírá-beschreibende Bestandteil erfaßt werden soll. Beide Komponenten werden durch Ratingskalen gemessen. (S. zur Ratingskala unter 4.3.1.2.) Das im Rahmen dieses Modelles unterstellte Urteilsverhalten der Konsumenten ist kompensatorisch, d.h. negative Einzelbewertungen können durch positive ausgeglichen werden. Neben Einstellungsmodellen, nach der Art des Fishbein-Modells, sind vor allem solche verbreitet, bei denen davon ausgegangen wird, daß sich die Konsumenten an einem fiktiven Idealbild für den entsprechenden Objekt- bzw. Produkttyp orientieren. Hiernach lassen sich Einstellun-gen auch als Summe der Distanzen zwischen einem subjektiv wahrgenommenen Eindruck und einem Idealbild über alle relevanten Eigenschaften eines Objektes messen. Ein Beispiel für derartige Modelle ist das von TROMMSDORFF ( 1 9 7 5 ) , formal dargestellt: A¡j= Σ | B i j k - I i k | k=i

(2.5)

(mit A¡j für die Einstellung von Person i gegenüber Objekt j, Bijk für das von Person i subjektiv wahrgenommene Merkmal k von Objekt j, Iik für das Idealbild von Person i hinsichtlich Merkmal k für den entsprechenden Objekt- bzw. Produkttyp und η für die Anzahl der relevanten Merkmale).

40

Teil I

Grundlagen

Sofern man der These folgt, daß die Einstellung dem Käufer als Orientierungshilfe und Entscheidungsgrundlage dient, läßt sich diese als Maßstab für systematische Verbesserungen der verschiedenen Elemente des Marketing heranziehen. Der empirischen Erhebung der Einstellungen von Personen gegenüber Produkten, Marken, Unternehmen, Marketingmaßnahmen etc. kommt in der Marktforschung daher eine große Bedeutung zu. Dabei dienen die oben dargestellten Meßmodelle - auch wenn deren Validität problematisch bleibt - als Ansatzpunkte für eine Operationalisierung des Einstellungskonstrukts, so daß dieses für empirische Untersuchungen erfaßbar wird. Neben diesen Multiattributmodellen sind hinsichtlich der Messung von Einstellungen weiterhin verschiedene Skalierungstechniken wie etwa die in 4.3.1.2 dargestellten Magnitude-Skalierung oder das Semantische Differential von Bedeutung. Die Relevanz des Einstellungskonzeptes wird vor allem dann deutlich, wenn man die Beziehung zwischen diesem und anderen Begriffen bzw. Konstrukten der Ökonomie im allgemeinen und der Marketingtheorie im besonderen betrachtet. Eng verbunden mit dem Einstellungsbegriff ist zunächst die Präferenz. Hierunter kann man die (subjektiv bewertete) Vorziehenswürdigkeit einer Produktalternative gegenüber einer oder mehreren anderen verstehen, also deren relative Vorteilhaftigkeit. Im Unterschied zur Einstellung handelt es sich bei der Präferenz somit um das Resultat einer relativen Produktbeurteilung. Konsequenterweise operationalisiert KAAS (1977, S. 46 f.) die Präferenz als Differenz der Einstellungen hinsichtlich zweier Produkte. Im Hinblick auf die Verbindung von Einstellung und Qualität kann in ersterer eine verhaltenswissenschaftlich begründete Bewertung letzterer gesehen werden. Z.T. werden die Bedeutungsinhalte beider Begriffe daher gleichgesetzt. Im Rahmen von Marktforschungsmaßnahmen zur empirischen Durchdringung des Beurteilungsverhaltens hinsichtlich der Qualität eines Produktes durch die Nachfrager kann deshalb die Einstellung als Indikator dienen. In enger Beziehung zum Einstellungsbegriff steht der Terminus Image. Vielfach werden beide Begriffe synonym benutzt. Zuweilen wird der Bedeutungsinhalt der Einstellung jedoch weiter, zuweilen auch enger gefaßt als der des Images. Im Grundsatz wird unter Image ein ganzheitliches Vorstellungsbild von einem Gegenstand verstanden. Demgemäß könnte eine Unterscheidung zwischen Image und Einstellung auch dahin gehen, daß es sich bei ersterem nicht wie bei letzterer um ein Resultat der ganzheitlichen Objektbeurteilung, sondern um eine Speicherung ver-

Kapitel 2 Meßtheoretische und verhaltenswissenschaftliche Grundlagen

41

schiedener subjektiv gefärbter Eindrücke hinsichtlich eines Gegenstandes handelt. Eine spezielle Fortführung der Imageforschung kann in der Imageryforschung ausgemacht werden. Unter Imagery wird dabei die gedankliche Entstehung, Verarbeitung und Speicherung innerer Bilder verstanden. Als solche bezeichnet man die ganzheitliche visuelle Repräsentation von wahrgenommenen Gegenständen der Umwelt (Personen, Produkte, Straßenzüge etc.). Sie sind gespeicherte Wabrnehmungsbilder, die als Gedächnisbilder durch eine Vielzahl von Reizen (z.B. Geräusche, Gerüche oder bestimmte Wörter) ausgelöst werden können. (Vgl. dazu ausführlicher z.B. KROEBER-RIEL 1993, S. 40ff.) Innere Bilder sind damit eine bestimmte Modalität der Wahrnehmung und Speicherung von Informationen, nämlich die ganzheitliche Aufnahme und Verarbeitung bildlich kodierter Daten, welche im Normalfall (bei rechtshändigen Personen) durch die rechte Gehirnhälfte kontrolliert wird. Im Vergleich zur sequentiellen Aufnahme, Verarbeitung und Speicherung verbal kodierter Informationen - durch die linke Gehirnhälfte erweist sich die Bildinformationsverarbeitung hinsichtlich der vorauszusetzenden kognitiven Anstrengungen sowie der Verarbeitungsgeschwindigkeit als überlegen. Die Imagery-Theorie ist daher insbesondere im Rahmen wahrnehmungs- und lerntheoretischer Erklärungen des Konsumentenverhaltens bedeutsam. (S. dazu den folgenden Abschnitt.) Da unterstellt wird, daß diese Imageries einen wesentlichen Bestandteil der Informationen ausmachen, die bei Konsumenten über Produkte, Marken, Unternehmen etc. abrufbar sind - "die Konsumenten machen sich ein Bild vom betreffenden Gegenstand" - wurde ihrer Messung, in besonderer Weise zur Beurteilung kommunikationspolitischer Maßnahmen, verstärkt Aufmerksamkeit geschenkt. Um die Stärke und Prägnanz von Imageries zu messen, wird häufig auf Recall-Tests (s. dazu Kap. 16) zurückgegriffen. Allerdings werden hierdurch bildlich gespeicherte Sachverhalte verbal abgefragt. Daher wird vorgeschlagen, intermodale Messungen vorzunehmen, die neben verbalen auch bildliche Reizmodalitäten umfassen. Als Technik für intermodale Messungen bietet sich vor allem die Magnitude-Skalierung an, z.B. durch ein computergestütztes Vorgehen, bei dem eine Auskunftsperson die Stärke von Bilderlebnissen über die Bedienung einer spezifischen Indikatorregelung an einem Befragungsterminal anzeigt. (Vgl. NEIBECKER 1983b; s. auch in Kap. 4.)

42

Teil I Grundlagen

Auch Messungen der emotionalisierenden Wirkung mittels der oben skizzierten Verfahren werden zur imagerybezogenen Beurteilung von Bildern (z.B. in Werbeanzeigen) eingesetzt. Prinzipiell erscheint zur Messung von Imageries - in gleicher Weise wie bei der Einstellung - eine mehrdimensionale Operationalisierung zweckmäßig. RUGE ( 1 9 8 8 ) führt im Kontext des vom ihm vorgeschlagenen Imagery-Differentials die Dimensionen Lebendigkeit, Aktivierungspotential, psychische Nähe, Strukturiertheit, Beständigkeit, Neuartigkeit/Informationsgehalt sowie Bewertung/Gefallen an. Das komplexe Zusammenspiel einer größeren Zahl von Einstellungen in bezug auf eine größere Menge von Gegenständen wird durch den Begriff Wert gekennzeichnet (vgl. TROMMSDORFF 1993, S.163ff.). Werte sind damit ein Integrator für Einstellungen. Sie haben nicht zuletzt auch deshalb Integrationswirkung, weil sie Einstellungen in die soziale Umwelt eines Individuums einbetten, da das Beachten von Werten mit positiven (Belohnung) und das Mißachten mit negativen Reaktionen (Bestrafung) der Umwelt verbunden ist. Konsequenzen für das Marketing haben Werte insbesondere vor dem Hintergrund der These des Wertewandels. (Vgl. dazu z.B. WINDHORST 1985.) In Verbindung mit der Annahme, daß einzelne Zielgruppen relativ gleichartige Wertesysteme aufweisen und Veränderungen von Werten im vorbezeichneten Sinne auf umfangreiche Einstellungskomplexe rückwirken, resultieren hieraus schließlich weitreichende Konsequenzen für den Absatz ganzer Produktklassen. Die sog. Werteforschung kann insofern dem Marketing wichtige Orientierungshilfen bieten, indem sie versucht, eine Erklärung und Vorhersage derartiger Wertveränderungsprozesse zu leisten. Bekannt sind in diesem Zusammenhang vor allem die Begründungen der These eines Ubergangs von materiellen zu postmateriellen Prioritäten durch INGLEHART (1979). Seine Erwägungen legen letztlich nahe, daß das Konsumentenverhalten in Zukunft stärker durch Werte wie Selbstverwirklichung, Umweltschutz, Gemeinschaftssinn etc. zu Lasten unmittelbarer - physikalischer - Konsumprioritäten bestimmt wird.

Kapitel 2 Meßtheoretische und verhaltenswissenschaftliche Grundlagen

43

2.2.3.2 Kognition Wie oben bereits angedeutet, läßt sich das Konsumentenverhalten nicht allein aus der Aktivierung heraus erklären, da aktivierende Prozesse immer von mehr oder weniger ausgeprägten kognitiven Prozessen begleitet werden. Die folgenden Ausführungen sollen sich dabei auf drei wesentliche Konstrukte konzentrieren, durch die kaufverhaltensrelevante kognitive Prozesse gekennzeichnet sind: - die Wahrnehmung, - das Denken, - das Lernen. Wahrnehmung ist als kognitive Repräsentation von Stimuli (Informationen) im Bewußtsein durch den Prozeß der Aufnahme, Selektion, Strukturierung und Interpretation derselben zu verstehen. Die Relevanz von Kenntnissen hinsichtlich menschlicher Wahrnehmungsprozesse im Bereich des Marketing braucht kaum begründet zu werden, da es auf der Hand liegt, daß die Wirksamkeit absatzpolitischer Maßnahmen davon abhängt, ob und in welcher Weise diese vom Kunden z.B. in Form einer bestimmten Produktgestalt, bestimmter Werbebotschaften oder einer bestimmten Verpackung - wahrgenommen werden. Ein herausragendes Problem für die Absatzpolitik - vor allem für den Einsatz kommunikationspolitischer Maßnahmen - resultiert aus dem Umstand, daß die biologisch bedingte Wahrnehmungskapazität des Menschen sich innerhalb sehr enger Grenzen bewegt. So kann das menschliche Auge im Durchschnitt nicht mehr als 200 Informationseinheiten in einer Minute aufnehmen, wobei wiederum ungefähr vier Fünftel aller Informationen allein über das Auge erfaßt werden (vgl. etwa WIMMER 1 9 8 8 ) . Gleichzeitig steigt jedoch das Angebot an Informationen mit der Konsequenz einer Informationsüberlastung. Nach Ermittlungen des Instituts für Konsum- und Verhaltensforschung der Universität des Saarlandes (vgl. dazu KROEBER-RIEL 1 9 8 7 ) ist diese für die - alte - Bundesrepublik Deutschland mit 98,1% zu beziffern, so daß weniger als 2% aller angebotenen Informationen die Empfänger überhaupt erreichen. Vor diesem Hintergrund zeigen sich bildliche Informationen solchen, die verbal kodiert sind, offenbar überlegen, da diese zunächst ganzheitlich verstanden und sehr schnell unter geringem kognitiven Aufwand aufgenommen und verarbeitet werden. Während Bilder von mittlerer Komplexität innerhalb von zwei Sekunden erfaßt und verstanden werden, läßt sich mittels verbal kodierter Informationen, welche der menschliche Wahrnehmungsapparat sequentiell und bedeutend langsamer verarbeitet, nur ein Bruchteil dieser Datenmenge vermitteln. (Vgl. dazu auch die Untersuchungen von SHEIKIAN 1 9 8 2 . ) Daher ist es im Zuge der Konzeption von Marketingmaßnahmen geboten, der Informationsüberlastung - aber auch dem in vielen Fällen geringen Invol-

44

Teil I Grundlagen

vement (s. dazu noch unten) - der Konsumenten mit der Betonung bildhafter Informationen Rechnung zu tragen. (Vgl. insbesondere zum Einsatz von Bildern im Rahmen der Kommunikationspolitik KROEBER-RIEL 1993.)

Vor dem Hintergrund des Problems der Informationsüberlastung der Konsumenten sollen betrieblichen Entscheidern auf dem Wege der Marktforschung vor allem Daten darüber zur Verfügung gestellt werden, in welche Umfang Marketingmaßnahmen - insbesondere im Bereich der Werbung - das Wahrnehmungsverhalten der potentiellen Kunden berücksichtigen. Eine wichtige Frage ist in diesem Zusammenhang die, ob Kontakt mit dem Objekt vorausgesetzt - es die Konsumenten vermögen, innerhalb der zumeist recht kurzen Betrachtungszeit (durchschnittlich etwa 2 Sekunden) aus Werbeanzeigen, -plakaten etc. die wesentlichen Informationen zu entnehmen. Ein zentrales Instrument der Marktforschung ist hier die Blickaufzeichnung (s. dazu unter 5.2.2). Mittels dieser werden wichtige Parameter über das Verhalten der Käufer im Verlauf von Betrachtungen, wie etwa die Häufigkeit, die Dauer sowie die Reihenfolge und der Verlauf von Blickfixationen, bei Testpersonen im Hinblick auf Anzeigen, Plakate etc., erhoben. Eine andere wichtige Erkenntnis im Hinblick auf die menschliche Wahrnehmung, welche z.B. für die konkrete Gestaltung kommunikationspolitischer Maßnahmen nützlich zu sein vermag und daher auf dem Wege der Marktforschung abzufragen ist, betrifft den Umstand, daß zwischen verschiedenen Wahrnehmungsobjekten Ausstrahlungseffekte auftreten können. Dieses sog. Irradiationsphänomen bedingt, daß die Wirkung bestimmter Wahrnehmungselemente die Wahrnehmung anderer beeinflußt und daß Wahrnehmungsinhalte sogar übertragen werden. Nahezu klassische Beispiele für die Ausnutzung des vorbezeichneten Effektes sind Präsentationen von Mode- und Kosmetikartikeln durch weibliche oder männliche Personen, die das gängige Schönheitsideal weit überdurchschnittlich erfüllen und durch ihr angenehmes Außeres die Wahrnehmung der vorgestellten Waren positiv beeinflussen sollen. Ein weiteres Ausstrahlungsphänomen im Kontext der menschlichen Wahrnehmung ist der sog. Halo-Effekt, die Übertragung eines allgemeinen Eindruckes einer Firma oder eines Produktes auf einzelne Produkteigenschaften oder weitere Produkte dieser Firma. So kann z.B. das positive Image eines Unternehmens auf einzelne angebotene Produkte übertragen werden, so daß dadurch die Produktwahrnehmung der Käufer positiv vorgeprägt wird.

Von großer Bedeutung für die Beurteilung der Wahrnehmungsqualität von Marketingelementen auf der Grundlage der Marktforschung, wie Produktgestalt, Verpackung, Anzeigen, TV-Spots etc., ist die auf die Leipziger Schule ( 0. Beispiel 3-8 1. Im Falle von Beisp. 3-6 könnte die Alternativhypothese zur Nullhypothese Ρ = 0,35 lauten: Ρ > 0,35 (einseitig). 2. In ähnlicher Weise könnte die Hypothese über den "wahren" Anteil von Käufern eines Produkts (P = 0,4) einseitig getestet werden. (S. dazu auch A 3-6.) Ob ein- oder zweiseitiger Test zu verwenden ist, muß ausschließlich inhaltlich begründet werden. Formal ist dies jedoch von erheblicher Bedeutung: Einseitige Tests führen eher zur Verwerfung der Nullhypothese, also zu - meist erwünschten - "signifikanten" Ergebnissen. (S. dazu A 3-14.) Grundsätzlich sollte deshalb immer dann, wenn nicht aus der Sachlage heraus andersartige Evidenz vorliegt, zweiseitig getestet werden!

Kapitel 3

Inferenzstatistische Grundlagen

63

2. Die Wahl des Testverfahrens führt auch zur Bestimmung der zugrunde zu legenden Prüfverteilung. Im hier gegebenen Zusammenhang handelt es sich zunächst ausschließlich um einen Einstichprobentest auf der Basis der Normal- bzw. t-Verteilung. 3. Bei der Festlegung des Signifikanzniveaus geht es, wie gesagt, im Grunde um eine "außerstatistische" Entscheidung; sie sollte jedoch unbedingt vorher erfolgen. In der Praxis hat sich nun, ähnlich den oben erwähnten σ-Regeln, die Verwendung ganz bestimmter Signifikanzniveaus eingebürgert, denen zumeist - nicht immer ganz einheitlich - auch "Qualitäten" (und Symbole) zugeordnet werden: α =0,01 (hochsignifikant + +) α = 0,05 (signifikant +) Besonders - vielleicht zu - strenge Anforderungen werden bei der Verwendung eines Signifikanzniveaus von 0,001 (+ + +) gestellt. Umgekehrt ist die Tolerierung einer Irrtumswahrscheinlichkeit von 10% ("schwach signifikant") wohl eher zu großzügig, "n.s." steht oft bei nicht signifikanten Resultaten (und, zumal bei Verwendung nur eines Signifikanzniveaus - meist 0,05 - "s." für signifikante). Aus Prüfverteilung - als Ergebnis von Schritt 3 - und Signifikanzniveau zusammen folgt der Tafelwert. In Computer-Programmen wird zunehmend sogleich die betreffende Wahrscheinlichkeit ausgedruckt (statt des "empirischen" Prüfwertes - wodurch die Arbeit des Vergleichens mit dem Tafelwert, s. unten, entfällt). Dabei ist jedoch Vorsicht anzuraten: einmal wegen der Möglichkeit der Fehl-Interpretation (handelt es sich um die Vertrauens- oder Irrtumswahrscheinlichkeit?), zum anderen auch wegen der Gefahr, daß der Forscher das ursprüngliche Signifikanzniveau solange varriiert, bis die ihm genehmen Ergebnisse als "signifikant" erscheinen.

4. Bei der Berechnung der Prüfgröße (Teststatistik) geht es im hier gegebenen Fall einfach um die Umformung - gegebenenfalls unter Ersatz von t durch ζ - obiger Formeln. Das ergibt für Mittelwerte: M U σ/νη (Varianz der Grundgesamtheit bekannt - "Einstichproben-Gauß-Test") t=

s /vn

(dto. unbekannt).

(3.11b)

64

Teil I

Grundlagen

Für Proportionen ergibt sich entsprechend: z=J L J L

0 der

V p ^ / V K

t = -j£=^-i-=

(3.12a und b)

Vivq/V^

Statt der Verwendung des Absolutzeichens im Zähler der obigen Formeln wird bisweilen auch t bzw. ζ "absolut" genommem. Oder es wird auf jede Kennzeichnung verzichtet (und stattdessen für den Tafelwert einfach das gleiche Vorzeichen benutzt wie für den empirischen Wert).

5. Aufgrund der Gegenüberstellung von empirischer Prüfgröße und "theoretischem" Tafelwert fällt die Entscheidung: Verwerfung der Nullhypothese dann, wenn erstere größer ist als letzterer. Im hier gegebenen Falle: Ablehnung, wenn der empirische z- oder t-Wert (temp) größer ist als der entsprechende Tafelwert (ttheor). Von der Schreibweise t , für t , wird hier abgesehen. Für t theor werden als Subskript die Vertrauenswahrscheinlichkeit (also, auch wegen der Form der Tabellierung der "statistischen Tafeln" im Anhang, nicht die Irrtumswahrscheinlichkeit bzw. das Signifikanzniveau) sowie in Klammern die Anzahl der Freiheitsgrade benutzt. N u r im Bedarfsfalle würde dahinter als nochmaliges Subskript e (für "einseitig") verwandt; ansonsten wird "zweiseitig" getestet. Das heißt aber auch, daß im folgenden Beispiel unter α / 2 abzulesen ist. Beispiel 3-9 1. Mit den Werten von Beisp. 3-5 soll die Hypothese μ = 0,77 zweiseitig getestet werden: J 0 , 8 0 - 0 , 7 7 | = 0,03 _

t emp

0,3/V5ÖÖ

^ 0,95(500) = ^0,975(500)e

0,013

2

3

'

^>96

Die Nullhypothese μ = 0,77 m u ß abgelehnt werden; der "wahre Wert" ist (mit 95% Wahrscheinlichkeit) größer oder kleiner. (S. dazu auch in Beisp. 3-5, wonach 77 - und auch 83 - Pfennig nicht mehr vom Intervall umschlossen wurden.) Eine andere - und vielleicht bessere - Formulierung der "Nullhypothese" könnte lauten: Der Unterschied zwischen dem hypothetischen wahren Wert von 0,77 und dem Stichprobenmittelwert ist 0. Da diese, gemäß oben, verworfen werden muß, kann man das Ergebnis als signifikant bezeichnen: Eine Differenz existiert (mit der vorgegebenen Wahrscheinlichkeit) tatsächlich. 2. Der Test soll einseitig durchgeführt werden: t0,95{500)e - 1 ' 6 4 ; temp unverändert 2 , 3 1 Wiederum muß die Nullhypothese verworfen werden; das Ergebnis ist signifikant.

Kapitel 3

Inferenzstatistische Grundlagen

65

Zur Wirkung der Veränderung von Signifikanzniveau, Stichprobenumfang und Nullhypothese s. A 3-13 bis -15. Beispiel 3-10 Mit den Werten von Beisp. 3-6 soll die Hypothese Ρ = 0,35 einseitig getestet werden:

t emp

|0,3-0,35| V0.3-0,7/V2ÖÖ

0,05 „ 0,0205 '

t(>,955(2000)e ~ ^0,95(»)e ~ 1>64 Die Nullhypothese muß verworfen werden; das Ergebnis ist (auf dem gegebenen Niveau) signifikant. S. auch A 3-16.

Literaturhinweise Ausführungen zu den hier erörterten elementaren Grundlagen finden sich in praktisch allen Statistik-Lehrbüchern. Deren Zahl ist groß, selbst der speziell für "Wirtschaftswissenschaftler" etc. geschriebenen. Von der Aufführung - auch nur einer Auswahl - muß deshalb abgesehen werden; statt dessen seien zunächst zwei allgemeine í/e«í5c¿sprachige Darstellungen genannt: HARTUNG/ELPELT/KLÖSENER (1995 bzw. 1999) und SACHS (1992 bzw. 1999); ferner sei hingewiesen auf BOHLEY (2000).

Aufgaben 3-1:

Berechnen Sie das arithmetische Mittel für die yj -Werte: 10; 12; 17; 11; 18; 13.

3-2:

dto. für die folgenden Werte: 7; 8; 10; 9; 13; 12.

3-3:

Wie hoch ist der Modus im Falle der Werte von A 3-1?

3-4:

dto. der Median?

3-5:

dto. die Standardabweichung?

66

Teil I Grundlagen

3-6:

dto. die Spannweite im Falle der Werte von Beisp. 3-1?

3-7:

dto. der Quartilsabstand bei Beisp. 3-2?

3-8:

Wie groß ist die Anzahl der möglichen Stichproben bei Ν = 80 und η = 7?

3-9:

dto. bei nunmehr η = 3 (und weiter Ν = 6, wie in Beisp. 3-4)?

3-10: Prüfen Sie für die Werte von Beisp. 3-6, ob sich bei Anwendung des Korrekturfaktors - für Auswahl "ohne Zurücklegen" (bei Annahme einer Grundgesamtheit von 35 Mio.) - ein Unterschied in den Resultaten ergibt! 3-11: Prüfen Sie für die Werte von Beisp. 3-5 nach einer weitergehenden t-Tabelle in einem statistischen Lehrbuch oder Tafelwerk, ob sich bei Verwendung des genauen t-Wertes (statt einfach der z-Werte) ein Unterschied in den Resultaten ergibt! 3-12: Berechnen und interpretieren Sie das Konfidenzintervall bei ζ = t = 2,58, χ = 0,6 (in DM), s = 0,2 und η = 100! 3-13: Für Beisp. 3-9: Die Irrtumswahrscheinlichkeit soll auf 1% verringert werden. (Bezüglich des "Signifikanzniveaus" spricht man auch - inhaltlich sinnvoll - von der "Erhöhung"!) a) Führen Sie den Test zweiseitig durch! b) dto. einseitig! 3-14: Der Stichprobenumfang soll auf 300 verringert werden. a) Führen Sie den Test (mit den Werten von Beisp. 3-9) zweiseitig durch! b) dto. einseitig! 3-15: Die Nullhypothese soll verändert werden, auf nunmehr μ = 0,78. a) Führen Sie den Test (mit den Werten von Beisp. 3-9) zweiseitig durch! b) dto. einseitig! 3-16: a) Wie lautet die "Alternativhypothese" im Fall 2 von Beisp. 3-8? b) Führen Sie den Test (mit ρ = 0,425 und η = 1600) auf einem Signifikanzniveau von α = 0,05 durch!

Teil II Methoden der Datengewinnung in der Marktforschung In diesem Teil werden die Methoden der Datengewinnung oder -kollektion behandelt. Sie umfassen, wie in Kap. 2 bereits erwähnt (s. dort auch zum nachstehenden - das Schema gemäß Darst. 2-4), Primär- und Sekundärforschung. Letztere wird im Kap. 8 erörtert. Grundmethoden der ersteren sind Befragung (ausführlich, in Kap. 4) und Beobachtung (kürzer in Kap. 5). Das Experiment dagegen stellt keine eigenständige dritte - Methode dar; erhebungstechnisch kann es sowohl als Befragungsais auch Beobachtungsexperiment durchgeführt werden; die Darstellung in einem eigenen Kapitel (6) erfolgt wegen seiner Besonderheiten. Ähnliches gilt für das Panel (Kap. 7).

Kapitel 4 Die Befragung Die Befragung ist zweifellos die bedeutendste Methode der primären Datengewinnung in der Marktforschung. (Man spricht gelegentlich geradezu von "Befragungs-" oder "Umfrageforschung".) Ihr wird deshalb vergleichsweise breiter Raum gewidmet. In einem 1. Abschnitt werden zunächst diverse Grundformen der Befragung unterschieden (nach dem Adressatenkreis, dem Erhebungsmodus und der Zahl der Untersuchungsthemen). Im 2. Abschnitt erfolgt die Diskussion von Befragungsstrategie und -taktik (Arten des Interviews und der Fragestellung). Dem folgt im 3. Abschnitt die Erörterung des umfangreichen Frageinstrumentariums (Arten der Fragen). Im 4. Abschnitt schließlich wird die Bildung der Stichprobe besprochen: Arten der Auswahl der Befragten und - anknüpfend an Kap. 3 - Berechnung des Umfangs der Stichprobe etc. Die verschiedenen Arten der Befragung, die - mit Ausnahme der bereits eingangs erwähnten Unterscheidung - in den folgenden Abschnitten erörtert werden sollten, kann man gemäß Darst. 4-1 (folgende Seite) zusammenfassen.

Teil II Methoden der Datengewinnung in der Marktforschimg

68

Lfd. Nr.

Kriterium.

Einteilung

II!

grundsätzliche Anlage

experimentell - nichtexperimentell

WM

Zahl der Untersuchungsthemen

Spezialbefragung - Omnibusbefragung ("Mehr-ThemenUmfrage")

3

Form der Datenkollektion (Erhebungsmodus)

schriftlich - telefonisch (persönlich-)mündlich

4

Adressatenkreis

Experten - Händler - Verbraucher

Befragungstaktik

direkt - indirekt

Befragungsstrategie

standardisiert - nichtstandardisiert

WM 6

Dar st. 4-1: Arten der Befragung

4.1 Grundformen der Befragung 4.1.1 Einteilung nach dem Adressatenkreis Nach dem befragten Personenkreis läßt sich folgende Unterscheidung treffen: 1. Expertenbefragung, 2. Händlerbefragung, 3. Verbraucherbefragung. (1) Die Expertenbefragung entspricht in etwa dem in der Statistik als Enquete bezeichneten Verfahren; es ist darunter die Befragung von Sachverständigen, von Spezialisten, zu verstehen. Das sind nicht in erster Linie Verbraucher; wenn z.B. Autobesitzer über vielleicht die Ausgestaltung der Kraftfahrzeugversicherung befragt werden, so sind diese zwar gegenüber den Nichtbesitzern von Autos im Zweifel "Experten", gleichwohl bleibt das Ganze einer Verbraucherbefragung

MERK (1962, S. 65) ist der Meinung, daß wegen der Besonderheiten der Expertenbefragung ("Expertendünkel", Gefahr der Einseitigkeit eng spzialisierter Fachleute, Problem der Aufnahmefähigkeit des Interviewers usw.) dem Fragebogen gegenüber dem freien Gespräch der Vorzug zu

Kapitel 4 Die Befragung

69

geben sei. Andererseits wird, da meistens keine repräsentaiv-statistische Grundlage vorhanden ist, eine allgemeine Umfrage in diesem Form kaum durchgeführt werden; vielmehr bleibt in der Regel die Expertenbefragung auf einige klärende Gespräche im Rahmen der sog. Leitstudie - s. Kap. 2 beschränkt, wobei sich gerade dann (schon wegen des Verzichts auf statistische Auswertung) das freie Gespräch empfiehlt. Für die Prognose kann eine Spezialform der Expertenbefragung, die Delphi-Methode, eine Rolle spielen. (S. dazu auch unten, 14.4, und etwa HÜTTNER 1982 oder 1986c.)

(2) Der Händlerbefragung sollte in der Praxis der Marktforschung mit einer gewissen Vorsicht begegnet werden. Während man früher eher der Meinung war, daß sie der Verbraucherbefragung vorzuziehen sei, ist man heute überwiegend gegenteiliger Ansicht - insbesondere in Anbetracht dessen, daß der Händler nicht als neutraler Beobachter, wie etwa der "Experte", anzusehen ist. Dies kann sich jedoch nur darauf beziehen, daß der Händler indirekt befragt wird, also über das Verhalten der Verbraucher Aufschluß geben soll; bildet er bzw. seine Geschäftspolitik den Gegenstand der Befragung, so ist der Ansatz zweifellos richtig. Ebenso wird die Sache anders zu beurteilen sein, wenn Feststellungen über Umsätze usw. an die Vertraucher zu treffen sind; s. zum sog. Einzelhandels-Panel unten, in Kap. 7.

Schwieriger ist die Entscheidung jedoch dann, wenn man vor der Frage steht, ob die Berichte der Vertreter, der Kommissionäre usw. - die zu den Händlern im weiteren Sinne gerechnet werden können - im Interesse der Marktforschung ausgewertet bzw. darauf ausgerichtet werden sollen. So sehr einerseits methodische Erwägungen dagegen sprechen, die eigene "Verkaufsorganisation" marktforschungsmäßig einzusetzen, so sehr werden oft praktische Belange, vor allem kostenmäßige Gesichtspunkte, den Ausschlag dafür - insbesondere auf dem Auslandsmarkt - geben. Allerdings wird man dabei auch den Zweck würdigen (so kann beispielsweise die Schätzung von Verkaufszahlen für die nächste Periode durch den Außendienstmitarbeiter als zusätzliches, ergänzendes bzw. kontrollierendes, Mittel für die Aufstellung von Verkaufsprognosen durchaus von Bedeutung sein!) und nach der Stellung dieser Mitarbeiter (angestellte Reisende gegenüber - primär umsatzorientierten - selbständigen Vertretern!) differenzieren müssen.

70

Teil II Methoden der Datengewinnung in der Marktforschung

(3) Der Normalfall wird - infolge der geschilderten Umstände - die Verbraucherbefragung sein. Für den Bereich der Konsumgüterindustrie ist dabei die Zielperson der Befragung selbstverständflich der einzelne Konsument. Für die Hersteller von Investitionsgütern dagegen erhebt sich und zwar verschärft, je länger die Kette vom Erzeuger bis zum letzten Verbraucher ist - die Frage, wer befragt werden soll, der unmittelbare Abnehmer (sofern er ein Verbraucher und kein Händler ist, s. oben) oder ein mittelbarer Verbraucher. Grundsätzlich wird es richtig sein, den unmittelbaren Abnehmer zu befragen. Es kann jedoch auch Fälle geben, in denen das Befragen des Letztverbrauchers ratsam oder unumgänglich ist. Beispiel 4-1 Der Hersteller von Blechen (die etwa auch für Kraftfahrzeuge verarbeitet werden können) wird sich normalerweise an den unmittelbaren Weiterverarbeiter (und nicht an den Käufer des Autos, in dem dieses Blech in irgendeiner F o r m verarbeitet ist) wenden. Dagegen wird ein Hersteller von Autoreifen sich eher auf den Letztverbraucher ausrichten - nicht nur wegen der Ersatzbeschaffung , sondern auch bezüglich der Gewinnung von Argumenten für die Erstausstattung durch den Automobilhersteller.

Die Befragung von Zwischenverbrauchern wirft gewisse methodische Probleme auf, die bei der Behandlung der Besonderheiten der Marktforschung für Investitonsgüter zusammenfassend - da sich die späteren Ausführungen meist auf die Letztverbraucher-Befragung beziehen - erörtert werden; s. 17.1.

4.1.2 Einteilung nach dem Erhebungsmodus Nach dem Erhebungsmodus können folgende Grundformen der Befragung unterschieden werden: 1. schriftliche Befragung, 2. telefonische Befragung, 3. (persönlich-)mündliche Befragung. (1) Die schriftliche Befragung ("mail interview") hat eine Reihe von Nachteilen aufzuweisen: 1. Die Antwortquote ist im allgemeinen relativ gering. Es werden für diese Quoten verschiedene Sätze genannt - verschieden schon wegen der unterschiedlichen Anlage der jeweiligen Untersuchung und auch wegen

Kapitel 4

Die Befragung

71

des differierenden Interesses am Thema der Befragung. Zudem ist dabei zu berücksichtigen, ob von den diversen Möglichkeiten zur Erhöhung der Antwortquote (s. unten) Gebrauch gemacht wurde. In jüngerer Zeit scheint es insgesamt gelungen zu sein, höhere Antwortquoten zu erzielen; es wird jedoch nur sehr selten (mit Ausnahme vielleicht von "Spezialquerschnitten") gelingen, Quoten von über 50% zu erreichen. So berichtet BLANKENSHIP (1961, S. 56) für die USA der 40er Jahre, daß "gewöhnlich ... kaum mehr als 15% Rückantworten eingehen". GREEN/TULL (1982, S. 139) weisen darauf hin, daß die Rücklaufquote häufig nur zwischen 20% und 40% liegt). Yu/COOPER (1983) berichten aufgrund einer Metaanalyse von 93 Aufsätzen von im Gesamtdurchschnitt 47,3% Antworten (und wesentlich höheren Sätzen bei den beiden anderen Erhebungsarten). HAFERMALZ (1976, S. 29) konnte bei der Befragung von ADAC-Mitgliedern sogar eine Antwortquote von 63,7% feststellen.

Es gibt jedoch einige Möglichkeiten, die Antwortquote zu erhöhen: - Hingabe von kleineren Geschenken. Grundsätzlich wird die "Honorierung" der Arbeit der Befragten in der Marktforschung nahezu einhellig abgelehnt. (Dies nicht nur, wie naheliegend, aus Kostengründen, sondern auch wegen der sog. Verschönerungstendenz - der Neigung der Auskunftspersonen, gewissermaßen als "Gegenleistung" eine ihrer Ansicht nach im Sinne des Veranstalters liegende Antwort zu geben!) Ausnahmen bilden allenfalls besonders intensive Mitarbeit erfordernde Befragungsformen, wie etwa Panels oder die Befragung von Ärzten. Insofern können auch nur vergleichsweise geringwertige Geschenke in Frage kommen. Problematisch ist dabei nicht nur, ob diese groß genug sind, um den (sicher individuell verschiedenen!) "Schwellenwert" der Neigung zur Nichtbeantwortung zu übersteigen, sondern auch der Zeitpunkt der Überreichung: Legt man das Präsent von vornherein dem Fragebogen bei, besteht die Gefahr, daß die Empfänger das Geschenk annehmen, ohne den Bogen zurückzuschicken; stellt man es für später in Aussicht, so ist - neben den höheren Portokosten usw. - zu befürchten, daß die Auskunftspersonen dem nicht recht trauen oder es ihnen nicht lohnend genug erscheint. - Auslosung von größeren Preisen. Dies stellt möglicherweise einen Ausweg aus den vorgenannten Problemen dar. HAFERMALZ (1976, S. 144 - Tab. 25) berichtet z.B. auch über die Wirkung des Beilegens eines Lottoscheines. Im übrigen existiert über die Bedeutung von "Anreizen" (Incentives) eine Reihe von Detail-Untersuchungen. So referiert etwa SCHNEIDER (1995) die Ergebnisse eines Experiments mit 3 Gruppen: kein materieller Anreiz („Kontrollgruppe"),

„Egois-

musgruppe" (Verlosung von Lotterielosen), „Altruismus" (gemeinnützige Spende von

72

Teil II Methoden der Datengewinnung in der Marktforschung

DM 2); bei der letztgenannten Gruppe war der Rücklauf am höchsten, mit 40,2% auswertbaren Fragebögen, gegenüber 34,0% bei der Egoismusgruppe und „nur" 24,3% bei der Gruppe ohne Anreiz.

- vorherige (briefliche oder telefonische) Ankündigung. Experimente haben ergeben, daß damit beachtliche Steigerungen der Antwortquoten zu erreichen sind. (S. zur Kombination mit anderen Erhebungsarten auch unten. Die Beifügung eines Begleitbriefs, der Sinn und Zweck der Umfrage erläutert etc., ist wohl selbstverständlich.) - Koppelung mit der Einsendung von "Garantiekarten". Diese (offensichtlich nicht selten angewandte) Möglichkeit ist naturgemäß beschränkt auf einerseits hochwertige Gegenstände, andererseits aber vor allem die Gruppe der "Käufer"; die - vielleicht interessanteren "Nichtkäufer" bleiben ausgeschlossen. - Beigabe von kleinen Fragebogen zur Verpackung. Entsprechende Versuche scheinen allerdings nicht besonders erfolgreich verlaufen zu sein. - Nachfassen. Dieses allgemeine Mittel (auch in Kombination mit anderen Erhebungsarten - s. unten) bringt zwar zumeist eine Erhöhung der Antwortquote, andererseits aber auch eine solche der Kosten. Zudem fördert es eine Identifikation der Nicht-Antwortenden und damit Aufgabe des Grundsatzes der Anonymität. Das gilt zumal dann, wenn das Nachfassen, in Gestalt der Bildung einer Unterstichprobe aus der Gruppe der NichtAntwortenden und - mündlicher - Zusatzbefragung, zur Kontrolle des Non-Response-Verhaltens dient. (Vgl. dazu auch LEHMEIER/SEGLER 1985. S. zum Non-Response-Problem allgemein unten, 4.4.2.) Damit erscheint es möglich, den Einfluß der Antwortverweigerung in etwa abzuschätzen. Das ist notwendig, da eine einfache "Überhöhung" der Stichprobe nicht genügt. Beispiel 4-2 Wenn man meint, mindestens 500 Antworten haben zu müssen und die voraussichtliche Antwortquote mit 40% veranschlagt, seien eben einfach 1250 Personen anzuschreiben, um diese Antwortzahl zu realisieren.

Dies verkennt völlig, daß es nicht nur auf die absolute Zahl der Antworten, sondern auf deren Repräsentanz ankommt. Sie wäre aber nur dann gegeben, wenn die Gruppe der Nicht-Antwortenden sich nicht von der der Antwortenden unterschiede. Damit kann aber nicht von vornherein gerechnet werden: Manchen liegt die schriftliche Bewortung nicht, andere sind besonders interessiert usw.

Kapitel 4 Die Befragung

73

2. Der Stichtag der Erhebung ist nicht einheitlich, da kaum ein Einfluß darauf ausgeübt werden kann, wann die Empfänger den Fragebogen ausfüllen. Insbesondere wegen der Befragten, bei denen nachgefaßt werden mußte, können diese Zeitunterschiede sehr erheblich sein. Erfahrungsgemäß wird die Beantwortung dann vorgenommen, wenn die meiste Zeit dazu vorhanden ist, also etwa an den Wochenden, d.h. an grundsätzlich anders gelagerten Tagen. Es kann also auch kaum damit gerechnet werden, daß die durch die Zeitunterschiede verursachten Abweichungen sich gegenseitig aufheben. 3. Sowohl die Tatsache, daß die Auskunftspersonen mehr Zeit zum Uberlegen der Antwort haben, als auch die, daß sie vorher den Fragebogen im Zusammenhang durchlesen können, hat u.U. ein abweichendes Ergebnis zur Folge und beeinträchtigt z.B. den Erfolg von "Ablenkungsfragen" (s. unten, 4.3). 4. Damit im Zusammenhang steht, daß die Meinung der Auskunftspersonen nicht die zu sein braucht, die schließlich im Fragebogen zum Ausdruck kommt (Einfluß von dritter Seite). (1976) spricht in diesem Zusammenhang von "Identitätsproblem": Es umfaßt - noch weitergehend - überhaupt die Frage der Ubereinstimmung von anvisierter Auskunftsperson und tatsächlich Antwortenden. Aufgrund verschiedener empirischer Uberprüfungen kommt er zu dem Schluß, daß dieser Identitätsverlust in der Größenordnung von 6 bis 10% liege und damit zu keiner "qualitativen" Beeinträchtigung der schriftlichen Umfragedaten führe ("da nicht anzunehmen ist, daß sich die Aussagen der Ersatzpersonen diametral von denen der Zielpersonen unterscheiden" 5. 190). HAFERMALZ

Dabei bleibt zu bedenken, daß dieses Problem auch bei den anderen Erhebungsarten existent ist. Bei der mündlichen Befragung wird es zudem eventuell nur verdeckt bzw. überlagert (z.B. beim Quotenverfahren - s. 4.4.1.3; vgl. auch unten, zum "Fälscherproblem").

5. Der Umfang des Fragebogens muß in der Regel geringer sein. Im mündlichen "Gespräch" kommt der Zeitablauf dem Befragten meist nicht so recht zum Bewußtsein (s. dazu unten, Beisp. 45) wie bei der Vorlage eines langen schriftlichen Fragebogens; zumindest wirkt ein solcher abschreckend.

74

Teil II Methoden der Datengewinnung in der Marktforschung

6. Die Gefahr von Mißverständnissen sowohl hinsichtlich des richtigen Verständnisses der Fragen als auch der Bedeutung der Antworten ist größer als bei einem mündlichen oder fernmündlichen Gespräch. 7. Gewisse "komplexe Informationen" sind nur sehr schwer zu ermitteln. Speziell steht zu befürchten, daß manche höhere Analyse-Methode, die einen bestimmten Daten-Input erfordern, auf erhebungstechnische Schwierigkeiten stoßen. In einem vom Verf. federführend betreuten Projekt an der Universität Bremen wurden z.B. auch Einstufungen der Ähnlichkeit von Benzinmarken bezüglich verschiedener "bipolarer Eigenschaften" verlangt. Die Ergebnisse zeigten, daß die Antwortquote hier erheblich niedriger war, d.h. entsprechende - noch dazu möglichst einfach gewählte - Datenerhebungsmethoden auf (emotionale oder intellektuelle) Widerstände stießen. Allerdings handelt es sich hierbei um ein Problem, das auch für andere Erhebungsmethoden als existent anzusehen ist. Es wird manchmal dadurch verdeckt, daß sich diese - oft primär methodisch ausgerichtete - Illustration neuer Techniken auf Daten bezieht, die durch Befragung kleiner Gruppen von Studenten gewonnen wurden.

Diesen Nachteilen stehen jedoch auch einige Vorteile gegenüber: 1. Der Interviewereinßuß (s. unten, Exkurs) entfällt. 2. In gewissen Fällen kann die Tatsache, daß genügend Zeit zum Uberlegen besteht, dem Erhebungszweck förderlich sein (Ausschluß unüberlegter, hingeworfener Antworten). 3. Ansonsten schwer zu erreichende Berufskreise (Schichtarbeiter, Landwirte usw.) können erfaßt werden. 4. Die rein räumliche Repräsentation eines großen Gebietes wird erleichtert. 5. Die Kosten erscheinen niedriger (lediglich Portokosten statt der hohen Aufwendungen für Interviewer usw.). Jedoch muß dies im Zusammenhang mit der erreichbaren Antwortquote gesehen werden, da ein hoher Prozentsatz der Nicht-Anwortenden die Kosten pro Antwort stark in die Höhe treibt (und die Repräsentanz generell gefährdet, s. oben). Insgesamt scheint damit eine gewisse Vorsicht bei der Entscheidung für die schriftliche Befragung geboten. Andererseits zeigen, wie angedeutet, empirische Befunde, daß so manche der erwähnten Gefahren durch entsprechende Sorgfalt und geschickte Gestaltung, nicht nur des Fragebogens, sondern auch des Begleitschreibens usw., vermieden werden kön-

Kapitel 4 Die Befragung

75

nen. Insofern ist, im Unterschied zu vor vielleicht noch einigen Jahren (und angesichts auch der möglicherweise zunehmenden Tendenz zur Verweigerung von Interviews - s. dazu unten, 4.4.2), der schriftlichen Befragung für die Zukunft eine eher steigende Bedeutung zuzuerkennen. (2) Die telefonische Befragung war in den USA schon lange weit verbreitet. Bei uns wurden ihr gegenüber jedoch gewisse Vorbehalte gemacht: 1. Die Repräsentanz ist nur schwer herstellbar. Dieses "Repräsentanzproblem" (STROBEL 1983) zerfällt in eine Reihe von Teilproblemen. Allgemein kann man zunächst feststellen, daß selbst bei weiter Verbreitung des Telefons die Telefonbesitzer nicht unbedingt den Bevölkerungsquerschnitt widerspiegeln; einzelne Schichten können unterrepräsentiert bleiben. Zudem muß angenommen werden, daß verschiedene Bevölkerungskreise ungleichmäßig antworten bzw. erreichbar sind; die Antwortquote differiert. Dabei spielt zweifellos - zumal bei uns - auch die Einstellung gegenüber telefonischen Befragungen eine Rolle. Als Spezw/problem kommt hinzu, daß die Auswahlunterlagen, die Telefonbücher bzw. die entsprechenden CD-ROMs, nicht auf dem neuesten Stand sind (Aktualität!) bzw. nicht alle Anschlüsse enthalten ("GeheimNummern"!). Als besondere Auswahlmethode - s. dazu allgemein unten, 4.4 - ist deshalb in den USA das sog. random digit dialing, eine Zufallszahlen-Wahl, entwickelt worden. Dessen Übertragung auf die Bundesrepublik scheint jedoch schon wegen des andersartigen Aufbaus der Telefonnummern schwierig. Man kann hier allerdings ein zweistufiges Verfahren anwenden: In der ersten Stufe wird auf üblichem Wege - meist durch „systematische Auswahl" - eine Zufallsauswahl auf der Grundlage der Telefonbücher etc. vorgenommen. In der zweiten Stufe ist der letzten Ziffer - man kann das Verfahren natürlich auch auf mehrere Schlußziffern (üblich: bis zu 3) ausdehnen - eine Zahl hinzuzuaddieren {„add a digit"-Methode)·, entweder konstant eine 1 o.ä. oder jeweils eine Zufallszahl. Außerdem ist das Verfahren berufsethisch umstritten. In einer im 1996 vorgelegten „Richtlinie für telefonische Befragungen" (überarbeitet 2000) haben die deutschen Marktforschungsverbände ADM und BVM (s. dazu auch Kap. 20) jedoch offensichtlich von einer Achtung Abstand genommen. Auch soll das Mithören durch Supervisaren (oder sogar Auftraggeber) zur Überwachung der Telefon-Interviewer oder eben Qualitätssicherung erlaubt sein. Dagegen gelten Beschränkungen hinsichtlich der Zeiten·. abgesehen von Sonderfällen an normalen Werktagen nur zwischen 9 und 21 Uhr.

76

Teil II Methoden der Datengewinnung in der Marktforschung

Umfaßt der angerufene Haushalt mehrere in Betracht kommende Personen, so entsteht zusätzlich das Problem der Auswahl der Zielperson, genau wie bei der mündlichen Befragung. Grundsätzlich können deshalb auch ähnliche Methoden angewandt werden, s. dazu unter 4.4.2.4.

2. Die Gesprächssituation (STROBEL 1983 spricht auch vom "Kommunikationsproblem") ist nicht überschaubar. Es besteht die Gefahr, daß es sich um flüchtige, hingeworfene Antworten - wegen anderweitiger dringender Beschäftigung bzw. mangelnder Konzentration -, Einflüsse von dritter Seite usw. handelt. Demgegenüber sind als Vorzüge zu nennen: 1. die Schnelligkeit der Durchführung. Dies ist gerade heute, wo der Zeitfaktor im Verhältnis zur weiteren Verfeinerung der bereits hochentwickelten Methoden immer stärker in den Vordergrund tritt, von besonderem Gewicht. 2. der vergleichsweise geringe Interviewereinfluß (und sei es nur dergestalt, daß das Ablesen des Fragebogens den Befragten nicht stört etc.); 3. die im allgemeinen beachtliche Kostenersparnis. Selbst wenn man nicht davon ausgeht, daß dabei nebenberufliche Interviewer durch festangestellte "Telefonistinnen" ersetzt werden und daraus ein Fixkostendruck erwächst, entsteht dieser gegebenenfalls doch durch die - eventuell "computerisierte", s. dazu unten - Anrufplatz-Ausstattung. Daraus kann auch ein berufsethisches Problem resultieren, weil bei Nicht-Auslastung von teurer Kapazität die Versuchung erwächst, dies durch "Telefon-Marketing" zu beseitigen. (Die Abgrenzung zum TelefonMarketing ist in der oben erwähnten „Richtlinie" geregelt.) In der Praxis wird aber eher zunehmend versucht, umgekehrt den Fixkostendruck dadurch zu senken, daß die Telefon-Interviewer nicht, wie vordem meist, stundenweise bezahlt werden (mit ohnehin nicht allzu hohen Sätzen - derzeit im Mittel noch klar unter 20 DM!), sondern „per Stück", bei reinen Marktforschungsaufgaben also pro Interview (in - allgemeinen - Call Centern dagegen je nach Art der Leistung, z.B. eingehender Bestellung).

(3) Aus den Vorbehalten gegenüber den anderen Arten der Erhebung folgte zumindest früher zwangsläufig die große Bedeutung der mündlichen Befragung, im Sinne der persönlichen Interviews („face-to-face interview"). In der Tat wird diese Form auch heute noch sehr häufig verwendet. (Man sprach früher sogar von „Königsweg der empirischen Sozialforschung". S. zur neueren Entwicklung aber unten.) Auch deshalb sind die Erörterungen in den folgenden Abschnitten vielfach an dieser Erhebungsform ausgerichtet.

Kapitel 4 Die Befragung

77

Neben weiteren, bisher nicht erwähnten Vorteilen (etwa bezüglich der Möglichkeiten der Verwendung von Vorlagen - s. unten 4.3) hat die mündliche Befragung jedoch auch einige Nachteile. Diese folgen unmittelbar aus den komparativen Vorteilen der beiden anderen Erhebungsarten, brauchen hier also nicht wiederholt zu werden. Stattdessen soll zusammenfassend eine Gegenüberstellung der Vor- und Nachteile der Grundformen der Befragung nach dem Erhebungsmodus erfolgen, gemäß Darst. 4-2.

schriftliche Befragung Antwortquote

-

einheitlicher Erhebungsstichtag

-

(persönlich)telefonische mündliche Befragung Befragung

+ +

+ + +

Antwortzeit o

-

- Messung

-

+

EinfluB von dritter Seite

-

o

Umfang des Fragebogens

-

-

Gefahr von Mißverständnissen

-

+

komplexe Informationen

-

-

+ + + +

+ + + +

o

-

- Ausschlufl unüberlegter Antworten

Interviewereinfluß schwer erreichbare Berufskreise räumliche Repräsentation Kosten

o

' o

+ +

-

Es bedeuten: + Vorteil; - Nachteil; ° Indifferenz bzw. unklar

Darst. 4-2: Vor- und Nachteile der Grundformen der Befragung nach dem Erhebungsmodus Zur "Antwortquote" (und Länge der Befragung) sowie zur "Antwortzeitmessung" s. auch noch unten.

Jede der Erhebungsarten hat also ihre charakteristischen Vor- und Nachteile. Im Unterschied zu früher gelten sie deshalb heute als grundsätzlich gleichwertig. Das zeigt sich auch in einem relativen Vordringen der telefonischen und schriftlichen Befragung. So berichtet etwa Infratest (ANDERS o.J.), daß dort 1980 67% persönliche, 27% schriftliche und 5% telefonische Inter-

78

Teil II Methoden der Datengewinnung in der Marktforschung

views durchgeführt wurden. BAUSCH ( 1 9 9 0 , S. 67f.) teilte dann schon - aus einer 1988/89 vorgenommenen schriftlichen Umfrage bei deutschen Marktforschungsinstituten - einen Anteil von 13,5% telefonischen Befragungen mit. 1995/96 galt bereits: „Jede dritte Befragung durch die Institute wird vom Telefon aus erledigt". (Die Welt vom 8 . 8 . 9 6 . ) Eine „Umfrage über Umfragen", (Context 1 4 / 9 6 ) kommt zu einem ähnlichen Ergebnis: 34% Telefoninterviews für die alten Bundesländer und bereits 25% für die neuen. Bei den ADM-Mitgliedsinstituten (s. auch Kap. 20) überstieg ab 1998 der Anteil der Telefon-Interviews den der persönlich-mündlichen (Quelle: ADM-Web-Site: ... adm-ev.de). In den USA hatte das Telefon-Interview die anderen Formen bereits um die Mitte der 80er Jahre überrundet: "telephone interviewing was most common, with door-todoor, mall intercept, and mail following in that order." (HONOMICHL 1986, S. 173. Allerdings ist dabei eben die Aufspaltung des "mündlichen Interviews" in die quasi traditionelle Form des zu Hause geführten und das neue "Mall Intercept" zu beachten; s. zu letzterem unten.)

Es taucht deshalb die Frage auf, ob nicht durch kombinierte Formen die spezifischen Nachteile vermieden bzw. Vorteile hervorgehoben werden können. Tatsächlich sind solche Kombinationen teils schon länger bekannt und auch in Gebrauch. A A K E R / K U M A R / D A Y ( 1 9 9 5 , S. 232f.) nennen Beispiele dafür: 1. telefonische Verabredung eines mündlichen Interviews (mit Hinterlassung eines später per Post einzusendenden Fragebogens); 2. telefonische Gewinnung für die Beantwortung eines Fragebogens, der per Post zu- und wieder zurückgesandt wird; 3. mündliches Vor- und telefonisches Nach-Interview (im Rahmen eines Panels oder zur Bestätigung); 4. schriftliche Umfrage mit telefonischen Nach-Interview; 5. telefonischer oder mündlicher Kontakt für die Beantwortung eines Fragebogens, der persönlich überbracht und später wieder abgeholt (bzw. eingesandt) wird. Daneben sind einige Sonderformen entwickelt worden: (1) Die Methode der Klassenzimmerbefragung ist schon recht alt (s. etwa PLANCK 1 9 5 9 ) . Man versteht darunter die Durchführung der Erhebung in der Weise, daß an in einem geschlossenen Raum anwesende Personen Fragebogen verteilt werden, die von diesen „unter Aufsicht" auszufüllen sind.

Kapitel 4 Die Befragung

79

(2) Jüngeren Datums ist eine in den USA entwickelte Methode, die dort unter verschiedenen Namen diskutiert wird: Mall Intercept (GATES/ SOLOMON 1982; BUSH/HAIR jr. 1985) oder Central-Location Interviewing (WISEMAN/SCHAFER/SCHAFER 1983) oder Shopping Center Sampling (SUDMAN 1980) bzw. einfach Shopper Surveys (BLAIR 1983). Es handelt sich um eine Abart der mündlichen Befragung, die dadurch charakterisiert ist, daß die Interviews an einem zentralen Ort, zumeist eben in einem (regionalen) Einkaufszentrum, stattfinden. In den USA, wo man (typische) Shopping Mails in hoher Zahl findet, sind derartige Erhebungen recht verbreitet, hierzulande - nicht zuletzt bedingt durch die andersartigen Gegebenheiten der üblichen Einkaufszentren - hingegen deutlich weniger. Eine besondere Rolle spielt auch der Computer bei der Befragung. (Es geht hier also nur um die Datengewinnung - nicht die Datenanalyse, wo der Einsatz des Computers schon seit langem üblich ist.). Dabei haben sich in der jüngsten Zeit verschiedene Anwendungsmöglichkeiten eröffnet, mit durchaus auch unterschiedlichen Bezeichnungen. Sie sind nicht leicht zu systematisieren, zumal dies anhand verschiedener Kriterien geschehen kann. Die nachstehende Einteilung erfolgt zunächst danach, ob die Antworteingabe durch den Interviewer oder den Befragten selbst vorgenommen wird; weitere Aspekte sind die Orte des "Interviews". 1. Antworteingabe durch den Interviewer a) telefonische Interaktion Interviewer/Befragter Bei dieser Variante der telefonischen Befragung werden vom Interviewer die vor ihm auf dem Bildschirm erscheinenden Fragen dem Befragten vorgelesen und dessen Antworten eingegeben; daraufhin wird vom Programm aufgrund der Konstruktion des "Fragebogens" die nächste Frage generiert usw. Man spricht in diesem Zusammenhang von CATI (Computer-Assisted Telephone Interview - im Unterschied zum traditionellen "Paper and Pencil"-Interview, manchmal auch als PPI bezeichnet). Dies erleichtert auch - wie andere Formen der Computer-Unterstützung - die quasi sequentielle Anlage der Befragung: Der Stichprobenumfang (s. dazu unter 4.4) braucht nicht von vornherein festgelegt zu sein; durch die quasi gleichzeitig mit der Datengewinnung und -eingäbe erfolgende Osttnanalyse kann man laufend Zwischenergebnisse abrufen und bei deren "Stabilisierung" die Befragung beenden. Das Leistungsspektrum der CATI-Software ist recht groß·. Es reicht von der Fragebogenerstellung über das Stichprobenmanagement, die Erhebungskontrolle und Datensatzverwaltung bis eben zur Zwischen- und Endauswertung; es verwundert deshalb nicht, daß sie, wie oben bereits angedeutet, vergleichsweise teuer ist.

80

Teil II Methoden der Datengewinnung in der Marktforschung

b) persönliche Interaktion Interviewer/Befragter Bei dieser Variante der mündlichen Befragung hat der Interviewer einen portablen Klein-Computer und gibt die Antworten unmittelbar ein; er übermittelt sie später - etwa am Abend - gesammelt per Diskette, via Briefpost oder per Telefon-Modem an das Institut („mobile Datenerfassung"). S. zur Weiterentwicklung und zum Begriff CAPI auch unten. 2. Antworteingabe durch den Befragten a) an besonderen Orten Die Befragten werden zu " Teststudios", in eigenen oder gemieteten Räumen, gebeten. b) am Ort des Befragten Hierbei entfällt im Extrem der Interviewer völlig; es entsteht eine unmittelbare "Maschine-Mensch-Kommunikation". Man spricht dann auch von Bildschirmbefragung bzw. heute, in etwas anderer Sicht, von Online-Befragung; sie stellt im Grunde eine eigene - 4. - Erhebungsart, neben schriftlicher, telefonischer und persönlich-mündlicher Befragung, dar. Im einzelnen sind jedoch durchaus verschiedene Formen der direkten Antworteingabe vorstellbar (die eben auch nicht alle ohne - als Medium - „den Interviewer" oder „das Telefon" auskommen): - Eine Weiterentwicklung des CATI-Systems liegt dann vor, wenn der „Telefon-Interviewer" durch ein Band oder eine Computerstimme ersetzt und der Befragte zur direkten Antwort durch Drücken bestimmter Tasten (z.B. 1 für „ja") aufgefordert wird. Man spricht auch von CATS (Computer Automated Telephon Survey) bzw., in etwas anderem Zusammenhang, von CSAQ (Computer Assisted Self-Administered Questionnaire). - Auch von Te/e/äx-Umfragen wird berichtet: VAZANNA/BACHMANN (1994) erreichten damit sogar eine leicht höhere Rücklaufquote als bei einer vergleichbaren postalischen Umfrage. DICKSON/MACLACHLAN (1996) betonen zudem den Kostenvorteil. - Die obenerwähnte „mobile Datenerfassung" kann dahingehend erweitert werden, daß nunmehr der „Interviewer" nur noch die Tür öffnet und den Laptop transportiert; die Antworteingabe erfolgt nach Erscheinen der Frage auf dem Bildschirm - durch den Befragten selbst. Zumindest dann spricht man auch von CAPI (Computer-Assisted-Personal-Interview). Besonders erleichtert wird die Antworteingabe durch den Ersatz der Tastatur durch Touchscreens, also Antip-

Kapitel 4 Die Befragung

81

pen der Antwortvorgabe mit einem Stift {„Pen-Pad" oder auch „PenTop")• - Ein praktisch völliger Entfall des Interviewers geschieht bei „Online Research". (So schon der Titel von B A T I N I C et al. 1 9 9 9 ; s. auch ders. 2 0 0 1 . Vgl. auch z.B. T H E O B A L D 2 0 0 0 und ders. et al. 2 0 0 1 . ) Schon relativ früh - DUBKE 1 9 8 3 - wurde vom Einsatz von btx (heute: T-Online) berichtet; auch die Benutzung anderer Online-Dienste oder - allgemeiner - des Internet kommt in Betracht. Hieraus schon und aus den angeführten Begriffen wird eine gewisse Uneinheitlichkeit der Terminologie deutlich. Das hängt damit zusammen, daß die Möglichkeiten der Marktforschung im Internet viel weiter reichen als die bloße „Online-Befragung", der Begriff Internet-Marktforschung also umfassender ist. Das soll Darst. 8-3 zeigen. Ursprünglich stand sogar die Nutzung für die Sekundärforschung im Vordergrund. (Vgl. z.B. auch den Titel von THEOBALD 1 9 9 8 . ) Deshalb wird auf das Internet allgemein in Kap. 8 eingegangen. (Außerdem hat es, wegen der zunehmenden Werbung darin, Bedeutung für die Werbeforschung - Kap. 17.) Der Wegfall des Interviewers bedeutet natürlich auch den Verzicht auf die Möglichkeit, durch ihn Austauschpersonen „vor Ort" für eine Befragung zu gewinnen, d.h. eine gewisse Antwortbereitschaft wird vorausgesetzt. Das verführt geradezu dazu, „Adressenpools" von Befragten anzulegen (und solche auch zu verkaufen oder zu kaufen). Das führt letztlich direkt zur Panelforschung. S A M U E L S ( 1 9 9 5 ) - der auch den Begriff HAPPI (Home-Based Active Passive Personal Interviewing) propagiert, der aber hier schon wegen seiner Affinität zur Beobachtung (s. Kap. 5) nicht weiter verfolgt werden soll - sieht das abwägend eher nicht negativ; doch sollten die damit verbundenen Probleme - Repräsentanz und die Problematik von Panels generell (s. Kap. 7) - nicht unterschätzt werden. Das Problem der Repräsentanz stellt wohl eines der schwerwiegendsten Probleme der Befragung allgemein im Internet dar. (Nach einer im Context 2 0 / 2 0 0 1 , S. 1 1 zitierten Untersuchung waren etwa nur 42,6% der Deutschen über 14 Jahre Internet-Nutzer.) In gewissem Zusammenhang damit steht auch das Problem der Mehrfacbzählungen: „Findige Internet-Surfer können Abstimmungen u.U. gezielt manipulieren. Die Anonymität des Netzes fordert mitunter sogar dazu heraus, die Ergebnisse nach Belieben zu verfälschen. Die Adresse läßt sich nur allzu leicht verwischen. ... Sogar das lästige Mehrfachklicken kann der pfiffige Manipulator mit einem Programm an den Computer delegieren, der dann sozusagen per Universalklick mitunter Hunderte von Einzelklicks auf den Weg schickt." (K.P. Schöppner -Emnid-O'irektor - in „Die Welt" vom 2 1 . 0 1 . 2 0 0 1 . ) Schöppner weist damit auf die Gefahr der „Click-Me-Marktforschung" hin und fordert, daß „alle Umfragen in die Hand der Institute gehören, die sich zur Transparenz verpflichtet haben." Deshalb auch stellten ADM, BVM und andere eine „Checkliste für Auftraggeber von Online-Befragungen" zusammen.

82

Teil II Methoden der Datengewinnung in der Marktforschung

4.1.3 Einteilung nach der Zahl der Untersuchungsthemen Nach der Zahl der Untersuchungsthemen kann man folgende Unterscheidung vornehmen: 1. Spezialbefragung, 2. Omnibusbefragung. Im Gegensatz zur Spezialbefragung, bei der nur ein Thema Gegenstand der Befragung ist (deshalb auch: Ein-Thema- Umfrage) wird die Omnibusbefragung (oder Mehr-Themen-Umfrage) für mehrere Themenkreise veranstaltet. Dabei pflegt man gar nicht so sehr darauf abzustellen, ob inhaltlich mehrere Gebiete berührt oder vom Befragten empfunden werden, sondern vielmehr auf das Vorhandensein mehrerer Auftraggeber (mit den unten noch zu erörternden Konsequenzen). Die Gründe für diese Entwicklung sind offenbar nicht nur die auf der Hand liegenden wirtschaftlichen Vorteile. Es wird auch eine Reihe methodischer Vorzüge genannt (BEHRENS 1966, S. 62): - Erleichterung der Anwendung indirekter Befragungstaktiken (s. 4.2.2) (durch die Möglichkeit der Isolierung von sachlich zwar zusammengehörigen, zweckmäßigerweise aber getrennt zu erfragenden Sachverhalten); - Gewährleistung genauerer Angaben (durch die Beseitigung der bei der Spezialbefragung bestehenden Gefahr, daß die Auskunftsperson dem Untersuchungsgegenstand besondere Aufmerksamkeit widmet und damit unbewußte Tendenzen zur Verzerrung ausgelöst werden); - günstigeres allgemeines "Befragungsklima" (da durch die Themenmischung das Interview interessanter erscheint). Diese Vorteile insgesamt und das dadurch verursachte Vordringen von Omnibusbefragungen haben in der Konsequenz zu zwei besonderen Formen geführt: - Beteiligungsuntersuchungen, mit Eingliederungsfragen Von "Beteiligungsuntersuchungen" spricht man, wenn die Befragung auf Initiative des Instituts - meist turnusmäßig, mit festen Terminen durchgeführt und die Beteiligung daran, mit einzelnen "Eingliederungsfragen", potentiellen Auftraggebern angeboten wird. Für die Institute hat das den Vorteil einer besseren und vor allem gleichmäßigeren Auslastung. (Für den Auftrageber liegt der Vorteil in

Kapitel 4 Die Befragung

83

niedrigeren Kosten.) Allerdings tragen sie auch das Risiko einer eventuell zu schwachen Beteiligung. Nicht selten werden deshalb von ihnen Themenkomplexe eingegliedert, die entweder ihren eigenen Forschungsinteressen - insbesondere auch in methodischer Beziehung Rechnung tragen und/oder, speziell bei allgemein interessierenden Fragen, der Öffentlichkeit über die Massenmedien (bezahl oder unbezahlt Pressedienst!) dargeboten werden können. - Standarduntersuchungen Hierunter versteht man Untersuchungen, die ohne festen Auftrag erfolgen und deren Ergebnisse gewissermaßen wie Broschüren oder Zeitschriften Interessenten verkauft werden. Auch dabei besteht nicht selten die Möglichkeit, durch Eingliederungsfragen zusätzliche Informationen zu erhalten. Meist wird hierzu vorher zur Subskription eingeladen. Vielfach kann man den Ergebnisbericht auch noch nachher - mitunter, nach Ablauf von viel Zeit, auch wesentlich billiger - beziehen. Insofern besteht hier eine Verbindung zur Sekundär-Marktforschung (s. Kap. 8). Während ursprünglich von den verschiedenen Instituten ausschließlich (persönlich)mündliche Mehr- 7?;ewen-Befragungen angeboten wurden (s. dazu den als "Appendix" zu diesem Kapitel wiedergegebenen Fragebogen-Auszug), werden solche Umfragen heute auch telefonisch durchgeführt. S. zu Beispielen und insbesondere den Kosten bei Omnibusbefragungen auch in Kap. 20.

4.2 Befragungsstrategie und -taktik 4.2.1 Arten des Interviews Betrachtet man die Befragungsstrategie als im wesentlichen durch die Art des Interviews determiniert, so ist eine Zweiteilung zweckmäßig: 1. standardisiertes Interview ("Interview mit festgelegter Fragefolge" [MERK 1962, S. 67], "keine Variationsfreiheit des Interviewers" [BEHRENS 1966, S. 49]: Wortlaut und Reihenfolge der Fragen sind fest vorgegeben).

84

Teil II Methoden der Datengewinnung in der Marktforschung

2. nicht-standardisiertes Interview a) strukturiert ("Interview mit variabler Fragefolge" [MERK 1962, S. 67], "teilweise Variationsfreiheit des Interviewers" [BEHRENS 1966, S. 69]: Wortlaut und Reihenfolge der Fragen sind nicht fest vorgegeben). Man spricht in diesem Zusammenhang von einem Interviewerleitfaden. (SEITZ/ MEYER 1995 empfehlen sogar, ihn so einzusetzen wie einen Fragebogen.) Offensichtlich können damit - insbesondere bei komplexen Zusammenhängen im betrieblich-organisatorischen Bereich, im Sinne von „Fallstudien" - durchaus zufriedenstellende Ergebnisse erzielt werden. Vgl dazu, mit Wiedergabe des kompletten „Leitfadens", etwa SCHWARTING 1993 und A. VON AHSEN 1996b.

b) unstrukturiert ("Interview mit freier Fragefolge" [MERK 1962, S. 67], "völlige Variationsfreiheit des Interviewers" (BEHRENS 1966, S. 59): lediglich das Untersuchungsthema wird vorgegeben - nicht aber in Einzelfragen zerlegt). Insbesondere früher wurde das nicht-standardisierte Interview mit dem Tiefeninterview gleichgesetzt. Dies ist jedoch nicht zwingend. So lassen sich völlig frei geführte Interviews vorstellen, die nicht Tiefeninterviews im Sinne der Psychoanalyse sind; das ist etwa bei £xperiercbefragungen der Fall; bei Ker¿rd«c¿erbefragungen kann man sich dagegen ein frei geführtes Gespräch ohne "tiefenpsychologische" Absicht weniger denken. Man könnte auch von Intensiv - oder schlechthin qualitativen Interviews sprechen. Diese Gleichsetzung erscheint jedoch dann zweckmäßig, wenn die beiden, im Zuge des in Kap. 1 erwähnten "Methodenstreits", insbesondere in den späten 50er und frühen 60er Jahre, miteinander ringenden Richtungen besser hervortreten sollen. Denn im Grunde war es ein Streit um die Frage der zweckmäßigeren Form des Interviews: Während die Verfechter des standardisierten Interviews die Meinung vertraten, daß nur ein Interview mit festgelegtem Wortlaut und vorgeschriebener Reihenfolge der Fragen eine Vergleichbarkeit der Ergebnisse gewährleistet und deshalb allgemeingültige Schlüsse zuläßt, glaubten die Anhänger der Motivforschung, daß nur ein - teilweise oder, besser noch, völlig - frei geführtes Gespräch die tieferen, vielfach unbewußten Strebungen des Käufers zutage bringen könnte. Dieser "Methodenstreit" kann heute als überwunden gelten. Das steht im Zusammenhang damit, daß "Einstellungsuntersuchungen in den mei-

Kapitel 4 Die Befragung

85

sten Fällen die Erforschung von Motiven ersetzt" haben (WlSWEDE 1973, S. 13). Es hat sich weitgehend eine Annäherung der Standpunkte durchgesetzt - in dem Sinne, daß dem standardisierten Interview in vielen Fällen der Vorzug zu geben ist, und zwar aus folgenden Gründen (BEHRENS 1966, S. 50): "(1) Die Tiefe eines Interviews hängt nicht von der Befragungsstrategie, sondern von der Befragungstaktik ab. (2) Die Quantifizierbarkeit nicht standardisiert gewonnener Untersuchungsmaterialien ist problematisch. (3) Bei nicht standardisierten Interviews besteht die besondere Gefahr, daß der Interviewer das Gespräch bewußt oder unbewußt in Richtung auf die Bestätigung bestimmter Erwartungen lenkt. 4) Nicht standardisierte Befragungsformen überlasten den Interviewer." Die Notwendigkeit der Einbeziehung psychologischer Überlegungen ist also nicht mehr umstritten. (Dies kann man, gemäß Kap. 1, sogar als Kennzeichen einer neuen Periode der Marktforschung ansehen.) Sie erfolgt aber im Rahmen der Befragungsta&í¿&. Bevor darauf (in Abschnitt 4.2.2) eingegangen wird, sei zunächst noch auf eine Sonderform im Rahmen des "unorthodox interviewing", das verdeckte Interview ("disguised interview"), hingewiesen. Man versteht darunter ein - unter irgendeinem Vorwand begonnenes - Gespräch, bei dem der Auskunftsperson gar nicht bewußt wird (oder werden soll), daß es sich um ein Interview handelt. Diese Form ist berufsethisch problematisch.

Innerhalb der ESOMAR (s. dazu in Kap.

20) wird sie denn auch für unzulässig gehalten.

Ferner erscheint es im hier gegebenen Zusammenhang zweckmäßig, im folgenden - als "Exkurs" - den Aufbau sowie Einsatz der InterviewerOrganisation zu erörtern. Ähnlich wie zur Durchführung des Absatzes eine Verkaufs(außen)organisation - sofern es sich nicht um ein reines Versandunternehmen handelt -, braucht man nämlich für (persönlichmündliche Befragungen eine Interviewer-Organisation. Diese ist also schon wegen der räumlichen Abdeckung des Befragungsgebietes, des „Feldes", erforderlich. Insofern besteht auch ein Zusammenhang mit der unten zu erörternden Frage „dezentral/zentral". Insoweit die telefonische Befragung zentral erfolgt, stellt sich hier die Frage anders - statt von „Interviewern" könnte man hier in gewisser Hinsicht auch von „Telefonisten" sprechen - und entfällt bei der schriftli-

86

Teil II Methoden der Datengewinnung in der Marktforschung

chen Befragung völlig. Die nachfolgenden Betrachtungen sind daher vorangig am (persönlich-)mündlichen Interview orientiert. Eine solche Organisation im „Feld" ist in erster Linie für - zumeist kommerzielle Institute, die "Umfrageforschung" ständig betreiben, notwendig. Für die betriebliche Marktforschung dürfte die Unterhaltung einer eigenen Interviewer-Organisation dagegen, schon wegen der damit verbundenen Kosten, eher die Ausnahme sein.

Daneben haben sich in jüngerer Zeit als selbständige Unternehmen betriebene "Feldorganisationen" etabliert, die im Grunde eben gerade Interviewerstäbe unterhalten und diese quasi den Auftraggebern (das kann die betriebliche Marktforschung, aber auch ein Institut sein) "gegen Berechnung" zur Verfügung stellen.

Exkurs: Die Interviewer-Organisation 1. Aufbau und Unterhaltung der Interviewer-Organisation Ehe Interviewer angeworben werden können, ist zunächst zu klären, welchen Anforderungen diese genügen müssen. Zumindest beim standardisierten Interview hängt offenbar der Erfolg einer Umfrage nicht vorrangig von der geistigen Leistungsfähigkeit der Interviewer ab: Entscheidend sind in erster Linie "Kontaktfähigkeit, 'blinde Pendanterie' und Interesse für Menschen" sowie "moralische Widerstandskraft" (NOELLENEUMANN/PETERSEN 1 9 9 6 , S. 3 2 2 ) .

Vgl. dazu auch schon die Uberschrift bei RING (1992, S. 85): „Interviewer: Kontaktfähige Pendanten". An anderer Stelle (S. 6 0 ) zitieren NOELLE-NEUMANN/PETERSEN (S. 1 0 4 ) SCHMIDTCHEN ( 1 9 6 2 ) : "Nicht der Interviewer, der Fragebogen muß schlau sein."

Aufgrund dieser Anforderungen und anderer Überlegungen (Ungleichmäßigkeit in der Beschäftigung, Erreichbarkeit der Befragten, Auswechselung der Interviewer usw.) hat sich weitgehend die Auffassung durchgesetzt, daß im allgemeinen nebenberufliche Interviewer den festangestellten vorzuziehen seien. Die Anwerbung der Interviewer scheint wegen der speziellen Anforderungen an diese von besonderer Bedeutung. Das Vorgehen dabei ist nicht einheitlich; manche Institute bevorzugen grundsätzlich die Empfehlung durch bereits mitarbeitende Interviewer, andere legen mehr Wert auf

Kapitel 4 Die Befragung

87

Anwerbung mittels Zeitungsanzeige. Dabei kommt es wesentlich darauf an, weniger diejenigen Personen anzusprechen, denen es primär um einen (beliebigen) Nebenverdienst geht. Für sich genommen, sind die Honorare für ein Interview durchschnittlicher Länge bzw. Schwierigkeit (gegebenenfalls zusätzlich Spesen), kaum sonderlich attraktiv noch dazu angesichts möglicher größerer Intervalle in der Beschäftigung. (Bei telefonischen Umfragen sind, wie erwähnt, vielfach - zumal, wenn diese zentral erfolgen „Stundenlöhne" üblich, die aber ebenfalls als eher niedrig erscheinen mögen.) Obwohl von den Instituten zumeist eher nicht erwünscht bzw. sogar untersagt, muß man davon ausgehen, daß mancher Interviewer für mehrere Institute gleichzeitig tätig ist. (Dies kann sich speziell bei Anwendung des Quotenverfahrens - s. 4.4.1.3 - recht negativ auswirken.)

Große Bedeutung kommt der Aus- und Fortbildung der Interviewer zu, da eine Verzerrung des Umfrageergebnisses nur dann vermieden werden kann, wenn alle Interviewer nach einheitlichen Grundsätzen vorgehen. Die Praxis hinsichtlich des Vorherrschens von mündlicher oder schriftlicher Schulung ist verschieden (und hängt auch mit dem anschließend zu behandelnden Problem der Organisation des Interviewernetzes zusammen). Es ist jedoch allgemein üblich, daß - zumeist schon mit der Annahme als Interviewer - Übungsinterviews durchzuführen sind. Zudem werden in der Regel, unabhängig von den speziellen Anweisungen bei den einzelnen Umfragen, schriftlich grundsätzliche Hinweise über die Durchführung von Interviews etc. gegeben (mitunter in Form von "Interviewer-Handbüchern" o.ä.) Gewisse Unterschiede ergeben sich in der Praxis hinsichtlich der Leitungsorganisation. Grundsätzlich kann diese zentral oder dezentral sein. Für die zentrale Leitung sprechen so gewichtige Argumente wie straffe Steuerung und einheitliche Ausrichtung, für die dezentrale solche wie besserer persönlicher Kontakt, erleichterte mündliche Schulung usw. Einen anderen Aspekt hat die Frage "zentral/denzentral" bei der telefonischen Befragung, den der Stationierung: Sollen alle Anrufe von der Zentrale aus erfolgen (geringerer Regionalbezug usw.) oder von verschiedenen Orten in der Nähe der Befragten (erschwerte Interviewerkontrolle usw.)? Zumindest bei CATI-Verfahren überwiegt wohl - schon wegen deren relativ hohen Hard- und Software-Kosten - die zentrale Form. Im übrigen spielt hier natürlich bei der Auswahl der Interviewer deren Stimme eine große Rolle, weshalb schon die Bewerbung - quasi als erster Test - telefonisch erfolgen soll. Nach einer Grundschulung geschieht, wie erwähnt, die laufende Kontrolle durch „Supervisoren" (und evtl. eine Mzc/jschulung).

88

Teil II

Methoden der Datengewinnung in der Marktforschung

2. Einsatz der Interviewer-Organisation Als Aufgaben bei der Vorbereitung des Interviewer-Einsatzes sind insbesondere zu nennen: 1. die Einteilung der Interviewer. Der Aufwand hierfür steht im Zusammenhang mit dem angewandten Auswahlverfahren (s. 4.4.1): Beim (Adressen-)Randomverfahren geht die oft recht langwierige Ermittlung der Anschriften, die den Interviewern zu nennen sind, voraus, während beim Quotenverfahren einfach die ermittelten Quoten den Interviewern bekanntgegeben werden, meist mittels besonderer Formblätter (s. auch Bsp. 4-56). In jedem Falle entsteht natürlich die Frage, wieviel Interviews von einem Interviewer zweckmäßigerweise durchgeführt werden sollen. Während beim Randomverfahren ein gewisser Zusammenhang mit der räumlichen Lage der ermittelten Anschriften besteht, ist beim Quotenverfahren die Anzahl im Prinzip beliebig. Es hat sich jedoch allgemein die Auffassung durchgesetzt, daß aus rein methodischen Erwägungen (geringerer Interviewereinfluß - s. dazu unten -, Vermeidung des "selektiven Hörensdas zu hören, was man, insbesondere nach einer gewissen "Konditionierung" durch die bisherigen Interviews, zu hören ertwartet) die Zahl der Interviews pro Interviewer relativ klein gehalten werden sollte. Nicht selten wird die Meinung vertreten, daß diese bei 5-10 Interviews, das Maximum bei etwa 15, liegen dürfte. 2. die Erarbeitung spezieller Interviewer-Anweisungen. Wenngleich grundsätzlich der Fragebogen so gehalten werden sollte, daß besondere Erläuterungen nicht notwendig sind, so werden sich doch in der Praxis gewisse zusätzliche Anweisungen kaum vermeiden lassen. Außerdem müssen Vorschriften über den Termin der Erhebung usw. vorliegen. Die Durchführung des Interviewer-Einsatzes wirft ebenfalls verschiedene Probleme auf, etwa: 1. Gewinnung der Auskunftspersonen für ein Interview. Oben wurde bereits darauf hingewiesen, daß die Honorierung der Auskunftsperson im allgemeinen abgelehnt wird. Diese ist deshalb auf andere Weise zur Mitarbeit zu gewinnen, etwa durch eine - schriftliche oder mündliche - Einführung in das Wesen von Umfragen; zumindest muß sie davon überzeugt werden, daß es sich tatsächlich um eine solche handelt

Kapitel 4 Die Befragung

89

(zumal nicht wenige Fälle vorgekommen sind, in denen sich Vertreter als Interviewer tarnten). Der Arbeitskreis Deutscher Marktforschungsinstitute, der gegen solche Fälle auch gerichtlich vorzugehen pflegt, hat deshalb ein besonderes "Siegel" - mit Merkblatt entwickelt, vermittels dessen sich die Interviewer als zu einem Mitgliedsinstitut gehörend ausweisen können. "Echte" Verweigerer machen übrigens nur einen Teil der Ausfälle aus. Da dieses Problem, jedenfalls die Form seinen Auftretens, mit der Art der Auswahl der Befragten zusammenhängt, wird es dort (unter 4.4.1) näher behandelt.

2. Ausschaltung des Interviewereinflusses. Unter Interviewereinfluß oder Interviewer-Bias ("interviewer error") versteht man im engeren Sinne die Gefahr, daß der Interviewer völlig unbewußt, allein durch sein Auftreten, sein Aussehen usw., Gefälligkeitsoder Prestige-Antworten etc. hervorruft (a). Im weiteren Sinne zählen hierzu - neben a - auch unsachgemäße oder völlig falsche Aufzeichnungen bzw. Einstufungen von Antworten (b). Im weitesten Sinne kann man - neben a und b - dazu ferner die bei der Quotenauswahl bestehende Gefahr, daß der Interviewer "immer dieselben Personen" befragt, rechnen (c - s. unten, 4.4.1.3). Zum Problemkreis a gehört etwa die Frage, ob z.B. junge weibliche Interviewer bei älteren Männer andere Antworten hervorrufen, ob gutes Aussehen vielleicht zu Prestige-Antworten verleitet usw. Von mancher Seite wird diesen Fragen außerordentliches Gewicht beigemessen und immer wieder die grundsätzliche Problematik von "Feldeinflüssen" betont. Insbesondere natürlich aus Kreisen der Institute wird dem widersprochen und hervorgehoben, daß bei richtiger Schulung der Interviewer die von diesen ausgehenden Einflüsse außerordentlich gering sind im Verhältnis zu anderen Fehlermöglichkeiten. Tatsächlich scheinen entsprechend angelegte Experimente (mittels Teilgruppen usw.) gezeigt zu haben, daß sich speziell der Interviewereinfluß i.e.S. in Grenzen halten kann. Wie oben erwähnt, sucht man das darüber hinaus durch die Beschränkung der Anzahl der vorzunehmenden Interviews zu erreichen. Das wirkt auch auf den Effekt c. Einfluß b schließlich läßt sich zudem durch Kontrolle der Interviewer begrenzen:

90

Teil II Methoden der Datengewinnung in der Marktforschung

Die Kontrolle des Interviewer-Einsatzes bezieht sich in erster Linie auf das Fälscherproblem. Nur zu leicht könnten manche Interviewer geneigt sein, auf ein Interview ganz zu verzichten, den Fragebogen also "in Heimarbeit" auszufüllen, oder aber zwar ein Interview zu beginnen, einen gewissen Teil der Fragen aber - zumal bei partieller Antwortverweigerung - selbst zu beantworten (7e¿/falschung). Da durch Fälschungen u.U. der ganze Zweck der Untersuchung in Frage gestellt werden kann, hat man schon seit langem Verfahren zu deren Entdeckung entwickelt. Dazu gehört etwa die Aufnahme von "Fangfragen" in den Fragebogen. (Es ist allerdings darauf hinzuweisen, daß eine offenbare Widersprüchlichkeit in den Angaben eines Befragten noch keinen Beweis für das Vorliegen einer Fälschung bietet; eher kann - umgekehrt - ein allzu glattes Ineinanderpassen der einzelnen Antworten auf eine solche hindeuten.) Eine weitere Möglichkeit ist die Kontrollbefragung eines Teiles der Auskunftspersonen, entweder in Form einer nochmaligen Befragung - etwa mit dem Hinweis, der Fragebogen sei verloren gegangen - oder lediglich der Bitte um Bestätigung. So wird bei manchen Instituten routinemäßig ein bestimmter Prozentsatz der Befragten um eine Bestätigung über das Stattfinden des Interviews und dessen Dauer, als Anhaltspunkt für das eventuelle Vorliegen einer Teilfälschung, gebeten. U m eine solche Kontrolle überhaupt durchführen zu können, muß man sich bei Auswahlverfahren, bei denen die Adresse nicht vorgegeben ist - so beim Quotenverfahren - vom Interviewer die Befragten-Anschrift nennen lassen. (Ist die Adresse dagegen vorgegeben - wie beim Adressen-Random - so besteht die Möglichkeit, gar nicht existierende „Adressen" aufzuführen - um zu sehen, was der Interviewer damit „anfängt".) Insofern kann auch kaum argumentiert werden, daß manche Auswahlverfahren von vornherein eine größere Anonymität garantieren würden.

Ein besonderes Problem der Kontrolle der Interviewer ist, ob im Fragebogen offen gelassen bzw. anscheinend falsche Antworten im Institut ergänzt werden sollen oder nicht. Grundsätzlich wird man hier sehr vorsichtig sein müssen; eine eigenmächtige Ergänzung ist nicht nur dann angebracht, wenn es sich um offensichtliche Fehler handelt. Beispiel 4-3 Bei einer Untersuchung erscheint als Antwort bezüglich der bevorzugten Marke eine gar nicht existierende Spirituosensorte "Förstergold"; alle übrigen Anzeichen - Geschmacksrichtung, Aufmachung usw. - deuten aber darauf hin, daß nur die bekannte Marke "Jägergold" gemeint sein kann.

Kapitel 4 Die Befragung

91

Auch ist zu berücksichtigen, daß Einstellung und Verhalten nicht übereinzustimmen brauchen. Beispiel 4-4 Auf die Frage, ob er für den Weg zur Arbeit lieber öffentliche Verkehrsmittel oder den eigenen Pkw benutzen würde, erscheint als Antwort des Befragten, daß er ein öffentliches Verkehrsmittel bevorzuge; in Wirklichkeit - was also im Zweifel nicht geändert werden dürfte! - fährt er aber mit dem Auto.

4.2.2 Indirekte Befragung (und psychologische Tests) Nach der Art der Fragestellung und damit der Befragungsta&í¿& kann zwischen direkter und indirekter Befragung unterschieden werden. Die direkte Befragung stand lange Zeit im Vordergrund; ihr Vorherrschen charakterisiert eine ganze Periode der Entwicklung der Marktforschung. (S. Kap. 1.) Sie ist dadurch gekennzeichnet, daß die zu ermittelnden Sachverhalte ohne Umschweife erfragt werden. Einige vereinfacht formulierte Beispiele mögen dies veranschaulichen: Beispiel 4-5 "Wie hoch ist Ihr Einkommen"" Beispiel 4-6 "Besitzen Sie ein Auto?" Beispiel 4-7 "Haben Sie gestern Zahnpasta benutzt?" Beispiel 4-8 "Wann haben Sie zuletzt Ihre Haare gewaschen?"

Erst allmählich erkannte man die Mängel dieser Verfahrensweise und versuchte, durch indirekte Befragung mehr in Erfahrung zu bringen. Darunter soll hier lediglich das Vorgehen verstanden werden, welches darauf abzielt, durch entsprechende Formulierung bzw. Gestaltung der Fragen zu Resultaten zu gelangen, die bei direkter Befragung aus unterschiedlichen Gründen (Prestige, aber auch Unbewußt-Sein) nicht zu erhalten gewesen wären.

92

Teil II Methoden der Datengewinnung in der Marktforschung

Der Begriff ist also im engeren Sinne zu verstehen. Ausgeschlossen werden soll insbesondere die Art der "indirekten" Befragung, die darin besteht, daß man einen Dritten, etwa einen Händler, über das Verhalten des eigentlich Interessierenden, des Verbrauchers, befragt.

Vielfach kann dies bereits durch psychotaktisch-zweckmäßige Befragungsweise geschehen: Beispiel 4-9 (Forts, v. Beisp. 4-5) Die Ermittlung des Einkommens (meist als "Haushalts-Nettoeinkommen") wird üblicherweise als äußerst wichtig angesehen - zumal als mit vielen andern Größen korrelierendes Merkmal -, ist aber auf direktem Weg (aus Prestige- und anderen Gründen) meist schwer erreichbar Sie könnte ersetzt werden durch die Frage nach bzw. Beobachtung von KaufkraftIndizien, wie z.B. Art der Wohnung, Vorhandensein von Gegenständen des gehobenen Bedarfs. Allerdings besteht hier kein eindeutiger Zusammenhang - man denke nur an die Verschuldungsmöglichkeit durch den Konsementenkredit. In der Praxis wird deshalb meist eine Liste mit lediglich Einkommensstufen verwandt. (S. dazu auch Liste D zu dem im "Appendix" wiedergegebenen FragebogenAuszug.) Erfolgt darauf keine - spontane - Antwort und auch keine "Schätzung" durch den Befragten selbst, so wird diese durch den Interviewer oder notfalls den Sachbearbeiter im Institut vorgenommen. Beispiel 4-10 (Forts, v. Beisp. 4-6) Die aus Prestige-Gründen vielleicht etwas problematische Frage nach dem Besitz eines Personenkraftwagens ist in dem bereits erwähnten, vom Verf. betreuten Projekt (s. HÜTTNER [Hrsg.] 1977 oder ders. 1979) so formuliert worden: "Wer besitzt in Ihrem Haushalt einen Wagen?" Antwortvorgaben waren: "1 Ich selbst 2 Zusätzlich meine Frau bzw. meine Kinder (Zweitwagen)" Es hatten also nur die Besitzer eines Autos ausdrücklich zu antworten, wogegen der Nicht-Besitz nicht explizit erklärt zu werden brauchte. (Die Frage erfüllte damit auch "Ablaufordnungsfunktionen" - s. dazu unter 4.3.2 -, indem die beiden Gruppen an unterschiedlicher Stelle des Fragebogens fortzusetzen hatten, die Nichtbesitzer also einige Fragen überspringen sollten.) Beispiel 4-11 (Forts, v. Beisp. 4-7) Die Frage, ob gestern Zahnpasta benutzt wurde, kann z.B. psychologisch geschickt folgendermaßen formuliert werden: "Bekanntlich gibt es verschiedene Methoden der Mundpflege: Zahnpulver, Zahnpasta, Zahnseife, Mundwasser, Alkohol und andere Mittel. Haben Sie vielleicht im Laufe des gestrigen Tages Zahnpasta benutzt - oder haben Sie es gestern anders gehalten?" (Aus einer Untersuchung des EMNID-Instituts, Bielefeld.)

Kapitel 4

Die Befragung

93

Beispiel 4-12 (Forts, v. Beisp. 4-8) Durch folgende Formulierung kann einer Prestige-Antwort auf die im Rahmen einer Marktuntersuchung für Haarwaschmittel zu stellende Frage, wann man sich zuletzt die Haare gewaschen habe, entgegengewirkt werden: "Würden Sie mir noch ein paar Fragen über Ihre Gewohnheiten bei der Haarwäsche beantworten? Viele Menschen sagen ja, daß es schädlich für das Haar und die Kopfhaut ist, wenn man sich allzu häufig den Kopf wäscht. Könnten Sie mir sagen, wann Sie zum letzten Mal Ihre Haare gewaschen haben?" (Aus einer Untersuchung des Instituts für Demoskopie, Allensbach; vgl. NOELLENEUMANN/PETERSEN 1 9 9 6 , S. 1 3 9 . )

In vielen Fällen wird die Anwendung der psychotaktisch-zweckmäßigen Befragungsweise, die Formulierung der Fragen in indirekter Form bzw. überhaupt ihre geschickte psychologische Umkleidung, hinreichend sein, um die gewünschten Ergebnisse zu erlangen. In anderen Fällen bedarf es dazu der Anwendung psychologischer Tests. Meist handelt es sich dabei um projektive Verfahren. Man versteht hierunter Tests, die so angelegt sind, daß die Reaktion der Versuchsperson auf die vorgegebenen Reize ihre eigenen Einstellungen etc. erkennen läßt, ohne daß sie sich dessen bewußt ist. Das geschieht, indem der Testperson unklare, mehrdeutige Situationen usw. vorgegeben werden, die sie zu beschreiben oder wofür sie die Reaktion Dritter zu "erfinden" hat (ThirdPerson-Technique), in die sie also gewissermaßen ihre subjektiven Gegebenheiten "hineinprojiziert". Die Bedeutung mancher solcher Tests hat sich in der Praxis der Marktforschung doch nicht als so groß erwiesen, wie man zunächst geglaubt hatte. Die folgende Aufzählung und Beschreibung ist deshalb relativ kurz. Sie folgt dem "Alter" der einzelnen Verfahren (und wird ergänzt durch einige neuere, erst in den letzten Jahren im gegebenen Zusammenhang entstandene Methoden). 1. Der Foto- oder Personen-Zuordnungstest alte Form dar.

stellt eine verhältnismäßig

E r hat seinen Ursprung in den physiognomischen Tests der klinischen Psychologie. Beim sog. Szondi-Test wird der Versuchsperson eine Reihe von Porträts gezeigt, und zwar von Leuten, die - was verschwiegen wird - an einer geistigen Störung (Verfolgungswahn und dgl.) leiden. Man bittet den Probanden, die Person herauszusuchen, mit der er am liebsten Kontakt haben würde. Dabei wird angenommen, daß er sich zu derjenigen Person am meisten hingezogen fühlt, deren geistige Störung er im leichten Ansatz ebenfalls aufweist.

94

Teil II Methoden der Datengewinnung in der Marktforschung

In der Marktforschung findet das Verfahren in der Weise Anwendung, daß Abbildungen oder Beschreibungen von Personen vorgegeben werden mit der Bitte, den Verwender bzw. Käufer eines bestimmten Produkts diesen zuzuordnen. Beispiel 4-13 In einer Schweizer Untersuchung (der Gesellschaft für Martkforschung in Zürich; vgl. BORSCHBERG 1963, S. 307) über die beiden Substitutionsgüter Gasherd und Elektroherd wurde den Befragten ein Bildblatt vorgelegt mit folgender Frage: "Hier zeige ich Ihnen die Bilder von verschiedenen Frauen. Nehmen wir an, alle diese Frauen müßten jetzt denselben Entscheid treffen zwischen Gas und elektrisch, den Sie jetzt gerade angegeben haben. Was würden diese Frauen wählen?"

2. Der Satzergänzungstest ("sentence completion test") wird in der Marktforschung ebenfalls schon lange verwandt. Formal handelt es sich dabei um nicht anderes als "offene Fragen", also solche, bei denen die Antwortmöglichkeit nicht vorgegeben ist. (S. dazu unten, 4.3.1.1.) Die Besonderheit liegt darin, daß man die Auskunftsperson bittet, einen bereits begonnenen Satz zu vervollständigen - wobei der Eindruck erweckt wird (jedenfalls soweit es sich um ein projektives Verfahren handelt), als ob sie die Antwort für eine dritte Person "erfinden" müßte. Es ist deshalb erforderlich, letztere relativ wenig zu konturieren, um der Projektion freien Raum zu lassen. Deshalb und auch der Veranschaulichung halber wird der Satzergänzungstest bisweilen in graphischer Form durchgeführt: Abbildung von zwei Personen, von denen die eine etwas sagt (in Gestalt einer "Sprechblase", eines über ihr schwebenden "Ballons" - Ballon/rage), worauf die andere (in gleicher Form) zur Antwort ansetzt, diese - mit dem eigentlichen Sinngehalt - jedoch von der Auskunftsperson ergänzt werden muß. Beispiel 4-14 In einer Untersuchung des Instituts für Demoskopie, Allensbach (vgl. - ausführlich, mit Abbildung - NOELLE-[NEUMANN] 1963, S. 76 bzw. - sehr viel kürzer, aber mit möglichen Antworten - NOELLE-NEUMANN/PETERSEN 1996, S. 501) sollten die Vorurteile gegen das Brillentragen geklärt werden. Den weiblichen Befragten (den männlichen entsprechend) wurde dazu die Abbildung von zwei - relativ wenig konturierten - Frauen vorgelegt, von denen die eine mit dem Satz beginnt: „Du kennst doch die Marianne. Seitdem sie jetzt eine Brille trägt " Die dazugehörige Frage lautete für Frauen (für Männer entsprechend): "Sehen Sie hier - da unterhalten sich gerade zwei Frauen. Die eine ist eben im Satz unterbrochen worden. Was meinen Sie, wie könnte dieser Satz zu Ende gehen?" (S. dazu auch A 4-2).

Kapitel 4

Die Befragung

95

Eine besondere Form des Satzergänzungstests ist der sog. Bildenttäuschungstest ("picture frustration testRosenzweig-Test). Im Grunde handelt es sich dabei um einen Persönlichkeitstest, da er versucht, durch die Abbildung eines frustrierenden Ereignisses und die vom Befragten zu ergänzende Antwort des Betroffenen zur Analyse der Persönlichkeit der Auskunftsperson - ob etwa aggressiv oder zurückhaltend - beizutragen. (Als Beispiel SMITH 1955. S. 138: Abbildung eines Restaurant-Tisches; der Kellner bringt eine Speise, mit dem Satz im „Ballon": „Es tut mir leid, aber der Koch hat es nicht so zubereitet, wie sie es bestellt haben"; der Ballon über dem Gast - Mann oder Frau - ist leer.)

3. Der Wortassoziationstest ("word association test") ist ebenfalls schon recht lange in Gebrauch. Hierbei werden den Befragten Wörter präsentiert mit der Bitte, möglichst rasch und ohne Überlegen anzugeben, woran sie dabei denken, welche Vorstellung sie also mit den genannten Stimuli assoziieren. Die Verwendungsmöglichkeit ist überaus vielfältig. So kann man damit z.B. Namenstests durchführen, also festzustellen suchen, welche Vorstellungen mit einer bestimmten Produktbezeichnung assoziiert werden (oder auch umgekehrt, welche Namensvorstellungen ein bestimmtes neues - Produkt hervorruft). Beispiel 4-15

In etwas abgewandelter Weise wurden in einer Untersuchung des Instituts für Demoskopie auch die mit der Verwendung von Frischfisch verbundenen Assoziationen getestet, s. Darst. 4-3 auf der folgenden Seite. (Das Beispiel zeigt gleichzeitig die Nähe zum "Semantischen Differential" - s. unter 4.3.1.2.)

4. Der TAT (Thematischer Apperzeptions-Test - Thematic Apperception Test) besteht in seiner Grundform aus einer Serie sorgfältig ausgewählter Bildtafeln, die der Auskunftsperson vorgelegt werden mit der Aufforderung, dazu jeweils eine Geschichte zu erfinden bzw. zu erklären, was ihrer Meinung nach auf dem Bild vor sich geht. Es handelt sich um ein typisch projektives Verfahren, indem angenommen wird, daß der Erzähler seine geheimen Wünsche, Vorstellungen usw. in die Geschichte hinein"projiziert". Die Frage dabei ist, ob sich diese Projektion besser erreichen läßt durch stärker strukturierte Bilder - wie sie Murray, auf den der TAT zurückgeht, entwickelte - oder durch mehr vage gehaltene Vorlagen. Grundsätzlich wird man sagen können, daß, je strukturierter die Bilder sind, um so mehr auch die Stellungnahmen sich auf präzise Einzelfragen beziehen. Der TAT war so in erster Linie ein Persönlichkeitstest, der der Persönlichkeitsanalyse diente. Er läßt sich jedoch in verschiedener

96

Teil II Methoden der Datengewinnung in der Marktforschung

Es dachten an:

0

10

20

Sphmarlrhaft

30

40

SO

60

70

80

« /

• •·

»

Frauen, die im Sommer und Winter ziemlich viel Frischfisch zubereiten Frauen, die hauptsächlich im Winter Frischfisch zubereiten Fischgegnerinnen

Darst. 4-3: "Assoziations-Wahltest"

(nach NOELLE-NEUMANN/PETERSEN 1996, S. 522)

Weise variieren, über den "Vier-Bilder-Test" zum Ein-Bild-Test. Letztere Form findet am ehesten in der Marktforschung Verwendung. Beispiel 4-16 In einer amerikanischen Untersuchung (von Social Research International; vgl. B E R T H 1 9 5 9 , S. 1 7 4 ) über Autos sollte auch die Einstellung der Verbraucher zur Geschwindigkeit ermittelt werden, um daraus Schlüsse für die Konstruktion, Werbung usw. ziehen zu können. Den Auskunftspersonen wurde deshalb ein Bild vorgelegt, das deutlich eine Geschwindigkeit von fast 70 Meilen pro Stunde (und damit mehr als die damals üblicherweise zugelassene Höchstgeschwindigkeit, aber

Kapitel 4 Die Befragung

97

sonst eigentlich nur Hände am Steuer) zeigt - mit der Aufforderung, sich in die Rolle des Fahrers hineinzuversetzen und davon zu berichten.

5. Das Gruppendiskussionsverfahren ("Gruppeninterview" - man spricht auch von Focus Groups) besteht darin, daß eine - meist kleinere Gruppe von Personen zu einer Diskussion über ein bestimmtes Thema (unter der Leitung eines "Moderators") gebeten wird. Man geht dabei von der Annahme aus, daß im Zuge der Diskussion gewisse Hemmungen beseitigt werden und die Teilnehmer sich gegenseitig zu Äußerungen anregen bzw. hinreißen lassen. Die Analyse der (Tonband- oder Videoaufzeichnungen kann dann Hinweise auf - unbewußte - Strebungen und Motive geben, die andernfalls nur schwer aufzudecken wären. Dieses billige und schnelle, aber auch stichprobentheoretisch und in manch anderer Hinsicht problematische Verfahren wird in der Marktforschung sehr häufig angewandt, etwa einerseits in Situationen, in denen man "noch gar nichts weiß" (also zur Entwicklung eines standardisierten Fragebogens kaum in der Lage wäre), andererseits bei Produkttests (s. Kap. 15). Dies geschieht vielfach mittels besonderer "Test-Studios", die evtl. auch Passanten auf der Straße ansprechen ("Baggern") und zur u.U. sofortigen Mitarbeit bewegen. Solche Test-Studios wurden offenbar in den letzten Jahren in zunehmenden Maße gegründet. Sie sind oft reichhaltig mit apparativen Techniken ausgestattet - s. dazu Kap. 5 - und führen neben Gruppendiskussionen und den schon erwähnten Produkttests auch Anzeigentests sowie TV- und Funk-Spot-Tests durch. In jüngerer Zeit war speziell die Anwerbung von Gruppendiskussions-Teilnehmern ins Gerede gekommen. Einerseits hatte sich hier ein neuer, vermittelnder „Beruf" herausgebildet, den man als „Rekrutierer" (recruiter) bezeichnen könnte. Andererseits gäb es - gemäß J. Rose, Institutschef in London (nach Context 10/95, S. 4ff.; vgl. auch ders. 5/96, S. 2ff.) - „ein Gemunkel, mit der qualitativen Anwerbung stehe es nicht zum besten. Nicht das britische Volk werde da befragt, sondern ein kleiner Club von Berufsbefragten, die, je nach Wunsch, als Dreißig- oder Vierzigjährige aufträten, als Rechts- oder Linkswähler, als kinderreich oder kinderlos, und allzeit bereit, als Pepsioder Coca-Konsumenten zu posieren" (wenn nur das Honorar stimme).

Während die vorstehend genannten Verfahren im Grunde schon recht lange bekannt sind und angewandt werden, traten zwei andere Methoden im Zusammenhang "indirekter" - im weitesten Sinne - Feststellung von Sachverhalten erst in jüngerer Zeit verstärkt in Erscheinung: 1. die Messung der Antwortzeit,

98

Teil II Methoden der Datengewinnung in der Marktforschung

2. das "Randomized Response Model". Zu 1: Die Antwortzeit (" response latency") ist die Zeit zwischen Fragestellung und Antwort. Sie gilt als ein Maß für die Sicherheit oder Uberzeugung, mit der eine Antwort gegeben wird (und somit für die Beeinflußbarkeit und die Prognose des Verhaltens). So wird angenommen, daß die Antwortzeitmessung die Prognose wesentlich verbessern kann. AAKER et al. ( 1 9 8 0 ) haben dies im Vergleich zu anderen Indikatoren für Präferenzdaten (bezüglich der Markenwahl) untersucht. MACLACHLAN/MYERS ( 1 9 8 3 ) wandten das Verfahren zur Identifikation von "motivierender Werbung" an. Die Antwortzeitmessung ist natürlich am genauesten und vom Befragten unbemerkt ("nicht-reaktiv", gemäß Kap. 5) unter Verwendung eines Computers bei der Befragung möglich.

Zu 2: Mit der Technik des Randomized Response wird versucht, Verzerrungen durch Verweigerung oder bewußt falsches Antworten bei sensitiven Fragen dadurch entgegenzuwirken, daß - dem Interviewer verborgen bleibende - Zufallsmechanismen die Antwort des Befragten steuern und damit seine Anonymität gewährleisten. Beispiel 4-17 F O X / T R A C Y (1986, S. 12f.) demonstrieren das Prinzip am Thema "Gewalt gegen (Ehe-)Frauen": Angenommen, eine Versammlung von 100 Ehemännern sollte darüber befragt werden. (Von Problemen der Repräsentanz wird abgesehen.) "Natürlich würde die einfache Bitte, diejenigen Männer sollten die Hand heben, die ihre Frau schon geschlagen haben, höchstwahrscheinlich einen Raum voller Gaffer ('rubbernecks') produzieren, aber nur wenige erhobene Hände." Stattdessen könne man jeden bitten, für sich - d.h. unbemerkt von den anderen - eine Münze zu werfen und seine Hand zu heben, falls das Ergebnis "Kopf" zeigt oder er seine Frau schon geschlagen hat. Von den 100 Männern müßten dann 50 die Hand allein aufgrund des Münzwurfs heben; die darüber hinausgehende Zahl indiziert also diejenigen, die die sensitive Frage bejahen müßten; zur Berechnung ihres Anteils ist diese Zahl auf 50 zu beziehen (und nicht auf 100, weil es nur diejenigen sind, die nicht schon aufgrund des Münzwurfs ihre Hand zu heben hatten). Wurden also 58 Hände gehoben, so folgt daraus ein Anteil von 16%, die die Gewalt-Frage bejahen müßten - und zwar ohne daß Identifikation möglich wäre.

Das Prinzip des "Randomized Response" geht auf W A R N E R ( 1 9 6 5 ) zurück. Es bezog sich ursprünglich, wie im Beispiel, lediglich auf - dichotome • Nominaldaten, und zwar dergestalt, daß - etwas anders als im Beispiel der Zufallsmechanismus nur bewirkt, daß dem Befragten die sensitive Frage selbst ober deren Verneinung vorgelegt wurde. Im Lauf der Zeit hat

Kapitel 4 Die Befragung

99

sich eine ganze Reihe von Varianten entwickelt, die man etwa wie folgt zusammenfassen kann: 1. Variation des Randomized-Response-Designs. Hierzu gehört vor allem das - gegenüber dem "Warner-Modell" wohl präferierte - "Simmons"- oder „Unrelated Question-Modell" (HORVITZ/ SHAH/SIMMONS 1 9 6 7 ) : Die beiden Frage-Varianten sind voneinander unabhängig, eine davon ist nicht-sensitiv. Eine Extension in anderer Richtung - zu weiteren vgl. auch die angegebene Literatur - bezieht sich auf die Anwendungsmöglichkeit von telefonischer und schriftlicher Befragung (STEM/STEINHORST 1 9 8 4 ) . 2. Ausdehnung - von dichotomen - auf multitome (polytome) Messungen (ABUL-ELA/GREENBERG/HORVITZ 1 9 6 7 ) .

Erweiterung auf metrische Daten ("quantitatives Modell" - GREENBERG et al. 1971). 4. Verbindung von "qualitativem" und "quantitativem Modell" ("Two Stage Model" - REINMUTH/GEURTS 1975). 3.

Anwendungen sind - im Vergleich zu methodischen Beiträgen - eher rar. Das gilt speziell für den Bereich Marketing. Zu nennen ist hier etwa die Studie von GEURTS/ANDRUS/REINMUTH 1 9 7 5 über Ladendiebstahl und anderes "abweichendes (Konsumenten-)Verhalten". Deshalb auch wurde hier auf die im Einzelfall nicht unbeträchtliche Mathematik und die bisherigen Validierungsversuche nicht eingegangen; vgl. dazu ausführlich F O X / T R A C Y 1 9 8 6 (und DEFFAA 1 9 8 2 sowie SCHNEIDER 1 9 9 5 ) . Diese geringe Praxis-Anwendung mag u.a. damit zusammenhängen, daß ähnliche sensitive Fragen wie in anderen Bereichen (z.B. Drogenkonsum!) in der Marktforschung nicht auftreten. Andererseits ist zu bedenken, daß dem Schutz der Privatsphäre und damit dem "Randomized Response" auch hier in Zukunft steigende Bedeutung zukommen kann.

4.3 Das Frageinstrumentarium Im Laufe der Entwicklung, insbesondere mit der zunehmenden Verwendung des standardisierten Interviews, hat sich eine große Zahl von verschiedenen Arten der Fragen herausgebildet (die zudem noch teilweise unterschiedliche Benennungen tragen). Zur Klassifikation dieser zahlreichen Arten empfiehlt sich der Rückgriff auf die Unterscheidung von BEHRENS ( 1 9 6 6 , S. 94):

100

Teil II Methoden der Datengewinnung in der Marktforschung

"(1) nach der bestehenden oder fehlenden Vorgabe von Antwortkategorien, (2) nach der Verwendung oder Nicht-Verwendung von Vorlagen, (3) nach dem Zweck, der mit einer Frage verbunden ist." Die erste Einteilung, nach den Antwortmöglichkeit, ist die wichtigste; sie wird deshalb in einem eigenen Abschnitt (mit weiterer Untergliederung) behandelt. Im zweiten Abschnitt erfolgt die zusammengefaßte Erörterung der beiden anderen Einteilungen. Im letzten Abschnitt werden noch einige Probleme der zweckmäßigen Gestaltung des Fragebogens diskutiert.

4.3.1 Einteilung nach der Antwortmöglichkeit Die Einteilung der Fragen nach der Antwortmöglichkeit kann gemäß Darst. 4-4 vorgenommen werden.

Fragen (nach der Antwortmöglichkeit) Offene Fragen

Geschlossene Fragen

Alternativfragen Normalform

Mehrfach-Auswahl-Fragen (Selektivfragen)

Spezialform: ilogfrage

Normalform

Ja-Nein-Frage Neutrale Fassung

Unbegrenzte Anzahl von Nennungen

Spezialform: "" " ~ ifrage Begrenzte Anzahl von Nennungen

in unbestimmter in bestimmter Weise Weise (nach unten nach unten nach oben und oben begrenzt begrenzt begrenzt) Darst. 4-4: Einteilung der Fragen nach der Antwortmöglichkeit

Kapitel 4 Die Befragung

101

Im nächsten Unterabschnitt erfolgt zunächst die Diskussion der grundlegenden Einteilung in offene und geschlossene Fragen und sodann die der Unterformen der letzteren, mit Ausnahme der "Skalafrage"; diese ist, wegen ihrer großen Bedeutung, einem besonderen Unterabschnitt vorbehalten.

4.3.1.1 Offene und geschlossene Fragen Die offene Frage ("open-ended/response question") ist dadurch gekennzeichnet, daß der Auskunftsperson die Formulierung der Antwort überlassen wird - entweder vollständig oder nur hinsichtlich der Ergänzung eines bereits angefangenen Satzes ("Satzergänzungstest", s. oben). Die Aufzeichnung durch den Interviewer soll so originalgetreu wie möglich erfolgen, da jede Veränderung des Wortlauts, auch in der besten Absicht, zu Verzerrungen führen kann; allenfalls unbedeutende Einzelheiten können weggelassen werden. Die offene Frage erscheint auf den ersten Blick als das allein angemessene Verfahren, da offenbar nur sie - so zumindest die Vertreter der stärker psychologisch orientierten Richtung - der Auskunftsperson zu sagen erlaubt, was sie sagen will. Dem stehen jedoch verschiedene Nachteile gegenüber: 1. die Antworten gehen möglicherweise am Kern dessen, was man eigentlich wissen wollte, vorbei ("Multidimensionalität der offenen Frage"); 2. sie hängen wesentlich vom Ausdrucksvermögen der Befragten ab; 3. die Auswertung ist schwierig. Dies gilt nicht nur in technisch-formaler Hinsicht - insofern, als die Codezahlen nicht schon im Fragebogen vorgegeben und evtl. vom Interviewer sogleich maschinenlesbar markiert werden können. (S. dazu den im Appendix zu diesem Kapital wiedergegebenen Fragebogen. Vgl. im übrigen zu Aufbereitung und Codierung die Einführung zum III. Teil.) Vielmehr ist die Verschlüsselung auch inhaltlich schwierig, insbesondere dann, wenn nicht, wie etwa bei der - "offen" gestellten - Frage nach dem Alter, quantitative Merkmale vorliegen und deshalb Zuordnung und Gruppenbildung in vergleichsweise einfacher Art erfolgen können. Die bei qualitativen Merkmalen notwendige Bildung von Kategonen kann offensichtlich in verschiedener Weise geschehen. Grundsätzlich lassen

102

Teil II Methoden der Datengewinnung in der Marktforschung

sich dabei zwei Vorgehensweisen unterscheiden: Einmal ist die Bildung von

Kategorien

nach

interpretativen

("evaluativen")

Gesichtspunkten

möglich; die A n t w o r t e n werden "bewertet" nach ihrem positiven, negativen und eventuell neutralen Gehalt. In der Regel wird man allerdings deskriptive

(beschreibende) Kategorien bevorzugen, die auch Begründun-

gen enthalten. Beispiel 4-18 Die Einstellung junger Mädchen zu pfeiferauchenden jungen Männern (vgl. hierzu und zum folgenden S O M M E R 1 9 6 3 ) kann nach interpretativen Kategorien gemäß folgenden einfachen Code verschlüsselt werden: 1 - positive Äußerungen 2 - negative Äußerungen 3 - neutrale Äußerungen 4 - Äußerungen, die das Thema verfehlen 5 - ohne Antwort Am Thema vorbeigehende Antworten lassen sich noch als solche ohne Stellungnahme, also unter "ohne Antwort", einordnen, so daß nur 4 Kategorien zu bilden sind. Nach deskriptiven Gesichtspunkten könnte sich z.B. folgender Code ergeben: 1 - allgemein positive Aussagen (z.B. prima, fein, in Ordnung) 2 - sieht gut aus; steht ihnen gut 3 - sieht männlich aus, wirkt männlich 4 - ist gesünder als Zigaretten rauchen 5 - sonstige positive Aussagen 6 - entschiedene Ablehnung (z.B. widerlich, mit denen will ich nichts zu tun haben, dieser dämliche Mensch) 7 - lächerlich, komisch, albern 8 - ist etwas für ältere Männer 9 - ist Angabe, wollen sich wichtig tun 10 - Pfeife ist ungesund 11 - sonstige negative Aussagen 12 - gleichgültige, neutrale Aussagen (z.B.: muß jeder selbst wissen, stört mich nicht, kommt darauf an) 0 - ohne Angabe, weiß nicht E s ist hierbei auch noch zu beachten, daß die Antwortkategorien h o m o gen sein müssen, d.h. trennscharf, auf einer logischen Ebene liegend usw. Zwei Beispiele sollen dies demonstrieren. Beispiel 4-19 Die Antworten auf die Frage nach den Gründen für den Kauf eines neuen Haarwassers, insbesondere für den Markenwechsel, können (vgl. dazu ausführlicher SOMMER 1963) katalogisiert werden nach den Eigenschaften des neuen Haarwassers

Kapitel 4 Die Befragung

103

- wiederum unterteilt z.B. nach Geruch und Erfolg - und nach den Informationsquellen und Werbeträgern. Beispiel 4-20 Die Antworten auf die Frage nach den Hoffnungen für das nächste Jahr (vgl. dazu ausführlich NOELLE-NEUMANN/PETERSEN 1 9 9 6 , S. 383ff.) können gegliedert werden nach dem persönlichen Bereich - unterteilt nach den finanziell-wirtschaftlichen Wünschen, solchen nach Gesundheit usw. - und dem öffentlichen Bereich, mit mehreren Unterteilungen. D i e geschlossene Frage ("closed-ended/response question") ist dadurch gekennzeichnet, daß die Antwortkategorien d e m Befragten vorgegeben werden. Technisch geschieht dies - sofern sich die Antwortmöglichkeiten nicht bereits aus dem Wortlaut ergeben - durch Vorlage von "Listen" usw. Die Bekanntgabe der Antwortkategorien nur - mittels des Fragebogens - an die Interviewer (die die offenen Antworten der Befragten dann in diese Kategorien einzuordnen haben - "Feldverschlüsselung") genügt als nicht, um den Charakter als "geschlossene Frage" zu begründen. Umgekehrt macht die Tatsache, daß die Befragten den Fragebogen nicht selbst ausfüllen, sondern die Interviewer die den Antwortkategorien entsprechenden Zahlen eintragen oder gar nur "markieren", die geschlossene Frage nicht zur "offenen". S. dazu auch den als Appendix wiedergegebenen Fragebogen und die dazugehörigen Listen. Nachteile der geschlossenen Frage sind: 1. die "Selbstentfaltung" der Befragten wird verhindert. Dieser - umgekehrt betrachtet - Korteil der offenen Frage, die volle Selbstentfaltung des Befragten, kann aber auch bei ihr verschwinden, indem sie suggestiv wirkt bzw. implizite Antwortvorgaben enthält. Andererseits kann es aber auch so sein, daß ein Nachteü der offenen Frage, ihre "Multidimensionalität", bei der geschlossenen Frage nur nicht in Erscheinung tritt. Dies hängt mit den folgenden Nachteilen zusammen: 2. es besteht die Gefahr, daß sich Antwortkategorien überschneiden; 3. solche k ö n n e n für einzelne Fälle überhaupt fehlen. Insbesondere letzteres ist wohl manchem aus eigener Erfahrung "schmerzlich" geläufig. Dem kann durch zweierlei vorzubeugen versucht werden: a) sorgfältiger Test des Fragebogens (s. dazu unten, "Probebefragung") bzw., n o c h weitergehend, in einer " Vorabbefragung" offene Formulierung zur G e w i n n u n g der dann vorzugebenden Kategorien;

104

Teil II Methoden der Datengewinnung in der Marktforschung

b) "Öffnung" des Fragebogens durch eine Restkategorie "Sonstiges " (mit beliebiger Antwortmöglichkeit). Beispiel 4-21 Aus einer Untersuchung des Instituts für Demoskopie, Allensbach: Interviewer, jetzt gelbe Liste 10 bereitlegen! "Es kann ja verschiedene Gründe geben, warum man ein bestimmtes Geschäft bevorzugt. Hier ist einiges aufgeschrieben - was davon trifft bei Ihnen für dieses Geschäft zu?" (Interviewer überreicht gelbe Liste 10! Mehreres kann eingekreist werden!) /1/2/3/4/5/6/7/8/9/10 /I1/12/13/14/15/16/17/18/ "Anderes, und zwar: (S. dazu auch A 4-3).

Die Antwortkategorien dienen hier mehr nur als Gedächtnishilfe. Insofern kann man - umgekehrt - das Vorgehen auch als partielle "Schlüsselung" einer Frage, durch Eingrenzung der Variationsmöglichkeit der Antworten (Vorgabe der Antwortkategorien, die als die wichtigsten angesehen, werden bzw. derjenigen, welche die Antwortrichtung bestimmen) betrachten. Die "Restkategorie" kann dabei auch - formal vollständig "geschlossen" sein: Beispiel 4-22 Aus der EMNID-Untersuchung "Einkaufsverhalten 1985": "Auf diesem Vorlageblatt stehen verschiedene Dinge des täglichen und längerfristigen Bedarfs. Sagen Sie mir bitte, wo Sie diese Dinge überwiegend einkaufen." Die Antwortmöglichkeiten waren vorgegeben. Es handelt sich dabei zunächst um 9 Arten des Geschäfts" (vom "Laden um die Ecke/Tante Emma-Laden" bis zum "Wochenmarkt"), ferner aber auch - neben einer Art Filter: "kaufe nicht/selten ein" - eine Restkategorie: "nichts davon".

Alternativfragen sind dadurch gekennzeichnet, daß nur zwei Möglichkeiten der Beantwortung - von "weiß nicht", "unentschieden" und dergleichen abgesehen - bestehen. Die einzelnen Formen unterscheiden sich darin, wie diese Alternative formuliert ist: Die einfache Ja-Nein-Frage läßt dem Befragten nur die Antwortmöglichkeiten "ja" oder "nein". Von der dritten Möglichkeit ("weiß nicht" etc.) wird hier, wie gesagt, abgesehen. Diese Kategorie darf jedoch im konkreten Fall nicht unberücksichtigt bleiben, zumal oft nur die Beziehung der einzelnen Antworten auf die Gesamtzahl der Befragten - also

Kapitel 4 Die Befragung

105

nur die Beziehung der einzelnen Antworten auf die Gesamtzahl der Befragten - also einschließlich der "Unentschiedenen" - ein zutreffendes Bild geben kann. (Das spielt z.B. eine große Rolle bei den "Wahlprognosen"!)

Diese Form besticht durch ihre Kürze: Beipiel 4-23 "Rasieren Sie sich elektrisch?" Beispiel 4-24 "Besitzen Sie einen Pkw?" Letztere Frage ist allerdings zweckmäßigerweise indirekt zu stellen. Sie ermöglicht dann sogar eine Aufspaltung der - in diesem Falle: postiven - Antworten in mehrere Kategorien: Beispiel 4-25 Formal ist die Frage in Beisp. 4-10: "Wer besitzt in Ihrem Haushalt einen Wagen?" keine Ja-Nein-Frage, allerdings die Umformulierung: "Besitzt in Ihrem Haushalt jemand einen Wagen?", mit den gleichen Antwortmöglichkeiten. Insgesamt hätten sich so 3 Kategorien ergeben: "niemand", "ich selbst", "zusätzlich meine Frau bzw. meine Kinder (Zweitwagen)".

Die neutrale Fassung der Alternativfrage soll vermeiden, daß durch die Nennung nur einer Alternative diese bevorzugt wird; die andere Antwortmöglichkeit ist also ebenfalls aufzuführen. Dabei kann die Reibenfolge der Nennung der beiden Möglichkeiten eine Rolle spielen. (Ein Ausweg wäre ein Splitting, indem der einen Hälfte der Befragten die eine Folge, der zweiten die andere genannt wird.) Auch bereitet die Formulierung der Alternative oft gewisse Schwierigkeiten. Beispiel 4-26 Soll man fragen: "Rasieren Sie sich elektrisch oder nicht?" oder: "Rasieren Sie elektrisch, oder rasieren Sie sich nicht elektrisch?" oder schließlich: "Rasieren Sie sich elektrisch oder auf eine andere Weise?" Letzteres dürfte vielleicht vorzuziehen sein, zumal es den Anschluß weiterer Fragen unmittelbar ermöglicht. Andererseits ist es fraglich ob dadurch nicht wiederum eine Möglicheit, hier die negative, begünstigt wird.

Dabei braucht es sich durchaus nicht nur um einen (Meinungs-)Gegenstand, ein Item, zu handeln. Im folgenden Beispiel geht es um das Zutref-

106

Teil II Methoden der Datengewinnung in der Marktforschung

fen oder Nicht-Zutreffen einer ganzen Batterie von Statements (Aussagen, Behauptungen): Beispiel 4-27 Aus der EMNID-Untersuchung "Einkaufsverhalten 1985": "Ich lese Ihnen zunächst einige Sätze über das Einkaufsverhalten vor und Sie sollen mir dann bitte sagen, ob der Inhalt dieser Sätze auf Sie zutrifft oder nicht. Also z.B.: 'Ich achte beim Einkauf vor allem auf günstige Sonderangebote.' Trifft das auf Sie zu oder nicht?" Ingesamt waren 15 solcher Statements vorgegeben. (Z.B. auch - N r . 6 -: "Ich kaufe lieber in Fachgeschäften ein als in Warenhäusern, Supermärkten usw." und - N r . 8 -: "Ich kaufe sehr gern in einem Warenhaus ein, weil ich dort alles unter einem Dach bekommen kann".)

Die Dialogfrage ist insofern eine Spezialform der Alternativfrage, als dem Befragten die beiden Möglichkeiten in der Weise präsentiert werden, daß sie - rein textlich oder in Form von besonderen Vorlagekarten oder, noch anschaulicher, in Gestalt von Bildern (ähnlich der „Ballonfrage") zwei Diskussionspartnern in den Mund gelegt werden und der Befragte einem davon zustimmen soll. Beispiel 4-28 Aus einer Untersuchung des Instituts für Markt- und Verbrauchsforschung der Freien Universität Berlin (STROSCHEIN 1965, S. 113): "Zwei junge Männer unterhalten sich über Verlobungsringe. Der eine heißt Weiß, der andere Schwarz. Weiß sagt: Wenn ich mich verlobe, werde ich teure Ringe aus massivem Gold kaufen. Das ist mir der Anlaß wert. Schwarz sagt: Ich finde es vernünftiger, einfache Ringe zu nehmen. Dann ist mehr Geld für andere Anschaffungen übrig. Wem würden Sie eher zustimmen: Weiß oder Schwarz?"

Gegen die Dialogfrage in Gestalt von Symbolen (Herr Weiß/Herr Schwarz etc.) - auch Symbolfrage genannt - ist der Einwand erhoben worden, daß grundsätzlich keine zwei Symbole gleichwertig seien, also allein schon durch deren Verwendung die Bevorzugung einer bestimmten Möglichkeit vorliege. Es fragt sich allerdings, ob es überhaupt eine völlig "neutrale" Fassung geben kann (z.B.: Herr A - Herr Z?) Hier könnte wiederum nur ein Splitting, mit Vertauschen der Symbole, helfen. Die Eigenart der Mehrfach-Auswahl-Frage ("multiple-choice question") besteht darin, daß dem Befragten die Auswahl zwischen mehreren Antwortmöglichkeiten gelassen wird. Dabei mag eine unbegrenzte Zahl von Nennungen zulässig sein; der Befragte kann also im Extrem sämtliche oder auch keine der ihm vorgegebenen Möglichkeiten auswählen. (Eine

Kapitel 4 Die Befragung

107

gewisse "Begrenzung" liegt lediglich in der beschränkten Anzahl von Antwortvorgaben, entsprechend dem Wesen der geschlossenen Frage.) Die Anzahl der Nennungen kann aber auch begrenzt sein. Dies ist einerseits in unbestimmter Weise möglich, durch Begrenzung also entweder nach unten oder nach oben. Beispiel 4-29 Aus einer Untersuchung von EMNID, Bielefeld: "Was von dieser Liste könnte wohl gerade zu dieser Marke" (von der vorhergehenden Frage) "passen? Bitte lesen Sie diese Liste zunächst ganz durch, bevor Sie einen oder zwei Gesichtspunkte auswählen!"

Andererseits kann die Begrenzung in bestimmter Weise (nach oben und unten) erfolgen, die Anzahl der Nennungen also genau festgelegt sein. Beispiel 4-30 Aus einer Untersuchung von INTERMARKET, Düsseldorf: "Wenn Sie sich jetzt ein gutes Kleid " (bzw. bei Männern: "einen guten Anzug") "für den Sonntag kaufen: Nach welchen zwei dieser Gesichtspunkte suchen Sie sich dann das Kleid" (bzw. bei Männern: "den Anzug ") "am ehesten aus?" (Vorgabeliste!)

Mehrfachnennungen - mit der Konsequenz, daß Prozente auf "über 100" addieren - sind also nur bei Begrenzung auf genau 1 Antwort ausgeschlossen. Dies wird sich allerdings nicht selten aus der Natur der Sache heraus ergeben, nämlich bei sich gegenseitig ausschließenden Antwortmöglichkeiten.

4.3.1.2 Die "Skalierung" Der Begriff „Skalierung" ist umstritten bzw. wird in der - speziell psychologischen - Literatur recht unterschiedlich gebraucht. (So nennen BORG/ STAUFENBIEL 1989, S. 198ff., allein 6 „traditionelle", d.h. eher „anwendungsorientierte", Unterscheidungen und diskutieren anschließend 5 „theoretische Perspektiven".) Hier soll auf eine ausführliche Darstellung verzichtet werden. Verwiesen sei nur darauf, daß bereits früher der Begriff „Skalennivem" im Sinne von ^ießniveau", des Informationsgehaltes", mit dem Messungen erfolgen, verwendet wurde; s. dazu die Darlegungen in Kap. 2. Im folgenden geht es dagegen um die sog. Skalafrage im Rahmen des Frageinstrumentarium. Sie stellt eine Sonderform der

Teil II Methoden der Datengewinnung in der Marktforschung

108

Mehrfach-Auswahl-Frage (mit der Möglichkeit nur einer Nennung) dar und soll nicht nur das Vorhandensein eines Sachverhalts, sondern auch dessen Intensität messen. Beispiel 4-31 In Kap. 3 wurde das "Schätzen" und "Testen" am Anteil der Raucher bzw. Nichtraucher exemplifiziert (Beisp. 3-6 und -10). Dieser wäre über die einfache - allerdings, in Anbetracht der Diskussion um die Problematik des Rauchens, vielleicht zweckmäßigerweise neutral oder indirekt zu formulierende - Alternativfrage "Rauchen Sie?" zu ermitteln gewesen. Sie läßt sich aufspalten in mehrere Vorgaben, die eine Art Skala bilden: 0 Ich 1 Ich 2 Ich 3 Ich

rauche rauche rauche rauche

nicht selten bzw. gelegentlich oft sehr stark

Der im vorstehenden Beispiel zu ermittelnde Sachverhalt ist offensichtlich weitgehend objektiver Art. Allerdings enthält die Skala sehr viel subjektiven Spielraum (Selbsteinschätzung als z.B. sehr stark rauchend) und ist zudem unausgewogen. Eine "Objektivierung" - im Sinne der Einschränkung des subjektiven Spielraums ließe sich dadurch erreichen, daß nach dem mengenmäßigen Verbrauch pro Zeiteinheit (etwa in einer Woche) gefragt wird. Dies läuft dann allenfalls auf ein Problem der statistischen Gruppenbildung hinaus.

Die eigentliche Bedeutung liegt jedoch im Bereich der subjektiven Sachverhalte. So kann es sich etwa darum handeln, den Grad der Zufriedenheit mit einem bestimmten Produkt oder der Zustimmung zu einem Statement zum Ausdruck zu bringen. Beispiel 4-32 Die Frageformulierung von Beisp. 4-27 beschränkte sich im Grunde auf die beiden Kategorien "Ja, trifft zu" und "Nein, trifft nicht zu". Möglich wären jedoch auch folgende Vorgaben gewesen: o trifft voll und ganz zu o trifft zu o trifft teils zu, teils nicht o trifft eher nicht zu o trifft ganz und gar nicht zu

Kapitel 4 Die Befragung

109

Solche "subjektiven" Skalen sind im Laufe der Zeit in sehr verschiedenen (und teilweise recht umstrittenen) Ausprägungen entwickelt worden. Einige - wichtige - davon sollen im folgenden diskutiert werden. 1. Rating-Skalen (und Magnitude-Skalierung) Hierbei handelt es sich um eine £z«ordnungs-Skala (gelegentlich findet sich auch der Ausdruck "Schätzskala"): Der Befragte hat seine Position in einer Anzahl von Kategorien oder einem Kontinuum anzugeben. Die Ausgestaltung - und damit auch das "Meßniveau" - kann sehr verschieden sein. In den vorstehenden beiden Beispielen handelte es sich um rein verbale Skalen. Sie ergeben - inhaltlich bezeichnete - Kategonen. ("Itemized Category Scale".) Beispiel 4-33 (Forts, v. Beisp. 4-31) Es resultieren folgende "Rauchen-Kategorien. 0 Nichtraucher 1 schwacher Raucher 2 starker Raucher 3 sehr starker Raucher

Die Messung geschieht also auf 7Vo?m«¿/skalenniveau. (Die Zuordnung von Zahlen zu den Kategorien im vorstehenden Beispiel dient nur der Verschlüsselung.) Zugleich liegt in den Kategorien jedoch eine gewisse Reihung. Das tritt hervor bei der Messung des Grades der Zufriedenheit oder Zustimmung. Besonders klar wird es bei rein numerischen Sklalen. Eine "klassische" Form ist die - nach dem Holländer Jan Stapel so genannte - Stapel-Skala (gemäß Darst. 4-5 auf der folgenden Seite). Sie bedarf der Verankerung, z.B. mit "sehr unzufrieden" für den unteren Minuswert. Zusätzlich kann - da ohnehin "diskretisiert" und damit "geschlossen" der obere Pluswert mit z.B. "sehr zufrieden" bezeichnet werden. Die Messung geschieht hier nicht mehr auf Nominalskalen-Niveau (zumal die Kategorien gar nicht ausformuliert sind), sondern zumindest dem von Ordinalskalen. Strittig ist jedoch, ob man auch metrisches Niveau annehmen kann (was sehr viel weitergehende Auswertungen, etwa Berechnung von Mittelwerten - auch für verschiedene Gruppen, z.B.

110

Teil II Methoden der Datengewinnung in der Marktforschung

Jüngere und Ältere, Männer und Frauen - und letztlich multivariate Analysen, ermöglichen würde). Das hängt sicher auch mit der Ausgestaltung zusammen. So beinhaltet die Skala gemäß Darst. 4-6 (s. auch Darst. 4-14 im Appendix) nicht nur keinen "Nullpunkt", im Sinne von Indifferenz, sondern überhaupt keinen negativen Bereich.

• • • • • • • • • •

+5 +4

Ausgezeichnet

+3

10 9

+2 +1 -1 -2 -3 -4

Nicht so gut

-5

Darst. 4-5: Stapel-Skala

Darst. 4-6: Thermometer-Skala

Eine große Rolle spielt zweifellos auch die Anzahl der Intensitätsstufen. In der Praxis werden sehr oft 5er-Skalen (s. Beisp. 4-32 oben) und 7erSkalen (etwa beim "Semantischen Differential" - s. unten, auch Beisp. 439) verwandt. Bezüglich der zweckmäßigen Anzahl von Skalenpunkten liegt eine beträchtliche Anzahl von Untersuchungen vor. Für den angloamerikanischen Raum referieren WIDRICK/ISSELHARDT/MOSS (1983) solche, mit Empfehlung von nur 2 bis zu 20 oder 30, allerdings mit der Mehrzahl im Bereich 5 bis 9. In Auswertung einer großangelegten Methoden-Studie für den deutschen Raum konnte STADTLER (1985) feststellen, daß die "Flucht aus dem Nein-Bereich" stark deutlich wird, wenn dem Befragten - bei einer Skala - nur eine "negative" Kategorie zur Verfügung steht, jedoch bis zu 5 Skalenpunkten anhält; die Erhöhung auf 6 und 7 Punkte wird voll zur Differenzierung genutzt; bei weiterer Erhöhung auf 8 oder 9 trifft dies kaum noch zu, vielmehr entsteht wieder eine gewisse Unsicherheit und Neigung zu den Extrempositionen. Im übrigen kam Stadtler zu dem Schluß, daß es keine Rolle spielt, ob der zahlenmäßig höchste Extrempunkt inhaltlich positiv oder negativ "geladen" war; auch andere Variationen der Darbietungsform hatten offenkundig keinen Einfluß auf die - faktorenanalytisch (s. Kap. 12) gemessene - "Urteilsstruktur".

Kapitel 4 Die Befragung

111

Der Verf. hält zwar die "metrische Behandlung" einer gemischt-verbalnumenschen Skala (wie sie etwa entstehen würde, wenn man die "Zustimmungsgrade" laut Beisp. 4-32 mit Zahlen versehen und diese dem Befragten bekanntgeben würde - s. auch zur "Likert-Skala" unten) für nicht ganz unbedenklich. Einer rein numerischen Skala würde er dagegen Bedenken - wenn nicht andersgeartete Evidenz vorliegt - kaum entgegenbringen. Das gilt noch stärker für rein graphische Skalen. Beispiel 4-34 In dem bereits erwähnten, vom Verf. federführend betreuten Projekt war auch zur Gewinnung von "Proximitätsdaten", s. Kap. 12 - nach der Ähnlichkeit von (Paaren von) Benzinmarken gefragt worden, gemäß Darst. 4-7a.

(unähnlich)

(ähnlich) Esso/Shell

i

i

Shell/Jet

Darst. 4-7: a) rein graphische Skala Dem ging ein Unterweisungs-Beispiel - für Zigaretten-Marken - voraus, gemäß Darst.4-7b. Sie halten die Reyno und die Stuyvesant für ziemlich unähnlich. Ihre Markierung könnte dann etwa so aussehen: (ahnlich)

4

\ ^

I

(unähnlich)

A

Darst. 4-7: b) dto. (Unterweisungs-Beispiel)

In dieser Form wird der Unterschied zur - vor einiger Zeit stärker diskutierten (LODGE 1981; BEHRENS 1983; GRUNERT 1983; NEIBECKER 1983a/b) - Magnitude-Skalierung vergleichsweise gering. Auch hierbei erfolgt die Kennzeichnung der Reaktion auf einen Reiz, z.B. durch unterschiedlich hohe Zahlen und verschieden lange Linien, in einem Kontinuum. Allerdings ist dies im Prinzip nicht, wie oben, geschlossen, sondern offen. Andererseits wird dadurch - da ja jeder Befragte im Grunde sein "Reaktionskontinuum" indi-

112

Teil II Methoden der Datengewinnung in der Marktforschung

viduell festlegt - eine Standardisierung erforderlich. (Sie geschieht durch Definition eines Standardreizes - z.B. des ersten - und Zuordnung einer willkürlichen Zahl - z.B. 10 - zu Reaktion darauf.) Auch hier bedarf es in der Regel eines UnterweisungsBeispiels bzw. "Übungsteiles". Das Verfahren stammt aus der Psychophysik (STEVENS 1975). Dort ging es darum, sog. phychopbysische Funktionen zu gewinnen, d.h. solche, die die Beziehungen wiedergeben zwischen der Ausübung eines physikalischen Reizes ("Stimulus" = S) - z.B. Schalldruck - und dessen Wahrnehmung - in Gestalt der Lautstärke -, gemessen an der Reaktion ("Response" R), etwa in Gestalt unterschiedlich hoher Zahlen oder verschieden langer Linien. Diese Messungen erwiesen sich als recht stabil und führten zum sog. Potenzgesetz: R - aS 8 (mit a als einer Proportionalitätskonstante und ß dem "stimulusspezifischen Exponenten"). Damit waren für eine ganze Reihe solcher Stimuli die Koeffizienten bekannt. Somit konnte eine direkte, "kreuzweise" Validierung erfolgen (indem z.B. ein Reiz als Laut dargeboten wurde und seine Wahrnehmung durch die Auskunftsperson als "Helligkeit" - etwa einer einstellbaren Lampe darzustellen war). Durch dieses "Cross Modality Matching" (CMM) ergab sich so letztlich eine Reihe weiterer, validierter "Modalitäten" zur Magnitude-Messung. Für sozialwissenschaftliche Stimuli - wie die Zustimmung zu Statements oder Produkten - sind die "wahren" Exponenten natürlich nicht bekannt (nicht eimal die Existenz der Potenzfunktion als solcher). Verwendet man jedoch zwei Modalitäten gleichzeitig, deren "wahre" Exponenten ß; aus der Psychophysik bekannt sind, so kann man den daraus ableitbaren "theoretischen Koeffizienten" ß)/ß2 dem "empirischen Koeffizienten" b= bi/b2 - mitunter wird auch dieser bereits als "Exponent" bzeichnet - gegenüberstellen und damit zumindest die Konsistenz der Messung überprüfen ("Indirect Cross Modality Matching" - ICMM). Beispiel 4-35 GRUNERT (1983) berichtet von einer Untersuchung, bei der insgesamt 59 Personen 12 Statements vorgelegt wurden mit der Bitte, einen "Intensitätsgrad" magnitudeskaliert, mit Linien und Zahlen, auszudrücken. Nach Aggregierung, durch "Standardisierung" und anschließender Berechnung des - hier in der Regel: geometrischen - Mittelwertes, ergaben sich für die beiden Modalitäten je 12 Werte. Damit konnte der Regressionskoeffizient b ermittelt werden. Da die aus Psychophysik bekannten "wahren" Exponenten sowohl für Linien als auch Zahlen 1 betragen, war diese Zahl damit auch der zu erwartende "theoretische Koeffizient". Die Abweichung von b gegenüber 1 (als ß) läßt sich auch auf Signifikanz testen. Interessant sind natürlich die Beziehungen zwischen den Ergebnissen von Magnitudeund Ä*fegonen-Skalierung. NEIBECKER (1983a/b) hat diese, in Gestalt des Korrelationskoeffizienten (und für 2 unterschiedliche - und nichtlineare - "Anpassungsmodelle"), berechnet. In allen Fällen - mit verschiedenen Modalitäten bei der MagnitudeMessung - ergaben sich dabei hohe Koeffizienten. Sie beruhen allerdings, wie gesagt, auf einem nichtlinearen Anpassungsmodell: der Ansicht der Psychophysiker, "daß Ratingskalen nicht über den gesamten Meßbereich Intervallniveau messen und die Endpunktintervalle gedehnt bzw. gestaucht werden" (NEIBECKER 1983a, S. 228). Die-

Kapitel 4 Die Befragung

113

se - ungleichmäßige - Stauchung konnte auch GRUNERT (1983), durch Eintragung der 12 Mittelwerte für die Kategorien-Skala auf der einen und der Magnitude-Skala auf der anderen Achse, zeigen. Allerdings wurden dabei diskrete Rating-Skalen - einmal 5, zum anderen llstufig - verwandt. (Bei Neibecker ist die Art der Rating-Skalen nicht ersichtlich.) Offen bleibt damit die Beziehung zur graphischen Rating-Skala, in der oben dargestellten Form, und damit letztlich die Bedeutung der Magnitude-Skalierung für die Praxis:

Vorteile der Magnitude-Messung sind: 1. Die Ergebnisse können am ehesten als metrisch skaliert interpretiert und entsprechenden Prozeduren (insbesondere auch der multivariaten Datenanalyse) unterworfen werden. 2. Die Validität der Skalierung läß sich prüfen. Als Nachteile müssen angesehen werden: 1. Die Anwendung von Modalitäten wie Helligkeit, Lautstärke usw. erfordert Geräte, kann also vielfach nur in Studios durchgeführt werden und wirft damit Repräsentanzprobleme auf. 2. Die Modalitäten "Zahl" und "Linie" können zwar auch in umfangmäßig großen Befragungen angewandt werden. Da ihr psychophysikalischer Exponent aber 1 beträgt, spricht insofern nichts gegen ihre Verwendung in entsprechenden Rating-Skalen. Insbesondere gegen die graphische Rating-Skala lassen sich nicht leicht Argumente vorbringen. 3. Einer der gegen die graphische Rating-Skala möglichen Einwände ist die Erhöhung des Befragungsaufwandes (durch die Einfügung von Unterweisungs-Beispielen); dies trifft aber für die Magnitude-Skalierung generell in noch weit höherem Maße zu. Insgesamt muß deshalb die Frage des Praxis-Einsatzes der MagnitudeSkalierung - zumindest in größerem Umfange - offen bleiben. Selbst dem gegenüber der graphischen Rating-Skala theoretisch bestehenden Vorteil, daß bei dieser das "Reaktionskontinuum" geschlossen, bei der MagnitudeSkalierung aber offen ist, sind praktische Grenzen gesetzt, durch das bei der Befragung mittels schriftlichen Fragebogens gegebenen Begrenzung durch das Papierformat. Bei der telefonischen Befragung sind beide ohnehin kaum anwendbar. Bei letzteren ist allerdings selbst die Verwendung einer einfachen Rating-Skala nicht ohne weiteres möglich: Es bedarf einer Aufspaltung (man spricht auch von Unfolding Tactic).

114

Teil II Methoden der Datengewinnung in der Marktforschung

Beispiel 4-36 (nach A N D E R S O.J. - unter Bezugnahme auf: B. Kubn/C. Charbonnier: Some Aspects of Quantitative Telephone Surveys ... [1978]) Im mündlichen Interview ist die Abfrage der Einordnung des Produktes X in die Polarität "modern/altmodisch" durch Vorlage einer Liste mit den Kategorien: "sehr stark (modern) - stark - etwas - weder noch - etwas (altmodisch) - stark - sehr stark" möglich (bei der schriftlichen Befragung durch entsprechende Gestaltung des Fragebogens). Die Abfrage im telefonischen Interview erfordert eine Aufspaltung in zwei Fragen: 1. "Halten Sie das Produkt X für eher modern oder eher altmodisch?" (mit den Antwortkategorien: "eher modern" - "weder noch" - "eher altmodisch") 2. bei der Antwort "eher altmodisch" - bei "eher modern" analog -: „Finden Sie es ausgesprochen altmodisch, ziemlich altmodisch oder nur etwas altmodisch?"

2. Ranking (und Paarvergleich) Ranking setzt das Vorhandensein mehrerer Stimuli voraus; diese werden nach ihrer "Dominanz" - häufig: Präferenz - angeordnet, in eine Rangordnung gebracht: Beispiel 4-37 In dem bereits mehrfach erwähnten, vom Verf. federführend betreuten Projekt wurden die Befragten (Nr. 35 des Fragebogens) gebeten, 14 Automodelle in eine Rangordnung zu bringen: "... nennen Sie an 1. Stelle das Modell, das Sie am meisten bevorzugen, danach das in Ihren Augen zweitbeste usw., bis zuletzt das Modell steht, dem Sie am wenigsten zuneigen." Es sei darauf hingewiesen, daß der Vergleich mehrerer Objekte auch durch Rating möglich ist. ("Comparative Rating Scale".) Es muß sich dabei auch nicht zwangsläufig um Präferenzen handeln; auch "Ahnlichkeitsratings" sind möglich. Hinwiederum lassen sich solche Ahnlichkeitsdaten auch durch Ranking ermitteln (indem einer der Stimuli als "anchor point", als Referenzreiz dient, nach dem die anderen in abnehmender Ähnlichkeit zu ordnen sind).

Die durch Ranking entstandene Rangordnung ist naturgemäß ordinal skaliert. Durch Mittelung - etwa über die Personen - entstandene "Durchschnittsränge" sind im Grunde allenfalls formal "metrisch". Dagegen erlaubt der Paarvergleich bei entsprechender Ausgestaltung die "echte" Transformation in eine Intervallskala. (Vgl. zu Thurstone's "Law of Comparative Judgement" z.B. K A A S 1980.)

Kapitel 4 Die Befragung

115

3. Konstantsummenskala Auch die „Constant Sum Scale" setzt das Vorhandensein mehrerer Stimuli voraus. Jedoch wird ein weiterer Schritt zur Metrisierung (s. auch zum Konzept der "Dollar-Metrik" unter 13.1) dadurch getan, daß auf die einzelnen Produkte, Marken usw. ein bestimmter Geldbetrag oder eine gegebene Anzahl von Punkten zu verteilen ist. Bei einer großen Anzahl von Stimuli sind die Befragten allerdings schnell überfordert. Die "Fractionation Scale" verfolgt das gleiche Ziel auf etwas anderem Wege: Für einen Referenzreiz wird eine bestimmte Anzahl von Punkten vorgegeben; die - in der Summe freie - Zahl von Punkten für die anderen Stimuli soll sich daran ausrichten. (Damit ähnelt diese Form eher der Magnitude-Skalierung; s. oben.) Beispiel 4-38 Die Frage nach der Präferenz für Automobile (Beisp. 37) hätte in die Form der fractionation scale etwa dadurch gebracht werden können, daß der VW 1200 als Standardreiz mit 100 Punkten versehen worden wäre. (S. dazu A 4-4a.) Für die Konstantsummenskala können. (S. dazu A 4-4b.)

hätte man eben diese 100 Punkte insgesamt vergeben

4. Likert-Skala Die Likert-Skala wird vielfach erst (wie auch z.B. die hier nicht behandelte "Guttman-Skalierung"; die Bezeichnung erfolgte in beiden Fällen nach ihren - amerikanischen - „Erfindern") zu den "eigentlichen", "echten" Skalierungstechniken gerechnet, weil hinter ihr eine Art Meßmodell steht: Es wird eine ganze Fülle von Indikatoren für zu messende Variable gesucht, dann die Messung durchgeführt und daraus ein Gesamtwert berechnet. Es kommt also zu den bereits oben (s. auch Beisp. 27) erwähnten "Statement-Batterien": Für die einzelnen Items hat der Befragte den Grad seiner Zustimmung anzugeben. Dazu wird meist eine 5stufige RatingSkala verwandt: "starke Zustimmung" = +2, (mäßige) "Zustimmung" = +1; "unentschieden" = 0; (mäßige) "Ablehnung" = -1; "starke Ablehnung" = -2. (Zur Formulierung der Kategorien s. Beisp. 32.) Diese Ratings werden dann, über die verschiedenen Statements, summiert.

116

Teil II Methoden der Datengewinnung in der Marktforschung

5. Semantisches Differential Das Semantische Differential (Polaritätsprofil nach Hofstätter) besteht in seiner Grundform darin, daß die Befragten für eine ganze Serie von Gegensatzpaaren (Polaritäten) - zumeist jeweils auf einer 7stufigen Ratingskala - anzugeben haben, wie sie einen Meinungsgegenstand, z.B. ein Produkt, einordnen. Das Verfahren wurde ausführlich dargestellt in O S G O O D / S U C I / T A N N E N B A U M (1957 - Neudruck 1967), nach einem Aufsatz von O S G O O D 1952. H O F S T Ä T T E R führte es unter der Bezeichnung "PolaritätsprofiP in die deutsche Literatur ein und nahm eigene Untersuchungen dazu vor (1955 und - mit L Ü B B E R T - 1958). Im Aufbau und in der äußeren Gestaltung sind die beiden Verfahren weitgehend identisch; in der psychologischen Konzeption und der Ausrichtung im Detail sind allerdings durchaus Unterschiede zu sehen. (S. dazu auch etwa schon MAGENS 1963). Beispiel 4-39 Aus einer Untersuchung über Haarpflegemittel·. 0 interessant nutzlos

langweilig nützlich

billig chemisch

teuer pflanzlich

kraftvoll kosmetisch wässerig scharf praktisch

medizinisch alkoholisch mild unpraktisch

schwer duftend

frisch duftend

einwandfrei

fragwürdig

für Männer gewöhnlich künstlich

für Frauen fein natürlich

stark riechend dezent

schwach riechend auffällig

süßlich ausländisch

herb

modern verschwenderisch

konservativ sparsam

kraftlos

deutsch

Darst. 4-SBeispiel eines (vorgegebenen) Semantischen Differentials

Kapitel 4 Die Befragung

117

Beispiel 4-40 Aus einer Untersuchung von Benzinmarken:

1

2

3

4

5

6

7

8

sicher / unsicher billig / teuer modisch / zeitlos umweltfreundlich / -feindlich aggressiv / friedlich fortschrittlich / rückständig fremd / heimisch Die Skala bedeutet (Bsp.): 1 2 3 4 S 6 7 8

extrem sieber sehr etwas kaum (sicher) kaum (unsicher) etwas sehr extrem unsicher

Legende: ESSO JET ARAL FANAL SHELL

Darsi. 4-9: Beispiel eines (graphisch ausgewerteten) Polaritätsprofils Die Beispiele lassen schon die meisten der nunmehr noch zu erörternden Probleme erkennen: 1. Es entstehen alle auch bei den einfachen Rating-Skalen auftauchenden Fragen, etwa - gerade oder ungerade Zahl von Stufen - Anzahl der Stufen - Gestaltung der Stufen 2. uni- oder bipolare Skalen? Das Semantische Differential ist üblicherweise (bei Hofstätter im Grunde schon in der Bezeichnung) ¿¿polar definiert. Begründet wird dies, wenn überhaupt, letztlich damit, daß die "doppelte Verankerung" die Skala in-

118

Teil II Methoden der Datengewinnung in der Marktforschung

haltlich besser bestimmt. TROMMSDORFF ( 1 9 7 5 , S. 89) weist demgegenüber darauf hin, daß die Fehlergrenzen dadurch auch vergrößert werden können, da neben den Befragten, die tatsächlich ihre "Position" durch den Bedeutungsvergleich finden, zwei andere Gruppen existieren, die jeweils den einen Pol nur als formalen Gegenpol des anderen ansehen, inhaltlich also von letzterem beeinflußt wurden. Semantische Differentiale mit unidimensionalen Skalen finden sich allerdings in der Praxis eher selten. Auch die Drehung der Pole (so daß "positive" Eigenschaften - sofern man überhaupt eine solche Bewertung vornehmen kann - nicht immer nur z.B. links stehen, sondern sich abwechseln mit "negativen") ist großenteils konventionell. Eine Begründung kann allenfalls darin gesehen werden, daß so eben ein - oft deutlich hervortretendes - "Polaritätspro/z/" entsteht; ferner wird durch das Alternieren einer Antwortverzerrung, in Richtung etwa der Bevorzugung der "positiven" Pole, entgegengewirkt. 3. Sehr große Bedeutung kommt zweifellos der Auswahl der aufzunehmenden Polaritäten zu ("Item-Selektion"). Es geht ja nicht nur darum, welche inhaltlichen Bedeutungspaare aufzunehmen sind, sondern auch, wie diese formuliert werden sollen. Beispiel 4-41 1. Im vorstehenden Beispiel (der Benzinmarken) ist auch erwogen worden, statt der Polarirät "modisch/zeitlos" lieber "modern/altmodisch" zu wählen. Offensichtlich handelt es sich dabei aber nicht um das Gleiche; außerdem werden hier - was vermieden werden sollte - mehr deskriptive durch stärker evaluierende Begriffe ersetzt. 2. Anstatt "fremd/heimisch" war die Polarität "inländisch/ausländisch" in der Diskussion. Ist dies dasselbe? Und auch "inländische Marke/ausländische Marke"?

Hierzu gehört auch das Problem der "Wortform". Beispiel 4-42 TROMMSDORFF (1975) schlägt, gestützt auch auf eine empirische Untersuchung, ergänzend zur üblichen adjektivistischen Form andere Möglichkeiten vor. Zum Beispiel könne statt "würziger Geruch" auch "Würzigkeit des Geruchs" oder "riecht würzig" formuliert werden (S. 125).

Kapitel 4 Die Befragung

119

4.3.2 Andere Einteilungen Nach der Verwendung von Vorlagen kann man die Fragen gemäß Darst. 4-10 einteilen.

Fragen (nach der Verwendung von Vorlagen)

Vortragsfragen

Textvorlagen

Vorlagenfragen

Bildvorlagen

Originalvorlagen

Darst. 4-10: Einteilung der Fragen nach der Verwendung von Vorlagen Die Vorlagenfragen, die zunehmend an Bedeutung gewonnen haben, unterscheiden sich von den Vortragsfragen dadurch, daß neben den Vortrag oder an dessen Stelle die Vorlage von Material in irgendeiner Form tritt. Der Zweck kann ein unterschiedlicher sein. So wird es sich oft um Gedächtnishilfen handeln. (Andererseits ist es denkbar, daß es gerade auf den spontanen Effekt ankommt, etwa auf die Assoziation, und deshalb bewußt auf die Vorlage von Erinnerungssiitzen verzichtet wird.) Der Zweck der Vorlage kann aber auch die Veranschaulichung sein, so z.B. bei der oben erwähnten Dialogfrage, insbesondere in Form der "Ballonfrage". In Darst. 4-10 ist weiter nach der A rt der Vorlagen unterschieden: 1. Textvorlagen Hierzu würden z.B. Listen (oder stattdessen Kartensätze) zählen, ferner die Dialogfrage, sofern sie rein textlich auf zwei Karten formuliert ist. 2. Bildvorlagen In Gestalt der "Ballonfrage" wäre die Dialogfrage hierzu zu rechnen. Es kann sich dabei aber auch um Vorlage von Abbildungen der Untersuchungsgegenstände (etwa der Zigarettenmarke "Würzig") handeln.

120

Teil II Methoden der Datengewinnung in der Marktforschung

3. Orginalvorlagen Originalvorlagen sind z.B. in der Leserschaftsforschung (Vorlage von Originalnummern von Zeitschriften) üblich oder bei gewissen Formen von Produkttests (z.B. Geruchs- oder Geschmackstests) sogar notwendig. Nach dem Zweck der Fragen ist die Einteilung gemäß Darst. 4-11 möglich.

Fragen (nach dem Zweck)

Ergebnisfragen

instrumen teile Fragen

analytische Fragen (Korrelationsfragen usw.)

Ablaufordnungsfragen (Filter- u. Gabelungsfragen)

Darst. 4-11: Einteilung

Psychologischfunktionelle Fragen (Kontaktfragen usw.) der Fragen nach dem Zweck

Die instrumentellen Fragen haben - im Gegensatz zu den Ergebnisfragen - primär keinen sachlichen Gegenstand, vielmehr beruhen sie in erster Linie auf methodischen Erwägungen. Das schließt allerdings nicht aus, daß bei sich bietender Gelegenheit damit die Erfragung bestimmter Sachverhalte gekoppelt wird. Zur ersten Untergruppe, den analytischen Fragen, sind zunächst Korrelationsfragen zu rechnen; sie dienen "der Herausarbeitung funktionaler Beziehungen durch Kreuztabulierung der gegebenen Antworten mit Antworten auf andere Fragen" (BEHRENS 1966, S. 99f.; er verwendet allerdings allein für diese Art die Bezeichnung "analytische Fragen"). Aufgabe der Fälscher- und der Kontrollfragen - als weiteren Arten - ist die Kontrolle bzw. Aufdeckung von falschen Angaben (einerseits der Interviewer selbst, andererseits auch der Befragten).

Kapitel 4 Die Befragung

121

Zu den Ablaufordnungsfragen gehören die Filter- und die Gabelungsfragen, die die Aufgabe haben, den Kreis der Befragten einzuschränken auf diejenigen, die Gegenstand der Untersuchung sind. Der Unterschied zwischen diesen beiden Fragetypen ist gering; von "Filterfragen" spricht man dann, wenn die Nicht-Betroffenen ausgeschieden werden, während man den Ausdruck "Gabelungsfrage" verwendet, wenn auch die so gebildete zweite Gruppe weiter - aber mit anderen Fragen - interviewt wird. Das ist meist der Fall, zumal viele Befragungen heute Omnisbusbefragungen sind. Selbst bei reinen Filterfragen wird dann einfach "ausgekoppelt", d.h. dieses Untersuchungsthema übersprungen und erst beim nächsten weitergefragt. Beispiel 4-43 Die oben erwähnte Frage nach dem Auto-Besitz erfüllt auch die Funktion einer Filterfrage, da, wenn z.B. nur Autobesitzer befragt werden sollen, nur diejenigen in Betracht kommen, die mit "Ich selbst" oder "Zusätzlich meine Frau bzw. meine Kinder (Zweitwagen)" geantwortet haben.

Zur dritten Untergruppe, den "psychologisch-funktionellen Fragetypen" ( N O E L L E - [ N E U M A N N ] 1 9 6 3 ) , zählen erstens die Kontaktfragen, auch "Eisbrecher·"- (oder "warm up"-)Fragen genannt. Beispiel 4-44 (Quelle: NOELLE-NEUMANN/PETERSEN 1996, S. 134) „Es gibt ja Menschen, die morgens munter sind, andere kommen erst abends richtig in Schwung. Wie ist das bei Ihnen?"

Weiterhin gehören zu dieser Gruppe die Ablenkungs- oder " Puffer" Fragen (die von dem Zusammenhang zwischen zwei Themen oder Fragen ablenken sollen - zur Vermeidung des "Halo-Effekts") sowie die Lehrund Trainings- oder Unterweisungsfragen (s. als Exempel dafür in Beisp. 434). Die große Gruppe der Ergebnisfragen, der eigentlich "sachdienlichen" Fragen, wurde im Grunde bereits bei der Einteilung der Fragen nach der Antwortmöglichkeit besprochen. Einen Fragetyp besonderer Art stellt die Tendenzfrage dar; s. dazu in Kap. 6.

122

Teil II Methoden der Datengewinnung in der Marktforschung

4.3.3 Die Entwicklung des Fragebogens Die Entwicklung des Fragebogens ist zweifellos eine der wichtigsten Phasen in der Vorbereitung der Befragung. Dabei sind insbesondere folgende Punkte von Bedeutung: 1. Die Formulierung der Fragen. Der Wortlaut der Fragen spielt eine wesentliche Rolle. Es ist dies ein Problem der Befragungstaktik und des richtigen Einsatzes des Frageinstrumentariums. Quasi zusammenfassend zu dem oben Gesagten lassen sich folgende Grundsätze der Frageformulierung aufstellen: a) Die Fragen müssen einfach gehalten und leicht verständlich sein. b) Die Fragen müssen eindeutig und präzise sein. c) Die Fragen dürfen nicht suggestiv wirken. d) Die Fragen dürfen nicht zu falschen Antworten aus Prestigegesichtspunkten etc. verleiten. 2. Die Reihenfolge der Fragen. Daß die Anordnung der Fragen von großer Bedeutung ist, wurde oben bereits dargelegt. Grundsätzlich soll die Reihenfolge so gewählt werden, daß nicht eine vorhergehende Frage eine darauffolgende in irgendeiner Weise beeinflußt. Darüber hinaus sind die verschiedenen Fragetypen so einzusetzen, daß der Ablauf des Interviews nicht als langweilig und ermüdend, sondern als anregend und spannend empfunden wird: "Der Fragebogen bestimmt die Dramaturgie des Interviews," (NOELLE-NEUMANN/ PETERSEN 1 9 9 6 , S . 1 2 0 . )

3. Der Umfang des Fragebogens. Diese durch den Fragebogen bestimmte "Dramaturgie" beeinflußt ganz wesentlich die mögliche Länge des Interviews und damit den Umfang des Fragebogens. NOELLE-NEUMANN/PETERSEN (1996, S. 126) meinen geradezu, daß die Dauer des Interviews nicht nach mechanischem, sondern psychologischem Zeitmaß zu messen sei. Beispiel 4-45 JOHANNSEN (1968, Bd. 2, S. 277) berichtet von einer Untersuchung, bei der im Anschluß an das Interview die Versuchsperson gefragt wurde, wie lange ihrer Meinung nach "die Unterhaltung" gedauert habe. Die kürzeste Zeitangabe betrug 30 Minuten (die längste 2 Stunden; der Mittelwert lag bei 1 Stunde, 18 Minuten). Demgegenüber erbrachte die Feststellung der tatsächlich vergangenen Zeit eine Mindest-Dauer von 1 Stunde, 10 Minuten (bei einem Mittelwert von 1:38).

Kapitel 4 Die Befragung

123

Damit werden Interviews mit einer Dauer von 1 Stunde und länger möglich. Die Erfahrungen vieler Institute und der Umfang der von ihnen entwickelten Fragebogen bestätigen, daß mündliche Interviews von solcher Länge durchaus üblich sind. Bei der schriftlichen Umfrage dagegen dürften allzu umfängliche Fragebogen eher abschreckend wirken; andererseits kann hier der Befragte quasi "nach Belieben" - und auch "stückweise" - Zeit zur Verfügung stellen. LAVRAKAS (1993, S. 6) sieht in der begrenzten Länge einen der Nachteile des telefonischen Interviews und meint, daß es "tiresome" sei, im Schnitt jemanden länger als 20 bis 30 Minuten am Telefon zu halten. 4. Die "Probebefragung". Die "Probebefragung" - die nicht zu verwechseln ist mit der in Kap. 2 erwähnten Voruntersuchung, der "Leitstudie" (obwohl ja auch in deren Rahmen einzelne Interviews stattfinden können) - dient der Kontrolle der Brauchbarkeit des Fragebogens. Sie ist ein "Test" auf dessen Verwendbarkeit (und wird deshalb oft auch als Pretest - des Fragebogens - bezeichnet). Diesen Test sollten u.a. besonders befähigte Interviewer vornehmen, die bei von ihnen leichter zu beobachtenden etwaigen Mängeln - auch entsprechende Abänderungsvorschläge machen können. Oft schließt sich eine (Probe-)Auswertung an, da auch diese Mängel in der Frageformulierung und/oder Codierung aufzudecken hilft. U.U. folgen weitere "Probebefragungen" .

4.4 Die "Stichprobe" In der Einleitung zu Kap. 3 wurde bereits angedeutet, daß eine Volle.rhebung, also die Erfassung der Gesamt-Masse, der Grundgesamtheit (gelegentlich, dem amerikanischen Sprachgebrauch folgend, auch Universum oder Population) nur in den seltensten Fällen erfolgen kann. Aus Zeitund insbesondere Kostengründen ist in der Regel eine 7e¿/erhebung, eine Beschränkung auf einen Teil aller in Betracht kommenden Personen eben eine " Stichprobe" oder ein "Sample" - erforderlich. Gleichwohl sollen die Ergebnisse "repräsentativ" sein. Das kann im Prinzip auf zwei Wegen erreicht werden: einmal dadurch, daß man bewußt versucht, diesen "repräsentativen Querschnitt" herzustellen, zum anderen mittels

124

Teil II Methoden der Datengewinnung in der Marktforschung

einer Steuerung durch den "Zufall". Die hiermit verbundenen Probleme und Überlegungen werden im folgenden erörtert.

4.4.1 Die Arten der Auswahl der Befragten 4.4.1.1 Auswahlverfahren und -techniken im Überblick Darst. 4.12 gibt eine Übersicht über die verschiedenen Auswahlverfahren und -techniken. Auswahlverfahren (und Auswahltechniken)

Nicht-Zufallsverfahren (nonprobability sampling)

Zufallsverfahren (probability sampling "Wahischeinlichkeitsstichp roben")

besondere Formen 1. Schneeballverfahren 2. Random Route 3. ADM-Master-Sample

Sonderformen

Normalfoim: uneingeschränkte Zufallsauswahl (und Auswahltechniken)

Auslosen oder Aus würfeln

Zufalls- systeSchlufizahlen- matische Zifferntafeln Auswahl verfahren

Auswahl Auswahl Auswahl mit mit mit Schich- ungleichen Anordtung Wahrnung scheinlichkeiten

willkürliche Auswahl (Auswahl aufs Geratewohl)

bewußte Auswahl

Buchstabenaus wähl, Geburtstagsverfahren

Klumpenmehrmehrverfahren stufiges phasiges und Verfahren Verfahren Flächenι 1 auswahl ' ' typische Quoten- AbschneideAuswahl Auswahl verfahren

Darst. 4-12: Auswahlverfahren (und Auswahltechniken) Die erste Gruppe - die „Wahrscheinlichkeitsstichproben" (manchmal wird, in einem strengen Sinne, auch nur in diesem Falle von "echten"

Kapitel 4

Die Befragung

125

Stichproben gesprochen) - ist dadurch gekennzeichnt, daß jedes Element der Grundgesamtheit eine angebbare (von Null verschiedene) Chance hat, in die Auswahl zu gelangen. Die entsprechenden Techniken und Verfahren werden im nächsten Unterabschnitt - zwar nur recht kurz, aber doch allesamt - erörtert. Dies gilt auch, im letzten Unterabschnitt, für die „besonderen Formen". Hinsichtlich des "nonprobability sampling" wird jedoch nur das Quotenverfahren in einem eigenen Unterabschnitt diskutiert. Auf die anderen Formen muß deshalb hier noch kurz eingegangen werden: Die "willkürliche Auswahl", die "Auswahl aufs Geratewohl", der "Griff hinein ins volle Menschenleben", verkörpert in der Regel durchaus nicht eine Zufallsauswahl und ist deshalb grundsätzlich abzulehnen. (Es sei denn, es lägen besondere Verhältnisse vor - daß also z.B. gerade ermittelt werden soll, welche Personen mit welchen Charakteristika auf einer Hauptstraße zu einer bestimmten Zeit verkehren.) Beispiel 4-46 Es würde sicher zu verzerrten Ergebnissen führen, wenn bei einer allgemeinen Bevölkerungsumfrage ein Interviewer sich etwa am Hauptbahnhof postierte und vielleicht jede zehnte vorübergehende Person befragte, da - ganz abgesehen davon, daß die Antwortquote relativ gering sein dürfte, weil manche Leute es eilig haben und die Antwort verweigern werden - Personen, die den Bahnhof besuchen, also zum großen Teil Reisende, eben nicht einen repräsentativen Ausschnitt aus der Bevölkerung dieses Ortes bilden. Beispiel 4-47 "Jemand stellt sich an einem Montag von 11 bis 12 Uhr vor den Haupteingang der Universität München und befragt 400 Studenten, ob sie ihr Studium ganz oder teilweise selbst finanzieren müssen. Offenbar bekommt er dann keinen echten Ausschnitt aus der Gesamtheit, denn Werkstudenten sind um diese Tageszeit sicher schwächer vertreten. Außerdem kommen überwiegend Studenten in die Auswahl, die um diese Zeit Vorlesung haben, also vielleicht überproportional viele Betriebswirte; bei diesen können aber die Verhältnisse anders liegen als bei den übrigen Studenten." (KELLERER 1960, S. 155.)

Man spricht in diesem Zusammenhang auch von convenience samples („sometimes called accidental samples" - CHURCHILL 1 9 8 8 , 3 9 6 ) . Hierzu kann auch das sog. self-selected sample, die "sich selbst wählende Stichprobe" - wie sie etwa entsteht, wenn ein "Befragungs-Computer" (s. dazu oben, unter 4 . 1 . 2 ) in einem Kaufhaus oder in einer Ausstellung postiert würde - gezählt werden.

126

Teil II Methoden der Datengewinnung in der Marktforschung

Weniger klar ist dagegen der Begriff des judgemental samples, der "Beurteilungsstichprobe". Während diese im deutschen Schrifttum manchmal (vgl. etwa LEINER 1 9 9 4 ) mit der ganzen Gruppe der "Nicht-Zufallsstichproben" gleichgesetzt wird, spricht die amerikanische Literatur in diesem Zusammenhang meist von "expert choice". In diesem Sinne wäre die Bezeichnung am ehesten der ersten Untergruppe der bewußten Auswahl, dem "purposive sampling" gemäß obigem Schema, d.h. der typischen Auswahl, zuzuordnen. Dieser Form, der Auswahl der für "typisch" gehaltenen Elemente der Gesamtheit, ist mit äußerster Skepsis zu begegnen, wegen der notwendigerweise irgendwie subjektiven Entscheidung darüber, was "das Typische" ist. Dieses Verfahren spielt in der Praxis der Umfrageforschung im allgemeinen aber offensichtlich keine größere Rolle. (Als spezieller Fall kann die Auswahl von „Testmärkten" - s. dazu in Kap. 15 angesehen werden.) Das gilt nicht im gleichen Maße für das - insbesondere im Rahmen der Investitionsgütermarktforschung (s. 17.1) doch vergleichsweise oft angewandte - "Abschneideverfahren" ("Cut off-Verfahren" oder auch Konzentrationsprinzip). Es besteht in der Konzentration auf die für wesentlich gehaltenen - oder überhaupt identifizierbaren - Teile der Grundgesamtheit, also, umgekehrt ausgedrückt, dem "Abschneiden" der als weniger relevant erachteten oder schwer auszumachenden. Insofern kann es jedoch auch als gar kein spezielles Auswahlverfahren, sondern lediglich eine entsprechende Definition der Grundgesamtheit gedeutet werden. In dem Falle, daß die Größenordnung der weggelassenen Gruppe bekannt ist, vermag man sogar ungefähre Vorstellungen über den möglichen Fehler zu entwickeln. In gewisser Weise kann das Verfahren insoweit sogar als besondere Variante einer "geschichteten Stichprobe" (s. dazu unten) - der Auswahlsatz in einer bestimmten Schicht beträgt 0 - betrachtet werden.

4.4.1.2 Die Zufallsauswahl Wie bereits aus Darst. 4-12 ersichtlich, erfolgt die Bildung einer - uneingeschränkten oder mit gewissen Einschränkungen - "zufallsgesteuerten Stichprobe" mittels verschiedener Auswahltechniken:

Kapitel 4

Die Befragung

127

1. Das Auslosen (und "Auswürfeln") orientiert sich am stärksten am theoretischen "Urnenmodell": Die Urne (oder, wie beim Lotto: Trommel) enthält gut durchgemischte Kugeln o.ä.; ihr werden "per Zufall", also ohne irgendeinen subjektiven Einfluß, einzelne Elemente entnommen. Wegen des damit verbundenen Aufwandes scheidet das Verfahren für die Praxis der Marktforschung fast völlig aus. Das gilt im Grunde - zumindest bei großen Gesamtheiten - auch für das Auswürfeln. Zusätzlich muß hierbei noch auf die Auswahlchancen der (durchnumerierten) Elemente geachtet werden. Sie sind bei Verwendung normaler Würfel durchaus unterschiedlich (s. dazu A 4-8), so daß besondere Konstruktionen ("Dezimalwürfel" - mit 10 Seiten - oder auch die "AWF-Zufallswürfel" - AWF: Arbeitsgemeinschaft für Wirtschaftliche Fertigung e.V., Eschborn) entwickelt wurden.

2. Zufallszahlentafeln sind gewissermaßen "Urnen auf Vorrat"; sie enthalten eine - oft große - Anzahl von rein zufällig, theoretisch also durch Auslosen bzw. -würfeln, entstandenen Ziffernfolgen. Praktisch handelt es sich meist allerdings nur um fteWo-Zufallszahlen, also um aus den Grundzahlen durch verschiedenartige Rechenoperationen - meist auf elektronischem Wege - hergestellte Zahlen. Während früher solche Zufallszahlentafeln als selbständige Veröffentlichungen über den Handel vertrieben oder zumindest in Tafelsammlungen etc. abgedruckt waren, enthalten heute schon bessere Taschenrechner entsprechende Algorithmen. Im hier gegebenen Zusammenhang handelt es sich im Prinzip um (keinesfalls aber etwa normalverteilte) Zufallszahlen.

gleichverteilte

Die Auswahl setzt voraus, daß die Elemente durchnumeriert sind. Es wird dann an einer - im Grundsatz wiederum "zufällig" gewählten - Stelle der Tafel begonnen und die entsprechende Anzahl von Ziffern zusammengefaßt. Beispiel 4-48 Sind 250 Karten aus einer Kartei von 1000 Karten auszuwählen, so werden jeweils 3 Ziffern zusammengenommen, also etwa 933, 848, 062 uw., bis man 250 Zahlen hat. Die Karteikarten mit den so ermittelten Nummern (also: 933, 848, 62 usw.) kommen in die Auswahl. (S. dazu auch A 4-10.)

128

Teil II Methoden der Datengewinnung in der Marktforschung

Zahlen, die über den Umfang der Grundgesamtheit hinausgehen, werden in der Praxis meist einfach weggelassen. Umfaßte im vorstehenden Beispiel die Kartei etwa nur 900 Karten, so würde die Nummer 933 unberücksichtigt gelassen und sogleich mit der nächsten begonnen.

3. Die systematische Auswahl ("systematic sampling') ist dadurch gekennzeichnet, daß entsprechend dem Auswahlsatz f bzw. dessen Kehrwert i jedes i-te Element in die Auswahl gelangt. Beispiel 4-49 Sollen von 1000 Karteikarten 250 ausgewählt werden, so bleiben jeweils 3 Karten unberücksichtigt, d.h. jede 4. Karte kommt in die Auswahl.

Um eine echte Zufallsauswahl garantieren zu können, müssen allerdings zwei Voraussetzungen erfüllt sein: (1) Es muß ein Zufallsstart erfolgen. Beispiel 4-50 Ergibt im obigen Fall ein Wurf mit einem Würfel eine 3, so werden die Karten 3, 7, 11 ... ausgewählt.

(2) Die Elemente müssen sich in einer Zufallsanordnung befinden. Im Einzelfall kann eine systematische Anordnung (z.B. nach Stadtbezirken oder Geburtsjahren) aber auch erwünscht sein; es handelt sich dann jedoch um ein besonderes Auswahlverfahren (s. unten, "Auswahl mit Anordnung").

4. Beim Schlußziffernverfahren gelangen die Elemente mit bestimmten - "per Zufall" festzulegenden - Schlußziffern in die Auswahl. Beispiel 4-51 "Wir setzen eine von 1 bis Ν durchnumerierte Gesamtheit voraus. Um aus ihr 20% aller Fälle auszuwählen, brauchen wir nur wie folgt zu verfahren: Es werden alle Elemente genommen, deren Schlußziffer beispielsweise 2 oder 9 ist, da ja jede dieser beiden Schlußziffern 2 bzw. 9 mit 10% in der Gesamtheit vertreten ist. Um 3% zu erhalten, genügt es, alle Einheiten auszuwählen, deren Ordnungsnummer etwa mit den Zahlenpaaren 21 oder 48 oder 73 endet. Ein Vorteil hierbei ist u.a., daß die Karten nicht in der Zahlenfolge 1 bis Ν vorliegen müssen." (KELLERER 1 9 6 0 , S. 1 4 6 ) .

5. Bei der Buchstabenauswahl, dem Geburtstagsverfahren usw. erfolgt die Auswahl nach Merkmalen der einzelnen Personen, die aber - das ist unbedingt vorauszusetzen - nicht irgendwie mit solchen Variablen, die

Kapitel 4 Die Befragung

129

Gegenstand der Befragung sind, zusammenhängen dürfen. Hierzu gehören im allgemeinen der Geburtstag (nicht das -jähr!), der Anfangs- oder Endbuchstabe usw. des Familiennamens etc. (S. zur praktischen Anwendung insbesondere des Geburtstags auch unten, 4.4.1.4.) Die verschiedenen Auswahlverfahren unterscheiden sich dadurch, ob und in welcher Weise eine Einschränkung des Zufalls erfolgt: 1. Die uneingeschränkte Zufallsauswahl stellt gewissermaßen die Norder auf dem Zufallsprinzip beruhenden Auswahlverfahren dar. Sie ist dadurch gekennzeichnet, daß jedes Element die gleiche - positive Chance hat, in die Stichprobe zu gelangen. maliorm

Demgegenüber sind die - aus praktischen Erwägungen, insbesondere zur Zeit- und Kostenersparnis entwickelten - Sonderiormen dadurch charakterisiert, daß in irgendeiner Weise eine Einschränkung des Zufalls erfolgt, so daß die Auswahlchancen nicht mehr notwendigerweise gleich, aber noch angebbar (von 0 verschieden) sind: 2. Von Auswahl mit ungleichen Wahrscheinlichkeiten spricht man dann, wenn die Auswahlchance von der Bedeutung - meist: Größe - abhängt. Deren Berücksichtigung kann bei der Auswahltechnik explizit geschehen oder auch nicht; sie kann ferner erwünscht sein oder nicht. Beispiel 4-52 Die Auswahl von Gemeinden proportional zur Einwohnerzahl erscheint im allgemeinen sinnvoll. Dies kann dazu führen, daß größere Gemeinden eine höhere Auswahlchance erhalten. Erfolgt hingegen eine uneingeschränkte Zufallsauswahl der Gemeinden, etwa per "systematischer Auswahl": jede 10. Gemeinde, so haben größere Gemeinden - die ja weniger oft vorkommen müssen als kleinere - eine geringere Auswahlchance. Wenn man (s. dazu auch unten, insbesondere "mehrstufige Auswahl") pro ausgewählter Gemeinde nur 1 Einwohner befragen würde, sind also Einwohner in größeren Gemeinden "unterrepräsentiert". Beispiel 4-53 Bilden Haushalte die Auswahleinheit ('"Haushaltsstichprobe") und erfolgt daraus uneingeschränkte Zufallsauswahl, so haben entsprechend - bei 1 Befragten pro Haushalt - Personen in größeren Haushalten eine geringere Auswahlchance. Würde dagegen eine - uneingeschränkte - Zufallsauswahl aus Personen geschehen ("Personenstichprobe•"), so haben alle Personen, unabhängig von der Größe des Haushalts, in dem sie leben, die gleiche Auswahlchance.

130

Teil II Methoden der Datengewinnung in der Marktforschung

Bei der "Hochrechnung" (s. dazu unten) können allerdings die ungleichen Auswahlwahrscheinlichkeiten wieder rückgängig gemacht werden; so läßt sich eine Personenstichprobe rechnerisch aus der Haushaltsstichprobe durch "Umgewichtung" herstellen.

3. Auswahl mit Schichtung ("stratification" - oder "stratified" "sampling'') besteht darin, daß die - relativ inhomogene - Gesamtmasse in - homogenere - Teilmassen zerlegt wird. Durch die Aufteilung nach bestimmten Merkmalen (z.B. Bildung von yl/imgruppen) verringert sich die Streuung und damit, selbst bei gleichem Auswahlsatz, der Zufallsfehler. Ist der Auswahlsatz für alle Schichten gleich, so spricht man von proportionaler Aufteilung. (S. dazu A 4-12.) Sie ist zweckmäßig bei ungefähr gleicher Streuung in den einzelnen Schichten (oder überhaupt fehlender Information darüber); der Vorteil liegt in der "Selbstgewichtung" bei der Hochrechnung. Die optimale Allokation ist gekennzeichnet durch Minimierung des Stichprobenfehlers - allerdings primär eher für das Merkmal, dessen Werte zur Aufteilung verwandt wird - und führt in der Regel zu verschiedenen Auswahlsätzen für die einzelnen Schichten. 4. Auswahl mit A n o r d n u n g ist dann gegeben, wenn die Elemente in bezug auf bestimmte Merkmale sortiert (angeordnet) werden und anschließend systematische Auswahl erfolgt. Die Wirkung ist ähnlich der der Schichtung. Der Vorteil (gegenüber dieser) liegt darin, daß keine getrennten Gruppen notwendig sind; andererseits können - als Nachteil - auch keine unterschiedlichen Auswahlsätze verwirklicht werden. In der Praxis kombiniert man deshalb oft Schichtung und Anordnung. 5. Klumpen- und Flächenauswahl sind nahe verwandt; letztere bildet im Grunde nur einen Sonderfall der ersteren. Die Klumpenzaswahl ("cluster sampling") ist dadurch charakterisiert, daß eine Zerlegung der Gesamtmasse in mehrere - im Prinzip: regionale - Teilmassen, eben die "Klumpen", erfolgt. Je nach Stichprobenumfang wird eine Anzahl davon per Zufall ausgewählt und jedes darin befindliche Element befragt. Beispiel 4-54 1. Haushalte als Klumpen von Personen. 2. Stimmbezirke als Klumpen von Haushalten und/oder Personen.

Das letztgenannte Exempel leitet bereits über zur Flächenauswahi ("area ampling"). Sie liegt dann vor, wenn das Gesamtgebiet in Flächen zerlegt

Kapitel 4 Die Befragung

131

wird, davon einzelne "per Zufall" ausgewählt und alle darin befindlichen Elemente befragt werden. Es bedarf in diesem Falle keiner "Auswahlgrundlage" (Erfassung der Grundgesamtheit!), sondern allenfalls Landkarten etc. Auf der anderen Seite - als Nachteil - entsteht, wie generell bei der Klumpenauswahl ein "Klumpeneffekt".

6. Das mehrstufige Verfahren ("multistage sampling") besteht aus dem Hintereinanderschalten einer Reihe von Zufallsauswahlen, wobei die Auswahleinheit jeweils wechselt. Beispiel 4-55 Eine "zweistufige Auswahl" liegt etwa dann vor, wenn in der ersten Stufe Haushalte (= "Auswahleinheiten 1. Stufe" - "primary sampling units") und in der zweiten daraus Personen (= „Auswahleinheiten 2. Stufe" - „secondary sampling units") ausgewählt werden. Der Unterschied zum Klumpenverfahren besteht im Grunde nur darin, daß bei diesem in der zweiten Stufe keine "Auswahl" mehr erfolgt, die Befragung also zu 100% vorgenommen wird. Auch für die mehrstufige Auswahl gilt eine Erleichterung in bezug auf die Auswahlgrundlage, die nur für die 1. Stufe vorhanden zu sein braucht. Nachteiligt wirkt, als Entsprechung zum "Klumpeneffekt" der Klumpenauswahl, der "Stufungseffekt": Sekundäreinheiten nicht ausgewählter Primäreinheiten haben keine Chance, in die Stichprobe zu gelangen.

7. Das mehrphasige Verfahren ("multiphase sampling') unterscheidet sich von dem mehrstufigen dadurch, daß es sich bei den einzelnen zeitlich aufeinanderfolgenden Untersuchungsabschnitten um jeweils die gleiche Auswahleinheit handelt. Es wird also in den späteren Phasen nur jeweils eine Unterstichprobe aus der vorhergehenden Stichprobe gezogen. Damit kann ein "mehrgeschossiger Erhebungsaufbau" verwirklicht werden, etwa fortschreitend von einer großen Anzahl von (relativ billigen) Grobinterviews hin zu wenigen (verhältnismäßig kostspieligen) IntensivStudien.

4.4.1.3 Die Quotenauswahl Das Quotenverfahren wird in der Praxis der Marktforschung - speziell in Deutschland, kaum dagegen in den USA - sehr oft angewandt. (Man kann

132

Teil II Methoden der Datengewinnung in der Marktforschung

die Markt- und Meinungsforschung geradezu als D o m ä n e dieser Methode, die anderswo eher eine untergeordnete Rolle spielt, bezeichnen!) Es besteht darin, daß entsprechend der - aus Volkszählungen usw. - bekannten Struktur der Grundgesamtheit " Q u o t e n " hinsichtlich einiger Merkmale (meist: Geschlecht, Alter, Beruf, Gemeindegrößenklasse) gegeben werden. Innerhalb dieser Q u o t e n hat der Interviewer völlig freie H a n d bei der Auswahl der Befragten (S. dazu A 4-13 bis -15.) Beispiel 4-56 1. In den ersten Auflagen dieses Buches war eine „Auswahl-Vorschrift" des EMNID-Institutes wiedergegeben worden; sie galt für die „Ortsgröße IV" (100 000 Einwohner und mehr) und „für 10 bis 20 Personen" (Form IVa/b). Bei Form IVa waren 4 Männer und 6 Frauen zu befragen. Hinsichtlich des Alters war folgende Quotierung vorgegeben: 1 Person 14 bis unter 21 Jahre, dto. je 1 21-25 und 25-30, je 3 30-50 und 50-65 sowie 1 ab 65 Jahre. Für die Berufe (mit näherer Definition auf der Rückseite des Formblattes) galt: 3 Arbeiter, 3 Angestellte (ohne BehördenAngestellte), je 1 Beamter oder Behörden-Angestellter und Selbstständiger sowie 2 Rentner. Das Formblatt war so aufgebaut, daß die „erledigten" Interviews „abgestrichen" werden konnten. Der Interviewer hatte durch seine Unterschrift (und unter Angabe der Interviewerausweis-Nr.) eine Bestätigung zu geben. 2. In der 4. Auflage dieses Buches (S. 94) war wiederum eine „Auswahlvorschrift" des EMNID-Institutes abgedruckt, die ein etwas anderes Aussehen hatte und noch nicht vollständig konkretisiert war. Sie galt für „Ihren Wohnort" (und damit die Ortsgröße) und für 5 Männer und Frauen. Für jede Gruppe war dann eine Aufteilung nach dem Alter (sowie nach „berufstätig" und „nicht berufstätig") vorgesehen - im Beispiel nicht konkretisiert -: 14-19, 20-29, 30-39, 40-49, 50-59 und ab 60 Jahre./ Ferner war die Aufteilung nach Berufsgruppen - im Beispiel wiederum nicht konkretisiert (und auch nicht getrennt nach Geschlecht) - vorgesehen: „Selbstständige, Freie Berufe, Landwirte", „leitende Beamte/ Angestellte", „sonstige Beamte/ Angestellte", „Facharbeiter", „sonstige Arbeiter". (Für nicht mehr Berufstätige galt die frühere Berufsgruppe.) Wiederum war, unter Angabe der Nr. des InterviewerAusweises und mit Unterschrift, zu versichern, „daß ich die Befragung den Richtlinien des EMNID-Institutes entsprechend durchgeführt habe." Das Quotenverfahren ist allerdings recht umstritten. D e r grundsätzliche E i n w a n d ist der, daß es eine F o r m der bewußten und nicht der Zufallsauswahl darstellt und infolgedessen im Grunde nicht die Anwendung der Wahrscheinlichkeitstheorie und damit die Berechnung von Genauigkeitsgrad bzw. Fehlerspanne (s. Kap. 3 bzw. unten) erlaubt. I m einzelnen werden folgenden Einwendungen vorgebracht: 1. Die Q u o t e n beziehen sich auf relativ wenige Merkmale. W o d u r c h aber wird gewährleistet, daß auch die anderen Variablen hinreichend repräsentiert sind?

Kapitel 4 Die Befragung

133

(NOELLE-NEUMANN/PETERSEN (1996, S. 261) haben demgegenüber darauf hingewiesen, daß nicht nur der Bereich, der durch die Quote gesteuert wird, sondern bei normalen Verhältnissen auch der gesamte übrige Bereich repräsentativ für die Gesamtheit sei: Ohne daß z.B. in den Quotenanweisungen etwas über Familienstand oder Konfession oder Haushaltsgröße usw. gesagt werde, stellten sich die Proportionen der amtlichen Statistik her. Unabhängig davon kann man - sofern entsprechende Angaben vorliegen - natürlich die Ubereinstimmung bezüglich nichtquotierter Merkmale überprüfen und gegebenenfalls "anpassen" (s. dazu unten, Hochrechnung). WENDT (1964, S. 18) bezweifelt allerdings, daß "selbst eine sehr weit getriebene Ubereinstimmung einzelner Kontrollmerkmale in Teil- und Grundgesamtheit" als "Grundlage zur Berechnung einer solchen Ubereinstimmung für andere Merkmale" angesehen werden kann.

2. Schwer antreffbare Personen (z.B. Ledige, kinderlose Ehepaar, Vertreter) dürften in geringerem Maße als leichter Erreichbare in die Auswahl gelangen. 3. Ahnlich wird der Interviewer eher als beim Zufallsverfahren auf eine Überredung der Person, die nicht auf Anhieb zur Auskunftserteilung bereit sind, verzichten und damit zur Unterrepräsentation der Gruppe der weniger auskunftswilligen Personen beitragen. 4. Der Interviewer wird dazu neigen, seine Interviews regional zu häufen, wodurch eine Art "Klumpeneffekt" entsteht. 5. Der Interviewer könnte hinsichtlich der Quotenmerkmale großzügig verfahren, so z.B. einen 48jährigen - woher weiß er überhaupt auf Anhieb das Alter? - in die Gruppe der 50-60jährigen nehmen, falls er dafür die Quote noch nicht erfüllt hat. 6. Der Interviewer kann versucht sein, eine subjektive Auswahl zu treffen, z.B. Leute mit größerem Sachverstand, höherer Intelligenz usw. vorzuziehen. 7. Es besteht die Gefahr, daß der Interviewer immer dieselben Personen deren Merkmale ihm ja bekannt sind - befragt. Dem kann man, in gewissen Grenzen, allerdings gegensteuern durch Vergleich der Auskunftspersonen bei verschiedenen (Quoten-)Umfragen. Andererseits gibt es eben auch den Fall, daß Interviewer für mehrere Institute gleichzeitig tätig sind.

8. Das der Quotenbildung zugrundeliegende Material kann fehlerhaft, insbesondere zeitlich überholt sein. Man denke nur daran, daß z.B. 1986 seit der letzten Volkszählung ein Zeitraum von 16 Jahren vergangen war. Der Rückgriff aber auf die Ergebnisse der Bevölkerungsfortschreibung oder des Mikrozensus ist problematisch (zumal ja deren Anpassung an bekannte Werte der Grundgesamtheit auch nicht erfolgen konnte).

9. Die Kontrolle ist normalerweise schwieriger. Aus diesem Grunde sind die Interviewer in der Regel gehalten, die Adressen der Befragten zu notieren; s. dazu auch unten.

134

Teil II Methoden der Datengewinnung in der Marktforschung

Vgl. zur Kritik am Quotenverfahren im wesentlichen KELLERER (1963, S. 194ff.) S. dazu auch den bezeichnenden Titel: "Wann wird das Quotenverfahren begraben?" von WENDT 1960 (und, wie angeführt, ders. 1964). V o n den Anhängern des Quotenverfahrens wird demgegenüber betont, daß durch geeignete Vorkehrungen einer Reihe dieser Gefahren vorgebeugt werden könne. (Vgl. etwa die bei NOELLE-NEUMANN/PETERSEN 1 9 9 6 , S. 278f. - nach Schmidtchen - wiedergegebene Liste der Anforderungen.) Insbesondere hätten verschiedene empirische Untersuchungen gezeigt, daß die Resultate durchaus zufriedenstellend sind. Ein Vergleich kann sich dabei nicht nur auf die Ubereinstimmung von Quoten-Ergebnissen mit bekannten Werten der Grundgesamtheit beziehen, sondern auch auf die zwischen Quota- und Random-Resultaten. Auch das Randomverfahren ist nämlich mit einer Reihe von Mängeln behaftet, die sich als Vorzüge des Quotenverfahrens darstellen. 1. Das Randomverfahren bringt (zumindest beim "Adressen-Random", der Vorgabe einer bestimmten Adresse) den Verlust von Anonymität mit sich. Dieses Argument kann allerdings insofern keine große Rolle spielen, als, wie bereits ausgeführt, in der Praxis aus Kontrollgründen in der Regel von den Interviewern die Angabe der Adresse der Befragten verlangt wird. 2. Das Quotenverfahren ist weniger umständlich und damit sehr stark zeit- und kostensparend. 3. Die theoretisch perfekt erscheinende Zufallsauswahl weist in der Praxis eine entscheidende Lücke auf; àie Ausfälle. Auf dieses nonresponse-Problem ist oben, bei der Erörterung der unterschiedlichen "Response-Raten" in bezug auf die verschiedenen Befragungsarten, bereits hingewiesen worden. (Unten ist darauf - in schärferer Fassung - nochmals zurückzukommen; s. "Hochrechnung".) Dabei wurde auch der nonresponse error erwähnt: die Differenz zwischen dem Ergebnis, wenn alle Befragten antworten würden, und dem tatsächlichen Resultat (zurückzuführen auf die Unterschiede zwischen der Gruppe der Antwortenden und der Nicht-Antwortenden). Dieser Fehler (bei der Erörterung und Klassifizierung der Fehlerarten in Kap. 2 - s. auch Darst. 2-1 - nicht herausgehoben, da unter die systematischen Fehler zu subsumieren) ist bei der Tei/erhebung auf Zufallsbzsis offenkundig. Er entsteht in gleicher Weise aber auch bei der Ko//erhebung auf freiwilliger Basis. Wird die Antwort hingegen erzwungen, so bleibt er verdeckt (in möglicherweise verschlechterter Antwortqualität usw.). Auch bei der Quotenauswahl wird das Problem im Grunde verdeckt, da der Interviewer hier eben auf andere Personen ausweichen und somit die volle Zahl der vorgegebenen Interviews durchführen kann.

Kapitel 4 Die Befragung

135

Empirisch ist über den Nonresponse-Bias nicht sehr viel bekannt. K U R Z ( 1 9 8 7 ) hat, auf der Basis von 3 (mündlichen) Mehr-Themen-Umfragen in Osterreich, eine Untersuchung dazu vorgelegt. Sie beruht auf der Einführung zusätzlicher "Nonresponse-Variablen". Eine davon war die - vom Interviewer vorzunehmende Angabe, beim wievielten Besuch das Interview zustande kam. (Die Zahl der Versuche war nicht, wie sonst meist üblich, auf 3 begrenzt. Gleichwohl betrug die Ausschöpfungsquote - s. dazu unten - nur 6 3 , 6 % . ) Es ergab sich das - beruhigende - Resultat, daß "das Fehlerausmaß durchweg sehr gering ist. So beträgt die maximale Abweichung der von Nonresponse-Bias bereinigten Umfrageergebnisse von den 'Rohergebnissen' nur 2,9%. Die meisten Abweichungen liegen innerhalb der statistischen Schwankungsbreite der unkorrigierten Umfrageergebnisse" (S. 128).

4.4.1.4 Besondere Formen und Probleme Eine besondere Form eines Auswahlverfahrens stellt das sog. Schneeballverfahren ("snowball sampling', auch "linkage sampling) dar. Es besteht darin, daß man im Rahmen einer allgemeinen Umfrage auf eine Person mit den benötigten Merkmalen stößt, von dieser sich dann wiederum Adressen, die den gleichen Tatbestand erfüllen, erbittet und so fort. Es dient zur Verringerung des Problems der "Leerinterviews", also solcher, bei denen die befragten Personen selbst nicht betroffen ist. Der Grad dieser "Selbstbetroffenheit" wird z.B. gering sein, wenn Probanden über Produkte mit niedrigen Marktanteilen (sei es, daß es sich um neu eingeführte oder "Spitzenprodukte" - etwa von Autos - handelt) zu befragen sind. Das Schneeballverfahren geht zurück auf GOODMAN ( 1 9 6 1 ; s. auch Z I N K H A N / B U R T O N / WALLENDORF 1 9 8 3 ) und wurde von ihm ursprünglich aufgefaßt als ein mehrstufiges Verfahren, bei dem die erste Stufe in einer Zufallsstichprobe von Personen besteht, die nach den Adressen von "Betroffenen" gefragt werden. Andererseits läßt sich das Verfahren auch als Quotenauswahl vorstellen, bei der die Abgrenzung - statt über die Definition der Grundgesamtheit - über die Formulierung der Quote ("Generalquote" - Infratest) erfolgt.

Eine weitere besondere Form ist das sog. Random Route. Es besteht darin, daß dem Interviewer in einer bestimmten Gemeinde eine "Startadresse" angegeben wird und von da aus in vorgeschriebener Gehrichtung jeder i-te Haushalt auszuwählen ist. Insofern stellt das Random Route eher eine Auswahlteciwti dar, bei der - ähnlich der systematischen Auswahl - nach "Zufallsstart" durch z.T. detaillierte Vorschriften (z.B.

136

Teil II Methoden der Datengewinnung in der Marktforschung

Hinterhäuser, Feld oder Wald, kreisförmiger Platz!) ein "Zufallsweg" und damit die Zufallsauswahl von Haushalten erreicht werden soll. Als nächste Stufe muß also die Auswahl von Personen erfolgen; s. dazu unten. Der „Zufallscharakter" des Verfahrens - wiewohl öfters angewandt - ist jedoch theoretisch wie praktisch nicht unbestritten. Hinsichtlich des letzteren bemerkt FUCHS ( 1 9 9 4 , S. 1 4 7 ) etwa: „So erfährt man von Interviewern unter der Hand, daß einige Umfrageinstitute das Random-Route-Verfahren augenzwinkernd zur Disposition stellen, weil - wie sich vermuten läßt - der Aufwand nicht gerechtfertigt ist, wenn sich nur die Hälfte der Interviewer daran hält."

Aus Vorstehendem dürfte bereits deutlich geworden sein, daß im Prinzip nahezu jede Kombination sowohl der Auswahlverfahren untereinander als auch mit den verschiedenen Techniken erfolgen kann. Daraus ergibt sich, daß für den konkreten Fall eine Vielzahl von Möglichkeiten der Anlage einer Stichprobe besteht. Das führte zur Entwicklung von ADMMSP, den ADM (Arbeitskreis Deutscher Afarktforschungsinstitute)-Äf«sierStich-prohen-Plänen; vgl. SCHAEFER 1 9 7 9 . Sie waren als „Baukastensystem" konzipiert und umfassten „individuelle" nationale, regionale oder lokale Stichproben; dabei wurde auch die Quotenauswahl einbezogen. Von diesem allgemeinen Rahmen zu unterscheiden ist, als konkrete „koordinierte nationale Stichprobe", das sog. ADM-Master-Sample. Die Bezeichnung ist auch heute noch in der Praxis weitgehend üblich, aber nicht ganz exakt. Das Verfahren hat sich nämlich (vgl. dazu ausführlich SCHAEFER 1 9 7 9 und LÖFFLER 1 9 9 9 ) im Kontext der Durchführung von Leseranalysen entwickelt, in Zusammenarbeit der früheren AG.LA („Arbeitsgemeinschaft Leseranalyse" - heute: AG.MA - „Arbeitsgemeinschaft Medienanalyse") mit dem ADM. Später wurde diese enge Verbindung zum ADM gelockert und der „Club der 13" gebildet, dem neben der AG.MA und einer Reihe von „ADM-Instituten" auch solche angehören, die zumindest damals - nicht Mitglied des ADM waren. Die konkreten - gezogenen Stichproben (s. unten) stehen im Prinzip nur den Mitgliedern zur Verfügung. Insbesondere im Zusammenhang mit der „Medienanalyse" (s. dazu in Kap. 16) spricht man auch vom „koordinierten AG.MA-Stichprobensystem".

Es handelt sich dabei um ein Stichproben-System, bei dem in der 1. Stufe als Auswahleinheiten Sampling Points definiert sind: die amtlichen Stimmbezirke (bzw., bei solchen mit weniger als 400 Wahlberechtigten, Zusammenlegungen davon). Eine - gezogene - Stichprobe (ein „Netz") enthält im „Stichproben-System 1 9 9 7 " (vgl. dazu BEHRENS/LÖFFLER 1 9 9 9 ) 258 solcher Sampling Points. Vor der Ziehung wurde geschichtet bzw. angeordnet (nach Bundesländern, Regierungsbezirken, Gemeindegrößen-

Kapitel 4 Die Befragung

137

klassen etc.). Die so entstandenen „Zellen" bilden - als „Ziehungsdatei" die Auswahlgrundlage, aus der dann die Ziehung erfolgen konnte. Die Auswahlchance eines Sampling Points war dabei proportional zur Anzahl seiner Haushalte. Gezogen wurde eine große Anzahl solcher „Netze", die „ von der Anlage her ... möglichst überschneidungsfrei und beliebig kombinierbar" sein sollten (BEHRENS/LÖFFLER 1999, S. 77) und dann an die Beteiligten gegeben werden konnten. In der 2. Stufe erfolgt dann seitens der Institute in jedem „Netz" die Auswahl von Haushalten. Da die unterschiedliche Anzahl von Haushalten pro Sampling Point bereits bei deren Ziehung berücksichtigt wurde, kann nunmehr eine uneingeschränkte Zufallsauswahl vorgenommen werden. Dafür stehen verschiedene Möglichkeiten zur Verfügung. Sind die Haushalte im Stimmbezirk bekannt, so kann aus dieser „Totalauflistung" als Auswahlgrundlage die Zufallsauswahl erfolgen. Eine solche Totalauflistung kann auch durch vorherige „Begehungen" (durch einen Interviewer) Zustandekommen. Vielfach geschieht die Begehung aber im Wege des Random Route; das ergibt nur eine „Teilauflistung". Diese kann vorab erfolgen (derjenige, der das Interview durchzuführen hat, erhält dann eine vorgegebene Adresse - „Adressen-Random") oder auch „parallel", indem bei der Begehung des Zufallsweges sogleich auch das Interview durchgeführt wird.

Dazu bedarf es in der 3. Stufe der Auswahl der zu befragenden Person. In der Regel wird nämlich nur eine Person pro Haushalt befragt. Damit handelt es sich um eine Haushaltsstichprobe. Zur Umwandlung in einer Personewstichprobe bedarf es der Transformation; s. dazu unten (und auch die Ausführungen oben).

Für die Auswahl der Personen im Haushalt gibt es verschiedene Möglichkeiten. Eine besonders einfache stellen die Varianten der Geburtstagsregel dar: Es ist die Person zu befragen, die als erste im Jahr Geburtstag hat bzw. die mit den niedrigsten der Zahlen zwischen 1 und 31 oder auch die, welche - vom Befragungstag gerechnet - als letzte Geburtstag hatte bzw. als nächste haben wird. Diese Vorgehensweisen haben auch den Vorteil, daß keine Auflistung der Personen im Haushalt - es sei denn aus Kontrollgründen - vorgenommen werden muß. Das ist erforderlich beim Verfahren der Zufallszahlenreihe. Dabei wird für jedes Interview eine per Zufall gewonnene Folge von Zahlen zwischen - zumeist - 1 und 9 vorgegeben. Die Person in der (in der Praxis meist nach dem Alter, evtl.

Teil II Methoden der Datengewinnung in der Marktforschung

138

auch gesondert nach dem Geschlecht, geschehenden) Auflistung ist zu befragen, deren "laufende Nummer" zuerst in der Zufallsfolge auftritt. Beispiel 4-57 Die Zufallsfolge lautet: 6; 8; 2; 4; 7; 9; 1; 5; 3. Im Haushalt leben 4 Personen: Vater 37 Jahre, Mutter 25; Tochter 16; Sohn 11. Ist als Grundgesamtheit definiert "Personen ab 15 Jahre" und soll die Auflistung allein nach dem Alter - beginnend mit dem höchsten - erfolgen; so ergibt das: 1 2 3 Zu

Vater Mutter Tocher befragen ist die 2. Person, also die Mutter.

Auch der sog. Schwedenschlüssel findet oft Verwendung. Dabei wird für jedes Interview und für jede Haushaltsgröße (bei MehrpersonenHaushalten) vorgegeben, die wievielte Person zu befragen ist. Diese Zahl ergibt sich durch fortlaufendes Abarbeiten der "Permutationen" der Zahlen von 1 bis η (mit η als der Haushaltsgröße) oder einfach aus „Zufallsfolgen". Beispiel 4-58 Vereinfachend sei angenommen, daß nur Haushalte mit bis zu 3 „zählenden" Personen (also unter Ausschluß solcher, die nicht zur Grundgesamtheit gehören, wie oben der 11jährige Sohn) in Betracht kommen. Die Permutationen würden dann so aussehen: „Haushaltsgröße" 2 3

Interview A Β C D E F.... 1 1

2 1 2 1 2 2 3 1 2 3

Die Interviewer-Anweisung würde also etwa lauten: Bei 2 zu befragenden Personen im Haushalt ist die ..te zu befragen. Bei 3 zu befragenden Personen im Haushalt ist die ..te zu befragen. Beim dritten durchzuführenden Interview (C) wäre also 1 und 3 einzusetzen, entsprechend der Auflistung im vorigen Beispiel also nunmehr die Tochter zu befragen.

Das Verfahren des „Schwedenschlüssels" (s. dazu auch A 4-16) ist gegenüber dem der „Zufallszahlenreihe" zwar etwas komplizierter, aber auch leichter nachzuvollziehen bzw. zu kontrollieren.

Kapitel 4 Die Befragung

139

4.4.2 Hochrechnung - Fehlerrechnung - Der Umfang der Stichprobe Bei der Hochrechnung handelt es sich um den Rückschluß von der Stichprobe auf die Grundgesamtheit: Während die Stichprobe im Idealfall ein Miniaturbild, eine Verkleinerung der Grundgesamtheit darstellt, wird durch die Hochrechnung die (Wieder-)Vergrößerung erreicht. Allerdings ist eine Umrechnung dabei nicht immer erforderlich. So kann, wie dargelegt, bei der uneingeschränkten Zufallsauswahl - und auch der proportionalen Schichtung (wegen der Selbstgewichtung) - eine direkte Schätzung der Anteils- oder Mittelwerte der Grundgesamtheit aus den entsprechenden Werten der Stichprobe erfolgen. Anders verhält es sich etwa in bezug auf die Ermittlung von Totalwerten·, zumindest dann spricht man von "Hochrechnung". Zumal auch dem Schätzen solcher Totalwerte (z.B. Gesamteinkommen) gegenüber dem von Durchschnitts- oder Anteilswerten in der Marktforschung nicht eine überragende Bedeutung zukommt, soll hier auf die Verfahren und besonderen Probleme der Hochrechnung nicht ausführlich eingegangen werden. Vielmehr sei nur erwähnt, daß man bei den Hochrechnungsue^Äre» zwischen "freier" und "gebundener" Hochrechnung unterscheidet. Während die freie Hochrechnung ohne Heranziehung zusätzlicher Informationen - also nur mittels der aus der Stichprobe selbst gewonnenen - erfolgt, sind die verschiedenen Unterformen der gebundenen Hochrechnung dadurch gekennzeichnet, daß zusätzliche Informationen, Basiswerte (Zahlen einer früheren, der Basis-Zeit), verwandt werden. Die Ausnutzung dieser Basiswerte geschieht dabei in verschiedener Weise, mittels Differenzenbildung {Differenzenschätzung}, durch multiplikative Verknüpfung (Verhältnisschätzung) und schließlich am aufwendigsten, sicher aber auch informativsten - durch Berücksichtigung der Unterschiede in den individuellen Werten zwischen Basis- und Beobachtungszeit (Regressionsschätzung). Bei freier Hochrechnung ergibt sich der Totalwert (x') - als "Punktschätzung", d.h. ohne Konfidenzintervall - einfach aus der Multiplikation des Stichprobentotalwertes (x) mit dem Kehrwert des Auswahlsatzes: Ν x' = —·χ η

(4.1a)

140

Teil II Methoden der Datengewinnung in der Marktforschung

(4.1b) (4.1c) Beispiel 4-59 Ν = 1 Mio.; η = 1000; X - 0,8: 1 000 000 · 0,8 = 800 000 (Zur Differenzen- und Verhältnisschätzung s. A 4-17 und -18).

Im Unterschied dazu geht es bei der Gewichtung um die Abstimmung mit - irgendwie bekannten - "Randwerten" der Grundgesamtheit ("Anpassung"). Lediglich eine Umgewichtung stellt die Transformation von einer Haushalts- in eine Pmowenstichprobe - und umgekehrt - dar. Dabei wird bloß die Auswahl mit ungleichen Wahrscheinlichkeiten wieder rückgängig gemacht. Beispiel 4-60 Wurde ein Interview in einem Haushalt geführt, in dem 4 Personen zur Grundgesamtheit gehören, so erhält dieser als Gewicht 4.

Verzerrungen bei der Zufallsauswahl können vor allem durch die Ausfälle entstehen. Solche sind auf recht verschiedene Gründe zurückzuführen. Man kann sie in zwei große Gruppen zusammenfassen: die "unechten" oder "stichprobenneutralen" Ausfälle und eben die "echten" oder "nicht-neutralen". Zu den ersteren gehören die nicht zur Grundgesamtheit zu zählenden Personen - z.B. Ausländer, Personen außerhalb der Altersgrenzen -, nicht (mehr) existierende Haushalte usw. Ihre Elimination stellt quasi eine Bereinigung dar und führt zu den "eligibles", die insgesamt die Afeiîo-Stichprobe ausmachen: 5r«ííostichprobe ./. stichprobenneutrale Ausfälle Afeííostichprobe ./. echte Ausfälle auswertbare Interviews/Fragebogen ("Ausschöpfung") Unter Ausschöpfungsgrad (oder - quote) wird der Prozent-Anteil der auswertbaren Interviews/Fragebogen an der Netto-Stichprobe verstanden. Das Komplement zu 100 kann entsprechend als Ausfallquote be-

Kapitel 4 Die Befragung

141

zeichnet werden. Allerdings muß man dabei eben darauf achten, welche Art von Ausfällen Inbegriffen sein soll. Zweifellos ist also die Verweigerungsquote ("refusal rate") niedriger, da die Verweigerungen nur einen Teil der echten Ausfälle bilden; ein weiterer sind die (trotz wiederholter Versuche) Nicht-Antreffbaren. Andererseits kann die Antwortquote auch vom "Ausschöpfungsgrad" abweichen, d.h. mehr oder weniger auf die Brutto-Stichprobe bezogen sein: wenn die "Ausfallgründe" schwer feststellbar sind, etwa bei schriftlichen Umfragen; man spricht in diesem Zusammenhang auch von Rücklauf oder Response-Quoten. Bei zahlenmäßigen Aussagen ist auf dieses Differieren zu achten. So gibt L A V R A K A S (1993, S. 90ff.) ein - empirisches - Beispiel für die bei einer telefonischen Befragung möglichen verschiedenen "Completion Rates". Als "most reasonable" nennt er in diesem Falle eine von 64,3%. (Die niedrigste lag bei 34,2%.) Diese - und andere - Angaben scheinen darauf hinzudeuten, daß die Ausschöpfungsquote doch wohl nicht zwangsläufig so hoch ist, wie man dies lange geglaubt haben mochte. (1987 fand in der Bundesrepublik eine lebhafte Diskussion - im wesentlichen zwischen beteiligten Instituten - darüber statt, in deren Verlauf sich herausstellte, daß Quoten von nur 40% oder auch 60% möglich bzw. "nicht ungewöhnlich" sind - offenbar auch in Abhängigkeit davon, wieviel Zeit für die Feldarbeit und damit x-mal wiederholte Telefon-Kontakt-Versuche zur Verfügung steht.) Für die mündliche Befragung - zu Zahlenangaben für die Antwortquoten bei schriftlichen Umfragen s. dort - gibt es Schätzungen, die von durchschnittlich 10% Verweigerern und weiteren 15% Unantreffbaren sprechen; ferner kommen etwa 5% aller Interviews nicht zustande oder müssen vorzeitig abgebrochen werden, weil die Befragten wegen Krankheit, Trunkenheit, Geistesschwäche oder Sprachschwierigkeiten dazu nicht in der Lage sind. Ganz allgemein jedoch befürchtet man, daß der Ausschöpfungsgrad tendenziell eher abnimmt und insbesondere die Verweigerungen zunehmen (einmal, weil der Reiz des Neuen, der Umfrageforschung als solcher, inzwischen verblaßt ist, andererseits im Zusammenhang mit der Diskussion um den Datenschutz).

Zumindest im Umkreis des ADM-Master-Samples hat sich für den Versuch zur Beseitigung der durch Ausfälle entstandenen Verzerrungen der Ausdruck "Redressement" eingebürgert. Man versteht darunter die Anpassung an bekannte Randwerte der einzelnen "Schichtungszellen". Ingesamt kann so die Gewichtung in drei Stufen erfolgen: 1. Korrektur der Abweichungen vom haushaltsproportionalen Ansatz: Gewichtung der Haushaltssùàvprobz nach Bundesländern usw.; 2. Transformation der Haushalts- in eine Pmonenstichprobe; 3. Gewichtung der Personenstichprobe nach z.B. Alter und Geschlecht.

142

Teil II Methoden der Datengewinnung in der Marktforschung

Etwas strittig ist - bezüglich 1 und 3 - die Form der Anpassung. Früher dominierte eher die Methode des "Doppeins und Streichen": doppelte Aufbereitung einzelner Elemente bei t/raiererfassung und zufälliges Herausgreifen und Ausschluß von der Aufbereitung bei Ubererfassung. Dieses führte aber zu einer Veränderung der Fallzahlen (mit "künstlichen" Fällen). Heute wird dagegen mehr die proportionale Anpassung oder "faktorielle Transformation", also letztlich - ähnlich der Verhältnisschätzung bei der gebundenen Hochrechnung - die Multiplikation mit einem Veränderungssatz, vorgezogen. Daran müßte sich die Fehlerrechnung anschließen. Dabei ist nun einerseits zu bedenken, daß bei der Qwoienauswahl eine solche im Grunde nicht möglich ist, andererseits auch bei der Zufallszuswahl höchst selten eine "uneingeschränkte Zufallsauswahl" stattfindet. Damit müssen auch die - in Kap. 3 dargestellten (und unten wiederholten) - Formeln für die Berechnung von Konfidenzintervallen durch kompliziertere ersetzt werden. In der Praxis entfällt die Fehlerrechnung zumeist völlig. Allenfalls werden - tabellenartig - Hinweise gegeben. So enthält etwa die früher bereits erwähnte Untersuchung "Einkaufsverhalten 1985" von E M N I D eine "Tabelle der Fehlertoleranzen", die für verschiedene Werte von ρ - die mitgeteilten Ergebnisse bestehen ausschließlich aus Prozentwerten - und unterschiedlichen Stichprobengrößen für einen bestimmten Sicherheitsgrad die "Fehlerspanne" angibt.

Die Fehlerspanne spielt eine Rolle für die Berechnung des Umfangs der Stichprobe. Auch dies ist natürlich im Grunde nur für die Zufallsauswahl (und deren "Sonderformen", in u.U. sehr viel komplizierterer Weise als unten dargestellt) möglich. Auch wird in der Praxis oft ganz darauf verzichtet und stattdessen auf "Erfahrungswerte" (z.B. 1000 oder 2000 - s. das Schlagwort von der "Herrschaft der Zweitausend") oder allenfalls Ubersichts-Tabellen zurückgegriffen. Im folgenden ist die exakte Berechnung für Anteilswerte dargestellt. (Wegen Mittelwerten s. A 4-19.) Gemäß Kap. 3 ergibt sich hierfür: P=p ± t · ] ^ Wird für die Fehlerspanne das Symbol e eingeführt:

(4.2)

Kapitel 4 Die Befragung

143

(4.3) so folgt: t2

PO

(4.4)

Die Werte für t und e müssen vorgegeben werden. Auch Ρ und Q - als die durch die Stichprobe ja erst zu schätzenden Werte der Grundgesamtheit sind nicht bekannt. Hierfür müssen also "Hypothesen" gewonnen werden. Dies kann aus früheren oder durch Vor-Erhebungen geschehen. Im hier gegebenen Falle von Proportionen - die ja definitionsgemäß zwischen 0 und 1 liegen - kann man einfach auch deren "ungünstigstes" Verhältnis annehmen, nämlich 0,5 : 0,5. (fede andere Multiplikation von Ρ und Q würde ein kleineres Produkt ergeben.) Der höchstzulässige Fehler wird dann jedenfalls nach oben hin eingehalten. Beispiel 4-61 Der Sicherheitsgrad wird auf 2 festgelegt, der höchstzulässige Fehler soll bei 3% liegen. Es ergibt sich dann:

Literaturhinweise Der Gegenstand dieses Kapitels: "die Befragung", wird selbstverständlich relativ ausführlich in den allgemeinen Büchern zur Marktforschung (s. dazu auch die Literaturhinweise zu Kap. 1) behandelt. Außerdem gibt es im Rahmen von anderen "empirischen" Disziplinen, wie "Field Research", "Business Research", "Social Research" etc., viele einschlägige Darstellungen. Neben den bereits im Text erwähnten - zwar etwas engeren, aber doch noch sehr allgemeinen - Werken zur "Umfrageforschung" (insbesondere NOELLE-NEUMANN/PETERSEN 1996, auch BEHRENS 1966) sollen deshalb im folgenden nur noch einige Literaturhinweise zu den einzelnen Abschnitten dieses Kapitels gegeben werden.

144

Teil II

Methoden der Datengewinnung in der Marktforschung

Der 1. Abschnitt hatte die Befragungwferc zum Thema. Speziell zu der stark in der Entwicklung befindlichen telefonischen Befragung sei hier neben den im Text erwähnten Schriften von STROBEL 1 9 8 3 , LAVRAKAS 1 9 9 3 und FUCHS 1 9 9 4 - noch hingewiesen auf FREY/KUNZ/LÜSCHEN 1 9 9 0 , zur schnftlichen Umfrage - neben HAFERMALZ 1 9 7 6 , gemäß Text - auf ERDOS 1 9 8 3 u n d MANGIONE 1 9 9 5 .

Zum 2. Abschnitt·. Generell mit psychologischen Problemen in der Marktforschung befassen sich - schon lt. Titel - SCHUB VON BOSSIATZKY 1992 und SALCHER 1995. Neuere Darstellungen speziell zum Gruppeninterview (in den USA) sind MORGAN/KRUEGER 1998 und vor allem FERN 2001. Speziell zum 3. Abschnitt, zur „Kunst des Fragens", sei hingewiesen auf das berühmte Buch von PAYNE 1 9 5 1 . In dessen - direkter - Nachfolge soll stehen: SUDMAN/BRADBURN 1 9 8 6 . S. auch SCHUMAN/PRESSER 1 9 9 6 und CONVERSE/PRESSER 1 9 8 6 .

Zum 4. Abschnitt („Stichprobe") existiert ebenfalls sehr viel Literatur. Ein Teil davon ist eher theoretisch - mathematisch-statistisch - ausgerichtet. Nachstehend (s. auch A. 4-16) nur einige anwendungsbezogene Schriften: COCHRAN 1 9 7 7 , KISH 1 9 6 5 , SCHEAFFER/MENDENHALL/OTT 1 9 9 0 u n d SUDMAN

1976.

Aufgaben 4-1 :

Was ist eine " Omnibus-Befragung" ?

4-2:

Wie könnte der Satzergänzungstest gemäß Beisp. 4-14 in nichtprojektiver Form ausgestaltet werden?

4-3:

a) Nennen Sie die Nummern der "Listen" zu dem im Appendix wiedergegebenen Fragebogen-Auszug, die durch eine entsprechende Formulierung - analog Beisp. 4-21 - eine "Öffnung" bewirken! b) Gilt dies auch für "Liste D"; warum bzw. warum nicht?

Kapitel 4 Die Befragung

4-4:

4-5:

145

a) Wie kann die Frageformulierung für eine "fractionation scale" gemäß Beisp. 4-38 lauten? b) dto. "Konstantsummenskala"? MC:

Im folgenden finden Sie zwei Statements: I. Die Feldarbeit wird nicht nur kontrolliert, weil der Kunde es will II. In bzw. zu jeder Tabelle eines Marktforschungsberichts sollte die η-Zahl genannt werden. Welche sind richtig? o I und II sind beide unrichtig o I ist richtig, II ist unrichtig o I ist unrichtig, II ist richtig o I und II sind beide richtig 4-6:

MC:

Welche Befragten-Gruppen sind ausgeschlossen, wenn die Grundgesamtheits-Definition lautet: „Einwohner Deutschlands, 18 Jahre und älter"? o Personen, die außerhalb Deutschlands geboren sind o Ausländer, die mit ihren Eltern in Deutschland leben o Dänische Grenzgänger, die in Deutschland arbeiten o Personen mit ausländischem Paß, die in Deutschland leben 4-7:

MC:

Auf einem Flughafen werden Passagiere befragt, die in der Wartezone auf den Abflug warten. Der Interviewer kann jeden Passagier ansprechen. Das Interview betrifft die Flughafen-Einrichtungen. Um welche Art Stichprobe handelt es sich? o um eine selektive Stichprobe („self-selected sample") o um eine internationale Stichprobe o um eine Quota-Stichprobe o um eine Random-Stichprobe

"•Bei solchen Multiple-Choice-Aufgaben ist nur eine Antwort anzukreuzen, nämlich die, die man für „am richtigsten" hält. Diese Aufgabe und die folgenden beiden gehen - wörtlich oder sinngemäß - zurück auf ein zur Ausbildung von Interviewern verfaßtes holländisches Werk (von Ed van Eunen, Houten 1993 - hier nach Context 20/95, S. 9f.).

146

Teil II Methoden der Datengewinnung in der Marktforschung

4-8:

Beurteilen Sie die Auswahlchancen des 1. Elements im Verhältnis zu der des 7. bei Verwendung von zwei normalen Würfeln!

4-9:

Mittels der „AWF-Zufallswürfel" kann eine uneingeschränkte Zufallsauswahl aus 1296 (durchnumerierten) Elementen vorgenommen werden. Dazu werden insgesamt 4 Würfel verwandt, die nur auf 5 Seiten Zahlen tragen. (Die letzte Seite ist leer bzw. hat ein Symbol und kann als 0 interpretiert werden.) Der 1. Würfel hat die Zahlen 1 bis 5, der zweite: 6, 12, 18, 24, 30. a) Geben Sie an, welche Zahlen auf dem 3. und dem 4. Würfel stehen! b) Wie müssen die Würfel fallen, damit das (1) 1. Element, (2) 1295., (3) 1296., (4) 37. augewählt werden?

4-10: Wie kommt, im Falle von Beisp. 4-48, das 1000. Element zu "seiner" Auswahlchance? 4-11: T/F: Die Einschränkung des Zufallsprinzips in dem Sinne, daß nicht mehr jedes Element der Grundgesamtheit notwendigerweise die gleiche (aber noch angebbare) Auswahlchance hat, macht das Verfahren noch nicht zu einem „nonprobability sample". T/F 4-12: Eine Grundgesamtheit im Umfange von 75 000 lasse sich nach einem bestimmten Merkmal sinnvoll in 5 Schichten (a 12000, 15000, 21000, 18000 und 9000) aufteilen. Der Stichprobenumfang sei 1000. Zumal über die Streuung in der Grundgesamtheit nichts bekannt ist, soll proportionale Aufteilung erfolgen. Wie groß ist der Stichprobenumfang in den einzelnen Schichten? 4-13: Von den Verfechter des Quotenverfahrens wird mitunter angeführt, daß dieses einer "geschichteten Stichprobe" nahekomme. Nehmen Sie dazu Stellung! 4-14: Vergleichen Sie die "Wahlfreiheit" des Interviewers beim Quotenverfahren bezüglich der ersten und der letzten Auskunftsperson!

Kapitel 4 Die Befragung

147

4-15: a) Würden "spezifische Quotenentstehend durch Kombination der Quotierung (also z.B.: Interviews mit 5 weiblichen Personen, davon 2 Angestellte - vielleicht zusätzlich in einer bestimmten Altersgruppe), die Aus wahlfreiheit des Interviewers einschränken oder gar beseitigen? b) Handelt es sich in Beisp. 4-56 um eine solche kombinierte Quotenvorschrift? (1) bei 1., (2) bei 2.? 4-16: Bei KREIENBROCK (1993, S. 158) findet sich - hier hinsichtlich des Aufbaus wie auch der Frageformulierung modifiziert - folgender „Schwedenschlüssel": Haushalt

Haushaltsgröße 2 3 4 5 6 7 8

A 3 12 14 5 2 Β 1 2 3 2 5 9 3 C 1 1 2 4 2 6 9 D 2 3 15 14 9 Führt er zu einer Zufallsstichprobe? 4-17: Die Differenzenschätzung für den Totalwert der Grundgesamtheit ( D i f f ) geschieht in folgenden Schritten: 1. Feststellung der Differenz der beiden (Stichproben-)Totalwerte, 2. Hochrechnung dieser Differenz mit dem reziproken Auswahlsatz, 3. Addition der hochgerechneten Differenz zum Basis-Totalwert der Grundgesamtheit. a) Geben Sie - analog (4.1) und mit Y für den Totalwert der Grundgesamtheit sowie y den Stichproben-Totalwert für die Basis-Zeit - die Formel für die Differenzen-Schätzung an! b) Berechnen Sie x' Diff mit den Werten von Beisp. 4-59 und Y = 700 000 sowie y = 750! x

4-18: Bei der Verhältnisschätzung für den Totalwert der Grundgesamtheit (x Quot) erfolgt Multiplikation des Verhältnisses der beiden Stichproben-Totalwerte mit dem Totalwert der Grundgesamtheit für die Basiszeit.

148

Teil II Methoden der Datengewinnung in der Marktforschung

a) Geben Sie - analog (L.2) - die Formel für die Verhältnisschätzung an! b) Berechnen Sie x'Quot. mit den Werten von A 4-13! 4-19: Leiten Sie die Formel für den Umfang der Stichprobe - analog (4.4) - für den Fall von Mittelwerten ab!

Appendix: Fragebogen Darst. 4-13 (folgende Seiten) enthält einen Auszug aus dem umfangreichen Fragebogen einer Mehr-Themen-Umfrage des EMNID-Instituts. Er wurde der Anschaulichkeit halber im Original belassen und nicht neu gesetzt; die Seitenzählung stammt vom Verf. Dazu ist noch folgendes anzumerken: 1. Bei Seite 1 handelt es sich um das Deckblatt. (Man sieht hieraus, daß die Umfrage schon etwas weiter zurückliegt; das ist auch bei den Anweisungen bzw. Beispielen zur Strichmarkierung zu beachten!) 2. Die Seiten 2 und 3 stellen jeweils den Beginn neuer Themenkomplexe dar. a) Seite 2 beginnt mit dem Themenkomplex "Rauchen". (S. dazu auch die früheren Beispiele!) Die Listen dazu sind folgende: Liste 70:

11 selbstgefertigte, also selbst gedrehte, gestopfte oder gerollte Zigaretten 12 gekaufte Zigaretten mit Filter 13 gekaufte Zigaretten ohne Filter 14 Pfeife 15 Zigarillos 16 Zigaretten 17 Stumpen 18 Sonstiges 20 N I C H T R A U C H E R

Liste 71:

11 Bantam Halffzare Shag

49 West zum Selbstdrehen 50 Andere, welche? Bitte angeben!

Kapitel 4 Die Befragung

149

Darst. 4-13: Fragebogen (Auszug aus einer Mehr-Themen-Umfrage des EMNIDInstitutes)

Teil II Methoden der Datengewinnung in der Marktforschung

150

ci





V)

=· s

• oι

c

> · ~ 5 α 2 S S. 5 · « c 3 Ai ε 5 c V O £ V X

e £ ~ cVt» £

e



·-

Ξί

«> c U3C > CM c-oc

OC Ό

si

îii i i • • •

*

U. *>

W

S. C «> C «I

H i

8

ι 11. L

«

c χ —

E 3C

ι. « « 4J υ «

freilassen!

—3 E ' * 3 Ο 3

Χo

" — •««MC



Bitte —

— « Κ "rt

• vï C « A C

Τ U

C O 3 £ Κ t> E «

i¿il! • • • •

-9

en j 3

M» β C «Λ £C Ό C

«>

^

""

ι/)

»-

£ —>

*

> irt

UilÌJ

Kapitel 4 Die Befragung

151

152

Teil II Methoden der Datengewinnung in der Marktforschung

a

«

o

« «> M en

ν



JZ V



O >

£

Λ

O

α

·-

Ν

!,!•• ΙΏΏ

153

Kapitel 4 Die Befragung

a.

e

α

I

ΐ

J-

3

£

o — £ 4-1 £ — Ζ 3 ft) Χ >

Γ

c

«-

• •••



«*

«-



«

C

£

Ό

Κ

§

α.

β| « Ζ« r I

22 £

»

U





Ο

Μ

ίι • • • Π Sil i =

3

«

«

Ό

£

§

!

3 ν ν

— — d J

Ϊ £~ 3„ χ ί Iϊ 3C £ç

ω

154

Liste 74:

Teil II Methoden der Datengewinnung in der Marktforschung

11 Atika

52 53 61 62 Liste 75:

West eine sogenannte Weiße Marke oder Billigzigarette andere Marke mit Filter, welche? Bitte angeben! andere Marke ohne Filter, welche? Bitte angeben!

11 Telefon im Haushalt vorhanden 12 fahre selbst Auto 13 PKW im Haushalt vorhanden 14 Videorecorder im Haushalt vorhanden 15 Kauf oder Miete eines Videorecorders in den nächsten 12 Monaten geplant 16 habe Garten 17 treibe Sport (einschl. Jogging, Schwimmen, Wandern etc.) 18 mache Heimwerker-/Bastel-Arbeiten (do it yourself) 19 bin zur Zeit arbeitslos 21 plane in den nächsten 5 Jahren den Bau eines Hauses 22 plane in den nächsten 5 Jahren den Kauf einer eigenen Wohnung/ eines eigenen Hauses 23 habe eigenes Haus/Eigentumswohnung 24 Heim-Sauna

b) Seite 3 leitet den Themenkomplex "Gesundheit" ein. Die direkt anschließenden Fragen (14-64) - später folgt dann auch n o c h eine Konkretisierung in bezug auf Fußpflegemittel

(einer bestimmten F i r m a bzw. be-

stimmter Marken) - haben die Einschätzung der Gefährlichkeit ner Krankheiten

verschiede-

z u m Gegenstand; als "Liste 14" wurde dazu die Skala lt.

Darst. 4-14 vorgelegt. Die anderen Listen - zu Seite 3 - sind: Liste 10:

11 sehr gut 12 gut 13 mittel, es geht 14 schlecht 15 sehr schlecht

Liste 11:

Letzter Arztbesuch liegt länger zurück als ... 11 einen Tag 12 eine Woche 13 zwei Wochen

Kapitel 4 Die Befragung

- 100 -

90

-

80

-

70

-

60

-

50

-

40

-

30

-

20

-

10

-

0

kann tödlich sein oder zu bleibenden Schäden fuhren

»anz ungefährlich, harmlos höchstens unangenehm)

Darst. 4-14: Skala zum EMNID-Fragebogen 14 einen Monat 15 ein Vieteljahr 16 ein halbes Jahr 17 ein Jahr 18 letzter Arztbesuch war heute 19 weiß nicht genau 21 war noch nie beim Arzt Liste 12:

11 gesunde Ernährung 12 Hetze, Streß 13 Sauberkeit, Hygiene 14 Vorsorgeuntersuchungen 15 Ubergewicht 16 regelmäßig zum Arzt gehen 17 Alkohol 18 Impfungen 19 vorsorglich Medikamente einnehmen 21 Rauchen 22 viel Vitamine

156

Liste 13:

Teil II Methoden der Datengewinnung in der Marktforschung

11 Es gibt viele gute Hausmittel, die eine ärtzliche Behandlung unnötig machen. 12 Ob man krank wird oder nicht, ist einfach Schicksal. 13 Ich habe immer ein bißchen Angst, wenn ich zum Arzt gehen soll. 14 Viele Krankheiten sind nichts anderes als Einbildung. 15 Ich habe meist keine Zeit, zum Arzt zu gehen. 16 Häufig sind die Maßnahmen gegen eine Krankheit unangenehmer als die Krankheit selbst. 17 Für die meisten Krankheiten gibt es keine wirksamen Vorbeugungsmethoden. 18 Ich kann es mir einfach nicht leisten, krank zu werden.

3. Die Seiten 4 und 5 enthalten - wie meist, zum Schluß - die sog. Soziodemographika. Die Listen dazu sind: Liste A:

11 Volks-, Hauptschule ohne abgeschlossene Lehre 12 Volks-, Hauptschule mit abgeschlossener Lehre 13 weiterbildende Schule ohne Abitur 14 Abitur, Hochschulreife, Fachhochschulreife 15 Studium (Universität, Akademie, Fachhochschule)

Liste Β:

11 voll berufstätig 12 teilweise berufstätig 13 zur Zeit arbeitslos Rentner, Pensionär (nicht mehr voll berufstätig) 14 früher berufstätig 15 früher nicht berufstätig in Ausbildung 16 Lehrling 17 Schüler, Student nicht berufstätig 18 aber früher berufstätig gewesen 19 (noch) nie berufstätig gewesen

Liste C:

Angestellte 11 einfache Angestellte 12 mittlere Angestellte 13 qualifizierte Angestellte 14 leitende Angestellte Arbeiter 15 ungelernte Arbeiter 16 angelernte Arbeiter 17 einfache Arbeiter 18 qualifizierte Facharbeiter

Kapitel 4 Die Befragung

Selbstständige/ Freie Berufe/ Landwirte 21 kleinere Selbstständige 22 mittlere Selbstständige 23 größere Selbstständige 24 Freie Berufe (z.B. Arzt, Anwalt) 25 Selbstständige Landwirte Beamte 26 einfacher Dienst 27 mittlerer Dienst 28 gehobener Dienst 29 höherer Dienst Liste D:

11 12

13 14 15 16 17 18 19 20

unter 500 DM 500 bis unter 1000 DM 1000 bis unter 1500 DM 1500 bis unter 2000 DM 2000 bis unter 2500 DM 2500 bis unter 3000 DM 3000 bis unter 3500 DM 3500 bis unter 4000 DM 4000 bis unter 5000 DM 5000 und mehr DM

157

Kapitel 5 Die Beobachtung Im 1. Abschnitt ist zunächst der Begriff der Beobachtung zu klären; danach sind die sich durch Anwendung verschiedener Einteilungskriterien ergebenden Arten zu skizzieren. Im 2. Abschnitt wird dann näher auf die technische Durchführung, also die Form der Datenkollektion - durch Personen oder durch technische Einrichtungen, aber auch Bestandsaufnahme und "Spurenanalyse" - eingegangen. Im 3. Abschnitt schließlich finden einige methodische Probleme ("Beobachtungsgesamtheit" und "Beobachtungseffekt") Erörterung.

5.1 Begriff und Arten Die Beobachtung ist begrifflich dadurch gekennzeichnet, daß der festzustellende Sachverhalt sich nicht aufgrund einer ausdrücklichen Erklärung der Auskunftsperson ergibt, sondern unmittelbar aus dieser selbst bzw. ihrem Verhalten erkennbar wird. Damit handelt es sich um eine weite Fassung des Begriffs (der eben nicht nur im engeren Sinne die Beobachtung durch persönliche Beobachter enthält, sondern auch die mittels technischer Einrichtungen). Im noch weiteren Sinne kann man allerdings der Befragung als verbaler Methode die nicht-verbalen Verfahren gegenüberstellen. Insbesondere durch WEBB et al. (1981 1. Auflage 1966) ist auch die Entgegensetzung von reaktiven und nicht-reaktiven Methoden üblich geworden. (In der 1. Auflage sprechen sie im Titel noch von "unobtrusive measures", betonen später aber - S. I X -, daß es mehr auf die "nonreactivity" als die "unobtrusiveness" ankomme.) In diesem Sinne wären auch (Beobachtungen von) Gruppendiskussionen, gemäß Kap. 4, hierzu zu zählen, ferner die Content Analysis - s. in Kap. 9 - und überhaupt die Analyse von Sekundärmaterial (£ap. 8). Zumal letzteres erscheint ganz unzweckmäßig (und ist auch nicht üblich). Auf die Spurenanalyse wird jedoch unten - kurz - eingegangen.

Aus der obigen Begriffsbestimmung folgt auch, daß die Beobachtung (ebenfalls im Unterschied zur Befragung) im Prinzip unabhängig von der Auskunftsbereitschaft ist. Das gilt jedoch - in dem Sinne, daß die Zustimmung der beobachteten Person grundsätzlich nicht gegeben sein muß - nicht uneingeschränkt für alle Arten der Beobachtung. In der Literatur

Kapitel 5 Die Beobachtung

159

findet sich diesbezüglich eine ganze Reihe von Einteilungen, gemäß Darst. 5-1. Lfd. Nr.

Kriterium

Einteilung

Form der Datenkollektion

Beobachter und technische Einrichtungen (sowie: Bestandsaufnahmen und "Spurenanalysen")

grundsätzliche Anlage

experimentell - nichtexperimentell

3

Beobachtungsstrategie

standardisiert - nichtstandardisiert

4

Bedingungen, unter denen sich das Beobachtungsobjekt befindet

5

Erhebungssituation

normales Umfeld: Feldbeobachtung künstlich geschaffene Bedingungen: Laboratoriumsbeobachtung offen - nichtdurchschaubar quasibiotisch - biotisch

6

Partizipationsgrad

1 2

teilnehmende - nichtteilnehmende Beobachtung

Darst. 5-1: Arten der Beobachtung Zu 1: S. Abschnitt 2. Zu 2: S. zu experimentellen Anordnungen Kap. 6. Zu 3: Diese Einteilung folgt der entsprechenden Unterscheidung bei der Befragung. (S. Kap. 4.) Jedoch ist - im Gegensatz zum Arbeiten etwa mit standardisierten Fragebögen - die "Standardisierung von Beobachtungen ... zumeist mit erhebungstechnischen Schwierigkeiten verbunden" ( B E C K E R 1973, S. 27). Da die Standardisierung letztlich die Kontrolle der Bedingungen, unter denen die Beobachtung stattfindet, bedeutet, spricht man auch von "kontrollierter" und "unkontrollierter Beobachtung" oder - eben wegen der Probleme dabei - von "geringer" oder "weitgehender Kontrolle". ( A T T E S L A N D E R 1995 verwendet das Begriffspaar strukturiert/unstrukturiert.) Zu 4: In dem Maße, wie es sich um ausgesprochene Versuchsanordnungen handelt, nähert sich die Laboratoriums-Beobachtung damit einem Experiment. Dennoch ist eine Subsumierung unter dieses nicht ohne weiteres berechtigt, da sich die Unterscheidung zunächst rein äußerlich darauf bezieht, wo die Beobachtung stattfindet, der Grund dafür also lediglich darin liegen kann, daß technische Geräte eingesetzt werden sollen. Damit wird bei der Laboratoriumsbeobachtung die Unabhängigkeit von

160

Teil II Methoden der Datengewinnung in der Marktforschung

der "Auskunftsbereitschaft" aufgehoben - jedenfalls insoweit, als der Beobachtungsperson der Zweck der Beobachtung bekannt ist. Zu 5: Auf diesem "Wissen" bezüglich der Erhebungssituation beruht die (SPIEGEL 1 9 7 0 folgende) Einteilung in - offene (und durchschaubare) Situation: Die Versuchsperson kennt sowohl das Versuchsziel, ihre Aufgabe innerhalb des Versuchs als eben auch die Tatsache, daß sie beobachtet wird. - nichtdurchschaubare Situation: Sie kennt nur ihre Aufgabe und ihre Rolle als Versuchsperson, nicht aber das Versuchsziel. - quasibiotische Situation: Lediglich die Rolle als Versuchsperson ist bekannt. - biotische Situation: völlige Unkenntnis. Hieraus folgt, daß auch bei Laboratoriumsbeobachtungen die Situation nicht völlig offen bzw. durchschaubar zu sein braucht. Beispiel 5-1 Die im nächsten Abschnitt zu erwähnende "Augenkamera" kann so eingesetzt werden, daß der Versuchsperson die wahre Situation nicht bewußt wird. Darauf beruht das Verfahren der "Mannheimer Blickregistrierung" (s. etwa BÖHMER 1964 und GUTJAHR 1965): Die Auskunftsperson wird zwar zu einer Untersuchung gebeten, muß aber vor der für sie eigentlichen Aufgabe einige Minuten im Wartezimmer Platz nehmen; dort befinden sich Zeitschriften (mit Anzeigen), deren Durchblättern über Bildschirme bzw. mittels Kameras beobachtet wird. S. dazu auch unten, "Beobachtungseffekt".

Zu 6: Diese Unterscheidung bezieht sich auf persönliche Beobachter (und wird inhaltlich deshalb im nächsten Abschnitt erörtert). Gemeint ist das Ausmaß von deren "Aktivität"; korrekter wäre deshalb die Bezeichnungsweise: "aktiv teilnehmend" und "nicht aktiv teilnehmend" (oder, so ATTESLANDER 1 9 9 5 : "passiv teilnehmend").

5.2 Die Form der Datenkollektion 5.2.1 Datenerhebung durch Beobachter Die Feststellung bestimmter Sachverhalte durch Beobachter kann durchaus sinnvoll sein. Das gilt immer dann, wenn nur ein einziges, äußerlich wahrnehmbares Merkmal zu beobachten ist.

161

Kapitel 5 Die Beobachtung

Beispiel 5-2 Zahl der Besucher bei zu unterschiedlichen Zeiten eingesetzten Werbeveranstaltungen. J e m e h r M e r k m a l e gleichzeitig z u erfassen u n d je schwieriger diese feststellbar sind, desto k o m p l i z i e r t e r w i r d die B e o b a c h t u n g . Beispiel 5-3 Die Uberprüfung der Werbewirksamkeit eines Schaufensters durch Beobachtung macht allein nach dem Merkmal "Handlung" eine Unterscheidung in 5 Personenkreise notwendig: Betreten des Geschäfts ohne Blick ins Schaufenster, Betreten des Geschäfts nach Blick ins Schaufenster, Blick ins Schaufenster ohne Betreten des Geschäfts, Vorübergehen mit Betrachten des Schaufensters, Vorübergehen ohne Betrachten des Schaufensters. Jede dieser Gruppen ist dann zweckmäßigerweise wieder nach Geschlecht, Laufrichtung und zumindest einigen Altersgruppen zu unterscheiden. Eine zweckentsprechende Anordnung würde dabei mindestens 7 Beobachter erfordern. (Vgl. BEHRENS 1966, S. 67-69.) Bei t e i l n e h m e n d e r B e o b a c h t u n g n i m m t der B e o b a c h t e r - wie e r w ä h n t aktiv,

auf der gleichen E b e n e w i e der Beobachtete, a m A b l a u f des Ge-

schehens teil. Beispiel 5-4 Testkauf („Mystery-Shopping"): Der Beobachter besucht in der Rolle eines Interessenten ein Einzelhandelsgeschäft, mit der Aufgabe, das Verhalten des Verkäufers festzustellen. Damit kann man etwa ermitteln wollen, ob ein bestimmtes Produkt geführt wird ("Distribution"!), mit welchen Argumenten es angeboten wird (Verkaufshilfen!), in welcher Qualität es sich befindet (Lagerhaltung!) usw. Vorgänge dieser Art, mit einem "intervenierenden" Beobachter, wurden von CAMPBELL (1963) als Contrived, Situations bezeichnet. AAKER/KUMAR/DAY (1995, S. 190) vergleichen sie mit den - in Kap. 4 erörterten - "projektiven Tests". Gewissermaßen auf die Spitze getrieben werden sie in Entrapment Studies. WEBB et al. (1981, S. 269) berichten als Beispiel von einer Taxifahrer-Studie in New York City, bei der der Experimentator sich als Fremder mit schlechtem Englisch und ungenügender Kenntnis des Taxi-Preises ausgab, um so die Taxifahrer zu überhöhten Preisen zu verführen. V o n m ö g l i c h e n ethischen

b z w . juristischen

t e i l n e h m e n d e B e o b a c h t u n g auch methodisch

B e d e n k e n abgesehen, ist die f r a g w ü r d i g , da sie n u r sehr

schwer verallgemeinerungsfähige Resultate z u erbringen v e r m a g . J e weniger der B e o b a c h t e r " t e i l g e n o m m e n " , also aktiv auf das schließlich beobachtete E r g e b n i s eingewirkt hat, desto präziser w i r d n o r m a l e r w e i s e die A u s s a g e sein. D i e größte Zuverlässigkeit in dieser H i n s i c h t d ü r f t e n zweifellos " B e o b a c h t e r " haben, bei denen eine individuelle E i n w i r k u n g völlig ausgeschlossen ist, also entsprechende technische E i n r i c h t u n g e n :

162

Teil II Methoden der Datengewinnung in der Marktforschung

5.2.2 Der Einsatz von technischen Einrichtungen Die Skala geeigneter technischer Einrichtungen reicht von vergleichsweise einfachen Hilfsmitteln über die herkömmlichen Ton- und Bildaufzeichnungsgeräte bis zu komplizierten bzw. spezialisierten Konstruktionen. Einige Möglichkeiten sollen im folgenden aufgeführt werden. Dabei kann danach unterschieden werden, ob die Erfassung des Sachverhalts mit dem Augenblick seines Auftretens erfolgt und damit auch beendet ist (und allenfalls der Auszählung bedarf) oder ob im Augenblick des Auftretens nur eine Aufzeichnung (mit anschließender Interpretation) geschieht. Man kann demgemäß von mittelbarer und unmittelbarer Beobachtung ("direct observation") sprechen. Im folgenden wird nicht danach getrennt und auch auf die - insbesondere im Zusammenhang mit der im vorigen Abschnitt behandelten "Durchschaubarkeit" der Beobachtungssituation bzw. dem Einverständnis des Beobachteten auftretenden - u.U. beträchtlichen Probleme ethischer und juristischer Art nicht näher eingegangen. (S. zu letzterem aber auch in Kap. 20 über die „Berufsverbände auf dem Gebiet der Marktforschung" und den dort erwähnten „Richtlinien".)

1. Lichtschranken sind ein einfaches Hilfsmittel zur Zählung von Besuchern usw. Probleme liegen hier allenfalls in der technischen Gestaltung von Ein- und Ausgängen (z.B.: Mehrfachzählung bei - u.U. nur kurzzeitigem - Verlassen; gleichzeitiges Eintreten von zwei Personen in der Weise, daß sie zusammen nur eine Reaktion des Zählapparates ergeben).

2. Einwegscheiben sind Scheiben, deren andere Seite etwa als Spiegel ausgebildet ist. Sie ermöglichen z.B. die verdeckte Beobachtung von Diskutanten. 3. Die bereits erwähnte Augenkamera filmt, im "Labor" über oder hinter der Versuchsperson - versteckt - angebracht, deren Augenstellung und Blickrichtung beim Betrachten von Werbemitteln („KameraLesebeobachtung", so REHORN 1987, oder auch Leseverhaltensbeobachtung" - Institut Compagnon). 4. Im Unterschied dazu verläuft das (etwa von KROEBER-RIEL 1983 und BERNHARD 1983 - mit Abbildungen - geschilderte) Verfahren der Blickaufzeichnung "offen": Die Versuchsperson trägt eine Art Brille, die mit einer Kamera o.ä. verbunden ist. Diese dient dazu, die Fixationen (das Auge verweilt, der fixierte Ausschnitt wird wahrgenommen) und Saccaden (zur Fortbewegung von einem Fixationspunkt zum nächsten) zu erfassen. Durch Verbund mit einem Videogerät kann man das jeweilige

Kapitel 5 Die Beobachtung

163

Blickfeld der Versuchsperson und darin die Fixationen sichtbar machen. (Vgl. dazu auch - sehr kritisch - REHORN 1987, S. 95ff.) 5. Das Tachistoskop ist ein Gerät, das es ermöglicht, der Versuchsperson den Blick auf eine Vorlage, etwa ein Werbemittel, für eine jeweils genau festgelegte Zeitspanne freizugeben. Damit läßt sich die Aufmerksamkeitswirkung von Bildern, insbesondere ihre "Gestaltsfestigkeit", prüfen. 6. Ein mechanisches Hilfsmittel im Rahmen von "Spontanhandlungsverfabren", die sog. Schnellgreifbühne, soll bewirken, daß die Versuchsperson ohne Uberlegungszeit aus einer Anzahl von Packungen eine herausgreift (Spezialform des Greiftests), um daraus auf deren "Anmutungsqualität" zu schließen. Sie wird gelegentlich in Zweifel gezogen: Nach BECKER ( 1 9 7 3 , S. 1 6 4 ) gingen bei seinen "Informationsgesprächen ... in Marktforschungsinstituten ... mehrere Gesprächspartner sogar soweit, die Schnellgreifbühne als ein Gerät zu bezeichnen, das lediglich der Akquisition unerfahrener Kunden diene".

7. Der Aktivierungsmessung (Messung der "inneren Erregung") dient, im Rahmen der "psychobiologischen Verfahren", der Psychogalvanometer: ein Gerät zur Messung der, "psychogalvanischen" bzw. "elektrodermalen Reaktion" (PGR/EDR), des elektrischen Hautwiderstandes. (Vgl. dazu ausführlicher KROEBER-RIEL (1992 S. 61ff.) und NIESCHLAG/DICHTL/ HÖRSCHGEN (1994, S. 760ff.). 1 9 9 6 erwähnt ein neu entwickeltes Gerät {Kölner VITAPORT System), „das kaum die Größe eines Handdiktiergerätes hat. Es kann von der Versuchsperson einen ganzen Tag am Körper getragen werden und dabei über 18 Kanäle ein unglaublich breites Spektrum physiologischer Daten aufnehmen. ... Solche Meßdaten sind valider als Daten aus Laboratoriumsexperimenten" (S. 492).

BEHRENS

8. In ähnlicher Weise beruht auf dem Prinzip des "Lügendetektors" die Stimm(frequenz)analyse. (Vgl. dazu etwa BACKHAUS/KLEINSCHMIDT/VOLLMER 1983.) 9. Zur Messung von Emotionen kann auch die Videoaufzeichnung und Analyse von Gestik, Mimik usw. verwendet werden. (Vgl. dazu etwa WEINBERG 1986.) Der Videoaufzeichnung kommt darüber hinaus allgemein eine große Bedeutung zu; so kann sie etwa die oben erwähnte Beobachtung durch Einwegspiegel bei Gruppendiskussionen ersetzen oder ergänzen und auch „Kundenumlaufstudien" im Rahmen der Einzelhandelsmarktforschung - s. dazu in Kap. 17 - dienen.

164

Teil II Methoden der Datengewinnung in der Marktforschung

10. Schon länger bekannt ist das Program-Analyzer-Verfahren. Hierbei bedient man sich zur Feststellung der Reaktion des Probanden eines mit z.B. roten oder grünen Knöpfen versehenen Gerätes, auf dem etwa bei Zustimmung der grüne Knopf, bei Ablehnung der rote, bei Stimmenthaltung dagegen keiner von beiden zu drücken ist. Die Intensität von Zustimmung und Ablehnung kann am verschieden starken Drücken des jeweiligen Knopfes gemessen werden. Als Ergebnis erhält man bei Aggregation über die Zeit ein "Reaktionsprofil", vgl. etwa die Abbildung bei KROEBER-RIEL 1983. Das Institut Compagnon pries, unter der Bezeichnung "wahrnehmungssimultane TVSpot-Wirkungsanalyse", ein Verfahren an, bei dem - statt einer "Tastatur" - mit einem (stufenlos in verschiedener Richtung bewegbaren) Hebel gearbeitet wird.

11. Die Erforschung des TV-Zuschauerverhaltens geschieht heute zunehmend - auch international - im Wege der Meterforschung. (Mitunter spricht man von „Telemetrie". S. dazu im übrigen in Kap.16.) Im Unterschied zu dieser „Seherforschung" steht die „Hörerforschung", die Ermittlung der Radiohörerschaft, bezüglich der apparativen Ausstattung eher noch am Anfang; man experimentierte hier (vgl. dazu Context 1 1 / 9 5 , S. 24ff.) mit einer Art „Armbanduhr", einem Gerät, das von den mitarbeitenden Personen getragen wird und die eingeschalteten Sendungen erfaßt (Probleme: Nebengeräusche, Sendercodierung).

5.2.3 Bestandsaufnahmen und "Spurenanalysen" Bestandsaufnahmen können sowohl bei Händlern als auch bei Verbrauchern erfolgen. Auf ersterem beruht die Idee des - inzwischen weit verbreiteten - Einzelhandels-Panels, während letzteres, der sog. pantry check, mit dem Aufkommen des Verbraucher-Panels eher rückläufig war, mehr als Ergänzung dient. GREEN/TÜLL (1982, S. 41) berichten, daß in den USA auch Hersteller bei Händlern durch ihren Verkaufsaußendienst quasi Bestandsprüfungs-Panels bewirken. S. zu Panels im übrigen Kap. 7.

Spurenanalysen ("physical trace measures") lägen z.B. dann vor, wenn der Verbrauch von alkoholischen Getränken aufgrund der Anzahl von entsprechenden leeren Flaschen im Müll geschätzt werden könnte. Auch der sog. Duke'sche Test, die Sammlung und Zählung der weggeworfenen lee-

Kapitel 5 Die Beobachtung

165

ren Zigarettenpackungen nach einer Großveranstaltung, z.B. einem Fußballspiel, oder an einem Bahnhof zur Ermittlung des Marktanteils der einzelnen Marken, gehört hierher.

5.3 Methodische Probleme 5.3.1 Die Repräsentanz Fragen der Repräsentanz wird zumeist weniger Aufmerksamkeit gewidmet. (Eine Ausnahme bildet BECKER 1973, S. 54-61: Auswahlverfahren in der Beobachtungspraxis.) Fast könnte es scheinen, als ob die Verallgemeinerungsfähigkeit gar nicht recht interessiert. In der Tat sind für bestimmte Arten von Beobachtungen verallgemeinerungsfähige Resultate nur schwer zu erlangen. Das trifft, wie erwähnt, für die teilnehmende Beobachtung zu, aber auch für viele Laboratoriums-Beobachtungen. (Man denke nur an das Gewinnen von Versuchspersonen durch "Baggern"!) Insofern existiert das Problem der Repräsentanz nicht allein wegen der zumal bei Laboratoriums-Beobachtungen - oft kleinen Stichproben. Vielmehr geht es schon um die Frage, wie die "Beobachtungsgesamtheit" zu definieren ist. Bleibt dabei - wie bei der Befragung - auf Personengruppen oder ist vielmehr auf die Zeitdauer abzustellen, muß also die Auswahl von Personen oder von Ereignissen erfolgen? Bildet die Auswahleinheit etwa ein - gegebenenfalls, wie beim "Multimomentverfahren", sehr kleiner - Zeitraum? Verzerrungen können sehr leicht entstehen. Beispiel 5-5 Das Untersuchungsergebnis wird verzerrt sein, wenn zur Lösung der Beobachtungsaufgabe, wie groß der Anteil der Pesonen mit Regenschirmen an der Gesamtzahl der sich unterwegs befindlichen Personen ist, der Beobachter sich am Hauptbahnhof postiert: Es muß angenommen werden, daß Reisende sich hinsichtlich des Mitnehmens von Regenschirmen anders verhalten als die Gesamtbevölkerung. (S. dazu auch A 5-4.)

5.3.2 Beobachtereinfluß und "Beobachtungseffekt" Analog dem Interviewereinfluß bei der Befragung (s. Kap. 4) ist für die Methode der Beobachtung ein Beobachtereinfluß zu konstatieren. Das

166

Teil II Methoden der Datengewinnung in der Marktforschung

war zu erwarten für die (aktiv) teilnehmende Beobachtung, trifft wohl aber auch für die allenfalls passiv teilnehmende Beobachtung zu: Der Beobachter kann sich selektiv den Daten aussetzen oder sie selektiv wahrnehmen. Selbst also dann, wenn der Beobachter nicht sichtbar ist, wird zumindest durch die selektive Wahrnehmung ein Einfluß nicht ausgeschlossen. Allenfalls technische Geräte können (annähernd - s. dazu die Erörterungen bei Lichtschranken oben) "neutral" wirken.

Umgekehrt, auf der Seite des Beobachteten, kann der "BeobachtungsEffekt" eintreten: daß er unter dem Einfluß der Beobachtung sein Verhalten ändert. Es handelt sich hier um eine dem "Panel-Effekt" (s. Kap. 7) analoge Erscheinung. Ahnlich wie bei diesem ist jedoch unklar, welche Rolle er tatsächlich spielt. Bei den Fällen, in denen er nachgewiesen wurde, handelt es sich offenbar mehr nur um Sonderfälle, die "sich auf längerdauernde Erhebungen mit relativ starkem Kontakt zwischen Beobachter und Beobachtetem beziehen" (und insofern für die Marktforschung weniger relevant sind - B E C K E R 1973, S. 40). Grundsätzlich muß man die Gefahr entsprechender Verhaltensänderungen jedoch in Rechnung stellen. Gerade deshalb kommt der - oben erörterten - Ausgestaltung in bezug auf das "Wissen um die Erhebungssituation" (bzw. der "disguised observation" verdeckte Beobachtung) große Bedeutung zu.

Literaturhinweise Über die Methode der Beobachtung - im Kontext der Marktforschung existieren relativ wenige selbständige Schriften. Ergänzend zu den im Text (und in L 5-1) erwähnten Werken, insbesondere BECKER 1973, seien deshalb nur noch genannt: DWORAK 1969 und GRÜMER 1974.

Kapitel 5 Die Beobachtung

167

Aufgaben 5-1: Worin besteht der Unterschied zwischen "teilnehmender" und "nicht-teilnehmender Beobachtung"? 5-2: Das Tachistoskop („Tácheles reden") bildet den Kern eines Verfahrens zur inhaltsanalytischen Interpretation von Gesprächen. Τ / F 5-3: Die teilnehmende Beobachtung ist dadurch gekennzeichnet, daß der Beobachter die Werte der technischen Einrichtungen einstellt, die die besten Beobachtungsergebnisse erbringen. Τ / F 5-4: Worin kann, in Beisp. 5, die Begründung - auch unter dem vorher diskutierten Aspekt der "Zeitdauer" bzw. von "Ereignissen" - dafür gesehen werden, daß sich Reisende anders verhalten?

Kapitel 6 Das Experiment Ähnlich wie im vorigen Kapitel werden im 1. Abschnitt zunächst Begriff und Arten des Experiments diskutiert. Der 2. Abschnitt widmet sich dann ausführlich dem Problem der Versuchsanlage.

6.1 Begriff und Arten Der Begriff des Experiments ist nicht eindeutig. Im allgemeinsten Sinne läßt es sich auffassen als ein Prozeß, in dem eine oder mehrere unabhängige Variable variiert oder kontrolliert und die Wirkungen auf die abhängige(n) Variable(n) studiert werden. Im engeren ("klassischen") Sinne geht es dabei nur um die Auswirkung der Variation eines Faktors auf eine andere Größe (unter Konstanthaltung aller übrigen). Für den Bereich der Sozialwissenschaften allgemein und der Marktforschung speziell erscheint eine solche Definition schon deshalb als zu eng, weil die übrigen Einflußfaktoren entweder gar nicht alle bekannt sind und insofern bereits nicht konstant gehalten werden können oder dies unmöglich ist, da es sich nicht um "Laborexperimente" (s. dazu unten) handelt. Es bedarf deshalb einer begrifflichen Erweiterung. Im Sinne der - in Kap. 2 erörterten - Unterscheidung zwischen Elementen und deren Merkmalen, den Variablen, sind dabei folgende Größen von Bedeutung: 1. (Test^Elemente - "test units" - sind die "Objekte" des Experiments: je nach Sachverhalt Personen, Geschäfte usw. 2. Variable: a) Abhängige Variable sind die Größen, bei denen die Messung der Wirkungen des "Testfaktors" erfolgt (also z.B. der Umsatz). b) Diese Testfaktoren stehen als unabhängige Variable. Das können mehrere sein. Außerdem kann jeder Testfaktor in verschiedenen Ausprägungen - alternative Werbemittel, Verpackungsgrößen usw. vorkommen. Dafür wird oft auch, entsprechend dem anglo-amerikanischen Usus, die Bezeichnung " Treatments" benutzt. Diese ist jedoch nur für Versuchspläne mit einem Faktor eindeutig. Bei mehreren könnte sie leicht mit diesen gleichgesetzt werden; man spricht deshalb auch von "Treatment-Ausprägungen" (oder "-Niveaus",

e n t s p r e c h e n d d e m englischen "level"); a u c h die B e z e i c h n u n g

Stufen" wird verwandt.

"Faktor-

Kapitel 6 Das Experiment

169

Neben den Testfaktoren übt auch eine - u.U. größere bzw. unbekannte - Anzahl anderer Größen Einfluß aus: die sog. Störvariablen. Sie können auch nur implizit, im "Störterm", erfaßt werden.

Damit sind im Grunde schon die verschieden Arten von Experimenten angesprochen: Nach der grundsätzlichen Anlage kann man zwischen "klassischen" Experimenten (solche im engeren Sinne, bei denen nur eine Größe variiert wird) und "erweiterten" Experimenten (mehrere Varianten eines Faktors, evtl. auch mehrere Faktoren) unterscheiden. Für den Charakter eines Experiments ist es von großer Bedeutung, daß dabei dem Prinzip der Randomisierung gefolgt wird. Unter Randomisierung kann man allgemein eine Zufallsauswahl verstehen - bei der Stichproben-Ziehung generell in dem Sinne, daß sie "repräsentativ" für die Grundgesamtheit steht. Bei Experimenten speziell bedeutet dies, daß die untersuchten Gruppen jeweils Zufalls-Stichproben und damit untereinander vergleichbar sind. In etwas anderer Betrachtungsweise stellt sich das dar als die zufällige Verteilung der Test-Elemente auf die verschiedenen Treatments ("Zufallszuweisung"). Dies führt zum - von CAMPBELL/STANLEY ( 1 9 6 3 / 6 6 ) herausgearbeiteten Begriff des Quasi-Experiments (und seiner Entgegensetzung zum echten "true" - Experiment; eine dritte Gruppe bilden die vorexperimentellen Versuchsanordnungen). Im strengen Sinne ist es allein durch das Fehlen der Randomisierung gekennzeichnet. (COOK/CAMPBELL [ 1 9 7 9 ] , S. 6 : "Experiments that have treatments, outcome measures, and experimental units, but do not use random assignment"; s. auch die Bedeutung von R in der Symbolik unten.) In einer etwas weiteren Fassung gehört das Fehlen einer vollständigen Kontrolle überhaupt dazu (z.B. hinsichtlich des Experimental-Faktors von Kontrollgruppen). In diesem Sinne weichen Quasi-Experimente "nur graduell von echten Experimenten im Hinblick auf das Ausmaß der Kontrolle ab. Dabei ist es eine Frage der Konvention, wie weitreichend derartige Kompromisse sein dürfen, um noch von einem Quasi-Experiment sprechen zu können." (BÖHLER 1992, S. 46.) Letztlich wird damit die Einteilung unscharf. Sie soll deshalb auch nur ergänzend bei der Klassifizierung der Versuchsanlagen (im nächsten Abschnitt) herangezogen werden.

Auf die Einteilung (1) nach der grundsätzlichen Anläge ("klassische" vs. "erweiterte" Experimente) und (2) nach dem Charakter ("echte" vs. "Quasi-Experimente") wird in Abschnitt 2 näher eingegangen. Hier sollen noch kurz einige weitere Arten unterschieden werden:

170

Teil III Methoden der Datengewinnung in der Marktforschung

(3) Nach der Art der Erhebung der Auswirkung der Testfaktoren kann man differenzieren zwischen Befragungs- und Beobachtungsexperimenten. Zumal dies schon Erwähnung fand, wird hierauf nicht weiter rekurriert. (4) Nach den Bedingungen, unter denen das Experiment stattfindet, kann unterschieden werden zwischen Laboratoriums-Experiment, dem Experiment unter "künstlichen" Bedingungen, und dem /¿/¿/-Experiment, dem unter gegebenen natürlichen Bedingungen, im "normalen Umfeld", durchgeführten Experiment. Letztlich geht diese Unterscheidung darauf zurück, ob die Versuchspersonen wissen, daß mit ihnen ein Experiment vorgenommen wird, oder nicht (und deshalb auch entsprechend mehr oder weniger befangen sind). S. dazu auch oben, bei der Beobachtung. (5) Nach der Art und Weise der Bedingungskontrolle wird mitunter in "projektives" und "ex-post-facto"-Experiment eingeteilt. Letzteres liegt dann vor, wenn diese nachträglich "durch auswertungstechnische Operationen" erfolgt. (SCHREIBER 1966, S. 92. Vgl. zur Begründung des expost-facto-Experimentes insbesondere auch GREENWOOD [1945 und 1972].) Der Verf. ist allerdings der Meinung, daß es sich dabei um gar kein "richtiges" Experiment ("a misleading one" - CAMPBELL/STANLEY [1963/66] handelt: Bloß "auswertungstechnische Operationen" können nicht - quasi rückwirkend - eine Untersuchung in eine solche experimentellen Charakters (bei der eben, wie unten zu besprechen, gerade das Problem der Versuchsanlage eine entscheidende Rolle spielt) verwandeln. S. 6 0 ) bemerkt - unter Verweis auf SCHULZ ( 1 9 7 0 , S. 9 3 ) -, daß man dafür gar nicht die Bezeichnung „Experiment", sondern „post-iaaum-Analyse" verwenden sollte.

RING ( 1 9 9 2 ,

(6) Von größerer Bedeutung erscheint die Einteilung nach dem zeitlichen Aspekt in Sukzessiv- und S¿w2«/í gilt insgesamt folgende Formel: t'emp (mit 2p - 2 Freiheitsgraden)

(6.1)

Teil III Methoden der Datengewinnung in der Marktforschung

176

Beispiel 6-1 In einem Experiment haben sich die beiden Gruppen-Mittelwerte x, = 10,77 und x 2 = 8,80 (und die Varianzen s^ = 3,20, s 2 2 = 3,61; Gruppengröße - 3) ergeben; die Differrenz ist auf Signifikanz zu testen (α = 0,05). _ """

|l0,77-8,80|

1,9 7

^(3,20 + 3 , 6 0 / 3

1,51

'

Bei df = 2 - 3 - 2 = 4 und dem angegebenen Signifikanzniveau resultiert gemäß Darst. T-l im Anhang 13,975(4) = 2,78. Die Nullhypothese kann also nicht abgelehnt werden; die vorgefundene Differenz ist nicht signifikant. Zum Test von Proportionen

s. auch in Kap. 10 (speziell A 15).

6.2.2 "Erweiterte" Experimente Die bisher geschilderten Versuchsanordnungen enthielten nur einen Testfaktor, der zudem nicht in verschiedenen Ausprägungen vorkam. Zwar kann die Unterscheidung in "vom Testfaktor Erreichte" und "vom Testfaktor nicht Erreichte" als die Anwendung zweier verschiedener Treatments gedeutet werden (eines davon quasi in "Null-Stärke"). Die Erweiterung auf mehrere Treatment-Ausprägungen und zusätzlich eventuell Faktoren beinhaltet im Grunde jedoch ein anderes Konzept als das "klassische" (die Variation einer Größe und Konstanthaltung aller übrigen). Deshalb auch ist die bisherige Darstellungsweise - in ihren beiden Formen - nicht mehr recht anwendbar. (Dagegen bleibt der - der Unterscheidung in "echte" und "Quasi"-Experimente letztlich zugrunde liegende - Gedanke der Randomisierung erhalten; das wird unten noch deutlich werden.) Die formale Methode der Auswertung ist ebenfalls eine andere: die "Varianzanalyse". Sie wird in Kap. 11 behandelt. Die nachstehenden Ausführungen beschränken sich auf die Anlage von Experimenten. Dabei kann danach differenziert werden, ob sich die Betrachtung nur auf einen (Test-)Faktor bezieht oder deren mehrere. Entsprechend könnte man zwischen ein- und me^rfaktoriellen Plänen unterscheiden. In der Literatur wird jedoch vereinfachend oft auf eine Kennzeichnung

Kapitel 6 Das Experiment

177

verzichtet, wenn es sich um "einfaktorielle Pläne" handelt. Dieser Praxis wird auch bei der Vorstellung der "Standard-Designs" (vollständiger Zufallsplan, zufälliger Blockplan, Lateinisches Quadrat, faktorielle Pläne) gefolgt; im Anschluß daran werden einige Varianten erörtert. 1. Beim vollständigen Zufallsplan finden "Störeinflüsse" indirekt dadurch Berücksichtigung, daß für die verschiedenen Treatments wiederholte Messungen ("Replikationen") nach dem Prinzip der Randomisierung durchgeführt werden. Schematisch ergibt das die Anordnung gemäß Darst. 6-1. ^^^^Treatments ι

... j

·•· m

1 • •

xu • •

. . . X,j • •

...

i• • •

XU • •

. . . *ij • • •

· · · *im • •

P

V

···

· "

χI

. . . Xj

Replikationen^\_



Spaltenmittel





pj

•lm •





x

x



. . . *m

Dar st. 6-1: V o l l s t ä n d i g e r Z u f a l l s p l a n Man kann dabei unterscheiden, ob die (Wiederholungs-) Messungen bei den gleichen oder jeweils anderen Test-Elementen (Personen, Perioden, Geschäfte usw.) erfolgen. Ist ersteres der Fall (man spricht dann auch von "repeated measures" - "Repetition" statt "Replikation"!), so sind die einzelnen Messungen nicht mehr voneinander unabhängig, was bei der Auswertung berücksichtigt werden muß. Dies stellt im Grunde jedoch schon eine Variante dar - s. dazu auch unten -; hier wird davon ausgegangen, daß es sich um jeweils andere Elemente handelt (deshalb auch "Replikation" statt "Element" in der Vorspalte). Insbesondere ist der "vollständige Zufallsplan" nicht so zu verstehen, daß jedes Treatment bei jedem Element gemessen wird; vielmehr kommt auf jedes Treatment - nach dem Zufallsprinzip - lediglich eine bestimmte (in obiger Darstellung: gleiche - s. auch unten) Anzahl von Elementen. Beispiel 6-2 Das obige Beispiel 1 kann inhaltlich auch so gedeutet werden, daß der Erfolg von 2 alternativen Werbeprogrammen ( = Treatments) zu messen ist. S. dazu auch Kap. 11.

Teil III Methoden der Datengewinnung in der Marktforschung

178

Beispiel 6-3 Der Einfluß der alternativen Placierung einer Hundefuttermarke in einem Supermarkt ist zu messen: 3 Regalhöhen ( = Treatments) sollen 8 Tage lang ( = Replikationen) - in zufälliger zeitlicher Verteilung - variiert werden, so daß sich insgesamt 24 Messungen ergeben. (GREEN/TULL 1982, S. 2338ff.)

2. Die vorstehenden Beispiele zeigen, daß keine der möglichen Störvariablen - hier insbesondere Perioden und vor allem Geschäfte - explizit berücksichtigt war. Es liegt jedoch die Annahme nahe, daß die Verschiedenartigkeit zwischen den einzelnen Geschäften oder Perioden beachtlich ist. Man kann sich deshalb bemühen, die Effizienz der Versuchsanlage zu verbessern, indem man eine Zusammenfassung zu Blöcken vornimmt. (Voraussetzung ist allerdings, daß die Variabilität innerhalb dieser "Blöcke" geringer ist als die zwischen ihnen.) Damit wird auch die Berechnung von Zeilen-Mittelwerten sinnvoll. Auf Replikationen kann verzichtet und trotzdem die varianzanalytische Trennung der beiden Variablen - allerdings ohne die Möglichkeit der Berücksichtigung von Interaktionen - durchgeführt werden. Schematisch ergibt sich der zufällige Blockplan gemäß Darst. 6-2.

Treatments Blöcke 1 • • • k • *•

1

·< • J

· 1• m

xu •

·< •

X lj

• • •

· '"

x lm

Xtj • • •

· ."

xkm

• •

*kl • ·· . . • •

η Spaltenmittel

•·

• • •

• • •

*nj ·

Xjim

• X j · '·

*m

Zeilenmittel

X, • • • x k.

• • •

X ( = x)

Darsi. 6-2: Zufälliger Blockplan Beispiel 6-4 Die Messung des Erfolgs der 2 alternativen Werbeprogramme (Treatments) soll in 3 verschiedenen Gebieten - "Testmärkten" - geschehen; diese werden als Blöcke aufgefaßt. S. dazu A 6-2.

Kapitel 6 Das Experiment

179

Beispiel 6-5 In Abwandlung des obigen Beispiels von Green/Tull ließe sich ein Block-Design etwa dadurch verwirklichen, daß die Messungen des Einflusses der einzelnen Regalhöhen in verschiedenen - als Blöcke definierten - Geschäften vorgenommen werden. Dabei ist zu beachten, daß durch den Verzicht auf Randomisierung auch der Charakter als "echtes" Experiment verloren geht; "Blocking" - man spricht dann oft von "Matching" - kann also durchaus auch an vorgegebenen ("nonequivalent") Gruppen erfolgen. Ferner sei darauf hingewiesen, daß - wie beim vollständigen Zufallsplan - das Design nicht quadratisch sein muß. Auch sind etwa die unterschiedlichen Zeiten (Perioden) noch immer nicht berücksichtigt.

3. Beim Lateinischen Quadrat (Latin Square) kann dagegen eine weitere Variable, also etwa eine zweite Störgröße, berücksichtigt werden. Der Name rührt daher, daß einerseits die Treatments üblicherweise mit - großen - lateinischen Buchstaben bezeichnet werden, andererseits die Ausprägungen aller drei Variablen in ihrer Anzahl einander entsprechen. (Die Zahl der Messungen ist also gleich dem Quadrat der Anzahl der Ausprägungen jeder Größe; s. dazu das folgende Beispiel und A 6-3.)

Das Design stellt im Grunde eine Ausbalancierung dar - dergestalt, daß die Treatments so zugeteilt werden, daß sie in jeder Spalte wie auch Zeile nur einmal vorkommen. Beispiel 6-6 Werden 3 Treatments (ζ. Β. Regalhöhen) in 3 Geschäften zu 3 verschiedenen Zeiten getestet, so ergibt sich etwa die Anordnung gemäß Darst. 6-3.

1

1

A

2

Β

3

C

2

B

3

C

C A

A B

Darst. 6-3: Lateinisches Quadrat (Beispiel)

Beispiel 6-7 4 Produktvarianten

werden in 4 verschiedenen Gebieten und Geschäften getestet.

180

Teil III Methoden der Datengewinnung in der Marktforschung

4. Faktorielle Pläne ermöglichen die Untersuchung von mindestens 2 (Test-)Faktoren und der Interaktion zwischen ihnen. Das setzt verschiedene Messungen für die jeweilige Faktorenkombination voraus. Im einfachsten Falle, beim vollständigen bifaktiorellen Zufallsplan mit gleicher Anzahl von Replikationen, ergibt sich schematisch die Anordnung gemäß Darst. 6-4. 2. Faktor Treatments 1

k η

1. Faktor ^Treatments 1 Replikatu? •—. nen X 1 IU 1 x lü x Ρ lpl x 1 kll x 1 tíl x Ρ kpl x 1 nll 1 "nil x Ρ npl

i

m

x

x

x

x

llj lij X lpj x ldj x kij X

kD¡

x

nlj nij x npj x

llm lim x lpm x

klm lrim x kpm x nlm x nim x npm X

Dar st. 6-4: Vollständiger bifaktorieller Zufallsplan Die Dimension eines faktoriellen Experiments wird durch die Anzahl der Ausprägungen bezeichnet. Im obigen Falle handelt es sich demgemäß um ein m χ n-Design. Auf den dritten Index, für die Wiederholungen, ist hier verzichtet worden - zumal gleiche Häufigkeiten in den einzelnen Zellen unterstellt sind. Bezeichnet man die Replikationen wiederum mit p, so ergibt sich die erforderlichen Anzahl von Messungen beim m χ n-Design als ρ χ m χ η. Beispiel 6-8 Wird neben der "Regalhöhe" (mit 3 Ausprägungen: Kniehöhe, Taillenhöhe, Augenhöhe - auch die "Regalfülle" - mit 2 Ausprägungen: voll und halb) getestet, so ergeben sich bei 3 Replikationen insgesamt 3 x 2 x 3 = 18 Messungen.

Die Kategorie der "faktoriellen Pläne" liegt auf einer anderen Ebene als die vorher besprochenen 3 Designs; deshalb ist auch eine Kombination möglich. Schon insofern ergibt sich bereits bei den bisher ausschließlich betrachteten vollständigen Plänen die Möglichkeit der Bildung von Varianten.

Kapitel 6 Das Experiment

181

Beispiel 6-9 Es lassen sich vollständige faktorielle Blockpläne konstruieren. Die 3 Replikationen von Beisp. 6-8 können als "Blöcke" aufgefaßt (und ausgewertet) werden. S. dazu A b b . 6-7 b e i H ü i T N E R 1979, S. 144.

Varianten ergeben sich, wie erwähnt, auch dadurch, daß die Zahl der Messungen für die einzelnen Treatments verschieden ist. Beispiel 6-10 (1991, S. 114ff.) bringen ein Rechenbeispiel, mit Varianzanalyse, für einen vollständigen (einfaktorìellen) Zufallsplan mit ungleicher Stichpro· bengröße; sie betrug, für die vier Treatments, 6, 5, 8 und 7. WINER/BROWN/MICHELS

Ferner läßt sich das Prinzip des Lateinischen Quadrats ausdehnen. Beispiel 6-11 So spricht man vom griechisch-lateinischen Quadrat, wenn eine 4. Größe - mit (kleinen) griechischen Buchstaben bezeichnet - eingeführt wird. S. dazu Abb. 6-9 bei H ü T T N E R 1979, S. 145.

Als hyperlateinische Quadrate werden solche mit noch mehr Variablen bezeichnet.

Die Versuchsanlage läßt sich vereinfachen durch unvollständige Pläne . Beispiel 6-12 Das Youden Square ist ein unvollständiges Lateinisches Quadrat, bei dem die "quadratische Eigenschaft" - die gleiche Anzahl der Ausprägungen - nur für zwei der drei Variablen gegeben zu sein braucht. Die erforderliche Ausbalancierung geschieht am zweckmäßigsten durch Weglassen einzelner Zeilen oder Spalten aus dem konstruierten vollständigen Quadrat. S. dazu als Beispiel Abb. 6-11 und 6-12 b e i HÜTTNER 1 9 7 9 , S . 1 4 6 .

Zu unvollständigen faktoriellen Plänen s. auch in Kap. 13 und die dort erwähnten „Basispläne" von ADDELMAN (1962).

Andererseits muß man eine kompliziertere Versuchsanlage wählen, wenn damit zu rechnen ist, daß (zeitlich) aufeinander folgende Messungen nicht unabhängig voneinander sind, also "carry-over-Effekte" vorliegen. Beispiel 6-13 Ein "Double-Change-Over "-Design ist etwa dann gegeben, wenn einem ersten vollständigen Quadrat ein zweites folgt, daß quasi komplementär angelegt wurde. S. dazu Abb. 6 - 1 3 bei HÜTTNER 1 9 7 9 , S. 1 4 7 .

182

Teil III Methoden der Datengewinnung in der Marktforschung

Literaturhinweise Die Literatur über Experimente ist umfangreich und vielgestaltig. Ein Teil davon befaßt sich - mehr grundsätzlich - mit deren Anlage; s. etwa die im Text genannten Werke von CAMPBELL/STANLEY 1 9 6 3 / 6 6 und ZIMMERMANN 1 9 7 2 . Ein anderer Teil hat stärker die - statistisch-mathematische - Auswertung zum Gegenstand; einige dieser Bücher werden im Zusammenhang der Varianzanalyse (in Kap. 12) genannt. Hier zu erwähnen bleiben noch einige Schriften, die sich speziell mit Experimenten im Kontext Marketing/Marktforschung beschäftigen: BANKS 1 9 6 5 , Cox/ ENIS 1 9 6 9 u n d STEIDL 1 9 7 7 .

Aufgaben 6-1: Ein Psychologe untersucht die Wirkung von Koffein auf die Leistung von Studenten mittels video-aufgezeichneter Interviews. 30 Studenten wurden eine Stunde nach Erhalt eines Placebo's interviewt. Einen Monat später wurden dieselben Studenten eine Stunde danach interviewt, nachdem sie 100 mg Koffein erhalten hatten. Wiederum einen Monat später wurden diese Studenten interviewt, diesmal eine Stunde nach Aufnahme von 350 mg Koffein. Folgende durchschnittlichen Leistungs-Bewertungen wurden erzielt: Placebo 100 mg Koffein 250 mg Koffein

20,7 34,5 41,9

a) Falls die Analyse einen signifikanten Effekt ergibt, ist dies als Beleg für die Steigerung der Leistungsfähigkeit durch Koffein zu interpretieren? b) Wäre ein besseres experimentelles Design vorzuschlagen? (Quelle: Norusis, M. /., SPSSX Advanced Statistics Guide, New York 1985, S. 292.) 6-2:

Stellen Sie die Meßwerte von Beisp. 6-4 (ohne die Mittelwerte) schematisch dar!

6-3: Wieviel Messungen erfordert ein Lateinisches Quadrat mit 6 „Treatments"?

Kapitel 7 Das Panel Das Panel stellt insofern eine Besonderheit dar, als die Erhebung der (Primär-)Daten sowohl mittels Befragung als auch Beobachtung erfolgen kann. Es vermag zudem als Experiment angesehen zu werden (und zwar als spezielle Variante des "before-after-Designs"). Wegen dieser Sonderstellung scheint die Behandlung in einem eigenen Kapitel geboten. Im 1. Abschnitt wird dabei zunächst auf den Begriff und die verschiedenen Arten eingegangen. Im Abschnitt 2 werden einige Aspekte der technischen Durchführung erörtert. Der 3. Abschnitt ist methodischen Problemen (Repräsentanz und - vieldiskutiert - "Panel-Effekt") gewidmet.

7.1 Begriff und Arten Den Begriff des Panels kann man wie in den früheren Auflagen dieses Buches fassen: als einen bestimmten, gleichbleibenden, repräsentativen Kreis von Auskunftspersonen, der über eine längeren Zeitraum hinweg fortlaufend oder in gewissen Abständen über im Prinzip den gleichen Gegenstand befragt wird. (S. dazu auch A 7- 2.) Die Anwendung der Technik auf die empirische Sozialforschung bzw. Markt- und Meinungsforschung erfolgte in den USA während der 20er und 30er Jahre. Die erste systematische Darstellung, unter Verwendung der Bezeichnung "Panel", gaben LAZARSFELD/FISKE (1938). Nach dem Kriege fanden Methode und Terminus auch in der Bundesrepublik Eingang. Von der amtlichen Statistik wurde der Begriff bis heute allerdings nicht übernommen, obwohl hier seit längerem auf einen bestimmten Zeitraum begrenzte oder im Prinzip unbefristete "Wirtschaftsrechnungen" - später auch: "Einkommens- und Verbrauchsstichproben" -, üblich sind. Stichproben allerdings, die nur einige Male (und noch dazu vielleicht mit unterschiedlichen Themenkreisen) befragt werden, sind besser nicht zum Begriff des Panels zu rechnen; s. auch "Tendenzfrage", in Kap. 6.

In der Praxis hat sich im Laufe der Zeit eine ganze Reihe von Arten des Panels herausgebildet. Sie können gemäß Darst. 7-1 schematisch zusammengefaßt werden.

184

Teil II Methoden der Datengewinnung in der Marktforschung

Panel

Verbraucher-Panel

Händler-Panel

EinzelhandelsPanel

GroßhandelsPanel

allge- speziell (z.B. mein Drogerien, Apotheken)

VorverbraucherPanel (z.B. Handwersbetriebe, Baufirmen)

Haushalts-Panel (allgemein)

VerbrauchsgüterPanel

GebrauchsgSterPanel

Spezial-Panel (z.B. Produkttest, Hörer- u. SeherForschung)

EndverbraucherPanel

EinzelpersonenPanel

allgemein

speziell (z.B. Autobesitzer, Hausbesitzer)

Darst. 7-1: grundsätzliche Arten des Panels Dazu noch zwei Anmerkungen: 1. Das Einteilungskriterium ist nicht einheitlich; Spezial-Panels sind nicht nach dem Befragtenkreis, sondern nach der Zielsetzung abgegrenzt. Im Unterschied zu den anderen Arten tragen sie also ihre Bezeichnung nach dem speziellen Zweck, dem sie die-

2. Endverbraucher-Panels werden gelegentlich, dem angloamerikanischen Sprachgebrauch folgend, auch als "Consumer-Panels" bezeichnet. Daneben kann man dann auch noch von Gro/?verbraucher-Panels (Kantinen, Anstalten usw.) sprechen; sie spielen aber bislang - jedenfalls im Vergleich zur erstgenannten Form - eine vergleichsweise geringe Rolle.

Händler-Panels sind zunächst als Großhandels-Panels möglich. Solche werden eher selten durchgeführt. ("In Deutschland sind das GfK-Cashand-Carry-Panel, der Nielsen-Lebensmittel-Sortimentsgroßhandels-Index und das GfK-Elektrogroßhandels-Panel" erwähnenswert - BÖHLER 1992, S. 62.)

Einzelhandels-Panels existieren in verschiedenen Formen. Die wichtigste davon ist das allgemeine Einzelhandels-Panel - allgemein in dem

Kapitel 7 Das Panel

185

Sinne, daß nicht von vornherein eine Begrenzung auf einige oder wenige Warengruppen erfolgt, sondern grundsätzlich eine größere Anzahl davon in Betracht kommt. Diese Panel-Art wurde von der Firma Nielsen in der Bundesrepublik eingeführt (S. dazu noch unten.) Später hat auch die Gfl(. ein derartiges Panel aufgebaut. Daneben entstanden zunehmend spezielle Panels (auch als FachhandelsPanels bezeichnet). Sie werden von verschiedenen Instituten für diverse Branchen unterhalten. So gibt es etwa Panels für Apotheken, Drogerien und verwandte Bereiche beim Institut für Medizinische Statistik (IMS). Weiter existieren Panels z.B. für Farbenfachgeschäfte und für Schreibwaren, aber auch für Elektrogeräte bzw. Unterhaltungselektronik. Neuerdings spielt dabei immer stärker auch die telefonische Befragung eine Rolle. Panels solcher Art beziehen sich weniger auf Meinungen, Wünsche usw. der Händler selbst als vielmehr auf die bei diesen vorhandenen Lagervorräte, die aus den Rechnungen hervorgehenden Ein- und Verkäufe etc. Damit stehen sie gewissermaßen stellvertretend für LetztverbraucherBefragungen. Der große Vorzug speziell des Einzelhandels-Panels liegt gerade darin, daß statt der Ankäufe vieler Konsumenten die Verkäufe weniger Einzelhändler (da ein Händler eine Vielzahl von Verbrauchern beliefert) erfaßt werden! Demgegenüber muß man als Nachteil ansehen, daß zumeist ζ. B. weder Waren- noch Versandhäuser einbezogen sind. Damit ist das Problem der "Abdeckung" (Coverage) angesprochen: ein Problem, daß im Grunde für sämtliche Arten von Panels - wenngleich, nach konkreter Ausgestaltung, mehr oder weniger stark - besteht. Verbraucher-Panels können, wie dargestellt, zunächst als Vorverbraucher-Panels vorkommen. Dazu gehören z. B. Panels mit Autoreparaturbetrieben, Fliesenlegerbetrieben, Heizungsinstallateuren, landwirtschaftlichen Betrieben, Möbelfabriken. Sehr viel stärker im Vordergrund stehen jedoch Endverbraucher-Panels, insbesondere in Gestalt des (allgemeinen) Haushalts-Panels. Dabei ist der gesamte Haushalt - vertreten zumeist durch die "haushaltsführende Person", zumeist die Hausfrau - Untersuchungsgegenstand. Diese Form eignet sich also grundsätzlich für alle Waren, die gemeinsam vom Haushalt (und nicht so sehr von einzelnen Mitgliedern desselben) verbraucht werden. Erfaßt wird allerdings im Grunde nicht der Verbrauch,

186

Teil II Methoden der Datengewinnung in der Marktforschung

sondern der Einkauf. (Insofern stellen sie gewissermaßen das Spiegelbild des Einzelhandels-Panels dar. S. auch zur technischen Durchführung unten.) A m weitesten verbreitet ist dabei das Verbrauchsgüter-Panel, das sich quasi auf die Güter des täglichen Bedarfs bezieht. Demgegenüber sollen Gebrauchsgüter-Panels "langlebige Konsumgüter" erfassen. Einzelpersonen-Panels (auch "Individual-Panels" genannt) sind immer dann angebracht, wenn der Gegenstand des Verbrauchs nicht so sehr den gesamten Haushalt betrifft, sondern jedes Haushaltsmitglied weitgehend selbst als Käufer auftritt. Solche Panels können einerseits in der Weise durchgeführt werden, daß die ausgewählten Personen (meist: männlich und weiblich getrennt) ihre Einkäufe bezüglich einer ganzen Reihe von üblicherweise nicht im Gesamtverband des Haushalts verbrauchten Waren festhalten, also in einer eher allgemeinen Art. Andererseits kann eine mehr spezielle Durchführung erfolgen in der Weise, daß von vornherein Verbraucher bestimmter Güter ausgewählt werden (ζ. B. Autobesitzer-Panels, „Raucher-Panels" usw). Als Spezial-Panels werden hier, wie dargelegt, solche Panels bezeichnet, die besonderen Zwecken dienen. (In bezug auf den Personenkreis handelt es sich zumeist um Haushalts- oder Individual-Panels.) Dazu gehören vor allem speziell eingerichtete Panels für den Test von Produkten und zum Zweck der Mediaforschung. Produkttest-Panels unterhalten in der Bundesrepublik verschiedene Institute. S. zum Produkttest ausführlich in Kap. 15. (Vgl. dort auch zum "Mini-Testmarktverfahren", für das sich quasi eine neue Form entwickelt hat: das Mini-Testmarkt-Panel.) Zu Panels in der Hörer- und Seherforschung s. 16.2.

7.2 Technische Durchführung Allgemein zur technischen Durchführung von Panels kann zunächst festgestellt werden, daß dabei, wie im Grunde bei jeder Erhebung, drei große Abschnitte zu unterscheiden sind: 1. Vorbereitung und Aufbau des Panels, 2. Erhebung des Materials, 3. Aufbereitung und Darstellung der Ergebnisse. Andererseits bedingt das Panel technische Besonderheiten, die die Panelforschung - im Unterschied zur "ad hoc-Forschung" - als Sondergebiet der Marktforschung (mit meist darauf spezialisierten Instituten wie Nielsen und GfK Panel Services) erscheinen lassen. Im folgenden werden zunächst zwei wichtige Arten behandelt, das Einzelhandels- und das

Kapitel 7 Das Panel

187

Verbraucher-Panel. Dabei ist die „traditionelle" Art der Durchführung von der durch die neuere technische Entwicklung bedingten zu unterscheiden: Zusätzliche Möglichkeiten wurden durch das Scanning eröffnet. Ein „Scanner" ist ein elektronisch-optisches Lesegerät. Im absatzwirtschaftlichen Kontext werden Scanner insbesondere als Instrument zur Erfassung der auf Verpackungen angebrachten Strich- und Balkencodes (hier gemäß ΕΑΝ: Europäische - heute: „Internationale" - Artikel-Numerierung) eingesetzt. Dabei steht die Verwendung am „Point of Sale" (POS) an vorderster Stelle: Das Kassenterminal der Kassiererin im Supermarkt ist mit einem Rechner verbunden, der einerseits die zugehörigen Preise aus einer entsprechenden - leicht aktualisierbaren - Datenbank liefert und andererseits die „artikelgenaue Registrierung" ermöglicht. Durch - vertragliche - Zusammenfassung mehrerer Einzelhändler kann ein Haní/e/spanel geschaffen werden. Mit der Entwicklung von „Handscannern" kam man auf die Idee, Verbraucher mit solchen Geräten auszustatten und so eine neue Form der Verbraucberpznels zu schaffen („Inhome-Scanning"). Ein weiterer - schon sehr früh skizzierter (vgl. etwa SIMON/KUCHER/SEBASTIAN 1 9 8 2 ) - Schritt ist die Verbindung des Scanning-Einzelhandelspanels mit einem Verbraucherpanel in der Art, daß ausgewählte Kunden „Identifikationskarten" mit einigen soziodemographischen Merkmalen - erhalten und beim Einkauf vorlegen (gegen gewisse Gratifikationen). Ein anderer Schritt zum Prinzip der „Daten aus einer Hand" könnte dadurch erfolgen, daß das Medien-Verhalten einbezogen wird. Das seit einiger Zeit diskutierte Prinzip des Single Source liegt also in der Verbindung von Verbrauchs- mit Mediennutzungsdztea. (als quasi einer besonderen Art des Konsums). Damit kann man wichtige Panel-Arten nach der technischen Durchführung gemäß Darst. 7-2 (folgende Seite) zusammenfassen. Auf die bereits oben, in Kap. 4, erwähnte Möglichkeit von Online-Panels wird hier nicht weiter eingegangen. Ganz abgesehen davon, daß es sich dabei wieder im Grunde nur um eine besondere Art der technischen Durchführung handelt, spricht man das schon genannte Problem der Repräsentanz derzeit (noch) gegen die Durchführung allgemein gültiger Erhebungen; wird dagegen nur auf das Verhalten der Internet-Nutzer abgestellt, so wiegen die Bedenken zweifellos weniger schwer. So verwundert es denn nicht, daß - man denke an die Zeit- und Kostenersparnis - solche Panles zunehmend in Erscheinung treten. Bezüglich der Rekrutierung kann man zwischen

188

Teil II Methoden der Datengewinnung in der Marktforschung

passiver (allein durch entsprechende Web-Sites) und aktiver (auch auf andere Weise) unterscheiden.

Panel

EinzelhandelsPanel

traditionell

Scanning-Panel ("POS-Scanning")

VerbraucherPanel

traditionell

POS-Scanning mit ID-Kaite

Single-Source-Panel

Scanning-Panel ("Inbome-Scanmng")

Darsi. 7-2: wichtige Panels nach der technischen Durchführung Verbraucher-Panels als Haushaltspanels werden heute in großem Umfange von der GfK durchgeführt. (Zum entsprechenden Panel von Nielsen, insbesondere zu „Single Source", s. unten.) In der traditionellen Form entstanden sie - nach dem Auslaufen des „Attwood-Panels" 1973 - als Gemeinschaftsgründung von Gß( und Infratest unter der Bezeichnung G&I" (und nach der Übernahme aller Anteile und Umgründung unter dem heutigen Namen). Unterhalten wurden danach zunächst zwei getrennte - aber addierbare - Panels mit je 7000 Haushalten, die wöchentlich berichteten. Darst. 7-3 (folgende Seite) gibt einen Auszug aus dem „Einkaufsbericht". Er wird hier in gewisser Weise eher aus „historischen Gründen" (man beachte auch das Datum im Kopf der Abbildung!) wiedergegeben, insbesondere um die Detaillierung des „Abfrageprogrammes" zu zeigen. (Es geht natürlich über Nahrungs- und Genußmittel hinaus und umfaßt weiter etwa Körperpflegemittel und Waschmittel, aber auch Bücher, Spielwaren und Uhren, insofern auch „Gebrauchsgüter".) In zunehmendem Maße tritt nunmehr das - schon erwähnte - „Scanning" in den Vordergrund. Schon ab 1995 wurde nur noch eines der beiden Panels in der traditionellen Form geführt, das andere dagegen bereits als „Inhome-Scanning-Panel", mittels Electronic Diary. Es handelt sich dabei um ein Datenerfassungsgerät - äußerlich einem großen Taschenrechner ähnelnd -, das Handscanner, Kleincomputer und Modem in sich vereinigt. Mittels des Scanners werden die ΕΑΝ-Codes gelesen; „Daten von Produkten ohne ΕΑΝ-Code sind auf dem Speicher des Geräts hinterlegt, ebenso die Artikel der Handelsketten Aldi und Norma" (aus einem Firmenprospekt); mittels des Modems erfolgt die Datenfernübertragung (per Abruf).

Kapitel 7 Das Panel ICD

¡Sí o> £ tn S 22 fil

ili s 1 1;1° 331 11 · «ài

CM

O)

CO

ä

CD

^

l i

x

189

190

Teil II Methoden der Datengewinnung in der Marktforschung

Derzeit existieren „postalische" Panels eher nur als „Spezialstichproben"; im Mittelpunkt steht das GfK-„ConsumerScan" mit 12000 privaten deutschen Haushalten (und diversen Sonderformen). Single Source, als Ansatz zur unmittelbaren Verbindung von Verbrauchs- mit Mediennutzungsdaten wurde am konsequentesten von Nielsen propagiert. Bereits 1992, bei der offiziellen Vorstellung in Leipzig war von 6000 Haushalten die Rede. Ein Kernstück stellte schon damals die Ausstattung der Haushalte mit Handscannern und die Datenübertragung per Modem dar. Die Erfassung der Mediennutzung geschah im /Viwfbereich einmal über die Erfassung der Einkäufe - wie die aller anderen Waren - von Zeitschriften etc., zum anderen über - ähnlich der „Medien-Analyse", s. Kap. 16 - eine einmalige jährliche Befragung; im TV-Bereich wurden (wiederum analog zu dem in Kap. 16 beschriebenen Usus) Telemeter installiert. Derzeit bildet „Single Source" - mit 4500 berichtenden Haushalten - mehr nur einen Teilbererich vom insgesamt 8400 Haushalte umfassenden Nielsen- Jiomescan Consumer Panel". Besonders bekannt geworden war, wie erwähnt, Nielsen allerdings durch sein Einzelhandelspanel („Nielsen-Index"). Es berücksichtigte zunächst 4 Gebiete und später 6, die nach der Wiedervereinigung erweitert wurden, auf nunmehr 7 bzw. 8 gemäß Darst. 7-4 (folgende Seite). Darin erfolgte, geschichtet nach Ortsgröße und Geschäftstyp (sowie proportional zum Umsatz), die Auswahl einzelner Geschäfte, in denen nach Vertragsabschluß in Abständen von 61 Tagen durch Außendienstmitarbeiter des Instituts die Aufnahme der Bestände und der Einkäufe im Berichtszeitraum vorgenommen wurde. Gemäß der "Fortschreibungsgleichung": +

Anfangsbestand (AB) Zugänge (Einkäufe) Abgänge (Verkäufe)

(7.1)

Endbestand (EB) ergibt sich daraus: Endverbraucherabsatz

= A B + Einkäufe ./. EB

(7.2)

Daneben wurden, insbesondere nach der Umstellung auf monatliche Erfassung im Jahre 1987, eine ganze Reihe weiterer Größen ermittelt (Bezugswege, die "Distribution" usw.). Mit der Entwicklung der Scanner-Technik und der Voraussetzung für ihre Anwendung im Einzelhandel durch die Festlegung des ΕΑΝ-Codes, unter maßgeblicher Mitwirkung der C C G („Centrale für Coorganisation"), lag es zunächst nahe, die dabei anfallenden Rohdaten zusammenzustellen; so enstand das M A K A D O M („Markt-

Kapitel 7 Das Panel

191

Daten-Kommunikation"). Zu Scanning-Panels mit Identifikationskarten s. in Kap. 15 unter Mini-Testmarktverfahren. f

'· • asa ' sa Nielsen-Gebiete

Bundesländer

l

Schleswig-Holstein, Niedersachsen, Hamburg, Bremen

2

Nordrhein-Westfalen

3a 3b

Hessen, Rheinland-Pfalz, Saarland Baden-Württemberg

4

Bayern

5 6

Berlin Mecklenburg-Vorpommern, Brandenburg, Sachsen-Anhalt Sachsen, Thüringen

7

Darst. 7-4: Nielsen-Gebiete Heute herrschen auch im Einzelhandelsbereich Scanning-Panels vor, bei Nielsen unter der Bezeichnung „Market Track", bei der GfK mit dem Namen „InfoScan".

7.3 Methodische Probleme Ein wichtiges methodisches Problem bildet die Repräsentanz des Panels. Dieses bezieht sich - erstens - auf die Auswahl der Panelteilnehmer. Grundsätzlich kann jedes beliebige Auswahlverfahren angewandt werden. Es ist jedoch zu bedenken, daß infolge der Schwierigkeiten bei der Gewinnung der Teilnehmer und vor allem infolge ihres laufenden Ausscheidens (s. dazu nachstehend) eine Zufallsauswahl auf die Dauer nur sehr schwer aufrechtzuerhalten ist, so daß im Grunde auch die Errichtung des Panels nach dem Randomverfahren als nicht notwendig erscheinen könnte. Das Panel verlangt in weit stärkerem Maße als die Einzelbefragung die Mitarbeit der Befragten. Bezüglich - zweitens - der Gewinnung der Panelteilnehmer muß deshalb in geeigneter Weise dafür gesorgt werden, das Interesse an der Teilnahme zu wecken und zu erhalten. Außer von der Form der Ansprache wird dies wesentlich abhängen von einer finanziel-

192

Teil II Methoden der Datengewinnung in der Marktforschung

len Vergütung in Form der Prämienverteilung bzw. einer Verlosung oder, was sehr oft der Fall sein wird, eines - im Grunde geringen - Honorars. Drittens besteht das Problem der sog. Panelsterblichkeit. Man versteht darunter nicht nur die "Mortalität" im wörtlichen Sinne, also das Auflösen des Haushalts durch T o d oder aus anderen Ursachen, sondern auch die Einstellung der Teilnahme aus sonstigen Gründen (nachlassendes Interesse, Fortzug usw.). Dadurch verliert natürlich das Panel im Laufe der Zeit an Repräsentanz. Dem kann dadurch Rechnung getragen werden, daß man die ausgeschiedenen Haushalte durch neue mit den gleichen Merkmalen ersetzt. Sofern das Panel nach einem "Zufallsmodell" errichtet wurde (und dieser Charakter nicht durch eine hohe Zahl von Verweigerern beeinträchtigt ist), muß man darauf achten, daß dies nicht durch "bewußte Auswahl" der Ersatz-Haushalte verloren geht. So kann der Ersatz etwa aus einer Liste von Haushalten mit den entsprechenden Schichtungsmerkmalen durchaus "per Zufall" erfolgen.

Allerdings ist zu bedenken, daß umgekehrt das Panel auch durch die Veränderung der Grundgesamtheit seine Repräsentanz verliert. So mag sich eine (partielle oder vollständige) Rotation der Teilnehmer auch unabhängig von der Panelsterblichkeit bzw. über diese hinaus als zweckmäßig erweisen. Für das Single-Source-Panel von Nielsen wurde (nach einem Bericht im Horizont, N r . 26 v o m 30.6.1995, S. 44) die gesamte Panelfluktuation - also einschließlich der "Rotation", d.h. Kündigung seitens des Veranstalters, "weil ... sich die Haushaltszusammensetzung bzw. -große ändert und (die Leute) nicht mehr in die Stichprobe passen" - mit rd. 15% jährlich angegeben. Damit sei sie nicht höher oder niedriger als bei anderen Haushalts-Panels.

Die Panelrotation kann auch - quasi vorbeugend - von Vorteil sein im Hinblick auf den sog. Panel-Effekt. Man versteht hierunter die Erscheinung, daß die Teilnehmer mehr oder weniger unbewußt unter dem Einfluß der Teilnahme am Panel ihr Verhalten ändern (also vielleicht preisbewußter werden, den im Fragebogen erwähnten Marken mehr Aufmerksamkeit widmen, die Tagespresse und Anzeigen, Rundfunk- und Fernsehsendungen aufmerksamer verfolgen usw.). Empirisch scheint sich dieser theoretisch zweifellos begründete Verdacht indessen nicht bestätigt zu haben. (Langfristig sprechen gewisse Anzeichen allenfalls "für eine qualitative Beeinflussung in der Richtung, daß die Markenwahl des

Kapitel 7

D a s Panel

193

Panelmitglieds nicht mehr so differenziert ist" - REHORN 1 9 6 5 , S . 2 9 7 . ) Vielmehr zeigen entsprechende Untersuchungen eher das Umgekehrte, nämlich ein " Overreporting" während der ersten Wochen der Berichtszeit.

Literaturhinweise Über Panels gibt es zwar eine ganze Reihe von Aufsätzen bzw. Beiträgen in Sammelwerken, aber kaum Monographien. Schon etwas ältere Ausnahmen bilden REHORN 1 9 6 5 und SEDLMEYER 1 9 8 3 . Neuere Beiträge in Sammelwerken sind OLBRICH 1 9 9 5 und ZENTES 1 9 9 4 , als Einzelschrift GÜNTHER/VOSSEBEIN/WILDNER

1998.

Aufgaben 7-1: MC: Ein Panel ist eine Form der Befragung, bei der o stets dieselben Personen regelmäßig befragt werden o eine kleine Gruppe von Personen befragt wird o verschiedene Leute regelmäßig befragt werden o Befragte einer bestimmten Altersgruppe zur Teilnahme an einem Forschungsprojekt eingeladen werden (Quelle: s. Anmerkung zu A 4-5) 7-2: Abweichend vom Text (und Glossarium) könnte man auch definieren: "Unter einem Panel versteht man die fortlaufende - über einen bestimmten Zeitraum hinweg - Befragung oder Beobachtung eines bestimmten, im Prinzip gleichbleibenden, repräsentativen Kreises von Auskunftspersonen bezüglich des gleichen Gegenstandes." Worin liegen die Unterschiede, und wie können diese begründet werden? 7-3: Besteht, in bezug auf die Ermittlung des "Endverbraucherabsatzes", ein Unterschied zwischen dem "traditionellen" Einzelhandels-Panel und der durch das Scanning gegebenen Möglichkeit (und in welchem Posten liegt er ggf. im wesentlichen)? 7-4: T/F: Die Ausweitung der von Scannerkassen in Einzelhandelsbetrieben registrierten Umsätze bildet den typischen Fall eines "Single-Source-Panels". T/F

Kapitel 8 Sekundärmaterial Im 1. Abschnitt wird zunächst auf Begriff und Bedeutung (und damit auch Probleme der Abgrenzung und der "Zukunft") der sekundärstatistischen Marktforschung eingegangen. In Abschnitt 2 werden dann die Quellen, unterteilt nach internen und externen, behandelt. Der 3. Abschnitt hat die Probleme der technischen Durchführung zum Gegenstand; dabei erfolgt auch eine Erörterung von Online-Diensten und Internet.

8.1 Begriff und Bedeutung Der Begriff der sekundärstatistischen Marktforschung oder einfach Sekundärforschung wurde bereits in Kap. 2 formuliert: Darunter ist die Auswertung bereits vorliegenden, d.h. nicht eigens im konkreten Fall erhobenen Materials für Zwecke der Marktforschung zu verstehen. Im einzelnen - s. zur gleichen grundsätzlichen Problematik auch noch unten - kann es hier zu Abgrenzungsproblemen kommen. So mag man etwa meinen, daß die (in Kap. 4) erwähnten, von verschiedenen Marktforschungsinstituten durchgeführten Standarderhebungen mehr - obwohl aus deren Sicht zweifellos eine Primärerhebung! zum Bereich der Sekundärforschung gehören, da der Abonnent im allgemeinen nur vor der Entscheidung steht, dieses Material zu beziehen oder nicht. Vielfach existiert jedoch die Möglichkeit, sich durch Eingliederungsfragen aktiv zu beteiligen, in die Erhebung einzuschalten, also "echte" Primärforschung zu betreiben. Auf den Begriff der Dokumenten- oder Akten-Analyse soll hier verzichtet werden; diese spielt auch eher in anderen Bereichen - wie etwa in der Gechichtswissenschaft eine Rolle. Zur ("qualitativen" und "quantitativen") /«¿w/tsanalyse s. in Kap. 9.

Die Bedeutung von Sekundärmaterial für die Marktforschung ist im allgemeinen groß (obgleich in den einzelnen Bereichen - zumal den "besonderen", gemäß Kap. 17 - unterschiedlich). Sie ergibt sich aus den generellen Vor- und Nachteilen. Als Vorteile gelten: - Zeitersparnis, - Kostenersparnis, Nachte ile sind, daß - das Material zeitlich überholt sein kann, - seine Qualität abhängt von der ursprünglichen Zwecksetzung.

Kapitel 8

Sekundärmaterial

195

Damit kommt den Quellen große Bedeutung zu. Bevor auf diese - im nächsten Abschnitt (zu den Quellen der Auslandsmarktforschung s. in Kap. 17, Abschn. 2) - näher eingegangen wird, sei noch darauf hingewiesen, daß die "Zukunft der Sekundärforschung" quasi unsicher erscheint: Bisher konnte man, gemäß auch der eingangs erwähnten begrifflichen Festlegung, davon ausgehen, daß irgendwelche Institutionen Material erheben und - sofern es nicht der Geheimhaltung unterliegt oder sonstige Beschränkungen entgegenstehen - veröffentlichen. Dies geschah im Prinzip in „gedruckter Form". (Nicht veröffentlichtes Material konnte im Einzelfall durch Anfrage beschafft werden.) Dies könnte man als Origi«¿ζ/quellen bezeichnen. Es gab nun schon länger Institutionen, die dieses "Original-Material" heranzogen und in irgendeiner Form verarbeiteten, damit also neues generierten. Dessen Veröffentlichung hätte man als "abgeleitete Quellen" bezeichnen können. Auf diese Unterscheidung wurde zumeist, so auch vom Verf., schon bisher verzichtet, weil die Abgrenzung schwierig war. Durch die technische Entwicklung sind nunmehr jedoch neue Möglichkeiten aufgetreten. So kann das Material in elektronischen Speichern festgehalten werden und auch zugriffsbereit sein; das führt zu "Datenbanken". Daraus kann es dann in besondere Speichermedien übertragen und lieferbar werden, heute zumeist als CD-ROM. Natürlich ist dies auch ohne Zwischenschaltung einer "Online-Datenbank" möglich: Material erscheint in gedruckter Form oder zugleich als CD. Im folgenden werden letztere nur als eine besondere Form der Quellen betrachtet und damit unter diese - im nächsten Abschnitt - einbezogen. Bereits mit der Entwicklung der Online-Datenbanken entsteht eine neue Situation, weil es hier eben der speziellen "Abfrage" bedurfte und nicht des Durchsehens des gedruckten Materials bzw. des Aufsuchens entsprechender Bibliotheken/Archive; andererseits wird letzteres eben auch durch den Zugriff auf CD's ersetzt. Mit der offensichtlich zunehmenden Verbreitung von Online-Diensten und vor allem des Internet entsteht wiederum eine neue Lage, weil man nun zunächst die Sekundärmarktforschung vom Computer aus betreiben könnte (noch dazu zu vergleichsweise geringen Kosten). Darauf ist insgesamt im 3. Abschnitt einzugehen; vorher soll aber, quasi in "traditioneller Art", eine Ubersicht über die mehr oder weniger "originären" - Quellen gegeben werden:

196

Teil II Methoden der Datengewinnung in der Marktforschung

8.2 Quellen 8.2.1 Interne Informationen Als Lieferant interner Informationen kommt insbesondere die Betriebsstatistik in Betracht. Sie kann in zweifacher Richtung Anwendung finden: 1. als Ergänzung zu anderem primären oder sekundären Material; hier kann es sich wieder darum handeln, daß a) das externe Material durch diese Ergänzung überhaupt erst aussagekräftig wird Beispiel 8-1 Sind die Gesamtumsätze der Branche bekannt, so ergibt sich eine wesentlich stärkere Aussagekraft normalerweise erst dann, wenn durch die Bezugnahme des eigenen Umsatzes auf diese der Marktanteil (s. dazu auch Kap. 14) ermittelt wird.

b) die Gegenüberstellung der Ergebnisse von externem Material und Betriebsstatistik Kontrollzwecken dient. Beispiel 8-2 Ist der typische Verlauf der saisonalen Absatzschwankungen des Marktvolumens (der Branche) berechnet worden, so ist es wertvoll, diesen Zahlen die Saisonbewegungen des eigenen Unternehmens gegenüberzustellen, um daraus ein etwaiges Abweichen erkennen zu können.

2. als Ersatz für anderes primäres oder sekundäres Material Beispiel 8-3 Liegt externes Material über die saisonalen Absatzschwankungen der gesamten Branche nicht vor und ist zu vermuten, daß der Saisonverlauf bei den anderen Betrieben nicht wesentlich anders ist als beim eigenen, so kann der Saisonindex mit Hilfe einer der üblichen Techniken (s. dazu etwa HÜTTNER 1986c) aus den Zahlen der Betriebsstatistik ermittelt werden.

Im allgemeinen wird allerdings das Erstgenannte zutreffen: die Verwendung als Ergänzung zu externem Material. Neben der Betriebsstatistik können Berichte der (Verkaufs-)Außendienstorganisation herangezogen werden. Diese sind aber im Grunde als primäre Quellen anzusehen und, wie in Kap. 4 dargelegt, wegen der damit verbundenen Gefahr der unbewußten oder bewußten Verzerrung aufgrund subjektiver Gegebenheiten nur mit einer gewissen Vorsicht zu benutzen.

Kapitel 8 Sekundärmaterial

197

8.2.2 Externe Informationen Die Zahl der externen Informationsquellen ist groß. Darst. 8-1 gibt eine Ubersicht; es folgt eine detailliertere Erörterung. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.

allgemeine amtliche Statistik sonstige amtliche Quellen (Ressorstatistik) Wirtschaftsorganisationen und Verbände wirtschaftswissenschaftliche Institute Nachschlagewerke Fachliteratur und Fachzeitschriften Zeitungen und Zeitschriften Messe- und Ausstellungskataloge Firmenveröffentlichungen (z.B. Geschäftsberichte, Kataloge) Hilfsbetriebe (z.B. Adressendienste, ext. Datenbanken)

Darst. 8-1: externe Informationsquellen (Übersicht) 1. Die allgemeine amtliche Statistik existiert, entsprechend dem föderativen Aufbau der Bundesrepublik, auf drei Ebenen: - Statistisches Bundesamt (Wiesbaden) - Statistische Landesämter (meist in den Landeshauptstädten) - kommunalstatistische Amter (in größeren Gemeinden und bei Kreisverwaltungen) Das Arbeitsgebiet des Statistischen Bundesamtes ist außerordentlich vielgestaltig. Dabei kommt längst nicht alles zur Veröffentlichung, was an Material anfällt. Uber den "Auskunftsdienst" des Amtes bzw. die Nutzung der externen Datenbank STATIS-BUND ist es möglich, weiteres bzw. entsprechend aufbereitetes Material zu beziehen. Erstmalig zum Oktober 1995 wurde - von der DSI, Data Service und Information GmbH - die Lieferung des "gesamten Datenbestandes" von STATIS-BUND (und von der Zeitreihendatenbank der Deutschen Bundesbank: ZEWI) auf einer CD-ROM angekündigt.

Aus dem umfangreichen Veröffentlichungsprogramm sind zwei Gruppen hervorzuheben: - zusammenfassende Veröffentlichungen; darunter wieder: - "Statistisches Jahrbuch für die Bundesrepublik Deutschland" (Stjb); auch auf CD-ROM

198

Teil II Methoden der Datengewinnung in der Marktforschung

- Monatsschrift "Wirtschaft und Statistik" (WiSta) - "Statistischer Wochendiest" - /^¿Veröffentlichungen Hierbei handelt es sich um die wesentlichen Original-Quellen. Derzeit existieren 19 "Fachserien" (in weiterer Untergliederung in "Reihen" und auch "Einzelveröffentlichungen", speziell erstere z.T. noch stärker unterteilt), gemäß Darst. 8-2. 1: Bevölkerung und Erwerbstätigkeit 2: Unternehmen und Arbeitsstätten 3: Land- und Forstwirtschaft, Fischerei 4: Produzierendes Gewerbe 5: Bautätigkeit und Wohnungen 6: Binnenhandel, Gastgewerbe, Tourismus 7: Außenhandel 8: Verkehr 9: Geld und Kredit 10: Rechtspflege 11: Bildung und Kultur 12: Gesundheitswesen 13: Sozialleistungen 14: Finanzen und Steuern 15: Wirtschaftsrechnungen 16: Löhne und Gehälter 17: Preise 18: Volkswirtschaftliche Gesamtrechnungen 19: Umwelt Darst. 8-2:

Fachserien des Statistischen Bundesamtes

Es gibt auch Quellen- bzw. Veröffentlichungsverzeichnisse. Zu nennen ist hier speziell "Das Arbeitsgebiet der Bundesstatistik" - eine zusammenfassende Darstellung der organisatorischen, methodischen und rechtlichen Grundlagen der Bundesstatistik mit einem Katalog der einzelnen Statistiken. Letztere erscheint nunmehr als Teil 2 in Loseblattform; die letzte Ausgabe stammt von 1992. (Der Teil 1 kam zuletzt 1997 heraus.) Daneben findet sich ein „Veröffentlichungsnachweis" jeweils auch im Statistischen Jahrbuch.

Kapitel 8

Sekundärmaterial

199

Dazu treten noch die verschiedenen Publikationen der Statistischen Landesämter und der Kommunalstatistischen Ämter. Diese Berichte bringen oft eine starke regionale Differenzierung der Ergebnisse. 2. "Ressortstatistik": Der Umfang der nicht besonderen Ämtern zugewiesenen amtlichen Statistik ist, absolut gesehen, durchaus nicht gering. Hierzu gehört neben den statistischen Veröffentlichungen aus einzelnen Ministerien vor allem die statistische Tätigkeit der Deutschen Bundesbank (mit der Publikation von Ergebnissen in den "Monatsberichten ..." und periodischen - "Beiheften" dazu; s. auch oben, Datenbank ZEWI), die Statistik der Arbeitslosigkeit, der offenen Stellen usw. durch die Bundesanstalt für Arbeit, die Statistik des Kraftfahrzeugbestandes durch das

Kraftfahrt-Bundesamt etc.

3. Die statistische Arbeit der Wirtschaftsverbände ist für die Marktforschung von außerordentlicher Bedeutung. Zumindest die großen Fachverbände unterhalten eigene statistische Abteilungen und veranstalten Erhebungen bei ihren Mitgliedern. Sie sind deshalb, speziell auf Gebieten, auf denen die amtliche Statistik nicht tätig wird, oft die einzige Materialquelle überhaupt. (Sehr häufig werden z.B. die zur Berechnung des eigenen Marktanteils - s. dazu auch in Kap. 14 - erforderlichen Zahlen über den Gesamtabsatz der Branche nur von der Verbandsstatistik zu erhalten sein.) Dabei bleibt jedoch zu prüfen, ob das vom Verband erhobene Material hinreichend repräsentativ ist, so z.B., ob beachtliche Teile der Branche im betreffenden Verband nicht organisiert und deshalb auch in den Ergebnissen nicht enthalten sind. Außerdem sollte im Einzelfall jeweils berücksichtigt werden, ob die Zwecksetzung der Erhebung und Aufbereitung des Materials - etwa für wirtschaftspolitische Ziele - der Auswertung für die Zwecke der Marktforschung abträglich ist. Die Industrie- und Handelskammern verfügen gegenüber den Verbänden meist weniger über branchenmäßig detailliertes als vielmehr über tiefer regional, für den jeweiligen Kammerbezirk, gegliedertes Material. Neben der Lieferung von regional spezifizierten zahlenmäßigen Daten (die die Verbände, sofern sie räumlich untergliedert sind, häufig ebenfalls bereitstellen können) werden die Industrie- und Handelskammern oft auch für Angaben über qualitative Tatbestände, wie Handelsbräuche usw., in Betracht kommen.

200

Teil II Methoden der Datengewinnung in der Marktforschung

4. Die Wirtschaftsforschungsinstitute als Quellen von Material können einmal unterschieden werden in allgemeine und branchenmäßig oder regional spezialisierte Institute. Ferner kann man danach differenzieren, ob die Institute mehr nur anderweitig bereits vorliegendes Material auswerten und verarbeiten oder auch originär Daten erheben (wie z.B. das IfoInstitut mit dem "Konjunkturtest"); allerdings sind die Grenzen hier recht fließend. Nachstehend werden nur die 6 großen Institute aufgezählt, die turnusmäßig die sog. "Gemeinschaftsdiagnose" erarbeiten: - Deutsches Institut für Wirtschaftsforschung, Berlin - Ifo-Institut für Wirtschaftsforschung, München - Rheinisch-Westfälisches Institut für Wirtschaftsforschung, Essen - Institut für Weltwirtschaft an der Universität Kiel, Kiel - HWWA - Institut für Wirtschaftsforschung -, Hamburg - Institut für Wirtschaftsforschung Halle (IWH), Halle 5. Weiter kommen als wichtige Quellen der Marktforschung Nachschlagewerke aller Art in Betracht. Neben Handbüchern, Handwörterbüchern und Lexika insbesondere waren-, länder- und rechtskundlicher Art sind hier vor allem firmenkundliche Nachschlagewerke, speziell Adreßbücher, zu erwähnen. Letztere können entweder lediglich zur Feststellung der Zahl und eventuell Anschrift der Wettbewerber oder potentieller Abnehmer dienen (insbesondere in Gestalt der Bezugsquellenverzeichnisse) oder aber auch herangezogen werden zur Feststellung von Zahl der Beschäftigten, Kapital, Umsatz, Mutter- und Tochtergesellschaften usw. Je nach Art enthalten die einschlägigen Werke entweder nur kurze firmenkundliche Angaben oder aber im Extrem detaillierte seitenlange Berichte. 6. Für Fachliteratur und Fachzeitschriften allgemeiner oder spezieller waren-, länder-, rechts- oder firmenkundlicher Art gilt ähnliches. Entsprechende Monographien oder Zeitschriften sind ebenfalls sehr oft als Quellen heranzuziehen. 7. Wichtige Informationen können auch den allgemeinen Zeitungen und Zeitschriften entnommen werden. Das gilt nicht nur für die generelle Orientierung oder auch speziell die Börsen- und Marktberichte usw., also den redaktionellen Teil, sondern wesentlich auch für den Anzeigenteil; er erlaubt eine unmittelbare Anschauung über Art, Umfang und Aufmachung der Werbung der Konkurrenten usw.

Kapitel 8

Sekundärmaterial

201

8. Auch die diversen Messe- und Ausstellungskataloge ermöglichen die Information über das Vorgehen der Konkurrenz, aber auch über Kunden. Die Auswertung des Materials wird durch die unmittelbare Beobachtung beim Besuch der entsprechenden Veranstaltung erleichtert. 9. Gleichen oder ähnlichen Zwecken dient schließlich die Auswertung von Firmenveröffentlichungen, seien dies nun Bilanzen oder Geschäftsberichte, Kataloge, Werkzeitschriften usw. Daraus können oft wertvolle Anregungen für die Marktforschung (in Gestalt der Werbeforschung oder Produktforschung etc.) gewonnen werden. 10. Typische Hilfsbetriebe der sekundären Marktforschung sind: a) Zeitungsausschnittbüros, b) Sonderdienste, c) Adressenlieferanten, d) externe Datenbanken. Zu a): Zeitungsausschnittbüros kann etwa der Auftrag zur Sammlung von Zeitungsberichten über bestimmte Konkurrenten oder Produkte erteilt werden. Zu b): Zu den "Sonderdiensten" sind einmal solche Büros zu rechnen, die Unterlagen über die Konkurrenz, wie Kataloge, Prospekte, Geschäftsberichte usw., beschaffen. Derartige Büros haben vor allem in den USA größere Verbreitung gefunden. Zum anderen können hier solche Dienste genannt werden wie der monatlich erscheinende "Schwacke-Bericht" (heute ebenso auf CD-ROM wie der seit einiger Zeit existierende "konkurrierende" Dienst der "Deutschen Automobil Treuhand"), der die gezahlten Preise für nahezu alle deutschen und viele ausländische Pkw enthält und oft eine wesentliche Unterlage für die Inzahlungnahme gebrauchter Fahrzeuge bei Neuwagenkäufen darstellt. Zu c): Adressendienste kann man zur Lieferung der Adressen von Firmen einer bestimmten Branche, die als Kunden in Frage kommen, bzw. überhaupt von irgendwie definierten Kundengruppen (z.B. Hochschullehrern, Ärzten usw.) heranziehen. Diese Adressendienste dienen natürlich auch dem "Direct Marketing" (und führen dann ebenfalls den Versand etc. durch) wie auch anderen Zwecken. Das gilt gleichermaßen für CD-Versionen. So kann die Schober

202

Teil II Methoden der Datengewinnung in der Marktforschung

Business Info CD, mit laut Angebot "über 5 Millionen Firmenadressen" aus Deutschland, Östereich und der Schweiz mancherlei Zwecken, aber auch z.B. der "Auffindung von Marktpotentialen", dienen. (So lassen sich z.B. alle "Spediteure", auch nur aus einem bestimmten Gebiet, aufrufen.) Sie hat damit den Charakter von „Masterfiles". MARTIN (1992) bezeichnet, im Rahmen der Diskussion der mikrogeographischen Marktsegmentierung, damit solche Dateien, die „nahezu vollständig die Gesamtbevölkerung eines Landes auf Basis der Haushalte und teilweise auch auf Basis der Personen, mit der entsprechenden aktuellen Adresse" (S. 141) umfassen und grenzt sie von „Segmentfiles" („Datenbestände von Konsumentenadressen, bei denen jede Adresse mindestens ein zusätzliches Qualifizierungsmerkmal aufweist") ab. Es wird damit deutlich, daß die sog. "Mikrogeographie" eben nicht nur relativ kleinräumige und homogene aber doch noch - "Cluster" (und damit auch Marktsegmente), sondern ihre inhaltliche "Auffüllung" bis hin - in Richtung auf das "IndividualMarketing" - zur individuellen Adresse umfaßt. Martin gibt im Anfang seiner Schrift eine Charakterisierung von 5 solchen - wie er sagt - "Segmentierungssystemen" (Context dagegen spricht wesentlich später, nämlich in 1/96, schon von 5 Anbieter-Gruppen), darunter auch die bereits erwähnte Firma Schober mit dem Ziel der "Erhebung sämtlicher Häuser" (zunächst in Baden-Württemberg). Ob es allerdings jemals gelingen wird, auf privatwirtschaftlicher Basis - von Amts wegen gibt es, zumal nach dem Scheitern der Einführung des PKZ ("Personenkennzeichen"), keine Datenbank mit sämtlichen Einwohnern der Bundesrepublik - eine umfassende Datenbank mit den aktuellen Adressen aller Einwohner (die dann auch zur Stichprobenziehung verwandt werden könnte - s. Kap. 4) zu schaffen, mag bezweifelt werden können. Zu d): Auf externe Datenbanken, als Datenlieferanten (nicht als quasi nur extern geführte "Marketing-Informations-Systeme") wird, wegen ihrer zunehmenden Bedeutung, im nunmehr folgenden Abschnitt eingegangen:

Kapitel 8

8.3

Sekundärmaterial

203

Technische Durchführung / "Online-Dienste" und "Internet"

Für die technische Durchführung der Sammlung von Sekundärmaterial lassen sich einige Grundsätze aufstellen. Diese werden zunächst erörtert. Sie lauten: 1. Die Heranziehung und Ausnutzung aller verfügbaren sekundären Quellen sollte am Anfang jeder Marktforschung stehen. Ehe Hypothesen aufgestellt werden, ist die vorhandene Literatur usw. daraufhin zu prüfen, ob über den fraglichen Gegenstand irgendwelche verwertbaren Untersuchungen vorliegen. 2. Primärerhebungen sollen erst nach Ausschöpfung aller sekundären Quellen in Erwägung gezogen werden. Erst wenn feststeht, daß auf sekundärem Wege nicht mehr weiterzukommen ist, bleibt zu fragen, ob die noch fehlenden Tatbestände so wesentlicher Art sind, daß ohne sie die Untersuchung unvollständig wäre, sie also auf dem Wege der Primärerhebung beschafft werden müssen. (Man ist immer wieder erstaunt, welche interessanten Fakten einfach durch Nachschlagen oder Auswerten bestimmter Quellen "entdeckt" werden können!) 3. Im Interesse der Steigerung der Arbeitseffizienz empfiehlt sich die Arbeitsteilung, d.h. die Spezialisierung von Mitarbeitern eigens auf die Aufgabe der Materialsammlung. Stehen, wie es nicht selten der Fall sein wird, mehrere Mitarbeiter für die Marktforschung zu Verfügung (s. dazu auch in Kap. 18), so ist es zweckmäßig, einen davon auf die Aufgabe der Marktdatensuche usw. zu spezialisieren. 4. Eine umfassende Kenntnis der in Betracht kommenden Quellen und der Möglichkeiten ihrer Ausnutzung ist Voraussetzung einer erfolgreichen Arbeit. 5. Die rationelle Auffindung und insbesondere Ausnutzung der Quellen erfordert eine gute Orientierung über die einschlägigen Fundstellen (Bibliotheken, Archive, Datenbanken usw. - s. dazu unten). 6. Jede sekundäre Quelle sollte sorgfältig auf ihre Brauchbarkeit hin geprüft werden. Diese Prüfung auf Brauchbarkeit korrespondiert mit den eingangs erörterten Nachteilen der Sekundärforschung; sie gilt auch - hier womöglich verstärkt - für Online-Datenbanken, Online-Dienste und das Internet.

204

Teil II Methoden der Datengewinnung in der Marktforschung

Externe Datenbanken, als "Online-Datenbanken", waren in den letzten Jahren in zunehmendem Maße entstanden. Man kann dabei verschiedene Arten unterscheiden. Dabei könnte man zunächst grundsätzlich in solche Datenbanken einteilen, die nur "Verweise" oder "Hinweise" enthalten {Referenz-Datenbanken) und andere, aus denen auch "Fakten" entnommen werden können (Fakten- oder Quellendatenbanken). Die weitere Unterteilung ist jedoch in der Literatur unterschiedlich. Zumal die Ubergänge fließend sind, soll nachstehend nur mehr eine Aufzählung erfolgen: 1. reine Referenzdatenbanken·. Sie enthalten als "bibliographische Datenbank" nur Literaturangaben, sind also bloße "Fundstellennachweise". 2. bibliographische Datenbanken mit "Extrakten"·. Den Literaturhinweisen sind jeweils auch kurze Inhaltsangaben beigefügt (insbesondere in der anglo-amerikanischen Literatur nicht als "Summary", sondern als "Abstract" den eigentlichen Ausführungen vorangestellt). 3. dto. mit auch zahlenmäßigen Ergebnissen. Eine Kritik (s. auch unten) an den "Abstracts" ist, daß sie oft eher bloß eine verbale Formulierung der formalen Gliederung darstellen. Dem könnte durch die Beigabe von Resultaten abgeholfen werden.

4. Volltext-Datenbanken·. Der gesamte Inhalt eines "Dokuments" - etwa eines Aufsatzes - wird gespeichert. Selbstverständlich erfordert dies viel Speicherplatz, eröffnet aber andererseits auch neue Möglichkeiten der Suche: die mittels bloßer Deskriptoren - abhängig von der Qualität des Suchprogramms und insbesondere eben deren Formulierung - kann ersetzt werden durch die "Freitextrecherche". 5. Real-Time-Datenbanken - gelegentlich auch als "Ticker-Dienste" apostrophiert - geben laufend z.B. Börsennotierungen wieder. Die Nutzung der großen Zahl von externen Datenbanken war allerdings zunächst weit hinter den Erwartungen zurückgeblieben. Das belegen nicht nur "allgemeine Erfahrungen" (auch die des Verf.), sondern auch eine umfängliche empirische Untersuchung des Ifo-Instituts (REINHARD 1987). Sie bestand aus 1. einer groß angelegten schriftlichen Umfrage (mit 7249 verschickten und 2685 auswertbaren Fragebogen - 37,0%), 2. mündlichen Experten-Interviews und 3. einigen Fallstudien. Zwei davon sollen im folgenden - zugleich als Beispiele für die Sekundärforschung allgemein - referiert werden: Beispiel 8-4 Ein Unternehmen (mit 270 Beschäftigten) wollte im Bereich der mechanischen Computerperipherie als Neuanbieter auftreten. Dafür sollte ein Vorprodukt zum

Kapitel 8

Sekundärmaterial

205

Einbau in einen speziellen Plotter entwickelt werden. Zur Abschätzung des Marktpotentials wollte man wissen, wie groß der Plottermarkt in Europa - in Stück - ist und .welchen Anteil daran der betreffende Typ hat, wer diesen insbesondere anwendet und ob es weltweit bereits einen Hersteller für das geplante Produkt gibt. Die Recherche erbrachte: aktuelle Aufträge großer Anwender für den betreffenden Plotter-Typ, Marktanteile (stückzahlenmäßig) der wichtigsten Plotter-Hersteller, Analysen des Plotter-Marktes in der Bundesrepublik und in Italien. Es ergab sich zudem kein Hinweis darauf, daß bereits ein Hersteller für das geplante Produkt existiert. (Allerdings standen keine japanischen Produktdatenbanken zur Verfügung!) Das Unternehmen war mit den Ergebnissen sehr zufrieden. Ein Teil davon war zwar schon bekannt, man erhielt aber eine Reihe weiterer Informationen. Auch die Kosten von ca. D M 700 wurden als angemessen betrachtet. Man würde auch in Zukunft wieder eine Recherche durchführen, wünschte sich aber eine "Informationsvermittlungsstelle" (s. dazu unten) in der Nähe. (Zusammengestellt aus: REINHARD 1987, S. 150ff.) Beispiel 8-5 Eine Bauunternehmung (ca. 2000 Beschäftigte) möchte Umsatzrückgänge in einigen Sparten durch Erschließung neuer Geschäftsfelder kompensieren. Man denkt dabei an Baumaßnahmen bei Gemeinden und in der Industrie im Bereich "Umweltschutz". Man hatte bereits hierüber Informationen aus den laufend zur Verfügung stehenden Quellen gesammelt; da aber der genannte Bereich nicht eindeutig abgegrenzt ist, hat man Sorge, daß Informationslücken bestehen. Die Datenbankrecherche soll klären, welche Literatur über den Umweltschutz-Markt existiert und ob es Informationen über Umfang und Entwicklungstendenz der "AltlastenSanierung" gibt. Die Recherche erbrachte: Artikel über Möglichkeiten der "Altlastensanierung" (einschl. Schätzungen über den erforderlichen Sanierungsaufwand); Literaturhinweise über bauliche Maßnahmen zur Sanierung der "Altlasten" und die Rolle der Bauindustrie dabei sowie zu der entsprechenden Problematik speziell in der chemischen Industrie; Hinweise auf einschlägige Statistiken. Die gelieferten Informationen waren dem Unternehmen im wesentlichen bekannt; als positives Ergebnis bewertete man die Bestätigung, offensichtlich gut informiert zu sein. Den Preis von ca. D M 700 hierfür hielt man jedoch nicht für angemessen. (Zusammengestellt aus: REINHARD 1987, S. 152ff.)

Als Gründe für die relativ geringe Datenbanknutzung müssen einerseits die - wie auch aus den Beispielen hervorgeht - nicht nicht ganz unerheblichen Kosten angesehen werden. Diese wiederum stehen im Zusammenhang mit komplizierten Zugriffsmöglichkeiten (durch individuelle AbfrageSprachen bzw. -Modalitäten) und fehlender Information betreffs der jeweiligen Datenbank (durch oft zu teure, detaillierte "Handbücher", anstelle von Überblicksmaterial). Schließlich waren die Datenbankzra/w/îe selbst unbefriedigend (oder zumindest ungenügend "aufbereitet").

206

Teil II Methoden der Datengewinnung in der Marktforschung

Beispiel 8-6 Man wollte die Zahl der 16-25jährigen in der Bundesrepublik wissen. "Erstaunlicherweise konnte keiner der Datenbankanbieter die gewünschte Anzahl der Jugendlichen liefern" - obwohl sie dem Statistischen Jahrbuch zu entnehmen ist! (Quelle: REINHARD 1987, S. 155.)

Ein wichtiger Impuls für die Ausweitung der Möglichkeiten im Bereich der Sekundärforschung war zweifellos die Entfaltung und allgemeine Etablierung des Internet im vergangenen Jahrzehnt. Der vorbezeichnete Begriff, der sich aus dem Terminus INTERconnected NET ableitet und seit 1990 im Gebrauch befindet, ist heute beinahe jedem geläufig. Will man den Sachverhalt Internet gleichwohl definitorisch genauer fassen, so ist hierunter eine globale Vernetzung von Netzwerken zu verstehen, in dem mittels Telekommunikations- und Datenleitungen sowie durch den Einsatz eines gemeinsamen Kommunikationsprotokolls Computer weltweit verknüpft sind, so daß sie miteinander Daten austauschen können. Aufgrund seines dezentralen Arbeits- und Aufbauprinzips sieht es dabei für den Informationstransfer zwischen den jeweiligen Sendern und Empfängern im Grundsatz keine direkte Verbindung vor, sondern „schleust" die betreffenden Daten in geeigneter Form durch das gesamte informationstechnologische Verknotungssystem. Ende der 1960er Jahre zunächst verteidigungspolitisch motiviert und auf die USA beschränkt, danach recht rasch aber auch auf den zivilen wissenschaftlichen Datentransfer abstellend, in den 1980er Jahren sich schließlich explizit für „jedermann" öffnend, arbeitete das Fundament dieses Netzwerkes länger relativ unbemerkt. Etwa seit 1990 - eben schon unter der Bezeichnung Internet - ist es dann aber nahezu „explodiert" und hat bis heute die Schwelle einer dreistelligen Millionenzahl von „Usern" weltweit klar überschritten. Auf der Anwenderebene präsentiert sich das Internet als Träger einer Reihe von einzelnen Diensten. Die heute bei weitem bedeutensten Services sind der E-Mail-Dienst, der „elektronische Briefverkehr", das Versenden und Empfangen elektronischer Post zwischen Usern, sowie das unten noch näher betrachtete World Wide Web. Für die Primärforschung (etwa [Marktforschungs-]Gruppendiskussionen) ist zudem die Möglichkeit einer „synchronen" Mehrbenutzer-„Echtzeit"-Kommunikation, etwa auf der Grundlage des Internt Relay Chat (IRC), von Bedeutung. Der Zugang zum Internet bzw. zu den Internet-Diensten wird entweder hergestellt, indem ein eigener Rechner als Knoten in das globale Netzwerk eingebunden ist, wie heute bei Hochschulen und größeren Unter-

Kapitel 8 Sekundärmaterial

207

nehmen üblich, oder indem für den eigenen Computer per Modem und via Telefonnetz ein Anschluß an einen anderen eingebundenen Rechner aktiviert werden kann. Insbesondere für die Angehörigen von Hochschulen stehen heute auf dem letztgenanntem Wege für ihre eigenen Rechner zumeist kostenfreie Accounts zur Verfügung, nicht selten aber auch den Mitarbeitern anderer größerer Organisationen und Unternehmen. Daneben bieten in recht großer Zahl Betreiber kommerziell orientierter Anbindungen, sog. Provider, Zugänge gegen - mitunter ausgesprochen niedriges (dann häufig jedoch mit Nachteilen in der Leistungsfähigkeit erkauftes) - Entgelt, aber z.T. auch kostenfrei an (wenn die Finanzierung durch andere Leistungen im Vordergrund steht). Die Funktion eines Providers wird in der Regel auch von den OnlineDiensten erfüllt; s. dazu unten.

Das World Wide Web (auch WWW oder W3 genannt) steht heute für das Internet wie kein anderer Dienst. Es basiert auf einem speziellen, standardisierten Kommunikationsprotokoll, dem HyperText Transfer Protocol (HTTP - die Adressen beginnen entsprechend mit „http://www. ..." ), das es gestattet, über relativ einfach zu bedienende Benutzeroberflächen (die sog. Browser - etwa Internet Explorer von Microsoft oder Netscape Communicator) auf multimediale Informationen zuzugreifen. Diese Informationen sind nach dem „Client-Server-Prinzip" auf sog. Web-Servern, rund um den Globus, abgelegt und werden dort den Nutzern des World Wide Web zum Aufruf als WWW-Dokument bereitgehalten. Die Möglichkeiten der Marktforschung im Internet kann man gemäß Darst. 8-3 - folgende Seite - zusammenfassen. (Mit der internet-basierten Pnmárforschung befassen sich andere Kapitel. Auf die Verwendung im Bereich der Befragung wurde bereits in Kap. 4 hingewiesen; auf die Messung des Nutzungsverhaltens, insbesondere die „Werbeerfolgskontrolle", wird noch kurz in Kap. 17 eingegangen.) Hier konzentriert sich die Aufmerksamkeit auf die Nutzung des Internet als Basis der Sekundärforschung. Prinzipiell läßt sich hierzu anmerken, daß die Exi-stenz des Internet die Möglichkeiten im Bereich der Sekundärforschung erheblich ausgeweitet hat, da es letztlich den mehr oder weniger jederzeitigen und unmittelbaren Zugriff auf das größte Datenreservoir der Welt mit Informationen und Datenbanken aus über 190 Staaten gestattet. Gerade den klassischen Motiven für die Sekundärforschung, den Streben nach kostengünstigen und rasch verfügbaren Informationen, kommt das globale Datennetz in besonderer Weise entgegen. Gleichzeitig kann es die Problematik einer häufig unbefriedigenden Aktualität sekundärforscherisch

208

Teil II Methoden der Datengewinnung in der Marktforschung

gewonnener Daten in gewissen Maße reduzieren, da im Internet im Grunde täglich neue Informationen hinzukommen, wodurch sich die Chancen für die Erlangung vergleichsweise aktueller Kenntnisse deutlich erhöhen. Marktforschung ( Primärforschung J Befragung V I OnlincGruppendiskussioncn

E-MailFragebogen

^

Sekundärforscliung

J

1 r Beobachtung^ Registrierung von Nutzeradressen

Nutzung von Datenbanken/ Quellen

WWWFragebogen Coupons, Registrierkarten und

Registrierung des Nutze rvcrhaltcns durch die Server

Abonnements zur Erfassung von Kundendaten

Darst. 8-3: Möglichkeiten der Marktforschung im Internet (modifiziert nach LAMPE 1998) Die Verwendungsmöglichkeiten des Internet im Rahmen der Sekundärforschung sind äußerst vielgestaltig. Zunächst ist die Organisation des Zugriffes auf spezifische - kostenfrei oder gegen Entgelt zu nutzende Datenbanken zu nennen. Eine oftmals lohnende Quelle sind auch Meinungsplattformen oder Meinungsportale, in denen sich Verwender, Händler, (echte oder selbst ernannte) Experten über bestimmte Produkte, Produktbereiche, Gebiete des Freizeitverhaltens etc. austauschen. Besondere Aufmerksamkeit verdient das auf marktforscherische Fragen ausgerichtete - „explorative" - Surfen im World Wide Web. Auf diesem Weg kann man sich etwa Aufsätze, Artikel, Forschungsberichte, Statistisken etc. erschließen, die von einzelnen Unternehmen (insbesondere von Verlagen, Consultants u.ä.), von öffentlichen Institutionen (etwa Forschungs- oder Verwaltungsorganisationen) oder Privatpersonen zu einem bestimmten Gegenstand ins Netz gestellt wurden. Weiterhin sind vor allem die Home-Pages von Forschungsinstitutionen, Verbänden, Verlagen, staatlichen Einrichtungen etc., über welche man z.T. eine Verbin-

Kapitel 8

Sekundärmaterial

209

dung („link") zu deren Datenbeständen oder Verweise zu anderen Informationsquellen erhält, als Ziele von Web-Recherchen zu nennen. Außerdem lassen sich noch die via WWW öffentlich gemachten Daten anderer Unternehmen (Konkurrenz, Handel etc.) anführen. Das auf eine marktforscherische Frage ausgerichtete Surfen im World Wide Web ist vor diesem Hintergrund als wichtiges Instrument zur raschen Erschließung eines umfangreichen Pools kostenfreier Informationen zu begreifen. Wenn es auch oftmals nicht unmittelbar zum erwünschten Sekundärmaterial führt, so gewinnt man hierdurch oft aber zumindest einen gewissen Überblick über die fokussierte Problematik und erhält Hinweise zur Lokalisierung hier relevanter Informationsquellen. Insofern ist diese Form der Web-Nutzung hinsichtlich der voranstehend auf S. 203 unter Ziffer 1 und 2 aufgeführten Prinzipien besonders herauszuheben. Unverzichtbare Hilfsmittel für das Surfen im WWW überhaupt, also auch für jenes unter marktforscherischen Aspekten, sind Suchmaschinen („search engines"), da man die Vielzahl der angebotenen Informationen, verbunden mit einer entsprechenden Unübersichtlichkeit, ansonsten kaum bewältigen könnte. Echte Suchmaschinen - populäre Vertreter sind z.B. altavista.com oder hotbot.com - durchkämmen das WWW automatisch mit Hilfe sog. Spider und indizieren dabei riesige Datenmengen. Dagegen fußen die Suchergebnisse von Online-Katalogen - populäre Vertreter sind z.B. yahoo.com oder lycos.de - auf am Ende von Menschenhand gebildeten Sortierungen. In der Regel müssen sich marktforscherische Recherchen im WWW auf verschiedene Suchdienste stützen, schon allein deshalb, weil selbst die großen deutlich weniger als die Hälfte der allgemein zugänglichen Web-Seiten abdecken. In der „Breite" sind daher sog. Meta-Suchmaschinen - etwa metacrawler.com -, die ihrerseits Search Engines, aber eben mehrere, abfragen, und in der „Tiefe" spezialisierte Suchhilfen für einzelne Fachgebiete von besonderem Interesse. Für spezielle Recherche-Projekte können zudem - meist kommerzielle - Auftrags-Internet-Rechercheure, sog. information broker, herangezogen werden. (Wegen des Problems - ganz abgesehen von der „Datensicherheit" - der Vielzahl der angebotenen Informationen und im Zusammenhang damit von deren „Qualität" - weshalb eben auch die oben betriebene „Quellenkunde" durchaus als wichtig erscheint - wird heute bereits über den Aufbau eines „Internet 2" diskutiert.

210

Teil II Methoden der Datengewinnung in der Marktforschung

Neben dem weiten Spektrum der Internet-Dienste stehen noch eigenständige Online-Dienste zur Verfügung, die allerdings in der Regel ebenfalls Anbieter für den Zugang zum Internet und daher in ihrer Geschäftstätigkeit in gewisser Hinsicht auch mit diesem Netzwerk verbunden sind. Sie eröffnen gegen Entgelt den - mehr oder weniger strukturierten - Zugriff auf eine Vielzahl von (kostenpflichtigen oder -freien) Informationsleistungen. Man wird quasi „Mitglied". Die in Deutschland populärsten Online-Dienste sind „T-Online", der zunächst als „Datex-J" aus dem seinerzeit nicht sehr erfolgreichen „btx" (Bildschirmtext) hervorging, sowie America Online (AOL), der gleichzeitig bisher unangefochtener Weltmarktführer ist. Unter dem Gesichtspunkt der Sekundärforschung ist vor allem herausheben, daß Online-Dienste aufgrund der hier im Vergleich zum freien Internet besser regelbaren Abrechnungsmodalitäten für die Anbieter kostenpflichtiger Datenbanken eine besondere Attraktivität aufweisen.

Literaturhinweise Monographien über „Sekundärforschung" gibt es kaum; Ausnahmen bild e n STEWART/KAMINS 1 9 9 3 u n d PATZER 1 9 9 5 .

Uber das Internet allein existiert verständlicherweise ein großes Schrifttum. S. dazu etwa das schon im Text erwähnte Buch von LAMPE 1998 und auch ders., Hrsg., 1999 sowie die in Kap. 4 genannte Literatur; vgl. dazu auch die schon im Titel auf das Marketing hinweisenden Schriften von FRITZ (2001 und ders., Hrsg., 2001).

Aufgaben 8-1:

Was kann man sich unter "ifomc^ewdatenbanken" vorstellen? Wer könnte als Träger in Betracht kommen?

8-2:

T/F: Das unmittelbare Recherchieren in einer Online-Datenbank, einem Online-Dienst oder im Internet stellt den typischen Fall einer Primärforschung dar. T/F

Teil III Methoden der Datenanalyse in der Marktforschung Einführung: Datenaufbereitung und Datenanalyse - Die Datenmatrix (und ihre "Partitionierung") Während der II. Teil die Methoden und Probleme der Gewinnung des Materials, der Sammlung bzw. Erhebung der Daten, zum Gegenstand hatte, geht es nunmehr um deren Analyse. Bevor die Daten jedoch analysiert werden können, müssen sie entsprechend aufbereitet sein. Insbesondere bei der Erörterung der (amtlichen) Statistik wurde früher der Phase der Aufbereitung breiter Raum gewidmet, wobei speziell die Aufbereitungsverfahren im Vordergrund standen. Heute hat sich die elektronische Datenverarbeitung durchgesetzt. Obwohl statistische Auszählungen der Entwicklung wesentliche Impulse gegeben haben (so schuf der Deutsch-Amerikaner Hollerith eigens für die USVolkszählung die später nach ihm benannte Lochkartenmaschine), ist die EDV heute längst nicht mehr darauf beschränkt. Insofern bleibt hier mehr nur auf die Datenerfassung ("data recording") abzustellen. Dabei ist anzustreben, "daß zwischen der erstmaligen Datenerfassung" und der Dateneingabe ("data input") - in den Speicher der Datenverarbeitungsanlage - "keine manuellen Eingriffe mehr erforderlich sind" (DWORATSCHEK 1 9 8 9 , S. 7 2 ) . Ein Mittel dazu wären "Belegleser" - im Sinne von Scannern - oder "Sprechschreiber". Diese sind aber in dem allgemeinsten Sinne, daß sie jede beliebige Handschrift oder Aussprache erkennen können, (noch) nicht verfügbar. So müssen vielfach die Urbelege erst "maschinenlesbar" gemacht werden. Besondere Verbreitung hat in der Praxis dabei das Strichmarkierungsverfahren erlangt. Es wurde bei der amtlichen Volkszählung - schon 1970! - und z.B. auch von E M N I D (s. den als Appendix zu Kap. 4 wiedergegebenen Fragebogen-Auszug) verwandt.

212

Teil III Methoden der Datenanalyse in der Marktforschung

Ein häufig anzutreffender Fall dürfte auch heute noch sein, daß - bei der (persönlich-)mündlichen Befragung - die Fragebogen vom Interviewer ausgefüllt und im Institut weiter bearbeitet werden. Selbst dann, wenn die Dateneingabe durch den Interviewer bzw. sogar durch den Befragten erfolgt - etwa per Laptop/Pentop und einzusendender Diskette oder telefonisch über Modem etc. - muß eine irgendwie geartete Rücklaufkontrolle geschehen. Dazu gehört nicht nur die - in Kap. 4 diskutierte - Entscheidung über die Berichtigung oder Ergänzung offensichtlich (oder auch nur anscheinend?) falscher bzw. fehlender Antworten der Befragten, sondern insbesondere auch die Kontrolle darüber, ob - im Falle der Zufallsauswahl - die Auswahlvorschriften befolgt bzw., beim "AdressenRandom", die Fragebogen mit den Antworten der vorgesehenen Befragten zurückgekommen sind (evtl. Notwendigkeit des Nachfassens zur Erhöhung der Antwortquote!) bzw. - im Falle der Quotenauswahl - die vorgegebene Quotierung erfüllt wurde. Von besonderer Bedeutung ist die Verschlüsselung. Im allgemeinsten Sinne versteht man unter Schlüssel oder Code die Vorschrift für die eindeutige Zuordnung eines ersten "Alphabets" (der Zeichen eines Zeichenvorrats) zu einem anderen. In der Marktforschung speziell bezeichnet man mit Codieren ("coding") die Zuordnung von Zahlen zu den einzelnen Ausprägungen der Variablen. Das entsprechende Schema wird auch Codeplan genannt; analog enthält das Codebook (bzw. „Codebuch") die Zusammenstellung, welchen Merkmalsausprägungen welche Werte zugewiesen wurden und wo diese zu finden sind (z.B. in welcher Datei an welcher Stelle). Bei geschlossenen Fragen bereitet die Verschlüsselung zumeist keine Schwierigkeiten. Die Probleme bei der Verschlüsselung offener Fragen in bezug auf qualitative Merkmale wurden bereits erörtert. (S. unter 4.3.1.1, speziell Beisp. 4-18.) Bei quantitativen ist zu prüfen, ob nicht die Spannweite der Antworten so groß ist, daß eine gewisse Konzentration in Gestalt einer Gruppenbildung erfolgen sollte. Diese Gruppenbildung ist kein einfacher Vorgang; sie wirft vielfältige sachliche und methodische Probleme auf (hinsichtlich der Anzahl der Gruppen, ihrer Breite, der zweckmäßigen Gruppengrenzen usw.). Es besteht durchaus die Gefahr, daß durch eine unzweckmäßige Gruppenbildung die ursprüngliche Häufigkeitsverteilung verfälscht wird (mit der Folge auch der Verzerrung von Maßzahlen, wie Mittelwerten usw.). Insofern dürfte es zweckmäßig sein, sämtliche Ausprägungen zu erfassen und die Entscheidung über eine etwaige Gruppenbildung aufgrund der (einfachen) Häufigkeitsanalyse zu treffen; s. dazu 9.1.

Einführung: Datenaufbereitung und Datenanalyse

213

Das Ergebnis der Aufbereitung kann in der Datenmatrix X dargestellt werden. (S. zu Matrizen allgemein Anhang B.) Sie enthält in der einen Dimension - meist den Spalten - die Variablen (oder Merkmale), in der anderen - meist den Zeilen - die Elemente (oder "Fälle" - Cases), gemäß Darst. IIIE-1. ^"-\Variable

1 ... j ... η

1 i m Darst. IIIE-1: Datenmatrix

Die OztcTíAríúyst-Methoden können nach der Anzahl der untersuchten Variablen unterschieden werden: 1. univariate Methoden, 2. bivariate Methoden, 3. multivariate Methoden. 2« 1: Der Normalisil der univariaten Analyse liegt vor, wenn nur eine Spalte, also eine Variable, herausgegriffen und ihre Verteilung über die einzelnen Elemente untersucht wird. Diese "einfache Häufigkeitsanalyse" ist im 1. Abschnitt des ersten Kapitels dieses Teiles, Kap. 9, behandelt. (Im 2. Abschnitt wird dann noch die "Kreuztabulierung" erörtert.) Als Spezialfall läßt sich vorstellen, daß die Elemente nicht Personen, sondern einzelne Zeitabschnitte - etwa Jahre - beinhalten. Auf die "Zeitreihenanalyse" wird in diesem Buch nicht mehr explizit eingegangen. (S. dazu ausführlich HÜTTNER 1986c.) Abgesehen von einigen Hinweisen zur Prognose in Kap. 14, enthält der abschließende Exkurs in Kap. 9, über die "Kohortenanalyse", eine verbindende Betrachtung von "Längs-" und "Querschnitten".

Zu 2: Die Kreuztabulierung (oder -auswertung) kann gewissermaßen als die "subjektive" Form der gleichzeitigen Untersuchung von zwei Spalten der Datenmatrix, der bivariaten Analyse, angesehen werden. Darüber hinaus können "schärfere", objektive" Verfahren, insbesondere der Regressions- und Korrelationsrechnung sowie Chi-Quadrat-Analyse, Anwendung finden. Diese Verfahren werden in Kap. 10 behandelt. Dabei ist

214

Teil ΠΙ Methoden der Datenanalyse in der Marktforschung

allerdings z.B. auch die "multiple Regression" - mindestens 2 unabhängige und 1 abhängige Variable - mit einbezogen. Zu 3: Der vorerwähnte Fall der multiplen Regression läßt sich schon als multivariate Analyse ansehen. Davon spricht man im allgemeinen (vereinfachend) bereits dann, wenn die gegenseitigen Beziehungen zwischen mindestens 3 Variablen analysiert werden. Allerdings wird der Terminus "multivariat" bisweilen in einem engeren Sinne erst dann verwandt, wenn es auch auf der Seite der abhängigen Variablen deren mehrere also mindestens 2 - gibt. S. dazu auch unten (etwa unter 11.1, M A N O VA).

Solche multivariate Verfahren gibt es nun in einer ganzen Anzahl. Ihr gemeinsames Ziel kann darin gesehen werden, maximale Datenreduktion bei minimalem Informationsverlust zu erreichen. Ihre Unterschiede bzw. Besonderheiten ergeben sich aus einer Reihe von Merkmalen; die wichtigsten Einteilungskriterien lassen sich jedoch aus der obigen Datenmatrix ableiten: 1. Richtung der Datenkompression: (mehr) auf Variablen oder auf Elemente gerichtete Verfahren. (Gelegentlich läßt sich auch noch eine dritte Dimension - z.B. Produkte - denken; s. dazu etwa unter 12.1.) 2. Partitionierung der Datenmatrix, in der Weise, daß einer oder mehreren Variablen andere gegenübergestellt und die Einflüsse dieser untersucht werden. Es geht hier also darum, die Abhängigkeit {Dependent von einer oder mehreren Größen von mehreren anderen zu analysieren. Fehlt diese Partitionierung, wird also nur die Wechselwirkung der Variablen untereinander untersucht, so spricht man von lnterdependenz-hnAyst. (Diese Einteilung geht auf KENDALL 1950 zurück.) Darst. IIIE-2 (folgende Seite) gibt eine Ubersicht über wichtige multivariate Methoden nach den vorstehenden beiden Einteilungen. Als weitere - 3. - Einteilung kann insbesondere die nach dem Skalenniveau der untersuchten Daten erfolgen. Speziell bei der Dependenz-Analyse vermag man - 4. - nach der Anzahl der Variablen auf jeder Seite zu differenzieren.

Nicht enthalten in der Abbildung sind allgemeine Ansätze: das Conjoint Measurement und die Kovarianzstrukturanalyse·, sie finden in Kap. 13 Behandlung. Ebenfalls nicht enthalten ist - zumal schon wegen ihrer Zuordnung umstritten - die Korrespondenzanalyse·, sie wird in Kap. 11 erörtert. Dort werden auch weitere Methoden der Dependenz-Analyse (sofern sie nicht schon - wie erwähnt, die multiple Regression - in Kap. 10 dargestellt

Einführung: Datenaufbereitung und Datenanalyse

215

wurden) diskutiert. Kap. 12 ist dann den Methoden der InterdependenzAnalyse gewidmet. multivariate Methoden

I

die Datenmatrix partitionierende Methoden (Dependenz-Analyse)

gerichtet auf Variablen

gerichtet auf Elemente

die Datenmatrix nicht partitionierende Methoden (Interdependent Analyse)

gerichtet auf . Variablen

(multiple) Varianz- kanonische Diskriminanz- AID (multiple) Regres- (und Ko- Analyse analyse Kprrelavananz-) tionsanalyse Analyse analyse

gerichtet auf Elemente

R-Fak- Multi- Cluster- Q-Faktoren- dimen- analyse torenanalyse sionale anahse

Sistierung

Darsi IIIE-2: multivariate Methoden

Vor der Diskussion der einzelnen Analyse-Methoden sie noch auf Datenanalysesysteme hingewiesen. Man versteht darunter Programmsysteme, die neben Routinen zur Ein- und Ausgabe sowie Manipulation der Daten solche für die wichtigsten Analysemethoden enthalten. Sie wurden naturgemäß zunächst für Großrechner („mainframes") entwickelt. Zu den ältesten und auch wohl bekanntesten zählen BMDP (vorher: BMD Biomedical Computer Programs) und SPSS (ursprünglich: Statistical Package für the Social Sciences, heute: Superior Performing Software System). Später traten andere hinzu, etwas SAS (Statistical Analysis System). Mit dem Aufkommen und dem Erfolg des PC entstand eine immer größer werdende - Anzahl von ausschließlich darauf abstellenden Programmsystemen. (Ein Beipsiel dafür ist NCSS - Number Cruncher Statistical System.) Daneben entwickelten die älteren Anbieter PC-Versionen (z.B. SPSS-PC). Später kamen „Windows"-Versionen dazu. Man mußte also aufpassen, „wovon man spricht". So gab es bei SPSS - abgesehen von Spezialisierungen - allein schon drei große Ausgaben: SPSS", SPSS-PC und später SPSS-Windows. Heute haben die Großrechnerversionen kaum noch Bedeutung (und zunehmend weniger auch die für DOS). Die „Standardversion" ist derzeit SPSS 10.0. Ähnliches gilt für die Literatur. Diese ist so vielgestaltig, daß hier auf eine Aufführung verzichtet werden muß. Erwähnt sei nur, daß es zumindest bei den meistverbreiteten Programmsystemen neben den „offiziellen" Handbüchern bzw. entsprechender Literatur (z.B. für SPSS von M. Norusis) solche „freier" Autoren gibt. Als

216

Teil III Methoden der Datenanalyse in der Marktforschung

Beispiel: W.-M. Kahler, Leiter des Fachgebietes „Statistik und Projektberatung" im „Zentrum für Netze und und verteilte Datenverarbeitung (ZfN)" der Universität Bremen, hat für SPPS eine ganze Reihe von Büchern vorgelegt; derzeit aktuell ist davon allein wohl noch „SPSS für Windows", 4. Aufl., Braunschweig 1998. Für 1996 gab übrigens SPSS die Übernahme von BMDP bekannt. (Schon im September 1994 war SYST A T - ebenfalls ein Statistikprogramm - gekauft worden.) Neben diesen allgemeinen Datenanalysesystemen - die sich durch ein sehr weites Angebot an statistischen Analyse-Methoden auszeichnen - gibt es auch solche Packages, die speziell für die Anforderungen der Marktforschung entwickelt wurden, entweder für mehr oder weniger alle Phasen oder für Sonderaufgaben. Daneben existieren natürlich die zahlreichen Graphik- und Textverarbeitungsprogrzmme.

Nicht eingegangen wird im folgenden auf „Data Warehousing und Data Mining". (So schon der Titel von LUSTI 2 0 0 2 ; etwas überraschenderweise bilden dann allerdings diese beiden Begriffe nur jeweils ein Kapitel - 5 und 6 - in dem umfassenden Werk.) Dies begründet sich vor allem daraus, daß die verwendeten Methoden nicht allzu sehr verschieden sind von den im folgenden dargestellten. So stehen „Mustererkennungsverfahren" wie die Clusteranalyse - s. dazu ausführlich in Kap. 12 - im Vordergrund; auch „neuronale Netze" - s. dazu, allerdings nur kurz, in Kap. 14 - werden genannt. Es verwundert deshalb nicht, daß Fragen auftauchen wie „Altbekanntes in neuer Verpackung?" - so M. Bauer in „Business Computing" 4 / 1 9 9 6 , hier zitiert nach D E C K E R / W A G N E R / K N A U F F 1 9 9 6 - oder: „Data Mining: A New Label for an Old Problem?" - G A U L / S C H A D E R 1 9 9 9 . Unter Data Mining wird dabei im allgemeinen verstanden das „Buddeln" oder „Schürfen" in der Datenmine, dem Bestand der für ein Unternehmen verfügbaren Daten, d.h. „die automatische und nichttriviale Suche nach Wissen in Massendaten" (LUSTI 2 0 0 2 , S. 2 6 0 ) . Eine „Datenmine" soll dabei verkörpert werden durch ein Data Warehouse, eine „analytische" - d.h. vom „operativen System" losgelöste - Datenbank, die vor allem auch historische Datenbestände enthält. Speziell in bezug auf das Internet spricht man auch von Web Mining (so SÄUBERLICH 2 0 0 1 ) b z w . Web Log Mining

(BENSBERG 2 0 0 1 ) .

Kapitel 9 Ein- und mehrdimensionale Auszählungen Im ersten Abschnitt dieses Kapitels wird die einfache Häufigkeitsanalyse erörtert, im anderen die zweidimensionale, die sog. Kreuztabulierung. Wie schon in der Einführung zu diesem Teil gesagt, ist bei der univariaten Analyse nur auf "Querschnittsdaten" abgestellt; die "Zeitreihenanalyse" bleibt hier unberücksichtigt; im Anschluß an die Darstellung der Kreuztabulierung erfolgt allerdings ein Exkurs über die "Kohortenanalyse", als verbindende Betrachtung von Längs- und Querschnitten. Eingegangen wird dagegen in Abschnitt 1 auch auf die graphische Darstellung in Gestalt von Diagrammen sowie die - "qualitative" und "quantitative" Inhaltsanalyse.

9.1 Die einfache Häufigkeitsanalyse Wie bereits erwähnt, liegt eine einfache Häufigkeitsanalyse dann vor, wenn aus der Datenmatrix nur eine Spalte, d.h. eine Variable x, herausgegriffen und die Verteilung der einzelnen Ausprägungen x^ (über die Elemente) untersucht wird, gemäß Darst. 9-1 (mit f für die Häufigkeiten oder Frequenzen - "frequencies").

X

f

••

fi• •

xk • •

• • fr Ef ( = Ν oder n)

Darsi. 9-1: (einfache) Häufigkeitsverteilung

218

Teil III Methoden der Datenanalyse in der Marktforschung

Hierbei handelt es sich nur um die absoluten Häufigkeiten. Weitere Möglichkeiten sind: 1. Darstellung der relativen Häufigkeiten: fj/f. (Anteile oder Proportiof nen) bzw. y- χ 100 (Prozente). Die Darstellung in relativen Häufigkeiten hat zunächst den Vorteil, daß sie für alle Skalenniveaus anwendbar ist. Beispiel 9-1 Eine erste Auszählung einer Untersuchung über die Altersversorgung der berufstätigen Bevölkerung bringt folgendes Ergebnis: Es haben eine Lebensversicherung für sich abgeschlossen 31% der Berufstätigen Es haben keine Lebensversicherung für sich abgeschlossen 68% der Berufstätigen (S. weiter - auch zur Quelle - unten, Beisp. 10.)

Es handelt sich hierbei um ein dichotomes Merkmal (vorhanden/nicht vorhanden). Speziell bei multitomen Variablen ist nun aber, wie in Teil I ausführlich dargelegt, die weitere Auswertung beschränkt. (Insbesondere die Berechnung solcher Maßzahlen wie arithmetisches Mittel und Standardabweichung scheint nur bei metrischer Skalierung sinnvoll.) Zudem ergeben sich bei der Darstellung in relativen Zahlen einige Probleme. Eines davon ist, ob die absoluten Werte zusätzlich angegeben werden sollten. Diese Frage wird oft verneint, schon deshalb, weil das die doppelte Menge an Zahlen bedeuten würde und dadurch die Tabellen usw. unanschaulich werden könnten. Damit entsteht jedoch die Gefahr des Außerachtlassens des absoluten Umfangs der jeweiligen Gesamtheit; dies kann geradezu irreführend sein, wenn es sich nur um wenige Fälle handelt. Uberhaupt ist bei der Interpretation Vorsicht geboten. Beispiel 9-2 Die Meldung "50% der Prüflinge fielen durch!" ist eine unzulässige Aussage, wenn es sich nur um 2 Prüflinge handelte, von denen eben der eine zufällig den Anforderungen nicht genügte. Beispiel 9-3 Die Angabe: "Das Produkt X hat im Berichtszeitraum eine Zunahme, in Höhe von 20%, zu verzeichnen" ist mehrfach unklar: a) 20% können viel oder wenig sein, je nachdem, wie der Ausgangsstand war. (Extrem: Eine "Steigerung der Produktion von 100%" ist absolut gesehen minimal, wenn vorher nur 1 Stück produziert wurde!)

Kapitel 9 Ein- und mehrdimensionale Auszählungen

219

b) Es ist wichtig zu wissen, ob eine Zunahme auf x% (des Ausgangswertes) oder um x% (vom Ausgangswert) erfolgte. c) Unterschieden werden muß auch zwischen der Veränderung um Prozentpunkte und der prozentualen Veränderung des bisherigen Anteils (Prozente von Prozenten). So können sich die erwähnten 20% beziehen etwa auf den bisherigen (Markt-)Anteil: 20% von bisher 10% Marktanteil ergibt einen neuen Anteil von 12%. Handelt es sich dagegen um Prozentpunkte, so würde dies bedeuten, daß der Marktanteil nunmehr 30% beträgt. (S. dazu auch A 9-1).

Es wird deshalb oft gefordert, bei Prozentangaben, die sich auf eine kleine Gesamtheit (z.B. weniger als 100 Cases) beziehen, die absoluten Zahlen zusätzlich mitzuteilen. In jedem Falle, auch bei großen Massen, empfiehlt sich die Angabe des Umfangs der Gesamtheit (n oder N), die dann immer eine Berechnung auch der absoluten Werte für die Prozentzahlen ermöglicht. Bei Vergleichen gilt zudem die Forderung nach Mitteilung der Vergleichsgrundlage. 2. Darstellung der kumulierten Häufigkeiten: Fk=hc c=l

(9.1)

Läuft - wie oben - k von 1 bis r, so bedeutet c = 2 etwa, daß die Häufigkeiten der ersten beiden Ausprägungen zu addieren sind. Dies kann sich auch auf die relativen Häufigkeiten beziehen, desgleichen auf die "adjustierten": 3. "adjusted frequencies" bezeichnet meist die Bereinigung um die fehlenden Werte (missing values). Solche können in einer zusätzlichen Zeile: "k.A." (keine Angabe) ausgewiesen werden. Sie sind auf vielerlei Gründe zurückzuführen, möglicherweise auch erst auf Irrtümer bei der Datenerfassung. Meist werden sie jedoch auf fehlenden Angaben der Auskunftsperson beruhen und können bereits bei der Datenerhebung, als "unentschieden", "weiß nicht" etc., berücksichtigt werden. Wie dargelegt, gehört diese Kategorie im Prinzip mit zum Ergebnis. Ihre Nichtberücksichtigung (z.B. die Prozentuierung der Wähler- oder Produktpräferenzen nur auf die Gesamtsumme derer, die überhaupt eine Präferenz für eine bestimmte Partei bzw. ein bestimmtes Produkt angeben) kann bedenklich sein. In jedem Falle bedarf die Basis der Prozentuierung sorgfältiger Überlegung.

220

Teil III Methoden der Datenanalyse in der Marktforschung

Beispiel 9-4 Erklären sich von der Gesamtheit der Befragten 10% als Verwender eines Produkts und davon wiederum rund 50% als mit diesem zufrieden, so mag leicht der Eindruck entstehen, als ob man seinerseits hierdurch "befriedigt" sein könne; tatsächlich sind aber eben nur 5% aller Befragten mit dem Produkt zufrieden. (Ein Großteil ist etwa gerade wegen der Unzufriedenheit mit dem Produkt nicht Verwender desselben!) Hier wäre also als Basis besser z.B. die Gesamtzahl der Befragten zu nehmen. Beispiel 9-5 Was würde eine Zusammenstellung besagen, die sich auf die Wahl von Zigaretten bezieht, aber auch diejenigen, die keine Zigaretten kaufen oder überhaupt Nichtraucher sind, enthält? (Etwa: Zigarettenmarke A 10%, Marke Β 17%, C 14%, sonstige 7%, Nicht(zigaretten)raucher 52%.) In diesem Falle wäre als Basis vielleicht nur die Gesamtzahl der Zigarettenraucher geeignet, die der - prinzipiellen? Nicht(zigaretten)raucher also auszuschließen.

Die Frage der Basis spielt auch eine Rolle im Zusammenhang mit Mehrfachnennungen. Meist läßt man es hier zu, daß die Addition aller - prozentualen - Nennungen mehr als 100% ergibt. (Die Möglichkeit, als Summe der Prozente gleichwohl 100% zu erhalten, indem etwa die Gesamtzahl der Nennungen gleich 100 gesetzt wird, ist eher abzulehnen, wegen der Schwierigkeiten bei der Interpretation.) Dies hängt auch mit der Art und Weise des Coding zusammen, für die grundsätzlich zwei Wege bestehen: Beispiel 9-6 Bei einer Frage seien bis zu 5 Antworten zugelassen. 1. Diese eine Frage wird in 5 einzelne Variablen (als Spalten der Datenmatrix) aufgegliedert, die sich dann als 0/1-Variablen (gegeben/nicht gegeben) darstellen. 2. Es bleibt bei einer Variablen, die dann aber bis zu 5 Ausprägungen gleichzeitig kodierbar zulassen muß (etwa: Case A vielleicht - nur - Antwortmöglichkeit 3, bei Β dagegen 2, 3 und 5.)

Wie in der Einführung zu diesem Teil erwähnt, wird in modernen Datenanalyse-Programmsystemen (auch für PCs) zunehmend Graphik eingesetzt. Diese optische Veranschaulichung von numerischen Sachverhalten liegt offensichtlich im "Zuge der Zeit" und folgt dem Grundsatz: "Ein Bild sagt mehr als tausend Worte." Nachstehend werden, ohne Anspruch auf Vollständigkeit und als Einteilungskriterium in etwa der geometrischen Dimension folgend, einige Formen von Diagrammen mehr nur aufgezählt:

Kapitel 9

Ein- und mehrdimensionale Auszählungen

221

1. Das Linien- (mathematisch exakter: Strecken-) Diagramm entsteht dadurch, daß - meist in der Waagerechten, also gewissermaßen parallel zur Abszisse, nach links und rechts von einer Mittellinie, quasi der Ordinate Strecken entsprechend der Größen abgetragen werden. Es findet verhältnismäßig selten Anwendung; eine Ausnahme bildet z.B. die in der Bevölkerungsstatistik übliche Darstellung des Altersaufbaus der Bevölkerung ("Bevölkerungspyramide") .

Zeichnet man diese Strecken als "Stäbe" oder "Säulen", so erhält man ein Stab- (oder Säulen- oder Balken-)Diagramm. Dieses ist also noch immer nur eindimensional: Es kommt allein auf die Höhe bzw. Länge an (im Unterschied zum "Histogramm" der Statistischen Methodenlehre, bei dem die Fläche entscheidend ist). Das Stabdiagramm wird sehr oft angewandt, noch dazu mit Variationen {Scbraffur, Farbe, Unterlegung von Symbolen usw.). Beispiel 9-7 Entwicklung der Umsätze, aufgeteilt nach In- und Auslandsumsatz in verschiedenen Jahren.

2. Beim Flächen-Diagramm ist, wie schon der Name sagt, der Flächeninhalt maßgeblich. Verwandt wird es meist in der speziellen Form des Kreisdiagrammes, und zwar fast ausschließlich zur Veranschaulichung von Anteilen. (Die Wiedergabe absoluter Größen - etwa durch unterschiedlich große Kreise für verschiedene Jahre - wäre in der Regel eher irreführend.) Wegen der sonst, bei vielen kleinen Sektoren, sich ergebenden Unübersichtlichkeit ist es im Grunde begrenzt auf Merkmale mit relativ wenigen Ausprägungen. 3. Bei Körper-Diagrammen ist der Raumm\iûx. entscheidend. Infolge dieser dreidimensionalen Betrachtungsweise - etwa in Gestalt verschieden großer Würfel für mehrere Perioden oder Gebiete - kann es allerdings eher Verwirrung stiften und wird deshalb nur selten benutzt. 4. Kurven-Diagramme hinwiederum wird man sehr häufig anwenden können. Sie entstehen durch die Verbindung von in ein Koordinatensystem eingetragenen Punkten. Die Einteilung kann deshalb nach der Art des Koordinatensystems erfolgen: a) Der Normalfall sind rechtwinklige (kartesische) Koordinaten. Dabei kann ein verschiedener Maßstab Anwendung finden:

222

Teil III Methoden der Datenanalyse in der Marktforschung

(1) Beim arithmetischen Maßstab besteht besonders die Gefahr der "optischen Manipulation", also der Veränderung der Kurvengestalt durch Streckung oder Kürzung eines der beiden Achsenmaßstäbe. (Gelegentlich wird deshalb als Faustregel empfohlen, daß das Verhältnis der Maßeinheiten dem der Standardabweichungen der zwei Variablen entsprechen soll.) Auch bieten sich natürlich verschiedene Variationsmöglichkeiten an: mehrere Kurven in einem Diagramm, Schraffur, Unterlegung mit sinnbildlichen Darstellungen usw. In der Statistik spricht man auch von Häufigkeitspolygon. Es entsteht aus dem Histogramm durch die Errichtung der Gruppenhäufigkeitsstrecken und Verbindung dieser zu einem Kurvenzug. Die entsprechende Darstellung der kumulierten Häufigkeitsverteilung wird oft als Ogive bezeichnet.

(2) Ein wichtiger Grund für die Anwendung des (meist: halb-)logarithmischen Maßstabs ist - bei Zeitreihen - das Erkennen der relativen Veränderungen ("Wachstumsraten"): Ergeben absolut gleiche Zuwächse bei arithmetischer Skalierung eine Gerade, so zeigt sich in diesem Fall bei Verwendung des logarithmischen Maßstabs nur ein degressiver Anstieg; eine Gerade resultiert erst aus relativ gleichen Zuwächsen. Ferner kann ein (halb-)logarithmischer Maßstab sinnvoll bei Vorliegen einer asymmetrischen, speziell rechtsschiefen Verteilung benutzt werden. (3) Die praktische Umsetzung wird sich zumeist entweder auf Software mit geeigneten Graphik-Features oder entsprechend präpariertes Papier (im Falle der halblogarithmischen Darstellung sog. Exponential-, bei der doppellogarithmischen sog. Potenzpapier) stützen. Für die verschiedensten Zwecke sind eine Reihe weiterer solcher "Netze" entwickelt worden, denen allen - analog zur logarithmischen Skalierung - eine irgendwie bewirkte "Verzerrung" einer oder beider Achsen gemeinsam ist, etwa wie beim sog. Wahrscheinlichkeitspapier (oder -netz), welches eine derartige Einteilung der Ordinate aufweist, daß die kumulierte Gaußsche Normalverteilungskurve zu einer Geraden wird. Damit kann also rein graphisch entweder überhaupt das - zumindest annäherungsweise - Vorliegen einer Normalverteilung überprüft oder die Ablesung der Parameter μ und σ vorgenommen werden; ferner eignet sich das Papier, wegen der weitgehenden Ähnlichkeit mit der logistischen Funktion, evtl. auch zu entsprechenden Prognosen. b) Po/^rkoordinaten finden als Darstellungsmittel verhältnismäßig selten Anwendung; Draec^skoordinaten werden noch seltener benutzt.

Kapitel 9

Ein- und mehrdimensionale Auszählungen

223

Bisher war auf eher "konventionelle" Darstellungsmittel eingegangen worden. Wie bereits (in Kap. 2) erwähnt, ist nun aber innerhalb der "explorativen Datenanalyse"von. TUKEY 1 9 7 7 (und anderen) eine Fülle von - auch graphischen - Verfahren im Rahmen einfacher Häufigkeitsauszählungen vorgeschlagen worden, wie etwa "Box Plots", "Stem-and-Leaf Displays" usw. Sie setzen sich nur sehr langsam durch; auch hier sei deshalb nur auf die entsprechende Literatur (am Schluß dieses Kapitels) verwiesen. Auch auf bi- und multivariate Darstellungen kann - zumal an dieser Stelle - nicht eingegangen werden. Dafür wurden ebenfalls verschiedene Vorschläge gemacht, so z.B. von CHERNOFF (1973) die Variation der Elemente von Gesichtern ("Chernoff Faces "). Wie einleitend zu diesem Kapitel bereits erwähnt, soll jetzt noch - kurz die Inhaltsanalyse diskutiert werden. Diese Behandlung, unter dem Rubrum "einfache Häufigkeitsanalyse", mag zunächst verwundern. Tatsächlich kann aber der erste Schritt im Rahmen einer quantitativen Inhaltsanalyse die Auszählung der Häufigkeit der einzelnen Wörter eines Textes - oder allgemeiner: "Dokumentes" - sein. (Vgl. dazu etwa den bei MOCHMANN [ 1 9 8 0 , S. 2 1 ] wiedergegebenen Computer-Ausdruck der Auszählung eines amerikanischen Textes, mit z.B. "a" 44mal, "able" lmal usw.) Natürlich nutzt eine solche bloße Deskñption wenig. Auch bei der oft so genannten automatisierten Inhaltsanalyse müssen deshalb weitere Analyse-Schritte folgen. Von den Vertretern der qualitativen Inhaltsanalyse wird deshalb oft sogleich mit Bewertungen usw. gearbeitet. Überhaupt ist darauf hinzuweisen, daß der - hier stark verkürzt wiedergegebene - Gegensatz zwischen "qualitativer" und "quantitativer" Inhaltsanalyse bei weitem nicht die ganze Fülle von einschlägigen Verfahren umreißt. So gibt etwa MERTEN ( 1 9 9 5 , S. 1 2 1 ) eine "Synopsis inhaltsanalytischer Verfahren", die 20 Varianten umfaßt. (Darunter ist auch das - in Kap. 4 erwähnte - Semantische Differential. An anderer Stelle - S. 199 - wird auch der TAT dazu gerechnet; s. zu diesem ebenfalls Kap. 4.) In den USA wird diese Vielfalt im allgemeinen unter der Bezeichnung Content Analysis erfaßt. Wie umstritten diese ist, zeigt das von MAYRING (1993, S. 25) angeführte Schmähwort von der "discontent analysis" (Unzufriedenheitsanalyse).

224

Teil III Methoden der Datenanalyse in der Marktforschung

Dabei scheint noch nicht einmal sicher, in welchen Kontext die Methodik einzuordnen ist: Während sie hier unter Daterlanalyse erörtert wird, ordnet sie Merten der Datenerhebung zu, und zwar als weitere Methode neben Befragung und Beobachtung, also innerhalb der /VzVwárforschung. Hier wird sie eher als Sekundäriorsch\ir\% angesehen: bereits vorliegende "Dokumente" werden ausgewertet. Rein technisch kann man die Datenerfassung dabei heute relativ wenig zeit- und kostenaufwendig durchführen (mittels automatisierter Lesegeräte, vorwiegend für

gedruckte Texte).

Diese kritische Beurteilung der Inhaltsanalyse verwundert nicht angesichts dessen, daß das eigentliche Problem in der Kategorienbildung liegt, d.h. der Entwicklung eines Kategorienschemas und der Zuordnung der einzelnen Analyse-Einheiten (neben - wie erwähnt - Wörtern können das Sätze, Themen usw. sein) zu den Kategorien. Dabei entstehen gerade auch für die automatisierte Inhaltsanalyse mittels Computer nur sehr schwer lösbare Probleme der Synonyma bzw. des Kontextes, wie abschließend ein Beispiel zeigen mag: Beispiel 9-8 Der einfache englische Satz: "Time flies like an arrow" läßt drei verschiedene Interpretationen zu: 1. "Die Zeit vergeht wie im Fluge" 2. "Es gibt eine Klasse von Fliegen (genannt 'Zeit-Fliegen'), die für einen Pfeil schwärmen" 3. "Es liegt ein Befehl vor: Richte Fliegen ab so wie einen Pfeil!" (KRIPPENDORFF 1 9 6 9 , zitiert nach MERTEN 1 9 9 5 , S. 3 4 2 ) . In diesem Zusammenhang sei noch die (qualitative) Trendforschung erwähnt, die sich etwa eben der Inhaltsanalyse, aber auch sog. (neuerdings sogar „Online-")Scouts, zur Erspähung neuer „In's" und „Out's", bedient; vgl. dazu etwa kritisch RUST 1997.

9.2 Kreuztabulierung Unter Kreuztabulierung oder -auswertung (cross-tabulation) versteht man die Auszählung der Ausprägungen eines Merkmals gegen die eines anderen. Darst. 9-2 zeigt dies schematisch bzw. allgemein. (In der Praxis wird es sich zumeist um «omm^/skalierte Merkmale handeln; man spricht dann, insbesondere im Zusammenhang weitergehender Analysen, auch von Kontingenztafeln. S. dazu unten, 10.2.)

Kapitel 9

\

y

x \ M

225

Ein- und mehrdimensionale Auszählungen

yi

f

i n , 1

...

yi

...

1 11

Γ

...

ys

...

Γ fis

• »- V f Eil. '

...

f ks

Efk.

Ν

*k

i kl

...

1 ι ·

" Κ

:

... Ef.i

Γ

...

fri Efi

... ...

1f

* rs-

Ef.

>

Efr. *

Γ

Σ

s

E

k = l 1=1

fu

= Σί ..= Ν (oder η) Darst. 9-2: zweidimensionale Häufigkeitsverteilung Die Pfeile deuten die verschiedenen Möglichkeiten der Berechnung von relativen Häufigkeiten, zumeist Prozenten, an: 1. in Richtung auf die Randverteilung des Merkmals x, 2. dto. von y und 3. die Gesamtheit. Die Entscheidung darüber stellt ein erstes Problem der zweidimensionalen Häufigkeitsanalyse dar. Sie ist wesentlich davon abhängig, welches Merkmal als die "unabhängige Variable" und welches als "abhängige Variable" angesehen werden kann. (Die Berechnung in Richtung auf die Gesamtheit wird weniger oft eine Rolle spielen.) Vielfach kann man die demographischen Merkmale - Alter, Familienstand usw., s. auch das Beispiel unten- als unabhängig annehmen. Grundsätzlich soll die Prozentrechnung von demjenigen Faktor ausgehen, der der einflußreichere ist. In Zweifelsfällen wird man zunächst die Berechnungen in allen Richtungen durchführen lassen, um dann die Darstellung zu wählen, die die klarere Aussage gibt. (SPSSX etwa erlaubt diese 3fache Berechnung als Option.)

Ein zweites Problem stellt das der Entscheidung darüber dar, welche Merkmale gegeneinander auszuweiten sind. Theoretisch wird die Anzahl aller möglichen Kreuztabulierungen sehr schnell recht groß, nach der Formel:

·

226

Teil III Methoden der Datenanalyse in der Marktforschung

Beispiel 9-9

Ì32Ì

Bei - "nur" - 32 Fragen ergeben sich bereits I 2 J - 16 · 31 - 496 Kreuztabellen.

O b w o h l deren Generierung und Ausdruck im Falle hochentwickelter Programmsysteme nur vergleichsweise wenig Zeit erfordert, ist sofort einsichtig, daß ihre Analyse entweder nur sehr oberflächlich und damit nutzlos bzw. sogar schädlich (weil eventuell zu falschen Schlußfolgerungen verleitend) sein kann oder aber lange Zeit benötigt. Die Anzahl der Kreuztabellen m u ß also reduziert, d.h. eine Selektion vorgenommen werden. Diese scheint aber kaum nach objektiven Kriterien möglich; vielmehr erwächst dem Ermessen des Analytikers hier breiter Raum. Beispiel 9-10 Die univariate Auszählung im Beisp. 9-1 ist für sich allein noch wenig aussagekräftig; es bedarf zumindest eines zweiten Merkmals, um mehr Aufschlüsse zu erhalten. Das kann etwa das Alter sein: Besitz einer Lebensversicherung bei Berufstätigen verschiedenen Alters

Berufstätige im Alter von 18-29 3044 45-59 60 und mehr Jahren Jahren Jahren Jahren

Es haben eine Lebensversicherung für sich abgeschlossen

17%

38%

39%

40%

Eine ähnliche Zusammenstellung kann jedoch auch nach dem Familienstand erfolgen: Besitz einer Lebensversicherung bei Berufstätigen nach Familienstand

Es haben eine Lebensversicherung für sich abgeschlossen

Ledige

Verheiratete

15%

43%

Ein wesentlich besserer Einblick ist allerdings durch die Zusammenfassung beider Tabellen möglich:

Kapitel 9 Ein- und mehrdimensionale Auszählungen

227

Besitz einer Lebensversicherung bei Berufstätigen verschiedenen Alters nach Familienstand

Berufstätige im Alter von 18-29 Jahren 30 u. mehr Jahren Ledige Verheiratete Ledige Verheiratete

Es haben eine Lebensversicherung für sich abgeschlossen

15%

33%

25%

44%

Hieraus ergibt sich, daß der bestimmende Faktor für den Abschluß einer Lebensversicherung weniger - wie es zuerst hätte scheinen können - das Alter als weit mehr der Familienstand ist. (Von den jüngeren Personen besitzen Verheiratete im größeren Ausmaß eine Lebensversicherung als die Ledigen unter den älteren!) Die Folgerung für die Versicherer mußte also lauten, sich bei der Werbung für neue Kunden weniger an ältere Personen als stärker an solche, die gerade geheiratet haben - mit der Betonung der Sicherung der Familie - zu wenden. (Quelle: NOELLE[-NEUMANN] 1963, S. 243f. - In NOELLE-NEUMANN/PETERSEN 1996, S. 429ff., findet sich praktisch das gleiche Beispiel, aber mit anderen Zahlen, aufgrund einer Umfrage vom März 1995; die Aussage hat sich jedoch nicht verändert.)

Die letzte Tabelle im vorstehenden Beispiel zeigt, daß die gegenseitige Auswertung auch in bezug auf mehrere Merkmale vorgenommen werden kann. In der Praxis wird dies aber - und auch das nur mehr in Sonderfällen - auf ¿dreidimensionale Tabellen begrenzt bleiben. Ansonsten wird man sich auf Analyse nur zweidimensionaler Tabellen beschränken und dabei versuchen müssen, in solchen Fällen, in denen die beiden Größen von einer dritten Variablen abhängig sind, den "Stör-Faktor" zu eliminieren. Beispiel 9-11 Bei einer - schon länger zurückliegenden - Umfrage in Berlin antworteten auf die Frage "Rauchen Sie?" 47% der Sportvereinsmitglieder mit "Ja", dagegen nur 41% der Personen, die nicht Mitglied eines Sportvereins sind. Daraus hätte geschlossen werden können, daß Sportler relativ stärker rauchen - mit möglichen Konsequenzen für die Werbung. In Wirklichkeit hing sowohl das Sportausüben als auch das Rauchen mit einer dritten Größe, dem Geschlecht, zusammen: Nach dessen Berücksichtigung - weit höherer Anteil der Männer an den Sportvereinsmitgliedern - ergab sich ein ganz anderes Resultat, nämlich bei den männlichen Mitgliedern 58% Raucher gegenüber 69% bei Nichtmitgliedern und bei den weiblichen 25% gegenüber 24%.

228

Teil III Methoden der Datenanalyse in der Marktforschung

Selbst hier, bei diesem klaren und mit der allgemeinen Erfahrung übereinstimmenden Ergebnis, daß Sportler weniger rauchen, ist noch (insbesondere bei den Frauen) ein versteckter Faktor, nämlich das Alter (jüngere Frauen rauchen öfter, gehören aber auch öfter einem Sportverein an), verborgen, der weiterer Untersuchung bedürfte. (Nach einer Analyse von K. Schreiber in: Berliner Briefe, Institut für Markt- und Verbrauchsforschung der Freien Universität Berlin, III, vom 7.7.1961, zitiert nach NOELLE [-NEUMANN] 1963, S. 237.)

In den letzten Jahren hat sich in den USA eine Darstellungsform verbreitet, die dort als banner bezeichnet wird: die Auswertung einer Variablen - im Prinzip der "abhängigen", in den Zeilen - gegen mehrere andere, in den Spalten. Dies "multiple-variable cross-tabulation table" oder eben "(stub and) banner table", mit "stub" als der abhängigen, der An^/yse-Variablen, und "banner" den Gruppierungs-Variablen - stellt also praktisch die Aneinanderreihung mehrerer einzelner Kreuztabellen mit der gleichen "Eingangs"-Variablen dar (das ist der Vorteil!). Andererseits erlaubt sie - als Nachteil - nicht die gleichzeitige Betrachtung mehrerer - in Beisp. 10: dreier - Variablen, also ihrer "Interaktionen". (S. auch MAGUIRE/WILSON 1 9 8 3 u n d A 9 - 2 . )

Exkurs: "Kohortenanalyse" In neuerer Zeit findet das Konzept der "Kohortenanalyse" auch in der Marktforschung zunehmend Beachtung. Man kann darunter begrifflich ganz allgemein "das Verfolgen einer Personengesamtheit im Zeitablauf" (HÜTTNER 1 9 7 3 , S. 8 1 ) verstehen. Abgestellt wird im folgenden dabei nur auf Geburtskohorten - also Populationen, bei denen das (im Sinne von RYDER 1 9 6 5 ) eine Kohorte definierende "gleiche Ereignis innerhalb des gleichen Zeitraums" das Geborenwerden ist. Bei Kohorten in diesem Sinne sind drei verschiedene Effekte möglich: 1. Geschichts- oder Periodeneñekt Er spiegelt die Verhaltensveränderung wider, die auf die für alle Personen gemeinsamen Umweltsbedingungen zurückgeht. 2. Alters- oder Reifungseffekt

Kapitel 9 Ein- und mehrdimensionale Auszählungen

229

Er bezieht sich auf die individuellen Verhaltensveränderungen, die auf subjektive, während des Untersuchungszeitraums sich vollziehende "Reifungsprozesse" zurückzuführen sind. 3. Generationen- oder Kohorteneffekt Er ergibt sich durch die Einzigartigkeit jeder Kohorte, ihre Besonderheit (z.B., daß es sich um einen besonders "umfänglichen" Geburtenjahrgang handelt). Diese verschiedenen Effekte können durch die traditionellen Erhebungsdesigns allein nicht erfaßt werden. So besteht die übliche Querschnittsanalyse ("cross-sectional design") aus einer Messung an verschiedenen Personen zum gleichen Zeitpunkt. Die Aufgliederung nach dem Alter erlaubt also im Grunde - obwohl nicht selten vorgenommen - keine "entwicklungsmäßige Interpretation": Die vorzufindenden Unterschiede enthalten neben dem Alterseffekt auch den Kohorteneffekt. In ähnlicher Weise enthält eine ebenfalls oft verwandte Anlage - die zudem noch den Nachteil hat, auf die Ergebnisse eventuell lange warten zu müssen! -, die Längsschnittanalyse ("longitudinal design"), die Messung an den gleichen Personen zu verschiedenen Zeitpunkten, neben dem Alterseffekt noch den Periodeneffekt. Eine Untersuchungsanlage, die das Zusammenwirken aller drei Effekte zu erfassen vermag, ist zunächst durch das Panel gegeben (sofern eine Aufgliederung nach Altersgruppen erfolgt). Gerade durch das Gleichbleiben der Personen wird dabei die Feststellung und zeitliche Zuordnung möglich. Gelegentlich unterscheidet man zwischen "unechten" und "echten" Kohorten; letztgenannte liegen vor, wenn "identische Personen im Zeitablauf beobachtet werden" (GLAAB 1976, S. 419f.). Letztlich ist bei dieser Identität der Personen aber auch das Repräsentanzprob\em angesprochen. In der Praxis der Marktforschung wird man aus Kostengründen meist mit "Stichproben" arbeiten müssen; die Aufrechterhaltung der Repräsentanz einer einmal gezogenen Stichprobe über die - u.U. längere! - Zeit hinweg ist aber außerordentlich problematisch; s. dazu "Panelsterblichkeit" und "-rotation" in Kap. 7.

Gemäß der oben gegebenen Definition stellt nun aber die Kohortenanalyse nicht unbedingt auf die individuellen Veränderungen im einzelnen, sondern zusammenfassend auf die der Gesamtheit ab. Insofern liegt es nahe, sich mit einer Sequenz von Querschnitten, mit hinreichender Repräsentanz für die einzelnen Altersgruppen, zu begnügen. Eine solche Querschnitts-Sequenz läßt sich in einer - 2dimensionalen - Kreuztabelle darstel-

230

Teil III Methoden der Datenanalyse in der Marktforschung

len, mit dem Alter in den Zeilen (Index k, v o n 1 ... r) und den Perioden (Jahren) -1, v o n 1 ... s - in den Spalten, gemäß Darst. 9-3. (χ ι ) x

Alter

x

11 ·· •

X

11 ·· •

x

x

kl ·· •

x

x

il

·· •

X

x

.l

·· •

x

x

l.

X

x

k.

x

kl

·· •

x

r.

xrl

.. •

x

·· •

Spaltenmittel Darst.

·· •

.l

.l

.i

··

x

.s

Zeilenmittel

ls

x

l.

ks

x

k.

x

r.

IS

.s

χ(oder χ )

9-3: Querschnitts-Sequenz zur Kohortenanalyse (Schema)

Die Kohorten, mit Index c, 1 ... q, finden sich in den Diagonalen. Ihre Anzahl ist damit größer als die der Zeilen oder Spalten, sie beträgt r + s - 1. Beispiel 9-12 RENTZ/REYNOLDS/STOUT (1983) geben eine Datenmatrix für den Pro-Kopf-Verbrauch von "Soft Drinks" in den USA (in Gallonen - Darst. 9-4). Es handelt sich hier um eine 5x3-Tafel, mit 15 Einzelwerten xkl. Die Anzahl der Kohorten ist somit 5 + 3 - 1 = 7. Damit können nicht alle Kohorten "vollständig" sein. So gibt es für die (sofern man, wie vielfach üblich, die Zählung mit der "ältesten" Kohorte, d.h. hier: der letzten Zeile der ersten Spalte, beginnt) "erste Kohorte" nur 1 Wert: 11,8, für die zweite schon 2: 17,3 und 22,5 usw. Ρ 1 (1960)

2 (1969)

1 ( 8-19)

31,4

40,0

48,6

2 (20-29)

30,2

42,1

48,3

3 (30-39)

21,1

34,7

42,1

4 (40-49)

17,3

28,4

34,8

5 (ab 50)

11,8

22,5

23,5

A

3 (1979)

Darst. 9-4: Querschnittssequenz zur Kohortenanalyse (Beispiel)

Kapitel 9 Ein- und mehrdimensionale Auszählungen

231

Außerordentlich problematisch ist nun aber die Schätzung der Effekte. Das Problem liegt gerade darin, daß sie nicht voneinander unabhängig sind (im Sinne der Regressionsanalyse - gemäß Kap. 10 - also Multikollinearität besteht). Dazu wurden einige Lösungsvorschläge entwickelt; davon ist besonders der Ansatz von MASON et al. (1973) hervorgetreten, der auf eine - restringierte - "dummy-Variablen-Regression" hinausläuft. (Vgl. dazu ausführlich etwa bei HÜTTNER 1986b und - auch mit einem neuen Ansatz - M. VON AHSEN 1990.) Insgesamt muß allerdings die Heranziehung der solcherart geschätzten Effekte, zumindest für Prognosen, als fragwürdig erscheinen. Im folgenden Beispiel (vgl. auch HÜTTNER 1988) soll deshalb nur das grundsätzliche Konzept der "Kohorten-Sukzession" herangezogen werden. Beispiel 9-13 SCHWEDLER (1986) hat - so der Untertitel - "zwei Beispiele für Auswirkungen von Bevölkerungsveränderungen auf die Entwicklung inländischer Nachfragepotentiale" gegeben. Für die Produkte "Jeans" und "Eau de Cologne" wird dabei von der nach Alter und Geschlecht gegliederten Wohnbevölkerung in der Bundesrepublik 1985 und ihrer Prognose bis 2010 ausgegangen. Durch Multiplikation der jeweiligen (Gruppen-)Besetzungszahlen mit den (gruppenspezifischen) "Kaufhäufigkeiten", auf der Grundlage der "AWA 1985" (Allensbacher Werbeträger-Analyse - s. Kap. 16), ergeben sich dann die Potentiale in den Gruppen; ihre Aufsummierung über diese erbringt für beide Jahre das gesamte "Marktpotential" (im Sinne der Definition dieses Begriffes in Kap. 14) und der Vergleich die Prognose der Veränderung. Dieses Vorgehen entspricht der üblichen "entwicklungsmäßigen Interpretation": Die für die einzelnen Altersgruppen (und zusätzlich nach Geschlecht) ermittelten Kennzahlen eines Querschnitts werden so interpretiert, als seien sie allein auf das Alter zurückzuführen. Dieser Vorstellung soll die der "Kohorten-Sukzession" entgegengesetzt werden. Kritik wird also nicht daran geübt, daß die "empirisch beobachteten Kaufhäufigkeiten konstant bleiben, was bedeutet zu unterstellen, daß sich das Verhalten bis zum Jahre 2010 nicht verändern wird" (SCHWEDLER 1986, S. 408), sondern daran, daß die Kaufhäufigkeiten - 1985 wie 2010 - für die gleichen Altersgruppen Ansatz finden. Für die Alternativ-Rechnungen werden ausschließlich die Original-Zahlen von SCHWEDLER (1986 - dort Tabellen 1-3) benutzt. U m die Unterschiede klar hervortreten zu lassen, ist es zweckmäßig, die Berechnungen anders zu organisieren. (Abweichend vom oben erwähnten Vorgehen beginnt hier die Numerierung mit der "jüngsten" Kohorte.) Wegen ihrer Detaillierung werden sie nur für Jeans und Männer wiedergegeben (Darst. 9-5 auf der folgenden Seite; s. auch A 9-3).

232

Teil III Methoden der Datenanalyse in der Marktforschung

2010

1985

Kohorte

Alter

BeKaufsetzung läuflg- Potential keit

Alter

angeboren

15-19

2

ingeboren

20-24

3

0-4

25-29

4

5-9

30-34

5

10-14

6

15-19

7

20-24

8

25-29

9

30-34

10

35-39

11

40-44

12

45-49

13

50-54

14

55-59

15

60-64

16

65-69

17

70+

total

-

Ì >5139,8

82,4

/

63,4

>4172,5 Γ

40,0

\

2132,76

3258,63

1669,00

>4690,9

23,1

1083,60

Ì >3544,5 i

6,1

216,21

\>2100,6

3,7

77,72

2218,7

1,8

39,94

24455,3

-

8477,86

Prognose 1(S)

Prognose 2

Kauf-

Kaufhäufig- Potential keit

häufig- Potential keit

1

2588,3

Besetzung

35-39

82,4

1276,46

63,4

1944,29

40,4

1253,08

>23,1

1114,71

Ì } 6,1

240,50

1549,1

\>3066,7 / \>3132,7 )

40-44

2396,8

45-49

2428,8

50-54

2089,4

55-59

1853,3

60-64

1561,2

65-69

1589,5

70-74

1349,9

/

Ì k 3,7

/ 1

Il 75+

-

1271,1

22288,5

116,58

\

>82,4

6384,76

82,4

1974,96

>63,4

2864,54

>40,0

1365,80

y 23,1

679,00

3,9

49,57

\ )

47,18

Γ/

-

5992,80 (70,7 %)

-

13318,63 (157,1 %)

Dar st. 9-5: Alternativrechnungen (Beispiel) Das Resultat ist erstaunlich: Während sich nach den Berechnungen von Schwedler (Prognose 1 - S) für 2010 als Potential nur 70,7% desjenigen von 1985 ergibt, also ein Rückgang um 29,3%, folgt aus der "Kohorten-Prognose" (2) ein beträchtliches Wachstum, um 57,1%! Daran wird auch die möglicherweise andersartige Lösung zweier Sonderprobleme nicht viel ändern. Eines besteht darin, daß für die "älteren Jahrgänge" nicht mehr detaillierte Daten vorhanden sind. So wurde im vorliegenden Falle für die im Jahre 2010 über 75jährigen nur eine Zahl eingesetzt, gebildet als einfaches arithmetisches Mittel. Zur Kontrolle ist auch mit dem gewogenen Mittel gerechnet worden, mit allerdings kaum verändertem Ergebnis - angesichts der vergleichsweise geringen Bedeutung dieser Altersgruppe (im Hinblick auf sowohl ihren Bevölkerungsanteil als auch ihre Kaufhäufigkeit) nicht verwunderlich. Problematischer kann der

Kapitel 9 Ein- und mehrdimensionale Auszählungen

233

Ansatz der Kaufhäufigkeit der 1985 15-19jährigen für die - z.T. noch ungeborenen unteren Altersgruppen im Jahre 2010 erscheinen. Aber welche Evidenz hätte man wie gesagt, immer ohne Heranziehung ergänzenden Materials - für den Ansatz anderer Werte?

Es sei betont, daß es im vorstehenden Fall im Grunde nur darum ging, die "kohortenanalytische Alternative" herauszuarbeiten. Hätte man die in Darst. 9-3 schematisierte und in 9-4 beispielhaft dargestellte Querschnitts-Sequenz vorliegen, also auch mehrere Daten für die "Kennwerte" (Kaufhäufigkeiten, wie hier, oder Pro-Kopf-Verbrauch, wie oben), so könnte man - auch ohne die erwähnte numerische Schätzung der Kohorten und sonstiger Effekte - so etwas wie einen "Trend" der Veränderung dieser Kennwerte feststellen und damit die Prognose auf eine verläßlichere Basis stellen.

Literaturhinweise Ausführungen zur einfachen Häufigkeitsanalyse und zur Kreuztabulierung - oder, genereller: zur Aufbereitung und Auszählung von Daten überhaupt - finden sich in vielen Lehrbüchern der Statistischen Methodenlehre bzw. EDV-Literatur und natürlich in praktisch allen zu Kap. 1 genannten Schriften. (Zu den multivariaten Methoden allgemein s. die "Literaturhinweise" zu Kap. 11). Hier sei deshalb nur noch das berühmte Werk von ZEISEL ( 1 9 6 8 ) erwähnt. Nachstehend, wie angekündigt, einige Hinweise zu graphischen Darstellungen: eher einführend, auf die Präsentation gerichtet (und im Titel angelehnt an Zeisel) ZELAZNY 2 0 0 1 , stärker grundsätzlich, an der Analyse orientiert und auch auf neuere Entwicklungen eingehend: CHAMBERS et al. 1 9 8 3 , TUFTE 1 9 8 3 , CLEVELAND 1 9 9 4 sowie SCHNELL 1 9 9 4 . Zur Inhaltsanalyse sei, neben den im Text erwähnten Werken, noch hingewiesen auf KLINGEMANN (Hrsg.) 1 9 8 4 und R . P . WEBER 1 9 8 5 .

234

Teil ΠΙ

M e t h o d e n der Datenanalyse in der M a r k t f o r s c h u n g

Aufgaben 9-1:

Gegeben seien folgende Zahlen über die Entwicklung eines Wirtschaftsguts W: Anfang der Periode A 60 Einheiten), Ende von A = Anfang von Β 100 E, Ende von Β 150. Welche der folgenden Aussagen ist richtig? „1. Die Zunahme von W in A war gegenüber der in Β um 20% geringer. 2. Die Zunahme von W in A war gegenüber der in Β um 16,7% höher. 3. Die Zunahme von W in Β hat sich gegenüber der in A um 25% gesteigert. 4. Die Zunahme von W in Β hat sich gegenüber der in A um 1/4 (=25%) verringert." (KRIZ 1 9 8 1 , S . 7 8 . )

9-2:

Stellen Sie die Daten von Beisp. 9-10 als "stub and banner-Tabelle" dar (mit der Ja-Nein-Variablen "Besitz einer Lebensversicherung" als stub sowie Alter und Familienstand als banner)!

9-3:

In der folgenden Zusammenstellung sind für 1985 zunächst für Frauen die Besetzungszahlen in den einzelnen Altersgruppen, dann die Kaußäufigkeiten für Jeans und Eau de Cologne sowie schließlich für letztere nur die für Männer angegeben: Kaufhäufigkeit Eau de Cologne Altersgruppe

Wohnbevölkerung weiblich

15-19 20-29 30-39 40-49 50-59 60-69 70 +

2452,0 4793,7 3962,0 4475,9 3703,3 3285,3 4436,2

total

27108,4

Jeans weiblich

64,2 40,7 25,9 12,3 2,3

weiblich

männlich

1,1 0,4

14,0 20,8 24,9 35,9 37,2 47,1 49,7

5,0 8,9 12,0 16,6 15,8 17,5 21,5

-

-

-

Kapitel 9 Ein- und mehrdimensionale Auszählungen

235

Nachstehend die für 2010 veranschlagte weibliche Wohnbevölkerung: 15-19 1477,8 20-29 2947,8 30-39 3053,6 40-44 2350,7 45-49 2402,7 50-54 2086,6 55-59 1942,3 60-64 1652,3 65-69 1809,9 70-74 1724,1 2412,2 70 + a) Prognostizieren Sie nach dem Muster von Darst. 9-5 das Marktpotential 2010 und dessen Veränderung gegenüber 1985 für Frauen bei Jeansl b)Wie lauten die entsprechenden Daten für den GesamtmzrVx. (Männer und Frauen)? c) Prognostizieren Sie nach dem Muster von Darst. 9-5 das Marktpotential 2010 und dessen Veränderung gegenüber 1985 für Männer bei Eau de Colognei d) dto. für Frauenl e) Wie lauten die entsprechenden Daten für den Gesamtmarkt}

Kapitel 10 Korrelation und Assoziation grundlegende Verfahren In diesem und den folgenden Kapiteln werden nunmehr "schärfere" statistisch-mathematische Verfahren der bi- und multivariaten Datenanalyse betrachtet. Im vorliegenden Kapitel 10 geht es dabei um die grundlegenden Verfahren der Korrelation und Assoziation, die deshalb relativ ausführlich dargestellt werden. (In den nachstehenden Kapiteln erfolgt eine wesentlich stärkere Konzentration.) Im 1. Abschnitt, bei der Regressions· und Korrelationsanalyse, sind - im Prinzip - metrische Daten vorausgesetzt. Die Erörterungen beschränken sich dabei zunächst auf den hivariaten Fall; später wird dann auch die multiple Regression diskutiert. Bei der Kontingenzanalyse, die im 2. Abschnitt Behandlung findet, sind keine Voraussetzungen bezüglich des Meßniveaus erforderlich; sie eignet sich also speziell für nominalskalierte Daten. Im 3. Abschnitt schließlich wird - kurz - auf die Möglichkeiten der Regression bei "Nominaldaten " eingegangen.

10.1 Regressions- und Korrelationsanalyse Die Zielsetzung der Regressionsanalyse besteht in einer quantitativen Schätzung - und statistischen Prüfung - der funktionalen Beziehung zwischen (zumeist) einer als abhängig erkannten und einer oder mehreren unabhängigen Variablen. Die Korrelationsanalyse ist ein Verfahren zur Messung des formalen Zusammenhangs zwischen verschiedenen Reihen. Die Arten der Regressionsznûyse können nach zwei Kriterien eingeteilt werden: 1. ob die untersuchte Variable von einer oder mehreren abhängt (einfache oder multiple Regression). 2. ob die Beziehungen linearer oder nicht-linearer Art sind. Im folgenden 1. Unterabschnitt wird zunächst die £m/2c&-Regression behandelt. (Die Diskussion der multiplen Regression erfolgt im 2. Unterabschnitt.)

Kapitel 10

10.1.1

Korrelation und Assoziation: grundlegende Verfahren

237

Lineare und nicht-lineare Einfach-Regression

Im Falle der hier zunächst zu erörternden linearen Einfach-Regression: y = bx + c

(10.1)

geht es um die Untersuchung der (linearen) Abhängigkeit einer Variablen von einer anderen. Die rechte Seite der Gleichung enthält also die sog. unabhängige Variable χ (auch, nach dem anglo-amerikanischen "predictor", als Prediktor bezeichnet; andere Benennungen sind: erklärende Variable, Regressor). Entsprechend nennt man die Variable y auf der linken Seite abhängige Variable (nach dem anglo-amerikanischen "criterion" auch Kriterien oder Kriterium bzw. Außenkriterium; erklärte Variable; Regressant . Die Gewinnung der Parameter b (Regressionskoeffizieni) und c (Regressionskonstante) in der Regressionsfunktion (10.1) erfolgt zumeist nach der Methode der kleinsten Quadrate (OLS = Ordinary Least Squares). Diese fordert, daß die Summe der quadrierten Abstände zwischen den Schätzwerten yj und den Beobachtungswerten yj (j = 1, ..., m) ein Minimum wird: I(yj-yj)2=Min.

(10.2)

Das Resultat sind die sog. Normalgleichungen. (Zu deren Herleitung s. etwa HÜTTNER 1986c, S. 78f.) Die zwei sich ergebenden Normalgleichungen: b E x + mc = £ y

(10.3)

b£x2 + c £ x = £xy müssen sodann nach den Koeffizienten c und b aufgelöst werden. Das ergibt für c, in der ersten Gleichung: c =—Œy-bZx) m = y - bx.

(10.4a)

Setzt man dies in die zweite Gleichung ein, so resultiert, nach Umformung (s. A 10-1):

238

Teil ΠΙ Methoden der Datenanalyse in der Marktforschung

—Exy-xy

b = JS

1 ^ 2

-Σχ m

(10.4b)

—2



Beispiel 10-1 Verwendet werden die beiden Reihen aus Kap. 3, gemäß Darst. 10-1. y

χ

*y

χ2

/S y

10

3 5 6 2 4 1

30 60 102 22 72 13

9 25 36 4 16 1

13,06 14,83 15,71 12,18 13,95 11,30

21 ΟΓ = 3,5)

299

91

12

17 11

18 13 81 (y = 13,5) Darst. 10-1:

-

Arbeitstabelle zur Berechnung der linearen Einfach-Regression (1. Berechnungsart*)

* Zur 2. Berechnungsart s. L(ösung) 10-6. Daraus resultieren: 299 5.13 5 91 , , 2 ' 6

2,92

c = 13,5-0,884-3,5 = 10,4 also als Regressionsfunktion: y = 0,884x + 10,4 Die resultierenden Schätzwerte finden sich in der letzten Spalte der Tabelle. (S. dazu A 10-2.)

Die Korrelation findet ihren formalen Ausdruck im Korrelationskoeffizienten. Der Bravais-Pearson'sche Maßkorrelationskoeffizient gibt dabei Richtung und Ausmaß des Zusammenhangs an. Er ist normiert, d.h. liegt zwischen 0 und ±1: +1 bedeutet stark positive, -1 stark negative (die Reihen entwickeln sich gegenläufig!) und 0 überhaupt keine Korrelation.

Kapitel 10 Korrelation und Assoziation: grundlegende Verfahren

239

Es gibt nun mehrere Schreibweisen des Korrelationskoeffizienten. Recht einleuchtend ist die über die Kovarianz und die Varianzen. Mit der üblichen Definition: Kovarianz: s x y ( =

S Y X

)= Σ(Χ~Χ)(Υ~Ϋ)

(10.5)

(s. dazu A 10-3) Varianz (von χ - bei y analog):

Σ (χ-χ)2 = — — m

(10-6)

- s. auch (3.2) kann der Korrelationskoeffizient geschrieben werden als: s

xy

(10.7a)

SxSy

Z(x-x)(y-y) VZ(x-x)2Z(y-y)2 D a der Regressionskoejßzient Schreibweise möglich: b =

il y — Σ (χ - xXy - yy )» /

. ΙΛ

_ ^

Λ

_ 2

Σ (χ - χ) 2

=

(10.7b)

hiermit zusammenhängt, ist auch für ihn eine analoge

(10.8a)

(10.8b) s

x

(S. dazu unten und A 10-4.) Beispiel 10-2 F ü r die Reihen von Beisp. 10-1 resultiert (mit s X y aus A 10-3, Sy aus A 3-5 und s x aus Beisp. 3-3): r= - ^ = 0,50 1,71-2,99 O b ein solcher Korrelationskoeffizient (und zwar unabhängig von den - unten zu erörternden - Signifikanztests) als "eher hoch" oder "eher niedrig" zu bewerten ist, kann im Grunde nicht ohne Ansehen des Sachproblems entschieden werden. Gewisse Bewertungsmaßstäbe folgen jedoch aus dem Bestimmtheitsmaß:

Der Korrelationskoeffizient kann auch aus dem Bestimmtheitsmaß Β (Determinationskoeffizient) abgeleitet werden: r = Vb

(10.9)

240

Teil III Methoden der Datenanalyse in der Marktforschung

Es folgt aus einer Streuungszerlegung (quasi als Grundform der - in Kap. 11 erörterten "Varianzanalyse"): Die gesamte - totale - Streuung (SJ wird zerlegt in die erklärte - die Streuung der auf der Regressionsgerade liegenden Werte um den Mittelwert (Se) - und die nicht-erklärte, die Streuung der Beobachtungs- um die Schätzwerte (Sne). Formal: Z(y-y) 2 -Z(y-y) 2 +E(y-y) 2 (10.10) Das Bestimmtheitsmaß ist nun definiert als das Verhältnis der erklärten zur totalen Streuung:

Damit läßt es sich auch interpretieren·. Es gibt an (bei Multiplikation mit 100), wieviel Prozent der Variation der abhängigen Variablen durch die einbezogene Unabhängige "erklärt" werden. Daraus lassen sich auch gewisse Forderungen an die Höhe ableiten: Es ist sicher nicht zufriedenstellend, wenn das Bestimmtheitsmaß unter 0,5 liegt, d.h. mehr als die Hälfte der Variation "unerklärt" bleibt. So wäre dann entweder nach weiteren "Prediktoren" zu suchen (und damit zur - unten zur erörternden - "multiplen Regression" zu gelangen) oder aber zumindest nach einer anderen Variablen, die einen höheren Erklärungsbeitrag liefert. Daraus ergeben sich auch gewisse Folgen für die Höhe des Korrelationskoeffizienten: Akzeptiert man als "Schwellenwert" ein Β von 0,5, so müßte der entsprechende Korrelationskoeffizient mindestens Λ/o ,5 » 0,7 betragen. Beispiel 10-3 Mit der erklärten und der totalen Streuung aus A 10-5 ergibt sich: B = ! M = 0 .25 53,3 r = Vb = 0,50 (und damit das Gleiche wie in Beisp. 10-2) Der "Erklärungsbeitrag" der Variablen χ ist also nicht sehr hoch und muß als unbefriedigend erscheinen.

Die bisherigen, rein deskriptiven Maße sollten inferenzstatistischen Uberlegungen unterworfen werden. Im folgenden ist sogleich auf Signifikanztests abgestellt, und zwar - vereinfachend - auf den Test des Regressionskoeffizienten b gegen die Hypothese, daß der "wahre Wert" 0 sei; die Alternative wäre dann β t 0 bei zweiseitigem oder β > 0 bzw. β < 0 bei einseitigem Test.

Kapitel 10 Korrelation und Assoziation: grundlegende Verfahren

241

Dafür benötigt man zunächst den Standardfehler der Schätzung ("standard error of estimate"). Er ergibt sich als Wurzel aus der durchschnittlichen nicht-erklärten Streuung, also aus dem Mittel der (quadrierten) Residuen.

Su = Ì

Z(y

my)2

( 1 0 l l 2 )

Die Verwendung des nach dieser Formel berechneten Wertes als "Schätzer" liefert jedoch ein verzerrtes Ergebnis. Es bedarf der Multiplikation mit m/(m - 2), um ein unverzerrtes Resultat zu erhalten: m—ζ Der Standardfehler des Regressionskoeffizienten b ergibt sich hieraus als: =

Σ(χ-χ)

(10-14)

und daraus die Testgröße·. t emp(b) = — (mit m - 2 Freiheitsgraden) sb

(10.15)

Gemäß dem in Kap. 3 geschilderten allgemeinen Vorgehen ist nunmehr dieser "empirische" t-Wert dem "theoretischen", dem sich bei dem gewählten Signifikanzniveau (und der angegebenen Anzahl von Freiheitsgraden) aus der t-Verteilung - s. Darst. T-l im Anhang - ergebenden Wert, gegenüberzustellen. Nach dem gleichen Muster kann man auch die Regress'ionskonstante testen. Statt sfo ist hier entsprechend s c zu verwenden; dies ergibt sich recht einfach aus s u mittels Division durch m. Statt gegen die Hypothese, daß der "wahre Wert" von b oder c Null sei, können diese auch gegen jeden anderen Wert getestet werden. Er wäre dann im Zähler der Formel für temp z u subtrahieren. Zum Test des Korrelationskoeffizienten s. unten. Beispiel 10-4 Es soll - zweiseitig, auf dem 5%-Niveau - getestet werden, ob der Regressionskoeffizient von Beisp. 10-1 signifikant von Null verschieden ist. Mit der nicht-erklärten Streuung aus A 10-5 und der (totalen) Streuung von χ aus Beisp. 3-3 folgt:

242

Teil III Methoden der Datenanalyse in der Marktforschung

s

u

= J f

= 3)15

jm=0,75

Sb= t

0,88



Wie in Kap. 3 erläutert, ist wegen der Form der Tabellierung der Tafel 1 im Anhang bei einem Signifikanzniveau von α — 0,05 und zweiseitigem Test nicht unter 0,95, sondern 0,975 mit 6 - 2 - 4 Freiheitsgraden nachzusehen. Der abzulesende Wert von 2,78 liegt weit über dem empirischen Wert. Die Nullhypothese kann also nicht zurückgewiesen werden; der ermittelte Regressionskoeffizient ist nicht signifikant.

Beziehungen zwischen Variablen sind nicht notwendigerweise linear. Es soll deshalb noch ein kurzer Ausblick auf die nicht-lineare EinfachRegression vorgenommen werden. Dabei kann die Nichtlinearität zunächst in den Parametern liegen. Soll die hier nur betrachtete gewöhnliche Kleinstquadrate-Schätzung (OLS) Verwendung finden, so muß zunächst eine Linearisierung durch geeignete Transformation erfolgen. Dies kann etwa durch Logarithmierung geschehen. So ergibt sich für die Exponentialfunktion. y = e bx · c (10.16) durch Verwendung natürlicher Logarithmen: lny = b-x + lnc (10.17) Verwendet man dekadische Logarithmen, so kann man analog auch schreiben: y = bx · c (10.18) und daraus: lgy = x-lgb + lgc (10.19) In gewisser Weise umgekehrt ergibt die Potenzfunktion ("power curve"): y = xb · c "linearisiert": lgy = b-lgx + lgc

(10.20) (10.21)

Die Nicht-Linearität kann jedoch auch in den Variablen selbst zum Ausdruck kommen, so etwa bei der quadratischen Regression·. y = b,x + b 2 x 2 + c (10.22) und allgemein·.

Kapitel 10 Korrelation und Assoziation: grundlegende Verfahren

y = bjx + b 2 x 2 +

243

... + b n x n + c

(10.23)

Man beachte, daß es sich hierbei jeweils um die gleiche Variable handelt, wenn auch in verschiedener Potenz. Dabei ist es allerdings durchaus nicht zwingend, daß die Potenzen in linear ansteigender Ordnung auftreten. Da sich jede beliebige Potenz als eigene Variable ansehen läßt, reduziert sich das Problem formal auf die - nunmehr zu behandelnde - multiple Regression.

10.1.2

Multiple Regression

Wird eine weitere "unabhängige" Variable eingeführt, so lautet die Regressionsfunktion·. y = b,x, + b 2 x 2 + c (10.24) Es ergeben sich nunmehr 3 Normalgleichungen·. biZ*i

+b2£x2

biZx?

+b2Sxix2 +°Σχι

b,X i 2 +b2x2 x

=Zy

+ m c

+cZ 2

x

x

=ΣχιΥ

(10.25)

=Σ 2Υ χ

und daraus die Parameter: c = y - bjX] - b 2 x 2

(10.26a)

1 ι 2—2 1 1 (—ΣΧ17-Χ17)(-ΣΧ2 -χ2)-(-ΣΧ27"χ27)(—Σχ1χ2 _ m m m m (-ΣχΪ-xf) m m

jj^ _

1

1

m

m

(—Σ*2"*2)

2

_2

-

-χ1χ2)

(-Σχΐχ2"χ1χ2)2 m (10.26b)

1

1

m

m

( - Σ χ2Υ - x 2 y ) ( - Σ χ ι - χ ι ) - (— Σ x iy - x iy)(— Σ χ ι χ 2 - χ ι χ 2) (— Σ m

χ

1"

χ ΐ ) m

(— Σ χ 2 " χ 2 )

-

(-Σχ1χ2-χ1χ2)2 m (10.26c)

Teil III Methoden der Datenanalyse in der Marktforschung

244

Beispiel 10-5 Mit den beiden Reihen aus Beisp. 10-1 und einer weiteren unabhängigen Variablen X2 ergibt sich:

x2y

y

X

10 12 17 11 18 13

3 5 6 2 4 1

7 8 10 9 13 12

9 25 36 4 16 1

30 60 102 22 72 13

49 64 100 81 169 144

70 96 170 99 234 156

21 40 60 18 52 12

81

21

59

91

299

607

825

203

Darst. 10-2:

1

x

X X

2

2

1

x

X

i y

2

2

X

(2?9 _ 3 > 5 . 1 3

5)

. (M7 _ 9

832)

_

£_3,52).(^-9,832) 6

6

_^ -

^

(

2Ç3 _ ^

(-^--3,5-9,83)2 6

(49,83 - 47,25) · (101,17 - 96,63) - (137,5 -132,7) · (33,83 - 34,40) (15,17 -12,25) · (101,17 - 96,63) 14,45 12,94

(33,83 - 34,40) 2

= 1,12

b 2 (der Nenner bleibt gleich!) _

x

2

Arbeitstabelle zur Berechnung der linearen Mehrfach-Regression

Daraus resultieren die Parameter wie folgt:

b, = ·

1

ζ5_9)83.13,5)·(^-3,52)-(^-3)5·13,5)·(^-3,5·9,83) 6 6 6 6 12,94 15,49 = 1,20 12,94

(

c = 13,5-1,12-3,5-1,20-9,83 = -2,22

^

Kapitel 10 Korrelation und Assoziation: grundlegende Verfahren

245

Bei η unabhängigen Variablen lautet die Regressionsfunktion entsprechend: y ^ X i + ... + bnxn + c (10.27) Die Normalgleichungen ergeben sich analog. Die Auflösung ist aber bei einer größeren Anzahl von Prediktoren in der bisherigen Weise kaum noch möglich. Vielmehr empfiehlt sich hier die Anwendung von Computerprogrammen. Zur Darstellung des Lösungsgangs bedient man sich dabei am besten der A/izinzenschreibweise, unter Verwendung standardisierter Regressionskoeffizienten. (S. etwa bei HÜTTNER 1979, S. 242f.) Diese haben den Vorteil - neben dem dadurch bedingten Wegfall der Konstanten c -, daß sie untereinander vergleichbar sind und damit, als eine von mehreren Möglichkeiten, als Indiz für die Bedeutung einer Einflußgröße genommen werden können. Diese sog. beta-Koeffizienten kann man natürlich direkt über die Standardisierung der Beobachtungswerte erhalten. Es ist aber auch eine indirekte Gewinnung möglich, nach der Beziehung: beta

=bx '

(10.28)

' sy

Beispiel 10-6 Für die vorstehende Regression ergibt sich (mit den Standardabweichungen von Beisp. 10-2) etwa: beta,1 = 1 , 1 2 · — = 0,64 2,99

Das multiple Bestimmtheitsmaß gibt - analog dem bei der Einfach-Regression - an, welcher Anteil der Varianz von den in die Regressionsfunktion einbezogenen unabhängigen Variablen "erklärt" wird. Seine Berechnung kann auf verschiedene Weise erfolgen, z.B. ausführlich für 2 Prediktoren: 2 " Τ I(y-y)2 oder kürzer für η Prediktoren: R2=IbetaX;rX;V

R =

| V 1

*>

1

J

J

(10.29) (10.30)

Beispiel 10-7 Im Falle des vorstehenden Exempels ergibt sich, mit dem dort ermittelten Wert für betaj und ri y aus Beisp. 10-2 (sowie beta2 aus A 10-7 und r2y aus A 10-6b): R 2 = 0,64-0,5 + 0,85 0,75 = 0,96 (S. dazu auch A 10-8.)

246

Teil III Methoden der Datenanalyse in der Marktforschung

Vom sog. bereinigten Bestimmtheitsmaß ("adjusted R2") wird hier abgesehen. Dieses beruht auf der Überlegung, daß mit wachsender Zahl von unabhängigen Variablen notwendigerweise eine bessere Anpassung an die gegebenen Werte des Kriteriums folgt. Die Bereinigung geschieht also unter Berücksichtigung der Anzahl der Fälle und der Prediktoren. Damit ist es möglich, daß die Einbeziehung einer weiteren unabhängigen Variablen nicht zwangsläufig - wie beim unbereinigten R 2 - zu einer (wenn vielleicht auch minimalen) Erhöhung, sondern eventuell sogar zu einer Verringerung führt. Umgekehrt folgt aus dem Dargelegten auch, daß eine solche "Bereinigung" bei nur wenigen Prediktoren kaum ins Gewicht fällt.

Der multiple Korrelationskoeffizient ergibt sich analog der Einfach-Regression aus dem multiplen Bestimmtheitsmaß: (10.31) Beispiel 10-8 Der multiple Korrelationskoeffizient im Falle des vorstehenden Beispiels beträgt: R - 0,98

Signifikanztests können sich bei der multiplen Regression sowohl auf den Test der einzelnen Regressionskoeffizienten wie auf den der Regressionsfunktion im ganzen beziehen. Für ersteres ist der Test in analoger Weise wie früher, über die t-Verteilung, möglich. Man kann aber auch über die F-Verteilung (s. Tafel 2 im Anhang) vorgehen. Das empfiehlt sich insofern, als der Test für die gesamte Regressionsfunktion über die F-Verteilung erfolgt. Dies ergibt sich schon daraus, daß nunmehr auch im Zähler des Bruches, mittels dessen die "Prüfgröße" berechnet wird, mehrere Freiheitsgrade auftauchen. Die Herleitung kann dabei wie folgt geschehen: Gemäß (10.12) resultiert su, der "Standardfehler der Schätzung", letztlich aus der nicht-erklärten Streuung Sne. Analog (10.14) hätte auch geschrieben werden können: 2 _Sne /(m-2) b

"

Σ(χ-χ)2

(10.32)

analog (10.15): 2 emp(b)

b S

2 n

I(x-x)2 e / ( m - 2 )

Sne / ( m - 2 )

(10.33a) (10.33b)

Kapitel 10 Korrelation und Assoziation: grundlegende Verfahren

247

Die Testgröße ergibt sich also aus dem Verhältnis der erklärten zur nichterklärten Streuung. Nun war aber das Bestimmtheitsmaß definiert als Verhältnis der erklärten zur totalen Streuung. Daraus folgt (s. A 10-10): S„

r2

(10.34)

1-r2 und damit: Sne

t2 = F =

SP/1 r2 /1 ^ ^ = Sne/(m-2) (l-r2)/(m-2)

(10.35)

(S. dazu auch A 10-11 und 11-4.) Für den multiplen Fall ergibt sich entsprechend: Sg_/n

P_

_ tftn

Sne/(m-n-l) (1-R )/(m-n -1) (mit η und m - η - 1 Freiheitsgraden) Im Fall der Einfach-Regression kann also wahlweise die t- oder F-Verteilung benutzt werden. Im Falle der multiplen Regression ist zu unterscheiden zwischen dem Test einzelner Koeffizienten und dem der Regressionsfunktion im ganzen (alle Koeffizienten gleich Null). Für ersteres kann weiterhin der t-Test angewandt werden. Der FTest gemäß (10.36) gilt jedoch zunächst nur für letzteres. Sollen auch die einzelnen Regressionskoeffizienten im multiplen Falle über die F-Verteilung getestet werden, ist im Zähler von ( 1 0 . 3 6 ) statt S E nunmehr deren Zuwachs (und 1 statt n) zu setzen. Ein entsprechender Ersatz hat auch in der zweiten Formel zu erfolgen, indem im Zähler der "Erklärungszuwachs" durch die "semi-partiellen" Korrelationskoeffizienten ausgedrückt wird. Auf diese kann hier nicht eingegangen werden; vgl. dazu etwa HÜTTNER 1979, S. 245f. Beispiel 10-9 Der Test der Regressionsfunktion gemäß Beisp. 10-5, mit R 2 lt. Beisp. 10-7, ergibt: F =

^

=

(1 — 0 , 9 6 ) / ( 6 — 2 — 1)

^ 4 8 _

=

3 6 ; 0 9

0,0133

Bei einem Signifikanzniveau von a = 0,05 ist - formal "einseitig", inhaltlich "zweiseitig" - in der Tafel der F-Verteilung (Darst. T-2) unter 0,95 nachzusehen: FQI95(2;3) = 9,55. Die Regressionsfunktion im ganzen ist also signifikant, d.h. mindestens ein Koeffizient ungleich Null. Dieser Test entspricht dem Test des Korrelationskoeffizienten. (Im vorstehenden Beispiel hätte deshalb auch gefolgert werden können: Der - multiple - Korrelationskoeffizient ist signifikant.) Üblicherweise wird dafür - immer nur gegen die Nullhypothese, daß der "wahre Wert" 0 sei - im bivariaten Fall die t-Verteilung verwandt. Dies ergibt, gemäß Gleichung (10.35), als Wurzel aus der rechten Seite:

Teil III Methoden der Datenanalyse in der Marktforschung

248

m W

)

=

V(l-r2)/(m-2)

(10.37)

(S. dazu auch A 10-12).

Bisher wurde gewissermaßen die "Standardform" der multiplen Regression, mit vorheriger Spezifikation von Anzahl und Reihenfolge der unabhängigen Variablen, behandelt. Im Unterschied zu diesem eher simultanen Ansatz geht die schrittweise Regression (Stepwise Regression) quasi sukzessive vor: die Einbeziehung der unabhängigen Variablen geschieht in einzelnen Schritten. Das Prinzip ist auch als Suchverfahren deutbar: Man gibt eine Liste von Variablen vor, aus denen nach bestimmten Kriterien und mittels festgelegter Prozeduren einzelne selektiert werden. Als solche Prozeduren kommen in Betracht: 1. vorwärtsschreitende Inklusion, 2. rückwärtsschreitende Elimination, 3. schrittweise (vorwärtsschreitende) Einbeziehung und gleichzeitiger Ausschluß. Eliminiert werden solche Variablen, die nach jedem Schritt, infolge der Einbeziehung weiterer Variablen, die Kriterien nicht mehr erfüllen. Speziell bei unterschiedlicher Ausprägung dieser für die Aufnahme und die Elimination einer Variablen kann u.U. die Gefahr eines "Zyklus" entstehen - dergestalt, daß eine soeben eliminierte Variable im nächsten Schritt wieder einbezogen wird usw. Gelegentlich wird nur diese F o r m - quasi im engeren Sinne - als "stepwise" bezeichnet. Auch sonst ist die Terminologie nicht einheitlich. So kann man als "vorwärtsschreitende Inklusion" - wiederum quasi im engeren Sinne - nur das Vorgehen verstehen, aufgrund einer Residualanalyse (s. dazu auch unten) die jeweils nächste Variable auszuwählen, und ihr bzw. der Stepwise Regression die "allpossible-subsets regression" (für alle η Variablen) gegenüberzustellen. S. dazu auch A 10-13.

Als Ein- und Ausschluß-Zinimew kommen in Betracht: 1. "Erklärungszuwachs" (gemäß oben) bzw. allgemeiner: „Erklärungsbeitrag", 2. statistische Signifikanz (gemessen an t- oder F-Werten), 3. Obergrenze für die Anzahl der Variablen usw., vielfach in Kombination - z.B. in der Weise, daß ein Kriterium zunächst darüber entscheidet, welche Variable als nächstes einzubeziehen wäre, dies aber tatsächlich nur dann erfolgt, wenn zugleich andere Kriterien erfüllt sind. Insgesamt ergibt sich, als Verbindung der verschiedenen Prozeduren und Kriterien, eine Fülle möglicher Vorgehensweisen.

Kapitel 10 Korrelation und Assoziation: grundlegende Verfahren

249

Die schrittweise Regression wie die multiple generell weisen verschiedene Probleme auf. Die Kritik an der schrittweisen Regression geht in die Richtung, daß die Gefahr der Bequemlichkeit besteht: Eine "Unzahl" von Variablen wird definiert bzw. gemessen und die Auswahl dann quasi dem Computerprogramm überlassen, anstatt sich über die möglichen sachlichen bzw. kausalen Beziehungen Gedanken zu machen! Zweifellos besteht diese Gefahr tatsächlich; sie ist quasi die "Kehrseite der Medaille", der Preis, der dafür gezahlt werden muß, daß andererseits die Präspezifikation von Anzahl und Reihenfolge der unabhängigen Variablen entfällt. Während bei der (normalen) multiplen Regression der "Erklärungsbeitrag" der einzelnen Variablen von der Reihenfolge ihrer Einbeziehung abhängig ist, bestimmt gerade umgekehrt bei der schrittweisen Regression dieser Beitrag oftmals die Reihenfolge des Einschlusses! Ein Problem der Regression generell ist das der Multikollinearität. (S. dazu auch M. VON AHSEN/HÜTTNER 1991.) Hierunter versteht man, daß die Interkorrelationen zwischen den Prediktoren vergleichsweise hoch sind. Im Grenzfall der totalen Abhängigkeit eines Prediktors von einem anderen, also einer Korrelation in Höhe von ± 1,0, wäre das System von Normalgleichungen "überbestimmt" und damit nicht eindeutig lösbar. In der Praxis können Verzerrungen schon bei wesentlich niedrigeren Interkorrelationen vorkommen. Zur Lösung dieses Problems sind zahlreiche Vorschläge gemacht worden. So kann man etwa die Multikollinearität formal dadurch senken, daß man eine sehr hoch korrelierende Variable einfach wegläßt. Allerdings liegt dann im Grunde ein Spezifikationsfehler bezüglich des Modells vor. Quasi umgekehrt kann an die Stelle des Weglassens auch die Zusammenfassung der miteinander stark verbundenen Variablen treten. In der Tendenz führt dies zur Faktorenanalyse·, s. dazu in Kap. 12. (Zur "Ridge Regression" s. unten.) Ein weiteres Problem ist das der Autokorrelation. Man versteht darunter allgemein die Korrelation der Reihenwerte mit sich selbst. In der speziellen Form der Autokorrelation der Residuen deutet es auf eine Fehlspezifikation des Modells hin. Der Residual-Analyse ist in den letzten Jahren zunehmend Aufmerksamkeit gewidmet worden. Es wurden verschiedene "Tests" und "Plots" entwickelt. Dazu gehören "Q-Q-Plots" (z.B. Quantile der Residuen gegen

250

Teil III

Methoden der Datenanalyse in der Marktforschung

solche der Normalverteilung), "Cook's distances" usw. Vgl. dazu etwa COOK/WEISBERG 1 9 9 2 .

Die Robust Regression ist nun ein Verfahren, mittels dessen Abweichungen von der Normalverteilungs-Hypothese und insbesondere Ausreißer behandelt werden können. Der Terminus "robust" - er geht auf BOX 1953 zurück - stellt also auf Unempfindlichkeit gegenüber der unterstellten Verteilung ab, der Ausdruck "resistant" - MOSTELLER/TUKEY 1977 auf solche gegenüber der zugrunde liegenden Stichprobe. Obwohl also konzeptionell verschieden, ist bei beiden der praktische Zweck identisch (so HUBER [1981], auf den die Entwicklung von "robust estimators" zurückgeht). Die Ridge Regression ist dagegen ein Verfahren, das auf die Uberwindung des Problems der Multikollinearität abzielt. Sie wurde von H O E R L / KENNARD (1970a, b) eingeführt und beruht auf dem von STEIN 1956 entwickelten Gedanken, daß gegebenenfalls "verzerrte" (biased) Schätzer bessere Resultate erbringen. In der Zwischenzeit ist eine Vielzahl solcher "Stein-Schätzer" entwickelt worden. Die Ridge Regression (eine Ubersetzung als "Kamm-Regression" wird v o m Verf. nicht empfohlen) beinhaltet im Kern, daß der Hauptdiagonalen des Produkts der Prämultiplikation der Matrix der - standardisierten - Beobachtungswerte

mit

ihrer

Transpose eine Zahl (k) zwischen 0 und 1 (vorgeschlagen wurden Werte bis zu 0,3) hinzuzufügen ist. Die hieraus resultierenden Schätzwerte für die Regressionskoeffizienten sind dann zwar nicht mehr erwartungstreu; dafür aber ist ihre Varianz geringer, und sie k o m m e n damit "näher" den wahren Werten. Zudem kann man verschiedene Läufe mit alternativen W e r t e n von k durchführen und prüfen, welche Veränderungen (auch gegenüber den "normalen" Regressionskoeffizienten, also mit k =

0)

sich ergeben, d.h., wie "stabil" die geschätzten Koeffizienten sind.

10.2 Kontingenzanalyse In Kap. 3 wurden Maßzahlen zur Deskription der «mvariaten Verteilung entwickelt. In diesem Kapitel geht es - im Prinzip - um die bivariate Analyse. Dabei handelt es sich im Kern um Maße zur Kennzeichnung des Zusammenhangs. Sofern - wie im vorigen Hauptabschnitt - metrische Variablen zugrunde liegen, spricht man meist von Korrelation. Speziell Kor-

Kapitel 10

Korrelation und Assoziation: grundlegende Verfahren

251

relationskoeffizienten sind normierte Maße, die zwischen 0 und 1 betragen. Solche können aber auch für andere Kombinationen als "metrisch/metrisch" gebildet werden. Aus den verschiedenen Meßniveaus läßt sich ja eine Matrix zusammenstellen, mit den beiden Variablen als Ein- und Ausgang. Eine Aufteilung dieser in abhängige und unabhängige ist dabei nicht erforderlich. Das gilt auch für den /fongkorrelationskoeffizienten, der (in Gestalt etwa von Spearman 's rho) die Strammheit des Zusammenhangs zwischen zwei Reihen von

Ordinaldaten

zum Ausdruck bringt (und auf den hier nur hingewiesen werden soll).

Das andere Extrem bilden rein nominalskalierte Variablen. Speziell in diesem Zusammenhang (manchmal auch als Oberbegriff schlechthin) spricht man dann von Assoziation. Entsprechende Maße lassen sich auf der Basis der zweidimensionalen Häufigkeitsauszählung, in den "Kreuz-Tabellen", konstruieren. Speziell im Hinblick hierauf redet man auch von Kontingenztabellen oder -tafeln. (Die entsprechenden Maßzahlen werden als Kontingenzmaße bezeichnet.) Bei der im vorigen Kapitel, in Darst. 9-2, schematisch dargestellten allgemeinen "Zweiweg-Tabelle" handelt es sich um eine "r · s-Tafel". Bei r = s spricht man von quadratischen Tafeln. Den einfachsten Fall, mit 2 für r und s, bezeichnet man auch als Vierfeldertafel. Darst. 10-3 gibt ihre schematische Kennzeichnung a) in der in Darst. 9-2 verwandten Symbolik, b) in einer alternativen, oft benutzten Bezeichnungsweise.

H

b) \ y X \ Yi

Y2

Σ

Χι

a

b

a+b

f2.

X2

c

d

c+d

m

Σ

yi

Y2

Σ

XI

fil

fl2

fi.

X2

f 21

hi

Σ

f.1

f.2

Darst. 10-3: Vierfeldertafel

a+c b+d

m

252

Teil III Methoden der Datenanalyse in der Marktforschung

Daraus läßt sich nun eine Maßzahl Chi-Quadrat berechnen: 2 _ m ( f 11 f 22- f l2 f 2l) 2 X

(10.38a)

f.f2.f.f.2

oder: o

2 1

m(ad - bc) = ( a + b)(c + d)(a + c)(b + d)

(10.38b)

Im Nenner steht also in beiden Fällen das Produkt der Randhäufigkeiten. Zu einer dritten, anders aufgebauten Berechnungsformel s. unten.

Diese Maßzahl wird mit χ 2 bezeichnet, weil sie approximativ (unter gewissen Voraussetzungen - es gibt auch "exakte" bzw. "korrigierte" Grössen: Fisher-Test bzw. "Yates Korrektur", die in Programmsystemen bisweilen, ergänzend oder ersetzend, benutzt werden) einer χ2-Verteilung folgt und damit als Prüfgröße in einem Test Verwendung finden kann. Die Anzahl der Freiheitsgrade beträgt allgemein (r - 1) · (s - 1), bei einer Vierfeldertafel speziell also 1. Beispiel 10-10 Je 100 Verbraucher, die sich bisher in ihren Kaufgewohnheiten nicht unterschieden, seien jeweils einer speziellen Verkaufsförderungs-Maßnahme für ein bestimmtes Produkt ausgesetzt worden. Nach Abschluß der Aktion ergäbe sich bei der Maßnahme A ein Käufer-Anteil von 18%, bei Β von 12%. Die Frage ist, ob aus der Differenz auf eine Überlegenheit der Maßnahme A geschlossen werden kann. (Die Zahl von 100 in diesem - konstruierten - Beispiel wird nicht nur der leichteren Rechenbarkeit halber gewählt, sondern auch, um die Verbindung zu "Prozenten" bzw. "Anteilen" und damit "diskreten Verteilungen" aufzuzeigen; s. dazu unten.) Signifikanzniveau: 5%. Die Analyse ergibt folgende Vierfeldertafel: Käufer Promotion A

18

82

100

Promotion Β

12

88

100

30

170

200

und daraus, nach (10.38a): 2 _ 200-(18-88-82-12)2 1

Nicht-Käufer

~

100-100-30-170

Kapitel 10 Korrelation und Assoziation: grundlegende Verfahren

253

Diesem empirischen χ 2 -Wert ist der theoretische gegenüberzustellen; er ergibt sich aus Darst. T-l im Anhang, für df = 1 und a = 0,05, mit 3,84. Der Unterschied zwischen den beiden Maßnahmen ist also nicht signifikant. S. dazu auch A 10-14. Bei hinreichend großer Stichprobe gilt:

= z; die Signifikanz kann man dann bei

der Vierfeldertafel auch gemäß (3.12) prüfen; s. dazu A 10-15.

Formel (10.38) läßt sich für eine r · s-Tafel verallgemeinern·. X2=m

(ΣΣτ%-1)

(10.39)

k 1 IkAl

fk.-f 1,/m bezeichnet man auch als Erwartungshäufigkeiten - ein Ausdruck dafür, daß die "erwarteten" Häufigkeiten aus den Randverteilungen berechnet werden. Sie lassen sich jedoch - als Hypothese - auch vorgeben. Dies führt zu der allgemeinen Formulierung des %2-Tests, nämlich zu prüfen, ob die beobachteten (tatsächlichen) Häufigkeiten von Ereignissen mit erwarteten (theoretischen) in Einklang zu bringen sind, oder, anders ausgedrückt: ihre Differenz - auf einem vorzugebendem Signifikanzniveau wesentlich oder zufällig ist. Formal (mit der Zählung von - wie auch oben schon - f über alle einzelnen Tabellenfelder - und η = r · s). χ2

_ (fl° - ρ ' re rl

, (f20-f|)2 re

2

,

.

|

(fnO:pfne)2_¿(flQ-fie)2(l010) re

η



1=1

re

h

Beispiel 10-11 In HÜTTNER (1979, S. 216f.) findet sich folgendes, auf HEYN 1962 zurückgehendes Beispiel für eine 9 · 2-Tabelle: Die Distribution der Marke Y in Fachgeschäften in den einzelnen Bundesländern soll dahingehend überprüft werden, ob sich signifikante Unterschiede zwischen den Ländern ergeben. Die Nullhypothese lautet also, daß der Distributionsgrad bundeseinheitlich ist. Zur Prüfung dieser Hypothese wird in einem Sample von 1000 Fachgeschäften jeweils festgestellt, ob das einzelne Geschäft den Artikel führt oder nicht. Die Summe der Resultate für die einzelnen Länder ergibt zugleich den "Bundesdurchschnitt": Danach führten den Artikel 831 der 1000 Geschäfte = 83,1%; 16,9% führten ihn nicht. Unter Berücksichtigung der Gesamtzahl der Geschäfte folgt die erwartete Verteilung. Sie ist der beobachteten gegenüberzustellen. Dies geschieht in der Zusammenstellung gemäß Darst. 10-4 (folgende Seite; sie wurde vom Verf. arrangiert; durch die dabei z.T. notwendig werdende Neuberechnung ergaben sich geringfügige - das Endresultat nicht berührende - Veränderungen).

254

Teil III Methoden der Datenanalyse in der Marktforschung

Marke Y

Land

Gesamtzahl nicht geführt geführt Geschäfte ( = 0 , ) ( = ° 2 >

e

1

.Î « 2 lo,-eil ( ° l - ° 2 ) , (o 1 -e 1 ) ( o 2 - e 2 ) e 0 e2 l 2 ^ 2 =916 - 0.990 - 0.792 -=-0»8ZQ 3,568

Dividiert man die Summe dieser Diskriminanzwerte für die erste Gruppe durch ihre Anzahl, so ergibt sich 0,892 (und damit das gleiche wie in Beisp. 11-6; s. auch A 11-11).

Die gewonnenen Diskriminanzwerte können nun insbesondere in zweierlei Hinsicht Anwendung finden. Erstens läßt sich mit ihnen eine Zuordnung vornehmen, indem Fälle > dem kritischen Wert der Gruppe A, die anderen Β zugeordnet werden; das Ergebnis ist eine sog. Konfusionsmatrix, mit der "richtigen" Zuordnung in der Hauptdiagonalen, "FehlKlassifikationen" in den anderen Feldern:

Kapitel 11 Weitere Methoden der Dependenzanalyse

279

Beispiel 11-10 Mit dem "kritischen Wert" von 0,846 für die obigen Daten ergibt sich, daß der an sich in Gruppe A gehörende Fall 3 der Gruppe Β zuzuordnen ist; umgekehrt kommen entsprechend die Fälle 4 und 5 der Gruppe Β in A. Es resultieren also 3 "falsche" und 7 "richtige" Zuordnungen, gemäß Darst. 11-4.

Gruppenzugenörigkeit

tatsächlich

insgesamt

aufgrund Diskriminanzfunktion

insgesamt

A

Β

A

3

1

4

Β

2

4

6

5

5

10

Darst. 11-4: Konfusionsmatrix (Beispiel)

Die vorstehende Zuordnung geschah mit den gleichen Elementen, aufgrund derer die Diskriminanzfunktion gewonnen wurde; damit konnte überprüft werden, inwieweit das Ziel der Gruppentrennung zu erreichen war. Die Gewinnung der Diskriminanzfunktion für gegebene Elemente deren Gruppenzugehörigkeit ja bekannt ist - dient insoweit bloß der Deskription. Allerdings bleibt auch dabei schon problematisch, daß die gleichen Elemente, mittels derer die Diskriminanzfunktion gewonnen wurde, zu ihrer Uberprüfung herangezogen werden. Es ist deshalb vorgeschlagen worden, die Stichprobe gewissermaßen zu halbieren: Mit einer Hälfte ist die Diskriminanzanalyse durchzuführen, die andere zur Klassifikation zu benutzen. Dieses - generell anwendbare - Prinzip wird als cross-validation (Kreuz-Validierung) bezeichnet. Man spricht hierbei auch von "analysis" bzw. "calibration (sub)sample" einerseits und "validation sample" andererseits; s. dazu und zur "double cross-validation" auch unter 13.2. Darüber hinaus kann die Diskriminanzfunktion zur Zuordnung neuer Elemente - mit unbekannter Gruppenzugehörigkeit - verwendet werden. Hierin liegt ihr eigentlicher "prediktiver" bzw. "prognostischer" Wert allerdings zugleich auch ihre Problematik (man spricht in diesem Zusammenhang auch von "Zuordnungs-" bzw. "Klassifikationsverfahren"):

280

Teil ΠΙ Methoden der Datenanalyse in der Marktforschung

Die Zuweisung anderer als der Berechnung der Diskriminanzfunktion zugrunde liegender Elemente stellt sich nur dann als zweckmäßig dar, wenn die a-prìorì-Wahrscheinlichkeiten für die Zugehörigkeit zu einer bestimmten Gruppe gleich sind. Das trifft zunächst - von anderen Umständen abgesehen - zu für den Fall gleicher Gruppengröße·. Die Wahrscheinlichkeiten für ein Element, in die Gruppe A (= ρ) oder Β (= q = 1 - ρ) zu fallen, unterscheiden sich dann im Prinzip nicht. In diesem Falle ist auch die Konfusionsmatrix am ehesten als Maß für die "Güte" der Diskriminanzanalyse geeignet. Das gilt natürlich um so mehr, je größer die Stichprobe war (und je eher die - gemäß oben - an sich notwendige Voraussetzung gleicher Dispersionsmatrizen zutrifft). Je weniger davon ausgegangen werden kann, um so problematischer ist auch die Voraussage über die Gruppenzugehörigkeit neuer Elemente allein aufgrund der Diskriminanzfunktion. Vielmehr können darüber hinaus, je nach den getroffenen Annahmen, durchaus unterschiedliche Regeln für die Entscheidung über die Zuordnung von neuen Elementen entwickelt werden. Eine weitere Anwendung der Diskriminanzwerte ist die - graphische - Positionierung in einem Marktmodell. Allerdings benötigt man dazu mehrere (am besten, wegen der graphischen Darstellung: zwei) Diskriminanzfunktionen. Diese sind aber nur möglich im "Mehr-Gruppen-" oder multiplen Fall. Die maximale Anzahl der extrahierbaren Diskriminanzfunktionen hängt nämlich nicht nur von der Anzahl der unabhängigen Variablen (n), sondern auch von der Gruppen (g) ab: der kleinste Wert von η oder g - 1 bestimmt ihre Obergrenze. S. dazu A 11-12. Im Falle mehrerer Diskriminanzfunktionen ist auch unbedingt die Standardisierung der Beobachtungswerte anzuraten. Dadurch verschwindet die Konstante. Bei nur einer Diskriminanzfunktion, wie im obigen Beispiel, war deren Außerachtlassung unproblematisch (da ja durch die Addition einer Konstanten keine Veränderung in der relativen Lage der Werte verursacht wird). Bei mehreren Diskriminanzfunktionen ergäben sich aber auch mehrere durchaus unterschiedliche Konstanten.

Die extrahierten Diskriminanzfunktionen spannen gewissermaßen einen "Diskriminanzraum" auf, in dem jede dieser Funktionen eine Dimension darstellt. Da sich für jede Gruppe jeweils ein Wert auf einer solchen Dimension ergibt, ist damit auch die Position in diesem Raum festgelegt. Für die sachliche Interpretation der Dimensionen können dann die Diskriminanzgewichte herangezogen werden: Hohe Gewichte deuten darauf hin, daß die entsprechende Variable für die betreffende Dimension eine besondere Bedeutung hat.

Kapitel 11 Weitere Methoden der Dependenzanalyse

281

Heute werden solche "Positionierungsstudien" allerdings zumeist mittels der Faktorenanalyse oder - öfter - der Multidimensionalen Skalierung durchgeführt; s. dazu Kap. 12.

11.3 AID-Verfahren Im engeren Sinne steht AID für ein bestimmtes Computer-Progamm: "Automatic Interaction Detector". (S. dazu unten.) Im weiteren Sinne kann man unter AID-Verfahren (andere, teilweise ebenfalls nur spezielle, Bezeichnungen sind: Segmentation, Kontrastgruppenanalyse, BaumAnalyse, Tree Analysis) alle Verfahren zusammenfassen, deren Ziel es ist, aus einer Anzahl von unabhängigen Variablen mittels sukzessiver Aufteilung in jeweils zwei Gruppen diejenigen Kombinationen zu suchen, die in bezug auf eine abhängige Variable optimal - nach einem bestimmten Kriterium - sind. Bevor auf die verwendeten Kriterien (und Stoppregeln) eingegangen wird, sei der Suchprozeß schematisch in Darst. 11-5 veranschaulicht.

E

gesamte Stichprobe

¿

2

¿

¿

1. Teilungsstufe

2. Teilungsstufe

letzte Teilungsstufe

Darsi. 11-5: AID-Baum Das Verfahren zerlegt also die gesamte Stichprobe (Nr. 1) in zwei Gruppen (Nr. 2 und 3), die jede im Hinblick auf die - metrische - abhängige Variable und in bezug auf ein bestimmtes Kriterium "homogener" sind (als 1). Dazu müssen die Ausprägungen der unabhängigen Variablen in

282

Teil III Methoden der Datenanalyse in der Marktforschung

dichotome Gruppen zusammengefaßt sein (oder werden - s. dazu unten). Sämtliche dichotomen Splits sind zu untersuchen; der "beste" bildet die 1. Aufteilungsstufe. Von deren beiden Gruppen wird zunächst wiederum die beste weiter untersucht, d.h. zunächst nur einer der "Aste" des "Baumes" weiter analysiert. In der schematischen Darstellung konnten deshalb die Nummern für die weiteren Gruppen nicht eingetragen werden; zu einem konkreten Beispiel s. unten. Wegen des Suchvorganges ähnelt das Verfahren zunächst der Stepwise Regression. Andererseits ähnelt es auch der Kreuztabulierung, indem jeweils die Darstellung nach den "relevanten" Merkmalen versucht wird; im Unterschied zu dieser erfolgt jedoch die Bestimmung nicht subjektiv, sondern nach einem definierten (Aufteilungs-)Kriterium. Wird als solches die Varianzerklärung verwandt, ist wiederum die Verbindung zur Varianzanalyse gegeben. Die Gemeinsamkeit mit der Clusteranalyse (s. 12.3) liegt darin, daß Gruppen von Elementen gebildet (und, bei den hierarchischen Verfahren, in oft in gewisser Weise ähnlicher F o r m im "Dendrogramm" - s. Darst. 126 - zusammengefaßt) werden können: Bei dieser geschieht das aufgrund der - im einzelnen zu definierenden - "Ähnlichkeit" der Elemente, hier dagegen eben in bezug auf eine abhängige Variable.

Kriterien für die Aufteilung können sein: 1. die Diskriminationsßhigkeit der Variablen, gemessen an den Mittelwerten der (jeweiligen) 2 Teilgruppen. Danach ist bei jeder Teilung die unabhängige Variable heranzuziehen, welche die größte Mittelwertdifferenz in den beiden Teilgruppen bewirkt. 2. der Beitrag zur Varianzerklärung. Es findet eine Zerlegung der totalen Streuung in die zwischen den Gruppen und innerhalb dieser statt. Letztere entspricht der nicht-erklärten ("noch verbliebenen") Streuung, erstere der erklärten. Zur Segmentbildung dient jeweils die Variable, die den größten Beitrag zur Reduktion der nicht-erklärten bzw. eben (Erhöhung der) Varianzerklärung liefert. Dies ist das im Programm AID (SONQUIST/MORGAN 1 9 6 4 ; SONQUIST/BAKER/MORGAN 1 9 7 4 ) benutzte Kriterium und findet schon deshalb heute zumeist Anwendung. Stoppregeln für den Abbruch des Prozesses können sein: 1. vorgeschriebene Mindestgröße der Gruppen oder Maximalzahl von Splits, 2. Mindest-"Inhomogenität" - gemessen als Anteil an der ursprünglichen Abweichungsquadratsumme (der jeweiligen Gruppe, die weiter aufgeteilt werden soll) - oder Mindestbeitrag zur Varianz-Reduktion.

Kapitel 11 Weitere Methoden der Dependenzanalyse

283

Beispiel 11-11 DOYLE/FENWICK (1975) berichten von einer Untersuchung über das sonntägliche Leseverhalten in bezug auf eine Reihe einschlägiger Medien. Sie hatte das Ziel, die "heavy reader" zu charakterisieren (da davon auszugehen ist, daß solche Leser eine hohe Wahrscheinlichkeit haben, eine Anzeige zu sehen, und auch möglicherweise deren stärkere Bindung an das Medium die Wirkung der Anzeigen vergrößert). Unabhängige Variablen waren zunächst 25 durch die betreffenden Medien abgedeckte Themenbereiche; diese wurden, per Faktorenanalyse - s. 12.1 -, zu 6 Faktoren (z.B. "Sport", "Heim und Häuslichkeit") zusammengefaßt. Dazu kamen dann noch: Alter (7 Kategorien), Geschlecht, soziale Schicht (5 Kategorien) sowie Fernsehen (3 Programme als Variable, in jeweils 6 Kategorien). Stoppregeln waren: Unterschreiten der Mindest-Gruppengröße von 100, interne Varianz mindestens 0,01% der Gesamtvarianz und Mindest-Varianzerklärungsbeitrag von 0,001%. Die abhängige Variable bildete dabei die zum Lesen aufgewandte Zeit (in Minuten). Auf die Wiedergabe des vollständigen AID-Baumes sei hier verzichtet. (S. dazu auch Abb. 13-5 bei HÜTTNER 1979.) Der Teil der Ausgangsstichprobe, der der Analyse unterzogen wurde (der andere Teil diente der Kreuzvalidierung), umfaßte 1074 Personen, mit einem Mittelwert der abhängigen Variablen von 49,0. In der 1. Teilungsstufe wurde das Alter als Aufteilungsmerkmal herangezogen; die beiden Gruppen waren: "über 45 Jahre" und "darunter", die letztgenannte Gruppe umfaßte 564 Personen, mit einem Mittelwert von 60,2, die erste 510 und 36,5 als Mittelwert. Die letzte Teilungsstufe war die auf die Erreichung des Abbruchskriteriums "Mindestgruppengröße" folgende (es war die 4.). Sie umfaßte 14 Gruppen. Die "obere" Extremgruppe, mit dem höchsten Mittelwert der abhängigen Variablen (109,9) war gekennzeichnet durch: Alter über 45 Jahre, männlich, ...; die mit dem niedrigsten Mittelwert (12,0) war: geringes Alter, weiblich usw.

Ergänzend dazu sei darauf hingewiesen, daß Reihenfolge und Anzahl der unabhängigen Variablen keine Rolle spielen. Ferner müssen bei jedem Merkmal nicht von vornherein nur 2 Gruppen vorhanden sein; diese können auch für die einzelnen Splits erst gebildet werden. Beispiel 11-12 Läge im obigen Exempel die Datenbasis etwa in folgenden Altersgruppen vor: bis 15 Jahre, über 15 bis 25 Jahre, über 25 bis 35 Jahre, über 35 bis 45 Jahre, über 45 Jahre, so wären folgende Splits sukzessive durchzurechnen: 1. bis 15 Jahre vs. über 15 Jahre, 2. bis 25 Jahre vs. über 25 Jahre, 3. bis 35 Jahre vs. über 35 Jahre, 4. bis 45 Jahre vs. über 45 Jahre.

Daraus folgt auch, daß letztlich die unabhängigen Variablen "metrisch" skaliert sein können; s. dazu A 11-13.

284

Teil ΠΙ Methoden der Datenanalyse in der Marktforschung

In der, wie der Name sagt: automatischen Suchprozedur, zum Auffinden und Beschreiben von "Marktsegmenten", liegt der Vorzug des Verfahrens. Es muß aber auch auf seine Schwächen hingewiesen werden: 1. Im allgemeinen wird eine relativ große Stichprobe benötigt. Dies folgt daraus, daß eben mehr auf Gruppen als auf Individuen abgestellt ist. (Jede soll noch "repräsentativ" sein; deshalb auch die oben erwähnte Stoppregel der Mindestgröße!) SONQUIST/BAKER/MORGAN (1974) selbst beziffern den Min¿fotstichprobenumfang auf 1000. Im Vergleich etwa zur Regressionsanalyse stellt das eine beachtliche Größe dar. Anders formuliert: Die Regression ist, so ARMSTRONG/ ANDRESS (1970), "more powerful".

2. Die Interkorrelation der Variablen wird nicht berücksichtigt: Ist einmal eine Variable zwecks Teilung ausgewählt, so hat - aus der Logik des Verfahrens folgend - die mit ihr korrelierte Variable sogar (obwohl vielleicht mit ursprünglich ähnlich hohem "Erklärungsbeitrag") eine geringere Chance! 3. Es werden Interaktionen sichtbar gemacht , (die "Wege" durch den "Baum"!), aber nur die 1. Ordnung. 4. Es existierten - und darin besteht wohl einer der größten Nachteile keine Signifikanztests. (S. aber auch unten zur Weiterentwicklung speziell CHAID.) Insgesamt wird man deshalb das AID-Verfahren mehr nur der explorati· ven Analyse - nicht der konfirmatorischen - zurechnen können. Anders ausgedrückt: Sein Wert liegt mehr in der Deskription der Beziehungsstruktur der Variablen, im Hinblick auf deren "diskriminatorische Kraft" in bezug auf die abhängige Größe. Insofern kann sie insbesondere auch als Vorstufe, zur Gewinnung eines verbesserten (etwa: regressionsanalytischen) Modells zur Erklärung und Prognose, dienen. Inzwischen existieren Weiterentwicklungen in verschiedener Richtung, so T H A I D (für polytome abhängige Variable, mehr als zwei Splits zulassend) und vor allem C H A I D (mit Ch für Chi-Quadrat). Letzteres - vgl. dazu etwa MAGIDSON 1994 - ist inzwischen auch Bestandteil von SPSS.

11.4 Kanonische Analyse (und Korrespondenzanalyse) Die Kanonische Analyse (oder Kanonische Korrelation) ist ein Verfahren, das dazu dient, aus zwei Sätzen von (metrisch skalierten) Variablen "Fak-

Kapitel 11 Weitere Methoden der Dependenzanalyse

285

toren" (Kanonische Variaten) in der Weise zu extrahieren, daß die jeweiligen Linearkombinationen, d.h. die Summen der Produkte aus den Koeffizienten der Kanonischen Variaten und den Variablenwerten, maximal miteinander korreliert sind. Ausgegangen wird zweckmäßigerweise von der Korrelationsmatrix. Dabei handelt es sich allgemein um eine quadratische Matrix, mit gleicher Anzahl von Zeilen und Spalten. Hier speziell - wie auch sonst meist - sind dies die Variablen (und nicht - wie in besonderen Fällen - die Cases der ursprünglichen Datenmatrix). Die Matrix-Elemente sind also Korrelationskoeffizienten zwischen Variablen. D.h. auch, daß in der Hauptdiagonalen - jedenfalls normalerweise - jeweils 1 steht und alle Elemente oberhalb dieser (obere Dreiecksmatrix) spiegelbildlich identisch mit denen unterhalb derselben (untere Dreiecksmatrix) sind. Man nennt eine solche Matrix auch symmetrisch·. 1,0 r12 r

21 i;

0

Mn ··· 2n = R r

(11.33)

r

nl rn2 ·" 1.0.

Hierbei handelt es sich um eine einheitliche Gruppe von Variablen. (Sie ist typisch für die "Interdependenzanalyse", Kap. 12; s. auch die in Darst. ΠΙ wiedergegebene "empirische" Korrelationsmatrix.) Teilt man jedoch die Variablen in zwei Gruppen auf - die beiden "Sätze" (nicht notwendigerweise gleich groß!) -, so ergibt sich folgende Partition: R

11 r 1 2 =R R-21 R-22.

(11.34)

Ru enthält die Interkorrelation der Variablen des 1. Satzes, der "Kriterion-Variablen", und R22 die der "Prediktor-Variablen". R 12 ist die Transpose von R 2 j und enthält die Korrelation der Kriterion- mit den Prediktor-Variablen. Eine inhaltliche Festlegung in abhängige und unabhängige Variablen, eine Festlegung der Richtung der Beziehung zwischen den beiden Variablensätzen, ist im Grunde nicht erforderlich. Es geht hier nur um die Ermittlung der - maximalen - Korrelation zwischen ihnen. Insofern ist aber auf jeden Fall die Partition der Datenmatrix notwendig und muß auch die Anordnung hier unter "die Datenmatrix partitionierende Verfahren" gerechtfertigt erscheinen. Die Bezeichnung als "Kanonische Analyse" verweist dagegen mehr auf den Aspekt der Faktorenanalyse, gemäß Kap. 12 (auf den

286

Teil III Methoden der Datenanalyse in der Marktforschung

unten noch zurückzukommen ist). Aus dieser Möglichkeit einer unterschiedlichen Betrachtungsweise erklären sich auch gewisse Uneinheitlichkeiten in der Terminologie.

Die Kanonische Analyse kann als Verallgemeinerung der Regressionsanalyse (und auch der Varianz- und der Diskriminanzanalyse) gesehen werden: Ging es bei der - multiplen - Regressionsanalyse darum, die durch die Regression erklärte Streuung (im Verhältnis zur totalen) zu maximieren, also das höchste Bestimmtheitsmaß und damit den größten Korrelationskoeffizienten zu finden, in bezug auf mehrere unabhängige Variable - einen Satz - und ein Kriterion, so handelt es sich bei der Kanonischen Analyse um die Maximierung der Korrelation zwischen zwei Sätzen von Variablen. Der Unterschied liegt also darin, daß auch auf der Seite der abhängigen Variablen nunmehr mehrere existieren. Während bei der Regressionsanalyse nur eine Funktion berechnet werden konnte, können es hier mehrere sein (und zwar so viele, wie der kleinere Satz an Variablen umfaßt). Sie sollen orthogonal, voneinander unabhängig, sein. Anders ausgedrückt: Die Kanonischen Variaten (= "Faktoren") sind so zu extrahieren bzw. ihre Koeffizienten so zu bestimmen, daß die aus dem ersten Faktor von Satz 1 resultierenden Linearkombinationen maximal korreliert sind mit denen des ersten Faktors von Satz 2 usw., wobei jeder weitere Faktor vom vorhergehenden statistisch unabhängig ist. Die ermittelten Koeffizienten entsprechen im Prinzip den betaGewichten bei der Regression (bzw. den entsprechenden Koeffizienten bei der Diskriminanzanalyse) und werden zumeist als Kanonische Gewichte (mitunter auch - etwas mißverständlich, s. dazu unten - einfach "canonical coefficients" oder noch anders) bezeichnet. Sie ergeben sich gesondert für jede Kanonische Variate. Dies gilt auch für den Kanonischen Korrelationskoeffizienten. (Aus der Eigenart des Verfahrens folgt allerdings, daß er für jede folgende Kanonische Variate niedriger ist.) Darüber hinaus kann man noch andere - verwandte - Maße heranziehen. Das gilt zunächst für die Kanonischen Gewichte: Zusätzlich dazu können Kanonische Ladungen berechnet werden. (Auch diese Bezeichnung wird nicht einheitlich benutzt.) Sie geben die Korrelation der ursprünglichen Variablen mit den - neuen - Kanonischen Variaten an. Das Vorliegen eines solchen weiteren Satzes von Koeffizienten kann leicht zu Schwierigkeiten bei der Interpretation führen, insbesondere dann, wenn Abweichungen auftreten, d.h. die relative Bedeutung der einzelnen Variablen

Kapitel 11 Weitere Methoden der Dependenzanalyse

287

unter Verwendung der "Gewichte" eine andere ist als bei den "Ladungen". ALPERT/PETERSON (1972, S. 192) versuchen dazu eine g e n e r e l l e Aussage: "Gewichte erscheinen eher geeignet für Voraussagen, während Ladungen besser die dahinterstehenden (obwohl interkorrelierten) Konstrukte erklären mögen." (Übers, d. Verf. An dieser Stelle verwenden Alpert und Peterson für "Ladungen" die Bezeichnung "correlations".)

Das Quadrat des Kanonischen Korrelationskoeffizienten könnte, ähnlich wie bei der Regressions- und Korrelationsanalyse, als ein Maß für die "Erklärung" des Zusammenhangs angesehen werden. Allerdings ist zu bedenken, daß es nur den "erklärten" Varianzanteil zwischen den ~Lmez.r-K.ombinationen der Variablen beider Sätze, nicht zwischen den Variablen an sich, reflektiert. Von STEWART/LOVE (1968) ist deshalb das Konzept der Redundanz entwickelt worden. (Gelegentlich spricht man sogar von Redundanz-Analyse, als "Alternative" - so WOLLENBERG (1977). Es kann gemäß Darst. 11-6 veranschaulicht werden.

Die Kreise symbolisieren die Varianz in beiden Variablensätzen, die Schnittfläche also die, die sowohl zu A als auch zu Β gehört. Sie ist normalerweise nicht symmetrisch. Es können also zwei verschiedene Redundanz-Indizes, in bezug auf A einerseits und Β andererseits, ermittelt werden.

288

Teil ΙΠ Methoden der Datenanalyse in der Marktforschung

Deren Berechnung erfolgt relativ einfach. Ansonsten ist der Rechengang verhältnismäßig kompliziert und aufwendig. Es wird deshalb von dessen Darlegung abgesehen. S. dazu bei HÜTTNER 1 9 7 9 . Das dort "von Hand" durchgerechnete Beispiel bezieht sich allerdings auf den simpelsten Fall von nur 2 Variablen in jedem Satz. Im Normalfall müssen Computerprogramme verwendet werden, die in den Datenanalyse-Progammsystemen üblicherweise vorhanden sind. Während die Probleme des - früher prohibitiven - Rechenaufwandes durch den Computereinsatz praktisch beseitigt sind, gilt dies nicht für die Schwierigkeiten der Interpretation. (Vgl. dazu, neben ALPERT/PETERSON [ 1 9 7 2 ] , insbesondere LAMBERT/DURAND [ 1 9 7 5 ] und FORNELL [ 1 9 7 8 ] . ) Damit muß es wohl zusammenhängen, daß - von einigen wenigen "PilotStudien" abgesehen - praktische Anwendungen im Marketing eher selten sind. Es mag deshalb die zusammenfassende Einschätzung gerechtfertigt erscheinen, die Bedeutung der Kanonischen Analyse weniger in der konkreten Anwendung in der Marktforschung als vielmehr darin zu sehen, daß sie als formales Konzept mehr oder weniger hinter nahezu allen multivariaten Verfahren steht, anders ausgedrückt: diese letztlich nur Spezialfälle jenes allgemeinen Konzepts sind. Eine enge Beziehung besteht, wie schon verschiedentlich erwähnt, insbesondere auch zur Faktorenanalyse, auf die zu Beginn des folgenden Kapitels über die Methoden der Interdependenz-Analyse einzugehen ist. Vorher aber soll noch, wie ebenfalls bereits erwähnt, die Korrespondenzanalyse kurz diskutiert werden. Die Gemeinsamkeit mit der Faktorenanalyse (und auch der Multidimensionalen Skalierung) besteht darin, daß es sich ebenfalls um ein „dimensionsreduzierendes Verfahren" - rechnerisch über die Eigenwertzerlegung, mit dem Ziel der graphischen Darstellung in möglichst wenigen (im Idealfall zwei) Dimensionen - handelt. Im Unterschied zu den vorgenannten Methoden - und insofern gemeinsam mit der Kanonischen Analyse - geht es aber nicht nur um eine „Punktwolke", sondern zwei oder mehr; sie beruhen auf «omznd/skalierten Variablen; das macht den Vorzug der Korrespondenzanalyse (und zugleich den Unterschied zur Kanonischen Analyse) aus. Ahnlich wie bei dieser sind die Ergebnisse aber schwer zu interpretieren. Damit hängt es zusammen, daß die Zuordnung zu anderen multivariaten Verfahren durchaus verschieden gesehen werden kann. Von GOODMAN (1991) etwa wird mehr die Nähe zu loglinearen Modellen, bei GlFI (1990) mehr die zur Multidimensionalen

Kapitel 11

Weitere Methoden der Dependenzanalyse

289

Skalierung hervorgehoben. Deshalb auch - und wegen ihrer „relativen N e u h e i t " (so ist bei Backhaus et al. noch bis zur 6. Aufl. 1990 die Korrespondenzanalyse nicht einmal im Stichwortverzeichnis erwähnt)

- wurde von der Aufnahme in das Schema v o n

Darst. IIIE-2 abgesehen. BACKHAUS und MEYER haben allerdings eine einführende Darstellung bereits 1988 den Titel v o n HILL 1974 aufgreifend - gegeben. D a ß es sich u m ein „vernachlässigtes Verfahren" - mit von Zeit zu Zeit (in „Wellen") erfolgender „Wiederentdeckung" handelt, hängt zunächst damit zusammen, daß es in den Grundzügen im französischen Sprachraum (vgl. etwa BENZÉCRI 1963) entwickelt wurde; deshalb wohl stand entsprechende Software - jedenfalls in den großen „Packages" - nicht zur Verfügung. Diese „Vernachlässigung" ist sicher aber auch auf die erwähnten Schwierigkeiten der Interpretation zurückzuführen. Die Interpretations- und damit die Anwendungsmöglichkeiten sind bis heute umstritten; deshalb wird im folgenden nur ein sehr kurzer Uberblick über das Vorgehen gegeben.

Im allgemeinsten Sinne kann als Ziel der Korrespondenzanalyse die Untersuchung der Zusammenhangstruktur zwischen in der Regel nominalskalierten Variablen und deren graphische Darstellung in einem möglichst niedrig dimensionierten - metrischen - Raum angesehen werden. Bei mehr als zwei Variablen spricht man von multipler Korrespondenzanalyse. Praktisch werden allerdings zumeist nur Kreuztabellen - des Umfangs r-s - untersucht (invariate Korrespondenzanalyse). Im folgenden geschieht eine Beschränkung hierauf (unter Weglassung des Zusatzes „bivariat"). Im Grunde geht es dann lediglich „um die graphische Darstellung der Residuen einer Kreuztabelle unter der Annahme, daß Zeilen und Spalten unabhängig voneinander sind", also „eine graphische Darstellung der Interaktionseffekte" (SCHNELL 1 9 9 4 , S. 1 8 7 ) . Ausgangspunkt ist also eine Tabelle laut Darst. 9-2 oben. In der Regel handelt es sich dabei, wie dort, um Häufigkeiten in den einzelnen Zellen. In jedem Falle müssen die Werte ganzzahlig sein. („Fractional data values are truncated in the analysis" [SPSS Inc., SPSS Categories 6.1, Chicago 1994, Ch. 7: Correspondence Analysis - im folgenden: SPSS Categories -, S. 60.]) Die absoluten Zahlen werden dann in Prozente umgerechnet, und zwar in bezug auf beide Randverteilungen. Man erhält also zwei Darstellungen mit den so genannten (Zeilen- oder Spalten-)/Vo/i/era. Daraus werden dann Chi-Quadrat-Distanzen - deshalb auch war oben von der Voraussetzung der „Unabhängigkeit" die Rede! - berechnet. „Die Chi-Quadrat-Distanz zweier Zeilenprofile ist also die W u r z e l aus der Summe der quadrierten Differenzen der beiden Profile über alle Spalten, wobei die einzelnen Summanden mit der Spaltensumme gewichtet werden. Die

Chi-Quadrat-Distanz

290

Teil ΙΠ Methoden der Datenanalyse in der Marktforschung

zweier Spaltenprofile wird entsprechend berechnet, wobei anstelle der Spaltensummen die Zeilensummen r¡ zur Gewichtung verwendet werden und über alle Zeilen summiert wird." (SCHNELL 1994, S. 188.)

Danach geschieht die Dimensionsreduktion, indem zunächst eine Lösung des „Eigenwertproblems" (s. dazu auch noch in Kap. 12, bei der Faktorenanalyse) - man spricht hier von SVD: Singular-Value-Decomposition erfolgt und danach entschieden wird, wie viele der solcherart gewonnenen Dimensionen beibehalten werden. Die beibehaltenen Dimensionen sollten - immer ähnlich der Faktorenanalyse - möglichst viel Varianz erklären; praktisch versucht man, wegen der größeren Übersichtlichkeit, fast immer die Darstellung in nur zwei Dimensionen, die man dann - aufgrund der Korrelationen zwischen ihnen und den Original-Ausprägungen („Ladungen" bei der Faktorenanalyse) - zu interpretieren versucht. Dazu müssen die Koordinaten berechnet worden sein; das Problem dabei ist, daß es zwar gemeinsame Koordinaten zwischen den Zeilen- und den Spalten-Ausprägungen gibt, die Lage der Punkte auf diesen - je nachdem, in welcher „Richtung" gerechnet wurde, mehr auf die Zeilen oder die Spalten - verschieden ist; ein „echter" joint space scheint nicht möglich. Dies hängt damit zusammen, daß man unterscheiden muß zwischen der Darstellung der Beziehungen zwischen den beiden Variablen und der der Ausprägungen („Kategorien") jeder einzelnen davon. Trifft letzteres zu, so spricht man - hinsichtlich der graphischen Darstellung - von asymmetrischen Plots: entweder in bezug auf die Zeilen oder Spalten. Bei asymmetrischen Zei/ercplots (SPSS Categories: row principal normalization) wird auf die Distanzen der Zeilenprofilpunkte abgestellt; hier kann also die Entfernung der Zeilen-Kategorien interpretiert werden (sie liegen meist relativ nah beieinander, wogegen die Spaltenkategorien eher stärker gestreut im wie erwähnt, meist zweidimensionalen - Raum zu finden sind). Bei asymmetrischen Spaltenplots verhält es sich umgekehrt. Beispiel 11-13 1. SCHNELL (1994, S. 193ff.) verwendet ein Beispiel von GREENACRE 1993 über das Ausmaß der Forschungsförderung (5 Kategorien - in den Spalten) in 10 Fakultäten. Die Anzahl der 4 möglichen Dimensionen (niedrigste Zahl der Kategorien minus 1) wird auf 2 reduziert. Bei dem asymmetrischen Zeilenplot liegen in diesem zweidimensionalen Raum die 10 Fakultäten nahe beieinander, einige der „Ausmaßkategorien" dagegen weit verstreut. Beim asymmetrischen Spaltenplot streuen dagegen die Fachrichtungen weit stärker.

Kapitel 11 Weitere Methoden der Dependenzanalyse

291

2. SPSS Categories verwendet als Beispiel das Wahlverhalten in 5 Ländern (in den Zeilen) in bezug auf 3 „Parteien": „Christliche Demokraten", „Sozialisten" und „andere". Beim asymmetrischen Zeilenplot (S. 51) liegen die Länder nahe beieinander (Deutschland und die Niederlande sind praktisch identisch), die Scores für die Parteien dagegen weit auseinander.

Der symmetrische Plot dagegen „bevorzugt" keine der beiden Variablen, ist im Grunde aber nicht auf die Interpretation der Entfernung zwischen den Kategorien der einen oder anderen Variablen, sondern der der Variablen selbst ausgerichtet: Entsprechend der Bezeichnung des ganzen Verfahrens sollt hier „die Korrespondenz" zwischen den beiden Variablen einer Kreuztabelle herausgearbeitet werden. Deshalb ist diese canonical normalization auch die Voreinstellung („default") in „SPSS Categories". Beispiel 11-13 (Forts.) Im „joint plot with canonical normalization" bei SPSS Categories (S. 57) findet sich Italien am nächsten mit „andere (Parteien)", Luxemburg mit „Christliche Demokraten" und Belgien, die Niederlande und Deutschland mit „Sozialisten". Jedoch·. „this plot does not indicate the relationship between categories of the row variable or of the column variable".

Von der „Französischen Schule" wird dagegen eher die principal normalization bevorzugt; man bezeichnet den entsprechenden Plot deshalb auch mitunter als „french plot". In SPSS Categories wird ein Plot hierfür gerade nicht zur Verfügung gestellt, weil „not appropriate for this normalization technique". Dies stimmt überein mit den entsprechenden Warnungen von SCHNELL, wegen der Schwierigkeiten der Interpretation; er empfiehlt deshalb, im allgemeinen - wenn, wie zumeist, der Vergleich der „Zeilenprofile" interessiert - nur asymmetrische Zeilenplots zu verwenden, und sieht im übrigen die Eignung der Korrespondenzanalyse „vor allem für die graphische Darstellung größerer Kreuztabellen, über deren Struktur nichts bekannt ist" (S. 200 - „für kleine Tabellen benötigt man keine graphische Darstellung"). Wegen dieser zumindest derzeit offenbar doch nur eingeschränkten Anwendungsmöglichkeit der Korrespondenzanalyse sei hier auf weitere Ausführungen - auch in bezug auf Anwendungsbeispiele - verzichtet; s. aber auch die nachstehenden Literaturhinweise.

292

Teil III

Methoden der Datenanalyse in der Marktforschung

Literaturhinweise Wie bereits angekündigt, sollen hier zunächst Hinweise auf das Schrifttum zu multivariaten Methoden allgemein gegeben werden. Dieses - besonders das englischsprachige - ist jedoch außerordentlich umfangreich. Deshalb muß eine Auswahl erfolgen. Sie bezieht sich zuvörderst auf "neuere" Schriften. Diese Beschränkung genügt jedoch nicht. Es könnte eine Einteilung in mehr grundlegend mathematisch-statistische und stärker anwendungsorientierte Werke erwogen werden (bei letzteren wiederum nach dem Sachgegenstand in Richtung auf "Marketing" etc.). Dies scheint schwierig und unbefriedigend, zumal der "Anwendungsbezug" oft eher in der - didaktisch geschickten - Durchrechnung von Beispielen besteht. Im folgenden geschieht deshalb nur eine Trennung in deutschund englischsprachig (mit, insbesondere bei letztgenannten, subjektiver Auswahl, im Hinblick auf die - sowohl bezüglich der theoretisch-statistischen Grundlagen als auch der "anwendungsbezogenen" Darstellung beurteilten - Qualität). In diesem Sinne können genannt werden (in alphabetischer Reihenfolge): 1. deutschsprachig: BACKHAUS et al. 2 0 0 0 , FAHRMEIR/HAMERLE (Hrsg.) 1 9 8 4 bzw. 1996, HARTUNG/ELPELT 1999, LITZ 2000; 2. englischsprachig: ANDERSON 1984, JOBSON 1996, KRZANOWSKI 1990, MORRISON 1 9 8 4 , TABACHNK/FIDELL 1 9 9 6 .

Nachstehend noch einige Hinweise zur Varianzanalyse. Hierfür gilt ebenfalls - zumal wegen der engen Verbindung zur Regressionsanalyse -, daß das Schrifttum ziemlich reichhaltig ist. Die folgende Aufzählung stellt also gleichfalls nur eine Auswahl dar (begründet in ähnlicher Weise wie oben - unter Wegfall allerdings der Trennung in deutsch- und englischsprachig ): BOX/HUNTER/HUNTER

1978,

LINDMAN

1992,

NETER/WASSERMAN/KUTNER

1 9 9 0 u n d WINER/BROWN/MICHELS 1 9 9 1 . Ferner wird hingewiesen auf BORTZ 1999 (weil in diesem - lt. Titel - allgemeinen Statistik-Lehrbuch varianzanalytische Methoden einen außerordentlich breiten Rahmen einnehmen).

Zur Diskriminanzanalyse sei zunächst DEICHSEL/TRAMPISCH 1 9 8 5 .

KLECKA 1 9 8 0

genannt; s. aber auch

Kapitel 11

Weitere Methoden der Dependenzanalyse

293

Nachstehend noch einige Hinweise zur Korrespondenzanalyse. Diese sollen sich, wie angedeutet, nicht so sehr auf grundsätzliche, theoretische Werke (etwas davon wurde im Text bereits erwähnt - vgl. aber etwa auch BLASIUS 2 0 0 1 ) , sondern vor allem auf neuere, deutschsprachige Schriften, die Anwendungsbeispiele - insbesondere im Marketing - enthalten, beziehen. In diesem Sinne können genannt werden (in alphabetischer Reihenfolge): FLIEß 1 9 9 4 , HALLER 1 9 9 8 , KESSING 1 9 9 3 , MATIASKE/DOBROV/ BRONNER 1 9 9 4 , MEYER/DIEHL/WENDENBURG 2 0 0 0 , SCHARF 1 9 9 1 .

Aufgaben 11-1:

Zeigen Sie, daß sich aus den Meßwerten von Beisp. 11-1 die in Beisp. 6-1 angeführten Mittelwerte und Varianzen ergeben!

11-2:

Die "Summe der Abweichungsquadrate" ist, gemäß auch der vorstehenden Aufgabe, nichts anderes als der Wert vor der Division durch die Gruppengröße. Verifizieren Sie demgemäß anhand der gegebenen Daten die Beziehung: SAQW = (st2 + s 2 % -1)

(11.35)

11-3:

Zeigen Sie für Beisp. 11-1 die Ubereinstimmung der Ergebnisse, wenn man den ersten Teil von (11.2-4) verwendet!

11-4:

Zeigen Sie, unter Verwendung der in (10.35) angegebenen Beziehung zwischen t und F, die Ubereinstimmung von Beisp. 11-1 und 6-1!

11-5:

Unter Verwendung der oben erörteten Beziehung zwischen s2 und SAQ kann der Nenner γon (6.1) auch geschrieben werden als: ^/(SAQ! + SAQz) /[p(p -1)] Verifizieren Sie dies mit den obigen Daten bzw. den von Beisp. 61!

294

11-6:

Teil III Methoden der Datenanalyse in der Marktforschung

Statt des t-Tests kann auch ein F-Test erfolgen, mit (vgl. 1992, S. 354):

ρ e m p

_ "p(l

(ρ-ιΧΣχι-Σχ2)2 χ ^ Η ς χ 0

2 +

, Μ

SACHS

1 ι ν Λ (

}

Berechnen Sie vorstehenden Ausdruck mit den obigen Daten und vergleichen Sie das Ergebnis mit a) Beisp. 11-1, b) Beisp. 6-1. 11-7:

Führen Sie die Varianzanalyse für das zufälligen Block-Design gemäß Beisp. 11-2 durch!

11-8:

Führen Sie die Varianzanalyse für den bifaktoriellen Plan gemäß Beisp. 11-3 durch!

11-9:

Führen Sie die Varianzanalyse für das Lateinische Quadrat gemäß Beisp. 11-4 durch!

11-10: a) Stellen Sie aus den Zahlen von Beisp. 11-5 die Matrix der Abweichungsquadrat- und Kreuzprodukt-Summen (kurz: Kreuzprodukt-Matrix) C zusammen! b) Zeigen Sie den Ubergang zur bzw. die Entwicklung der Elemente der Varianz-Kovarianz-Matrix (kurz: Kovarianzmatrix) S (1) aus der Matrix C, (2) aus den Einzelwerten! c) Das Gleichungssystem (11.27) kann - was insbesondere der den Fall mehrerer unabhängiger Variablen wichtig ist - in MatrixFormulierung geschrieben werden als: b = C 1d (mit b als dem Vektor der Koeffizienten und d dem der Mittelwertdifferenzen sowie C"1 als Inverse von C gemäß oben) Zeigen Sie, mit C"1 aus L 12-19, die Übereinstimmung der Lösung mit der von Beisp. 11-5!

Kapitel 11 Weitere Methoden der Dependenzanalyse

295

11-11: Berechnen Sie analog Beisp. 11-9 die Diskriminanzwerte für die zweite Gruppe! 11-12: Wieviele Diskriminanzfunktionen können extrahiert werden bei a) 2 Gruppen und (1) 2 unabhängigen Variablen, (2) dto. 3, b) 3 Gruppen und (1) 2 unabhängigen Variablen, (2) dto. 3? 11-13: Angenommen, im Bespiel des AID-Verfahrens lägen die Daten für das Alter "in Jahren" vor. Ließe sich dieses direkt der Analyse unterziehen?

Kapitel 12

Methoden der Inter dependenzAnalyse

Im Unterschied zu den bisherigen Betrachtungen wird in diesem Kapitel davon ausgegangen, daß die Datenmatrix nicht partitioniert (in "abhängige" und "unabhängige" Größen) ist, sondern nur ein einziger Satz vorliegt. Dies werden zumeist Variablen sein; jedoch tritt hier auch stark die Datenkompression in Richtung auf Elemente ("Cases") in den Vordergrund. - Im ersten Abschnitt wird die Faktorenanalyse behandelt, im zweiten die Multidimensionale Skalierung und im dritten die Clusteranalyse.

12.1 Faktorenanalyse 12.1.1 Begriff und Arten (Die Vorgehensweise im grundsätzlichen) Die Faktorenanalyse ist eines der ältesten multivariaten Verfahren. Sie hat ihren Ursprung in der Psychologie: Man versuchte dort schon um die Jahrhundertwende, im Zuge der Messung der "Intelligenz" diese möglichst auf einen einzigen Faktor, den "Generalfaktor", zurückzuführen (SPEARMAN 1 9 0 4 ) . Später wurde zu der Vorstellung von "multiplen Faktoren" ( T H U R S T O N E 1 9 3 1 ) übergegangen. Damit konnte als - auch heute noch maßgebliche - Grundidee angesehen werden, eine Vielzahl von gegebenen ("manifesten") Größen, auf der Basis der empirischen Korrelation zwischen ihnen, auf dahinterstehende - "latente" - "Faktoren" zurückzuführen. Ausgangspunkt ist also die Korrelationsmatrix. Darst. 12-1 zeigt ein Exempel: Beispiel 12-1 Der "IWEMA-Anzeigentest" erbrachte die Korrelationskoeffizienten der Häufigkeitszuordnung von 12 Eigenschaften ("Variablen") bei 4 3 Anzeigen und 4 3 0 0 Befragten (WOLF 1963) gemäß Darst. 12-1.

Kapitel 12 Methoden der Interdependenzanalyse

297

leben- nichts- unüber- ununan- über- langge- vor- ansagend sicht- schön genehm trieben weilig fallig nehm spruchs- dig voll lich

Variable

modern

ansprechend

0,68 0,76 0,73

0,43

0,49

-0,12 -0,19 -0,36 -0,39 -0,15 -0,17

0,62 0,67

0,66

0,47

-0,36 -0,29 -0,39 -0,33 -0,20 -0,36

0,84

0,54

0,46

-0,22 -0,23 -0,33 -0,36 -0,24 -0,13

0,76

0,46

-0,30 -0,32 -0,47 -0,47 -0,34 -0,23

0,27

-0,34 -0,30 -0,45 -0,44 -0,39 -0,29

modem gefallig vornehm anspruchsvoll

-

-

-

-

lebendig nichtssagend unübersichtlich unschön unangenehm übeltrieben langweilig

-

-0,19 -0,00 -0,10 -0,23 -

0,65 -

0,14 -0,18

0,61

0,69

0,57

0,89

0,74

0,71

0,69

0,59

0,87

0,65

0,62

-

0,61

0,68

-

-

-0,45 -

Darst. 12-1: Korrelationsmatrix (Beispiel)

Wiedergegeben ist nur die obere Dreiecksmatrix. (Vgl. die formale Definition in Kap. 11.) Die Hauptdiagonale fehlt; s. dazu auch unten. Die Tabelle zeigt, daß z.B. bei den positiven Eigenschaften außerordentlich hoch "vornehm" und "gefällig" (positiv) korrelieren, d.h., daß eine Anzeige, die man als "vornehm" bewertet, gleichzeitig auch als "gefällig" empfunden wird, und umgekehrt. Im negativen Bereich korrelieren (positiv) am stärksten "nichtssagend" und "langweilig".

Bei dieser Matrix handelt es sich bei den Zeilen und Spalten um die Variablen. Damit ist schon eine der vielfältigen Arten der Faktorenanalyse angesprochen: 1. Die Analyse der Interkorrelation der Variablen bezeichnet man als RTechnik. Es ist jedoch auch denkbar (und u.U. zweckmäßig), die andere Dimension der Datenmatrix, die "Fälle" oder "Cases", hinsichtlich ihrer Interkorrelation zu untersuchen; man spricht bei dieser "umgekehrten Faktorenanalyse" auch von Q-Technik.

298

Teil III Methoden der Datenanalyse in der Marktforschung

Es ist hier darauf verzichtet worden zu spezifizieren, was in den Spalten und was in den Zeilen der Datenmatrix steht. Dies erweist sich schon deshalb als zweckmäßig, weil in der Literatur zur Faktorenanalyse oft von einer - von Darst. IIIE-1 - verschiedenen Anordnung der Datenmatrix ausgegangen wird. Daraus resultieren unterschiedliche Definitionen der verwendeten Matrizen. Es bleibt jedoch darauf hinzuweisen, daß für diese "andere Dimension" - neben den Variablen - vielfach zwei Möglichkeiten bestehen. (So könnten im obigen Beispiel außer den Eigenschaften - "Variablen" - noch Anzeigen und Befragte gegeben sein.) Normalerweise wird der "Fall" (Case) als Person definiert; er umschließt - im obigen Beispiel - die verschiedenen Anzeigen. Als quasi dritte Dimension lassen sich jedoch auch Produkte ansehen. (Das war etwa so in dem wiederholt erwähnten, vom Verf. federführend betreuten Projekt: Polaritäten - "Variable" - bei 5 Benzinmarken - Produkte - und m Personen. S. auch Darst. 4-9.) Diese Auffassung der anderen Dimension der Datenmatrix als Produkte, d.h. vorherige Mittelung über die Personen, ist erst jüngeren Datums; sie bietet etwa den Vorteil der unmittelbaren "Produktpositionierung". Insgesamt ergeben sich damit folgende Möglichkeiten: (1) R-Analyse: (a) Normalfall: Reduktion der bei m Personen beobachteten η Variablen (auf r Faktoren), (b) Sonderfall: Durchschnittsbildung über die m Personen für ρ Produkte, mit Reduktion der η Variablen, (2) Q-Analyse: (a) Normalfall: Reduktion der für η Variablen erfaßten m Personen (auf r Faktoren - "Personentypen"), (b) Sonderfall: Durchschnittsbildung über die m Personen für ρ Produkte und "Faktorisierung" in Richtung auf diese. Im letzteren Falle erhält man eine Art "Produkt-Typen"; allerdings ist die Interpretation nicht einfach. S. dazu auch A 12-1 und -2. Inhaltlich lassen sich auch noch weitere Dimensionen denken: Zeit (T) und Situation (S); man gelangt dann zur S- und T-Technik. S. dazu - und zur Q-Technik - auch HOFSTÄTTER/WENDT 1974, S. 234f. (mit Wiedergabe der Abbildung und des Kommentars dazu auch bei HÜTTNER 1979).

2. Im Laufe der Zeit haben sich verschiedene Modelle der Faktorenanalyse entwickelt. Ihre Zweckmäßigkeit und Bedeutung sind z.T. stark umstritten; das wirkt sich bis in die - unterschiedliche - Terminologie aus. In den folgenden Unterabschnitten werden nur zwei davon - die wichtigsten weiter behandelt. (Ein drittes wird nachstehend noch kurz erwähnt.) Das hier so genannte Hauptkomponentenmodell beruht auf der Methode der Hauptkomponenten ("principal components"). Dabei tritt an die Stelle des Satzes der bisherigen Variablen (bei der normalen R-Ana-

Kapitel 12 Methoden der Interdependenzanalyse

299

lyse, auf die im folgenden zunächst allein abgestellt wird) nur ein neuer, eben der "Faktoren". Die gegebenen Variablen ζ (also in standardisierter Form) werden gedacht als Linearkombination der neuen - unkorrelierten - Komponenten f. Die die Transformation bewirkenden Koeffizienten a heißen Faktorenladungen ("factor loadings"). Formal (mit, wie bisher, j für die η Variablen): zj - ajifi + aj2Í2 + - + aj r f r

(12.1a)

Bezieht man auch noch die einzelnen Elemente i ein und bezeichnet die Ausprägung der jeweiligen Faktoren auf ihnen als Faktorenwerte ("factor scores"), so gelangt man zur Λ/rfínzenschreibweise: Z' = AF·

(12.1b)

(S. dazu A 12-3 bis -5.) Zum "Modell" im Sinne der Faktorenanalyse wird die Methode erst, wenn eine Reduktion auf weniger Faktoren als ursprüngliche Variablen erfolgt: r < n . Die Multiplikation der Matrix der Faktorenladungen mit der der Faktorenwerte reproduziert also in diesem Falle nicht mehr die Matrix der standardisierten Beobachtungswerte. (S. dazu unten - vgl. auch A 12-6.) Das "Faktorenmodell" geht dagegen von vornherein davon aus, daß die gemeinsamen ("common") Faktoren nur einen Teil der gesamten Varianz erklären; der unerklärte Rest entfällt auf "Einzelresdsktoren" ("unique factors"): zj = ajifi + aj2f2 + - + aj r f r + I b j U j

(12.2a)

(wie oben, aber mit r < η und bj der Ladung der unique factors uj) In Matrizenschreibweise: Ζ' = AF' + BU'

(12.2b)

Der letzte Ausdruck wird in der Regel vernachlässigt (bzw. ergibt sich als Komplement); im Vordergrund steht die Gewinnung der - hier: "gemeinsamen" - Faktoren. Die Extraktion dieser (s. dazu unten) erfolgt nun aber sowohl beim "Hauptkomponenten-" als auch beim "Faktorenmodell" so, daß sie orthogonal, d.h. statistisch voneinander unabhängig sind. Dann gilt das sog. Fundamentaltheorem der Faktorenanalyse·. R = AA·

(12.3)

300

Teil III Methoden der Datenanalyse in der Marktforschung

Das bedeutet, daß die Matrix der Faktorenladungen, multipliziert mit ihrer Transpose, die ursprüngliche Korrelationsmatrix reproduziert. Im Falle der expliziten Berücksichtigung von "Einzelrestfaktoren" kann damit die Hauptdiagonale nicht, wie bei einer normalen Korrelationsmatrix, gleich 1 sein. Vielmehr ergibt sich ein niedrigerer Wert; er wird als "Kommunalität" h bezeichnet. Formal ist hj 2 definiert als Summe der quadrierten Faktorenladungen einer Variablen (über alle Faktoren). Eine solche "reduzierte Korrelationsmatrix" sollte entsprechend Rh geschrieben werden. (Die obige Gleichung hat also im Grunde die Form: R - U = AA'!) Letztlich bedeutet dies, daß praktisch die beiden Modelle sich dadurch unterscheiden, ob in der Ausgangs-Korrelationsmatrix 1 in der Hauptdiagonale steht oder nicht. Ein drittes Modell, die Image-Analyse, sei hier nur kurz erwähnt. Dieses auf GUTTMAN ( 1 9 5 3 ) zurückgehende Verfahren beruht darauf, daß eine Aufspaltung jeder Variablen in 2 Teile erfolgt: Der erste, eben das "Image", beinhaltet den, der völlig durch die anderen Variablen bestimmt wird (und durch multiple Regression berechnet werden kann); der Rest das "Anti-Image" - ist der von der anderen Variable unabhängige Teil. Im weiteren Verlauf werden dann nur die "Image"-Werte weiter verarbeitet. Insofern basiert das Verfahren einerseits durchaus auf dem Faktorenmodell. Der Unterschied liegt darin, daß die aus den "Images" resultierenden Kommunalitäten zugrunde gelegt werden. Es kann deshalb andererseits zusammen mit dem Modell der Hauptkomponenten gerade dem "Faktorenmodell" gegenübergestellt werden: "Images und Hauptkomponenten lassen sich immer berechnen, sie sind Transformationen der Daten." (REVENSTORF 1 9 8 0 , S . 7 1 . )

Beim Faktorenmodell können durchaus verschiedene Methoden zur Extraktion der Faktoren herangezogen werden. Weit verbreitet ist allerdings auch hierbei die Anwendung der Hauptkomponentenmethode; darauf wird unten noch eingegangen.

3. Im nächsten Unterabschnitt werden nur das Hauptkomponenten- und das Faktorenmodell weiter behandelt. Auch dafür sind einige Voraussetzungen zu erwähnen: Multivariate Normalverteilung erscheint letztlich nur für wahrscheinlichkeitstheoretische Tests unverzichtbar; ähnlich gilt inhaltlich das Vorliegen einer Zufalls-Stichprobe zwar in jedem Falle als wünschenswert, als zwingend dagegen nur bei konfirmatorischer Interpretation (s. unten). Vorausgesetzt ist, wie aus den Formeln ersichtlich, lineare Additivität (die Beziehungen der Variablen sind linear, die Faktoren wirken additiv zusammen - es existiert jedoch auch das Konzept einer

Kapitel 12 Methoden der Interdependenzanalyse

301

"nicht-linearen Faktorenanalyse"); die Daten sind metrisch. Im strengen Sinne würde letzteres bedeuten, daß die Korrelationsmatrix, die ja, wie wiederholt betont, den Ausgangspunkt der Berechnungen bildet, nur Bravais-Pearson'sche Korrelationskoeffizienten enthält. (Jedoch könnte man auch mit anderen Korrelations- oder Assoziationskoeffizienten - als formal "metrischen" Maßen - Faktorenanalysen durchführen.) 4. Die Faktorenanalyse, wie sie hier dargestellt wird, kann im Grunde nur explorativen Charakter haben, der Gewinnung von Hypothesen dienen. In jüngerer Zeit ist jedoch die Idee der konfirmatorischen Faktorenanalyse stark in den Vordergrund getreten. Sie unterscheidet sich von der erstgenannten letztlich nur dadurch, daß Hypothesen über die "Faktorenstruktur", d.h. die Anzahl der Faktoren und ihre Beziehungen sowohl untereinander als auch mit den gegebenen Variablen, formuliert und überprüft werden. S. dazu in Kap. 13, "Kovarianzstrukturanalyse".

12.1.2 Der Ablauf im einzelnen Im allgemeinen Falle kann man vier Ablauf-Schritte der "eigentlichen" Faktorenanalyse (also abgesehen von der meist - erforderlichen - "Vorbehandlung" der Daten, in bezug auf das Problem der Ausreißer, fehlenden Werte usw.!) unterscheiden: (1) Kommunalitätenschätzung, (2) Faktorenextraktion, (3) Faktorenrotation, (4) Berechnung von Faktorenwerten.

12.1.2.1 Kommunalitätenschätzung Das Problem der Kommunalitätenschätzung ergibt sich, wie dargelegt, überhaupt nur dann, wenn vom "Faktorenmodell" ausgegangen wird. Die ansonsten für die Hauptdiagonale der Korrelationsmatrix anzunehmende 1 (die Korrelation einer Variablen mit sich selbst) ist dann durch andere Werte zu ersetzen. Allein dafür gibt es eine ganze Reihe von Verfahren. Wichtig davon sind einerseits die Wahl des (absolut) höchsten Koeffizienten in der betreffenden Zeile oder andererseits die Verwendung

302

Teil III Methoden der Datenanalyse in der Marktforschung

des multiplen Bestimmtheitsmaßes der jeweiligen Variablen in bezug auf alle anderen. Hinsichtlich solcherart geschätzter Werte können dann auch - heute vielfach benutzt! - iterative Verfahren angewandt werden: Die Faktorenextraktion beginnt mit den geschätzten Kommunalitäten in der Hauptdiagonalen. Wie dargelegt, ergeben sich - via "Fundamentaltheorem" - aus den Faktorenladungen neue Kommunalitätenschätzungen. Es beginnt ein weiterer Iterationszyklus, mit Einsatz dieser in die ursprüngliche Korrelationsmatrix, usw. Die Iteration endet, wenn entweder eine vorher festgelegte Zahl von Schritten vollzogen ist oder die Differenz zwischen ursprünglichen und resultierenden Kommunalitäten eine bestimmte Größe nicht übersteigt.

12.1.2.2 Faktorenextraktion Die Faktorenextraktion bildet den eigentlichen rechnerischen Kern der Faktorenanalyse (da ja, wie mehrfach erwähnt, die Kommunalitätenschätzung bei Verwendung des "Hauptkomponentenmodells" entfällt). Sie ist aufwendig und erfordert den Einsatz von Computern. Die gängigen Datenanalyseprogramme enthalten entsprechende Routinen, so daß auf die Durchrechnung eines Beispiels hier verzichtet werden kann. (S. dazu etwa, „per Hand", HÜTTNER 1979, mittels NCSS HÜTTER/SCHWARTING 2000.) Nur der Rechengang sei kurz skizziert: Ausgangspunkt ist, wie erwähnt, die Korrelationsmatrix R. Da, wie ebenfalls bereits erwähnt, orthogonale Faktoren so extrahiert werden sollen, daß die von ihnen jeweils erklärte Varianz maximiert wird, handelt es sich um die Maximierung einer Funktion unter Nebenbedingungen. Im Wege der Differentialrechnung unter Verwendung der Lagrange-Multiplikatoren 1¡ resultiert dann das klassische "Eigenwertproblem", mit der "charakteristischen Gleichung": I R - λ il = o den Eigen vektoren für die einzelnen Eigen werte·. Rv = λν

(12.4) (12.5)

und endlich der kompletten Eigenstruktur·. RV = VL

(12.6)

Die Koeffizientenmatrix V sagt jedoch inhaltlich wenig aus; es interessieren vielmehr die Korrelationen der extrahierten Faktoren mit den ur-

Kapitel 12 Methoden der Interdependenzanalyse

303

sprünglichen Variablen, die - wie erwähnt - "Faktorenladungen". Ihre Matrix A ergibt sich durch Multiplikation von V mit den Quadratwurzeln der Eigenwerte: A

-

VIL/2

(12.7)

Das eigentliche - inhaltliche - Problem dabei stellt dar, wie viele Faktoren aus den ursprünglich gleichviel Hauptkomponenten wie Variablen - "beizubehalten" sind. In der Praxis verwendet man dafür meist Faustregeln. Die verbreitetste davon ist (zum sog. Scree-Test - mit Abbildung - vgl. BACKHAUS et. al. 1 9 9 6 , S. 2 2 7 ) das sog. Kaiser-Kriterium: Es sind nur so lange Faktoren zu extrahieren, wie deren Eigenwerte > 1 sind. Das leuchtet unmittelbar ein: Durch die Standardisierung ist die Varianz einer Variablen 1; ein "Faktor", der gerade nur so viel bzw. sogar weniger als die ursprüngliche Variable zur Varianzerklärung beiträgt, hat also wenig Berechtigung. Die folgenden Beispiele zeigen die Bedeutung, aber auch die Implikationen dieses Vorgehens: Beispiel 12-2 In dem wiederholt erwähnten, vom Verf. federführend betreuten Projekt erfolgte die Auswertung der Frage nach den "Eigenschaften von Benzinmarken" (s. Beisp. 4-40) auch so, daß der Durchschnitt über alle Personen für jede Polarität und Marke gebildet wurde; damit entsteht eine Datenmatrix, die in den Zeilen die 7 Variablen, in den Spalten die 5 Produkte enthält. (Q-Analyse: "Faktorisierung" in Richtung auf die Produkte.) Die - vollständige - Hauptkomponentenanalyse erbrachte also zunächst auch 5 Faktoren. Davon hatte der erste einen Eigenwert von rund 3,2 und erklärte 63,8% der Varianz. Der Eigenwert der zweiten betrug immer noch 1,7 mit 34,8% Varianzerklärung. Der dritte Faktor hatte nur noch einen Eigenwert von 0,06 und 1,1% Varianzerklärung. Damit war das Ergebnis eindeutig: Die Eigenwerte fallen steil ab und sind beim dritten Faktor bedeutungslos; die ersten beiden "erklären" allein 98,6% der Varianz. Der weiteren Analyse sind also nur diese zugrunde zu legen. Anders ausgedrückt: Die Produkte können im zweidimensionalen Raum dargestellt werden. Beispiel 12-3 Für eine bestimmte Benzinmarke ergab sich für die ersten beiden Faktoren: Eigenwert 1,9 und 1,6, Varianzerklärung 27,0 und 22,3. Die nächsten beiden Faktoren hatten jeweils einen Eigenwert von knapp unter 1 (bei der hier angewandten Rundung auf eine Dezimale genau 1); auch ihre Varianzerklärung war, mit 14,2 und 13,6%, noch beachtlich. (Selbst die - hier letzte - Polarität 7 "erklärte" noch rd. 6%!) Das Ergebnis ist also viel weniger eindeutig: Die ersten beiden Faktoren haben zusammen nur eine Varianzerklärung von 49,3%; die weiteren Eigenwerte sind noch relativ hoch und liefern beträchtliche Erklärungsbeiträge. Die schematische Anwendung obiger Regel ist also problematisch. Das wird noch dadurch unterstrichen, daß bei einer anderen Behandlung des - in der Praxis wichtigen! - Problems "fehlender Werte" sich die Zahl der extrahierten Faktoren auf 4 erhöht. Al-

304

Teil III Methoden der Datenanalyse in der Marktforschung

lerdings lagen die beiden zusätzlichen nur geringfügig über der Grenze von 1; das ändert jedoch nichts daran, daß im Ergebnis nunmehr eine vierdimensionale Lösung resultiert!

Die Faktorenextraktion liefert im allgemeinen einen Satz von neuen Variablen (oder "Variaten"), eben die Faktoren, die formal statistisch voneinander unabhängig - "orthogonal" -, inhaltlich aber unbestimmt sind. Es bedarf also der Interpretation. Diese wird jedoch dadurch erschwert, daß zumeist die extrahierten Faktoren im Grunde arbiträr, willkürlich sind: Sie können ohne Verstoß gegen die mathematisch-statistischen Grundlagen in andere transformiert werden. Diese Transformation in eine Lösung, welche die Interpretation erleichtert, ist Aufgabe der Faktorenrotation:

12.1.2.3 Faktorenrotation Das grundlegende Prinzip hat Thurstone beschrieben: die Einfachstruktur. (Er hat auch eine Reihe von Kriterien für das Vorliegen einer solchen angegeben - z.B., daß jede Zeile der Faktor[ladungs]matrix mindestens eine 0 haben muß.) Es läuft darauf hinaus, daß durch Drehung der Koordinatenachsen die Koordinatenwerte der Variablenpunkte - im zweidimensionalen Falle - nahe an eben diese Achsen gebracht werden. Mit anderen Worten und allgemeiner: Die "Ladungsstruktur" soll so aussehen, daß die Ladungen einzelner Variabler auf einem Faktor möglichst hoch, auf den anderen dagegen möglichst niedrig sind. Dadurch werden im Ergebnis die Faktoren durch einige wenige Variablen "beschrieben" und damit interpretierbar. Damit ist schon gesagt, daß die Rotation zunächst visuell (oder "geometrisch") geschehen kann: Aufgrund der Inspektion des Punkteschwarms wird eine Rotation vorgenommen; zeigt sich, daß die "Einfachstruktur" noch nicht hinreichend gegeben ist, die Punkte also noch nicht nahe genug an den Koordinatenachsen liegen, muß eine weitere Rotation erfolgen, usw. Heute geschieht diese Rotation im allgemeinen auf analytischem Wege. Umstritten ist jedoch der dabei anzuwendende Algorithmus. Dies gilt noch stärker für die grundsätzliche Frage, ob die ursprünglich orthogonalen Faktoren beibehalten werden sollen, also eine rechtwinklige Rotation

Kapitel 12 Methoden der Interdependenzanalyse

305

erfolgt, oder das Konzept der "Einfachstruktur" erfordert, sie ohne Rücksicht auf die Unabhängigkeit der Faktoren anzustreben, also gegebenenfalls eine sc^ze/winklige Rotation vorzunehmen. Die Entscheidung für eine schiefwinklige - oblique - Rotation wird dadurch erschwert, daß nicht nur, wie dies auch bei der orthogonalen Rotation der Fall ist, eine ganze Reihe verschiedener Lösungsansätze (z.B.: Oblimax, Oblimin usw.) vorliegt, sondern auch innerhalb eines Ansatzes diverse Lösungen möglich sind. Für die schiefwinklige Rotation spricht, daß eigentlich kaum Anhaltspunkte dafür vorliegen, daß das "wirkliche Leben" tatsächlich "orthogonal" ist. Gegen sie ist anzuführen, daß damit "der Willkür zusätzlich noch Tür und Tor" geöffnet wird (TSCHOPP 1991). Auch hat man es mit zusätzlichen Matrizen zu tun: Neben die bereits bekannte Matrix A (jetzt: Faktorenmuster - "factor pattern") tritt die Matrix S der Faktoren5irw&f«r ("factor structure"); sie ergibt sich aus ersterer durch deren Nachmultiplikation mit der Matrix C, der Interkorrelation der Faktoren ("factor correlation"): A C - S.

Für die rechtwinklige - orthogonale - Rotation gibt es, wie erwähnt, ebenfalls verschiedene Algorithmen. Die wohl bekanntesten sind: 1. Quartimax: Hierbei wird eine "Vereinfachung" - im Sinne von Thurstone - der Zeilen (einer Matrix, bei der die Variablen in den Zeilen, die Faktoren in den Spalten stehen) angestrebt. Das bedeutet, daß im Extrem jede Variable nur auf einem Faktor lädt. Die Konsequenz ist im allgemeinen, daß der erste Faktor eher einen "Generalfaktor" - mit mehreren hohen Variablen-Ladungen - darstellt, die weiteren dagegen nur Untergruppen von Variablen oder eben nur jeweils eine davon enthalten. 2. Varimax: Im Gegensatz zur Quartimax zielt die Varimax-Rotation auf die "Vereinfachung" der Spalten. Wegen dieser Vereinfachung der Spalten und damit der Faktoren - in Richtung auf 1 oder 0 - wird im allgemeinen eine deutlichere Ladungsstruktur erreicht und damit die Interpretation erleichtert. 3. Equamax: Wie schon der Name sagt, stellt diese Methode den Versuch eines Kompromisses zwischen Quartimax und Varimax dar: Die Ausrichtung erfolgt nicht auf entweder die Zeilen oder die Spalten, sondern gleichermaßen auf beides. Erfahrungen auch des Verf. zeigen, daß die Unterschiede im allgemeinen gering sind. Das gilt selbst bei Einbezug der Oblimin-Rotation, zumin-

306

Teil III Methoden der Datenanalyse in der Marktforschung

dest der "gemäßigt-schiefwinkligen", und ebenfalls für die Kombination mit den verschiedenen Extraktionsmethoden. Für die Praxis der Marktforschung kann deshalb, unter Bezugnahme auf KAISER ( 1 9 7 0 ; hier ist ein sehr viel komplizierteres "Second Generation Little Jiffy" vorgeschlagen) folgendes Vorgehen empfohlen werden: (unter Bei1. Faktorenextraktion nach dem Hauptkomponentenmodell behalten von "Faktoren" mit Eigenwerten > 1),

1. Varimax-Rotation.

Mit der Extraktion und Rotation der Faktoren endete früher zumeist der Rechengang; es folgte "nur noch" die Interpretation. Sie geschah auf der Basis der Yzkxorenladungen (die ja, wie erwähnt, die Korrelaton der gewonnenen Faktoren mit den ursprünglichen Variablen angeben). Zur Benennung der Faktoren - in Raum: "Dimensionen" - wurden dazu die (positiv oder negativ!) bei einem Faktor "hoch" ladenden Variablen herangezogen. Die Entscheidung, was als "hoch" angesehen wird, erfolgt meist mehr oder weniger willkürlich bzw. mit Faustregeln. ("Gängige Praktik", wie TSCHOPP 1991, S. 5 3 , es bezeichnet, scheint in der Tat, "Variablen mit Faktorladungen > .30 zur Interpretation beizuziehen.")

12.1.2.4 Die Berechnung von Faktorenwerten Heute geht man vielfach noch einen Schritt weiter und ordnet den einzelnen Cases "Werte" (factor scores) zu. Diese resultieren, gewissermaßen in einer Drehung des ursprünglichen Problems, aus der Multiplikation der (standardisierten) Beobachtungswerte mit den gewonnenen Faktorenladungen. Formal: Lautete gemäß oben, die Ausgangsgleichung Ζ' = AF\

(12.1b)

so folgt daraus für die Faktorenwerte: F' = A-1Z·

(12.8)

Die exakte Berechnung ist aber nur möglich, wenn mittels der Hauptkomponentenmethode alle Faktoren extrahiert und beibehalten werden; nur dann existiert eine Inverse der Matrix der Faktorenladungen. Wie dargelegt, ist dies aber in der Regel nicht der Fall; es widerspräche dem Sinn der Faktorenanalyse. Dann kann nur eine Schätzung erfolgen. Dafür wurden im Laufe der Zeit mehrere Vorschläge ausgearbeitet. Via Regression kann beispielsweise eine Ermittlung wie folgt geschehen:

Kapitel 12 Methoden der Interdependenzanalyse

F' = ZB

307

(12.9)

mit Β = RIA

(12.10)

(S. dazu A 12-7.) Die Bedeutung der (explorativen) Faktorenanalyse für das Marketing läßt sich in drei große Gebiete zusammenfassen: 1. Das historisch älteste Anwendungsgebiet ist - mehr methodisch - die Reduktion der Vielzahl von Variablen auf einige wenige, diese kennzeichnende Dimensionen. Mit der Gewinnung solcher grundlegender Dimensionen und ihrer Interpretation wurde also die Aufgabe als beendet angesehen. Sachlich handelte es sich dabei z.B. um "Werthaltungen" und ihre grundsätzlichen Dimensionen, die Beseitigung von Redundanzen in Fragebogen bzw. Tests (in bezug auf die verschiedenen "Items") oder Produkteigenschaften. Hinsichtlich letzterer seien zwei Beispiele genannt: die Auswertung einer Studie über das Arzneimittel "Bactrim" (in einer vom /rc/rato£-Forschungsservice 1974 herausgegebenen Broschüre - eine 1980 erschienene Veröffentlichung, aber mit anderen Beispielen, wurde im Vorwort als „Nachfolger eines wissenschaftlichen Bestsellers" bezeichnet -; s. auch das ausführliche Referat bei H Ü T T N E R 1 9 7 8 ) und eine empirische Studie für Butter und Kaffee (WEINBERG 1 9 7 6 ; s. das Referat darüber bei HÜTTNER 1 9 7 9 ) .

2. Die Berechnung von Faktorenwerten für die einzelnen Elemente ermöglicht - ganz abgesehen von der bloßen Datenreduktion (anstelle der ursprünglichen Variablenwerte) - deren Positionierung im Raum. Damit wird auch ihre Verteilung bzw. "Zusammenballung" deutlich. Statt dieser mehr nur visuellen Darstellung kann ein weiteres analytisches Vorgehen erfolgen: die Zusammenfassung aufgrund der Faktorenwert-Ausprägungen zu Gruppen mittels der Clusteranalyse. Insofern wird die Faktorenanalyse zur Vorstufe - wie auch schon in Beispiel 11-11 bei AID - für weitere Analysen: Der Einsatz multivariater Verfahren erfolgt im Verbund. Ein weiteres Beispiel, mit der Anwendung mehrerer multivariater Verfahren "im Verbund", bildet der Bericht von ZENTES/ANDERER ( 1 9 9 6 ) über eine ausführliche Untersuchung bezüglich des Managements der Internationalisierung europäischer Handelsunternehmen. Aufgrund der Befragung von 60 Topmanagern wurde hinsichtlich der strategischen Grundorientierung zunächst eine Clusteranalyse (s. dazu im 3. Hauptabschnitt dieses Kapitels) durchgeführt, die 4 Gruppen erbrachte: "Kostenführer", "Qualitätsführer", "(unprofilierte) Mitte" und "Outpace". Da in bezug auf die Entsheidungsaspekte ("Logistikentscheidungen", "Auswahl der Lieferanten" etc.) aufgrund einer Korrelationsznzlyse eine Verdichtung der Entschei-

308

Teil III Methoden der Datenanalyse in der Marktforschung

dungsvariablen mittels der Faktorenanaiyse angezeigt erschien und die 2-FaktorLösung eine Einteilung in "Primäraktivitäten" und "flankierende Maßnahmen" bestätigte, wurde anschließend eine Varianzanalyse vorgenommen. Sie "ergab signifikante Autonomieunterschiede hinsichtlich der Primäraktivitäten. So weisen Kostenführer wesentlich höhere Zentralisierungsgrade ihrer Primäraktivitäten im Vergleich zu allen übrigen Clustern auf. Das größte Ausmaß an Dezentralisierung zeigt das Outpace-Cluster" (ebenda, S. 88). - Auch Diskriminanzamly sen waren durchgeführt worden, auf der Grundlage der jeweiligen Splits (der 4 Strategie-Cluster) in "well" und "weak performer". Damit wurde "untersucht, in welchen Bereichen und mit welchen Intensitäten bzw. Ausprägungen verschiedener Instrumente sich erfolgreiche von weniger erfolgreichen Unternehmen differenzieren lassen" (ebenda, S. 101).

3. Es ist ein altes Ziel, Produkte in einem "Marktmodell" darstellen zu können. Empirisch ist dies möglich geworden mittels multivariater Verfahren: zuerst mit der Diskriminanzanalyse, heute vielfach mittels der Multidimensionalen Skalierung. Die Faktorenanalyse ermöglicht eine solche "Produktpositionierung" ebenfalls: über die Produkte. Wie oben angedeutet, kann dies sogar auf zwei Wegen geschehen: in einer normalen R-Analyse, indem zunächst über die Personen gemittelt wird; damit verbleiben Produkte - als Elemente - und Variablen; die "Faktorisierung" letzterer ergibt die zugrunde liegenden Dimensionen; über die Faktorenwerte können die Produkte dann in diesen Dimensionen dargestellt werden. (Ein Beispiel hierfür bringen, in großer Ausführlichkeit und Anschaulichkeit, BACKHAUS et. al. 2 0 0 0 . ) Die zweite Vorgehensweise ist von HÜTTNER 1979 herangezogen worden: Als Sonderfall der Q-Analyse wird, nach ebenfalls Mittelung über die Personen, direkt in Richtung auf die Produkte faktorisiert. Wegen dieser Faktorisierungsrichtung - die Korrelationsmatrix enthält nun die Beziehungen zwischen Produkten - ergibt sich unmittelbar, ohne die Schätzung von Faktorenwerten, eine "Produktpositionierung". Allerdings ist hier die Interpretation schwieriger; über die Positionierung der Variablen mittels der Faktorenwerte können jedoch zusätzliche Anhaltspunkte dafür gewonnen werden. Beispiel 12-4 1. Im Beispiel d. Verf. ging es um die Positionierung von 5 Benzinmarken (im zweidimensionalen Raum). 2 . B Ö H L E R gibt für 4 Haushaltsreiniger eine Darstellung (gemäß 1 2 - 2 ) im dreidimensionalen Raum:

309

Kapitel 12 Methoden der Interdependenzanalyse

1 Sympathie/ Seriosität

/

ψ Der General

/

Oberflächenschonung/ Pflege/Glanz Dar st. 12-2: Positionierungsmodell für Produkte des Haushaltsreinigermarktes (modifiziert nach BÖHLER 1977, S.236)

12.2 Multidimensionale Skalierung 12.2.1 Begriff und Arten Der Begriff der multi- (oder mehrdimensionalen Skalierung ist nicht leicht zu fassen. Ganz allgemein kann man darunter eine Gruppe von Verfahren verstehen, die aufgrund der - wahrgenommenen oder beurteilten - Relationen zwischen den Objekten diese, unter Einschluß eventuell auch der individuellen Präferenzen bzw. von "Idealobjekten", in einem Raum möglichst geringer Dimensionalität zu "positionieren" versuchen. Eine solche räumliche Darstellung von Objekten ist zwar, wie erwähnt, auch mittels der Diskriminanzanalyse und der Faktorenanalyse möglich. Dabei mußten aber - mehr oder weniger - detaillierte Daten über Eigenschaften der Objekte vorliegen: Profildaten, im Sinne einer Einteilung v o n SHEPARD ( 1 9 7 2 ) .

310

Teil III Methoden der Datenanalyse in der Marktforschung

Es hatte also eine Präspezifizierung der Variablen zu erfolgen. Das bedingt nicht nur die Gefahr der "Präformierung" der Probanden, sondern auch die, daß wichtige Eigenschaften vergessen werden. (Der Einschluß redundanter Eigenschaften ist dagegen weniger problematisch: Das Ziel der Faktorenanalyse ist ja gerade die Zurückführung auf einige wenige Dimensionen.)

Eine grundsätzlich andere Vorgehensweise besteht darin, die Befragten nur um Globaluñeiie über das Verhältnis der Objekte zueinander bitten. Die beiden grundlegenden Relationen, in denen "Stimuli" abgebildet werden können, sind nun Dominanz und Konsonanz. Bei letzterer geht es um die Übereinstimmung·. A entspricht Β oder nicht (Α = Β oder Α Φ Β), bei ersterer darum, ob Β von A "dominiert" wird oder umgekehrt (A > Β oder Α < Β). In sachlicher Hinsicht können nun diese Beziehungen eingesetzt werden zur Messung von Präferenzen oder Proximitäten. Damit sind auch schon die verschiedenen Arten der Multidimensionalen Skalierung (MDS) angesprochen: 1. Im Sinne der eben vorgenommenen Einteilung kann man unterscheiden zwischen Skalierung von Präferenzdaten und Skalierung von Proximitätsdaten (oder "Ahnlichkeitsdaten" - mitunter wird auch nur kurz von "Ahnlichkeitsskalierung" gesprochen.) Darauf wird in den folgenden Abschnitten näher eingegangen. 2. Die vorliegenden Daten können - insbesondere bei der Ahnlichkeitsskalierung - metrisch oder nichtmetrisch sein. Der große Vorteil späterer Entwicklungen lag aber gerade darin, daß allein aufgrund von Rangordnungen, also nichtmetrischer Daten, eine MDS-Lösung gefunden werden kann. Bisweilen wird deshalb sogar nur von NMDS gesprochen. Abgestellt ist dabei nur auf den Input; der Output wird immer "metrisch". Verfahren, bei denen auch der Output lediglich nichtmetrisch ist ("fully nonmetric methods"), haben demgegenüber keine größere Bedeutung erlangt.

3. Wie dargelegt, entspricht es gerade dem Wesen der MDS, nur direkt nach entweder der Ähnlichkeit oder der Präferenz zu fragen. Es ist jedoch auch möglich, aus vorliegenden Profildaten abgeleitete Ahnlichkeitsoder Präferenzdaten zu ermitteln und damit die Skalierung vorzunehmen. (S. zur Datenerhebung auch noch unten.) 4. Bisher wurde im Grunde auf - über die befragten Personen - aggregierende Verfahren abgestellt. Damit entstehen zunächst meßtechnische Probleme: Soll z.B. beim Vorliegen nur von Rangordnungen, im Sinne

Kapitel 12

Methoden der Interdependenzanalyse

311

der nichtmetrischen MDS, über die Personen gemittelt, also ein - metrischer - "Durchschnittsrang" gebildet und als Input verwandt werden? (Dieser wäre dann metrisch, ließe sich aber wieder in eine - nichtmetrische - Rangordnung der "Durchschnittsränge" zurückverwandeln. Andererseits könnten bei Verwendung von Rating-Skalen unmittelbar die "metrisierten" Daten eingegeben werden. S. dazu und zu mehreren Ergebnisvarianten auch HÜTTNER 1 9 7 9 . ) Bei Aggregation gehen die individuellen "Sichtweisen" usw. verloren. Andererseits wäre eine Skalierung getrennt für jede einzelne Person auch nicht sinnvoll. Nicht-aggregierende MDS-Verfahren versuchen einen Mittelweg, z.B. über die Bildung von "Personengewichten". 5. Speziell bei der Präferenzskalierung geht es darum, die beurteilten Objekte und die sie beurteilenden Personen in Gestalt ihrer die Präferenzstruktur bestimmenden "Idealvorstellungen" (als "Idealpunkte" oder als "-vektoren") gemeinsam abzubilden. Wird dieser "joint space" in einem Zuge erstellt, spricht man von interner Skalierung. Demgegenüber setzt die externe Skalierung die Konfiguration der Objekte voraus; in diese hinein erfolgt die Projizierung der Personen. Der in einem Zuge erstellte "joint space" beinhaltet dann sowohl "Wahrnehmungen" als auch "Bewertungen": E r besteht zugleich aus dem perceptual und dem evaluative space. Das bedeutet, daß Wahrnehmungs- von Bewertungsurteilen nicht zu trennen sind; beide werden miteinander vermengt. Diesem Nachteil steht allerdings als Vorteil gegenüber, daß die Skalierung nach den gleichem Verfahren erfolgt, die aus der Anwendung verschiedener MDS-Algorithmen resultierenden Unterschiede also vermieden werden.

12.2.2

Die Skalierung von Ähnlichkeitsdaten

Die Ähnlichkeitsskalierung ist die grundlegende Form der MDS. (Die Skalierung von Präferenzdaten kann auch als lediglich eine Variante davon angesehen werden.) Deshalb soll hier zunächst das grundsätzliche Vorgehen skizziert werden: Ausgangspunkt sind Proximitätsdaten. Diese "proximities" sind entweder "similarities" oder "dissimilarities". Erstere bezeichnen die Ähnlichkeit, letztere die Unähnlichkeit. Diese wiederum ist Ausdruck der "psycholo-

312

Teil III Methoden der Datenanalyse in der Marktforschung

gischen Distanz": je unähnlicher zwei Stimuli, desto größer die Entfernung zwischen ihnen. Die in der Psychologie schon länger bekannten Verfahren zur metrischen MDS - sie stellen gewissermaßen das "klassische" Vorgehen dar (TORGERSON 1952) - setzen nun, in einem DistanzmoAêX, einen expliziten funktionellen Zusammenhang zur Transformationen der Proximitäten in Distanzen voraus; das ermöglicht die Anwendung der (linearen) Regression. Der - von SHEPARD (1962) formulierte - Grundgedanke der nichtmetrischen MDS besteht demgegenüber darin, eine bloß monotone Beziehung ("monotone Regression") anzunehmen: Die Rangordnungen der eingegebenen und der generierten Distanzen sollen einander entsprechen, d.h. die am ähnlichsten empfundenen Objekte auch die kürzeste Distanz aufweisen usw. Es finden so lange Iterationen statt, bis die Differenz zwischen beiden hinreichend klein, der Monotoniebedingung also im ausreichenden Maße Genüge getan ist. Ausgangspunkt sind also in jedem Falle Proximitätsschätzungen. Für η Objekte können diese in einer η χ η-Matrix dargestellt (und, wegen ihrer Symmetrie, eventuell auch nur als Dreiecksmatrix eingegeben) werden. Bei der nichtmetrischen MDS genügt eine "Ahnlichkeits-/?«rkriterium. Sie stellen im Grunde nur Ableitungen bzw. Erweiterungen des Varianzkriteriums dar.

Im einzelnen sind durchaus verschiedene Algorithmen möglich. Im Prinzip reduzieren sich diese aber auf zwei große Gruppen: 1. Man kann, nach der Generierung der Anfangspartition, die Zentren der so entstehenden Cluster berechnen und aufgrund dessen die Verschiebung der einzelnen Elemente in die Gruppe vornehmen, zu dessen Zentrum sie die geringste Distanz aufweisen. Der Abbruch erfolgt - vom (seltenen) Fall der periodischen Reproduktion der Gruppierung abgesehen - bei Gleichheit zweier aufeinanderfolgender Partitionen. STEINHAUSEN/LANGER (1977) bezeichnen dieses Vorgehen treffend als Minimaldistanzverfahren. Hierzu ist auch die bekannte k-means-Technik zu zählen. Deren Besonderheit besteht im wesentlichen darin, daß nach jeder Neuzuordnung das Zentrum der veränderten Gruppe neu berechnet wird (mit Konsequenzen also für die Zuordnung weiterer Elemente, damit aber auch der Abhängigkeit von der Reihenfolge der Verarbeitung!).

2. Im Unterschied hierzu verwendet das sog. hill climbing-Verfahren direkt die Verbesserung des Gütekriteriums: Nach der Generierung der Anfangspartition und der Berechnung der Gruppenzentren wird für jedes Element geprüft, ob sich das Kriterium durch dessen Verschiebung verbessert. Diese erfolgt in die Gruppe mit der größten Verbesserung, danach Neuberechnung des Gruppenzentrums usw. Damit ist auch dieses Verfahren von der Reihenfolge der Verarbeitung der Elemente abhängig. Der Abbruch erfolgt, wenn keine Verbesserung des Kriteriums mehr erreichbar ist.

12.3.4

Die Cluster-"Beschreibung" (und die Kombination mit anderen Verfahren)

Der eigentliche Cluster(bildungs)prozeß, im Sinne der "Clustertechnik", endet bei hierarchischen Verfahren mit der "Endlösung", also der Zusam-

Kapitel 12 Methoden der Interdependenzanalyse

331

menfassung aller Elemente in einem einzigen Cluster bei agglomerativen Verfahren (und der Aufteilung auf lauter einzelne Elemente bei divisiven), und mit dem Abbruch des Algorithmus aufgrund von "Abbruchkriterien" bei iterativen Verfahren. Hier mußte die Clusteranzahl vorgegeben werden; wie dargelegt, ist es jedoch zweckmäßig, verschiedene Lösungen durchzurechnen und sich dann für die "brauchbarste" zu entscheiden. Bei hierarchischen Verfahren entstehen von vornherein verschiedene Lösungen. Insofern existiert das Problem der "beizubehaltenden" Clusteranzahl praktisch in jedem Falle. Für die "Brauchbarkeit" einer Lösung spielen nun aber nicht nur die oben angeführten Aspekte eine Rolle (wie die Veränderung des Gütekriteriums), sondern auch die "Beschreibbarkeit" der Cluster. Dies gilt in doppelter Hinsicht: einmal in bezug auf ihre inhaltliche Interpretation, zum anderen für die Identifikation - insbesondere bei aus den gewonnenen Informationen abzuleitenden Marketingentscheidungen, etwa in Hinblick auf eine "Marktsegmentierungsstrategie" - der den Clustern zugehörigen Elemente. Insofern kann man auch (wie dies etwa Infratest tut; s. dazu nachstehend) zwischen aktiven und passiven Variablen unterscheiden: Erstere sind die, aufgrund derer der Clusterbildungsprozeß erfolgt; sie genügen eventuell zwar noch einer inhaltlichen Interpretation der gefundenen Cluster, meist jedoch nicht mehr einer - an "äußere", meist soziodemographische Merkmale anknüpfenden - Identifikation, im Sinne der Adressierung absatzpolitscher Maßnahmen. Beispiel 12-17 In der erwähnten, vom /n/n»íe5í-Forschungsservice 1974 herausgegebenen Broschüre ("Zur Einführung in die multivariate Datenanalyse") wurden als aktive Variablen 17 Eigenschaftszuordnungen für die BACTRIM-Werbung ("modern", "medizinisch", "unseriös" usw.) anhand einer 3-Punkte-Skala ("trifft sehr zu", "trifft weniger zu", "trifft gar nicht zu") herangezogen. Daneben fanden als passive Variablen die Beurteilung verschiedener wichtiger Arzneimittel-Eigenschaften ("neuartiges Wirkungsprinzip", "breites Wirkungsspektrum" etc.), die Fachrichtung, die Niederlassungsdauer, das Geschlecht der befragten Arzte usw. Verwendung. Der - so Infratest - "Typologie"-Prozeß, d.h. speziell die Reduktion von ursprünglich 15 Typen, wurde in einem Dendrogramm dargestellt. Dabei zeigte sich, daß der Typ 4, in allen Reduktionsstufen erhalten blieb. Dieser "eigenständige" Typ 4 war, in bezug auf die aktiven Variablen, dadurch gekennzeichnet, daß bei ihm die BACTRIM-Werbung als überdurchschnittlich "unseriös", "überholt" und "aggressiv", und unterdurchschnittlich "sachlich", "informativ", "glaubwürdig" usw. eingestuft wurde, er also eine Arztegruppe mit eindeutiger Ablehnung der Werbung für BACTRIM verkörperte. Hinsichtlich der passiven Variablen ergab

332

Teil III Methoden der Datenanalyse in der Marktforschung

sich bei diesem ablehnenden Typ ein niedrigerer Wert als der Durchschnitt (auf einer 5-Punkte-Skala) etwa in bezug auf die Wichtigkeit des Arguments "breites Wirkungsspektrum". Noch deutlicher wird der Unterschied zu anderen - etwa auch den "positiv" eingestellten - Typen beim Anteil derjenigen, die den Bedarf an neuen Präparaten bejaht haben.

Beispiel 12-18 1985 hat WINDHORST, laut Untertitel, einen "Beitrag zur empirischen Analyse der Konsumrelevanz individueller Wertvorstellungen" vorgelegt. In dieser Untersuchung wurden jeweils 18 Werte (in 5er Skalen) in 4 Dimensionen: "Gegebensein heute", "dto. im kommenden Jahrzehnt", "Wichtigkeit" und "ideale Werte", abgefragt. Für die letzten beiden Werte-Dimensionen wurden Clusteranalysen durchgeführt. "Beide Segmentierungsansätze kommen dabei zu ähnlichen Gruppierungslösungen." (S. 221.) Bezüglich der "Wichtigkeit" ergeben sich 7 Cluster, für die "idealen Werte" 9. Die Beschreibung bzw. Interpretation erfolgt jeweils einerseits aufgrund der 18 Werthaltungen (als "aktive" Variable), andererseits mit "passiven" Variablen: Soziodemographika (5) und Informationsverhalten (Wichtigkeit von 9 Informationsquellen). In zusammenfassenden Ubersichten wurde jeweils das Verhältnis zum Durchschnitt markiert ( - - = "stark unterdurchschnittlich", - = "unterdurchschnittlich", 0 = "durchschnittlich", + - "überdurchschnittlich", + + = "stark überdurchschnittlich"). Letztendlich konnte so - hier nur dargestellt für die Segmente auf der Basis "idealer Werte" - folgende Charakterisierung gegeben werden (S.220): Segment 1 prestigeorientierte Intellektuelle: Traditionelle Konsumenten mit kritischem Informationsverhalten Segment 2 Wertablehner: Konsumenten mit hohem Informationsbedarf Segment 3 gesellschaftsorientierte Hedonisten: Ausgabefreudige unkritische Konsumenten Segment 4 persönlichkeitsorientierte Genießer: Konsumorientierte Verbraucher Segment 5 kulturorientierte Egozentriker: Unkritische Konsumenten ohne Genußorientierung Segment 6 familienorientierte Alternative: Kritische Konsumenten mit negativer Konsumeinstellung Segment 7 sparsame Wertablehner: Sparsame Konsumenten Segment 8 gesundheitsbewußte Sozialtypen: Konsumgegner Segment 9 Wertefans: Unkritische Konsumenten mit hohen Ausgaben im Freizeitbereich

In den vorstehenden Beispielen wurde die Clusteranalyse aufgrund der Original-Variablen, sozusagen "isoliert", vorgenommen. Die Durchführung kann jedoch auch im Verbund erfolgen. So hätte man im Falle der Werthaltungen auf die Ergebnisse der Faktorenanalyse zurückgreifen und

Kapitel 12 Methoden der Interdependenzanalyse

333

den Clusterbildungsprozeß aufgrund der Faktorenwerte v o r n e h m e n können. D e r Gruppierungsprozeß kann aber auch auf Ergebnissen der Multidimensionalen Skalierung aufbauen. Beispiel 12-19 Es soll eine Gruppierung der Verwender bzw. der Käufer von Zahnpasta aufgrund der in Beisp. 12-11 geschilderten Präferenz-Skalierung erfolgen. "Genauer: Es sollen Konsumententypen gefunden werden, die sich in ihrem Präferenzverhalten gegenüber allen fünf Produkten möglichst ähnlich sind" (REHDER 1975, S. 297). Als Daten für die Gruppierungsprozeß dienten die Distanzen des Idealproduktes zu allen 5 Marken, die aus dem dargelegten Skalierungsprozeß für die einzelnen Elemente gewonnen worden waren. Als Clustertechnik wurde das Programm AUKL (von Faber/Nollau) verwandt. Die Iteration konnte bereits nach dem zweiten Suchzyklus abgebrochen werden, da die geringen Änderungen die damit gefundene 4-Gruppen-Lösung als optimal erscheinen ließen. REHDER gelangt, nach verschiedenen Signifikanztests und Darstellung der Mitglieder der einzelnen Gruppen in dem durch den Skalierungsprozeß gewonnenen "Dimensionen-Raum", zu folgendem - auszugsweisen - Kommentar (S. 301): "Dem Ideal des ersten Verbrauchertyps kommt ... das Produkt 4 am nächsten. Es erfüllt die Wünsche dieser Gruppe am besten. Dagegen weisen die anderen vier Marken eine beträchtlich größere Distanz zum Ideal der Gruppe 1 auf. Gleichzeitig sind sie Distanzdifferenzen zwischen ihnen nur gering. Es kann deshalb vermutet werden, daß zwischen den vier Produkten in diesem Segment ein starker Wettbewerb herrscht. Er wird jedoch überlagert durch die sehr vorteilhafte Position des Produktes 4, so daß die Konkurrenz zwischen den vier Marken um das Potential dieser Gruppe nur dann durch das Konsumentenverhalten wirksam werden dürfte, wenn Produkt 1 nicht erhältlich wäre." A u s den vorstehenden Beispielen dürfte deutlich geworden sein, daß die Clusteranalyse das Instrument zur empirischen Herausarbeitung v o n "Käufertypen" und damit zur Marktsegmentierung ist. In vielen Fällen werden dabei psychographische Merkmale herangezogen, am deutlichsten w o h l in "Life-Style-Analysen", w i e in den v o n verschiedenen (Zeitschriften-) Verlagen editierten Verlagstypologien oder den für das internationale Marketing bedeutsamen "Lebensstilen". (Vgl. dazu - kurz zusammenfassend - etwa HÜTTNER/VON AHSEN/SCHWARTING 1999, S. 514f.) D i e Art der zugrunde liegenden Merkmale spielt aber natürlich im Grunde keine Rolle, w i e abschließend das folgende Beispiel zeigt. Beispiel 12-20 führt im Rahmen der Einzelhandelsforschung (s. auch unter 17.3) eine Warenkorbanalyse auf der Basis von Scannerdaten durch. Dafür nahm er auch eine Käufersegmentierung auf der Grundlage von ausschließlich quantitativen Merkmalen - Umsatz, Postenanzahl etc. - vor, mit im Ergebnis 4 Clustern FISCHER (1995)

334

Teil III Methoden der Datenanalyse in der Marktforschung

("Stammkunden der Konkurrenz", "Unentschlossene", "Fast-Stammkunden", "Alleskäufer").

Literaturhinweise Auf Literatur, die multivariate Methoden allgemein (und damit auch die in diesem Kapitel erörterten Verfahren) behandelt, ist bereits am Ende von Kap. 11 hingewiesen worden. Hier seien deshalb nur noch einige - insbesondere im Text noch nicht erwähnte - Schriften zu den EinzelVerfahren genannt: 1. zur Faktorenanalyse·. ARMINGER 1 9 7 9 , HARMAN 1 9 7 6 , REVENSTORF 1 9 7 6 ( u n d 1 9 8 0 ) , WEIBER 1 9 8 4 ;

2. zur Multidimensionalen

Skalierung:

BORG

1 9 9 7 , DAVISON 1992, GREEN/CARMONE/SMITH

1981 bzw.

BORG/GROENER

1989 u n d

SCHIFFMAN/REY-

NOLDS/YOUNG 1 9 8 1 ; 3.

zur Clusteranalyse:

ALDENDERFER/BLASHFIELD 1 9 9 5 , BACHER 1 9 9 6 , DEICH-

SEL/TRAMPISCH 1 9 8 5 , ROMESBURG 1 9 8 4 u n d SPÄTH 1 9 8 3 .

Aufgaben 12-1:

Es sei vereinbart, daß (abweichend von einem Teil der Literatur) die Dimension, in deren Richtung "faktorisiert" wird, in den Spalten der Datenmatrix steht. Gegeben seien η Variablen, m Befragte und ρ Produkte. a) Welche Größe steht in den Spalten bei der R-Analyse (1) im Normalfall, (2) im Sonderfall? b) Welche Größe steht in den Zeilen (1) im Normalfall, (2) im Sonderfall? c) Welche Größe steht in den Spalten bei der Q-Analyse (1) im Normalfall, (2) im Sonderfall? d) Welche Größe steht in den Zeilen (1) im Normalfall, (2) im Sonderfall?

Kapitel 12 Methoden der Interdependenzanalyse

335

12-2:

Welche Größen (mit den gleichen Vereinbarungen bzw. Gegebenheiten wie bei 12-1) stehen in den Zeilen und Spalten der Korrelationsmatñx a) bei der R-Analyse (1) im Normalfall, (2) im Sonderfall? b) bei der Q-Analyse (1) im Normalfall, (2) im Sonderfall?

12-3:

Wie sind (mit den gleichen Vereinbarungen bzw. Gegebenheiten wie bei 12-1) die Faktorenladungen zu interpretieren a) bei der R-Analyse (1) im Normalfall, (2) im Sonderfall? b) bei der Q-Analyse (1) im Normalfall, (2) im Sonderfall?

124:

Wie sind (mit den gleichen Vereinbarungen bzw. Gegebenheiten wie bei 12-1) die Faktorenwerte zu interpretieren a) bei der R-Analyse (1) im Normalfall, (2) im Sonderfall? b) bei der Q-Analyse (1) im Normalfall, (2) im Sonderfall?

12-5:

Geben Sie die "Dimension" der Matrizen in (12.1b) an!

12-6:

Wie sind die Dimensionen der vorgenannten Matrizen im Falle r < n?

12-7:

Geben Sie die Dimension der Matrizen in (12.9) an!

12-8:

T/F: Die Faktorenanalyse beruht auf der Schaffung eines geometrisch interpretierbaren Raumes von möglichst geringer Dimensionalität durch die Analyse einer Präferenzordnung von Variablen. T/F

336

12-9:

Teil III Methoden der Datenanalyse in der Marktforschung

Angenommen, es habe sich - für die bei 5 Objekten möglichen 10 Paare - folgende "Ähnlichkeits-Rangordnung" ergeben: AB > AD > BD > CE > DE > CD > AE > BC > AC > BE (Das Zeichen > bedeutet, daß das davorstehende Paar als ähnlicher eingeschätzt wird.) a) Stellen Sie diese Rangordnung in Matrizenform dar (mit dem Rang 1 für das Paar, das als am ähnlichsten empfunden wurde)! b) Handelt es sich hierbei um eine Matrix der "similarities" oder der "dissimilarities"? Begründen Sie Ihre Meinung!

12-10: Wie würde die Matrix der vorigen Aufgabe aussehen, wenn das Paar, dessen Objekte als am ähnlichsten eingeschätzt werden, die höchste Rangzahl erhält? Welcher Art ist diese Matrix? 12-11: Welche der laut den vorigen beiden Aufgaben aufgestellten Matrizen könnte - zumindest der Größe der darin enthaltenen Daten nach - als Distanzmztrix gedeutet werden? 12-12: Geben Sie für den in Darst. 12-3 graphisch veranschaulichten Sachverhalt die entsprechenden Formeln an! 12-13: Berechnen Sie die euklidische Distanz für die ersten beiden Elemente von Beisp. 11-5! 12-14: Wie hoch ist die Zahl der Triaden bei a)4, b)10 Stimuli? 12-15: Wie hoch ist die Zahl der Tetraden bei a)4, b)10 Stimuli? 12-16: Berechnen Sie mit den Daten von Beisp. 12-13 den "simple matching coefficient" bzw. die "total distance" und vergleichen Sie die Ergebnisse mit denen des Beispiels!

Kapitel 12 Methoden der Interdependenzanalyse

337

12-17: Gegeben sei die Datenmatrix für 2 Personen bzw. Objekte und 12 Merkmale: X = 0 0 1 1 0 1 0 0 1 1 0 0 0 1 1 1 0 1 0 0 0 1 0 1

Berechnen Sie a) si, b)s2! 12-18: Gegeben sei die Datenmatrix für 6 Objekte und 4 Merkmale: Γ0 1 1 0 Ί 0 0

x=

10

1 1 1 1

0 10

0

1 1 1 0 1 1 0 1_ Berechnen Sie die Koeffizienten a) s,, b)s 2 und stellen Sie diese jeweils in einer Ahnlichkeitsmatrix dar! 12-19: Berechnen Sie nach der in Anhang Β angegebenen Kurzformel für die Inverse einer 2 χ 2-Matrix aus den Matrizen von A 11-10 ajC1 b) S"1! 12-20: Berechnen Sie die Mahalanobis-Distanz a) für die ersten beiden Elemente von Beisp. 11-5, mit S"1 aus der vorstehenden Aufgabe, b)für die beiden Gruppen-Mittelwerte von Beisp. 11-5, mit C"1 aus der vorstehenden Aufgabe - anstelle von S"1 in (12.11) -, und vergleichen Sie das Ergebnis mit dem von Beisp. 11-7! 12-21: Gegeben sei die Datenmatrix für 6 Objekte und 2 Merkmale: -1 1 0 0 - 1 3,5 X= 2 3 2 1 4 -1 a) quadrierte euklidische Distanzen: (1) Zeigen Sie die Berechnung für die ersten beiden Elemente!

338

Teil III Methoden der Datenanalyse in der Marktforschung

(2) Berechnen Sie die gesamte Distanzmatrix, D! b) Berechnen Sie D für euklidische Distanzen! 12-22: Prüfen Sie für die Matrix D lt. Teil a) der vorstehenden Aufgabe, wie sich mittels des Verfahrens des Single Linkage das Dendrogramm gemäß Darst. 12-6 ergibt! 12-23: Wenden Sie auf die gleiche Matrix das Verfahren des Complete Linkage an und stellen Sie das Ergebnis in Gestalt des Dendrogramms dar! 12-24: T/F: Eine Gemeinsamkeit von Clusteranalyse und Diskriminanzanalyse liegt darin, daß es bei beiden um „Gruppen" geht; im Unterschied zur Diskriminanzanalyse werden diese aber bei der Clusteranalyse nicht „analysiert" (in dem Sinne, daß nach der besten Trennung durch - metrische - unabhängige Variablen gesucht wird), sondern - aufgrund von Ähnlichkeitsdaten - zunächst einmal überhaupt erst gebildet. T/F 12-25: T/F: Bei einer Faktorenanalyse genügt zur Durchführung der Berechnungen im Grunde eine Korrelationsmatrix als Dateninput. T/F

Kapitel 13 Allgemeine Ansätze In diesem Kapitel werden zwei Ansätze diskutiert, die wegen ihres allgemeinen bzw. übergreifenden Charakters nur schlecht unter die vorigen Kapitel zu subsumieren wären: das "Conjoint Measurement" (Abschnitt 1) und die Kovarianzstrukturanalyse (Abschnitt 2).

13.1

Das Conjoint Measurement

13.1.1

Begriff und Abgrenzung

Vom Verfahren her ist der Begriff des Conjoint Measurement nicht leicht zu fassen: Während etwa K I N N E A R / T A Y L O R ( 1 9 9 6 , S . 8 4 8 ) es ausdrücklich als "dependence method of multivariate data analysis" kennzeichnen, handelt es sich nach BÖCKER ( 1 9 8 4 / 5 , S . 3 5 ) überhaupt nicht um ein multivariates Verfahren. Tatsächlich geht es dabei, wie im Laufe der Zeit immer deutlicher geworden ist, weniger um ein eigenständiges Verfahren mit einer besonderen, dieses kennzeichnenden Methodik -, sondern eine Gruppe von Ansätzen, die auf unterschiedliche Weise versuchen, (zumeist) den Beitrag einzelner Produkteigenschaften zur globalen Beurteilung eines Produktes simultan zu schätzen und so etwa deren optimale Kombination und damit das "optimale Produkt" generieren zu helfen. Von dieser Zielsetzung her kann man - quasi in einem weiteren Sinne unter Conjoint Measurement eine Klasse von Vorgehensweisen verstehen, die dazu dienen, aus ganzheitlichen individuellen Objektbeurteilungen (Produktbewertungen) durch Personen die Parameter eines Beurteilungsmodelles zu schätzen. Die zentralen Einsatzfelder des Conjoint Measurement sind neben der bereits angesprochenen Produktgestaltung - Bewertung von Produktkonzepten - die Preisbestimmung und Marktsegmentierung. (Vgl. dazu WrrTINK/VRIENS/BURHENNE 1 9 9 4 . Zu ihren Ergebnissen - auch für andere Anwendungsbereiche sowie getrennt nach Europa und USA - s. ferner Abb. 1 bei WEIBER/ROSENDAHL 1 9 9 6 . ) Zum Zwecke des Pricing Research kann der Preis als - in der Regel "negative" - Eigenschaft in das zu bewertende Merkmalsprofil eines Produktes einbezogen werden (s. dazu auch die

340

Teil III Methoden der Datenanalyse in der Marktforschung

Ausführungen zum Verhältnis von "Preistest" und "Produkttest" in Kap. 15), um Veränderungen der Erzeugnisbeurteilung in Abhängigkeit von der Variation des Merkmals Preis zu analysieren. Im Rahmen der Marktforschung können auch andere Objekte als Produkte im Fokus von Untersuchungen mittels Conjoint Measurement stehen, so etwa Unternehmen - s. dazu Beispiel 13-5. Der Ausdruck Conjoint Measurement stammt von L U C E / T U K E Y (1964). Er wird hier - wie meist auch - synonym mit Conjoint Analysis gesetzt (und allein deshalb präferiert, weil deren Abkürzung - CA - verwechslungsfähig ist mit der für "Clusteranalyse", CM dagegen nicht). Der deutsche Ausdruck Verbundmessung kann gleichfalls synonym gebraucht werden (scheint aber weniger prägnant und deshalb nicht vorziehenswürdig).

Der Ausgangspunkt des Conjoint Measurement ist die Zugrundelegung eines bestimmten multiattributiven Beurteilungsmodelles. Dieses setzt sich aus zwei Komponenten zusammen, zum einen aus mehreren (entsprechend der Merkmalsanzahl) attributsspezifischen Beurteilungsfunktionen sowie zum anderen aus einer Verknüpfungsfunktion, welche die Kombinationsregel für die Zusammenfassung der eigenschaftsbezogenen Bewertungen vorgibt. Für den Aufbau der attributsspezifischen Beurteilungsfunktionen kommen vor allem die bereits bei der MDS erwähnten Idealpunkt- und Idealvektor·Modelle sowie daneben das Teilnutzenwertmodell ("partworth model") in Frage. Beim Teilnutzenwertmodell wird, im Unterschied zu den vorgenannten, jeder Ausprägungsstufe eines Merkmals eine spezifische Beurteilung (partworth) zugeordnet. Hinsichtlich der Verknüpfungsregel herrscht das additive Modell vor. Man spricht hier auch vom additiven Conjoint Measurement (ACM). Zumeist ist das ACM verbunden mit attributsspezifischen Bewertungsfunktionen nach dem Teilnutzenwertmodell. In diesem Fall liegt ein "additives Teilnutzenwertmodell" (TUWM - S C H W E I K L 1 9 8 5 ) vor. Bei ihm ergibt sich die - metrische - globale Beurteilung Ζ als Summe der Beiträge (ß) der einzelnen Ausprägungsstufen i ("treatments") bei den verschiedenen Produkteigenschaften j ("Attribute"): Z=ZZßij

(13.1)

i j Darauf ist unten näher einzugehen. Hier sei nur noch erwähnt, daß sich letztlich eine Vielzahl v o n Beurteilungsmodellen unterstellen läßt, wenn man bedenkt, daß neben additiven Verknüpfungen auch andere, multi-

Kapitel 13

Allgemeine Ansätze

341

plikative - sowie weitergehende Kombinationen aus Summen und Produkten -, denkbar sind und diese wiederum bei Heranziehung von Idealpunkt-, Idealvektor- oder Teilnutzenwert-Modellen erfolgen können. Von der allgemeinsten Form der Verknüpfungsfunktion geht das sog. polynomial Conjoint Measurement (TVERSKY 1 9 6 7 ) aus. Hier sind z.B. neben Summen - auch Produkte zugelassen. (S. dazu das Programm POLYCON, von Young. Man spricht in diesem Zusammenhang bisweilen auch von "polynomialer Verbundmessung" - so MAZANEC 1 9 7 6 . ) Insgesamt sind inzwischen zahlreiche unterschiedliche Ansätze des Conjoint Measurement resp. der Durchführung entsprechender Untersuchungen entwickelt worden. (Vgl. dazu den Überblicksaufsatz von CARROLL/GREEN 1995 mit einer "Taxonomy of Conjoint Methods" aufgrund einer Abbildung, die auf GREEN/KRIEGER/SCHAFFER 1993 zurückgeht.) Als wesentliche neuere Entwicklungen seien an dieser Stelle die Adaptive Conjoint Analysis (ACA) sowie die Hybrid Conjoint Analysis ( H C A ) hervorgehoben. Auf beide Konzepte ist unten noch zurückzukommen.

Von großer Bedeutung erscheint die simultane Schätzung. Im Unterschied zum - beim traditionellen "Produkttest" (s. dazu Kap. 15) üblichen - sukzessiven Vorgehen wird dadurch nämlich die Gefahr vermieden, daß man das globale Optimum verfehlt. (Z.B. könnte beim Test der Farbe etwa rot - gegenüber gelb - der Vorzug gegeben worden sein und beim anschließenden Test aller roten Verpackungen der runden Form - gegenüber der eckigen -, während der gleichzeitige Test von Farbe und Form die Überlegenheit der gelben eckigen Verpackung zeigt.) Dazu müssen also Kombinationen der Produkteigenschaften vorgegeben werden. Insofern handelt es sich um ein experimentelles Design. S. dazu noch unten. Bei der historisch älteren Form des Conjoint Measurement - der im engeren Sinne - waren diese verschiedenen Kombinationen vom Probanden lediglich in eine Rangordnung zu bringen. Insoweit handelt es sich dabei um eine Sonderiorm der Varianzanalyse (deshalb auch gelegentlich früher die Bezeichnung als "nichtmetrische Varianzanalyse'). Dabei konnte das aus der Multidimensionalen Skalierung, Kap. 12, bekannte - Prinzip der "monotonen Regression" Verwendung finden. (So im Programm MONANOVA; s. dazu auch unten.) Damit war aber auch die Verbindung zur MDS deutlich - ja, das Conjoint Measurement kann sogar als Verallgemeinerung dieser gesehen werden (YOUNG 1 9 7 2 ) . Geht man vom nicht-metrischen Charakter der Daten ab und zu solchen metrischer Art über - s. dazu unten -, so wird auch die Anwendung der (dummy-Variablen^Regression möglich. Ehe aber auf die Wahl des Schätzverfahrens

342

Teil III Methoden der Datenanalyse in der Marktforschung

noch etwas näher eingegangen wird, sind im folgenden Probleme der Datengewinnung und -aggregation zu erörtern.

13.1.2 Datengewinnung (und -aggregation) Bei der Datengewinnung geht es um a) die experimentelle Anlage und b) die Konstruktion der Frageformulierung sowie das "Skalenniveau" der damit erhobenen Daten. Das experimentelle Design ergibt sich dem Grundsatz nach aus der Gesamtheit aller Treatment-Kombinationen. Sind also z.B. 3 Produkteigenschaften beurteilungsrelevant ("salient") - zur Auswahl der Attribute s. unten - und bei zweien davon 3 Treatment-Ausprägungen, beim dritten 2, vorhanden, so ergäbe das 3 x 3 x 2 = 18 Produkte als Teststimuli. Ihre Anzahl wird also im praktischen Fall sehr schnell recht groß. Es besteht Einigkeit darüber (bei verschiedenen Angaben über die Obergrenze im Detail), daß aus Gründen der Uberforderung der Auskunftspersonen die Anzahl begrenzt werden sollte. Die Art und Weise, wie dies geschehen kann, hängt auch von der Art der Datenerhebung ab. Am weitesten verbreitet ist wohl die Profilbewertung. Dabei werden alle Produkteigenschaften (des konkreten experimentellen Designs, s. auch unten) herangezogen. Beispiel 13-1 (1986) testeten im Rahmen einer Pilotstudie - mit Studenten bzw. Teilnehmern eines Marketing-Seminars - zur "Verpackungsmarktforschung" verschiedene Packungen, mit den Faktoren "Markenname" (3 Ausprägungen), "Packmittel" (3) und "Preis" (2). Verwendete Produktprofile waren z.B. DICHTL/THOMAS

7

2

PEPSI-COLA Dose DM -,48

PEPSI-COLA Glasflasche DM -.65

Man kann aber auch "Trade Off-Matrizen" erheben. Dabei werden jeweils nur zwei Faktoren kombiniert; man spricht deshalb auch von "Zwei-Faktor-Bewertungen" oder "two-factors-at-a-time procedures". Alle Zellen der Matrix sind mit - in der Regel ordinalen - Präferenzziffern zu versehen.

Kapitel 13 Allgemeine Ansätze

343

Beispiel 13-2 Für die beiden Faktoren "Packmittel" und "Preis" des obigen Beispiels könnte eine solche erhobene Trade-off-Matrix folgendes Aussehen haben (mit 1 als der höchsten Präferenz): Preis -,48

-,65

Packmittel Dose Glasflasche Kunststoffflasche

5 1 4

2 3 6

Nachstehend werden trade-off-Matrizen nicht weiter verfolgt. Sie waren jedoch deshalb zu erwähnen, weil gelegentlich "Trade-Off-Analysis" und "Conjoint Analysis" einander gegenübergestellt werden. Tatsächlich muß man erstere jedoch lediglich als besondere Form ansehen; das generelle Ziel des C M ist es ja gerade, die "Trade-Offs" zwischen den Ausprägungen der einzelnen Produkteigenschaften zu erfassen.

Gleichung (13.1) hätte, bei 3 Produkteigenschaften α, β und γ, auch geschrieben werden können als: Z = c + I I l ( a + ß + y) ijk

(13.2)

(mit c für eine etwaige Konstante) Vergleicht man dies mit der Formel für das Lateinische Quadrat, (11.18), unter Weglassung des Fehlerterms: xijk

= μ + αί+β3+γ1:

(13.3)

so wird die Ähnlichkeit sichtbar: Hier wie dort sind nur die "Haupteffekte" ausbalanciert; Interaktionen sind nicht vorgesehen (und werden schätztechnisch mit den Haupteffekten konfundiert). Man bezeichnet eine solche Anlage auch als Haupt-Effekte-Design (HED). Die Parameterschätzung ist einwandfrei nur dann möglich, wenn die Interaktionen vernachlässigt werden können; das wiederum setzt voraus, daß die "Faktoren" paarweise voneinander unabhängig sind. Beispiel 13-3 Während, wie gezeigt, D I C H T L / T H O M A S ( 1 9 8 6 ) die Markennamen explizit verwendeten, kam SCHWEIKL ( 1 9 8 5 ) in seiner Untersuchung bezüglich Videorecordern - s. dazu auch noch unten - zu dem Schluß, die Markennamen wegen der fehlenden Unabhängigkeit von anderen Merkmalen wegzulassen (da sonst unrealistische TestStimuli entstanden wären - z.B. "Grundig" mit "System Beta"). Dies wiederum ist von Kode in seiner Rezension (ZfB 3 / 8 6 ) kritisiert worden.

Teil III Methoden der Datenanalyse in der Marktforschung

344

Das Lateinische Quadrat entspricht einem symmetrischen HED mit jeweils gleicher Anzahl von Stufen. Ist die Zahl der Treatment-Ausprägungen ungleich, so bezeichnet man dies als asymmetrisches HED. Zur Verringerung der Anzahl der Profile müssen unvollständige Designs konstruiert werden. Beispiel 13-4 In der Untersuchung von DICHTL/THOMAS ( 1 9 8 6 ) wurden außer den in Beisp. erwähnten beiden "Profilen" noch 7 weitere verwandt: 3. 4. 5. 6. 7. 8. 9. (S. dazu

13-1

PEPSI/Kunststoffflasche/-,65 COCA/Dose/-,65 COCA/Glasflasche/-,65 COCA/Kunststoffflasche/-,48 SINCO/Dose/-,65 SINCO/Glasflasche/-,48 SINCO/Kunststoffflasche/-,65 auch A 13-1 und -2.)

Das zweckmäßige Vorgehen bei der Konstruktion solcher "unvollständiger Pläne" ist von ADDELMAN (1962) skizziert worden; er hat auch sog. Basispläne (basic plans) dazu vorgelegt. Reduzierungen der Anzahl der durch die Auskunftspersonen zu beurteilenden Objekte (Attributsprofile) können allerdings auch durch spezifische Modifikationen der Erhebungstechnik realisiert werden. Auf solchen besonderen Formen bauen die bereits erwähnten Hybrid-ConjointAnalysis (HCA) und Adaptive Conjoint Analysis (ACA) auf. Kennzeichnend für den hybriden Ansatz (vgl. dazu etwa GREEN 1 9 8 4 ) ist, daß bei der Parametrisierung des Beurteilungsmodelles nicht allein das dekompositionelle Prinzip - also die Zerlegung (Dekomposition) einer Gesamtbeurteilung in merkmalsspezifische Urteilsbeiträge - des klassischen conjointanalytischen Vorgehens herangezogen wird. Stattdessen stellt man auch auf kompositioneile Parametrisierungen ab, indem in gleicher Weise wie bei den in Kap. 2 dargelegten Einstellungsmodellen die merkmalsbezogenen Urteile direkt erhoben werden. Hierdurch sollen die Vorteile kompositioneller und dekompositioneller Verfahren miteinander verbunden werden. Der wesentliche Vorzug dieses Vorgehens liegt in der drastischen Minderung der Urteilsobjekte (Merkmalsprofile). Bei der ACA (JOHNSON 1987) wird ebenfalls der hybride Ansatz zugrunde gelegt. Im Zentrum dieses Verfahrens steht der Gedanke der interaktiven

Kapitel 13

Allgemeine Ansätze

345

und computergestützten Erhebung von Urteilsdaten. Durch das interaktive Vorgehen, mit sofortiger Eingabe der Anworten, können sich weitere Fragen an den gegebenen Antworten ausrichten, um den Produktbeurteilungsprozeß im Hinblick auf individuell wichtige Merkmale zu analysieren. Hierdurch vermag die Anzahl der erforderlichen Urteilsobjekte deutlich verringert zu werden. Umgekehrt erlaubt die A C A die Einbeziehung einer vergleichsweise großen Menge von Produkteigenschaften (maximal 30). Nach übereinstimmender Einschätzung hat sich diese Methodik sehr bewährt und gehört zu den beliebtesten Vorgehensweisen. (Vgl. auch WITTINK/VRIENS/BURHENNE 1 9 9 4 . ) Die praktischen Probleme der Darbietung der Testobjekte im Rahmen des klassischen CM wurden im Grunde bereits bei der MDS, speziell der "Präferenzskalierung" (12.2.3), erörtert, denn bei der ursprünglichen Ausprägung des Conjoint Measurement geht es um die Gewinnung von Rangordnungen. Wie dargelegt, kann dies direkt über das Ranking aller Testobjekte erfolgen oder auch mittels Ableitung aus Paarvergleichen. Der Vergleich von jeweils zwei Profilen mit Angabe der Präferenz ist zwar für die Befragten einfach, führt aber wegen der rasch groß werdenden Anzahl der erforderlichen Paar-Vergleiche eventuell zu Ermüdungserscheinungen. Dagegen ist, zumindest bei einer großen Zahl von vorgelegten Profilen (mit u.U. jeweils einer großen Zahl von Ausprägungen), die Bildung einer Gesamt-Rangordnung intellektuell schwierig. Empfohlen wird deshalb, zunächst eine Trennung in zwei (oder mehr) Gruppen - "weniger präferiertV'stärker präferiert" - vorzunehmen, dann zunächst innerhalb jeder Gruppe die Präferenzordnung zu bilden und daraus dann, unter Prüfung auf "Konsistenz", die Gesamt-Rangordnung zu erstellen. Beispiel 13-5 So wurde in einer Untersuchung der GfK vorgegangen. Dabei handelte es sich (wie oben schon angedeutet, inhaltlich umfassender) darum, den Beitrag von 5 "Unternehmensmerkmalen" zum "Unternehmens-Image" zu ermitteln. Den - schriftlich Befragten wurden dazu 16 Kärtchen ("Unternehmen A " bis "T") vorgelegt, die sie in eine Rangordnung bringen sollten. Empfohlen wurde dabei, nach einer Grobsortierung in zwei Gruppen ("gut"/"nicht so gut"), das Unternehmen mit dem besten Gesamteindruck ganz nach links zu legen, das mit dem schlechtesten nach rechts. So konnte sich etwa - wie beim Verf. - ein Bild gemäß Darst. 13-1 ergeben (vgl. HUBEL 1 9 8 8 , S. 2 4 ) :

346

Teil III Methoden der Datenanalyse in der Marktforschung

"Wie ist Ihr Gesamteindruck von diesem Unternehmen?"

Darst. 13-1: CM-Rangfolge (Beispiel) In jüngerer Zeit hat die Erhebung von Urteilsdaten auf metrischem Niveau erheblich an Bedeutung gewonnen. Nach WITTINK/VRIENS/BURHENNE (1994) wurden in Europa in der zweiten Hälfte der 80er Jahre etwa bei 70% aller CM-Studien die Objektbeurteilungen über Rating-Skalen erhoben. Ein Weg zur Gewinnung metrischer Urteile stellt die Verbindung des Paarvergleichs mit dem Rating dar ("Graded Paired Comparisons", GPC-Skala). Beispiel 13-6 Profil D vs. Profil F bevorzugtes Profil: Stärke der Bevorzugung:

weniger stark I

I sehr stark

Kapitel 13

Allgemeine Ansätze

347

Weitere Möglichkeiten liegen in der Anwendung der Konstantsummenskala (Kap. 4) oder der sog. "Dollar-Metrik": Beispiel 13-7 In der Untersuchung von SCHWEIKL (1985) wurden den Probanden jeweils 2 Kärtchen mit - relativ umfänglichen - Beschreibungen des Objekts vorgelegt und gefragt: 1. "Bei gleichem Preis: Welches Gerät ziehen Sie vor?" 2. "Angenommen, das (bevorzugte) Gerät ist teurer. Wieviel darf es höchstens mehr kosten?" (Zur Einübung ging ein Beispiel mit zwei realen Objekten - Vorlage aktueller Prospekte - voraus.)

Bei der Interpretation ist allerdings zu beachten, ob man die genannten Zahlen als (absolute) Geldbeträge auffaßt oder - wie SCHWEIKL 1985 dies tut - lediglich als absolute Präferenzunterschiede (z.B. doppelt so hoch, wenn beim Paar A/B 100,- und D/E 200,- angegeben wurde). Ein weiteres Problem ist das der Aggregation. Es ähnelt dem bei der MDS; hier wie dort war ja davon ausgegangen worden, daß es sich um (Präferenz-)Funktionen jeweils eines Individuums handelt. Praktisch ist man aber in der Regel an stärker zusammenfassenden Aussagen interessiert. Dabei kann man unterscheiden, ob diese Aggregation auf der Ebene der Input- oder der Outputázttn. erfolgt; damit im Zusammenhang steht auch die Frage einer eventuellen Segment- bzw. Clusterbildung: 1. Aggregation auf der Ebene der Inputà&ten heißt, daß man für die - im nächsten Abschnitt zu besprechende - Parameterschätzung etwa statt der individuellen eine Durchschnitts-Kzngordming verwendet. a) Inhaltlich bedeutet dies, daß man auf die Präferenzfunktion einer fiktiven Durchschnittsperson abstellt. Damit, dieser Durchschnitt aussagekräftig wird, kann man vorher eine stärkere Homogenisierung herbeizuführen versuchen, indem man - aufgrund anderer Merkmale - eine Clusteranalyse vornimmt. b) Formal führt die Bildung von "Durchschnittsrängen" in jedem Fall zu "metrisierten" Daten; s. dazu die Diskussion bei der MDS (unter 12.2). arithmetischen Mittels bei der Durchschnittsbildung den verwandt. Theoretisch wird dadurch, da es sich um einen "Mittelwert der

MAZANEC (1976) hat statt des

Median

348

Teil III Methoden der Datenanalyse in der Marktforschung

Lage" handelt, das Problem entschärft, praktisch allerdings kaum (da er, bei gruppierten Daten, gemäß unten Beisp. 9, "berechnet" werden muß).

2. Es läßt sich denken, für jede Person eine Schätzung der "Teilnutzenwerte" vorzunehmen und diese Outputdzten dann zu mittein. Alternativ dazu können die Teilnutzen auch Inputdaten für eine Clusteranalyse sein ("Benefit-Segmentation'); den so gebildeten Gruppen werden dann die Mittel zugewiesen. Dabei empfiehlt sich eine Normierung. (S. zur Formel dafür etwa BACKHAUS et al. 2 0 0 0 , S. 588f.) Das ist insbesondere der Fall, wenn man, wie SCHWEIKL 1985, auf individuell - und nicht nur, wie üblich, durchschnittlich - wichtige Produktmerkmale abstellt.

13.1.3

Die Wahl des Schätzverfahrens - Anwendungsbeispiele

Inzwischen haben sich mehrere Schätzmethoden und, darauf aufbauend, Programme für das Conjoint Measurement entwickelt. Im folgenden sollen einige davon kurz skizziert und - quasi zusammenfassend - Anwendungsbeispiele referiert werden. Wie eingangs erwähnt, ist das älteste Programm MONANOVA (von Kruskai). Es beruht auf dem Prinzip der monotonen Regression. (S. auch bei der MDS, unter 12.2.2.) Hier bedeutet dies, daß die erhobene Präferenzrangordnung in metrische Werte Ζ transformiert wird. Im simpelsten Falle erhielte also z.B. bei 10 Testobjekten das am höchsten präferierte den Wert 10,0. Es wird dann eine beliebige Startkonfiguration generiert. Angenommen, die Summe von deren Teilnutzenwerten für dieses (k-te) Testobjekt ergäbe Z= 12,1; für alle Testobjekte zusammen kann dann der "Stress" berechnet werden: l(zk-zk)2 ' " f e ? Er wird in einem iterativen Prozeß minimiert.

'

(I3 4)

Kapitel 13 Allgemeine Ansätze

349

Andere Verfahren verwenden andere Algorithmen und Optimierungskriterien. So beruht das Programm LINMAP (von Srinivasan und Shocker) auf einem Ansatz der Linearen Programmierung, mit einem "Index of Fit" (C*) als Optimierungskriterium. Insbesondere dann, wenn die Präferenzen als metrisch angesehen werden können, läßt sich auch die Methode der kleinsten Quadrate heranziehen; die Treatment-Niveaus sind hier als dummy-Variablen (s. in Kap. 10 und das folgende Beispiel 8) zu repräsentieren. Abschließend, wie erwähnt, noch einige Anwendungsbeispiele. (Zu einer „Synopse der Anwendungsempfehlungen", gegliedert einerseits nach Erhebungs-, Anwendungs- und Auswertungssituation, andererseits nach Conjoint-Ansätzen, vgl. WEIBER/ROSENDAHL 1 9 9 6 , S. 5 8 0 . Zu „Determinanten der Validität" der Conjoint-Analyse s. - an gleicher Stelle - auch TSCHEULIN 1 9 9 6 . )

Beispiel 13-8 SCHWEIKL (1985 - vgl. dazu auch die Beispiele oben) hat in einer Untersuchung von Videorecordern die ursprünglich 24 Produktmerkmale (wie erwähnt, waren der Markenname - und auch der Preis sowie die Form - nicht darunter) für die Konstruktion der Profile, einer Empfehlung von GREEN/SRINIVASAN (1978) folgend, auf 6 pro Person - wie dargelegt, individuell verschieden! - reduziert. Die Merkmale hatten jeweils nur 2 Ausprägungen, mit einer Ausnahme: 3 Ausprägungen. Insgesamt waren also 7 dummy-Variablen erforderlich, bei einem HED-Design mit 16 Testobjekten. Der Paarvergleich - mit "Dollar-Metrik" - wurde auf 35 Paare beschränkt. Mittels der sich ergebenden 35x7-Matrix konnten die Parameter geschätzt werden, und zwar individuell für jede Person. Insgesamt waren die hier ja nur diskutierten Fälle mit individualisierten Produktmerkmalen in zwei Gruppen (nach der Art der Auswahl der als wichtig erachteten Merkmale) à 50 Personen eingeteilt worden. (Es handelte sich dabei - entsprechend einer Vorgabe des Kooperationspartners - um Männer, die auf die Frage, ob sie in nächster Zeit einen Videorecorder zu kaufen beabsichtigten, positiv geantwortet hatten.) Für diese 100 Personen wurde zusätzlich, aufgrund der einzelnen normierten Parameterschätzwerte, eine Clusteranalyse durchgeführt. Für die gefundenen 5 Cluster (s. dazu Beisp. 12-16) konnten dann auch die Mittelwerte der "Teilnutzen" - im Prinzip für sämtliche 24 Produktmerkmale - berechnet werden. Beispiel 13-9 MAZANEC analysierte in einer Pilotstudie ( 1 9 7 6 ) Ergebnisse einer Befragung, bei der 50 "per Zufall" aus dem Wiener Telefonbuch ausgewählte Personen die Präferenzordnung für 9 hypothetische Sparformen (2 Produktmerkmale, jeweils mit 3 Ausprägungen: 1. Bindungsdauer, und zwar 0, 3, 6 Jahre, 2. Zinshöhe, nämlich 5, 10 und 15%) anzugeben hatten. Für die Mittelung über diese 50 Rangordnungen wur-

350

Teil III Methoden der Datenanalyse in der Marktforschung

de der Median verwandt, und zwar mittels "Berechnung" aus Gruppen (für jede Variante: Nennung an 1. Stelle ..mal, dann 2. .. usw.). Zur Auswertung wurde das Programm POLYCON II benutzt. Im Ergebnis „erhärtet sich die ... Hypothese, daß durch Abbau der Bindungsfrist ein höherer Präferenzzuwachs erzielt wird, als durch Anheben des Zinssatzes" (S. 59). Beispiel 13-10 - vgl. die Beispiele oben) schätzen die Teilnutzen, mittels des Programms U N I C O N im Programmpaket MDS(X), für jede Versuchsperson. Nach den erforderlichen Umrechnungen, durch "Transponieren" und "Normieren", waren die Werte vergleichbar und konnten einer Clusteranalyse unterzogen werden. Dabei ergaben sich 3 Cluster, mit z.B. folgenden Ergebnissen für die Gruppe 1: Markenname COCA 17 PEPSI 3 SINCO 19 Packmittel Glas 22 Kunststoff 7 Dose 15 Preis 0,48 3 0,65 14 Es "zeigt sich für Gruppe 1 ein vergleichsweise ausgeglichenes Nutzenprofil. Vereinfacht ausgedrückt wäre dieser Personenkreis mit den Marken COCA-COLA oder SINCO-COLA, mit Glasflasche oder Dose und einem Preis von DM -,65 am besten bedient. Relativ wenig zum Zustandekommen einer hohen Präferenz gegenüber einer Cola-Packung würden die Kunststoff-Flasche, ein Preis von DM -,48 und die Marke PEPSI-COLA beitragen." (S. 32f.) DICHTL/THOMAS ( 1 9 8 6

Beispiel 13-11 SIMON ( 1 9 9 5 , S 4 2 - 4 7 ) berichtet über eine Auto-Studie. Dabei wurde, „aufgrund der vorgegebenen Problemstellung" und „in Zusammenarbeit mit dem Management", von 4 Eigenschaften, mit jeweils 3 Ausprägungen, ausgegangen: Marke, Preis, Höchstgeschwindigkeit und Benzinverbrauch. Damit konnten 81 verschiedene Autos „konstruiert" werden; davon mußten - als „Voll-Profil" - für jeweils zwei im Paarvergleich von den Befragten Präferenzurteile abgegeben wurden. (Mittels „Computer-Interviewing" war es möglich, die Anzahl der von jedem einzelnen Befragten vorzunehmenden Paarvergleiche stark zu reduzieren.) Nach der Datenerhebung wurden für jeden Befragten individuell die Teilnutzenwerte ermittelt und da ein lineares Modell zugrunde gelegt worden war - zu einem Gesamtnutzenwert für das einzelne Auto addiert. Letztlich sollte jedoch die Preisabsatzfunktion ermittelt werden. „Da die Conjoint Analyse selbst keine Aussagen darüber macht, wie die ermittelten Produktpräferenzen auf Kaufwahrscheinlichkeiten oder beobachtbare Kaufhandlungen wirken, muß dieser Zusammenhang mit einer zusätzlichen Modellannahme quantifiziert werden." ( B A L D E R J A H N 1 9 9 4 , S. 1 5 ; vgl. auch - ähnlich ders. 1 9 9 1 , S. 3 4 . ) Hier wurde diefirst-choice-Regel zugrunde gelegt, d.h. der - bei einem bestimmten Preis resultierende maximale Gesamtnutzenwert ist entscheidend für die Wahl der Au-

Kapitel 13

Allgemeine Ansätze

351

tomarke. Daraus konnten dann - für die einzelne Marke - auch aggregierte Preisabsatzfunktionen, mit Preiselastizitäten, ermittelt werden. So betrug etwa für Automarke A die Preiselastizität bei einem Preis von D M 50 0 0 0 (-)2,0, bei 7 0 0 0 0 (-)1.1.

13.2 Die Ko Varianzstrukturanalyse 13.2.1 Begriff - Die Entwicklung der Modelle Die Kovarianzstrukturanalyse kann als "ein Verfahren zur simultanen Analyse komplexer Zusammenhangsstrukturen zwischen beobachtbaren (manifesten) Variablen und nicht beobachtbaren (latenten) Variablen" so Baiderjahn in einem Vortrag auf der Jahrestagung 1986 der Deutschen Statistischen Gesellschaft - bezeichnet werden. In dieser Definition klingen auch die "Wurzeln" der Methode an: 1. die konfirmatorische Faktorenanalyse, 2. die Pfadanalyse. Zw 1: In der explorativen Faktorenanalyse, gemäß 12.1, waren - im Prinzip - alle Faktoren entweder unkorreliert (orthogonal) oder - bei schiefwinkeliger Rotation - korreliert. Auch waren vom Ansatz her alle Faktoren von gegebenen Variablen beeinflußt: Ziel der Rotation war es aber gerade, die "Ladungsstruktur" zu vereinfachen. Im Falle des "Faktorenmodells" besaßen außerdem alle beobachteten Größen "Einzelrestfaktoren"; diese waren sowohl untereinander als auch mit den "gemeinsamen Faktoren" unkorreliert. Bei der konfirmatorischen Faktorenanalyse wird hingegen - aufgrund von sachlogischen Überlegungen spezifiziert, wie viele Faktoren vorhanden und wie sie untereinander und mit den Variablen verbunden sind. (Es entfällt also auch die Rotation.) Es wird dann "getestet", ob die spezifizierte Struktur mit den empirischen Daten in Einklang zu bringen ist. (Vgl. dazu etwa WEEDE/JAGODZINSKI [1977] und LONG 1983a - und auch 1983b.) Zu 2: Die Pfadanalyse stellt eine Weiterentwicklung der traditionellen Regressionsanalyse dar - dergestalt, daß versucht wird, kausale Beziehungen zu ermitteln. Ziel dabei ist es, Sctówkorrelationen bzw. "spurious regressions" zu vermeiden (und auch etwaige Multikollinearität zu erhellen). Ahnlich der Ökonometrie werden dabei Modelle, mit mehreren Gleichungen, spezifiziert und die - gegebenen - Variablen eingeteilt in endo-

352

Teil III Methoden der Datenanalyse in der Marktforschung

gene und exogene. Erstere sind solche, die innerhalb des Modells erklärt werden (bei "Eingleichungsmodellen" ist dies die abhängige Variable); exogene Variablen sind "von außen" vorgegeben (bei Eingleichungsmodellen: die unabhängigen Variablen). Durch die Modell-Spezifikationen sind die interessierenden "Pfade" festgelegt, die - durch Pfeile symbolisiert - in Pfaddiagrammen dargestellt werden können. Die Schätzung der Koeffizienten kann, jedenfalls bei vollständig rekursiven Modellen, via Regression, durch "Dekomposition" der gesamten - in den Korrelationskoeffizienten zum Ausdruck kommenden - Kovarianz erfolgen. (S. dazu die - an das SPSS-Handbuch von 1985 angelehnte - Wiedergabe von "Dekompositionstableau" und Pfaddiagramm für ein Beispiel bei HÜTTNER 1979, S. 326f. Vgl. auch die Darstellung bei HILDEBRANDT 1983.) Es ist allerdings darauf hinzuweisen, daß die - oben verwandte - Bezeichnung "kausal" lediglich dahingehend verstanden werden kann, daß sich für ein theoretisch begründetes Modell eine "statistische Bestätigung" (s. dazu ausführlicher unten) finden läßt. Experimenteller Charakter kommt dem Verfahren allenfalls im Sinne von "ex post facto "-Untersuchungen (s. dazu in Kap. 6) zu. Deshalb wird hier - neutraler und zugleich genereller - zumeist von "Kovarianzstrukturanalyse" gesprochen; auf den Begriff Kausalmodelle ("Causal Modeling") ist dagegen im allgemeinen verzichtet worden, ebenso auf die häufig gebrauchte Bezeichnung Strukturgleichungsmodelle ("Structural Equation Modeling"). Im folgenden wird die Kovarianzstrukturanalyse in der Terminologie des Programmpaketes LISREL skizziert. Dieses ist so eng mit der Entwicklung der Methodik verbunden, daß gelegentlich auch von LISREL-Modellen (LISREL Modeling) gesprochen wird. Der Ansatz wurde von JÖRESKOG 1 9 6 9 zunächst im Zusammenhang mit der konfirmatorischen Faktorenanalyse entwickelt; 1970 wurde bereits die Verallgemeinerung auf "Kovarianzstrukturen" dargelegt; in den verschiedenen Versionen von LISREL ist dies weiter ausgebaut worden. (Besonders starke Veränderungen traten dabei mit dem Ubergang zur Version 5 - vgl. dazu JÖRESKOG/SÖRBOM [ 1 9 8 2 ] auf.) Derzeit gibt es die Version 8: Jöreskog, K.G./Sörbom, D., LISREL 8 (with PRELIS), Chicago 1993, bzw. dies., LISREL 8 with PRELIS 2 for Windows, Chicago 1995. Eine Variante oder, in gewissem Sinne - wegen seiner größeren Allgemeinheit und Flexibilität - Alternative stellt E Q S ("EQuations based Structural program") dar. Es ist hauptsächlich mit dem Namen Bentier verbunden. Das theoretische Modell wurde im wesentlichen von B E N T L E R / W E E K S ( 1 9 7 9 ; 1 9 8 0 ) entwickelt. Zu Computerprogrammen s. Bentier, P.M., E Q S Structual Equations Program Manual, Los Angeles 1992,

Kapitel 13 Allgemeine Ansätze

353

bzw. Bentier, P.M./Wu, E.J.C., EQS for Windows 5.0, Encino 1995. p i e Multivariate Software Inc. wies Ende 2001 darauf hin, daß Version 6.0 derzeit noch nicht ausgeliefert werden könne.) Vgl. zu EQS auch DUNN/EVERITT/PICKLES 1 9 9 3 und BYRNE 1 9 9 4 . ) Relativ stark von LISREL und EQS unterscheidet sich der PLS-Ansatz von Wold (PLS = Partial Least Squares); vgl. etwa W O L D 1 9 8 2 und LOHMÖLLER 1 9 8 9 .

Entsprechend der doppelten Einteilung der Variablen in 1. gemessene (manifeste) und latente, 2. endogene und exogene, finden in LISREL zwei Teil-Modelle Anwendung: das Meß- und das StrukturmoàzW. Im folgenden werden zunächst die beiden Teilmodelle und sodann ihre Inkorporation in das Gesamtmodell erörtert, jeweils formal wie auch anschaulich. Schon deshalb, weil die graphische Darstellung schlecht allgemein möglich ist, wird sie an einem Beispiel vorgenommen. Gewählt wurde dabei ein in der deutschsprachigen Literatur gegebenes (FÖRSTER et al. 1984), weil einmal dieses relativ leicht zugänglich ist, zum anderen dafür auch noch weitergehende Ausführungen vorliegen (FRITZ 1984). Das Meßmodell {"Measurement Model') beruht auf der faktorenanalytischen Wurzel: Es beschreibt, wie Faktoren durch beobachtbare Variablen ausgedrückt werden (oder, anders formuliert, "theoretische Konstrukte" durch entsprechende "Indikatoren"). Bezeichnet man - wie bisher - die Beobachtungsvariablen mit χ und die Faktoren - neu - mit ξ (Xi), so gilt hierfür, in Matrizenschreibweise: χ = Λχ ξ + δ

(13.5)

Darin ist Λ (groß Lambda) die Matrix der Faktorenladungen. Abgestellt wird dabei auf das "Faktorenmodell", (mit r < n); es verbleiben also Einzelrestfaktoren, symbolisiert durch δ (delta). Diese können auch als "errors", d.h. Meßfehler, aufgefaßt werden; es handelt sich also um ein "Fehler-in-den- Variablen-Modell ". Beispiel 13-12 et al. ( 1 9 8 4 ) gehen zunächst von 3 latenten Variablen aus. Dabei wird ξγ, die "Branchenzugehörigkeit", durch xj (nominalskaliert: ob Hersteller von Waschvollautomaten oder 3-Weg-Kompaktanlagen), die "Organisationsgröße", durch X2 (jährlicher Gesamtumsatz) sowie X3 (Beschäftigtenzahl), und £3, die "Konkurrenzintensität", durch X4 (wahrgenommener Wettbewerbsdruck: "sehr gering", "ziemlich gering" , "weder/noch" , "ziemlich groß" , "sehr groß" - aufgefaßt

FÖRSTER

354

Teil III Methoden der Datenanalyse in der Marktforschung

als Intervallskala) gemessen. Dabei stehen gekrümmte Linien, mit doppelter Pfeilspitze, für Korrelationen; "Pfade" dagegen sind symbolisiert durch gerade Linien, mit nur einer Pfeilspitze. Manifeste Variable werden durch Quadrate gekennzeichnet, latente durch Kreise. Dabei ist angenommen, daß "Einzelrestfaktoren" nur bei den Variablen x 2 und X3 vorhanden sind, ferner, daß sie nicht miteinander korrelieren. (Das tun aber die "gemeinsamen Faktoren"!) Graphisch läßt sich dies gemäß Darst. 13-2 veranschaulichen.

Mit der Spezifikation von Anzahl und Beziehung der Einzelrestfaktoren ist auch eine weitere Matrix fixiert: Θ (groß Theta). Beispiel 13-13 (Forts, des vorigen Beisp.) Im vorliegenden Falle gilt: 0 0 0! 0 0 θ2 0 0 0 0 Setzt man weiterhin die Relation zwischen x j und ξι sowie X4 und ξ4 gleich 1, so gilt insgesamt: X x

x

1

2

3 _x4

1 0 0 λ: 0 λ2 o o

0 0 0 1

r, η 0 ^ ÔJ l 2 + δ2 Ls3j o

Kapitel 13

Allgemeine Ansätze

355

Da es, wie dargelegt, nicht nur zwischen manifesten und latenten, sondern auch zwischen exogenen und endogenen Variablen zu unterscheiden gilt, benötigt man ein zweites Meßmodell, hier für die endogenen Variabien: y = Ay η + ε

(13.6)

(mit η - eta - für die latenten Variablen und ε - epsilon - den "error") Beispiel 13-14

(Forts, des vorigen Beisp.)

FÖRSTER et al. (1984) gehen vom Problem der produktpolitischen Anpassung von Industrieunternehmen an den Warentest (der Stiftung gleichen Namens) aus. Sie nehmen an, daß sich die - endogene - Anpassung vor allem in zweierlei Weise vollzieht: durch Berücksichtigung der Prüfkriterien des Warentests bei der Produktentwicklung (r|i = "Produktentwicklung mit Testkriterien") und "Produktänderungen aufgrund von Testergebnissen" (η2). Für letzteres steht nur 1 Indikator: Y3, das "Ausmaß, in dem Testergebnisse zu Produktänderungen beitragen", mit den - als intervallskaliert aufgefaßten - Ausprägungen: "sehr gering", "ziemlich gering", "weder/noch", "ziemlich groß", "sehr groß". Wiederum wird hier kein Meßfehler unterstellt und die Beziehung zwischen manifester und latenter G r ö ß e gleich 1 gesetzt. 2 Indikatoren stehen dagegen für die erste latente Variable, nämlich y j : "Häufigkeit, mit der Testkriterien in der Produktentwicklung berücksichtigt werden" und y^. "Ausmaß, in dem Testkriterien in der Produktentwicklung berücksichtigt werden" (jeweils mit 5 Intervallskalen-Stufen, bei y j mit der Verbalisierung "selten" und "häufig" - statt "gering" und "groß"). Bei beiden ist ein - untereinander nicht korrelierter - Meßfehler vorhanden. (S. dazu A 13-3.)

Θ ε steht, ähnlich oben, für die Spezifikation der Meßfehler. (S. zur Gestalt dieser Matrix und der des zweiten Meßmodells insgesamt A 13-4.) Damit sind 4 der für ein LISREL-Modell erforderlichen 8 ParameterMatrizen bestimmt. Die restlichen vier Matrizen werden im Rahmen des Strukturmodells spezifiziert. Es hat folgende Form: η = Βη + Γξ + ζ

(13.7)

Darin stellen Β (groß Beta) und Γ (groß Gamma) Koeffizienten-Matrizen dar: Die Yq stehen für die Effekte der ξ- auf die η-Variablen, die ß ; (Elemente von B) für die der η-Variablen untereinander. (Zu den Effekten der ξ-Variablen untereinander s. unten.) ζ (zeta) steht wiederum für einen "error", hier aber den "error in the equation". Er wird spezifiziert in der

356

Teil III Methoden der Datenanalyse in der Marktforschung

Matrix Ψ (groß Psi), mit den Elementen ψ;, die die Beziehungen zwischen den ζ; darstellen. Beispiel 13-15 (Forts, der vorigen Beisp.) Nimmt man mit FÖRSTER et al. (1984) an, daß die Residuen in der Gleichung für T|i und r\2 nicht miteinander korreliert sind, so ergibt sich: Ψ=

Ψι .0

Ψ2

Das Strukturmodell selbst hat folgende Gestalt, wenn man annimmt, daß Einflüsse von ξ χ auf Ήι, ξ χ auf τ|2 sowie ξ χ auf η j und vorliegen:

"Π1

0

ß2

ßl

0

ηι

y\2

Yl 0

0 Y3 γ2 0

ξι ξ2

ζι'

UbJ

Schließlich sind noch die Beziehungen der ζ; untereinander zu spezifizieren. Sie werden in der Matrix Φ, mit den Elementen φ, (Phi), zusammengefaßt. Beispiel 13-16 (Forts, der vorigen Beisp.) Für Darst. 13-3 wurde bereits festgelegt, daß die 3 latenten exogenen Variablen alle miteinander korreliert sein sollen. Somit resultiert:

Φ =

1 Φΐ

1

Φ2

Φ3

Damit läßt sich das Kovarianzstrukturmodell insgesamt darstellen. Beispiel 13-17 (Forts, der vorigen Beisp.; s. dazu Darst. 13-3 auf der folgenden Seite)

Dazu sei - quasi zusammenfassend - in Darst. 13-4 (ebenfalls auf der folgenden Seite) noch eine Ubersicht über die in einem LISREL-Modell verwendeten Variablen und (Parameter-)A/áínzen gegeben.

Kapitel 13 Allgemeine Ansätze

357

Dar st. 13-3: Kovarianzstrukturmodell (nach FÖRSTER et al. 1984)

I. Variable Nr.

Symbol

1

X

2

ξ δ

3 4 5 6

Bezeichnung

Bedeutung manifeste exogene Variable

Xi (ksi)

latente exogene Variable

Delta

η ε

Eta Epsilon

Residualvariable für χ manifeste endogene Variable latente endogene Variable Residual-Variable y

ζ

Zeta

Residual-Variable η

y

7 II. Parameter

Symbol "Nr.

Matrix ¡nsges.

Matrix- Bezeichnung Element

Bedeutung

1

Λ,

λ

Lambda(-x)

Koeffizienten der Pfade zwischen χ und ξ

2 3

Ay Β

λ

Lambda(-y) Beta

dto. y und η dto. der Korrelation zwischen η

4

Γ

Υ

Gamma

dto. zwischen η und ξ

5

Θδ

θ

Theta(-5)

Varianz-Kovarianz-Matrix zwischen δ

6

©ε

θ

Theta(-E

(Hauptdiagonale: Fehler in den Variablen x) dto. zwischen ε (analog für y)

7

Ψ

Ψ

Psi

dto. zwischen ζ (analog für η)

8

Φ

φ

Phi

dto. zwischen ξ

β

)

Darst. 13-4: Zusammenstellung der Variablen und Matrizen in einem vollständigen LISREL-Modell

358

Teil III Methoden der Datenanalyse in der Marktforschung

13.2.2 Identifikation, Schätzung und Überprüfung der Modelle Im vorigen Abschnitt wurde die Entwicklung der Modelle (in der Terminologie von LISREL) erörtert; mit einer Explikation in der Art von Darst. 13-3 - bzw. der entsprechenden Matrizen - endet die Spezifikation. Davon zu unterscheiden ist die Identifikation. Bei dieser geht es um die Bestimmtheit, d.h. eindeutige Lösbarkeit von Systemen linearer Gleichungen. Der Nachweis der Identifikation in LISREL-Modellen ist - nach dem derzeitigen Stand - schwierig. Sie hängt mit der Anzahl der zu schätzenden Parameter zusammen; diese darf nicht zu groß sein. Dabei ist zu beachten, daß LISREL 3 Arten von Parametern unterscheidet: 1. festgelegte ("fixed"): a-priori-Zuweisung bestimmter Werte; 2. restringierte ("constrained"): unbekannt, aber gleichgesetzt mit anderen Parametern (einem oder mehreren); 3..freie ("free"). Als notwendige - aber nicht hinreichende - Bedingung für letztere, die Anzahl der zu schätzenden Parameter (t) gilt: t < ( p + q)(p + q + l)/2

(13.8)

(mit ρ für die Anzahl der x- und q die der y-Variablen) Beispiel 13-18 (Forts, der vorigen Beisp.) Im Modell laut Darst. 13-3 sind einige Parameter bereits gleich 0 oder 1 gesetzt. Zu schätzen verblieben noch 19. N u n kann "jedoch zur Bestimmung der Skala der latenten Variablen, die von mehreren Indikatoren gemessen werden, ein Meßpfad bzw. eine Varianz auf eins fixiert" werden (FÖRSTER et al. 1984, S. 365); ferner ist Q>2 - hier letztlich nichts anderes als die empirische Korrelation zwischen zwei manifesten Variablen - bekannt; die Anzahl der noch zu schätzenden Parameter reduziert sich also auf 16. Bei insgesamt 7 beobachteten Variablen ergibt sich: (7· 8)/2 = 28; die notwendige Bedingung ist also erfüllt. Die hinreichenden Bedingungen müssen ggf. für jeden Modellparameter einzeln geprüft werden. FÖRSTER et al. (1984) weisen darauf hin, daß dies im Beispiel - mit Erfolg - getan wurde.

Ist das Modell spezifiziert und identifiziert, so kann die Schätzung der Parameter erfolgen. Als Input genügt die empirische (Varianz-)Kovarianz-

Kapitel 13

Allgemeine Ansätze

359

Matrix (S. zur Berechnung einer Kovarianz-Matrix auch A 11-10.) Ziel der Schätzung ist "that of fitting the covariance matrix Σ implied by the model to the sample covariance matrix S" (JÖRESKOG/SÖRBOM 1 9 8 2 , S. 405), d.h. die Minimierung des Abstandes zwischen den beiden Matrizen. Dafür stand bis zur Modell-Version 4 einschließlich als Verfahren nur ML ("Maximum Likelihood") zur Verfügung. Dies ist zwar theoretisch "optimal", allerdings nur unter den gegebenen Voraussetzungen (Multinormalverteilung!); außerdem ist es sehr aufwendig. In Version 5 wurde deshalb ein nicht an spezielle Verteilungs-Voraussetzungen gebundenes und weniger aufwendiges - aber immer noch iteratives - Verfahren: ULS (Unweighted Least Squares) aufgenommen, ferner ein - nichtiteratives und deshalb schnelles - IE(Initial Estimate)-Verfahren. In späteren Versionen steht auch GLS (Generalized Least Squares) zur Verfügung. Für die Überprüfung der Modelle lassen sich, ähnlich dem "diagnostic checking" beim Box-Jenkins-Approach (s. dazu etwa HÜTTNER 1 9 8 6 C , Kap. 6), sowohl Detei/kriterien als auch stärker zusammenfassende Maße heranziehen. Zu ersteren gehören die Uberprüfung der Parameter-Schätzungen (in bezug auf Plausibilität von Vorzeichen und Höhe sowie Standardfehler und Korrelation), der Residuen, die multiplen Korrelations- bzw. Determinationskoeffizienten usw. Als globales Maß war bis einschließlich Version 4 nur die x2-Statistik verfügbar. Der Chi-Quadrat-Wert soll die Differenz zwischen - aus dem theoretischen Modell abgeleiteten - Σ und - empirischen S zum Ausdruck bringen. Als Test ist er abweichend von dem üblichen Vorgehen (aber im Einklang mit dem beim Box-Jenkins-Approach) so angelegt, daß die Nullhypothese der Ubereinstimmung zwischen S und Σ, also die "Äquivalenz" des Modells, postuliert wird. Erst wenn der empirische χ2Wert den theoretischen (bei gegebener Anzahl vom Freiheitsgraden und festgelegtem Signifikanzniveau - empfohlen ist vielfach α = 0,1) übersteigt, wird das Modell als nicht vereinbar mit den Daten abgelehnt. Nun gilt aber, auch aufgrund von Simulationen - d.h. "wahren" (nicht nur Stichproben-)Werten der Varianz-Kovarianz-Matrix, daß einerseits bei großen Stichproben auch kleinste Effekte die Tendenz haben, signifikant zu werden, also zur Ablehnung des Modells führen, andererseits bei kleinen Stichproben ein Bias in Richtung "Bestätigung" besteht.

360

Teil III

Methoden der Datenanalyse in der Marktforschung

(1982) empfehlen deshalb nunmehr, den χ 2 - Wert eher als deskriptive Größe - denn als 7esi-Statistik - zu interpretieren (in dem Sinne, daß hohes χ 2 mit "bad fit" korrespondiert und umgekehrt). Gleichzeitig schlagen sie zwei weitere - deskriptive - Maße vor: "Goodnessof-Fit Index" (GFI) und "Root Mean square Residual" (RMR). Der GFI mißt "die relative Menge an Varianz und Kovarianz, der das Modell insgesamt Rechnung trägt" (FÖRSTER et al. 1984, S. 361 - "the relative amount of variances and covariances jointly accounted for by the model", JÖRESKOG/SÖRBOM 1982, S. 408); für ihn gilt also: "je höher, desto besser". Dagegen ist RMR, gemäß seiner Bezeichnung, ein Maß für den Durchschnitt der Residuen; es gilt also umgekehrt: "je niedriger, desto besser".

JÖRESKOG/SÖRBOM

Beispiel 13-19 (Forts, der vorigen Beisp.) FÖRSTER et al. (1984) geben für ihr Modell G F I mit 0,99 und R M R mit 0,05 an; die (Gesamt-)Anpassung kann also als gut bezeichnet werden. Allerdings weisen auch GFI und RMR die oben erwähnten Tendenzen - insbesondere die der Begünstigung der Akzeptanz des Modells im Falle kleiner Stichproben - auf. BOOMSMA 1982 empfiehlt deshalb für die M.-Methode einen Stichprobenumfang nicht unter 100, möglichst aber über 200. BALDERJAHN (1986b) kommt in einer analog angelegten Simulationsstudie bei der ULS- Methode zu ähnlich schlechten Ergebnissen für kleine Stichproben.

Wenn aber die "overall fit"-Maße nicht als inferenzstatistisch fundierter Test (mit der Entscheidung über Ablehnung oder Nicht-Ablehnung) gedeutet werden können, sondern lediglich als deskriptive Maße, so führt dies letztlich - statt der absoluten - zu einer relativen, vergleichenden Betrachtung. Die Frage ist nun, was miteinander verglichen werden soll. BENTLER/BONETT ( 1 9 8 0 ) haben dafür den Gedanken des "Null-Modells" in einem neuen Sinn vorgetragen: den "incremental fit", die sukzessive Anpassung immer höher parametrisierter Modelle. Dies kann man mit der Idee der "Kreuz-Validierung" - s. auch in Kap. 11 - verbinden (CUDECK/BROWNE 1 9 8 3 ) .

Beispiel 13-20 BALDERJAHN (1986a; vgl. auch ders. 1988) spezifiziert ein Modell mit 25 manifesten und 7 latenten Variablen. Die Stichprobe wird geteilt in ein Validation- und ein Calibration-Subsample. Für letzteres werden mehrere, jeweils höher parametrisierte Modelle geschätzt. Ein "incremental cross-validity index" wird berechnet; als Referenz-Modell dient eines mit gleichen Korrelationen für alle manifesten Variablen. Durch Vertauschung von Validation- und Calibration-Sample ("double cross-validation") kann die Berechnung wiederholt werden. In beiden Fällen schneidet ein Modell M2 - g e r i n g e r e Parametrisierung - besser ab. Bei Betrachtung

Kapitel 13

Allgemeine Ansätze

361

der "goodness-of-fit"-Werte für nur eine Stichprobe verhält sich dagegen das - höher parametrisierte - Modell M 4 gleich gut. Baiderjahn folgert daraus, daß bei nur einer Stichprobe überparametrisierte Modelle präferiert zu werden scheinen.

13.2.3 Anwendung: Beispiele und Probleme Aufgrund der vorstehenden Ausführungen mögen die Probleme bei der Anwendung von Kovarianzstrukturmodellen schon deutlich geworden sein. Ehe darauf, abschließend mit dem Versuch einer Gesamt-Würdigung, etwas näher eingegangen wird, seien noch zwei Beispiele referiert: Beispiel 13-21 (Forts, von oben) FÖRSTER et al. (1984, S. 356f.) interpretieren die geschätzten Parameter wie folgt: Die Ergebnisse stützen "die Annahme, nach der die jeweilige Branchenzugehörigkeit der Unternehmen (ξ)) branchenunterschiedliche produktpolitische Testwirkungen verursacht. Dies gilt zunächst in bezug auf die Berücksichtigung von Testkriterien in der Produktentwicklung (η^), auf die die Branchenzugehörigkeit einen ausgeprägten direkten Effekt entfaltet": yj = -0,65. (Zum negativen Vorzeichen merken die Autoren an - S. 365 -, daß dieses "im Zusammenhang mit der nominal skalierten und als Dummy-Variable behandelten Branchenzugehörigkeit der Unternehmen lediglich [bedeutet], daß der zu erklärende Sachverhalt [hier r|2] bei Herstellern von Waschvollautomaten stärker ausgeprägt ist als bei Herstellern von 3-Weg-Kompaktanlagen".) "Nun zeigen die Untersuchungsergebnisse aber darüber hinaus, daß sich eine Berücksichtigung von Testkriterien in der Produktentwicklung (t|i) positiv auf die Neigung der Unternehmen auswirkt, gegebenenfalls Produktänderungen aufgrund von Testergebnissen vorzunehmen (η 2 ; ß l = 0 , 5 5 ) , und daß dies seinerseits, wenn auch im geringerem Maße, die Berücksichtigung von Testkriterien in der Produktentwicklung fördert (P2 =0,11). Diese Wechselwirkung zwischen r|i und η 2 führt zu einer Verstärkung des direkten Effekts von ξ ι auf r\2 (Totaleffekt von ξ 1 auf η ! = (1- ß j ß 2 ) -1 γι = -0.69). Ferner entsteht aufgrund des durch ß j repräsentierten Zusammenhangs zwischen den beiden produktpolitischen Testwirkungssachverhalten trotz fehlenden direkten Effekts ein indirekter Effekt der Branchenzugehörigkeit (ξι) auf die testinduzierten Produktänderungen (r|2), der ebenfalls durch die Wechselwirkung zwischen η^ und η 2 noch verstärkt wird (Totaleffekt von ξι auf η 2 = (1- ß i ß 2 )"' * Yi ß i = -0,38). Hersteller von Elektrohaushaltsgroßgeräten beziehen demnach Warentestinformationen in höherem Maße in ihre Produktpolitik ein als Hersteller von Produkten der Unterhaltungselektronik, was sich aus dem negativen Vorzeichen der Effekte ergibt. N u r teilweise in Übereinstimmung mit den Ausgangshypothesen wirkt sich im Rahmen des vorliegenden Kausalmodells jedoch die Organisationsgröße ( ξ ^ auf die produktpolitischen Testwirkungen aus. Zwar hat sie der Erwartung entsprechend einen negativen Einfluß auf die testinduzierten Produktänderungen (η 2 ; Y2 = -0,17; Totaleffekt von ξ 2 auf η 2 = (1 - ß t ß 2 )"* γ 2 = -0,18); ein Einfluß auf die

362

Teil III Methoden der Datenanalyse in der Marktforschung

Berücksichtigung von Testkriterien in der Produktentwicklung (r| j) ist dagegen praktisch nicht zu erkennen (Totaleffekt von ξ 2 auf r|i = (1- ßiß 2 ) 72ß2 = " 0>02). Im Gegensatz zur Branchenzugehörigkeit und zur Organisationsgröße entfaltet die Konkurrenzintensität ^3) auf beide produktpolitischen Testwirkungssachverhalte sowohl direkte als auch indirekte Effekte. Dabei wirkt sie sich auf die von Testergebnissen verursachten Produktveränderungen (η^ positiv und damit fördernd aus (γ 4 = 0,32; Totaleffekt von ξ 3 auf η 2 = (1 - PjP 2 ) (γ4 + γ 3 βι) = 0,26), während ihr Einfluß auf die Berücksichtigung von Testkriterien in der Produktentwicklung (t|I) entgegen der Erwartung nicht sehr stark ausgeprägt und negativ ist (73= -0,14; Totaleffekt von ξ 3 auf ηι = (1 - ßiß 2 ) 1 (ϊ3 + l^fo) - -0,12). In beiden Fällen werden die direkten Effekte durch entgegenstehende indirekte Effekte abgeschwächt." Ferner wird auf die "beträchtliche Erklärungsleistung" in bezug auf die produktpolitischen Testwirkungen hingewiesen: Anteil der erklärten Varianz bei r|j 50% und η 2 84%. Beispiel 13-22 Ein von HILDEBRANDT (1983 - im 5. Teil seiner Arbeit) konstruiertes Modell bezieht sich ebenfalls auf den "Warentest"; Ziel ist "eine bessere Erklärung und Prognose der Rezeption von Warentestinformationen, insbesondere der Nutzung der Zeitschrift 'test'" (S. 192). Schließlich wurden 4 Modelle - damals noch mit LISREL 4 - getestet; die Ergebnisse "waren enttäuschend. Bei 399 Befragten, dem Sample der 'test'-Kenner, zeigte kein Modell einen adäquaten Fit" (S.251).

In den letzten Jahren häuften sich in der Literatur Berichte über Beispiele. Gleichwohl existieren gemäß den obigen Ausführungen, auch zahlreiche Probleme. Eines davon soll hier noch einmal aufgegriffen werden, weil es grundlegend scheint: die Gefahr der Verletzung von Basisprinzipien der wissenschaftlichen Schlußweise ("basic principle of scientific inference" vgl. dazu CLIFF 1 9 8 3 ) . Insbesondere ist dabei an eines zu denken: Daten "bestätigen" nicht ein Modell; sie können allenfalls dazu dienen, daß eine "Nicht-Bestätigung" unterbleibt. Wenn letzteres aber eintritt, so bedeutet das auch, daß zahlreiche andere Modelle existieren können, deren "NichtBestätigung" ebenfalls unterbleibt. Die oben geäußerte Reserve gegenüber der Bezeichnung "Kausalmodelle" (s. dazu die Uberschrift: "Do We Really Believe Our Models?" in DILLON 1986) mag auch noch in einer etwas anderen Richtung als begründet erscheinen: Die angestrebte "Konfrontation der Theorie mit den Daten" bedeutet, daß ein Modell aus theoriegeleiteten Hypothesen aufgebaut wird; erfolgt mittels der Daten eine "Nicht-Bestätigung", so ist auch das Modell abgelehnt (und insoweit, als die "Ableitung" nicht fehlerhaft war, auch die Theorie); s. dazu auch das oben, in Beisp. 13-22 referierte Vor-

Kapitel 13

Allgemeine Ansätze

363

gehen von HILDEBRANDT (1983), der konsequenterweise nach der NichtBestätigung mit seiner Arbeit abschloß. Das weitere Vorgehen bei der Nicht-Bestätigung könnte allenfalls so sein, daß über neue theoretische Einsichten ein neues Modell entwickelt und dieses dann wieder "getestet" wird. Demgegenüber geht man aber vielfach so vor, allein aufgrund des Daten-Outputs nach Hinweisen für die "Verbesserung" des Modells zu suchen. Der "kausale" Charakter wird dadurch noch fraglicher; letztlich bleibt offen, welche "Theorien" den Daten gegenübergestellt werden. LEAMER (1978, S. V) hat für den Prozeß der Suche des Forschers von einer ModellSpezifikation zu einer anderen den Ausdruck "Spezimetrie" (!) geprägt. (SCHNELL spricht in diesem Zusammenhang von einer „Übung in der Kunst der Modellanpassung" - 1994, S. 335.) Das Programm LISREL sieht nunmehr ausdrücklich den Output von "Modifikationsindizes" vor, die Hinweise auf die Veränderung des Modells zur Verbesserung des "Fit" liefern sollen.

Damit soll nicht grundsätzlich die große Bedeutung des Ansatzes für die Entwicklung der Theorie bestritten werden. (Eher war auf die noch zu lösenden Probleme und die Gefahren von Fehlinterpretationen hinzuweisen.) Unabhängig von dieser Bedeutung für die Grundlagenforschung bleibt jedoch nach der für die Praxis der Marktforschung zu fragen, oder aber: nach der Relation von möglichem Informationsgew'mn zu entstehendem Aufwand. Hier scheint den Verf. eine allzu große Euphorie eigentlich noch weniger angebracht.

Literaturhinweise 1. Das Conjoint Measurement wird in vielen - zumal neueren - Lehrbüchern zu multivariaten Methoden allgemein relativ ausführlich behandelt. (Vgl. nur als Beispiel: BACKHAUS et al. 2 0 0 0 , S. 5 6 4 - 6 2 6 . ) Besondere Monographien liegen dagegen primär im Zusammenhang mit spezifischen Anwendungen vor. Man könnte hier etwa die bereits erwähnte Schrift von SCHWEIKL 1 9 8 5 oder die von REINERS 1 9 9 6 nennen; weiterhin sei auf GUSTAFSSON/HERRMANN/HUBER, (Hrsg.), 2 0 0 1 verwiesen.

364

Teil III

Methoden der Datenanalyse in der Marktforschung

2. Für die Kovarianzstrukturanalyse gilt Ähnliches. (Vgl. nur als Beispiel zu allgemeinen Lehrbüchern über multivariate Methoden·. BACKHAUS et al. 2000, S. 390-498.) Hier existieren ebenfalls einerseits Schriften, bei denen die methodischen Darlegungen in einen Anwendungsbezug "verpackt" sind (so, im Text bereits erwähnt: HILDEBRANDT 1983, und, hier zusätzlich aufgeführt: HOMBURG 1989). Daneben gibt es jedoch auch "eigenständige" Werke - in dem Sinne, daß die Darstellung des Verfahrens im Vordergrund steht -, so, neben den im Text bereits erwähnten Schriften, HAYDUK 1996 und MUELLER 1996. Vgl. zu beiden Aspekten auch HILDEBRANDT/HOMBURG (Hrsg.) 1998.

Aufgaben 13-1:

Eine (Produkt-)Eigenschaft sei mit Ej, mit j von 1 bis n, bezeichnet; analog sollen die einzelnen Ausprägungen von 1 bis m laufen. Zeigen Sie für die im Beisp. 13-1 und -4 angegebenen 9 Profile (P), welche Treatment-Kombinationen verwandt wurden, nach folgendem Muster: Ρ

Ej (Markenname)

E 2 (Packmittel)

1

1

1

E 3 (Preis)

1

(mit 1 für PEPSI, 2 C O C A und 3 SINCO sowie 1 Dose, 2 Glasund 3 Kunststoffflasche, ferner 1 dem niedrigeren und 2 dem höheren Preis)! 13-2:

Konstruieren Sie für den vorstehenden Fall das vollständige Design und zeigen Sie, wie daraus das ««vollständige (lt. Lösung zur vorigen Aufgabe) entsteht!

13-3:

Stellen Sie das Meßmodt\[ für die endogenen Variablen von Beisp. 13-14 graphisch, in der Art von Darst. 13-2, dar (unter der Annahme, daß die latenten Variablen korreliert sind)!

13-4:

Geben Sie die Matrix Θ ε und damit das Meßmodell für die endogenen Variablen insgesamt (gemäß der Schreibweise im Text) an!

Teil IV

Sachgebiete der betriebswirtschaftlichen Marktforschung

Einführung:

Zur Systematik der Anwendungsbereiche der Marktforschung

In diesem IV. Teil soll eine Ubersicht über die Anwendungsbereiche der Marktforschung, über ihre Sachgebiete, gegeben werden. Es handelt sich dabei also nicht um eine vorwiegend methodisch, sondern um eine primär sachlich ausgerichtete Betrachtung; es soll in erster Linie das Zusammenwirken der verschiedenen Methoden zur Lösung der sachlichen Aufgaben gezeigt werden. Allerdings ist das Ziel dabei nicht eine bis ins einzelne gehende, detaillierte Darstellung, sondern nur ein grober Uberblick über die verschiedenen Anwendungsgebiete. Dies scheint um so eher möglich, als in den früheren Ausführungen bereits zahlreiche Beispiele für konkrete Anwendungen der jeweiligen Methoden gegeben wurden. Allerdings bedeutet der Einsatz in den einzelnen, ζ. T. sehr speziellen Sachgebieten - wie etwa der Werbeforschung - auch, daß im Einzelfall besondere Ausprägungen der "Grundmethoden" entwickelt wurden; insofern enthält dieser Teil noch neue Methoden. Die Systematisierung der vielfältigen Anwendungsbereiche kann nun in durchaus verschiedener Weise erfolgen. Hier wird zunächst eine Einteilung in einen allgemeinen und einen besonderen Bereich vorgenommen. Ersterer bezieht sich inhaltlich im wesentlichen auf die Marktforschung für Konsumgüter, letzterer - erörtert in Kap. 17 - auf die Marktforschung für Investitionsgüter und für Dienstleistungen sowie, wegen ihrer Besonderheiten, die "Auslandsmarktforschung" schlechthin. Obwohl die Trennung in einen allgemeinen und einen besonderen Bereich primär davon ausgeht, wo das generelle, in den Teilen II und III dargestellte Instrumentarium eingesetzt werden kann oder wegen der Spezifika u.U. stärkerer Modifikationen bedarf, führt sie letztlich zu einer Art Differenzierung gemäß dem "commodity

366

Teil IV

Sachgebiete der betrieblichen Marktforschung

approach", einer auf den besonderen Charakter des jeweiligen "Gutes" beruhenden Spezialisierung. Diesen Approach könnte man selbstverständlich sehr viel weitergehend verfolgen, sowohl innerhalb der großen Gruppen als auch über diese hinaus. (So wird z.B. abweichend von einigen Vor-Auflagen die "landwirtschaftliche Marktforschung" nicht mehr erörtert. Der Wegfall von "Finanz-", "Arbeits-" und "Beschaffungsmarktforschung" folgt schon aus der in Kap. 1 begründeten Abgrenzung.)

Der Bereich der Absatz-Marktforschung im allgemeinen läßt sich zweiteilen danach, ob - gewissermaßen mehr passiv - die Größe und Entwicklung des Marktes schlechthin untersucht wird oder konkret die Wirkung des Einsatzes der absatzpolitischen Maßnahmen. Ersteres geschieht im folgenden Kap. 14. Die nächsten beiden Kapitel sind den absatzpolitischen Maßnahmen vorbehalten. Deren Vielzahl wird in der Regel in der deutschen Literatur (seit GUTENBERG 1955) unter dem Begriff des "absatzpolitischen Instrumentariums" zusammengefaßt. Von diesen - in Kap. 2 bereits erwähnten - 4 P's des Marketinginstrumentariums ("Product", "Price", "Promotion", "Place") werden in den folgenden Kapiteln jedoch nur 2 behandelt: "Promotion" in Kap. 16 (Werbeforschung - "Advertising Research") und "Product" in Kap. 15 (Produkttest - Verkaufstest Ladentest). Auf die besondere Erörterung der Distribution (für "Place") wird deshalb verzichtet, weil sich ein - mehr oder weniger geschlossenes - Distribution Research nicht herausgebildet zu haben scheint. Vielmehr werden hier eher - wichtige! - Sonderprobleme untersucht, wie etwa "Konflikt zwischen Industrie und Handel" (oder "power" in den "marketing channels") und des Entgelts - im weiteren Sinne - in Verkaufs(außen)organisationen. Dagegen ist das Instrumentarium für Pricing Research durchaus vielfältig. Wenn hier auf eine gesonderte Behandlung, in einem eigenen Kapitel, verzichtet wird, so deshalb, weil der Preis als eine spezielle Eigenschaft eines Produktes angesehen und deshalb - allein oder in Zusammenhang mit anderen Produktmerkmalen - im Rahmen von "Produkttests" usw. behandelt werden kann. (S. dazu unten, Kap. 15 - und auch oben, Conjoint Measurement, in Kap. 13.) In diesem Zusammenhang sei noch kurz auf einen Begriff eingegangen, der vor einiger Zeit eine gewisse Prominenz erhalten hatte: den des

Einführung: Zur Systematik der Anwendungsbereiche der Marktforschung

367

Markenwertes („brand, equity"). Diese Prominenz rührt sicher auch aus Pressemeldungen über die Höhe des Wertes dieser oder jener Marke. Ganz abgesehen davon, daß über die verschiedenen - bis heute recht umstrittenen - Meßmodelle für eine bestimmte Marke bisweilen sehr weit auseinanderliegende Zahlen ermittelt wurden, ist zu analysieren, welche Ziele mit einer Markenbewertung verfolgt werden können. Dabei tritt auch zutage, daß ein Großteil dieser Ziele unternehmensexîemer Natur ist. Im Vordergrund steht dabei wohl der Kauf und Verkauf von Markenrechten, allein oder im Zusammenhang mit der Akquisition des ganzen Unternehmens. Dabei kommt der „Markenwert" in die Nähe von Begriffen wie „Firmenwert" oder „Unternehmenswert" (Wert der Unternehmung im ganzen) und wird damit zu einem Bewertungs- bzw. Bilanzierungsproblem (Aktivierung in der Bilanz!). Unternehmensíwíera kann allerdings der „Markenwert" ebenfalls im Sinne der langfristigen Investition („im Markt") gesehen werden. Obwohl dafür auch Meßansätze von Marktforschungsinstituten vorliegen, soll von der Erörterung solcher Ansätze und der damit verbundenen Probleme hier abgesehen und stattdessen auf die Literatur verwiesen werden (z.B. E S C H 2 0 0 0 , IRMSCHER 1 9 9 6 sowie 1 9 9 7 , S A T T L E R 1 9 9 5 , 1 9 9 7 sowie 2 0 0 1 und S A N D E R 1 9 9 4 ) . Dies dürfte um so vertretbarer sein, als einerseits das Interesse der Praxis besonders dann stark zunehmen dürfte, wenn eine „Aktivierung" gesetzlich vorgeschrieben wird, und andererseits die Messung eher „kurzfristiger" und vor allem nicht in einem einzigen Geldausdruck kulminierender Sachverhalte, wie z.B. Markenpräferenz, Markenbekanntheit, Markentreue, schon bislang zum „Standardrepertoire" der Marktforschung gehört.

Kapitel 14 Analyse und Prognose der Entwicklung des Marktes Der "Markt" kann einerseits global, als Gesamtmzrkt, oder in seiner regionalen Differenzierung aufgefaßt werden. Zweitens kann man mehr auf die früheren Entwicklungen bzw. den gegenwärtigen Stand und dessen Analyse, also die Diagnose, oder die zukünftige voraussichtliche Entwicklung, also die Prognose, abstellen. Die Kombination ergibt formal - 4 Möglichkeiten. Die folgende Untergliederung des Kapitels zeigt zwar ebenfalls 4 Abschnitte, aber in - geringfügig - anderer Einteilung: Abschnitt 1 erörtert, einschließlich der erforderlichen Definitionen, den Stand des Ge&zmimarktes. Der Marktanteil und seine regionale - Analyse wird in Abschnitt 2 diskutiert. Ebenfalls der regionalen Differenzierung des Gesamtmarktes zugehörig ist das in Abschnitt 3 behandelte Sondergebiet der Marktindikatoren. In Abschnitt 4 werden schließlich, zusammenfassend und mehr nur überblicksartig, Markt- und Absatzprognosen dargestellt.

14.1 Die Ermittlung der Größe des Marktes In einer früheren Auflage dieses Buches war die Marktforschung als die systematische - Untersuchung eines konkreten Teilmarktes bezeichnet worden. Wenngleich dies heute als etwas eng erscheinen muß, so deutet es doch auf eine der wichtigsten und ursprünglichsten Aufgaben der Marktforschung hin: die Untersuchung der Größe (und Merkmale) eines konkret abgegrenzten Marktes. Die Marktabgrenzung stellt in der Praxis ein Problem dar. Denn kaum jemals liegt ein "homogenes Gut" (im Sinne der Markttheorie) vor. Was aber ist als relevanter Markt (ein Begriff, der auch juristische Bedeutung hat, etwa im Zusammenhang des "Kartellgesetzes" - GWB, Gesetz gegen Wettbewerbsbeschränkungen) zu verstehen? Bei Automobilen ζ. B.: nur Pkw oder auch Lkw? Bei ersteren: nur "Kleinwagen" (wie abgegrenzt?) oder auch "Mittelklassewagen" (?) usw. Zu dieser gutsmäßigen Abgrenzung können andere Kriterien treten: Abnehmergruppen, Länder etc. Benötigt wird die Marktabgrenzung, neben der genannten juristischen Bedeutung und der unten zu diskutierenden "Homogenität" bei der Ermittlung des Marktanteils, natürlich zur Zielgraßpenbestimmung im Rahmen der Festlegung der Marketingstrategie.

Kapitel 14 Analyse und Prognose der Entwicklung des Marktes

369

Dazu sind auch die Merkmale des Marktes bzw. der Marktteilnehmer erforderlich. Soweit letztere - von der Seite der Nachfrage also - Verbraucher sind, wird im folgenden hierauf nicht mehr eingegangen. Aus den früheren Ausführungen sollte deutlich geworden sein, daß dazu neben "psychographischen" insbesondere auch die üblichen "soziodemographischen" Charakteristika von Bedeutung sind. Berücksichtigt man auch die Angebotsseite, sind sie die Zahl und Struktur usw., also die Merkmale der Wettbewerber, einzubeziehen. Wie in Kap. 1 bereits bemerkt, ist eine solche "Wettbewerbsforschung" im Grunde nichts Neues. Dies kommt besonders auch in den Kennzahlen zur Marktgröße zum Ausdruck:

Hinsichtlich der Größe des Marktes kann man folgende Unterscheidung treffen: I. abgestellt allein auf den Gesamtm&rkt (als Summe von "eigenen" und "fremden" Umsätzen - also nicht im Hinblick auf die regionale Differenzierung), in absoluten Zahlen: Zwischen Umsatz und Absatz wird hier nicht unterschieden: weder in Richtung des Ergebnisses der Marketing-Aktivitäten und dieser selbst, also die Funktion bzw. den Prozeß, noch bezüglich Menge und Wert.

(1) Marktkapazität Hierunter kann die rein von der Bedarfsseite her, ohne Berücksichtigung der Kaufkraft, gegebene Aufnahmefähigkeit des - konkreten, d. h. "abgegrenzten" Marktes verstanden werden.

(2) Marktpotential Dieser Begriff bezeichnet die unter Berücksichtigung der Kaufkraft gegebene Aufnahmefähigkeit des Marktes, also die mögliche Nachfrage.

(3) Marktvolumen Das Marktvolumen ist die Gesamtheit der getätigten mengen- oder wertmäßigen - Umsätze auf einem Markt, also die tatsächliche Nachfrage (bei den gegebenen Preisen). Als Marktausschöpfung (oder "Marktausschöpfungsgrad") kann das Verhältnis von Marktvolumen zu Marktpotential ( · 100) bezeichnet werden.

II. abgestellt nur auf das eigene Unternehmen, absolut: (4) Absatzvolumen Es umschließt die Gesamtheit der auf einem bestimmten Markt getätigten eigenen Umsätze.

III. abgestellt sowohl auf das eigene Unternehmen als auch den Gesamtmarkt: A. absolut·. (5) Absatzpotential Als Absatzpotential kann man den in einem bestimmten Markt maximal möglichen Umsatz bezeichnen. (Rechnerisch ergibt es sich aus dem potentiellen Marktanteil, dem höchsten eigenen Anteil am Marktpotential.)

370

Teil IV Sachgebiete der betriebswirtschaftlichen Marktforschung

B. relativ: (6) Marktanteil Der Marktanteil ist das prozentuale Verhältnis der auf einem bestimmten Markt getätigten eigenen - mengen- oder wertmäßigen - Umsätze zur Gesamtheit aller (eigenen und fremden) entsprechenden Umsätze, also der Anteil des Absatzvolumens am Marktvolumen. Terminologisch günstiger wäre es - weil dann alle Begriffe, die sich (nur oder auch, also Gruppe II und III zusammen) auf die eigene Unternehmung beziehen, von denen der Gruppe I unterschieden würden -, bei (6) von Absatzanteil zu sprechen; der Begriff "Marktanteil" hat sich jedoch eingebürgert. S. zu der weiteren Relativierung der an sich schon relativen Größe, dem "relativen Marktanteil", in Abschnitt 2.

Bei Gütern, deren Lebensdauer nicht vernachlässigbar gering ist, also speziell bei Gebrauchsgütern, vermag darüber hinaus zwischen Bestands- und A ¿>5íí£zentwicklung differenziert zu werden. Bei unbegrenzter Lebensdauer kann man erstere als Kurve der kumulierten Umsätze, letztere umgekehrt als erste Ableitung der Bestandsentwicklung betrachten. Unterstellt man eine Marktsättigung und für die Zeit des Marktwachstums einen symmetrischen Verlauf, in Gestalt einer Normalverteilung, entsprechend der Theorie der "Diffusion von Innovationen" (ROGERS 1988, 1. Aufl. 1962) begründet durch die verschiedenartige Reaktionsstruktur des Menschen -, so läßt sich die Entwicklung gemäß Darst. 14-1 veranschaulichen. Für Prognosezwecke wird statt von der Normalverteilung oft von der logistischen Funktion ausgegangen. Das ist deshalb möglich, weil sich beide im Verlauf sehr stark ähneln: SCHRÖDER (1958) hat nachgewiesen, daß die Abweichung zwischen der logistischen Kurve und der Gauß'schen Verteilungskurve (II im Schaubild) höchstens 2,1 % betragen kann.

Die bisherigen Betrachtungen bezogen sich nur auf die Neu-Nachfrage. Dazu kommt, in Abhängigkeit von der Lebensdauer, die ErsatzNachfrage. (Bei einem "ewig" verwendbaren Gut würde sie Null betragen, bei einem in der Periode t zu ersetzenden Artikel würde der Absatz vom Zeitpunkt der "vollen" Marktversorgung an konstant bleiben!)

Kapitel 14 Analyse und Prognose der Entwicklung des Marktes

1 1 1 1 1

371

A-" /n

/

J

//\ Λ

1 // 1' \ j / hf-t1/ '

1 ι

\

I \

'

Zeit

Wachstum

Schrumpfung

progressiv (1) degressiv (2) progressiv (3) degressiv (4)

Markt•-Sättigung Marktreife *0% 50% 100% Sättigung I = Umsatz (absolut oder in %, nicht-kumulierte Häufigkeit) Π = Sättigungsgrad (in %, kumulierte Häufigkeit)

Darst. 14-1: Marktwachstum und Marktsättigung (4-Phasen-Schema des Produktlebenszyklus) Beispiel 14-1 Der Umfang des Pkw-Marktes soll festgestellt werden. Nach der Abgrenzung des Begriffes "Personenkraftwagen" (ζ. B. Einordnung der Krankenfahrzeuge, Kombiwagen usw.) bedarf es dazu der Erkenntnis des Zusammenhangs zwischen Bestand und Nachfrage. Er läßt sich gemäß Darst. 14-2 (folgende Seite) abbilden. Ginge man davon aus, daß die Importe und Exporte gebrauchter Kraftfahrzeuge wegen ihrer Geringfügigkeit bzw. der Vermutung, daß sie sich in etwa ausgleichen, vernachlässigt werden könnten, so ergäbe sich die Größe des Marktes im Grunde aus der Statistik über die Zulassung fabrikneuer Fahrzeuge. Der Vergleich mit dem Bestand der Vorperiode erlaubt dann weiter die Aussage darüber, welcher Teil dieser Neuzulasungen auf die Neunachfrage und wieviel auf die Ersatznachfrage zurückzuführen ist. Eine empirische Analyse von SCHÜLEN (1985) zur Prognose des Pkw-Marktvolumens erbrachte übrigens, daß dafür die Altersstruktur des - in "erster Hand" gehaltenen Pkw-Bestandes maßgeblich ist.

372

Teil IV Sachgebiete der betriebswirtschaftlichen Marktforschung

i Neunachfrage V

Ex

Ζ

> Ersatznachfrage

Im

Bestand am Ende der Periode t

t=l

Legende: Ζ = Zugang neuer Fahrzeuge; Im = Import gebrauchter Fahrzeuge; V = verschrottete (endgültig aus dem Verkehr gezogene) Fahrzeuge Darst. 14-2: Bestand und Nachfrage im Pkw-Markt (nach SIEBKE 1963, S.44)

14.2 Der Marktanteil und seine Analyse Die rechnerische Ermittlung des Marktanteils ist, gemäß obiger Definition, einfach: eigener Umsatz Gesamtumsatz

• 100

Beispiel 14-2 Der Zigarettenabsatz betrug aufgrund von Angaben der amtlichen Statistik im Bundesgebiet und in West-Berlin 1961 im Monatsdurchschnitt 6503 Mill. Stück, 1954 nur 3305 Mill. Stück; die Zahlen der eigenen Statistik weisen einen Absatz für 1961 (ebenfalls Monatsdurchschnitt) von 1000 Mill. Stück und für 1954 800 Mill. Stück aus. Es ergeben sich folgende Marktanteile: 1 9 5 4 : - ^ - - 1 0 0 =24,2%, 3305

Kapitel 14 Analyse und Prognose der Entwicklung des Marktes

373

100 1961——--100 = 15,4%, 6503 d.h., ein Sinken des Anteils trotz absolut gestiegener Umsätze. (Quelle: FICKEL 1962.)

Wie erwähnt (und aus der Diktion des Beispiels ersichtlich), soll begrifflich nicht zwischen "Absatz" und "Umsatz" unterschieden werden. Nichtsdestoweniger können selbstverständlich die Anteile nach Menge und Wert differieren. (Drittens kann es sich um den "Käufer"-Anteil "Kunden"-Anteil; SPIEGEL [1961] verwendete den Begriff "Feldanteil" handeln: den Anteil der Käufer des eigenen Produkts an der Gesamtzahl der Käufer dieses Produkts.) Das ist, etwa im Hinblick auf die sachliche Richtigkeit von Werbeaussagen, in der Praxis zu beachten - zumal nicht von vornherein die eine oder andere Art der Messung zu präferieren sein dürfte. Dagegen wird man dem Abstellen auf den Absatz gegenüber dem auf die Produktion den Vorzug geben müssen: Die Bezugnahme der eigenen Produktion auf die Gesamtproduktion enthält ja auch die "Produktion auf Lager", bzw., anders ausgedrückt, noch nicht die marktmäßige Realisierung. Wird, wie vielfach bei Konsumgütern, der Absatz über den Handel vorgenommen, ist die Realisierung im Grunde erst durch den Absatz an Endverbraucher erfolgt. Insofern wäre der durch Panels ausgewiesene Marktanteil vorzuziehen. (Obwohl auch dabei noch mitunter nicht unbeachtliche Differenzen etwa zwischen den Ergebnissen von Einzelhandels- und Haushalts-Vunels auftreten können; s. dazu Kap. 7.) Damit ist im Grunde auch schon das Homogenitätsprinzip (FUCHS 1963) angesprochen; das Erfordernis der Abstimmung der eigenen Zahlen mit denen für den Gesamtmzrkt. Beispiel 14-3 Eine Schuhfabrik möchte ihren Marktanteil sowohl insgesamt für Schuhe als auch für die einzelnen Sorten (Straßenschuhe, Arbeitsschuhe usw.) ermitteln. Der eigene Absatz ist aus der entsprechend ausgerichteten Verkaufsstatistik bekannt. Den Gesamtumsatz der Schuhindustrie kann man aus dem Statistischen Jahrbuch (1995) allerdings nicht entnehmen; es bedarf also der Heranziehung zusätzlicher amtlicher statistischer Quellen oder der Anfrage beim zuständigen Fachverband etc. Andererseits weist das Jahrbuch unter der Rubrik "Produktion ausgewählter Erzeugnisse" die Produktion von Schuhen spezifiziert nach einigen Sorten - sowie nach Menge und Wert - aus, so daß hieraus auch die Berechnung von

374

Teil IV Sachgebiete der betriebswirtschaftlichen Marktforschung

Marktanteilen möglich wäre. Jedoch handelt es sich hier eben um die Produktion, nicht den Absatz; es ist also auch dabei durch die Heranziehung zusätzlicher Quellen die Abstimmung zwischen den eigenen Absatzzahlen und dem Gesamtmarktvolumen herzustellen. (Noch weniger nützlich dürften in diesem Fall die Daten unter "Versorgung" sein; hier werden neben Produktion zwar auch Einund Ausfuhr nachgewiesen, aber nur für "Schuhe" insgesamt in "Mio. Paar".)

Aus dem Dargelegten folgt, daß es sich beim Marktanteil um eine Verhältniszahl (im Sinne der in der deskriptiven Statistik üblichen Terminologie - Untergruppe: Gliederungszahl) handelt. Im Rahmen der Literatur zur strategischen Unternehmensführung ist darüber hinaus jedoch der Begriff des relativen Marktanteils entwickelt worden. Im Zusammenhang mit dem PIMS-Projekt - Profit Impact of Market Strategy - wurde dabei die Vorstellung des "Portfolio" geprägt. In seiner einfachsten Form geht dies, unter Zugrundelegung des Konzepts der "Erfahrungskurve" und des "Produkt-Lebenszyklus" sowie aufgrund der aus den PIMS-Studien abgeleiteten direkten, linearen Beziehung zwischen Marktanteil und Gewinn, von der "Marktwachstum-Marktanteil-Matrix" (für Strategische Geschäftseinheiten - SGE - oder einfach Produktgruppen bzw. Produkte) gemäß Darst. 14-3 aus:

Markt-

Λ

"Stars" (Zukunftsprodukte)

hoch

"Fragezeichen" (Nachwuchsprodukte)

niedrig

"Dogs" (Ergänzungsprodukte)

"Cows" (Basisprodukte)

niedrig

hoch

-t>

(relativer) Marktanteil

Darst. 14-3: Marktwachstum-Marktanteil-Portfolio Für die Marktforschung handelt es sich dabei sicher nicht um die Entscheidung über das "Soll-Portfolio", sondern die Informationen für die Aufstellung des "Ist-Portfolios". Die dabei auftretenden Probleme beginnen mit der Frage, welche der zahlreichen Portfolio-Varianten zugrunde gelegt werden soll (und dem Problem, daß etwa PORTER [1980]

Kapitel 14 Analyse und Prognose der Entwicklung des Marktes

375

gerade nicht vom erwähnten linearen Zusammenhang, sondern einer UKurve ausgeht). Sie setzen sich fort - bleibt man bei der dargestellten Matrix - über die Definition von "Marktwachstum" bis eben auch zum "relativen Marktanteil". Üblicherweise wird dabei von der Bezugnahme des eigenen Marktanteils auf den des stärksten Konkurrenten ausgegangen. Möglich sind aber auch andere Definitionen. Beispiel 14-4 Die (absoluten) Marktanteile in einem Markt seien: für A 40%, Β 30%, C 20% und D (Sonstige) 10%. Für A können folgende "relative" Marktanteile berechnet werden: 40 1. Bezugnahme auf den stärksten Konkurrenten: — = 1,3(!) 2. dto. auf die Summe der beiden stärksten Konkurrenten: 40 — — — = 0,8 30+20 40 3. dto. auf alle Konkurrenten: — = 0,7

60

(S. dazu auch A 14-2.)

Bisweilen findet man auch den Begriff des relativen Marktvolumens. Er bezieht sich allerdings auf die regionale Analyse des Marktanteils und meint dann das Marktvolumen pro Region. (Zur Ermittlung desselben bzw., anders formuliert, zur Aufteilung des gesamten Marktvolumens auf die einzelnen Regionen s. nächsten Abschnitt.) Damit kann dann auch der regionale Marktausschöpfungsgrad berechnet werden. Dieser läßt sich auch als Leistungsindex bezeichnen bzw. deuten. Als Beurteilungsmaßstab für die Leistung der einzelnen Mitglieder des Verkaufsaußendienstes eignet er sich allerdings nur bedingt. Dazu müßten die Differenzen in den regionalen Marktanteilen ausschließlich auf die verschiedene Verkaufsintensität der einzelnen Vertreter usw. zurückzuführen sein, das jeweilige regionale Absatzvolumen also weder durch die Unterschiede in den von der Unternehmung beeinflußbaren Faktoren (Struktur der Verkaufsorganisation, Werbung usw.), noch durch solche in den nicht beeinflußbaren Faktoren (Wettbewerbsverhältnissse usw.) verändert werden.

Die Berechnung ist möglich - jeweils unter Multiplikation mit 100 erstens durch Beziehung des Ist-Absatzes auf den Soll-Absatz, zweitens durch die Bildung des Verhältnisses von Ist-Marktanteil zu SollMarktanteil, drittens schließlich durch Beziehung des prozentualen Anteils des Gebietes am gesamten Absatzvolumen auf den Prozentanteil

376

Teil IV Sachgebiete der betriebswirtschaftlichen Marktforschung

des regionalen Marktvolumens am gesamten Marktvolumen. Ferner können natürlich die absoluten Abweichungen in Form von Verkaufsdefizit und -Überschuß ausgewiesen werden. Beispiel 14-5 Das Gesamtabsatzgebiet bestehe aus 4 Regionen A, B, C und D, deren Aufnahmefähigkeit 40, 30, 20 und 10% des Gesamtmarktvolumens von 100 000 Stück betrage. In den einzelnen Regionen seien abgesetzt worden: 4375, 4167, 1875 und 2083 Stück. Die Ergebnisse der Berechnungen sind in Darst. 14-4 zusammengefaßt. (Zu den erwähnten 3 Berechnungsarten s. A 14-3. Wegen eines weiteren Rechenbeispiels s. A 144.)

Aufnahmefähigkeit

Gebiet

in Stück A Β C D Insgesamt

VerkaufsSoll

in % in Stück

LeiVerkaufsMarkt- stungs- defizitindex bzw. anteil -Überschuß in % in % in % in Stück

Verkäufe-Ist in Stück

40 000 30 000 20 000 10 000

40 30 20 10

5 000 3 750 2 500 1 250

4 375 4 167 1 875 2 083

100 000

100

12 500

12 500

35 331/3 15 162/3

10,9 13,9 9,4 20,8

87,5 111,1 75,0 166,6

100

12,5

100

+ +

625 417 625 833 0

Darst. 14-4: regionale Analyse des Marktanteils (1. Beispiel)

14.3 Die Heranziehung von Marktindikatoren Marktindikatoren (oder Marktindizes) dienen als Schlüssel zur Aufteilung des Gesamtmarktvolumens auf die regionalen Teilmärkte. Dabei muß natürlich ihr Indikationswert sorgfältig geprüft werden, entweder mehr theoretisch-deduktiv oder empirisch (s. dazu das nachstehende Beispiel). Als allgemeine Marktindikatoren kommen in Betracht (zu speziellen s. unten): 1. Bevölkerung Beispiel 14-6 Gesucht wird ein Verteilungsschlüssel zur Aufteilung des Marktvolumens für Benzin. Er wird in der Verteilung der Gesamtbevölkerung vermutet.

Kapitel 14 Analyse und Prognose der Entwicklung des Marktes

377

Die Prüfung der Brauchbarkeit des Indikators kann aufgrund der bekannten Zahlen der Vergangenheit erfolgen. Für die regionale Bevölkerungsstruktur wird dabei die "Einwohnerdichte" (Einwohner je qkm) verwendet. Für die einzelnen Dichtestufen oder -klassen können dann Prozentanteile berechnet und diese kumuliert werden. Trägt man die kumulierten Werte in ein Koordinatensystem ein, das auf der Abszisse das Benzinmarktvolumen in Prozent, also von 0 bis 100, auf der Ordinate die Einwohner in Prozent, in gleichem Maßstab, ausweist, so müßte sich bei völliger Entsprechung eine Linie mit einer Steigung von 45° ergeben. Die Abweichung der aufgrund der tatsächlichen Werte gebildeten Kurve von dieser 45°-Linie zeigt das Ausmaß der Verschiedenheit, der Strukturdivergenz, und damit die Brauchbarkeit des Indikators an. (Vgl. dazu FUCHS 1963, S. 54 ff.)

2. Kaufkraft Hier wird nicht auf die Zahl der Einwohner, sondern auf die Ausstattung der Bevölkerung mit Kaufkraft abgestellt; es werden Kaufkraftkennziffern errechnet und diese gegebenenfalls als Kaufkraftkarte dargestellt. Derartige Ergebnisse wurden in der Vergangenheit insbesondere von der GfK vorgestellt. (S. dazu auch den in der 1. Auflage dieses Buches 1965 - zwischen den Seiten 160 und 161 - wiedergegebenen farbigen Auszug aus der "GfK-Kaufkraftkarte".) Heute werden regional recht tief gegliederte Zahlen von verschiedenen Instituten veröffentlicht. So umfaßten die "Kaufkraftkennziffern 1995" von macrom (München) "14892 Gemeinden plus 1811 Gemeindeteile der 209 größten Städte" und die "Kaufkraftkennziffern 1996-1998" der BBE (Köln) waren „erhältlich für ... 14931 Gemeinden incl. Stadtbezirke größerer Städte über 100 000 Einwohner" usw.

3. Steueraufkommen"oder "Industriestruktur" Während die vorgenannten Indikatoren eher für Konsumgüter in Betracht kommen, sind allgemeine Kennziffern für die "Wirtschaftskraft" etwa das Steueraufkommen, evtl. verdichtet zu Steuerkraftkennziffern, oder die Industriestruktur. Letztere ist insbesondere für Investitionsgüter von Bedeutung: Im Unterschied zur "Regionalstruktur", die - immer gemessen an den Beschäftigtenzahlen - die Aufteilung der gesamten Industrie innerhalb der Region auf die einzelnen Branchen kennzeichnet (z.B.: Industriezweig I = 25%), gibt die "Industriestruktur" für einen bestimmten Industriezweig (ζ. Β. I) die regionale Aufteilung der Gesamtindustrie an (ζ. B. Region A 20%) und ermöglicht damit unmittelbar die Aufschlüsselung des Marktvolumens. Daneben können für die einzelnen Branchen und Sektoren die verschiedensten speziellen Indikatoren herangezogen werden, wie etwa die Zahl der Arbeiter oder geleistete Arbeitsstunden für die arbeitsintensive Industrie, Energieverbrauch für die kapitalintensive Industrie, der

378

Teil IV Sachgebiete der betriebswirtschaftlichen Marktforschung

Kraftfahrzeugbestand zur Analyse des Benzin- und Motorenölmarktes, die Zahl der Eheschließungen für den Markt für Wohnmöbel. Die Anzahl der erteilten Baugenehmigungen bzw. die qm- oder cbm-Zahl des be- oder umbauten Raumes läßt sich - um noch einige recht spezielle Fälle aus der Praxis zu nennen - ζ. B. verwenden für den Neubedarf an Feuerungseinrichtungen oder an Schwingtoren für Garagen, die Geburtenzahl für den Verbrauch von Baby-Kost usw.

14.4 Markt- und Absatzprognosen Wie einleitend zu diesem Kapitel bereits erwähnt, soll hier mehr nur überblickartig auf "Markt- und Absatzprognosen" eingegangen werden. Es wird also nicht zwischen solchen für das Markt- und das Absatzvolumen getrennt. Will man vom prognostizierten Marktvolumen auf das künftige Absatzvolumen schließen, so bedarf es dazu der Vorausschätzung des Marktanteils. Dazu könnten wiederum verschiedene Ρ rognose verfahren - s. zur Ubersicht darüber nachstehend herangezogen werden. Eines davon besteht in der Verwendung von Markenwahl-Modellen ("brand switching models"). Sie beruhen zumeist auf der Theorie der MarkoffKetten, die über die Ermittlung von Ubergangswahrscheinlichkeiten die Prognose des Endzustandes ("Konvergenzzustand') ermöglichen. Ihre praktische Anwendbarkeit muß jedoch als recht problematisch erscheinen. Man hat dabei auch zu unterscheiden, ob es sich um bereits eingeführte oder neue Produkte handelt. Für letztere hat sich das Modell von PARFITT/COLLINS (1968) als brauchbar erwiesen. (S. zu dessen Darstellung etwa HÜTTNER 1986c.)

Nach empirischen Untersuchungen (s. etwa HÜTTNER [Hrsg.] 1981) steht bei betrieblichen Prognosen eindeutig die des Absatzes (hierbei des mengenmäßigen Absatzes noch vor dem "Umsatz" - als Produkt aus Menge und Preis) gegenüber anderen Gegenständen - wie Kosten oder Beschäftigte - im Vordergrund. Daraus erklärt sich einerseits, daß die Prognoseerstellung sehr oft zu den Aufgaben der betrieblichen Marktforschung gehört. (S. dazu auch in Kap. 18.) Andererseits werden Verkaufsvoraussagen - nach einer, gemäß Titel von vornherein auf "Sales Forecasting" beschränkten Untersuchung von DALRYMPLE 1975 - für ganz unterschiedliche Zwecke verwandt: Finanzen, Verwaltung, Budgetierung, Produktion, Lagerkontrolle, Verkauf, Planung, Rechnungswesen, Werbung, Personalkosten, Merchandising, Forschung und Entwicklung, Versand (in dieser Reihenfolge, von 80% bis 19%).

Kapitel 14 Analyse und Prognose der Entwicklung des Marktes

379

Für die praktische Aufstellung von Verkaufsvorausschätzungen steht nun eine Vielzahl von Prognosemethoden zur Verfügung. Man kann sie in mehreren großen Gruppen zusammenfassen. Die in Darst. 14-5 gegebene Systematik - nach H Ü T T N E R 1 9 8 6 C bzw. 1 9 8 9 (zu neueren Entwicklungen s. auch noch unten) - folgt als erstes dem Kriterium der Einteilung in einerseits "qualitative" (oder "subjektive" bzw. "intuitive") und andererseits "quantitative" (oder "objektive") Verfahren; die quantitativen Methoden sind darüber hinaus nach einem zweiten Kriterium gegliedert, in "kausale" und "rein zeitreihenanalytische".

I. "qualitative" Verfahren A. Auswertung von Befragungen 1. Vertreterbefragung 2. Expertenbefragung (einschl. Delphi-Methode) 3. Verbraucherbefragungen (einschl. Markttests usw.) B. Indikatoren-Methoden und Analyse der Nachfragekomponenten C. (weitere) Methoden der "technologischen Prognose" etc. II. "quantitative" Verfahren A. "kausale" Methoden 1, regressionsanalytische Verfahren 2. ökonometrische Modelle B. Zeitreihenprojektionen 1. Projektion aufgrund "naiver" Verfahren bzw. gleitender Durchschnitte 2. Projektion mittels herkömmlicher Kleinstquadrateschätzung 3. Projektion mittels Exponential Smoothing 4. Prognosen nach Box-Jenkins 5. Prognosen mit "adaptiven" Verfahren

Darst. 14-5: Systematik der Prognosemethoden Die Vielzahl der Verfahren und ihrer Varianten kann hier nicht im einzelnen dargestellt werden. (S. dazu etwa HÜTTNER 1982 und 1986c.) Es sei jedoch darauf hingewiesen, daß nach praktisch allen vorliegenden empirischen Untersuchungen die qualitativen Verfahren im Vordergrund standen. Allerdings ist wohl davon auszugehen, daß mit der fortschreitenden Verbesserung des Preis/Leistungs-Verhältnisses bei der EDV die Heranziehung der in den letzten Jahren bzw. Jahrzehnten entwickelten ζ. T. hochkomplizierten quantitativen Methoden, die sinnvoll eben oft nur mit Computer-Unterstützung handhabbar sind, zunimmt.

380

Teil IV

Sachgebiete der betriebswirtschaftlichen Marktforschung

Solange entsprechende Programme sehr spezialisiert, d.h. auf ein Verfahren oder allenfalls eine Gruppe davon beschränkt und damit auch recht teuer waren, stand die Auswahl im Vordergrund: Aufgrund der betrieblichen Gegebenheiten mußte gefragt werden, welches Verfahren die Aufgaben am besten erfüllt; erst nach der Nutzen/Kosten-Abwägung fiel die Entscheidung für die Beschaffung eines entsprechenden Pro-gramms. In der letzten Zeit ging die Entwicklung aber zur Erstellung von Programmsystemen, die die wichtigsten Verfahren umfassen. Im Zusammenhang mit der Verbreitung des PCs wurden diese zudem sehr viel billiger. Damit ist es aber auch praktikabel geworden, mehrere Verfahren zugleich anzuwenden und die Ergebnisse zu kombinieren. Auf die vielfältigen Möglichkeiten und Probleme der Selektion und Kombination von Prognoseverfahren kann hier nicht näher eingegangen werden; es sei dazu verwiesen auf die zusammenfassenden Betrachtungen bei HÜTTNER 1994.

Damit in Verbindung steht die Entwicklung von "automatisierten" (s. als Beispiel die von HÜTTNER/BEDNARZIK 1 9 9 0 vorgestellte System-Idee A U T O P R O G ) und "regelbasierten" Systemen bzw. solchen unter Einbeziehung Künstlicher Intelligenz (vgl. dazu JANETZKE/FALK 1 9 9 4 ) . Im Zusammenhang damit stehen auch die so viel diskutierten Neuronalen Netze·, vgl. dazu etwa, neben der eben genannten Arbeit und dem Beitrag von HRUSCHKA 2 0 0 0 , zu den statistischen Grundlagen ANDERS 1 9 9 7 , zu einer „vorläufigen Evaluation" SCHAEFER/SCHEBESCH 1 9 9 6 und in bezug auf das Marketing-Management WIEDMANN/BUCKLER (Hrsg.) 2 0 0 1 .

Aufgaben 14-1:

Ordnen Sie die mit (1) bis (4) bezeichneten Phasen des Produktlebenszyklus gemäß Darst. 14-1 den 4 Feldern des Marktwachstum-Marktanteil-Portfolios gemäß Darst. 14-3 zu!

14-2: Berechnen Sie mit den Zahlen von Beisp. 14-4 die darin beschriebenen 3 relativen Marktanteile jeweils für Β und C! 14-3: Demonstrieren Sie, mit den Zahlen von Beisp. 14-5, für das Gebiet A die erwähnten 3 Berechnungsarten für den regionalen Marktausschöpfungsgrad bzw. Leistungsindex!

Kapitel 14 Analyse und Prognose der Entwicklung des Marktes

381

14-4: Ein Unternehmen hatte im letzten Jahr einen GesamtInlandsabsatz von 7,2 Mill. DM, die Konkurrenz insgesamt einen solchen von 12,8. Die Verteilung des eigenen Absatzes auf die 4 Regionen kann der Verkaufsstatistik entnommen werden (A 2,5 Mill. DM, Β 2,4, C 1,1 und D 1,2). Der Absatz der Konkurrenz in diesen Gebieten ist nicht bekannt. Aus Marktindikatoren läßt sich jedoch (nach Abstimmung der Gebiete etc.) ein Verteilungsschlüssel für das Gesamtmarktvolumen gewinnen: A 40%, Β 30%, C 20% und D 10%. Nehmen Sie die Berechnung nach dem Muster von Darst. 14-4 vor!

Kapitel 15 Produkttest - Verkaufstest Testmarkt Das Kapitel beginnt mit einer Einführung über die Möglichkeiten des Einsatzes der Marktforschung in den verschiedenen Stadien des Produktentwicklungsprozesses. In den beiden großen Hauptabschnitten werden dann wichtige dieser Möglichkeiten im einzelnen behandelt: in 15.1 der „Produkttest" und in 15.2 (simulierte und reale) „Markttests". Als Exkurs folgt dann noch eine - kurze - Betrachtung über die Messung der „Kundenzufriedenheit".

15.0 Der Einsatz der Marktforschung in den verschiedenen Stadien des Produktentwicklungsprozesses Aus der Konzeption des Produktlebenszyklus folgt - ganz unabhängig davon, inwieweit diese Zyklen immer kürzer werden -, daß ständig "alte" Produkte verschwinden, also "neue" entwickelt werden müssen. Die Gefahr allerdings, daß solche Neuentwicklungen zu einem Fehlschlag, einem Flop, werden, ist sehr groß. In Literatur und Praxis werden durchaus differierende "Flop-Raten" genannt. Das hängt damit zusammen, daß auf unterschiedliche Produkte oder Produktklassen, vor allem aber auf verschiedene Stadien im Produktentwicklungsprozeß - als Basis - abgestellt wird. Deshalb sei auf einen zusammenfassenden Report solcher Raten hier verzichtet und nur erwähnt, daß die 1981 erfolgte Wiederholung der in diesem Kontext meist zitierten amerikanischen Untersuchung ergeben hat, daß sie insgesamt - entgegen manchen Befürchtungen! - im Zeitablauf nicht gestiegen zu sein schienen: 1981 waren danach 7 Produkt-Ideen erforderlich für ein erfolgreiches Produkt, gegenüber noch 58 im Jahre 1968. (Vgl. BOOZ, ALLEN AND HAMILTON INC. 1968; 1982.)

Die verschiedenen Stadien des Produktentwicklungsprozesses werden zumeist in Anlehnung an PESSEMIER (1966) oder BOOZ, ALLEN AND HAMILTON INC. (1968, 1982) dargestellt; es sind in beiden Fällen - obzwar in Bezeichnung und Bedeutung unterschiedlich - 6. Hier soll diese Zahl beibehalten werden, wenngleich mit wiederum verschiedenen Inhalten: - Ideensuche, - "Screening" - vorläufige wirtschaftliche Analyse,

Kapitel 15 Produkttest - Verkaufstest - Testmarkt



383

- Konzepttest, detaillierte wirtschaftliche Analyse, Produktentwicklung und Produkttest, Test auf simulierten und realen Märkten, Markteinführung.

Damit ergeben sich 3 Einsatzmöglichkeiten von "Test"-Verfahren: 1. Konzepttests. Sie sind dadurch charakterisiert, daß sie in einer sehr frühen Phase des (Neu-)Produktentwicklungsprozesses geschehen und dort erfolgversprechende Produktideen aussondern helfen. Ein sehr wichtiges Instrument dazu stellt das "Conjoint Measurement" (s. 13.1) dar. 2. Produkttests (s. 15.1). 3. "Markttests"(als Oberbegriff). Gemäß 15.2 gehören hierzu im einzelnen: Testmarktsimulationsverfahren, das "klassische" Testmarktverfahren, der "Ladentest" (als spezielle Form von "Verkaufstests") sowie - neuerdings zunehmend "Mini-Testmarktverfahren". Nicht behandelt wird der Warentest. Diese Bezeichnung hat mit der Gründung und praktischen Tätigkeit der "Stiftung Warentest" einen Inhalt angenommen, der mit dem hier Referierten wenig zu tun hat.

15.1 Der Produkttest 15.1.1 Begriff und Arten Der Begriff des Produkttests scheint sehr vielschichtig. Das Verbindende ist, daß er nach der Entwicklung des Produkts - evtl. mehrerer Varianten -, aber vor der auch nur probeweisen Markteinführung erfolgt: Das Produkt wird, im Original oder Proben davon usw., ausgewählten Konsumenten zur Beurteilung vorgelegt. Dieser Begriff erlaubt die Einteilung in verschiedene Arten, nach diversen Kriterien. (BAUER [1981] nennt allein 23.) Einige wichtige Einteilungen sollen im folgenden skizziert werden:

384

Teil IV Sachgebiete der betriebswirtschaftlichen Marktforschung

1. Man kann zunächst danach differenzieren, ob im Prinzip alle oder nur einzelne Seiten bzw. Wirkungen des Produkts getestet werden. Im ersteren Falle spricht man von Volltest. 2. Ein Blindtest liegt dann vor, wenn die Herstellerbezeichnung "neutralisiert" worden ist (was schon im Interesse der Geheimhaltung vor der Konkurrenz - ein besonderes Problem aller Produkttests! - oft geboten erscheint). 3. Nach der Beschränkung auf einzelne Seiten des Produkts ist es zweckmäßig, zwischen Produkttest im engeren und im weiteren Sinne zu unterscheiden. Gemäß Darst. 15.1 handelt es sich beim Produkttest i.e.S. um einen Qualitätstest (oder "Produktleistungstest"). In einem weiteren Sinne kann man dem Begriff "Produkttest" auch noch den Preistest, den Verpackungstest und den Namenstest subsumieren - dies allerdings nur dann, wenn der Test dieser Seiten des Produkts im Zusammenhang mit der Vorlage des Produkts (und nicht unabhängig davon) erfolgt. Produkttest i.e.S.

i.w.S.

Qualitätstest ("Produktleistungstest") z.B. Funktion, Haltbarkeit, Handhabung, Material, Farbe

1

2 Preistest Verpackungstest Namentest

Legende: 1 = im Zusammenhang mit der Produktvorlage 2 = unabhängig von der Produktvorlage Darst. 15-1:

Produkttest im engeren und im weiteren Sinne

Auf Preis- und Qualitätstests wird im nächsten Abschnitt - anhand von Beispielen - eingegangen. Bei den hier noch zu erwähnenden Verpackungsund Namenstests wird die mögliche Loslösung vom Test des Produkts als solchem ganz deutlich. So kann zwar einerseits die Verpackung als Teil des Produkts gesehen und mit ihm zusammen getestet werden: Material, Größe, Form usw. Andererseits mag die werbliche Seite der Verpackung in den Vordergrund treten und allein einem Test unterliegen ("CopyTest" - s. Kap. 16). In ähnlicher "Weise läßt sich auch der Namenstest völ-

Kapitel 15

Produkttest - Verkaufstest - Testmarkt

385

lig separat durchführen. Das gilt vor allem für die Überprüfung der Namenseignung. So können etwa die Aussprechbarkeit des Namens, sein Klang, die damit verbundenen Assoziationen etc. getestet werden. Zur Namensfindung vermag der Produkttest - etwa in der Weise, daß dem Befragten das Produkt vorgelegt wird mit der Bitte um Äußerung, wie seiner Meinung nach der Artikel wohl heißen könne - offenbar nicht allzuviel beizutragen, da die spontanen Äußerungen der Befragten meist zu blaß und zu sehr dem Umkreis des Produkts entnommen sind. LOHMEIER (1959, S. 179 ff.) hält deshalb die Einholung von Anregungen für die Namensfindung durch Preisausschreiben für ergiebiger (Möglichkeit überlegter und ausgereifter Vorschläge!). Ergänzend sei darauf hingewiesen, daß es auch möglich ist, die Zweckmäßigkeit und vor allem Verständlichkeit von Gebrauchsanweisungen testen zu lassen. Dies wird insbesondere dann von Bedeutung sein, wenn man befürchten muß, daß durch unsachgemäße Handhabung Schäden an der Ware entstehen bzw. deren Gebrauch beeinträchtigt wird und damit der Artikel gegenüber Konkurrenzprodukten bei an sich gleicher oder besserer Qualität ins Hintertreffen gerät.

4. Nach der Beschränkung auf einzelne Wirkungen des Produkts kann man unterscheiden ζ. B. zwischen - Geschmacks- und Geruchstest (beides auch zusammengefaßt unter der Bezeichnung "Degustationstest"; man spricht ebenfalls von „5ensorischen Tests"), - Greiftest (s. auch zur Sonderform der "Schnellgreifbühne"'va.Kap. 5), - akustischer Test. 5. Die methodische Anlage kann man zunächst schlicht danach unterscheiden, ob nur ein Produkt einbezogen wird oder deren mehrere: Einzeltest (monadischer Test) vs. Mehrfachtest ("nicht-monadischer Test"). Letzterer kann in verschiedener Weise differenziert werden. - wie viele Produkte einbezogen sind. In der Praxis beschränkt man sich meist auf 2 oder 3 Produkte (wegen der sonst entstehenden Gefahr der Unübersichtlichkeit). Bei nur 2 Produkten könnte man auch von Paarvergleichen sprechen; eine Entgegensetzung dieser zum triadischen Vergleich bei 3 Produkten ist aber insofern mißverständlich, als - wie in Kap. 12 dargelegt - auch bei Triaden "Paarvergleiche" stattfinden. - ob es sich um zwei (oder drei) Variationen des eigenen Produkts oder um den Vergleich des eigenen mit einem Konkurrenzprodukt, und zwar zweckmäßigerweise einem führenden, handelt.

386

Teil IV Sachgebiete der betriebswirtschaftlichen Marktforschung

- ob der Vergleich simultan (nebeneinander) oder sukzessive (hintereinander) erfolgt. Im ersteren Falle spricht man auch vom parallelen Vergleichstest, bei letzterem von "pseudo "• oder "quasi-monadic test ". Im einzelnen ist eine Fülle von Versuchsanlagen möglich. 6. Diese Zahl erhöht sich noch, wenn nach der "Art der Urteile, die von den Testobjekten zu treffen sind" (&AUER 1981, S. 27), z.B. zwischen Präferenztests, Evaluationstests usw. unterschieden wird. 7. Nach der Dauer, während derer die Testpersonen dem Testobjekt ausgesetzt sind, kann man zwischen Eindruckstests und Erfahrungstests (nach kürzerer oder längerer Erprobung) differenzieren. 8. Das hängt auch mit der Art der technischen Durchführung zusammen. Diesbezüglich steht im Grunde ja das gesamte Instrumentarium der Primärforschung zur Verfügung. Dementsprechend kann man auch viele verschiedene Unterscheidungen - auf mehreren Ebenen - treffen, ζ. B. - einstufig (nur - im Falle mündlicher Befragung - ein Interview mit sofortiger Durchführung des Tests) oder mehrstufig (mehrere Interviews, mit Erprobung des Produkts in der Zwischenzeit) - Vorlage des Produkts im Original oder nur von Abbildungen usw. oder gar Beschreibungen. Im letzteren Falle könnte man auch von deskriptiven Tests sprechen. Dieser Begriff ist aber mißverständlich, in doppelter Weise: Einmal kann sich "deskriptiv" auf die Art der Urteile, gemäß Ziff. 6 oben, beziehen, zum anderen gerät dadurch die Eindeutigkeit des Begriffs "Produkttest" in Gefahr; insbesondere die Grenze zum "Konzepttest" würde schwimmend. Beschreibungen oder Abbildungen sollten nur an die Stelle des Originals treten, wenn das wegen seiner Größe oder Beschaffenheit (z. B. Möbel, Gardinen) für den "home use-Test" schlecht geeignet ist. In diesem Falle wäre aber vielleicht besser die Hinführung der Testperson zum Testobjekt zu erwägen: - Test in Studios etc. (in eigenen oder gemieteten Räumen) oder Mobilen {Caravan-Ttsx). Eine besondere Form stellt die sog. Car Clinic (die GfK spricht spricht auch von Current Car Clinic - für bereits eingeführte Modelle) dar. Sie dient, wie der Name schon sagt, in erster Linie dem Test neu entwickelter Automobile (kann aber offenbar auch für andere langlebige Gebrauchsgüter - z.B. Waschmaschinen eingesetzt werden). Sie findet oft in größeren Hallen, mit gar nicht so kleinen

Kapitel 15 Produkttest - Verkaufstest - Testmarkt

387

Stichproben - so wird von bis zu insgesamt 500 Teilnehmern berichtet -, statt, unter Einsatz auch von psychologischen Methoden (projektive Verfahren, Rollenspiele).

- An die Stelle der mündlichen kann auch die schriftliche Erhebung treten. Hierzu bietet sich dann insbesondere die Form des Produkttest-Panels (s. auch Kap. 7) an. Allerdings ist hierbei die Gefahr der Konditionierung besonders groß. Es wird deshalb im allgemeinen sorgfältig darauf geachtet, daß diese Panels - einerseits - von anderen unabhängig sind und andererseits, zur Vermeidung der Herausbildung von "Test-Spezialisten", die Anzahl der Tests pro Panel-Mitglied begrenzt bleibt. Aus diesem Grunde (und wegen der Besonderheiten der einzelnen Produkte) müßte die Stichprobengröße relativ hoch sein. Sie hängt natürlich wesentlich davon ab, inwieweit man Repräsentanz auch für Teilgruppen (Altersgruppen usw.) fordert.

15.1.2 Beispiele für Produkt- bzw. Preistests Die vorstehenden (und eventuell weitere) Einteilungen sind im Prinzip alle miteinander kombinierbar. Im einzelnen ergibt sich damit - obwohl naturgemäß bestimmte Kombinationen aus sachlichen oder anderen Gründen ausscheiden - eine Fülle von konkreten Formen. Im folgenden sollen einige Beispiele dafür gebracht werden, zunächst für Produkttests i.e.S. (Qualitätstest). Beispiel 15-1 LOHMEIER (1959, S. 96) berichtet über einen Test von 2 Proben eines Putzmittels. Es handelt sich um einen parallelen Vergleichstest als Blindtest. (Um möglichst keine Verzerrung durch die gewählten Symbole für die Produktkennzeichnung zu erhalten, werden Ziffern - weitgehend gleicher Art - verwandt.) Die Urteile wurden als Präferenzen und als Deskriptionen (Lohmeier spricht vom "Parallelprinzip") abgegeben:

388

Teil IV

Sachgebiete der betriebswirtschaftlichen Marktforschung

Präferenzprinzip

Parallelprinzip

Von allen Test-Hausfrauen bevorzugten 26% Probe 386 gegenüber 648 43% Probe 648 gegenüber 386 31% keine der beiden Proben

Von allen Test-Hausfrauen waren mit dem Erfolg von Probe 386 648 sehr zufrieden zufrieden nicht ganz zufrieden nicht zufrieden

100%

18% 52% 18% 11%

39% 36% 39% 9%

100%

100%

Resultat: Die Probe 648 hat nicht nur die relativ größten Chancen. Sie stellt auch die Wünsche von mehr als einem Drittel der Verbraucher sehr ( = uneingeschränkt) zufrieden.

Das Beispiel zeigt bei den deskriptiven Urteilen die Vorgabe von Skalen. Diese können in mannigfacher Weise konstruiert sein; s. dazu die Erörterungen in Kap. 4. Auch bezüglich der Präferenzen kann weiter differenziert werden. So ist der Ausweis der Präferenz von Eigenschaften im Produktvergleich und umgekehrt der Präferenz von Produkten im Eigenschaftsvergleich möglich. Beispiel 15-2 (zusammengestellt aus CRISP 1959, S. 575f.) Die eigene neu entwickelte Mayonnaisesorte (K), die in ihrer Konsistenz an der führenden Marke (R) ausgerichtet wurde, wird gegen diese zum Test gestellt. Dabei ergab sich folgendes: grundsätzliche Präferenz

insgesamt Urteil über K: zu dick zu dünn Urteil über R: zu dick zu dünn

Bevorzugung von Κ

Bevorzugung von R

64 11 1 54

54 33 2 14

-

-

Das Resultat zeigt deutlich, daß auch die führende Marke als "zu dick" empfunden wird. Damit wurden der eigenen Produktverbesserung und der Werbung wertvolle

Kapitel 15 Produkttest - Verkaufstest - Testmarkt

389

Hinweise geliefert. Dies war um so wichtiger, als die in Angleichung an die führende Marke vorgenommene Verdickung des Produkts höhere Kosten zur Folge hatte, die nunmehr eingeschlagene Entwicklung zur Verdünnung also auch Einsparungen mit sich brachte.

Abschließend dazu noch zwei Beispiele, bei denen es weniger um die Konsistenz als um den Geschmack geht. Beispiel 15-3 Simon, Kucher & Partners, Bonn, berichten in einer „Fallstudie Dr. Oef¿er-Fertigdesserts" (1994, S. 8) über den Test eines solchen namens G A L A vs. zwei Konkurrenzprodukte. („Elite" stammt von Unilever.) „Dabei nahmen insgesamt 1.500 Hausfrauen an Verkostungstests teil, wobei jeweils Paarvergleiche zwischen den Produkten angestellt wurden. U m den Einfluß von Markenimage und Verpackung zu isolieren, wurden sowohl ein Blindtest sowie auch ein As-marketed-Test durchgeführt; hier traten allerdings nur geringfügige Unterschiede auf. In beiden Fällen wurde das Gervais-Danone-Produkt am häufigsten auf Platz 1 gesetzt; ' G A L A ' folgte auf Rang 2 und der Elite-Schokoladenpudding wurde von den wenigsten Testpersonen präferiert. Der Abstand zwischen Elite und Danone war statistisch signifikant, während der Abstand zwischen Dr. Oetker und Gervais Danone bzw. Elite nicht signifikant ausfiel." Beispiel 15-4 „Gut 60 Jugendliche und 30 Erwachsene ... (kommen) mindestens einmal im Monat .. in kleinen Gruppen zur 'Sensorik'" ins Labor von Katjes Fassin, Emmerich. „Dann sitzen die Probeschmecker durch Sichtblenden voneinander getrennt, atmen kontrollierte Luft mit extrem viel Sauerstoff und kauen eine Stunde lang vor sich hin. Sind die 'Katzenpfötchen' weich genug? Schmecken die 'Frucht-Kaugis' nicht zu säuerlich? Schimmert 'Fred Ferkel' wirklich schweinerosa? Die Tester richten gewissenhaft. 10 D M und ein paar Warenproben bringt ihnen die Mühe ein." (M. Machatscbke in Die Welt vom 4.8.95.)

Preistests können zunächst der Ermittlung der Vorstellungen über die Preishöhe dienen (Preisschätztest). Beispiel 15-5 (zusammengestellt aus LOHMEIER 1959, S. 184f.) Es soll die Preisschätzung zweier kosmetischer Erzeugnisse ermittelt werden. Auf die Frage, was die Tube im Laden wohl kosten könne, ergaben sich folgende Antworten:

390

Teil IV Sachgebiete der betriebswirtschaftlichen Marktforschung

Probe 39

Probe 63

Preis (in D M % 1,20 1,00 0,90 bzw. 0,95 0,80 bzw. 0,85 0,75 0,70 0,60 bzw. 0,65 0,50 keine Preisvorstellung

5 26 15 13 23 5 4 3 6

kumuliert 5 31 46 59 82 87 91 94 100

% 3 20 11 13 25 7 7 8 6

kumuliert 3 23 34 47 72 79 86 94 100

Diese Preisvorstellungen der Verbraucher geben grobe Hinweise auf die Elastizität der Nachfrage.

Man kann auch versuchen, der Preiselastizität dadurch näher zu kommen, daß man die Reaktion auf verschiedene Preishöhen feststellt. Der Preistest dient hier also der Ermittlung der Aufnahmebereitschaft bei gegebenem Preis (Preisbereitschaftstest). Beispiel 15-6 Zwei Teilgruppen werden, bei feststehendem Preis für das Konkurrenzprodukt, alternative Preise für das eigene Produkt vorgegeben, mit folgendem Resultat: Teilgruppe 1

Präferenz für Produkt A (Konkurrenzprodukt) Präferenz für Produkt Β (eigenes Produkt) Unentschieden

Teilgruppe 2

Preis

%

Preis

%

1,00

85

1,00

74

1,20

9

0,90

18

6

8

Ergebnis: Abgesehen von den Unentschiedenen, die eine gewisse Absatzreserve darstellen, steht einem um ein Drittel höheren Preis eine um die Hälfte niedrigere Zahl von Käufern des eigenen Produkts gegenüber.

Der Einsatz derartiger Tests (DILLER 1991, S. 135ff., faßt die vorgenannten beiden Formen sowie Preisempfindungstests und Preiswürdigkeitstests unter der Bezeichnung „Preispräferenzbefragungen" zusammen und weist auf Variationen des Preisbereitschaftstests hin - GABOR 1977 und BLAMIRES 1979) im Rahmen von Pricing Research zur Ermittlung der

Kapitel 15 Produkttest - Verkaufstest - Testmarkt

391

Preiselastizität ist jedoch nicht unproblematisch. Erfolgversprechender mag dafür - neben anderen Ansätzen (SIMON 1985 merkt z.B. die "zunehmende Bewährung" der Expertenbefragung an) - das Conjoint Measurement erscheinen. Das bedeutet aber zugleich eine Verlagerung in frühere Phasen des Produktentwicklungsprozesses. Diese Tendenz ist auch bei den im folgenden Abschnitt zu besprechenden Formen feststellbar.

15.2 Simulierte und reale Markttests Unter dem Begriff Markttest - auf die Bezeichnung "Marktexperiment" wird hier verzichtet - werden alle die Formen zusammengefaßt, die nach der Entwicklung des Produkts (und seiner Prüfung bei ausgewählten Personen mittels des Produkttests), aber vor der vollen Markteinführung liegen. Sie umfassen also den probeweisen Verkauf des Produktes. "Klassische" Formen sind der Verkaufstest - zumeist in der speziellen Ausprägung des Laden- oder Store Tests - und der Testmarkt, neuere Entwicklungen Testmarkt-Simulation und Mini-Testmarktverfahren (S. auch A 15-1.)

15.2.1 Der Ladentest und das "klassische" Testmarktverfahren Der Ladentest stellt eine spezielle Form des Verkaufstests dar. Allgemein wird dieser dadurch charakterisiert, daß der probeweise Verkauf des Produkts weniger räumlich als vielmehr sachlich abgegrenzt ist. Er umfaßt insofern begrifflich etwa auch den Test-Verkauf sowohl über Reisende als auch Kataloge usw. In der Praxis kommt er aber meist eben als "Ladentest", d. h. dem probeweisen Verkauf des Produkts in ausgewählten Geschäften, vor. Dafür wird oft auch die Bezeichnung "Store-Test" verwandt. Dieser Begriff ist allerdings eng mit den Aktivitäten eines bestimmten Marktforschungsinstituts verknüpft. Überhaupt muß an dieser Stelle grundsätzlich darauf hingewiesen werden, daß im Bereich "Product Research" (und "Advertising Research", s. Kap. 16) sich z.T. sehr spezielle bzw. konkrete Formen herausgebildet haben, die - angesichts der oft nicht niedrigen "Entwicklungskosten" - mehr oder weniger der Geheimhaltung unterliegen bzw. wettbewerbsrechtlich geschützt sind.

392

Teil IV

Sachgebiete der betriebswirtschaftlichen Marktforschung

Beim "klassischen" Testmarkt-Verfahren geht die Markteinführung am weitesten. Begrifflich sind - in allgemeinster Fassung - unter Testmärkten regional begrenzte Märkte zu verstehen, auf denen bestimmte absatzpolitische Maßnahmen ergriffen werden, deren Ergebnisse im Vergleich zu ähnlichen Märkten, bei denen solche unterbleiben (Kontrollmarkt), die Wirksamkeit derselben anzeigen sollen. Es handelt sich beim Testmarktverfahren also um ein Experiment unter Ä/i/bedingungen. Damit ist ein erstes der methodischen Probleme das der Versuchsanlage. Der Testfaktor wird nur auf dem Testmarkt zum Einsatz gebracht, der Kontrollmarkt bleibt davon unberührt; bei sonst gleicher Entwicklung muß die Veränderung also auf die Wirkung des Testfaktors zurückzuführen sein. Bei gleicher Ausgangslage wäre die Messung nur nach Eintritt der Wirkung des Testfaktors notwendig. Kann eine gleiche Ausgangslage nicht angenommen werden, so ist die Messung sowohl vor Einsatz des Testfaktors als auch danach erforderlich. Im Hinblick auf die Gefahr einer völlig atypischen, unvorhergesehenen Entwicklung auf einem Markt, dem Ausfall dieses Marktes also, spräche vieles dafür, sogar zwei Testmärkte zu verwenden, d. h. insgesamt einschl. auch zweier Kontrollmärkte - vier Märkte. (Manchmal wird sogar empfohlen, mindestens drei Märkte als Testmärkte vorzusehen, damit, sollte einer davon ausfallen, das Ergebnis nicht nur auf einem einzigen Markt beruht, der zudem vielleicht unglücklich ausgewählt wurde.) Insbesondere aus Kostengründen läge andererseits der Verzicht auf besondere Kontrollmärkte nahe. Anders ausgedrückt: Der gesamte Rest des Gebietes - alles, was nicht Testmarkt ist - dient als Kontrollmarkt. Damit sind aber - als zweites methodisches Problem - besonders strenge Anforderungen an den (oft einzigen) Testmarkt zu stellen. So muß einerseits die Bevölkerung des Testmarkts möglichst repräsentativ für die Gesamtbevölkerung sein. Andererseits soll sie gerade von letzterer isoliert werden. Dazu müßte zum einen eine relativ scharfe lokale Abgrenzung der Werbeträger möglich sein; zum zweiten sollten - zumal in Verbindung damit - Kommunikationsprozesse zwischen der "Testmarkt"- und der Gesamtbevölkerung weitgehend unterbleiben.

Kapitel 15 Produkttest - Verkaufstest - Testmarkt

393

Allein diese (und manche weitere) Anforderungen haben zur Folge, daß es nicht allzu viele Gebiete gibt, die als Testmärkte in Frage kommen können. (Zudem ist die wiederholte Heranziehung des gleichen Gebietes nicht ungefährlich: störendes Verhalten sowohl der Verbraucher als auch der Händler infolge bewußter Kaufüberlegungen, Auftreten also eines "Testmarkt-Effekts", ähnlich dem Panel-Effekt, etc.) Damit ist auch deutlich - als drittes methodisches Problem -, daß die Auswahl der Testmärkte nicht nach dem Zufallsprinzip erfolgen kann. Insgesamt verbleiben damit für die Bundesrepublik Deutschland nur relativ wenige Gebiete, die überhaupt als Testmarkt in Frage kommen (ζ. B. Saarland, Bremen). Eventuell ist deshalb eine andere als administrative Abgrenzung zu wählen, etwa Nielsen-Gebiete. Damit sind aber bereits Probleme der technischen Durchführung angesprochen: Ein erstes Problem dieser Art ist das der Ermittlung der Ergebnisse. In der Mehrzahl der Fälle wird der Umsatz durch die Aufzeichnung der Verkäufe oder der Lagerbestände der Einzelhändler, d. h. mittels eines eigens geschaffenen oder bereits bestehenden Einzelhandels-Panels, erfolgen. In vielen Fällen können auch Verbraucher-Panels in Frage kommen. Auch Gutscheine bzw. Coupons könnten als Hilfsmittel zur Feststellung der Wirkungen in Betracht gezogen werden. Ein zweites Problem ist das der Dauer. Allgemein wird man hierzu sagen müssen, daß diese nicht zu kurz sein darf, da sonst das Ergebnis zufällig bzw. der Testfaktor nicht voll zur Auswirkung gekommen sein könnte. (6 Monate werden vielfach als untere Grenze genannt.) Die Bedeutung des klassischen Testmarkt-Verfahrens ist in den letzten Jahren zurückgegangen. Schuld daran sind nicht nur die vergleichsweise hohen Kosten, sondern auch die Zweifel an der Validität der Ergebnisse. So mag die prognostische Relevanz allein dadurch in Frage gestellt sein, daß - im Unterschied zu manch anderen Marktforschungsmaßnahmen die Einrichtung eines Testmarkts spätestens mit dem Einsetzen des Testfaktors der Konkurrenz offenkundig wird, diese also versuchen kann, durch eigene Maßnahmen entweder die Testresultate zu beeinflussen (ζ. B. durch forcierte Werbung) oder davon zu partizipieren (ζ. B. durch eigene Produktentwicklungen).

394

Teil IV Sachgebiete der betriebswirtschaftlichen Marktforschung

15.2.2 Testmarkt-Simulation und Mini-Testmarktverfahren Angesichts der Kosten und Probleme des klassischen Testmarkt-Verfahrens verwundert es nicht, daß nach neuen Möglichkeiten gesucht worden ist. Solche wurden in der Testmarkt-Simulation gefunden. Hierbei wird eine Anzahl von Personen in ein Studio oder Labor (deshalb auch: "Labor-Testmarkt') eingeladen; dort erfolgt zunächst ein Vorinterview, anschließend die Vorführung von Werbemitteln, wesentlich in Gestalt von Werbespots für das zu testende Produkt, und danach in einem simulierten Supermarkt die Anregung zum Kauf (durch Zurverfügungstellung eines bestimmten Geldbetrages, die Gewährung von Rabatten usw.); später wird ein Nachinterview durchgeführt. Die mathematisch-statistische Auswertung ist nicht unkompliziert. Vgl. dazu etwa ERICHSON 1 9 8 0 und 1 9 8 1 . Hierin wird auch TESI (TEstmarkt-SImulation - durchgeführt von der GfK) vorgestellt. S. dazu auch die stärker verbale Beschreibung bei ERICHSON 2 0 0 0 ) .

Ausgangspunkt war L T M (Laboratory Test Market); s. dazu auch

YANKELOVICH, SKELLY

AND WHITE INC. 1 9 8 1 ) .

Probleme der Testmarktsimulationsverfahren liegen aber gerade darin, daß es sich um keine "echten" Märkte handelt - zumal die Sonderstellung des beworbenen, zu testenden Produkts, verstärkt durch die Rabattgewährung, "Verschönerungstendenzen" Vorschub leistet. (S dazu auch A 15-2.) Mini-Testmarktverfahren können charakterisiert werden durch die Tendenz zu "voll-elektronischen " Testmärkten, die sich aus der Entwicklung von "neuen Medien" einerseits und "Scanning"(s. Kap. 7) andererseits ergibt: Neben die streng regionale (auf eng umrissene Gebiete) oder sachliche Begrenzung (auf nur wenige große Geschäfte), im Zusammenhang evtl. mit isolierter Umwerbung, tritt die Verbindung von Haushaltsund Verbraucher-Panel. Für Deutschland sind hier speziell zu nennen: GfK-BehaviorScan: Gemäß der Bezeichnung handelt es sich hierbei um eine Adaption eines amerikanischen Forschungsinstruments. Es ist ausgerichtet worden auf eine einzige Gemeinde: Haßloch - im Bereich des damaligen "Kabelpilotprojekts Ludwigshafen". Dafür wurden ursprünglich zwei Panels von Haushalten aufgebaut: eines mit /£d£>e/anschluß, eines ohne. Inzwischen wurden rd. zwei Drittel des heute insgesamt 3000 Haushalte umfassenden Panels mit einem speziellen Klein-Computer aus-

Kapitel 15 Produkttest - Verkaufstest - Testmarkt

395

gerüstet, der den Einsatz der sog. targetable TV-Technik ermöglicht: gezielte, individuelle Ansprache eines Haushalts mittels "Überblendung" ("cut in") der im laufenden Werbeblock enthaltenen Spots durch TestSpots. Ein Teil der Haushalte erhält auch eine Spezialausgabeeiner großen TV-Programmzeitschrift (mit besonderen Anzeigen). Die ReaktionsErfassung erfolgt mittels Scanner in den Geschäften des gebildeten Handels-Panels, wobei von den Testhaushalts-Mitgliedern eine Identifikationskarte - „GfK-Ausweis" - vorzulegen ist. (Damit wird ein Vergleich zwischen den speziell beworbenen - mittels TV oder Programmzeitschrift - und den nicht beworbenen Haushalten möglich.) Telerim (Nielsen): Das inzwischen - vor ca. 2 Jahren - eingestellte Telerim ähnelte dem vorgenannten "vollelektronischen Testmarkt" durch die Verbindung von Handels- und Haushalts-Panel, unterschied sich von ihm aber einerseits dadurch, daß es statt nur einer zwei Gemeinden in verschiedenen Bundesländern einbezog: Bad Kreuznach und Buxtehude. Andererseits handelte es sich um das normale Fernsehprogramm. (Damit war auch "targetable TV" nicht möglich - wohl aber, durch Vereinbarung mit einer Reihe großer Werbungstreibender im Rahmen des "Telerim User Club", die Einblendung spezieller Test-Spots.)

Exkurs: Die Messung der Kundenzufriedenheit Kundenzufriedenheit und (Total) Quality Management sind in den Mittelpunkt des Interesses gerückt. Uber beide existiert inzwischen eine riesige Literatur, und es wird sogar von künden- bzw. qualitätsorientierter Unternehmensführung gesprochen; dabei sind die Beziehungen zwischen beiden gar nicht immer klar. (Zur Literatur - und zu dieser Beziehung speziell vgl. statt vieler A . v. AHSEN 1996a und b.) Hier wird die Kundenonentierung als das Primäre gesehen und im folgenden mehr nur darauf abgestellt. Im Mittelpunkt steht dabei nicht so sehr Begriff und Bedeutung sowie das "Management" der Kundenzufriedenheit als vielmehr die Verfahren zu ihren Messung. Die Bedeutung der Kundenzufriedenheit liegt darin, daß es - kurz gesagt heute nicht mehr, wie in Zeiten wachsender Märkte genügt, zwischen "Kunden" und "(Noch-)Nicht-Kunden" zu unterscheiden und das Augenmerk, im Interesse höherer Marktanteile, vornehmlich auf letztere zu richten. Vielmehr muß es darum gehen, die (Noch-)Kunden als Stammkunden zu gewinnen - man spricht auch von "Stammkunden-

396

Teil IV

Sachgebiete der betriebswirtschaftlichen Marktforschung

Marketing" - und die Nicht-Mehr-Kunden hinsichtlich der Gründe der Abwanderung zu analysieren und eventuell zurückzugewinnen versuchen. (In diesem Zusammenhang ist eine Reihe von Merk-Sprüchen entstanden, wovon einer dem Verf. - in dessen eigener Formulierung - besonders treffend erscheint: "Nicht das Produkt soll zurückkommen, sondern der Kunde!"). In Anwendung eines anderen Merkspruches heißt es in den Firmenregeln des Oberhausener CENIRO-Einkaufs- und Freizeitparks (nach einem Bericht von H. Breuer - Die Welt v o m 24.8.96): „Gäste sind die wichtigsten Menschen überhaupt. Gäste sind nicht von uns abhängig, sondern wir von ihnen. Gäste stören uns nicht bei der Arbeit. W i r tun ihnen keinen Gefallen, indem wir sie bedienen, sondern sie tun uns einen Gefallen, wenn wir sie bedienen dürfen." Oder (H. Gillies in Die Welt v o m 21.8.96): „Er wundere sich, so bemerkte ein Amerikaner auf Deutschland-Besuch, daß sich ein Kunde hierzulande, wenn er einen Verkäufer anspreche, zuerst einmal entschuldige. W e n n in den U S A ein Kunde den Laden betrete, sei des Verkäufers erster Reflex: 'Hier k o m m t mein Arbeitgeber!' In Deutschland dagegen blizt in den Augen der Verkäuferin, der sich ein Kunde nähert, die Botschaft auf: 'Hier naht Arbeit.' "

Man spricht auch von "Buying Cycle", mit der "Vorkaufphase", der "Kaufphase" und der "Nachkaufphase". Während die traditionelle Marktforschung eher bei den ersten Phasen ansetzt, geht es bei der Zufriedenheitsmessung mehr um die letzte (im Hinblick auf das "Nachkauf-Marketing"). Töpfer bringt die Beziehung zwischen Marktforschung und Customer Satisfaction Measurement (CSM) zusammenfassend auf die Formulierung: "Was ist der geforderte und erstellte Nutzen?" (für erstere) und "Was ist der erfahrene und bewertete Nutzen?" (für letztere) und sieht die Schnittmenge zwischen beiden als gar nicht so groß an. (Vgl. dazu - mit Abbildung - TÖPFER 1996, S. 503). Es verwundert deshalb nicht, daß auch nach neuen Verfahren zur Messung gesucht wurde. Ehe darauf nachstehend näher eingegangen wird, sei hinsichtlich des Begriffs "Kundenzufriedenheit" erwähnt, daß dieser gar nicht so ganz klar erscheint. Zwar ist unstrittig, daß zwischen Gesamtund TeiZ-Zufriedenheit differenziert werden kann (vgl. etwa Abb. 5: "Elemente der Zufriedenheit" bei TÖPFER 1996 S. 507) und die Zufriedenheit als solche sich im Prinzip aus den Erwartungen und dem subjektiv wahrgenommenen Ausmaß der Erfüllung ergibt. Die operationale Definition im einzelnen mag jedoch durchaus verschieden sein. Dies wird auch aus den Ausführungen von G. Haedrich ("Eindrücke eines Beteiligten" in dem von E. Dichtl Herausgegebenen Bericht über das 2. " C P C T r e n d F o r u m " :

397

Kapitel 15 Produkttest - Verkaufstest - Testmarkt

Kundenzufriedenheit - erreichbar und bezahlbar?, Mainz 1996, S. 69 - Hervorhebung vom Verf.) deutlich: "Zunächst war es wichtig, daß Herr Tomczak den Begriff der Kundenzufriedenheit geklärt hat: Der Kunde ist dann zufrieden, wenn seine Erwartungen übertroffen werden; nur dann ist es möglich, eine Profilierungsleistung zu erreichen. Werden die Erwartungen des Kunden erfüllt, gibt es keine Stra/punkte; ßo««spunkte im Sinne einer Profilierung werden nur dann vergeben, wenn die Erwartungen übertroffen werden. Interessant fand ich in diesem Zusammenhang auch die Definition von Herrn Oggenfuss: 'Kundenzufriedenheit ist das Gefühl, das beim Kunden zurückbleibt' ".

Zur Messung der Kundenzufriedenheit steht inzwischen eine Reihe von Verfahren zur Verfügung. Sie können gemäß Darst. 15-2 zusammengefaßt werden. (Vgl. ähnliche - wenngleich mitunter beachtlich abweichende - Zusammenstellungen auch etwa bei LINGENFELDER/SCHNEIDER 1 9 9 1 , HOMBURG/ RUDOLPH 1995, TÖPFER 1996.)

Verfahren der Kundenzufriedenheitsmessung

objektive

produktionsorientiert (z.B. Qualitätskontrolle)

absatzorientiert (z.B. Wiederkaufrate)

subjektive (kundenorientierte)

merkmalsorientiert (z.B. multiattributive Befragung)

ereignisorientiert

Beschwerde- Sequentielle analyse Ereignismethode

\ Critical Incident Technique

Darst. 15-2: Verfahren der Kundenzufriedenheitsmessung Zu den objektiven Verfahren sollen hier auch produktionsorientierte gerechnet werden, obwohl doch - nicht zu Unrecht - die Dienstleistungsqualität zunehmend betont wird. "Wer aber, wie der Verf., als "treuer Wiederkäufer" seiner Marke eine Zeitlang nacheinander erleben mußte, daß bei jedem neuen Auto-Kauf im Laufe der ersten größeren Fahrt ein abruptes "Ende der Dienstfahrt" eintrat, wird - trotz anstandsloser Behebung der Mängel und insgesamt durchaus hoher "Servicequalität" - bestätigen können, daß die "Kundenorientierung" durchaus auch "produktionsorientiert" sein muß; alle Instrumente des Total Quality Management sind einzusetzen. Die dfcsrfizorientierten Verfahren umfassen praktisch alle einschlägigen Kennzahlen, wie Umsatz und Marktan-

398

Teil IV

Sachgebiete der betriebswirtschaftlichen Marktforschung

teil, insbesondere natürlich aber, im Hinblick auf die "Käuferwanderungen", "gain and loss"-Analysen etc. Im Mittelpunkt der neueren Entwicklung stehen die subjektiven, kundenorientierten Verfahren. Diese können zunächst merkmalsbezogen sein. Dabei sind etwa Fragen - zumeist über RatingshAen - entweder direkt nach der "Zufriedenheit" oder nach der Erfüllung von Leistungsattributen möglich. So definierten die KLM-Airlines - nach Direktmarketing vom Februar 1995, S. 9 (s. zu anderen Airlines auch das Beispiel unten) 10 "Schlüsselelemente", angefangen von der "Freundlichkeit der Crew" (25%) bis zu "Unterhaltung", "Information" und "Pünktlichkeit" mit je 4%. S. zur „multiattributiven Befragung" im Beispiel 7 unten; s. zu „multiattributiven Einstellungsmodellen" allgemein auch unter 2 . 2 . 3 . 1 . Vgl. ferner die Diskussion um Variationen bei S C H M I D T / H A H M A N N / S T E F F E N H A G E N 1 9 9 6 (sowie zur Erfassung der Qualität komplexer Dienstleistungen bei B E N K E N S T E I N / G Ü T H O F F 1 9 9 6 ) .

Während es sich hierbei um quasi "klassische" Marktforschungsmethoden handelt, trifft dies für die ereignisoñenúetten Verfahren nicht zu. Das heißt nicht, daß sie nicht schon früher entwickelt und in anderen Bereichen eingesetzt wurden.So stammt die Critical Incident Technique schon aus den 50er Jahren (FLANAGAN 1954). Bei ihrer Anwendung in der Zufriedenheitsmessung wird, wie schon der Name sagt, der Kunde nach "kritischen" Ereignissen gefragt, also solchen - positiver oder negativer Art -, an die er sich erinnert. Dagegen wird bei der Sequentiellen Ereignismethode ein "Blueprint" für alle Ereignisse gefertigt und der Kunde damit konfrontiert. Die Beschwerdeanalyse - als die quasi "automatische", passiv gegebene Form - geht dagegen von den Kundenbeschwerden aus. Sie gilt heute, da gewissermaßen nur die "Spitze des Eisberges" und den (erfahrungsgemäß geringen) Teil der Kunden, welche die "Aktivitätsschwelle" überschritten und eine Beschwerde angebracht haben, umfassend, als nicht mehr ausreichend. Gleichzeitig wird daran deutlich, daß die "Kundenzufriedenheitsmessung" nicht eine originäre Aufgabe der Marktforschung war; Kundenbeschwerden gingen sicher nicht unmittelbar in der Marktforschung ein; das "Beschwerdemanagement" (so auch der Titel von STAUSS/SEIDEL 1996) wird damit - wie natürlich auch die Kundenorientierung insgesamt - zu einer organisatorischen Aufgabe. (Für die durchzuführenden Befragungen werden jedoch oft Marktforschungsinstitute eingeschaltet; ein gewisses Problem bei allen Befragungen

Kapitel 15 Produkttest - Verkaufstest - Testmarkt

399

namentlich bekannter K u n d e n mag deren A n o n y m i t ä t bilden. S. aber z u r " K u n d e n a n a l y s e " allgemein auch in Kap. 17, speziell A b s c h n . 3.) Abschließend n o c h einige Beispiele, die nicht zuletzt die

Verschiedenartig-

keit des eingesetzten Instrumentariums veranschaulichen sollen: Beispiel 15-7 HENTSCHFX (1995 S. 358) gibt ein Beispiel für die Messung von Leistungsattributen des Kundendienstes bei der Firma Hewlett Packard. Es handelt sich dabei um "multiattributive Messungen" gemäß oben, mit folgendem Wortlaut: „Bitte bewerten Sie die Wichtigkeit (absolut unwichtig bis absolut wichtig), die die folgenden Kriterien für Sie haben. Anschließend bewerten Sie bitte Ihre Zufriedenheit (absolut unzufrieden bis absolut zufrieden) mit den erbrachten Dienstleistungen." Für die einzelnen Kriterien (eines lautete ζ. B. "Dauer der Instandsetzungsarbeiten bis zur Wiederverfügbarkeit des Systems") sind dabei 10 - waagerecht angeordnete Kästchen, jeweils für "Wichtigkeit und Zufriedenheit", vorgegeben mit der Verankerung: - (links) und + (rechts). Im übrigen wird für das Gesamtunternehmen berichtet (in mobil 2/1994 S. 20): "Experten messen den Reifegrad jeder HP-Filiale und benoten sie. Die Bestnote 5 steht für Topform, die bislang noch niemand erreicht hat. Wer 3,5 schafft, wird mit einem Pokal ausgezeichnet, den President Lew Platt persönlich überbringt. Die Aussicht auf den President's Cup erzeuge dabei die 'richtige Aufbruchstimmung'". Beispiel 15-8 Uber die Firma Philips Car Systems International GmbH berichtet die WirtschaftsWoche (Nr. 19 vom 4.5.95, S. 77): „'Und dann hatten wir die Idee mit der TelefonHotline ... Und wir haben uns wirklich Mühe gegeben', betont die Managerin für Kundenbetreuung, 'wenn wir sagten, wir rufen Sie bis Mittag zurück, dann haben wir uns daran gehalten.' Damit keine Anregung verlorengeht, werden die Kundenanrufe systematisch ausgewertet, die Ergebnisse bei der Produktentwicklung berücksichtigt. 'Die Ingenieure greifen sogar in die laufende Fertigung ein, früher dauerte das über ein Jahr, bevor die Produkte an die Kundenbedürfnisse angepaßt werden konnten.'" Beispiel 15-9 Die "10 Schlüsselelemente" der KLM-Airlines wurden oben im Text bereits erwähnt. Kundenzufriedenheitsmessungen werden aber auch bei anderen Fluggesellschaften durchgeführt. Für die Lufthansa z.B. reportiert K. Binder-Kobal (in dem erwähnten Bericht über das 2. "CPC TrendForum", S. 53) über die "Product Clinic als Instrument der Marktforschung": "In einer Flugzeugattrappe werden Flüge unter realistischen Bedingungen mit unterschiedlichen Kundengruppen simuliert. Dabei konnte ζ. B. festgestellt werden, zu welchem Zeitpunkt, in welchem Umfang und in welcher Zusammensetzung Kunden auf Mittel- oder Lang-

400

Teil IV Sachgebiete der betriebswirtschaftlichen Marktforschung

Streckenflügen gastronomisch verwöhnt werden möchten. Eine andere Möglichkeit der Product Clinic ist die Beurteilung des Sitzkomforts durch die Kunden bei der Entwicklung von Flugzeugsitzen." Ferner werden "Customer Advisory Boards" durchgeführt: "Arbeitsgruppen von 20 bis 30 Personen diskutieren unter Beteiligung von Lufthansa-Verantwortlichen ihre Erfahrungen, unterbreiten Verbesserungsvorschläge und formulieren Erwartungen, Wünsche und Forderungen an Dienstleistung bzw. Produkt." Klein berichtet über den Kundendialog in Form von Fluggastbefragungen. Der Basis-Fragebogen erziele dabei eine Rücklaufquote von 20%. Uber Conjoint Measurement sei ζ. Β. der Wunsch nach einem höheren Aufmerksamkeitsgrad der Fluggastbegleiter ermittelt worden. ( K L E I N 1 9 9 5 . ) Ein ausführliches Fallbeispiel über Lauda Air bringen S E I T Z / M E Y E R ( 1 9 9 5 , S. 3 4 4 350). Danach sei man inzwischen bei über einer halben Million Fragebögen pro Jahr angelangt. Die Fragebögen sind in der Quelle wiedergegeben; dort wird ausführlich auch auf deren Auswertung und die Erstellung von Qualitätsprofilen (mit Abbildung) eingegangen.

Aufgaben 15-1:

Fertigen Sie ein (Begriffs-)Schema der hier vorgenommenen Einteilung der Testverfahren in den verschiedenen Stadien des Produktentwicklungssprozesses an!

15-2:

Ist die im T e x t erwähnte Gefahr der Konditionierung Verschönerungstendenz

identisch?

mit der sog.

Kapitel 16 Die Werbeforschung Wegen der Bedeutung einer erfolgreichen Werbung und der damit zusammenhängenden Höhe des Werbeetats ist die Werbeforschung („Advertising Research") schon lange ein umfangreiches und relativ selbständiges Teilgebiet der Marktforschung. (Das schlägt sich auch darin nieder, daß in den USA bereits seit geraumer Zeit ein besonderes "Journal of Advertising Research" existiert.) Die dabei verwendeten Begriffe und Einteilungen sind vielfältig (und für eine "Gesamtschau" eher erschwerend). In einem 1. Abschnitt wird deshalb, unter dem Aspekt der Werbeziele und ihrer Realisierung, eine begriffliche Abgrenzung vorgenommen. Daraus ergibt sich im Abschnitt 2 die Erörterung der Werbeiragerforschung und in 3 der Werbemziie/forschung. Abschließend wird noch kurz - ohne formale Ausgliederung - auf die Werbung im Internet eingegangen.

16.1 Begriff und Abgrenzung - Die Werbeziele und ihre Realisierung "Werbeforschung" könnte zunächst (ähnlich wie Marketing-Forschung) als jegliche Bemühung um Erkenntnisgewinn im Bereich der Werbung verstanden werden. Analog den Erörterungen zur Festlegung des Begriffes Marktforschung in Kap. 1 wird hier jedoch darunter nur die Anwendung der letzteren auf das Gebiet "Werbung" aufgefaßt. Auch dabei verbleiben noch viele Teilgebiete. In der Praxis werden heute vielfach 2 große Gruppen, unterschieden: „¿ibove" und „below the line" (Sales Promotion, Sponsoring etc.) Unter ersteren ist im Kern die sog. klassische Werbung (oder „Publikumswerbung" zu verstehen; die folgenden Ausführungen beschränken sich im wesentlichen darauf. Dabei kann man zweckmäßigerweise davon ausgehen, den Prozeß der Werbung in zwei große Stadien zu zerlegen: 1. die Bestimmung der Werbeziele, 2. die Realisierung (und Kontrolle) der Werbeziele.

402

Teil V Sachgebiete der betriebswirtschaftlichen Marktforschung

Zu I: Im Mittelpunkt stehen also die Werbeziele. Dazu gehört zunächst die Festlegung des Werbeetats und der Zielgruppe. Darauf soll hier nicht mehr eingegangen werden; es gilt als durch die Entscheidung über Produkt und anzusprechendes Marktsegment als erledigt. Zu befinden ist jedoch noch über die beabsichtigte Werbewirkung. Es wird deshalb von Werbewirkungsforschung (STEFFENHAGEN 1984) oder -analyse (BEHRENS 1976) gesprochen. Diese Begriffe werden hier nicht weiter verfolgt; s. stattdessen unten.

Je nach den verschiedenen Stufen-Konzeptionen kann man das Ziel der Werbewirkung in Teilziele aufspalten (z.B. nach der altbekannten "AIDAFormel": Attention, Interest, Desire, Action) in: 1. Aufmerksamkeitswirkung, 2. Gedächtniswirkung, 3. Einstellungs(veränderungs)Wirkung, 4. Handlungswirkung. Zu 2: Die Werbewirkungen werden primär über die Werbemittel (TVSpots, Zeitschriften-Anzeigen etc.) erreicht. Zur Realisierung der Werbeziele gehört also zunächst der Entwurf des Werbemittels. Bevor dieses eingesetzt wird, sollte es jedoch auf seine Wirksamkeit getestet werden; man spricht von Pretests oder - bezeichnet man den Niederschlag der Werbewirkung als "Werbeerfolg" - von Werbeerfolgsprognose. Sieht man jedoch, unter dem zeitlichen Aspekt, den Einsatz von Tests usw. als Mittel zur Kontrolle an, so kann man sie als Posttests, zur Werbeerfolgskontrolle, bezeichnen. Da speziell ein Teil der Handlungswirkung - der nämlich, der sich im Kaufverhalten äußert - in "ökonomischen" Größen, wie Umsatz, Gewinn etc., zum Ausdruck kommt, kann man zur Unterscheidung zwischen ökonomischem und außerökonomischem Werbeerfolg gelangen. Schematisch läßt sich dies gemäß Darst. 16-1 veranschaulichen. Huth/Pflaum beziehen sich auf BIDLINGMAŒR 1973. Im Unterschied zu ihm verwenden sie die Bezeichnung "Werbewirkung" jedoch ausdrücklich nur für den "außerökonomischen Werbeerfolg". Gelegentlich wird letztere Begriffsbildung kritisiert - mit dem Hinweis, daß Werbung letztlich immer "ökonomisch" der Gewinnerzielung diene. Unabhängig davon, daß auch Werbung im "non profit-sector" existiert, ist die Messung des ökonomischen Werbeerfolgs, also etwa des Zusammenhangs zwischen Werbung und Umsatz, aber sehr schwierig. (Man denke nur an die berühmt-berüchtigten - "Lydia Pinkham"-Daten [PALDA 1964], zwei relativ lange

Kapitel 16 Die Werbeforschung

403

Zeitreihen über Werbung und Umsatz, die schon sehr oft Gegenstand von - insbesondere ökonometrischen - Analysen waren.)

Darst. 16-1: Messung des Werbeerfolgs (nach HUTH/PFLAUM 1993, S.220) Bei der Behandlung der Werbemittel (im Abschnitt 3) wird dem obigen Schema nicht gefolgt. Das ergibt sich zunächst daraus, daß die Unterscheidung zwischen Pre- und Posttest im konkreten Fall unter dem Gesichtspunkt des zeitlichen Einsatzes zwar richtig (und wichtig) ist, vielfach dafür aber das gleiche Verfahren eingesetzt werden kann. Ahnliches gilt in bezug auf die obigen vier Teil-Wirkungen. (Selbst die "Handlungswirkung" läßt sich heute schon prognostizieren, etwa mittels des "Labor-Testmarktes", gemäß Kap. 15.) Die Unterscheidung wird fließend; zumindest würden bei einer systematischen Gliederung viele Wiederholungen erforderlich. Es erfolgt deshalb später eher eine bloße Aufzählung der einzelnen "Tests". Vorstufe für die Werbemittel ist allerdings die Festlegung der Werbebotschaft. Darauf wird im folgenden nicht explizit eingegangen. (Aus den früheren allgemeinen Ausführungen dürfte die Bedeutung des Einsatzes der Marktforschung für die Gewinnung von Werbeargumenten deutlich geworden sein.) Man spricht in diesem Zusammenhang auch von " Copy-Strategien". Als Copy-Test können im Hinblick hierauf, quasi im weiteren Sinne, alle Verfahren zur Prüfung eines Werbemitteleniw«^ bezeichnet werden. Etwas enger kann man darunter auch nur die Prüfung eines gedruckten

404

Teil V

Sachgebiete der betriebswirtschaftlichen Marktforschung

Abzuges - im Unterschied zu der des noch nicht gedruckten Layouts etc. - verstehen. Im ursprünglichen Sinne handelt es sich beim Copy-Test um die Prüfung der Beachtung von Anzeigen bzw. redaktionellen Beiträgen in Zeitschriften oder Zeitungen (etwa in der Art des unten geschilderten "Wiedererkennungsverfahrens"). Im folgenden wird zwar, wie erwähnt, in einem eigenen Abschnitt (2) auf die "Mediaforschung" eingegangen. Nicht weiter diskutiert werden jedoch Mediaselektionsmodelle. Es sind dies spezielle Varianten von Marketing-Modellen, die - neben Angaben zum erforderlichen Dateninput auch modellmäßige Aussagen über die Werbewirkung enthalten müssen, um - als Output - im günstigsten Falle mittels eines Optimierungsprogramms Vorschriften über Art und Häufigkeit der Belegung der auszuwählenden Werbeträger zu erhalten. Nach einer anfänglichen Euphorie über die Möglichkeiten derartiger Modelle Anfang der 70er Jahre ist es heute diesbezüglich relativ still geworden. Das hängt eben damit zusammen, daß gesicherte "modellmäßige Aussagen" bezüglich der Werbung recht rar sind. Dazu müssen auch solche über das zweckmäßige "Timing" gerechnet werden. Darunter ist nicht nur die zeitliche Länge einer Werbekampagne überhaupt zu verstehen, sondern auch die Anzahl und zeitliche Verteilung der einzelnen Maßnahmen. Darauf wird im folgenden ebenfalls nicht weiter eingegangen. Schließlich soll auch auf die sog. Werbestatistik nicht besonders eingegangen werden. Man versteht darunter die Erfassung der Werbeaufwendungen bzw. Beobachtung des "Werbemarktes" - nicht nur global für die gesamte Volkswirtschaft, sondern gerade in tiefergehender Aufgliederung. In Deutschland hat sich darauf seit langem ein Unternehmen spezialisiert, das zunächst unter Kapferer & Schmidt (später Schmidt & Pohlmann und danach Nielsen Werbeforschung S+P) firmierte.

16.2 Werbeträgerforschung (Mediaforschung) Die Zahl der Werbeträger ist sehr groß. Neben alte, bewährte Arten treten zunehmend neue Möglichkeiten (wie ζ. B. "Sportwerbung", durch zunächst Bandenwerbung, später Trikotwerbung usw.). Hier soll, wie erwähnt, eine Beschränkung erfolgen auf die sog. klassische Werbung und innerhalb dieser auf Print (gedruckte Medien) und Funk.

Kapitel 16

Die Werbeforschung

405

Für die Berücksichtigung der Printmedien, also der einzelnen Zeitschriften und Zeitungen, in "Streuplänen" kommt es natürlich auch auf die äußeren Daten, wie Format, Anzeigenpreise, Höhe der Auflage usw. an. Sie liegen im allgemeinen vor bzw. sind leicht zu erlangen. Uber die Auflage informiert in der Bundesrepublik z. B. die IVW (Informationsgemeinschaft zur Feststellung der Verbreitung von Werbeträgern), eine Gründung des ZAW (Zentralausschuß der Werbewirtschaft). Nachdem die Bedeutung der Auflagenzahlen wegen ihrer Problematik („saisonale" Schwankungen, In- u. Auslandsauflage usw.) hinter die der „Reichweite" - s. dazu nachstehend - zurückgetreten war, ist nunmehr eine „Renaissance" der „Währung 'Auflage'" (so in der Überschrift zu einem Aufsatz von W. Meier in Horizont 39/95) zu verzeichnen. Dabei ist zunächst klar, daß es nur um die verkaufte Auflage gehen kann. Sie könnte wie folgt berechnet werden: Einzelverkauf Inland + Abo's Inland = regulär verkaufte Inlandsauflage + „sonstige Verkäufe" (Lesezirkel!) + „Sockel Auslandsauflage" (die Abrechnung der Rückläufe - „Remittenden" - benötigt hier geraume Zeit!)

=

verkaufte Auflage insgesamt. Zur Ausschaltung der saisonalen Schwankungen werden seit April 1996 //e/iauflagen veröffentlicht (mit einem „Remissionsschätzfaktor" für die noch nicht abgerechnete Auslandsauflage).

Daneben interessieren vor allem die Reichweite (sie geht weiter als die „Auflage" und enthält nunmehr neben dem LpA - Leser pro Ausgabe statt des LpS - Leser pro Seite - den LpwS - 'Leser pro werbeführender Seite' - sowie Strukturwerte, d. h. die Aufgliederung des Leserkreises nach Alter, Geschlecht, Einkommen, Beruf usw. Die Ermittlung solcher Daten hat in den letzten Jahren eine rasche Entwicklung erfahren. Im Interesse sowohl der Kostenersparnis als auch vielleicht der Einstellungen zur Verläßlichkeit der Ergebnisse erwies sich dabei ein gemeinsames Vorgehen der betreffenden Werbeträger als vorteilhaft. So kam es zunächst zur Gründung der "Arbeitsgemeinschaft Leseranalyse e.V." (AG.LA), einer gemeinsamen Einrichtung der Medien (Zeitschriftenverlage) und deren Nutzern (Werbungstreibende, Agenturen). Sie untersuchte seit 1954 zunächst in zweijährigem Turnus eine große Anzahl deutscher Publikumszeitschriften. Ab 1960 wurden diese Untersuchungen jährlich durchgeführt. Später kam es dann auch zu einer inhaltlichen Erweiterung (Einbezug von ARD und ZDF sowie großen, überregionalen Tageszeitungen) und zu einer entsprechenden Umbenennung der Untersuchung in Medienanalyse (und der Institution in AG.MA: "Arbeitsgemeinschaft Medienanalyse"). 1987 wurde das Prinzip der einheitlichen Erfassung auf-

406

Teil V Sachgebiete der betriebswirtschaftlichen Marktforschung

gegeben (um durch „mediengerechte und valide Erhebungsinstrumente" letztlich besser zu einer Fusion für verschiedene „Datenbestände in eine D a t e n b a n k für die Multimediaplanung" zu gelangen [WIEDEMANN 1987]): neben die MA Print trat dann die MA Elektronik.

1 9 9 5 / 9 6 kam es zu einer

neuerlichen Umstellung, auf die sog. rollierende

MA, mit - zunächst für

die /Vznimedien - jeweils (im Frühjahr und im Herbst) zwei „Trend-" und „Gesamtberichten". D e r erste „Trendbericht Printmedien" wurde im Herbst 1995 vorgelegt (der zweite erst im Herbst 1996); wie üblich, sind die rd. 13 000 Interviews von mehreren

Instituten durchgeführt worden.

(S. dazu A 16-1. - Z u m "koordinierten AG.MA-Stichprobensystem" s. auch in Kap. 4.) 2001 gab es (lt. Web-Site: ...agma-mmc.de) „Pressemedien II" - 26 032 Fälle - und „Pressemedien T r e n d H e r b s t " , mit 13 085 Fällen. Schon seit vielen Jahren wird - neben der M A und unabhängig davon die Allensbacher Werbeträgeranalyse durchgeführt. D i e „ A W A 2 0 0 0 " z. B. beruht auf der Befragung von 20 606 Bundesbürgern ab 14 Jahren. Dagegen gab es die erste

„Verbraucher-Analyse"

1983; die „ V A 1996"

umfaßte rd. 20 000 Interviews, 2001 dagegen schon 30 673 „Fälle". Sie ist eher als Ergänzung Konkurrenz

zur M A deklariert (wenngleich sie auch in gewisser

dazu gesehen werden kann); so wird der Charakter der M A

„als Leitwährung" betont. E i n Unterschied zu dieser besteht darin, daß die Initiative auf zwei große Verlage zurückgeht (mit einer großen Anzahl weiterer „Nutzungsberechtigter"). Dagegen wurde die - ursprünglich sogar nur von einem Verlag getragene - „Typologie der Wünsche (Intermedia)", die T d W I , eher zu dem in Kap. 12 erwähnten „Verlagstypologien" gerechnet, sollte dann aber „aus dem Schatten der V A treten" (so in der Uberschrift zu einem Aufsatz in Horizont 32/96). Das führt auch hin zu speziellen Leser-Analysen für einzelne Verlage oder Verlagsgruppen - sei es mit anderer Anlage (wie z. B. die L A E - „Leser-Analyse Entscheidungsträger" des Spiegel-Verlages), sei es, weil die betreffenden Verlagserzeugnisse (wie Fachzeitschriften oder regionale Tageszeitungen) von solchen allgemeinen Untersuchungen wie der M A gar nicht erfaßt sind. Speziell auch im Hinblick auf letztere gibt es das ZAW-Rahmenschema (8. Aufl. 1994): Richtlinien, die die Verlage beim Erstellen von Leser-Analysen beachten sollen. D i e Funkmedien sind Hörfunk und T V . D e r H ö r f u n k - und mit ihm die einbezogenen großen Tageszeitungen - ist in der M A enthalten (2001: „Ra-

Kapitel 16 Die Werbeforschung

407

dio II, 54 154 Fälle). Daneben existieren spezielle - insbesondere auch regionale - Analysen. Für TV gibt es einerseits - analog der MA - große repräsentative Umfragen, die zusätzlich zur Auskunhsbereitschaft auch das entsprechende -vermögen - hier: Erinnerungsvermögen! - voraussetzen. 1996 wurde hier die erste von der „Arbeitsgemeinschaft VuMA" in Auftrag gegebene Untersuchung vorgestellt: von 4 Instituten aufgrund des ADM-Stichprobensystems - s. dazu Kap. 4 - mittels Adressen-Randoms bei rd 18 000 Personen durchgeführte persönlich-mündliche Interviews (mit Haushaltsbuch) über die Mediennutzung („TV und Radio MA-vergleichbar, Print reduziert") und - im Sinne von Single Source - Freizeitverhalten, Haushaltsausstattung, „persönliche und haushaltsbezogene Verwendung/Kauf aus 250 Produktbereichen mit 500 Marken." Die VuMA 2001 umfaßte - lt. ...ardwerbung.de - bereits 900 Marken und wurde, mit 12 447 Interviews, in zwei Wellen im Herbst 2000 und Frühjahr 2001 durchgeführt. Daneben erfolgt der Einsatz von Panels (als „Spezial-Panels" gemäß der Einteilung im Kap. 7), mit entsprechenden Geräten, welche die „Sehbeteiligung" bzw. „Einschaltquoten" messen, die sog. Meterforschung. Derartige Ermittlungen wurden in der Bundesrepublik zunächst von INFRATAM vorgenommen, mittels eines Panels von 825 Haushalten (je 125 in den Sendegebieten NDR/RB, WDR, HR, SDR/SWF und BR, je 100 beim SR und SFB). Das entsprechende Meßgerät bezeichnete man als Tammeter, den Anteil der Haushalte, die eine bestimmte Sendung einschalteten, als Tamrating. Zusätzlich zu diesen sog. quantitativen wurden qualitative Ermittlungen durchgeführt. Dazu befragte INFRATEST - nicht im Rahmen eines Panels, sondern über einen Quotenschlüssel - pro Tag 300 Personen in Haushalten mit TV-Geräten zu ihrem Fernsehkonsum am letzten und vorletzten Tag. Dabei erbat man die Beurteilung der gesehenen Sendungen anhand einer 6stufigen Skala (von "sehr gut" bis "sehr schlecht") und erstellte aufgrund dessen einen "Index" von +10: "sehr gut" bis -10: "sehr schlecht". (Ab 1972 wurden darüber hinaus weitere Daten - z.B., ob die Sendung ganz oder nur teilweise gesehen worden war - erhoben.) Im Zuge der - nachstehend geschilderten - Umstellung des Panels entfielen auch diese Ermittlungen. Auch später dachte die AGF (s. dazu unten - lt.

408

Teil V

Sachgebiete der betriebswirtschaftlichen Marktforschung

1995, S. 71) nicht daran, „Programmbewertungen durch Zuschauer vornehmen zu lassen". STOCKMANN

1975 erfolgte eine Neuorientierung der Panel-Erhebungen. Dabei ging es vor allem darum, den entscheidenden Nachteil des alten Verfahrens, daß im Grunde nur die Laufzeit der Fernsehgeräte in den ausgewählten Haushalten, nicht aber die Sehbeteiligung der darin lebenden Personen gemessen wurde, zu beseitigen. Die Entscheidung unter den eingereichten Vorschlägen fiel dabei zugunsten der Teleskopie, eines gemeinsam von IflD Allensbach und Infas Bad Godesberg - aufgrund ausländischer Vorbilder entwickelten Verfahrens. Basis für die Untersuchung war ein Panel von 1200 Haushalten, mit etwa 3100 Personen, darunter rd. 500 Kinder zwischen 3 und 13 Jahren. (Die regionale Panel-Größe schwankte zwischen 100 Haushalten in den kleineren Sendegebieten - SFB, SR, SDR - und 270 im Gebiet des WDR.) Das dabei verwendete Meßgerät wurde Teleskomat genannt; es registrierte - mittels besonderer Teilnehmertasten - die Sehbeteiligung der einzelnen Personen und machte sie über ein Modem telefonisch abrufbar. 1979 wurde die Geräte-Technologie verbessert (und der Name geändert in "teleMetron"). Auch die Stichprobe war im Laufe der Zeit vergrößert worden; sie umfaßte 1985 1600 Haushalte. Zu dieser Zeit wurde der Auftrag wiederum neu vergeben und ging nunmehr an die GfK, Nürnberg. Die Gründe dafür mögen vielschichtig gewesen sein. Methodisch schienen sie (nach WIEDEMANN 1 9 8 5 ) vor allem in zweierlei Richtung zu liegen: Einmal weist das entsprechende Gerät, das "Gfli-Meter" (später, wie schon in der Schweiz: Telecontrol) gewisse technische Vorzüge auf - insbesondere im Hinblick auf Fernbedienung und Videorecorder -, zum andern war die Stichprobe größer (um fast tausend Haushalte) und vor allem ebenfalls auf dem AG.MA-Stichprobensystem (s. dazu Kap. 4, "ADM-Master-Sample") beruhend.

1988 wurde die „Arbeitsgemeinschaft Fernsehforschung" (AGF) gegründet; ihr gehörten (und gehören) neben den beiden öffentlich-rechtlichen Fernsehanstalten auch „Private" an, speziell die Sender-Familien „RTL" und „Pro Sieben/SAT 1". Sie vergab, nach Ausschreibung, 1993 den erneuerten (Forschungs-)Auftrag wiederum - damals zunächst bis 1999 - an die Gr/K". Letztere mißt seit 1995 mit einem neuen „GfK-Meter" Telecontrol XL. Dem neuen Gerät wird der Vorzug zugeschrieben, „Sender über eine automatische Kanalerkennung und über einen in der Austastlücke enthaltenen Sendercode (ähnlich dem Video-Programmierer-Signal VPS) zu identifizieren" (STOCKMANN 1995, S. 71). Gleichwohl handelt es sich noch immer um eine „aktive" Messung. Der Zuschauer

Kapitel 16 Die Werbeforschung

409

entscheidet also selbst durch „Knopfdruck" - gegenüber einer passiven Messung, die ihn automatisch, über hochauflösende Systeme, identifizieren würde. Abgesehen von den Kosten, befürchteten Kritiker dabei - wegen des doch weitgehenden Eingriffs in den persönlichen Bereich - eine Verminderung von Akzeptanz und damit letzlich Repräsentanz. In beiden Fällen ist aber nur sehr schwer festzustellen, ob das eingeschaltete Gerät mehr oder weniger nur „mitläuft". (Zu den Problemen der Höreriorschung mit entsprechenden Meßgeräten - sog. Audio- oder Radiometer - s. in Kap. 5; seit 2001 läuft hier, im Anfangsstadium, ein [GfK-]Panel mit „Radiocontrol".)

Ab 1996 wurde das Panel weiter aufgestockt, um 360 Haushalte in Ballungsräumen. Der Vertrag mit der GfK war 1999 um weitere 5 Jahre prolongiert worden; ab 2000 geschah die Zusammenlegung mit dem „Ausländer"-Panel; damit werden 5660 Haushalte erfaßt. Insgesamt ist damit das Ziel verfolgt worden, die AGF-Ergebnisse - mit der GfK als „Dienstleister" - als „einheitliche Währung" aufrechtzuerhalten. Denn der „TVWährungskonsens beginnt zu bröckeln" (so die Uberschrift zu einem Artikel von R. Karepin in Horizont 21/95), und zwar auch wegen der Zunahme von - in der AGF nicht vertretenen - Regional- wie Spartenprogrammen. Die Verschmelzung von Mediennutzungs- und Verbrauchsdaten erfolgt in der MA durch „Fusion": Zunächst werden die Ergebnisse des G/K-Meter-Systems in die „Elektronik-MA" hinein und diese dann mit der „Pressemedien-MA" zusammengebracht. Die zukünftige Entwicklung muß deshalb als offen erscheinen: Es wird fraglich, ob eine „einheitliche Währung" erhalten bleiben kann. Zwar eröffnen sich durch die Zusammenlegung mehrerer Datensätze neue Möglichkeiten; im Grunde bleiben solche Fusionen aber immer problematisch, da eben mehr auf „fiktive" denn „tasächliche" Haushalte abstellend. Andererseits wurde auch auch das „Single Source" von Nielsen als „ein bisher nicht überzeugendes Panel" bezeichnet (MediaFacts 8/96, S. 4). Immerhin ist aber die Fernsehzuschauerforschung von Nielsen („Television Audience Measurement" - ΤΑΜ) in vielen Ländern verbreitet und hat ein entsprechendes Meßgerät, „Eurometer", installiert, im Rahmen des - in Kap. 7 bereits erwähnten - „Homescan Single Source Panel".

Dabei ist selbst die „Meterforschung" in Frage zu stellen: „Verschiedene Entwicklungen lassen erwarten, daß die 'people-meter'-Systeme ihre innerhalb kürzester Zeit erworbene überragende Stellung für die Fernsehzuschauerforschung in Europa nahezu ebenso schnell wieder einbüßen werden." (BAUER 1 9 9 6 , S. 1 4 0 . ) Der Grund dafür ist in der Digitalisierung und - damit verbunden - Fragmentierung des Nutzerkreises zu sehen. Ersteres führt zu Nischenkanälen (und damit zu einer Rückkehr zu älteren Methoden) oder sogar zu „interaktiven Formen" (die eine direkte

410

Teil V

Sachgebiete der betriebswirtschaftlichen Marktforschung

Messung ermöglichen würden). Die Fragmentierung gilt aber über TV hinaus auch für den Hörfunk und insbesondere die Printmedien und läßt damit auch für diese Bereiche Veränderungen erwarten.

16.3 Werbemittelforschung Die vielfältigen Möglichkeiten der Werbemittelforschung - oft als "Tests" bezeichnet - könnte man nach verschiedenen Kriterien systematisieren (s. auch Abschn. 16.1): Pre- und Post-Tests; einzelne Werbewirkungen (Aufmerksamkeits-, Gedächtnis- usw. -Wirkung); ohne oder mit bewußter Mitwirkung ("offene" vs. "biotische" Situation usw.; s. Kap. 6) etc. Allein in bezug auf Pretests bemerkt FELDWICK (1995, S. 60): „Es gibt unzählige verschiedene Pretest-Systeme. D D B Needham in den U S A haben ein Verzeichnis der Tests herausgegeben, die es in den U S A gibt. Es hat den Umfang eines N e w Yorker Telefonbuches."

Auf eine Systematisierung soll im folgenden - zumal nicht überschneidungsfrei - verzichtet werden. Stattdessen erfolgt mehr eine bloße Aufzählung; im Interesse der Übersichtlichkeit wird eine Zusammenfassung zu Gruppen versucht: 1. Das Recognition-Verfahren (Wiedererkennungsverfahren) besteht in seiner einfachen - "unkontrollierten" - Form darin, daß den Auskunftspersonen nacheinander Werbemittel (in der Regel in den großen Zeitungen und Zeitschriften erschienene Anzeigen) vorgelegt werden und sie angeben sollen, ob sie das Material bereits gesehen haben. Da diese Nennungen aus den verschiedensten Gründen (Verwechslungen, Prestigegründe usw.) unrichtig sein können, also auch solche Werbemittel als "wiedererkannt" bezeichnet werden, bei denen in Wirklichkeit ein Wiedererkennen nicht vorliegt, wird neben dem "einfachen" das "kontrollierte" Wiedererkennungsverfahren angewandt. Die Angaben der Auskunftspersonen werden dabei in irgendeiner Weise kontrolliert. Meist geschieht dies durch die Aufnahme erfundener bzw. noch unveröffentlichter Anzeigen in die Vorlage. Man spricht dann auch von "Folder" (künstliche Zeitschriften, in die die zu testenden Original- und FalschAnzeigen - sowie ggf. entsprechende redaktionelle Beiträge - eingebunden werden) und bezeichnet die Methode als Folder- oder Portfolio-Test. Auch der Ausdruck "Dummy-Testing" ist üblich.

Kapitel 16

Die Werbeforschung

411

Man kann letzteres - und im Grunde das ganze Recognition-Verfahren auch als "aided recall" ansehen; s. dazu nachstehend. (Vgl. auch A 16-2.) Daß man überhaupt eine Trennung vornimmt, hängt mit bestimmten Spezifika der konkreten Verfahrensausprägung zusammen. So wandte zwar schon STRONG (1912) das Recognition-Prinzip an; seine spezielle Ausprägung erfuhr es jedoch - bereits in den 20er Jahren - durch STARCH (vgl. etwa 1966). Der Starch-Test besteht darin, daß dem Befragten das entsprechende Heft (Original oder Folder) vorgelegt wird und dieser es zusammen mit dem Interviewer durchgeht und jeweils angibt, was er "bemerkt", "betrachtet" oder "gelesen" hat. Das Verfahren eignet sich damit im Prinzip nicht nur für die Werbung speziell, sondern für das Leseverhalten schlechthin (man spricht deshalb auch von "Starch Readership Study"; s. auch oben, "Copy-Test"). Es wurde deshalb früher sehr häufig angewandt. Inzwischen sind jedoch auch aufgrund verschiedener Untersuchungen - Zweifel daran aufgetreten, was es eigentlich mißt. Heute neigt man eher dazu, daß es "nicht die Aufmerksamkeitswirkung einer Anzeige mißt, sondern nur die Bereitschaft, zuzugeben, daß man die Anzeige gesehen hat" (REHORN 1 9 8 7 , S. 214). Es wird deshalb allein in der Werbemittelforschung kaum mehr eingesetzt. 2. An seine Stelle ist heute - eventuell in Verbindung damit - das RecallVerfahren (Erinnerungsverfahren) getreten. Man unterscheidet dabei zwischen "pure" oder "unaided" und "aided recall". Beim unaided Recall (oder Verfahren der reinen Gedächtniskontrolle) ist die Auskunftsperson allein auf ihr Gedächtnis angewiesen; dagegen werden beim aided Recall möglicherweise in verschiedenen Stufen - Gedächtnishilfen gegeben. Ihre besondere Ausprägung hat die Methode durch Gallup erfahren. Dadurch wurde auch der sog. Impact-Test bekannt. Er erhielt seinen Namen durch die von Gallup herausgegebene Testzeitschrift "Impact", eine Zeitschrift, die - in ihrer Aufmachung und in ihrem Inhalt anderen ähnlich - lediglich zum Zwecke der Prüfung von Anzeigenentwürfen gedruckt wurde. Einige Zeit nach der Verteilung erfolgte die Ermittlung (zunächst mit Hilfe einer Markenliste und später mit weiteren Fragen) der Erinnerung an die einzelnen Anzeigen. Das Verfahren war unter dieser Bezeichnung lange Zeit auch von EMNID praktiziert worden.

412

Teil V Sachgebiete der betriebswirtschaftlichen Marktforschung

Auf eine andere Variante hatte sich (das US-Institut) Burke spezialisiert: den DAR-Test. Dieser "Day After Recall"-Test (weitere Version: SDRTest - Same Day Recall) ist für Printmedien, aber auch für TV-Spots entwickelt worden: "Nachdem ein Spot im Werbefernsehen ausgestrahlt wurde, wird einen Tag später per Telefonumfrage bei einer Stichprobe von durchschnittlich 100 bis 150 Personen (Seher des Werbeblocks) ermittelt, wer sich an den Testspot erinnert." ( R E H O R N 1 9 8 7 , S. 2 0 7 . ) Eine besondere Variante stellt der von Keppler, Stuttgart, entwickelte CEDAR-Test (Controlled Exposure Day After Recall) dar: "Die Zielpersonen werden in das Institut eingeladen, und es wird mit ihnen ein Scheininterview durchgeführt (Durchführung eines Produkttests). Zur gleichen Zeit wird ein Fernsehblock mit Werbespots ausgestrahlt. Einen Tag später werden ... per Telefon Recall werte ermitt e l t . " (REHORN 1 9 8 7 , S. 2 0 7 . )

3. Die "klassischen" Recognition- und Recall-Verfahren werden, trotz aller Zweifel speziell hinsichtlich ihrer Validität, in der Praxis häufig angewandt. Sie beschränken sich jedoch (mit den vorerwähnten Ausnahmen) auf die Printmedien. In bezug auf Werbefilme und -spots stellt ein ebenfalls schon beinahe "klassisches" Verfahren der sog. Theatertest, nach dem "Erfinder", dem (US-)Institut Schwerin, auch Schwerin-Test oder aber: "Schwerin-Theater-Test" - genannt, dar. Er gehört zu den Verfahren, die nicht in erster Linie die Aufmerksamkeits- oder Gedächtniswirkung, sondern die Wirkung auf die Veränderung der Einstellung messen sollen (und deshalb auch als "Pre-/Post-Choice-Verfahren" bezeichnet werden). Innerhalb dieser zählt er zu den sog. Lotterie-Methoden: Eine möglichst repräsentative - Gruppe von Personen wird in ein Studiotheater eingeladen. Vor Beginn der Filmvorführung werden die Leute gebeten, aus einer Liste von konkurrierenden Produkten die auszuwählen, die sie bei einer Verlosung gern gewinnen möchten ("pre-choice"); nach der Vorführung ist wiederum zu wählen ("post-choice"), und die Ergebnisse werden verglichen, somit die Veränderungen der Präferenzen festgestellt. Der Schwerin-Test (der zumindest in Deutschland kaum noch angewandt wird - "... erkannte man, daß der Theatertest ein Testtheater war" [ R E H O R N 1 9 8 7 , S. 1 3 1 ] ) gehört damit zu den sog. forced-exposure- Verfahren. Im Gegensatz dazu wissen bei On-Air-Tests die Testpersonen beim Zuschauen noch nicht, daß sie später darüber befragt werden.

Kapitel 16

Die Werbeforschung

413

4. Die verschiedenen Möglichkeiten von (Pre- und Post-)Tests mittels apparativer Einrichtungen wurden im Grunde - in Kap. 5 - bereits behandelt; dazu gehören: - Augenkamera bzw. Blickaufzeichnung, - Tachistoskop, - Schnellgreifbühne, - Galvanometer, - Program Analyzer. Die Validität bzw. Relevanz mancher dieser Verfahren für die Werbeforschung muß derzeit als eher offen betrachtet werden. (S. dazu auch in Kap. 5.) Am ehesten scheint sie, wie empirische Untersuchungen zeigen, noch dem Tachistoskop zuzukommen; vgl. dazu etwa PELZ 1 9 8 2 . (S. im übrigen auch die bereits in Kap. 2 erwähnte Schrift von HOSSINGER, 1 9 8 2 . ) 5. Während die vorstehend genannten Möglichkeiten der Methode der Beobachtung zuzurechnen waren, sind natürlich für die Werbeforschung auch - speziell psychologisch ausgerichtete - Befragungen (s. Kap. 4) geeignet. Zu denken ist hierbei insbesondere an die verschiedenen Skalierungsverfahren zur Messung der Einstellungs(veränderungs)wirkung: einfaches Rating sowie Ranking - einschließlich von Paarvergleichen - bis hin zu Polaritätsprofilen usw. Dabei können auch nicht-standardisierte Interviews, selbst im Rahmen von Expertenbeurteilungen, in Betracht kommen. 6. Von besonderem Interesse ist natürlich die Ermittlung der Handlungswirkung. Dazu kann zunächst das Verfahren der Anfragen- und Verkaufskontrolle mittels Coupon herangezogen werden. Es besteht darin, daß dem Werbeappell zur Anforderung von Prospekten, Katalogen usw. oder zum Kauf ein auszuschneidender Coupon oder eine Werbeantwortkarte beigefügt wird. Bei mehreren Werbeträgern kann man die Wirksamkeit dieser dadurch zu testen versuchen, daß bei jedem eine andere Kennzeichnung (ζ. B. Firma .., Abt. Β ..) angegeben wird. Man kann aber auch - umgekehrt - die Wirksamkeit mehrerer Werbewitte/ zu testen versuchen, indem die Auflage eines 'Werbeträgers nach reinen Zufallsgesichtspunkten halbiert oder gevierteilt und jede Teilgruppe gleichmäßig über das gesamte Verbreitungsgebiet gestreut wird {Split-Run- Verfahren). Das letztgenannte Vorgehen weist schon auf experimentelle Anordnungen (Kap. 6) hin. Als solche kommen vor allem die verschiedenen Formen des Markttests in Frage; s. dazu ausführlich Kap. 15.

414

Teil V Sachgebiete der betriebswirtschaftlichen Marktforschung

Wie eingangs angemerkt, soll abschließend noch das Problem der Messung von Online-Werbung angesprochen werden. Diese Betrachtungen stehen am Schluß des Kapitels für dieses insgesamt, weil hierbei auch die Unterscheidung zwischen Werbeträgern und Werbemittel fraglich wird. So ist bei einem auch als Internet-Version erscheinenden Printtitel nur der Zugriff auf die Seiten oder Teile davon von Interesse; hier stellt sich die Situation ähnlich dar wie sonst, wenn dem Nutzer nur der redaktionelle Text interessiert und die Werbung nur en passant „ins Blickfeld gerät". Anders ist die Frage, wenn der Nutzer - vielleicht aufgrund eines anderswo gegebenen Hinweises - von sich aus die Werbung aufsucht. Grundsätzlich erlauben die vorhandenen technischen Möglichkeiten die individuelle Messung jeder Nutzung; dem können jedoch Datenschutzprobleme entgegen stehen. (So hat das EU-Parlament - nach einem Bericht in „Die Welt" von 1 6 . 1 1 . 0 1 - beschlossen, Internet-Spürprogramme, sog. Cookies, zu verbieten, sofern nicht eine Einwilligung des Nutzers, der sie allerdings schon bisher zumeist „ausschalten" konnte, vorliegt.) Für die Messung bei den Web-Sites selbst gab es zunächst verschiedene Vorschläge, vom DMMV (Deutscher Multimedia-Verband) etwa: - Page Impressions (Seitenabrufe) - Browser (Nutzungen) - User (Nutzer) - Identified User (identifizierte Nutzer) - Visits (Besuche) - Ad Impressions (Werbekontakte) - Ad Clicks (Werbe-Klicks - über ein werbetragendes Objekt [Link]) Der BDZV (Bundesverband Deutscher Zeitungsverleger) dagegen meinte, mit nur zwei Begriffen auszukommen: Page Views (entspricht den „Page Impressions") und Visits. Nach der Einigung der Verbände - im Kern auf „Page Impressions" und „Visits" - werden nunmehr die Messungen von der oben erwähnten IVW durchgeführt. (Vgl. zu den damit verbundenen - größtenteils „technischen" - Problemen etwa W E R N E R 1 9 9 9 . ) Daneben gibt es zahlreiche Ansätze, über Befragungen bzw. Panels diese eher „objektiven" Kontaktmessungen mit (stärker subjektiven) Nutzungsgewohnheiten zu verbinden.

Kapitel 16 Die Werbeforschung

415

Aufgaben 16-1: Wie hätte das vollständige System der „rollierenden MA" (für die Printmedien), mit der erwähnten Fallzahl von rd. 13 000 im Frühjahr und Herbst für den Trendbzñchx, aussehen können? 16-2: Nach REHORN (1987, S. 114) wurde in "Foldertests im Bereich Körperpflege" folgende "Frage zum Recall" gestellt: "Welche Produkte und Marken wurden in den Anzeigen, die Sie gerade gesehen haben, gezeigt? Nennen Sie mir bitte alle Markennamen mit der dazugehörigen Produktart, die Ihnen einfallen". (Falls nur Produktart genannt: "Um welche Marke handelt es sich dabei?" Falls nur Markenname genannt: "Um welche Produktart handelt es sich dabei?") Hätte es hier nicht besser: "Frage zur Recognition" heißen müssen?

Kapitel 17 Besondere Bereiche der Marktforschung Die bisherigen Betrachtungen bezogen sich, gemäß der "Einführung" zu diesem IV. Teil, auf die Anwendung der Marktforschung im allgemeinen. Insofern gelten sie im Grunde mehr für die Konsumgüterindustrie. In diesem Kapitel sollen die Besonderheiten, die sich aus dem speziellen Charakter von Wirtschaftsbereichen ergeben, erörtert werden. Dabei liegt es, wie angedeutet, nahe, nach dem sachlichen Gesichtspunkt, nach dem Objekt, das auf den zu untersuchenden Märkten gehandelt wird, nach der Art der "Güter" also, zu differenzieren. Daneben können weitere Einteilungskriterien verwandt werden, so etwa nach der räumlichen Ausdehnung des Marktes die Unterscheidung zwischen nationaler, "übernationaler" und globaler Marktforschung. Im folgenden wird nicht im Sinne einer strengen Systematik nach diesen Kriterien - zumal nicht überschneidungsfrei - vorgegangen, sondern eher im Wege einer bloßen Aufzählung für wichtige Bereiche. So werden im 1. Abschnitt die Besonderheiten der Investitionsgütermarktforschung diskutiert. Gegenstand des 2. Abschnitts ist die A «s/dmismarktforschung. Im Abschnitt 3 ist auf den besonderen Charakter der Marktforschung für Dienstleistungen (speziell: im Einzelhandel, für Banken und Versicherungen und für den Fremdenverkehr) abzustellen. Ergänzend folgen, in einem Exkurs, noch einige Hinweise zum Sondergebiet "Umfragen und Gewerblicher Rechtsschutz".

17.1 Die Marktforschung für Investitionsgüter Die Begriff "Investitionsgut" wird hier, in einem weiten Sinne und in Anlehnung an den Sprachgebrauch in der Wirtschaftstheorie, im Gegensatz zu dem des Konsumgutes verwandt; er umfaßt also alle materiellen Güter, die nicht Konsumgüter sind. (Eine dritte Gruppe bilden die immateriellen Güter, die "Dienstleistungen" - s. Abschnitt 3.) In einem engeren Sinne werden gelegentlich unter "Investitionen" auch nur Anlagen fM«jrwsi«wgs-Investitionen") verstanden. Letztere könnte man dann den "Produk-

Kapitel 17 Besondere Bereiche der Marktforschung

417

tionsgütern" entgegensetzen. Auf den Begriff Troí/«&£¿í>güter-Marktforschung" wird deshalb verzichtet. Mitunter wird auch von "industrieller Marktforschung" (s. auch in den USA: industrial marketing) gesprochen.

Die Besonderheiten des Marktes für Investitionsgüter sind mannigfach. Sie können hier (vgl. dazu auch HÜTTNER/VON AHSEN/SCHWARTING 1 9 9 9 , S. 388) wie folgt zusammengefaßt werden: - als Nachfrager treten Organisationen (Unternehmungen etc.) auf - das Käuferverhalten nimmt den Charakter eines - in der Regel multipersonalen - Organisationalen Beschaffungsverhaltens an (mit der Konsequenz, daß der Entscheidungsprozeß oft stärker formalisiert ist - "Einkaufs-Richtlinien" o.ä.) - die Nachfrage ergibt sich als abgeleitete Größe ("derivative Nachfrage") - der Verwendungszweck besteht in der Hervorbringung weiterer Sachbzw. Dienstleistungen - es handelt sich dabei häufig um komplexe Problemlösungen·, die auf individuelle Kundenbedürfnisse zugeschnitten werden müssen. Dazu kommt noch, daß die Investitionsgüter, im Sinne der obigen Definition, außerordentlich heterogen sind. Neben solchen, die sich sachlich von Konsumgütern kaum unterscheiden (sondern eben nur durch ihren Verwendungszweck), wie Firmen-Pkw, Schreibmaschinenpapier, Farbe etc., treten solche, die ganz andersartig sind - etwa Kraft- oder Walzwerke. Das macht es auch so schwer, allgemein und doch konkret genug zu sein, oder, anders ausgedrückt, führt dazu, daß die Literatur vielfach entweder sehr allgemein bzw. abstrakt bleibt oder auf ganz konkrete Branchen oder Fälle abstellt. Auch im folgenden kann dieses Dilemma kaum vermieden werden; neben nur sehr wenige allgemeine Hinweise sollen dabei einige konkrete Beispiele treten. („Man wird von der Vorstellung Abschied nehmen müssen, als gäbe es ,die' Investitionsgütermarktforschung." ENGELHARDT 1 9 9 8 , S. 1 6 3 . )

In bezug auf die Methoden der Datengewinnung ist zunächst festzustellen, daß die Primärforschung relativ stark in den Hintergrund tritt. Innerhalb dieser steht jedoch auch hier die Befragung im Vordergrund. Hinsichtlich des Adressatenkreises wird man dabei die Verbraucherbetrugung vorziehen - meist die des Zwischenverbrauchers, des unmittelbaren Abnehmers (obwohl im Einzelfall auch die Befragung der £w/verbraucher in Betracht kommen kann). Allerdings finden hier ebenfalls in relativ großem Umfange £xperie«befragungen statt. Nach dem Erhebungsmodus bietet sich in erster Linie die mündliche Befragung an - nicht nur wegen der höheren Antwortquote, sondern auch der besonderen Art der Fragestellung und des Problems der Wahl der richtigen Auskunftspersonen (s. dazu unten). Aber auch schriftliche und

418

Teil IV

Sachgebiete der betriebswirtschaftlichen Marktforschung

telefonische Befragungen werden öfters vorkommen: Für die schriftliche Form spricht die geringere Kostenhöhe, für die telefonische darüber hinaus die Zeitersparnis (und die nicht bestehende Gefahr der Beeinträchtigung der Repräsentanz durch unterschiedlich weite Verbreitung des Telefons). Mitunter werden auch Kombinationen praktiziert, etwa in der Weise, daß die besonders wichtigen Betriebe mündlich, die weniger wichtigen telefonisch befragt werden. Insgesamt wird es sich fast immer um Spezw/befragungen handeln müssen. Bezüglich der Befragungsstrategie ist offenkundig, daß das in der Konsumgütermarktforschung weitgehend übliche standardisierte Interview hier nicht so sehr in Betracht kommen kann, sondern eher nur das Interview mit variabler Fragenfolge, wenn nicht gar das völlig freie Interview. Der Grund dafür liegt nicht zuletzt darin, daß es sich bei den Auskunftspersonen in der Regel um in verantwortlicher Stellung Tätige handelt. Damit wird die Wahl der Interviewer zu einem besonderen Problem. Ganz zweifellos ist es schwierig, dafür einfach Personen aus einer allgemeinen Interviewer-Organisation zu verwenden. Vielmehr müssen in der Investitionsgütermarktforschung einzusetzende Interviewer einerseits das erforderliche Niveau zur Durchführung von Gesprächen auf höherer Ebene, andererseits aber auch - sofern eben nicht ein standardisierter Fragebogen verwendet werden kann - die jeweils notwendigen fachlichen bzw. technischen Kenntnisse besitzen. Vielfach versucht man dies dadurch zu erreichen, daß die gesamte Untersuchung einschließlich Interviews von demselben Arbeitsteam durchgeführt wird - im Gegensatz zu der strikten Trennung von Planer, Interviewer und Auswerter in der Konsumgütermarktforschung.

Besonders schwierige Probleme wirft die Auswahl der Befragten auf. Dabei geht es zunächst um die Auswahl der Betriebe. Vielfach scheidet dabei die Zufallsauswahl aus; in der Praxis dominieren Quotenverfahren und vor allem das Konzentrationsprinzip. (MORIARTY 1983 weist auch auf den Einsatz des Schneeballverfahrens hin.) Das bedeutet, daß zunächst die als bisherige oder - bei neu einzuführenden Produkten - zukünftige Abnehmer in Betracht kommenden Wirtschaftszweige festgestellt und in diesen die einzelnen Firmen nach ihrer größenmäßigen Bedeutung ermittelt werden. (Ein besonderes Problem ist dabei die Festlegung des Kriteriums für die Größe, ob ζ. B. Beschäftigtenzahl, Umsatz, Einkäufe, Einsatz be-

Kapitel 17 Besondere Bereiche der Marktforschung

419

stimmter Aggregate usw.) Es erfolgt dann eine Konzentration auf die wichtigsten Betriebe. Damit entfällt einerseits die Grundlage für die Berechnung von Fehlergrenzen usw., andererseits tritt ein für die praktische Durchführung der Marktforschung wesentlicher Nachteil auf: Da von den "Großbetrieben" wegen ihrer Bedeutung meist sämtliche befragt werden müssen, die Weglassung auch nur eines Betriebes die Repräsentanz also bedeutend verschlechtern würde, kommt es bei fortschreitender Anwendung der Marktforschung auch in der Investitionsgüterindustrie praktisch dazu, daß weitgehend immer wieder dieselben Betriebe betroffen sind. Das folgende Beispiel ist zwar schon etwas alt, zeigt aber doch wohl anschaulich die Problematik bei der Auswahl der Betriebe und zugleich den Ablauf einer ganzen Marktanalyse für ein Investitionsgut: Beispiel 17-1 Eine Maschinenfabrik hatte einen neuen Motorkompressor zur Verwendung in der Bauindustrie entwickelt. Die Absatzchancen dieses Produkts waren zu klären. Bei der Analyse des sekundärstatistischen Materials ergab sich, daß in nur 9% der Betriebe, den Großbetrieben, 72% aller Kompressoren zu finden waren; mit einer Auswahl von 6000 Großbetrieben aus der Gesamtzahl der Betriebe von 63000 hätte man also rd. drei Viertel des Marktes erfaßt. Der Vergleich von Statistiken mehrerer Jahre zeigte jedoch, daß die Zuwachsrate im Bestand an Motorkompressoren bei den kleineren Betrieben größer war. Außerdem mußte bedacht werden, daß der Fall der ersten Anschaffung bei den kleineren Betrieben häufiger auftritt als bei den Großbetrieben mit ihrem überwiegenden Erneuerungsbedarf (mit der Konsequenz schlechterer Absatzchancen für ein neues Produkt). Schließlich wurden insgesamt 350 Interviews durchgeführt, die ergaben, daß zwar das neue Produkt in der technischen Ausführung allgemein positiv beurteilt wurde, hinsichtlich Preis und Leistung aber wesentlich vom "Ideal" abwich. Lediglich 7% der Befragten wären bereit gewesen, den Kompressor zu kaufen. Daraus folgte, daß nur insgesamt etwa 600 solcher Kompressoren hätten abgesetzt werden können. Zumal bisher der Bedarf durch drei bekannte Fabrikate gedeckt wurde, entschloß man sich, das Produkt nicht auf den Markt zu bringen. (Quelle: WISSEL 1960.)

Eine weitere Schwierigkeit stellt die Auswahl der Auskunftspersonen innerhalb des Betriebes dar. Man muß ja darum bemüht sein, diejenigen Personen als Gesprächspartner zu erhalten, die tatsächlich maßgeblich an der Entscheidung über die Anschaffung von Investitionsgütern beteiligt sind. Es geht also darum, sie im Rahmen der Theorie des Organisationalen Be-

420

Teil IV Sachgebiete der betriebswirtschaftlichen Marktforschung

schaffungsverhaltens,

in Sonderheit des sog. Buying

Centers,

konkret

zu

identifizieren. Dieses Problem kann wohl nur von Fall zu Fall gelöst werden. Ein maßgeblich an der Marktforschung für Investitionsgüter beteiligtes Institut ζ. B. ging in der Weise vor, daß schriftlich um ein zwangloses Gespräch und um die Nominierung der maßgeblichen Personen für dieses Gespräch ersucht wurde. Die Befragung geschah in diesem Falle ausschließlich durch hauptberufliche Mitarbeiter von der Zentrale aus, welche die gesamte Untersuchung von Anfang an in der Hand hatte und auch die Auswertung vornahm. Bei einem anderen Institut waren zwar Schreibtisch- und Feldarbeit getrennt, die Befragung erfolgte gleichwohl aber nicht durch Angehörige der allgemeinen Interviewer-Organisation, sondern mittels eines kleinen Stabes von Fachinterviewern. Dieser konnte bei Bedarf allerdings durch besonders ausgewählte Interviewer aus der allgemeinen Organisation verstärkt werden. Mehr oder weniger von selbst gegeben sind die Auskunftspersonen bei der Standbefragung (vgl. dazu AMON 1992) im Zuge der für das Investitionsgütermarketing so besonders wichtigen Messen und Ausstellungen. Generell können als Ziele der Messeforschung bezeichnet werden „neben der Ermittlung von Umfang und Ort des Kundenbedarfes für bestimmte Problemlösungen die Erhebung der unmittelbaren Kundenbewertungen in Hinblick auf ausgestellte Waren, das Auffinden von Hinweisen für eine erfolgreichere Gestaltung der Messeteilnahme (z.B. Kundenurteile hinsichtlich Standgestaltung und Kompetenz des Standpersonals) sowie die Messeerfolgskontrolle" (HÜTTNER/VON AHSEN/SCHWARTING 1999, S. 396). D e r B e o b a c h t u n g k o m m t in der Investitionsgütermarktforschung sicher derzeit eine vergleichsweise geringe Bedeutung zu. Ihre A n w e n d u n g liegt am ehesten in der Werbeforschung

nahe, w o entsprechende Geräte z u m

(insbesondere Pre-)Test v o n W e r b e m i t t e l n eingesetzt werden k ö n n e n . So wies bereits STROTHMANN 1964 auf die Möglichkeit hin, wegen des eventuellen Widerstandes der Fachleute gegen den Besuch eines werbepsychologischen Studios Untersuchungen mittels eines tragbaren

Tachistoskops

vorzunehmen. A u c h e x p e r i m e n t e l l e A n o r d n u n g e n werden eher selten

anzutreffen

sein; s. aber dazu das Beispiel unten zum Test von Produkt(konzept)en. W i e s c h o n gesagt, k o m m t der S e k u n d ä r f o r s c h u n g eine vergleichsweise große Bedeutung zu. D a m i t in Verbindung steht, daß die D a t e n a n a l y s e eine wichtige R o l l e spielt. D i e s resultiert auch daraus, daß bei den A n w e n d u n g s b e r e i c h e n die Analyse

und Entwicklung

des Marktes stark i m

V o r d e r g r u n d steht. D a s wird aus den folgenden B e i s p i e l e n n o c h deutlich

Kapitel 17 Besondere Bereiche der Marktforschung

werden. Zunächst werbsanalyse:

ein

Exempel

zur

421

Konkurrenzforschung/Wettbe-

Beispiel 17-2 MEYER/FISCHER (1975) behandeln in ihrem (Haupt-)Abschnitt "Konkurrenzanalyse" drei Themen: 1. "Modell einer Konkurrenzermittlung", 2. "Analyse von Konkurrenzprodukten" und - worauf hier nur abgestellt werden soll - (3) "Analyse der Konkurrenzunternehmungen". Von den darunter erörterten - wiederum drei Problemkreisen braucht hier auf die "Informationsquellen" nicht mehr eingegangen zu werden; dafür gilt das früher, in Kap. 8, Gesagte. Damit verbleiben - erstens - "KonkurrenzdatenDazu schlagen die Verfasser einen "Fragenkatalog" (Checklist) vor, im folgenden jeweils mit der 1. Frage aus den einzelnen Bereichen: - Allgemeine Information über das Konkurrenzverhältnis im Markt z.B.: "Welche Konkurrenten existieren überhaupt?" - Beschaffung z.B.: "Wie groß ist die Abhängigkeit der Konkurrenten von den Lieferanten?" - Finanzierung z.B.: "Begünstigt die Unternehmensform der Konkurrenten die Finanzierung?" - Entwicklung z.B.: "Wie groß ist die Zahl der Beschäftigten in den Entwicklungsabteilungen?" - Produktion z.B.: "Uber welches Produktionsprogramm verfügen die Konkurrenten?" - Absatz z.B.: "Wer sind die Abnehmer der Konkurrenten?" - Personalwesen z.B.: "Wie groß ist die Beschäftigtenzahl in den Unternehmungen der Konkurrenten?" Ein zweiter Problemkreis ist die "Datenaufbereitung". Hierzu wird einerseits der Aufbau einer Konkurrenzkartei, andererseits die Vornahme von Studien über Konkurrenzunternehmen vorgeschlagen. Die "Konkurrenzkartei" (heute wohl: computergestützte datei") soll folgende "Kenngrößen" für die einzelnen Wettbewerber enthalten: Firmenname; Rechtsform; Anschrift; Kapital- und Besitzverhältnisse; Tochtergesellschaften und Beteiligung; Umsatz, Beschäftigte und Investitionen; Produktionsbetriebe; Absatzorganisation; Sonstiges (sofern im Einzelfall von Belang). Diese "Merkmale reichen für eine umfassende Konkurrenzbeurteilung nicht aus"; deshalb empfiehlt es sich, laufend sog. Konkurrenzstudien durchzuführen. Als "mögliches Gliederungssystem" wird vorgeschlagen (S. 97f. - s. dort auch zu weiteren Details): Gründung und Wachstum der Konkurrenzunternehmung; Produktionsprogramm; Tochtergesellschaften und Zweigwerke; wirtschaftliche Kennzeichnung; Organisation; Auslandstätigkeit.

Das nächste Beispiel soll den Einsatz moderner Methoden der Datengewinnung und Datenanalyse zeigen. Auf letztere wird allerdings - schon wegen der Komplexität - mehr nur hingewiesen; im Vordergrund steht das Untersuchungsí/e5¿g«:

422

Teil IV Sachgebiete der betriebswirtschaftlichen Marktforschung

Beispiel 17-3 SCOTT/KEISER (1984) stellen im Rahmen ihres Ansatzes zur quantitativen Schätzung der Akzeptanz eines neuen Investitionsgutes zwei Fallstudien dar, für Solaranlagen: 1. Die Anlagen sollen der Unterstützung des Aufheizvorganges von Reinigungswasser auf Geflügelfarmen dienen. Für diese "Poultry Processing"-Studie wurden als Betriebe die 9 größten amerikanischen Geflügelfarmen mit mehreren Filialen und ca. 65% der Gesamtproduktion ausgewählt. Als Auskunftspersonen waren in vorherigen Gruppengesprächen die Filial-Betriebsleiter und der Leiter des Finanzwesens der Gesamtunternehmung ermittelt worden. Dementsprechend wurden in jedem ausgewählten Betrieb der letztere und der Leiter der größten Filiale befragt. Sie waren durch Telefon-Kontakte für eine Mitarbeit gewonnen worden. Ihnen wurde Informationsmaterial zugesandt, das die technischen Daten usw. für 5 Versuchs-Produktkonzepte enthielt. Zusätzlich bekam jeder Befragte eine (zunächst verschlossene) Metallbox mit 32 ProduktKonzepten. Diese bildeten die eigentliche Bewertungsaufgabe. (Die Versuchskonzepte dienten in erster Linie der Uberprüfung, ob eine klare Rangordnung mit dem erstgenannten Konzept als dem besten - gebildet worden war.) Die 32 Konzepte stellen eine experimentelle Versuchsanlage dar (aus den Faktoren "Kosten" - 4 Ausprägungen -, "jährliche Einsparung (nach Steuern)" - 2 -, "staatliche Anreize" - 3 - und "Gebäude" - Neubau oder bereits bestehend). Je Konzept wurden zwei Beurteilungen verlangt: - "Kauf"/"Nichtkauf"/"50:50" ("discret choice") - Marktanteils-Schätzungen 2. Solaranlagen für Bürogebäude: Ausgewählt wurden bei dieser "Mid-rise Office Building"-Studie 10 Betriebe, die Bürogebäude mittlerer Größe erstellen und dann verkaufen. Da sich herausstellte, daß derartige Firmen in der Regel von nur einem Unternehmer/Manager geführt werden, brauchte nur 1 Person pro Unternehmung befragt zu werden. Vorgelegt wurden 24 hypothetische Konzepte (entstanden aus Kombinationen der Faktoren "Kosten" - 4 Ausprägungen -, "jährliche Einsparung (nach Steuern)" - 2 -, "Systemtyp" - 3 -, "Steuererleichterung" - 2 - und "Zins-Anreize" - 2). Zusätzlich zu den obigen beiden Beurteilungen (mit gewissen Modifikationen) wurde hier die Bildung einer Präferenz-Rangordnung verlangt. Die Auswertung der Rangordnung erbrachte - nach den Prinzipien des Conjoint Measurement (s. 13.1) - die Teilnutzenwerte. Hierbei standen niedrige Anschaffungskosten und hohe Einsparungen an der Spitze. Die Auswertung der anderen zwei Beurteilungen erfolgte in beiden Studien übereinstimmend; für die Marktanteilsschätzugen mittels OLS und die "discret choice"-Angaben aufgrund des multionomialen Probit-Modells (s. auch Kap. 10). Bei der "Office-Building"-Studie nahm den ersten Rang in der Reihe der Akzeptanzgründe die Höhe der Anschaffungskosten ein, gefolgt von Energie-Einsparungen, Zins-Anreizen und Steuererleichterungen; der Typ des verwendeten Solarsystems spielt demgegenüber praktisch keine Rolle. (Die beachtliche Ubereinstimmung zwischen normalen Regressions- und Probit-Koeffizienten ließ im übrigen vermuten, daß der

Kapitel 17 Besondere Bereiche der Marktforschung

423

gleiche Beurteilungsprozeß sowohl für die Kaufentscheidung als auch die Marktanteilsschätzung gilt.)

Das nächste Beispiel zeigt das Vorgehen bei einer Marktanalyse insgesamt; es leitet zugleich zur - im folgenden Unterabschnitt behandelten Auslandsmarktforschung über: Beispiel 17-4 (entnommen - mit geringfügigen Kürzungen - aus LANTERMANN 1984) Ein im internationalen Großanlagenbau tätiges Unternehmen will seine Marktaussichten in Nigeria überprüfen. 1. Wie immer steht am Anfang die Sekundäranalyse. Mit den gewonnenen Daten ließ sich ein erstes, wenn auch noch grob skizziertes Bild der wirtschaftlichen Situation Nigerias und der dort vorzufindenden Rahmenbedingungen für den Großanlagenbau zeichnen. 2. Es folgten Gespräche mit drei in Nigeria tätigen deutschen Anlagenbauern an ihren heimischen Stammsitzen. Ziel war es, erste allgemeine Informationen über den internationalen, ggf. auch den lokalen Wettbewerb zu erhalten, insbesondere zu erfahren, wer die wichtigsten internationalen Anbieter sind, wie die Finanzierungsmodalitäten aussehen und schließlich Funktion und Sitz der Entscheidungsträger. 3. Die Finanzierung nigerianischer Projekte im Großanlagenbau wird häufig von Londoner Instituten übernommen. Deshalb wurden in einem dritten Schritt in London Gespräche mit Geschäftsleuten und Bankenvertretern geführt. Die Ausnutzung vorhandener und die Knüpfung neuer Kontakte bot die Möglichkeit, die Szenerie anhand konkreter Projekte zu studieren und die bisher gewonnenen Informationen zu überprüfen. Ein weiteres Ergebnis der Londoner Gespräche war die Möglichkeit, Gesprächspartner für die beiden noch ausstehenden Untersuchungsschritte zu nominieren. 4. Es folgten insgesamt vier Gespräche mit Wettbewerbern in Italien und Frankreich, mit Unternehmen, die bereits in Nigeria tätig sind oder waren. Die dort erfahrenen - sicher auch subjektiven - Markteinschätzungen führten zu einer Relativierung bereits früher erhaltener Informationen, u. a. auch der deutschen Anbieter. Außerdem boten die Gespräche zusätzliche Erkenntnisse für die noch zu erbringende "Vor-Ort"-Recherche. 5. Erst mit dem letzten Untersuchungsschritt erfolgte eine Reise nach Nigeria. Dank der gezielten Vorarbeiten konnte das restliche Informationsdefizit mit etwa zehn Gesprächen abgebaut werden, was 14 Tage Aufenthalt im Lande erforderte, weil die vorher in Europa mit einem verhältnismäßig geringen Zeitaufwand erfahrenen Informationen den Marktforscher ohne Zeitverlust die richtigen Fragen an die richtigen Leute stellen ließ.

424

Teil IV Sachgebiete der betriebswirtschaftlichen Marktforschung

17.2 Die Auslandsmarktforschung Der Begriff "A «s/dtti/smarktforschung" - man könnte auch von Internationaler Marktforschung sprechen - erlaubt eine Unterteilung in Exportund /mpori-Marktforschung. Hier soll, entsprechend den früheren Betrachtungen, der Ausrichtung auf A fadízmarktforschung, eine Gleichsetzung von Auslands- und Exportmarktforschung erfolgen. Die Besonderheiten der Auslandsmarktforschung ergeben sich schon daraus, daß sie im Unterschied zur Binnenmarktforschung mehrere, u.U. sehr viele Märkte umfaßt. Das bedeutet, daß oft schon der jeweilige Absatz auf dem einzelnen Auslandsmarkt in der Regel vergleichsweise niedrig ist (und zwar selbst dann, wenn die "Exportquote", der Anteil des Auslandsabsatzes am Gesamtabsatz, relativ hoch sein sollte). Daraus folgt einerseits, daß oft die für den jeweiligen Markt aufwendbare Kostensumme und damit letztlich die Intensität der Marktforschung nur relativ niedrig sein kann. Es kommt - andererseits - hinzu, daß die Auslandsmarktforschung einen notwendigerweise viel größeren sachlichen Umkreis hat, weil viele Dinge, die auf dem Binnenmarkt bekannt bzw. selbstverständlich und deshalb nicht Gegenstand der Marktforschung sind, im Ausland erst festgestellt werden müssen. Zu diesen Sachverhalten, die als Grundlage oft erst zu ermitteln sind, ehe mit der Marktforschung im eigentlichen Sinne begonnen werden kann, zählen (in entsprechender Anwendung einer Systematik von RINGEL 1963) insbesondere: 1. naturgegebene Faktoren (geographische Daten, klimatische und demographische Gegebenheiten); 2. kulturelle Grundlagen (Sprache, religiöse Uberzeugungen, Bildungswesen usw.); 3. Daten der Wirtschafts- und Sozialstruktur; 4. verkehrsstrukturelle Daten; 5. staats- und gesellschaftspolitische Faktoren (politische Gegebenheiten; das Rechtssystem, insbesondere Rechtsgrundlagen für den Außenhandel: Zoll, Kontingentierungs- und Devisenbestimmungen usw.); 6. "der Mensch als bewegende Kraft im Markt" (Mentalität, Volkscharakter, insbesondere Verhaltens- und Reaktionsweisen usw.). Welche Bedeutung speziell dem Letztgenannten zukommt, zeigt das Folgende:

Kapitel 17 Besondere Bereiche der Marktforschung

425

Beispiel 17-5 In Puerto Rico scheiterte eine aufgrund von Feststellungen amerikanischer Ernährungswissenschaftler für notwendig gehaltene Erhöhung des Milchkonsums trotz einer mit allen werbetechnischen Raffinessen durchgeführten Werbekampagne nur deshalb, weil das Trinken von Milch als "unmännlich, nur für Kinder" usw. galt. Das Problem wurde nach dem Rat eines länderkundigen Psychologen in der Weise gelöst, daß für die Mischform "Milchkaffee" geworden wurde - nunmehr mit Erfolg! (Vgl. BRACHFELD 1964.)

Aus Vorstehendem folgt, daß die Besonderheiten der Auslandsmarktforschung - erstens - davon abhängig sind, auf welche Länder sich diese bezieht. Sie werden am stärksten in den Ländern der Dritten Welt, im allgemeinen am geringsten dagegen in den "westlichen " Ländern sein. Zweitens entstehen spezielle Probleme - die der internationalen Vergleichbarkeit statistischer Daten schlechthin - bei vergleichenden Untersuchungen für mehrere Länder. Bezüglich der Datengewinnung gilt auch hier - wie bei der Investitionsgütermarktforschung - , daß die Primärforschung stärker in den Hintergrund tritt. Sofern eine solche durchgeführt wird, kommt dabei am ehesten die Befragung in Betracht. In bezug auf den Adressatenkreis wird man dabei nicht selten, wegen der hohen Kosten, statt der von Verbrauchern die von (Groß- und E'mzel-)Händlern oder - eventuell im Rahmen eines Panels - von Experten durchführen müssen. In bezug auf den Erhebungsmodus sind telefonische Befragungen, wegen der zu geringen Dichte des Telefonnetzes bzw. der zu einseitig strukturierten Verteilung der Anschlüsse, oft unmöglich; die schriftliche Befragung kann schon wegen einer zu hohen Quote von Analphabeten scheitern; im Vordergrund wird deshalb die - teure - mündliche Befragung stehen müssen. Der Durchführung von Mehr-Themen-Umfragen dürfte wohl zumeist wenig im Wege stehen. Beispiel 17-6 Getas Consult, Berlin, berichtet für die Volksrepublik China (lt. Absatzwirtschaft 4/95, S. 104): „Die gegenwärtig am häufigsten genutzten und effektivsten Methoden sind Mehrthemenumfragen, Spezialbefragungen, Desk Research, Produkttests und Gruppendiskussionen. Diese Erhebungen finden derzeit ausschließlich in den Städten und ihrem Umland statt. Die dort erfahrenen Daten können - bedingt durch die großen Unterschiede zu den ländlichen Gebieten - nicht auf die Gesamtbevölkerung hochgerechnet werden. Die Städte und ihr Umland werden jedoch für absehbare Zeit die Zentren von Produktion und Absatz und damit Zielgebiete für die Marktforschung bleiben. Ein Beispiel für unser Repertoire ist der 'China-

426

Teil IV

Sachgebiete der betriebswirtschaftlichen Marktforschung

Omnibus' (Face-to-Face-Interviews, variable Sichprobengröße), der monatlich in den drei Großstädten Beijing, Shanghai und Guangzhou gestartet wird."

Ebenso werden sich kaum Schwierigkeiten bei der Durchführung von standardisierten Interviews ergeben, so daß diese als Befragungsstrategie, wegen ihrer - in Kap. 4 - geschilderten Vorzüge, allgemein in Betracht kommen dürften. Schwieriger ist die Wahl der richtigen Befragungstaktik·, es wird stark von der Mentalität der Bewohner des jeweiligen Landes abhängen, ob die interessierenden Tatbestände direkt angegangen werden können oder durch geschickte Fragestellung bzw. mittels psychologischer Tests indirekt erfaßt werden müssen. Beispiel 17-7 Für Südostasien berichtet WÜLKER 1964 schon, daß dort - die Erweckung von Vertrauen vorausgesetzt - einerseits Fragen mit größter Bereitwilligkeit beantwortet werden; andererseits weist sie auf die sprichwörtliche Höflichkeit der Bewohner Asiens und damit die Gefahr von Gefälligkeitsantworten hin. Ergänzend hierzu bemerkt NEUBECK (1964), daß deshalb in diesem Gebiet viel mit offenen Fragen und projektiven Tests, auf jeden Fall aber mit Fragen, die jede Suggestion vermeiden, gearbeitet werden müsse.

Besonders wichtig ist die Auswahl der Interviewer. Da eine Befragung durch Ausländer von vornherein Widerstand erwecken könnte und außerdem den "Interviewereinfluß" zu groß werden ließe, wird man grundsätzlich im fremden Land Ansässige gewinnen müssen, die jedoch über den erforderlichen Bildungsstand verfügen sollten. Andererseits bedarf offenbar der einheimische Interviewer der Zusammenarbeit mit Fachleuten des Veranstalters, schon im Interesse des richtigen Verständnisses von Sinn und Zweck der Untersuchung. (Selbst beim Einsatz einheimischer Interviewer verbleiben genügend Schwierigkeiten, da mancherorts bedeutende Stammes- oder Rassenunterschiede bestehen, weiterhin ζ. B. alte Leute nicht von jüngeren, Frauen nicht von Männern befragt werden können usw.) Den Fragebogen wird man von einem im fremden Land ansässigen Dolmetscher übersetzen lassen müssen, da dieser die Mentalität der Bewohner besser kennt; zweckmäßigerweise sollte man aber zur Kontrolle teilweise Rückübersetzungen vornehmen. (SCHOPPHOVEN 1 9 9 1 spricht in diesem Zusammenhang von „iterativen Ubersetzungsschleifen". Vgl. zu den Ubersetzungsproblemen und -methoden auch ausführlich BAUER 1 9 8 9 u n d 1995.)

Kapitel 17

Besondere Bereiche der Marktforschung

427

Das Übersetzungsproblem ist nur ein Teil des sog. Äquivalenzproblems, auf das bei internationalen Untersuchungen grundsätzlich zu achten ist. (Vgl. dazu wiederum insbesondere BAUER 1 9 8 9 und 1 9 9 5 sowie SCHOPPHOVEN 1 9 9 1 . ) Es besagt, daß die zu verwendenden Methoden nicht identisch sein müssen, aber einander so entsprechen sollen, daß die gewonnenen Daten vergleichbar sind. Die Erfüllung dieses Postulats durch bloße Addition - etwa in Richtung des Gemeinsamen Europäischen Marktes - erscheint problematisch. Vielmehr wäre hier eher eine Integration (z.B. in Gestalt einer „Europäischen Stichprobe") anzustreben; auch dann verbliebe allerdings noch das Sprachproblem. Internationale Marktsegmentierungen, aufgrund der Identifikation von länderübergreifenden Segmenten, sind deshalb schwierig. Auf entsprechende Lzyë-Sfy/e-Typologien, im Sinne der „Euro-Styles" oder der „SINUS Lebenswelten", sei hier nur verwiesen. D a s gilt u m so mehr, als zusammenfassende, wissenschaftliche Darstellungen dafür noch k a u m vorliegen; als beste überblicksartige und auch kritische Beschreibung auf der Basis des damaligen Standes ist wohl KRAMER 1991 anzusehen.

Damit ist auch das besonders schwierige Problem der Auswahl der Befragten angesprochen. Bekanntlich erfordert das Zufallsverfahren in seiner reinen Form das Vorhandensein entsprechender Listen oder Karteien eine Voraussetzung, die in vielen Ländern nicht gegeben ist. Für das Quotenverfahren andererseits benötigt man die Kenntnis der Gesamtheit und ihrer Merkmale, sofern für diese Quoten vorgegeben werden sollen; die erforderlichen Statistiken sind jedoch ebenfalls in manchen Ländern nicht vorhanden bzw. zugänglich. Recht oft wird allerdings das Flächenstichprobenverfahren weiterhelfen; in vielen Fällen wird damit auch bei ungünstigen Voraussetzungen eine befriedigende Repräsentation erreicht werden können. Ganz allgemein hat man wegen der vielen Probleme bei der technischen Durchführung (man denke auch an Regenzeiten, Dürre usw.!) mit einer längeren Dauer der Erhebungen zu rechnen. Dabei ist ebenfalls zu bedenken, daß der Stand der Entwicklung der Marktforschungsmethoden bzw. die Möglichkeiten ihres praktischen Einsatzes in den einzelnen Ländern durchaus verschieden sein können. (So berichten etwa OHBORA/PARSONS/RIESENBECK 1992, daß die 3-6 Monate, die in den USA für Markttests oft erforderlich sind, für Japan ausreichen, konkurrierende Produkte zu entwickeln und zu lancieren.)

428

Teil IV Sachgebiete der betriebswirtschaftlichen Marktforschung

Das gilt auch für die Methode der Beobachtung. Sie wird vor allem dann Platz greifen, wenn infolge der Mentalität der Einwohner oder mangels geeigneter Interviewer eine mündliche Auskunft nicht zu erlangen, der Tatbestand als solcher aber beobachtbar ist (ζ. B. Einkaufsgewohnheiten, bestimmte Verbrauchsgewohnheiten usw.). Der international unterschiedliche Stand wird deutlich selbst bei apparativen Meßmethoden wie den TV-Metern: „Bereits 1993 wurden in 18 verschiedenen europäischen Märkten 21 unterschiedliche Peoplemetersysteme registriert (Belgien, Norwegen und Portugal halten jeweils zwei)", so nach einem Bericht von G. Herkel in Horizont 47/95. Vgl. dazu auch BAUER 1996, und, hinsichtlich der weltweiten „Verbreitung von TV-Meter-Systemen", BAUER 1995.

Die Bedeutung der Sekundärforschung ist so groß, daß hier noch einmal auf die Quellen eingegangen werden soll. Man kann diese zunächst wie in Kap. 8 in externe und interne unterteilen. Darüber hinaus ist eine Einteilung in inländische und ausländische (und evtl. supranationale) möglich. Die externen Quellen werden hier in der gleichen Systematik wie in Kap. 8 abgehandelt; dabei erfolgt jedoch eine Unterteilung in in- und ausländische: 1. Für die allgemeine amtliche Statistik ist im Hinblick auf inländische Quellen darauf hinzuweisen, daß das Statistische Bundesamt in beachtlichem Umfange Daten über das Ausland publiziert. Quellen hierfür sind Unterlagen der (fremden) statistischen Amter usw., der deutschen Auslandsvertretungen, der internationalen Organisationen, auch ausländische Zeitschriften etc. und - in gewissem Umfange - sogar eigene Feststellungen des Amtes. Diese Auslandsstatistik ist in den letzten Jahren verschiedentlich umorganisiert worden. Erschienen früher „Vierteljahreshefte zur Auslandsstatistik", so wird seit 1989 ein besonderes „Statistisches Jahrbuch für das Ausland" herausgegeben. Daneben werden in der Reihe 11 der Fachserie 17 „Preise und Preisindizes im Ausland" veröffentlicht; die Reihe 5 der Fachserie 16 enthält „Löhne, Gehälter und Arbeitskosten im Ausland". Dagegen wurden die „Länderberichte", die ausführliche (textliche) Darstellungen mit wirtschafts- und sozialstatistischen Daten für einzelne Länder oder Ländergruppen beinhalteten, 1996 eingestellt.

Kapitel 17 Besondere Bereiche der Marktforschung

429

Als ausländische Quellen kommen zunächst die Veröffentlichungen der jeweiligen statistischen Zentralämter (die von praktisch allen Ländern unterhalten werden) in Betracht. Allerdings können dabei neben Schwierigkeiten mit der Sprache solche der unterschiedlichen Definitionen, Erhebungsmethoden usw., damit also Mängel in bezug auf die Vergleichbarkeit (s. oben, „Äquivalenz"), entstehen. Aus diesem Grunde ist es vielfach ratsam, auf die Veröffentlichungen der statistischen Amter inter- oder supranationaler Behörden zurückzugreifen. Zu erwähnen sind hier insbesondere die UN und ihre Organisationen (ζ. B. "Statistical Yearbook" und "Demographic Yearbook" der UN, "Production Yearbook" der FAO - Food and Agriculture Organization), die OECD und ihrer Organisationen (etwa die EPA - European Productivity Agency) und vor allem - durch zunehmende Bedeutung bei einem Fortschritt der europäischen Integration - das statistische Amt der Europäischen Union: Eurostat. 2. Sonstige amtliche und halbamtliche Stellen: Hier ist vor allem die Bundesstelle für Außenhandelsinformation (BfAI) in Köln zu erwähnen, die recht umfangreiches Material herausgibt, darunter (in Zusammenarbeit mit dem VWD - Vereinigte Wirtschafts-Dienste) die werktäglich erscheinenden "Nachrichten für Außenhandel" (NfA). Man kann sich natürlich auch im Einzelfall direkt an die deutschen Auslandsvertretungen wenden. (Von ihnen wird allerdings, sofern Auslandshandelskammern existieren - s. dazu nachstehend -, oft auf diese Spezialinstitutionen verwiesen. Auch die BfAI bezieht z.T. ihre Informationen von dort; vgl. dazu die Abb. 6: „BfAI als Datenpool für Außenhandelsinformationen" bei MEISSNER 1 9 9 6 . )

3. Inländische Wirtschaftsorganisationen und Verbände: Neben den sich auf das Ausland beziehenden Stellen der allgemeinen Veröffentlichungen kommen hier insbesondere Auslandsrundschreiben usw. sowie zur Auskunftseinholung die mitunter beachtlich großen Außenhandelsbzw. "Außenwirtschafts"-Abteilungen der Kammern und Verbände in Betracht. Weiterhin ist an die speziell auf dem Gebiet des Außenhandels bzw. der Länderkunde tätigen Vereinigungen zu denken. Umgekehrt könnte man sich auch an die im Ausland ansässigen Wirtschaftsorganisationen und -verbände wenden. Zweckmäßiger dürfte jedoch die Inanspruchnahme der in vielen Ländern existierenden, oft auf

430

Teil IV Sachgebiete der betriebswirtschaftlichen Marktforschung

paritätischer Grundlage aufgebauten A uslandsbandelskammern sein, deren Ziel ja gerade in der Förderung des Handels zwischen den jeweiligen Ländern besteht und die deshalb meist auch über einschlägige Unterlagen verfügen. Zu erwähnen ist in diesem Zusammenhang auch die Internationale Handelskammer in Paris, die schon seit langen Jahren statistisches und anderes Material herausgibt. 4. Im Hinblick auf wirtschaftswissenschaftliche Institute ist wohl in erster Linie an die im Inland gelegenen zu denken, die zunächst eigens für die Weltwirtschaft eingerichtet wurden (wie das HWWA - "Hamburgisches Welt-Wirtschafts-Archiv" - oder das "Institut für Weltwirtschaft" in Kiel). Als weitere Quellen kommen in Betracht: 5. in- und ausländische Nachschlagewerke; 6. dto. Fachliteratur und Fachzeitschriften; 7. dto. Zeitungen und Zeitschriften; 8. dto. Messe- und Ausstellungskataloge; 9. dto. Firmenveröffentlichungen. 10. Als "Hilfsbetriebe" kommen zunächst inländische Informationsdienste in Frage, seien dies nun - unentgeltliche - Service-Dienstleistungen (ζ. B. Auslandsrundschreiben der großen Banken, aber auch die sich allerdings mehr auf die technische Abwicklung von Exporten beziehenden "Informationen" großer internationaler Spediteure) oder - entgeltliche - kommerzielle Dienste. Datenbanken, die im Inland gelegen sind, enthalten natürlich sehr oft auch Auslands-Informationen; daneben ist vielfach der Zugriff auf ausländische Datenbanken sehr wichtig. Wiederum sei, wie schon in Kap. 8, darauf hingewiesen, daß natürlich auch sehr viele Daten auf CD-ROM vorliegen. Das gilt für manche Datenbank, aber auch bisher lediglich gedruckt vorliegende „Jahrbücher". So gibt es das oben erwähnte „Statistical Yearbook" der U N ab der 38. Ausgabe auf CD-ROM, wie auch eine EUROSTATCD, als „elektronisches Jahrbuch der Europäischen Gemeinschaften", 1993 erstmals von „Eurostat" herausgegeben. Diese und andere CDs können von der in Kap. 8 erwähnten DSI GmbH bezogen werden, die insofern als typischer „Hilfsbetrieb" im obigen Sinne gelten mag, aber auch selbst Material kompiliert und veröffentlicht, so etwa - als C D - ein „Internationales Statistisches Jahrbuch". Solche zusammenfassende Informationsquellen kosten oft einige tausend Mark.

Kapitel 17 Besondere Bereiche der Marktforschung

431

Interne Quellen im Inland sind die allgemeine Korrespondenz und vor allem eine entsprechend aufgebaute Umsatzstatistik, mit Unterteilung der Auslandsumsätze zumindest nach den verschiedenen Ländern. Als Materialien aus dem Ausland kommen speziell die Berichte der ausländischen Vertreter und Repräsentanten in Betracht, wobei allerdings wegen der nicht unbedingt gegebenen Neutralität und Unbefangenheit des Berichterstatters eine gewisse Vorsicht geboten ist. (So mag es ζ. B. schwierig sein, verläßliche Angaben des Vertreters über die künftigen Umsätze zu erhalten, während vermutlich die Befragung über solche Tatbestände wie augenblickliche Devisenlage, Handhabung des Importverfahrens usw. oder - noch besser - die Schilderung gewisser mentalitätsbedingter Besonderheiten durchaus zuverlässige Ergebnisse erbringen wird.) Schließlich ist hier auch die Auswertung der Reiseberichte führender Mitarbeiter zu erwähnen. Insgesamt bleibt festzuhalten, daß natürlich auch die Auslandsmarktforschung dem allgemeinen - 5stufigen - Marktforschungsprozeß (gemäß Darst. 2-3) folgt, allerdings mit bestimmten Besonderheiten, die sich aus dem eingangs Dargelegten ergeben und auf die nunmehr noch eingegangen werden soll: So resultiert etwa das Problem der Marktselektion eben aus der Vielzahl möglicher Absatzgebiete bzw. Länder. Dafür stehen verschiedene Vorgehensweisen zur Verfügung, darunter auch Punktbewertungsverfahren. In neuerer Zeit sind Portfolio-Ansätze stärker hervorgetreten. Im Unterschied zu dem in Kap. 14 - s. auch Darst. 14-3 - geschilderten Vorgehen werden jetzt allerdings Länder in die Felder der Matrix eingetragen (und nicht Strategische Geschäftseinheiten oder Produkte). In ähnlicher Weise können Länder (und nicht, wie in Kap. 12, Produkte oder Marken) den Gegenstand einer Multidimensionalen Skalierung bilden; vgl. etwa BRADLEY (1986).

Ein empirisches Beispiel für eine derartige - immer noch aus nur 4 Feldern bestehende - Matrix findet sich bei Fuß/ΜεYER/STERN 1989 (S. 147: „Länderportfolio für den Absatz von Spinnmaschinen" - mit den Dimensionen „Importvolumen" und „relativer Wettbewerbsanteil"). Dagegen haben MEISSNER/WINKELGRUND bereits 1982, dem McKinsey-Ansatz folgend, eine 9-Felder-Matrix („niedrig/mittel/hoch") vorgeschlagen, deren Abszisse wie bei McKinsey die „Marktattraktivität" bildet, die Ordinate dagegen das „Risikopotential". STAHR 1991 gibt dann eine 9-Felder-Matrix,

432

Teil IV Sachgebiete der betriebswirtschaftlichen Marktforschung

bei der letztere genau wie bei ursprünglichen McKinsey-Form die „Wettbewerbsposition" enthält. Es ist also zu beachten, daß nicht etwa die „Risikobereitschaft" zur „Wettbewerbsposition" erweitert wird; im Gegenteil, das Risiko existiert hier als Unterkriterium der anderen Achse, der „Marktattraktivität". Die Matrix enthält dann in jedem Feld eine Strategie-Empfehlung. Vgl. dazu auch die entsprechenden Abbildungen bei HÜTTNER/VON AHSEN/SCHWARTING 1999, S. 520 und 521. Dort - S. 506 - findet sich auch eine Darstellung der verschiedenen Arten des Länderrisikos.

Ein anderes Problem ist das der Organisation der Marktforschung. Wie im V. Teil noch näher zu untersuchen, kann man generell zwischen betrieblicher und /wízíttís-Marktforschung differenzieren. In der Auslandsmarktforschung kommt dazu speziell die Frage, ob ein etwa beauftragtes Institut im In- oder Ausland angesiedelt sein soll. Unterscheidet man noch, ob die Verbindung zwischen in- und ausländischem Institut auf partnerschaftlicher oder kapitalmäßiger Grundlage beruht, so kommt man, mit L A N T E R M A N N ( 1 9 8 4 ) , zu 6 verschiedenen Möglichkeiten, gemäß Darst. 17-1.

0 0 0 0 0 0

Inland

Δ

L

t t t I τ O • • Δ Δ Δ

Ausland

Legende:

Ο

1=1

Δ

betriebliche Marktforschung Marktforschungsinstitut; Stammsitz Inland Marktforschungsinstitut; Stammsitz Ausland

Darst. 17-1: Organisation der Auslandsmarktforschung (in Anlehnung an LANTERMANN 1984, S. 7)

Kapitel 17 Besondere Bereiche der Marktforschung

433

Eine sehr viel differenziertere Darstellung gibt BAUER 1995 (S. 293ff., mit Abb.). S. zur „Internationalisierung" bei den Marktforschungsinstituten auch noch Kap. 19.

Lantermann kommentiert diese Möglichkeiten wie folgt: "Zu 1: Die betriebliche Marktforschung (MFb) eruiert selbst auf Auslandsmärkten. Dieser Weg ist unter bestimmten Voraussetzungen möglich, wenn nur einige Expertengespräche geführt werden sollen. Die Schwierigkeiten wachsen mit der räumlichen Entfernung vom heimatlichen Standort. Zu 2: MFb beauftragt ein deutsches Institut, das auf dem relevanten Auslandsmarkt ein Tochterinstitut betreibt. Zu 3: MFb kontaktiert unmittelbar das ausländische Tochterinstitut. Zu 4: Das deutsche Institut verfügt über partnerschaftliche Verbindungen zu ausländischen Instituten, sogenannten Korrespondenzinstituten. Zu 5: MFb beauftragt direkt auf dem Auslandsmarkt ein dort ansässiges Institut. Zu 6: Das ausländische Institut akquiriert über eine Tochtergesellschaft oder Niederlassung auf dem deutschen Markt. MFb verhandelt mit dieser Niederlassung."

17.3 Die Marktforschung im Dienstleistungssektor Die typische Besonderheit des Dienstleistungssektors und damit die allgemeine Problematik der Marktforschung in diesem Sektor liegt darin, daß die "Produktion" in der Zurverfügungstellung von Dienstleistungen besteht; sie sind immateriell („immaterial"), damit nicht anfaßbar („intangible"), unsichtbar („invisible") und vergänglich („perishable"); Produktion und Verbrauch fallen zusammen. Daraus folgt, daß eine auf das Produkt gerichtete Forschung im herkömmlichen Sinne nicht möglich ist, sondern an deren Stelle im allgemeinen eine Analyse der Kunden mit den von diesen gehegten Wünschen bzw. Erwartungen tritt, die eine entsprechende Gestaltung der anzubietenden Dienstleistungen ermöglicht. Insofern spielt auch die Messung der Kundenzufriedenheit in diesem Bereich eine besondere Rolle. Es wird deshalb auf die entsprechenden Betrachtungen (und Beispiele) im Exkurs zu Kap. 15 verwiesen (wie umgekehrt auch manche der unten angeführten Exempel als direkte Ergänzung zu diesem gesehen werden können).

434

Teil IV Sachgebiete der betriebswirtschaftlichen Marktforschung

Dazu kommt als zweites, daß die Betriebsgrößenstruktur oft wesentlich anders ist. So existieren ζ. B. im Einzelhandel neben den Großbetrieben immer noch viele kleine und mittlere Betriebe, bei denen schon aus Kostengründen eine Marktforschung analog der der Industrie nicht in Frage kommen kann. Schließlich ist - in Verbindung damit - oft nur eine geringe örtliche Reichweite gegeben, so daß schon deshalb umfassende Repräsentativbefragungen, ζ. B. für einen örtlichen Einzelhändler, seltener in Erwägung zu ziehen sind. Aus allen diesen Gründen wird man teilweise nach spezifischen Methoden suchen müssen. Sie können im folgenden nur ganz allgemein bzw. exemplarisch aufgezeigt werden. Die Erörterung der Möglichkeiten in den vielen, ζ. T. recht heterogenen Zweigen des Dienstleistungssektors (deren Gemeinsames eben nur das ist, daß sie "Dienstleistungen" anstelle greifbarer Produkte herstellen) würde den Rahmen der Darstellung sprengen; ein Eingehen auf spezielle Branchen erfolgte ja auch früher nicht. Die Marktforschung im Einzelhandel ist dadurch gekennzeichnet, daß hier alle oben genannten Besonderheiten zugleich vorliegen; kein greifbares Produkt, stark divergierende Betriebsgrößenstruktur, große örtliche Gebundenheit (mit gewissen Ausnahmen, ζ. B. im Hinblick auf den Versandhandel). Daraus folgt in bezug auf die Methoden, daß diese bei den ausgesprochenen Großbetrieben allein aus Kostengründen kaum einer Beschränkung unterliegen müssen, wohl aber etwa aus der örtlichen Gebundenheit. Beispiel 17-8 Will ein Warenhausunternehmen sein "Firmenimage" feststellen, so steht es vor der Frage, ob es dafür eine große, für das Gesamtgebiet repräsentative Umfrage starten soll oder nur mehrere kleine - in Orten, in denen es jeweils vertreten ist. Für letzteres spricht, daß das "Firmen-Image" sicher sehr stark von dem seiner örtlichen Niederlassung geprägt ist (und infolgedessen regional differieren kann). Auch wird natürlich dadurch die Zahl "Leerinterviews" geringer.

Wie erwähnt, wird man aber nach spezifischen Methoden suchen müssen. Diese folgen aus der eingangs dargelegten Besonderheit der Dienstleitungsmarktforschung als Kundenanalyse. Wie das folgende Beispiel zeigt, kann dabei aber durchaus auf Nicht-Käufer eingegangen werden. Aus dem Beispiel geht auch hervor, daß in diesem Bereich der Beobachtung - eventuell mit Einsatz des eigenen Verkaufspersonals - große Bedeutung zukommt.

Kapitel 17 Besondere Bereiche der Marktforschung

435

Beispiel 17-9 Ein Filialunternehmen der Textilbranche stellte anhand der Absatzstatistik fest, daß ein Großteil der Filialen zunächst stagnierende und später sogar rückläufige Umsätze zu verzeichnen hatte; weiterhin sank in fast allen Filialen die Zahl der Kunden. Einer betriebswirtschaftlichen Beratungsstelle des Einzelhandels wurde ein Beratungsauftrag erteilt mit dem Ziel, entsprechende betriebspolitische Vorschläge zu erarbeiten. Nach grundlegenden statistischen Feststellungen über die Umsatzentwicklung des Betriebes im Vergleich zur Entwicklung der gesamten Branche wurden in einigen für das Gesamtunternehmen repräsentativen Verkaufsstellen weibliche Beobachter des Beratungsdienstes postiert. Diese hatten unauffällig die fast ausnahmslos weibliche Kundschaft zu beobachten, und zwar hinsichtlich Alter (4 Altersgruppen: bis 20 Jahre, 20 bis 30 Jahre, 30 bis 50 Jahre, über 50 Jahre) und "Fehlkäufen" (= Nicht-Käufe; aufgeteilt nach 6 Warengruppen). Die Auswertung dieser Beobachtungen ergab einen unverhältnismäßig großen Anteil der höchsten Altersgruppe an der Gesamtkundschaft sowie einen stark unterschiedlichen Anteil der Fehlkäufe bei den einzelnen Warengruppen. Diese Altersstruktur der Kundschaft in Verbindung mit der Aufgliederung der Fehlkäufe in den verschiedenen Warengruppen nach Altersklassen ließ, im Zusammenhang mit anderen Überlegungen, Schwächen in der Sortimentsgestaltung erkennen, die zu entsprechenden Vorschlägen für die künftige Sortimentspolitik führten. Die Folge waren steigende Umsätze und zunehmende Kundenzahl. (Zusammengestellt aus: Betriebswirtschaftliche Beratungsstelle des Einzelhandels BBE, Entwicklung und Wirkung der Betriebsberatung im Einzelhandel, Köln 1963, S. 35-39.)

Noch stärker tritt die Beobachtung bei den sog. Kunden(um)laufstudien hervor. Dabei werden entweder persönliche Beobachter oder auch feststehende - Kameras eingesetzt (die von den Kunden nicht wie sonst „Beobachtetsein" als störend empfunden werden dürften, da sie diese wegen des Ladendiebstahls für erforderlich halten). Eine spezielle Variante wird aus England berichtet: Beispiel 17-10 „Dabei werden Micro-Kameras in der Kleidung von Test-Käufern versteckt, um die Verkäufer unter die Lupe zu nehmen, ob sie ihren Kunden den Service und die Beratung bieten, die von ihnen erwartet wird." Ähnliche „Analysen sind bereits vom Bekleidungshandel genutzt worden, um Erkenntnisse drüber zu gewinnen, wie Partner gemeinsam einkaufen.... Dabei wurde beobachtet, daß Ehemänner oder Freunde sich eher unwohl fühlen, wenn die Frauen die Kleidung in den Kabinen ausprobieren und sie außen vor gelassen werden. ... Dieses Problem kann behoben werden, indem Sofas und Magazine in der Nähe der Umkleidekabinen zur Verfügung stehen. Der Kunde hat ein besseres Einkaufserlebnis, und das Geschäft macht ein besseres Geschäft". (Quelle: Horizont 20/95, S. 71.)

436

Teil IV Sachgebiete der betriebswirtschaftlichen Marktforschung

Kundenkreditkarten können ebenfalls, für ein „Kundeninformationssystem" (KIS), herangezogen werden. In Verbindung mit Scannerdaten sind damit auch nach demographischen Merkmalen auswertbare Ker¿«»¿analysen, z.B. als Clusteranalysen (s. Beisp. 1 2 - 2 0 ) möglich. (Vgl. dazu etwa MOHME 1 9 9 5 und POGGENPOHL 1 9 9 4 . )

Neben die Kundenanalyse als ein spezielles Aufgabengebiet tritt die Standortforschung. Man sollte dabei unterscheiden, ob es sich um neue Standorte handelt; hier könnten dann auch Punktbewertungsmodelle, Verfahren der Investitionsrechnung usw. zum Einsatz kommen. Bei schon existierenden Standorten kann das sog. "customer spotting-Verfahren " angewandt werden. Hierbei befragt man Kunden nach ihrem Alter usw. und vor allem ihrem Wohnort. Letzterer wird anschließend in einer Karte lokalisiert. Nach dieser Abgrenzung des Einzugsgebietes können weitere Analysen - z. B. der Konkurrenz - vorgenommen werden. Vgl. zum genannten Verfahren DRUMMEY 1 9 8 4 . S. auch das Praxisbeispiel zum Standort von Filialen bei HERBST 2 0 0 0 . In einer weiteren Fallstudie zur Image-Analyse wird dort übrigens bemerkt, eine lOstufige Ratingskala habe „sich bewährt, da sie die Angaben von Prozentsätzen zuläßt und eine relativ starke Differenzierung des Kundenvorteils ermöglicht. Die Befürchtung, die Befragten würden die Skala nicht voll ausschöpfen", konnte in zahlreichen „eigenen Studien widerlegt werden" - S. 1144.

Ein anderer Bereich des Dienstleistungssektors ist das Versicherungs- und Bankgewerbe. Ansätze zur Marktforschung bei Versicherungen, zumindest im Bereich der Lebensversicherung, können schon recht früh festgestellt werden; sie gehen zurück bis in die Zeit vor dem 2. Weltkrieg. Wie MICHALETZ ( 1 9 5 9 , S. 1 6 ) berichtet, sind bereits ab 1 9 3 5 in der damaligen Wirtschaftsgruppe "Privatversicherung" marktforschungsmäßige Erwägungen angestellt worden, die ihren Ausdruck z. B. auch im 2. Geschäftsbericht der Wirtschaftsgruppe 1 9 3 8 / 3 9 in einem eigenen Kapitel "Statistik und Marktforschung" fanden.

Das hat seine Ursache offenbar darin, daß einerseits die Versicherungen wohl schon von jeher über recht gute Statistiken verfügen und andererseits die notwendigen Daten, wiederum besonders für die Lebensversicherungen in Gestalt der Angaben über die Bevölkerung, bereits seit langem in relativ großem Ausmaß von der amtlichen Statistik bereitgestellt werden. Dementsprechend handelte es sich vorwiegend um Sekundäriorschung. /Vzwwerhebungen, insbesondere große repräsentative Umfragen, fanden dagegen anfangs eher zögerlich Anwendung. Dafür kann man mehrere Gründe nennen. Einer lag sicher in der Tatsache, daß der Untersuchungsgegenstand außerordentlich komplex ist; man denke nur an die vielen Arten von Versicherungen und ihre jeweilige besondere Funktion.

Kapitel 17 Besondere Bereiche der Marktforschung

437

Auch bei Banken und Sparkassen erfolgte der Einsatz repräsentativer Umfragen zunächst eher spärlich. So wurden in der Schweiz von den 4 großen Banken gemeinsam ab 1984 alle 2 Jahre 3000 (Privatpersonen befragt ("Finanzmarkt Schweiz 19.."). Daneben fand, ebenfalls in zweijährigem Turnus, die Befragung von ca. 2000 Entscheidungsträgern aus Kundenfirmen statt. (Vgl. dazu REGLI 1988, S. 141. S. ferner Beisp. 13-9, für Österreich, mit Conjoint-Measurement-Befragung für alternative Sparformen.)

Schon seit längerem spielt aber die Kundenanalyse auch in diesem Bereich eine Rolle. So wird aus den USA für 1961 berichtet (Kundenanalyse für Banken, Blätter für Genossenschaftswesen 1961, S. 304 f.), daß dort eine Stichprobenziehung mittels Zufallszahlentafeln aus der Kundenkartei empfohlen wurde. Andere Möglichkeiten referiert R E G L I (1988). Das folgende Beispiel geht noch weiter: Beispiel 17-11 Ein Geldinstitut mit einer größeren Anzahl von Zweigstellen legte in diesen den in Darst. 17-2 (folgende Seite) wiedergegebenen Fragebogen aus. Der Fragebogen konnte auch mittels eines vorbereiteten Umschlages („Porto zahlt Empfänger") an die „Marketingabteilung" der Zentrale eingesandt werden. Daraus wie aus der Anlage insgesamt - die natürlich auch Fragen der Repräsentanz aufwirft (ähnlich wie die vielfach üblichen Fragebogen in Hotels; s. auch im nächsten Abschnitt) - ist wohl zu schließen, daß es sich bei den ganzen Aktion um eine über die reine Marktforschung hinausgehende, im Zuge generell der „Kundenzufriedenheit", handelte.

Auch bei Geldinstituten hat der Einsatz von „Testkäufern" Eingang gefunden, in Form des sog. Schaltertests. Ein weiteres Arbeitsgebiet ist ebenfalls die Standortforschung, hier oft Zweigstellenanalyse genannt. Relativ weite Verbreitung hat die Marktforschung im Fremdenverkehr (oder „Tourismusmarktforschung" - so SEITZ/MEYER 1 9 9 5 ) gefunden. Das ist erklärlich nicht nur aus der - zahlenmäßigen - Bedeutung des Tourismus schlechthin, sondern auch daraus, daß daran verschiedene Gewerbe und Institutionen interessiert sind: die Reiseveranstalter bzw. -büros, die einzelnen Verkehrsträger, die primären Fremdenverkehrseinrichtungen (Hotels usw.) ebenso wie die sekundären (Zulieferanten für den Fremdenverkehr, Dienstleistungsbetriebe), nicht zuletzt aber auch der Staat aus allgemein steuerpolitischen oder Devisen-Gründen. Es überrascht deshalb nicht, daß der Umfang entsprechender Untersuchungen bzw. vorliegenden sekundärstatistischen Materials recht groß

Teil IV Sachgebiete der betriebswirtschaftlichen Marktforschung

438

W i r m ö c h t e n u n s e r e L e i s t u n g e n zu I h r e m N u t z e n s t ä n d i g v e r b e s s e r n . D e s h a l b liegt u n s s e h r d a r a n v o n I h n e n zu e r f a h r e n , w i e S i e u n s b e u r t e i l e n . H a b e n S i e V e r b e s s e r u n g s v o r s c h l ä g e , sind S i e m i t i r g e n d e t w a s n i c h t z u f r i e d e n o d e r gefällt I h n e n e t w a s b e s o n d e r s g u t ? D a n n n e h m e n S i e s i c h b i t t e ein p a a r M i n u t e n Z e i t u n d n o t i e r e n

(btlte dru Ort der Gesch¡n.sstelle eintragen)

R ä u m l i c h k e i t e n und Innengestaltung der Kundenhalle • •

sehr gut • gut • nicht befriedigend, weil:

Mitarbeiter

befriedigend

Freundlichkeit. Höflichkeit, Hilfsbereitschaft • •

sehr gut • gut • nicht befriedigend, weil:

befriedigend

A t m o s p h ä r e in d e r G e s c h ä f t s s t e l l e •

sehr gut



nicht befriedigend, weil:



gut



befriedigend

Fachkenntnis.se Q •

sehr gut • gut • nicht befriedigend, weil:

Diskretion an Schalter. Kasse und Beratungsplatz

Beratunesqualilät

O •

O •

sehr gut • gut • nicht befriedigend, weil:

befriedigend

Informationsangebot (Prospekte. Werbung) • •

sehr gut • gut • nicht befriedigend, weil:

sehr gut • gut • nicht befriedigend, weil:

befriedigend

befriedigend

Finanzangebote und Leistungen befriedigend

Geldautomat. Kontoaus/uedrucker und Service am Schaltcr • •

sehr gut Q gut • nicht befriedigend, weil:

befriedigend

Öffnungszeiten • •

sehr gut • gut • nicht befriedigend, weil:

befriedigend .

Geldanlage. Finan/iening und andere Finan/dicnstlcislungcn • •

sehr gut • gut O nicht befriedigend, weil:

befriedigend

Raum für weitere Anmerkungen und Hinweise:

Die Angabc I h r e r persönlichen Daten ist Ihnen freigestellt.

(Vorname, Ñame, Anschrift) A u f W u n s c h rufen wir S i e auch g e m e an. Telefon-Nr.:. Sie erreichen mich in der Zeit von

bis

Vielen Dank für Ihre Hinweise und Ihre Mitarbeit.

Darst. 17-2: Fragebogen der Kundenbefragung eines Geldinstituts

Uhr.

Kapitel 17 Besondere Bereiche der Marktforschung

439

und beides auch in methodischer Hinsicht sehr vielfältig ist. Dabei fällt es nicht immer leicht, zwischen Primär- und SekundäAovschung zu trennen - da eben, wegen des eingangs skizzierten vielseitigen Interesses am Fremdenverkehr, nicht nur die amtliche Statistik (so etwa im Rahmen des „Mikrozensus"), sondern auch mancher Wirtschaftsverband mit eigenen Erhebungen aktiv wird. Dabei kommt es ebenfalls zu „Verbands"- und „ Verbund-Marktforschung". (S. dazu in Kap. 19.) Zu nennen ist in diesem Zusammenhang vor allem der frühere „Studienkreis für Tourismus e. V. Starnberg. Er führte laufend - bis zu seinem Zusammenbrechen Ende 1993 - als große repräsentative Umfrage „Reiseanalysen" durch; nunmehr gibt solche - zuletzt die RA 'Ol - die Forschungsgemeinschaft Urlaub und Reisen" heraus. Daneben existiert umfängliches Material, auch aus Panels, von diversen Instituten.

Exkurs: Umfragen und Gewerblicher Rechtsschutz Abschließend zu diesen Betrachtungen über besondere Bereiche der Marktforschung soll noch kurz auf ein Gebiet eingegangen werden, das wegen seiner großen Bedeutung für das Marketing-Management ebenfalls zur Marktforschung gerechnet werden kann: die Frage des "Markenschutzes". In allen den Fällen, in denen das geltende Recht auf die Verkehrsauffassung abstellt, kann versucht werden, diese durch Umfragen zu ermitteln. Nach MÖHRING (1963) erstreckt sich die Bedeutung der Verkehrsauffassung im Gewerblichen Rechtsschutz auf folgende Punkte: Sittengebot, Verbot der irreführenden Werbung, sklavische Nachahmung, Firmenrecht, Eintragungsfähigkeit von Warenzeichen, Ausstattungsschutz, Warengleichartigkeit, Verwechslungsgefahr, warenzeichenmäßiger Gebrauch, Verlust des Warenzeichen- und Ausstattungsschutzes, berühmte Marke, wettbewerbsrechtliche Nebengesetze (Rabattgesetz, Zugabeverordnung, Sonderveranstaltungen). Die Bedeutung von Umfragen in der Rechtspraxis (vgl. dazu auch NOELLE-NEUMANN/SCHRAMM 1961 - „grundlegend überarbeitete Neufassung in Vorbereitung" [NOELLE-NEUMANN/PETERSEN 1996, S. 93]) kann aber noch weiter gesehen werden: überhaupt als „empirische Rechtsforschung" oder „Rechtstatsachenforschung" (Vgl. dazu SCHWEIZER 1976). Zumindest der Ausdruck „empirische Rechtsforschung" scheint zu weit - weil zu sehr in der Nähe von „empirischer Rechtssoziologie" (mit ζ. B. auch Untersuchungen über die Rolle des Richters usw.!) - ; dagegen erscheint den Verf. die Bezeichnung „repräsentative Rechtstatsachenermittlung" (so SCHWEIZER/QUITT 1985) angemessen. Mitunter wird auch von forensischer Marktforschung gesprochen.

440

Teil IV

Sachgebiete der betriebswirtschaftlichen Marktforschung

Während früher zur Erforschung der Verkehrsanschauung lediglich Zeugenbeweis, Auskünfte von Industrie- und Handelskammern, Werbeaufwands· und Umsatzzahlen sowie eventuell die Auffassung des Richters "als Person der beteiligten Verkehrskreise" in Betracht kamen, sind seit "Beginn der 50er Jahre demoskopische Gutachten ein von fast allen Gerichten anerkanntes Beweismittel" (MÖHRING 1963, S. 69). Die Möglichkeiten und Probleme dabei sollen die folgenden beiden Beispiele demonstrieren. Beispiel 17-12 Unter Vorlage eines Bildblattes wurde folgende Frage gestellt: „Hier habe ich die Vorderseite einer Packung für O l zur Körperpflege. Der Name ist darauf absichtlich unkenntlich gemacht. Erkennen Sie diese Packung? Haben Sie ein Ol in so einer Packung schon mal gekauft oder gesehen?" (1) Ja, schon mal gekauft (2) Nur gesehen (3) Weiß nicht genau, unsicher (4) Nein, bestimmt noch nicht gesehen Mit der Untersuchung sollte festgestellt werden, ob eine Verwechslungsgefahr zwischen den Verpackungen zweier Massageöl-Hersteller besteht. Dazu wurden - Prinzip des „split ballot" bzw. „split half" (s. Kap. 4) - der einen Hälfte der Befragten das Bildblatt mit der Verpackung des einen Produzenten und der anderen Hälfte das der ebenfalls neutralisierten und sehr ähnlichen Verpackung des zweiten vorgelegt. „Die neutralisierten Bilder machten es unmöglich, die Herstellerfirma aufgrund des Produktnamens zu identifizieren. Nur die Aufmachung alleine wurde getestet. Der Befragte konnte seine Meinung nicht durch sorgfältiges Lesen überprüfen. Durch die neutralisierte Bildvorlage wurde das flüchtige Wahrnehmen nachempfunden, mit dem der Kunde beim Einkaufen das von ihm gesuchte Produkt identifiziert, ohne den Text auf der Verpackung zu lesen, und das die Voraussetzung dafür ist, daß überhaupt die Produkte verschiedener Hersteller miteinander verwechselt werden." (NOELLE-NEUMANN/PETERSEN 1 9 9 6 , S . 1 6 7 / 1 6 8 . )

Beispiel 17-13 Schweizer liefert eine "Analyse des Urteils des O L G Hamburg vom 11.8.1977 durch das O L G Hamm im Urteil vom 1.2.1979" (SCHWEIZER/QUITT 1985, S. 44). "Vermutlich wurde die von einer Partei vorgelegte und vom O L G Hamburg verwertete Studie zu einem anderen Thema erstattet." (Ebenda, S. 45.) Als Hinweis darauf wird u.a. die Frage 3 des verwendeten Fragebogens aufgeführt; sie lautet: "(Interviewer: Blaues Kartenspiel ungeordnet vorlegen!) Man denkt ja nicht immer gleich an alle Möglichkeiten. Auf diesen Kärtchen sind mögliche Bedeutungen dieser Aussage ("Es gibt kein besseres Bier" - d. Verf.) angeführt. Welche davon ist Ihrer Ansicht nach richtig? Sie können auch mehr als eine Bedeutung als richtig ansehen.

Kapitel 17

Besondere Bereiche der Marktforschung

441

(1) das ist das beste Bier, das es überhaupt gibt (2) jedes andere Bier ist nicht so gut (3) das sagt nichts über das Bier aus (4) das ist ein reiner Werbespruch" Schweizer meint, daß es "aus der Sicht der wettbewerbsrechtlichen Problematik zum negativen Komparativ" - abgesehen von der Rest-Kategorie "weiß nicht" u.ä. - zumindest sechs Antwortmöglichkeiten gibt: "1. Das beste Produkt, alle anderen Produkte sind schlechter. 2. Das Produkt gehört zu der Gruppe der Besten; die Masse der anderen Produkte ist schlechter. 3. Es kann andere Biere geben, die auch gut sind; aber keines dieser Biere ist besser. 4. Ein besseres Produkt gibt es nicht, es gibt aber möglicherweise auch keine schlechteren Produkte. 5. Die Aussage ist zwar ernst gemeint, aber nicht nachprüfbar. 6. Die Aussage will nicht ernst genommen werden; sie will nur auf das Produkt aufmerksam machen." und resümiert: "Wer die Frage 3 genau überprüft, wird feststellen, daß die dort vorgegebenen Antwortmöglichkeiten bei weitem nicht die zur wettbewerbsrechtlichen Problematik erheblichen Antwortmöglichkeiten abdecken. Nach einigem Nachdenken wird er sogar einräumen müssen, daß der Fragebogen der verwerteten Studie nur die erste und fünfte Antwortmöglichkeit berücksichtigt. D e r Fragebogen geht nicht auf das wettbewerbsrechtliche Kernproblem ein, nämlich auf das Problem, ob der Slogan von einem nicht unerheblichen Teil der Werbeadressaten als Spitzen-Behauptung oder als Alleinstellungs-Behauptung aufgefaßt wird." (SCHWEIZER/QUITT 1985, S. 46 und 47.)

Aufgaben 17-1: Können im Rahmen der Investitionsgütermarktforschung Produkttests durchgeführt werden? 17-2: T/F: Die - in vielen Ländern existierenden, oft auf paritätischer Grundlage - v4«s/ΰ io

2,83 3,48 4,44

sC OO OO

fN O ? * ' «r!

2,92 3,60 4,62

Vi © >C 5C Vi * ci f i *

f. * * f i * ' v"

3,11 3,89 5,06

3,03 3,77 4,86

/i r-* (N

C C K r - «o r- # S » . * , * sC O·' * v i o o

r· r j ? C * * " >Λ r»'

* VC — ÍN Os «ir-*©

sC sc W-. * Ο >£ — oc r - , «Λ * r-Γ

Os Γ-

«Λ O· ©s 0 s o'o'c

3,48 4,48 6,06

OC IN 1— r< oc * *' vi«'

f , (N IN

se r-, * r i * sO

O.

* ' S¿ X

wioo r í

^ * «ri r-* —' « i r - ' c *

sC * Os OS © * ' so c '

os S Os o" o" o '

sr. |C.J c· Os Ο Οο' c c

Os ¿ Ss o'o ©

-

oc

OS

©

— v-l *

* * c

OC «Ν * * σ-" r

© — «r» R -

1,84

• ΰ Τ Ι Ι Λ

2,42

IN

— riri ri ri ri — ( N ri

2,09

2.07

2,87

2,40



481

0 o c 0 0 ri 0 f. © ri o c ri C *T 0 0 «< N Ο Γ ·^ O N se • IN « r » ON R - 0 R* ^ "·. - τ 3 CO ri e ri Í Ñ C i0 . fi. r-. ΟΛ« f » 0 0 ^rj r v i ff i < N ri — riri ri ri r Γ ri ri* r Γ ri ri ri ri ri ri r ri ri η

0 — — fi 0 0 00 o — V, ON — w .» o — riri — riri

Λ Ι — Ν ©« « Λ » 0 · 0 0 > o f. >r »0 fi > 0 »r » 0 0 0 0 fi I N O N 00 O O O N — O * < N O NV — O« — Τ r » r-f i- v 0 fi o > « Τ O N « O C w i © . R~.« N O — —N 0 . Ofir O ri N O ON, ri NC O N . — — 0 0 Λ — R - , t C« N r -1 r » ft « — « Λ O .0 Γ riri fΓ ri ri ri F Γ rif T ff Π r rJ ri ri ri ri ri ri ri ri ri ri ri — ri ri ri ri f Γri ri fi C^t^îfi — riri

C r s ci- on Γ-1ΙΛΟ o c 0 J^ > Λ r-— —O o N T l o >nc.r A N O «C — ;O * . η o o « τfi R - f i N T , O , r^ ri ri V ri ri* fi ri ri fi ri ri f T I N fi F I ri fi f T

u l IN IN O w i i N ' TF R - — ri. s o .— Ν Ι« Λ O • — ' T O ririn ri ri ri

O

IN IN

5 R Ï — ^ 0 0 ri riri ri I N r I f^if^tr-i

O f > r0 «Τ Ο ri r-τ ^ r » fi η r* — r «sf « t O N 0 » R - O> f . ON r- Ο Τ O 3C O x f ro· O — O — u > 0 > , Η , »— I N N O — Ρ» ^ fi , NO T.o O N N . O ^oen Γ ^ Γ Λ Μ t > 0 —o _ ΓΗ, « Λ C > ,T .o c — , O^ \ « N — ri © — ri ri f* N ri ri r T ri ri fi riri ri dri*^ rj < — ΓV I * ri fi rifif» ri ri ri ri ri ri ri ri V rifÌ^·"

O fi « r ifi fi O « « Π « Λ r- 0 0 vi r , 0 — O fi — g xc fi r » — O · O Λ o c « Τ O N« Λ p s O —« o o _ nriN — R^ — T . 0 0 -. τ ri ri V riff ri ri τ" ri fi J ri fi ri ri f î ri ri fi riri η ri " C Vri ri « '· " ri fi η

Í 3 0 > — C.f·«or fi — 0 0 0 ¡ 0 0 r* — fi > C o »o o O r-. ro ,> ,> 5 < 0 OS NC W*. ri rit* rifí > •» ri ri τ" ri fí V ri f Γ T f * ri f\

9* η Ο — ΟΟ — ON ri — TTH O N IN 0 , — f. τ* vi r Γ» -Τ vi

O

R . ^ V I

x r > > o

rr

ose

V < o * oo

fi ON fi

NO. I N O .

O · ON 0 0 IN O ON Ό NO

I N — fi o > < 0

ON ON R «

ι Λ * 0 —

^ r *o * 00'

jr. rj 0 0 — O O0 0O N f j . O > , —, * * — < N IVI« V »0 0



ri f TV

>0

R-

0 0

ON

0 ri W i— Or- O NO 0 —. 00 . ri. O . r-. I N O N 00 V fi f>.riM Γ RIFI^·* R I F I V ^ ri ri ri R I F I V

N IC O O -

00 N O

O

I N 0C

N O — , Γ , rififΓ

fi O N I N

rr η f , ri τ r- O O W I -— t 0 0 OO N -O r » r- o0 0 — O .T f .f > O N — O N ,0 — « Λ« Λ O . fi. — O .N .< N O , 0 0 0 , < £ 0 , δ r-, I N « O fr i w i O T f *w i f T« / i r-* vr*Tr»* ri«/i «c v'wir«'

O vor*

W i «R» V i « Λ « Λ « C O N w » - f- Q \ Ί ^ ON ^ R « ON 9> ON ON ON ON ο . ο a »O · O S o í S N ON 5 ^ N O » O « O « ON 0 * 0 * 0 * 0 0 * 0 * 0*0 O 0 * 0 * 0 * 0 * 0 * 0 * o'o'o* 0 * 0 * 0 * 0*0*0*

V)

— fi fi 0 — 0 0 « ΛS

I N fi*

no 0 0 1 — O N , © ,— 0 0 ON. f T f C w r fTfi'T*

»IN-

— «Λ

V »

0 0 ON « r i IN

vr

N O f. — — 0 — M « r .S INO- C ri ri f T ri rí fi ri ri fî

« η η

Darsi. T-2: Quantile der F-Verteilung (Forts.)

O fi

VI SN 0 * 0 * 0 *

O » ON ON

0 •F

O Ν»

0*0*0*

«Η « Λ « Λ r0» ON ON ON O » ON ON

« Λ

IFTRFT 0 > ON ON

0 * 0 O

O Γ-

O*O* O*

8

Ο

0 * 0 "

S IN

0 * 0 " O*

8

482

Anhang

Β. Einige Regeln für Matrizen und Vektoren*

Im folgenden sollen zunächst einige Definitionen für Matrizen und Vektoren gegeben und Rechenregeln dafür angeführt werden. Danach geht es um einige spezielle Formen von Matrizen und besondere Probleme, die mit der Berechnung verbunden sind. Eine Gliederung in dieser Richtung (etwa: Definitionen, Rechenregeln, Sonderprobleme) erweist sich jedoch als zumindest darstellungsmäßig unzweckmäßig. Nachstehend erfolgt deshalb mehr eine — formal ungeordnete — Aufzählung einiger Punkte. 1. Definition von Matrizen. Unter einer Matrix versteht man ein rechteckiges, aus m Zeilen und η Spalten bestehendes Schema von Zahlen (Elementen): 21

a 12 a ?2

. . . a,j . . . a ?j

. · · a1n . • · a2n

a,i

a i2

. . . a¡j

.•

an a

a

m1

a

m2

·• ·

a

mj

·

•·

a

a

in

mn

m χ η ist die Dimension einer Matrix. Ist m = n, so handelt es sich um eine quadratische Matrix. Sie hat eine Hauptdiagonale; deren Summe heißt die Spur der Matrix. Beispiel 1 A=

2 3

4

ist eine quadratische Matrix; die Elemente der Hauptdiagnonalen sind 2 und 4, ihre Spur beträgt 6. B =

4

1

2

1

7

3

ist eine 2 χ 3-Matrix.

Quadratische Matrizen können symmetrisch sein; in diesem Fall sind alle Elemente oberhalb der Hauptdiagonalen (obere Dreiecksmatrix) spiegel* E r g ä n z t e r N a c h d r u c k a u s HÜTTNER 1 9 8 6 C . ( S . a u c h HÜTTNER 1 9 7 9 . )

Β. Einige Regeln für Matrizen und Vektoren

483

bildlich identisch mit d e n e n unterhalb dieser (untere Dreiecksmatrix): a¡j = ají f ü r alle i u n d j. Eine Matrix aus Korrelationskoeffizienten zwischen k Variablen ist immer symmetrisch (mit jeweils 1 in der Hauptdiagonalen); f ü r eine solche Korrelationsmatñx genügt deshalb die — obere oder untere — Dreiecksmatrix. Sind die Elemente ober- und unterhalb der Diagonalen alle 0, so spricht m a n von einer Diagonalmatnx. Sind zusätzlich die Elemente d e r Diagonalen alle 1, so liegt eine Einheitsmatúx vor. (Im folgenden mit I — Identi/ä/smatrix — bezeichnet.) Sind andererseits auch die Elemente der Diagonalen 0, oder, allgemeiner — da nicht nur für quadratische Matrizen geltend - , alle Elemente 0, so ist eine AW/matrix (0) gegeben. 2. Addition und Subtraktion von Matrizen. Zwei (oder mehr) Matrizen mit gleicher Dimension — also nicht notwendigerweise quadratisch — kann man addieren und subtrahieren. Dabei werden die Elemente d e r einzelnen Matrizen addiert oder subtrahiert. Beispiel 2 4 1 "2 1 ~ _3 4_

1 1 "4 7 3_ + 1 ~2 1 " 3 4

"0 0

~ 8 2 4" 2 14 6

12" 7 3 0" 0

D a s letzte Beispiel zeigt, d a ß gilt: A —A = 0 = A4- 0 = A = 0+ A= A d.h., Addition wie Subtraktion sind kommutativ(und Reihenfolge spielt keine Rolle.

auch assoziativ);

die

3. Multiplikation von Matrizen. Zwei Matrizen werden miteinander multipliziert, indem man die Elemente der i-ten Zeile der ersten Matrix mit denen der j-ten Spalte der zweiten multipliziert und die Produkte jeweils addiert: an a2i

3|2 a-o

Β

bu t>21

b|2 b 22

a n b u + a 13 bji ¿21 b n +&22 t>21

a n b 12 + a| 2 b 2 2 &2Ì t>12 + a22 t>22 _

484

Anhang

Daraus folgt zunächst, daß die Matrizenmultiplikation nur vorgenommen werden kann, wenn die Anzahl der Spalten der ersten Matrix gleich der der Zeilen der zweiten ist, Dagegen mag die Zeilenzahl der ersten und die Spaltenzahl der zweiten beliebig sein; beide ergeben die Dimension der neuen Matrix. Allgemein: zwei Matrizen der Dimensionen m t χ ni und m 2 x n 2 können miteinander multipliziert werden, wenn n] = m2; die Dimension der neuen Matrix ist dann m, χ n2. Beispiel 3 Gegeben seien die beiden Matrizen aus Beispiel 1 : A=

2

Γ

3

4

1. A · B =

B= 9 16

9 31

4

1

2"

1.73

7 18

2. BA ist nicht möglich.

Daraus folgt, daß die Matrizenmultiplikation nicht kommutativ ist. Man muß deshalb zwischen Pra-und /W-Multiplikation unterscheiden: AB bedeutet einerseits, daß Β mit A prämultipliziert wird, wie auch umgekehrt die Postmultiplikation von A mit B. 4. Vektoren. Transponieren. Besteht eine Matrix nur aus einer Spalte - Dimension also m χ 1 - , so spricht man von einem Spaltenvektor. ai a2 a=

a¡ am

Entsprechend liegt ein Zeilenvektor dann vor, wenn die Dimension 1 χ η beträgt: a ' = [a,

a2...aj...an].

a' entsteht aus a durch Transponieren. Entsprechend bezeichnet A' die transponierte Matrix („Transpose").

485

Β. Einige Regeln für Matrizen und Vektoren

Beispiel 4 Β (aus Beispiel 1 ) = ^

B' =

4 1 2

*

3J

1 7 3

Die /Vämultiplikation eines Spaltenvektor mit einem Zeilenvektor — von gleicher Dimension — ergibt einen Skaiar (d. h. eine einzelne Zahl), das Umgekehrte eine Matrix: a'b=

ab' =

a, b, +

a , b2 +

.. · +

ajbj

+

... +

anbm

" a , b, a2bi

a, b 2 a2b2

a,bj a 2 bj

a, b n a 2 bn

a¡b,

a¡b2

a¡bj

a¡ b n

_amb,

amb2

a m bj

a m bn

Die Pramultiplikation einer m χ ri-Matrix mit einem Zeilenvektor der Dimension m ergibt einen Zeilenvektor der Dimension n, die Pos/multiplikation einer m χ η-Matrix mit einem Spaltenvektor einen Spaltenvektor der Dimension m : a'B = e' = [C]

c 2 . . . C j . . . cn] C]

Ç2 Ba = c =

Ci

Dagegen ist die Prämultiplikation einer Matrix mit einem Spaltenvektor wie auch deren fWmultiplikation mit einem Zeilen vektor nicht möglich. 5. Inverse, Determinante und Rang einer Matrix. Eine Division von Matrizen, die den üblichen Rechenregeln entsprechen würde, ist nicht definiert. Jedoch läßt sich bei quadratischen Matrizen unter bestimmten Voraussetzungen (s. auch unten) für eine Matrix A eine Matrix A - ' so finden, daß A A " ' = I wird. Es gilt auch: 1. A"'A = I 2. ( A - 1 ) - 1 = A

486

Anhang

3. (A')" 1 H A " 1 ) ' 4. ( A B ) - , = B - 1 A - 1 . Die rechnerische Durchführung der Inversion ist aufwendig. (Eine Ausnahme bildet die Diagnonalmatrix; die Inversion erfolgt hier einfach durch Einsetzen der reziproken Werte der Hauptdiagonale in diese.) Es existieren dafür verschiedene Rechentechniken, die etwa dem Gauß'schen Algorithmus zum Lösen simultaner Gleichungssysteme bzw. der SimplexMethode beim Linearen Programmieren ähneln resp. darauf zurückgehen. Eine davon wird — da sie die „Determinante" benutzt — im Anschluß an den nächsten Abschnitt vorgestellt. In der Praxis erfolgt allerdings (eben wegen des Aufwandes, zumal bei größeren Matrizen) die Inversion mittels Computerroutinen. Quadratischen Matrizen läßt sich weiterhin eine einfache Zahl — eine Skalar — zuordnen, die als Determinante bezeichnet wird. Sie ergibt sich aus der — mit alternierendem Vorzeichen gebildeten* — Summe der m- ( = n-) gliedrigen Produkte der Elemente a¡j mit den — m! („m-Fakultät") — Permutationen der Zahlen i = 1 bis m und j = 1 bis m. Bei m = 2 gibt es also 2! = 2· 1 = 2 solcher Permutationen; folglich ist: a

IAI =

11

a

u

3-2] 322

— a11 a22 — a12a21·

Beispiel 5 A=

2 3

Γ ; IAI = 8 - 3 = 5. 4

Die Zahl der Glieder steigt sehr rasch an; bei m = 3 ergibt sich bereits: IAI = 3] ι 3j2 833 — 3i] 3J3 3jt

+ 3]2

83]

— â^a^] 833 + 3)3 3?] 832 — a 13 a 22 a^].

Je größer die Dimension einer (quadratischen) Matrix, desto aufwendiger wird also die Berechnung der Determinante und kann dann praktisch nur noch mittels Computern erfolgen. Darauf braucht hier nicht weiter eingegangen zu werden. Festzuhalten bleibt nur, daß Voraussetzung für die Möglichkeit der Inversion einer Matrix ist, daß deren Determinante nicht 0 wird. Ist dies der Fall, „verschwindet" also die Determinante, dann nennt * Exakter formuliert: Das Vorzeichen resultiert aus der Anzahl der Inversionen (gerade-!-, ungerade — ); eine Inversion liegt dann vor, wenn in einem Index eine höhere Ziffer einer niedrigeren vorangeht.

Β. Einige Regeln für Matrizen und Vektoren

487

m a n eine s o l c h e Matrix singulär. ( E i n e nicht-singuläre Matrix heißt auch regulär)

In e i n e m derartigen Falle sind die Zeilen(vektoren) o d e r Spal-

ten(vektoren) nicht — linear — v o n e i n a n d e r unabhängig. ( V o n linearer Abhängigkeit wird d a n n g e s p r o c h e n , w e n n sich Vektoren als Linearkombination v o n anderen ausdrücken lassen.) D e r Rang(r)

einer quadratischen

Matrix ist die Zahl der v o n e i n a n d e r u n a b h ä n g i g e n Vektoren (Zeilen oder Spalten). Er ist also m a x i m a l gleich m (und zwar, wie dargelegt, e b e n dann, w e n n die D e t e r m i n a n t e nicht verschwindet u n d damit auch eine Inverse existiert). Andernfalls spricht m a n v o n einer Matrix mit reduziertem Wie bereits erwähnt, soll nun ein Verfahren zur Matrizeninversion werden. Danach ergibt sich die Inverse von A als

Rang.

kurz vorgestellt

A"1 = C ' / I Al. Darin bedeutet C die Matrix der Cofaktoren von A (bezeichnet als: cof A) und C die Transpose von C, auch Adjunkte ( a d j A) genannt. Cofaktoren sind die Unterdeterminanten oder Minoren von A (der Ordnung η ; η entspricht da es sich voraussetzungsgemäß um quadratische Matrizen handelt, der Anzahl der Reihen in jeder Richtung — Zeilen wie Spalten), die sich ergeben (mit der Ordnung η —1) durch Streichung der i-ten Zeilen und j-Spalte und der Zuordnung eines Vorzeichens, durch Multiplikation mit ( - 1 ) Ή * * Beispiel 6 Gegeben sei die Matrix: 4

1 2

1

7

3

5

6

2

Der Wert der Determinante IAI kann nach den früher angegebenen Formeln oder auch über die Cofaktoren berechnet werden. Letzteres bedeutet, daß ζ. B. bei einer „Entwicklung" nach der 1. Zeile — die Entwicklung nach anderen Reihen würde das gleiche Resultat erbringen! —, also iw^zeii/verStreichung der 1. bis 3.Spalte bei jeweiliger Streichung der I.Zeile, die so entstehenden Determinanten zu multipli** Minoren (Unterdeterminanten) und Cofaktoren unterscheiden sich also dadurch, d a ß letzteren ein Vorzeichen zugeordnet ist. Ferner wurde hier der angloamerikanischen Literatur gefolgt, die streng zwischen cofacior und adjoint Matrix differenziert (s.Z.B. BOLCH/HUANG — 1974). Demgegenüber definiert etwa E. WEBER Adjunkte im Sinne der oben für Cofaktoren gegebenen Kennzeichnung und bemerkt konsequenterweise: „Für Adjunkte wird auch der Ausdruck Cofaktor gebraucht" (1974, S. 174).

488

Anhang

zieren sind mit den Elementen der 1. Zeile (unter Beachtung der aus obiger Regel resultierenden Vorzeichen). Das ergibt: 7 6

I Al = 4

3 2

1 5

-1

3 2

+2

1 5

7 6

= 4 · (14 —18) —(2 —15)4-2-(6 —35) -16 +13 -58 =

- 6 1 .

Damit liegt auch bereits die 1.Zeile der Matrix der Cofaktoren fest ; nach entsprechender Ermittlung ergibt sich letztere insgesamt als:

7 6

3 2

1 5

3 2

1 5

7 6

1 6

2 2

4 5

2 2

4 5

1 6

1 7

2 3

4 1

2 3

4 1

1 7

-4 10 -11

13 -2 -10

-29 -19 27

(Beispiel für die Vorzeichen: Bei Streichung der 2. Zeile (i) und 3. Spalte (j). also i + j = 5, erhält — da eine (/«gerade Potenz — der entsprechende Cofaktor: 4 5

1 6

das Minuszeichen/

Daraus folgt dann einfach:

A"'=C7-61 =

4 61

10 61

11 61

13 61

61

10 61

29 61

19 61

27 61

Diese Rechenschritte sind auch in „Kurzformeln" gefaßt worden. Für eine 2 x 2 r o Matrix ergibt sich etwa als Inverse von A = ! 11 a-π A-' =

1 a,j /.j^). Diese Werte bezeichnet man als Eigenwerte. Jedem solchen Eigenwert ist ein Vektor - genannt Eigenvektor - so zugeordnet, d a ß er die Gleichung Av = ¿V erfüllt. Die komplette Eigenstruktur chung

einer Matrix wird beschrieben durch die Glei-

AV = V L Darin ist L d i e Diagonalmatrix der Eigenwerte, und die Matrix V enthält in jeder Spalte den jedem Eigenwert entsprechenden Eigenvektor.

Aufgaben-Lösungen Beide Fragen sind zu verneinen. Zu den nicht-metrischen Skalen gehört auch die Nominal-Skala. Lediglich bei bestimmten multivariaten Verfahren (s. Kap. 11 und speziell 12) wird - im Falle von Rangdaten - die Bezeichnung "nicht-metrisch" gerade zur Unterscheidung von "metrischen" Verfahren verwandt.

Der Begriff "Auswertung" ist deshalb mißverständlich, weil man darunter einmal die im formalen Sinne (d.h. der Verfahren der Da· tenanalyse), zum anderen die inhaltliche Auswertung - die Interpretation - verstehen kann. Sekundärforschung meint die Auswertung von nicht eigens für den speziellen Untersuchungszweck erhobenen Materials, Sekundäranalyse dagegen die Re-Analyse, die wiederholte Analyse von Originaldaten (durch andere Forscher). richtig Man bezeichnet S-O-R-Modelle als echte Verhaltensmodelle, da diese das Zustandekommen menschlichen Verhaltens aus dem Kontext auch nicht beobachtbarer Einflußfaktoren erklären und daher nicht allein - in ihrem Wesen letztlich unerklärte - UrsacheWirkungs-Beziehungen zwischen äußeren Einflüssen (Stimuli) und Verhaltensreaktionen kennzeichnen. richtig

η

6

7 + 8 + 10 + 9 + 13 + 12 = 9,83 Es gibt keinen.

C. Aufgaben-Lösungen

491

Il H" 1

3-4:

Die Formel für die Lage des Medians lautet: —— ; im Beispiel ergibt sich = 3,5,4. d.h., Median werden: muß als Da (arithmetisches) Mittel ausalso dem 3. und Wertder berechnet die Reihe in aufsteigender Ordnung lautet: 10; 11; 12; 13; 17; 18, ergibt sich: (12 + 13) / 2 = 12,5.

3-5:

y = 13,5, gemäß L(ösung) 3-1; also: sy = Vl-3.52 + [-1,52 J+ 3,52 +1-2.52j+ 4,52 + [-0,52 j)/6 = 2,99.

3-6:

x

M« -Xbh =6-1=5.

3-7:

Die Formel für die Lage des 1. Quartiis lautet:

(Für das 3.

Quartil ist also das Ergebnis mit 3 zu multiplizieren.) Das ergibt = 1,5 (-3 = 4,5). Das obere Quartil resultiert also als arithme4 tisches Mittel aus dem 4. und 5. Wert: (6 + 7) / 2 = 6,5, das untere entsprechend aus dem 1. und 2. Wert: (1 + 2) / 2 = 1,5; mithin beträgt der Quartilsabstand: 6,5-1,5 = 5. Gelegentlich wird auch vom mittleren Quartilsabstand gesprochen. Er ergibt sich einfach durch Division: 5 / 2 = 2,5. 3-8:

8Cij = 80 · 79 · 78 · 77 · 76 · 75 · 74 7J~

1·2·3·4·5·6·7

= 3 176 716 400.

Die Anzahl der möglichen Stichproben hat sich also gegenüber dem Beispiel infolge der Vergrößerung des Stichprobenumfangs erhöht\ 3-10:

35000000-2000 = 0,9999714 ; das Resultat ist also praktisch das V 35000000-1 Gleiche!

492

3-11:

Anhang

Bei HARTUNG/ELPELT/KLÖSENER ( 1 9 9 5 ) sind die t-Werte auf 3 Stellen angegeben, allerdings nicht für 500 (bzw. genau: 499), sondern nur für 4 0 0 und 6 0 0 Freiheitsgrade; Interpolieren ergibt 1 , 9 6 5 , gegenüber Ζ = 1 , 9 6 0 . (Das stimmt überein mit der - allerdings anders aufgebauten und allein nach den bisherigen Ausführungen schwer verständlichen - Tabelle bei SACHS [ 1 9 9 2 ] , die 5 0 0 direkt ausweist.) Zunächst ergibt bei Rundung auf nur 2 Stellen die Anwendung der "Gerade-Zahl-Regel" auch für t 1,96 und damit das Gleiche. Selbst bei Rechnen mit 3 Dezimalzahlen folgt jedoch als Resultat der Multiplikation 0 , 0 2 5 5 (gegenüber 0 , 0 2 6 3 ) , d.h. bei Runden auf "ganze" Pfennige wiederum das Gleiche!

3-12: μ = 0,6 ± 2,58 · VTÖÖ = 0,6 ±0,052 Der "wahre" Mittelwert der Grundgesamtheit liegt mit einer Wahrscheinlichkeit von 99% zwischen DM 0,55 und 0, 65. 3-13: a) t 0 99 ( 500 ) = to,995(500)e ~ 2,58. t e m p unverändert 2,31. Ergebnis: nicht signifikant (n.s.). b) ^,99 (500) e = 2,33. Bei unverändertem t e m p = 2,31 ist hier die Abweichung ebenfalls nicht signifikant (wenn auch nur noch „gerade eben"!) 3-14: a) to,95(300)

0,975(300)e ~ 1>96.

= t

¡0,80 - 0,77| _0i03_ 0,3 / V3ÖÖ 0,017 ' Die Nullhypothese kann nicht verworfen werden; das Ergebnis ist nicht signifikant. temp

b

) to,95(300) ~ 1.64; t e m p unverändert 1,76.

Die Nullhypothese kann verworfen werden; das Ergebnis ist signifikant. Die Änderung der „Testanlage" hat also zu einer anderen Konsequenz geführt!

C. Aufgaben-Lösungen

, «r 345:

\ a) t e m p =

493

10,80-0,781 0,02 = ~ 0 j 7 m 0^0134164

= 1,49 ;

U n V 6 r ä n d e r t 1 96

'

·

Ergebnis: n.s.

b) Bei unverändertem t e m p = 1,49 und t t h e o r nunmehr 1,64 im Er gebnis ebenfalls „n.s.". 3-16: a) Die - wohl allein sachlich sinnvolle - „Alternativhypothese" lautet: ρ > 0,4. b ) t ec mm pp =

, 1 0 · 4 2 5 - 0 ; 41 - 4 3 » - i g . λ/0,4-0,6 /Λ/1600 0,012

to,95 (1600) e ~ Ergebnis: s.

(5).

4-1:

Eine „Omnibus"- oder „Mehr-Themen"-Befragung ist eine - meist von Marktforschungsinstituten in bestimmten Turnus durchgeführte - Umfrage mit mehreren Themenkomplexen. (S. dazu den als „Appendix" zu Kap.4 wiedergegebenen Fragebogen-Auszug.)

4-2:

Z.B. Überreichung einer Vorlage mit dem zu ergänzenden Text: „Ich meine, daß das Tragen einer Brille ..."

4-3:

a) Nr. 70, 71 und 74. b) Es gilt für diese Liste nicht: Die höchste Einkommensgruppe ist zwar „offen" nach oben hin (was etwa die Berechnung des arithmetischen Mittels ziemlich erschwert), das Kategoriensystem jedoch insgesamt geschlossen.

4-4:

a)

4-5:

„I und II sind beide richtig" (s. dazu auch Kap. 9)

„... Angenommen, der VW 1200 erhält 100 Punkte, wieviel Punkte würden Sie den anderen Automarken geben (wobei die höhere Punktzahl eine größere Wertschätzung ausdrücken soll)?" b) „... Angenommen, Sie hätten 100 Punkte zu verteilen: Wieviel Punkte würden Sie jeder einzelnen Automarke geben (wobei die höhere Punktzahl...)?" (Anmerkung: Die Klammererläuterung kann evtl. wegfallen, wenn keine Mißverständnisse zu befürchten sind.)

494

4-6: 4-7:

Anhang

„Dänische Grenzgänger, die in Deutschland arbeiten" „um eine selektive Stichprobe"

4-8:

Die Auswahlchancen sind extrem ungleich. Das 1. Element hat überhaupt keine Chance, ausgewählt zu werden, das 7. dagegen mehrere: 1-6; 2-5; 3-4 (und umgekehrt - die erste Zahl steht für den einen Würfel, die zweite für den anderen).

4-9:

a) 36, 72, 108, 144, 180; 216, 432, 648, 864, 1080 b) (1) 0; 0; 0; 1 (2) 5; 30; 180; 1080 (3) 0; 0; 0; 0; (4) 36; 1; 0; 0.

4-10: Durch Zuordnung der Nr. 000. 4-11: richtig 4-12: Bei proportionaler Aufteilung ist der Auswahlsatz für alle Schichten i gleich; der Stichprobenumfang jeder Schicht verhält sich also zum Gesamtumfang der Schicht wie der Stichprobenumfang insgesamt zum Umfang der Grundgesamtheit: n¡ _ η (L.la) (L.lb) Z.B.: also:

η, - - ^ - - 1 2 0 0 0 = 160 75000 η, = 160 n2 = 200 n, = 280 n4 = 240 n< - 120 1000

4-13: In der Tat können Quotierungs- und Schichtungsmerkmale identisch sein. Ganz abgesehen von den Kombinationen (s. dazu L 415), liegt der grundsätzliche Unterschied darin, daß beim Schichtenverfahren die Elemente letztlich „per Zufall" entnommen wer-

C. Aufgaben-Lösungen

495

den, beim Quotenverfahren hingegen der Interviewer die Auswahl bestimmt. 4-14: Für das erste Interview paßt nahezu jede beliebige Person in das Quotenschema. Mit zunehmender Anzahl von Interviews wird jedoch die Suche nach in die Quotierung „passenden" Personen schwieriger - bis zum letzten Interview, wo eine Person sämtliche verbleibenden Quotenmerkmale gleichzeitig erfüllen muß. (Innerhalb dessen hat jedoch die Interviewer jederzeit freie Hand bei der Bestimmung der konkreten Person!) 4-15: a) Einschränken ja, völlig beseitigen aber natürlich nicht! b) 1.: nein 2.: hinsichtlich Geschlecht und Alter (Welche Unterschiede sich bei der Zusammensetzung einer Stichprobe ergeben können, wenn die Quotenbedingungen nur „im Total" erfüllt zu sein brauchen, zeigt an einem Beispiel R E H O R N 1987, S. 83.) 4-16: „Es liegt kein Schwedenschlüssel vor, da z.B. in Spalte 8 keine gleichverteilverteilten Zufallszahlen aus (1, ..., 8) stehen." (KREIENBROCK. 1 9 9 3 , S . 1 7 2 . )

4-17: a ) x ^ . = Y + - - ( x - y ) η

(L.2)

b) 700000 + 1 0 0 0 0 0 0 · (800 - 750)= 750000 ' 1000 v ' (x folgt, als η · χ , aus Beisp. 59) 4-18: a ) xQuot. = ~ " Y

y

(L.3)

b); — · 700000 « 746 667 750 4-19: μ = Χ + t • Vn Aus: e - t - f vn folgt:

(L.4)

(L.5)

Anhang

η=

t

2

·σ

2

(L.6)

Die teilnehmende Beobachtung ist dadurch gekennzeichnet, daß der Beobachter, auf der gleiche Ebene wie der Beobachtende, aktiv am Ablauf des Geschehens teilnimmt. Sie wird unterschiedlich beurteilt. Von den meisten Vertretern der - primär auf die statistische Vergleichbarkeit, wegen der Möglichkeit verallgemeinerungsfähiger Resultate, gerichteten - empirischen Sozialforschung wird sie gerade wegen dieser Beeinflussung abgelehnt. Gelegentlich findet sich auch eine Befürwortung, mit verschiedener Begründung: Während etwa FRIEDRICHS/LÜDTKE ( 1 9 7 7 ) mehr in die Richtung argumentieren, daß sie den „traditionellen", „harten" Methoden tendenziell gleichwertig an die Seite zu stellen sei, entwikkeln Anhänger der „Aktionsforschung" (vgl. etwa MOSER 1 9 7 8 ) ein Gegenkonzept, das explizit von der Mitwirkung der „Betroffenen" ausgeht.

falsch falsch Die Mitnahme eines Regenschirms kann von bestimmten „Ereignissen" (oder „Zuständen") - ob es gerade regnet oder nicht abhängig sein. Die Zeitdauer spielt insofern eine Rolle, als Reisende oft länger unterwegs sind (und damit ihr Verhalten nicht nur vom augenblicklichen „Wetter-Zustand" bestimmt wird). a) Nein. Die Ergebnisse könnten auch als „Lern-Effekt", von einem Interview zum nächsten, erklärt werden. b) Ja. Die Studenten hätten in 3 Gruppen eingeteilt werden können, mit zufälliger Zuordnung jedes Studenten zu einer davon. (Vgl. Norusis, M.J., SPSS X Advanced Statistics Guide, New York 1 9 8 5 , S. 4 8 7 . )

C. Aufgaben-Lösungen

497

6-2:

2

2 3

Xu X2| χ



χ

12

χ

22

χ

32

6-3:

62=36

7-1:

„stets dieselben Personen regelmäßig befragt werden"

7-2:

1. In der neuen Fassung wird deutlich, daß es weniger um die Definition eines Personenkreises als um die einer Methode geht. 2. In der neuen Fassung wird explizit auch von Beobachtung gesprochen. Die alte Fassung ist jedoch deshalb nicht falsch, weil sie sich, wie oben gesagt, auf den Personenkreis bezieht. Streng genommen wird jedoch nicht dieser beobachtet, sondern lediglich zur Erhebung bestimmter Daten die Methode der Beobachtung eingesetzt. (S. „technische Durchführung".) Insofern ist auch die neue Fassung nicht ganz exakt. 3. Die Alternative „oder in gewissen Abständen" ist entfallen. Das kann geschehen, weil sie im „fortlaufend" als eingeschlossen betrachtet werden kann. Die Abstände der Erfassung und Abfrage können ja durchaus sehr verschieden sein. 4. Die Einschränkung „im Prinzip" ist nunmehr beim „Gleichbleiben" des Personenkreises angebracht (und könnte, gemäß den Erörterungen im Text, auch auf „repräsentativ" bezogen werden), dagegen entfallen beim Gleichbleiben des Untersuchungsgegenstandes. „Uber einen längeren Zeitraum hinweg" trifft das jedoch - jedenfalls auf lange Sicht - auch nicht zu. Insofern ist der Entfall hier mehr auf sprachliche Gründe zurückzuführen. Aus dieser Sicht dürfte die alte Fassung in jedem Falle vorzuziehen sein.

7-3:

Es besteht ein Unterschied: Beim „traditionellen" EinzelhandelsPanel wird der Endverbraucher-Absatz über die „Fortschreibungsgleichung" (7.1) ermittelt, also quasi indirekt, beim Scanning erfolgt die direkte Erfassung der Verkäufe. (Die Differenz liegt im „Schwund")

498

Anhang

7-4:

falsch

8-1:

„Branchendatenbanken" enthalten, wie der Name schon sagt, Material speziell für eine Branche. Es kann sich dabei um vorwiegend numerische Datenbanken handeln, in denen für eine bestimmte Branche relevantes statistisches Material zusammengestellt ist. Weiterhin kann es um die Aufbereitung von branchenbezogener Literatur (im Volltext oder nur als Referenz) gehen. Schließlich können Hinweise auf Marktstudien bzw. Produktanwendungen gespeichert sein. Insbesondere die Sammlung und Breitstellung statistischen Materials ist jetzt schon ein Aufgabengebiet vieler Wirtschaftsverbände. (S. auch in Kap. 19 zur „Verbandsmarktforschung").) Es liegt deshalb nahe, daß diese sich - zunehmend - um den Aufbau von Branchendatenbanken bemühen. Ein erster Versuch, mit der Datenbank ELTROD AT des ZVEI (Zentralverband der Elektrotechnischen Industrie), galt zunächst als wenig geglückt. „Der Verband der Chemischen Industrie (VCI) hat aus diesen Erfahrungen gelernt und hat sich ... vor allem auf die Entwicklung einer einfach zu handhabenden Software konzentriert." (REINHARD 1987, S. 137f.) Inzwischen war die ZVEI-Datenbank weiterentwickelt worden (auf Basis WIDAD - Wirtschafts- und Informatiosdatenbank der Wirtschaftsforschungsinstitute) und umfaßt derzeit 4100 Hersteller der elektrotechnischen Branche.

8-2:

falsch

9-1:

Alle vier sind richtig. Begründung: „ad 1: Zunahme in A: 40E, in Β 50E; 10E von 50E sind 20% weniger ad 2: Zunahmen von 40E bei A =60E sind 66,7%; analog 50E bei Β = 100E sind 50%, d.h. 66,7% minus 50% = 16,7% mehr in A ad 3: Zunahme in A: 40E, in Β: 50E; 10E von 40E sind 25% mehr ad 4: analog zu 2: in A 66,7%, in Β 50%, d.h. Α - Β = 16,7% weniger 16,7% sind aber bezogen auf 66,7% in A 1/4 oder 25%." (KRIZ 1 9 8 1 , S. 2 7 7 . )

499

C. Aufgaben-Lösungen

9-2: Besitz einer Lebensversicherung ja nein

Dar st. Irl: 9-3:

Alter

Familienstand

18-29 30-44 45-59 17 83

38 62

39 61

60 und mehr 40 60

ledig 15 85

verheiratet 43 57

"stub and banner "-Tabelle (Beispiel)

a) Nach dem Muster von Darst. 9-5 ergeben die entsprechenden Berechnungen für Frauen einen noch krasseren Unterschied: 1985 betrug das Potential 5240,97, 2010 nach „Prognose 1" 3671,35, das sind 70% von 1985, nach „Prognose 2" 9534,99 = 181,9%, d.h., einen Rückgang um 30,0% steht ein Wachstum von 81,9% gegenüber. b) Faßt man den Markt für Jeans als einen einheitlichen Markt auf und demgemäß die Ergebnisse für Männer und Frauen zusammen, so ergibt sich für 1985 13718,83 und für 2010 nach „Prognose 1" 9664,15 (70,4%), nach „2" 22853,62 (166,6%), also gegenüber einem Rückgang um fast ein Drittel ein Wachstum von zwei Dritteln! c) S. dazu Darst. L-2 auf der folgenden Seite. Für Eau de Cologne ergibt die „kohortenanalytische Interpretation" (Prognose 2) bei den Männern also einen Rückgang um 37,6%, die „entwicklungsmäßige" dagegen praktisch ein Gleichbleiben. d) Wiederum erbringen die entsprechenden Berechnungen bei den Frauen eine noch etwas größere Differenz: 1985 Potential 9063,55, 2000 nach „Prognose 1" 8472,04 = 93,5%, nach „2" 5551,98 = 61,2%. e) Insgesamt resultiert: 1985 12334,45, 2010 nach „Prognose 1" 11737,24 = 95,2%, nach „2" 7591,66 = 61,5%, d.h., einem nur geringen Rückgang, um noch nicht einmal 5%, steht ein sehr starker, um 38,5%, gegenüber!

500

Anhang

2010

1985

Prognose 1 (S)

Kohorte KaufBesetzung häufig- Potential Alter keit

Alter

1

uiigeboren

15-19

2

ungeboren

20-24

3

0-

4

25-29

5-

9

30-34

5

10-14

35-39

6

15-19

7

20-24

4

8

25-29

9

30-34

10

35-39

11

40-44

12

45-49

13

50-54

14

55-59

15

60-64

16

65-69

17 total

KaufKaufBesetzung häufig- Potential häufigkeit keit 1549,1

5,0

} 3066,7

8,9

5,0

129,42 4 0 - 4 4

2396,8

} 5139,8

457,44

45-49

2428.8

8,9

50-54

2089.4

55-59

1853,3

12,0

500,70

60-64

1561,2

65-69

1589.5

70-74

1349.9

75 +

1271,1

} 4690,9

16,6

778,69

} 3544,5

15,8

560,03

} 2100,6

17,5

367,61

70 +

2218,7

21,5

477,02

-

24455,3

-

3270,90 total

22288,5

272,94 ' 5,0

387,43

375,92 5,0

119,84

1 8,9

402,12

}l2,0

409,74

}l6,6

487,94

18,3

232,61

801,05

} 16,6 } 15,8

622,95

} 17,5

552,37

563,52

21,5

-

Potent.

77,46

1 3132,7 12,0

2588,3

14172,5

Prognose 2

3265,20 (99,8%)

-

2039,68 (62,4%)

Dar st. L-2: Alternativrechnungen (Beispiel - Forts.)

1

1

?

10-1: c = — Z y _ t > — Σ χ (10.4a) eingesetzt in: b Σ χ + c £ x m m (zweite Gleichung von [10.3}) ergibt: b Z x

2

+ ( - I y - b - Z x = Zxy

m

m

ΜΣχ2 - - Σ χ Σ χ ) = Σ χ χ - - Σ γ Σ χ m m Daraus folgt, nach Erweiterung mit — , (10.4b):

m

= ΣχΥ

C. Aufgaben-Lösungen

501

£xy-xy

Σ Χ -χ 2

m

- 2

10-2: ft = 0,884 Xl +10,41 = 0,884 · 3 +10,41 = 13,06 γ 2 =0,884-5 + 10,41 = 14,83 10-3:

χ-χ (gemäß Beisp. 3-3) -0,5 1,5 2,5 -1,5 0,5 -2,5

y-y (gemäß L 3-5) -3,5 -1,5 3,5 -2,5 4,5 -0,5

(x-x)(y-y) 1,75 -2,25 8,75 3,75 2,25 1.25 15,50

sxy = 15,5/6 = 2,58 (Zur Summe der Kreuzprodukte zwischen y und x2 s. Darst. L-3 letzte Spalte.) 10-4: Mit sxy aus A 10-4 und sx2 aus Beisp. 3-3 folgt:

und praktisch das Gleiche wie in Beisp. 10-1. 10-5: Gemäß (10.10) läßt sich die Arbeitstabelle L-3 (folgende Seite) aufstellen. Daraus resultieren (mit geringfügigen Rundungsdifferenzen). a) totale Streuung: 53,5 b) erklärte Sreuung: 13,6 c) nicht-erklärte Streuung: 39,7

502

Anhang

y

y

y-y

(y-y)2

y-y2

(y-y)2

10 12 17 11 18 13

13,06 14,83 15,71 12,18 13,95 11,30

-3,5 -1,5 3,5 -2,5 4,5 -0,5

12,25 2,25 12,25 6,25 20,25 0,25

-0,44 1,33 2,21 -1,32 0,45 -2,20

0,19 1,77 4,88 1,74 0,20 4,84

-3,06 -2,83 1,29 -1,18 4,05 1,70

9,36 8,01 1,66 1,39 16,40 2,89

81,03

0

53,50

13,62

(-0,03)

39,71

81 (y = 13,5)

(0,03)

(y-y)2

y-y

Darst.L-3: Arbeitstabelle zur Streuungszerlegung bei der Regression

10-6: y

x

2

y-y

(y-50 2

* 2 -Xj

(x2 - x 2 f

10 12 17 11 18 13

7 8 10 9 13 12

-3.5 -1,5 3,5 -2,5 4,5 0,5

12,25 2,25 12,25 6,25 20,25 0,25

-2,83 -1,83 0,17 -0,83 3,17 2,17

8,01 3,35 0,03 0,69 10,05 4,71

9,90 2,74 0,60 2,08 14,26 -1,08

81

59

0

53,50

0

26,84

28,50

(y - y) (x 2 _x 2 )

y = 13,5 (x = 9,83)

Darst. L-4: Arbeitstabelle zur Berechnung der linearen EinfachRegression (2. Berechnungsart) 10-7:

s ^ X2

^(x2-x2)=26j4= m 6

4 ) 4 7 > a l s o :

beta,2 = b22 · ^ = 1,2 · ^ sy 2,99

= 0,85

10-8: Es resultiert, mit den Regressionskoeffizienten aus Beisp. 10-5 und den Kovarianzen aus A 10-3 und -4 sowie der erklärten Streuung aus A 10-5: r 2 = 1,12.15,5 + 1,2-28,5 53,5 und damit das Gleiche wie in Beisp. 10-7.

C. Aufgaben-Lösungen

503

10-9: Aus der „Streuungszerlegung" gemäß (10.10) resultierten: s e = Z ( ? - y )2 = Σ (bx + c - y) 2 mit γ = bx + c, gemäß (10.1) = Σ (bx - y + bx - y) 2 mit c = y - bx, gemäß (10.4) = Σ (bx - bx) 2 = Σ^(χ-χ)2 = b 2 Σ (χ - χ) 2 , wie gefordert 10-10: r 2 = — ; also: St r

2

1-r

S =

S

St

2

S

st 10-11: F e m p =

St

=

Se S

t~ e st

Sne

(mit S e und S n e gemäß A 10-5)

= 1,37 (= t 2 m p gemäß Beisp. 10-4) f

0,95(1;4) = 7 > 71 (gemäß Tafel 2)

(V77Ï = 2,78 = t 0 ,975(4) > g e m ä ß Beisp. 10-4) 0¿ = _0¿ =^ = 0,82 10-12: t e m p ( r ) = , V(1-0,52)/(4-2) 0^1 ι

0,95(2) = t0,975(2)e = 4 > 30 · Der Korrelationskoeñizient ist also - wie gemäß Beisp. 10-4 schon der Regressionskoeííizient - nicht signifikant. 10-13: Nein, denn wenn - wie hier - in jedem Schritt nur eine Variable inkludiert und keine ausgeschlossen sowie das Bestimmheitsmaß nicht „bereinigt" wird, kann es sich nicht verringern.

504

Anhang

(

10-14: a) χ 2 = 200

182

|

30-100

82 2 170-100

| +

12 2

88 2

|

30-100

^

170-100

/

„ „ , 324 6724 144 7744 . = 200 · + + + 1 ,3000 17000 3000 17000 = 200 · (0,1080 + 0,3935 + 0,0480 + 0,455 - 1 ) = 200-0,7 = 1,4 _ (18-15)2

b)

|

(82-85)2

|

15 85 = 0,6 + 0,1 + 0,6 + 0,1 = 1,4

(12-15)2

|

(88 - 8 5 ) 2

15

85

10-15: a) Einsetzen der entsprechenden Werte in (3.12) ergibt: ,|p"P| - , |18"151 - 3 -M" -JP-Q/Vn Λ/15 - 85 / Λ/200 2,53 Darst. T-l erbringt (bei α = 0,05 und zweiseitigem Test): Zem emp

z

0,975 = ! ' 9 6 · Die Nullhypothese kann nicht verworfen werden; die Differenz zwischen dem „erwarteten" (theoretischen) und dem tatsächlichen Wert ist nicht signifikant. b) -J% emp (aus Beisp. 10-10): V m I = 1,19 (wie oben) Vxtheor ( d t o ') :

V^84 = 1,96 (dto.)

10-16: φ 2 = χ 2 / m , also v =

I

X2/m min(r - 1 ) , (s - 1 )

18,58/1000 _ 1

~ '

Der Zusammenhang ist nicht sehr stark. 10-17:falsch

C. Aufgaben-Lösungen

11-1: xχ,l i 12,3 8,8 11,2

x

505

l i ~ X1

(xii"xi)2

1,53 -1,97 0,43

2,34 3,88 0,18

6,7 9,3 10,4

6,40

26,4

32,3

x

2i

x

2i ~ x 2 -2,1 0,5 1,6

( x 2i " X a / 4,41 0,25 2,56 7,22

( * 1 > = 10,77

= 8,80

s i 2 = 6,40 I i = 3,20

S2 2

=

3,61

S. auch Beisp. 3-3. (Als Divisor bei der Berechnung der Varianzen ist - wie in Beisp. 3-5 - die um 1 verminderte Gruppengröße zu verwenden!) 11-2: ( 3 , 2 0 + 3,61)· 2 = 13,62 (und damit praktisch das Gleiche wie in Beisp. 11-1) 11-3:

SAQt=Il(xij Xjj-X 2,52 -0,98 1,42 -3,08 -0,48 0,62

12,3 8,8 11,2 6,7 9,3 10,4

6,35 0,96 2,02 9,49 0,23 0,38

1ÎM

58,7 ( x = 9,78)

SAQ^Zp^j-xj

(xij -

2

= (mit χ aus A 11-1)

506

Anhang

Xj

- X

(xrx)f

10,77-9,78 = 0,99 8,80-9,78= -0,98

p(xj - x j

0,98 0,96

2,94 2r88 5.82

SAQW-El(xij-Xj)f = (aus A 11-1) 6,40+7,22=1X62 11-4: F = 1,70 (gemäß Beisp. 11-1) t = 1,30 (gemäß Beisp. 6-1) also, wie in (10.35) angegeben: VF = t: J Ï J = 1,3 11-5: V(6,40 + 7,22) / ( 3 • 2) = 7 ^ 2 7 = 1,51 (und damit das Gleiche wie in Beisp. 6-1) 2.(32,3 - 2 6 4 ) 2

2-5,9*

3 • (593,71)- (32,3 2 + 26,4 2 )

1781,13 -1740,25

=

^62 40,88

(und damit in Ubereinstimmung sowohl mit Beisp. 11-1 als auch gemäß auch A 11-4 - Beisp. 6-1) 11-7: Es ergibt sich (s. auch Berechnungen in Beisp. 11-1): SAQ t : 593,71 - 574,28 = 19,43 SAQ tr : 580,08- 574,28 = 5,80 (12,3 + 6,7) 2 + (8,8 + 9,3) 2 + (11,2 +10,4) 2 :

2

= 577,58 - 574,28 = 3,30 SAQ r : 593,71 - 580,08 - 577,58 + 547,28 = 10,33 und somit folgende Tabelle:

C. Aufgaben-Lösungen

507

Variation

Quadrat- Freiheits- mittleres summe grade Quadrat

F emp F theor (a = 0,05)

Treatments Blöcke Fehler

5,80 3,30 10,33

1 2 2

1,12 0,32

Total

19,43

5

5,80 1,65 5,16

18,5 19,0

(Femp folgt jeweils aus der Division durch die Fehlervarianz - für die Treatments z.B. also: 5 , 8 / 5 , 1 6 ; daraus resultieren auch die Freiheitsgrade für F t h e o r - für die Treatments als 1, 2, für die Blöcke 2,

H

Wiederum zeigen die Ergebnisse, daß keine signifikanten Unterschiede zu erkennen sind: Die Nullhypothese kann weder für die Treatments, die alternativen Werbeprogramme, noch die Gebiete verworfen werden. 11-8:

Es resultiert (s. zu den Berechnungen im einzelnen S. 278f.) folgende Tabelle: Variation

Quadrat- Freiheits- mittleres summe grade Quadrat

Treatments Faktor A 3,64 Faktor Β 6,21 Interaktion 16,22 Fehler 28,11

1 2 2 12

3,64 3,10 8,11 2,34

HÜTTNER 1 9 7 9 ,

F emp F theor (α = 0,05)

1,56 4,75 1,32 3,89 3,47 3,89

Total 54,18 17 (Wiederum ist zur Ermittlung von F e m p jeweils durch das mittlere Quadrat der Fehlervarianz dividiert worden; daraus ergeben sich auch die Freiheitsgrade: 1, 12 und zweimal 2,12.) Die Ergebnisse sind in keinem Falle signifikant. 11-9: Es resultiert (s. zu den Berechnungen im einzelnen S. 280f.) folgendes Tableau:

HÜTTNER

1979,

Anhang

Variation

Quadrat- Freiheits- mittleres summe grade Quadrat

Zeilen (Geschäfte) 0,55 Spalten (Gebiete) 5,76 Treatments 3,75 Fehler 11,31 Total

21,37

F emp F theor (α = 0,05)

2

0,28

0,05

19,00

2 2 2

2,88 1,88 5,66

0,51 0,33

19,00 19,00

8

Wiederum kann also die Nullhypothese nicht verworfen werden: Es ergeben sich signifikante Unterschiede weder zwischen den Gebieten noch den Geschäften oder Treatments. 10: a) SAQj, SP12, SP21 und SAQ 2 sind die Elemente der Matrix C: r

42,08 -0,75] -0,75 20,25_

b) (1) Jedes Element der Matrix C wird durch die Anzahl der Fälle (= 10) dividiert: 4,21 -0,08 S= -0,08 2,02 _ (2) s 1A 2 =

—A m

=^

4

= 2,19 ; analog s l ß 2 = 33,33 / 6 - 5,56. Λ

Die Zusammenfassung zu s^ kann allerdings, wegen der unterschiedlichen Gruppengröße, nicht als einfaches arithmetisches Mittel erfolgen. Vielmehr muß eine Gewichtung mit der Gruppengröße vorgenommen werden, also 4 vs. 6 bzw. 2 und 3: (2,19-2+ 5,56-3)/5 = 4,21. In ähnlicher Weise würden sich die anderen Elemente ergeben; der Weg gemäß a) ist allerdings wesentlich kürzer.

c)

"0,024 0,001" "1,92" 0,001 0,049

0,25

"0,046" 0,014_

wie in Beisp. 11-5

C. Aufgaben-Lösungen

509

11-11: y' B i = 0,046-17+ 0,014·2 = 0,810 y'ß2 y'ß3 y-B4 y'ßs y'ß6

= 0,820 = 0,668

= 0,884 = 0,962 = QJÓR 4,802/6 = 0,800 (wie in Beisp. 11-6)

11-12: a) (1) 1 (2)1 b) (1) 2 (2)2 11-13: Ja. Die Splits würden entsprechend der kumulierten Häufigkeitsverteilung vorgenommen. Ist z.B. die Untergrenze für die Erfassung 18 Jahre, so wäre der 1. Split „18 Jahre" vs. „mehr als 18 Jahre", der 2. „bis 19 Jahre" vs. „mehr als 19 Jahre" usw. 12-1: a) in beiden Fällen die Variablen b) (1) die Personen entweder: getrennt für die einzelnen Produkte (insgesamt also ρ Analysen) oder: für das „Durchschnittsprodukt" (2) die Produkte (gemittelt über die Personen) c) (1) wie b) (1) (2) wie b) (2) d) wie a) 12-2: a) in beiden Fällen die Variablen b) (1) Personen (2) Produkte 12-3: a) in beiden Fällen: zahlenmäßig: Korrelationen der Variablen mit den Faktoren graphisch·. Variable im „Merkmalsraum" b) (1) zahlenmäßig·. Korrelationen der Personen mit den Faktoren graphisch: Personen im „Personenraum" (2) zahlenmäßig·. Korrelationen der Produkte mit den Faktoren graphisch·. Produkte im „Produktenraum"

510

Anhang

12-4: a) (1) Personen im „Merkmalsraum" (2) dto. Produkte b) (1) Variable im „Personenrmm" (2) dto. Produkte 12-5: Ζ ' : η χ m A :η χ η F': η χ m also, gemäß (12.1b): Ζ ' = A F ' (η χ η) (η χ m) = η χ m 12-6: Ζ ' : η χ m Α :η χ r F': r χ m 12-7: R wie auch R"1: η χ η Α: η χ r (s. Α12-6) also: Β = R *Α (η χ η) (η χ r) = η χ r F = ΖΒ (m χ η) (η χ r) = m χ r (s. auch A 12-6) 12-8: falsch 12-9: a) Die geforderte Matrix hat folgende Form: A A Β C D E

-

1 9 2 7

Β

C

D

E

1

9 8

2 3 6

7 10 4 5

-

8 3 10

-

6 4

-

5

-

b) Es handelt sich um eine Matrix der Dzssimilaritäten - weil die einander ähnlichsten Objekte nicht mit dem höchsten, sondern dem niedrigsten Rang bezeichnet werden.

C. Aufgaben-Lösungen

511

12-10: Die sich in diesem Falle ergebende Matrix der Similaritäten hat die nachstehende Form. (Wegen der Symmetrie wird nur die obere Dreiecksmatrix dargestellt.) A A Β C D

B

C

D

E

10

2 3

9 8 5

4 1 7 6

-

-

-

12-11: Die Matrix der Dissimilantäten. 12-12: euklidische Metrik d

AB = V(XA1 - x Bl) 2 + (XA2 " X B2) 2 city block-metric: d

AB = |XA1 - x Bl| + |XA2 ~ XB2¡

12-13: 7(19 - 20)2 + ( 3 - 5 ) 2 = λ!l2 + 2 2 = 2,236. 12-14: a) b)

12-15: a)

V3y

= 4: ABC, ABD, ACD, BCD

V 3J

= 120

4·5·3·2 8

= 15

davon z.B. AB - AC verbunden („conjoint") AB - CD unverbunden („disjoint") b) 990 12-16: a d b+c η also:

= 3 = 3 = _i - 10

512

Anhang

Si = 1

3+3

. J RT = 0,6 ; d

10

,

4

= 1 - si = — = 0,4.

10

1

Vergleicht man s 2 ( = 0 , 4 3 )

cher

mit s^, so zeigt sich doch ein

beträchtli-

Unterschied.

12-17: a

=

4

d = b+c = η = also:

5

Si = 1

Λ

12

4 + 5

12

= 0,75

4 S 2 =

= 0,57

ÍT3

12-18: a)

0,75

0,5

1

0,25

1

1

Si =

0,75

0,75

0,25

0,5

0,5

0

0,25

0,75

0,75

0,5

0,5

1

0,5

1

0,5

0,5

0,5

0,67

0,25

1

0,25

0

0,33

0

1

0,25

0,75

0,75

1

0,33

0,33

1

0,5

_

1

(Quelle: FAHRMEIR/HAMERLE [Hrsg.] 1984, S. 378 und 379.) 12-19: a) Mit C = C1-

42,08

-0,75

-0,75

20,25

folgt:

1

"20,25

42,08 • 20,25 - (-0,75) '

0,75

1 851,56

0,75" 42,08

C. Aufgaben-Lösungen

513

" 0 , 0 2 4

0 , 0 0 1 "

II

= 0,00117

_

0 , 0 0 1

0 , 0 4 9

b) Analog ergibt sich: s-1-

0,238 0,009

0,009 0,494

12-20: a) Gemäß (12.11) folgt: 2 = (xi-x^'S'^xj-x^· Mit [1 2] als Zeilenvektor der Differenzen, gemäß A 12-13, und S"1 aus der vorstehenden Aufgabe resultiert zunächst: 0,009" [1 2] "0,238 = [0,274 0,997]; 0,009 0,494

D

dies multipliziert mit

erbringt 2,268.

b) In ähnlicher Weise ergibt sich, mit der Mittelwert-Differenz d¡ aus Beisp. 11-5: D2= d'CM, also zunächst: [1,92

0,25]

0,024 0,001 0,001 0,049

Das entspricht b¡. multipliziert mit

1,92 0,25

= [0,046

0,014].

folgt 0,092 (und da-

mit das Gleiche wie in Beisp. 11-7). 12-21: a) (1) Zu berechnen ist - s. auch (12.6) -: d

(2)

12 = Z ( * i k - x 2 k ) 2 ( m i * k = 1 und 2)

= - l 2 +12 = 2 Insgesamt ergibt sich (vgl. S. 395):

F A H R M E I R / H A M E R L E

[Hrsg.]

1 9 8 4 ,

514

Anhang

2 0

6,25 13,25 0

1,41 0

9 5 15,25 4 0

13 13 9,25 0

5,39 3 2,24 4,12 3,91 6,73 2 4,47 0 2,83 0

3,61 3,61 3,04 0

2,5 3,64 0

29 17 45,25 20 8 0

(Vgl. F A H R M E I R / H A M E R L E [Hrsg.] 1984, S. 384.) 12-22: Ausgangspunkt ist die Distanzmatrix von A 12-21a), in etwas anderer Schreibweise und für die einzelnen Stufen des Verfahrens mit einem entsprechenden Index versehen: 1 1 2 3 4 5 6

-

2 2

3 6,25 13,25 -

4

5

13 13 9,25

9 5 15,25 4

-

6

-

29 17 45,25 20 8 -

In der 1. Stufe sind die beiden Elemente mit dem geringsten Abstand („nearest neighbour") zu vereinigen, also 1 und 2. Da im nächsten Schritt die Verschmelzung nach dem gleichen Prinzip erfolgt, sind nunmehr die geringsten Entfernungen eines Elements des entstandenen Clusters zu den restlichen Elementen zu berechnen und in eine neue Distanzmatrix einzubringen: für d12)3: d 13 = 6,25; d23 = 13,25; also: 6,25 für d12>4: d 14 = 13 d 24 = 13 13 für d 125 : 5 für d12>6: 17 Damit resultiert:

515

C. Aufgaben-Lösungen

12

D(2) =

12 3 45 6

3

45

6,25 -

6

5 9,25 -

17 45,25 8 -

Der niedrigste Wert der Matrix ist 4; in der 2. Stufe sind also die Elemente 4 und 5 zu vereinigen. Wiederum sind nunmehr die kleinsten Distanzen der beiden Elemente des neuen Clusters zu den übrigen Elementen bzw. Clustern festzustellen und in eine neue Matrix einzubringen: fi»" ¿45,12: min(d 4 i2,d512) = 5 (vs. 13) fürd 45)3 : 9,25 für d 456 : 8 Es resultiert: 12

D(3) =

12 3 45 6

3

45

6,25 -

6

5 9,25 -

17 45,25 8 -

In der 3. Stufe sind - auf dem „Distanz-Niveau" 5 - die beiden Cluster 12 und 45 zu vereinigen. Hierfür ergeben sich folgende kleinste Distanzen (mittels der Ausgangs-Matrix): für d1245)3: min(di3,d23,d43,d53) = 6,25 für d1245i6: 17 und somit die neue Matrix: 1245

D

W

-

1245 3 6

3 6,25

6 8 45,25 -

In der 4. Stufe ist - mit der kleinsten Distanz 6,25 - das Element 3 mit dem Cluster 1245 zu vereinigen. In der 5. und letzten Stufe wird dann noch das Element 6 einbezogen; das Niveau dafür ist unmittelbar aus der letzten Spalte der Ausgangs-Matrix ersichtlich: 8. Damit resultiert das in Darst. 12-6 wiedergegebene Dendrogramm.

516

Anhang

12-23: Mit D ^ wie in L 12-22 als Ausgangs-Matrix ergibt sich in der 1.Stufe kein Unterschied: Da auch hier die Clusterbildung nach den geringsten Abständen in der Matrix erfolgt, werden dabei die Elemente 1 und 2 vereinigt. Danach aber sind für die Aufstellung der neuen Matrix die größten Abstände („farthest neighbour") zu verwenden: fürd 12 3: 13,25 d12;4: 13 di2,5: 9 < W 29 Damit resultiert: 12 3 4 5 6 12 3 4 5

13,25 -

13 9,25

9 15,25 4

-

-

29 45,25 20 8

Auch in der 2. Stufe ergibt sich also kein Unterschied zu Single Linkage: Es werden die Elemente 4 und 5 vereinigt. Daraus folgt: für d 45il2 : max(d4ii2,d5il2): 13 d45>3 15,5 d45,6

20

und somit: 12 3 45 6

12

3

-

13,25

45

-

6

13 29 15,25 45,25 20 -

-

Damit ergibt sich in der 3. Stufe dasselbe Bild: Die beiden Cluster 12 und 45 sind - allerdings jetzt auf einem höheren DistanzNiveau: 13 - zu vereinigen. Dafür sind die größten Distanzen: für d 12453 : 13,25 ¿1245,6: 29 Es resultiert:

C. Aufgaben-Lösungen

517

1245

3

1245 3 6

6

13,25 29 45,25 -

-

Wiederum erfolgt in der 4. Stufe die Vereinigung des Elements 3 mit dem Cluster 1245 und erst in der 5. Stufe auch die Einbeziehung des Elements 6. Die dazugehörigen Distanz-Niveaus sind dabei aber jeweils anders. Diese Unterschiede in den letzten drei Stufen zeigt auch das Dendrogramm gemäß Darst. L-5.

45,25 ι 15,25 13

2

r-^

1

2

4

5

3

Darst. L-5: Dendrogramm (2. Beispiel - nach HAMERLE [Hrsg.] 1984, S. 397)

12-24: richtig 12-25: richtig

6 FAHRMEIR/

518

Anhang

13- 1: Ρ

EI

E2

E3

1 2 3 4 5 6 7 8 9

1 1 1 2 2 2 3 3 3

1 2 3 1 2 3 1 2 3

1 2 2 2 2 1 2 1 2

13- 2: Das vollständige Design würde lauten:

1 1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 3 3

1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3

1 1 1 2 2 2 1 1 1 2 2 2 1 1 1 2 2 2

Vergleicht man damit das unvollständige Design gemäß L 13-1 und verwendet dafür die Symbolik des Lateinischen Quadrats (mit großen lateinischen Buchstaben für die Treatments, arabischen Ziffern für die Zeilen und römischen für die Spalten), so zeigt sich, daß

519

C. Aufgaben-Lösungen

dieses für die „Packmittel" in den Zeilen dem Lateinischen Quadrat lt. Darst. 6-3 entspricht. Die Preise wären dagegen in den Spalten anzuordnen, mit dem niedrigeren in nur einer und dem höheren in zwei: ^"\Preise Packmittel 1 2 3

I

II

II

A Β C

Β C A

C A Β

13-3:

Darst. L-6: konfirmatorisches Faktorenmodell (2. Beispiel) Γθ; -Νο CD

0 0

Ύ\ Ύι Jl-

=

0

Γλ 3 λ4 _0

ο" 0 1

"εΓ



η ι

1+

ε

2

_ 0 _

520

Anhang

14-1: „Fragezeichen": „Stars": „Cows": „Dogs":

(1) (2) (3) (4)

14- 2: 1. Β : — - 0,75 40

3.

C : — = 0,5 40

30 = 0,5 40 + 20

20 40 + 30

30 — = 0,4 70

20 — = 0,25 80

, 0,3

. , „ . Ist - Absatz . Λ _ 4375 . . . 14- 3: 1. — 100 = 100 = 87,5 Soll - Absatz 5000 _ Ist-Marktanteil 10,9 „ . ,. r r 1X 2.———-100 = — ^ = 100 = 87,2 v(Rundungsdifferenz!) b Soll-Marktanteil 12,5 ' Anteil Anteil

am am

gesamten gesamten

Absatzvolumen ^ Marktvolumen

- 87 5

_ 35 ^ 40

14-4:

Gebiet

Aufnahmefähigkeit in Mill. DM in %

A Β C D

VerkaufsSoll

Verkaufs-Ist

Marktanteil

in Mill. DM

in Mill. DM in %

in %

8 6 4 20

40 30 20 10

2,9 2,2 1,4 0,7

2,5 2,4

20

100

7,2

Leistungsindex

Verkaufsdefizit bzw. -dberscbufi

in %

in Mill. DM

1,2

35 331/3 15 16 2/3

31 40 27,5 60

86 109 79 171

-0,4 +0,2 -0,3 +0,5

7.2

100

36

100

0

1,1

Dar st. L-7: regionale Analyse des Marktanteils (2. Beispiel)

C. Aufgaben-Lösungen

521

15-1:

Testverfahren im Produktentwicklungsprozeß Konzepttests

Produkttests*

Verkaufstest

Markttests

Testmarkt

Testmarktsimulation

MiniTestmarkt

* s. auch Darst. 15-1

Darst. L-8: Testverfahren im Produktentwicklungsprozeß

15-2: Nein. Unter Konditionierung versteht man die „Beeinflussung" einer späteren Untersuchung durch die Teilnahme an der jetzigen (der Befragte „lernt" bzw. wird eben "konditioniert"); sie steht besonders beim Panel - als „Panel-Effekt" - zu befürchten. Unter Verschönerungstendenz versteht man die Tendenz der Befragten, ihre Dankbarkeit bzw. ihr Wohlwollen gegenüber dem Veranstalter durch mildere Beurteilung des Produktes zum Ausdruck zu bringen; sie besteht besonders beim „Einzeltest". 16-1: Frühling Jahr 1: Trendbericht 1 (13 000) Herbst: Trendbericht 2 (13 000) Gesamtbericht 1 (26 000 - Trendbericht 1+2) Frühling Jahr 2: Trendbericht 3 Gesamtbericht 2 - Trendbericht 2 + 3) Herbst Trendbericht 4 Gesamtbericht 3 (Trendbericht 3+4)

16-2: Nicht zwingend. Es wurde im Text bereits darauf hingewiesen, daß man das ganze „Recognition"-Verfahren auch als „aided recall" ansehen kann und die Trennung letztlich nur mit bestimmten Spezifika der konkreten Verfahrensausprägung zusammenhängt. (So ist dafür, gemäß dem „Starch-Test", eigentlich typisch, das entsprechende Heft dem Befragten vorzulegen und mit dem Interviewer durchzu-

522

Anhang

gehen - mit der Angabe, was man „bemerkt", „betrachtet" oder „gelesen" hat.) 17-1: Selbstverständlich können - und müssen - Produkttests auch im Rahmen des Investitionsgütermarketings durchgeführt werden. Die Möglichkeiten zum Einsatz dieses Instruments hängen jedoch deutlich von der Art des zu testenden Produktes ab. Zweckmäßig und in der Regel durchführbar sind Produkttests vor allem im Geschäft mit Einzelaggregaten, wobei die zu testenden Aggregate zumeist für einen gewissen Zeitraum an ausgewählte (Test-) Unternehmen ausgeliehen werden. 17-2: falsch 17-3: falsch

D. Glossarium Absatzpotential Als Absatzpotential kann man den in einem bestimmten Markt maximal möglichen eigenen Umsatz bezeichnen. Rechnerisch ergibt es sich aus dem potentiellen Marktanteil, dem höchsten eigenen Anteil am Marktpotential. Absatzvolumen Das Absatzvolumen bezeichnet die Gesamtheit der auf einem bestimmten Markt getätigten eigenen - mengen- oder wertmäßigen - Umsätze. AID-Verfahren Im engeren Sinne steht AID für ein bestimmtes Computer-Programm: „Automatic Interaction Detector". Im weiteren Sinne kann man unter AIDVerfahren (andere - teilweise ebenfalls nur spezielle - Bezeichnungen sind: „Segmentation", „Kontrastgruppenanalyse", „Baum-Analyse", „Tree-Analysis") alle Verfahren zusammenfassen, deren Ziel es ist, aus einer Anzahl von unabhängigen Variablen mittels sukzessiver Aufteilung in jeweils zwei Gruppen diejenigen Kombinationen zu suchen, die in bezug auf eine abhängige Variable optimal - nach einem bestimmten Kriterium - sind. Alternativfrage Sie ist dadurch gekennzeichnet, daß nur zwei Möglichkeiten der Beantwortung - von "weiß nicht", "unentschieden" und dergleichen abgesehen - bestehen. Die einzelnen Formen ("Ja-Nein-Frage", neutrale Fassung, Dialogfrage) unterscheiden sich darin, wie diese Alternative formuliert wird. Antwortzeit: Zeit zwischen Fragestellung (z.B. Auftauchen auf dem Bildschirm) und Antwort (z.B. Eingabe); sie gilt als Indikator für die Sicherheit bzw. Überzeugung eines Antwortenden. arithmetisches Mittel: Summe der Einzelwerte, dividiert durch ihre Anzahl. Augenschein-Validität s. unter Inhalts-Validität Auswahl mit Anordnung Die Elemente werden in bezug auf bestimmte Merkmale sortiert (angeordnet); anschließend erfolgt „systematische Auswahl".

524

Anhang

Auswahl mit Schichtung Die Gesamtmasse wird in - homogenere - Teilmassen zerlegt und eine Zufallsauswahl (mit gleichem oder verschiedenem Auswahlsatz) durchgeführt. Auswahlfehler: Fehler, die durch fehlerhafte Handhabung des Auswahlverfahrens bzw. der Auswahltechnik und falsche Behandlung der Stichprobe entstehen. Auswahlsatz: Verhältnis des Umfangs der Stichprobe (n) zu dem der Grundgesamtheit (N), also: f - nach der englischen Bezeichnung „sampling/raction" - = Autokorrelation Hierunter ist allgemein die Korrelation der Reihenwerte mit sich selbst zu verstehen. In der speziellen Form der Autokorrelation der Residuen deutet dies auf eine Fehlspezifikation des Modells hin. „Baum-Analyse" s. AID Verfahren Befragung Die Auskunftsperson soll durch eine Reihe von Fragen bzw. Stimuli zu verbalen Äußerungen veranlaßt werden. Beobachtung Die Methode der Beobachtung ist dadurch gekennzeichnet, daß der festzustellende Sachverhalt sich nicht aufgrund einer ausdrücklichen Erklärung der Auskunftsperson ergibt, sondern unmittelbar aus dieser selbst bzw. ihrem Verhalten erkennbar wird. Sie ist damit im Prinzip unabhängig von der Auskunftsbereitschaft. Beobachtungs-Effekt Unter "Beobachtungs-Effekt" versteht man die Erscheinung, daß der Beobachtete unter dem Einfluß der Beobachtung sein Verhalten ändert. Bestimmtheitsmaß Das Bestimmtheitsmaß ("Determinationskoeffizient") gibt an - bei Multiplikation mit 100 -, wieviel Prozent der Variation der abhängigen Variablen durch die einbezogene Unabhängige "erklärt" werden. Rechnerisch resultiert es - via Streuungszerlegung - als Verhältnis der erklärten zur totalen Streuung oder auch - auf anderem Wege (und mit der entsprechenden Begrenzung) - als Quadrat des Korrelationskoeffizienten.

D. Glossarium

525

Handelt es sich um mehrere Unabhängige, so spricht man vom multiplen Bestimmtheitsmaß. Bias s. systematischer Fehler Black-Box-Modell s. S-R-Modell Blindtest Ein Produkttest wird als "Blindtest" bezeichnet, wenn eine Neutralisierung der Herstellerangabe erfolgt. CEDAR-Test s. unter Recall- Verfahren Clusteranalyse Im - meist gebrauchten - engeren Sinne wird unter dem heute vorherrschenden Begriff „Clusteranalyse" eine Reihe von Verfahren zusammengefaßt, deren Ziel es ist, die Elemente (oder Variablen) nach dem Grad ihrer Ähnlichkeit in - in sich möglichst homogenen, untereinander möglichst heterogenen - Gruppen oder Klassen, eben "Clustern", zusammenzufassen. Im Vordergrund steht also die Clusterbildung. In einem weiteren Sinne kann auch die Beschreibung der gewonnenen Cluster zur "Clusteranalyse gerechnet werden. Code, Codieren Im allgemeinsten Sinne wird unter einem Code die Vorschrift für die eindeutige Zuordnung eines ersten "Alphabets" (der Zeichen eines Zeichenvorrats) zu einem anderen verstanden. In der Marktforschung speziell bezeichnet man mit Codieren die Zuordnung von Zahlen zu den einzelnen Ausprägungen der Variablen. Codebuch, Codeplan Der Codeplan ist das Schema der Zuordnung von Zahlen zu den einzelnen Antwortkategorien. Entsprechend bezeichnet das Codebook die Zusammenstellung, welchen Merkmalsausprägungen welche Werte zugewiesen wurden und wo diese nach der Datenerfassung zu finden sind (ζ. B. in welcher Datei an welcher Stelle). Conjoint Measurement Der Begriff Conjoint Measurement (oder „Conjoint Analysis") steht für eine Gruppe von Verfahren, deren Ziel es ist, aus über experimentelle Designs empirisch erhobenen Globalbeurteilungen multiattributiver Objekte (zumeist

526

Anhang

Produkte) die speziellen Beiträge der einzelnen Eigenschaften zum Zustandekommen dieser ganzheitlichen Bewertung simultan zu schätzen. Es werden also aus globalen Urteilsdaten die Parameter eines Urteilsmodelles abgeleitet. Die klassische Anwendung des Conjoint Measurement stellt auf die Auswertung empirisch gewonnener Rangordnungen zur Bestimmung metrischer Urteilsbeiträge für die einzelnen Objektmerkmale ab. Copy-Test Im weitesten Sinne können unter "Copy-Testing" - im Hinblick auf die "CopyStrategie - alle Verfahren zur Prüfung eines Werbemittelenrwwí/j verstanden werden. Etwas enger bezeichnet man auch nur die Prüfung eines gedruckten Abzugs - im Unterschied zu der des noch nicht gedruckten Layouts etc. - als Copy-Test. Im ursprünglichen Sinne handelt es sich dabei um die Prüfung der Beachtung von Anzeigen bzw. redaktionellen Beiträgen in Zeitschriften oder Zeitungen (etwa in der Art des Wiedererkennungsverfahrens). DAR-Test s. unterRecall-Verfahren Datenanalyse(programm)system Unter einem Datenanalysesystem versteht man ein Programmsystem, das neben Routinen zur Ein- und Ausgabe sowie Manipulation der Daten solche für die wichtigsten Analysemethoden enthält. Datenmatrix Unter einer Matrix allgemein versteht man ein rechteckiges, aus Zeilen und Spalten bestehendes Schema. Dementsprechend enthält die Datenmatrix in der einen Dimension - meist den Spalten - die Variablen, in der anderen - meist den Zeilen - die Elemente (oder „Fälle" - Cases). Determinationskoeffizient s. Bestimmtheitsmaß Diskriminanzanalyse Bei der Diskriminanzanalyse handelt es sich um ein statistisches Verfahren, bei dem die Werte der unabhängigen Variablen gewonnen werden sollen, die am besten zwischen zwei oder mehr Gruppen separieren. Diskriminanz-Validität s. unter Konstrukt-Validität

D. Glossarium

527

Dummy-Testing s. unterRecognition-Verfahren Erinnerungsverfahren s. Recall-Verfahren Experiment Im allgemeinsten Sinne läßt sich das Experiment auffassen als ein Prozeß, in dem eine oder mehrere unabhängige Variable variiert oder kontrolliert und die Wirkungen auf die abhängigen Variable(n) studiert werden. Im engeren ("klassischen") Sinne geht es dabei nur die Auswirkung der Variation einer Größe auf eine andere (unter Konstanthaltung aller übrigen). Bei erweiterten Experimenten werden dagegen verschiedene Varianten eines Faktors oder mehrerer Faktoren getestet. Experten-Validität s. unter Inhalts-Validität Faktorenanalyse Bei der Faktorenanalyse handelt es sich um ein(e Gruppe von) Verfahren mit dem Ziel, auf der Basis der Korrelation zwischen den angegebenen ("manifesten") Größen dahinterstehende "latente" Größen, eben die "Faktoren", zu ermitteln. Dabei können verschiedene Modelle und (Extraktions-)Afeí¿oí/en unterschieden werden. Deren Zweckmäßigkeit und Bedeutung sind z. T. stark umstritten; dies wirkt sich bis in die - unterschiedliche Terminologie aus. Hier wird die Verwendung der Hauptkomponentenmethode dann als "faktorenanalytischesModell" betrachtet, wenn sie zu einer geringeren Zahl von Faktoren als ursprünglichen Größen, mit anschließender "Rotation", führt. Flächenauswahl Das Gesamtgebiet wird in Flächen zerlegt, wovon einzelne "per Zufall" ausgewählt werden. Innerhalb dieser sind dann sämtliche Elemente zu erheben. Folder-Test s. unter Recognition- Verfahren Foto-Zuordnungstest s. Personen-Zuordnungstest Freiheitsgrade: Anzahl der frei verfügbaren Beobachtungen (Stichprobenumfang abzüglich der aus der Stichprobe geschätzten Parameter).

528

Anhang

geschichtete Stichproben s. Auswahl mit Schichtung geschlossene Frage Sie ist dadurch gekennzeichnet, daß die Antwortmöglichkeiten dem Befragten vorgegeben sind. Gruppendiskussionsverfahren (Gruppeninterview) Eine - meist kleinere - Gruppe von Personen wird gebeten, unter der Leitung eines "Moderators" über ein bestimmtes Thema zu diskutieren. Halo-Effekt Im verhaltenswissenschaftlichen Kontext versteht man hierunter allgemein die Übertragung hinsichtlich eines bestimmten Objektes erfolgter Wahrnehmungen bzw. Beurteilungen auf andere, also die Ausstrahlung bzw. den Nachhall der Informationsverarbeitung bezüglich bestimmter Gegenstände auf andere. Dies kann sich etwa als Übertragung eines globalen Eindruckes von einem Produkt auf einzelne Erzeugnismerkmale oder als Ausstrahlung des Images eines Produktes einer bestimmten Firma auf andere Bestandteile ihres Angebotsprogrammes niederschlagen. Im speziellen Zusammenhang der Marktforschung verwendet man diesen Begriff dann, wenn ein bestimmter Erhebungsinhalt, ein bestimmtes Thema, ein bestimmtes Item, eine bestimmte Frage etc. auf das/die nächste(n) ausstrahlt. Häufigkeitsanalyse, Häufigkeitsverteilung: Auszählung der verschiedenen Ausprägungen eines Merkmals der Untersuchungsgesamtheit. Hauptkomponentenanalyse s. Faktorenanalyse Haushaltsstichprobe Hierbei sind Haushalte die Auswahleinheit. Daraus wird „uneingeschränkte Zufallsauswahl" vorgenommen. Personen in kleineren Haushalten sind also „überrepräsentiert". Impact-Test s. unter Recall- Verfahren Inhalts-Validität Hierbei geht es darum, inwieweit die Meßinstrumente inhaltlich, d.h. sachlich und logisch, geeignet sind. Dies kann entweder einfach durch eine Art "Plausi-

D. Glossarium

529

¿zY¿í¿í5-Prüfung" geschehen (Augenschein- oder "Face-"Validität) oder, etwas strenger, mittels der Beurteilung durch Experten (£x/>erten-Validität). Interne-Konsistenz-Reliabilität "Internal Consistence" (oder "Interitem Consistency") wird nachgewiesen durch die Korrelation zwischen Teilen eines Meßinstruments; geprüft wird also die Einheitlichkeit eines - z.B. in zwei Hälften - geteilten Instruments (etwa einer Skala). Intervallskala Die Messung erfolgt in konstanten Einheiten (allerdings ohne festen Nullpunkt). Interviewereinfluß (Interviewer-Bias) Im engeren Sinne versteht man hierunter die Gefahr, daß der Interviewer völlig unbewußt, allein durch sein Auftreten, sein Aussehen usw., Gefälligkeits- oder Prestige-Antworten etc. hervorruft. Im weiteren Sinne zählen hierzu auch unsachgemäße oder völlig falsche Aufzeichnungen bzw. Einstufungen von Antworten. Item Formal ist ein "Item" ein Element, ein einzelner Punkt oder Posten, meist enger - einer Skala, aber auch - weiter - eines ganzen Fragebogens etc. Inhaltlich kann es sich dabei etwa um eine Frage eines Fragebogens oder eine Aussage bzw. Behauptung ( = "Statement") handeln. Insofern können die Ausdrücke"Item"- oder "Statement-Batterie" synonym gebraucht werden. Ja-Nein-Frage Bei der einfachen Ja-Nein-Frage hat der Befragte nur die Möglichkeit, mit "ja" oder "nein" - von "weiß nicht", "unentschieden" und dergleichen abgesehen zu antworten. Die neutrale Fassung soll vermeiden, daß durch die Nennung nur einer Alternative diese bevorzugt wird; die andere Antwortmöglichkeit ist also ebenfalls aufzuführen. Kanonische Analyse Die Kanonische Analyse (oder Kanonische Korrelation) ist ein statistisches Verfahren, das dazu dient, aus zwei Sätzen von - metrisch skalierten - Variablen "Faktoren" (Kanonische Variaten) in der Weise zu extrahieren, daß die jeweiligen Linearkombinationen, d. h. die Summen der Produkte aus den Koeffizienten der Kanonischen Variaten und den Variablenwerten, maximal miteinander korreliert sind.

530

Anhang

Klumpenauswahl Die Gesamtmasse wird in - im Prinzip: regionale - Teilmassen ("Klumpen") zerlegt, aus denen "per Zufall" einzelne ausgewählt werden. Innerhalb dieser sind dann sämtliche Elemente zu erheben. Kohortenanalyse Unter Kohortenanalyse kann man ganz allgemein das Verfolgen einer Personengesamtheit im Zeitablauf verstehen. Abgestellt wird dabei meist auf Geburtskohorten, also Gesamtheiten, bei denen das eine Kohorte definierende gleiche Ereignis innerhalb des gleichen Zeitraums das Geborenwerden ist ("Generation" von Gleichaltrigen). Konkurrent-Validität s. unter Kriteriums-Valilität Konstantsummenskala: Eine bestimmte Anzahl von Produkten oder ein bestimmter Geldbetrag soll auf mehrere Stimuli (z.B. Produkt-Marken) verteilt werden. Konstrukt-Validität Als Konstrukt-Validität kann man das Ausmaß der Beziehungen zwischen einem theoretischen Konstrukt und dem Konzept seiner empirischen Messung bezeichnen Diese Beziehung kann in zweifacher Hinsicht erfaßt werden: einerseits als der Grad, in dem die Meßkonzeption in Richtung des Konstruktes "konvergiert" (Konvergenz-Validität), zum zweiten - umgekehrt - als der Grad, in dem andere Konstrukte bei der Messung ausgeschlossen sind (DiskriminanzValiditätj. S. auch MM-Matrix, Kontingenzanalyse "Kreuztabellen" bezeichnet man bei nominalskalierten Variablen auch als Kontingenztabellen oder -tafeln. In diesem Falle handelt es sich um "ZweiWege-Tafeln", mit je einer Variablen als "Eingang" und "Ausgang". Sie können auch quadratisch sein (d. h., die gleiche Anzahl von Ausprägungen haben); im Grenzfall - bei nur 2 Ausprägungen - bilden sie eine Vierfeldertafel. Mittels der "Besetzungszahlen" der einzelnen Tabellenfelder kann man eine Maßzahl "Chi-Quadrat" (Chi-Quadrat-Statistik) berechnen und damit einen Test durchführen ("Chi-Quadrat-Test"; man spricht auch von "Chi-QuadratAnalyse). Aus dieser Maßzahl lassen sich Kontingenzmaße ableiten, die (mehr oder weniger) "normiert" sind und ähnlich dem Korrelationskoeffizienten etwas über den "Zusammenhang" aussagen; sie können auch auf andere Weise als über Chi-Quadrat - berechnet werden.

D. Glossarium

531

Kontrastgruppenanalyse s. AID-Verfahren Konvergenz-Validität s. unterKonstrukt-Validität Konzepttest Der Konzepttest dient, in einer frühen Phase des (Neu)-Produktentwicklungsprozesses, der Bewertung und Aussonderung von Produktideen. Korrelationskoeffizient Der Korrelationskoeffizient ist ein Maß des - linearen - Zusammenhangs zwischen zwei Variablen. Sind diese metrisch, so kann der Bravais-Pearson'sehe "Maßkorrelationskoeffizient" berechnet werden (und zwar als Verhältnis der Kovarianz zu dem Produkt der beiden Standardabweichungen). Er liegt zwischen 0 und ±. 1: 0 bedeutet fehlende, +1 stark positive und -1 stark negative Korrelation; der Koeffizient gibt damit sowohl Richtung als auch Ausmaß des Zusammenhangs an. Korrelationsmatrix Bei der Korrelationsmatrix handelt es sich um eine quadratische Matrix, mit gleicher Anzahl von Zeilen und Spalten. Die Elemente der Matrix sind Korrelationskoeffizienten, zwischen - meist - Variablen. Demgemäß steht in der Hauptdiagonalen - normalerweise - jeweils 1; die Elemente oberhalb dieser (obere Dreiecksmatrix) sind spiegelbildlich identisch mit denen unterhalb derselben (untere Dreieckmatrix). Es handelt sich also zugleich um eine symmetrische Matrix. Korrespondenzanalyse Im allgemeinsten Sinne kann als Ziel der Korrespondenzanalyse die Untersuchung der Zusammenhangsstruktur zwischen in der Regel «owzzrad/skalierten Variablen und deren graphische Darstellung in einem möglichst niedrig dimensionierten - metrischen - Raum angesehen werden. Bei mehr als zwei Variablen spricht man von multipler Korrespondenzanalyse. Praktisch werden zumeist allerdings nur ÄVewztabellen - des Umfangs r . s - untersucht („hivariate Korrespondenzanalyse"). Kovarianz: Summe der Produkte der Abweichungen zwischen jeweiligem Einzelwert und Mittelwert bei den Reihen χ und y, dividiert durch die Anzahl der Werte. Diese Maßzahl mißt damit die gemeinsame Variation zweier Variablen (ähnlich dem Korrelationskoeffizienten - aber nicht, wie dieser, normiert.)

532

Anhang

Kovarianzstrukturanalyse Die Kovarianzstrukturanalyse kann als "ein Verfahren zur simultanen Analyse komplexen Zusammenhangsstrukturen zwischen beobachtbaren (manifesten) Variablen und nicht beobachtbaren (latenten) Variablen" (Baiderjahn) bezeichnet werden. Kreuztabulierung, Kreuzauswertung: Auszählung der Ausprägungen eines Merkmals gegen die eines anderen. Kriteriums-Validität Diese Validierung an einem empirischen Kriterium kann in zwei Formen auftreten. Bei der Prognose- oder Vorhersage-Validität wird auf die Ubereinstimmung mit einer zeitlich später erfolgenden Messung abgestellt. Werden dagegen Messungen zum gleichen Zeitpunkt verglichen, so spricht man auch von KonkurrentValidität. Labor-Testmarkt s. Testmarkt-Simulation Ladentest Der Laden- oder Store-Test ist die - meist verwandte - spezielle Form des Verkaufstests, bei der der probeweise Verkauf in ausgewählten Läden erfolgt. Längsschnittanalyse: Messungen an den gleichen Elementen zu verschiedenen Zeitpunkten. Leitstudie Unter einer Leitstudie versteht man die formlose Untersuchung im "vorstatistischen Bereich" (Auswertung von Sekundärmaterial, einzelne Befragungen usw.) zur Klärung des Marktforschungs-Problems und Feststellung der einzelnen Aufgaben im Rahmen dieses Problems. Likert-Skala Der Befragte hat für eine "Statement-Batterie" - für jedes einzelne in der Regel auf einer 5stufigen Rating-Skala (von -2 bis +2) - den Grad seiner Zustimmung bzw. Ablehnung anzugeben; die Punkte für die einzelnen Statements kann man anschließend zu einem Gesamtwert aufsummieren. Magnitude-Skalierung: Angabe der Reaktion auf einen Reiz in einem "Reaktionskontinuum" mittels verschiedener "Modalitäten" (Helligkeit, numerisch, graphisch, Lautstärke usw.).

D. Glossarium

533

Marktanteil Der Marktanteil ist das prozentuale Verhältnis der auf einem bestimmten Markt getätigten eigenen - mengen- oder wertmäßigen - Umsätze zur Gesamtheit aller (eigenen und fremden) entsprechenden Umsätze, also der Anteil des Absatzvolumens am Marktvolumen. Als "relativer Marktanteil" wird die Bezugnahme des eigenen Marktanteils auf den des stärksten Konkurrenten (oder die Summe der Anteile mehrerer Wettbewerber) bezeichnet. Marktforschung Marktforschung ist der systematische Prozeß der Gewinnung und Analyse von Daten für Marketing-Entscheidungen. Marktkapazität Unter Marktkapazität kann die rein von der Bedarfsseite her, ohne Berücksichtigung der Kaufkraft, gegebene Aufnahmefähigkeit des Marktes verstanden werden. Marktpotential Das Marktpotential bezeichnet die unter Berücksichtigung der Kaufkraft gegebene Aufnahmefähigkeit des Marktes, also die mögliche Nachfrage. Markttest Unter "Markttest" werden alle die Formen zusammengefaßt, die nach der Entwicklung des Produkts (und seiner Prüfung bei ausgewählten Personen mittels des "Produkttests"), aber vor der vollen Markteinführung liegen. Sie umfassen also den probeweisen Verkauf des Produkts mittels "Ladentest" (als spezieller Form des "Verkaufstests"), simulierte und reale Testmärkte sowie Mini-Testmarktverfahren. Marktvolumen Das Marktvolumen bezeichnet die Gesamtheit der getätigten - mengen- oder wertmäßigen - Umsätze auf einem (konkreten, d. h. abgegrenzten) Markt, also die tatsächliche Nachfrage (bei den gegebenen Preisen). Median (Zentralwert): mittlerer in der Reihe der nach der Größe geordneten Werte. Mehrfach-Auswahl-Frage Bei dieser Fragenart hat der Befragte die Auswahl zwischen mehreren Antwortmöglichkeiten. Dabei kann die Anzahl der Nennungen begrenzt oder unbegrenzt sein, letzteres in bestimmter oder in unbestimmter Weise (nach

534

Anhang

oben oder nach unten). "Mehrfachnennungen" sind nur bei Begrenzung auf genau 1 Antwort ausgeschlossen. mehrphasige Auswahl Mehrere Zufallsauswahlen werden hintereinandergeschaltet, wobei die Auswahleinheit gleich bleibt. Es handelt sich bei den späteren Phasen also jeweils um eine Unterstichprobe aus der vorhergegangenen Stichprobe. mehrstufige Auswahl Es werden mehrere Zufallsauswahlen hintereinandergeschaltet, wobei auf jeder Stufe die Auswahleinheit wechselt. Mehr-Themen-Umfrage s. Omnibusbefragung Messung Als Messung kann man die - nach bestimmten Regeln vorzunehmende Zuordnung von Symbolen (Zahlen oder Zeichen) zu Objekten bezeichnen. Meta-Analyse Man versteht hierunter die statistische Analyse der Befunde vieler einzelner Studien (im Sinne von „integrative research", des Versuchs der Generalisierung). Mini-Testmarktverfahren Verfahren des „Mini-Testmarktes" sind charakterisiert durch die Tendenz zum „voll-elektronischen" Testmarkt: Neben die strenge regionale (auf eng umrissenem Gebiet) oder sachliche Abgrenzung (nur wenige große Geschäfte), im Zusammenhang evtl. mit isolierter Umwerbung, tritt die Verbindung von Haushalts- und Verbraucher-Panel, via „Scanning" und Kunden-Identifikationskarte. mittlere quadratische Abweichung s. Standardabweichung MM-Matrix Eine MM-Matrix ("multitrait-multimethod matrix" oder "MultimerkmalsMultimethoden-Matrix") dient zur Messung der Konstrukt-Validität: verschiedene Konstrukte ("traits" oder Merkmale) werden mit unterschiedlichen Methoden gemessen. Für jedes Konstrukt müssen also mindestens zwei Messungen erfolgen. Durch Auswertung der Korrelation zwischen den Elementen können Aussagen über die Konvergenz- und Diskriminanz-Validität gewonnen werden. (S. CAMPBELL/FISKE 1 9 5 3 ) .

D. Glossarium

535

Modus oder "dichtes Mittel": häufigster Wert. Multidimensionale Skalierung Unter multi- (oder mehrdimensionaler Skalierung versteht man eine Reihe von Verfahren, die aufgrund der - wahrgenommenen oder beurteilten - Relationen zischen den Objekten diese, unter Einschluß eventuell auch der individuellen Präferenzen bzw. von "Idealobjekten", in einem Raum möglichst geringer Dimensionalität zu "positionieren" versuchen. Multikollinearität Hierunter ist zu verstehen, daß die Interkorrelation der unabhängigen Variablen einer Regressionsanalyse vergleichsweise hoch ist. Dadurch ergeben sich rechentechnische Probleme und Verzerrungen der Regressionskoeffizienten. Zur Lösung dieses Problems sind verschiedene Vorschläge gemacht worden (Zusammenfassung der hoch korrelierten Variablen bzw. Faktorenanalyse oder - umgekehrt - Weglassen bis auf eine usw.). multiple Regression s. Regressionsanalyse multipler Determinationskoeffizient s. unter Bestimmtheitsmaß multipler Korrelationskoeffizient Während der "einfache" (bivariate) Korrelationskoeffizient Ausmaß und Richtung des Zusammenhangs zwischen zwei Variablen (schlechthin, d. h. ohne Klassifizierung als "Abhängige" oder "Unabhängige") angibt, mißt der "multiple" Korrelationskoeffizient nur die Stärke der Beziehung zwischen einer abhängigen und mehreren unabhängigen Variablen (und liegt demgemäß zwischen 0 und 1). multiples Bestimmtheitsmaß s. unter Bestimmtheitsmaß Nominalskala Es erfolgt lediglich eine Klassifizierung, d.h. Zuordnung von Kategorien bzw. Attributen (z.B. "ja/nein"; verheiratet). offene Frage Sie ist dadurch gekennzeichnet, daß der Auskunftsperson die Formulierung der Antworten überlassen wird.

536

Anhang

Ordinalskala Es erfolgt lediglich die Zuweisung von Rangziffern; sie ermöglicht eine "Anordnung" (allerdings ohne Definition der Intervalle). Paarvergleich Beim Paarvergleich werden einzelne Stimulus-Paare (oder auch "Paare von Paaren") beurteilt; damit wird, bei hinreichend großer Anzahl, die Transformation in Intervallskalen-Niveau möglich. Panel Unter einem Panel versteht man einen bestimmten, gleichbleibenden, repräsentativen Kreis von Auskunftspersonen, der über einen längeren Zeitraum hinweg fortlaufend oder in gewissen Abständen über im Prinzip den gleichen Gegenstand befragt wird. Panel-Effekt Unter "Panel-Effekt" versteht man die Erscheinung, daß die Teilnehmer mehr oder weniger unbewußt unter dem Einfluß der Teilnahme am Panel ihr Verhalten ändern. Parallel-Test-Reliabilität Hierbei erfolgt die Vergleichsmessung bei einem zweiten - äquivalenten - Meßinstrument zum gleichen Zeitpunkt. Personenstichprobe Hierbei erhalten Personen die gleiche Auswahlwahrscheinlichkeit. Dies kann rechnerisch, durch "Umgewichtung" aus der Haushaltsstichprobe, ober auch direkt dadurch geschehen, daß Personen die Auswahleinheit bilden. Personen-Zuordnungstest Dem Befragten werden Abbildungen oder Beschreibungen von Personen vorgegeben mit der Bitte, den Verwender bzw. Käufer eines bestimmten Produkts diesen zuzuordnen. Polaritätsprofil s. Semantisches Differential Portfolio-Test s. unterRecognition-Verfahren Preistest Beim Preistest handelt es sich dann um eine spezielle Form des Produkttests (im weiteren Sinne), wenn - wie meist in der Praxis - das Testen des Preises

D. Glossarium

537

zusammen mit der Vorlage des Produktes (oder Abbildungen usw. davon) erfolgt. Pretest (des Fragebogens) s. Probebefragung Primärforschung Das Material wird eigens für den Zweck der Untersuchung erhoben. Probebefragung Die Probebefragung dient der Kontrolle der Brauchbarkeit des Fragebogens. Sie ist ein Test auf dessen Verwendbarkeit und wird deshalb oft auch als (Fragebogen-)Pretest bezeichnet. Produkttest Der Begriff des Produkttests ist sehr vielschichtig und erlaubt die Unterteilung in verschiedene Arten (nach diversen Kriterien). Das Verbindende ist, daß er nach der Entwicklung des Produkts - eventuell mehrerer Varianten davon -, aber vor der auch nur probeweisen Markteinführung erfolgt: Das Produkt wird, im Original oder Proben davon usw., ausgewählten Konsumenten zur Beurteilung vorgelegt. Prognose-Validität ("Vorhersage-Validität") s. unter Kriteriums-Validität projektive Verfahren Man versteht hierunter psychologische Tests, die so angelegt sind, daß die Reaktion der Versuchsperson auf die vorgegebenen Reize ihre eigenen Einstellungen usw. erkennen läßt, ohne daß sie sich dessen bewußt ist. Quartilsabstand: Differenz zwischen oberen Quartil (bei 75% der Werte) und unterem (25%). Der Quartilsabstand umfaßt somit die "mittleren" 50% der Werte. Quasi-Experiment Im engeren Sinne ist das Quasi-Experiment allein durch das Fehlen der Randomisierung gekennzeichnet. Im weiteren Sinne gehört das Fehlen einer vollständigen Kontrolle überhaupt dazu (z.B. hinsichtlich der Experimental-Faktoren und von Kontrollgruppen). Querschnittanalyse: Messungen an verschiedenen Elementen zum gleichen Zeitpunkt.

538

Anhang

Quotenauswahl Das Quotenverfahren besteht darin, daß entsprechend der - aus Volkszählungen usw. - bekannten Struktur der Grundgesamtheit "Quoten" hinsichtlich einiger Merkmale (meist: Geschlecht, Alter, Beruf, Gemeindegrößenklasse) gegeben werden. Innerhalb der Quoten (Beispiel: von 10 Interviews müssen 5 auf weibliche Personen entfallen) hat der Interviewer völlig freie H a n d bei der Auswahl der Befragten. Randomisierung Unter Randomisierung kann man allgemein eine "Zufallsauswahl" verstehen bei der Stichproben-Ziehung generell in dem Sinne, daß diese "repräsentativ" für die Grundgesamtheit steht. Bei Experimenten speziell bedeutet dies, daß die untersuchten Gruppen jeweils "Zufalls-Stichproben" und damit untereinander vergleichbar sind. In etwas anderer Betrachtungsweise stellt sich dies dar als die zufällige Verteilung der Test-Elemente auf die verschiedenen Treatments. Randomized Response-Technik (RRT oder RRM - M für „Modell") Mit der Technik des „Randomized Response" wird versucht, Verzerrungen durch Verweigerung oder bewußt falsches Antworten dadurch entgegenzuwirken, daß - dem Interviewer verborgen bleibende - Zufallsmechanismen die A n t w o r t des Befragten steuern und damit seine Anonymität gewährleisten. Im Laufe der Zeit haben sich zahlreiche Varianten entwickelt. Random Route Es besteht darin, daß dem Interviewer in einer bestimmten Gemeinde eine „Startadresse" angegeben wird und von da aus in vorgeschriebener Gehrichtung jeder i-te Haushalt auszuwählen ist. Ranking: durch Anordnung mehrerer Stimuli gebildete

Rangordnung.

Rating-Skala Einordnungs-Skala ("Schätzskala"): Der Befragte hat - verbal, numerisch oder graphisch - seine Position in einem Kontinuum oder einer Anzahl von Kategorien anzugeben. Je nach Ausgestaltung (und auch Verankerung) ist das Meßniveau nominal, ordinal oder "metrisch". Ratioskala s. Verhältnisskala Recall-Verfahren Beim "Recall"- oder "Erinnerungsverfahren" unterscheidet man zwischen "pure" oder "unaided" und "aided recall": Beim unaided Recall ("Verfahren der

D. Glossarium

539

reinen Gedächtniskontrolle) ist die Auskunftsperson allein auf ihr Gedächtnis angewiesen; dagegen werden beim aided Recall Gedächtnishilfen gegeben. Der sog. Impact-Test erhielt seinen Namen durch die von Gallup herausgegebene Testzeitschrift "Impact", eine Zeitschrift, die lediglich zum Zwecke der Prüfung von Anzeigenentwürfen hergestellt wurde. Einige Zeit nach der Verteilung erfolgte die Ermittlung der Erinnerung an die einzelnen Anzeigen. Eine andere Variante bildet der T>AR-Test. Dieser "Day After Recall"-Test (weitere Version: SDR-Test - Same Day Recall) ist dadurch gekennzeichnet, daß am Tage nach Erscheinen oder Ausstrahlung per Telefon festgestellt wird, wer sich an diese Werbung erinnert. Eine besondere Variante stellt der CEDAR-Test (Controlled Exposure Day After Recall) dar: "Die Zielpersonen werden in das Institut eingeladen, und es wird mit ihnen ein Scheininterview durchgeführt (Durchführung eines Produkttests). Zur gleichen Zeit wird ein Fernsehspot mit Werbespots ausgestrahlt. Einen Tag später werden ... per Telefon Recallwerte ermittelt." (REHORN 1987.)

Recognition-Verfahren Das "Recognition-" oder "Wiedererkennungsverfahren" besteht in seiner einfachen - "unkontrollierten" - Form darin, daß den Auskunftspersonen nacheinander Werbemittel (in der Regel in den großen Zeitungen und Zeitschriften erschienene Anzeigen) vorgelegt werden und sie angeben sollen, ob sie das Material bereits gesehen haben. Da diese Nennungen aus den verschiedensten Gründen (Verwechslungen, Prestigegründe usw.) unrichtig sein können, wird daneben auch das kontrollierte Wiedererkennungsverfahren angewandt. Die Angaben der Auskunftspersonen werden dabei in irgendeiner Weise kontrolliert. Meist geschieht das durch die Aufnahme erfundener bzw. noch nicht erschienener Anzeigen in die Vorlage. Man bezeichnet eine solche künstliche Zeitschrift, in die die zu testenden Original· und "Falsch"-Anzeigen sowie gegebenenfalls entsprechende redaktionelle Beiträge eingebunden wurden, als "Folder" und spricht auch von Folder- oder Portfolio-Test. Der Ausdruck Dummy-Testing wird ebenfalls benutzt. Das Verfahren erfuhr seine konkrete Ausprägung vor allem durch Starch. Der Starch-Test besteht darin, daß dem Befragten das entsprechende Heft (Original oder Folder) vorgelegt wird und dieser es zusammen mit dem Interviewer durchgeht und jeweils angibt, was er "bemerkt", "betrachtet" oder "gelesen" hat. Regressionsanalyse Die Regressionsanalyse ist ein statistisches Verfahren, bei dem eine "abhängige" Variable auf eine oder mehrere "unabhängige" bezogen wird. (Im letzteren Falle spricht man auch von multipler, im ersteren von Einfach-Regression.) Handelt es sich dabei um eine lineare (Einfach-)Regression, so wird die Bezie-

540

Anhang

hung zwischen den Variablen y und χ durch eine Gerade ausgedrückt. Die beiden Parameter der linearen Regressionsfunktion, die Regressionskonstante und der Regressionskoeffizient, werden zumeist nach der Methode der kleinsten Quadrate gewonnen; sie fordert, daß die Summe der quadrierten Abstände zwischen den Beobachtungswerten und den Schätzwerten ein Minimum wird. Reliabilität Ein Meßinstrument ist reliabel oder "zuverlässig", wenn es bei wiederholten Messungen das gleiche Ergebnis erbringt. Realibilität liegt also in dem Maße vor, in dem die Messungen frei von "Zufallsfehlern" sind. Research Design: die grundsätzliche Anlage von Untersuchungen, maßgeblich für die Art und Weise der Datengewinnung und Datenanalyse. Satzergänzungstest: Ergänzung eines bereits begonnenen Satzes, oft in graphischer Form und meist als projektives Verfahren, indem der Befragte für eine (abgebildete bzw. angegebene) "dritte Person" zu antworten hat. Scanning Ein "Scanner" ist ein elektronisch-optisches Lesegerät (z.B: zur Erfassung von in Strich- bzw. Balkencodes auf der Verpackung angebrachten Artikelnummern. Schätzskala s. Rating-Skala Schichtenverfahren s. Auswahl mit Schichtung Schneeballverfahren Es besteht darin, daß man im Rahmen einer allgemeinen Umfrage auf eine Person mit den benötigten Merkmalen stößt, von dieser sich dann wiederum Adressen, die den gleichen Tatbestand erfüllen, erbittet und so fort. Schwerin-Test Eine - möglichst "repräsentative" ~ Gruppe von Personen wird in ein Studiotheater (deshalb auch "Theater-Test") eingeladen. Vor Beginn der Filmvorführung werden die Leute gebeten, aus einer Liste von konkurrierenden Produkten die auszuwählen, die sie bei einer Verlosung gern gewinnen möchten; nach der Vorführung ist wiederum zu wählen, und die Ergebnisse werden verglichen, somit die Veränderungen der Präferenzen festgestellt.

D. Glossarium

541

Der Test gehört damit zur Gruppe der "pre-/post-choice-Verfahren" (und innerhalb dieser zu den "Lotterie-Methoden"). Er rechnet zudem zum "forced exposure-Vorgehen". Im Gegensatz dazu wissen bei On-Air-Tests die Testpersonen beim Zuschauen noch nicht, daß sie später darüber befragt werden. "Segmentation" s. AID- Verfahren Sekundärforschung Anderweitig bereits vorhandenes Material wird für Zwecke der Marktforschung ausgewertet. Semantisches Differential Der Befragte hat für eine Serie von Gegensatzpaaren (Polaritäten) für jedes einzelne auf einer zumeist 7stufigen Skala anzugeben, wie er einen Meinungsgegenstand (etwa ein Produkt) einordnet. Die anschließende Auswertung kann rein graphisch oder auch - in vielfältiger Weise - numerisch erfolgen. Spannweite: Differenz zwischen größtem und kleinsten Einzelwert. S-O-R-Modell (Stimulus-Organism-Response-Modell) Als S-O-R-Modelle bezeichnet man solche Abbildungen des menschlichen Verhaltens, bei denen versucht wird, die zu Verhaltensreaktionen führenden Vorgänge innerhalb des Organismus zu beleuchten. Zur Erklärung beobachtbarer Reaktionen von Individuen auf beobachtbare Stimuli werden insofern nicht beobachtbare - intraindividuelle Einflußfaktoren herangezogen, die als sog. intervenierende Variablen operationalisiert werden. In Entgegensetzung zum Black-Box-Ansatz der S-R-Modelle kennzeichnet man S-O-R-Modelle auch als echte Verhaltensmodelle. S-R-Modelle (Stimuhis-Response-Modelle) Als S-R-Modelle werden solche Abbildungen menschlichen Verhaltens bezeichnet, bei denen Verhaltensreaktionen allein als Abhängige beobachtbarer Stimuli erklärt werden. Die intraindivuellen Prozesse im Organismus bleiben dabei unberücksichtigt, weil sie nicht beobachtbar sind. Sie werden als innerhalb einer sog. „Black-Box" verborgen betrachtet. Aus diesem Grunde spricht man hier auch von Black-Box-Modellen. Standardabweichung: Streuungsmaß; Wurzel aus der Varianz, s. dazu die Formeln (3.2) und (3.8).

542

Anhang

Standardfehler Hiermit wird die Standardabweichung der Stichprobenverteilung der .jeweiligen Maßzahl bezeichnet. S. etwa zum Standardfehler des arithmetischen Mittels in Kap. 3, zu dem des Regressionskoeffizienten in Kap. 10. Stapel-Skala 10-Punkte-Skala, von -5 bis +5, die - als nichtverbale Ratingskala - zur Messung der Intensität von subjektivem Verhalten dient. Starch-Test s. unterRecognition-Verfabren Statement s. unter Item Stichprobenfehler Im engeren Sinne handelt es sich hierbei um die "Zufallsfehler i.e.S.", also die Fehler, die dadurch entstehen, daß statt der Grundgesamtheit im Umfange Ν nur eine (Zufalls-)Stichprobe von η untersucht wird. Im weiteren Sinne gehören dazu auch die "Auswahlfehler", also die Fehler, die durch fehlerhafte Handhabung des Auswahlverfahrens bzw. der Auswahltechnik und falsche Behandlung der Stichprobe entstehen. Store-Test s. Ladentest systematische Auswahl Entsprechend dem Auswahlsatz f bzw. dessen Kehrwert i - nach der englischen Bezeichnung "sampling interval" - gelangt (nach "Zufallsstart" und bei Zufallsanordnung der Kartei) jede i-te Karte in die Auswahl. systematischer Fehler Als systematische Fehler oder Bias bezeichnet man alle Abweichungen vom "wahren Wert" in nur einer Richtung, also die Fehler, die nicht Zufallsfehler sind. TAT (Thematischer Apperzeptionstest) Dem Befragten wird eine - mehr oder weniger strukturierte - Abbildung (oder auch eine Serie davon) vorgelegt mit der Bitte, dazu Stellung zu nehmen, also etwa zu erklären, was das Bild wiedergibt.

D. Glossarium

543

teilnehmende Beobachtung Sie liegt dann vor, wenn der Beobachter aktiv, auf der gleichen Ebene wie der Beobachtete, am Ablauf des Geschehens teilnimmt. Tendenzfrage: Frage gleichen Wortlauts, die wiederholt an einen jeweils - in gleicher Weise "repräsentativen Querschnitt" gestellt wird (und damit die Ermittlung von "Trends" und "Tendenzen" ermöglicht). Testmarkt-Simulation Hierbei wird eine Anzahl von Personen in ein Studio oder Labor (deshalb auch: "Labor-Testmarkt") eingeladen; dort erfolgt zunächst ein Vorinterview, anschließend die Vorführung von Werbemitteln, wesentlich in Gestalt von Werbespots für das zu testende Produkt, und danach in einem simulierten Supermarkt die Anregung zum Kauf (durch Zurverfügungstellung eines bestimmten Geldbetrages, die Gewährung von Rabatten usw.); später wird ein Nachinterview durchgeführt. Test-Retest-Reliabilität Hierunter versteht man - im Sinne der allgemeinen Definiton der Réhabilitât die Korrelation mit einer Wiederholungsmessung zu einem späteren Zeitpunkt. Theater-Test s. Schwerin-Test Treatment Hierunter versteht man die verschiedenen Varianten von Test-Faktoren, denen die Test-Einheiten in Experimenten ausgesetzt werden. Zumindest bei mehrfaktoriellen Experimenten ist die Bezeichnung Treatment-Λ usprägungen (oder Niveaus, entsprechend dem englischen "level") zweckmäßiger; man spricht auch dann von Faktor-Stufen. uneingeschränkte Zufallsauswahl Jedes Element der Grundgesamtheit hat die gleiche (von Null verschiedene) Chance, in die Stichprobe zu gelangen. Validität Ein Meßinstrument ist valide oder "gültig", wenn es gerade das mißt, was gemessen werden soll. Validität liegt also in dem Maße vor, in dem die Messungen frei von "systematischen Fehlern" sind.

544

Anhang

Varianz: Summe der quadrierten Abweichungen zwischen Einzelwerten und Mittelwert, dividiert durch η oder η -1 (mit η für die Anzahl der Werte). Varianzanalyse Bei der Varianzanalyse handelt es sich um ein statistisches Verfahren, das primär zur Auswertung von Versuchsanlagen entwickelt wurde. Formal geht es dabei im Kern um die Erweiterung des Tests der Gleichheit zweier Mittelwerte auf mehrere. Die Bezeichnungsweise rührt daher, daß dies über eine Zerlegung der Streuung erfolgt. Verbandsmarktforschung: Durchführung von Marktforschungsmaßnahmen durch die (Fach-)Verbände für die ihnen angeschlossenen Unternehmen. Verbund-Marktforschung besteht darin, daß Unternehmen gemeinsam Marktforschung betreiben. Verbundmessung s. Conjoint Measurement Verhältnisskala Die Messung erfolgt in konstanten Einheiten und mit festem Nullpunkt. Verkaufstest Der Verkaufstest stellt eine Unterform des Markttests dar, die dadurch charakterisiert wird, daß der probeweise Verkauf weniger räumlich als vielmehr sachlich abgegrenzt ist: ausgewählte Läden ("Ladentest" oder"Store-Test"), TestVerkauf sowohl über Reisende als auch über Kataloge usw. Verschlüsselung s. Codieren Volltest Ein Produkttest ist dann ein "Volltest", wenn im Prinzip alle Seiten oder Wirkungen des Produkts getestet werden. Wiedererkennungsverfahren s. Recognition-Verfahren Wortassoziationstest Dem Befragten werden Wörter präsentiert mit der Bitte, möglichst rasch und ohne Überlegung anzugeben, woran er dabei denkt.

D. Glossarium

545

Zentralwert s. Median Zufallsauswahl („Wahrscheinlichkeits-Stichprobe") Jedes Element der Grundgesamtheit hat eine angebbare - von Null verschiedene - Chance, in die Auswahl zu gelangen. Zufallsfehler Im engeren Sinne handelt es sich hierbei um den - berechenbaren - Fehler, der dadurch entsteht, daß statt der Grundgesamtheit im Umfang Ν nur eine (Zufalls-)Stichprobe von η untersucht wird. Im weiteren Sinne gehören dazu auch die zufallsähnlichen Meßfehler.

E. Vokabularium englisch | deutsch advertising research analysis of variance area sampling bias brand equity brand switching models canonical analysis (or correlation) closed-ended/response question cluster sampling code codebook coding coefficient of correlation coefficient of determination coefficient of variation concurrent validity confidence interval constant sum scale construct validity content validity control group convergent validity covariance criterion validity cross-sectional analysis cross-tabulation cross-validation data recording degrees of freedom discriminant analysis discriminant scores discriminant validity disguised interviews/observation error experimental group face validity factor analysis factor pattern factor structure frequency distribution goodness of fit hierarchical tree interquartil range

Werbeforschung Varianzanalyse Flächenauswahl systematischer Fehler, Bias Markenwert Markenwahl-Modelle Kanonische Analyse (oder Korelation) geschlossene Frage Klumpenauswahl Code Codebuch, Codeplan Codieren Korrelationskoeffizient Determinationskoeffizient, Bestimmtheitsmaß Variationskoeffizient Konkurrent-Validität Vertrauensbereich Konstantsummenskala Konstrukt-Validität Inhalts-Validität Kontrollgruppe Konvergenz-Validität Kovarianz Kriterium-Validität Querschnitts analyse Kreuztabulierung, Kreuzauswertung Kreuzvalidierung Datenerfassung Freiheitsgrade Diskriminanzanalyse Diskiminanzwerte Diskriminanz-Validität verdeckte Interviews/Beobachtung Fehler Experimentiergruppe Augenschein- (oder eben: Face-)Validität Faktorenanalyse Faktorenmuster Faktorenstruktur Häufigkeitsverteilung Anpassungsgüte Dendogramm, Stammbaumschema Quartilsabstand

E. Vokabularium englisch/deutsch

interviewer error kurtosis latin square longitudinal analysis mail interview mean measurement model missing values monadic test multi-phase sampling multiple-choice question multi-stage sampling open-ended/response question partworth physical trace measures picture frustration test pilot study primary sampling unit principal component analysis random error range ratio scale refusal rate reliability response latency sample sampling distribution sampling fraction secondary sampling unit selection error sentence completion test sknewness snowball sampling standard deviation standard error stepwise regression stratification sampling systematic sampling unique factors ties tree analysis true value validity white noise word association test

Interviewereinfluß Wölbung Lateinisches Quadrat Längsschnittanalyse schriftliche Befragung Mittel Meßmodell fehlende Werte monadischer Test, Einzeltest mehrphasige Auswahl Mehrfach-Auswahl-Frage mehrstufige Auswahl offene Frage Teilnutzen Spurenanalyse Bildenttäuschungstest Leitstudie Auswahleinheit 1. Stufe Hauptkomponentenanalyse Zufallsfehler Spannweite Verhältnisskala Verweigerungsquote Réhabilitât, Zuverlässigkeit Antwortzeit Stichprobe Stichprobenverteilung Auswahlsatz Auswahleinheit 2. Stufe Auswahlfehler Satzergänzungstest Schiefe Schneeballverfahren Standardabweichung Standardfehler schrittweise Regression Auswahl mit Schichtung systematische Auswahl Einzelrestfaktoren Bindungen Baum-Analyse wahrer Wert Validität, Gültigkeit weißes Rauschen Wortassoziationstest

Literaturverzeichnis Vorbemerkungen 1. Aufgeführt ist stets nur der erstgenannte Verlagsort. 2. Mehrmals zitierte Zeitschriften sind ggf. abgekürzt. Es bedeuten: ASt A Allgemeines Statistisches Archiv JAR Journal of Advertising Research JASA Journal of the American Statistical Association JA VF Jahrbuch der Absatz- und Verbrauchsforschung JoM Journal of Marketing JMR Journal of Marketing Research J. Roy. Stat. Soc. Journal of the Royal Statistical Society MR Marketing Research Psych. Bull. Psychological Bulletin PuA Planung und Analyse ZfMM Zeitschrift für Markt- und Meinungsforschung ZfB Zeitschrift für Betriebswirtschaft ZfbF Zeitschrift für betriebswirtschaftliche Forschung

A Aaker (et al.,1980), D.A./Bagozzi, R.P. /Carman, J.M./ MacLachlan, J.M.: On Using Response Latency to Measure Preference, in: JMR, 27 (1980), 237-244 Aaker. D.A./Kumar, V./Day, G.S. (1995): Marketing Research. 5th. ed., New York (7th ed. 2001) Abul-Ela, A.L./ Greenberg. B.G./ Horvitz, D.G. (1967): A Multiproportions Randomized Response Model, in: JASA, 62 (1967), 990-1008 Addelman, S. (1962): Orthogonal Main-Effect Plans for Asymmetrical Fractional Experiments, in: Technometrics, 4 (1962), 21-46 ADM/AG.MA (Hrsg.) (1999): Stichproben-Verfahren in der Umfrageforschung, Opladen Ahlert, D./Olbrich, R. (Hrsg.) (1995): Integrierte Warenwirtschaftssysteme und Handelscontrolling, 2. Aufl., Stuttgart (3. Aufl. 1997) Ahlert, D./ Olbrich, R. (1996): Zur Schnittstelle von marktorientierter Unternehmensführung und Informationswirtschaft - Welche unterschiedlichen Rollen spielen Controlling und Informationsmanagement auf dem Gebiet der Infomationsversorgung?, in: Ahsen, A.v./Czenskowsky, T. (Hrsg.) (1996), S. 223-244 Ahrens. H. J. (1974): Multidimensionale Skalierung ..., Weinheim Ahsen, A.v. (1996a): Marketing und Total Quality Management - Schnittstellen und Konflikte, in: Ahsen, A.v./Czenskowsky, T. (Hrsg.) (1996), S. 175-190 Ahsen, A.v. (1996b): Total Quality Management. Komponenten und organisatorische Umsetzung einer unternehmerischen Qualitätskonzeption, Frankfurt/Main Ahsen, A.v./Czenskowsky, T. (Hrsg.) (1996): Marketing und Marktforschung. ... (Festschrift Hüttner), Hamburg

Literaturverzeichnis

549

Ahsen, M.v. (1990): Kohortenanalytische Prognosen im Rahmen einer Strategischen Marktforschung, Diss., Bremen Ahsen, M.v./Hüttner, M. (1991): Diagnose von Multikollinearität und anderer Annahmeverletzungen der multiplen Regression, in: PuA, 2/1991, 52-56 Albers, S. (1989a): Ein System zur Ist-Soll-Abweichungs-Ursachenanalyse von Erlösen, in: ZfB, 59 (1989), 637-654 Albers, S. (1989b): Der Wert einer Absatzreaktionsfunktion für das Erlös-Controlling. Entgegnung, in: ZfB, 59 (1989), 1235-1241 Aldenderfer, M.S./Blashfield. R. K. ( 1995): Cluster Analysis, 13th ed., Thousand Oaks Alpert, M.I./ Peterson. R. A. ( 1972): On the Interpretation of Canonical Analysis, in: JMR, 9 (1972), 187-192 Amon, P. (1992): Standbefragung - Ein Instrument der Messeerfolgskontrolle, in: m+a-report, 4/1992, 72-77 Anders, M. (o.J.): Das Telefoninterview in der Bevölkerung, München ( I n f r a t e s t ) Anders, U. (1997): Statistische Neuronale Netze, München Andersen, E.B. (1997): Introduction to the Statistical Analysis of Categorical Data, Berlin Anderson, T.W. (1984): An Introduction to Multivariate Statistical Analysis, 2nd ed., New York Arminger, G. (1979): Faktorenanalyse, Stuttgart Armstrong, J.S./Andress. J.G. (1970): Exploratory Analysis of Marketing Data: Trees vs. Regression, in: JMR. 7 (1970), 487-492 Atteslander, P. (1995): Methoden der empirischen Sozialforschung, 8. Aufl., Berlin (9. Aufl. 2000)

Bacher, J. (1996): Clusteranalyse, 2. Aufl., München Backhaus, K./Meyer, M. (1988): Korrespondenzanalyse. Ein vernachlässigtes Analyseverfahren nicht metrischer Daten in der Marketing-Forschung, in: Marketing ZFP, 4/1988, 295-307 Backhaus, K./ Kleinschmidt, M./ Vollmer, B. (1983): Die Stimmfrequenz ..., in: Marketing ZFP, 2/1983,113-121 Backhaus (et al. 2000), K./Erichson, B./Plinke, W./Weiber, R.: Multivariate Analysemethoden, 9. Aufl., Berlin Bänsch, A. (1998): Käuferverhalten, 8. Aufl., München Baiderjahn, I. (1986a): Cross-Validation of Covariance Structures in One and Multi Group Analysis ..., in: Degens, P.O./Hermes, H.-J./Opitz, O. (Hrsg.), Die Klassifikation und ihr Umfeld, Proceedings ..., Studien zur Klassifikation, 17 (1986), S. 333-340 Balderjahn, I. (1986b): The Robustness of LISREL Unweighted Least Squares Estimation against Small Sample Size in Confirmatory Factor Analysis Models, in: Gaul, W./ Schader, M. (ed.), Classification as a Tool of Research, Amsterdam 1986, S. 3-10

550

Literaturverzeichnis

Baiderjahn, I. (1988): Die Kreuzvalidierung von Kausalmodellen, in: Marketing ZfP, 1/1988, 61-73 Baiderjahn, I. (1991): Ein Verfahren zur empirischen Bestimmung von Preisresponsefunktionen, in Marketing ZfP, 1/1991, 33-42 Baiderjahn, I. (1994): Der Einsatz der Conjoint-Analyse zur empirischen Bestimmung von Preisresponsefunktionen, in: Marketing ZFP, 1/1994, 2-20 Banks, S. (1965): Experimentation in Marketing, New York Batinic, B. (2001): Fragebogenuntersuchungen im Internet, Aachen Batinic (et. al., 1999), Β./Werner, A./Gräf, L./Bandilla, W. (Hrsg.): Online-Research, Göttingen Bauer, E. ( 1981): Produkttests in der Marketingforschung, Göttingen Bauer, E. (1989): Ubersetzungsprobleme und Ubersetzungsmethoden bei einer multinationalen Marketingforschung, in: JA VF, 2/1989, 174-205 Bauer, E. (1995): Internationale Marketingforschung, München (2. Aufl. 1997) Bauer, E. (1996): Fernsehzuschauerforschung in Europa, in: Ahsen, A.v./Czenskowsky, T. (Hrsg.) (1996), S. 129-141 Baumann, U. (1971): Psychologische Taxometrie, Bern Bausch, T. (1990): Stichprobenverfahren in der Marktforschung, München Becker, W. (1973): Beobachtungsverfahren in der demoskopischen Marktforschung, Stuttgart Behrens, G. (1976): Werbewirkungsanalyse, Opladen Behrens, G. (1983): Magnitude-Skalierung, in: Innovative Marktforschung, Würzburg 1983, S. 125-137 Behrens, G. (1996): Die Entwicklung von Sozialtechniken in der Konsumentenforschung - Hoffnungen, Enttäuschungen und Möglichkeiten, in: Ahsen, Α .ν./ Czenskowsky, T. (Hrsg.) (1996), S. 483-498 Behrens, K.C. (1966): Demoskopische Marktforschung, 2. Aufl., Wiesbaden Behrens, K./Löffler, U. (1999): Aufbau des ADM-Stichproben-Systems, ADM/AG.MA (Hrsg.) (1999), S. 69-91

in:

Benkenstein, M . / G ü t h o f f , J. (1996): Methoden zur Erfassung der Qualität komplexer Dienstleistungen - ein Vergleich qualitativer und quantitativer Methoden, in: Ahsen, A.v./Czenskowsky, T. (Hrsg.) (1996), S. 514-536 Benninghaus, H . (1976): Ergebnisse und Perspektiven der Einstellungs- und Verhaltensforschung, Meisenheim/ Glan Bensberg, F. (2001): Web Log Mining als Instrument der Marketingforschung, Wiesbaden Bentier, P.M./ Bonett, D.G. (1980): Significance Tests and Goodness of Fit in the Analysis of Covariance Structures, in: Psych. Bull., 88 (1980), 588-606 Bentler, P.M./Weeks, D.G. (1979): Interrelations among Models for the Analysis of Moment Structures, in: Multivariate Behavioral Research, 14 (1979), 169-186 Bentler, P.M./Weeks, D.G. (1980): Linear Structural Equations with Latent Variables, in: Psychometrika, 45 (1980), 289-308 Benzécri, J.P. (1963): Course de Linguistique Mathématique, Rennes

Literaturverzeichnis

551

Berekoven, L./Eckert, W./Ellenrieder, P. (2001): Marktforschung. ..., 9. Aufl., Wiesbaden Bernhard, U. (1983): Das Verfahren der Blickaufzeichnung, in: Innovative Marktforschung (1983), S. 105-122 Berth, R. (1959): Marktforschung zwischen Zahl und Psyche, Stuttgart Bidlingmaier, J. (1973): Marketing 2, Hamburg Bishop, Y.M./Fienberg, S.E./Holland, P.W. (1995): Discrete Multivariate Analysis, 12th repr., Cambridge Blair, E. (1983): Sampling Issues in Trade Area Maps Drawn From Shopper Surveys, in: JoM, 47, Winter 1983, 98-106 Blamires, C. (1979): Pricing Research Techniques, in: Journal of the Market Research Society, 23 (1979), 103-126 Blankenship, A.B. (1961): Markt- und Meinungsforschung in den USA, Tübingen Blasius, J. (2001): Korrespondenzanalyse, München Bock, H . H . (1974): Automatische Klassifikation ..., Göttingen Bock, H . H . (1988): Classification and Related Methods of Data Analysis, Amsterdam Böcker, F. (1984/5): Multivariaten-Analyse ( T . I i in: Marktforschung, 29 (1985), 3542 (aus: Management-Enzyklopädie, 2. Aufl., Landsberg a.L. 1984) Böhler, H . (1977): Methoden und Modelle der Marktsegmentierung, Stuttgart Böhler, H . (1992): Marktforschung, 2. Aufl., Stuttgart Böhmer, M. (1964): Praktische Aspekte der "Mannheimer Blickregistierung", in: Der Marktforscher, 8 (1964), 97-100 Bohley, P. (2000): Statistik, 7. Aufl., München Boich, B.W./ Huang, C.J. (1974): Multivariate Statistical Methods for Business and Economics, Englewooa Cliffs Bonoma, T.V. (1985): Case Research in Marketing, in: JMR, 22 (1985), 199-208 Boomsma, A. (1982): The Robustness of LISREL against Small Sample Size in Factor Analysis Moaels, in: Jöreskog, K.G./Wold, H. (ed.), Systems Under Indirect Observation, P.I., Amsterdam 1982, S.149-173 Booz, Allen and Hamilton Inc. (1968): Management of New Products, New York Booz, Allen and Hamilton Inc. (1982): New Products Management for the 1980s, New York Borg, I. (1981): Anwendungsorientierte Multidimensionale Skalierung, Berlin Borg, I./Groenen, P.J.F. (1997): Modern Multidimensional Scaling, New York Borg, I./Staufenbiel, T. (1989): Theorien und Methoden der Skalierung, Bern (3. Aufl. 1997) Borschberg, E. (1963): Produktive Marktforschung, Stuttgart Bortz, J. (1984): Lehrbuch der empirischen Forschung, Berlin Bortz, J. (1999): Statistik für Sozialwissenschaftler, 5. Aufl., Berlin Box, G.E.P. (1953): Non-Normality and Tests on Variances, in: Biometrika, 40 (1953), 318-335

552

Literaturverzeichnis

Box, G . E . P . / H u n t e r , W . G . / H u n t e r , J.S. (1978): Statistics for Experimenters. New York Brachfeld, O . (1964): Internationale Marktforschung und Völkerpsychologie, in: Kleiner Almanach der Marktforschung 1964 (5. Jg. - hrsg. v. EMNID), S. 113120 Bradley, M.E. (1986): Developing Communication Strategies for Foreign Market Entry, in: Turnbull, P.W./Paliwoda, S.J. (ed.): Research in International Marketing, London 1986. S. 35-61 Bush, A . J . / H a i r , J . F . jr. (1985): An Assessment of the Mall Intercept as a Data Collection Method, in: JMR, 22 (1985), 158-167 Byrne, B.B.M. (1994): Strutturai Equation Modelling with E Q S and E Q S / W I N DOWS, Thousand Oaks

C Campbell, D . T . (1963): Social Attitudes and Other Acquired Behavorial Dispositions, in: Koch, S. (ed.), Psychology: A Study of a Science, Vol. 6, Investigations of Man as Socius, New York 1963, S. 94-176 Campbell, D.T./Fiske, J . D . (1959): Convergent and Discriminant Validity by the Multitrait-Multimethod Matrix, in: Psych. Bull., 56 (1959), 81-105 Campbell, D.T./Stanley, J . C . (1963/66): Experimental and Quasi-Experimental Designs for Research on Teaching, in: Gage, N . L . (ed.), Handbook of Research on Teaching, Chicago 1963, S.171-246 (deutsche Beark: Schwarz, E., Experimentelle und quasi-experimentelle Anordnungen in der Unterrichtsforschung, in: Ingenkamp, K. [Hrsg.], Handbuch der Unterrichtsforschung, T.I., Weinheim 1970, Sp. 445-632.) (Auch als: Campbell/Stanley, Experimental and QuasiExperimental Designs for Research, Boston 1966.) Carroll, J . D . / G r e e n , P.E. (1995): Psychometric Methods in Marketing Research: Part I: Conjoint Analysis, in: J M R 32 (1995), 385-391 Chambers (et al.1983), J.M./Cleveland, W.S./Kleiner, W.S./Tukey, P.H.: Graphical Methods for Data Analysis, Monterey Chatterjee, S./Price, Β. (1991/95): Regression Analysis by Example, 2nd ed., New York 1991; dt. u. d. Titel: Praxis der Regressionsanalyse, München 1995 Chernoff, Η . (1973): The Use of Faces to Represent Points in k-dimensional Space Graphically, in: JASA, 68 (1973), 361-368 Churchill, G . A . jr. (1987): Marketing Research. Methodological Foundations, 4th ed., Chicago (7th ed. Fort Worth 1999) Churchill, G.A. jr. (1988): Basic Marketing Research, Chicago (4th ed. Fort Worth 2001) Cleveland, W.S. (1995): The Elements of Graphing Data, rev. ed, Murray Hill Cliff, N . (1983): Some Cautions Concerning the Application of Causal Modeling Methods, in: Multivariate Behavorial Research, 18 (1983), 115-126 Cochran, W.G. (1977): Sampling Techniques, 3rd ed., New York 1977 (dt. Übers. der 2. Aufl. 1963 - unter dem Titel: Stichprobenverfahren, Berlin 1972) Converse, J.M./Presser, S. (1986): Survey Questions, Beverly Hills

Literaturverzeichnis

553

Cook, R.D./Weisberg, S. (1992): Residuals and Influence in Regression, London (repr.) Cook, R.D./Weisberg, S. (1999): Applied Regression, New York Cook, T.D./Campbell, D.T. (1979): Quasi-Experimentation, Chicago Cook, T.D./Reichardt, C.S. (1979): Beyond Qualitative Versus Quantitative Methods, in: dies. (Hrsg.), Qualitative and Quantitative Methods in Evaluation Research, Beverly Hills 1979, S. 7-32 Cooley, W.W./Lohnes, P.R. (1971): Multivariate Data Analysis, New York Copeland, R.T. (1923): Relations of Consumer's Buying Habits to Marketing Methods, in:Harvard Business Review, 1923, 282-289 Cox, K.K./Enis, B.M. (1969): Experimentation for Marketing Decisions, New York 1969 (und Aylesbury 1973) Crisp, R.D. (1959): Absatzforschung, Essen (dt. Übers, v.: Marketing Research, New York 1957) Crisp, R.D. (1961): Organisation der Marketingarbeit, in: Praxis des Marketing (ΑΜΑ-Schriftenreihe, Bd. 8), Düsseldorf Cudeck, R./Browne, M.W. (1983): Cross-Validation of Covariance Structures, in: Multivariate Behavorial Research, 18 (1983), 147-167 Czenskowsky, T. (1988): Strategische Unternehmensplanung und Marktforschung Ansätze einer strategischen Marktforschung, Bremen, Diss. D Dalrymple, D.J. (1975): Sales Forecasting Methods and Accuracy, in: Business Horizons, Dec. 1975, 69-73 Darden, W.R./Monroe, K.B./Dillon, W.R. (ed.) (1983): Research Methods and Causal Modeling in Marketing, Chicago Davison, M.L. (1992): Multidimensional Scaling, Malabar Decker, R./Wagner, R. (2000): Log-lineare Modelle und Logit, in: Herrmann/Homburg (Hrsg.) (2000), S. 549-578. Decker, R./Wagner, R./Knauff, N. (1996): Data Warehouse - Ein Instrument für Marktforschung und Management, in: Marktfroschung und Management, 42, 1996, S. 172-177 Debus, G. (1977): Gefühle, in: Herrmann, T. (Hrsg.): Handbuch psychologischer Grundbegriffe, München 1977, S. 156-168 Deffaa, W. (1982): Anonymisierte Befragungen mit zufallsverschlüsselten Antworten - Die Randomized-Response-Technik (RRT), Frankfurt/Main Deichsel, G./Trampisch, H.J. (1985): Clusteranalyse und Diskriminanzanalyse, Stuttgart Dichtl, E./Thomas, U. (1986): Der Einsatz des Conjoint Measurement im Rahmen der Marktforschung, in: Marketing ZFP, 1/1986, 27-33 Dickson, J.P./MacLachlan, D.G. (1996): Fax Surveys: Return Patterns and Comparison With Mail Surveys, in: JMR 33, 1996, S. 108-113 Diller, H. (1991): Preispolitik, 2. Aufl., Stuttgart (3. Aufl 2000)

554

Literaturverzeichnis

Dillon, W.R.(1986): Building Consumer Behavior Models With LISREL: Issues in Applications, in: Brinberg, D./Lutz, R.L. (ed.), Perspectives on Methodology in Consumer Research, New York 1986, S.107-154 Doyle, P./Fenwick, I. (1975): The Pitfalls of AID Analysis in: JMR, 12 (1975), 408413 Draper, N.R./Smith, H . (1998): Applied Regression Analysis, 3rd ed., New York Drummey, G.L. (1984): Traditional Methods of Sales Forecasting, in: Davies, R.L./ Rogers, D.S., Store Location and Store Assessment Research, New York 1984, S. 279-299 Dubke, H.-P. (1984): Bildschirmtext: Möglichkeiten der On-Line-Marktforschung, in: Zentes (Hrsg.) (1984), S.67-83 D u n n , G./Everitt, B./Pickles, A. (1993): Modelling Covariances and Latent Variables using EQS, London Dworak, K. (1969): Beobachtung und Experiment als Verfahren der Erhebung in der Absatzforschung, Diss. Nürnberg Dworatschek, S. (1989): Grundlagen der Datenverarbeitung, 8. Aufl., Berlin E Engelhardt, W.H. (1998) : Marktforschung für Investitionsgüter - Defizite und Perspektiven, in: Erichson, B./Hildebrandt, L. (Hrsg.), Probleme und Trends in der Marketingforschung (Festschrift Hammann), Stuttgart, S. 153-167 Enis, B.M./Yu, J.H. (1983): Toward a Taxonomy of Errors in Marketing Research, in: Darden/Monroe/Dillon (ed.) (1983), S. 161-164 Erdos, P.L. (1983): Professional Mail Surveys, rev. ed., Malabar Erichson, B. (1980): Ermittlung von Kaufwahrscheinlichkeiten durch Logit-Analysen, in: Schwarze, J. (Hrsg.), Angewandte Prognoseverfahren, Herne 1980, S. 165-188 Erichson, Β. (1981): TESI: Ein Test- und Prognoseverfahren für neue Produkte, in: Marketing ZFP, 3/1981, 201-207 Erichson, B. (2000): Testmarktsimulation, in: Herrmann/Homburg (Hrsg.) (2000), S. 789-808 Everitt, B. (1993): Cluster Analysis, 3rd ed., London Esch, F.-R. (2000): Markenwertmessung, in: Herrmann/Homburg (Hrsg.) (2000), S. 979-1023 F Fahrmeir, L./Hamerle, A. (Hrsg.) (1984): Multivariate statistische Verfahren, Berlin (2. Aufl. 1996) Fairley, J.U./Lehmann, D.R. (1986): Meta-Analysis in Marketing, Lexington Feger, H . (1974): Die Erfassung individueller Einstellungsstrukturen, in: Zs. f. Sozialpsychologie, 5 (1974), 242-254 Feldwick, P. (1995): Im Dickicht der Werbepretests, in: PuA, 5/95, 59-65 Fern, E.E. (2001): Advanced Focus Group Research, Thousand Oaks

Literaturverzeichnis

555

Fickel, F.W. (1962): Unbekannter Markt - schon bekannt, in: Marketing, Beilage zu: Volkswirt, Nr. 41 v.12.10.1962, S. 13-17 Fishbein, M. (1966): The Relationship between Beliefs, Attitudes, and Behavior, in: Feldmann, S. (Hrsg.): Cognitive Consistency, New York 1966, S. 199-223 Fischer, T. (1995): Computergestützte Warenkorbanalyse als Informationsquelle des Handelsmanagements, in: Ahlert/Olbrich (Hrsg.) (1995), S. 251-282 Flanagan, J.C. (1954): The Critical Incident Technique, in: Psych. Bull. 1954, 327358 Fließ, S. (1994): Messeselektion. ..., Wiesbaden Förster (et al., 1984), F./Fritz, W./Silberer, G./Raffée, Η.: Der LISREL-Ansatz der Kausalanalyse und seine Bedeutung für die Marketingforschung, in: ZfB, 54 (1984), 346-367 Förster, H.P. (1979): Von der Markt- zur Unternehmensforschung, in: Marktforschung, 23 (1979), 75-80 Fornell, C. (1978): Problems in the Interpretation of Canonical Analysis ..., in: JMR, 15 (1978),489491 Fox, J.A./Tracy, P.E. (1986): Randomized Response, Beverly Hills Friedrichs, J . / Lüdtke, Η . (1977): Teilnehmende Beobachtung, 3. Aufl., Weinheim Frey, J . H . / Kunz, G . / Lüschen, G. (1990): Telefonumfragen in der Sozialforschung, Opladen Fritz, W. (1984): Warentest und Konsumgüter-Marketing, Wiesbaden Fritz, W. (2001): Internet-Marketing und Electronic Commerce, 2. Aufl., Wiesbaden Fritz, W. (Hrsg.) (2001): Internet-Marketing...., 2. Aufl., Stuttgart Fuchs, M. (1994): Umfrageforschung mit Telefon und Computer, Weinheim Fuchs, R. (1963): Marktvolumen und Marktanteil, Stuttgart Fuß, J./Meyer, W./Stern, U. (1989): Praxis der Auslandsmarkterkundung, Heidelberg

Gabor, A. (1977): Pricing, Principles and Practices, London Gates, R./Solomon, P. (1982): Research Using the Mall Intercept: State of the Art, in: JAR, 22 (1982), 43-49 Gaul, W./Schader, M. (1999): Data Mining: An New Label for an Old Problem?, in: dies, Mathematische Methoden der Wirtschaftswissenschaften (Festschrift Opitz), Heidelberg, 1999, S. 3-14 Geurts, M.D./Andrus, R.R./Reinmuth, J.E. (1975): Researching Shoplifting and Other Deviant Customer Behavior Using trie Randomized Research Design, in: Journal of Retailing, 51 (1975), 43-48 Ghazizadeh, U.R. (1987): Werbewirkungen durch emotionale Konditionierung, Frankfurt/Main Gifi, A. (1990): Nonlinear Multivariate Analysis, New York Glaab, P. (1976): Die Vorausschätzung der Fruchtbarkeit anhand von Kohortenextrapolationen, in: AStA, 60 (1976), 415-433

556

Literaturverzeichnis

Glass, G.V. (1976): Primary, Secondary and Meta-Analysis of Research, in: Educational Researcher, 5 (1976), 3-8 Glass, G.V./McGaw, B./Smith, M.L. (1981): Meta-Analysis in Social Research, Beverly Hills Goodman, L.A. (1961): Snowball Sampling, in: Annals of Mathematical Statistics, 32 (1961), 1948-1970 Goodman, L.A. (1970): The Multivariate Analysis of Qualitative Data: Interactions Among Multiple Classifications, in: JASA, 65 (1970), 226-256 Goodman, L.A. (1991): Measures, Models and Graphical Displays in the Analysis of Cross-Classified Data, in: JASA, 86 (1991), 1085-1138 Graf, U./Henning, H.-T./Stange, K./Wilrich, R.-T. (1987/97): Formeln und Tabellen der angewandten mathematischen Statistik, 13. Auf., Berlin 1987, korr. Nachdruck 1997 Green, P.E. (1984): Hybrid Models for Conjoint Analysis: An Expository Review, in: JMR, 21 (1984), 155-169 Green, P.E./Carmone, F.J./Smith, S.M. (1989): Multidimensional Scaling. ..., Boston Green, P.E./Srinivasan, V. (1978): Conjoint Analysis in Consumer Research: Issues and Outlook, in: Journal of Consumer Research, 5 (1978), 103-123 Green, P.E./Tull, D.S. (1982): Methoden und Techniken der Marketingforschung, Stuttgart 1982 (dt. Ubers. - v. R. Köhler und Mitarbeitern - von: Research for Marketing Decisions, 4th ed., Englewood Cliffs 1978) Green, P.E./Krieger, A.M./Schaffer, C.M. (1993): A Hybrid Conjoint Model with Individual Level Interaction: in: Advances in Consumer Research, 20 (1993), Ιό Greenacre, M.J. (1993): Correspondence Analysis in Practice, London Greenberg (et al.,1971), B.G./Kuebler, R.R./Abernathy, J.R./Horvitz, D.G. (1971): Application of the Randomized Response Technique in Obtaining Quantitative Data, in: JASA, 66 (1971), 243-250 Greenwood, E. (1945): Experimental Sociology. A Study in Method, New York Greenwood, E. (1972): Das Experiment in der Soziologie, in: König, R. (Hrsg.), Beobachtung und Experiment in der Sozialforschung, 8. Aufl., Köln 1972, S.171220 Grings, W.W./Dawson, M.E. (1978): Emotions and Bodily Responses - A Psychophysiological Approach, New York Grizzle, J.E./Starmer, C.F./Koch, G. (1969): Analysis of Categorial Data by Linear Models, in: Biometrics 25 (1969), 489-504 Grümer, K.-W. (1974): Beobachtung, Stuttgart Grunert, K. G. (1983): Magnitude-Skalierung, in: Marketing ZFP, 2/1983, 108-112 Günther, M./Vossebein, U./Wildner, R. (1998): Marktforschung mit Panels, Wiesbaden Gustafson, A./Herrmann, A./Huber, F. (Hrsg.) (2001): Conjoint Measurement, 2. Aufl., Berlin Gutenberg, E. (1955): Grundlagen der Betriebswirtschaftslehre, Bd. 2: Der Absatz, Berlin 1955 (17. Aufl. 1984)

Literaturverzeichnis

557

Gut jähr, G. (1965): Die Methode der Blickregistrierung, Göttingen Diss. Guttman, L. (1953): Image Theory for the Structure of Quantitative Variates, in: Psychometrika, 18 (1953), 277-296 H Hafermalz, O. (1976): Schriftliche Befragung - Möglichkeiten und Grenzen, Wiesbaden Haller, S. (1998): Beurteilung von Dienstleistungsqualität, 2. Aufl., Wiesbaden Hammann, P./Erichson, B. (1994): Marktforschung, 3. Aufl., Stuttgart (4. Aufl. 2000) Harman, H.H. (1976): Modern Factor Analysis, 3rd ed., Chicago Hartley, R.F./Prough, G.E./Flaschner, A.B. (1983): Essentials of Marketing Research, Tulsa Härtung, J./ Elpelt, B. (1999): Multivariate Statistik. 6. Aufl., München Härtung, J./Elpelt, B./Klösener, K.-H. (1995): Statistik, 10. Aufl., München (12. Aufl. 1999) Haseloff, O.W./Jorswieck, E. (1970): Psychologie des Lernens, Berlin Hayduk, L.A. (1996): LISREL: Issues, Debates and Strategies, Baltimore Hedges, L.V./01kin, I. (1985): Statistical Methods for Meta-Analysis, Orlando Hentschel, B. Í1995): Multiatrributive Messung von Diensleistungsqualität, in: Bruhn, M./Stauss, B. (Hrsg.), Dienstleistungsqualität, 2. Aufl., Wiesbaden 1995, S. 349-378 (3. Aufl. 2000) Herber, H.-J. (1976): Motivationspsychologie, Stuttgart Herbst, S. (2000): Marktforschung im Handel, in Herrmann/Homburg (Hrsg.) (2000), S. 1127-1148 Herrmann, A./Homburg, C. (Hrsg.) (2000): Marktforschung, 2. Aufl., Wiesbaden Heyn, W. (1962): Der Chi-Quadrat-Test in der Marktforschung, Konstanz Hildebrandt, L. (1983): Konfirmatorische Analysen von Modellen des Konsumentenverhaltens, Berlin Hildebrandt, L. (1984): Kausalanalytische Validierung in der Marketingforschung, in: Marketing ZFP, 1/1984, 41-51 (wiederabgedruckt in Hildebarndt/Homburg [Hrsg.] [1998]) Hildebrandt, L./Homburg, C. (Hrsg.) (1998): Die Kausalanalyse, Stuttgart Hill, M.O. (1974): Correspondence Analysis: A neglected Multivariate Method, in: J. Roy. Stat. Soc., C (Applied Statistics), 23 (1974) 340-354 Hinterhuber, H.H. (1990): Wettbewerbsstrategie, 2. Aufl., Berlin Hoerl, A.E. / Kennard, R.W. (1970a): Ridge Regression. Biased Estimation for Nonorthogonal Problems, in: Technometrics, 12 (1970), 55-67 Hoerl, A.E./Kennard, R.W. (1970b): Ridge Regression. Applications to Nonorthogonal Problems, in: Technometrics, 12 (1970), 69-82 Hofstätter, P.R. (1955): Über Ähnlichkeit, in: Psyche, 1955, 54-80 Hofstätter, P.R./Lübbert, H. (1958): Die Untersuchung von Stereotypen mit Hilfe des Polaritätsprofils, in: ZfMM, 3/1958,127-138 (+274)

558

Literaturverzeichnis

Hofstätter, P.R./Wendt, D. (1974): Quantitative Methoden der Psychologie, 4. Aufl., München Homburg, C. (1989): Exploratorische Ansätze der Kausalanalyse als Instrument der Marketingforschung, Frankfurt/Main Homburg, C./Rudolph, B. (1995): Theoretische Perspektiven zur Kundenzufriedenheit, in: Simon/Homburg (Hrsg.) (1995), S. 29-49 Honomichl, J. J. (1986): Honomichl on Marketing Research, Lincolnwood Horvitz, D.G./Shah, B.U./Simmons, W.R. (1967Ì; The Unrelated Question Randomized Response Model, in: Proceedings of the Social Statistics Section, American Statistical Association, 1967, 65-72 Hossinger, H.-P. (1982): Pretests in der Marktforschung. Die Validität von Pretestverfahren..., Würzburg Hruschka, H. (2000): Neuronale Netze, in: Herrmann/Homburg (Hrsg.) (2000) Hubel, W. (1988): Der Einsatz von Conjoint Measurement bei Unternehmensimageanalysen, in: PuA, 1/1988, 22-27 Huber, P.J. (1981): Robust Statistics, New York (1996: Robust Statistical Procedures, 2nd ed) Hüttner, M. (1973): Grundzüge der Wirtschafts- und Sozialstatistik, Wiesbaden Hüttner, M. (1978): Multivariate Methoden im Marketing, München Hüttner, M. (1979): Informationen für Marketing-Entscheidungen. Ein Lehr- und Arbeitsbuch der Marktforschung, München Hüttner, M. (1982): Markt- und Absatzprognosen, Stuttgart Hüttner, M. (1986a): Auf dem Wege zur "Strategischen Marktforschung"? (überarb. Version eines Vortrages auf dem BVM-Kongreß 1986), in: THEXIS, 3 (1986), 10-15 u. 18-21 Hüttner, M. (1986b): Die Kohortenanalyse als Instrument der strategischen Marktforschung, in: Beiz, C. (Hrsg.), Realisierung des Marketing, Savosa 1986, Bd. 1, S. 309-327 Hüttner, M. (1986c): Prognoseverfahren und ihre Anwendung, Berlin Hüttner, M. (1988): Nochmals: Bevölkerungsveränderungen und Nachfragepotentiale, in: Markenartikel, 50/1988, 132-134 Hüttner, M. (1989): Markt- und Absatzprognosen für Marketingentscheidungen, in: Bruhn, M. (Hrsg.), Handbuch des Marketing, München 1989, S. 154-188 Hüttner, M. (1994): Vergleich und Auswahl von Prognoseverfahren für betriebswirtschaftliche Zwecke, in: Mertens (Hrsg.) (1994), S. 349-363 Hüttner, M. (1995): Betriebswirtschaftslehre, 2. Aufl., München Hüttner, M. (Hrsg.) (1977): Zum Informations- und Kaufverhalten von Arbeitern, Bericht..., Bremen Hüttner, M. (Hrsg.) (1981): Zur Anwendung von Markt- und Absatzprognosen in der Praxis. Bericht über eine empirische Untersuchung ..., Bremen Hüttner, M./Bednarzik, U. (1990): Selektion und Kombination von Prognoseverfahren - Das System AUTOPROG, in: JA VF, 36 (1990), 103-115 Hüttner, M./Czenskowsky, T. (1986): Strategische Orientierung der Marktforschung und ihre Konsequenzen, in: Marktforschung, 30 (1986), 74-78

Literaturverzeichnis

559

Hüttner, M./Czenskowsky, T. (Hrsg.) (1988): Zum Stande von Marktforschung, Prognose, Langfrist-Informationsoeschaffung und strategischer Unternehmensplanung in der deutschen Wirtschaft..., Bremen 1988 Hüttner, M./Schwarting, U. (2000): Exploratorische Faktorenanalyse, in Herrmann/Homburg (Hrsg.) (2000), S. 381-412 Hüttner, M./Ahsen, A.v./Schwarting, U. (1999): Marketing-Management, 2. Aufl., München Hunter, J.E./Schmidt, F.L. (1990): Methods of Meta-Analysis, Newbury Park Huth, R./Pflaum, D. (1993): Einführung in die Werbelehre, 5. Aufl., Stuttgart (6. Aufl. 1996) I Inglehart, R. (1979): Wertewandel in westlichen Gesellschaften, in: Klages, H./ Kmieciak, P. (Hrsg.): Wertewandel und gesellschaftlicher Wandel, Frankfurt/ Main 1979, S. 279-316 Irmscher, M. (1996): Markenwertbegriffe, in: Markenartikel, 2/1996, 58-61 Irmscher, M. (1997): Markenwertmanagement, Frankfurt/Main

J Janetzke, P./Falk, J. (1994): Der Beitrag der Künstlichen Intelligenz zur Prognose, in: Mertens (Hrsg.) (1994), S. 317-348 Jirasek, J. (1963): Markterkundung in der Praxis, in: Rationalisierung, 14 (1963), 210212 Jobson, J.D. (1996): Applied Multivariate Data Analysis, Vol. 1: Regression and Experimental Design; Vol. 2: Categorical and Multivariate Methods, New York Jöreskog, K.G. (1969): A General Approach to Confirmatory Maximum Likelihood Factor Analysis, in: Psychometrika, 34 (1969), 183-202 Jöreskog, K.G. (1970): A General Method for Analysis of Covariance Structures, in: Biometrika, 57 (1970), 239-251 Jöreskog, K.G./Sörbom, D.I. (1982): Recent Developments in Structural Equation Modelling, in: JMR, 19 (1982), 404-416 Johannsen, U. (1968): Das Marken- und Firmen-Image ..., Braunschweig Diss. 1968 (und Berlin 1971) Johnson, R. (1987): Adaptive Conjoint Analysis, in: Proceedings of the Sawtooth Software Conference, on Perceptual Mapping, Conjoint Analysis, and Computer Interviewing, Ketchum 1987, S. 253-266 Κ Kaas, K.P. (1977): Empirische Preisabsatzfunktionen bei Konsumgütern, Berlin Kaas, Κ. P. (1980): Thurstone's 'Law of Comparative Judgement', in: WiSt, 5/1980, 233-235 Kaiser, H.F. (1970): A Second Generation Little Jiffy, in: Psychometrika, 35 (1970), 401-415 Kapferer, C. (1994): Zur Geschichte der deutschen Marktforschung, Hamburg Kellerer, H. (1960): Statistik im modernen Wirtschafts- und Sozialleben, Reinbek

560

Literaturverzeichnis

Kellerer, H . (1963): Theorie und Technik des Stichprobenverfahrens, 3. Aufl., München Kendali, M. G. (1950): Factor Analysis ..., Factor Analysis as a Statistical Technique, in: J. Roy. Stat. Soc., Β, 12 (1950), 60-73 Kepper, G. (1996): Qualitative Marktforschung, 2. Aufl., Wiesbaden Kepper, G. (2000): Methoden der qualitativen mann/Homburg (Hrsg.) (2000), S. 159-202

Marktforschung,

in:

Herr-

Kessing, O . (1993): Dynamisierung strategischer Planungsinstrumente mit Hilfe multivariater Methoden der Datenanalyse, Frankfurt/Main Kiener, J. (1980): Marketing-Controlling, Darmstadt Kinnear, T.C./Root, J.R. (ed.) (1995): 1994 Survey of Marketing Research, Chicago Kinnear, T.C./Taylor, J.R. (1996): Marketing Research, 5th ed., New York Kish, L. (1965): Survey Sampling, New York Klecka, W.R. (1980): Discriminant Analysis, Beverly Hills (15th print. 1993) Klein, K.F (1995): Management von Kundenzufriedenheit bei der Deutschen Lufthansa AG, in: Simon/Homburg (Hrsg.) (1995), S. 367-385 Klingemann, H.-D. (Hrsg.) (1984): Computergestützte Inhaltsanalyse in der empirischen Sozialforschung, Frankfurt/Main Kreienbrock, W. (1993): Einführung in die Stichprobenverfahren, 2. Aufl., München Kramer, S. (1991): Europäische Life-Style-Analysen zur Verhaltensprognose von Konsumenten, Hamburg Krafft, M. (2000): Logistische Regression, in: Herrmann/Homburg (Hrsg.) (2000), S. 237-264 Krippendorf, K. (1969): Models of Messages: Three Prototypes, in: Gerbner, G . / Holsti, O . / Krippendorf, K. / Paisley, W.S. / Stone, P.J. (ed.), The Analysis of Communication Content, New York 1969 Kriz, J. (1981): Methodenkritik empirischer Sozialforschung, Stuttgart Kroeber-Riel, W. (1983): Neuere Methoden der Marktforschung, in: Die Betriebswirtschaft, 43 (1983), 277-285 Kroeber-Riel, W. (1987): Weniger Informationsüberlastung durch Bildkommunikation, in: WiSt, 1/87, S. 485489 Kroeber-Riel, W. (1992): Konsumentenverhalten, 5. Aufl., München (7. Aufl. - Kroeber-Riel/Weinberg - 1999) Kroeber-Riel, W. (1993): Bildkommunikation, München Krueger, F. (1928): Das Wesen der Gefühle, Leipzig Krzanowski, W.J. (1990): Principles of Multivariate Analysis, corr. paperback ed., Oxford/New York (repr. 1996) Kuß, A./Tomczak, T. (2000): Käuferverhalten, 2. Aufl., Stuttgart Kurz, H . (1987): Die Genauigkeit von Umfrageergebnissen: eine empirische Analyse des Nonresponse-Bias, Wien

Literaturverzeichnis

561

L Lambert, Z.V./Durand, R.M. (1975): Some Precautions in Using Canonical Analysis, in: JMR, 12 (1985), 468-475 Lane, O. (1988): Aktivation, in: Asanger, R./Wenninger, G. (Hrsg.), Handwörterbuch der Psychologie, 4. Aufl., München 1988, S. 5-6 Lange, E. (1961): Bedeutung der Marktforschung für die Unternehmungsführung, in: Marktforschung im Unternehmen, 1 (1961), 66-70 (in: Der Marktforscher, 5 [1961]) Lampe, F. (1998): Unternehmenserfolg im Internet, Braunschweig (1. Aufl. unter dem Titel: Business im Internet) Lampe, F. (Hrsg.) (1999): Marketing und Electronic Commerce, Braunschweig Lantermann, F.W. (1984): Methoden der betrieblichen Auslandsmarktforschung aus der Sicht eines Investitionsgüterherstellers, Köln (Bundesstelle für Außenhandelsinformation/Institut rur Außenwirtschaft GmbH) Lavrakas, P.J. (1993): Telephone Survey Methods, 2nd ed., Newbury Park Lazarsfeld, P.F./ Fiske, M . (1938): The "Panel" as a New Tool for Measuring Opinion, in: Public Opinion Quarterly, 2 (1938), 596-612 Learner, E.E. (1978): Specification Searches

New York

Lehmeier, P./Segler, K. (1985): Möglichkeiten der Kontrolle von Non-ResponseVerhalten bei schriftlichen Befragungen, in: Marketing ZFP, 1/1985, 47-51 Leiner, B. (1994): Stichprobentheorie, 3. Aufl., München Leitherer, E. (1989): Betriebliche Marktlehre, 3. Aufl., Stuttgart Lindenlaub, S. (1984): Einstellungen und Handeln, Göttingen Linder, A. (1964): Statistische Methoden für Naturwissenschaftler, Mediziner und Ingenieure, 4. Aufl., Basel Lindman, H . R . (1992): Analysis of Variance in Experimental Design, New York Lingenfelder, M./Schneider, W . (1991): Die Kundenzufriedenheit. Bedeutung, Meßkonzept und empirische Befunde, in: Marketing ZFP, 2/1991,109-119 Litz, U.P. (2000): Multivariate Statistische Methoden, München Löffler, U. (1999): Die Historie der ADM-Stichproben, in: ADM/AG.MA (Hrsg.) (1999), S. 61-68 Lodge, M . (1981): Magnitude Scaling, Beverly Hills Lohmeier, F. (1959): Der Warentest, Essen Lohmöller, J.-B. (1989): Latent Variable Path Modeling with Partial Least Squares, Heidelberg Long, J.S. (1983a): Confirmatory Factor Analysis. ..., Beverly Hills Long, J.S. (1983b): Covariance Structure Models

Beverly Hills

Luce, R.D./Tukey, J . W . (1964): Simultaneous Conjoint Measurement: A New Type of Fundamental Measurement, in: Journal of Mathematical Psychology, 1 (1964), 1-27 Luck, D.J./Rubin, R.S. (1987): Marketing Research, 7th ed., Englewood Cliffs Lüninghöner, K.H. (1984): "New York wird im Pferdemist ersticken". Strategische Marktforschung auch in kleinen und mittleren Pharma-Unternehmen, in: Pharma-Marketing Journal, 3/1985, 81-86

562

Literaturverzeichnis

Lusti, M . (2002): Data Warehousing und Data Mining, 2. Aufl, Berlin M MacLachlan, J.M./Myers, J.G. (1983): Using Response Latency to Identify Commercials That Motivate, in: JAR, 23 (1983), 51-57 Magens, Κ. (1963): Was kann die Image-Forschung für die Praxis leisten? in: Markenartikel , 25 (1963), 945-960 Magidson, J. (1994): The CHAID Approach to Segmentation Modeling, in: Bagozzi, R. (ea.), Advanced Methods of Marketing Research, Cambridge 1994, S. 118159 Maguire, R./Wilson, T.C. (1983): Banners or Cross-Tabs? ..., in: Marketing News, May 13, 1983, 10 Mangione, T.W. (1995): Mail Surveys...., Thousand Oaks Martin, M . (1992): Mikrogeographische Marktsegmentierung, Wiesbaden Maslow, A . H . (1954): Motivation and Personality, New York Mason (et al., 1973), K.O./Mason, W.M./Winsborough, H.H./Poole, W.K.: Some Methodological Issues in Cohort Analysis of Archival Data, in: American Sociological Review, 38 (1973), 242-258 Matiaske, W./Dobrov, J./Bronner, R. (1994): Anwendung der Korrespondenzanalyse in der Imageforschung. ..., in: Marketing ZFP, 1/1994, 42-54 Mayring, P. (1993): Qualitative Inhaltsanalyse, 4. Aufl., Weinheim (7. Aufl. 2000) Mazanec, J. (1976): Die Schätzung des Beitrags einzelner Produkteigenschaften zur Markenpräferenz als Problem der polynomialen Verbundmessung ..., Wien Meffert, H. (1992): Marketingforschung und Käuferverhalten, 2. Aufl., Wiesbaden Meinefeld, W . (1977): Einstellung und soziales Handeln, Reinbek Meissner, H.G./Winkelgrund, R. (1982): Internationales Marketing als Herausforderung deutscher Unternehmen, in: Marketing ZFP, 2/1982, 115-121 Meissner, H.G. (1996): Internationales Marketing als Erfolgsfaktor deutscher Unternehmen, in: Ahsen, A.v./Czenskowsky, T. (Hrsg.) (1996), S. 49-64 Merk, G. (1962): Wissenschaftliche Marktforschung, Berlin Merten, K. (1995): Inhaltsanalyse, 2. Aufl., Opladen Mertens, P. (Hrsg.) (1994): Prognoserechnung, 5. Aufl., Heidelberg Meyer, M/Diehl, M.-J./Wendenburg, D. (2000): Korrespondenzanalyse, in: Herrmann/Homburg (Hrsg.) (2000), S. 513-548 Meyer, W./Fischer, M . (1975): Methoden zur Investitionsgütermarktforschung, Berlin Michaletz, H . (1959): Marktforschung der Versicherungswirtschaft, die Aufgabe der Zukunft. Dargestellt und erläutert am Beispiel der Lebensversicherung, Berlin Miles, M.B./Huberman, A.M. (1994): Qualitative Data Analysis, 2nd ed., Thousand Oaks Mitchell, A.A./Olson, J . C . (1981): Are Product Attribute Beliefs the only Mediator of Advertising Effects on Brand Attitude, in: JMR, 18/1981, 318-332

Literaturverzeichnis

563

Mochmann, E. (1980): Methoden und Techniken automatisierter Inhaltsanalysen, in: ders. (Hrsg.), Computerstrategien für die Kommunikationsanalyse, Frankfurt/Main Möhring, P. (1963): Gewerblicher Rechtsschutz und Umfrageforschung, in GFMMitteilungen, 3/1963, 69-75 Mohme, J. (1995): Der Einsatz von Kundenkarten zur Verbesserung des Kundeninformationssytems im Handel, in: Ahlert/Olbrich (Hrsg.) (1995), S. 283-299 Morgan, D.L./Krueger, R.A. (1998): The Focus Group Kit, Thousand Oaks Moriarty, R.T. (1983): Industrial Buying Behavior, Lexington Morrison, D.F. (1984): Multivariate Statistical Methods, 3rd ed., New York Moser, H . (1978): Aktionsforschung als kritische Theorie der Sozialwissenschaften, 2. Aufl., München Mosteller, F./Tukey, J.W. (1977): Data Analysis and Regression, Reading Müller-Hagedorn, L. (1986): Das Konsumentenverhalten, Wiesbaden Müller, Ρ Η . / N e u m a n n , P./Storm, R. (1979): Tafeln der mathematischen Statistik, 3. Aufl., Leipzig Mueller, R.O. (1996): Basic Principles of Structural Equation Modeling. An Introduction to LISREL and EQS, New York Ν Neave, H . R . (1998): Statistics Tables, New York Neibecker, B. (1983a): Elektronische Datenerhebung. Computergestützte Reaktionsmessung, in: Innovative Marktforschung Würzburg 1983, S. 209-275 Neibecker, B. (1983b): Computerkontrollierte Magnitudeskalierung: Eine kausalanalytische Validierung, in: Marketing 2FP, 3/1983, 185-189 Neider, J.A./Wedderburn (1972): Generalized Linear Models, in: J. Roy. Stat. Soc., A, 135 (1972), 370-383 Neter, J./Wasserman, W./Kutner, M.J. (1990): Applied Linear Statistical Models. Regression, Analysis of Variance und Experimental Designs, 3rd ed., Boston Neubeck, G. (1964): Praktische Marktforschung und Meinungsforschung in Südostasien, in: Kleiner Almanach der Marktforschung 1964 (5. Jg. - hrsg. v. EMNID), S. 133-141 Nieschlag, R./Dichtl, E./Hörschgen, H . (1994): Marketing, 17. Aufl., Berlin (18. Aufl. 1997) Noelle-Neumann, E. (1958): Spekulative oder exakte Marktforschung? in: Die Anzeige, 34 (1958), 194-200 Noelle(-Neumann), E. (1963): Umfragen in der Massengesellschaft

Reinbek

Noelle-Neumann, E./Petersen, T. (1996): Alle, nicht jeder. Einführung in die Methoden der Demoskopie, München (Neubearbeitung von Noelle 1963; Neuausgabe - „3. Aufl." - Berlin 2000) Noelle-Neumann, E./Schramm, C. (1961): Umfrageforschung in der Rechtspraxis, Weinheim

564

Literaturverzeichnis

O Oerding, R. (1961): Organisatorische Voraussetzungen für die optimale Wirksamkeit der betrieblichen Marktforschung (Vortrag ..!), Marktforschung im Unternehmen, 1 (1961), 63-64 (in: Der Marktforscher, 5 [1961]) Oerter, R. (1971): Psychologie des Denkens, Donauwörth Ohbora, T./Parsons, A./Riesenbeek, H . (1992): Alternative Routes to Global Marketing, in: The McKinsey Quarterly, 3/1992, 52-74 Olbrich, R. (1995): Stand und Entwicklungstendenzen integrierter Warenwirtschaftssysteme, in: Ahlert/Olbrich (Hrsg.) (1995), S. 117-156 Osgood, C.E. (1952): The Nature and Measurement of Meaning, in: Psych. Bull., 49 (1952), 197-237 Osgood, C.E./Suci, G.J./Tannenbaum, P.H. (1957): The Measurement of Meaning, Urbana 1957 (Neudruck 1967) Ρ Palda, Κ. (1964): The Measurement of Cumulative Advertising Effects, Englewood Cliffs Parfitt, J.H./Collins, B.J.K. (1968): Use of Consumer Panels for Brand-Share Prediction , in: JMR, 5 (1968), 131-145 Patzer, G. (1995): Using Secondary Data in Marketing Research, Westport Pawlow, I.P. (1927): Conditioned Reflexes, London Payne, S.L. (1951): The Art of Asking Questions, Princeton Pelz, Ν . (1982): Analyse der verschiedenen aktualgenetischen Verfahren und die Beurteilung ihrer Einsatzmöglichkeiten in der Werbeforschungspraxis, Diss. St. Gallen Pessemier, E.A. (1966): New-Product Decisions...., New York Pfanzagl, J. (1971): Theory of Measurement, 2nd ed., Würzburg Piercy, N./Evans, M. (1983): Managing Marketing Information, London Planck, H . (1959): Zur Methode der Klassenzimmerbefragung, in: ZfMM, 2 (1959), Nr. 4, 511-516 Poggenpohl, M. (1994): Verbundanalysen im Einzelhandel auf der Grundlage von Kundenkarteninformationen, Frankfurt/Main Polasek, W. (1994): Explorative Datenanalyse, 2. Aufl., Berlin Popper, K.R. (1994): Logik der Forschung, 10. Aufl., Tübingen Porter, M.E. (1980): Competitive Strategy, New York 1980 (deutsch: Wettbewerbsstrategie, Frankfurt/Main 1983) Powelz, H.J.H. (1989): Ein Sytem zur Ist-Soll-Abweichungs-Ursachenanalyse von Erlösen. Anmerkungen zu dem gleichlautenden Aufsatz von Albers, in: ZfB, 59 (1989), 1229-1234 Prince, M. (1982): Consumer Research for Management Decisions, New York R Regli, J. (1988): Bankmarketing, 2. Aufl., Bern

Literaturverzeichnis

565

Rehder, H . (1975): Multidimensionale Produktmarktstrukturierung ... , Meisenheim a. Gl. Rehorn, J. (1965): Das Consumer Panel als Instrument der Absatzforschung, Diss. Mainz Rehorn, J . (1987): Werbetests, Kap. 7 (224 S.) von: Poth, L.G. (Hrsg.), Marketing, 2. Aufl., Neuwied (Loseblatt, lfd.) (auch als Buch, mit anderer Seitenzählung - und Stichwörterverzeichnis: Neuwied 1988) Reinhard, M. (1987): Wirtschaftsinformation in der Bundesrepublik Deutschland ..., München Reiners, W . (1996): Multiattributive Präferenzstrukturmodellierung durch ConjointAnalyse, Münster Reinmuth, J.E./Geurts, M . D . (1975): The Collection of Sensitive Information Using a Two-Stage, Randomized Response Model, in: J M R , 12 (1975), 402-407 Rentz, J.O./Reynolds, F . D . / S t o u t , R . G . (1983): Analyzing Changing Consumption Pattern with Cohort Analysis, in: J M R 20 (1983), 12-20 Revenstorf, D . (1976): Lehrbuch der Faktorenanalyse, Stuttgart Revenstorf, D . (1980): Faktorenanalyse, Stuttgart Reykowski, J . (1973): Psychologie der Emotion, Donauwörth Ring, E. (1992): Signale der Gesellschaft, Göttingen Ringel, K. (1963): Exportmarktforschung als Informationsaufgabe, Köln Rogers, E.M. (1988): Diffusion of Innovations, 4th. ed., New York Romesburg, H . C . (1984): Cluster Analysis for Researchers, Belmont (repr. 1990) Rosenthal, R . (1991): Meta-Analytic Procedures for Social Research, rev. ed., Newbury Park Ruge, H . D . (1988): Die Messung bildhafter Konsumerlebnisse, Heidelberg Rust, H . (1997): Das Anti-Trendbuch, Wien Ryder, N . B . (1965): The Cohort as a Concept in the Study of Social Change, in: American Sociological Review, 30 (1965), 843-861 Ryssel, C. (1985): Marktforschung - Investition in die Zukunft, in: PuA, 10/1985, 473 S Sachs, L. (1992): Angewandte Statistik,7. Aufl., Berlin (9. Aufl. 1999) Säuberlich, F. (2001): Web Mining ..., in: Wiedmann/Buckler (Hrsg.) (2001), S. 103121 Salcher, E. (1995): Psychologische Marktforschung, 2. Aufl., Berlin Samuels, J . (1995): Von Capi zu Happi, in: PuA, 1/95, 47-53, und 2/95, 27-34 Sander, M. (1994): Die Bestimmung und Steuerung des Wertes von Marken, Heidelberg Sattler, H . (1995): Markenbewertung, in: ZfB, 65 (1995), 663-682 Sattler, H . (1997): Monetäre Bewertung von Markenstrategien für neue Märkte, Stuttgart Sattler, H . (2001):Markenpolitik, Stuttgart

566

Literaturverzeichnis

Schäfer, E./Knoblich, H. (1978): Grundlagen der Marktforschung, 5. Aufl., Stuttgart (1. Aufl. 1928 - Schäfer, ... Marktbeobachtung -, 2. Aufl. 1940 - ders., ... Marktforschung) Schaefer, F. (Bearb.) (1979): Muster-Stichproben-Pläne..., hrsg. v. ADM, München Schaefer, H./Schebesch, K.B. (1996): KNN-Modelle und Zeitreihenprognosen - eine vorläufige Evaluation -, in: Ahsen, A.v./Czenskowsky, T. (Hrsg.) (1996), S. 599-620 Schär, J.F. (1923): Allgemeine Handelsbetriebslehre, 5. Aufl., Leipzig Scharf, A. (1991): Konkurrierende Produkte aus Konsumentensicht. ..., Frankfurt/Main Scheaffer, R.L./Mendenhall, W./Ott, L. (1990): Elementary Survey Sampling, 5th ed., North Scituate Schiffman, S.S./Reynolds, M.L./Young, F.W. (1981): Introduction to Multidimensional Scaling, New York Schmidt, R./Hahmann, U./Steffenhagen, M. (1996): Das Adequacy Importance Modell und die interpersonell gegenläufige Ausrichtung von Idealvektoren am Beispiel der Beurteilung eines studentischen Nonprofit-Organisation, in: Ahsen, A.v./Czenskowsky, T. (Hrsg.) (1996), S. 537-556 Schmidtchen, G. (1962): Der Anwendungsbereich betriebssoziologischer Umfragen, Bern Schneider, S. (1995): Optimale Randomized-Response-Designs-Techniken mit abhängiger Randomisierung, Dortmund Diss. Schneider, W.P.A. (1995): Promised Incentives, in: PuA, 4/1995, 29-31 Schnell, R. (1994): Graphisch gestützte Datenanalyse, München Schopphoven, I. (1991): Marktforschung für das internationale Marketing, in: JA VF, 1/1991, 28-47 Schreiber, K. (1966): Marktforschung, Berlin Schröder, D. (1958): Zum Problem der langfristigen Entwicklung der Nachfrage nach neuen Gütern, Kiel Diss. Schub von Bossiatzky, G. (1992): Psychologische Marketingforschung, München Schülen, H. (1985): Langfristige Automobilmarktprognosen, Idstein Schulz, W. (1970): Kausalität und Experiment in den Sozialwissenschaften, Mainz Schuman, H./Presser, S. (1996): Questions and Answers in Attitude Surveys, Thousand Oaks Schwarting, U. (1993): Institutionalisierung des Marketingkonzeptes durch ProduktManagement, Frankfurt/Main Schwarze, J. (1994): Netzplantechnik, 7. Aufl., Herne (8. Aufl. unter dem Titel „Projektmanagement mit Netzplantechnik" 2001) Schwedler, E. (1986): Jeans and Eau de Cologne...., in: Markenartikel, 48 (1986), 405410 Schweikl, H. (1985): Computergestützte Präferenzanalyse mit individuell wichtigen Produktmerkmalen, Berlin Schweizer, R. (1976): Empirische Rechtsforschung, in: JAVF, 22 (1976), 386-429

Literaturverzeichnis

567

Schweizer, R . / Q u i t t , H . (1985): Rechtstatsachenermittlung durch Befragungen, Köln Scott, J.E./Keiser, S.F. (1984): Forecasting Acceptance of New Industrial Products with Judgement Modeling, in: JoM, 48 (1984), 2, 54-67 Sedlmeyer, K.-J. (1983): Panelinformation und Marketing-Entscheidung, München Seitz, E./Meyer, W. (1995): Tourismusmarktforschung, München Sell, A. (1994): Internationale Unternehmenskooperationen, München Sen, A./Srivastava, M. (1997): Regression Analysis, 3nd corr. print., New York Sheikian, M. (1982): Pictorial Information Processing: A Selective Review, Arbeitspapier des Instituts für Konsum- und Verhaltensforschung an der Universität des Saarlandes, Saarbrücken Shepard, R.N. (1962): The Analysis of Proximities: Multidimensional Scaling with an Unknown Distance Function, in: Psychometrika, 27 (1962), 125-139 und 219-246 Shepard, R.N. (1972): A Taxonomy of Some Principal Types of Data and of Multidimensional Methods for Their Analysis, in: Shepard/Romney/Nerlove (ed.) (1976), S. 21-47 Shepard, R.N./Romney, A.K./Nerlove, S. (ed.) (1976), Multidimensional Scaling, Vol. I, Theory, New York Siebke, J. (1963): Die Automobilnachfrage. Die Nachfrage nach Personenkraftwagen in der Bundesrepublik Deutschland mit einer Prognose bis zum Jahr 1970, Köln Siller, H . (1985): Grundsätze des ordnungsmäßigen strategischen Controlling, Wien Simon, H . (1985): Strategisches Preismanagement, in: THEXIS, 2 (1985), 2-6 Simon, H . (1995): Preismanagement kompakt, Wiesbaden Simon, H./Kucher, E./Sebastian, K.-H. (1982): Scanner-Daten in Marktforschung und Marketingentscheidung, in: ZfB, 52 (1982), 555-579 Simon, H . / H o m b u r g , C. (Hrsg.) (1995): Kundenzufriedenheit, Wiesbaden (3. Aufl. 1998 - 4. Aufl., mit Homburg, C., allein als Hrsg., angekündigt) Skinner, B.F. (1938): The Behavior of Organismus - An Experimental Analysis, New York Skinner, B.F. (1973): Wissenschaft und menschliches Verhalten, München Smith, G . H . (1955): Warum Kunden kaufen. Motivforschung in Werbung und Verkauf, München 1955 (Originaltitel: Motivation Research in Advertising and Marketing - New York 1954, reprint Greenwood 1971) Sneath, P/Sokal, R. (1973): Numerical Taxonomy, San Francisco Sokal, R./Sneath, P. (1963): Principles of Numerical Taxonomy, San Francisco Sommer, J.W. (1963): Zur Praxis der Vercodung, in: GFM-Mitteilungen, 1/1963, 2835 Sonquist, J.A./Morgan, J.M. (1964): The Detection of Interaction Effects, Ann Arbor Sonquist, J.A./Baker, E.L./Morgan, J.M. (1974): Searching for Structure (Alias AID III), rev. ed., Ann Arbor

568

Literaturverzeichnis

Spearman, C. (1904): General Intelligence objectively determined and measured, in: American Journal of Psychology, 1904, 201-293 Späth, H . (1983): Cluster-Formation und -Analyse, München Spiegel, Β. (1961): Die Struktur der Meinungsverteilung im sozialen Feld, Bern Spiegel, B. (1970): Werbepsychologische Untersuchungsmethoden, 2. Aufl., Berlin Stadtler, K. (1985): Die Auswirkungen unterschiedlicher Rating-Skalen auf das Antwortverhalten von Befragten, in: marktforschungs-report, 3/1985, 7-10 Stahr, G. (1991): Internationales Marketing, Ludwigshafen (2. Aufl. 1993) Starch, D. (1966): Measuring Advertising Readership and Results, New York 1966 (deutsch: Anzeigenwirkung richtig planen und messen, München 1969) Stauss, B./Seidel, W . (1996): Beschwerdemanagement, München Steffenhagen, H . (1984): Ansätze der Werbewirkungsforschung, in: Marketing ZFP, 2/1984, 77-88 Steidl, P. (1977): Experimentelle Marktforschung, Berlin Stein, C. (1956): Inadmissibility of the Usual Estimator for the Mean of a Multivariate Normal Distribution, in: Proceedings of the Third Berkeley Symposium on Mathematical Statistics and Probability, 1 (1956), 197-206 Steinhausen, D./Langer, Κ. (1977): Clusteranalyse...., Berlin Stem, D.E./Steinhorst, R.K. (1984): Telephone Interview and Mail Questionnaire Applications of the Randomized Response Model, in: JASA, 79 (1984), 555-564 Stevens, S.S. (1946): On the Theory of Scales of Measurement, in: Science, (1946), 677-680 Stevens, S.S. (1975): Psychophysics, New York Stewart, D./Love, W.A. (1968): A General Canonical Correlation Index, in: Psych. Bull., 70 (1968), 160-163 Stewart, D.W./Kamins, M.A. (1993): Secondary Research, 2nd ed., Newbury Park Stockmann, R. (1995): Qualitätssicherung. Zum aktuellen Stand der Fernsehzuschauerforschung in Deutschland, in: PuA, 5/1995, 69-71 Strobel, L. (1983): Die Anwendbarkeit der Telefonumfrage in der Marktforschung, Frankfurt/Main Strong, E.C. jr. (1912): The Effect of Length of Series Upon Recognition Memory, in: The Psychological Review, 19 (1912), 447-462 Stroschein, F.R. (1965): Die Befragungstaktik in der Marktforschung, Wiesbaden Strothmann, K.-H. (1964): Methoden der Werbewirkungskontrolle für Konsumgüter- und Produktionsgüter-Anzeigen, in: Kleiner Almanach der Marktforschung 1964 (5. Jg. - hrsg. v. EMNID), S. 72-79 Sudman, S. (1976): Applied Sampling, New York Sudman, S. (1980): Improving the Quality of Shopping Center Sampling, in: JMR, 17 (1980), 423-431 Sudman, S./Bradburn, N.M. (1983): Asking Questions, San Francisco

Literaturverzeichnis

569

Τ Tabachnik, B.G./Fidell, L.S. (1996): Using Multivariate Statistics, 3rd ed., New York Theobald, A. (1998): Möglichkeiten der Sekundär- und Primärforschung im Internet, Kaiserslautern Theobald, A. (2000): Das World Wide Web als Befragungsinstrument, Wiesbaden Theobald, A./Dreyer, M./Starsetzki, T. (Hrsg.) (2001): Online-Marktforschung, Wiesbaden Thurstone, L.L. (1931): Multiple Factor Analysis, in: Psychological Review, 1931, 406-427 (vgl. auch das Buch unter dem gleichen Titel - Chicago 1947) Töpfer, A. (1996): Anforderungen und Probleme bei der Messung von Kundenzufriedenheit, in: Ahsen, A.v./Czenskowsky, T. (Hrsg.) (1996), S. 499-513 Torgerson, W.S. (1952): Multidimensional Scaling. ..., in: Psychometrika, 17 (1952), 401-419 Triandis, H.C. (1975): Einstellungen und Einstellungsänderungen, Weinheim Trommsdorff, V. (1975): Die Messung von Produktimages für das Marketing ..., Köln Trommsdorff, V. (1982): Kausalmodelle: Gegen Irrtum in der Marktforschung, in: Marktforschung, 26 (1982), 111-116 Trommsdorff, V. (1998): Konsumentenverhalten, 3. Aufl., Stuttgart Tryon, R.C. (1939): Cluster Analysis, Ann Arbor Tscheulin, D.K. (1996): Determinanten der Validität der Conjoint-Analyse, in: Ahsen, A.v./Czenskowsky, T. (Hrsg.) (1996), S. 585-596 Tschopp, A. (1991): Modellhaftes Denken in der Soziologie, Bern Tufte, E.R. (1983): The Visual Display of Quantitative Information, Ceshire Tukey, J.W. (1977): Exploratory Data Analysis, Reading Tversky, Α. (1967): A General Theory of Polynomial Conjoint Measurement, in: Journal of Mathematical Psychology, 4 (1967), 1-20 Twedt, D.W. (ed.) (1978): 1978 Survey of Marketing Research, Chicago Twedt, D.W. (ed.) (1983): 1983 Survey of Marketing Research, Chicago V Vazanna, G.A./Bachmann, D. (1994): Fax Attracts, in: MR, 6 (1994), 19-25 W Warner, S.L. (1965): Randomized Response: A Survey Technique for Eliminating Evasive Answer Bias, in: JASA, 60 (1965), 63-69 Webb (et al.1981 ), E.T./Campbell, C.T./Schwartz, R.D./Sechrest, L./Grove, J.B.: Nonreactive Measures in the Social Sciences, 2nd ed., Boston Weber, E. (1974): Einführung in die Faktorenanalyse, Jena Weber, G. (1996): Strategische Marktforschung, München Weber, R.P. (1985): Basic Content Analysis, Beverly Hills (repr. 1992)

570

Literaturverzeichnis

Weede, E./Jagodzinski, W. (1977): Einführung in die konfirmatorische Faktorenanalyse, in: Zeitschrift für Soziologie, 6 (1977), 315-333 Weiber, R. (1984): Faktorenanalyse, St. Gallen Weiber, R./Rosendahl, T. (1996): Einsatzmöglichkeiten alternativer Untersuchungsansätze der Conjoint-Analyse, in: Ahsen, A.v./Czenskowsky, T. (Hrsg.) (1996), S. 557-584 Weiers, R.M. (1988): Marketing Research, 2nd ed., Englewood Cliffs Weinberg, P. (1976): Produktspezifische Markentreue von Konsumenten, in: ZfbF (1976), 276-297 Weinberg, P. (1986): Nonverbale Marktkommunikation, Heidelberg Wendt, F. (1960): Wann wird das Quotenverfahren begraben?, in: AStA, 44 (1960), 35-40 Wendt, F. (1964): Bewußte Auswahlverfahren, in: Marktforschung im Unternehmen, 4 (1964), 15-23 (in: Der Marktforscher, 8 [1964]) Werner, A. (1999): Kontaktmessung im WWW, In: Batinic et al. (Hrsg.) (1999), S. 213-225 Widrick, S.M./Isselhardt, B./Moss, L.M. (1983): Graphic Rating Scales: A Comparison of the Continuum with Five - and Seven - Category Scales, in: Darden/Monroe/Dillon (ed.) (1983), S. 9-11 Wiedemann, J. (1985): GfK-Fernsehforschung. Erste Erfahrungen mit dem neuen System. Oaer: warum "Der Alte" auf einmal mehr Zuschauer hat, in: Media Perspektiven, 2/1985, 131-141 (und 4/1985, 288) Wiedemann, J. (1987): Die ARD im AG.MA-Partnerschaftsmodell, in: MediaSpectrum, 8/1987, 10-15 Wiedmann, K.-P./Buckler, F. (Hrsg.) (2001): Neuronale Netze im MarketingManagement, Wiesbaden Wimmer, R.-M. (1988): Menschen sind Augentiere, in: asw, 2/88, 88-98 Windhorst, K.-G. (1985): Wertewandel und Konsumentenverhalten. ..., Münster Winer, B.J./Brown, D.R./Michels, K.M. (1991): Statistical Principles in Experimental Design, 3rd ed., New York Wiseman, F./Schafer, M./Schafer, R. (1983): An Experimental Test of the Effects of a Monetary Incentive on Cooperation Rates and Data Collection Costs in Central-Location Interviewing, in: JMR, 20 (1983), 439-442 Wissel, F. (1960): Marktforschung für Produktionsgüter, in: GFM-Mitteilungen, 1/1960, 10-13 Wiswede, G. (1973): Motivation und Verbraucherverhalten, 2. Aufl., München Wittink, D./Vriens, M./Burhenne, W. (1994): Commercial Use of Conjoint Analysis in Europe: Results and Critical Reflections, in: International Journal of Research in Marketing, 11 (1994), 41-52 Wold, H. (1982): Soft Modeling, in: Jöreskog, K.G./ Wold, H. (ed.), Systems Under Indirect Observation, P. II, Amsterdam 1982, S. 1-54 Wolf, H.E. (1963): Methodologische und empirische Probleme der Imageforschung, in: GFM-Mitteilungen, 1/1963, 10-17 Wollenberg, A.L. van den (1977): Redundancy Analysis: An Alternative for Canonical Correlation Analysis, in: Psychometrika, 42 (1977), 207-219

Literaturverzeichnis

571

Wülker, G. (1964): Fragebogen in Asien, ..., in: Kleiner Almanach der Marktforschung 1964 (5. Jg. - hrsg. v. EMNID), S. 120-132 Y Yankelovich, Skelly and White Inc. (1981): LTM Estimating Procedures, in: Wind, Y./Mahajan, V./Cardozo, R.N. (ed.), New Product Forecasting, Lexington 1981, S. 249-268 Young, F.W. (1972): A Model for Polynomial Conjoint Analysis Algorithms, in: Shepard/Romney/Nerlove (ed.) (1972), S. 69-104 Yu, J./Cooper, H . (1983): An Quantitative Review of Research Design Effects on Response Rates to Questionnaires, in: JMR, 20 (1983), 36-44 Ζ Zeisel, H . (1968): Say it with Figures, 5th ed. New York 1968 (deutsch: Die Sprache der Zahlen, Köln 1970) Zelazny, G. (2001): Say it with Charts, 4th ed., Homewood (deutsch: Wie aus Zahlen Bilder werden, 5. Aufl., Wiesbaden 1999) Zentes, J. (1984): Technologiedynamik und Marktforschung, in: Zentes, J. (Hrsg.) (1984), S. 1-17 Zentes, J. (1987): EDV-gestütztes Marketing, Berlin Zentes, J. (1994): Elektronische Panels und Single-Source-Ansätze in der Konsumentenforschung, in: Forschungsgruppe Konsum und Verhalten (Hrsg.), Konsumentenforschung (Festschrift Kroeber-Riel), München 1994, S. 349-365 Zentes, J. (Hrsg.) (1984): Neue Informations- und Kommunikationstechnologien in der Marktforschung, Berlin Zentes, J./Anderer, M. (1996): Management der Internationalisierung europäischer Handelsunternehmen, in: Ahsen, A.v./Czenskowsky, T. (Hrsg.) (1996), S. 79106 Zimmermann, E. (1972): Das Experiment in den Sozialwissenschaften, Stuttgart Zinkhan, G.M./Burton, S./Wallendorf, M. (1983): Marketing Applications for Snowball Sampling: Potential Benefits and Problems, in: Darden/Monroe/Dillon (ed.) (1983), S. 5-8

Stichwortverzeichnis (Kursivdruck verweist auf das Glossar)

A „add a digit"-Methode 75 abgeleitete Ahnlichkeits-/Präferenzdaten 310 abhängige Variable 237 Ablaufordnungsfragen 121 Ablenkungsfrage 121 Absatzforschung 1 Absatzpotential 369, 523 Absatzvolumen 369, 523 Abschneideverfahren 126 absolute Häufigkeiten 218 Abweichungsquadrat- und Kreuzproduktsummem-Matrix s. Kreuzprodukt- Matrix ACM 340 ad hoc-Forschung 187 Adaptive Conjoint Analysis (ACA) 341, 344 Adjunkte 487 adjustierte Häufigkeiten 219 ADM 473 ADM-Master-Sample 136ff. Ähnlichkeitsdaten 310 Ahnlichkeitskoeffizienten 324f. Ahnlichkeitsskalierung 31 Iff. after-only-Design 172 AG.MA 405 AGF 408 agglomerative Verfahren 326ff. AID-Verfahren 28 Iff., 523 AIDA-Formel 402 aided recall 411 aktive Variablen 331 Aktivierung 3 Iff. Aktivierungsmessung 163 Aktualgenese 45 akustischer Test 385 all-possible-subsets regression 248 Allensbacher Werbeträgeranalyse (AWA) 406 allgemeine Auslandsstatik (des Statistischen Bundesamtes) 428

allgemeines lineares Modell 263 ALSCAL 318 alternative Merkmale 10 Alternativfrage 104ff., 523 Alternativhypothese 62 Alterseffekt 228 analytische Fragen 120 analytische Rotation 304 ANCOVA 263 Anfragen- und Verkaufskontrolle 413 Anmutung 45 ANOVA 263 Anpassung (bei der Hochrechnung) 140 Anpassungstest 60 Antwortquote 141 Antwortzeit 98, 523 Arbeitsmarktforschung 2 arithmetisches Mittel 49, 523 arithmetischer Maßstab 222 asymmetrische Plots (bei der Korrespondenzanalyse) 290 Audiometer 409 Augenkamera 162 Augenschein-Validität s. unter InhaltsValidität AUKL 333 Ausfallquote 140 Auslandshandelskammern 430 Auslandsmarktforschung 424ff. Auslosen 127 Ausschöpfungsgrad (-quote) 140 Auswahl aufs Geratewohl s. willkürliche Auswahl Auswahl mit Anordnung 130, 523 Auswahl mit Schichtung 130, 524 Auswahl mit ungleichen Wahrscheinlickeiten 129 Auswahlfehler 12, 524 Auswahlgrundlage 131 Auswahlsatz 524 Auswahltechniken 126ff.

Stichwortverzeichnis

Auswahlverfahren 124ff. Auswürfeln 127 Autocorrelation 249, 524 automatische Klassifikation 320 Average Linkage 328 Awareness Set 47 Β Balkendiagramm s. Stabdiagramm Ballonfrage 94 Bankenmarktforschung 437 Baum-Analyse s. AID-Verfahren BDZV 414 before-after with control group-Design 174 before-after-Design 172 Befragung 67ff., 524 Befragungsexperiment 170 Befragungsstrategie 83ff. Behavior Scan 394 Benefit-Segmentation 348 Beobachter 160f. Beobachtereinfluß 165 Beobachtung 158ff., 524 Beobachtungs-Effekt 166, 524 Beobachtungsexperiment 170 Beobachtungsgesamtheit 165 bereinigtes Bestimmtheitsmaß 245 berufsethische Fragen 474f. Beschaffungsmarktforschung 2 Beschwerdeanalyse 398 Bestandsaufnahmen 164 Bestimmtheitsmaß 239, 524 beta-Koeffizienten s. standardisierte Regressionskoeffizienten Beteiligungsuntersuchungen 82 betriebliche Marktforschung 443ff. betriebswirtschaftliche Marktforschung 443 Beurteilungsstichprobe 126 bewußte Auswahl 124 Bias s. systematischer Fehler Bildenttäuschungstest 95 Bildschirmbefragung 80 bibliographische Datenbanken 204 bifaktorieller Zufallsplan 180 Bindungen 11

573

Binomialkoeffizient 53 Binomialverteilung 55, 58 biotische Situation 160 bivariate Analyse 213 bivariate Korrespondenzanaylse 289 Black-Box-Modell s. S-R-Modell Blickaufzeichnung 162 Blindtest 384, 524 Blocking 179 BMDP 215 Branchendatenbanken 209, 498 Bravais-Pearson'scher Maßkorrelationskoeffizient 238 Browser 207 Bruttostichprobe 140 Buchstabenauswahl 128 Bundesstelle für Außenhandelsinformation (BfAI) 429 Buying Center 420 Buying Cycle 396 BVM 424 C Call-Center 76 CAPI 80 Car Clinic 386 Caravan-Test 386 Case Research 23 CATI 79 CATS 80 CEDAR-Test s. unter Recall-Verfahren Central-Location Interviewing 79 Centroid 273 CHAID 284 Chaining Effect 327 charakteristische Gleichung (einer Matrix) 489 Chernoff Faces 223 Chi-Quadrat-Analyse 252ff. Chi-Quadrat-Distanz 289 Chi-Quadrat-Verteilung 477ff. chopping the tree 326 city-block-Metrik 312 Click-Me-Marktforschung 81 Clumping-Verfahren 321 Clusteranalyse 319 ff., 525 Code, Codieren 212

574

Stichwortverzeichnis

Codebuch, Codeplan 212, 525 Cofaktor 487 Comparative Rating Scale 114 Complete Linkage 327 Conjoint Measurement 339ff., 525/ conjoint tetrads 316 Consumer Research 3 Consumer-Panel 184 Content Analysis 223 Contrived Situation 161 convenience sample 125 Copy-Test 403, 526 Coupon-Test s. Anfragen- und Verkaufskontrolle Coverage 185 Cramér's V 255 Critical Incident Technique 398 Cross Modality Matching 112 Customer Advisory Board 400 Customer Satisfaction Measurement (CSM) s. Kundenzufriedenheitsmessung customer spotting-Verfahren 436 cut off-Verfahren s. Abschneideverfahren

D DAR-Test s. unter Recall-Verfahren Data Mining 216 Data Warehouse 216 Datenanalyse(programm)system 215f., 526

Dateneingabe 211 Datenerfassung 211 Datenmatrix 213, 526 Datenschutz 474f. Degustationstest 385 Delphi-Methode 69 demoskopische Marktforschung 3 Dendrogramm 326 Density-Methoden 321 Dependenz-Analyse 214 Design-Matrix 256 desk research 22 Determinante (einer Matrix) 489 Determinationskoeffizient s. Bestimmtheitsmaß

Dezimalwürfel 127 Diagonalmatrix 483 Diagramme 220ff. Dialogfrage 106 dichotomes Merkmal 10, 218 dichtes Mittel s. Modus Dienstleistungsmarktforschung 433ff. Dimension (einer Matrix) 482 direkte Befragung 91 disjoint tetrads 316 disjunkte Verfahren 321 diskrete Merkmale 9 Diskriminanzanalyse 271ff., 526 Diskriminanzfunktion 273 Diskriminanzkriterium 274 Diskriminanzwerte 278 Diskriminanz-Validität s. unter Konstrukt-Validität Dispersionsparameter s. Streuungsmaße dissimilarities 311 Distanzen 312 Distribution Research 366 distributionfreie Diskriminanzanalyse 272 divisive Verfahren 326f. DMMV 414 Dollar-Metrik 347 Doppeln und Streichen 142 Double-Change-Over-Design 181 Dreieckskoordinaten 222 Dreiecksmatrix 482 dual scaling s. Korrespondenzanalyse Duke'scher Test 164 Dummy-Testing s. unter RecognitionVerfahren dummy-Variablen-Regression 256f. Dyaden s. Tetraden dynamische Motivtheorie 35 E ΕΑΝ 187 echtes Experiment 169 ECTA 257 Eigenstruktur 302, 489 Eigenvektor 302, 489 Eigenwert 302, 489

Stichwortverzeichnis

Eindruckstest 386 Einfach-Regression 237ff. einfache Häufigkeitsanalyse s. Häufigkeitsanalyse einfaktorielle Pläne Eingliederungsfragen 82 Einheitsmatrix 483 einseitiger Test 62 Einstellung 37ff. Einstichproben-Gauß-Test 63 Einwegscheiben 162 Einzelhandelsmarktforschung 434ff. Einzelhandels-Panel 184 Einzelpersonen-Panel 186 Einzelrestfaktoren 299 Einzeltest 385 Eisbrecherfrage s. Kontaktfrage Electronic Diary 188 elektrodermale Reaktion 163 Elemente 9 Emotionen 33ff. endogene Variable 352 Endverbraucher-Panel 185 Entrapment Studies 161 Entscheidungs-Alternativen-Test 60 EQS 352 Equamax-Rotation 305 ereignisorientierte Verfahren 398 Erfahrungstest 386 Erinnerungsverfahren s. Recall-Verfahren erklärende Variable 237 erklärte Streuung 240 erklärte Variable 237 Ersatz-Nachfrage 370 Erwartungshäufigkeiten 253 Erwartungstreue 57 erweiterte Experimente 169,176ff. euklidische Distanz 312 Eurometer 409 Eurostat 429, 430 Evoked Set 47 exhaustive Verfahren 321 exogene Variable 352 Experiment 168ff., 527 Expertenbefragung 68f.

575

Experten-Validität s. unter InhaltsValidität explorative Datenanalyse 24 Exponentialfunktion 242 Exponentialpapier 222 Exportmarktforschung 424 Exportquote 424 ex-post-facto-Experiment 170 externe Datenbanken 204ff. externe Informationen 197ff. externe Skalierung 311 F F-Verteilung 246, 477ff. Fachhandels-Panel 185 Fachserien 198 Fälscherproblem 90 Faktorenanalyse 296ff., 527 Faktorenextraktion 302ff. Faktorenladungen 299 Faktorenmuster 305 Faktorenrotation 304ff. Faktorenstruktur 305 Faktorenwerte 299, 307f. faktorielle Pläne 180 faktorielle Transformation 142 Faktorwirkung 171 Farthest Neighbour s. Complete Linkage fehlende Werte 219 Fehler 1. Art 60 Fehler-in-den-Variablen-Modell 353 Fehlerrechnung 142f. Fehlerspanne 53 Feldanteil 373 Feldforschung 22 Feldorganisationen 86, 461 Feldverschlüsselung 103 field research 22 Filterfrage 121 Finanzmarktforschung 2 Fishbein-Modell (der Einstellungsmessung) 39 Flächenauswahl 130, 527 Flächendiagramm 221 Flop-Raten 382 Focus Groups 97

576

Stichwortverzeichnis

Folder-Test s. unter Recognition-Verfahren forced-exposure-Verfahren 412 forensische Marktforschung 439 Forschungsbericht 17f. Forschungsdesign s. Research Design Forschungsplan 20 Forschungssender 81 Fortschreibungsgleichung 190 Foto-Zuordnungstest s. Personenzuordnungstest Fractionation Scale 115 Fragebogenumfang 122 Frageformulierung 122 Frageinstrumentarium 99ff. Fraktile 51 freie Hochrechnung 139 Freiheitsgrade 58, 527 Freitextrecherche 204 Fremdenverkehrsmarktforschung 437 Fundamentaltheorem der Faktorenanalyse 299 G Gabelungsfrage 121 Ganzheitspsychologie 44 Gebrauchsanweisungstest 385 Gebrauchsgüter-Panel 186 gebundene Hochrechnung 139 Geburtskohorten 228 Geburtstagsregel 137 Geburtstagsverfahren 128 gemeinsame Faktoren 299 Genauigkeitsgrad s. Sicherheitsgrad Generationeneffekt s. Kohorteneffekt Geruchstest 385 geschichtete Stichproben s. Auswahl mit Schichtung Geschichtseffekt s. Periodeneffekt geschlossene Frage 103ff., 428 Geschmackstest 385 GfK-Meter 408 G L I M 257 Gösset-Verteilung s. t-Verteilung GPC-Skala 346 grand mean 265 Greiftest 385

griechisch-lateinisches Quadrat 181 Großhandels-Panel 184 Großverbraucher-Panel 184 Grundgesamtheit 123 Gruppenbildung 212 Gruppendiskussionsverfahren (Gruppeninterview) 97, 528 GSK-Ansatz zur Analyse multipler Kontingenz-Tabellen 257 H Händlerbefragung 69 Häufigkeitsanalyse, Häufigkeitsverteilung 217ff., 528 Häufigkeitspolygon 222 Halo-Effekt 44, 528 Haupt-Effekte-Design (HED) 343 Hauptkomponentenanalyse s. Faktorenanalyse Haushalts-Panel 185 Haushaltsstichprobe 129,137, 140, 528 hierarchical tree s. Dendrogramm hierarchische Effekte s. nested models hierarchische Verfahren 325ff. hill climbing-Verfahren 330 Hochrechnung 139f. home use-Test 386 H T T P 207 Hybrid Conjoint Analysis ( H C A ) 341, 345 hyperlateinische Quadrate 181 Hypothesen-Test 60 I Identitätsmatrix s. Einheitsmatrix Image 40 Image-Analyse 300 Imageryforschung 41 Impact-Test s. unter Recall-Verfahren Index of Agreement 314 Indirect Cross Modality Matching 112 indirekte Befragung 91 Individual-Panel s. EinzelpersonenPanel I N D S C A L 318 industrielle Marktforschung s. Investitionsgütermarktforschung

Stichwortverzeichnis

Industriestruktur 377 InfoScan 191 information broker 209 Informationsüberlastung 43 Informationsvermittlungsstellen s. information broker Inhaltsanalyse 223f. Inhalts-Validität 15, 528 Inhome-Scanning 187 Instituts-Marktforschung 455ff. instrumenteile Fragen 120 Interdependenz-Analyse 214 Internationale Handelskammer 430 internationale Marktforschung s. Auslandsmarktforschung interne Informationen 196 interne Skalierung 311 Interne-Konsistenz-Reliabilität 15, 529 Internet 206ff. Internet-Marktforschung 81 Interrupted Time Series Design 173 Intervallschätzung 52 Intervallskala 11, 529 intervenierende Variablen 29 Interviewer-Bias s. Interviewereinfluß Interviewereinfluß 89, 529 Interviewer-Organisation 86ff. Interviewerleitfaden 84 Inverse (einer Matrix) 486f. Investitionsgütermarktforschung 416ff. Involvement 46 Irradiationsphänomen 44 Irrtumswahrscheinlichkeit 53 Item 105, 529 Itemized Category Scale 109 IVW 405

J

Ja-Nein-Frage 104f., 529 joint space (bei der MDS) 311 judgemental sample 126 Κ k-means-Technik 330 Kaiser-Kriterium 303 Kamera-Lesebeobachtung 162 Kanonische Analyse 284ff., 529

577

Kanonische Gewichte 286 Kanonische Korrelationskoeffizienten 286 Kanonische Ladungen 286 Kanonische Variaten 285 kardinales Meßniveau 11 kategoriale Regression 257 Käufer-Anteil 373 Käuferverhalten 27 Kaufkraftkennziffern 377, 431 Kausalmodell s. Kovarianzstrukturanalyse Klassenzimmerbefragung 78 Klassifikationsanalyse 272 klassische Experimente 169, 171ff. Klumpenauswahl 130, 530 Klumpeneffekt 131 Körperdiagramm 221 Kognition 43ff. Kohortenanalyse 228 ff., 530 Kohorteneffekt 229 Kohorten-Sukzession 231 Kommunalität 300 Kommunalitätenschätzung 301f. Konditionierung 47 Konfidenzintervall 52 Konfigurationsfrequenzanalyse (KFA) 321 konfirmatorische Analyse 24 konfirmatorische Faktorenanalyse 301, 351 Konfusionsmatrix 278 Konkurrent-Validität s. unter Kriteriums-Validität Konkurrenzforschung 2 Konstantsummenskala 115, 530 Konstrukt-Validität 15, 530 Konsumentenforschung 3 Konsumentenverhalten 3, 27 Konsumforschung 3 Kontaktfrage 121 Kontingenzanalyse 250ff., 530 Kontingenztafeln 224 kontinuierliche Mermale 9 Kontrastgruppenanalyse s. AID-Verfahren Kontrollmarkt 392

578

Stichwortverzeichnis

Kontrollgruppe 171 kontrollierte Beobachtung s. standardisierte Beobachtung kontrolliertes Wiedererkennungsverfahren 410 Konvergenz-Validität s. unter Konstrukt-Validität Konzentrationsprinzip s. Abschneideverfahren Konzepttest 383, 531 koordiniertes AG.MA-Stichprobensystem s. ADM-Master-Sample Korrelationsanalyse 236ff. Korrelationskoeffizient 238, 531 Korrelationsmatrix 285, 296, 531 Korrespondenzanalyse 258, 288ff, 531 Kovarianz 239, 531 Kovarianzanalye 263 Kovarianzmatrix 294 Kovarianzstrukturanalyse 351ff., 531 Kreisdiagramm 221 Kreuzprodukt-Matrix 294 Kreuztabulierung, Kreuzauswertung 224ff., 532 Kreuz-Validierung 16, 279 Kriterion 237 Kriteriums-Validität 16, 532 kumulierte Häufigkeiten 219 Kunden(um)laufstudien 435 Kundenanalyse 434, 437 Kundenzufriedenheitsmessung 394ff. Kurvendiagramm 221 KYST315 L Laboratoriumsbeobachtung 159 Laboratoriumsexperiment 170 Labortestmarkt s. Testmarkt-Simulation Ladentest 391, 532 LAE 406 Länderportfolio 43 lf. Länderrisiko 432 Längsschnittanalyse 229, 532 Lagrange-Multiplikatoren 302, 489 Lateinisches Quadrat 179, 270ff. latente Variable 353

Leerinterview 135 Lehrfrage 121 Leistungsindex s. regionale Marktausschöpfung Leitstudie 20, 532 Lernprozesse 47 Leseverhaltensbeobachtung 162 Lichtschranken 162 Likert-Skala 115, 532 lineare Diskriminanzanalyse 273ff. lineare Kontraste 264 Liniendiagramm 221 LINMAP 349 LISREL 352ff. Little Jiffy 306 log-lineare Modelle 258 logarithmischer Maßstab 222 Lokalisationsparameter s. Mittelwerte Lotterie-Methode 412 LpwS 405 LTM 394 M M-D-SCAL 314 Magnitude-Skalierung 11 Iff., 532 Mahalanobis-Abstand (-Distanz) 277, 323 MAKADOM 190 Mall Intercept 79 M A N C O V A 263 Manhattan-Metrik s. city block-Metrik manifeste Variable 353 M A N O VA 263 Markenwahl-Modelle 378 Marken wert 367 Market Research 1 Market Track 191 Marketingforschung 1 Marketing Research 1 Markoff-Ketten 378 Markt- und Absatzprognosen 378ff. Marktabgrenzung 368 Marktanalyse 3 Marktanteil 370, 372ff., 533 Marktausschöpfungsgrad 369 Marktbeobachtung 3 Markterkundung 1

Stichwortverzeichnis

Marktforschung, Abgrenzung Iff. Marktforschung, Definition 1, 533 Marktforschung, Periodisierung 4ff. Marktforschungsabteilungen der Werbeagenturen 461 Marktforschungsausbildung 47 Iff. Marktforschungsberater 460 Marktforschungsbudget 469 Marktforschungsinstitute s. Institutsmarktforschung Marktforschungskosten 465ff. Marktforschungsprozeß 16ff. Marktforschungsumsätze 469f. Marktforschungsverbände 473ff. Marktindikatoren (Marktindizes) 376£f. Marktkapazität 369, 533 Marktpotential 369, 533 Marktsättigung 370 Markttest 391, 533 Markt volumen 369 Marktwachstum-Marktanteil-Matrix 374 Maslow'sche Bedürfnispyramide 36 Matching 179 Matrizen 482ff. Mediaforschung s. Werbeträgerforschung Median 50, 533 Mediaselektionsmodelle 404 Medien-Analyse (MA) 405 Mehrfach-Auswahl-Frage 106ff., 533f. Mehrfachnennungen 108, 220 Mehrfachtest 385 mehrfaktorielle Pläne s. faktorielle Pläne mehrgeschossiger Erhebungsaufbau 131 mehrphasige Auswahl 131, 534 mehrstufige Auswahl 131, 534 Mehr-Themen-Umfrage s. Omnibusbefragung Meinungsforschung 3 Merkmale 9 Merkmalsträger 9 Messeforschung 420 Meßniveau s. Skalenniveau

579

Messung 8, 534 Meta-Analyse 24ff., 534 Meta-Suchmaschine 209 Meterforschung 164, 407ff. Methode der kleinsten Quadrate 237 mikrogeographische Marktsegmentierung 202 Mini-Testmarkt-Panel 186, 534 Mini-Testmarktverfahren 394 Minimaldistanzverfahren 330 Minkowski-Metrik 313 Minoren 487 mittelbare Beobachung 162 Mittelwerte 49f. mittlere quadratische Abweichung s. Standardabweichung mittlerer Quartilsabstand 491 MM-Matrix 16, 534 Modus 50, 535 monadischer Test s. Einzeltest M O N A N O V A 341, 348 monotone Regression 312 Motiv 35 Motivation 35ff. Motivforschung 4 mündliche Befragung 76ff. mulitattributive Einstellungsmodelle 39f. Multidimensionale Skalierung 309ff., 535 Multikollinearität 249, 535 Multinomial-Modell 272 Multinormalverteilung 273 multiple Diskriminanzanalyse 272 multiple Korrespondenzanalyse 289 multiple Regression s. Regressionsanalyse multipler Korrelationskoeffizient 246, 535 multiples Bestimmtheitsmaß 245 multitomes Merkmal 218 multivariate Analyse 214 Mystery Shopping 161 Ν Nachkauf-Marketing 396 Namentest 384

580

Stichwortverzeichnis

NCSS 215 Nearest Neighbour s. Single Linkage nested models 264 Nettostichprobe 140 Neu-Nachfrage 370 Neuronale Netze 380 nichtdurchschaubare Situation 160 nicht-erklärte Streuung 240 nicht-hierarchische Verfahren 329f. nicht-lineare (Einfach-)Regression 242 nicht-lineare Diskriminanzanalyse 272 nicht-monadischer Test s. Mehrfachtest nicht-reaktive Methoden 158 nicht-standardisierte Beobachtung 159 nicht-standardisiertes Interview 84 nicht-verbale Methoden 158 Nielsen-Gebiete 191 Nielsen-Index 190 Nominalskala 10, 535 Nonequivalent Group Design 174 N O N M E T 257 nonparametrische Tests 60 nonprobability sampling 124 Nonresponse-Bias 134f. Normalverteilung 55f., 477ff. Nullhypothese 61 Nullmatrix 483 numerische Taxonomie 320 O Oblimax-Rotation 305 Oblimin-Rotation 305 oblique Rotation 305 ökoskopische Marktforschung 3 offene Frage lOlff., 535 offene Situation 160 Ogive 222 ohne Zurücklegen 54 OLS 237 Omnibusbefragung 82 On-Air-Test 412 one shot case study 172 One-Group Pretest-Posttest Design 172 Online-Befragung 80 Online-Datenbanken s. externe Datenbanken Online-Dienste 210

Online-Werbung 414 optimale Allokation 130 Ordinalskala 10, 536 Organisationales Beschaffungsverhalten 27, 417 orthogonale Rotation 305 Ρ Paarvergleich 104, 536 Panel 183ff., 536 Panel-Effekt 192, 536 Panelfluktuation 192 Panelforschung 187 Panelrotation 192 Panelsterblichkeit 192 pantry check 164 Parallel-Test-Reliabilität 15, 536 paralleler Vergleichstest 386 Parametertest 60 partitionierende Verfahren 325 passive Variablen 331 Pearson's C 255 Periodeneffekt 228 Personenstichprobe 129, 137, 140, 536 Personen-Zuordnungstests 93, 536 Persönlichkeitstest 95 Perzentile 51 Pfadanalyse 35 lf. Phi (als Kontingenzmaß) 254f. physiognomische Tests 93 PIN-Daten 409 PLS-Ansatz 353 Polaritätsprofil s. Semantisches Differential Polarkoordinaten 222 Politik-Forschung 459 POLYCON 341 Population 123 Portfolio-Test s. unter RecognitionVerfahren POS 187 post factum-Analyse s. ex-post-factoExperiment Postmultiplikation 484 Posttest (des Werbeerfolgs) s. Werbeerfolgskontrolle

Stichwortverzeichnis Posttest-Only Control Group Design 174 Posttest-Only Design with Nonequivalent Groups 174 Potenzfunktion 242 Potenzpapier 222 Präferenz 40 Präferenzdaten 310 Präferenzskalierung 317ff. Prämultiplikation 484 Pre-/Post-Choice-Verfahren 412 PRE-Maße 254 Prediktor 237 PREFMAP 318 Preisbereitschaftstest 390 Preiselastizität 391 Preisschätztest 389, 536 Preistest 384, 3 8 9 f f . Pretest (des Fragebogens) s. Probebefragung Pretest (des Werbeerfolgs) s. Werbeerfolgsprognose Pretest-Posttest-Control Group Design 174 Pricing Research 339, 366, 390 Primärforschung 22, 537 probability sampling 124 Probebefragung 123, 537 Processed Set 47 Product Clinic 399 Produktentwicklungsprozeß 382f. Produktivgütermarktforschung s. Investitionsgütermarktforschung Produktlebenszyklus 371 Produkttest 383ff., 537 Produkttest-Panel 186, 387 Profildaten 309 PROFIT 315 Prognosemethoden 379 Prognose-Validität s. VorhersageValidität Programm Analyzer-Verfahren 164 projektive Verfahren 93, 537 projektives Experiment 170 Proportion 54 proportionale Aufteilung 130 Proximitätsdaten s. Ahnlichkeitsdaten

581

Proximitätsmaße 322ff. Prüfverteilung 63

Q

Pseudo-Zufallszahlen 127 psychobiologische Meßmethoden 34 Psychogalvanometer 163 psychologisch-funktionelle Fragetypen 21

psychologische Tests 93ff. Psychophysik 112 psychophysische Funktionen 112 psychotaktisch-zweckmäßige Befragungsweise 92 Pufferfrage s. Ablenkungsfrage purposive sample 126 Q'-Analyse s. Clusteranalyse Q-Technik der Faktorenanalyse 297 quadratische Matrix 482 quadratische Regression 242 qualitative Inhaltsanalyse 223 qualitative Marktforschung 23 qualitative Merkmale 9 Qualitätstest 384 Quantile 51 quantitative Inhaltsanalyse 223 quantitative Marktforschung 23 quantitative Merkmale 9 Quartil 51, 537 Quartilsabstand 51 Quartimax-Rotation 305 Quasi-Experiment 169, 537 quasibiotische Situation 160 Querschnittsanalyse 229, 537 Quotenauswahl 13 Iff. R R-Technik der Faktorenanalyse 297 Radiocontroll 409 Radiometer 409 random digit dialing 75 random effects model 264 Random Route 135f., 538 Randomisierung 169, 538 Randomized Response 98 Random Route 135f., 538 Randverteilung 235

582

Stichwortverzeichnis

Rang (einer Matrix) 487 Rangkorrelationskoeffizient 251 Ranking 114, 538 Ratio-Skala s. Verhältnisskala Rating-Skalen 109ff. Re-Analyse 25 reaktive Methoden 158 Real-Time-Datenbanken 204 Recall-Verfahren 41 lf., 538f. Rechtstatsachenforschung, repräsentative 439ff. rechtwinklige Rotation s. orthogonale Rotation Recognition-Verfahren 410f., 539f. Redressement 141 Redundanzanaylse 287 reduzierte Korrelationsmatrix 300 Referenzdatenbanken 204 regionaler Marktausschöpfungsgrad 373 Regionalstruktur 377 Regressand 237 Regressionsanalyse 236ff., 539 Regressionskoeffizient 237 Regressionsfunktion 237 Regressionskonstante 237 Regressor 237 reguläre Matrix 487 Reichweite 405 Reifungseffekt s. Periodeneffekt relative Häufigkeiten 218 relativer Marktanteil 374f. relevanter Markt 368 Réhabilitât 13ff., 540 Reliabilitätskoeffizienten 15 Repetition 177 Replikation 177 Research Design 21, 540 Residual-Analyse 249 Responsequote s. Rücklaufquote Ridge Regression 250 Robust Regression 250 rollierende MA 406 Rosenzweig-Test 95 Rücklaufkontrolle 212 Rücklaufquote 142

S Säulendiagramm s. Stabdiagramm Sample 123 Sampling Points 136 SAS 215 Satzergänzungstest 94, 540 Scanning 187, 540 Schätzskala s. Ratingskala Schaltertest 437 Schichtenverfahren s. Auswahl mit Schichtung Schiefe 51 schiefwinklige Rotation s. oblique Rotation Schlüsselreize 34 Schlußziffernverfahren 128 Schneeballverfahren 135, 540 Schnellgreifbühne 163 Schreibtischforschung 22 schriftliche Befragung 70ff. schrittweise Regression 248f. Schwedenschlüssel 138 Schwerin-Test 412, 540f. Scree-Test 303 SDR-Test 412 Search Engine s. Suchmaschine Sekundärforschung 22, 541 Sekundärmaterial 194ff. selektives Hören 88 self-selected sample 125 Semantisches Differential 116ff., 541 sensorischer Test 385 Separate-Sample Pretest-Posttest Design 173 Sequentielle Ereignismethode 398 SGE 374 Shopping Center Sampling 79 Sicherheitsgrad 53 Signifikanzniveau 60 Signifikanztests (grundsätzliches Vorgehen - s. auch jeweils bei den einzelnen Methoden) 60ff. similarities 311 Simple Matching Coefficient 324 Simulationsmodelle (des Käufeverhaltens) 31

Stichwortverzeichnis

simulierte Testmärkte s. TestmarktSimulation Simultan-Experiment 170 Single Linkage 327 Single Source 187, 190, 407 Singular-Value-Decomposition (SVD) 290 singulare Matrix 487 Skalafrage 107ff. Skalar 485 Skalenniveau 91. Skalierung 108 S-O-R-Modell 32, 541 Soziodemographika 156 Spaltenvektor 484 Spannweite 51, 541 Spezialbefragung 82 Spezial-Panel 186 Spontanhandlungsverfahren 163 SPSS 215 Spur (einer Matrix) 482 Spurenanalyse 164 S-R-Modell 30, 541 Stabdiagramm 221 Stammkunden-Marketing 395f. Standardabweichung 51, 541 Standard-Designs 177 Standarderhebung 83 Standardfehler 542 standardisierte Beobachtung 159 standardisierte Regressionskoeffizienten 245 standardisiertes Interview 83 Standardisierung 55 Standardnormalverteilung 55 Standbefragung 420 Standesrecht s. berufsethische Fragen Standortforschung (im Einzelhandel) 346 Stapel-Skala 109f., 542 Starch-Test s. unter Recognition-Verfahren Statement 48 Statement-Batterie 106 Static Group Comparison 174 STATIS-BUND 197 statistische Tafeln 477ff.

583

Statistisches Bundesamt 197f. Steuerkraftkennziffern 377 Stichprobe 123ff. Stichprobenfehler 12, 542 stichprobenneutrale Ausfälle 140 Stichprobenverteilung 54 Stimm(frequenz)analyse 163 Stimulus 28 stochastische Modelle (des Käuferverhaltens) 31 Store-Test s. Ladentest Störvariable (beim Experiment) 169 Strategische Marktforschung 2, 451ff. Streckendiagramm s. Liniendiagramm Stress 313f. Streuungsmaße 51 Streuungszerlegung (bei der Regression) 240 Strichmarkierung 148, 211 Strukturgleichungsmodell s. Kovarianzstrukturanalyse strukturierte Beobachtung s. standardisierte Beobachtung Strukturmodelle (des Käuferverhaltens) 31 stub and banner-Tabelle 225, 234 Student-Verteilung s. t-Verteilung Studio-Test 386 Stufungseffekt 131 Suchmaschine 209 Sukzessiv-Experiment 170 Supremums-Metrik 313 Symbolfrage 106 symmetrische Matrix 482 symmetrische Plots (bei der Korrespondenzanalyse) 291 SYSTAT 216 systematische Auswahl 128, 542 systematischer Fehler 12, 542 Szondi-Test 93 Τ t-Verteilung 57f,. 477ff. Tachistoskop 163 ΤΑΜ 409 Tammeter 407 Tamrating 407

584

Stichwortverzeichnis

Tanimoto-0accard-)Koeffizient 324 targetable TV-Technik 34 TAT 95, 542 Taxometrie 320 TdWI 406 Teilauflistung 137 Teilerhebung 49 teilnehmende Beobachtung 160, 543 Teilnutzenwertmodell 340 Telecontrol 408 Telefax-Umfragen 80 telefonische Befragung 75ff. Telefonmarketing 1, 76 Telemetrie 164 teleMetron 408 Telerim 395 Teleskomat 408 Teleskopie 408 Tendenzfrage 173, 543 TESI 394 Test-Retest-Reliabilität 14, 543 Testelement 168 Testfaktor 168 Testmarkt-Effekt 393 Testmarkt-Simulation 394, 543 Testmarkt-Verfahren 392f. Test-Retest-Reliabilität 14, 543 Teststatistik 63 Teststudios 80, 97, 461 Tetraden 316 THAID 284 Theater-Test s. Schwerin-Test Thematischer Apperzeptions-Test s. TAT Third-Person-Technique 93 Ticker-Dienste s. Real-Time-Datenbanken Tiefeninterview 84 TORSCA 314 Total Distance 324 Totalauflistung 137 Totalwerte 139 Tourismusmarktforschung s. Fremdenverkehrsmarktforschung Trade Off-Matrizen 342 Trainingsfrage 121 transponierte Matrix (Transpose) 484

Treatment 168, 543 Tree-Analysis s. AID-Verfahren Trendforschung (qualitative) 224 Triaden 316 Trommsdorff-Modell (der Einstellungsmessung) 31 typische Auswahl 126 U U-Statistik 263 Umfang der Stichprobe 142f. Umfrageforschung 67 Umgewichtung 130, 140 unabhängige Variable 237 unaided Recall 411 uneingeschränkte Zufallsauswahl 129, 543

U N I C O N 350 univariate Analyse 213 Universum 123 unmittelbare Beobachtung 162 unobtrusive measures 158 Unterdeterminanten 487 Unterstichprobe 131 Unterweisungsfrage 121 unverzerrter Schätzer s. Erwartungstreue unvollständige Pläne 181 Urnenmodell 127 V Validität 13ff., 543 Variable 9 Varianz 51, 544 Varianz-Kovarianz-Matrix s. Kovarianzmatrix Varianzanalyse 262ff., 544 Varianzkriterium 330 Varimax-Rotation 305 Vektoren 482ff. Verbandsmarktforschung 462f., 544 Verbraucher-Analyse (VA) 406 Verbraucher-Panel 185 Verbraucherbefragung 70 Verbraucherverhalten s. Konsumentenverhalten Verbrauchsforschung 3

Stichwortverzeichnis

Verbrauchsgüter-Panel 186 Verbund-Marktforschung 463f., 544 Verbundmessung s. Conjoint Measurement verdeckte Beobachtung 166 verdecktes Interview 85 Vergessenskurven 46 Verhältnisskala 11, 544 Verkaufstest 391, 544 Verlagstypologien 333 Verpackungstest 384 Verschlüsselung 212 Verschönerungstendenz 71 Versicherungsmarktforschung 436 Versuchsanlage 171ff. Vertrauensintervall s. Konfidenzintervall Vertrauenswahrscheinlichkeit 53 Verweigerungsquote 141 Videoaufzeichnung 163 Vierfelder(kontingenz)tafel 240 visuelle Rotation 304 Vollservice-Institut 456 vollständige faktorielle Blockpläne 181 vollständiger bifaktioreller Zufallsplan

180 vollständiger Zufallsplan 177, 225ff. Volltest 384, 544 Volltextdatenbanken 204 vorexperimentelle Versuchsanordnungen 169 Vorhersage-Validität 16 Vorlagenfragen 119 Vorverbraucher-Panel 185 VuMA 407 W Wahlforschung 3, 459 Wahrscheinlichkeitspapier 222 Wahrscheinlichkeitsstichprobe 124 Ward-Verfahren 328 Warenkorbanalyse 333 Warentest 383 warm up-Frage s. Kontaktfrage Web (Log) Mining 216 weißes Rauschen 12 Werbeerfolggsprognose 402

585

Werbeerfolgskontrolle 402 Werbeforschung 40 Iff. Werbemittelforschung 41 Off. Werbestatistik 404 Werbeträgerforschung 404ff. Werbewirkung 402 Werthaltungen 42 Wiedererkennungsverfahren s. Recognition-Verfahren Wilks' Lambda 263, 277 willkürliche Auswahl 125 Wirtschaftsforschungsinstitute 200 Wölbung 51 World Wide Web 207 Wortassoziationstest 95, 544 W 3 s. World Wide Web W W W s. World Wide Web Y Youden Square 181 Ζ Z A W 405 ZAW-Rahmenschema 406 Zeilenvektor 484 Zeitreihenanalyse 213 zentraler Grenzwertsatz 53 Zentralwert s. Median ZEWI197 zufälliger Blockplan 178, 267ff. Zufallsanordnung 128 Zufallsauswahl 126ff, 545 Zufallsfehler 12, 545 Zufallsstart 128 Zufallsweg 136 Zufallszahlenreihe 137 Zufallszahlentafeln 127 Zufallszuweisung 169 Zweigstellenanalyse 437 zweiseitiger Test 62