Nachfragerorientierte Präferenzmessung: Bestimmung zielgruppenspezifischer Eigenschaftssets auf Basis von Kundenbedürfnissen 3835007734, 9783835007734

Michael Steiner analysiert die gängigen Methoden zur Bestimmung von Eigenschaftssets als Basis der Präferenzmessung und

122 52 4MB

German Pages 534 [525] Year 2007

Report DMCA / Copyright

DOWNLOAD PDF FILE

Recommend Papers

Nachfragerorientierte Präferenzmessung: Bestimmung zielgruppenspezifischer Eigenschaftssets auf Basis von Kundenbedürfnissen
 3835007734, 9783835007734

  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

Michael Steiner Nachfragerorientierte Präferenzmessung

GABLER EDITION WISSENSCHAFT

Michael Steiner

Nachfragerorientierte Präferenzmessung Bestimmung zielgruppenspezifischer Eigenschaftssets auf Basis von Kundenbedürfnissen

Mit einem Geleitwort von Prof. Dr. Roland Helm

Deutscher Universitäts-Verlag

Bibliografische Information Der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar.

Dissertation Universität Jena, 2007

1. Auflage Juli 2007 Alle Rechte vorbehalten © Deutscher Universitäts-Verlag | GWV Fachverlage GmbH, Wiesbaden 2007 Lektorat: Frauke Schindler / Stefanie Brich Der Deutsche Universitäts-Verlag ist ein Unternehmen von Springer Science+Business Media. www.duv.de Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Umschlaggestaltung: Regine Zimmer, Dipl.-Designerin, Frankfurt/Main Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier Printed in Germany ISBN 978-3-8350-0773-4

Gewidmet meinem Vater, Dr. Günther Steiner

Geleitwort Michael Steiner behandelt in seiner Dissertation ein Themengebiet, dem sich bislang nur wenige Wissenschaftler widmen. Im Prinzip geht es darum, sozusagen in einem Schritt null vor der eigentlichen Messung von Präferenzen von potenziellen Nachfragern das für die Messung zu verwendende Set an Attributen und deren Ausprägungen zusammenzustellen. Die Forschungsbemühungen der letzten 30 Jahre haben sich sehr in Richtung Entwicklung und Optimierung bzw. Verfeinerung von Methoden der Präferenzmessung konzentriert; dieser wichtige Schritt vor der Entscheidung, welche Methode anzuwenden sein wird, ist in der empirischen Forschung als auch in der Praxis äußerst pragmatisch behandelt worden. Letztendlich ist die Tatsache, dass die Ergebnisqualität von Präferenzmessungen und auch die Übertragbarkeit auf Märkte nicht nur von der Durchführungsqualität, sondern natürlich auch in ganz erheblichem Umfang vom Untersuchungsinhalt in Form von für den Nachfrager relevanten Attributen und deren Ausprägungen eines interessierenden Leistungsangebots abhängt, offensichtlich. Die Befunde des empirischen Vergleichs der neuen Methode mit gängigen Alternativen bestätigten dies. Der Dissertation ist damit ein hohes theoretisches Interesse der betriebswirtschaftlichen Forschung, aber auch ein herausragender Praxisbezug zu attestieren.

Ich wünsche daher der Arbeit eine weite Verbreitung.

Roland Helm

VII

Vorwort Die Präferenzmessung spielt gerade in der Phase der Konzepterarbeitung und Leistungsplanung bei der Neuproduktentwicklung für Unternehmen eine entscheidende Rolle. Eine Erfassung von Präferenzen ist allerdings erst dann sinnvoll möglich, wenn die aus Kundensicht relevanten Beurteilungsdimensionen, d.h. die bei einer Kaufentscheidung genutzten Eigenschaften und Ausprägungen, bekannt sind. Deshalb wird in diesem Buch eine Methode entwickelt, mit der zielgruppenspezifische Eigenschaftssets bestimmt können. Durch eine stärker auf die zu untersuchende Zielgruppe abgestimmte Präferenzmessung soll die Ergebnisgüte erhöht und so das Floprisiko verringert werden. Zunächst möchte ich mich bei meinem Doktorvater, Herrn Prof. Dr. Roland Helm für die Möglichkeit der Promotion an seinem Lehrstuhl herzlich danken. Neben vielfältigen Diskussionsmöglichkeiten gab er mir zudem die für dieses Projekt erforderliche, großzügige wissenschaftliche Freiheit. Herr Prof. Dr. Roland Helm ermöglichte mir auch, im Rahmen verschiedener Projekte, weitere, sehr unterschiedliche Forschungsfragen zu bearbeiten. Zudem danke ich ganz besonders Herrn Prof. Dr. Armin Scholl, der mir im Rahmen interdisziplinärer Forschungsprojekte – wenn auch auf den ersten Blick nur indirekt – verschiedene, wichtige Impulse für meine Arbeit gab und diese unterstützte. Beiden danke ich herzlich dafür, dass ich das Promotionsverfahren rasch beenden konnte. Auch danke ich meinen Kollegen am Lehrstuhl Marketing und an den weiteren Lehrstühlen, die stets für eine fachliche Diskussion zur Verfügung standen. Vor allem danke ich Herrn Dipl.-Kfm. Gregory Nicklas, Herrn Dipl.-Kfm. Marc Tobias und Frau Dipl.-Kffr. Antonia Szelig, die mir zudem bei stilistischen Fragen eine große Hilfe waren. Weiterhin danke ich Herrn Dr. Olaf Ernst sowie Herrn Prof. Dr. Henrik Sattler, die mein Interesse am wissenschaftlichen Arbeiten und insbesondere an dem in dieser Arbeit untersuchten Forschungsfeld während meines Studiums geweckt haben. Es ist mir ein außerordentlich wichtiges Anliegen, schließlich meiner Familie für ihre Unterstützung und ihren Rückhalt zu danken. Mein ganz besonderer Dank gilt dabei meiner Lebensgefährtin Anja Jakszentis – ihre Geduld, mit der sie sämtliche Belastungen ertragen hat, ihr Zuspruch, ihre stilistischen Fertigkeiten und insbesondere die interdisziplinären Diskurse mit ihr waren bei der Realisierung dieses Buches von unschätzbarem Wert.

Michael Steiner IX

Inhaltsverzeichnis 1

Einleitung .................................................................................................................... 1

2

Theoretische Grundlagen der Präferenzmessung ................................................. 11 2.1 Die Bedeutung der Präferenzmessung als Element der Neuproduktentwicklung ...... 13 2.2 Kontextabhängigkeit von Präferenzen ........................................................................ 19 2.3 Die Präferenz im Rahmen des Kaufentscheidungsprozesses...................................... 21 2.4 Produkte als Untersuchungsobjekt der Präferenzmessung ......................................... 31 2.5 Anforderungen an das Untersuchungsobjekt .............................................................. 35 2.6 Nutzenmodelle bei der Bewertung von Merkmalsausprägungen ............................... 36 2.7 Nutzenfunktionen zur Einschätzung von Alternativen ............................................... 38

3

Verfahren und grundlegende Schritte bei der Durchführung von Studien zur Präferenzmessung ............................................................................................. 41 3.1 Ein Überblick über typische Methoden zur Erfassung von Präferenzen .................... 42 3.1.1 Abgrenzung typischer Methoden zur Erfassung von Präferenzen ....................... 42 3.1.2 Praktische Bedeutung der Verfahren zur Präferenzmessung ............................... 77 3.1.3 Herausforderungen bei der Selektion einer Methode zur Erfassung von Präferenzen ........................................................................................................... 78 3.2 Skalenarten bei der Präferenzmessung ....................................................................... 84 3.3 Anzahl der Eigenschaften ........................................................................................... 90 3.4 Erstellung von Versuchsplänen .................................................................................. 96 3.5 Präsentationsform ..................................................................................................... 104 3.6 Schätzverfahren zur Bestimmung der Teilnutzen der untersuchten Ausprägungen . 109 3.7 Standardisierung der Schätzergebnisse ..................................................................... 113 3.8 Berechnung der Bedeutung von Eigenschaften ........................................................ 116 3.9 Aggregation der Ergebnisse der Präferenzmessung und Berechnung von Marktanteilen ...................................................................................................................... 121 3.10 Gütemaße zur Einschätzung der Ergebnisse der Präferenzmessung ........................ 127 3.10.1 Überblick verschiedener Validitätsmaße............................................................ 127 3.10.2 Reliabilität .......................................................................................................... 142 3.10.3 Einschätzung der wahrgenommenen Befragungssituation................................. 144 3.10.4 Maße zur Analyse des Entscheidungsverhaltens der Befragungsteilnehmer ..... 146 XI

4

Eigenschaften und Eigenschaftsausprägungen ................................................... 153 4.1 Überblick verschiedener Arten und Unterscheidungsmerkmale von Eigenschaften ............................................................................................................ 155 4.1.1 Informationsökonomische Eigenschaftstypologie ............................................. 155 4.1.2 Extrinsische und intrinsische Merkmale ............................................................ 156 4.1.3 Qualitative und quantitative Eigenschaften ........................................................ 162 4.1.4 Schwelleneigenschaften, Trade-off Eigenschaften und Added-value Eigenschaften ..................................................................................................... 163 4.1.5 Natürliche, künstliche und Proxy-Merkmale ..................................................... 166 4.1.6 Einzelne und gebündelte Eigenschaften ............................................................. 168 4.1.7 Substantielle, erweiterte und generische Produkteigenschaften......................... 169 4.1.8 Objektive und subjektive Eigenschaften ............................................................ 170 4.1.9 Zwischenfazit ..................................................................................................... 177 4.2 Anforderungen an Eigenschaften und Ausprägungen bei der Präferenzmessung .... 177 4.2.1 Vollständigkeit der Beschreibung durch das Eigenschaftsset ............................ 178 4.2.2 Realisierbarkeit und Beeinflussbarkeit ............................................................... 179 4.2.3 Unabhängigkeit der Ausprägungen .................................................................... 180 4.2.4 Kompensatorische Beziehungen zwischen den Merkmalen .............................. 190 4.2.5 Eindeutigkeit ...................................................................................................... 195 4.2.6 Relevanz der Eigenschaften ............................................................................... 197

5

Methoden zur Identifizierung von entscheidungsrelevanten Eigenschaften und Ausprägungen ................................................................................................ 207 5.1 Bestimmung der Eigenschaften ohne Einbezug der Konsumenten .......................... 207 5.2 Direkte Methoden zur Bestimmung der Eigenschaften ............................................ 210 5.2.1 Direkte, offene Erhebung von potenziell relevanten Eigenschaften .................. 211 5.2.2 Direkte Einschätzung von vorgegebenen Eigenschaften ................................... 222 5.3 Indirekte Methoden ................................................................................................... 229 5.3.1 Prozessverfolgungsmethoden ............................................................................. 229 5.3.2 Psychologische Verfahren .................................................................................. 243 5.3.3 Tiefenpsychologische Interviews ....................................................................... 251 5.3.4 Multidimensionale Skalierung ........................................................................... 257 5.4 Befragung von Gruppen zur Ermittlung von entscheidungsrelevanten Attributen .. 260 5.5 Stufenverfahren ......................................................................................................... 265

XII

5.6 Zwischenfazit und praktische Relevanz der bisherigen Methoden zur Bestimmung des Eigenschaftssets ............................................................................ 269 5.7 Bestimmung der relevanten Eigenschaftsausprägungen........................................... 271 5.7.1 Bestimmung der Bandbreite bei Eigenschaften mit metrischen Ausprägungen ..................................................................................................... 272 5.7.2 Festlegung der Anzahl der Attributstufen .......................................................... 276 5.7.3 Benennung der Attributstufen bei Eigenschaften mit metrischen Ausprägungen ..................................................................................................... 286 5.7.4 Bestimmung der Abstände zwischen den Attributstufen bei Eigenschaften mit metrischen Ausprägungen ............................................................................ 288 5.7.5 Benennung der Attributstufen bei Eigenschaften mit nicht-metrischen Ausprägungen ..................................................................................................... 288 6

Vorschlag einer nachfragerorientierten Vorgehensweise zur Präferenzmessung .................................................................................................. 291 6.1 Vorgehensweise zur Bestimmung der relevanten Eigenschaften und Eigenschaftsausprägungen ........................................................................................ 291 6.1.1 Vorankündigung und Informationssammlung der Befragungsteilnehmer ......... 294 6.1.2 Angepasste Elicitation Technik .......................................................................... 296 6.1.3 Selbstselektion zielgruppenspezifischer Eigenschaftssets durch die Befragungsteilnehmer ........................................................................................ 306 6.1.4 Bestimmung der Relevanz der verbliebenen Eigenschaften .............................. 307 6.1.5 Bestimmung der Anzahl der zu untersuchenden Eigenschaften ........................ 310 6.1.6 Prüfung der Eigenschaftsausprägungen auf Präferenzunabhängigkeit .............. 311 6.2 Unmittelbare Schritte vor der Präferenzmessung ..................................................... 317 6.2.1 Vorankündigung der Untersuchung ................................................................... 317 6.2.2 Selbstselektion der Befragungsteilnehmer vor der Präferenzmessung .............. 318 6.2.3 Aufwärmprozess vor der Präferenzmessung ...................................................... 319

7

Empirischer Teil ..................................................................................................... 325 7.1 Beschreibung der empirischen Studie....................................................................... 325 7.1.1 Untersuchungsobjekt .......................................................................................... 325 7.1.2 Selektion traditioneller Verfahren zur Bestimmung von Eigenschaftssets ........ 326 7.1.3 Stichprobe ........................................................................................................... 327

XIII

7.1.4 Ablauf der Datenerhebung zur Bestimmung der relevanten Eigenschaften und Ausprägungen .............................................................................................. 329 7.1.5 Ablauf der Präferenzmessung ............................................................................ 331 7.2 Bestimmung des Eigenschaftssets mittels traditioneller Methoden ......................... 332 7.2.1 Bestimmung der relevanten Eigenschaften mittels Elicitation Technik............. 332 7.2.2 Bestimmung der relevanten Eigenschaften mittels Dualer Methode ................. 336 7.2.3 Festlegung der zu untersuchenden Eigenschaftsausprägungen .......................... 341 7.3 Bestimmung des Eigenschaftssets mit Hilfe der neuartigen Methode ..................... 345 7.3.1 Vorankündigung des Untersuchungsobjektes .................................................... 345 7.3.2 Erhebung von salienten Eigenschaften und Ausprägungen mit Hilfe einer angepassten Elicitation Technik ......................................................................... 346 7.3.3 Bewertung der Merkmalsausprägungen und Eigenschaften .............................. 354 7.3.4 Prüfung der Eigenschaften auf Präferenzinterdependenzen ............................... 362 7.3.5 Festlegung des Eigenschaftssets je nach Bedürfnisgruppe ................................ 366 7.4 Empirischer Vergleich des Einflusses alternativer Methoden zur Bestimmung der relevanten Eigenschaften auf die Ergebnisse der Präferenzmessung ................. 368 7.4.1 Beschreibung der Methode zur Präferenzmessung ............................................ 370 7.4.2 Auswahl verschiedener Gütemaße zum Vergleich der untersuchten Gruppen .............................................................................................................. 373 7.4.3 Augenscheinvalidität .......................................................................................... 374 7.4.4 Interne Validität .................................................................................................. 381 7.4.5 Prognosevalidität ................................................................................................ 384 7.4.6 Untersuchung der Befragungssituation .............................................................. 391 7.4.7 Analyse des Entscheidungsverhaltens der Befragungsteilnehmer ..................... 397 8

Zusammenfassung, Diskussion und Ausblick ..................................................... 411

Anhang .................................................................................................................................. 421 Literaturverzeichnis ............................................................................................................. 463

XIV

Abbildungsverzeichnis Abbildung 1: Aufbau der Arbeit ................................................................................................ 9 Abbildung 2: Phasen eines idealtypischen Produktentwicklungsprozesses (in Anlehnung an Brockhoff (1999), 106; Herstatt; Sander (2004), 103 und Albers; Kemnitz (1985), 237) ......................................................................................... 17 Abbildung 3: Fünf-Phasen-Modell eines Kaufentscheidungsprozesses (Quelle: Kotler; Bliemel (2001), 355; Böcker; Helm (2003), 146) .............................................. 21 Abbildung 4: Selektion von Alternativen (Produktkategorisierung in Anlehnung an Böcker; Helm (2003), 175f.; Kotler; Bliemel (2001), 356) ............................... 23 Abbildung 5: Zusammenhang zwischen Kaufabsicht und realisiertem Kauf (Quelle: in Anlehnung an Kotler; Bliemel (2001), 361 und Böcker (1986), 554) ............... 26 Abbildung 6: Beispiele für Typen von Nutzenverläufen ......................................................... 37 Abbildung 7: Schritte bei der Durchführung einer Studie zur Präferenzmessung (in Anlehnung an Backhaus; Erichson; Plinke; Weiber (2003), 547ff.) ................. 41 Abbildung 8: Self-Explicated Methoden im Überblick (Quelle: Hensel-Börner (2000), 17) ...................................................................................................................... 44 Abbildung 9: Mögliche Skalenarten zur Einschätzung von Alternativen bei der ConjointAnalyse ............................................................................................................... 85 Abbildung 10: Paarvergleich zweier hypothetischer Produkte .............................................. 104 Abbildung 11: Überblick über typische Schätzverfahren bei der Conjoint-Analyse ............. 109 Abbildung 12: Segmentierungsmöglichkeiten bei der Präferenzmessung (in Anlehnung an Green; Krieger (1991), 22) ....................................................................... 122 Abbildung 13: Fragen zur Operationalisierung der Befragungssituation beim Untersuchungsobjekt „Laptop“ ..................................................................... 145 Abbildung 14: Bestimmung der Abweichungen vom erwarteten Teilnutzen ........................ 149 Abbildung 15: Überblick typischer Eigenschaftsarten........................................................... 155 Abbildung 16: Überblick qualitativer und quantitativer Eigenschaftsarten ........................... 162 Abbildung 17: Relevanz von Eigenschaftsarten im Kaufentscheidungsprozess ................... 165 Abbildung 18: Einteilung objektiver Eigenschaften .............................................................. 170

XV

Abbildung 19: Einteilung der objektiven Eigenschaften nach Myers; Shocker (1981, 213) ................................................................................................................ 171 Abbildung 20: Eigenschaftseinteilung nach Myers; Shocker (1981), 214............................. 172 Abbildung 21: Mögliche Assoziationen eines Probanden bezüglich objektiver und subjektiver Eigenschaften sowie deren Ausprägungen (Quelle: Helm, Steiner (2006), 14) ......................................................................................... 175 Abbildung 22: Anforderungen an das zu untersuchende Eigenschaftsset ............................. 177 Abbildung 23: Beispiel für ein Compound-Attribute ............................................................ 184 Abbildung 24: Darstellung der verschiedenen Arten von Interaktionen................................ 186 Abbildung 25: Anforderungen an relevante Eigenschaften und Ausprägungen .................... 204 Abbildung 26: Methoden zur Erhebung von relevanten Eigenschaften auf individueller Ebene ............................................................................................................. 207 Abbildung 27: Direkte Ansätze zur Bestimmung der relevanten Eigenschaften ................... 210 Abbildung 28: Beispiel für eine Ähnlichkeitseinschätzung zwischen zwei Attributen (interne Codierung analog zu Pras (1975), 76) .............................................. 220 Abbildung 29: Direkte Befragung mit Einschätzung der Eigenschaften auf einer RatingSkala am Beispiel Autoreifen ........................................................................ 223 Abbildung 30: Duale Befragung am Beispiel Autoreifen (Fragenformulierung in Anlehnung an: Tscheulin (1992), 96; Skala in Anlehnung an: Anderson; Cox III; Fulcher (1976), 41) .......................................................................... 225 Abbildung 31: Beispiel für das Jaccard Subjective Probability Measure (vgl. Jaccard; Brinberg; Ackerman (1986), 465) ................................................................. 227 Abbildung 32: Beispielaufgabe für die Jaccard Subjective Probability Measure bei drei Ausprägungen ................................................................................................ 228 Abbildung 33: Indirekte Ansätze zur Bestimmung der relevanten Eigenschaften ................ 229 Abbildung 34: Beispiel für ein Information-Display-Board bei dem Untersuchungsobjekt Mountainbike ................................................................................................. 233 Abbildung 35: Psychologische Interviewtechniken im Überblick ......................................... 243 Abbildung 36: Stufen bei der Benefit-Chain (vgl. Young; Feigin (1975), 73) ...................... 255 Abbildung 37: Vorgehensweise bei der MDS (in Anlehnung an: Gierl (1995), 113ff.; Backhaus; Erichson; Plinke; Weiber (2003), 612) ........................................ 258

XVI

Abbildung 38: Vergleich zwischen einer linearen Preisabsatzfunktion und einer Gutenberg Preisabsatzfunktion (Quelle: in Anlehnung an Böcker; Helm (2003), 308ff.) ................................................................................................ 275 Abbildung 39: Auswirkungen der Variation der Zahl der Attributstufen nach der Gleichverteilungshypothese ........................................................................... 279 Abbildung 40: Vorschlag einer Methode zur Bestimmung eines Eigenschaftssets ............... 293 Abbildung 41: Vorgehensweise der angepassten Elicitation Technik ................................... 297 Abbildung 42: Vorgehensweise bei der gewichteten Self-Explicated Methode .................... 308 Abbildung 43: Vereinfachte und angepasste Form der gewichteten Self-Explicated Methode zur Be-stimmung der Relevanz von Eigenschaften........................ 309 Abbildung 44: Vorschlag für die Bestimmung der Anzahl der zu untersuchenden Eigenschaften ................................................................................................. 311 Abbildung 45: Darstellung verschiedener Interaktionsarten .................................................. 313 Abbildung 46: Beispiel für die Ermittlung von Interaktionen ............................................... 314 Abbildung 47: Vorgehensweise zur Berücksichtigung von Interaktionseffekten .................. 316 Abbildung 48: Möglichkeiten, Befragungsteilnehmer mit dem Eigenschaftsset vertraut zu machen ...................................................................................................... 321 Abbildung 49: Ablauf der Befragung..................................................................................... 329 Abbildung 50: Ablauf der Präferenzmessung ........................................................................ 331 Abbildung 51: Grafische Darstellung der Determinanzwerte bei der Dualen Methode für das Untersuchungsobjekt „Laptop“ ............................................................... 338 Abbildung 52: Grafische Darstellung der Determinanzwerte bei der Dualen Methode für das Untersuchungsobjekt „Fernseher“ ........................................................... 340 Abbildung 53: Grafische Darstellung der Relevanzeinschätzungen für das Untersuchungsobjekt „Laptop“ ..................................................................... 357 Abbildung 54: Grafische Darstellung der Relevanzeinschätzungen der Gruppe 1 für das Untersuchungsobjekt „Fernseher“ (n = 27) ................................................... 358 Abbildung 55: Grafische Darstellung der Relevanzeinschätzungen der Gruppe 2 für das Untersuchungsobjekt „Fernseher“ (n = 24) ................................................... 360 Abbildung 56: Untersuchungsgruppen bei der Präferenzmessung ........................................ 368 Abbildung 57: Aufbau des Fragebogens für ein Untersuchungsobjekt ................................. 369

XVII

Tabellenverzeichnis Tabelle 1: Überblick über die Anwendungsgebiete der Conjoint-Analyse.............................. 19 Tabelle 2: Arten des Kaufverhaltens (Quelle: Kotler; Bliemel (2001), 350) ........................... 28 Tabelle 3: Beispiele für Güterarten und Einschätzung zur Eignung der Präferenzmessung ... 34 Tabelle 4: Häufigkeit der Nutzung verschiedener Verfahren zur Präferenzmessung .............. 77 Tabelle 5: Vollständige Kombination der Merkmalsausprägungen zur Bildung von hypothetischen Alternativen .................................................................................... 99 Tabelle 6: Binärcodierung der Alternativen ........................................................................... 100 Tabelle 7: Bildung eines Partially Balanced Incomplete Block Designs ............................... 101 Tabelle 8: Erstellung eines Differenzendesigns – Alternativen eines Paarvergleichs ........... 103 Tabelle 9: Erstellung eines Differenzendesigns – Binärcodierung und Differenzbildung..... 103 Tabelle 10: Möglichkeiten zur Standardisierung der geschätzten Teilnutzenwerte .............. 115 Tabelle 11: Beispiel für die Berechnung von Bedeutungsgewichten .................................... 118 Tabelle 12: Systematisierung von Eigenschaften nach Kotler (1974, 415) ........................... 170 Tabelle 13: Beispiele für nicht eindeutige Merkmalsbeschreibungen beim Untersuchungsobjekt „Bahnreise“ ...................................................................... 196 Tabelle 14: Beispiel für Wichtigkeitsratings anhand von Rangdaten .................................... 214 Tabelle 15: Beispiel für eine Repertory-Grid Ergebnismatrix für einen Probanden mit dichotomen Einschätzungen (Quelle: in Anlehnung an Herrmann (1998), 369)...................................................................................................................... 216 Tabelle 16: Beispiel für eine Repertory-Grid Ergebnismatrix für einen Probanden mit Einschätzungen auf einer 9er Rating-Skala (Quelle: in Anlehnung an Herrmann (1998), 369) ........................................................................................ 217 Tabelle 17: Beispiel für eine Ähnlichkeitsmatrix .................................................................. 221 Tabelle 18: Typische Fragen in der ersten Phase der Benefit Structure Analysis (Quelle: in Anlehnung an Myers (1976), 24) .................................................................... 268 Tabelle 19: Praktische Relevanz verschiedener Methoden zur Bestimmung eines Eigenschaftssets................................................................................................... 271 Tabelle 20: Neugewichtung der Eigenschaften je nach Anzahl der Attributstufen ............... 282 Tabelle 21: Eigenschaften und Ausprägungen in der Studie von Schmidt (1990, 271) ........ 286 XIX

Tabelle 22: Beispiele für Entscheidungssituationen Attribut-Framing .................................. 287 Tabelle 23: Einteilung der genannten Eigenschaftsausprägungen in vom Forscher festzulegende Intervalle ....................................................................................... 301 Tabelle 24: Aggregation der Eigenschaftsausprägungen innerhalb der Intervalle und Festlegung der Eigenschaftsausprägungen .......................................................... 301 Tabelle 25: Beispiel für eine Trade-off Matrix ...................................................................... 312 Tabelle 26: Beispiel für die Ermittlung von Interaktionen .................................................... 314 Tabelle 27: Anzahl der notwendigen Bewertungen zur Überprüfung von Interaktionseffekten bei zwei Eigenschaften ....................................................... 315 Tabelle 28: Anzahl der Befragungsteilnehmer in der Vorstudie je nach Gruppe .................. 328 Tabelle 29: Anzahl der Befragungsteilnehmer in der Studie zur Präferenzmessung je nach Gruppe ........................................................................................................ 328 Tabelle 30: Häufigkeit der Nennungen von Eigenschaften (n = 41)...................................... 333 Tabelle 31: Häufigkeit der Nennung von Eigenschaften bei der Elicitation Technik (n = 41)........................................................................................................................ 333 Tabelle 32: Häufigkeit der Nennungen von Eigenschaften (n = 41)...................................... 334 Tabelle 33: Häufigkeit der Nennung von Eigenschaften bei der Elicitation Technik (n = 41)........................................................................................................................ 334 Tabelle 34: Beispiel für Fragen in einem Fragebogen der Dualen Methode ......................... 336 Tabelle 35: Ergebnisse der Dualen Befragung (n = 42) ......................................................... 337 Tabelle 36: Häufigkeit der Einschätzungen auf der Rating-Skala bei der Dualen Methode . 338 Tabelle 37: Ergebnisse der Dualen Befragung (n = 43) ......................................................... 339 Tabelle 38: Häufigkeit der Einschätzungen auf der Rating-Skala bei der Dualen Methode (n = 43) ................................................................................................................ 340 Tabelle 39: Merkmalsausprägungen der Eigenschaften - Gruppe 2 „Duale Methode + Fernseher“ ........................................................................................................... 342 Tabelle 40: Bandbreiten der Eigenschaften für das Untersuchungsobjekt „Fernseher” und die Duale Methode ....................................................................................... 342 Tabelle 41: Eigenschaftsset für das Verfahren „Duale Methode“ und das Untersuchungsobjekt „Fernseher“ ....................................................................... 343

XX

Tabelle 42: Berücksichtigte Merkmalsausprägungen der Eigenschaften - Gruppe „Elicitation Technik + Fernseher“....................................................................... 343 Tabelle 43: Eigenschaftsset für die Gruppe „Elicitation Technik + Fernseher“ .................... 343 Tabelle 44: Berücksichtigte Merkmalsausprägungen der Eigenschaften - Gruppe „Duale Methode + Laptop“ ............................................................................................. 344 Tabelle 45: Eigenschaftsset für die Gruppe „Duale Methode + Laptop“ .............................. 344 Tabelle 46: Berücksichtigte Merkmalsausprägungen der Eigenschaften – Gruppe „Elicitation Technik + Laptop“ ........................................................................... 344 Tabelle 47: Eigenschaftsset für die Gruppe „Elicitation Technik + Laptop“ ........................ 344 Tabelle 48: Anzahl der genannten Eigenschaften und Ausprägungen in der angepassten Elicitation Technik (n = 34) ................................................................................ 347 Tabelle 49: Häufigkeit der Nennungen von Eigenschaften (n = 34)...................................... 347 Tabelle 50: Gruppen von Ausprägungen für die Eigenschaft “Preis” beim Untersuchungsobjekt „Laptop” ........................................................................... 349 Tabelle 51: Zusammenfassung der individuellen Mittelwerte der Eigenschaftsausprägung zur Bestimmung der Bezeichnung der Merkmalsausprägung auf aggregierter Ebene bei Gruppe 4 ............................... 349 Tabelle 52: Gruppierte Ausprägungen der Eigenschaft „Preis“ beim Untersuchungsobjekt „Laptop“ ........................................................................... 349 Tabelle 53: Saliente Eigenschaften und Ausprägungen des Untersuchungsobjekts „Laptop“ .............................................................................................................. 351 Tabelle 54: Anzahl der genannten Eigenschaften und Ausprägungen in der angepassten Elicitation Technik (n = 34) ................................................................................ 352 Tabelle 55: Häufigkeit der Nennungen von Eigenschaften (n = 34)...................................... 352 Tabelle 56: Unterschiedliche Bedürfnisgruppen für das Untersuchungsobjekt „Fernseher” .......................................................................................................... 353 Tabelle 57: Saliente Eigenschaften und Ausprägungen des Untersuchungsobjekts „Fernseher“ .......................................................................................................... 354 Tabelle 58: Frageformulierungen zur Bestimmung der wichtigsten und unwichtigsten Eigenschaften ...................................................................................................... 355 Tabelle 59: Frageformulierung zur Einschätzung der Bedeutung von Merkmalen ............... 356

XXI

Tabelle 60: Ergebnisse der Einschätzung der Relevanz von Eigenschaften beim Untersuchungsobjekt „Laptop” (n = 52) ............................................................. 356 Tabelle 61: Eigenschaftsset für das Untersuchungsobjekt “Laptop” ..................................... 358 Tabelle 62: Ergebnisse der Einschätzung der Relevanz von Eigenschaften bei Gruppe 1 beim Untersuchungsobjekt „Fernseher” (n = 27) ................................................ 358 Tabelle 63: Eigenschaftsset für das Untersuchungsobjekt „Fernseher“ für Gruppe 1 ........... 359 Tabelle 64: Ergebnisse der Einschätzung der Relevanz von Eigenschaften bei Gruppe 2 beim Untersuchungsobjekt „Fernseher” (n = 24) ................................................ 359 Tabelle 65: Eigenschaftsset für das Untersuchungsobjekt „Fernseher“ für Gruppe 2 ........... 360 Tabelle 66: Häufigkeit von Cross-Over Interaktionen bei dem Untersuchungsobjekt „Laptop” .............................................................................................................. 364 Tabelle 67: Häufigkeit von Cross-Over Interaktionen bei dem Untersuchungsobjekt „Fernseher” für Gruppe 1 .................................................................................... 365 Tabelle 68: Häufigkeit von Cross-Over Interaktionen bei dem Untersuchungsobjekt „Fernseher” für Gruppe 2 .................................................................................... 366 Tabelle 69: Eigenschaftsset für das Untersuchungsobjekt „Laptop” ..................................... 367 Tabelle 70: Eigenschaftsset für das Untersuchungsobjekt „Fernseher“ für Gruppe 1 ........... 367 Tabelle 71: Eigenschaftsset für das Untersuchungsobjekt „Fernseher“ für Gruppe 2 ........... 367 Tabelle 72: Anzahl der ausgefüllten Fragebögen im Rahmen der Präferenzmessung ........... 369 Tabelle 73: Orthogonales Design für die Neue Methode beim Untersuchungsobjekt „Laptop“ .............................................................................................................. 371 Tabelle 74: Differenzendesign mit zufällig angeordneten Paarvergleichen für die Neue Methode beim Untersuchungsobjekt „Laptop“ ................................................... 372 Tabelle 75: Anzahl der zu bewertenden Paarvergleiche ........................................................ 372 Tabelle 76: Vermutete Rangfolge der Vorziehenswürdigkeit der Ausprägungen bei Gruppe 1 .............................................................................................................. 375 Tabelle 77: Häufigkeit der Erfüllung der a priori Rangfolge bei Gruppe 1 (n = 68) ............. 375 Tabelle 78: Vermutete Rangfolge der Vorziehenswürdigkeit der Ausprägungen bei Gruppe 2 .............................................................................................................. 376 Tabelle 79: Häufigkeit der Erfüllung der a priori Rangfolge bei Gruppe 2 (n = 65) ............. 376

XXII

Tabelle 80: Vermutete Rangfolge der Vorziehenswürdigkeit der Ausprägungen bei Gruppe 3 .............................................................................................................. 377 Tabelle 81: Häufigkeit der Erfüllung der a priori Rangfolge bei Gruppe 3 (n = 84) ............. 377 Tabelle 82: Vermutete Rangfolge der Vorziehenswürdigkeit der Ausprägungen bei Gruppe 1 .............................................................................................................. 378 Tabelle 83: Häufigkeit der Erfüllung der a priori Rangfolge bei Gruppe 1 (n = 69) ............. 378 Tabelle 84: Vermutete Rangfolge der Vorziehenswürdigkeit der Ausprägungen bei Gruppe 2 .............................................................................................................. 378 Tabelle 85: Häufigkeit der Erfüllung der a priori Rangfolge bei Gruppe 2 (n = 59) ............. 379 Tabelle 86: Vermutete Rangfolge der Vorziehenswürdigkeit der Ausprägungen bei Gruppe 3.1 ........................................................................................................... 379 Tabelle 87: Häufigkeit der Erfüllung der a priori Rangfolge bei Gruppe 3.1 (n = 49) .......... 379 Tabelle 88: Vermutete Rangfolge der Vorziehenswürdigkeit der Ausprägungen bei Gruppe 3.2 ........................................................................................................... 380 Tabelle 89: Häufigkeit der Erfüllung der a priori Rangfolge bei Gruppe 3.2 (n = 35) .......... 380 Tabelle 90: Interne Validität der verschiedenen Gruppen für das Untersuchungsobjekt „Laptop“ .............................................................................................................. 383 Tabelle 91: Rank Order Test für das Untersuchungsobjekt „Laptop” ................................... 383 Tabelle 92: Interne Validität der verschiedenen Gruppen für das Untersuchungsobjekt „Fernseher“ .......................................................................................................... 383 Tabelle 93: Rank Order Test für das Untersuchungsobjekt „Fernseher” ............................... 384 Tabelle 94: Hit-Rates für das Untersuchungsobjekt „Laptop” bei einem Vergleich der Ergebnisse der Referenzmethode mit den Schätzwerten der Präferenzmessung ................................................................................................ 386 Tabelle 95: Spearman Rang-Korrelationskoeffizient für das Untersuchungsobjekt „Laptop“ bei einem Vergleich der Ergebnisse der Referenzmethode mit den Schätzwerten der Präferenzmessung ................................................................... 387 Tabelle 96: Kendalls Tau Rang-Korrelationskoeffizient für das Untersuchungsobjekt „Laptop“ bei einem Vergleich der Ergebnisse der Referenzmethode mit den Schätzwerten der Präferenzmessung ................................................................... 387 Tabelle 97: Vergleich der prognostizierten Marktanteile mit den Ergebnissen der Referenzmethode beim Untersuchungsobjekt „Laptop“ ..................................... 388 XXIII

Tabelle 98: Hit-Rates für das Untersuchungsobjekt „Fernseher” bei einem Vergleich der Ergebnisse der Referenzmethode mit den Schätzwerten der Präferenzmessung ................................................................................................ 389 Tabelle 99: Spearman Rang-Korrelationskoeffizient für das Untersuchungsobjekt „Fernseher“ bei einem Vergleich der Ergebnisse der Referenzmethode mit den Schätzwerten der Präferenzmessung ............................................................ 389 Tabelle 100: Kendalls Tau Rang-Korrelationskoeffizient für das Untersuchungsobjekt „Fernseher“ bei einem Vergleich der Ergebnisse der Referenzmethode mit den Schätzwerten der Präferenzmessung .......................................................... 389 Tabelle 101: Vergleich der prognostizierten Marktanteile mit den Ergebnissen der Referenzmethode beim Untersuchungsobjekt „Fernseher“............................... 390 Tabelle 102: Mittelwerte der Einschätzung der Befragungssituation (9 Punkte RatingSkala: 1- negativer Pol, 9 - positiver Pol) beim Untersuchungsobjekt „Laptop“ ............................................................................................................ 392 Tabelle 103: Irrtumswahrscheinlichkeiten (p) der t-Tests auf Signifikanz der Unterschiede zwischen den untersuchten Gruppen beim Untersuchungsobjekt „Laptop“ ......................................................................... 393 Tabelle 104: Benötigte Zeit zur Einschätzung der Paarvergleiche innerhalb der ConjointAnalyse beim Untersuchungsobjekt „Laptop“ .................................................. 394 Tabelle 105: Mittelwerte der Einschätzung der Befragungssituation (9 Punkte RatingSkala: 1- negativer Pol, 9 - positiver Pol) beim Untersuchungsobjekt „Fernseher“ ........................................................................................................ 395 Tabelle 106: Irrtumswahrscheinlichkeiten (p) der t-Tests auf Signifikanz der Unterschiede zwischen den untersuchten Gruppen ........................................... 396 Tabelle 107: Aggregierte Maßzahlen der Kaufwahrscheinlichkeiten für die Alternativen der Referenzmethode ......................................................................................... 399 Tabelle 108: Irrtumswahrscheinlichkeiten (p) der Post-Hoc Tests bei der Varianzanalyse zur Analyse von Mittelwertunterschieden bei der Einschätzung von Kaufwahrscheinlichkeiten ................................................................................. 400 Tabelle 109: Mittelwert der Kaufwahrscheinlichkeiten nach der prognostizierten Rangfolge .......................................................................................................... 401 Tabelle 110: Aggregierte Maßzahlen der Kaufwahrscheinlichkeiten für die Alternativen der Referenzmethode ......................................................................................... 401 XXIV

Tabelle 111: Irrtumswahrscheinlichkeiten (p) der Post-Hoc Tests bei der Varianzanalyse zur Analyse von Mittelwertunterschieden bei der Einschätzung von Kaufwahrscheinlichkeiten ................................................................................. 402 Tabelle 112: Mittelwert der Kaufwahrscheinlichkeiten nach der prognostizierten Rangfolge .......................................................................................................... 402 Tabelle 113: Anteil der verwendeten Skalenpunkte zur der Bewertung der Stimuli beim Untersuchungsobjekt „Laptop“ ......................................................................... 404 Tabelle 114: Anteil der verwendeten Skalenpunkte zur der Bewertung der Stimuli beim Untersuchungsobjekt „Fernseher“ ..................................................................... 404 Tabelle 115: Mittelwerte der Unterschiedlichkeit der Bedeutungsgewichte ......................... 406 Tabelle 116: Irrtumswahrscheinlichkeiten (p-Werte) der Post-Hoc Tests bei der Analyse von mittleren Abweichungen der Bedeutungsgewichte .................................... 406 Tabelle 117: Bedeutungsgewichte der Eigenschaften bei Gruppe 2 (Duale Befragung) und dem Untersuchungsobjekt „Fernseher“ ...................................................... 407 Tabelle 118: Bedeutungsgewichte der Eigenschaften bei Gruppe 1 (Elicitation Technik) und dem Untersuchungsobjekt „Fernseher“ ...................................................... 407 Tabelle 119: Bedeutungsgewichte der Eigenschaften bei Gruppe 3.1 (neue Methode) und dem Untersuchungsobjekt „Fernseher“ ............................................................. 408 Tabelle 120: Bedeutungsgewichte der Eigenschaften bei Gruppe 3.2 (neue Methode) und dem Untersuchungsobjekt „Fernseher“ ............................................................. 408 Tabelle 121: Mittelwerte der Abweichungen von dem erwarteten Teilnutzen für das Untersuchungsobjekt “Laptop” ......................................................................... 409 Tabelle 122: Mittelwerte der Abweichungen von dem erwarteten Teilnutzen für das Untersuchungsobjekt “Fernseher” ..................................................................... 410 Tabelle 123: Beispiel für die Bestimmung von Bedeutungsgewichten ................................. 424 Tabelle 124: Aggregierte Bedeutungsgewichte ..................................................................... 424 Tabelle 125: Ausprägungen des Produktkonzepts und des Konkurrenzprodukts .................. 425 Tabelle 126: Beispiel für entscheidungsorientierte Bedeutungsgewichte.............................. 425 Tabelle 127: Ergebnisse der traditionellen Elicitation Technik für das Untersuchungsobjekt „Laptop“ (n = 41) ........................................................... 426 Tabelle 128: Ergebnisse der traditionellen Elicitation Technik für das Untersuchungsobjekt „Fernseher“ (n = 41) ....................................................... 427 XXV

Tabelle 129: Ergebnisse der Dualen Befragung für das Untersuchungsobjekt “Laptop” (n=42) ................................................................................................................ 428 Tabelle 130: Ergebnisse der Dualen Befragung für das Untersuchungsobjekt “Fernseher” (n=43) ................................................................................................................ 429 Tabelle 131: Orthogonales Design für die Elicitation Technik beim Untersuchungsobjekt „Fernseher“ ........................................................................................................ 430 Tabelle 132: Differenzendesign mit zufällig angeordneten Paarvergleichen für die Elicitation Technik beim Untersuchungsobjekt „Fernseher“ ............................ 430 Tabelle 133: Orthogonales Design für die Elicitation Technik beim Untersuchungsobjekt „Laptop“ ............................................................................................................ 431 Tabelle 134: Differenzendesign mit zufällig angeordneten Paarvergleichen für die Elicitation Technik beim Untersuchungsobjekt „Laptop“ ................................ 431 Tabelle 135: Orthogonales Design für die Duale Befragung beim Untersuchungsobjekt „Laptop“ ............................................................................................................ 432 Tabelle 136: Differenzendesign mit zufällig angeordneten Paarvergleichen für die Duale Befragung beim Untersuchungsobjekt „Laptop“ .............................................. 432 Tabelle 137: Orthogonales Design für die Duale Befragung beim Untersuchungsobjekt „Fernseher“ ........................................................................................................ 433 Tabelle 138: Differenzendesign mit zufällig angeordneten Paarvergleichen für die Duale Befragung beim Untersuchungsobjekt „Fernseher“ .......................................... 433 Tabelle 139: Orthogonales Design für die Neue Methode beim Untersuchungsobjekt „Fernseher“ für die Zielgruppe 1 ....................................................................... 434 Tabelle 140: Differenzendesign mit zufällig angeordneten Paarvergleichen für die Neue Methode beim Untersuchungsobjekt „Fernseher“ für die Zielgruppe 1 ........... 434 Tabelle 141: Orthogonales Design für die Neue Methode beim Untersuchungsobjekt „Fernseher“ für die Zielgruppe 2 ....................................................................... 435 Tabelle 142: Differenzendesign mit zufällig angeordneten Paarvergleichen für die Neue Methode beim Untersuchungsobjekt „Fernseher“ für die Zielgruppe 2 ........... 436 Tabelle 143: Bedeutungsgewichte der Eigenschaften bei Gruppe 1 und dem Untersuchungsobjekt „Laptop“ ......................................................................... 437 Tabelle 144: Bedeutungsgewichte der Eigenschaften bei Gruppe 2 und dem Untersuchungsobjekt „Laptop“ ......................................................................... 437 XXVI

Tabelle 145: Bedeutungsgewichte der Eigenschaften bei Gruppe 3 und dem Untersuchungsobjekt „Laptop“ ......................................................................... 437

XXVII

1 Einleitung Die Wettbewerbsfähigkeit und damit die Überlebensfähigkeit eines Unternehmens hängt in hohem Maße von der Fähigkeit ab, bereits bestehende Produkte an sich ändernde Bedürfnisse der Konsumenten anzupassen und kundenorientierte Innovationen zu generieren.1 Da in vielen Bereichen der Konsum- und Gebrauchsgüterindustrie der Wettbewerbsdruck gestiegen ist2 und zudem die Länge der Produktlebenszyklen tendenziell sinkt,3 hat sich die Bedeutung der Innovationstätigkeit in den letzten Jahren erhöht. Neuproduktentwicklungen sind in dieser veränderten Marktsituation ein Instrument, um das Unternehmenswachstum langfristig zu sichern und die Rendite zu verbessern.4 Entscheidend ist dabei eine permanente Innovationstätigkeit von Unternehmen, da einerseits viele Wettbewerbsvorteile auf Dauer imitierbar sind und sich andererseits die Kundenanforderungen ständig ändern.5 Mit Innovationsaktivitäten sind für die Unternehmen jedoch nicht nur Chancen, sondern meist auch erhebliche Investitionsaufwendungen6 und Risiken verbunden. In Meta-Studien zu Neuproduktentwicklungen liegen die Misserfolgsquoten derzeit bei 20% bis 96%.7 Viele dieser Flops könnten vermieden werden, wenn mehr Wert auf die frühen Phasen der Produktentwicklung gelegt werden würde.8 Es ist deshalb besonders wichtig, die Kundenanforderungen möglichst frühzeitig zu antizipieren und die Produkte an die spezifischen Anforderungen einer Zielgruppe anzupassen. In diesem Zusammenhang spielen Informationen über Kundenbedürfnisse eine entscheidende Rolle.9 Der Erfolg eines Unternehmens hängt somit insbesondere davon ab, inwieweit es im Vergleich zu den relevanten Wettbewerbern seinen Kunden einen höheren Nutzen stiften und auf sich ändernde Kundenwünsche reagieren kann. Gelingt es einem Hersteller dauerhaft, sich

1

Vgl. Brockhoff (1999), 1; Porter (1998), 163ff. Aus Sicht der Kunden werden Innovationen dabei als neuartig empfundene Produkte oder Dienstleistungen definiert, d.h. nicht die tatsächliche Neuartigkeit im Sinne einer vollständigen Neuproduktentwicklung ist entscheidend, sondern die Perzeption der Marktteilnehmer (vgl. Helm (2001), 49f.). Insofern können auch Produktanpassungen von den Kunden als Innovationen wahrgenommen werden. 2 Vgl. Soni; Lilien; Wilson (1993), 365; Tomkovick; Miller (2000), 415. 3 4 5 6 7 8 9

Vgl. Helm (2001), 34; Gruner; Sattler (2001), 26. Vgl. Brockhoff (1999), 1. Vgl. Porter (1998), 163ff.; Helm (2001), 40. Vgl. Porter (1998), 164. Eine umfangreiche Darstellung von Studien findet man in Helm (2001), 39. Vgl. Brockhoff (1999), 10; Porter (1998), 163. Vgl. Porter (1998), 163.

1

kontinuierlich auf die Anforderungen der Kunden einzustellen, so stellt dies einen wesentlichen Wettbewerbsvorteil gegenüber der Konkurrenz dar.10 Den Ausgangspunkt jeglicher unternehmerischer Tätigkeit bilden die Bedürfnisse der potenziellen Kunden.11 Um sich von der Konkurrenz erfolgreich differenzieren zu können, ist die Bestimmung der Eigenschaften und Eigenschaftsausprägungen, denen die Konsumenten besondere Bedeutung bei der Kaufentscheidung beimessen, ausschlaggebend. Es besteht somit eine enge Beziehung zwischen den relevanten Merkmalsausprägungen eines Produkts und dem Wettbewerbsvorteil eines Unternehmens. Fröhling (1994, 1144) bezeichnet deshalb strategische Wettbewerbsvorteile eines Unternehmens als verdichtete Kaufmerkmale. Die Kenntnis der Faktoren, die die Kaufentscheidung erheblich beeinflussen, ist aber auch deshalb grundlegend, weil heutzutage viele Produkte von den Kunden als sehr ähnlich wahrgenommen werden12 und es für die Hersteller immer schwieriger wird, sich hinsichtlich der aus Kundensicht relevanten Beurteilungsdimensionen vom Wettbewerb zu differenzieren. Da Innovationen, wie beschrieben, einen erheblichen Einfluss auf das Unternehmenswachstum ausüben, spielt die Neuproduktentwicklung eine bedeutende Rolle. Zu Beginn der Entwicklung neuer Produkte, d.h. in den beiden Phasen der Ideengenerierung und Konzeptentwicklung, ist den Unternehmen jedoch häufig die Wirkung verschiedener Eigenschaften und deren Ausprägungen auf die Kaufentscheidung der Kunden unbekannt. Allerdings sollten bereits die Ideen für Neuproduktentwicklungen auf Basis der für eine Zielgruppe relevanten Eigenschaften und Ausprägungen abgeleitet werden.13 In einem ersten Schritt müssen deshalb die aus Kundensicht relevanten Merkmale und Ausprägungen bestimmt werden. Erst auf der Grundlage dieser Informationen ist es möglich, im Rahmen eines Konzepttests kundenorientierte Produkte zu entwickeln und später zu vermarkten. Präferenzmessverfahren ermöglichen dabei eine genauere Analyse des Einflusses der Merkmale auf eine Kaufentscheidung sowie eine Abschätzung der Erfolgsträchtigkeit verschiedener Produktalternativen. Zu diesem Zweck können verschiedene Verfahren eingesetzt werden.14 Die Varianten der ConjointAnalyse sind dabei die am häufigsten eingesetzte Methoden zur Präferenzmessung im Rahmen der Konzeptentwicklung.15 Obwohl sich diese Verfahren auch bei kommerziellen Studien durch Marktforschungsinstitute wachsender Beliebtheit erfreuen, weisen die Ergebnisse teilweise eine unbefriedigende Güte auf, wovon sowohl traditionelle als auch neuere Metho10 11 12 13 14 15

2

Vgl. Fröhling (1994), 1144. Vgl. Fischer (2001), 8. Zur wahrgenommenen Ähnlichkeit von Gütern verschiedener Produktarten siehe Steffenhagen (2000, 35). Weitere Quellen für Neuproduktideen sind Wissenschaftler und Ingenieure im eigenen Unternehmen, die Produkte der Konkurrenz, Händler und Verkäufer sowie das unternehmensinterne Management (vgl. Kotler; Bliemel (2001), 522f.). Vgl. Herstatt; Sander (2004), 103. Vgl. Helm; Steiner; Scholl; Manthey (2004), 1; Wittink; Vriens; Burhenne (1994), 41.

den betroffen sind.16 Sie können deshalb nur eingeschränkt zur Prognose des realen Marktverhaltens von Kunden genutzt werden. Aufgrund der Kritik an den Ergebnissen der Präferenzmessung wurde in den letzten Jahren eine Vielzahl weiterer Conjoint-Varianten entwickelt oder Methoden aus anderen Forschungsbereichen wie der Entscheidungsanalyse übernommen.17 Vergleicht man die Schätzwerte der verschiedenen Verfahren zur Präferenzmessung miteinander, so ergibt sich allerdings ein äußerst heterogenes Bild. Keine Methode scheint dominant; es gibt also kein Verfahren, dass im Vergleich zu anderen eindeutig „bessere“ Ergebnisse liefert. Traditionelle Ansätze und neuere Methoden weisen beispielsweise oft eine vergleichbare Prognosevalidität auf.18 Vor diesem Hintergrund plädieren Wittink; Vriens; Burhenne (1994, 30) dafür, statt weitere Conjoint-Analyse Varianten zu entwickeln, endlich wieder zu den fundamentalen Forschungsfragen wie der Bestimmung der relevanten Eigenschaften und deren Ausprägungen zurückzukehren. Stallmeier (1993, 32) weist ebenfalls darauf hin, dass dieses Forschungsfeld in den vergangenen Jahren zu Unrecht in Forschung und Praxis keine große Aufmerksamkeit gefunden hat.19 Die Definition der zu untersuchenden Eigenschaften und Ausprägungen entspricht letztlich der „Problemdefinition“ bzw. der Phase der „Ideengenerierung“ im Bereich der Neuproduktentwicklung, d.h. der Frage, welche produktpolitischen Alternativen einem Unternehmen zur Verfügung stehen, um sich vom Wettbewerb zu differenzieren. Entscheidend ist dabei, dass das „Problem“ aus der Sicht der Konsumenten definiert werden muss, da ansonsten zwar möglicherweise eine valide Marktforschungsstudie, diese jedoch auf Basis falscher Annahmen durchgeführt wird. Die praktische Umsetzung der Marktforschungsergebnisse kann in diesen Fällen nicht das eigentliche Problem lösen.20 Generell wird der Bestimmung der relevanten Eigenschaften und deren Ausprägungen in der praktischen Anwendung bisher eine untergeordnete Rolle zugeschrieben. So wurden nach einer Meta-Studie von Schubert (1991, 306ff.) lediglich in 35% der untersuchten Studien Konsumenten in die Bestimmung der Eigenschaften einbezogen; lediglich 44,5% der Studien machten überhaupt Angaben zur Bestimmung der Eigenschaften.21 In den übrigen Fällen ist davon auszugehen, dass die Eigenschaften sowie deren Ausprägungen subjektiv vom Forscher 16

Vgl. Backhaus; Brzoska (2004), 48ff.

17

Siehe beispielsweise Sattler; Gedenk; Hensel-Börner (2001), 1ff.; Krapp; Sattler (2001), 1ff.; Srinivasan (1988), 295ff.; Helm; Manthey; Scholl; Steiner (2003), 1ff. oder Helm; Steiner; Scholl; Manthey (2004), 1ff. Siehe dazu Green; Helsen (1989), 346, 349; Agarwal (1988), 54; Orme; Alpert; Christensen (1997a), 220; Sawtooth Software (1999), 5; Elrod; Louviere; Davey (1992), 375. 19 Siehe dazu ebenfalls Jaccard; Brinberg; Ackerman (1986), 467. 18

20 21

Vgl. Gibson (1998), 8. Siehe Reiners (1996), 30, 37; Helm, Steiner (2006), 11.

3

festgelegt wurden.22 Doch selbst in Fällen, in denen eine systematische Bestimmung der zu untersuchenden Eigenschaften und Ausprägungen erfolgte, wurde die Vorgehensweise innerhalb der Studien häufig nicht ausreichend und nachvollziehbar beschrieben.23 Auch in den bekannten Artikeln zum Stand der Forschung in der Präferenzmessung von Green; Srinivasan (1990)24, Cattin; Wittink (1982) und Wittink; Cattin (1989a) wurde auf die Ermittlung der relevanten Eigenschaften nicht oder nur kurz eingegangen. Die Ergebnisse der Präferenzmessung variieren allerdings unabhängig von der verwendeten Methode je nachdem, welche Eigenschaften sowie Ausprägungen untersucht werden.25 Die Entscheidungen und Entscheidungsprozesse der potenziellen Kunden sind somit immer kontextabhängig.26 Daraus ergeben sich verschiedene Anforderungen, die eine Methode zur Bestimmung eines Eigenschaftssets erfüllen muss. Sie sollte u.a. gewährleisten, dass in der späteren Präferenzmessung alle relevanten Bewertungsdimensionen berücksichtigt werden.27 Fehlen bestimmte, für die Entscheider28 wichtige Eigenschaften, so ist mit verfälschten Schätzergebnissen zu rechnen, die nicht auf reale Wahlentscheidungen von Nachfragern übertragbar sind. Die in den Studien zur Präferenzmessung vorgegebenen Eigenschaften sowie deren Ausprägungen haben daher auch einen erheblichen Einfluss auf die Art der vom Entscheidungsträger genutzten Bewertungsstrategien. Ein Beurteilungskontext, in dem die für die Befragungsteilnehmer relevanten Eigenschaften und deren Ausprägungen fehlen, kann dazu führen, dass statt Trade-offs zwischen den Ausprägungen der Eigenschaften einfache Entscheidungsheuristiken29 angewendet werden,30 was die Ergebnisse der Präferenzmessung verzerren kann.31 Die Bestimmung der Eigenschaften sowie deren Ausprägungen stellt somit für die Ergebnisse der Präferenzmessung einen äußerst kritischen Schritt dar, da er sämtliche späteren

22 23

Vgl. Albrecht (1997), 300. Vgl. Stallmeier (1993), 32.

24

Im ersten Artikel von Green; Srinivasan (1978, 104f.) zum Stand der Forschung bei der Conjoint-Analyse wird kurz auf diese Problematik eingegangen, in Folgeartikeln (z.B. Green; Srinivasan (1990), 3ff.) wird dieser Aspekt nicht mehr berücksichtigt. 25 Vgl. Johnson; Levin (1985), 169; Yamagishi; Hill (1981), 13f.; Trommsdorff (1975), 57. 26 27 28 29 30 31

4

Vgl. Payne; Bettman; Schkade (1999), 246; Creyer; Ross (1988), 508; Verlegh; Schifferstein; Wittink (2002), 41. Vgl. Fröhling (1994), 1145; Wittink; Cattin (1989), 94. Mit Entscheider bzw. Entscheidungsträger werden im Folgenden potenzielle Nachfrager bezeichnet. Als Entscheidungsheuristiken werden hier vereinfachte Entscheidungsprogramme der Käufer bezeichnet, bei denen keine vollständige Informationsverarbeitung erfolgt (siehe dazu auch Höser (1998), 45). Vgl. Ratneshwar; Shocker; Stewart (1987), 523. Vgl. Acito (1977), 84; Hausruckinger (1993), 119f.; Mengen (1993), 85; Reiners (1996), 30.

Ergebnisse und Gütemaße erheblich beeinflusst.32 Trotz der genannten Vorbehalte entscheidet in der Praxis oft der jeweilige Auftraggeber einer Studie über die zu untersuchenden Eigenschaften und deren Ausprägungen.33 Cattin; Wittink (1982, 46) fordern deshalb, dass der Bestimmung der entscheidungsrelevanten Eigenschaften in der Forschung eine stärkere Bedeutung zukommen sollte.34 Insofern überrascht es, dass in den letzten 30 Jahren das Thema der Bestimmung von entscheidungsrelevanten Eigenschaften und deren Ausprägungen kaum problematisiert wurde.35 Neben der Auswahl der zu untersuchenden Merkmale wird in der Literatur auch die Ermittlung der relevanten Eigenschaftsausprägungen fast völlig vernachlässigt, obwohl auch dies oft als problematisch36 beschrieben wird. Dabei müssen zunächst die aus Konsumentensicht relevante Bandbreite und danach die einzelnen Ausprägungen festgelegt werden. Keine der bisher bekannten Methoden zur Bestimmung der entscheidungsrelevanten Eigenschaften kann dabei zufrieden stellende Ergebnisse liefern. Die Bestimmung der zu untersuchenden Ausprägungen ist allerdings der entscheidende Schritt bei der Festlegung eines zu untersuchenden Eigenschaftssets, da die Ergebnisse der Präferenzmessung durch die untersuchten Bandbreiten37 der Merkmale determiniert werden. Variiert man beispielsweise die Bandbreite einer Eigenschaft, so muss sich auch die Bedeutung dieses Attributs ändern.38 Werden die zu untersuchenden Eigenschaftsausprägungen, wie derzeit üblich, vom Marktforscher bestimmt, legt er damit den Einfluss der Eigenschaften auf die Präferenz selbst fest. Die Ermittlung der zu untersuchenden Ausprägungen sollte deshalb aus Kundensicht erfolgen, da der Marktforscher und die potenziellen Nachfrager u.U. unterschiedliche Anforderungen an ein Untersuchungsobjekt stellen. Wird dies nicht beachtet, können die Schätzergebnisse nicht zur Prognose von realen Wahlentscheidungen genutzt werden.

32

Vgl. American Marketing Association (1992), 6; Reiners (1996), 30; Payne; Bettman; Schkade (1999), 255; Klein (2002), 12; Meffert (2000), 401; Perrey (1998), 67; Theuerkauf (1989), 1180; Gibson (2001), 18; Cattin; Wittink (1982), 46. Die Bestimmung der zu untersuchenden Eigenschaften und Ausprägungen wird deshalb zu den wichtigsten, in der Zukunft zu lösenden Problembereichen gezählt (siehe dazu u.a. Bradlow (2005), 322). 33 Vgl. Cattin; Wittink (1982), 46. 34

Siehe dazu auch Zicha (1991), 36; Schubert (1991), 303; Payne; Bettman; Schkade (1999), 255; Fröhling (1994), 1159; Myers; Shocker (1981), 230. Möglicherweise fand dieses Themengebiet in der Forschung zur Präferenzmessung bisher kaum Beachtung, weil dieser erste Schritt der Problemdefinition keine spezifische Problematik einer bestimmten Methode der Präferenzmessung, sondern eine Vorbedingung für sämtliche Verfahren ist und daher von den Marktforschern bisher ausgeblendet wurde (vgl. Stallmeier (1993), 34; Melles (2001), 32). 36 Vgl. Fröhling (1994), 1146f. 35

37 38

Als Bandbreite wird im Folgenden der von einem Probanden wahrgenommene Präferenzunterschied zwischen der am wenigsten und der am meisten bevorzugten Eigenschaftsausprägung einer Eigenschaft definiert. Vgl. Sattler; Gedenk; Hensel-Börner (2002a), 1; Payne; Bettman; Schkade (1999), 246; Ratneshwar; Shocker; Stewart (1987), 520.

5

Bei der Bestimmung von relevanten Eigenschaften und Ausprägungen muss ferner berücksichtigt werden, dass bei der Untersuchung unterschiedlicher Kundengruppen jeweils zielgruppenspezifische Eigenschaftssets genutzt werden müssen. Dies ist notwendig, da die Mitglieder unterschiedlicher Kundengruppen voneinander abweichende Eigenschaften und Ausprägungen zur Bewertung von Produkten heranziehen.39 Um diesen Problem zu mildern, erlauben einige Methoden zur Präferenzmessung, dass zumindest völlig unakzeptable Eigenschaftsausprägungen auf individueller Ebene aus einer Untersuchung ausgeschlossen werden können. Andere, individualisierte Verfahren zur Präferenzmessung sollen sicherstellen, dass die Befragungsteilnehmer lediglich für sie relevante Informationen einschätzen. Ein Schwachpunkt aller Verfahren, die eine Individualisierung des Eigenschaftssets anstreben, ist jedoch, dass die Selektion der Bewertungsdimensionen auf individueller Ebene nicht stabil ist.40 Weiterhin können aufgrund der unterschiedlichen Bewertungsbasis die Ergebnisse der Präferenzmessung nur sehr eingeschränkt aggregiert werden.41 Voeth (2000, 177) plädiert deshalb dafür, dass nur die Ergebnisse von Befragungsteilnehmern mit homogenen Bewertungen aggregiert werden, d.h. lediglich Personen der gleichen Zielgruppe werden zusammengefasst. Dieser Vorschlag bedeutet letztlich, dass die Befragungsteilnehmer nach der Präferenzmessung in unterschiedlichen Gruppen aggregiert werden, die eine identische merkmalsbezogene Basis aufweisen. Dies entspricht verschiedenen getrennten, traditionellen Präferenzmessungen. Eine zielgruppenspezifische Erhebung macht durchaus Sinn, da in der Realität ebenfalls nicht völlig individualisierte, sondern zielgruppenspezifische Produkte angeboten werden. Die notwendige Gruppenbildung könnte aber bereits im ersten Schritt, also in der Phase der Bestimmung der Eigenschaften und deren Ausprägungen erfolgen, so dass die Entscheider im Anschluss zielgruppenspezifische Eigenschaftssets bewerten. Es ist weiterhin bekannt, dass Entscheidungsträger ausschließlich zu den Alternativen des individuellen Evoked-Sets42 ausgeprägte Präferenzen aufweisen.43 Stabile Einschätzungen sind demnach lediglich bezüglich jener Eigenschaften und Ausprägungen bereits vorhanden und damit messbar, die von den Befragungsteilnehmern in der Phase der Wahlentscheidung vor dem Kaufakt zur Bewertung der Alternativen herangezogen werden.44 Soll ein Entscheider dagegen Alternativen bewerten, die sich nicht in seinem Evoked-Set befinden, so muss er

39

Schon Shocker; Srinivasan (1979b, 9ff.) weisen darauf hin, dass für unterschiedliche Zielgruppen verschiedene Eigenschaften relevant sind. 40 Vgl. Huber (1987), 6. 41 42 43 44

6

Vgl. Voeth (2000), 177. Das Evoked-Set bezeichnet die Produktalternativen, die in eine letztliche Wahlentscheidung einfließen. Siehe Kapitel 2.3. Vgl Klein (2002), 8; Hahn (1997), 5. Siehe Kapitel 2.3.

zunächst Präferenzen „konstruieren“.45 Dies bedeutet, dass die Nutzen lediglich auf Basis der im Untersuchungskontext vorgegebenen Informationen bestimmt werden.46 Die Konstruktion von Beurteilungen ist dabei mit einem Lernprozess vergleichbar, d.h. „konstruierte“ Präferenzen entwickeln sich erst im Verlauf einer Befragung.47 Dies hat jedoch zur Folge, dass nur die letzten Bewertungen der Probanden zur Schätzung von Teilnutzen verwendet werden könnten. Zur Nutzenschätzung werden von den Verfahren zur Präferenzmessung aber alle Bewertungen herangezogen, was in diesen Fällen zu verzerrten Ergebnissen führt.48 Ein Eigenschaftsset sollte folglich sicherstellen, dass Präferenzen überhaupt gemessen werden können und nicht erst vom Entscheider „konstruiert“ werden müssen. Eine Grundvoraussetzung dafür ist, dass unterschiedliche Kundengruppen explizit berücksichtigt werden und Entscheider ausschließlich die für sie relevanten Informationen einschätzen. Das Ziel dieser Arbeit ist deshalb, eine Methode zu entwickeln, die die Erfassung der aus Sicht der Entscheidungsträger relevanten Merkmale und Ausprägungen und bereits eine erste Segmentierung der Befragungsteilnehmer ermöglicht. In einer anschließenden Präferenzmessung werden lediglich die für eine Zielgruppe relevanten Informationen bewertet; die zu untersuchenden Eigenschaftssets müssen also die unterschiedlichen Anforderungen der Kundengruppen widerspiegeln, wobei sich diese teilweise überschneiden können. Die Bestimmung der zu untersuchenden Eigenschaften und Ausprägungen, d.h. die Problemdefinition wird derzeit teilweise als „more art than science“49 beschrieben. Mit Hilfe der zu entwickelnden Methode soll schließlich ein erster Schritt zur systematischen und nachvollziehbaren Problemdefinition geliefert werden. Der Aufbau der Arbeit orientiert sich dabei an den bereits erwähnten Problembereichen. In einem zweiten Kapitel werden zunächst grundlegende Begriffe definiert und die Bedeutung der Präferenzmessung verdeutlicht – im Mittelpunkt steht dabei der Einfluss der Präferenzmessung im Neuproduktentwicklungsprozess aus Unternehmens- und ein typischer Kaufentscheidungsprozess aus Kundensicht. Weiterhin wird bestimmt, welche Produktgruppen überhaupt sinnvoll mit Hilfe der Methoden zur Präferenzmessung untersucht werden können. Im dritten Kapitel werden die zur Präferenzmessung typischen Verfahren präsentiert sowie deren grundlegende Merkmale beschrieben. Es zeigt sich, dass eine Vielzahl an Methoden zur Präferenzmessung eingesetzt werden kann. Allerdings existiert, wie beschrieben, kein domi45 46 47 48 49

Vgl. Bettman; Luce; Payne (1998), 188; Heitmann; Herrmann (2006), 225f. Vgl. Bettman; Luce; Payne (1998), 188. Vgl. Heitmann; Herrmann (2006), 226. Dies gilt insbesondere für wahlbasierte Verfahren der Präferenzmessung, da dabei typischerweise relativ wenig Einschätzungen erhoben werden (siehe auch Kapitel 3.1). Gibson (1998), 5.

7

nantes Verfahren. Ausgehend von den methodenspezifischen Vor- und Nachteilen kann ein Verfahren zur Präferenzmessung ausgewählt werden. Nachdem eine Methode zur Präferenzmessung festgelegt wurde, können in weiteren Schritten die Zahl der zu untersuchenden Eigenschaften und darauf aufbauend das Erhebungsdesign bestimmt und die Präferenzen erhoben werden. Ziel der Präferenzmessung ist es, auf die Bedürfnisse einer bzw. mehrerer Kundengruppen abgestimmte Produkte zu entwickeln. Die Möglichkeiten zur Bestimmung von Zielgruppen und der Aggregation der Ergebnisse der Präferenzmessung werden deshalb beschrieben. In einem weiteren Schritt muss die Güte der Präferenzmessung untersucht werden, dies erfolgt auf Basis verschiedener Validitätsmaße sowie Einschätzungen der Probanden zur Befragungssituation. Da diese Gütemaße nur eingeschränkt zur Analyse der vom Entscheidungsträger herangezogenen Bewertungsstrategien geeignet sind, werden hier weitere Gütemaße vorgeschlagen. Im vierten Kapitel werden zunächst die in der Literatur üblichen Eigenschaftsarten beschrieben und deren Einfluss auf die Präferenzmessung diskutiert. Auf Basis dieser Merkmalsarten und der Verfahren zur Präferenzmessung können Anforderungen an ein zu untersuchendes Eigenschaftsset aufgestellt werden, die die Methoden zur Bestimmung der relevanten Eigenschaften und Ausprägungen erfüllen müssen. Anschließend werden die Verfahren zur Bestimmung der relevanten Eigenschaften und Möglichkeiten zur Festlegung der zu untersuchenden Ausprägungen präsentiert und bewertet (Kapitel 5). Dabei wird deutlich, dass die bisherigen Techniken zur Bestimmung eines Eigenschaftssets den grundlegenden Ansprüchen nicht gerecht werden können. Ausgehend von den Anforderungen an ein Eigenschaftsset wird deshalb ein Vorschlag für eine neuartige Methode erarbeitet, die diesen grundlegenden Anwendungsbedingungen möglichst gut entsprechen soll (Kapitel 6). Im Rahmen einer empirischen Untersuchung (Kapitel 7) werden schließlich zwei traditionelle Vorgehensweisen zur Bestimmung von relevanten Eigenschaften mit der neu entwickelten Methode verglichen. Ziel der Studie ist die Überprüfung der Anwendbarkeit des vorgeschlagenen Verfahrens und die Analyse der Auswirkungen auf die Ergebnisse der Präferenzmessung. Dazu werden zunächst mit Hilfe der Methoden drei Eigenschaftssets bestimmt, die in einem zweiten Schritt zur Präferenzmessung genutzt werden. Auf Basis der Ergebnisse der Präferenzmessung kann die Eignung der Eigenschaftssets und deren Auswirkungen eingeschätzt werden. Im Mittelpunkt stehen dabei die Analyse der Befragungssituation und die von den Befragungsteilnehmern angewandten Bewertungsstrategien. Diese dienen als Indiz dafür, ob und wie stark die Ergebnisse der Präferenzmessung auf reale Wahlentscheidungen übertragen werden können. 8

Im achten Kapitel werden die Ergebnisse zusammengefasst, praktische Anwendungsmöglichkeiten des neu entwickelten Verfahrens sowie mögliche Entwicklungen im Bereich der Präferenzmessung diskutiert. Der Aufbau der Arbeit wird in der folgenden Abbildung 1 dargestellt.

2. Kapitel: Theoretische Grundlagen der Präferenzmessung

3. Kapitel Schritte bei der Präferenzmessung

4. Kapitel Gütemaße zur Einschätzung der Ergebnisse der Präferenzmessung

- praktische Bedeutung der Präferenzmessung - die Präferenz im Kaufentscheidungsprozess - Produkte als Untersuchungsobjekt der Präferenzmessung - Anforderungen an Untersuchungsobjekte - Überblick und Selektion einer Methode zur Präferenzmessung - Skalenarten und Schätzverfahren - Erhebungsdesign und Präsentationsform - Standardisierung und Aggregation der Ergebnisse der Präferenzmessung - Befragungssituation - Augenscheinvalidität - Analyse des Bewertungsverhaltens - interne Validität - Prognosevalidität und externe Validität - Reliabilität

5. Kapitel Arten und Besonderheiten von Eigenschaften

6. + 7. Kapitel Anforderungen an Eigenschaften und Ausprägungen Relevanz von Merkmalen

8. Kapitel Methoden zur Identifizierung der entscheidungsrelevanten Eigenschaften

9. Kapitel Bestimmung der zu untersuchenden Eigenschaftsausprägungen

10. Kapitel Einschätzung der Verfahren zur Bestimmung des zu untersuchenden Eigenschaftssets

Empirischer Vergleich zwischen traditionellen Verfahren und der vorgeschlagenen Methode

11. Kapitel Vorschlag einer Vorgehensweise zur Bestimmung der relevanten Eigenschaften und Eigenschaftsausprägungen

13. Kapitel Bestimmung des Eigenschaftssets mittels traditioneller Methoden

Fazit

Vorschlag einer neuartigen Methode

Stand der Forschung zur Bestimmung der Eigenschaften

Grundlagen der Präferenzmessung

Aufbau der Arbeit

12. Kapitel Diskussion und Ausblick

12. Kapitel Beschreibung der Studie 14. Kapitel Bestimmung des Eigenschaftssets mit Hilfe der vorgeschlagenen Methoden

15. Kapitel Vergleich der Ergebnisse der Präferenzmessung zwischen den traditionellen Methoden und der vorgeschlagenen Vorgehensweise

Abbildung 1: Aufbau der Arbeit

9

2 Theoretische Grundlagen der Präferenzmessung Ausgangspunkt jeglicher unternehmerischer Marktaktivitäten und damit der Präferenzmessung bilden die Bedürfnisse der potenziellen Kunden.50 Bedürfnisse sind dabei der Startpunkt des menschlichen Kaufentscheidungsprozesses und stellen ein Mangelgefühl, verbunden mit dem Bestreben der Beseitigung dieses Mangelgefühls, dar.51 Ein Individuum wird versuchen, diesen Zustand zu überwinden, indem es verschiedene Alternativen zur Bedürfnisbefriedigung selektiert und bewertet. Der sich daraus ableitende Bedarf ist objektorientiert und somit auf eine Reihe von Produktalternativen bezogen, die generell zur Bedürfnisbefriedigung geeignet erscheinen.52 Die letztendliche Entscheidung für eine konkrete Produktalternative wird hierbei stark von den Präferenzen des Entscheidungsträgers beeinflusst.53 Aufgrund der engen Beziehung zwischen Präferenzen und dem tatsächlichen Kaufverhalten spielen die Verfahren der Präferenzmessung eine bedeutende Rolle bei der Erklärung der Alternativenselektion von Nachfragern.54 Trotz ihrer herausragenden Bedeutung für die Produktentwicklung gibt es derzeit noch keine einheitliche Definition für den Begriff „Präferenz“.55 In der Regel wird Präferenz als eindimensionaler Indikator für die subjektive Vorziehenswürdigkeit einer Alternative gegenüber anderen Produktalternativen zu einem bestimmten Zeitpunkt beschrieben.56 Sie ist demzufolge ein entscheidendes Element zur Erklärung von Kaufentscheidungsprozessen.57 Im Vergleich zu Einstellungen, die als gelernte Bereitschaft eines Entscheidungsträgers auf einen Stimulus in einer bestimmten Art und Weise zu reagieren, beschrieben werden können,58 handelt es sich bei Präferenzen um die Einstellungsdifferenz zwischen mindestens zwei Alterna-

50 51 52 53 54 55 56 57 58

Vgl. Fischer (2001), 8. Vgl. Böcker; Helm (2003), 17; Trommsdorff (2003), 114. Vgl. Böcker; Helm (2003), 17; Fischer (2001), 8. Vgl. Fischer (2001), 8. Vgl. Fischer (2001), 9; Albrecht (2000), 7. Vgl. Fischer (2001), 9; Balderjahn (1993), 22. Vgl. Böcker (1986), 556; Thaden (2002), 1; Hahn (1997), 6f.; Schweikl (1985), 26; Albrecht (2000), 7. Vgl. Höser (1998), 27. Siehe dazu auch Kapitel 2.3. Vgl. Böcker; Helm (2003), 167.

11

tiven59 und somit „relativierte Einstellungen“.60 Präferenzen sind zudem stets auf einen einzelnen Entscheidungsträger bezogen - es handelt sich also um individuelle Beurteilungen.61 Durch die zeitliche Komponente der oben beschriebenen Definition wird deutlich, dass die Präferenz eine dynamische Größe und als solche das Ergebnis wiederholter Perzeptions- und Präferenzbildungsprozesse ist, das einem stetigen Wandel unterliegt.62 Präferenzen sind immer abhängig von den aktuell präsentierten Eigenschaften und Eigenschaftsausprägungen, d.h. sie sind immer kontextabhängig63 - ein Aspekt, der im folgenden Kapitel 2.2 genauer betrachtet wird. Zudem werden vom Nachfrager im Rahmen des Kaufentscheidungsprozesses lediglich bezüglich der Alternativen, die sich in seinem Evoked-Set64 befinden, genau definierte Präferenzen gebildet.65 Die Präferenz kann damit als geeigneter Prädiktor für die Auswahlentscheidung von Nachfragern gesehen werden, wobei jedoch zu beachten ist, dass anhand der Vorziehenswürdigkeit von Produktalternativen noch nicht darauf geschlossen werden kann, ob der Konsument eine Alternative kauft.66 Präferenzen werden danach unterschieden, ob bei der Erhebung restriktive Kauffaktoren einbezogen werden (Constrained Preferences) oder nicht (Unconstrained Preferences). Bei der Analyse von Constrained Preferences wird explizit berücksichtigt, dass Entscheider nicht unbedingt die Produktalternative wählen, die sie am meisten präferieren, sondern Wahlentscheidungen unter Berücksichtigung individueller Budgetrestriktionen getroffen werden.67 Derartige Kaufrestriktionen werden bisher lediglich berücksichtigt, indem der Preis einer Alternative als Produktmerkmal in die Untersuchungen aufgenommen wird.68 Eine Beschränkung auf individuelle Budgetrestriktionen erscheint jedoch nicht ausreichend, denn es kann nicht davon ausgegangen werden, dass allein die Eigenschaft „Preis“ in jedem 59

Vgl. Hahn (1997), 5; Höser (1998), 27; Heitmann; Herrmann (2006), 225. Einige Forscher wie Schweikl (1985, 26) oder Nowlis; Simonson (1997, 205) nutzen die Begriffe „Präferenz“ und „Nutzen“ als Synonyme. Präferenzen könnten demnach auch durch die direkte und isolierte Einschätzung einzelner Alternativen erhoben werden (vgl. Nowlis; Simonson (1997), 205). In dieser Arbeit wird jedoch analog zu Voeth (2000, 5f.) zwischen diesen beiden Begriffen unterschieden. Nutzen wird deshalb als „hypothetische objektbezogene Beurteilungsgröße“ (Voeth (2000), 5f.) definiert, d.h. es handelt sich um den subjektiven Wertmaßstab zur Beurteilung des Ausmaßes der Bedürfnisbefriedigung von Produktalternativen (vgl. Höser (1998), 26; Ahlert; Kenning (2006), 33). Präferenzen ergeben sich demgegenüber, wie oben beschrieben, immer erst aus dem Nutzenvergleich mindestens zweier Alternativen (vgl. Albrecht (2000), 7). 60 Trommsdorff (2003), 150. 61

Vgl. Hahn (1997), 5.

62

Vgl. Gierl (1987), 459; Hahn (1997), 5. Albrecht (2000, 7) beschreibt Präferenzen im Gegensatz dazu als „[i]nnerhalb eines bestimmten Zeitraums … stabil“, ohne jedoch die Einflussfaktoren auf diesen Zeitraum genauer zu erläutern. Er kommt jedoch zu dem Schluss, dass sich Präferenzen im Laufe der Zeit verändern können. 63 Vgl. Payne; Bettman; Schkade (1999), 246; Ratneshwar; Shocker; Stewart (1987), 520; Goldstein (1990), 316. 64 65 66 67 68

12

Siehe Kapitel 2.3. Vgl. Klein (2002), 8; Hahn (1997), 5. Die Erfassung von Präferenzen für Produkte, die sich nicht im Evoked-Set eines Befragungsteilnehmers befinden, ist somit nicht sinnvoll. Vgl. Hahn (1997), 8ff.; Balderjahn (1993), 112. Siehe auch Kapitel 2.3. Vgl. Hahn (1997), 6f.; Balderjahn (1993), 23, 26; Höser (1998), 51. Vgl. Balderjahn (1993), 98.

Fall Einfluss auf die letztendliche Kaufentscheidung ausübt – dies gilt insbesondere, wenn die Alternativen im Evoked-Set eines Entscheidungsträgers ein ähnliches Preisniveau aufweisen. Deshalb wird in dieser Arbeit vorgeschlagen, die Präferenzen auf Basis der Gesamtheit sämtlicher Anforderungen eines Entscheiders zu ermitteln – dies ist nur möglich, wenn die Erhebung der Präferenzen ausgehend vom Evoked-Set der Befragungsteilnehmer erfolgt.69 Entscheidend ist dabei, dass explizit unterschiedliche Kundengruppen berücksichtigt werden. Dies ist unerlässlich, da beispielsweise die Alternativen des Evoked-Sets einer Zielgruppe z.B. bezüglich des Preisniveaus für eine andere Kundengruppe unakzeptabel sein könnten. Im Rahmen der Präferenzmessung sollten deshalb zielgruppenspezifische Präferenzen erhoben werden. Eine strikte Fokussierung der gesamten Präferenzmessung auf die Alternativen des EvokedSets ist neu, aber zwingend notwendig, da Nachfrager lediglich bezüglich dieser Alternativen stabile Präferenzen ausbilden, die gemessen werden können.70 Der Ausgangspunkt einer Methode zur Bestimmung der relevanten Eigenschaften und Ausprägungen, aber auch der Präferenzmessung selbst muss deshalb das Evoked-Set der Befragungsteilnehmer sein.

2.1

Die Bedeutung der Präferenzmessung als Element der Neuproduktentwicklung

In vielen Branchen der Konsum- und Gebrauchsgüterindustrie ist in den letzten Jahren ein steigender Wettbewerbsdruck zu beobachten.71 Die Innovationskosten und die durchschnittliche Produktentwicklungszeit sind in den letzten Jahren tendenziell gestiegen, während die Länge der Produktlebenszyklen eher abnimmt. Durch die Globalisierung der Märkte drängen zudem immer neue Wettbewerber in angestammte Märkte der Hersteller vor.72 Eine auch auf langfristige Sicht erfolgversprechende Strategie, um als Unternehmen diesem gestiegenen Wettbewerbsdruck zu begegnen, besteht in der permanenten Innovationstätigkeit.73 Insbesondere vor dem Hintergrund kürzer werdender Produktlebenszyklen74 ist es notwendig, seine Produkte permanent an die Kundenanforderungen anzupassen.75 Die Innovationstätigkeit ist insofern eine der Schlüsselfunktionen im Unternehmen.76 Zwischen der Innovationstä69 70

Siehe dazu Kapitel 2.3. Vgl. Klein (2002), 8; Hahn (1997), 5. Dies wird ausführlich in Kapitel 2.3 beschrieben.

71

Vgl. Soni; Lilien; Wilson (1993), 365; Ali (1994), 46; Tomkovick; Miller (2000), 413; Sawalsky (1995), 22ff.; Uebele (1988), 777. 72 Vgl. Sawalsky (1995), 17ff.; Helm; Scholl; Manthey; Steiner (2004), 13. 73 74 75 76

Vgl. Helm (2001), 30; Brockhoff (1999), 1; Gruner; Homburg (1998), 1; Tomkovick; Miller (2000), 415; Sawalsky (1995), 7f. Vgl. Helm (2001), 34; Gruner; Homburg (1999), 120; Sattler (2001), 26; Ali (1994), 46; Sawalsky (1995), 17f. Vgl. Helm (2001), 34; Tomkovick; Miller (2000), 413; Boutellier; Völker (1997), 49; Albers; Kemnitz (1985), 236. Vgl. Helm (2001), 33; Gruner; Homburg (1999), 120; Tomkovick; Miller (2000), 415.

13

tigkeit von Unternehmen und dem langfristigen Unternehmenserfolg besteht somit eine enge Beziehung, die in empirischen Untersuchungen wie der PIMS-Studie nachgewiesen werden konnte. Dabei wurde festgestellt, dass gerade Innovationen einen hohen Anteil an Umsatzund Marktanteilssteigerungen bei Unternehmen verschiedener Branchen ausmachen.77 Innovationen der Hersteller sind jedoch nicht nur mit Chancen, sondern stets auch mit entsprechend hohen Risiken78 verbunden. Die Entwicklung und Vermarktung neuer Produkte bindet typischerweise erhebliche finanzielle Ressourcen.79 Der Misserfolg verschiedener Innovationen kann ein Unternehmen deshalb in erhebliche Bedrängnis bringen und dessen Überleben am Markt in Frage stellen.80 Die Flopraten bei neu entwickelten Produkten liegen je nach Branche zwischen 20% und 98%.81 Einer konsumentenorientierten Neuproduktentwicklung kommt infolgedessen eine besondere Bedeutung zur Reduzierung des Floprisikos zu. Produktinnovationen können technologie- bzw. nachfrageinduziert von den Herstellern entwickelt werden.82 Bei technologieinduzierten Produktinnovationen erfolgt die Entwicklung des neuen Produkts weitgehend durch die Forschungs- und Entwicklungsabteilung im jeweiligen Unternehmen. Bei nachfrageinduzierten Innovationen bilden demgegenüber die Bedürfnisse der Konsumenten die Grundlage für die Produktentwicklung.83 Aus Unternehmenssicht stellt sich die Frage, welche von beiden Innovationsstrategien verfolgt werden sollte. Oftmals wird dabei eine „geeignete Mischung“84 nachfrage- und technologieinduzierter Innovationstätigkeiten als am erfolgreichsten bezeichnet. Letztendlich kann diese Frage allerdings nicht allgemeingültig beantwortet werden. Vielmehr kommt es darauf an, ob ein Unternehmen radikale bzw. inkrementale Innovationen anstrebt. Bei radikalen Innovationen ist davon auszugehen, dass technologieinduzierte Innovationsstrategien geeignet

77 78

Vgl. Helm (2001), 39. Siehe analog Hauser; Urban (1977), 579f.; Ali (1994), 46; Tomkovick; Miller (2000), 416f.; Sawalsky (1995), 8; Urban; Weinberg; Hauser (1996), 47. Vgl. Helm (2001), 32; Sawalsky (1995), 13ff.; Calantone; Cooper (1981), 48; Erichson (2000), 387f.

79

Vgl. Helm (2001), 36; Brockhoff (1999), 2; Soni; Lilien; Wilson (1993), 365; Sawalsky (1995), 7; Urban; Hauser (1993), 60. 80 Vgl. Helm (2001), 40; Soni; Lilien; Wilson (1993), 365; Sawalsky (1995), 15f. 81

Für einen Überblick über verschiedene Studien siehe Helm (2001), 39 und Sawalsky (1995), 16. Siehe dazu auch Brockhoff (1999), 3ff.; Sattler (2001), 25; Fricke; Lohse (1997), 65; Erichson (2000), 387; Helm; Scholl; Manthey; Steiner (2004), 13. Vergleicht man diese Raten mit älteren Untersuchungen in denen beispielsweise Flopraten von 30% (vgl. Hauser; Urban (1977), 580) oder 64,5 %, im Jahr 1982 (vgl. Urban; Katz; Hatch; Silk (1983), 39) beschrieben wurden, so ist erkennbar, dass der Anteil der Flops an den Neuproduktentwicklungen in den letzten Jahren tendenziell gestiegen ist. 82 Vgl. Buchholz (1996), 129ff.; Paulson Gjerde; Slotnick; Sobel (2002), 1268; Gierl; Helm (2002), 313f.; Brockhoff (2000), 31ff. 83 Vgl. Helm (2001), 63. 84

14

Helm (2001), 64. Siehe ebenso Parry; Song (1994), 27f. und Buchholz (1996), 131f., die die Bedeutung nachfrageinduzierter Innovationen unterstreichen.

sind.85 Demgegenüber erscheinen bei eher inkrementalen Verbesserungen nachfrageinduzierte Innovationsstrategien erfolgversprechender.86 Da es sich bei den meisten Neuprodukten eher um inkrementale Innovationen handelt,87 sollen die nachfrageinduzierten Innovationen im Mittelpunkt der folgenden Betrachtungen stehen. Gleichwohl ist es auch bei technologieinduzierten Innovationen wichtig, potenzielle Kunden möglichst frühzeitig in den Innovationsprozess einzubeziehen,88 da sichergestellt werden muss, dass diese den angestrebten Produktvorteil überhaupt wahrnehmen können, die spezielle Leistung wünschen bzw. akzeptieren und bereit sind, diese entsprechend zu bezahlen.89 Die Analyse von Kundenanforderungen bzw. Kundennähe ist deshalb ein zentraler Erfolgsfaktor bei der Entwicklung neuer Produkte.90 Die Anforderungen der potenziellen Kunden sollten insbesondere bei Produktverbesserungen in allen Phasen des Innovationsprozesses im Mittelpunkt der Planungen stehen,91 wobei insbesondere in den Phasen der Konzeptentwicklung, des Produkttests und der Markteinführung Nachfrager im Innovationsprozess berücksichtigt werden sollten.92 Gerade die Einbeziehung potenzieller Nachfrager in frühe Phasen der Produktentwicklung, wie der Konzeptentwicklung, hat einen besonders großen Einfluss auf die Erfolgschancen der später am Markt eingeführten Innovationen, da zu diesem Zeitpunkt die Möglichkeiten zur Anpassung der Produkte an die Konsumentenbedürfnisse noch groß sind.93 Insbesondere bei inkrementalen Innovationen erscheint eine möglichst frühe Einbindung der potenziellen Kunden in die Produktentwicklung erfolgversprechend und erhöht die Wahrscheinlichkeit, dass das Produkt später von den Kunden akzeptiert wird.94 So können Zeit, Kosten und weitere Unternehmensressourcen effektiver eingesetzt bzw. gespart werden. Informationen über die Kundenbedürfnisse werden so zu einem entscheidenden Erfolgsfaktor bei der Neuproduktentwicklung.95 Dem Aufbau von Neuproduktentwicklungsprozessen kommt deshalb in Forschung und Praxis eine erhebliche Bedeutung zu, was nicht zuletzt an der Vielzahl an Studien zu diesem Themenbereich ersichtlich ist.96 Neuproduktentwicklungsprozesse beinhalten dabei Gestaltungs-, 85 86 87 88 89 90 91 92 93 94 95 96

Vgl. Helm (2001), 65; Simon (1996), 109f.; Buchholz (1996), 131. Vgl. Helm (2001), 65; Buchholz (1996), 131. Vgl. Helm (2001), 65; Brockhoff (1999), 2; Ali (1994), 46. Der Anteil der inkrementalen Innovationen ist jedoch von der jeweiligen Branche abhängig (vgl. Ali (1994), 47; Sawalsky (1995), 16). Vgl. Helm (2001), 79f. Vgl. Simon (1996), 110f.; Brockhoff (1999), 2. Vgl. Herstatt; Sander (2004), 100; Simon (1996), 112; Hauser; Urban (1977), 580; Shocker; Srinivasan (1979a), 159. Vgl. Helm (2001), 105f.; Schubert (1991), 80; Fricke; Lohse (1997), 8; Shocker; Srinivasan (1979a), 161. Vgl. Helm (2001), 80; Gruner; Homburg (1999), 136f.; Gruner; Homburg (1998), 27; Meffert (2000), 391. Vgl. Kristensson; Gustafsson; Archer (2004), 4; Brockhoff (1999), 10f.; Urban; Hauser (1993), 67ff.; Shocker; Srinivasan (1979a), 160. Vgl. Helm (2001), 80; Gruner; Homburg (1999), 137. Siehe auch Schubert (1991), 75, 105. Vgl. Parry; Song (1994), 28; Erichson (2000), 387. Für einen Überblick siehe beispielsweise Cooper; Kleinschmidt (1995), 377.

15

Bewertungs- und Auswahlaufgaben, die auf Basis der Kundenbedürfnisse gelöst werden müssen.97 Diese laufen, aufgrund der Vielfalt möglicher Güter und Dienstleistungen, auf unterschiedliche Weise ab und werden typischerweise durch Phasenmodelle, die einen idealtypischen Verlauf kennzeichnen, dargestellt. Man unterscheidet dabei zwischen „klassischen“ und „modernen“ Phasenmodellen der Neuproduktentwicklung.98 Der Unterschied zwischen den klassischen und modernen Phasenmodellen zur Produktentwicklung ist, dass bei den klassischen Verfahren die Konsumenten nicht in den Entwicklungsprozess einbezogen werden. Das Erfolgspotenzial der Produktkonzepte wird allein von Produktverantwortlichen des Unternehmens bzw. sonstigen Experten bewertet. Inzwischen wird in der Marketing-Literatur allgemein akzeptiert, dass nicht die Einschätzungen der Experten, sondern die der Konsumenten der jeweiligen Zielgruppe relevant sind. Deshalb erscheint eine solche klassische Vorgehensweise, insbesondere im Hinblick auf die geänderten Rahmenbedingungen und den steigenden Wettbewerbsdruck, nicht mehr zeitgemäß.99 Das frühzeitige Erkennen von Konsumentenbedürfnissen, d.h. eine auf das Schaffen von Konsumentenvorteilen ausgerichtete Innovationspolitik, wird infolgedessen immer wichtiger.100 Neuere Phasenmodelle berücksichtigen explizit die Bedürfnisse der potenziellen Kunden in allen Schritten der Neuproduktentwicklung. Die Phase der Konzeptentwicklung nimmt dabei die zentrale Rolle ein – potenzielle Nachfrager werden so möglichst früh in den Neuproduktentwicklungsprozess einbezogen.101 Diese neueren Produktentwicklungsprozesse lassen sich in eine Vielzahl von Teilschritten einteilen.102 Eine mögliche idealtypische Phaseneinteilung des Neuproduktentwicklungsprozesses wird in der folgenden Abbildung 2 präsentiert.

97 98 99

Vgl. Schubert (1991), 74. Vgl. Schubert (1991), 73ff. Vgl. Schubert (1991), 76ff.

100 101 102

16

Vgl. Calantone; Cooper (1981), 48; Sattler; Schrader (1995), 997f. Vgl. Schubert (1991), 80; Lees; Wright (2004), 389. Vgl. Brockhoff (1999), 106; Schubert (1991), 74f.

Ideensuche Bestimmung der relevanten Eigenschaften und Ausprägungen

Konzeptentwicklung

Prototypenentwicklung

Produktentwicklung

Produkteinführung

Präferenzmessung

Abbildung 2: Phasen eines idealtypischen Produktentwicklungsprozesses (in Anlehnung an Brockhoff 103 (1999), 106; Herstatt; Sander (2004), 103 und Albers; Kemnitz (1985), 237)

In der ersten Phase wird dabei nach generellen Ideen für Neuprodukte gesucht und bereits eine erste Vorauswahl dieser vorgenommen. Ideen für Neuproduktinnovationen könnten beispielsweise anhand der für die zu untersuchende Zielgruppe relevanten Eigenschaften und Ausprägungen abgeleitet werden.104 Anschließend können erste Konzepte für Neuprodukte entwickelt und deren Erfolgsträchtigkeit zum Beispiel mit Hilfe der Methoden zur Präferenzmessung prognostiziert werden.105 Die Ergebnisse der Präferenzmessung ermöglichen bereits eine erste Absatzprognose und sind Teil einer Wirtschaftlichkeitsanalyse. Ausgehend davon können besonders erfolgversprechende Konzepte selektiert und diese in konkrete Prototypen umgesetzt werden. In dieser Phase der Neuproduktentwicklung kann auch die Kapazitäts- und Produktionsvorplanung für die jeweiligen Alternativen erfolgen. In der Phase der Produktentwicklung wird die Konstruktion abgeschlossen, werden Vor- und Nullserien produziert und Testläufe der Produktionsanlagen genutzt, um produktionsbedingte Schwachstellen zu finden. Zudem kann nun die Erfolgsträchtigkeit der Produkte und Vermarktungskonzepte in Testmärkten überprüft werden. Nach der finalen Selektion einer Produktalternative bzw. der Feinabstimmung der Elemente des Marketing-Mix kann die Produktionsplanung und schließlich die Produkteinführung erfolgen.106

103

Je nach Gestaltung und Benennung der Phasen der Neuproduktentwicklungsprozesse wird die Präferenzmessung in der Literatur teilweise zu den Verfahren zur Selektion von Neuproduktideen gerechnet. Für ein Beispiel siehe Meffert (1998), 387ff.; Meffert (2000), 401; Tumbusch (1991), 1. Für erste praktische Anwendungen der Präferenzmessung im Rahmen der Konzeptentwicklung siehe Westwood; Lunn; Beazley (1974), 328ff. oder Hauser; Urban (1977), 581ff. 104 Für eine Übersicht der dabei zur Verfügung stehenden Verfahren siehe Kapitel 5. 105

Vgl. Green; Wind (1975), 112. Neben diesen quantitativen Verfahren (Methoden der Präferenzmessung) können auch qualitative Ansätze zur Bewertung der Produktkonzepte eingesetzt werden. Vorteil der quantitativen Methoden ist allerdings, dass die Erfolgsaussichten konkret, z.B. durch die Prognose von Marktanteilen, bestimmt werden können (vgl. Schubert (1991), 81). Deshalb sollen in dieser Arbeit die quantitativen Verfahren im Mittelpunkt stehen. Für einen Überblick über weitere Methoden zum Konzepttest siehe Green; Krieger; Vavra (1997), 12ff. oder Hauser; Urban (1977), 584ff. Die Verfahren zur Präferenzmessung sind jedoch eher auf inkrementale Innovationen beschränkt, da die Einschätzungen der Befragungsteilnehmer auf den bisherigen Erfahrungen bzw. gelerntem Wissen in der jeweiligen Produktkategorie beruhen, d.h. der Zusammenhang zwischen den präsentierten Eigenschaften und dem daraus resultierenden Nutzen muss dem Entscheidungsträger bekannt sein (vgl. Hoeffler (2003), 406ff.; siehe dazu auch Kapitel 4.1.8). Radikale Innovationen setzen demgegenüber zunächst einen „Lernprozess“ der Konsumenten voraus, damit die Produkte überhaupt eingeschätzt werden können. Derartige Produktinnovationen haben zudem oft einen erheblichen Einfluss auf bisherige Kauf- und Konsumgewohnheiten. Für einen Methodenüberblick zur Abschätzung der Erfolgspotenziale entsprechender Innovationen siehe Urban; Weinberg; Hauser (1996), 47ff. 106 Vgl. Brockhoff (1999), 106; Herstatt; Sander (2004), 102f.; Dahan; Srinivasan (2000), 100f.; Schubert (1991), 83ff.

17

Da die Konzeptentwicklung den wohl wichtigsten Schritt innerhalb der Neuproduktentwicklung darstellt,107 kommt der Präferenzmessung als einer Möglichkeit zur quantitativen kundenorientierten Bewertung möglicher Produktalternativen eine hohe Bedeutung zu – sie gehört aus diesem Grund zu den wichtigsten Verfahren im Bereich der Konsumentenforschung.108 Hauptanwendungsgebiet der Präferenzmessung und insbesondere der Conjoint-Analyse ist, wie bereits beschrieben, die Konzeptbeurteilung im Rahmen der Neuproduktentwicklung.109 Die Kenntnis der jeweiligen Teilnutzen der einzelnen Eigenschaftsausprägungen erlaubt es den Herstellern, die Produkte entsprechend den Bedürfnissen der Konsumenten zu gestalten und so das Erfolgspotenzial der Neuprodukte zu steigern.110 Neben dieser Anwendung können die Verfahren der Präferenzmessung zur Bestimmung von Preis-Absatz-Funktionen, der Marktanteilschätzung oder der Marktsegmentierung angewendet werden (siehe Tabelle 1).111 Die Varianten der Conjoint-Analyse sind die dominanten Methoden zur Präferenzmessung in der Marketing-Forschung. Die folgenden Untersuchungen zu den Anwendungsgebieten der Präferenzmessung beziehen sich deshalb ausschließlich auf diese Verfahren.

107 108 109 110 111

18

Vgl. Schubert (1991), 80; Lees; Wright (2004), 389. Vgl. Green; Srinivasan (1978), 103; Green; Wind (1975), 108. Vgl. American Marketing Association (1992), 9; Cattin; Wittink (1982), 45; Wittink, Cattin (1989), 92; Wittink, Vriens, Burhenne (1994), 41, 44. Vgl. American Marketing Association (1992), 9. Vgl. Weiber; Rosendahl (1997), 107.

Anwendungsgebiet

Stichprobengröße

Cattin; Wittink (1982), 45

Wittink; Cattin (1989), 92

Wittink; Vriens; Melles; Holling Burhenne (1992), (1998), 6 und 12 und (1994), 44 Melles (2001), 29

17 Marktforschungsinstitute

66 Marktforschungsinstitute

59 Marktforschungsinstitute

57 Marktforschungsinstitute und Lehrstühle

54 Marktforschungsinstitute

USA

USA

Europa

Deutschland

Deutschland, Österreich, Schweiz

1971-1980

1981-1985

1986-1991

1993-1998

2001

72%

47%

36%

Untersuchungsregion Untersuchungszeitraum Neuproduktentwicklung - Konzeptentwicklung Wettbewerbsanalyse Bestimmung von PreisAbsatz-Funktionen Marktsegmentierung Repositionierung Werbung Distribution Markenwertbestimmung

112

75%

Hartmann; Sattler (2002), 3

47%

-

40%

22%

41%

-

61%

38%

46%

59%

48%

48% 39% 7% -

33% 33% 18% 5% -

29% 13% 2% -

48% 2% 1% -

21% 16%

Tabelle 1: Überblick über die Anwendungsgebiete der Conjoint-Analyse

Es wird anhand von Tabelle 1113 deutlich, dass die Verfahren zur Präferenzmessung ein äußerst flexibles Instrumentarium darstellen und in einer Vielzahl von Anwendungsbereichen genutzt werden können.114

2.2

Kontextabhängigkeit von Präferenzen

Kundenpräferenzen befinden sich, wie bereits erwähnt, in einem steten Veränderungsprozess, der u.a. durch soziale, kulturelle, politische und insbesondere technologische Rahmenbedingungen beeinflusst wird.115 Werden beispielsweise in einem Markt neuartige Produkte angeboten, wird dies die Vorziehenswürdigkeit der sonstigen Produktalternativen am Markt beeinflussen.116 Präferenzen der Konsumenten können somit auch als „moving targets“ beschrieben werden.117 Präferenzen sind aus diesem Grund immer dynamische Konstrukte, die je nach Entscheidungskontext118 variieren.119 Die Relevanz einzelner Produktmerkmale kann folglich nicht 112

Es handelt sich hierbei um gewichtete Werte, um eine Vergleichbarkeit der Ergebnisse mit den anderen Studien zu ermöglichen (vgl. Melles; Holling (1998), 6). Auch Voeth (1999, 160) untersuchte die Anwendungsgebiete der Conjoint-Analyse, dies jedoch im Rahmen einer MetaStudie, bei der lediglich in Deutschland publizierte wissenschaftliche Studien herangezogen wurden. Über Anwendungsgebiete in der Praxis können deshalb keine Aussagen getroffen werden, weshalb diese Studie hier nicht berücksichtigt wird. 114 Weitere Anwendungsgebiete der Präferenzmessung sind Forschungsbereiche der Entscheidungsanalyse, der Psychologie, der Transportplanung, der Stadtplanung usw. (vgl. Vriens (1995), 13). 115 Vgl. Boutellier; Völker (1997), 49; Brockhoff (2000), 39f. 113

116 117 118

Vgl. Brockhoff (2000), 40; Cattin; Wittink (1982), 50. Vgl. Boutellier; Völker (1997), 49. Siehe dazu auch Gierl (1987), 459. Für weitere Faktoren, die den Kontext einer Untersuchung beeinflussen, siehe Anhang I.

19

statisch bzw. konstant sein, sie ist vielmehr allein von den jeweils relevanten Merkmalsausprägungen bzw. deren Bandbreite abhängig. Je geringer z.B. die Nutzenunterschiede zwischen den Ausprägungen von einem Entscheidungsträger wahrgenommen werden, desto kleiner ist für ihn die Bedeutung des jeweiligen Attributs.120 Ändern sich die am Markt verfügbaren Produktalternativen und wird diese Veränderung von den Nachfragern für Ihre Kaufentscheidung als relevant wahrgenommen, so führt dies deshalb stets auch zu einer Änderung der Präferenzen. Die Verfahren zur Präferenzmessung, wie beispielsweise die Varianten der Conjoint-Analyse, sind statische Verfahren. Die Ergebnisse der Präferenzmessung können deshalb nur in relativ stabilen Marktsituationen121 oder nur in einem begrenzten Zeitraum zur Prognose von realem Wahlverhalten herangezogen werden. Wie beschrieben, ist die Relevanz von Produkteigenschaften ein dynamisches Konzept.122 Das Eigenschaftsset sollte somit die jeweiligen Marktverhältnisse widerspiegeln. Ist dies nicht der Fall, so ist bei der Einschätzung der Befragungsteilnehmer mit erheblichen Verzerrungen zu rechnen und die Ergebnisse der Präferenzmessung sind vermutlich nur sehr eingeschränkt zur Prognose von Wahlverhalten geeignet.123 Eine Methode zur Bestimmung von relevanten Eigenschaften sowie deren Ausprägungen muss diesen Aspekt berücksichtigen. Zusammenfassend kann festgestellt werden, dass jedes Urteil von Entscheidungsträgern – ob es sich nun um Präferenzen oder sonstige Bewertungen von Eigenschaften handelt – immer relativ ist. Die Kontextabhängigkeit von Bewertungen ist ein Forschungsbereich, der in der Literatur zur Präferenz- aber auch zur Einstellungsmessung bisher kaum124 und bei der Bestimmung des zu untersuchenden Eigenschaftssets noch gar nicht explizit berücksichtigt wurde.

119

Vgl. Hahn (1997), 5; Johnson; Meyer (1984), 528.

120

Vgl. Winterfeldt; Edwards (1986), 285; Creyer; Ross (1988), 508; Schubert (1991), 239; Sattler; Gedenk (2005), 4; Fischer (1995), 252ff.; Nitzsch; Weber (1991), 971; Nitzsch; Weber (1993), 937f.; Sattler; Gedenk; Hensel-Börner (2002b), 954; Mishra; Umesh; Stem (1989), 605ff.; Payne; Bettman; Schkade (1999), 246; Ratneshwar; Shocker; Stewart (1987), 520f.; Green; Krieger (1996), 854; Goldstein (1990), 316; Höser (1998), 227; Shocker; Srinivasan (1979a), 161. Siehe dazu auch Kapitel 5.2.2.1. Im Gegensatz dazu fordern Oppewal; Louviere; Timmermans (1994, 92) bei der SelfExplicated Methode (siehe Kapitel 3.1) eine kontextfreie Bewertung der Eigenschaftsgewichte. Dies erscheint vor dem Hintergrund, dass Präferenzen gerade kontextabhängig sind, wenig sinnvoll. Auch Akaah; Korgaonkar (1983, 189) weisen darauf hin, dass von einem Entscheidungsproblem losgelöste Eigenschaftsgewichte nicht zur Prognose von Wahlentscheidungen geeignet sind. 121 Vgl. Green; Srinivasan (1978), 115. 122 123 124

20

Siehe analog Myers; Alpert (1997), 51. Vgl. Cattin; Wittink (1982), 51. Vgl. Höser (1998), 21f.

2.3

Die Präferenz im Rahmen des Kaufentscheidungsprozesses

Um die Bedürfnisse der Konsumenten verstehen zu können und darauf aufbauend eine entsprechende Marketingstrategie zu entwickeln, ist es wichtig zu wissen, wie Kaufentscheidungen gefällt werden.125 Kaufentscheidungsprozesse können dabei als Wahlentscheidungen mit „erkennbarer kognitiver Beteiligung des Individuums“126 definiert werden. Ein „typischer“ Kaufentscheidungsprozess kann durch die folgenden fünf Phasen in Abbildung 3 beschrieben werden. Erkennen der Problem- oder Bedürfnissituation

Informationssuche und –verarbeitung

Bewertung der Alternativen

Kaufentscheidung

Verhalten nach dem Kauf

Abbildung 3: Fünf-Phasen-Modell eines Kaufentscheidungsprozesses (Quelle: Kotler; Bliemel (2001), 127 355; Böcker; Helm (2003), 146)

Der Kaufentscheidungsprozess beginnt mit einem Bedürfnis oder einem Problem des Konsumenten, das befriedigt bzw. gelöst werden soll.128 Das Individuum vergleicht dabei den derzeitigen mit einem erwünschten Zustand; ergibt sich dabei ein Mangelgefühl, spricht man von einem Bedürfnis.129 Ein konkretisiertes Bedürfnis, das bereits auf eine bestimmte Objektklasse (Produktgruppe) gerichtet ist, nennt man Bedarf.130 Es schließt sich nun in der zweiten Phase die Informationssuche über mögliche Alternativen zur Bedürfnisbefriedigung an. Man kann bei diesem Schritt zwei Suchzustände, den der erhöhten Wachsamkeit und den der aktiven Informationssuche, unterscheiden. Eine erhöhte Wachsamkeit bewirkt, dass der Konsument generell eher geneigt ist, Produktinformationen z.B. durch Werbung aufzunehmen. Bei der aktiven Informationssuche nutzt das Individuum aus eigener Motivation heraus verschiedene Informationsquellen, um sich über mögliche Alternativen zu informieren. Das Ausmaß der Informationssuche ist dabei von der bereits vorhandenen Informationsmenge (z.B. durch Erfahrungen in dem entsprechenden Produktbereich), von dem Wert, der zusätzlichen Informationen zugesprochen wird, von den nötigen Anstrengungen im Suchprozess und vom Produkt selbst, abhängig.131 Erst durch Informationssammlung und -verarbeitung kann der Konsument Schlussfolgerungen über die für ihn relevanten Eigenschaften und Eigenschaftsausprägungen tref-

125 126 127 128 129 130 131

Vgl. Kotler; Bliemel (2001), 365. Höser (1998), 27. Siehe auch Höser (1998), 42f. Vgl. Böcker; Helm (2003), 17; Kroeber-Riel; Weinberg (2003), 143ff.; Trommsdorff (2003), 114. Vgl. Böcker; Helm (2003), 17; Kotler; Bliemel (2001), 355. Vgl. Böcker; Helm (2003), 17. Vgl. Kotler; Bliemel (2001), 355f. Siehe auch Gierl (1987), 458.

21

fen.132 Werden demgegenüber Probanden außerhalb des Kaufentscheidungsprozesses befragt, so ist nicht ohne weiteres davon auszugehen, dass diese die verschiedenen Eigenschaftsausprägungen der Alternativen kennen und einschätzen können. Zudem wird vermutet, dass die Befragung von Konsumenten außerhalb des Kaufentscheidungsprozesses unabhängig vom Produkt-Involvement eine Low-Involvement-Situation darstellt, was zu einer verringerten Validität der Präferenzmessung führen kann. Es ist demnach bei der Präferenzmessung vorteilhaft, wenn die Befragungsteilnehmer ein möglichst starkes Interesse am Produktkauf und ein möglichst hohes Involvement bezüglich der Produktgruppe und der Entscheidungssituation aufweisen.133 Im nächsten Schritt, der Bewertung der Alternativen, können die Produkte zunächst anhand von nicht-kompensatorischen Entscheidungsregeln in verschiedene Gruppen eingeteilt werden.134 Ein Vorteil nicht-kompensatorischer Entscheidungsregeln ist, dass sie einfach strukturiert und leicht anwendbar sind. Insofern entsprechen sie den beschränkten Informationsverarbeitungskapazitäten von Entscheidungsträgern135 und können genutzt werden, um die Anzahl der zur Auswahl stehenden Alternativen zu reduzieren.136 Eine typische nicht-kompensatorische Entscheidungsregel ist die „Elimination by Aspects“ Methode.137 Dabei definiert der Entscheidungsträger für alle in dieser Phase relevanten Eigenschaften k.o.-Kriterien,138 d.h. Eigenschaftsausprägungen, die nicht mehr akzeptiert werden. Aus der Gesamtheit der zur Verfügung stehenden Alternativen werden schrittweise die Produkte ausgeschlossen, die zumindest eine solche unakzeptable Eigenschaftsausprägung auf132 133 134 135 136 137 138

22

Vgl. Goodwin; Wright (2000), 57. Vgl. Backhaus; Brzoska (2004), 41ff. Vgl. Kotler; Bliemel (2001), 356; Goodwin; Wright (2000), 56ff.; Klein; Scholl (2004), 328; Gutman (1982), 61; Böhler (1979), 262. Vgl. Goodwin; Wright (2000), 57; Gutman (1982), 62. Vgl. Klein; Scholl (2004), 328. Goodwin; Wright (2000), 56. In den verschiedenen Phasen des Kaufentscheidungsprozesses nutzen Nachfrager unterschiedliche Eigenschaften zur Einschätzung der Alternativen. Die Relevanz eines Merkmals ist somit von der jeweils betrachteten Phase im Kaufentscheidungsprozess abhängig. Ein Attribut, dass beispielsweise innerhalb einer frühen Phase zur Bestimmung der akzeptablen Produkte herangezogen wird (dieses wird auch als Schwelleneigenschaft bezeichnet, siehe Kapitel 4.1.4), kann in einer folgenden Trade-off Phase irrelevant sein und wird deshalb bei der letztendlichen Entscheidung für eine Produktalternative nicht berücksichtigt (vgl. Gutman (1982), 62). Beispielsweise könnte ein Nachfrager fordern, dass ein Notebook über eine Speicherkapazität von mindestens 1 GB RAM verfügen muss. Alle Laptops, die weniger als die geforderte Größe des Arbeitsspeichers aufweisen, werden demnach nicht weiter in der Wahlentscheidung berücksichtigt. Im Evoked-Set verbleiben nach Berücksichtigung weiterer Schwelleneigenschaften u.U. lediglich Alternativen, die über eine Arbeitsspeicherkapazität von 1 GB RAM verfügen. Die Bedeutung der in der Trade-off Phase zu berücksichtigenden Produktmerkmale ergibt sich aus der in dieser Phase zu berücksichtigenden Bandbreite der Eigenschaftsausprägungen. Durch die Eliminierung von Produktalternativen wird die Bandbreite der möglichen Merkmalsausprägungen eingeschränkt, so dass sich die Relevanz der Produktmerkmale ändert. In dem beschriebenen Beispiel eines Laptopkaufs weisen alle Notebooks einen Arbeitsspeicher von 1 GB RAM auf, so dass diese Eigenschaft keinerlei Einfluss auf die weitere Wahlentscheidung ausübt. Es ist somit nicht davon auszugehen, dass Schwelleneigenschaften, die in der nicht-kompensatorischen Phase berücksichtigt werden, ebenfalls bei den späteren Trade-off Entscheidungen eine Rolle spielen. Dies bedeutet aber auch, dass nicht alle am Markt verfügbaren Ausprägungen, sondern lediglich Eigenschaftsausprägungen zu berücksichtigen sind, die für den jeweiligen Konsumenten in der jeweiligen Phase des Kaufentscheidungsprozesses relevant sind.

weisen. Diese Selektion endet, wenn nur noch eine Alternative übrig geblieben ist oder alle verbliebenen Produkte als akzeptabel eingestuft wurden.139 Innerhalb der verbliebenen Alternativen, die lediglich durch akzeptable Eigenschaftsausprägungen beschrieben werden, kann nun ein Trade-off zwischen den Produkten stattfinden.140 In Abbildung 4 werden die oben beschriebenen Bewertungsstrategien der Alternativen in den Kontext der Selektion von Produktalternativen aus Konsumentensicht eingeordnet und erstmals mit den Verfahren zur Präferenzmessung in Verbindung gebracht. Available-Set IBM Apple Texas Instruments Hewlett Packard Vobis Medion Gericom Sun Sony Fujitsu-Siemens Dell Compaq Acer Toshiba Elitegroup Yakumo Issam Atelco Xadox Terra Bluedisk Asus ...

Awareness-Set IBM Apple Texas Instruments Hewlett Packard Vobis Medion Gericom Sun Sony Fujitsu-Siemens Dell Compaq Acer Toshiba

Unawareness-Set Elitegroup Yakumo Issam Atelco Xadox Terra Bluedisk Asus ...

Processed-Set

Evoked-Set

Inert-Set Texas Instruments Sun Acer Toshiba ...

Entscheidung

IBM Apple Hewlett Packard Sony

IBM Apple Hewlett Packard Vobis Medion Gericom Sony Fujitsu-Siemens Dell Compaq

?

Hold-Set Vobis Fujitsu-Siemens Dell Compaq

Inept-Set Medion Gericom

Nicht-kompensatorische Entscheidungen

Trade-Off Verfahren zur Präferenzmessung (2-stufige Verfahren zur Präferenzmessung)

Abbildung 4: Selektion von Alternativen (Produktkategorisierung in Anlehnung an Böcker; Helm (2003), 175f.; Kotler; Bliemel (2001), 356)

Das Available-Set (Total-Set) besteht aus allen am Markt befindlichen Produkten der jeweiligen Produktklasse. Es ist den Konsumenten allerdings typischerweise auch nach dem Durchlaufen des Informationssuchprozesses nicht möglich, sämtliche im Gesamtmarkt potenziell vorhandenen Alternativen zu berücksichtigen.141 Zudem sind u.U. nicht alle Produktalternativen tatsächlich verfügbar, so dass sich die Zahl der weiter zu berücksichtigenden Produkte vermindert.142 Das Awareness-Set beschreibt deshalb die Produkte, die der jeweilige Konsument wahrgenommen hat.143 Zu einem Teil der hier vorhandenen Alternativen besitzt der Konsument jedoch nur ungenügend Informationen über die Eigenschaftsausprägungen der relevanten Merkmale, um diese Produkte bewerten zu können. Aufgrund dieser unvollständigen Informationen werden diese im Inert-Set (auch Foggy-Set) befindlichen Alternativen nicht weiter berücksichtigt. Die verbliebenen Alternativen im Processed-Set werden, wie be139 140 141 142 143

Vgl. Goodwin; Wright (2000), 56. Siehe analog dazu Gutman (1982), 62. Vgl. Mehta; Moore; Pavia (1992), 470; Kotler; Bliemel (2001), 357f., 360; Klein; Scholl (2004), 328; Malhotra (1986), 34. Vgl. Kotler; Bliemel (2001), 356. Vgl. Brockhoff (1999), 38. Die nicht wahrgenommenen Alternativen werden dabei dem Unawareness-Set zugeordnet (vgl. Böcker; Helm (2003), 176. Sämtliche nicht wahrgenommenen Produkte befinden sich dementsprechend im “unawareness set” (vgl. Böcker; Helm (2003), 176).

23

reits beschrieben, zunächst anhand von nicht-kompensatorischen Kriterien bewertet, d.h. Alternativen, die den a priori definierten Mindestausprägungen nicht entsprechen, werden verworfen (Inept-Set oder Reject-Set).144 Im Hold-Set befinden sich die Alternativen, die zwar nicht völlig abgelehnt, aber nur akzeptiert werden, wenn der Preis reduziert oder einige Eigenschaftsausprägungen verbessert werden würden.145 Stellt der Entscheider beim Kauf fest, dass das jeweilige Produkt im Sonderangebot ist oder bestimmte Eigenschaftsausprägungen verbessert wurden, kann das Produkt in das Evoked-Set gelangen. Die Produkte im EvokedSet (auch „relevant set“ oder Accept-Set)146 kommen für die letztendliche Kaufentscheidung in die engere Auswahl. Diese Alternativen sind dadurch gekennzeichnet, dass sämtliche Eigenschaftsausprägungen und auch deren Kombinationen akzeptiert werden. Lediglich bei diesen Alternativen ist davon auszugehen, dass die Entscheidung für oder gegen ein bestimmtes Produkt auf Basis von Trade-offs zwischen den relevanten Eigenschaften erfolgt.147 Erst anhand dieser Einteilung der am Markt verfügbaren Produktalternativen ist erkennbar, dass in einer späteren Befragung nur die Produkte untersucht werden können, die sich zumindest im „Processed-Set“ befinden, d.h. lediglich die Alternativen, deren Ausprägungen der Proband tatsächlich kennt und einschätzen kann.148 Ansonsten ist damit zu rechnen, dass die Probanden mehr oder weniger willkürliche Antworten geben. Interessieren die tatsächlich wahlentscheidenden Produktmerkmale und ist es somit das Ziel die Präferenzen der Entscheidungsträger bzw. deren späteres Wahlverhalten zu prognostizieren, so sollten lediglich Produkte berücksichtigt werden, die sich im Evoked-Set des jeweiligen Befragungsteilnehmers befinden.149 Die als akzeptabel eingestuften Produktalternativen werden im nächsten Schritt genauer bewertet und eine Entscheidung für ein Produkt getroffen. Es existiert jedoch kein einheitlich für alle Konsumenten und alle Produktgruppen anwendbarer Entscheidungsprozess, der die Bewertung von Alternativen abbilden kann. Die meisten Modelle gehen allerdings davon aus, dass die Selektion in „kognitiver Art“150 erfolgt, d.h. die Konsumenten eine „rationale“ Beur-

144

Vgl. Böcker; Helm (2003), 175f.; Brockhoff (1999), 38.

145

Die Alternativen im Hold-Set weisen somit bei einer oder mehreren Eigenschaften eine unakzeptable Ausprägung auf. Einige Verfahren zur Präferenzmessung berücksichtigen diesen Aspekt, indem diese Ausprägungen bzw. Alternativen aus der weiteren Untersuchung ausgeschlossen werden. Allerdings ist die Bestimmung der unakzeptablen Ausprägungen mit erheblichen Problemen verbunden (siehe Kapitel 3.1). 146 Vgl. Howard; Sheth (1969), 26ff.; Böcker; Helm (2003), 175; Brockhoff (1999), 38; Böhler (1979), 262f. 147 148 149 150

24

Analog zu Kotler; Bliemel (2001), 356f. und Mehta; Moore; Pavia (1992), 470. Vgl. Böhler (1979), 263f. Siehe auch Böhler (1979), 270; Hauser; Urban (1977), 589. Kotler; Bliemel (2001), 357.

teilung der Alternativen anstreben.151 Eine Grundvoraussetzung, um überhaupt Präferenzen erheben zu können, ist deshalb eine gewisse Vertrautheit mit dem Untersuchungsobjekt. Der Befragungsteilnehmer muss also die bereits beschriebene Phasen der Informationssammlung und -verarbeitung durchlaufen haben, um die Alternativen bewerten zu können. Mangelt es einem Probanden an der nötigen Produktvertrautheit, so kann dies zu einer stärkeren Anwendung von Entscheidungsheuristiken bei der Bewertung der Alternativen führen.152 Teilweise werden diese verschiedenen Phasen der Präferenzbildung auch vereinfacht in zwei Stufen, d.h. eine nicht-kompensatorische153 und eine kompensatorische Entscheidungsphase, eingeteilt154 – wobei lediglich in der zweiten Phase mit Trade-off Entscheidungen zu rechnen ist.155 Die in dieser letzten Phase des Kaufentscheidungsprozesses typischen Trade-offs zwischen den Eigenschaftsausprägungen verschiedener Alternativen können mit Hilfe der Verfahren zur Präferenzmessung erfasst werden.156 Die Präferenz ist damit die Basis für die Herausbildung einer Kaufabsicht und somit die Vorstufe der Selektion einer Alternative.157 In dieser Phase der letztendlichen Entscheidung für eine bestimmte Alternative sind nicht alle Produkteigenschaften relevant, vielmehr werden jeweils nur die Eigenschaften zur Beurteilung der Produkte herangezogen, die eine gewisse Unterscheidungskraft aufweisen,158 d.h. der Kunde nimmt Unterschiede in den Eigenschaftsausprägungen wahr, die die Präferenz so stark beeinflussen, dass diese in den finalen Entscheidungsprozess einfließen – die zugehörigen Bewertungsdimensionen kann man als entscheidungsrelevante Merkmale bezeichnen.159 Vor dem Hintergrund einer Vielzahl an Produkten, die heutzutage als relativ ähnlich wahrgenommen werden,160 spielt deshalb die Bestimmung der relevanten Eigenschaften eine besonders wichtige Rolle.

151

Vgl. Kotler; Bliemel (2001), 357. Da die Wahrnehmung bestimmter Produkte, beschrieben durch die jeweiligen Eigenschaftsausprägungen, subjektiv ist, können objektive und subjektive Realität u.U. voneinander abweichen (vgl. Böcker; Helm (2003), 175). 152 Vgl. Ratneshwar; Shocker; Stewart (1987), 523f. 153

Nicht-kompensatorische Vorgehensweisen zur Einschätzung von Alternativen werden auch als Entscheidungsheuristiken bezeichnet (vgl. Johnson; Meyer; Ghose (1989), 255; Andrews; Manrai (1998), 198). Für einen Überblick über Entscheidungsheuristiken siehe Goodwin; Wright (2000), 55ff.; Tscheulin (1992), 14ff. 154 Vgl. Malhotra (1986), 34; Bucklin; Srinivasan (1991), 61; Klein; Bither (1987), 240; Mehta; Moore; Pavia (1992), 470; Andrews; Manrai (1998), 198; Ayag (2002), 3058. 155 Vgl. Malhotra (1986), 34; Johnson; Meyer; Ghose (1989), 255. 156

Vgl. Green; Srinivasan (1978), 104. Daraus ergibt sich die Forderung, dass lediglich Ausprägungen, die zur Anwendung von kompensatorischen Entscheidungsprozessen führen, im Rahmen der Verfahren zur Präferenzmessung untersucht werden sollten (vgl. Voeth (2000), 69). 157 Präferenzmessmethoden untersuchen somit die „intention-to-purchase“, nicht aber reale Kaufentscheidungen (vgl. Cattin; Wittink (1982), 50). Siehe auch Albrecht (2000), 10. Mit Hilfe von Produktwahlmodellen wird jedoch oftmals versucht, das Produktwahlverhalten der Entscheidungsträger auf aggregierter Ebene zu prognostizieren (siehe dazu Kapitel 3.9). 158 Vgl. Kotler; Bliemel (2001), 358. 159 160

Siehe Kapitel 4.2.6.5. Vgl. Steffenhagen (2000), 35.

25

Ein Trade-off der verschiedenen Alternativen, aber auch die Ausprägungen der weiteren Marketing-Mix Elemente161 haben Einfluss auf die Kaufabsicht für ein bestimmtes Produkt. Der tatsächlich realisierte Kauf wird jedoch zusätzlich von weiteren Faktoren beeinflusst (siehe Abbildung 5). Ausgestaltung der anderen MarketingMix Elemente Trade-off der Alternativen

Einstellung anderer Personen realisierter Kauf

Kaufabsicht

Konkurrenzreaktionen

kurzfristige, unvorhersehbare situative Faktoren

verfügbare Zeit und finanzielle Mittel des Entscheidungsträgers

Abbildung 5: Zusammenhang zwischen Kaufabsicht und realisiertem Kauf (Quelle: in Anlehnung an 162 Kotler; Bliemel (2001), 361 und Böcker (1986), 554)

Die Kaufabsicht und damit der realisierte Kauf werden sowohl von der Bewertung der Dringlichkeit eines Produktkaufs163 als auch von den dem Entscheidungsträger zur Verfügung stehenden finanziellen Mittel beeinflusst.164 Beide Einflussgrößen sind deshalb insbesondere bei der Selektion der Befragungsteilnehmer, aber auch bei der Bestimmung der zu untersuchenden Eigenschaften und Ausprägungen zu berücksichtigen. So sollten bei der Erfassung der zu untersuchenden Eigenschaften und Ausprägungen möglichst Entscheidungsträger befragt werden, die kurz vor dem Kauf einer Alternative aus der jeweiligen Produktkategorie stehen. Zudem sollten nicht hypothetische „ideale“ Eigenschaftsausprägungen, sondern die Eigenschaftsausprägungen auf Basis der Alternativen im Evoked-Set bestimmt werden.165 Für die realisierte Wahlentscheidung spielen ferner die Einstellungen anderer Bezugs- und Einflusspersonen (z.B. Familienangehörige oder Freunde) sowie vom Konsumenten unvorhergesehene Faktoren (z.B. Sonderpreisaktionen der Konkurrenz) eine Rolle. Dritte Personen 161

Um bessere Aussagen über die Kaufabsicht eines Entscheidungsträgers bzw. über reale Kaufentscheidungen treffen zu können, müssen weiterhin die Ausgestaltungsformen der anderen Marketing-Mix Elemente wie Kommunikationspolitik und Vertriebsbemühungen, aber ebenso mögliche Konkurrenzreaktionen beachtet werden (vgl. Cattin; Wittink (1982), 50; Ding; Grewal; Liechty (2005), 68; Srinivasan; deMaCarty (1999), 29). 162 Eine ähnliche Einteilung findet sich in Böcker; Helm (2003, 18). 163 164 165

26

Vgl. Böcker; Helm (2003), 18; Böcker (1986), 554. Vgl. Böcker; Helm (2003), 18; Böcker (1986), 554; Albrecht (2000), 11. Dies bedeutet, dass beispielsweise bei dem Untersuchungsobjekt „Auto“ für die Eigenschaft „Marke“ nicht in jedem Fall die Ausprägungen, die ein Entscheidungsträger als „ideal“ wahrnimmt, untersucht werden sollten, sondern die, die für den jeweiligen Entscheidungsträger tatsächlich bei einer Kaufentscheidung in Frage kommen. So könnte ein Befragungsteilnehmer die Marken „BMW“, „Mercedes“ und „Audi“ präferieren, bei einer tatsächlichen Kaufentscheidung kommen für ihn aber aufgrund finanzieller Restriktionen lediglich Marken wie „Fiat“ oder „Renault“ in Frage. Die Ergebnisse der Präferenzmessung könnten bei der Untersuchung der Marken „BMW“, „Audi“ und „Mercedes“ nicht zur Ableitung produktpolitischer Entscheidungen herangezogen werden. Um möglichst realitätsnahe Entscheidungen zu treffen, sollte die Erfassung der Präferenzen deshalb auf Basis der Alternativen im Evoked-Set erfolgen.

können den Kauf entscheidend beeinflussen. Je negativer bzw. positiver ihre Einstellung zu dem Produkt und je stärker die Bereitschaft des Entscheidungsträgers ist, der Einstellung dieser Personen zu entsprechen, desto größer ist deren Einfluss auf die letztliche Wahlentscheidung. Darüber hinaus können sich kurz von dem Kaufakt ändernde Rahmenbedingungen eine veränderte Kaufentscheidung verursachen.166 Solche Änderungen ergeben sich beispielsweise, wenn die präferierte Marke gerade nicht verfügbar ist,167 andere Marken im Sonderangebot sind oder weitere Alternativen hinzukommen.168 Aufgrund der Vielzahl weiterer Einflussgrößen z.B. durch unvorhersehbare Konurrenzreaktionen oder durch Möglichkeiten bei der Ausgestaltung des Marketing-Mixes169 kann die tatsächliche Kaufentscheidung durch die Ergebnisse der Präferenzmessung nie mit Sicherheit prognostiziert werden.170 Dennoch nimmt die individuelle Präferenz eine zentrale Stellung bei der Vorhersage von Kaufentscheidungen ein, da sie insgesamt geeignet erscheint, Käuferverhalten zu prognostizieren und so zudem die Wirkung von produktpolitischen Marketingmaßnahmen direkt überprüft werden kann.171 In der Nachkaufphase, dies entspricht dem Verhalten nach dem Erwerb, kann der Nachfrager das Produkt ge- bzw. verbrauchen. Durch einen Vergleich zwischen vor dem Kauf bestehenden Erwartungen mit der nach dem Kauf wahrgenommenen Ist-Leistung resultiert Zufriedenheit bzw. Unzufriedenheit. Die Erwartungen basieren dabei auf den vor dem Kauf gesammelten Informationen über die Produkte, d.h. den relevanten Eigenschaften und deren Ausprägungen.172 Wie bereits beschrieben, erfolgt die Informationsaufnahme und -verarbeitung selektiv und subjektiv. Es werden in der Kaufentscheidung nur die wahlbeeinflussenden Eigenschaften berücksichtigt. Eigenschaften, bei denen keine relevanten Unterschiede zwischen den Alternativen wahrgenommen werden, sind dementsprechend nicht präferenzrelevant.173 Stellt der Käufer aufgrund einer Nicht-Erfüllung oder Übererfüllung seiner Erwartungen bezüglich einer nicht-determinanten und deshalb im Entscheidungsprozess nicht berücksichtigten Eigenschaft nachträglich große Unterschiede zwischen den am Markt verfügbaren Alternativen fest, so wird er diese Eigenschaft bei folgenden Kaufentscheidungen stärker berücksichtigen. 166 167

Vgl. Kotler; Bliemel (2001), 361; Albrecht (2000), 11; Payne; Bettman; Schkade (1999), 246; Böcker (1986), 554. Zum Einfluss von Bezugspersonen siehe auch Bither; Wright (1977), 39ff. Vgl. Green; Krieger (1991), 23; Kotler; Bliemel (2001), 361; Srinivasan; MaCarty (1998), 3; Wittink; Cattin (1989), 94.

168

Vgl. Kotler; Bliemel (2001), 361. Für einen Überblick über weitere Einflüsse auf das tatsächlich realisierte Kaufverhalten siehe Shocker; Srinivasan (1979a), 160; Höser (1998), 29ff.; Srinivasan; MaCarty (1998), 3f.; Braunstein; Huber; Herrmann (2005), 189. 169 Siehe dazu ausführlich Kapitel 3.10.1.4. 170 171 172 173

Vgl. Kotler; Bliemel (2001), 361. Vgl. Albrecht (2000), 11. Für einen Überblick über empirische Studien siehe Louviere (1988a, 113f.) – die Ergebnisse der Präferenzmessung sind demnach zur Prognose des realen Entscheidungsverhaltens geeignet. Vgl. Kotler; Bliemel (2001), 362. Vgl. Myers; Alpert (1968), 14.

27

Der bisher beschriebene Kaufentscheidungsprozess ist, wie bereits erwähnt, nicht für jede Kaufentscheidung als allgemeingültig anzunehmen. Vielmehr ist eine Unterscheidung nach der Art des Produktes vorzunehmen.174 In Tabelle 2 werden vier mögliche Varianten des Kaufverhaltens je nach Produktart präsentiert. Intensive Beschäftigung mit dem Kauf Bedeutende Unterschiede zwischen den Marken Geringe Unterschiede zwischen den Marken

Geringe Beschäftigung mit dem Kauf Abwechslung suchendes Kaufverhalten

komplexes Kaufverhalten dissonanzminderndes Kaufverhalten

habituelles Kaufverhalten

Tabelle 2: Arten des Kaufverhaltens (Quelle: Kotler; Bliemel (2001), 350)

Kotler; Bliemel (2001, 350) beschreiben komplexes Kaufverhalten als ein intensives Auseinandersetzen mit den möglichen Alternativen vor dem Kauf, wobei relevante Unterschiede zwischen den in Frage kommenden Produkten festgestellt und in der Entscheidung berücksichtigt werden. Deshalb ist hier mit einer tendenziell „rationaleren“ Kaufentscheidung zu rechnen.175 Typischerweise werden intensive Kaufanstrengungen aufgewendet, wenn: -

-

es sich um ein relativ teures Produkt handelt, dessen Anschaffung nicht als risikolos wahrgenommen wird, Produkte in dieser Kategorie selten gekauft werden, das Produkt in besonderem Maße die Persönlichkeit des Käufers repräsentiert176 und es sich um langlebige Güter handelt.177

Fehlen dem Konsumenten die entsprechenden Informationen, um verschiedene Alternativen einschätzen zu können, so müssen diese Informationen zunächst über die Eigenschaftsausprägungen der zur Verfügung stehenden Alternativen gesucht und bewertet werden.178 Der Entscheidungsträger durchläuft den gesamten, oben präsentierten Kaufentscheidungsprozess.179

174 175 176 177 178 179

28

Vgl. Albrecht (2000), 11; Kotler; Bliemel (2001), 350. Vgl. Köcher (1997), 143. Vgl. Kotler; Bliemel (2001), 350. Vgl. Köcher (1997), 143. Vgl. Kotler; Bliemel (2001), 350. Daneben werden auch extensive und limitierte Kaufentscheidungsprozesse zu den Verhaltenstypen gezählt, bei denen der Entscheidungsträger den gesamten Kaufentscheidungsprozess durchläuft. Extensive Kaufentscheidungsprozesse treten bei Gütern auf, bezüglich derer der Käufer über keine bzw. wenig bisherige Erfahrungen verfügt – deshalb ist die letztendliche Wahl einer Alternative aus Sicht des Entscheidungsträgers schwierig und neuartig, weshalb dabei mit einem höheren Ausmaß der kognitiven Prozesse zu rechnen ist (vgl. Albrecht (2000), 11). Da die Bewertungen eines Untersuchungsobjekts immer vom jeweiligen Vorwissen der Entscheidungsträger in einer bestimmten Produktkategorie abhängen (vgl. Urban; Weinberg; Hauser (1996), 47ff., siehe auch Kapitel 2.1), sind entsprechende Produktgruppen weniger zur Untersuchung im Rahmen einer Studie zur Präferenzmessung geeignet – es sei denn, es werden Entscheidungsträger befragt, die die Phasen der Informationssuche und –bewertung durchlaufen haben. Auch bei Produkten, bei denen dem Kauf typischerweise limitierte Kaufentscheidungsprozesse zugrunde liegen, dominieren zur Alternativenbewertung kognitive Prozesse bezüglich eines vom Entscheidungsträger bereits eingeschränkten Alternativensets, jedoch genügt dem Entscheider, dass die Alternativen ein bestimmtes Anspruchsniveau erreichen (vgl. Gierl (1995), 265).

Dissonanzminderndes Kaufverhalten ist dadurch gekennzeichnet, dass vor dem Kaufakt zwar eine umfassende Informationssammlung stattfindet, jedoch werden dabei vom Konsumenten kaum Unterschiede zwischen den einzelnen Alternativen wahrgenommen. Deshalb wird die letztendliche Kaufentscheidung nicht anhand von produktspezifischen Faktoren, sondern eher situationsspezifischen Einflüssen, wie ein günstiges Angebot oder Bequemlichkeit bezüglich des Kaufortes, getroffen.180 Beim Abwechslung suchenden Kaufverhalten nimmt der Konsument zwar große Unterschiede zwischen den angebotenen Alternativen wahr, jedoch sind die Kaufanstrengungen und die damit verbundene Informationssuche und –verarbeitung gering. Bei dieser Art des Kaufverhaltens wechselt der Konsument relativ oft die Marke aus Langeweile oder aus dem Wunsch heraus, z.B. eine andere Geschmackssorte zu kaufen. Dieses Kaufverhalten ist beispielsweise bei Käse, Wein oder Schokoladenriegeln zu erwarten.181 Habituelles Kaufverhalten ist schließlich dadurch gekennzeichnet, dass sich der Konsument nur wenig mit der Bewertung der Alternativen beschäftigt und zudem die wahrgenommenen Unterschiede zwischen den Produkten gering sind. Typischerweise ist bei niedrig-preisigen und häufig gekauften Produkten mit einem solchen habituellen Einkaufsverhalten zu rechnen. Dabei durchläuft der Konsument nicht die verschiedenen Phasen des Kaufentscheidungsprozesses, er übernimmt stattdessen eher passiv Informationen aus der Werbung. Werden wiederholt bestimmte Produkte gekauft, so erfolgt dies aus Gewohnheit, aber nicht aufgrund einer besonderen Markentreue, d.h. Konsumenten kaufen dann Produkte, mit denen sie schon Erfahrungen gemacht haben.182 Es wird deutlich, dass nicht jede Produktgruppe als Untersuchungsobjekt innerhalb von Studien zur Präferenzmessung geeignet erscheint. Backhaus; Brzoska (2004, 42) beschreiben zudem weitere Anforderungen, die ein Untersuchungsobjekt im Rahmen der Präferenzmessung möglichst gut erfüllen sollte. Demnach sollte der Kauf mit einem hohen finanziellen, sozialen und psychologischen Risiko verbunden sein. Dies führt zu einer „umfangreichen und multiattributiv geprägten Informationsaufnahme und –verarbeitung der kaufentscheidungsbeeinflussenden Faktoren sowie zu einer starken Identifikation der Nutzer mit dem Kauf des Produkts“183. Auch Akaah; Korgaonkar (1983, 188) weisen darauf hin, dass zur Untersuchung multiattributiver Bewertungsaufgaben lediglich Güter geeignet erscheinen, bei denen mit einem hohen Involvement bei den Befragungsteilnehmern zu rechnen ist.

180 181 182 183

Vgl. Kotler; Bliemel (2001), 351. Vgl. Kotler; Bliemel (2001), 353. Vgl. Diller (1988), 351f. Backhaus; Brzoska (2004), 42.

29

Zusammenfassend gilt, dass bei der Bestimmung der relevanten Eigenschaften und Eigenschaftsausprägungen sowie bei der Präferenzmessung möglichst Probanden befragt werden sollten, die sich bereits intensiv mit dem Untersuchungsobjekt auseinander gesetzt und somit die Phase der Informationssuche, -verarbeitung und -bewertung durchlaufen haben. Erst danach können die Probanden überhaupt die jeweiligen Eigenschaften und deren Ausprägungen einschätzen, d.h. ihre Präferenzen formulieren. Mindestanforderungen an bestimmte Eigenschaften kann der Entscheidungsträger ebenfalls erst festlegen, nachdem er sich einen Überblick über die am Markt verfügbaren Alternativen und deren Eigenschaftsausprägungen verschafft hat. Letztendlich wird deutlich, dass die Nutzung von Verfahren zur Präferenzmessung nur bei Vorliegen eines komplexen (extensiven) Kaufverhaltens sinnvoll erscheint.184 Stellt der Konsument beispielsweise nur geringe Unterschiede zwischen den angebotenen Alternativen fest, so entscheiden eher situationsspezifische Faktoren über den Kauf eines bestimmten Produkts (es handelt sich um ein dissonanzminderndes Kaufverhalten). Beschäftigen sich Konsumenten nur wenig mit der Kaufentscheidung, so ist die Informationssuche und -verarbeitung eingeschränkt. In diesen Fällen ist davon auszugehen, dass der Konsument auf Entscheidungsheuristiken statt Trade-offs zur Selektion einer Alternative zurückgreift. Die Conjoint-Analyse und die anderen Verfahren zur Präferenzmessung beruhen jedoch gerade auf Trade-offs der einzelnen Eigenschaften bzw. deren Ausprägungen und sind deshalb nur bei Vorliegen von Trade-off Entscheidungen einsetzbar. Abwechslung suchendes oder habituelles Kaufverhalten können somit nicht mit den vorhandenen Methoden der Präferenzmessung untersucht werden. Präferenzen sind stets relativ und damit von den Ausprägungen der Alternativen des Evoked-Sets eines Nachfragers abhängig, die zum Untersuchungszeitpunkt am Markt angeboten werden. Dies bedeutet, dass die Wichtigkeit von Eigenschaften immer durch den wahrgenommenen Nutzenunterschied der Bandbreite der untersuchten Ausprägungen determiniert wird.185 Es ist zu beachten, dass eine Änderung der Bandbreite der Ausprägungen einer Eigenschaft Einfluss auf die akzeptierte Bandbreite anderer Merkmale haben kann. Ändert sich beispielsweise die Bandbreite der Ausprägungen für die Eigenschaft Preis (z.B. im Rahmen einer Sonderpreisaktion) können Alternativen in das Evoked-Set aufgenommen werden, die sich vorher im Hold-Set befanden. Die Änderung der Bandbreite einer Eigenschaft führt dazu, dass u.U. zusätzliche Alternativen berücksichtigt werden, was die Kaufentscheidung erheblich beeinflussen kann. Die innerhalb der Präferenzmessung ermittelten Ergebnisse können deshalb nur in relativ stabilen Marktsituationen mit einer überschaubaren Anzahl an Alter-

184 185

30

Vgl. Backhaus; Brzoska (2004), 41. Siehe Kapitel 2.2 und 4.2.6.3.

nativen bzw. nur zur kurz- oder mittelfristigen Prognose von Marktanteilen genutzt werden.186 Hinzu kommt, dass die realen Entscheidungen von Konsumenten durch eine Vielzahl von Faktoren beeinflusst werden, die nicht innerhalb der Präferenzmessung abgebildet werden können. Dennoch zeigen verschiedene Studien, dass die Verfahren zur Präferenzmessung geeignete Methoden darstellen, um reale Kaufentscheidungen zu prognostizieren.187

2.4

Produkte als Untersuchungsobjekt der Präferenzmessung

Untersuchungsobjekt innerhalb der Präferenzmessung sind typischerweise Produkte und Dienstleistungen.188 In der Literatur besteht weitgehend Einigkeit darüber, dass Produkte mehr als nur Eigenschaftsbündel sind.189 Vielmehr stehen bei der Produktdefinition die Bedürfnisse der Kunden im Zentrum. Deshalb definiert Brockhoff (1999, 13) ein Produkt als „eine im Hinblick auf eine erwartete Bedürfnisbefriedigung beim bekannten oder unbekannten Verwender von einem Anbieter gebündelte Menge von Eigenschaften“. Böcker; Helm (2003, 249), Voeth (2000, 14f.) und Kotler; Bliemel (2001, 14f.) weisen ebenfalls darauf hin, dass eine zu enge Begrenzung des Produktbegriffs auf seine physikalischen, chemischen und äußeren Eigenschaften nicht sinnvoll ist, sondern die entsprechenden Nutzenerwartungen der Kunden im Mittelpunkt stehen sollten. Kotler (1974, 416), Böcker; Helm (2003, 250) sowie Herrmann (1998, 16) erläutern dies an dem Beispiel „Lippenstift“ bzw. Kosmetika. Eine Person kauft den Lippenstift oder sonstige Kosmetika üblicherweise nicht aufgrund der physikalisch-chemischen Eigenschaften, sondern sie kauft „Schönheit“. Aus Kundensicht werden die Produkte anhand von Nutzenerwartungen und jeweils abhängig vom individuellen Wahrnehmungs- und Bewertungsverhalten eingeschätzt sowie entsprechend ihrer Zwecktauglichkeit beurteilt.190 Die Herausbildung eines solchen Urteils geschieht im Rahmen eines komplexen Informationsaufnahme- und -verarbeitungsprozesses aus den Elementen Wahrnehmung, Erfahrung, Einstellung, Präferenzbildung und Lernen.191 Kunden kaufen Produkte demnach nicht allein wegen ihrer chemisch-technischen Eigenschaften. Die Wahrnehmung und Beurteilung der Eignung zur individuellen Bedürfnisbefriedigung beeinf-

186 187

Huber (1997, 244) sieht zudem einen strategischen Wert der Präferenzmessung, da mit ihrer Hilfe mögliches Entscheidungsverhalten bei Marktveränderungen vorhergesagt werden kann. Vgl. Albrecht (2000), 11; Louviere (1988a), 113f.

188

Vgl. Albers; Herrmann (2000), 5. Im Folgenden wird nicht weiter zwischen physischen Produkten und Dienstleistungen differenziert, da diese Unterscheidung keinen Einfluss auf die Präferenzmessung ausübt (für eine Ausnahme siehe Kapitel 4.1.1). 189 Vgl. Böcker; Helm (2003), 249; Brockhoff (1999), 13; Schubert (1991), 20; Kotler; Bliemel (2001), 14; Gutman (1982), 61; Jaeger; Hedderley; MacFie (2000), 1218; Brockhoff (2000), 27. 190 Vgl. Gutman (1982), 61. 191

Vgl. Herrmann (1996), 16; siehe auch Kapitel 2.3.

31

lussen vielmehr entscheidend das Kauf- und Konsumverhalten. Kunden kaufen nicht Eigenschaftsbündel, sondern Nutzenbündel.192 Entsprechend definiert Kotler (2003, 11) Produkte als „set of benefits“. Demnach ist ein Produkt alles, was ein Angebot zur Befriedigung eines Bedürfnisses oder Wunsches darstellt und umfasst physische Produkte wie auch Dienstleistungen.193 Ein Produkt ist „eine physische Einheit oder Verrichtung von wahrgenommenen, mit Nutzenerwartungen verknüpften Eigenschaften“.194 Aus dieser Definition ergibt sich wiederum, dass Nachfrager die nutzenstiftende Wirkung der Eigenschaftsausprägungen kennen müssen, um diese überhaupt bewerten zu können. Zudem erfolgt die Nutzenstiftung bei dieser Definition durch die jeweiligen Eigenschaftsausprägungen des Produkts. Der subjektiv empfundene Nutzen einer Alternative kann folglich auf bestimmte produktbezogene Eigenschaftsausprägungen zurückgeführt werden.195 Wie bereits beschrieben, können Nachfrager unterschiedliche Arten von Kaufentscheidungsprozessen bei der Wahlentscheidung für eine Produktalternative anwenden. Die Art der genutzten Bewertungsstrategie hängt dabei sehr stark von dem jeweiligen Untersuchungsobjekt ab. Deshalb sollen im Folgenden typische Produktkategorien vorgestellt und deren Eignung zur Untersuchung mit Hilfe der Verfahren zur Präferenzmessung diskutiert werden. Auf eine Differenzierung von Industriegütertypen wird im Rahmen dieser Arbeit verzichtet. In diesem Produktbereich werden überwiegend keine Individual- sondern Gruppenentscheidungen über den Erwerb eines Produktes getroffen. Die Verfahren zur Präferenzmessung sind jedoch nur zur Prognose von Individualentscheidungen geeignet. Gruppendynamische Entscheidungs- bzw. Bewertungsprozesse können nicht durch die Methoden abgebildet werden; eine Anwendung dieser Methoden auf Industriegüter erscheint deshalb nicht möglich. Produkte können entsprechend ihrer Dauerhaftigkeit und der materiellen Beschaffenheit in die drei Klassen Gebrauchsgüter, Verbrauchsgüter und Dienstleistungen eingeteilt werden. Gebrauchsgüter (Durable Goods) sind materielle Produkte, die viele Gebrauchseinsätze überdauern und häufig durch einen extensiveren Kaufentscheidungsprozess gekennzeichnet sind. Verbrauchsgüter (Nondurable Goods) sind materielle Produkte, die in einem oder wenigen Verwendungseinsätzen verbraucht werden. Die Wiederkaufzyklen sind typischerweise relativ kurz, so dass es bei Neuprodukten wichtig ist, die Erstkäufe der Konsumenten zu sti192 193 194

Vgl. Herrmann (1996), 17; Voeth (2000), 14ff. Vgl. Kotler; Bliemel (2001), 14; Kotler (2003), 407.

Herrmann (1996), 51. Genau genommen handelt es sich um eine physische Einheit oder eine Verrichtung von wahrgenommenen und mit Nutzenerwartungen verknüpften Eigenschaftsausprägungen. Siehe auch Kapitel 4 und vgl. Fischer (2001), 12. 195 Im Kapitel 4.1.8 wird auf dieses Problem genauer eingegangen.

32

mulieren, um eine entsprechende Präferenz für das Produkt zu entwickeln. Dienstleistungen (Services) sind immaterielle Produkte, die meist im engen Verbund zwischen Anbieter und Kunde erstellt werden, einer hohen Schwankungsbreite bezüglich der Qualität unterliegen können und nicht lagerfähig sind.196 Sämtliche dieser Gütergruppen können innerhalb von Verfahren zur Präferenzmessung untersucht werden. Weiterhin lassen sich Produkte entsprechend der Kaufgewohnheiten der Konsumenten klassifizieren, wobei zwischen Convenience Goods, Shopping Goods, Speciality Goods und Unsought Goods unterschieden werden kann.197 Güter des mühelosen Kaufs (Convenience Goods) sind Produkte, bei deren Kauf der Entscheider keinen oder nur einen geringen Vergleichs- und Einkaufsaufwand auf sich nimmt. Produkte dieser Gruppe lassen sich weiter in Güter des Regel-, Spontan- und Dringlichkeitskaufs unterteilen. Bei Produkten des Regelkaufs (Staples) entscheidet sich der Konsument aus Gewohnheit für ein bestimmtes Produkt. Beim Spontankauf (Impulse Goods) erfolgt keine gezielte Suche nach dem Produkt, der Konsument selektiert vielmehr ohne großen kognitiven Aufwand in der Einkaufsstätte ein bestimmtes Produkt. Auch bei Gütern des Dringlichkeitskaufs (Emergency Goods) sind die Informationssuch- und -verarbeitungsprozesse eingeschränkt. Sie werden gekauft, weil eine unvorhergesehene bzw. notfallartige Situation vorliegt, in der das Produkt benötigt wird – beispielsweise der Kauf eines Regenschirms bei Regen.198 Produkte des Such- und Vergleichskaufs (Shopping Goods) sind dadurch gekennzeichnet, dass der Kunde gezielt nach Alternativen sucht, diese anhand von verschiedenen Kriterien (Eigenschaften) bewertet bzw. vergleicht und letztendlich eine Wahlentscheidung trifft. Man unterscheidet bei diesen Gütern zwischen homogen und heterogen wahrgenommenen Produkten. Konsumenten nehmen die Qualität der Produkte bei homogenen Gütern relativ ähnlich wahr, so dass vor allem der Preis als Unterscheidungskriterium beim Kauf eine Rolle spielt. Heterogene Güter weisen aus Sicht der Konsumenten Qualitätsunterschiede auf, beim Kauf müssen deshalb verschiedene Eigenschaften zur Bewertung herangezogen werden.199 Güter des Spezialkaufs (Speciality Goods) sind durch „eigenständige“ Ausprägungen der Eigenschaften gekennzeichnet. Dies kann z.B. eine besondere Markenidentität eines Produkts sein. Der Kaufaufwand ist bei den meisten Konsumenten hoch; es werden zwar weniger Alternativen miteinander verglichen, allerdings ist vermutlich der Aufwand bei der Suche nach einem

196 197 198 199

Vgl. Kotler; Bliemel (2001), 719f.; Kotler (2003), 410. Vgl. Kotler; Bliemel (2001), 720; Nieschlag; Dichtl; Hörschgen (2002), 580. Vgl. Kotler; Bliemel (2001), 720; Kotler (2003), 411; Höser (1998), 33f.; Nieschlag; Dichtl; Hörschgen (2002), 580f. Vgl. Kotler; Bliemel (2001), 720f.; Kotler (2003), 411; Nieschlag; Dichtl; Hörschgen (2002), 581.

33

Händler, der das Produkt führt, groß.200 Produkte des fremdinitiierten Kaufs (Unsought Goods) sind schließlich solche Güter, die der Kunde noch nicht kennt oder an deren Kauf er normalerweise nicht denkt. Als typische Beispiele für solche Produkte gelten Lebensversicherungen, aber auch Bestattungsverträge.201 In der folgenden Tabelle 3 werden die verschiedenen Arten von Produkten im Überblick dargestellt und die Eignung der Conjoint-Analyse für diese Güter eingeschätzt. Convenience Goods Beispiel

Eignung für die Präferenzmessung

Regelkauf: Kaffee Spontankauf: Schokoriegel Dringlichkeitskauf: Regenschirm nicht geeignet

Shopping Goods

Speciality Goods

Unsought Goods

homogene Güter: besondere Autos bestimmte Dienstleistungen z.B. Telefonanbieter heterogene Güter: Gebrauchtwagen

Lebensversicherungen

nur heterogene Güter geeignet

eingeschränkt geeignet

eingeschränkt geeignet

Tabelle 3: Beispiele für Güterarten und Einschätzung zur Eignung der Präferenzmessung

Convenience Goods scheinen aufgrund des minimalen Such- und Vergleichsaufwands202 beim Kauf keine geeigneten Güter zu sein, die mit Verfahren der Präferenzmessung sinnvoll untersucht werden können. Wie bereits in Kapitel 2.3 angedeutet, ist bei der Kaufentscheidung dieser Gütern eher mit der Anwendung von Entscheidungsheuristiken als mit Trade-offs zu rechnen, d.h. es werden vereinfachte Bewertungsregeln zur Produktauswahl genutzt. Diese Art der Entscheidungsfindung führt allerdings nicht unbedingt zur Auswahl der „besten“ Alternative.203 Bei homogen wahrgenommenen Shopping-Goods spielt der Preis eine entscheidende Rolle, da sonst kaum Unterschiede in den Eigenschaftsausprägungen der Güter wahrgenommen werden. Trade-off Entscheidungen beruhen im Gegensatz dazu immer auf der Bewertung mehrerer Eigenschaften; aus diesem Grund erscheinen auch diese Güter für Studien zur Präferenzmessung ungeeignet.204 Heterogen wahrgenommene Shopping-Goods weisen demgegenüber aus Sicht der Konsumenten entscheidungsrelevante Unterschiede bezüglich der Ausprägungen mehrerer Eigenschaften auf. Es genügt infolgedessen nicht, nur anhand von den Ausprägungen einer Eigenschaft eine Entscheidung zu fällen. Trade-offs sind deshalb bei diesen Gütern wahrscheinlicher. 200 201 202 203 204

34

Vgl. Kotler; Bliemel (2001), 721.; Kotler (2003), 411; Nieschlag; Dichtl; Hörschgen (2002), 581. Vgl. Kotler; Bliemel (2001), 721.; Kotler (2003), 411. Vgl. Kotler; Bliemel (2001), 721. Vgl. Goodwin; Wright (2000), 57. Dies gilt analog zum Dissonanz mindernden Kaufentscheidungsverhalten, siehe Kapitel 2.3.

Speciality Goods bezeichnen Güter, bei deren Kauf mit der Anwendung eines extensiven Kaufentscheidungsprozesses zu rechnen ist, bei dem jedoch einzelne Eigenschaftsausprägungen (z.B. eine bestimmte Ausprägung der Eigenschaft „Marke“) die Wahlentscheidung dominieren können. Aufgrund des extensiven Kaufentscheidungsprozesses ist dagegen innerhalb der Alternativen des Evoked-Sets mit Trade-off Entscheidungen zu rechnen, weshalb Speciality Goods in dieser Phase für die Präferenzmessung geeignet erscheinen. Als Unsought Goods werden Produkte bezeichnet, bei denen die Phase der Informationsbeschaffung fremdinduziert ist, diese Produkte werden deshalb üblicherweise durch persönlichen Verkauf vertrieben.205 Deshalb ist nicht davon auszugehen, dass der Konsument einen Überblick über die am Markt verfügbaren Produkte erlangen kann. Die Entscheidung erfolgt vielmehr anhand der ihm vom Verkäufer präsentierten Alternativen, wobei bezüglich dieser Produkte jedoch Trade-offs möglich sind. Es wird deutlich, dass längst nicht alle Produktarten für die Präferenzmessung geeignet erscheinen. Neben den bisher beschriebenen Anforderungen an ein Untersuchungsobjekt werden in der Literatur weitere grundlegende Bedingungen genannt, die erfüllt sein müssen, um eine Produktgruppe sinnvoll mit Hilfe der Verfahren zur Präferenzmessung untersuchen zu können.

2.5

Anforderungen an das Untersuchungsobjekt

Die Conjoint-Analyse beruht, wie auch die anderen Präferenzmessverfahren, auf der Analyse von Trade-off Entscheidungen der Nachfrager. Damit Befragungsteilnehmer diese Bewertungsstrategie überhaupt anwenden können, ist ein entsprechendes Vorwissen in dem jeweiligen Produktbereich notwendig, d.h. die Eigenschaftsausprägungen müssen von ihm mit entsprechenden Nutzenerwartungen verknüpft werden können. Deshalb eignen sich ConjointAnalysen eher für inkrementale Produktverbesserungen statt für radikale Innovationen.206 Bei radikalen Innovationen ist damit zu rechnen, dass es eine längere Zeit dauern kann, bis sich die Produkte am Markt durchsetzen können. Während dieser Zeit ist bei sich ständig ändernden Wettbewerbsverhältnissen in besonderem Maße mit sich ändernden Präferenzen der Kunden zu rechnen.207

205 206 207

Vgl. Kotler; Bliemel (2001), 720. Vgl. American Marketing Association (1992), 6. Vgl. Cattin; Wittink (1982), 50.

35

Mit Hilfe von Methoden zur Präferenzmessung können lediglich Produkte untersucht werden, bei denen ein Trade-off der einzelnen Produktmerkmale bei realen Kaufentscheidungssituationen eine typische Entscheidungsstrategie darstellt.208 Um die Methoden zur Präferenzmessung überhaupt anwenden zu können, muss es darüber hinaus möglich sein, das Untersuchungsobjekt sinnvoll in bestimmte Teilleistungen aufzuteilen. Dies bedeutet, dass Entscheidungsträger verschiedene Alternativen typischerweise nicht „als Ganzes“ bewerten sollten, sondern ihre Einschätzung bezüglich eines Stimulus aus verschiedenen Einzelbewertungen der jeweiligen Produktelemente, d.h. der Merkmalsausprägungen, bilden. Bei Produkten, die vor allem auf Basis von visuellen, olfaktorischen oder gustativen Reizen wahrgenommen und bewertet werden, ist dagegen damit zu rechnen, dass diese für eine Untersuchung im Rahmen der Präferenzmessung nicht geeignet sind, da sie eher „als Ganzes“ beurteilt werden - weniger geeignet sind deshalb Produktgruppen wie Kunstwerke, v.a. ästhetische Produkte,209 Parfums oder Nahrungsmittel.210 Können Produkte in verschiedene Einzelelemente aufgeteilt werden, so schätzt ein Nachfrager zunächst die Vorteilhaftigkeit einzelner Eigenschaftsausprägungen der relevanten Merkmale unter Anwendung verschiedener Nutzenmodelle ein und kann danach mit Hilfe von Nutzenfunktionen den Gesamtnutzen einer Alternative bestimmen. Im Folgenden werden deshalb mögliche Formen von Nutzenmodellen und eine typische Nutzenfunktion beschrieben.

2.6

Nutzenmodelle bei der Bewertung von Merkmalsausprägungen

Die meisten Verfahren zur Präferenzmessung wie die Conjoint-Analyse Varianten, die SelfExplicated Methoden oder die hybriden Verfahren zur Präferenzmessung beruhen bei der Bewertung von Merkmalsausprägungen auf dem Teilnutzenmodell. Teilweise werden auch Idealpunkt- bzw. Vektormodelle eingesetzt (siehe Abbildung 6).211

208

Die Verfahren zur Präferenzmessung eignen sich somit eher zur Erfassung extensiver, aber nicht habitualisierter oder impulsiver Kaufentscheidungen. Dies ist vor allem bei Produkten der Fall, bei denen der Kauf mit einem gewissen finanziellen, sozialen und/oder psychologischen Risiko verbunden ist, so dass möglichst der gesamte, in Kapitel 2.3 beschriebene, Kaufentscheidungsprozess von einem potenziellen Käufer durchlaufen wird (vgl. Backhaus; Brzoska (2004), 41). 209 Dazu zählen Produktgruppen, bei denen das Design einen dominanten Einfluss auf die Kaufentscheidung ausübt. Dies könnte beispielsweise bei Einrichtungsgegenständen wie Vasen der Fall sein. 210 Vgl. Huber (1987), 5; Balderjahn (1993), 94; Johnson (1987), 253. Werden diese Produktgruppen mit Hilfe einer Präferenzmessmethode untersucht, ist deshalb verstärkt mit Interaktionseffekten zu rechnen (siehe Kapitel 4.2.3.1). 211 Vgl. Green; Krieger; Wind (2001), 59; Perrey (1998), 69.

36

Bei Vektormodellen geht man davon aus, dass ein „mehr“ (bzw. ein „weniger“) der Eigenschaftsausprägung eines Merkmals einen höheren (bzw. niedrigeren) Nutzen stiftet.212 Demgegenüber gibt es bei Idealpunktmodellen213 eine „optimale“ Ausprägung, die dem Entscheidungsträger den höchsten Nutzen stiftet. Eine Abweichung der Eigenschaftsausprägung unter bzw. über den Idealpunkt ist mit einem zu beiden Seiten symmetrischen Nutzenverlust verbunden.214 Problematisch an dieser Variante des Idealpunktmodells ist jedoch, dass ein symmetrischen Nutzenverlauf in der Realität u.U. nicht der Fall vorliegt.215 Die im Rahmen der Präferenzmessung üblichste Form der Nutzenmodelle ist, wie bereits angedeutet, das Teilnutzenmodell. Dabei werden jeweils für alle untersuchten Eigenschaftsausprägungen Teilnutzenwerte geschätzt; Annahmen über den Nutzenverlauf werden a priori nicht vorgegeben, weshalb dieses Modell äußerst flexibel einsetzbar ist.216 Idealpunktmodell Nutzen

Vektormodell Nutzen

Ausprägung

Teilnutzenmodell Nutzen

Ausprägung

A1

A2

A3

Ausprägung

Abbildung 6: Beispiele für Typen von Nutzenverläufen

Idealpunkt- und Vektormodelle sind lediglich bei Eigenschaften mit kontinuierlichen Ausprägungen anwendbar.217 Bei Merkmalen mit nominal-skalierten Ausprägungen kann dagegen nur das Teilnutzenmodell eingesetzt werden.218 Eine weitere Grundvoraussetzung für Idealpunkt- und Vektormodell ist zudem, dass die Entscheidungsträger einen konstanten, vorgege212

Vgl. Green; Srinivasan (1978), 105; Wilkie; Pessemier (1973), 429; Hammann; Erichson (2000), 386f.; Backhaus; Erichson; Plinke; Weiber (2003), 642; Skiera; Gensler (2002a), 203f.; Green; Srinivasan (1990), 4; Klein (2002), 15f.; Schubert (1991), 118f. Ein Beispiel dafür wäre der Preis einer Produktalternative (je geringer der Preis, desto höher ist die Präferenz) oder die Eigenschaft „Jahresgehalt“ bei einem Job-Angebot (je höher, desto stärker ist die Präferenz). Teilweise wird hier ein linearer Verlauf, d.h. jeweils proportionale Änderungen der Präferenz je nach Variation der Merkmalsausprägung, unterstellt (vgl. Gutsche (1995), 82; Fischer (2001), 65; Hahn (1997), 50f., 60; Thaden (2002), 12). Dieser, auch in Abbildung 6 dargestellte, lineare Nutzenverlauf ist jedoch lediglich für einen begrenzten Bereich gültig (vgl. Hammann; Erichson (2000), 387). In jedem Fall wird bei Vektormodellen von einem monoton wachsenden bzw. fallenden Nutzenverlauf ausgegangen (vgl. Balderjahn (1993), 93). 213 Vgl. Hahn (1997), 52; Backhaus; Erichson; Plinke; Weiber (2003), 650; Klein (2002), 16. Beispiele für ein mögliches Idealpunktmodell wären die „Süße“ oder die „Temperatur“ von Kaffee. 214 Vgl. Green; Srinivasan (1978), 105; Fischer (2001), 66f.; Skiera; Gensler (2002a), 203f.; Hahn (1997), 51; Wilkie; Pessemier (1973), 435; Thaden (2002), 12; Hammann; Erichson (2000), 386f.; Balderjahn (1993), 93; Gutsche (1995), 83f.; Green; Krieger; Wind (2001), 60; Backhaus; Erichson; Plinke; Weiber (2003), 642; Green; Wind; Rao (1998), 68; Green; Srinivasan (1990), 4; Klein (2002), 16f.; Perrey (1998), 68f. 215 Vgl. Gutsche (1995), 84. Schubert (1991, 120) präsentiert deshalb ein Idealpunktmodell, bei dem um den Idealpunkt kein symmetrischer Nutzenverlauf vorausgesetzt wird, es entspricht allerdings weitgehend dem Teilnutzenmodell, wie es z.B. Green; Srinivasan (1978, 106) beschreiben. 216 Vgl. Green; Srinivasan (1978), 105f.; Green; Srinivasan (1990), 4; Balderjahn (1993), 94; Gutsche (1995), 85; Fischer (2001), 67; Thaden (2002), 13; Skiera; Gensler (2002a), 203f.; Green; Wind; Rao (1998), 68; Schubert (1991), 120f. 217 Siehe Kapitel 4.1.3. 218

Vgl. Balderjahn (1993), 95; Green; Srinivasan (1978), 106; Klein (2002), 18; Schubert (1991), 120; Perrey (1998), 69.

37

benen Bewertungsmodus nutzen.219 Mit Hilfe des Teilnutzenmodells können jedoch auch Vektor- und Idealpunktmodelle abgebildet werden. Ein Nachteil des Teilnutzenmodells ist allerdings, dass tendenziell mehr Parameter als bei Anwendung des Idealpunkt- oder Vektormodells geschätzt werden müssen.220 Die Wahl des Nutzenmodells legt die Art der Nutzenfunktion und die Anzahl der zu schätzenden Parameter fest. In der praktischen Anwendung der Conjoint-Analyse, die im Mittelpunkt dieser Arbeit steht, wird fast ausschließlich das Teilnutzenmodell genutzt.221 Im Folgenden bleiben deshalb das Idealpunkt- oder Vektormodell ausgeblendet.

2.7

Nutzenfunktionen zur Einschätzung von Alternativen

Mit Hilfe von Nutzenfunktionen kann auf Basis der jeweiligen Nutzenmodelle der Gesamtnutzen einer hypothetischen Produktalternative berechnet werden. Wird dabei das Teilnutzenmodell angewendet, so kommt typischerweise ein linear additives Nutzenmodell zum Einsatz.222 Die Hauptvorteile des additiven Nutzenmodells sind die einfache Anwendbarkeit sowie dessen Robustheit223 z.B. gegenüber potenziellen Interaktionseffekten.224 Selbst beim Auftreten von Non-Cross-Over Interaktionseffekten können diese Nutzenmodelle stabile Prognosen liefern.225 Ein Beispiel für ein solches linear additives Nutzenmodell, das typischerweise im Rahmen der Conjoint-Analyse zur Anwendung kommt, wird in der folgenden Gleichung 1 vorgestellt. Der Gesamtnutzen für den Entscheidungsträger i bei einer Alternative m ergibt sich dabei durch Addition der jeweiligen Teilnutzen der vorhandenen Ausprägungen k über alle Eigenschaften j. 219

Vgl. Hahn (1997), 52.

220

Vgl. Green; Srinivasan (1978), 106; Green; Srinivasan (1990), 4; Hahn (1997), 53; Klein (2002), 18. Bei der Anwendung der Conjoint-Analyse auf Basis des Teilnutzenmodells werden für jede Ausprägung jeweils Teilnutzen geschätzt. Andererseits könnte man einige Teilnutzen von Ausprägungen quantitativer Merkmale bei Unterstellung des Vektormodells auch durch lineare Interpolation zwischen den Teilnutzen der Extrempunkte der Ausprägungen bestimmen (vgl. Green; Srinivasan (1978), 105). Eine solche Vorgehensweise ist durchaus problematisch, wenn der reale Nutzenverlauf wie z.B. beim Idealpunktmodell (siehe Abbildung 6) nicht linear ist. Zudem ist bei vielen Eigenschaften gerade nicht davon auszugehen, dass ein linearer Nutzenverlauf über eine große Bandbreite der Ausprägungen vorliegt (siehe dazu Kapitel 5.7.1). Wendet man das Teilnutzenmodell an und geht davon aus, dass zwischen den untersuchten Ausprägungen ein linearer Nutzenverlauf besteht, werden die drei in Abbildung 6 untersuchten Ausprägungen jeweils durch Geraden miteinander verbunden (vgl. Green; Srinivasan (1978), 106). Neben diesem Teilnutzenmodell könnten auch sog. „mixed models“, d.h. verschiedene Nutzenmodelle innerhalb einer Studie zur Präferenzmessung, angewendet werden (vgl. Green; Srinivasan (1978), 106f.; Green; Srinivasan (1990), 4). 221 Vgl. Thaden (2002), 13; Hahn (1997), 59; Green; Srinivasan (1978), 106; Cattin; Wittink (1982), 46f.; Schubert (1991), 121. 222 Vgl. Luce; Tukey (1964), 1ff.; Green; Carmone; Wind (1972), 290. 223

Vgl. Green; Carmone; Wind (1972), 298; Dawes; Corrigan (1974), 105; Green; Srinivasan (1978), 107; Green; Goldberg; Wiley (1983), 149; Johnson; Meyer (1984), 539f. Dies gilt jedoch nur eingeschränkt, wenn nicht-kompensatorische Entscheidungsregeln von einem Befragungsteilnehmer zur Bewertung der Alternativen eingesetzt werden (vgl. Johnson; Meyer; Ghose (1989), 268f.). 224 Vgl. Green; Carmone; Wind (1972), 298. Siehe auch Kapitel 4.2.3.1. 225

38

Siehe dazu Kapitel 4.2.3.1.

J

U im

K

¦¦ E

ijk

* yijkm

Gleichung 1

j 1k 1

mit:

U im :

E ijk : y ijkm : J: K:

geschätzter Gesamtnutzen der m-ten Alternative beim i-ten Entscheidungsträger geschätzter Teilnutzen für die k-te Merkmalsausprägung des j-ten Attributs beim i-ten Entscheidungsträger Binär-Codierung des j-ten Merkmals beim m-ten Stimulus für Proband i: 1 - wenn k-te Ausprägung vorhanden ist; 0 - wenn k-te Ausprägung nicht vorhanden ist Zahl der Eigenschaften Zahl der Ausprägungen

Bei anderen Präferenzmessverfahren muss die Formel für das linear additive Nutzenmodell entsprechend den Anforderungen der Methode angepasst werden. Bei gewichteten SelfExplicated Methoden226 ergibt sich beispielsweise die folgende Gleichung 2.227

U im

¦ ¦D

ijkm

* x ij

jJ kK j

Gleichung 2

mit:

U im : D ijk :

geschätzter Gesamtnutzen der m-ten Alternative beim i-ten Entscheidungsträger Einschätzung der k-ten Ausprägung, des j-ten Attributs durch den i-ten Entscheidungsträger, wenn diese bei der m-ten Alternative vorhanden ist

x jkm :

Einschätzung der Bedeutung des j-ten Merkmals durch den i-ten Entscheidungsträger

Dabei wird zunächst durch Multiplikation der Einschätzungen einer Eigenschaft mit der Bewertung der jeweiligen Ausprägung ein Teilnutzen für alle Ausprägungen einer Alternative berechnet. Dieser entspricht dem geschätzten Teilnutzen ijk bei der Conjoint-Analyse. Anschließend werden die Teilnutzen der Ausprägungen, die Alternative m aufweist, addiert, um den jeweiligen Gesamtnutzen zu berechnen.228

226

Siehe Kapitel 3.1.

227

Siehe Green; Carmone; Wind (1972), 288f.; Green; Srinivasan (1978), 104. Auch bei anderen Verfahren wie dem AHP oder der SMART wird der Gesamtnutzen in analoger Weise berechnet, siehe für den AHP u.a. Klein; Scholl (2004), 370f. bzw. von Winterfeldt; Edwards (1986), 281 für die SMART. 228 Vgl. Lans; Wittink; Huber; Vriens (1992), 365.

39

3 Verfahren und grundlegende Schritte bei der Durchführung von Studien zur Präferenzmessung

Bei der Durchführung von Studien zur Präferenzmessung sind, unabhängig von der genutzten Methode, die in Abbildung 7 dargestellten Schritte notwendig. Zunächst müssen die für die Untersuchung relevanten Eigenschaften sowie deren Ausprägungen bestimmt werden. Diese Phase determiniert, wie bereits mehrfach beschrieben, die Ergebnisse der Präferenzmessung und steht deshalb im Mittelpunkt dieser Arbeit. 1.

Bestimmung der relevanten Eigenschaften und deren Ausprägungen

2.

Festlegung des Erhebungsdesigns

3. Bewertung des Untersuchungsproblems durch die Entscheidungsträger 4.

Schätzung der Nutzenwerte

5.

Aggregation der Nutzenwerte / Marktsimulation

Abbildung 7: Schritte bei der Durchführung einer Studie zur Präferenzmessung (in Anlehnung an 229 Backhaus; Erichson; Plinke; Weiber (2003), 547ff.)

In einem zweiten Schritt wird das Erhebungsdesign für die Präferenzmessung festgelegt. Ziel ist es dabei, eine Bewertungsgrundlage für die Entscheidungsträger zu schaffen, anhand derer die Teilnutzen einzelner Eigenschaftsausprägungen bzw. die Bedeutung der Ausprägungen und Attribute ermittelt und damit Gesamtnutzen für hypothetische Alternativen geschätzt werden können. Die konkrete Ausgestaltung des Erhebungsdesigns wird dabei durch die vom Marktforscher selektierte Methode zur Präferenzmessung bestimmt.230 Daran anschließend werden je nach Präferenzmessverfahren von den Entscheidungsträgern ganze Alternativen bzw. einzelne Eigenschaften und Ausprägungen bewertet. Zur Einschätzung durch die Befragungsteilnehmer stehen verschiedene Skalenarten zur Verfügung, die in Kapitel 3.2 genauer beschrieben werden. Die Art der Präferenzmessmethode und die verwendete Skalenart bei der Bewertung der Alternativen bestimmen das Verfahren, mit dessen Hilfe danach die Teilnutzen bzw. Nutzengewichte der Eigenschaften und Ausprägungen bestimmt werden können (Schritt 4 in Abbildung 7). In Kapitel 3.6 werden verschiedene Schätzverfahren beschrieben; diese erlauben typischerweise eine Ermittlung der Nutzen auf individuellem Niveau, d.h. für jeden einzelnen Entscheidungsträger. 229 230

Siehe analog auch Green; Srinivasan (1978), 105; Perrey (1998), 66; Hair; Anderson; Tatham; Black (1998), 401, 419. Backhaus; Erichson; Plinke; Weiber (2003, 550) sehen deshalb die Festlegung der Methode zur Präferenzmessung als Bestandteil der Bestimmung des Erhebungsdesigns.

41

In der Marktforschung sind allerdings häufig nicht individuelle Präferenzen einzelner Befragungsteilnehmer, sondern die Anforderungen bestimmter Zielgruppen von Interesse.231 Erst die Analyse des Entscheidungsverhaltens auf Segmentebene erlaubt aus Herstellersicht die Formulierung von „Wenn-Dann“-Aussagen über das Wahlverhalten potenzieller Kunden.232 Bevor die Individualdaten jedoch aggregiert werden können (Schritt 5, siehe Kapitel 3.9), werden sie zunächst standardisiert (siehe Kapitel 3.7). Im Folgenden werden die einzelnen Schritte bei der Durchführung einer Studie zur Präferenzmessung genauer vorgestellt. Bevor diese Phasen beschrieben werden, sollen zunächst die typischen Methoden zur Erfassung von Kundenpräferenzen vorgestellt werden. Dies ist notwendig, da das gewählte Verfahren einen erheblichen Einfluss auf die Ausgestaltung der weiteren Schritte ausübt. Zudem können erst auf Basis der Darstellung der verschiedenen Präferenzmessverfahren entsprechende Anforderungen an ein Eigenschaftsset abgeleitet werden.233

3.1

Ein Überblick über typische Methoden zur Erfassung von Präferenzen

Bei jeder Art Präferenzmessung handelt es sich um eine heuristische Vorgehensweise, da es nicht möglich ist, die tatsächlichen Präferenzen eines Entscheidungsträgers exakt zu erfassen. Die Messung der Präferenzen von Entscheidungsträgern ist deshalb immer zu einem gewissen Grad mit Inkonsistenzen behaftet.234 Dies bedeutet allerdings auch, dass es nie „die“ eine richtige Methode zur Erhebung von Konsumentenpräferenzen geben kann. Entsprechend wurden in der Vergangenheit eine Vielzahl an Verfahrensarten bzw. –varianten vorgeschlagen.

3.1.1 Abgrenzung typischer Methoden zur Erfassung von Präferenzen

Oftmals wird bei der Präsentation verschiedener Methoden zur Präferenzmessung lediglich zwischen kompositionellen, dekompositionellen und hybriden Methoden zur Präferenzmessung unterschieden.235 Soll ein umfassenderer Überblick über die Verfahren gegeben werden, ist eine Beschränkung auf diese Methoden jedoch nicht ausreichend.

231 232 233 234 235

42

Vgl. Hahn (1997), 80; Schubert (1991), 233. Vgl. Schweikl (1985), 133. Schließlich ist eine überblicksartige Beschreibung notwendig, da die Methoden selbst teilweise selbst zur Bestimmung der relevanten Eigenschaften genutzt werden (dies gilt z.B. für die hybriden Methoden). Vgl. Klein; Scholl (2004), 325. Green; Krieger (1996), 851.

Vielmehr können folgende typische Abgrenzungskriterien zur Einordnung der Verfahren genutzt werden: -

-

-

-

-

-

-

Erfassung individueller Nutzenfunktionen bzw. Schätzung der Nutzenfunktion einer Gruppe von Entscheidungsträgern, Erheben von Präferenzen vs. Wahlentscheidungen, explizite Berücksichtigung symbolischer Eigenschaftsdimensionen vs. keine Annahmen zur Eigenschaftsart,236 Unterstellung vollständig kompensatorischer Entscheidungsprozesse vs. Berücksichtigung zweistufiger Kaufentscheidungsprozesse, die zunächst einen nicht-kompensatorischen Schritt beinhalten, Bewertung identischer Eigenschaftssets durch alle Entscheidungsträger bzw. Individualisierung der Eigenschaftssets, Gliederung der Eigenschaften und Ausprägungen innerhalb einer Hierarchie bzw. keine Nutzung einer Hierarchie zur Darstellung des Bewertungsproblems, Incentivierung der Teilnahme an der Präferenzmessung bzw. Höhe des Incentives je nach Güte und Art der getroffenen Entscheidungen durch den Befragungsteilnehmer, kompositionelle, hybride oder dekompositionelle Erfassung der Präferenzen und bei dekompositionellen Methoden zudem: die Unterscheidung in simultane Einschätzung aller Eigenschaften bzw. simultane Bewertung einer Teilmenge von Attributen, die Erfassung absoluter vs. relativer Bewertungsurteile und die Berücksichtigung von Interaktionseffekten bzw. keine Berücksichtigung von Interaktionen.

Im Folgenden sollen die im Marketing bekanntesten Verfahren zur Präferenzmessung kurz vorgestellt werden.237 Auf eine ausführliche Beschreibung der Methoden wird dabei aufgrund der Vielzahl an potenziellen Methoden zur Präferenzmessung verzichtet und deshalb auf die angegebenen Literaturquellen verwiesen. Kompositionelle Verfahren

Bei kompositionellen Verfahren werden die Eigenschaften und Ausprägungen vom jeweiligen Entscheidungsträger direkt eingeschätzt.238 Typische kompositionelle Verfahren sind die 236

Diese Unterscheidung spielt in der praktischen Anwendung kaum eine Rolle und wird deshalb nicht weiter betrachtet. Lediglich Stallmeier (1993, 39) nutzt eine solche Unterscheidung und schlägt eine Vorgehensweise vor, mit deren Hilfe symbolische Dimensionen wie Design, Prestige oder Sicherheit bewertet werden könnten (siehe dazu auch Kapitel 4.1.8). 237 Zusätzlich zu den hier genannten Verfahren kommen viele weitere Methoden der Entscheidungsanalyse in Frage, siehe dazu beispielsweise auch Schoemaker; Waid (1982), 183ff.; Kamenetzky (1982), 705f. Zudem werden lediglich Verfahren, die die Schätzung von Teilnutzen erlauben, berücksichtigt. Methoden, die der Prognose von Wahlverhalten dienen, jedoch keine Schätzung von Nutzenwerten ermöglichen, werden dagenen nicht weiter betrachtet – zu diesen Verfahren zählen u.a. die Even Swaps Methode (vgl. Hammond; Keeney; Raiffa (1998), 137ff.) oder das Repeated Stack Sorting (vgl. Hartmann; Sattler (2004), 6ff.; Hartmann (2004), 127ff.). 238 Vgl. Akaah; Korgaonkar (1983), 187; Wiley; MacLachlan; Moinpour (1977), 98; Green; Krieger (1996), 851; Albrecht (2000), 23.

43

Varianten der Self-Explicated Methode,239 des Analytic Hierarchy Process,240 die SMART,241 bzw. die Maut.242 Durch die direkte Bewertung der Ausprägungen und Eigenschaften ist es für den Entscheidungsträger sehr einfach, schnell und mit einem relativ geringen kognitiven Aufwand möglich, ein Entscheidungsproblem einzuschätzen, so dass im Vergleich zu anderen Methoden tendenziell komplexere Bewertungsobjekte untersucht werden können.243 Dabei werden vom Entscheidungsträger zunächst oft die Merkmalsausprägungen und in einem zweiten Schritt die Eigenschaften im Verhältnis zueinander eingeschätzt.244 Durch die direkte Einschätzung der Ausprägungen und Eigenschaften können jedoch keine Interaktionseffekte zwischen verschiedenen Merkmalen berücksichtigt werden.245 Self-Explicated Methoden sind die im Marketing am häufigsten genutzten kompositionellen

Verfahren. Im Vergleich zu den Varianten der Conjoint-Analyse werden sie allerdings relativ selten eingesetzt. Aufgrund dessen sind die Vor- und Nachteile des Verfahrens bisher weitgehend unbekannt.246 In Abbildung 8 werden die übliche Varianten der Self-Explicated Methode präsentiert.247 Schritt 1: Eliminierung völlig unakzeptabler Conjunctive

Eigenschaftsausprägungen Schritt 2: Bewertung der Eigenschaftsausprägungen Schritt 3: Einschätzung der Wichtigkeit der Eigenschaften

ungewichtete SelfExplicated Methode traditionelle SelfExplicated Methode

Compensatory gewichtete

Self-Explicated

Self-Explicated

Methode

248

Methode

Abbildung 8: Self-Explicated Methoden im Überblick (Quelle: Hensel-Börner (2000), 17)

Bei der traditionellen Variante der Self-Explicated Methode wird allein die Bedeutung der Eigenschaften auf einer Rating-Skala eingeschätzt;249 die Vorgehensweise entspricht dem Di239 240 241

Vgl. Hoepfl; Huber (1970), 408; Wiley; MacLachlan; Moinpour (1977), 98; Akaah; Korgaonkar (1983), 187. Vgl. Albrecht (2000), 24. Vgl. Goodwin; Wright (2000), 15ff.; Reiners (1996), 14ff.

242

Für weitere Verfahren, die vor allem in der Entscheidungsanalyse angewendet werden, siehe auch Scholl; Manthey; Helm; Steiner (2005), 762ff.; Pöyhönen; Hämäläinen (1997), 1ff. 243 Vgl. Akaah; Korgaonkar (1983), 188. 244 245 246

Vgl. Albrecht (2000), 24, 59. Vgl. McCullough (2002a), 49. Vgl. McCullough (2002a), 48f.

247

Krapp; Sattler (2001, 2) schlagen eine weitere Variante vor. Bei dieser als „New“ Self-Explicated Approach bezeichneten Methode werden die Eigenschaftsausprägungen bezüglich ihrer Vorziehenswürdigkeit lediglich in eine Rangfolge gebracht. Eine differenzierte Bewertung erfolgt dagegen bei der Bestimmung der Merkmalsgewichte – die Eigenschaften werden zunächst in drei Gruppen „important“, „partly important“ und „not important“ eingeteilt und innerhalb dieser Gruppen auf einer 7-stufigen Rating-Skala bewertet. 248 Dieses Verfahren wird u.a. ebenfalls als „two-stage rating model“ bezeichnet (vgl. Akaah; Korgaonkar (1983), 189). 249

44

Vgl. Wilkie; Pessemier (1973), 429; Jain; Mahajan; Malhotra (1979), 248; Green; Carmone; Wind (1972), 289; Wiley; MacLachlan; Moinpour (1977), 99.

rect-Ratio-Verfahren.250 Diese Art der Präferenzmessung ist insbesondere deshalb problembehaftet, weil, wie bereits beschrieben, anhand von Wichtigkeitseinschätzungen über Eigenschaften keine Rückschlüsse auf das Wahlverhalten von Konsumenten gezogen werden können.251 Bei der ungewichteten Self-Explicated Variante wird lediglich die Vorziehenswürdigkeit der Ausprägungen erhoben. Ausgangspunkt ist die Vermutung, dass die Bedeutungsgewichte aller untersuchten Merkmale gleich groß sind.252 Eine weitere, besonders häufig angewendete Variante ist die gewichtete Self-Explicated Methode,253 bei der der Entscheidungsträger zunächst die Vorteilhaftigkeit der Eigenschaftsausprägungen und auf Basis dieser Bewertungen die Bedeutung der Eigenschaften einschätzt.254 Eine neuere Variante - die Conjunctive Compensatory Self-Explicated Methode - schlägt Srinivasan (1988, 295ff.) vor.

Dabei wird der Entscheidungsträger zunächst über das gesamte Eigenschaftsset informiert und kann in einer ersten nicht-kompensatorischen Phase alle völlig unakzeptablen Merkmalsausprägungen eliminieren. Im zweiten, kompensatorischen Teil ähnelt die Vorgehensweise der gewichteten Self-Explicated Methode, wobei jedoch eine Ankerpunktmethode den Befragungsteilnehmern die Bewertung erleichtert. So wird der Proband zunächst gebeten, jeweils für jede Eigenschaft die Ausprägung zu selektieren, die er am meisten (diese erhält 100 Punkte) bzw. am wenigsten (diese erhält 0 Punkte) bevorzugt. Die restlichen Ausprägungen können danach auf einer 0-100 Punkte Rating-Skala zwischen diesen Ankerpunkten entsprechend ihrer Vorziehenswürdigkeit eingeordnet werden. Bei der Einschätzung der Eigenschaften wird zunächst ein „kritisches Merkmal“ bestimmt. Dabei handelt es sich um das Attribut, bei dem die Verbesserung von der schlechtesten zur besten Ausprägung am wichtigsten eingeschätzt wird. Dieser Eigenschaft wird ein Punktwert von „100“ zugewiesen; alle weiteren Merkmale werden in Relation zu diesem Attribut bewertet. Im Gegensatz zu anderen Varianten255 der Self-Explicated Methode werden die Eigenschaften nicht separat, sondern im Vergleich zuei250 251

Siehe Kapitel 5.2.2.1. Vgl. Mikes; Hulin (1968), 397; Gibson (2001), 18.

252

Vgl. Green; Krieger; Agarwal (1993), 373; Green; Carmone; Wind (1972), 289. Dabei können unterschiedliche Skalen zur Einschätzung der Ausprägungen genutzt werden. Green; Krieger; Agarwal (1993, 372) lassen diese beispielsweise lediglich in eine Rangfolge bringen. 253 Eine Variante der gewichteten Self-Explicated Methode ist „CASEMAP“, die auf computergestützten Einschätzungen beruht (vgl. Green; Krieger (1996), 852). 254 Vgl. Akaah; Korgaonkar (1983), 187, 189; Huber; Daneshgar; Ford (1971), 270; Green; Krieger (1996), 851; Green; Carmone; Wind (1972), 289; Lans; Wittink; Huber; Vriens (1992), 365. Der Teilnutzen einer Ausprägung kann entsprechend Gleichung 2 (siehe Kapitel 2.7) berechnet werden. Auch bei der gewichteten Self-Explicated Methode werden in den verschiedenen Studien unterschiedliche Skalen angewendet. Hoepfl; Huber (1970, 410) nutzen beispielsweise eine 0100 Punkte Skala, bei der keine Abstufungen vorgegeben wurden und der Entscheidungsträger die Eigenschaften bzw. Ausprägungen grafisch, durch Zeichnen einer Linie auf der 0-100 Skala, einschätzt. Bei Green; Goldberg; Wiley (1983, 147) werden die Ausprägungen auf einer 4-Punkte-Rating-Skala und die Eigenschaften auf einer 100 Punkte Konstantsummen-Skala bewertet. Teichert (2000b, 147, 156) beschreibt eine kompositionelle Methode, bei der im Gegensatz zu der sonstigen Reihenfolge der gewichteten Self-Explicated Methode zunächst die Eigenschaften und erst danach die Ausprägungen bewertet werden. Dies führte in dieser Studie zu einer tendenziellen Angleichung der bestimmten Bedeutungsgewichte. 255 Siehe im Folgenden beispielsweise die Variante der Self-Explicated Methode, die bei der Adaptive Conjoint-Analyse genutzt wird.

45

nander eingeschätzt. Dabei wird nicht eine subjektiv empfundene „Wichtigkeit“ der Eigenschaften bewertet, die Bedeutungsgewichte ergeben sich vielmehr aus der wahrgenommenen Verbesserung der am wenigsten zu der am meisten bevorzugten Ausprägung.256 In den meisten Studien, die auf einer Form der Self-Explicated Methoden basieren, wird eine Variante des gewichteten Modells benutzt.257 Dabei überwiegen die Verfahren, bei denen die Eigenschaften analog zu der von Srinivasan (1988, 296) vorgeschlagenen Vorgehensweise in Abhängigkeit von den jeweils untersuchten Ausprägungen bewertet werden.258 Eine weitere Variante der gewichteten Self-Explicated Methoden ist das Self-Explicated Choice Modeling (SUMM).259 Die Besonderheit besteht in einer Skala ohne vorgegebene Endpunkte, die positive und negative Werte annehmen kann.260 Zunächst schätzen die Entscheidungsträger die Vorziehenswürdigkeit der Ausprägungen auf einer offenen Skala ein – im Gegensatz zu den bisher beschriebenen Verfahren werden hierbei jedoch keine numerischen Werte, sondern Buchstaben zur Bewertung genutzt. Mit Hilfe des Buchstabens „L“ beschreibt ein Entscheidungsträger, dass er eine Ausprägung mag („like“); „D“ steht dagegen für „dislike“ und „N“ für eine neutrale Einschätzung. Um die Stärke der Präferenz anzugeben, kann der Befragungsteilnehmer so viele Buchstaben zur Einschätzung nutzen, wie er möchte. Diese Bewertungen werden danach umkodiert, d.h. ein „L“ wird beispielsweise als Punktwert „+1“ interpretiert, „LL“ als „+2“ usw.; negative Bewertungen („D“) werden entsprechend in negative Werte kodiert.261 Self-Explicated Methoden zeichnen sich, wie bereits beschrieben, insbesondere durch einfache Fragestellungen aus.262 Es ist somit zu erwarten, dass die kognitive Belastung der Pro-

banden relativ gering ist; aus diesem Grund können vergleichsweise viele Eigenschaften untersucht werden.263 Mit der Anwendung von Self-Explicated Methoden sind allerdings auch verschiedene Probleme verbunden. Beispielsweise ist noch nicht abschließend geklärt, ob und wie die bestimmten Bewertungen standardisiert und so zwischen den Entscheidungsträgern

256

Vgl. Srinivasan (1988), 296. Alle Varianten, bei denen die Bewertung der Merkmalsausprägungen und Eigenschaften in Anlehnung an Srinivasan (1988, 295ff) erfolgt und die keinen nicht-kompensatorischen Teil enthalten, werden im Folgenden als gewichtete Self-Explicated Methode bezeichnet. Eine weitere, zur Conjunctive Compensatory Self-Explicated Methode ähnliche Self-Explicated Variante, ist „Simalto“ (Simultaneous Multi Attribute Trade-off). Auch bei dieser Vorgehensweise werden in einer ersten Befragungsphase die völlig unakzeptablen Merkmalsausprägungen eliminiert und danach die verbliebenen Ausprägungen anhand von Trade-off Entscheidungen bewertet (vgl. Green (1984), 158). 257 Vgl. Akaah; Korgaonkar (1983), 189; Green; Krieger (1996), 851; Albrecht (2000), 180. 258 259 260 261 262 263

46

Vgl. Albrecht (2000), 180. Vgl. Gibson (2002), 49; Gibson (1998), 11; Orme (2002a), 46; Srinivasan; deMaCarty (1999), 31. Vgl. Gibson (2002), 49. Vgl. Orme (2002a), 46; Orme (2002b), 1. Vgl. Sattler; Hensel-Börner (2000), 123ff.; Lans; Heiser (1992), 327; Leigh; MacKay; Summers (1984), 456; Akaah; Korgaonkar (1983), 188; Lans; Heiser (1992), 327. Vgl. Sattler; Hensel-Börner (2000), 123ff.; Akaah; Korgaonkar (1983), 188.

vergleichbar gemacht werden können. Ferner ist nicht in jedem Fall davon auszugehen, dass die Einschätzungen der Entscheidungsträger ratio-skaliert sind.264 Weiterhin scheint die Erfassung von potenziellen Interaktionseffekten durch die direkte Bewertung einzelner Ausprägungen einer Eigenschaft unmöglich.265 Insgesamt sind die Ergebnisse, die bei der Anwendung einer Self-Explicated Methode erzielt werden können, jedoch durchaus mit den Ergebnissen anderer, komplizierterer Verfahren vergleichbar.266 In praktischen Anwendungen spielen die Varianten der Self-Explicated Verfahren derzeit kaum eine Rolle.267 Aus diesem Grund ist eine abschließende Einschätzung der methodenspezifischen Vor- und Nachteile nicht möglich.268 Ein weiteres weit verbreitetes und besonders einfach anzuwendendes, kompositionelles Verfahren zur Einschätzung von verschiedenen Alternativen ist die SMART (Simple MultiAttribute Rating Technique).269 Im Folgenden soll eine typische Variante der SMART beschrieben werden. Dabei werden zunächst (ähnlich wie bei der gewichteten Self-Explicated Methode) die Ausprägungen der Eigenschaften bewertet. Dies kann durch „Direct Rating“ oder bei quantitativen Eigenschaften durch die Aufstellung einer Wertfunktion erfolgen. Beim Direct Rating wird der Entscheidungsträger gebeten, jeweils die Ausprägung eines Merkmals zu bestimmen, die er am meisten bzw. am wenigsten bevorzugt. Diesen Ausprägungen werden danach Punktwerte von „100“ bzw. „0“ zugewiesen.270 Die restlichen Ausprägungen des Attributs erhalten entsprechend ihrer Vorziehenswürdigkeit Punkwerte zwischen 100 und 0.271 Um die Bedeutungsgewichte der Eigenschaften zu bestimmen, kann ein SwingVerfahren eingesetzt werden. Grundlage der Einschätzung bildet eine hypothetische Alternative, die bei allen Eigenschaften die jeweils am wenigsten präferierte Ausprägung aufweist. 264 265

Vgl. Lans; Heiser (1992), 328. Vgl. McCullough (2002a), 49.

266

Vgl. Green; Carmone; Wind (1972), 297; Srinivasan; Park (1997), 291; Akaah; Korgaonkar (1983), 19f. Für MetaStudien siehe Green; Srinivasan (1990), 11; Sattler; Hensel-Börner (2000), 121ff.; Albrecht (2000), 165ff.; HenselBörner (2000), 17f. 267 Vgl. McCullough (2002a), 48f. 268

Vgl. Hensel-Börner (2000), 18.

269

Vgl. Goodwin; Wright (2000), 18; von Winterfeldt; Edwards (1986), 259ff.; Reiners (1996), 14ff.; Schoemaker; Waid (1982), 185. Die im Folgenden beschriebene Variante der SMART wird oft als SMARTS bezeichnet. Dabei beruht die Bestimmung der Bedeutungsgewichte auf einem Swing-Verfahren (vgl. Edwards; Barron (1994), 306). Im Marketing werden diese Verfahren relativ selten genutzt, da sie zur Analyse komplexer Entscheidungsprobleme und mit einem Fokus auf eine kleine Gruppe von Entscheidern entwickelt wurden (vgl. Green; Krieger (1996), 850). 270 SMART bezeichnet dabei eine Vielzahl an möglichen Varianten zur Einschätzung von Alternativen; dazu zählen u.a. die Verfahren SMARTS und SMARTER (vgl. von Winterfeldt; Edwards (1986), 278; Pöyhönen; Hämäläinen (1997), 1). Unterschiedliche Varianten der SMART ergeben sich insbesondere durch Variation der Skalenart bei der Einschätzung der Ausprägungen oder Merkmale (vgl. Goodwin; Wright (2000), 22; von Winterfeldt; Edwards (1986), 260f., 282ff.). So werden bei einer frühen Variante der SMART oder bei der Verfahrensvariante SMARTER beispielsweise lediglich Rangdaten für die Wichtigkeitseinschätzungen der Eigenschaften erhoben (vgl. von Winterfeldt; Edwards (1986), 278, 310; Reiners (1996), 15). 271 Vgl. Goodwin; Wright (2000), 22ff.; von Winterfeldt; Edwards (1986), 262. Sollen die Ausprägungen von quantitativen Merkmalen eingeschätzt werden, kann aufgrund der Vielzahl möglicher Ausprägungen die Bewertung durch Aufstellung einer Wertfunktion vereinfacht werden; für ein Beispiel siehe Goodwin; Wright (2000), 25ff.

47

Der Entscheidungsträger kann nun bei einer Eigenschaft die Ausprägung von der am wenigsten auf die am meisten bevorzugte Ausprägung anpassen. Die Eigenschaft, bei der diese Veränderung von der am wenigsten zu der am meisten bevorzugten Ausprägung den größten Nutzenunterschied hervorruft, ist die wichtigste Eigenschaft; ihr wird ein Punktwert von „100“ zugewiesen. Um die Bewertung zu vereinfachen, wird zunächst eine Rangfolge der weiteren Merkmalsbedeutungen erhoben und den Merkmalen danach Punktwerte zugewiesen. Diese Punktwerte für die Bedeutungsgewichte der Attribute können in einem weiteren Schritt so normalisiert werden, dass ihre Summe „100“ ergibt. Der Gesamtnutzen272 einer hypothetischen Alternative berechnet sich aus der Summe der Teilnutzen aller Merkmale. Der Teilnutzen einer Ausprägung kann durch Multiplikation der Bedeutungsgewichte der Eigenschaften mit den Bewertungen der jeweiligen Ausprägungen bestimmt werden.273 Albrecht (2000, 79f.) nutzt eine modifizierte Variante der Swing-Methode zur Bestimmung der Bedeutungsgewichte von Eigenschaften. Dabei werden zunächst die Ausprägungen der Eigenschaften analog zur Self-Explicated Methode bewertet, d.h. die am wenigsten und die am meisten bevorzugten Ausprägungen werden festgelegt und ihnen Punktwerte von 1 bzw. 7 Punkten zugewiesen. Die verbliebenen Ausprägungen werden danach auf einer 7-stufigen Rating-Skala eingeschätzt. Die Bedeutungsgewichte der Merkmale werden ausgehend von einer Alternative, die bei allen Merkmalen durch die präferierte Ausprägung beschrieben wird, bestimmt. Der Entscheidungsträger entscheidet nun bei welcher Eigenschaft die Verschlechterung von der am meisten präferierten zur am wenigsten bevorzugten Ausprägung am größten ist. Dieses Merkmal erhält 10 Punkte und dient als Anker zur Bewertung der restlichen Eigenschaften, die auf einer 10-stufigen Rating-Skala bewertet werden. Albrecht (2000, 81f.) bestimmt die Bedeutungsgewichte somit durch das Ausmaß an „Verschlechterung“ einer Eigenschaft. Er geht dabei davon aus, dass Verluste vom Entscheidungsträger tendenziell stärker als Gewinne gewichtet werden und eine Beurteilung von Verlusten durch die Entscheidungsträger differenzierter erfolgt. Der Vorteil aller kompositionellen Methoden besteht darin, dass die Bewertungen nur geringe Anforderungen an die Informationsverarbeitungskapazitäten der Entscheidungsträger stellen und deshalb die Präferenzen relativ schnell und mit geringem Aufwand erhoben werden können. Nachteilig an der direkten Erfassung von Präferenzen ist, dass eine solche Herangehensweise möglicherweise für die Befragungsteilnehmer eine ungewöhnliche und relativ abstrakte 272 273

48

Siehe Gleichung 2. Vgl. Goodwin; Wright (2000), 22ff.; Pöyhönen; Hämäläinen (1997), 2; Edwards; Barron (1994), 316f.; Eisenführ; Weber (2003), 129; Albrecht (2000), 67. Die Ermittlung der Bedeutungsgewichte erfolgt in vergleichbarer Weise zu der Bestimmung der Eigenschaftswichtigkeiten bei der Conjoint-Analyse (siehe dazu Kapitel 3.8 und vgl. Albrecht (2000), 67). Für weitere Möglichkeiten zur Einschätzung der Bedeutungsgewichte von Merkmalen siehe Edwards; Barron (1994), 317ff.

Art der Bewertung von Alternativen darstellt.274 Dabei besteht die Gefahr, dass von den Entscheidungsträgern nicht stark genug differenziert und nahezu alle Merkmale als „sehr wichtig“ bewertet werden könnten.275 Gleichzeitig ist bei einigen Eigenschaften (z.B. Gehalt) mit einem höheren Ausmaß von sozial erwünschtem Antwortverhalten zu rechnen.276 Interaktionen können nicht mit Hilfe von kompositionellen Methoden untersucht werden.277 Dekompositionelle Verfahren

Im Gegensatz zu den kompositionellen Verfahren bewerten die Befragungsteilnehmer bei dekompositionellen Methoden eine Reihe von multiattributiven Alternativen; dabei handelt

es sich um Stimuli die durch mindestens zwei Attribute beschrieben werden.278 Durch eine solche Darstellung wird den Befragungsteilnehmern erleichtert, die Merkmalsausprägungen nicht isoliert, sondern im Rahmen von Trade-off Entscheidungen zu bewerten.279 Der erfasste Gesamtnutzen wird danach in die einzelnen Teilnutzen der Merkmalsausprägungen „dekomponiert“. Dies bedeutet, dass durch die Einschätzungen verschiedener, auf Grundlage eines Erhebungsdesigns280 systematisch konstruierter Alternativen die Teilnutzen für die untersuchten Merkmalsausprägungen geschätzt werden können.281 Zu den dekompositionellen Methoden der Präferenzmessung zählen sämtliche „klassische“ Varianten der Conjoint-Analyse. Die diesen Verfahren zugrunde liegende Idee und deren Annahmen wurden erstmals von Luce; Tukey (1964, 1ff.) beschrieben und diese Vorgehensweise als zur Nutzenmessung geeignet bewertet.282 Eine erste Variante der Conjoint-Analyse stellen Green; Rao (1971, 355ff.) vor.283 Sie erläutern die allgemeine Vorgehensweise bei der Conjoint-Analyse mit Hilfe verschiedener hypothetischer Beispiele, wobei die Stimuli ent-

274 275 276 277 278 279 280

Vgl. Albrecht (2000), 25. Vgl. Albrecht (2000), 25. Um dies zu verhindern schlägt Srinivasan (1988, 295ff.), wie beschrieben, die Nutzung von Ankerpunkten und eines „kritischen“ Attributs vor. Vgl. Albrecht (2000), 25; Srinivasan; Park (1997), 290; Sattler; Hensel-Börner (2000), 123. Vgl. Albrecht (2000), 25; Orme (2002b), 2. Vgl. Luce; Tukey (1964), 2; Green; Srinivasan (1978), 104; Green; Wind (1975), 108; McCullough (2002b), 19; Albrecht (2000), 25. Vgl. McCullough (2002b), 19. Siehe Kapitel 3.4.

281

Vgl. Green; Srinivasan (1978), 103f.; Akaah; Korgaonkar (1983), 187; Wiley; MacLachlan; Moinpour (1977), 98. Dekompositionelle Methoden wurden in Forschungsbereichen wie den „klinischen Bewertungen“ entwickelt (vgl. Hoffmann; Slovic; Rorer (1968), 365ff. oder Goldberg (1968), 483ff.). Für einen Überblick siehe Dawes; Robyn M. (1971), 181ff. Zudem stellt das Functional Measurement eine weitere dekompositionelle Vorgehensweise zur Bestimmung von Bedeutungsgewichten dar (vgl. Anderson (1970), 153ff.). Für weitere dekompositionelle Verfahren siehe Green; Srinivasan (1978), 104. 282 Vgl. Luce; Tukey (1964), 7. Die Idee, multiattributive Stimuli zu bewerten, wurde schon seit den 20er Jahren des letzten Jahrhunderts verfolgt (vgl. Green; Srinivasan (1978), 103; Green; Krieger (1996), 851). Weitere Ansätze zur dekompositionellen Erfassung von Konsumentenpräferenzen im Marketing beschreiben z.B. Green; Carmone (1969, 330ff.). 283 Erste Anwendungen der Conjoint-Analyse finden sich in Green; Carmone; Wind (1972), 288ff.; Green; Wind; Jain (1972a), 31ff.; Srinivasan; Shocker (1973), 473ff.; Green; Wind (1973), 54ff.; Johnson (1974), 121ff.; Westwood; Lunn; Beazley (1974), 230ff. und Green; Wind (1975), 107ff.

49

sprechend ihrer Präferenz in eine Rangfolge gebracht und die Teilnutzen mit Hilfe der MONANOVA284 geschätzt werden.285 Innerhalb einer relativ kurzen Zeit konnte sich die Conjoint-Analyse als eine in Praxis und Forschung sehr bedeutsame Methode durchsetzen.286 Heute ist sie das wohl wichtigste Forschungstool im Marketing.287 Zu den ersten Varianten der Conjoint-Analyse zählen Trade-off Matrizen und die Full-Profile Darstellung aller Alternativen.288 Die Nutzung von Trade-off Matrizen289 wurde erstmals von Johnson (1974, 121ff.)290 vorgeschlagen. Dabei werden je zwei Eigenschaften mit ihren Ausprägungen innerhalb einer Matrix gegenübergestellt. Die so gebildeten Alternativen bestehen aus zwei Merkmalen und können im Folgenden von dem Entscheidungsträger in eine Rangfolge gebracht291 bzw. auf einer Rating-Skala eingeschätzt werden.292 Im Gegensatz dazu werden bei der Full-Profile Darstellung nicht nur eine Teilmenge der untersuchten Eigenschaften, sondern komplette Stimuli, die durch sämtliche Merkmale beschrieben werden, un-

284

Siehe Kapitel 3.6.

285

Green; Rao (1971, 358f.) schlagen eine Methode vor, bei der sämtliche Alternativen zunächst vollständig miteinander kombiniert und paarweise bewertet werden, d.h. zunächst wird eingeschätzt, welche der beiden Alternativen stärker bevorzugt wird und danach werden die Paare entsprechend der Intensität des Unterschieds in eine Rangfolge gebracht. Diese Vorgehensweise erlaubt die Bildung einer Rangfolge der Alternativen. Die Teilnutzen der einzelnen Ausprägungen können mit Hilfe der Software „Torsca“ geschätzt werden, die aber bei Green; Rao (1971, 359) nicht genauer beschrieben wird. 286 Vgl. Green; Srinivasan (1978), 120. Für erste potenzielle Anwendungsmöglichkeiten der Conjoint-Analyse siehe Green; Wind (1975), 112; Luce; Tukey (1964), 5ff.; Green; Srinivasan (1978), 116f. 287 Vgl. Bradlow; Hu; Ho (2004), 369; Deal (2002), 44; Bradlow (2005), 319. 288 289

Vgl. Green; Srinivasan (1978), 107ff.

Diese Methode wird auch als „two-factor-at-a-time procedure“ (Green; Srinivasan (1978), 107) bzw. aufgrund der Bewertung von Eigenschaftspaaren als „pairwise approach“ bezeichnet (vgl. Westwood; Lunn; Beazley (1974), 232). Eine ähnliche Vorgehensweise wurde von Westwood; Lunn; Beazley (1974, 232ff.) und Hauser; Urban (1977, 594) präsentiert. 291 Vgl. Westwood; Lunn; Beazley (1974), 232ff.; Green; Srinivasan (1978), 107; Backhaus; Erichson; Plinke; Weiber (2003), 556f. 292 In den letzten Jahren wurde die Trade-off Matrix kaum noch zur Präferenzmessung eingesetzt, da die Darstellung teilweise als wenig realistische Präsentationsform angesehen wird (vgl. Backhaus; Erichson; Plinke; Weiber (2003), 551f.; Green; Srinivasan (1978), 108; Albrecht (2000), 55; Johnson (1987), 258). Gerade die Darstellung in einer Matrixform könnte den Entscheidungsträger verwirren. Sie könnte dazu führen, dass er bei der Einschätzung der Alternativen in den Zeilen bzw. Spalten verrutscht oder vereinfachte Entscheidungsstrategien bei der Bewertung nutzt (vgl. Oppewal; Louviere; Timmermans (1994), 92; Green; Srinivasan (1978), 108; Johnson (2001), 3). Eine Verringerung der Anzahl an nötigen Einschätzungen durch fraktionierte Erhebungsdesigns ist im Gegensatz zu der Full-Profile Darstellung nicht bzw. nur eingeschränkt möglich (vgl. Green; Srinivasan (1978), 108; für ein Beispiel zur Reduktion von Einschätzungen siehe Johnson (2001, 4) oder Johnson (1987, 258). Zwar kann durch die Reduktion der Bewertungsaufgabe die Einschätzung erleichtert werden, aber durch die vergleichsweise isolierte Betrachtung werden möglicherweise einzelne Merkmale übergewichtet. Zudem stellt das Verfahren recht hohe Anforderungen an das Abstraktionsvermögen der Befragungsteilnehmer, da alle anderen, in einer Matrix nicht untersuchten Attribute als konstant angesehen werden müssen (vgl. Albrecht (2000), 55; Johnson (2001), 2). Letztendlich ist man durch die isolierte Betrachtung von lediglich zwei Merkmalen oft auf verbale Beschreibungen angewiesen. Bildliche Darstellungen repräsentieren dagegen oft nicht nur eine bzw. zwei Eigenschaften (vgl. Green; Srinivasan (1978), 108). Demgegenüber erlaubt die Nutzung von Trade-off Matrizen eine im Vergleich zur Full-Profile Darstellung tendenziell einfachere Einschätzung und kann durch die Reduktion auf jeweils zwei Eigenschaften einen „information overload“ verhindern (vgl. Green; Srinivasan (1978), 107; Albrecht (2000), 55), so dass eine vergleichsweise hohe Anzahl an Eigenschaften und Ausprägungen untersucht werden kann (vgl. Johnson (1987), 257). Lediglich bei zu komplexen Entscheidungssituationen, etwa wenn Eigenschaften durch eine Vielzahl von Ausprägungen beschrieben und deshalb große Matrizen bewertet werden müssen, ist mit schematischem Antwortverhalten zu rechnen (vgl. Albrecht (2000), 55). 290

50

tersucht.293 Die Alternativen können dann wiederum entsprechend ihrer Vorziehenswürdigkeit in eine Rangfolge gebracht294 bzw. durch Nutzung verschiedener Skalenarten295 bewertet werden. Aufgrund der dekompositionellen Art der Einschätzung eignet sich die Full-Profile Darstellung insbesondere für relativ kleine Entscheidungsprobleme, wenn also relativ wenig Eigenschaften und Ausprägungen untersucht werden sollen.296 Bei der Full-Profile Darstellung werden meist alle einzuschätzenden Alternativen gleichzeitig präsentiert und simultan vom Entscheidungsträger beurteilt. Eine weitere Präsentationsform besteht darin, die Alternativen nicht „an sich“, sondern im Rahmen von Paarvergleichen, d.h. jeweils „in Relation zueinander“, zu bewerten. Bei einer simultanen Bewertung der Stimuli auf Basis von Rating-Skalen ist nicht auszuschließen, dass diese mehr oder weniger isoliert voneinander eingeschätzt und vermehrt Vereinfachungsstrategien angewendet werden. Auch durch die Beurteilung von Alternativen mittels Rangordnung kann dieses Problem nicht völlig vermieden werden.297 Paarvergleiche ermöglichen im Gegensatz zur simultanen Präsentation eine sehr viel einfachere Einschätzung.298 Wie bei der simultanen Präsentation weisen dichotome Paarvergleiche299 jedoch einen geringen Informationsgehalt auf,300 weshalb bei vielen Conjoint-Analysen auf der Basis von Paarvergleichen neben der Richtung der Präferenz auch die Intensität der Vorziehenswürdigkeit einer Alternative abgefragt wird.301 Unter dem Begriff „Conjoint-Analyse“ werden alle Methoden zur Präferenzmessung zusammengefasst, bei denen zumindest in einem Teilbereich die Präferenzen dekompositionell, d.h.

293 294

Vgl. Green; Srinivasan (1978), 108. Vgl. Westwood; Lunn; Beazley (1974), 232; Schweikl (1985), 54f.

295

Siehe Kapitel 3.2. Für ein Beispiel von Rating-Skalen siehe Schweikl (1985, 55) oder Mulye (1998, 267). Dazu zählt auch die kategoriale Einordnung von Alternativen, d.h. eine dichotome Bewertung von Stimuli durch Urteile wie „Produkt kommt in Betracht“ oder „Produkt kommt nicht in Betracht“. Ein solches Categorial Conjoint Measurement wird in der Praxis nur selten angewendet und soll deshalb hier nur der Vollständigkeit halber erwähnt werden (vgl. Schweikl (1985), 54; Schubert (1991), 230). Für ein Anwendungsbeispiel des Categorial Conjoint Measurement siehe u.a. TorresLacomba (2001, 1ff.). 296 Vgl. McCullough (2002b), 20; Johnson (1987), 257. Siehe dazu auch Kapitel 3.3. Werden zu viele Eigenschaften untersucht, so ist damit zu rechnen, dass die Entscheidungsträger diese nicht mehr simultan einschätzen können und Entscheidungsheuristiken zur Bewertung nutzen bzw. bestimmte Eigenschaften bei der Einschätzung völlig vernachlässigen. Durch die Nutzung reduzierter Designs kann zumindest die Anzahl der nötigen Bewertungen verringert werden, was das Problem der kognitiven Überlastung mildert (vgl. Green; Srinivasan (1978), 108; Albrecht (2000), 55; Baier; Säuberlich (1997), 951; Johnson (1987), 257). Vorteil der Full-Profile Darstellung ist, dass diese Form der Präsentation relativ realistisch ist (vgl. Green; Srinivasan (1978), 108; Albrecht (2000), 55; Johnson (1987), 257). 297 Vgl. Schweikl (1985), 55. 298

Vgl. Johnson (2001), 4. Auch bei anderen Verfahren wie dem AHP wird zur Einschätzung der Elemente auf Paarvergleiche zurückgegriffen, weil auf diese Weise ein Trade-off unterstützt und die Bewertung erleichtert wird (vgl. Zahedi (1986), 98). 299 Dabei wird lediglich angegeben, welche der beiden Alternativen innerhalb eines Paarvergleichs bevorzugt wird. 300 301

Vgl. Schweikl (1985), 57, 117. Ein typisches Beispiel für die Anwendung von abgestuften Paarvergleichen (graded paired-comparisons) ist die ACA, die im Folgenden noch genauer beschrieben wird. Die Intensität der Vorziehenswürdigkeit kann dabei beispielsweise durch Nutzung von Rating-Skalen bzw. mit Hilfe der Dollar-Metrik erfasst werden (vgl. Schweikl (1985), 58f.; siehe dazu auch Kapitel 3.2).

51

indirekt erfasst werden.302 In der Praxis zählen häufig neben den bei reinen dekompositionellen ebenfalls die hybriden Methoden der Präferenzmessung zu den Conjoint-Analysen.303 Die oben beschriebenen, rein dekompositionellen Methoden könnte man dagegen auch als „klassische“ Conjoint-Analysen bezeichnen. Eine weitere dekompositionelle Vorgehensweise, bei der es sich gleichwohl nicht um eine Conjoint-Analyse im „klassischen“ Sinn handelt, präsentieren Hauser; Urban (1977, 601f.). Dabei werden dem Entscheidungsträger analog zur Full-Profile Methode der ConjointAnalyse Alternativenpaare zur Bewertung vorgelegt. Es wird jedoch lediglich eine Alternative vollständig beschrieben, während bei dem anderen Stimulus jeweils die Ausprägung eines Merkmals nicht spezifiziert ist. Die Aufgabe des Befragungsteilnehmers besteht darin, eine Ausprägung für diesen Stimulus zu bestimmen, so dass er insgesamt zwischen den beiden Alternativen indifferent ist. Die Paarvergleiche werden so lange wiederholt, bis eine Schätzung der Teilnutzen möglich ist.304 Pessemier; Burger; Teach; Tigert (1971, 372) nutzen ebenfalls eine paarweise Einschätzung von Alternativen. Dem Entscheidungsträger werden jeweils zwei Alternativen präsentiert; er muss nun einschätzen, wie stark der Preis der bevorzugten Alternative steigen müsste, damit für ihn die beiden Alternativen gleichwertig sind. Letztlich ähnelt diese Vorgehensweise sehr stark einer Variante der klassischen ConjointAnalyse auf Basis von Paarvergleichen und unter Verwendung einer intervall-skalierten Skala wie der Dollar-Metrik.305 Die Vorteile rein dekompositioneller Verfahren liegen darin, dass eine multiattributive Darstellungsform eher realen Kaufentscheidungen entspricht306 und zudem (in gewissen Grenzen) Interaktionseffekte307 berücksichtigt werden können. Aus Sicht des Entscheidungsträgers ist die Bewertung multiattributiver Alternativen jedoch zeitaufwendiger und weniger einfach als bei kompositionellen Verfahren. Der kognitive Aufwand ist folglich tendenziell höher.308 Dies gilt insbesondere bei einer steigenden Zahl an Eigenschaften und Ausprägungen.309 Hybride Verfahren

Hybride Verfahren der Präferenzmessung sollen dieses Problem mildern, so dass tendenziell mehr Eigenschaften und Ausprägungen untersucht werden können. Zu diesem Zweck wird in 302 303 304 305 306 307 308 309

52

Siehe dazu ebenso Green; Srinivasan (1978), 104; Green; Srinivasan (1990), 4; Balderjahn (1993), 91f. Bei hybriden Verfahren, die aus einem kompositionellen und dekompositionellen Teil bestehen, spricht man häufig von hybriden Conjoint-Analysen (siehe beispielsweise Baier; Säuberlich (1997), 951). Vgl. Hauser; Urban (1977), 601f. Vgl. Albrecht (2000), 70. Vgl. Akaah; Korgaonkar (1983), 188; Albrecht (2000), 28. Siehe dazu Kapitel 4.2.3.1. Vgl. Akaah; Korgaonkar (1983), 188. Vgl. Albrecht (2000), 28.

einem ersten Schritt zumeist eine kompositionelle Methode genutzt, die die Berücksichtigung einer Vielzahl von Produktmerkmalen gestattet. In einem zweiten Schritt kommt eine Variante der dekompositionellen Conjoint-Analyse zur Anwendung. Durch Nutzung beider Verfahrensarten sollen jeweils die Vorteile kompositioneller und dekompositioneller Methoden miteinander kombiniert werden. Aus der Sicht der Entscheidungsträger sollen somit einfache Bewertungsaufgaben, die eine relativ schnelle Beantwortung erlauben, ermöglicht werden. Ferner können durch die Nutzung dekompositioneller Methoden der Realitätsgrad der Einschätzungen erhöht und evtl. auftretende Interaktionen berücksichtigt werden.310 Bei den hybriden Verfahren zur Präferenzmessung differenziert man in erster Linie zwischen nicht adaptiven und adaptiven Methoden. Diese beiden Gruppen unterscheiden sich danach, wie und ob

die Ergebnisse der kompositionellen und dekompositionellen Phasen miteinander kombiniert und die Gesamtnutzen für hypothetische Alternativen berechnet werden. Bei nicht adaptiven Vorgehensweisen erfolgt keine Berücksichtigung der in der ersten, d.h. kompositionellen Phase gewonnenen Daten zur Konzeption des zweiten, dekompositionellen Verfahrensschrittes.311 Die Befragung kann computergestützt, aber auch schriftlich erfolgen.312 Darüber hinaus ist eine Unterscheidung zwischen traditionellen und neueren nicht adaptiven hybriden Verfahren der Präferenzmessung möglich. Bei traditionellen Verfahren werden zur Ermittlung des Gesamtnutzens einer Alternative die Ergebnisse des dekompositionellen Teils mit den auf Gruppenebene gewichteten313 Teilnutzen der Self-Explicated Methode kombiniert.314 Bei den „neueren“ Verfahren handelt es sich im Gegensatz dazu um eine individuelle Analyse der Präferenzen; es werden also individuelle Nutzenfunktionen ermittelt.315 Anders als bei den nicht adaptiven Verfahren baut das Erhebungsdesign der ConjointAnalyse bei den adaptiven hybriden Methoden auf den Ergebnissen der ersten Erhebungsphase, d.h. einer Self-Explicated Methode, auf. So können aus einer Vielzahl von potenziellen Eigenschaften mit Hilfe einer Self-Explicated Methode diejenigen ermittelt werden, die einen hohen Einfluss auf die Präferenz ausüben und im zweiten dekompositionellen Teil lediglich diese Merkmale berücksichtigt werden.316 Hoepfl; Huber (1970, 409ff.) schlagen erstmals eine, später als „Huber Hybride“ bezeichnete, nicht adaptive Vorgehensweise vor, bei der in der Self-Explicated Phase lediglich die 310 311 312 313 314 315 316

Vgl. Akaah; Korgaonkar (1983), 187; Green; Goldberg; Wiley (1983), 147; Green; Goldberg; Montemayor (1981), 33; Green; Krieger (1996), 852; Baier; Säuberlich (1997), 951f. Siehe dazu u.a. Hensel-Börner (2000), 50ff. Vgl. Baier; Säuberlich (1997), 955. Für eine Beschreibung der verschiedenen Möglichkeiten zur Gewichtung der Ergebnisse der Self-Explicated Methode siehe Green; Krieger (1996), 853f. Vgl. Green; Krieger (1996), 854. Vgl. Green; Krieger (1996), 854ff.; Baier; Säuberlich (1997), 954ff. Vgl. Hensel-Börner (2000), 50.

53

Merkmalsausprägungen direkt bewertet werden. Die Bedeutung der Attribute wird dabei in einem zweiten, dekompositionellen Schritt durch eine Regressionsanalyse geschätzt. Dabei dienen die Einschätzungen der Alternativen der dekompositionellen Phase als abhängige Variablen und die Bewertungen der einzelnen Ausprägungen als unabhängige Variablen.317 Ein weiteres nicht adaptives hybrides Verfahren zur Präferenzmessung wurde von Green; Goldberg; Montemayor (1981, 33) vorgeschlagen. In einer ersten Befragungsphase werden zunächst im Self-Explicated Teil eine Vielzahl von Ausprägungen (auf einer 10 Punkte RatingSkala) und Eigenschaften (auf einer 5 Punkte Rating-Skala bzw. mit Hilfe einer 100 Punkte Konstantsummenskala) von den Entscheidungsträgern direkt bewertet. Interaktionseffekte können durch die kompositionelle Art der Befragung nicht berücksichtigt werden. Innerhalb der zweiten, dekompositionellen Phase bewertet der Entscheidungsträger dagegen lediglich eine Teilmenge der zur Nutzenschätzung notwendigen Alternativen. Diese Stimuli werden aus einem „Masterdesign“ entnommen, das alle notwendigen Stimuli zur Schätzung von Teilnutzen auf Gruppenebene enthält und zudem die Bestimmung ausgewählter potenzieller Interaktionseffekte gestattet. Ziel ist es, möglichst viele Eigenschaften zu untersuchen und gleichzeitig auch spezielle Interaktionseffekte berücksichtigen zu können. Es werden somit Informationen auf individueller Ebene (Self-Explicated Phase) und auf (Sub-) Gruppenebene ermittelt.318 Die Präferenzen, die mit Hilfe einer Self-Explicated Methode erhoben wurden, können dabei für eine erste Segmentierung der Nutzer herangezogen werden. So können Entscheidungsträger mit einer ähnlichen Präferenzstruktur zu entsprechenden Gruppen zusammengefasst und die Ergebnisse der Conjoint-Phase segmentweise ausgewertet werden.319 Unterschiede zu anderen nicht adaptiven hybriden Verfahren ergeben sich insbesondere durch die Art der verwendeten Self-Explicated Methode und der jeweiligen Skalenart bzw. durch die jeweils genutzte Variante der Conjoint-Analyse. Green; Goldberg; Wiley (1983, 147) beschreiben beispielsweise eine an die Huber Hybriden Methoden angelehnte Vorgehensweise, bei der der Entscheidungsträger zunächst im Rahmen einer Self-Explicated Methode die Ausprägungen auf einer 4 Punkte Rating-Skala und danach die Eigenschaften mit Hilfe einer 100 Punkte Konstantsummenskala bewertet. In einem zweiten Schritt schätzen die Befragungsteilnehmer wiederum lediglich eine Teilmenge von Alternativen (oft nur 4 bis 9 Stimuli) im Rahmen einer Conjoint-Analyse ein. Bei Green; Goldberg; Wiley (1983, 148) werden so beispielsweise jeweils 8 Stimuli je Entscheidungsträger aus einem Gesamtset von 32 zur Schätzung der Teilnutzen notwendigen Alternativen auf einer 7 Punkte Rating-Skala bewertet.320 317 318 319 320

54

Vgl. Hoepfl; Huber (1970), 409ff.; Huber; Daneshgar; Ford (1971), 271. Vgl. Green; Goldberg; Montemayor (1981), 34f. Siehe auch Green; Krieger (1996), 852. Vgl. Baier; Säuberlich (1997), 952f.; Hensel-Börner (2000), 51f. Für eine ähnliche Vorgehensweise, bei der keine Interaktionseffekte berücksichtigt werden können, siehe Green; Krieger (1996), 853.

Der Gesamtnutzen einer Alternative ergibt sich aus den Schätzungen des dekompositionellen Teils und den gewichteten Ergebnissen der Self-Explicated Methode.321 Akaah; Korgaonkar (1983, 190) präsentieren eine hybride Methode, bei der zu der geschätzten Nutzenfunktion der Conjoint-Analyse (siehe Gleichung 1322) der gewichtete Gesamtnutzen der Self-Explicated Methode hinzuaddiert wird. Entsprechend können auch Nutzenfunktionen bei hybriden Ansätzen gebildet werden, die die Berücksichtigung einzelner Interaktionseffekte ermöglichen.323 Moore; Gray-Lee; Louviere (1998, 197ff.) schlagen schließlich eine nicht adaptive hybride Methode vor, bei der die kompositionellen Self-Explicated Bewertungen mit Wahlentscheidungen auf Basis einer Choice-Based Conjoint-Analyse verknüpft werden. Ein Merkmal aller bisher präsentierten nicht adaptiven Methoden zur Präferenzmessung ist somit, dass keine Nutzenfunktionen auf individueller Ebene erhoben werden können.324 Insbesondere die Kombination von individuellen Einschätzungen und Gruppenbewertungen führt jedoch im Vergleich zu einer rein dekompositionellen Vorgehensweise oft zu keiner Verbesserung der Ergebnisgüte.325 Green; Krieger (1996, 852ff.) schlagen vier „neuere“, nicht adaptive, hybride Präferenzmessmethoden vor. Auch bei diesen Verfahren werden die mit Hilfe einer Self-Explicated Methode erhobenen kompositionellen Bewertungen mit den Teilnutzen aus einem dekompositionellen Teil kombiniert. Allerdings werden hier keine individuellen Bewertungen mit Gruppenurteilen „vermischt“, es handelt sich vielmehr um Analysen auf individuellem Niveau, die trotzdem eine Berücksichtigung von Interaktionstermen ermöglichen.326 Die vier Varianten unterscheiden sich hauptsächlich darin, wie die durch die SelfExplicated Analyse gewonnenen Daten mit den Ergebnissen der dekompositionellen Conjoint-Analyse Phase kombiniert werden. Eine weitere nicht adaptive, hybride Methode zur Präferenzmessung auf Basis von individuellen Einschätzungen präsentieren Baier; Säuberlich (1997, 955ff.). Diese Vorgehensweise entspricht weitgehend der von Green; Krieger (1996, 855ff.), wobei mit Hilfe von zu schätzenden sog. „Transformationsparametern“ Probleme

321

Die Verknüpfung der Ergebnisse verschiedener Eigenschaften zu einem Gesamtnutzen erfolgt durch eine lineare Nutzenfunktion. Zwei weitere Huber Hybride Modelle ergeben sich, wenn statt einer linearen Nutzenfunktion eine multiplikative bzw. die logarithmierten Einschätzungen der Ausprägungen in einer multiplikativen Nutzenfunktion zur Berechnung der Gesamtnutzen einer Alternative genutzt werden (vgl. Akaah; Korgaonkar (1983), 190). 322 Siehe Kapitel 2.7. 323 324

Siehe dazu Akaah; Korgaonkar (1983), 190f. Siehe auch Hensel-Börner (2000), 52.

325

Vgl. Green; Krieger (1996), 854. Zur Kritik an nicht adaptiven hybriden Verfahren, bei denen die Nutzenfunktion auf Gruppenebene bestimmt wird, siehe auch Perrey (1998, 80f.), der ein solches Vorgehen insgesamt als äußerst problembehaftet bewertet. 326 Siehe zu möglichen Problemen bei der Vermischung von individuellen und gruppenbasierten Urteilen ebenso Baier; Säuberlich (1997), 954.

55

durch die Nutzung verschiedener Skalenarten im kompositionellen und dekompositionellen Befragungsteil vermieden werden sollen. Hybride Methoden zur Präferenzmessung gestatten demnach, dass im Gegensatz zu klassischen Verfahren der Conjoint-Analyse tendenziell mehr Eigenschaften berücksichtigt werden können - der Aufwand zur Datenerhebung steigt dabei jedoch. Eine Möglichkeit, diese Problematik zu umgehen, besteht darin, lediglich die individuell wichtigsten Merkmale im Rahmen einer Conjoint-Analyse zu untersuchen.327 Dies ermöglichen hybride, adaptive Verfahren; dabei bewerten die Entscheidungsträger in einem ersten Schritt zunächst die Bedeutung einer Vielzahl vorgegebener Merkmale und in einer zweiten Phase werden nur die individuell wichtigsten Eigenschaften mit Hilfe einer Variante der Conjoint-Analyse weiter untersucht.328 Die hybriden, adaptiven Methoden können in zwei Gruppen eingeteilt werden: 1. lediglich die Informationen aus dem dekompositionellen Teil werden zur Nutzenschätzung herangezogen329 oder 2. die Daten aus der ersten und zweiten Erhebungsphase werden zur Berechnung der Teilnutzen miteinander kombiniert.330 Die erste individualisierte Präferenzmessmethode präsentiert Schweikl (1985, 111ff.).331 Hier wird die Bedeutung der Merkmale in einem ersten Schritt mit Hilfe einer Variante der Informations-Display Boards332 bestimmt und danach eine für alle Entscheidungsträger identische Anzahl an Merkmalen und Ausprägungen (z.B. 4 Eigenschaften mit jeweils 3 Ausprägungen) untersucht.333 Auf Basis der Ergebnisse der ersten Phase werden im zweiten Schritt der Datenerhebung computergestützt die zu untersuchenden Alternativen bestimmt, wobei ein orthogonales Erhebungsdesign334 die Schätzung der Teilnutzen ermöglicht. Die Stimuli werden anhand der Full-Profile Darstellung und auf Basis von abgestuften Paarvergleichen bewertet und die Teilnutzen mit Hilfe einer OLS Regression geschätzt.335

327

Vgl. Böcker; Schweikl (1988), 15.

328

Diese Vorgehensweise stellt, sofern die Eigenschaften und Ausprägungen nicht durch Kundenbefragungen bestimmt wurden, jedoch nicht sicher, dass tatsächlich die individuell wichtigsten Merkmale in der zweiten Phase untersucht werden. Bestimmt der Marktforscher beispielsweise das der Bewertung zugrunde liegende Eigenschaftsset selbst, so garantiert dies nicht, dass die individuell relevanten Merkmale bzw. Ausprägungen überhaupt in die Untersuchung aufgenommen werden (siehe dazu auch Kapitel 5.1). 329 Ein Beispiel dafür sind die von Böcker; Schweikl (1988, 18ff.) vorgeschlagene Vorgehensweise bzw. auch eine Variante der ACA/HB (vgl. Sawtooth Software (2003), 13), die im Folgenden genauer beschrieben werden. 330 Bekanntestes Beispiel für eine solche Vorgehensweise sind ältere Varianten der ACA (siehe beispielsweise Johnson (1987), 258ff.). 331 Neben Schweikl (1985, 111ff.) nutzen auch Böcker; Schweikl (1988, 18ff.) diese Methode. 332 333 334 335

56

Siehe Kapitel 5.3.1.2. Vgl. Schweikl (1985), 112ff.; Böcker; Schweikl (1988), 18ff. Vgl. Schweikl (1985), 115. Siehe auch Kapitel 3.4. Vgl. Schweikl (1985), 117ff.

Srinivasan; Park (1997, 287f.) schlagen eine weitere hybride, adaptive, jedoch nichtcomputergestützte „Customized Conjoint-Analysis“ (CCA) vor. Dabei können in einer ersten Stufe zunächst sämtliche völlig unakzeptable Eigenschaftsausprägungen eliminiert werden. Im zweiten Teil werden analog zur bereits beschriebenen Conjunctive Compensatory SelfExplicated Methode336 die Eigenschaftsausprägungen und anschließend die Merkmale bewertet. Auf Basis dieser Daten erfolgt die Berechnung der Bedeutungsgewichte sowie der Teilnutzen der Eigenschaftsausprägungen. Lediglich die sechs individuell wichtigsten Merkmale werden in der dekompositionellen Phase weiter untersucht.337 Nach der Befragung werden die Nutzenschätzungen der Self-Explicated und die der Conjoint-Analyse Phase standardisiert, die Summe der Teilnutzen einer Eigenschaft ergibt nun den Wert „0“. Die Teilnutzen der Conjoint-Analyse Phase werden so skaliert, dass die Summe der Bedeutungsgewichte der Summe der Self-Explicated Bedeutungsgewichte entspricht. Die Ergebnisse beider Erhebungsphasen werden in einem letzten Schritt mit Hilfe von Gewichtungsfaktoren miteinander kombiniert; Ziel ist es dabei, die Bewertungen der Referenzmethode möglichst gut vorhersagen zu können.338 Eine weit verbreitete adaptive, individualisierte, computergestützte hybride Methode der Präferenzmessung ist die Adaptive Conjoint-Analyse (ACA), deren erste Variante von Johnson (1987, 258ff.) vorgestellt wurde.339 Wie die bisher präsentierten hybriden Verfahren, besteht die ACA ebenfalls aus einem Self-Explicated und einem Conjoint-Analyse Teil.340 Bei dieser frühen Version der ACA können zunächst die Ausprägungen aller Merkmale nacheinander, d.h. isoliert präsentiert und völlig unakzeptable Ausprägungen eliminiert werden. Danach werden die Entscheidungsträger gebeten, die Ausprägungen der Eigenschaften entsprechend ihrer Präferenz in eine Rangfolge zu bringen. Bei den quantitativen Eigenschaften, für die a priori eine Rangfolge der Vorziehenswürdigkeit bekannt ist, kann dieser Schritt übersprungen werden.341 Die Rangfolge der Ausprägungen dient in der nächsten Phase als Grundlage zur

336

Vgl. Srinivasan (1988), 295ff.

337

Dabei wird je Merkmal lediglich ein Teil der Ausprägungen (Srinivasan; Park (1997, 287) empfehlen drei Ausprägungen) weiter untersucht. Diese werden vom Marktforscher selektiert und so bestimmt, dass jede Eigenschaft durch die gleiche Anzahl an Ausprägungen beschrieben wird. Um die Bedeutung der Merkmale nicht zu verändern, sollten jedoch jeweils die am wenigsten und die am meisten bevorzugten Ausprägungen in die Conjoint-Analyse aufgenommen werden (vgl. Srinivasan; Park (1997), 287). 338 Vgl. Srinivasan; Park (1997), 287f. 339

In ersten praktischen Anwendungen wurde die ACA schon seit 1985 eingesetzt (vgl. Orme (2003), 1; McLauchlan (1991), 1). 340 Vgl. Johnson (1987), 258. 341

Vgl. Johnson (1987), 258ff.; Sawtooth Software (2002), 6; Hensel-Börner (2000), 96. Für den folgenden dekompositionellen Teil kann der Marktforscher festlegen, dass nur ein Teil der hier präsentierten Ausprägungen weiter untersucht wird. Die ACA erlaubt in einem ersten Schritt die Berücksichtigung von bis zu 9 Ausprägungen. Im Conjoint-Teil können maximal 5 Merkmalsausprägungen berücksichtigt werden. Bei der Selektion der weiter zu untersuchenden Ausprägungen können beispielsweise die 5 vom jeweiligen Entscheidungsträger am meisten bevorzugten oder die 5 am wahrscheinlichsten auftretenden Eigenschaftsausprägungen ausgewählt werden (vgl. Hensel-Börner (2000), 96).

57

Bestimmung der Bedeutung der Merkmale. Die Einschätzung der Wichtigkeit eines Merkmals342 erfolgt auf der Basis des wahrgenommenen Nutzenunterschieds zwischen der am wenigsten und der am meisten bevorzugten Eigenschaftsausprägung eines Merkmals.343 Anhand der Bewertungen des Befragungsteilnehmers können auf individueller Ebene erste Teilnutzen und auch Bedeutungsgewichte der Attribute bestimmt werden. Lediglich die wichtigsten Eigenschaften344 werden in einem folgenden dekompositionellen Befragungsteil weiter berücksichtigt. Dabei werden den Entscheidungsträgern jeweils Alternativenpaare präsentiert, deren Vorziehenswürdigkeit auf einer 9 Punkte Rating-Skala eingeschätzt wird, d.h. die Befragungsteilnehmer entscheiden zunächst, welche der beiden Alternativen sie bevorzugen und geben die Stärke der Vorziehenswürdigkeit eines Stimulus auf der Rating-Skala an.345 Die Stimuli der Paarvergleiche werden auf Basis aller bisherigen Einschätzungen nach jeder Bewertung so konstruiert, dass die Alternativenpaare einen möglichst geringen Nutzenunter-

342

Die Bewertung der Eigenschaften erfolgt hier nicht wie beispielsweise bei der gewichteten Self-Explicated Analyse in Relation zueinander, sondern sequentiell, d.h. jede Eigenschaft wird separat bewertet (vgl. Reiners (1996), 118). Dies hat zur Folge, dass kein Trade-off zwischen den Eigenschaften stattfindet und u.U. keine ausreichende Unterscheidung der Wichtigkeitseinstufungen der Merkmale erfolgt (vgl. King; Hill; Orme (2005), 4f.; für weitere Probleme, die durch die sequentielle Präsentation hervorgerufen werden könnten, siehe Reiners (1996), 119 und King; Hill; Orme (2005), 4f.). King; Hill; Orme (2005, 11f.) schlagen entsprechend vor, die Wichtigkeitseinstufung der Eigenschaften auszulassen und stattdessen mehr Paarvergleiche durchzuführen. Die Bedeutungsgewichte könnten alle gleich gesetzt oder auf Basis früherer Untersuchungen festgelegt werden. Gegen eine solche Vorgehensweise spricht jedoch, dass (wie bereits von Johnson (1987, 258ff.) beschrieben) die Bedeutungsgewichte von Eigenschaften immer von den jeweils untersuchten Ausprägungen abhängen (siehe dazu auch Kapitel 2.2). Weiterhin könnte dann keine individualisierte Analyse der Präferenzen durchgeführt werden, d.h. alle Entscheidungsträger würden im dekompositionellen Teil identische Merkmale einschätzen. Dies hätte zudem zur Folge, dass auf den Vorteil der ACA, nämlich eine große Anzahl von Eigenschaften untersuchen zu können, verzichtet würde (letztendlich handelt es sich dann „nur“ noch um eine Conjoint-Analyse mit partiellen Profilen). 343 Hierfür werden, wie bereits beschrieben, jeweils maximal 5 Ausprägungen aus dem vorangegangenen Schritt genutzt (vgl. Hensel-Börner (2000), 97). 344 Die Anzahl der weiter zu untersuchenden Merkmale wird a priori vom Marktforscher festgelegt (vgl. Johnson (1987), 261f.). Der Marktforscher muss vor der Befragung bestimmen, durch wie viele Eigenschaften die Stimuli beschrieben werden. Mit Hilfe der ACA können auch partielle Profile (d.h. Teilmengen der zu untersuchenden Eigenschaften) untersucht werden (vgl. Johnson (1987), 261; Orme (2003), 1f.). Johnson (1987, 261) empfiehlt, dass eine Alternative aus 2 bis maximal 5 Eigenschaften bestehen kann, jedoch möglichst nur 3 Merkmale je Alternative genutzt werden sollten. Er geht dabei davon aus, dass „it seems pointless to go beyond 3 attributes, since the increased complexity of the task seems to outweigh the value of the richer concepts” (Johnson (1987), 261, siehe analog Green; Krieger; Agarwal (1991), 216). 345 Für ein Beispiel eines solchen Paarvergleichs siehe Abbildung 10 in Kapitel 3.4.

58

schied aufweisen.346 Der dekompositionelle Teil der Befragung endet, wenn die vom Marktforscher a priori vorgegebene Zahl an Paarvergleichen oder ein Abbruchkriterium erreicht wurde.347 Für die im Conjoint-Analyse Teil nicht berücksichtigten Merkmale und Ausprägungen können durch die im Self-Explicated Teil erhobenen Informationen Teilnutzen geschätzt werden, bei denen davon ausgegangen wird, dass sie nicht so präzise wie die im dekompositionellen Teil ermittelten Teilnutzen sind. In der letzten Kalibrierungsphase werden von der ACA Software auf individueller Ebene möglichst gegensätzliche Alternativen gebildet, d.h. von „very undesirable“ bis zu „very desirable“ Stimuli.348 Diese werden von den Entscheidungsträgern anhand von Kaufwahrscheinlichkeitsurteilen eingeschätzt. Die ermittelten Daten dienen im letzten Schritt dazu, die Teilnutzenwerte so zu skalieren, dass sie nicht nur Präferenzen, sondern ebenfalls das Ausmaß an Interesse für hypothetische Alternativen widerspiegeln.349 Der Hauptvorteil der ACA besteht vor allem in der leichten Anwendung, d.h. der Marktforscher muss nicht selbst ein Erhebungsdesign erstellen, die Schätzergebnisse liegen sofort nach Beendigung der Befragung vor und auch Marktsimulationen lassen sich sehr einfach mit Hilfe der Software durchführen.350 Aufgrund der leichten Anwendbarkeit der Methode entwickelte sich die ACA zu der am häufigsten eingesetzten Conjoint-Analyse Software der 1990er Jahre.351 Wie bei anderen hybriden Verfahren können mit Hilfe der ACA tendenziell mehr Ei-

346

Es handelt sich somit um ein nutzenbalanciertes Erhebungsdesign. Als Grundlage zur Bildung der ersten Paarvergleiche dienen die Ergebnisse der Self-Explicated Methode; nach jedem Paarvergleich werden die Nutzen auf Basis einer OLS Regression neu geschätzt und individuelle Paarvergleiche gebildet. Je mehr Fragen im dekompositionellen Teil der ACA gestellt werden, umso geringer wird der Einfluss der Schätzungen aus der Self-Explicated Methode auf die Ergebnisse der Präferenzmessung. Die Alternativenpaare werden so konstruiert, dass sie möglichst ähnlich bezüglich ihrer Nutzen sind und keine dominanten Alternativen in einem Paarvergleich auftreten (vgl. Green; Krieger; Agarwal (1991), 216ff.). Vorteil einer solchen Vorgehensweise ist möglicherweise, dass dies die Güte der Prognosevalidität erhöhen könnte (vgl. Huber; Hansen (1987), 162f.; Huber (1987), 9). Sie kann jedoch zu verzerrten Schätzergebnissen führen, da die Befragungsteilnehmer auch bei Alternativen, die sich bezüglich ihrer Nutzen relativ ähnlich sind, oft die zur Verfügung stehende Skala vollständig ausnutzen (vgl. Green; Krieger; Agarwal (1991), 216ff.; Baier; Säuberlich (1997), 954; Teichert (2000b), 150, 154). Schließlich führen nutzenbalancierte Paarvergleiche dazu, dass die Bewertung für den Entscheidungsträger tendenziell schwieriger ist und deshalb aufgrund kognitiver Überlastung verstärkt mit der Anwendung von Entscheidungsheuristiken zu rechnen ist (vgl. Orme; Alpert; Christensen (1997a), 209). Im dekompositionellen Befragungsteil können deshalb tendenziell weniger Eigenschaften als bei einer klassischen Conjoint-Analyse simultan untersucht werden. Beim Erhebungsdesign der dekompositionellen Phase wird zudem versucht, die Ausprägungen gleich häufig abzufragen und ein möglichst orthogonales Design zu erreichen (vgl. Sawtooth Software (2002), 22; HenselBörner (2000), 99). 347 Vgl. Sawtooth Software (2002), 9. 348

Vgl. Johnson (1987), 261; Sawtooth Software (2002), 4ff. Dabei werden 2 bis 9 Alternativen mit jeweils bis zu 8 Eigenschaften bestimmt (vgl. Green; Krieger; Agarwal (1991), 216; Reiners (1996), 120); es werden also u.U. nicht alle untersuchten Eigenschaften in der Referenzmethode berücksichtigt, so dass die Prognosevalidität lediglich für eine Teilmenge der Merkmale berechnet wird. Aussagen zur Prognosevalidität der gesamten Erhebung sind in diesen Fällen nicht möglich. Auch die Art der Konstruktion der Alternativen in der Referenzmethode führt, im Vergleich zu anderen Verfahren, zu einer tendenziell höheren Prognosevalidität, während bei Alternativen, die bezüglich ihrer Nutzen relativ ähnlich sind, mit einer geringeren Prognosevalidität gerechnet werden muss (vgl. Melles (2001), 95). Siehe dazu auch Kapitel 3.10.1.3. 349 Vgl. Johnson (1987), 258ff.; Green; Krieger; Agarwal (1991), 216; Johnson (1991), 223f.; Baier; Säuberlich (1997), 953. 350 351

Vgl. Johnson (1987), 262; Huber; Wittink; Fiedler; Miller (1991), 1. Vgl. Orme (2003), 1; Perrey (1998), 81; Reiners (1996), 115; Green; Krieger (1996), 852, 854.

59

genschaften als mit klassischen Varianten der Conjoint-Analyse berücksichtigt werden.352 Im Laufe der Jahre wurde das Verfahren immer wieder angepasst.353 Die Varianten der ACA unterscheiden sich bezüglich der Art und Weise, wie die Daten erhoben (dies betrifft insbesondere die Art der verwendeten Skalen), die Paarvergleiche gebildet und wie die Ergebnisse der Self-Explicated-, Conjoint- sowie Kalibrierungsphase miteinander kombiniert werden. Entsprechend weisen die verschiedenen Varianten sehr unterschiedliche Vor- und Nachteile auf. Bis zur Version 3.0 der ACA wurden, wie bereits beschrieben, beispielsweise die Ausprägungen im Self-Explicated Teil lediglich auf ordinalem Skalenniveau bewertet, während die Bedeutung der Eigenschaften auf einer 4-stufigen Rating-Skala und die Paarvergleiche des dekompositionellen Befragungsteils auf einer 9-stufigen Rating-Skala eingeschätzt werden.354 Obwohl lediglich eine Rangfolge der Vorziehenswürdigkeit der Ausprägungen im SelfExplicated Teil erhoben wurde, wird bei der weiteren Schätzung der Teilnutzen davon ausgegangen, dass wahrgenommene Abstände zwischen den Ausprägungen immer gleich groß sind. Diese Rangdaten werden bei der ACA in Werte im Intervall von 0 bis 1 umkodiert.355 Bei der Einschätzung der Bedeutungsgewichte der Eigenschaften wird auf eine 4-stufige Rating-Skala zurückgegriffen; eine solche Skala lässt insbesondere bei einer hohen Anzahl an untersuchten Merkmalen eine nur sehr ungenaue Bewertung zu.356 Die Paarvergleiche werden dagegen auf einer 9-stufigen Rating-Skala bewertet. Dies ermöglicht eine differenziertere Einschätzung. Allerdings basieren diese, wie bereits beschrieben, auf einem nutzenbalancierten Design,357 was zwar u.U. die Effizienz der Datenerhebung erhöhen könnte,358 jedoch aus Sicht der Entscheidungsträger die Einschätzung der Alternativenpaare tendenziell erschwert. 352

Vgl. Orme (2003), 1; Lans; Heiser (1992), 326; Agarwal (1988), 56. Johnson (1987, 262) geht davon aus, dass höchstens 30 Merkmale, die durch jeweils maximal 9 Ausprägungen beschrieben werden, mit der ACA untersucht werden können. Dies ist die theoretisch mögliche Obergrenze. Reiners (1996, 115) und Perrey (1998, 83) vermuten stattdessen, dass eine solche Anzahl an Eigenschaften und Ausprägungen praktisch nicht sinnvoll mit der ACA untersucht werden kann. 353 Vgl. Johnson (2001), 6. 354

Vgl. McLauchlan (1991), 2; Johnson (1987), 259; Green; Krieger; Agarwal (1991), 216; Green; Krieger; Agarwal (1993), 372; Johnson (1991), 223. Diese 4-stufige Rating-Skalenwerte der Bedeutungsgewichte für die Eigenschaften werden in Zahlenwerte von –2 bis +2 umkodiert (vgl. Orme (1998), 1), was letztendlich einer 5-stufigen Rating-Skala entspricht, bei der der Wert “0“ fehlt. Diese Art der Transformation der Zahlenwerte führt zu einer impliziten Gewichtung der Einschätzungen; während die Abstände zwischen den Skalenpunkten 1 und 2 bzw. zwischen 3 und 4 unverändert bleiben, ist der Abstand der Skalenpunkte zwischen den ursprünglichen Werten 2 und 3 nach der Transformation doppelt so groß, d.h. der Abstand beträgt 2 Einheiten. In Version 4 der ACA werden, falls die Ausprägungen mittels Rangbildung bewertet werden, die Rangzahlen (z.B. 1, 2, 3) zunächst so „umgedreht“, dass die am meisten bevorzugte Ausprägung den höchsten Wert aufweist (z.B. 3, 2, 1) und anschließend umkodiert, damit der Mittelwert der Daten „0“ ergibt (z.B. 0,5, 0, -0,5). Siehe dazu auch Reiners (1996, 116). Einschränkend ist anzumerken, dass eine solche Transformation ordinaler Daten in ein metrisches Skalenniveau nicht zulässig ist (vgl. Backhaus; Erichson; Plinke; Weiber (2003), 6). Die ACA Version 4 ermöglicht auch die Nutzung von Rating-Skalen. Ab Version 5 der ACA wird ausdrücklich empfohlen, mindestens eine 7-stufige Rating-Skala zu verwenden (vgl. Sawtooth Software (2002), 7). 355 Vgl. Green; Krieger; Agarwal (1991), 220. Dies bedeutet wiederum, dass aus ordinal skalierten Daten metrisch skalierte Werte erzeugt werden, was aber nicht zulässig ist (vgl. Backhaus; Erichson; Plinke; Weiber (2003), 6). 356 Green; Krieger; Agarwal (1991, 220f.) plädieren deshalb dafür, im kompositionellen Befragungsteil eine feiner abgestufte Skala zu verwenden. 357 Vgl. Green; Krieger; Agarwal (1991), 220. 358

60

Vgl. Johnson (1987), 262.

Für die direkte Einschätzung der Ausprägungen und Eigenschaften wird somit eine sehr grobe Skaleneinteilung genutzt. Bei der Bewertung der Alternativenpaare, deren Nutzenunterschiede möglichst minimal sind, wird demgegenüber eine feiner abgestufte Skala mit 9 Punkten verwendet. Diese sehr unterschiedlichen Skalenarten führen möglicherweise zu verzerrten Einschätzungen, da die Entscheidungsträger oftmals im dekompositionellen Befragungsteil die gesamte zur Verfügung stehende Bandbreite der Skala nutzen.359 Die Nutzung unterschiedlicher Skalenarten führt aber auch dann zu Problemen, wenn die Ergebnisse der SelfExplicated Methode mit denen der Conjoint-Analyse kombiniert werden sollen. Aufgrund der fehlenden Vergleichbarkeit der verwendeten Skalen erscheint dies unmöglich.360 Die Nutzung partieller Profile, d.h. die Alternativen werden im dekompositionellen Teil jeweils lediglich durch 2-3 Eigenschaften beschrieben, führt weiterhin zu unrealistischen Einschätzungen.361 Auf der Basis dieser Kritikpunkte von Green; Krieger; Agarwal (1991, 220f.) wurden einzelne Elemente der ACA angepasst und u.a. die Verwendung verschiedener Skalenarten im Rahmen der Self-Explicated Phase in der ACA Version 4 ermöglicht.362 So können nun die Eigenschaften und Ausprägungen im kompositionellen Befragungsteil auf einer 9-stufigen Rating-Skala eingeschätzt werden.363 Auch die Art, wie die Ergebnisse der Self-Explicated Methode mit denen der Conjoint-Analyse kombiniert werden, wurde angepasst. Die Nutzen werden jetzt getrennt berechnet. Die Stimuli des Kalibrierungssets dienen in Version 4 zur Gewichtung der Ergebnisse beider Phasen, so dass diese die Einschätzungen der Alternativen im Kalibrierungsset so gut wie möglich abbilden.364 Die aktuelle Version 5 der ACA unterscheidet sich zu den Vorgängerversionen insbesondere in der Art und Weise, wie die Self-Explicated und Conjoint-Analyse Ergebnisse miteinander verknüpft werden. Der Gewichtungsfaktor, mit dessen Hilfe die beiden Schätzergebnisse verknüpft werden, hängt von der Anzahl der im dekompositionellen Teil untersuchten Merkmalsausprägungen und der Anzahl der Paarvergleiche ab.365 Die optionale Kalibrierungsphase dient dabei als Interpretationshilfe, so dass (analog zur Version 3) die geschätzten Teilnutzen

359

Vgl. Green; Krieger; Agarwal (1991), 219ff. Green; Krieger; Agarwal (1991, 220) fordern deshalb, eher zufällige bzw. orthogonale statt nutzenbalancierte Erhebungsdesigns zu verwenden. 360 Vgl. Green; Krieger; Agarwal (1991), 220; Baier; Säuberlich (1997), 954. 361 362

Vgl. Green; Krieger; Agarwal (1991), 220. Vgl. Orme (1998), 2; Orme (2002b), 3.

363

Eigenschaften können auf einer 2- bis 9-stufigen Rating-Skala eingeschätzt werden. Es besteht jedoch weiterhin die Möglichkeit, die Ausprägungen auf einer ordinalen Skala zu bewerten (vgl. Sawtooth Software (2002), 6ff.). Vgl. Orme (1998), 2f.; Sawtooth Software (2003), 26f.; Sawtooth Software (2002), 11. Für eine ausführliche Beschreibung der Vorgehensweise in der Kalibrierungsphase siehe auch Reiners (1996), 120ff. oder Hensel-Börner (2000), 100ff. 365 Für eine genaue Beschreibung der Bestimmung dieses Gewichtungsfaktors siehe Sawtooth Software (2002, 20f.). 364

61

einfacher mit Kaufwahrscheinlichkeiten verbunden werden können.366 In Version 5 werden somit Elemente der Versionen 3 und 4 kombiniert, d.h. die Nutzen werden in beiden Phasen separat geschätzt und entsprechend ihres „Erklärungsgehalts“ gewichtet.367 Eine weitere Variante der ACA ergibt sich durch das Zusatzmoduls Hierarchical Bayes (ACA/HB).368 Im Gegensatz zu den bisher beschriebenen Varianten der ACA beruht die Nutzenschätzung bei diesem Verfahren nicht auf einer OLS Regression, sondern auf einer Variante des Hierarchical Bayes Ansatzes. Die Ermittlung der Teilnutzen erfolgt in einer iterativen Vorgehensweise nach Beendigung der gesamten ACA Befragung aller Entscheidungsträger.369 Nun ist es möglich, lediglich die Paarvergleichsdaten (dies ist die Voreinstellung in der Software) zur Nutzenschätzung heranzuziehen.370 Zudem können die Teilnutzen der dekompositionellen Phase so an die Self-Explicated Ergebnisse angepasst werden, dass die Reihenfolge der Vorziehenswürdigkeit der kompositionellen Phase auch in den Teilnutzen der Conjoint-Analyse erhalten bleibt.371 Mögliche Vorteile ergeben sich bei für die Entscheidungsträger neuen Eigenschaften, zu denen bei Beginn der Befragung u.U. noch keine ausgeprägten Präferenzen existieren. Der erste kompositionelle Teil der Befragung dient in diesem Fall somit eher dazu, die Befragungsteilnehmer mit den Eigenschaften und Ausprägungen vertraut zu machen.372 Zur Nutzenschätzung werden demgegenüber lediglich die Ergebnisse des zweiten, dekompositionellen Befragungsteils herangezogen, was zu einer höheren Prognosegüte führen kann.373 Die ACA tendiert, möglicherweise durch die Anwendung nutzenbalancierter Paarvergleiche, jedoch dazu, die Unterschiede zwischen den „wahren“ Teilnutzen zu verringern.374 Eine weitere ACA Variante, die diesen Effekt verringern soll, ergibt sich, wenn zusätzlich zu den geschätzten Teilnutzen aus der ACA weitere Alternativen bewertet und die Schätzergebnisse entsprechend dieser zusätzlichen Einschätzungen gewichtet werden.375

366

Vgl. Sawtooth Software (2002), 10, 21.

367

Vgl. Sawtooth Software (2002), 11. Zudem können die Alternativen im Kalibrierungsset nun neben den in vorangegangenen Varianten der ACA üblichen numerischen Eingaben von Zahlenwerten für die Kaufwahrscheinlichkeiten auch mit Hilfe eines Schiebereglers bewertet werden (vgl. Sawtooth Software (2002), 10). 368 Vgl. Sawtooth Software (2002), 21. 369

Für eine Beschreibung der Schritte zur Schätzung der Teilnutzen siehe Sawtooth Software (2003), 4ff.

370

Ähnlich wie bei Schweikl (1985, 111ff.) erfolgt die Nutzenschätzung bei der ACA somit erstmals allein auf Basis der im dekompositionellen Befragungsteil erhobenen Daten. Probleme durch Inkompatibilität und Nicht-Vergleichbarkeit der Skalen zwischen den kompositionellen und dekompositionellen Bewertungen werden so vermieden. Analog zur ACA Version 5 können die Nutzen der kompositionellen und dekompositionellen Phase aber auf Wunsch des Marktforschers weiterhin miteinander kombiniert werden (vgl. Sawtooth Software (2003), 13). 371 Vgl. Sawtooth Software (2003), 13. 372 373 374 375

62

Vgl. Orme (2002b), 4. Siehe dazu auch Kapitel 6.2.3. Vgl. Orme (2002b), 4f. Vgl. Green; Krieger (1996), 855. Orme (2002b, 3) bezeichnet diese Vorgehensweise als “Duale Conjoint”, ohne die Methode genauer zu beschreiben.

Aufgrund der unterschiedlichen Skalenarten, der verwendeten Schätzverfahren bzw. der unterschiedlichen Vorgehensweisen bei der Kombination der Schätzergebnisse der SelfExplicated und Conjoint-Analyse Phase kann daher nicht von „der“ ACA gesprochen werden. Jede Variante hat vielmehr spezifische Vor- und Nachteile, die bei der Einschätzung der Methoden berücksichtigt werden müssen.376 Hensel-Börner (2000, 54f., 68ff., 81ff.) präsentiert zwei weitere hybride, computergestützte, adaptive Verfahren: die Customized Computerized Conjoint Analysis (CCC) und die ChoiceOriented Individualized Conjoint Analysis (CHIC). Die CCC wurde in Anlehnung an die von Srinivasan; Park (1997, 287f.) vorgeschlagene CCA entwickelt, bei der die Alternativen in der dekompositionellen Phase simultan bewertet werden.377 Die von Hensel-Börner (2000, 69ff.) präsentierte CCC ermöglicht jedoch eine vollständig computergestützte Erhebung und Schätzung der Präferenzwerte, so dass der dekompositionelle Befragungsteil sofort nach Beendigung der kompositionellen Erhebungsphase angeschlossen werden kann. Bei der CCA ergaben sich zwischen beiden Phasen Zeiträume von zwei Wochen,378 in denen sich möglicherweise die Präferenzen verändert haben.379 Analog zu Srinivasan; Park (1997, 287f.) werden nach der Datenerhebung die Ergebnisse der Self-Explicated und die der Conjoint-Analyse Phase miteinander kombiniert. Eigenschaften, die in der dekompositionellen Phase nicht betrachtet wurden, werden allerdings weniger stark gewichtet.380 Bei der CHIC handelt es sich ebenfalls um eine hybride, adaptive, computergestützte Vorgehensweise zur Erfassung von Präferenzen, bei der die Entscheidungsträger jeweils Teilmengen der zu bewertenden Alternativen mit Hilfe von Auswahlentscheidungen einschätzen. Wie bei den meisten bisher beschriebenen hybriden Verfahren werden dazu in einem ersten Schritt die individuell wichtigsten Merkmale aus einem vorgegebenen Set von Eigenschaften mit Hilfe einer gewichteten Self-Explicated Methode bestimmt. In der dekompositionellen Phase werden dann diese Eigenschaften weiter untersucht. Dabei bewerten die Befragungsteilneh376

Mit allen Varianten der ACA ist ein tendenziell höherer Erhebungsaufwand verbunden. Überdies ist durch die zwei Phasen der Bewertung die Einschätzung der Alternativen weniger realitätsnah als bei „klassischen“ Verfahren der ConjointAnalyse. Teilweise wird deshalb davon ausgegangen, dass die Varianten der ACA reale Entscheidungsprozesse schlechter als die klassischen Varianten abbilden können (vgl. Perrey (1998), 83f.; Mengen (1993), 84). Folglich kann selbst die Anwendung einfacher Varianten der Self-Explicated Methode zu einem „besseren“ Ergebnis führen (vgl. Agarwal; Green (1991), 145; Akaah; Korgaonkar (1983), 196). Ebenfalls führen traditionelle Varianten der ConjointAnalyse im Vergleich zur ACA nicht zu einer verschlechterten Schätzung der Präferenzen (vgl. Akaah; Korgaonkar (1983), 196). Auch gegenüber den anderen hybriden Varianten der Conjoint-Analyse scheint die ACA keine Vorteile zu besitzen (vgl. Akaah; Korgaonkar (1983), 196; Perrey (1998), 83). Eine abschließende Bewertung der Vorteilhaftigkeit der ACA scheint jedoch nicht möglich (siehe dazu auch Kapitel 3.1.3). So sieht Sattler (1994, 39) die ACA im Vergleich zu klassischen Varianten der Conjoint-Analyse als überlegene Vorgehensweise. Im Vergleich zur CBC scheint die ACA zudem besser zur Prognose von Wahlentscheidungen geeignet zu sein (vgl. Huber; Wittink; Johnson (1992), 8). 377 Vgl. Hensel-Börner (2000), 69. 378 379 380

Vgl. Srinivasan; Park (1997), 288. Vgl. Hensel-Börner (2000), 72. Vgl. Hensel-Börner (2000), 79.

63

mer Teilmengen von Stimuli, die mittels einer Zufallsauswahl aus dem vollständigen Design bestimmt werden. Den Entscheidungsträgern werden drei bis vier „Choice“-Sets, die durch vier Stimuli und eine Nicht-Kauf-Alternative beschrieben werden, vorgelegt. Die Aufgabe der Befragungsteilnehmer besteht darin, ein präferiertes Produkt bzw. die Nicht-Kauf-Alternative auszuwählen. Im Gegensatz zu sonst üblichen wahlbasierten Methoden der Präferenzmessung wird der Entscheidungsträger bei der CHIC nach Auswahl der präferierten Alternative gebeten, die Auswahlentscheidung innerhalb des Choice-Sets zu wiederholen. Auf diese Weise wird letztendlich lediglich eine Rangfolge der Vorziehenswürdigkeit für die Alternativen im Choice-Set aufgestellt. Im Anschluss werden den Alternativen Punktwerte zugewiesen; der präferierte Stimulus erhält dabei „100“ und das am wenigsten präferierte Produkt „0“ Punkte. Um die Einschätzungen der Alternativen zwischen den vom Entscheidungsträger bewerteten Choice-Sets vergleichbar zu machen, werden Alternativenpaare, die aus je einem Stimulus eines Choice-Sets bestehen, gebildet und der Präferenzunterschied auf einer Dollar-Metrik Skala eingeschätzt. Eine solche Vorgehensweise ermöglicht die Schätzung individueller Nutzenwerte mit Hilfe einer OLS Regression.381 Eine weitere individualisierte Vorgehensweise zur Präferenzmessung präsentiert Fischer (2001, 137ff.). Dabei wird vom Marktforscher zunächst eine möglichst umfangreiche Liste mit Merkmalen bestimmt, die „alle existierenden produktbezogenen Eigenschaften“382 beinhalten sollte. Die Bandbreite der Ausprägungen jedes Merkmals orientiert sich an den am Markt tatsächlich existierenden Ausprägungen für die zu untersuchende Produktgruppe. Die Besonderheit des hier vorgestellten Verfahrens liegt darin, dass diese Merkmale und Ausprägungen den Entscheidungsträgern möglichst mit Hilfe von Medien präsentiert werden, die diese bei einer realen Entscheidung nutzen würden (z.B. Zeitungsartikel, Werbeprospekte usw.) und die Befragungsteilnehmer aus der Vielzahl von Informationen selbst die relevanten Eigenschaften und Ausprägungen auswählen bzw. ausgehend von den bisherigen Produkterfahrungen auch zusätzliche Eigenschaften und Ausprägungen ergänzen. Nach der Bestimmung der zu untersuchenden Merkmale werden zunächst alle völlig unakzeptablen sowie ggf. wenig präferierte Ausprägungen eliminiert und die Eigenschaften entsprechend ihrer Bedeutung in eine Rangfolge gebracht. Danach werden so lange Merkmale entfernt, bis die vom Marktforscher als maximal bestimmte Zahl der Eigenschaften nicht überschritten wird. Im Anschluss daran können die Alternativen computergestützt gebildet, vom Entscheidungsträger

381 382

64

Vgl. Hensel-Börner (2000), 81ff. Fischer (2001), 139.

anhand von Kaufwahrscheinlichkeiten bewertet und schließlich individuelle Teilnutzen geschätzt werden.383 Als vor- und gleichzeitig nachteilig erweist sich bei allen individualisierten Verfahren die Tatsache, dass jeweils unterschiedliche Eigenschaftssets bewertet werden. Da die Identifikation von Marktsegmenten eine identische Variablenbasis voraussetzt, sind die erhobenen Präferenzdaten nur sehr eingeschränkt für eine Marktsegmentierung auf Basis der Präferenzen geeignet.384 Problematisch ist insbesondere auch, dass Teilnutzen, die auf Basis von individualisierten Eigenschaftssets geschätzt wurden, nicht mehr miteinander vergleichbar sind. Eine Aggregation der Ergebnisse der Präferenzmessung ist somit nicht ohne weiteres möglich.385 Hinzu kommt, dass eine Selektion von individuell wichtigen Eigenschaften auf individueller Ebene häufig nicht stabil ist, während man auf der (Ziel-)Gruppenebene mit stabileren Einschätzungen rechnen kann.386 Bewertung einer Teilmenge von Attributen bei dekompositionellen Verfahren

Die dekompositionellen Verfahren zur Präferenzmessung kann man danach unterscheiden, ob alle zu untersuchenden Eigenschaften bzw. lediglich eine Teilmenge der Merkmale simultan

präsentiert und vom Entscheidungsträger eingeschätzt werden. Bei der bereits beschriebenen Full-Profile Darstellung werden dem Entscheidungsträger komplette Alternativen, die durch die Ausprägungen aller untersuchten Merkmale beschrieben werden, vorgelegt und von ihm bewertet.387 Ein typisches Verfahren, bei dem lediglich eine Teilmenge der Attribute simultan eingeschätzt wird, sind die bereits vorgestellten Trade-off Matrizen.388 Dabei bewertet der Entscheidungsträger eine Reihe von Tabellen, d.h. seine Aufgabe besteht darin, jeweils die Vorziehenswürdigkeit von Alternativen zu bestimmen. Die Stimuli ergeben sich aus der Kombination von Ausprägungen jeweils zweier Eigenschaften.389 Green; Wind; Jain (1972b, 371ff.) beschreiben eine weitere Vorgehensweise auf der Basis der Conjoint-Analyse, bei der die Präferenz für ein Produkt (z.B. Speisemenü), das aus verschiedenen Einzelprodukten (Vorspeise, Hauptspeise, Dessert usw.) besteht, erhoben wird, indem zunächst die Präferenzen für die Einzelprodukte (d.h. eine Teilmenge der Eigenschaften eines 383 384

Vgl. Fischer (2001), 145ff. Vgl. Perrey (1998), 53.

385

Vgl. Voeth (2000), 177. Dazu sind weitere Annahmen durch den Marktforscher notwendig, z.B. indem er (mehr oder weniger willkürlich) festlegt, dass nicht betrachteten Ausprägungen ein Teilnutzen von „0“ zugewiesen wird (vgl. Voeth (2000), 177). 386 Vgl. Huber (1987), 6. 387 388 389

Vgl. Green; Krieger (1996), 852. Vgl. Johnson (1974), 121ff. Vgl. Westwood; Lunn; Beazley (1974), 231; Green; Krieger (1996), 851; Albrecht (2000), 53.

65

Gesamtprodukts) getrennt untersucht und der Gesamtnutzen für ein hypothetisches Produkt (Speisemenü) durch Addition der Gesamtnutzen der Einzelprodukte berechnet wird.390 Bei der Nutzung von partiellen Profilen wird die Bewertungsaufgabe, ähnlich zu dem Vorgehen von Green; Wind; Jain (1972b, 371ff.), in verschiedene Teile gegliedert und eine Alternative durch eine Teilmenge der insgesamt untersuchten Eigenschaften beschrieben. Die in einem Sub-Set nicht betrachteten Merkmale weisen alle eine vorgegebene, identische Ausprägung auf.391 Diese Darstellungsform basiert auf der Grundannahme, dass Eigenschaften, die nicht präsentiert werden, keinen Einfluss auf die Bewertung der Alternativen ausüben.392 Eine solche Vorgehensweise ist allerdings nur anwendbar, wenn keinerlei Interaktionseffekte zwischen den Eigenschaften verschiedener Sub-Sets auftreten.393 Sie zielt darauf ab, die Bewertungsaufgabe zu vereinfachen,394 um insgesamt mehr Eigenschaften untersuchen zu können.395 Im Vergleich zur klassischen Conjoint-Analyse sind jedoch bei der Nutzung von partiellen Profilen durch die Aufteilung der Eigenschaften in verschiedene Sub-Sets mehr Bewertungen notwendig. In der Praxis erfolgt der Einsatz von partiellen Profilen oft im Rahmen der ACA. Dabei werden die Alternativen teilweise lediglich durch zwei bis drei Merkmale beschrieben.396 Die Problematik an dieser Vorgehensweise ergibt sich daraus, dass auch die nicht präsentierten Merkmale einen Einfluss auf die Einschätzungen von Alternativen ausüben.397 Hat der Entscheidungsträger in einem ersten Teil der Erhebung Merkmale bewertet, die in einem zweiten Teil fehlen, so wird er versuchen, diese fehlenden Informationen anhand der präsentierten Attribute und Ausprägungen abzuleiten.398 So könnten beispielsweise anhand der Eigenschaft „Preis“ Vermutungen über die Ausprägungen der nicht präsentierten Merkmale die Bewertungen beeinflussen.399 Bradlow; Hu; Ho (2004, 370ff.) entwickeln deshalb eine Methode, bei der die in einem vorhergehenden Sub-Set präsentierten Attribute ex390 391 392 393 394

Für einen Überblick über weitere ähnliche Verfahren siehe Green; Srinivasan (1978), 118. Vgl. Hopkins; Larréché; Massy (1977), 369; McCullough (2002b), 20; Holling; Melles; Reiners (1999), 251. Vgl. Bradlow; Hu; Ho (2004), 270; Johnson (2001), 3. Vgl. McCullough (2002b), 20 Vgl. Hopkins; Larréché; Massy (1977), 369; Bradlow; Hu; Ho (2004), 370.

395

McCullough (2002b, 20) geht davon aus, dass mit Hilfe der Nutzung von partiellen Profilen bei einer klassischen Conjoint-Analyse 50 oder sogar mehr Eigenschaften berücksichtigt werden können. Vgl. Green; Krieger (1996), 855. Auch bei klassischen Conjoint-Analysen bzw. bei Choice-Based Conjoint-Analysen können partielle Profile angewendet werden (vgl. McCullough (2002b), 20; Bradlow; Hu; Ho (2004), 370). 397 Dieser Effekt wurde in verschiedenen Studien beobachtet. Für einen Überblick siehe Bradlow; Hu; Ho (2004), 370. 396

398

Vgl. Bradlow; Hu; Ho (2004), 370; Abla; Cooke (2004), 382ff. Dies bedeutet aber, dass Methoden wie die ACA oder alle weiteren hybriden, individualisierten Verfahren ebenso von diesem Problem betroffen sind. Bei diesen Methoden bewertet der Entscheidungsträger in einem ersten Schritt auf Basis einer Self-Explicated Methode eine Vielzahl von Merkmalen, von denen in einer zweiten, dekompositionellen Phase lediglich die wichtigsten Eigenschaften weiter untersucht werden. Den Probanden ist durch diese zweistufige Vorgehensweise bewusst, dass sie im dekompositionellen Teil lediglich ein Sub-Set der Eigenschaften bewerten; die hier fehlenden Merkmale werden sie deshalb u.U. in die Entscheidung einfließen lassen (vgl. Bradlow; Hu; Ho (2004), 370). Auch bei der CBC ist mit entsprechenden Verzerrungen zu rechnen (vgl. Alba; Cooke (2004), 383). 399 Vgl. Rao (2004), 389.

66

plizit bei der Bewertung der folgenden Sub-Sets berücksichtigt werden. Die im vorhinein präsentierten Eigenschaften und Ausprägungen werden dabei analog zu „missing values“ in anderen Fragebögen mit zu erwartenden Werten ersetzt.400 Bei komplexen Entscheidungsproblemen können auch Gebrückte Designs zur vereinfachten Darstellung genutzt werden. Bei diesen Methoden wird, ähnlich wie bei den partiellen Designs, die gesamte Anzahl der Eigenschaften in verschiedene Sets mit je 5-6 Eigenschaften aufgeteilt. Ein oder zwei Merkmale dienen als „Brückenmerkmale“, die in allen Stimulisets der Untersuchung genutzt werden. Die Brückenmerkmale ermöglichen, dass die anderen Merkmale, die sich jeweils nur in einem Set befinden, durch eine entsprechende Gewichtung der ermittelten Teilnutzen miteinander verbunden und Gesamtnutzen für hypothetische Alternativen berechnet werden können.401 Die Anordnung und Bildung der Subdesigns erfolgt allerdings nicht aufgrund des tatsächlichen Informationsverarbeitungsprozesses durch den Entscheidungsträger, sondern ist künstlich und schränkt daher die Aussagekraft der Erhebung ein.402 Gliederung des Eigenschaftssets in einer Hierarchie

Soll eine Vielzahl an Eigenschaften untersucht werden, können diese den Entscheidungsträgern auch in Form einer Hierarchie präsentiert werden.403 Diese Verfahren basieren auf der Annahme, dass Entscheidungsträger bei komplexen Problemen dazu neigen, die Eigenschaften durch die die Alternativen beschrieben werden, in Gruppen zusammenzufassen. Grundvoraussetzung zur Anwendung dieser Methoden ist jedoch die Gleichheit der Beurteilungsprozesse durch verschiedene Entscheidungsträger.404 Die Stimuli werden zunächst innerhalb einer Merkmalsgruppe bewertet und daraus ein aggregiertes Urteil für jede Merkmalsgruppe gebildet. Durch eine spätere Aggregation der Merkmalsgruppeneinschätzungen kann ein Gesamturteil für eine Alternative abgeleitet werden. Eine solche Gliederung der Einzelmerkmale innerhalb einer Hierarchie dient der Vereinfachung eines Entscheidungsproblems und ermöglicht es den Befragungsteilnehmern u.U. komplexe Alternativen überhaupt zu bewerten.405

400

Vgl. Bradlow; Hu; Ho (2004), 370ff.; Rubin (2004), 390; Rao (2004), 388.

401

Vgl. Green; Srinivasan (1978), 108; Perrey (1998), 92f.; Thaden (2002), 55ff.; Oppewal; Louviere; Timmermans (1994), 92. Für ein Anwendungsbeispiel siehe Rosko; DeVita; McKenna; Walker (1985), 29f. Entsprechende Erhebungsdesigns können mit Hilfe der Bretton-Clark’s BRIDGER Software erstellt und Befragungen durchgeführt werden, wobei durch Anwendung dieser Vorgehensweise vermutlich eine im Vergleich zur klassischen Conjoint-Analyse höhere Zahl an Eigenschaften untersucht werden kann (vgl. Green; Krieger (1996), 854). 402 Vgl. Perrey (1998), 93. 403 404 405

Bei den meisten Verfahren zur Präferenzmessung wird das Eigenschaftsset nicht in Form einer Hierarchie gegliedert, d.h. der Befragungsteilnehmer bewertet konkrete Merkmale sowie deren Ausprägungen. Vgl. Perrey (1998), 104. Vgl. Louviere (1984a), 148; Oppewal; Louviere; Timmermans (1994), 93; Huber (1987), 9f.; Voeth (2000), 130; Schoemaker; Waid (1982), 183; Perrey (1998), 96.

67

Eine entsprechende Vorgehensweise zur hierarchischen Erfassung von Präferenzen schlägt Louviere (1984a, 148ff.) mit der Hierarchical Information Integration Methode (HII) vor. In einem ersten Schritt werden zunächst Eigenschaftsgruppen, d.h. analog zur klassischen Conjoint-Analyse Profile von Eigenschaften sowie deren Ausprägungen präsentiert und von den Entscheidungsträgern bewertet. Die Alternativen werden dabei lediglich durch Merkmale einer Gruppe beschrieben. Diese Einschätzungen der Profile bilden in der zweiten Stufe die Ausprägungen eines Gruppenmerkmals, die wiederum in Relation zueinender bewertet werden.406 In späteren Varianten dieser Methode wurden die auf Ratings basierten Einschätzungen der Ausprägungskombinationen einer Gruppe durch Wahlentscheidungen ersetzt.407 Das Hauptproblem bei der Anwendung der HII ist, dass der Befragungsaufwand bei der Beurteilung der verschiedenen Gruppen stark ansteigen kann.408 Eine weitere Methode zur hierarchischen Gliederung einer Conjoint-Analyse schlägt Perrey (1998, 92ff.) vor. Er nutzt die Unterscheidung zwischen subjektiven (Benefits) bzw. objektiven (Characteristics) Eigenschaften409 und geht davon aus, dass diese Merkmalsarten in einer zweistufigen Hierarchie gegliedert werden können. Die objektiven Merkmale befinden sich hier auf der untersten Hierarchieebene. Die Ausprägungen der objektiven Merkmale rufen eine ganz bestimmte Nutzenvorstellung (einen Benefit) hervor; deshalb befinden sich die einzelnen Benefit-Eigenschaften auf der übergeordneten, zweiten Ebene.410 Grundvoraussetzung für die Nutzung einer solchen Vorgehensweise ist, dass die objektiven Produktmerkmale lediglich eine ganz bestimmte Nutzenvorstellung beeinflussen.411 Entsprechende Benefit Merkmale könnten durch Nutzung der Faktorenanalyse bzw. „inhaltliche Strukturierung“412 gebildet werden.413 Nachdem die Benefit-Merkmale bestimmt wurden, können diese in einem 406

Vgl. Louviere (1984a), 149; Louviere; Gaeth (1987), 27ff.; Oppewal; Louviere; Timmermans (1994), 93; Voeth (2000), 130ff. Letztlich werden in einem ersten Schritt “konstruierte“ bzw. „künstliche“ Eigenschaften (siehe Kapitel 4.1.5) ermittelt, deren Ausprägungen durch die Einschätzungen der Entscheidungsträger bestimmt werden. In einem zweiten Schritt werden dann die Ausprägungen dieser künstlichen Eigenschaften bewertet. 407 Siehe dazu u.a. Oppewal; Louviere; Timmermans (1994), 94ff. 408 409

Vgl. Voeth (2000), 132. Siehe dazu Kapitel 4.1.8.

410

Vgl. Perrey (1998), 99. In einer empirischen Untersuchung wird auf der obersten Ebene neben den Benefits aber auch eine objektive Eigenschaft untersucht (siehe dazu beispielsweise Perrey (1998), 181), d.h. die im Theorieteil der Arbeit angestrebte Trennung zwischen Benefits und Characteristics konnte bei der empirischen Überprüfung der Methode nicht eingehalten werden. 411 Dies ist jedoch nicht in jedem Fall gegeben, siehe dazu auch Helm; Steiner (2006, 14) und Kapitel 4.1.8. 412

Perrey (1998, 174) legt die Hierarchie, die Benefit-Eigenschaften sowie die objektiven Merkmale aufgrund einer Vorstudie und insbesondere auf Basis von Plausibilitätsüberlegungen fest. 413 Vgl. Perrey (1998), 99. Zur Anwendbarkeit der Faktorenanalyse bei der Bestimmung übergeordneter Merkmale siehe Kapitel 5.2.1.4. Um die von Perrey (1998, 98ff.) vorgeschlagene Vorgehensweise sinnvoll anwenden und die Daten entsprechend interpretieren zu können, müsste jeder Faktor die Varianz der ursprünglichen Variablen vollständig erklären können und gleichzeitig dürfte jedes einzelne objektive Merkmal lediglich auf einen Faktor laden, d.h. die objektiven Merkmale dürfen nur Beziehungen zu einer subjektiven Eigenschaft aufweisen. Nur wenn diese Anforderungen vollständig erfüllt sind, können die Einschätzungen der beiden Hierarchiestufen miteinander durch eine Nutzenfunktion verknüpft werden. Bei der Zusammenfassung von Einzelvariablen zu Faktoren ist allerdings immer mit einem Informationsverlust zu rechnen (vgl. Backhaus; Erichson; Plinke; Weiber (2003), 266).

68

weiteren Schritt bewertet werden. Perrey (1998, 92ff.) nimmt an, dass alle Befragungsteilnehmer das Entscheidungsproblem in identischer Art, d.h. in einer vom Marktforscher vorgegebenen Weise gliedern würden. Die Strukturierung der Befragung wird den Probanden vorgegeben und vor der eigentlichen Befragung beschrieben. Um den Befragungsaufwand zu reduzieren, bewerten die Entscheidungsträger im Folgenden lediglich ein Sub-Set objektiver Merkmale. Die Gruppenzuordnung erfolgt durch den Marktforscher. Die beiden Hierarchieebenen können im Anschluss durch Gewichtung der Ergebnisse der unteren Hierarchiestufen mit den Teilnutzen der Benefit-Ebene kombiniert und die Daten auf Gruppenebene ausgewertet werden.414 Auch bei dem Analytic Hierarchy Process (AHP) wird das Entscheidungsproblem innerhalb einer Hierarchie gegliedert. Es handelt sich hierbei um ein im Bereich der Entscheidungsanalyse häufig angewandtes Verfahren.415 Zur Erfassung von Präferenzen im Bereich Marketing wurde es dagegen erst relativ selten genutzt.416 Diese Methode kann zur Analyse individueller Präferenzen417 oder aber zur Abbildung von Gruppenentscheidungen418 genutzt werden. Die Struktur und Anzahl der in einer Hierarchie enthaltenen Elemente und Hierarchiestufen wird weitgehend frei vom Marktforscher bestimmt.419 Dabei wird typischerweise zwischen zwei generellen Ansätzen des AHP unterschieden: der kompletten und der inkompletten Hierarchie.420 Bei der Anwendung einer kompletten Hierarchie wird auf der untersten Ebene eine diskrete Zahl an konkreten Alternativen bewertet. Auf diese Weise können jedoch nur die Gesamtnutzen der untersuchten Alternativen berücksichtigt werden. Deshalb erscheint diese Art der Datenerhebung lediglich für Auswahl einer Alternative aus einer vorgegebenen Alternativenmenge, nicht aber im Rahmen der Produktgestaltung geeignet.421 Im Gegensatz dazu befinden sich bei einer inkompletten Hierarchie die jeweiligen Ausprägungen einer Eigenschaft auf der unteren Ebene und die dazu gehörigen elementaren Attribute auf der zweiten

414

Vgl. Perrey (1998), 104f.

415

Vgl. Helm; Manthey; Scholl; Steiner (2002), 517; Scholl; Manthey; Helm; Steiner (2005), 764; Helm; Scholl; Manthey; Steiner (2004), 14; Mulye (1998), 263; Schoner; Wedley (1989), 462. Für einen umfangreichen Überblick über Anwendungsmöglichkeiten des AHP siehe Zahedi (1986), 101; Wind; Saaty (1980), 647ff. 416 Für Beispiele siehe Schoemaker; Waid (1982), 182ff.; Tscheulin (1991), 1267ff.; Mulye (1998), 263ff.; Helm; Manthey; Scholl; Steiner (2002), 517ff.; Helm; Scholl; Manthey; Steiner (2004), 12ff.; Scholl; Manthey; Helm; Steiner (2005), 760ff. 417 Siehe als Beispiel u.a. Helm; Manthey; Scholl; Steiner (2002), 517ff. 418

Siehe u.a. Condon; Golden; Wasil (2003), 1436ff.; Korpela; Kyläheiko; Lehmusvaara; Tuominen (2002), 190.

419

Vgl. Tscheulin (1992), 27; Tomczak (1989), 19. Auch bei dieser Methode wird davon ausgegangen, dass alle Befragungsteilnehmer das Entscheidungsproblem in identischer Art und Weise, d.h. so wie es der Marktforscher vorgibt, strukturieren würden. 420 Für weitere Verfahrensvarianten des AHP siehe Mulye (1998), 265f.; Kamenetzky (1982), 708ff.; Salo; Hämäläinen (1997), 311ff.; Schoner; Wedley (1989), 462. 421 Vgl. Helm; Manthey; Scholl; Steiner (2002), 518; Scholl; Manthey; Helm; Steiner (2005), 763; Tscheulin (1992), 27f. Zur Anwendung des AHP als Verfahren zur Alternativenselektion siehe auch Helm (2001), 68.

69

Hierarchieebene.422 Auf der obersten Ebene steht das jeweilige Oberziel der Untersuchung.423 Die Ausprägungen und Eigenschaften bzw. sonstigen Elemente der Hierarchie werden direkt auf Basis von Paarvergleichen eingeschätzt.424 Es handelt sich folglich um eine kompositionelle Methode.425 Eine Besonderheit im Gegensatz zu den anderen Verfahren zur Präferenzmessung426 besteht darin, dass die Elemente der Hierarchie auf einer Verhältnisskala (mit oftmals 9 möglichen Skalenpunkten427) bewertet werden. Der Befragungsteilnehmer beginnt die Bewertung auf der untersten Hierarchieebene und schätzt danach jeweils die Elemente der darüber liegenden Hierarchieebene ein.428 Die entsprechenden Zielgewichte der Elemente der Hierarchie (z.B. die Eigenschaften und Ausprägungen) werden mit Hilfe von Verfahren wie der Eigenwertmethode geschätzt, wobei es möglich ist, inkonsistente Antworten der Entscheidungsträger „auszumitteln“.429 Der Teilnutzen einer Eigenschaftsausprägung ergibt sich durch Multiplikation des Zielgewichts einer Ausprägung mit den Zielgewichten der jeweils übergeordneten Elemente (z.B. der jeweiligen Eigenschaft).430 Durch die kompositionelle Bewertung der Elemente und durch die Gliederung des Entscheidungsproblems innerhalb einer Hierarchie ist es mit Hilfe des AHP möglich, eine vergleichsweise hohe Zahl an Eigenschaften und damit vergleichsweise komplexe Problemstellungen zu untersuchen.431 422

Vgl. Helm; Scholl; Manthey; Steiner (2004), 18; Scholl; Manthey; Helm; Steiner (2005), 764; Tscheulin (1992), 28; Tscheulin (1999), 586. Vgl. Scholl; Manthey; Helm; Steiner (2005), 764; Helm; Scholl; Manthey; Steiner (2004), 18. Bei einer inkompletten Hierarchie sind deshalb mindestens 3 Ebenen notwendig, um entsprechende Teilnutzen schätzen zu können (vgl. Tscheulin (1992), 29; Zahedi (1986), 97). 424 Vgl. Scholl; Manthey; Helm; Steiner (2005), 765; Tscheulin (1992), 43; Schoemaker; Waid (1982), 183; Zahedi (1986), 98; Ossadnik; Lange (2000), 526. 425 Vgl. Helm; Manthey; Scholl; Steiner (2002), 518. 423

426

Für typische Skalenarten bei den anderen Methoden zur Präferenzmessung siehe Kapitel 3.2.

427

Vgl. Saaty (1980), 54; Zahedi (1986), 98. Für eine Diskussion über die Vorteilhaftigkeit einer solchen Skala siehe u.a. Harker; Vargas (1990), 269f.; Saaty (1990), 260. Alternativ können Magnituden-Skalen zur Bewertung der jeweiligen Paarvergleiche herangezogen werden (vgl. Tomczak (1989), 22; für eine Beschreibung von Magnituden-Skalen siehe Kapitel 3.2) 428 Vgl. Helm; Scholl; Manthey; Steiner (2004), 19; Scholl; Manthey; Helm; Steiner (2005), 765; Schoemaker; Waid (1982), 183. 429 Vgl. Helm; Manthey; Scholl; Steiner (2002), 519; Scholl; Manthey; Helm; Steiner (2005), 763; Helm; Scholl; Manthey; Steiner (2004), 19; Wind; Saaty (1980), 645ff.; Schoemaker; Waid (1982), 183; Ossadnik; Lange (2000), 530; Haedrich; Kuß; Kreilkamp (1986), 124f.; Tscheulin (1999), 583ff. Für weitere Möglichkeiten zur Bestimmung der Zielgewichte siehe Chandran; Golden; Wasil (2005), 2236ff.; Zelewski; Peters (2003), 1212f.; Tscheulin (1999), 588ff.; Tscheulin; Jacques (1996), 191ff. 430 Vgl. Helm; Scholl; Manthey; Steiner (2004), 20; Scholl; Manthey; Helm; Steiner (2005), 766. 431

70

Louviere (1984a, 148) und Louviere; Gaeth (1987, 26f) gehen davon aus, dass die AHP bei 10 oder mehr Eigenschaften bzw. bei komplexen Entscheidungsproblemen nicht mehr geeignet ist, ohne diese Einschätzung jedoch genauer zu erläutern. Im Gegensatz dazu schätzen Helm; Manthey; Scholl; Steiner (2002, 524); Helm; Scholl; Manthey; Steiner (2004, 27f.) und Scholl; Manthey; Helm; Steiner (2005, 768, 776) den AHP gerade für komplexe Entscheidungsprobleme als geeignet ein. Siehe analog dazu auch Wind; Saaty (1980), 642; Kamenetzky (1982), 702; Zahedi (1986), 101; Haedrich; Kuß; Kreilkamp (1986), 120; Korpela; Kyläheiko; Lehmusvaara; Tuominen (2002), 189; Tomczak (1989), 19; Saaty (1990), 259. Typische Anwendungen des AHP bestehen aus 3 bis 7 Hierarchiestufen (vgl. Zahedi (1986), 102). Die Zahl der notwendigen Paarvergleiche kann jedoch dann sehr stark steigen, wenn sich viele Elemente auf einer Hierarchieebene befinden (vgl. Dyer (1990), 255).

Verfahren zur Berücksichtigung von Interaktionseffekten

Die Verfahren zur Präferenzmessung unterscheidet man darüber hinaus danach, ob Interaktionseffekte berücksichtigt werden können oder nicht. Kompositionelle Methoden erlauben

durch die direkte Bewertung einzelner Ausprägungen und Eigenschaften keine Berücksichtigung von Interaktionseffekten.432 Dekompositionelle Methoden erfassen die Präferenzen, indem zumindest zwei Eigenschaften simultan berücksichtigt werden. Insofern könnten mit jeder dekompositionellen Methode zumindest auch Zwei-Wege Interaktionen (d.h. Interaktionen zwischen zwei Eigenschaften) untersucht werden.433 Bestimmung von Nutzenfunktionen auf Gruppenebene

Darüber hinaus kann man die Methoden danach unterscheiden, ob individuelle Nutzenfunktionen oder die Präferenzen für eine Gruppe von Entscheidungsträgern erfasst werden sollen. Hauptsächlich handelt es sich bei den Verfahren zur Präferenzmessung um Individualanalysen, d.h. es werden die Präferenzen der Entscheidungsträger auf individueller Ebene geschätzt.434 Bei Methoden, die zur Erfassung der Präferenzen eine hohe Zahl an Einschätzungen benötigen, werden die Präferenzen dagegen oft auf Gruppenebene erhoben, um eine Informationsüberlastung der Probanden zu verhindern.435 Dies gilt insbesondere bei ChoiceBased Conjoint-Varianten436 und damit für die meisten wahlbasierten Methoden zur Präferenzmessung.437 Auch bei Conjoint-Analysen, in deren Rahmen alle potenziellen Interaktionseffekte berücksichtigt werden sollen und die deshalb auf einem vollständigen Design beruhen, schätzt ein Befragungsteilnehmer lediglich eine Teilmenge der möglichen Merkmalskombinationen ein, so dass eine Nutzenfunktion auf Basis der Bewertungen aller Entscheidungsträger aufgestellt werden kann.438

432

Vgl. McCullough (2002a), 49.

433

Für einen Überblick über Möglichkeiten zur Berücksichtigung von Interaktionseffekten im Rahmen der ConjointAnalyse siehe Kapitel 4.2.3.1.1. 434 Vgl. Green; Srinivasan (1978), 104; Malhotra (1986), 33. Differenzierte Nutzenstrukturen können lediglich Methoden auf individueller Ebene erfassen (vgl. Perrey (1998), 53). Dies gilt insbesondere dann, wenn nicht sichergestellt ist, dass alle Befragungsteilnehmer über homogene Präferenzen verfügen. Ist dies nicht der Fall, muss bei der Schätzung von Nutzenfunktionen auf aggregierter Ebene mit einer geringeren Güte der Präferenzmessung gerechnet werden (vgl. Green; Krieger (2002a), 26). 435 Vgl. Hensel-Börner (2000), 25; Sawtooth Software (2005a), 2. 436

Siehe beispielsweise Huber; Wittink; Johnson (1992), 3; McFadden (1986), 852. Eine Ausnahme ist die CHIC, bei der für jeden Entscheidungsträger separate Teilnutzen geschätzt werden (vgl. Hensel-Börner (2000), 82). Vgl. Hensel-Börner (2000), 25f.; Sawtooth Software (2001b), 2. Mit Hilfe des Latent-Class Ansatzes lassen sich zumindest für verschiedene Segmente innerhalb einer Gruppe von Befragungsteilnehmern spezielle Nutzenfunktionen ermitteln. Die Antworten eines Entscheidungsträgers fließen dabei in die Schätzung der Nutzenfunktionen aller Segmente (Latent-Classes) ein. Zudem kann ermittelt werden, mit welchen Wahrscheinlichkeiten ein Befragungsteilnehmer zu einem bestimmten Segment gehört. Grundvoraussetzung für die Anwendung dieses Verfahrens ist jedoch eine vollständige Homogenität der Präferenzen innerhalb eines Segments (vgl. Teichert (2000c), 228f.). Mit Hilfe von Verfahren wie dem Hierarchical Bayes Ansatz wird versucht, individuelle Nutzenfunktionen „by ‚borrowing’ information from other individuals“ (Sawtooth Software (2000), 1) zu bestimmen. 438 Für Beispiele siehe Green; Goldberg; Montemayor (1981, 35) und Neslin (1981, 80ff.). 437

71

Wahlbasierte Methoden zur Präferenzmessung

Bei den bereits erwähnten wahlbasierten Methoden selektiert der jeweilige Entscheidungsträger aus einem439 bzw. mehreren Sets vorgegebener Alternativen lediglich diejenige, die er am meisten bevorzugt – es handelt sich letztendlich um dichotome Einschätzungen durch die Befragungsteilnehmer. Ziels dieses Verfahrens ist es, basierend auf hypothetischen Auswahlentscheidungen Aussagen über reale Kaufentscheidungen zu treffen. Man kann davon ausgehen, dass die Erfassung von hypothetischen Auswahlentscheidungen die reale Produktwahl realistischer widerspiegelt als die Erfassung von Präferenzen.440 Da wahlbasierte Verfahren, wie die meisten Varianten der klassischen Conjoint-Analyse, auf Full-Profile Darstellungen beruhen, d.h. die Alternativen werden durch sämtliche Ausprägungen der untersuchten Eigenschaften beschrieben, sollten nicht mehr als 6 bis maximal 10 Merkmale untersucht werden.441 Erste wahlbasierte Conjoint-Analysen wurden Anfang der 1990er Jahre präsentiert und erlangten, wie die ACA aufgrund verfügbarer kommerzieller Software, große Beliebtheit in der Marktforschung.442 Als Hauptvorteile dieser Vorgehensweise werden die relativ höhere Realitätsnähe443 von Wahlentscheidungen, aber auch eine relativ kurze Interviewdauer444 genannt. Außerdem können Interaktionseffekte berücksichtigt werden.445 Als nachteilig erscheint bei der Anwendung wahlbasierter Methoden zur Präferenzmessung die geringe Informationseffizienz dichotomer Wahlentscheidungen,446 die lediglich eine gruppen- bzw. segmentweise Schätzung von Teilnutzen ermöglicht.447 Die Effizienz der Datenerhebung verringert sich weiter, wenn eine „Nicht-Kauf-Alternative“ im Fragebogen verwendet und vom Entscheidungsträger gewählt wird.448 Bei der Untersuchung von Wahlentscheidungen ist schließlich eher mit der Anwendung vereinfachter Entscheidungsstrategien zu rechnen, z.B. könnte der Befragungsteilnehmer die erstbeste akzeptable Alternative wählen. Die Intensität der Informationsverarbeitung ist daher bei wahlbasierten Präferenzmessverfahren tendenziell geringer; u.U. werden lediglich bestimmte, als wichtig wahrgenommene Eigenschaften berücksichtigt und weniger wichtige Merkmale werden unterschätzt.449

439 440 441 442 443 444 445 446 447 448 449

72

Beispielsweise schätzt ein Entscheidungsträger bei der „STEP“ wahlbasierten Methode lediglich ein einziges Alternativen Set ein (vgl. Orme (2002a), 47). Vgl. Perrey (1998), 87ff.; Hensel-Börner (2000), 25f.; Teichert (2000b), 149; Teichert (2000c), 227. Vgl. Sawtooth Software (2001b), 2f. Vgl. Orme (2003), 4. Vgl. Orme (1997), 4; Hensel-Börner (2000), 26; Teichert (2000c), 227; McCullough (2002b), 22; Gensler (2006), 319. Vgl. Orme (1997), 4. Vgl. McCullough (2002b), 22; Sawtooth Software (2001b), 3. Vgl. Hensel-Börner (2000), 26; Sawtooth Software (2001b), 2; Teichert (2000c), 227; Gensler (2006), 319. Vgl. McCullough (2002b), 22. Vgl. Hensel-Börner (2000), 26. Vgl. Teichert (2000b), 149, 154.

Deshalb ist die Anwendung von wahlbasierten Präferenzmessmethoden eher bei Konsumgütern sinnvoll, da hier in realen Kaufentscheidungssituationen üblicherweise ebenfalls vereinfachte Entscheidungsstrategien angewendet werden. Für die Erfassung von Präferenzen bei Gebrauchsgütern ist demgegenüber nicht davon auszugehen, dass lediglich wenige Merkmale wie die Eigenschaften „Marke“ und „Preis“ die Kaufentscheidung dominieren.450 Auch wenn Choice Based Conjoint-Analysen somit eher auf realitätsnahen Wahlentscheidungen basieren, sind sie nicht in jedem Fall zur Prognose von realen Kaufentscheidungen geeignet.451 Aufgrund der verschiedenen Vor- und Nachteile dieser noch relativ neuen Gruppe von Verfahren zur Präferenzmessung wird deren Nutzen teilweise auch als „mixed blessing“452 bezeichnet. Bei den Choice Based Conjoint-Analysen unterscheidet man typischerweise zwischen den Verfahren, die die Teilnutzen auf der Basis eines Logit-Modells453 bzw. eines Hierarchical Bayes454 Ansatzes schätzen. Eine der ersten Anwendungen der Choice-Based Conjoint-Analyse beschreiben Louviere; Woodworth (1983, 352ff.).455 Dabei wird das Choice Set wie bei klassischen Varianten der Conjoint-Analyse auf Basis eines orthogonalen Erhebungsdesigns456 bestimmt. Die Schätzung der Präferenzen einer Gruppe von Befragungsteilnehmern erfolgt mit Hilfe eines multinominalen Logit-Modells.457 Huber; Wittink; Johnson (1992, 3) nutzen eine Randomized Choice-Based ConjointAnalyse, bei der die Stimulusauswahl durch Zufallsziehungen aus einem Gesamtset der zu

untersuchenden hypothetischen Alternativen erfolgt. Die Teilnutzen werden danach ebenfalls mit Hilfe eines multinominalen Logit-Modells so ermittelt, dass diese die Wahlentscheidungen so gut wie möglich vorhersagen.458 Eine weitere wahlbasierte Methode zur Präferenzmessung ist die Choice-Based ConjointAnalyse (CBC) von Sawtooth Software. Die CBC basiert, wie die bisher dargestellten wahl-

basierten Präferenzmessverfahren, auf einer Full-Profile Darstellung, bei der die Alternativen

450 451 452 453 454

Diese beiden Eigenschaften werden teilweise als dominante Merkmale zur Einschätzung von Konsumgütern bezeichnet (vgl. Huber; Wittink; Johnson (1992), 6ff.). Vgl. Huber; Wittink; Johnson (1992), 6, 8. Green; Krieger; Wind (2001), 62. Vgl. McFadden (1974), 105ff.; McFadden (1986), 275ff.; Louviere (1984b), 81ff. Vgl. Johnson (2000), 1ff.

455

Für verschiedene praktische Anwendungen siehe Louviere; Woodworth (1983), 355ff. bzw. Elrod; Louviere; Davey (1992), 368ff. Für weitere Möglichkeiten zur Bestimmung des Erhebungsdesigns bei wahlbasierten Conjoint-Analysen siehe Louviere; Woodworth (1983), 353ff.; Kanninen (2002), 214; Sandor; Wedel (2002), 455ff. 457 Vgl. Louviere; Woodworth (1983), 352ff. Weiterhin sind multinominale Probit Modelle zur Schätzung der Teilnutzen geeignet (vgl. Haaijer; Wedel; Vriens; Wansbeek (1998), 236ff.). 458 Vgl. Huber; Wittink; Johnson (1992), 3. 456

73

durch alle zu untersuchenden Eigenschaften beschrieben werden. Der Befragungsteilnehmer wählt jeweils aus einer Reihe von Auswahlsets die Alternative, die er am meisten bevorzugt. Analog zu den anderen wahlbasierten Methoden ist deshalb die Zahl der Eigenschaften, die mit der CBC untersucht werden können, relativ gering.459 Die Anzahl der in einem Auswahlset präsentierten Alternativen kann vom Marktforscher festgelegt werden. Die Obergrenze beträgt bei der CBC 16 Alternativen, die eine Nicht-Kauf-Option umfassen kann.460 Neben der Zahl der Alternativen kann auch die Anzahl der Fragen pro Proband vom Marktforscher selbst festgelegt werden.461 Anhand dieser Vorgaben erstellt die CBC Software ein entsprechendes Erhebungsdesign, d.h. die Alternativen und verteilt diese auf verschiedene Auswahlsets.462 Zur Auswertung der Daten können einfache Häufigkeitszählungen der Ausprägungen innerhalb der ausgewählten Alternativen oder aber zur Nutzenschätzung auf Gruppenebene ein multinominales Logit-Modell angewendet werden.463 Da eine Schätzung der Teilnutzen auf Gruppenebene keine Möglichkeit bietet, individuelle Präferenzunterschiede zu berücksichtigen, wurden in den folgenden Jahren mit dem „CBC/Latent-Class Modul“ und dem „CBC/Hierarchical Bayes Modul“ zwei Ansätze vorgeschlagen, die eine Milderung des Problems versprechen. Bei dem Latent-Class Verfahren werden die Entscheidungsträger anhand des beobachteten Wahlverhaltens in verschiedene Segmente, d.h. Latent-Classes, eingeteilt und entsprechende zielgruppenspezifische Nutzenfunktionen bestimmt. In einem zweiten Schritt kann ausgehend von diesen segmentspezifischen Nutzenfunktionen die Segmentzugehörigkeitswahrscheinlichkeit einzelner Entscheider zu einer Gruppe geschätzt werden464 Ziel des CBC/Hierarchical Bayes Ansatzes ist es 459

Die CBC Software kann maximal 10 Eigenschaften mit je höchstens 15 Ausprägungen berücksichtigen. Mit Hilfe des Advanced Design Zusatzmoduls kann diese Zahl theoretisch sogar auf bis zu 30 Attribute mit jeweils maximal 100 Ausprägungen gesteigert werden (vgl. Johnson; Orme (2003), 1). Johnson (2002, 47) geht jedoch davon aus, dass lediglich maximal 6 Eigenschaften mit der CBC untersucht werden sollten. Ist die Anzahl der untersuchten Eigenschaften zu groß, muss insbesondere bei der CBC mit der Anwendung von Vereinfachungsstrategien bei der Bewertung der Alternativen durch die Entscheidungsträger gerechnet werden (vgl. Orme (2003), 4). Da bei der Choice-Based-Conjoint mehrere Vollprofilkonzepte simultan innerhalb eines Choice-Sets berücksichtigt werden müssen, liegt die Zahl der Eigenschaften, die in die Analyse aufgenommen werden kann, deutlich unter der von Green; Srinivasan (1990, 8) vorgeschlagenen Grenze für Vollprofilmethoden von 6 oder weniger Merkmalen (vgl. Orme (2003), 4; Sawtooth Software (2001b), 3). Eine Möglichkeit, mehr Eigenschaften zu untersuchen, bietet die “Dual Conjoint”. Die Dual Conjoint besteht aus einer Kombination von ACA und CBC. Dabei werden mit Hilfe der ACA eine Vielzahl von Eigenschaften untersucht, bei der CBC jedoch nur eine Teilmenge wie die Attribute „Preis“, „Marke“ und ein Superattribut (siehe Kapitel 4.1.6), das verschiedene Qualitätsmerkmale umfasst, betrachtet (vgl. Sawtooth Software (2001b), 3; Pinnell (1994), 4). 460 Vgl. Sawtooth Software (2001b), 6, 15. 461

Vgl. Sawtooth Software (2001b), 6. Zur Bedeutung der Anzahl der Fragen bei einer wahlbasierten Präferenzmessung siehe auch Sattler; Hartmann; Kröger (2003, 1ff.). Die Auswertung der Daten erfolgt bei der CBC auf Gruppenebene, d.h. im Extremfall könnte ein Entscheidungsträger lediglich gebeten werden, eine einzige Auswahlentscheidung zu treffen (vgl. Sattler; Hartmann; Kröger (2003), 1; Orme (2002a), 46). Schon allein aus Kostengründen scheint eine solche Vorgehensweise jedoch nicht sinnvoll (vgl. Orme (2002a), 47). Daher muss der Marktforscher ausgehend von der Komplexität der Bewertungen die Anzahl der von einem Befragungsteilnehmer getroffenen Wahlentscheidungen festlegen. Als Obergrenze gelten dabei 20 Auswahlfragen (vgl. Johnson; Orme (1996), 7). 462 Siehe dazu Sawtooth Software (2001b), 12ff. 463 464

74

Vgl. Sawtooth Software (2001b), 15ff. Vgl. Sawtooth Software (2004), 1f.; Teichert (2000c), 228ff.

schließlich, mehr oder weniger „individuelle“ Nutzenfunktionen auch bei wahlbasierten Conjoint-Analysen zu bestimmen.465 Dabei werden zur Schätzung der individuellen Nutzenwerte Informationen über die Verteilung der Teilnutzen auf Gruppenebene herangezogen.466 Verfahren zur Berücksichtigung nicht-kompensatorischer Entscheidungsprozesse

In einer weiteren Gruppe von Präferenzmessverfahren wird berücksichtigt, dass bei realen Kaufentscheidungen häufig mit sehr unterschiedlichen Arten von Entscheidungsprozessen zu rechnen ist. In einem ersten nicht-kompensatorischen Schritt werden deshalb alle nicht akzeptablen Alternativen eliminiert und lediglich die akzeptablen Produkte in einem zweiten, kompensatorischen Schritt genauer bewertet. Häufig wird bei den Methoden zur Präferenzmessung davon ausgegangen, dass zwischen den Eigenschaften vollständig kompensatorische Beziehungen bestehen467 - weist beispielsweise eine Alternative eine vom Entschei-

dungsträger weniger bevorzugte Ausprägung auf, so kann dies durch eine Merkmalsausprägung eines anderen Attributs ausgeglichen werden. Grundvoraussetzung für eine solche Vorgehensweise ist, dass sich keinerlei völlig unakzeptable Merkmalsausprägungen im Eigenschaftsset befinden, d.h. Ausprägungen, die einem Entscheidungsträger so wenig Nutzen stiften würden, dass er eine Alternative, die diese Ausprägung aufweist, auf jeden Fall ablehnen würde. Nicht-kompensatorische Entscheidungsstrategien468 können zu verzerrten Ergebnissen der Präferenzmessung führen. Aus diesem Grund wurden spezielle Verfahren entwickelt, bei denen in einem ersten Schritt völlig unakzeptable Eigenschaftsausprägungen auf individueller Ebene eliminiert werden können. Typische Verfahren, die eine Eliminierung der völlig unakzeptablen Eigenschaftsausprägungen ermöglichen, sind die Adaptive Conjoint Analysis und die Conjunctive Compensatory Self-Explicated Methode. Mit Hilfe von Verfahren wie der Limit ConjointAnalyse469 und der erweiterten Limit Conjoint-Analyse470 werden völlig unakzeptable Alternativen bestimmt und aus der Nutzenschätzung ausgeschlossen. Malhotra (1986, 34) schlägt eine weitere Methode vor, bei der nicht nur einzelne Ausprägungen, sondern ebenfalls völlig unakzeptable, multiattributive Alternativen aus dem Erhebungsdesign ausgeschlossen und lediglich akzeptable Stimuli von den Entscheidungsträgern eingeschätzt werden. Ziel ist es, lediglich die Alternativen des Evoked-Sets bei der Präferenzmessung zu berücksichtigen. Ein

465 466 467 468 469 470

Vgl. Green; Krieger (2002a), 25. Vgl. Sawtooth Software (2005b), 4ff.; Allenby; Ginter (1995), 394. Für eine ausführliche Beschreibung der Parameterschätzung siehe Sawtooth Software (2005b), 7ff.; Allenby; Rossi (2003), 5ff. Vgl. Green; Srinivasan (1978), 104, 118. Siehe Kapitel 2.3 und 4.2.4. Vgl. Voeth; Hahn (1998), 120ff.; Perrey (1998), 89. Vgl. Voeth (2000), 165ff.

75

ähnlicher Grundgedanke wird auch bei Anwendung der MaiK-Conjoint-Analyse verfolgt, d.h. es sollen nur Alternativen aus dem Evoked-Set untersucht werden, die sich der Entscheidungsträger selbst konstruiert.471 Incentivierung der Befragung

Häufig erhalten Entscheidungsträger für die Teilnahme an einer Studie zur Präferenzmessung ein Incentive, dessen Wert unabhängig von den gegebenen Antworten ist; z.B. könnte eine bestimmte Geldsumme für die Beantwortung des Fragebogens gezahlt werden. Die Auszahlung ist selten von der Güte der Bewertungen abhängig. Dies könnte die Ergebnisse der Präferenzmessung verschlechtern und weniger „reale“ Bewertungen hervorrufen.472 Ding; Grewal; Liechty (2005, 68ff.) schlagen deshalb eine weitere Variante der Conjoint-Analyse vor, bei der die Höhe des Incentives von der Beziehung zwischen den Bewertungen und dem tatsächlichen Kaufverhalten abhängig ist. In der im Rahmen dieser Studie vorgestellten ConjointAnalyse erhielten die Entscheidungsträger jeweils die, auf Basis der geschätzten Teilnutzen prognostizierte, aus einem Set möglicher Kombinationen bevorzugte Alternative als Incentive bzw. konnten diese zu einem günstigeren Preis erwerben.473 Zusammenfassend verdeutlichen die hier präsentierten Methoden zur Präferenzmessung, dass dem Marktforscher zur Durchführung einer Studie eine Vielzahl an Verfahren zur Verfügung stehen, aus der er eine auswählen muss. Um die Selektion zu erleichtern, könnte zunächst die bisherige praktische Relevanz der verschiedenen Methoden berücksichtigt werden. Bei Verfahren, die bereits häufig eingesetzt wurden, kann eher davon ausgegangen werden, dass methodenspezifische Vor- und Nachteile bekannt sind und diese deshalb genauer als andere Verfahren eingeschätzt werden können, die bisher nur selten in empirischen Untersuchungen genutzt wurden. In einem zweiten Schritt der Selektion müssen typische methodenspezifische Faktoren beachtet werden, die Einfluss auf die Ergebnisse und die Güte der Präferenzmes-

sung ausüben bzw. diese determinieren.

471 472 473

76

Vgl. Köcher (1997), 145ff.; Fischer (2001), 130ff. Vgl. Ding; Grewal; Liechty (2005), 68. Diese Conjoint-Analyse Variante ist gleichwohl nur bei solchen Untersuchungsobjekten sinnvoll einsetzbar, die ohne weiteres in verschiedenen Kombinationen produziert werden können. Hauser; Urban (1977, 69) erheben so beispielsweise die Präferenzen für ein „Chinesisches Menü“ mit verschiedenen Gängen. Dagegen bietet sich diese Art der Conjoint-Analyse nicht an, wenn komplexe und teure Produkte untersucht werden sollen bzw. keine Prototypen hergestellt werden können (vgl. Hauser; Urban (1977), 78).

3.1.2 Praktische Bedeutung der Verfahren zur Präferenzmessung

Bei der Selektion einer Methode zur Präferenzmessung könnte, wie bereits erwähnt, zunächst berücksichtigt werden, wie häufig ein bestimmtes Verfahren in praktischen Anwendungen bisher genutzt wurde (siehe Tabelle 4).

Meta -Studie

Autoren

Stichprobengröße

17 Marktforschungsinstitute

Wittink; Cattin (1989), 92

Wittink; Vriens; Burhenne (1992), 12474

66 Marktforschungsinstitute

59 Marktforschungsinstitute

Voeth (1999), 161

Hartmann; Sattler (2002), 3 * Mehrfachnennungen möglich

ca. 55 Studien475

54 Marktforschungsinstitute

USA

USA

Europa

Deutschland

Deutschland, Österreich, Schweiz

1971-1980

1981-1985

1986-1991

1996-1998

2001

mit simultaner Präsentation aller Stimuli/ „klassische“ ConjointAnalyse

56 %

61 %

24 %

ca. 50 %

20 %*

Trade-off Matrizen Self-Explicated Methoden ACA Hybride Conjoint-Analyse Paarvergleiche Choice Based Varianten der Conjoint-Analyse Kombination verschiedener Methoden Sonstige Verfahren

27 %

6%

15 %

-

-

42 %

14 %* 34 %*

-

10 %

4%

30 % 2% -

-

-

-

-

47 %*

Untersuchungsregion Untersuchungszeitraum Full-Profile Darstellung

Präferenzmessmethoden

Cattin; Wittink (1982), 47

8 %*

14 %

10 %

5%

-

-

3%

13 %

10 %

ca. 23 %

-

Tabelle 4: Häufigkeit der Nutzung verschiedener Verfahren zur Präferenzmessung

Anhand der Ergebnisse in Tabelle 4 wird deutlich, dass in der Marketing-Praxis vor allem die verschiedenen Varianten der Conjoint-Analyse dominieren. Wobei jedoch einige dieser dekompositionellen Verfahren, wie beispielsweise die Trade-off Matrizen, nur noch selten zur Präferenzmessung eingesetzt werden. Die „klassischen“ Verfahrensvarianten der ConjointAnalyse scheinen ebenso tendenziell an Bedeutung zu verlieren, was nicht zuletzt daran liegt, dass, wie in Kapitel 3.1 beschrieben, inzwischen eine Vielzahl an Verfahrensvarianten entwickelt wurde. Über die zukünftige Entwicklung der Beliebtheit der Verfahren zur Präferenzmessung besteht teilweise Uneinigkeit. Einige Forscher wie Gibson (2001, 16ff.) oder Gibson; Marder (2002, 47ff.) empfehlen, stärker einfache Verfahren wie Self-Explicated Methoden einzusetzen. Dies gilt insbesondere, weil die Autoren davon ausgehen, dass im Rahmen der Präferenzmessung eine Vielzahl an Eigenschaften berücksichtigt werden muss. Im Gegensatz dazu prognostizieren beispielsweise Green; Krieger (2002a, 25ff.) eine wachsende Bedeutung der wahlbasierten Verfahren zur Präferenzmessung. Gensler (2006, 319) vermutet, dass bereits jetzt die 474 475

Siehe auch Wittink; Vriens; Burhenne (1994), 44. Insgesamt wurden 150 Studien im Zeitraum von 1979 bis 1998 untersucht. Um zeitliche Veränderungen in der Nutzungshäufigkeit darstellen zu können, werden hier nur die Studien aus dem Zeitraum von 1996-1998 präsentiert.

77

wahlbasierten Methoden die am häufigsten eingesetzten Präferenzmessverfahren sind. Diese Methoden könnten insbesondere deshalb in der künftigen Praxis eine größere Rolle spielen, weil die Existenz entsprechender kommerzieller Software auch die Anwendung komplexer Präferenzmessmethoden ermöglicht.476 Das Vorhandensein einer entsprechenden Software zur Erhebung und Auswertung der Präferenzen hat demnach einen dominanten Einfluss auf die Anwendungshäufigkeit der jeweiligen Verfahren, d.h. bei praktischen Anwendungen stehen für den Marktforscher oftmals Kriterien wie die Einfachheit der Datenerhebung und –auswertung bei der Selektion einer Methode im Mittelpunkt.477 Werden die Präferenzen von Entscheidungsträgern erhoben, sollte die Einfachheit der Datenerhebung und –auswertung allerdings nicht dass alleinige Selektionskriterium für eine bestimmte Methode darstellen. Bei der Auswahl eines Verfahrens ist es notwendig, weitere methodenspezifische Einflussgrößen zu beachten. Sie üben einen erheblichen – teilweise dominanten – Einfluss auf die Schätzwerte und Güte der Präferenzmessung aus. Werden diese Faktoren nicht berücksichtigt, ist mit verzerrten Teilnutzen zu rechnen, so dass reale Wahlentscheidungen nur sehr eingeschränkt prognostiziert werden können. Im folgenden Kapitel werden deshalb entscheidende Kriterien bei der Selektion von Verfahren zur Präferenzmessung beschrieben und deren Auswirkungen diskutiert.

3.1.3 Herausforderungen bei der Selektion einer Methode zur Erfassung von Präferenzen

Die Bestimmung eines zur Präferenzmessung geeigneten Verfahrens steht bisher im Mittelpunkt der Forschung. Die Eignung der verschiedenen Verfahrensvarianten wird dabei durch empirische oder theoriebasierte Methodenvergleiche eingeschätzt. Ziel dieser Verfahrensentwicklungen und Vergleiche ist die Bestimmung bzw. Selektion eines „dominanten“ Verfahrens, das „besser“ als die anderen Methoden zur Erfassung der Nachfragerpräferenzen geeignet ist. Bei einem Methodenvergleich und zur Einschätzung verschiedener Methoden haben folgende Faktoren einen Einfluss auf die Güte der Präferenzmessung: -

476 477 478

78

die genutzte Art der Datenerhebung478 und Skalenart,479

Vgl. Green; Krieger (2002a), 25ff. Vgl. Green; Krieger; Wind (2001), 69. Dazu zählt die Art des Erhebungsdesigns (vgl. Darmon; Rouziès (1991), 320f.; siehe zum Erhebungsdesign Kapitel 3.4) und die Präsentationsform der Alternativen (siehe Kapitel 3.5).

die Komplexität des Entscheidungsproblems, d.h. die Anzahl der Eigenschaften und Ausprägungen,480 die unterstellte Nutzenfunktion bzw. das Auftreten von Interaktionseffekten,481 die Berücksichtigung völlig unakzeptabler Eigenschaftsausprägungen,482 das Schätzverfahren,483 das Untersuchungsobjekt bzw. die Art des Kaufentscheidungsprozesses, der bei einem bestimmten Untersuchungsobjekt vom Entscheidungsträger genutzt wird,484 der Entscheidungsträger selbst,485 die Konstruktion der Alternativen im Hold-out Set bzw. der Referenzmethode,486 die Art des unterstellten Modells zur Prognose von Wahlentscheidungen,487 die zur Beantwortung des Fragebogens zur Verfügung gestellte Zeit,488 der Zeitraum zwischen der Erhebung der Präferenzen und der Einschätzung des Hold-out Sets bzw. der Referenzmethode,489 die Art der verwendeten Gütemaße,490 die Art der Befragung (d.h. schriftlich, computergestützt usw.)491 und falls ein Entscheidungsträger Fragebögen mehrerer Verfahren zur Präferenzmessung hintereinander nutzt, auch die Reihenfolge der Messvarianten492 und damit die relative Vorziehenswürdigkeit einer Methode.493 -

Je nach Ausgestaltung dieser Faktoren durch den Marktforscher erscheinen u.U. andere Methoden vorteilhaft. Eine Gegenüberstellung und die Selektion eines Verfahrens sind somit nur 479

Vgl. Baier; Säuberlich (1997), 865. Dabei hat auch die Art, wie die geschätzten Teilnutzen standardisiert werden, einen Einfluss auf die Ergebnisse der Präferenzmessung. Studien, bei denen die Art der Standardisierung nicht offengelegt wurde, können deshalb nur eingeschränkt interpretiert und verglichen werden (vgl. Gutsche (1995), 135; siehe Kapitel 3.7). 480 Vgl. Helm; Steiner; Scholl; Manthey (2004), 18f. 481 482

Siehe Kapitel 4.2.3. Siehe Kapitel 4.1.4 und 5.7.1.

483

Vgl. Baier; Säuberlich (1997), 865; Darmon; Rouziès (1991), 320f. Äußerst problematisch ist dabei insbesondere, dass die genauen Schätzalgorithmen bei den verschiedenen Softwareverfahren nicht vollständig publiziert sind, d.h. aus Sicht des Marktforschers handelt es sich bei einigen Verfahren um eine „Black-Box“ (vgl. Melles (2001), 79), was einen Vergleich dieser Methoden mit anderen Verfahren der Präferenzmessung erschwert bzw. unmöglich macht. 484 Vgl. Albrecht (2000), 189, 459; Orme (2002a), 46. 485 486

Siehe Anhang II. Vgl. Albrecht (2000), 186f.; Griffin; Hauser (1993), 21.

487

Je nach unterstelltem Wahlmodell (siehe Kapitel 3.9) können sich die geschätzten Marktanteile stark unterscheiden (vgl. Green; Krieger (1996), 864). In der Regel werden die Befragungsteilnehmer gebeten, den Fragebogen in einem relativ eingeschränkten Zeitraum zu beantworten. Hoepfl; Huber (1970, 410) stellen den Entscheidungsträgern jedoch einen Zeitraum von 4-6 Wochen zur Verfügung. 489 Vgl. Albrecht (2000), 187. 488

490 491 492 493

Vgl. Albrecht (2000), 3. Vgl. Orme (2002a), 46. Vgl. Srinivasan; Park (1997), 291; Albrecht (2000), 2, 185. Aufgrund der Vielzahl an Entscheidungen, die der Marktforscher zu fällen hat und die die Ergebnisse der Präferenzmessung erheblich beeinflussen, kommt Griffin; Hauser (1993, 23) zu dem Fazit, dass oftmals keine eindeutig „richtigen“ Entscheidungen über die Gestaltung einer Studie zur Präferenzmessung möglich sind und dass die „Conjoint analysis has pushed marketing research much closer to a science, but it remains an art“ (Griffin; Hauser (1993), 23).

79

sinnvoll, wenn die zu untersuchenden Methoden bezüglich der Ausprägung der Einflussgrößen überhaupt vergleichbar sind und die oben genannten Faktoren explizit berücksichtigt werden. Diese Einflussgrößen wurden bei vielen bisherigen Methodenvergleichen nicht oder nur unzureichend beachtet.494 Entsprechend sind bei Vergleichsstudien sehr heterogene Ergebnisse bezüglich der Güte und Vorziehenswürdigkeit einer Präferenzmessmethode zu beobachten.495 So kann allein die Ähnlichkeit zwischen Präferenzmessmethode und Gestaltung des Hold-out Sets bzw. der Referenzmethode die Ergebnisse der Prognosevalidität zugunsten eines bestimmten Verfahrens beeinflussen.496 Aber insbesondere die vom Marktforscher gewählte Vorgehensweise zur Festlegung der Alternativen im Hold-out Set bzw. der Referenzmethode kann einen systematischen Einfluss zugunsten eines Verfahrens ausüben.497 Die Einschätzung und Selektion einer Präferenzmessmethode anhand der verschiedenen Vergleichsstudien bzw. auf Basis von Meta-Studien ist jedoch auch bei der Berücksichtigung dieser Einflussgrößen problematisch, weil „derartige Tests zumeist von den Vertretern der jeweiligen Forschergruppen durchgeführt wurden und sich dabei nahezu selbstverständlicherweise

494

Um eine Variante des AHP und eine Variante der Conjoint-Analyse miteinander zu vergleichen, nutzen Helm; Manthey; Scholl; Steiner (2002, 517ff.) zum Beispiel jeweils eine Skala mit einer identischen Anzahl an Skalenpunkten, verwenden bei beiden Methoden Paarvergleiche, variieren die Reihenfolge der Methoden der Präferenzmessung systematisch und untersuchen eine möglichst homogene Gruppe von Entscheidungsträgern. Im Gegensatz dazu nutzen Green; Goldberg; Wiley (1983, 147ff.) für einen Vergleich zwischen Self-Explicated Methode, traditioneller Conjoint-Analyse und hybrider Conjoint-Analyse unterschiedliche Skalen. Bei der Self-Explicated Methode werden die Ausprägungen lediglich auf einer 4 Punkte Rating-Skala bewertet. Die Mehrzahl der untersuchten Eigenschaften wies dabei 4 Ausprägungen auf. Der Entscheidungsträger kann somit nicht wirklich differenzierte Bewertungen treffen, sondern lediglich eine Rangfolge der Vorziehenswürdigkeit abgeben - entsprechend schlecht sind die Ergebnisse für die Self-Explicated Methode. Auch bei der traditionellen CA sollten insgesamt 32 Stimuli auf einer 7 Punkte Rating-Skala eingeschätzt werden, der Proband musste also mehreren Alternativen den gleichen Wert zuweisen, auch wenn er zwischen diesen Alternativen nicht indifferent war. Andererseits bewerteten die Entscheidungsträger bei der hybriden Variante jeweils lediglich 8 Stimuli auf einer 7 Punkte Rating-Skala, d.h. nur zwei Alternativen musste der gleiche Punktwert zugewiesen werden. Die Entscheidungsträger konnten somit die vorgegebenen Alternativen differenzierter beurteilen. Insofern ist es nicht verwunderlich, dass das hybride Verfahren die Self-Explicated Methode und die traditionelle Conjoint-Analyse „outperformed“ hat (vgl. Green; Goldberg; Wiley (1983), 149f.). 495 Siehe dazu auch Baier; Säuberlich (1997), 865 oder Albrecht (2000), 2f., 185f. 496 497

80

Vgl. Albrecht (2000), 186f. Vgl. Griffin; Hauser (1993), 21.

die besseren Ergebnisse für das eigene Verfahren erzielen ließen.“498 Entsprechend kritisch sind manche Methodenvergleiche und die Ergebnisse von Meta-Studien zu hinterfragen. Insgesamt scheint es insbesondere vor dem Hintergrund der Vielzahl an Einflussfaktoren keine dominante Vorgehensweise zur Erfassung von Konsumentenpräferenzen zu geben - jedes

Verfahren hat entsprechende Vor- und Nachteile, die bei einer Selektion zu beachten sind.499 Generell hat der Marktforscher durch die Selektion der Präferenzmessmethode, die zu untersuchenden Eigenschaften und Ausprägungen sowie durch eine Variation der oben genannten Einflussgrößen einen erheblichen Einfluss auf die Ergebnisse und die Güte der Präferenzmessung.500 Green; Krieger (2002a, 27) schlussfolgern deshalb, dass “it’s wise to put trust in the supplier’s experience and knowledge of the chosen technique, whether self-explicated, hybr-

id, or discrete choice”.501 Es stellen sich bei der Selektion einer Methode derzeit zwei weitgehend ungelöste Problemfelder: 1. Welche Eigenschaften sollten in die Untersuchung aufgenommen werden?

498

Perrey (1998), 83. Siehe auch Orme (2002a), 46. Ein typisches Beispiel dafür liefern eine Reihe von Artikeln in der „Marketing Research“ aus den Jahren 2001 bis 2002. Ausgangspunkt der Diskussion ist ein Beitrag von Gibson (2001, 16ff.), der beklagt, dass es kein Verfahren gibt, mit dem die Relevanz von Merkmalen schon vor der Präferenzmessung bestimmt werden kann. Aus diesem Grund wird die Eignung der Conjoint-Analyse generell in Frage gestellt, weil mit diesem Verfahren nur eine geringe Anzahl an Eigenschaften und Ausprägungen berücksichtigt werden kann. Er plädiert dafür, dass alle potenziell relevanten Merkmale und Ausprägungen in eine Studie aufgenommen und untersucht werden. Gibson (2001, 16ff.) geht davon aus, dass dies lediglich mit Hilfe von Self-Explicated Methoden (und insbesondere mit der von ihm entwickelten SUMM Methode) möglich wäre. In einem folgenden Artikel stellen Green; Krieger (2002a, 24ff.) generell die Vorteilhaftigkeit von Self-Explicated Methoden in Frage, jedoch indem sie die Nachteile einer Variante der Self-Explicated Methode beschreiben, die inzwischen nicht mehr eingesetzt wird. Ausgehend von den Ergebnissen einer einzelnen Studie, in der eine bestimmte Variante einer Präferenzmessmethode genutzt wurde, wird auf die Vorteilhaftigkeit einer ganzen Gruppe von Verfahren geschlossen, und das obwohl sich Gibson (2001, 16ff.) in seiner Kritik an der Conjoint-Analyse explizit auf eine Reihe aktuellerer Varianten der Self-Explicated Methoden bezog (siehe dazu auch Gerstley; Marder (2002), 40; Gibson; Marder (2002), 48). In beiden Artikeln wurde somit jeweils der „eigene“ Standpunkt durch die Nutzung selektiver Beispiele untermauert. Entsprechend kritisch waren die Reaktionen anderer Wissenschaftler – für die Kritik an beiden Artikeln siehe Johnson (2002), 47f.; McCullough (2002a), 48f.; Gibson (2002), 49f.; Green; Krieger (2002b), 40; Gerstley; Marder (2002), 40; Gibson; Marder (2002), 47f.; und Orme (2002a), 46f. 499 Vgl. Melles (2001), 61; Orme (2002a), 46; Green; Krieger; Agarwal (1993), 370; Albrecht (2000), 55; Orme (2002b), 1, 5; Teichert (2000b), 156; Green; Helsen (1989), 349; Orme (2003), 1; Huber (1997), 243. Problematisch ist jedoch, dass einige Einschätzungen der Vor- und Nachteile von Methoden zudem lediglich auf Basis subjektiver Einschätzungen gefällt werden, was eine systematische Selektion von Verfahren zur Präferenzmessung erschwert. Beispielsweise bewerten einige Marktforscher eine Methode schlechter als andere, weil sie „simply doesn’t believe“ (Gibson; Marder (2002), 48) dass eine bestimmte Methode valide Ergebnisse liefern kann. 500 Vgl. McCullough (2002b), 19; Gibson (2001), 16; Green; Krieger (2002a), 27. Nicht sinnvoll interpretierbare Schätzergebnisse (z.B. ein höherer Teilnutzen bei einem höheren Preis) schreibt McCullough (2002b, 19) deshalb nicht dem jeweiligen Verfahren zur Präferenzmessung, sondern Fehlern des Marktforschers zu. Der Einfluss des Marktforschers auf die Ergebnisse der Präferenzmessung ist demnach insgesamt höher als potenzielle methodenbedingte Einflüsse (vgl. McCullough (2002a), 48). Dies erweist sich insbesondere bei den Verfahren als Problem, deren Vorgehensweise nicht vollständig offengelegt wurde; so betrifft es insbesondere die ACA. Während die Vorgehensweise der Verfahren bei der Anwendung traditioneller Methoden der Präferenzmessung für den Marktforscher genau nachvollziehbar ist, ergibt sich jedoch bei der Nutzung von Software zur Präferenzmessung das Problem, dass der Marktforscher nicht in jedem Fall sämtliche Einflussfaktoren auf die Güte der Präferenzmessung kennt und Fehler begeht, derer er sich gar nicht bewusst ist bzw. bewusst sein kann (vgl. McCullough (2002b), 19). 501 Green; Krieger (2002a), 27.

81

2. Unter welchen Bedingungen sollte ein bestimmtes Verfahren zur Präferenzmessung eingesetzt werden?502 Problem 1 verdeutlicht Gibson (2001, 18): “While different experts provide different counsel on how to select the attributes, the process ultimately comes down to expert judgments of importance. This critical process of selecting the attributes and levels is plagued with difficult logical problems. For example the process is intrinsically circular. In order to conduct a study to determine the significance of particular attributes and levels, researchers must select which attributes and levels are important enough to include in the study. If anyone actually knew a priori which attributes and levels were important enough, the study would not be necessary.”503 Derzeit wird versucht, dieses Problem zu lösen, indem möglichst viele bzw. „ideally, all the attributes and levels that could affect choice“504 in eine Studie zur Präferenzmessung aufgenommen werden. Entsprechend werden Methoden genutzt bzw. entwickelt, die möglichst viele Eigenschaften in einer Untersuchung berücksichtigen können. Gibson (2001, 18) präferiert deshalb zur Präferenzmessung eine Variante der Self-Explicated Methoden. Auch Johnson (2002, 47) sieht in der von ihm entwickelten Adaptive Conjoint-Analysis (ACA) im ersten Befragungsteil vor allem eine Methode zur Selektion relevanter Eigenschaften. Er geht davon aus, dass „Conjoint methods do require careful preliminary research to arrive at a subset of salient attributes and levels. The hybrid approach of adaptive conjoint analysis (ACA) does this by first using a brief self-explicated section”505. Beiden Vorgehensweisen liegt der Gedanke zugrunde, dass die vom Marktforscher vor der Präferenzmessung festgelegten Eigenschaften bezüglich ihrer Zahl, Art und Ausprägungen so wenig wie möglich eingeschränkt und durch das Präferenzmessverfahren selbst die relevanten Merkmale ermittelt werden. Da Konsumentenbefragungen zumeist mit einem hohen finanziellen Aufwand verbunden sind,506 stellt sich allerdings die Frage, ob dieser Selektionsprozess der zu untersuchenden Eigenschaften nicht schon vor der eigentlichen Präferenzmessung erfolgen kann. Weiterhin kann durch die von Gibson (2001, 18) propagierte Nutzung von Experten zur Bestimmung von Eigenschaften und Ausprägungen keinesfalls garantiert werden, dass tatsächlich die aus Sicht der Konsumenten relevanten Merkmale und Ausprägungen in dieser umfangreichen 502

Im Fokus steht somit nicht mehr die Entwicklung weiterer neuer Verfahren, sondern zunächst ein systematischer Methodenvergleich. Erst dieser ermöglicht es, die bestehenden Verfahren einzuschätzen. Ziel sollte es dabei nicht mehr sein, ein „dominantes“ Verfahren zu finden, sondern Richtlinien zur Vorteilhaftigkeit verschiedener Methoden je nach Untersuchungskontext zu entwickeln. 503 Gibson (2001), 18. Siehe auch Gibson; Marder (2002), 47. 504 505 506

82

Gibson (2001), 18. Johnson (2002), 47. Vgl. Orme (2002a), 47.

Liste überhaupt enthalten sind. Zudem stellt keines der Präferenzmessverfahren sicher, dass das Eigenschaftsset die relevanten Merkmalsausprägungen einer Zielgruppe enthält. Schließlich erscheint eine solche „umfassende“ Berücksichtigung aller potenziell relevanter Merkmale nicht sinnvoll. Vielmehr sollten lediglich die tatsächlich wahlentscheidenden Merkmale und insbesondere Ausprägungen untersucht werden.507 Ziel sollte es deshalb sein, eine systematische Vorgehensweise zur Selektion von Eigenschaften und Ausprägungen vorzuschlagen, die den Einfluss des Marktforschers auf die

Ergebnisse der Präferenzmessung verringert und die Aussagekraft und Übertragbarkeit der Ergebnisse der Präferenzmessung erhöht.508 Das zweite Problem betrifft die Bedingungen, bei denen die Nutzung bestimmter Verfahren zur Präferenzmessung vorteilhaft erscheint. Bei der Interpretation der Ergebnisse eines Methodenvergleichs ist darauf zu achten, dass eben nicht „die“ dekompositionelle oder „die“ kompositionelle Vorgehensweise, sondern lediglich jeweils „eine“ dekompositionelle bzw. „eine“ kompositionelle Methode miteinander verglichen wurden.509 Wird beispielsweise lediglich die Skalenart variiert, kann u.U. ein anderes Verfahren vorteilhafter erscheinen. Um tatsächlich Empfehlungen über die Vorziehenswürdigkeit einer Methode in einem speziellen Untersuchungskontext ableiten zu können, sind deshalb eine Vielzahl von vergleichenden Studien notwendig, bei denen die Art der Präferenzmessung und die Einflussfaktoren systematisch variiert werden – anhand von Meta-Studien könnten danach Richtlinien zur Vorteilhaftigkeit von verschiedenen Methoden abgeleitet werden. Entsprechend gab es in der Vergangenheit eine Vielzahl von Studien, die verschiedenste Varianten der Präferenzmessung berücksichtigten.510 Jedoch scheint es aufgrund der Vielzahl an Einflussgrößen ausgeschlossen, die Vorteilhaftigkeit von Verfahren zur Präferenzmessung für jede mögliche Untersuchungssituation einschätzen zu können.511 Ziel von Meta-Studien sollte es somit sein, lediglich einen groben Rahmen für die Selektion von Präferenzmessmethoden zu bieten. Das Problem bei der Beurteilung der Verfahren im Rahmen vieler bisheriger Meta-Studien ist derzeit jedoch, dass letztendlich nur gezählt wird, wie oft welche Gruppe von Präferenzmessmethoden „bessere“ Ergebnisse lieferte; daraus werden danach allgemeine Schlussfolgerungen über

507 508

Siehe dazu auch Kapitel 4.2.1. Siehe Kapitel 6.

509

Dies gilt insbesondere für die ACA. Die verschiedenen Versionen unterscheiden sich, wie beschrieben, bezüglich der Art und Weise der Nutzenschätzung erheblich, so dass sich eine Einschätzung des Verfahrens immer nur auf eine Version beziehen kann. 510 Für entsprechende Meta-Studien siehe u.a. Albrecht (2000), 165ff.; Hensel-Börner (2000), 31ff., 42ff., 61ff.; Green; Krieger; Agarwal (1993), 369f.; Akaah; Korgaonkar (1983), 188; Green; Krieger (1996), 854; Gibson (2001), 19. 511 Vgl. Orme (2002a), 46.

83

die Vorziehenswürdigkeit einer Vorgehensweise gezogen.512 Meta-Studien, in denen die Einflussfaktoren auf die Güte der Präferenzmessung (zumindest teilweise) explizit berücksichtigt werden, gibt es dagegen kaum.513 Wie bereits beschrieben, ist es aufgrund der verschiedenen Einflussgrößen schwer möglich, alle Varianten der Präferenzmessverfahren miteinander zu vergleichen, da dazu eine Vielzahl empirischer Studien unter möglichst vergleichbaren Verhältnissen durchgeführt werden müssten. Dabei sollte eine bzw. ausgewählte Einflussgrößen systematisch variiert, während die anderen möglichst konstant gehalten werden. Möglicherweise könnte dieses Problem durch die Nutzung von Simulationen gelöst werden. Mit Hilfe von Simulationen könnten die Einflussfaktoren systematisch variiert und anhand synthetischer Präferenzdaten die Auswirkungen auf die Ergebnisse der Präferenzmessung untersucht werden.514 Weitere systematische Vergleichsstudien, entsprechende Meta-Studien, insbesondere aber die Nutzung von Simulationen könnten die dargestellte Forschungslücke schließen, so dass dann eine systematische Selektion bestimmter Verfahren zur Präferenzmessung erfolgen kann. Dies ist derzeit noch nicht möglich. Deshalb muss der Marktforscher, wie von Green; Krieger (2002a, 27) beschrieben, bisher mehr oder weniger auf Basis seiner Erfahrungen und den bisherigen Forschungsergebnissen eine Methode zur Präferenzmessung auswählen und in einem nächsten Schritt festlegen, auf welcher Skalenart die Präferenzen erhoben werden sollen.

3.2

Skalenarten bei der Präferenzmessung

Nachdem die Methode zur Präferenzmessung selektiert wurde, muss die Skalenart, auf der die Präferenzen erhoben werden, festgelegt werden. Die Art der genutzten Skala ergibt sich häufig bereits bei der Wahl der Präferenzmessmethode; so beruhen wahlbasierte Verfahren zur Präferenzmessung auf dichotomen Skalen (Alternative wurde gewählt bzw. nicht gewählt).515 Bei kompositionellen Methoden dominiert die Nutzung von Rating-Skalen, wobei in der Marktforschung zumeist 9 bis 11 Abstufungspunkte, in der Entscheidungsanalyse häufig Punktwerte von 0 bis 100 genutzt werden.516 512

Siehe beispielsweise Hensel-Börner (2000), 60.

513

Eine Ausnahme ist dabei die Meta-Studie von Helm; Scholl; Manthey; Steiner (2004, 18f.), bei der die Komplexität eines Bewertungsproblems und der Einfluss durch die Selektion von Befragungsteilnehmern berücksichtigt wird. Entsprechende Simulationen wurden jedoch bisher kaum und wenn, dann zur Untersuchung einzelner spezifischer Aspekte genutzt. Siehe als Beispiele u.a. Carmone; Green; Jain (1978), 300ff.; Darmon; Rouziès (1994), 469ff.; Teichert (1994), 621ff.; Teichert (1998), 1246ff. In anderen Marktforschungsbereichen ist die Nutzung von Simulationen zur Einschätzung verschiedener Verfahren dagegen üblich, so z.B. zur Einschätzung verschiedener Verfahren zur Clusteranalyse (siehe dazu u.a. SPSS (2001a), 5ff.; Chiu; Fang; Chen; Wang et al. (2001), 266ff.). 515 Vgl. u.a. Perrey (1998), 87ff. 514

516

84

Vgl. Albrecht (2000), 75.

Sollen, wie in dieser Arbeit, die Präferenzen mit Hilfe einer „klassischen“ Conjoint-Analyse erhoben werden, steht demgegenüber eine Vielzahl möglicher Skalenarten zur Verfügung. Dabei unterscheidet man typischerweise zwischen metrischen und nicht-metrischen Skalenarten (siehe Abbildung 9).517 Skalenarten nicht-metrische Skalen - dichotome Urteile - kategoriale Zuordnung - Rangfolgen

metrische Skalen - Rating-Skalen - Kaufwahrscheinlichkeiten - Dollarmetrik - Konstantsummenskalen - Magnitudenskalen

Abbildung 9: Mögliche Skalenarten zur Einschätzung von Alternativen bei der Conjoint-Analyse

Nicht-metrische Skalen

Zu den nicht-metrischen Skalen gehören einfache dichotome Urteile, die insbesondere bei wahlbasierten Methoden der Präferenzmessung Anwendung finden. Dabei werden lediglich Informationen über die Auswahl bzw. Nicht-Auswahl einer Alternative erhoben.518 Bei der kategorialen Zuordnung erfolgt eine Einteilung der zu bewertenden Alternativen in verschiedene Gruppen; so könnten die Stimuli beispielsweise in die Gruppen „präferierte Produkte“, „akzeptable Produkte“ oder „nicht akzeptable Produkte“ eingeordnet werden.519 Ebenso ist es möglich, die zu bewertenden Stimuli vom Entscheidungsträger entsprechend der wahrgenommenen Vorziehenswürdigkeit in eine Rangfolge bringen zu lassen.520 Da einige der ersten Varianten der Conjoint-Analyse auf der Bildung einer Rangfolge von Alternativen beruhten, wird die Nutzung dieser Skalenart teilweise als „klassische“ Vorgehensweise bezeichnet.521

517

Vgl. Green; Srinivasan (1978), 111.

518

Vgl. Albrecht (2000), 69; Schweikl (1985), 54. Zu den dichotomen Urteilen gehören ebenfalls Paarvergleiche, bei denen der Entscheidungsträger lediglich angibt, welche Alternative er bevorzugt (vgl. Green; Srinivasan (1978), 111; Schweikl (1985), 56). Dichotome Paarvergleiche weisen häufig eine relativ hohe Reliabilität auf und sind durch einen geringen kognitiven Aufwand für den Entscheidungsträger gekennzeichnet. Die Informationseffizienz ist jedoch gering, d.h. zur Nutzenschätzung ist eine Vielzahl an Einschätzungen notwendig, weshalb die Bildung von abgestuften Paarvergleichen im Gegensatz zu dichotomen Paarvergleichen oft bevorzugt wird (vgl. Green; Srinivasan (1978), 112). 519 Vgl. Albrecht (2000), 69; Hensel-Börner (2000), 22f. 520

Vgl. Green; Srinivasan (1978), 111; Albrecht (2000), 69; Hensel-Börner (2000), 23. Dabei kann man zwischen der Bildung einer Ranfolge mit und ohne „Wahlzwang“ unterscheiden, d.h. der Marktforscher kann dem Befragungsteilnehmer die Möglichkeit geben, Alternativen auch einen identischen Rangplatz zuzuweisen (ohne Wahlzwang) oder festlegen, dass ein Rangplatz lediglich durch einen Stimulus (mit Wahlzwang) belegt werden kann (vgl. Fischer (2001), 89). 521 Vgl. Albrecht (2000), 72; Schweikl (1985), 55. Hammann; Erichson (2000, 337) beschreiben die Bewertung von Alternativen mittels Rangbildung sogar als die „gebräuchlichste“ Art der Einschätzung im Rahmen der Conjoint-Analyse.

85

Werden die Präferenzen der Entscheider auf Basis einer Rangfolge erhoben, geht man davon aus, dass die Probanden nicht in der Lage sind, ihre Präferenzen auf einem metrischen Skalenniveau abzugeben, die erhobenen Daten deshalb nicht intervallskaliert sind.522 Wenn eine große Anzahl an Alternativen bewertet werden soll, steigt allerdings der Aufwand für die Befragungsteilnehmer sehr stark. Je höher die Zahl der einzuschätzenden Alternativen ist, desto eher muss deshalb mit der Anwendung von Vereinfachungsstrategien gerechnet werden. Die Nutzung von Rangreihen ist aus diesem Grund eher bei einer relativ geringen Komplexität des Entscheidungsproblems geeignet.523 Um die Bewertung einer Vielzahl von Alternativen zu erleichtern, können die Stimuli zunächst in verschiedene Gruppen eingeteilt und danach innerhalb dieser Gruppen in eine Rangfolge entsprechend der Vorziehenswürdigkeit gebracht werden.524 Eine solche Vorgehensweise fällt den Befragungsteilnehmern bei Untersuchung einer begrenzten Anzahl von Produkten relativ leicht und führt eher zu reliablen Ergebnissen.525 Verschiedene vergleichende Studien526 weisen jedoch auf eine Überlegenheit metrischer Skalen hin. Metrische Skalen

Insbesondere der tendenziell höhere Informationsgehalt der erhobenen Daten erweist sich als Vorteil bei der Nutzung metrischer Skalen.527 Die Grundannahme ist dabei, dass die Entscheidungsträger die zu bewertenden Alternativen nicht nur in eine Rangfolge bringen, sondern ebenso den wahrgenommenen Nutzenabstand zwischen den Stimuli angeben können.528 In der praktischen Anwendung dominieren metrische im Vergleich zu nicht-metrischen Skalen, besonders häufig werden Rating-Skalen zur Einschätzung der Alternativen genutzt.529 Eine Möglichkeit zur Erfassung von Präferenzen auf metrischem Skalenniveau bietet die Konstantsummenskala. Der Entscheider wird bei dieser Skalenart gebeten, eine fest vorge-

gebene Punktzahl (z.B. 10 bzw. 100 Punkte) auf die zu untersuchenden Alternativen entspre-

522

Vgl. Green; Devita (1974), 57; Huber (1987), 2.

523

Vgl. Green; Rao (1971), 359f.; Schubert (1991), 170f.; Albrecht (2000), 72; Teichert (2000b), 148. Bei einer relativ hohen Zahl an einzuschätzenden Alternativen könnte ein Interviewer Hilfestellungen geben (vgl. Schweikl (1985), 54). Green; Srinivasan (1978, 109) gehen davon aus, dass bei Nutzung von Rangreihen nicht mehr als 30 Stimuli untersucht werden sollten. 524 Vgl. Green; Srinivasan (1978), 112; Albrecht (2000), 72; Schweikl (1985), 55. 525 526 527 528 529

86

Vgl. Green; Srinivasan (1978), 112; Fischer (2001), 88; Melles; Holling (1998), 11; Mulye (1998), 267. Für einen Überblick siehe Albrecht (2000), 74. Vgl. Green; Srinivasan (1978), 112. Schweikl (1985, 117) empfiehlt deshalb die Nutzung eines möglichst hohen Skalenniveaus bei der Präferenzmessung. Vgl. Albrecht (2000), 74. Vgl. Albrecht (2000), 74 und Wittink; Cattin (1989), 92f.; Wittink; Vriens; Burhenne (1994), 44.

chend der Präferenz zu verteilen.530 Die Bewertung der Alternativen ist dagegen mit einem vergleichsweise hohen kognitiven Aufwand verbunden, so dass sich der Befragungsteilnehmer u.U. mehr darauf konzentriert, die Punkte so aufzuteilen, dass die korrekte Gesamtpunktzahl vergeben wird, als seine tatsächlichen Präferenzen zu offenbaren.531 Die Alternativen können auch durch eine direkte Abfrage von Kaufwahrscheinlichkeiten bewertet werden. Für den Auftraggeber ist eine solche Skalenart bei relativ neuen Produkten von besonderem Interesse, weil erste Informationen über mögliche Kaufentscheidungen direkt abgeleitet werden können.532 Bei der Anwendung einer Dollarmetrik werden die Entscheidungsträger gebeten, Preise zu nennen, die sie für die jeweilige Alternative bezahlen würden.533 Bei der Nutzung von Paarvergleichen wird die Aufgabe dahingehend angepasst, dass zunächst erfasst wird, welche Alternative ein Proband bevorzugt und danach erhoben wird, um wie viele Einheiten der Preis der präferierten Alternative steigen müsste, so dass der Entscheidungsträger zwischen beiden Stimuli indifferent ist.534 Damit von intervallskalierten Daten ausgegangen werden kann,535 muss ein konstanter Unterschied in der Zahlungsbereitschaft zwischen verschiedenen Alternativen immer einen konstanten Nutzenunterschied hervorrufen.536 Die Vorteile einer Dollarmetrik sind, dass die Skala nach oben offen und die Bezeichnung der Skalenpunkte für alle Entscheidungsträger eindeutig ist.537 Die Nutzung der Dollarmetrik ist jedoch in den Produktbereichen problematisch, bei denen Preis-Qualitäts-Irradiationen auftreten können.538 Bei der Nutzung einer Dollarmetrik ist zudem damit zu rechnen, dass die Befragungsteilnehmer bei

530

Vgl. Albrecht (2000), 70; Schubert (1991), 174; Fischer (2001), 90; Hensel-Börner (2000), 23; Teichert (2000b), 147. Auch bei Paarvergleichen können Konstantsummenskalen zur Bewertung von Alternativenpaaren eingesetzt werden. Dabei wird eine vorgegebene Punktzahl auf zwei Alternativen aufgeteilt (vgl. Hammann; Erichson (2000), 378ff). Durch die Nutzung der Konstantsummenskala kann möglicherweise eher als beispielsweise bei Anwendung von Rating-Skalen davon ausgegangen werden, dass tatsächlich ratioskalierte Daten vorliegen (vgl. Green; Srinivasan (1978), 112). Dafür muss allerdings sichergestellt sein, dass die Befragungsteilnehmer die Bewertungsaufgabe tatsächlich verstehen (vgl. Albrecht (2000), 70; Schweikl (1985), 59). 531 Vgl. Fischer (2001), 90; Albrecht (2000), 70. Aus Sicht der Entscheidungsträger sind Paarvergleiche auf Basis von Konstantsummeneinschätzungen einfacher zu bewerten als die Verteilung von Punkten auf eine Vielzahl von Alternativen (vgl. Albrecht (2000), 70, 72f.). 532 Vgl. Green; Srinivasan (1978), 111; Fischer (2001), 91. Dabei sind die kognitiven Anforderungen an die Entscheidungsträger jedoch relativ hoch (vgl. Fischer (2001), 91). Zur Erleichterung der Einschätzung schlagen Green; Krieger (1996, 852) vor, zunächst die Alternativen in eine Rangfolge zu bringen und diese in einem zweiten Schritt mit Hilfe von Kaufwahrscheinlichkeiten einschätzen zu lassen. 533 Vgl. Albrecht (2000), 70; Hensel-Börner (2000), 23. 534 535

Vgl. Schubert (1991), 173; Albrecht (2000), 70; Pessemier; Burger; Teach; Tigert (1971), 372. Vgl. Green; Srinivasan (1978), 112.

536

So muss beispielsweise ein Nutzenunterschied beim Übergang von 100.- Euro auf 200.- Euro identisch zu einem Preisunterschied beim Übergang von 2000.- Euro auf 2100.- Euro wahrgenommen werden (siehe analog Schweikl (1985), 121). 537 Vgl. Schweikl (1985), 120f. 538

Vgl. Schweikl (1985), 121; Albrecht (2000), 73.

87

einer direkten Abfrage tendenziell überhöhte Preisbereitschaften angeben.539 Deshalb sollte diese Skalenart nur bei Entscheidungsträgern angewendet werden, die kurz vor einem tatsächlichen Kauf stehen.540 Die Einschätzung der Alternativen mittels Dollarmetrik ist letztendlich auch mit einem vergleichsweise höheren kognitiven Aufwand als bei anderen Skalenarten für den Entscheidungsträger541 und möglicherweise stärker mit sozial erwünschtem Antwortverhalten verbunden.542 Unterschiedliche Preisvorstellungen und –bedeutungen, die bei der Befragung von Entscheidern unterschiedlicher sozialer Schichten auftreten, können die Einschätzung der Alternativen beeinflussen und erschweren die Ableitung produktpolitischer Entscheidungen.543 Magnitudenskalen sind eine in der Präferenzmessung bislang noch selten genutzte Skalen-

art.544 Hierbei bewerten die Entscheidungsträger die Alternativen auf einer Skala, bei der keine festen Skalen- bzw. Abstufungspunkte vorgegeben sind. Auf die Begrenzung des Antwortkontinuums kann verzichtet werden, d.h. es kann sich, wie bei der Dollarmetrik, um nach oben offene Skalen handeln.545 Bei Magnitutenskalen wird zwischen der Einschätzung bestimmter optischer bzw. akustischer Reize und der Angabe konkreter Zahlenwerte unterschieden. Bei der Einschätzung optischer Reize kann der Entscheidungsträger seine Präferenz z.B. durch eine bestimmte Länge einer Linie, Größe oder Farbintensität eines Objekts bzw. die Intensität einer Lichtquelle angeben.546 Bei computergestützten Befragungen wird die Präferenz teilweise mit Hilfe eines Schiebereglers ohne Skalenangabe erfasst.547 Weiterhin kann die Stärke akustischer Reize, z.B. durch die Lautstärke oder Länge eines Tons, zur Einschätzung von Alternativen herangezogen werden. Diese Beurteilungen werden danach in numerische Werte transformiert und so zur Ermittlung der Präferenzwerte genutzt.548 Da Magnitudenskalen bisher selten zur Präferenzmessung genutzt wurden, ist die Einschätzung der Vorund Nachteile derzeit kaum möglich.549

539 540 541 542 543 544 545

Vgl. Schweikl (1985), 130. Vgl. Gierl (1995), 165. Vgl. Green; Srinivasan (1978), 112; Schubert (1991), 174. Vgl. Green; Srinivasan (1978), 112. Vgl. Albrecht (2000), 73. Vgl. Albrecht (2000), 74; Schubert (1991), 174. Vgl. Albrecht (2000), 69.

546

Vgl. Louviere; Gaeth (1987), 32; Schubert (1991), 175; Albrecht (2000), 69; Oppewal; Louviere; Timmermans (1994), 93; Kroeber-Riel; Weinberg (2003), 196f. 547 Tomczak (1989, 22) nutzt diese Skalenart beispielsweise zur Einschätzung von Paarvergleichen bei dem AHP. 548 549

88

Vgl. Albrecht (2000), 69. Zudem können die Entscheidungsträger gebeten werden, den Alternativen einen Zahlenwert zuzuweisen (vgl. Schubert (1991), 175; Albrecht (2000), 69; Kroeber-Riel; Weinberg (2003), 196f.). Vgl. Albrecht (2000), 74.

Eine der am häufigsten genutzten Skalenarten zur Einschätzung von Alternativen sind Rating-Skalen.550 Zur Bewertung der Stimuli werden die Entscheidungsträger gebeten, diese auf

Basis vorgegebener Skalenstufen einzuschätzen. In der weiteren Auswertung der erhobenen Daten wird davon ausgegangen, dass Einschätzungen auf intervallskaliertem Datenniveau vorliegen.551 Die Anzahl der zu bewertenden Ausprägungsstufen muss sich an dem Differenzierungsvermögen der Befragungsteilnehmer orientieren.552 Dabei sollte vermieden werden, dass die Anzahl der Alternativen größer als die Anzahl der Abstufungspunkte der RatingSkala ist553 - in diesem Fall wäre der Informationsgehalt von Rating-Skalen geringer als bei Rangreihen, d.h. die Einschätzungen sind bei der Nutzung von solchen wenig abgestuften Rating-Skalen relativ ungenau.554 Dagegen ist zu erwarten, dass die Reliabilität der Bewertungen mit steigender Zahl an Abstufungspunkten tendenziell abnimmt555 und Entscheidungsträger u.U. mit der Einschätzung überfordert sind und deshalb nur gröbere Abstufungspunkte nutzen.556 Ein weiteres Problem besteht darin, dass bei der Anwendung von Rating-Skalen und simultaner Präsentation aller Alternativen, die Stimuli von den Entscheidungsträgern eher isoliert und nicht im Verhältnis zueinander bewertet werden.557 Diese Skalenart eignet sich jedoch insbesondere bei schriftlichen Befragungen, da die Bewertungsaufgabe intuitiv ver-

550 551 552

Vgl. Albrecht (2000), 74; Wittink; Cattin (1989), 92; Wittink; Vriens; Burhenne (1994), 44; Hensel-Börner (2000), 23. Vgl. Albrecht (2000), 70f.; Green; Srinivasan (1978), 108. Vgl. Albrecht (2000), 71.

553

Vgl. Albrecht (2000), 71, 73; Hammann; Erichson (2000), 381. Für ein Beispiel siehe Hauser; Urban (1977, 591) oder Green; Goldberg; Wiley (1983, 147f.) - dabei sollten beispielsweise bei Green; Goldberg; Wiley (1983, 147f.) 32 Alternativen auf einer 7-Punkte Rating-Skala bewertet werden. Bei der Anwendung einer Rating-Skala mit zu wenig Abstufungspunkten ist der Entscheidungsträger gezwungen, mehreren Alternativen die gleiche Punktzahl zuzuweisen, auch wenn sie nicht gleich stark präferiert werden. Die Anzahl der zur Verfügung gestellten Skalenpunkte muss deshalb zumindest der Anzahl der darauf einzuschätzenden Alternativen entsprechen, um eine vergleichbar hohe Informationseffizienz wie bei der Nutzung von Rangdaten zu erreichen. Wird die Anzahl der Rating-Skalenpunkte dagegen zu klein gewählt, kann dies zu einer Verschlechterung der Ergebnisse führen. Als Beispiel dafür siehe Mulye (1998, 271ff.), dabei sollten 16 Stimuli auf einer 10-Punkte Rating-Skala eingeschätzt werden. Da eine solche Rating-Skala nur sehr grobe Einschätzungen der Alternativen ermöglicht, war die Güte der Prognosevalidität der Conjoint-Analyse auf Basis von Rating-Skalen mit wenig Abstufungspunkten schlechter als bei einer Conjoint-Analyse auf Basis von Rangreihen. 554 Rosko; DeVita; McKenna; Walker (1985, 29) empfehlen entsprechend, bei simultaner Präsentation der Alternativen eine 100-Punkte Rating-Skala zu verwenden. 555 Vgl. Tscheulin (1992), 43. 556

Vgl. Albrecht (2000), 71; Fischer (2001), 90. Bei Vorgabe einer 100-Punkte Rating-Skala ist beispielsweise oft zu beobachten, dass lediglich Abstufungen von 10 oder 5 Punkten tatsächlich genutzt werden (vgl. Albrecht (2000), 71). Deshalb kann die Bewertung von Alternativen auf Basis von Rating-Skalen durch Nutzung grafischer Elemente vereinfacht werden (vgl. Böcker; Schweikl (1988), 16; Albrecht (2000), 71). 557 Vgl. Schweikl (1985), 55; Albrecht (2000), 73; Hensel-Börner (2000), 24. Dieses Problem könnte gemildert werden, indem alle Stimuli auf einer Rating-Skala eingeschätzt werden. Eine solche Vorgehensweise hat jedoch zur Folge, dass ein Entscheidungsträger die Bewertung einer Alternative im Laufe der Einschätzung mehrfach anpassen muss. Dies ist aus Sicht des Probanden mit einem zusätzlichen kognitiven Aufwand verbunden. Die Alternativen könnten alternativ auf einer Art Lineal mit Hilfe von Kartenreitern angeordnet werden, was eine relativ schnelle Änderung der Position eines Stimulus ermöglicht (vgl. Schweikl (1985), 55f.). Zudem könnten die Entscheidungsträger dazu tendieren, vor allem mittlere Skalenpunkte bei der Einschätzung der Alternativen bei simultaner Präsentation zu nutzen (vgl. Fischer (2001), 90). Um die Bewertung der Stimuli bei simultaner Präsentation aller Alternativen zu erleichtern und eine Beurteilung der Alternativen im Verhältnis zueinander zu unterstützen, schlägt Green; Krieger (1996, 853) deshalb vor, diese zunächst in eine Rangfolge bringen und danach anhand einer 100-Punkte Rating-Skala einschätzen zu lassen. Eine weitere Möglichkeit besteht darin, zunächst die präferierte und die am wenigsten präferierte Alternative zu bestimmen und nach Bildung dieser Ankerpunkte die anderen Stimuli einschätzen zu lassen (vgl. Albrecht (2000), 71).

89

ständlich sowie relativ einfach zu beantworten ist und im Vergleich zu anderen Skalenarten deshalb ohne Erläuterungen eines Interviewers gelöst werden kann.558 Rating-Skalen dominieren vor allem bei der Nutzung von Verfahren auf Basis von Paarvergleichen.559 Ein typisches Beispiel für eine Conjoint-Analyse auf Basis von abgestuften Paarvergleichen ist die ACA, bei der die Alternativenpaare auf einer 9-stufigen Rating-Skala eingeschätzt werden.560 Nach der Definition der zu verwendenden Skalenart durch den Marktforscher erfolgt in einem weiteren Schritt die Bestimmung der Komplexität des Untersuchungsproblems. Dies bedeutet, dass die Anzahl der zu untersuchenden Eigenschaften und Ausprägungen festgelegt werden muss. Die bisherige Vorgehensweise zur Ermittlung des zu bewertenden Informationsumfangs wird im Folgenden beschrieben.

3.3

Anzahl der Eigenschaften

Die Anzahl der zu untersuchenden Merkmale und Ausprägungen sollte aus Kundensicht festgelegt werden, d.h. sie richtet sich danach, wie viele Informationen für eine realistische Entscheidung tatsächlich notwendig sind. Aus diesem Grund ist es nicht möglich, eine allgemeingültige Empfehlung zur Anzahl der zu untersuchenden Eigenschaften zu geben.561 Da die Ermittlung des Informationsumfangs einen erheblichen Einfluss auf die Güte der Präferenzmessung hat,562 muss eine Methode zur Bestimmung eines zu untersuchenden Eigenschaftssets diesen Aspekt explizit berücksichtigen und sich an dem Informationsbedarf der Befragungsteilnehmer ausrichten. Gleichwohl gibt es eine Reihe weiterer Faktoren, die die Anzahl der zu untersuchenden Eigenschaften beeinflussen. Der Informationsumfang, der mit Hilfe von Verfahren zur Präferenzmessung untersucht werden kann, hängt auch von -

der Methode zur Präferenzmessung bzw. dem verwendeten Erhebungsdesign,

-

dem jeweiligen Produkt,

-

der Phase im Rahmen des Produktentwicklungsprozesses,

-

der Heterogenität der Präferenzen der Befragungsteilnehmer,

-

dem Vorwissen sowie der Motivation der Entscheidungsträger und

558

Vgl. Green; Srinivasan (1978), 112; Cattin; Wittink (1982), 49.

559

Vgl. Schweikl (1985), 118. Wittink; Vriens; Burhenne (1994, 46) untersuchen die Häufigkeit der Anwendung von Skalenarten bei Studien zur Präferenzmessung in der Praxis und stellen dabei fest, dass „the rating scale is now the dominant measurement approach“ (Wittink; Vriens; Burhenne (1994), 46). 560 Vgl. Johnson (1987), 261. 561 562

90

Vgl. American Marketing Association (1992), 8. Vgl. Reibstein; Bateson; Boulding (1988), 274.

-

der zur Verfügung gestellten Interviewzeit ab.

Vorwissen, Motivation und zur Verfügung gestellte Interviewzeit beeinflussen die wahrgenommene Komplexität des Entscheidungsproblems und damit die Art des Entscheidungsprozesses und das Ausmaß der dabei genutzten Informationen. Wenn die Entscheidungsträger über ein geringes Vorwissen verfügen, wird die Entscheidung tendenziell komplexer und die Eigenschaften „fremdartiger“ wahrgenommen. Dies kann dazu führen, dass weniger Merkmale zur Bewertung von Alternativen herangezogen werden.563 Je komplexer eine Bewertungsaufgabe ist, desto eher werden vom Probanden Entscheidungsheuristiken eingesetzt.564 Mit solchen Effekten ist insbesondere dann zu rechnen, wenn zu viele Eigenschaften berücksichtigt werden sollen.565 Die Motivation der Entscheidungsträger während der Beantwortung eines Fragebogens hat ebenso einen erheblichen Einfluss auf die wahrgenommene Komplexität und damit auf die Anwendung von Entscheidungsheuristiken. Mit einer steigenden Motivation sinkt die Wahrscheinlichkeit, dass die Entscheidungsträger mit der Bewertung überfordert sind. Bei der Auswahl der Befragungsteilnehmer ist deshalb darauf zu achten, dass diese genügend für eine Befragung motiviert sind und über eine ausreichende Produktkenntnis verfügen.566 Dies bedeutet jedoch gleichzeitig, dass die zu untersuchenden Eigenschaften und Ausprägungen aus Konsumentensicht bestimmt werden müssen. Die Berücksichtigung der Nachfrager ist notwendig, damit sichergestellt ist, dass diese dem Vorwissen der Entscheidungsträger entsprechen. Zudem beeinflusst die den Befragungsteilnehmern zur Verfügung gestellte Interviewzeit die Anzahl der Eigenschaften, die im Rahmen einer Studie zur Präferenzmessung unter-

sucht werden kann.567 So könnte vermutet werden, dass bei einer zu knapp bemessenen Zeit zur Einschätzung der Alternativen vermehrt Entscheidungsheuristiken angewendet werden, die die Ergebnisse verzerren. Teilweise wird vermutet, dass die Phase im Produktentwicklungsprozess Auswirkungen auf die Anzahl der in der Präferenzmessung zu untersuchenden Eigenschaften hat. So besteht zu Beginn eines Entwicklungsprojekts ein stärkerer Bedarf eine höhere Anzahl an Eigenschaften zu untersuchen als in späteren Phasen. Ein Grund dafür ist, dass mögliche Zielgruppen in frühen Phasen der Produktentwicklung noch nicht bekannt sind. Ist außerdem mit relativ heterogenen Präferenzen der Entscheidungsträger, d.h. mit relativ vielen unterschiedlichen

Zielgruppen zu rechnen, müssen mehr Eigenschaften im Rahmen der Präferenzmessung be563 564 565 566 567

Vgl. McCullough (2002b), 20; Lines; Denstadli (2004), 306f. Vgl. Payne; Bettman; Schkade (1999), 247; Lines; Denstadli (2004), 307. Vgl. Payne; Bettman; Schkade (1999), 255. Vgl. Lines; Denstadli (2004), 307; Curry (1997), 6; Strebinger; Hoffmann; Schweiger; Otter (2000), 71. Vgl. Curry (1997), 6.

91

rücksichtigt werden, um die unterschiedlichen Anforderungen an das Eigenschaftsset abzudecken.568 Die Anzahl der zu untersuchenden Eigenschaften ist auch von dem untersuchten Produkt selbst abhängig. So kann beispielsweise davon ausgegangen werden, dass zur Beurteilung von Gebrauchsgütern tendenziell mehr Produktmerkmale herangezogen werden als bei Verbrauchsgütern.569 Die Entscheidungssituation sollte durch die untersuchten Eigenschaften möglichst vollständig570 beschrieben werden, da die Ergebnisse der Präferenzmessung sonst keine Ableitung

sinnvoller produktpolitischer Maßnahmen ermöglichen, sondern entsprechende Entscheidungen mehr oder weniger willkürlich erfolgen.571 Fehlen zur Einschätzung der Alternativen relevante Merkmale, so ist damit zu rechnen, dass die Entscheidungsträger versuchen werden, die fehlenden Informationen über Eigenschaften und Ausprägungen aus den vorhandenen Stimulusbeschreibungen abzuleiten.572 Eine aus Sicht der Befragungsteilnehmer subjektiv als unvollständig wahrgenommene Alternativenbeschreibung führt gleichzeitig dazu, dass die Motivation der Entscheidungsträger sinkt573 und die Alternativen tendenziell schlechter eingeschätzt werden.574 Die Anzahl der bei einer Studie untersuchten Eigenschaften sollte deshalb nicht zu klein sein.575 Entsprechend wird in der Praxis oft eine Vielzahl an Merkmalen zur

Beschreibung der Alternativen genutzt.576 Gibson (2001, 18) geht davon aus, dass in die Präferenzmessung alle potenziell relevanten Eigenschaften aufgenommen werden sollten, da zu Beginn der Präferenzmessung noch nicht bekannt sei, welche Merkmale die Befragungsteilnehmer bei einer Wahlentscheidung berücksichtigen. Je mehr Eigenschaften im Rahmen von Präferenzmessmethoden genutzt werden, desto eher ist jedoch damit zu rechnen, dass die Befragungsteilnehmer bei Informationsüberlastung 568 569 570 571 572 573 574

Vgl. Schubert (1991), 191f. Vgl. Schubert (1991), 185; Hahn (1997), 49. Siehe dazu auch Kapitel 2.3. Siehe Kapitel 4.2.1. Vgl. Hammond; Keeney; Raiffa (1998), 143. Vgl. Johnson; Levin (1985), 170ff.; Huber; McCann (1982), 324; Yamagishi; Hill (1981), 16f.; Melles (2001), 37. Vgl. Johnson; Levin (1985), 174.

Vgl. Huber; McCann (1982), 332. Fehlende Informationen können Misstrauen hervorrufen. Dies kann dazu führen, dass die vorhandenen Informationen negativer als bei einer vollständigen Beschreibung der Entscheidungssituation bewertet werden (vgl. Melles (2001), 37). 575 Ist die Anzahl der untersuchten Eigenschaften zu klein, muss mit einer tendenziell schlechteren Prognosevalidität gerechnet werden (vgl. Pras; Summers (1975), 280). 576 Gibson (2001, 18) beschreibt etwa, dass Studien zur Präferenzmessung in der Praxis oftmals 25-35 Eigenschaften mit insgesamt 100 bis 150 Ausprägungen umfassen. Auch Hartmann; Sattler (2002, 3) stellen bei der Untersuchung praktischer Anwendungen von Präferenzmessmethoden fest, dass eine relativ große Zahl an Eigenschaften genutzt wird (als Mittelwert ergeben sich 14 Merkmale und als Median 8 Eigenschaften). Innerhalb von wissenschaftlichen Studien werden dagegen tendenziell weniger Eigenschaften untersucht. Siehe dazu beispielsweise Helm; Steiner (2006, 9). Bei dieser Meta-Studie ergibt sich für die Anzahl der untersuchten Eigenschaften ein Mittelwert von 5,93 Merkmalen (ein ähnliches Ergebnis findet auch Schubert (1991), 318).

92

Vereinfachungsstrategien anwenden und im Rahmen von Studien auf Basis der ConjointAnalyse lediglich eine Teilmenge der präsentierten Merkmale tatsächlich in die Bewertung einbeziehen. Dies führt insgesamt zu verzerrten Schätzungen der Teilnutzen sowie in der Folge zu verfälschten bzw. unplausiblen Bedeutungsgewichten für die Merkmale und damit zu Ergebnissen, die nicht zur Prognose von realen Wahlentscheidungen geeignet sind.577 Dabei sind dekompositionelle Methoden aufgrund der simultanen Bewertung der Eigenschaften stärker als die kompositionellen Verfahren von verzerrenden Effekten bei der Erhöhung der Anzahl der zu untersuchenden Attribute betroffen,578 denn mit der Zahl der Eigenschaften und Ausprägungen bei der Nutzung dekompositioneller Verfahren steigt auch die Anzahl der einzuschätzenden Alternativen exponentiell.579 Eine größere Anzahl an untersuchten Eigenschaften sowie Ausprägungen führt deshalb zu einer längeren Befragungsdauer und somit zu verstärkten Ermüdungserscheinungen oder Frustration bei der Bewertung der Alternativen durch die Entscheidungsträger, die bis hin zur aktiven Sabotage der Erhebung führen kann.580 Neben der Gefahr verzerrte Präferenzen zu erheben, steigt die Wahrscheinlichkeit, dass ein Interview vorzeitig abgebrochen wird.581 Selbst wenn der zur Bewertung notwendige Informationsumfang auf Basis von Kundenanforderungen bestimmt wird, ist oft zu beobachten, dass selbst komplexe Güter von den Entscheidungsträgern anhand von wenigen, z.B. vier bis sieben Merkmalen eingeschätzt werden.582 Einige Forscher gehen sogar davon aus, dass die drei Merkmale „Marke“, „Verpackung“ (bzw. „Verpackungsgröße“) und „Preis“ bei vielen Studien zur Präferenzmessung ausreichend sind.583 Als Zwischenfazit kann man festhalten, dass nicht allein die Anzahl der untersuchten Merkmale entscheidend ist, viel wichtiger ist es, die tatsächlich relevanten Eigenschaften zu untersuchen.584 Weiterhin sollte sich die Anzahl der untersuchten Eigenschaften und Ausprägungen an der vom Entscheidungsträger tatsächlich benötigten Menge von Informationen orientieren. Sowohl die Nutzung zu weniger als auch die Untersuchung zu vieler Merkmale führt zu verzerrten Schätzergebnissen. Dies gilt insbesondere, wenn innerhalb einer Produktgruppe mit

577 578 579 580 581

Vgl. Orme; Alpert; Christensen (1997a), 210f.; Goodwin; Wright (2000), 65; Huber (1987), 7; Lines; Denstadli (2004), 306f.; Schubert (1991), 177f.; Vriens (1995), 35; Melles (2001), 37. Vgl. Huber; Wittink; Fiedler; Miller (1993), 110; Baier; Säuberlich (1997), 951; Gibson (2001), 18. Vgl. Gibson (2001), 16; Vriens (1995), 35. Vgl. Baier; Säuberlich (1997), 951; Lines; Denstadli (2004), 300. Vgl. Orme; Alpert; Christensen (1997b), 2.

582

Vgl. Böcker; Schweikl (1988), 16; Böcker (1986), 556; Huber (1987), 6; Green; Krieger (2002a), 26; Hahn (1997), 49; Orme (2002a), 47. Vgl. Orme (2002a), 46; Johnson (2002), 47. Dabei handelt es sich jedoch eher um Konsumgüter und somit um Produktgruppen, bei denen Verfahren zur Präferenzmessung nur eingeschränkt anwendbar sind. 584 Vgl. Böcker; Schweikl (1988), 16; Böcker (1986), 556; Lines; Denstadli (2004), 306. 583

93

dem Vorhandensein unterschiedlicher Zielgruppen gerechnet werden muss. In der Praxis wird versucht, dieses Problem zu lösen, indem eine möglichst hohe Anzahl an Eigenschaften untersucht wird. Dies würde allerdings bedeuten, explizit in Kauf zu nehmen, dass Entscheidungsträger für sie irrelevante Informationen bewerten müssen. Eine Methode zur Bestimmung der relevanten Eigenschaften und Ausprägungen sollte deshalb auch eine a priori Segmentierung der Entscheidungsträger ermöglichen, so dass im Folgenden lediglich für die jeweilige Kundengruppe relevante Eigenschaftssets bewertet werden. Da in der Praxis die zu untersuchenden Eigenschaften in den seltensten Fällen aus Konsumentensicht, sondern häufig durch den Marktforscher selbst bzw. mit Hilfe von Expertenbefragungen festgelegt werden,585 ist es in diesen Fällen nicht möglich, den aus Konsumentensicht notwendigen Informationsumfang zur Einschätzung von Alternativen zu ermitteln. Deshalb werden derzeit einfach alle potenziell relevanten Merkmale586 bzw. die maximale Attributzahl, die mit Hilfe einer bestimmten Methode berücksichtigt werden kann, untersucht. Entsprechend finden sich in der Literatur zahlreiche Vorschläge, wie viele Merkmale im Rahmen von Studien zur Präferenzmessung bei Anwendung einer bestimmten Methode maximal untersucht berücksichtigt können. Diese Empfehlungen beruhen dabei vor allem auf den „Untersuchungserfahrungen“587 der jeweiligen Autoren. Für die Verfahren der klassischen ConjointAnalyse wird häufig geraten, nicht mehr als 6 Eigenschaften in eine Studie aufzunehmen.588 Wird ein nutzenbalanciertes Erhebungsdesign (wie u.a. bei der ACA) genutzt, sollten sogar nicht mehr als 3 Merkmale simultan präsentiert werden.589 Eine Empfehlung über die maximale Anzahl der Eigenschaften, die sich mit Hilfe der dekompositionellen Methode untersuchen lassen, basiert auf Vermutungen darüber, wie viele Merkmale ein Entscheidungsträger simultan einschätzen kann. Wie bereits beschrieben, hat 585

Siehe Meta-Studie von Helm; Steiner (2006), 11. Dabei wird bei einer Individualisierung der Präferenzmessung oftmals davon ausgegangen, dass die Anzahl an relevanten Eigenschaften für alle Entscheidungsträger gleich groß ist. Dies erweist sich jedoch als eine wenig realistische Annahme (vgl. Schweikl (1985), 114, 94). 586 Siehe Gibson (2001), 18. 587 588

Perrey (1998), 72.

Siehe u.a. Green; Srinivasan (1990), 8; Green; Srinivasan (1978), 108, McCullough (2002b), 20; Orme (2002c), 1. Pras (1975, 76) empfiehlt, nicht die „magische“ Zahl von 7 Eigenschaften zu überschreiten. Für eine umfangreiche Übersicht über Empfehlungen zur Anzahl der Eigenschaften siehe auch Voeth (2000, 57); Hair; Anderson; Tatham; Black (1998, 401); Cattin; Wittink (1982, 47). Voeth (2000, 56) sieht die Grenze bereits bei 4-5 Merkmalen. Curry (1997, 6) geht demgegenüber davon aus, dass 6-8 Merkmale mit Hilfe der klassischen Conjoint-Analyse und bis zu 15 Merkmale unter Anwendung partieller Profile untersucht werden können. Louviere (1984a, 148) sieht die Obergrenze bei den klassischen, dekompositionellen Verfahren zur Präferenzmessung bei 10 Eigenschaften. Eine ähnliche Einschätzung nehmen auch Hair; Anderson; Tatham; Black (1998, 401) vor. Demnach können mit Hilfe der traditionellen Verfahren maximal 9 Eigenschaften untersucht werden. Die wahlbasierten Verfahren eignen sich bei der Untersuchung von sechs oder weniger Merkmalen. Sollen mehr als 6 Eigenschaften untersucht werden, so sind evtl. andere Verfahren zur Präferenzmessung den „klassischen“ Varianten der Conjoint-Analyse vorzuziehen (vgl. Huber; Wittink; Fiedler; Miller (1993), 111). Mit Hilfe der ACA können beispielsweise auch Bewertungsprobleme mit mehr als 9 Attributen analysiert werden (vgl. Hair; Anderson; Tatham; Black (1998), 401). 589 Vgl. Johnson (1987), 261. Als absolute Obergrenze wird dabei eine Anzahl von 5 Attributen gesehen (vgl. Johnson (1987), 261).

94

jedoch auch die gesamte Interviewzeit einen Einfluss auf die Güte der Präferenzmessung. Neben der Zahl der Eigenschaften determiniert auch die Anzahl der untersuchten Ausprägungen590 die Anzahl der zu bewertenden Alternativen. Erst durch die Kombination von Ei-

genschaften und Ausprägungen können erste Anhaltspunkte über die mögliche Befragungsdauer bzw. die Anzahl der notwendigen Einschätzungen einer Studie zur Präferenzmessung abgeleitet werden. Orme (2002c, 1) empfiehlt beispielsweise die Nutzung von maximal 6 Eigenschaften mit je 2 bis 5 Ausprägungen.591 Je nachdem, wie das Erhebungsdesign592 zur Bestimmung der Alternativen bzw. Paarvergleiche gebildet wird, ergibt sich eine unterschiedliche Anzahl an Stimuli, die vom Entscheidungsträger zu bewerten sind. Die Empfehlungen über die maximale Anzahl an Stimuli gehen dabei von 10593 bis 32594 Alternativen.595 Aufgrund der bereits beschriebenen Einflussgrößen, die Auswirkungen auf die maximale Anzahl der Eigenschaften innerhalb einer Studie zur Präferenzmessung haben, erscheint es unmöglich, eine allgemein gültige Aussage über die maximale Zahl an Eigenschaften bzw. Ausprägungen und die daraus resultierende Anzahl an Einschätzungen zu treffen. Beispiels-

weise übt das Vorwissen der Befragungsteilnehmer einen entscheidenden Einfluss auf die wahrgenommene Komplexität der Bewertungen und damit auf die maximale Anzahl an Eigenschaften sowie Ausprägungen, die im Rahmen einer Studie zur Präferenzmessung berücksichtigt werden kann, aus. Je höher das Vorwissen der Entscheidungsträger über die untersuchten Merkmale und Ausprägungen ist, desto weniger ist mit der Anwendung von Vereinfachungsstrategien zu rechnen.596 Dies bedeutet, dass bei einer Bestimmung der relevanten Merkmale und Ausprägungen aus Kundensicht tendenziell mehr Informationen untersucht werden können, als bei einer Festlegung des Eigenschaftssets ohne Einbeziehung der Anforderungen der Konsumenten. Die bisher übliche Vorgehensweise, die Komplexität der Bewertungsaufgabe an die Anforderungen einer Methode zur Präferenzmessung anzupassen,597 erscheint vor diesem Hintergrund äußerst problembehaftet. Vielmehr sollte ausgehend vom Umfang der Informationsnutzung 590

Je größer die Zahl der Ausprägungen ist, desto mehr Stimuli müssen untersucht werden (siehe Kapitel 3.4) und umso höher ist die durch den Entscheidungsträger wahrgenommene Komplexität der Studie. Orme (2002c, 4) empfiehlt deshalb, bei quantitativen Eigenschaften nicht mehr als 5 Ausprägungen zu untersuchen. 591 Siehe auch Klein (2002, 14), der die Untersuchung von maximal 6 Attributen, die durch 4 bis 5 Ausprägungen beschrieben werden, empfiehlt. 592 Siehe Kapitel 3.4. 593 594

Vgl. Perrey (1998), 71. Vgl. Baier; Säuberlich (1997), 951.

595

Für einen weiteren Überblick siehe Voeth (2000), 57; Wittink; Cattin (1989), 94. Siehe auch Green; Srinivasan (1978, 109) und Hausruckinger; Herker (1992, 102), die davon ausgehen, dass ab 30 Paarvergleichseinschätzungen erste Ermüdungserscheinungen bei der Bewertung der Alternativen durch die Befragungsteilnehmer auftreten. 596 Vgl. McCullough (2002b), 20; Lines; Denstadli (2004), 306f. 597

Siehe dazu beispielsweise Schubert (1991, 191) und Cattin; Wittink (1982, 47), die davon ausgehen, dass die Methoden zur Präferenzmessung die Anzahl der zu untersuchenden Eigenschaften beeinflussen.

95

der Entscheidungsträger bei der Bewertung verschiedener Alternativen eine entsprechend geeignete Präferenzmessmethode selektiert werden. Erst nachdem die Anzahl der zu untersuchenden Eigenschaften und Ausprägungen bestimmt wurde, kann bei den dekompositionellen Verfahren zur Präferenzmessung ein Erhebungsdesign erstellt werden. Die Vorgehensweise bei der Bestimmung solcher Versuchspläne wird im folgenden Kapitel beschrieben.

3.4

Erstellung von Versuchsplänen

In einem sog. „Erhebungsdesign“ wird festgelegt, welche Bewertungen bei einer Studie zur Präferenzmessung vom Befragungsteilnehmer vorgenommen werden. Die Bestimmung eines speziellen Erhebungs- bzw. Differenzendesigns ist lediglich bei Verfahren notwendig, bei denen verschiedene Möglichkeiten bestehen, die vorgegebenen Informationen bewerten zu lassen – dies ist bei allen Varianten der Conjoint-Analyse der Fall. Bei kompositionellen Verfahren wie beispielsweise dem AHP oder den Self-Explicated Methoden besteht dagegen keine Notwendigkeit, ein Erhebungsdesign zu erstellen. Vielmehr ergibt sich das Erhebungsdesign direkt aus den Anforderungen der jeweiligen Präferenzmessmethode; so werden bei dem AHP alle Elemente einer Hierarchiestufe, die zu einem gemeinsamen Oberziel gehören,598 vollständig miteinander kombiniert. Im Rahmen der Conjoint-Analyse ist dagegen mit Hilfe von Erhebungsdesigns zu bestimmen, welche Alternativen von den Entscheidungsträgern einzuschätzen sind. Bei dekompositionellen Verfahren auf Basis von Paarvergleichen ist zudem durch Differenzendesigns festzulegen, welche Alternativen einander gegenübergestellt werden. Erhebungsdesign

Werden die Präferenzen mit Hilfe eines dekompositionellen Verfahrens wie der ConjointAnalyse erhoben, kann ein vollständiges oder aber ein fraktioniertes Erhebungsdesign verwendet werden.599 Bei einem vollständigen Design werden die Ausprägungen aller Eigenschaften vollständig miteinander kombiniert.600 Sollen beispielsweise insgesamt sechs Eigenschaften untersucht werden, wobei fünf Merkmale drei Ausprägungen und ein Attribut zwei Ausprägungen aufweisen, so ergeben sich bei vollständiger Kombination der Ausprägungen insgesamt 35*21 = 486 Stimuli, die von den Entscheidungsträgern bewertet werden müssten. 598 599

Dies sind z.B. alle Ausprägungen einer Eigenschaft (Oberziel).

Vgl. Green; Srinivasan (1978), 109; Gierl (1995), 167; Baier; Säuberlich (1997), 959. Die meisten Varianten der Conjoint-Analyse (außer beispielsweise der ACA) beruhen auf einem a priori festgelegten Erhebungsdesign (vgl. McCullough (2002b), 20). 600 Vgl. Green; Srinivasan (1978), 109; Gierl (1995), 167; Vriens (1995), 42.

96

Diese Zahl an notwendigen Einschätzungen kann jedoch von keinem Befragungsteilnehmer vorgenommen werden. Daher muss die Anzahl der Alternativen reduziert werden.601 Zur Verringerung der Anzahl der Stimuli können fraktionierte Erhebungsdesigns angewendet werden – bei diesen Erhebungsdesign wird lediglich eine Teilmenge der möglichen Alternativen untersucht. Dabei unterscheidet man zwischen zufällig ausgewählten Stimuli oder orthogonalen Erhebungsdesigns.602 Bei der Nutzung von fraktionierten Erhebungsdesigns hängt die Anzahl der zu untersuchenden Stimuli von der Anzahl der zu schätzenden Parameter, d.h. der Anzahl der insgesamt untersuchten Eigenschaftsausprägungen ab. Die Zahl der Alternativen, die vom Entscheidungsträger bewertet werden, sollte dabei möglichst gering sein.603 Zufällig gebildete Erhebungsdesigns

Zufällig bestimmte Erhebungsdesigns604 werden im Vergleich zu orthogonalen Designs häufig als weniger effizient eingeschätzt, erlauben allerdings die Berücksichtigung von Interaktionseffekten605 zwischen verschiedenen Eigenschaftsausprägungen.606 Die Effizienz, d.h. der Informationsgehalt der Datenerhebung, kann verbessert werden, wenn so lange Alternativen gebildet werden, bis keine Alternative im Erhebungsdesign von einer anderen eindeutig dominiert wird - man spricht dabei auch von einem pareto-optimalen Erhebungsdesign.607

601

Vgl. Scholl; Manthey; Helm; Steiner (2005), 767. Siehe auch Green; Wind (1975), 109 oder Vriens (1995), 42. Eine Reduktion der zu untersuchenden Alternativen kann aber zu einer Verschlechterung der Prognosevalidität führen. Siehe dazu als Beispiel Darmon; Rouziès (1991, 320), bei denen die Nutzung des Lateinischen Quadrats im Vergleich zu einem vollständigen Design zu einer Verschlechterung der Prognosegüte führte. Im Gegensatz dazu zeigen andere Studien, dass fraktionierte Erhebungsdesigns zu vergleichbaren Ergebnissen wie vollständige Designs kommen können (siehe beispielsweise Carmone; Green; Jain (1978), 302). Die Wahl des Erhebungsdesigns kann folglich auch einen Einfluss auf die Ergebnisgüte der Präferenzmessung ausüben (vgl. Darmon; Rouziès (1991), 320f.). So führt die Anwendung von nutzenbalancierten (z.B. bei der ACA) und nicht nutzenbalancierten Erhebungsdesigns oftmals zu sehr unterschiedlichen Ergebnissen (vgl. Teichert (2000b), 154). 602 Im Laufe der Jahre wurde eine Vielzahl möglicher Erhebungsdesigns entwickelt, auf die bei der Gestaltung einer Studie zur Präferenzmessung mit Hilfe der Conjoint-Analyse zurückgegriffen werden kann. Siehe dazu u.a. Addelman (1962), 23ff.; Green (1974), 63; Schweikl (1985), 51; Baier; Säuberlich (1997), 959. 603 Vgl. Green; Srinivasan (1978), 109. 604

Vgl. Tscheulin (1992), 33; Hensel-Börner (2000), 83; Huber; Daneshgar; Ford (1971), 269; Weisenfeld-Schenk (1989), 32; Green; Carroll; Carmone (1978), 110; Backhaus; Erichson; Plinke; Weiber (2003), 552; Stallmeier (1993), 144; Vriens (1995), 43f.; Holland; Cravens (1973), 270; Reiners (1996), 75. Die CBC beruht beispielsweise auf einem Zufallsdesign (vgl. Melles (2001), 76). 605 Siehe Kapitel 4.2.3.1. 606 607

Vgl. Hensel-Börner (2000), 83; Melles (2001), 76. Dies kann gleichwohl dazu führen, dass zwischen den Eigenschaftsausprägungen eine gewisse Multikollinearität vorhanden ist (vgl. Stallmeier (1993), 144). Vgl. Hensel-Börner (2000), 73. Pareto-optimale Erhebungsdesigns können auch durch „trial and error“, d.h. durch wiederholte Bestimmung der Alternativen durch den Marktforscher, gebildet werden (vgl. Green; Carroll; Carmone (1978), 110; Parker; Srinivasan (1976), 1010). Die Eignung zufällig gebildeter Erhebungsdesigns wurde bisher noch nicht systematisch untersucht (vgl. Reiners (1996), 75). Eine entsprechende Analyse ist aber auch nicht möglich, da die Wirkung von Zufallseffekten nicht systematisch untersucht werden kann.

97

Orthogonale Erhebungsdesigns

Orthogonale Erhebungsdesigns erlauben die Ermittlung aller Haupteffekte und somit die Schätzung der Teilnutzen aller untersuchten Ausprägungen, jedoch nicht die Berücksichtigung von Interaktionseffekten.608 Orthogonal bedeutet dabei, dass die Merkmale im Erhebungsdesign untereinander völlig unkorreliert, d.h. unabhängig sind.609 Bei den orthogonalen Erhebungsdesigns unterscheidet man zwischen symmetrischen und asymmetrischen Versuchsplänen.610 Bei symmetrischen Erhebungsdesigns weisen alle Eigenschaften die gleiche Anzahl an Ausprägungen auf, während bei asymmetrischen Designs die Zahl der Ausprägungen je nach Eigenschaft variieren kann.611 Ein Beispiel für symmetrische Versuchspläne ist das Lateinische Quadrat, das allerdings nur dann genutzt werden kann, wenn drei Eigenschaften mit jeweils drei Ausprägungen untersucht werden sollen. Durch die Anwendung dieses fraktionierten Erhebungsdesigns kann die Zahl der zu bewertenden Alternativen von 27 auf 9 reduziert werden.612 Ein weiteres typisches Beispiel für symmetrische Erhebungsdesigns die sind Addelman Basispläne,613 die häufig im Rahmen der Conjoint-Analyse genutzt werden.614 Als Ausgangsbasis zur Erstellung von asymmetrischen Erhebungsdesigns dienen symmetrische Designs wie die Addelman Basispläne. Diese können durch „Streichen von Spalten“, „Collapsing“ oder „Replacement“ an das jeweilige Untersuchungsproblem angepasst und so in ein asymmetrisches Design überführt werden615 - dabei kann jedoch die Orthogonalität

608

Vgl. Green; Srinivasan (1978), S. 110; Teichert (2000b), 154; Albrecht (2000), 57; Green; Rao (1971), 360; Green; Wind (1975), 109; Stallmeier (1993), 153; Vriens (1995), 42; Baier; Säuberlich (1997), 959. Zur Berücksichtigung ausgewählter Interaktionseffekte können verschiedene sog. Kompromissdesigns genutzt werden. Siehe dazu Kapitel 4.2.3.1.1 oder Green; Carroll; Carmone (1978), 101; Steckel; DeSarbo; Mahajan (1991), 435ff.; Rosenbaum (1999), 125ff.; Kuhfeld (1997), 1ff. 609 Vgl. Green; Srinivasan (1978), 111; Albrecht (2000), 58; Green; Srinivasan (1990), 7; Stallmeier (1993), 144f.; Boya (1981), 306. Wenn keine Interaktionseffekte vorhanden sind, sollten orthogonale fraktionierte Erhebungsdesigns einer Zufallsauswahl vorgezogen werden, da sie tendenziell genauere Schätzergebnisse liefern und zu „less ambiguos answers“ (Green; Srinivasan (1978), 110) führen. Die Anwendung von orthogonalen Erhebungsdesigns ist deshalb bei der Conjoint-Analyse der Regelfall (vgl. Green; Krieger (1996), 853). 610 Vgl. Green; Carroll; Carmone (1978), 101. 611

Vgl. Perrey (1998), 71.

612

Vgl. Perrey (1998), 71; Backhaus; Erichson; Plinke; Weiber (2003), 552f.; Darmon; Rouziès (1991), 316f. Eine weitere, ähnliche Variante ist das Griechisch-Lateinische Quadrat (vgl. Holland; Cravens (1973), 270). Diese Erhebungsdesigns gehören zu der Gruppe der „Lattice Square“ Designs, siehe dazu auch Cochran; Cox (1992), 483ff. 613 Siehe Addelman (1962), 36ff. 614

Vgl. Gierl (1995), 169. Für weitere Arten von Erhebungsdesigns siehe auch Green; Carroll; Carmone (1978), 100ff.; Leigh; MacKay; Summers (1981), 317ff.; Holland; Cravens (1973), 270ff.; Stallmeier (1993), 153ff.; Vriens (1995), 42ff. Diese beruhen teilweise auf den Addelman Basisplänen (vgl. Vriens (1995), 43; Holland; Cravens (1973), 271). 615 Vgl. Addelman (1962), 23ff.; Gierl (1995), 170ff.; Albrecht (2000), 57; Backhaus; Erichson; Plinke; Weiber (2003), 553ff.; Herker (1992), 98. Für eine ausführliche Beschreibung dieser Vorgehensweisen siehe Addelman (1962), 23ff.; Gierl (1995), 170ff.

98

des Erhebungsdesigns verloren gehen.616 Das SPSS-Zusatzmodul „Conjoint“ (Orthoplan) bietet allerdings eine einfache Möglichkeit, um orthogonale asymmetrische Versuchspläne auf Basis der Addelman Erhebungsdesigns zu erstellen. Mit Hilfe solcher fraktionierter, orthogonaler Erhebungsdesigns kann beispielsweise ein Bewertungsproblem, bei dem 5 Eigenschaften 3 Ausprägungen und 1 Merkmal 2 Ausprägungen aufweisen, von 486 Stimuli auf zu untersuchende 18 Alternativen reduziert werden.617 Codierung der Variablen im Erhebungsdesign

Unabhängig von der Art des verwendeten Erhebungsdesigns muss dieses in einem nächsten Schritt in eine Dummy-Variablen-Darstellung überführt werden. Dabei werden die Eigenschaftsausprägungen der Alternativen des Erhebungsdesigns binär, d.h mit „0“ und „1“, kodiert.618 Sollen beispielsweise zwei Eigenschaften, bei der eine durch zwei (Eigenschaft 1) und die andere durch drei Ausprägungen (Eigenschaft 2) beschrieben wird, im Rahmen einer Conjoint-Analyse untersucht werden, so können folgende sechs Alternativen durch ein vollständiges Erhebungsdesign gebildet werden (siehe Tabelle 5).619 Nr.

Eigenschaft 1

Eigenschaft 2

1 2 3 4 5 6

Ausprägung 1 Ausprägung 1 Ausprägung 1 Ausprägung 2 Ausprägung 2 Ausprägung 2

Ausprägung 1 Ausprägung 2 Ausprägung 3 Ausprägung 1 Ausprägung 2 Ausprägung 3

Tabelle 5: Vollständige Kombination der Merkmalsausprägungen zur Bildung von hypothetischen Alternativen

Diese gebildeten Alternativen werden, falls die Nutzenschätzung mit Hilfe einer OLS Regression erfolgen soll, in einem nächsten Schritt binär kodiert (siehe Tabelle 6). Jeweils eine Eigenschaftsausprägung jedes Merkmals wird mit einer „0“ kodiert; für diese können keine

616

Vgl. Gierl (1995), 171. Die Orthogonalität eines Erhebungsdesigns lässt sich jedoch sehr einfach prüfen, indem die Korrelationen der Dummy-Variablen für die Ausprägungen aller untersuchten Merkmale berechnet werden. Dabei dürfen lediglich zwischen den Ausprägungen einer Eigenschaft Korrelationen auftreten (vgl. Gierl (1995), 168f.). 617 Vgl. Scholl; Manthey; Helm; Steiner (2005), 767. 618 619

Vgl. Skiera; Gensler (2002a), 203. Da in diesem Beispiel lediglich 2 Eigenschaften untersucht werden, wurden die Ausprägungen vollständig miteinander kombiniert, d.h. kein reduziertes Erhebungsdesign genutzt.

99

Teilnutzen geschätzt werden - ihnen wird somit implizit ein Teilnutzenwert von „0“ zugewiesen.620 Stimulus Eigenschaft 1 Nr. (0 – wenn Ausprägung 1; 1 – wenn Ausprägung 2) 1 2 3 4 5 6

0 0 0 1 1 1

(0 – wenn Ausprägung 1; 1 – wenn Ausprägung 2; 0 – wenn Ausprägung 3) 0 1 0 0 1 0

Eigenschaft 2 (0 – wenn Ausprägung 1; 0 – wenn Ausprägung 2; 1 – wenn Ausprägung 3) 0 0 1 0 0 1

Tabelle 6: Binärcodierung der Alternativen

Eine derartige Kodierung ist bei der Nutzenschätzung auf Basis einer OLS Regression notwendig. Würde für jede Eigenschaftsausprägung ein separater Teilnutzen geschätzt, d.h. jede Ausprägung wird einmal mit „1“ kodiert, so ließen sich einzelne Ausprägungen des Erhebungsdesigns als Linearkombination anderer Ausprägungen darstellen. Die Elemente des Erhebungsdesigns wären in diesem Fall nicht unabhängig voneinander, so dass nicht sämtliche Ausprägungen in die Regressionsgleichung aufgenommen werden können. Bei Eigenschaften mit j Ausprägungen werden somit jeweils lediglich j-1 Teilnutzen geschätzt.621 Positive Teilnutzen einer Ausprägung bedeuten, dass diese der mit „0“ kodierten Ausprägung vorgezogen werden, während negative Schätzwerte von Ausprägungen auf eine geringere Vorziehenswürdigkeit als die mit „0“ kodierte Referenzausprägung hinweisen. Eine Standardisierung der ermittelten Schätzwerte nach der Regression vereinfacht die Interpretation der ermittelten Teilnutzen.622 Sollen die Präferenzen mit Hilfe einer Conjoint-Analyse auf Basis von Paarvergleichen erhoben werden, so ist neben dem Erhebungsdesign auch ein sog. Differenzendesign zu erstellen. Dabei unterscheidet man zwischen einer vollständigen bzw. einer reduzierten623 Kombination der Alternativen, die mit Hilfe des Erhebungsdesigns gebildet wurden. Eine Reduzierung der Anzahl der Paarvergleiche ist oftmals notwendig. Werden beispielsweise lediglich 9

620

Vgl. Green; Srinivasan (1978), 106; Stallmeier (1993), 150; Gierl; Helm (1999), 833. Diese Ausprägung könnte man auch als Basis-Ausprägung (vgl. Gierl (1995), 156ff.) oder Referenzausprägung (vgl. Schweikl (1985), 63) bezeichnen. Werden bei einer Eigenschaft lediglich zwei Ausprägungen untersucht, so wird eine davon als „1“ und die andere als „0“ kodiert. Soll im Rahmen einer Conjoint-Analyse ein Attribut mit drei Ausprägungen untersucht werden, so kann Ausprägung 1 als „00“, Ausprägung 2 als „10“ und Ausprägung 3 als „01“ kodiert werden. Bei Merkmalen mit mehr Ausprägungen wird in ähnlicher Weise verfahren (siehe auch Gierl (1995), 156ff.). Im Gegensatz zu dieser Binärcodierung nutzt man bei Choice-Based Conjoint-Analysen eine sog. Effektkodierung. Siehe dazu Gensler (2006), 317. 621 Vgl. Schweikl (1985), 62; Gierl (1995), 166; Green; Krieger; Wind (2001), 61; Green; Wind; Rao (1998), 68; Klein (2002), 50. 622 Siehe dazu Kapitel 3.7. 623

Vgl. Rink (1987), 54.

100

Alternativen untersucht, so ergeben sich insgesamt 9*(9-1)/2 = 36 Paarvergleiche,624 die von einem Entscheidungsträger bewertet werden müssten. Aufstellung eines Differenzendesigns bei einer Conjoint-Analyse auf Basis von Paarvergleichen

Zur Reduzierung der Anzahl der Paarvergleiche kann u.a. ein Partially Balanced Incomplete Block Design625 oder ein von Hausruckinger; Herker (1992, 104ff.) vorgeschlagenes Design genutzt werden. Beide Vorgehensweisen sind jedoch nur in speziellen Fällen anwendbar. Sind die Voraussetzungen für diese Vorgehensweisen nicht erfüllt, könnten zufällig gebildete Paarvergleiche von den Entscheidungsträgern eingeschätzt werden.626 Beim quadratischen Partially Balanced Incomplete Block Design werden die Produktalternativen zunächst in einem Quadrat angeordnet (siehe Tabelle 7 für ein Beispiel mit 9 Stimuli) und jeweils die Alternativen einer Spalte und danach die einer Zeile vollständig miteinander kombiniert.627 Durch diese Vorgehensweise wird v.a. sichergestellt, dass alle Produktvariationen in einer gleichen Häufigkeit im Untersuchungsdesign auftreten. Die Zahl der notwendigen Paarvergleiche konnte in diesem Beispiel von 36 auf 18 reduziert werden. A1

A2

A3

A4

A5

A6

A7

A8

A9

Paarvergleiche anhand der Spalten anhand der Zeilen A1, A4 A1, A7 A4, A7

A2, A5 A2, A8 A5, A8

A3, A6 A3, A9 A6, A9

A1, A2 A1, A3 A2, A3

A4, A5 A4, A6 A5, A6

A7, A8 A7, A9 A8, A9

Tabelle 7: Bildung eines Partially Balanced Incomplete Block Designs

Den Ausgangspunkt bei der Erstellung eines Partially Balanced Incomplete Block Designs bildet immer eine quadratische Ausgangsmatrix. Dies bedeutet allerdings, dass ein solches Erhebungsdesign nur dann erstellt werden kann, wenn 4, 9, 16, 25, 36 usw. Alternativen untersucht werden sollen.628 Eine weitere Möglichkeit zur Reduzierung der Anzahl von Paarvergleichen präsentieren Hausruckinger; Herker (1992, 104ff.).629 Dieses Verfahren ermöglicht gegenüber dem Partial624 625 626

Siehe analog Huber; Holbrook (1982), 460. Vgl. Clatworthy (1955), 177ff.; Green (1974), 65; Rink (1987), 54ff.; Leigh; MacKay; Summers (1984), 457. Für weitere Varianten der Balanced Incomplete Block Designs siehe David (1988), 93ff. Vgl. Green, Krieger, Agarwal (1991), 220.

627

Vgl. Green (1974), 65; David (1988), 95f. Für ein weiteres Anwendungsbeispiel siehe Gierl; Helm (1999), 833. Hausruckinger (1993, 131) und Herker (1992, 88) bezeichnen die Nutzung von Partially Balanced Incomplete Block Designs auch als die „üblicherweise“ eingesetzte Methode. 628 Vgl. Green (1974), 65. 629

Siehe für eine ausführliche Beschreibung auch Hausruckinger (1993), 132ff.; Herker (1992), 89ff.

101

ly Balanced Incomplete Block Design zwar eine deutliche Verringerung der Anzahl der Paarvergleiche,630 ist jedoch nur bei Untersuchung einer bestimmten Anzahl von Eigenschaften und Ausprägungen anwendbar.631 Deshalb besitzt sie kaum praktische Relevanz.632 Schätzung der Teilnutzen auf Basis eines Differenzendesigns

Nachdem die zu untersuchenden Alternativen und Paarvergleiche festgelegt sowie von den Entscheidungsträgern eingeschätzt wurden, können, je nach verwendetem Erhebungsdesign,633 die Bewertungen in eine Rangfolge überführt und danach die entsprechenden Teilnutzen bestimmt bzw. die Teilnutzen direkt auf Basis eines Differenzendesigns geschätzt werden.634 Als nachteilig erweist sich bei der Transformation der Einschätzungen in eine Rangfolge, dass bei der Anwendung von abgestuften Paarvergleichen die zusätzlich erhobenen Informationen über die Stärke der Vorziehenswürdigkeit einer Alternative nicht in die Nutzenschätzung eingehen.635 Mit Hilfe eines Differenzendesigns können die Einschätzungen der Paarvergleiche direkt zur Bestimmung der individuellen Teilnutzen herangezogen werden. Diese Vorgehensweise beruht auf der Annahme, dass Eigenschaften, die in beiden Stimuli eines Paarvergleichs eine identische Ausprägung aufweisen, keinen Einfluss auf die Präferenz ausüben. Vielmehr ergeben sich Präferenzunterschiede zwischen den beiden Alternativen eines Paarvergleichs lediglich durch Merkmale, die unterschiedliche Ausprägungen aufweisen.636 Ein Differenzendesign wird gebildet, indem die Differenzen aus den binären Codierungen der beiden Alternativen eines jeden Paarvergleichs gebildet werden. Im Folgenden wird dies an 630

Vgl. Hausruckinger; Herker (1992), 104; Hausruckinger (1993), 131; Herker (1992), 89, 96f.

631

Die von Hausruckinger; Herker (1992, 104ff.) vorgeschlagene Vorgehensweise kann nur in folgenden Fällen genutzt werden: 1.) Es werden 7 Eigenschaften untersucht, wobei 1 Attribut durch 5 bis 8 Ausprägungen und die verbliebenen 6 Merkmale durch 2 Ausprägungen beschrieben werden. 2.) Es werden 4 Eigenschaften mit je 4 Ausprägungen untersucht. 3.) Es werden 6 Eigenschaften untersucht, wobei 3 Attribute durch 3 oder 4 Ausprägungen und 3 Eigenschaften durch 2 Ausprägungen beschrieben werden. 4.) Insgesamt werden 8 Merkmale untersucht, wobei 2 Eigenschaften durch 3 oder 4 Ausprägungen und 6 Attribute durch 2 Ausprägungen beschrieben werden. Letztendlich könnte die Methode auch genutzt werden, wenn 12 Eigenschaften mit jeweils 2 Ausprägungen untersucht werden (vgl. Hausruckinger; Herker (1992), 109; Hausruckinger (1993), 141). Geht man wie Green; Srinivasan (1990, 8) oder Green; Srinivasan (1978, 108) davon aus, dass im Rahmen einer Conjoint-Analyse auf Basis einer Full-Profile Darstellung maximal 6 Eigenschaften berücksichtigt werden können, so reduziert sich die Anwendbarkeit der von Hausruckinger; Herker (1992, 104ff.) vorgeschlagenen Vorgehensweise auf den 2. und 3. Fall. 632 Anwendungen finden sich in Gierl; Helm (1999), 270ff.; Hausruckinger (1993), 154ff. 633 634 635 636

Bei der Nutzung von Partially Balanced Incomplete Block Designs können die paarweisen Einschätzungen der Alternativen in eine Rangfolge der Stimuli überführt werden. Vgl. Reiners (1996), 75ff; Hausruckinger; Herker (1992), 101. Vgl. Hausruckinger; Herker (1992), 101. Vgl. Hausruckinger; Herker (1992), 101; Louviere; Woodworth (1988), 513; Gierl; Helm (1999), 833f. Für eine alternative Vorgehensweise siehe auch Huber; Holbrook (1982, 460ff.), die jedoch auf der Einschätzung eines nicht reduzierten Sets an Paarvergleichen beruht. Ein Befragungsteilnehmer bewertet dabei jeweils lediglich ein Sub-Set der möglichen Paarvergleiche.

102

einem beispielhaften Paarvergleich erläutert; den Ausgangspunkt bilden zwei Alternativen A und B, die durch vier Eigenschaften (E1, E2, E3 und E4) beschrieben werden. Jede Eigenschaft weist in diesem Beispiel zwei Ausprägungen (A1 und A2) auf. Es wird angenommen, dass die Produkte A und B die folgenden Ausprägungen besitzen (siehe Tabelle 8). Produkt A B

Eigenschaft 1 A1 A1

Eigenschaft 2 A1 A2

Eigenschaft 3 A2 A1

Eigenschaft 4 A2 A2

Tabelle 8: Erstellung eines Differenzendesigns – Alternativen eines Paarvergleichs

Anschließend werden die Alternativen binär codiert, wobei die Ausprägung 1 (A1) jedes Merkmals mit „0“ und die Ausprägung 2 (A2) jeweils mit „1“ beschrieben wird. Es ergibt sich für diese beiden Alternativen somit die in Tabelle 9 dargestellte Codierung. Für jeden Paarvergleich wird nun die Differenz zwischen den beiden Alternativen gebildet (in diesem Beispiel zwischen Alternative A und B).637 Produkt A B A-B

Eigenschaft 1 0 0 0-0= 0

Eigenschaft 2 0 1 0-1= -1

Eigenschaft 3 1 0 1-0= 1

Eigenschaft 4 1 1 1-1= 0

Tabelle 9: Erstellung eines Differenzendesigns – Binärcodierung und Differenzbildung

Wenn die Ausprägungen einer Eigenschaft bei beiden Stimuli identisch sind (im Beispiel in Tabelle 9 trifft dies für die Eigenschaften 1 und 4 zu), so ergibt sich jeweils eine Differenz von „0“. Damit wird, wie bereits beschrieben, unterstellt, dass Eigenschaften, die die gleiche Ausprägung aufweisen, keinen Einfluss auf die Einschätzung der Alternativen in einem Paarvergleich ausüben.638 Die Gesamtheit der Differenzen aus allen Paarvergleichen analog zu dem Beispiel in Tabelle 9 bildet das Differenzendesign. Diese gehen bei Schätzung der Teilnutzen mit Hilfe einer

637

Um die Interpretation der zu schätzenden Teilnutzen zu erleichtern, wird die Codierung der Alternativen, die im Paarvergleich rechts (Produkt B) angeordnet sind, von der abgezogen, die auf der linken Paarvergleichsseite (Produkt A) dargestellt ist (in diesem Beispiel A – B). Eine „+1“ bedeutet dabei, dass A die Ausprägung 2 aufweist, während der Stimulus B diese nicht besitzt. Eine „-1“ ist analog zu interpretieren, d.h. die Alternative B weist die Ausprägung 2 auf, während dies bei Produkt A nicht der Fall ist. Eine „0“ bedeutet, dass sich die Ausprägungen von Produkt A und B nicht unterscheiden, d.h. in diesem Beispiel kann Ausprägung 1 oder 2 bei beiden Alternativen vorliegen. 638 Eine solche Annahme bedeutet jedoch gleichzeitig, dass Conjoint-Analysen, bei denen die Teilnutzen auf Basis von Paarvergleichen, denen ein Differenzendesign zugrunde liegt, berechnet wurden, unabhängig von der Fraktionierung des Erhebungsdesigns nicht bzw. nur eingeschränkt zur Berücksichtigung von Interaktionseffekten (siehe Kapitel 4.2.3.1) geeignet sind. Beim Auftreten von Interaktionseffekten ist diese Annahme nicht mehr gültig, denn der Interaktionseffekt zwischen zwei Merkmalen kann durch das Differenzendesign nicht abgebildet werden. Bevorzugt ein Entscheidungsträger beispielsweise eigentlich beim Untersuchungsobjekt „Auto“ eine grau-metallic Farbe, bei der Marke „Ferrari“ dagegen eine rote Farbe, so liegt ein Interaktionseffekt vor. Ist in einem Paarvergleich bei beiden Alternativen die „rote“ Farbe vorhanden und bei einer Alternative zudem die Kombination „rot“ und „Ferrari“, so wird durch den Interaktionseffekt diese Alternative vom Entscheidungsträger stärker präferiert. Dies kann allerdings nicht durch das Differenzendesign erklärt werden.

103

OLS Regression als Ausprägungen der unabhängigen Variablen in die Regressionsgleichung ein. Als abhängige Variablen dienen die Bewertungen der Entscheidungsträger für jeden Paarvergleich (siehe Abbildung 10 für ein typisches Beispiel eines Paarvergleichs).639

Produkt A

Produkt B

E1: A1

A1 :E1

E2: A1

A2 :E2

E3: A2

A1 :E3

E4: A2

A2 :E4

4

3

sehr viel

viel

2 deutlich

A ist besser als B

1 etwas

0 gleich gut

-1

-2

etwas

deutlich

A~B

-3 viel

-4 sehr viel

B ist besser als A

Abbildung 10: Paarvergleich zweier hypothetischer Produkte

Nachdem die zu bewertenden Alternativen bzw. Paarvergleiche vom Marktforscher bestimmt wurden, muss die Präsentationsform der Bewertungsaufgabe festgelegt und danach die Stimuli von den Befragungsteilnehmern bewertet werden.

3.5

Präsentationsform

Zur Präsentation der zu bewertenden Stimuli können die Eigenschaften und Ausprägungen verbal, bildlich bzw. multimedial dargestellt oder die Alternativen in realer Form den Ent-

scheidungsträgern zur Einschätzung vorgelegt werden. Verbale Präsentation der Informationen

Meist werden im Rahmen von Studien zur Präferenzmessung verbale stichwortartige Formulierungen640 auf Stimuluskarten641 genutzt, um die Eigenschaften und Ausprägungen der

639

Die Codierung der Einschätzungen (von +4 bis zu –4) wurde wiederum so gewählt, dass, falls Produkt A bevorzugt wird, ein positiver Wert bzw. wenn Produkt B präferiert wird, ein negativer Wert in die Regressionsgleichung als abhängige Variable eingeht. Wenn ein Produkt A eine Nicht-Basis-Ausprägung und Produkt B die Basis-Ausprägung aufweist, wird dies im Differenzendesign mit einem „(+)1“ gekennzeichnet. Bevorzugt der Entscheidungsträger diese Nicht-BasisAusprägung, so wird er eine Einschätzung vornehmen, die eher einen positiven Wert erhält. Präferiert der Befragungsteilnehmer dagegen die Basis-Ausprägung, so resultiert aus diesem Paarvergleich eine Beurteilung, die eher einen negativen Wert annimmt. In der Regression geschätzte, positive Teilnutzen weisen somit darauf hin, dass die jeweilige Ausprägung gegenüber der Basis-Ausprägung bevorzugt wird. Analog gilt dies, wenn das Produkt B eine Nicht-BasisAusprägung und Produkt A eine Basis-Ausprägung aufweist. Dies wird im Differenzendesign mit „-1“ gekennzeichnet. Bevorzugt ein Entscheidungsträger eine Nicht-Basis-Ausprägung, so wird die Bewertung auf der Skala des Paarvergleichs tendenziell einen negativen Wert annehmen. In die Regressionsgleichung geht somit als unabhängige Variable ein negativer Wert aus dem Differenzendesign ein, während bei Bevorzugung der Nicht-Basis-Ausprägung auch die Bewertung einen negativen Wert annimmt. Der resultierende Teilnutzenwert weist somit ein positives Vorzeichen auf.

104

zu bewertenden Alternativen zu beschreiben.642 Die Vorteile einer verbalen Präsentationsform bestehen darin, dass die Daten vergleichsweise unkompliziert und effizient erhoben werden können. Andere Darstellungsformen verursachen dagegen zusätzliche Kosten. Die Erstellung nicht-verbaler Beschreibungen nimmt zudem tendenziell mehr Zeit in Anspruch.643 Verbale Beschreibungen ermöglichen dem Entscheidungsträger eine relativ einfache und strukturierte Informationsaufnahme,644 er wird nicht durch die Art der Darstellung abgelenkt.645 Komplexe Eigenschaften sollten allerdings vor der eigentlichen Präferenzmessung erläutert werden.646 Eine verbale Beschreibung von Eigenschaften, deren Ausprägungen ästhetische, geschmackliche, symbolische, olfaktorische oder akustische Reize darstellen, ist dagegen nur schwer möglich.647 Insbesondere bei diesen Eigenschaften kann nicht sichergestellt werden, dass alle Entscheidungsträger identische Vorstellungen über die jeweilige Ausprägung auf Basis der verbalen Beschreibungen ableiten.648 Eine weitere verbale, abstrakte Darstellungsform ist die sog. „Paragraph-Description“ – dabei werden die zu bewertenden Alternativen in Form eines Fließtextes beschrieben.649 Auf diese Weise soll der Realitätsgrad der Datenerhebung erhöht werden.650 Diese verbalen Beschreibungen können in Form von Werbeanzeigen651 bzw. fiktiven Testberichten652 dem Entscheidungsträger vorgelegt werden. Daher könnten mit Hilfe von Paragraph-Descriptions auch Werbeslogans getestet werden. Dabei muss jedoch auf individuellem Niveau mit einer, im Vergleich zur stichwortartigen Beschreibung, geringeren Validität gerechnet werden.653 Durch die Nutzung eines Fließtexts zur Beschreibung der Bewertungssituation ist die Bewer-

640 641 642 643 644 645 646

Diese Art der Präsentation wird auch als abstrakte Art der Produktbeschreibung bezeichnet (vgl. Ernst (2000), 2). Für ein Beispiel siehe Abbildung 10. Vgl. Wittink; Vriens; Burhenne (1994), 44f.; Ernst (2000), 2; Albrecht (2000), 90; Schubert (1991), 218f.; Cattin; Wittink (1982), 48. Vgl. Green; Srinivasan (1978), 111; Green; Wind (1975), 113; Albrecht (2000), 88. Vgl. Ernst (2000), 3; Albrecht (2000), 87. Vgl. Ernst (2000), 3. Vgl. Albrecht (2000), 87.

647

Vgl. Holbrook; Moore (1981), 103; Schubert (1991), 219; Albrecht (2000), 88. Siehe dazu auch Kapitel 4.1.8. Produkte, die vor allem durch sensorisch wahrnehmbare Eigenschaften beschrieben werden, sind u.U. nicht als Untersuchungsobjekte im Rahmen von Studien zur Präferenzmessung geeignet, da sie von den Entscheidungsträgern eher „als Ganzes“ beurteilt und deshalb weniger sinnvoll in einzelne Merkmale, zwischen denen keinerlei Interaktionsbeziehungen bestehen, aufgeteilt werden können (siehe dazu Kapitel 2.5). 648 Siehe Kapitel 4.1.8. 649 650 651 652 653

Siehe für ein Beispiel Hauser; Urban (1977), 590 oder Schubert (1991), 221. Vgl. Schubert (1991), 220. Dabei ist allerdings nicht klar, ob die Entscheidungsträger die Produkte selbst oder die Gestaltung des Werbetextes bewerten (vgl. Schubert (1991), 221; Albrecht (2000), 87). Vgl. Schubert (1991), 220. Vgl. Green; Srinivasan (1978), 111.

105

tung aus Sicht der Befragungsteilnehmer tendenziell komplexer,654 weshalb weniger Eigenschaften als bei einer stichwortartigen verbalen Präsentation untersucht werden können.655 Visuelle Darstellungsformen von Stimuli Visuelle, d.h. bildliche Darstellungen der Eigenschaftsausprägungen sollen insbesondere die

Bewertung der Alternativen erleichtern.656 Dabei können Zeichnungen, Computergrafiken, Fotos, Fotomontagen oder Filme zur Beschreibung der Alternativen angewendet werden.657 Bei der Nutzung bildlicher Darstellungsmöglichkeiten muss ein Entscheidungsträger die vorgegebene Information nicht erst lesen. Infolgedessen ist im Vergleich zu verbalen Beschreibungen mit einer weniger starken Informationsüberlastung zu rechnen.658 Außerdem kann eine visuelle Darstellungsform sicherstellen, dass die Eigenschaftsausprägungen möglichst homogen von den Befragungsteilnehmern wahrgenommen werden.659 Diese Präsentationsform entspricht bei vielen Produktgruppen eher einer realen Entscheidungssituation.660 Die Einschätzung verschiedener Alternativen wird deshalb oft weniger ermüdend und interessanter als bei verbalen Beschreibungen wahrgenommen.661 Ein Nachteil bei der Nutzung bildlicher Informationen zur Beschreibung von Alternativen besteht darin, dass die vom Marktforscher zur Verfügung gestellten Informationen möglicherweise von den Befragungsteilnehmern anders als intendiert interpretiert werden.662 Des Weiteren könnten in visuellen Darstellungen Eigenschaften wahrgenommen werden, die eigentlich gar nicht untersucht werden sollen,663 denn die in einem Bild enthaltenen Informationen können nicht wie bei einer verbalen Beschreibung systematisch kontrolliert und variiert werden. Wie bei der Nutzung der Paragraph-Description kann außerdem nicht ausgeschlossen werden, dass die Befragungsteilnehmer nicht das Produkt, sondern lediglich die Gestaltung der Bildinformationen bewerten.664 Schließlich ist die Erstellung visueller Beschreibungen von Alternativen gegenüber der verbalen Präsentationsform zeit- und kostenintensiver.665 Die multimediale Präsentation ist eine Mischform aus verbalen, bildlichen und akustischen Reizen. Zur Beschreibung der Alternativen können Texte, Bilder, Videosequenzen, computer654 655 656 657 658 659 660 661 662 663 664 665

Vgl. Schubert (1991), 221. Vgl. Green; Srinivasan (1978), 111. Vgl. Schubert (1991), 222; Albrecht (2000), 86. Vgl. Green; Srinivasan (1990), 7f.; Albrecht (2000), 88. Vgl. Green; Srinivasan (1978), 111; Green; Srinivasan (1990), 7; Loosschilder; Rosbergen; Vriens; Wittink (1995), 19f. Vgl. Green; Srinivasan (1978), 111; MacKay; Ellis; Zinnes (1986), 533; Albrecht (2000), 86. Vgl. Green; Srinivasan (1978), 111; Perrey (1998), 72f.; Loosschilder; Rosbergen; Vriens; Wittink (1995), 19f. Vgl. Green; Srinivasan (1978), 111; Green; Srinivasan (1990), 7; Albrecht (2000), 88. Vgl. Green; Srinivasan (1978), 111; Green; Srinivasan (1990), 7. Vgl. Perrey (1998), 73; Schubert (1991), 222. Vgl. Schubert (1991), 222. Vgl. Albrecht (2000), 88; Schubert (1991), 222.

106

animierte virtuelle Produkte, Töne und Geräusche genutzt werden.666 Eine Kombination verschiedener Informationsarten kann die Informationsaufnahme der Befragungsteilnehmer beschleunigen.667 Die multimediale Darstellung von Informationen ist insbesondere dann relevant, wenn verbale Beschreibungen subjektiv unterschiedlich wahrgenommen werden668 bzw. es sich um „innovative“ Merkmalsausprägungen handelt669 und ein entsprechendes Vorwissen der Befragungsteilnehmer noch nicht vorhanden ist, um verbal beschriebene Eigenschaftsausprägungen valide einschätzen zu können. Zur Präsentation der Alternativen können weitere Mischformen genutzt werden. So besteht die Möglichkeit, einige Merkmale verbal und andere durch Bilder zu beschreiben.670 Alternativ können beide Präsentationsformen so kombiniert werden, dass die Merkmalsausprägungen sowohl verbal als auch visuell dargestellt werden.671 Der Befragungsteilnehmer kann durch eine redundante Vorgabe von Informationen selbst auswählen, welche Präsentationsart er zur Einschätzung der Alternativen nutzt.672 Dabei ist damit zu rechnen, dass die Ergebnisse tendenziell denen der verbalen Präsentationsform entsprechen, jedoch die Informationen schneller aufgenommen werden können.673 Durch Kombination visueller und verbaler Beschreibungen erhofft man sich im Vergleich zu einer ausschließlichen Nutzung einer Präsentationsform eine höhere Realitätsnähe der Bewertungsaufgabe bei gleichzeitig geringerem Gestaltungsaufwand. 674 Physische Präsentation von Alternativen

Die Nutzung physischer Stimuli, die beispielsweise durch Präsentation dreidimensionaler Modelle, Prototypen oder realer Produkte erfolgen kann, entspricht häufig am ehesten einer realen Entscheidungssituation.675 Im Gegensatz zu den anderen Präsentationsarten können mit Hilfe realer Produkte oder Prototypen ebenso haptische, gustative oder olfaktorische Reize 666 667 668 669

Vgl. Ernst (2000), 3; Ernst; Sattler (2000), 161; Dahan; Srinivasan (2000), 102. Vgl. Hauser; Urban (1977), 78. Vgl. Ernst (2000), 154f., 173f.; Palupski (1995), 264. Vgl. Ernst (2000), 154f., 163.

670

Für ein Beispiel siehe Green; Wind (1975, 109); dabei werden vier Merkmale verbal und eine Eigenschaft durch Skizzen beschrieben. Durch die Nutzung unterschiedlicher Präsentationsformen kann es allerdings zu Verzerrungseffekten kommen (vgl. Albrecht (2000), 90). Vermutlich wird den visuell dargestellten Merkmalen einen höhere Aufmerksamkeit gewidmet, weshalb diese einen tendenziell höheren Einfluss auf die Bewertungen besitzen. Entsprechend dieser Vermutung weist die visuell dargestellte Eigenschaft in der Studie von Green; Wind (1975, 110) das höchste Bedeutungsgewicht auf. Dieser Effekt tritt allerdings nicht „automatisch“ auf (vgl. Albrecht (2000), 459). Degeratu; Rangaswamy; Wu (2000, 76) stellen in einer empirischen Studie beispielsweise fest, dass die Präsentationsform keinen Einfluss auf die Präferenzen ausübt. Möglicherweise wurde aber in dieser Studie ein Mindestniveau an visueller bzw. multimedialer Darstellung nicht erreicht (vgl. Ernst (2000), 176f.). 671 Vgl. Green; Srinivasan (1978), 111. 672 673 674 675

Vgl. Albrecht (2000), 89. Vgl. Green; Srinivasan (1978), 111. Vgl. Schubert (1991), 226. Vgl. Schubert (1991), 224ff.; Albrecht (2000), 88f.; Dahan; Srinivasan (2000), 103.

107

untersucht werden.676 Im Vergleich zu anderen Präsentationsarten ist die Generierung der Produktalternativen jedoch mit einem erheblichen Aufwand verbunden.677 Selektion einer Präsentationsform

Wie bereits in Kapitel 3.1.3 dargestellt, kann die Art der Präsentation einen erheblichen Einfluss auf die Ergebnisse der Präferenzmessung ausüben.678 Ziel ist es, den Entscheidungsträger durch die Wahl der Präsentationsform bei der Bewertung der Alternativen zu unterstützen. Dabei ist davon auszugehen, dass eine realitätsnähere Präsentationsform die Validität der Einschätzungen tendenziell verbessert.679 Dies bedeutet im Umkehrschluss, dass je nach Produktart eine Präsentationsform gewählt werden sollte, die der Art der Informationsaufnahme in realen Entscheidungssituationen möglichst nahe kommt. Dienstleistungen können bei-

spielsweise häufig nur verbal beschrieben werden.680 Neben der zu untersuchenden Produktgruppe hat auch die Vertrautheit der Befragungsteilnehmer mit dem Untersuchungsobjekt, die Art der Präferenzmessmethode, die Phase im Produktentwicklungsprozess und der mit einer Präsentationsform verbundene zeitliche und finanzielle Aufwand681 einen Einfluss auf die Selektion einer geeigneten Präsentationsform. -

Je geringer die Vertrautheit der Befragungsteilnehmer mit einer Produktgruppe ist, desto schwerer fällt es ihnen, die Alternativen zu bewerten. Eine abstrakte, d.h. verbale Präsentationsform kann in diesen Fällen zu verzerrten Ergebnissen führen. Eine realitätsnähere Darstellungsform könnte insbesondere die Güte der Präferenzmessung positiv beeinflussen. Auch die Art der Präferenzmessung hat Auswirkungen auf die Anwendbarkeit verschiedener Präsen-

tationsarten. Reale Produkte oder Prototypen sind immer multiattributive Darstellungsformen und können deshalb nur im Rahmen von dekompositionellen Verfahren zur Präferenzmessung berücksichtigt werden. Bei der Selektion einer bestimmten Präsentationsform spielen Praktikabilitätsüberlegungen eine dominante Rolle. Die Nutzung verbaler Beschreibungen ist mit

dem geringsten finanziellen und zeitlichen Aufwand verbunden. Dies spielt beispielsweise dann eine wichtige Rolle, wenn sich ein Hersteller noch in einer relativ frühen Produktentwicklungsphase befindet. Im Gegensatz dazu könnte die Nutzung einer möglichst realitätsnahen Präsentationsform, z.B. durch Prototypen oder reale Produkte, in späten Phasen der Pro676 677 678 679 680 681

Vgl. Schubert (1991), 225; Albrecht (2000), 89. Für verschiedene Beispiele siehe Schubert (1991), 225f. Ansonsten sind bei der physischen Darstellung die gleichen Vorund Nachteile wie bei der bildlichen bzw. multimedialen Darstellung zu erwarten (vgl. Albrecht (2000), 89). Vgl. Ernst (2000), 224ff. Vgl. Albrecht (2000), 86; Sattler (1991), 136. Vgl. Green; Srinivasan (1978), 111; Perrey (1998), 73; Albrecht (2000), 87. Vgl. Albrecht (2000), 86f.; Ernst (2000), 3.

108

duktentwicklung sinnvoll sein. Mögliche Produktkonzepte sind nun konkreter als in frühen Phasen spezifiziert und können mit Hilfe von Prototypen direkt auf die Marktakzeptanz hin überprüft werden.682 Derzeit dominiert, wie bereits erwähnt, die Nutzung verbaler Beschreibungen bei Studien zur Präferenzmessung. Da verschiedene Einflussfaktoren auf die Vorteilhaftigkeit einer Präsentationsform einwirken, kommen Vergleichsstudien zur Eignung einzelner Präsentationsformen zu unterschiedlichen Ergebnissen.683 Der Marktforscher muss bei der Auswahl einer Präsentationsart die in diesem Kapitel beschriebenen Einflussgrößen beachten und kann danach die Präsentationsform auswählen. Hat der Marktforscher die Präsentationsform festgelegt, können in einem nächsten Schritt die Präferenzen der Entscheidungsträger erhoben werden. Nachdem die Befragungsteilnehmer die Alternativen bewertet haben, können die Teilnutzen der einzelnen Merkmalsausprägungen geschätzt werden.

3.6

Schätzverfahren zur Bestimmung der Teilnutzen der untersuchten Ausprägungen

Das zur Ermittlung der Teilnutzen aller Ausprägungen zu verwendende Schätzverfahren muss entsprechend der verwendeten Skalenart festgelegt werden.684 Dabei unterscheidet man zwischen den in Abbildung 11 dargestellten Verfahrensarten.685 Analyse von: Auswahldaten

Rangdaten

Intervallskalierte Daten

z.B. Logit- und Probit-Modelle

z.B. MONANOVA, LINMAP

z.B. OLS Regression

Abbildung 11: Überblick über typische Schätzverfahren bei der Conjoint-Analyse

Liegen kompensatorische Entscheidungsprozesse, wie sie bei der Conjoint-Analyse unterstellt werden, vor, scheint die Anwendung einer OLS Regression (Ordinary Least Square

682 683 684 685

Vgl. Albrecht (2000), 86f., 199. Für einen Überblick siehe Albrecht (2000), 89f. Vgl. Weisenfeld-Schenk (1989), 68f.; Schubert (1991), 231. Vgl. Green; Srinivasan (1978), 112ff.; Reiners (1996), 133. Für einen Überblick weiterer Schätzverfahren siehe Green; Srinivasan (1978), 114; Schubert (1991), 230ff.; Reiners (1996), 134ff.

109

Regression) vorteilhaft.686 In den letzten Jahren ist zudem ein Trend in Richtung dieses metrischen Verfahrens zu beobachten.687 Im Folgenden soll deshalb insbesondere die OLS Regression beschrieben werden; diese Methode stellt das am häufigsten verwendete Verfahren zur Schätzung der Teilnutzen dar.688 Auswahldaten

Präferenzen können auf der Basis von Auswahldaten erhoben werden. Dabei selektiert der Befragungsteilnehmer beispielsweise aus einem Alternativenset den Stimulus, den er am meisten bevorzugt. Es handelt sich letztendlich um dichotome Urteile (Wahl/Nicht-Wahl). Die Informationseffizienz der Datenerhebung ist deshalb im Vergleich zu den anderen Skalenarten am geringsten. Aus diesem Grund wird zur Bestimmung der Teilnutzen eine Vielzahl an Auswahldaten benötigt.689 Die Präferenzen einer Gruppe von Entscheidungsträgern oder auch von einzelnen Befragungsteilnehmern können mit Hilfe von Logit oder Probit-Modellen geschätzt werden.690 Rangdaten

Bei ordinal skalierten Daten bildet der Befragungsteilnehmer entsprechend der Vorziehenswürdigkeit eine Rangfolge der Alternativen. Bei ordinalen Daten können die Teilnutzen mit Hilfe der Verfahren MONANOVA (Monotonic Analysis Of Variance) und LINMAP (LINear MAPping) geschätzt werden.691 Die Teilnutzen werden hierbei so bestimmt, dass der Gesamt-

686

Vgl. Green; Srinivasan (1978), 114. Ein typisches Verfahren, bei dem die Teilnutzen mit Hilfe der OLS Regression bestimmt werden, ist die ACA (vgl. Reiners (1996), 135). Bei einem Vergleich der verschiedenen Verfahren zur Parameterschätzung nimmt allerdings kein Verfahren eine eindeutig dominante Stellung ein. Während bei Darmon; Rouziès (1994, 475) die OLS Regression tendenziell zu einer höheren Ergebnisgüte führt, finden Jain; Acito; Malhotra; Mahajan (1979, 320) und Wittink; Cattin (1981, 105) kaum Unterschiede in den Ergebnissen der verschiedenen Schätzverfahren. Deshalb gehen einige Autoren davon aus, dass die Unterschiede zwischen den verschiedenen Methoden bezüglich der Schätzgenauigkeit eher „gring“ sind (vgl. Melles (2001), 81). Albrecht (1997, 101) findet dagegen in einer Meta-Studie beim Vergleich der Schätzverfahren „gemischte“ Ergebnisse bezüglich der Eignung der Verfahren - insgesamt kann allerdings auch bei dieser Meta-Studie keine dominante Methode identifiziert werden. OLS Regression und LINMAP sind jedoch offensichtlich geeignete Verfahren zur Parameterschätzung (vgl. Albrecht (1997), 101). 687 Vgl. Huber (1987), 4. 688

Vgl. Wittink; Cattin (1989), 92; Wittink; Vriens; Burhenne (1994), 44, 46; Melles (2001), 80ff.; Melles; Holling (1998), 12; Fischer (2001), 93. 689 Die Schätzung der Teilnutzenwerte erfolgt deshalb oft auf Gruppenebene (vgl. Albrecht (1997), 101; Green; Krieger (1996), 852). Bei der CBC wird dieses Problem mit Hilfe der Zusatzmodule zur Latent-Class Analyse oder dem Hierarchical Bayes Ansatz gemildert (siehe Kapitel 3.1). 690 Vgl. Green; Srinivasan (1978), 113; Albrecht (2000), 100f.; Wittink; Cattin (1989), 92; Wittink; Vriens; Burhenne (1994), 44; Jain; Acito; Malhotra; Mahajan (1979), 317. 691 Vgl. Schweikl (1985), 60f.; Albrecht (2000), 100; Wittink; Cattin (1989), 92; Wittink; Vriens; Burhenne (1994), 44; Green; Srinivasan (1978), 113; Carmone; Green; Jain (1978), 300ff.; Tscheulin (1992), 46. Für eine Beschreibung der MONANOVA siehe Green; Tull (1982), 451; Green; Rao (1971), 356; Green; Carmone; Wind (1972), 291; Backhaus; Erichson; Plinke; Weiber (2003), 560ff.; Louviere (1988a), 95f. Für eine Erläuterung des LINMAP siehe Perrey (1998), 168; Albrecht (1997), 100; Melles (2001), 81; Chrzan (1991), 207f.

110

nutzen der von dem Entscheidungsträger bewerteten Alternativen der erhobenen Rangfolge so gut wie möglich entspricht.692 Die Regressionsanalyse ist im Grunde nur zur Analyse von intervall-skalierten Input-Daten wie beispielsweise Rating-Skalen – geeignet. Dennoch werden damit teilweise auch Teilnutzen auf Basis von Rangdaten geschätzt.693 Obwohl dies gegen die Anwendungsvoraussetzungen der Regressionsanalyse verstößt, zeigen verschiedene Studien, dass sich die ermittelten Teilnutzen zwischen den Verfahren kaum unterscheiden und die Anwendung der Regressionsanalyse auch bei ordinalen Input-Daten zu „guten“ Ergebnissen führt.694 Im Vergleich zu anderen Schätzverfahren stellt die Regressionsanalyse eine robuste695 und exakte696 Methode dar.697 Intervall-skalierte Daten

Die Regressionsanalyse ist eines der am häufigsten genutzten statistischen Analyseverfahren, mit deren Hilfe der Einfluss einer oder mehrerer unabhängiger metrischer bzw. binär codierter Variablen auf eine metrische abhängige Variable untersucht werden kann.698 Bei der Schätzung der Teilnutzen mit Hilfe einer Regressionsanalyse gehen die im Erhebungsdesign binärcodierten Alternativen bzw. bei einem Differenzendesign die Paarvergleiche als unabhängige Variablen ein, während die von einem Entscheidungsträger (z.B. mit Hilfe von RatingSkalen) abgegebenen Urteile die metrische, abhängige Variable „Präferenz“ repräsentieren.699 Für jeden Befragungsteilnehmer werden die Teilnutzen somit auf individueller Ebene geschätzt, d.h. für jeden Entscheidungsträger wird eine individuelle Regressionsgleichung aufgestellt. Schätzung der Teilnutzen auf Basis der OLS Regression

Sollen beispielsweise die Teilnutzen für zwei Eigenschaften, wobei Eigenschaft 1 zwei und Eigenschaft 2 drei Ausprägungen aufweist, mit Hilfe einer Regressionsanalyse bestimmt werden, so könnte sich folgende Regressionsgleichung (siehe Gleichung 3) ergeben. Als unab-

692 693

Vgl. Green; Wind (1975), 109. Vgl. Albers (1983), 226; Hahn (1997), 71; Melles (2001), 80; Fischer (2001), 93; Reiners (1996), 133.

694

Siehe dazu Green; Srinivasan (1978), 114; Albrecht (2000), 100; Darmon; Rouziès (1994), 469ff.; Jain; Acito; Malhotra; Mahajan (1979), 318ff.; Agarwal (1988), 54. Vgl. Green; Srinivasan (1978), 113; Melles (2001), 81; Fischer (2001), 93; Reiners (1996), 133; Skiera; Gensler (2002a), 204. 696 Vgl. Darmon; Rouziès (1994), 475; Agarwal (1988), 54. Dies gilt insbesondere, wenn ein fraktioniertes Erhebungsdesign genutzt wird (vgl. Darmon; Rouziès (1991), 321). Zur Angemessenheit der mit Hilfe einer OLS Regression geschätzten Teilnutzenwerte siehe Akaah; Korgaonkar (1983), 190. 697 Die Regressionsanalyse ist auch in anderen Forschungsbereichen eine häufig genutzte Methode (vgl. Schweikl (1985), 64). 698 Vgl. Backhaus; Erichson; Plinke; Weiber (2003), 46ff.; Melles (2001), 80f. 695

699

Für die Erstellung eines Erhebungsdesigns siehe Kapitel 3.4.

111

hängige Variablen gehen dabei die durch das Erhebungsdesign in Tabelle 6 binär codierten Eigenschaften in die Schätzung ein. Als abhängige Variable dienen die Einschätzungen eines Befragungsteilnehmers, der in diesem Beispiel sechs Alternativen jeweils durch metrische Werte (in diesem Fall könnte es sich u.a. um Zahlungsbereitschaften700 handeln) bewertet hat. Bewertungen eines

Erhebungsdesign

Entscheidungsträgers701 ª10 º «20» « » «30 » « » «20» «30 » « » ¬«40¼»

E0 

ª0 º «0 » « » «0 » E1 * « »  «1» «1» « » ¬«1¼»

Konstante Eigenschaft 1

ª0 º ª0 º «1 » «0 » « » « » «0 » «1 » E 2 * « »  E3 * « » 0 « » «0 » «1 » «0 » « » « » 0 ¬« ¼» ¬«1¼»

Gleichung 3

Eigenschaft 2

Werden die Alternativen vom Entscheidungsträger direkt bewertet, so beinhaltet die zu schätzende Regressionsgleichung auch eine Konstante. Diese repräsentiert letztendlich eine Art „Grundnutzen“ bzw. den Nutzen eines Referenzobjekts, d.h. den Nutzen, den eine Alternative stiftet, bei der alle Merkmale jeweils die mit „0“ codierten Eigenschaftsausprägungen aufweisen.702 Bei der OLS Regression wird mit Hilfe von verschiedenen Regressionskoeffizienten (diese entsprechen bei der Conjoint-Analyse den Teilnutzen und der Konstante; in diesem Beispiel somit 0 bis 3) eine lineare Funktion so geschätzt, dass die Summe der quadrierten Abweichungen von den Beobachtungswerten (dies entspricht den erhobenen Präferenzen für jede Alternative) und den geschätzten Gesamtnutzen703 einer Alternative minimal wird. Ziel ist es dabei, den Erklärungsgehalt704 der geschätzten Gleichung zu maximieren.705 Durch die systematische Variation der Alternativen im Erhebungsdesign können aus den vom

700 701 702 703 704 705

Dies entspricht z.B. der Dollar-Metrik (siehe Kapitel 3.2). Jede Einschätzung entspricht dem Gesamtnutzen der jeweils betrachteten Alternative. Vgl. Gierl (1995), 157f. Der Gesamtnutzen einer Alternative ergibt sich aus der Summe der jeweiligen Teilnutzen (siehe Gleichung 1). Dieser wird durch das Bestimmtheitsmaß R2 ausgedrückt; siehe dazu Kapitel 3.10.1.2 Vgl. Backhaus; Erichson; Plinke; Weiber (2003), 58; Hahn (1997), 72; Skiera; Gensler (2002a), 205. Die OLS Regression wird auch als „Methode der kleinsten Quadrate“, Kleinst-Quadrate- oder KQ-Schätzung bezeichnet (siehe Backhaus; Erichson; Plinke; Weiber (2003), 58; Fischer (2001), 93f.). Da die unabhängigen Variablen binär codiert werden, kann man sie ebenfalls als Dummyvariablen-Regression bezeichnen (vgl. Gierl (1995), 166; Albrecht (2000), 100; Green; Krieger; Agarwal (1991), 478).

112

Entscheidungsträger

global

bewerteten

Alternativen

die

Teilnutzen

der

einzelnen

Eigenschaftsausprägungen abgeleitet werden. In diesem Beispiel ergibt sich die folgende Regressionsgleichung: 706 Präferenz = 10 + 10 * E1A2 + 10 * E2A2 + 20 * E2A3

Gleichung 4

Im Rahmen von Paarvergleichen werden die Alternativen nicht absolut, sondern jeweils ein Stimulus in Relation zu einer anderen Produktvariante - also relativ zu anderen Alternativen bewertet.707 Deshalb kann bei der Conjoint-Analyse auf Basis von Paarvergleichen mit Hilfe einer OLS Regression kein Grundnutzen geschätzt werden. Die Konstante entfällt hier bei der Ermittlung der Nutzenfunktion.708 Nachdem die Teilnutzen auf individueller Ebene bestimmt wurden, müssen die Schätzergebnisse in einem weiteren Schritt standardisiert werden, um eine Vergleichbarkeit der Werte zu gewährleisten.

3.7

Standardisierung der Schätzergebnisse

Die mit Hilfe eines der beschriebenen Schätzverfahren ermittelten Teilnutzen sollten vor einer Aggregation der Daten normiert werden.709 Dies stellt eine möglichst hohe Vergleichbarkeit der Ergebnisse sicher.710 Die Normierung der Teilnutzen ist typischerweise notwendig, da nicht davon ausgegangen werden kann, dass die verwendete Skala von allen Entscheidungsträgern identisch wahrgenommen wurde. Durch die Normierung können die Ergebnisse einfacher vom Marktforscher interpretiert und insbesondere erst danach aggregiert werden.711 Der Vorgang der Standardisierung kann in zwei Schritte unterteilt werden: 1. Bestimmung des Nullpunktes der Teilnutzen einer Eigenschaft, so dass dies die Interpretierbarkeit der Schätzergebnisse erleichtert und 2. Standardisierung der Teilnutzen, so dass diese zwischen den Entscheidungsträgern vergleichbar sind und die Daten aggregiert werden können.712

706 707 708 709 710

E1A2 bezeichnet die Ausprägung 2 der Eigenschaft 1. Vgl. Huber; Holbrook (1982), 462. Siehe dazu auch Schweikl (1985), 129. Im Folgenden werden die Begriffe „Standardisierung“ und „Normierung“ als Synonyme genutzt. Vgl. Balderjahn; Scholderer (2000), 277; Cattin; Wittink (1982), 51.

711

Vgl. Green; Krieger (1985), 3f.; Gutsche (1995), 133; Schweikl (1985), 132f.; Backhaus; Erichson; Plinke; Weiber (2003), 566f. Selbst bei der Nutzung der Dollar-Metrik bietet sich eine Normierung der Ergebnisse an, da oft Zweifel bestehen, dass die Befragungsteilnehmer damit tatsächlich ihre Zahlungsbereitschaft und nicht nur die jeweilige Vorziehenswürdigkeit einer Alternative ausdrücken wollten (vgl. Schweikl (1985), 132). 712 Vgl. Bauer; Thomas (1984), 209; Reiners (1996), 138f. Dieser Schritt verbessert gleichzeitig die Vergleichbarkeit der geschätzten Teilnutzen bei Anwendung verschiedener Schätzverfahren (vgl. Bauer; Thomas (1984), 209).

113

Erleichterung der Interpretierbarkeit der geschätzten Teilnutzen

Da die geschätzten Teilnutzenwerte auf einem Intervallskalenniveau vorliegen, besitzen die Daten keinen natürlichen Nullpunkt und können ohne Informationsverlust transformiert werden.713 Für diesen 1. Schritt stehen verschiedene Möglichkeiten zur Verfügung. Unter anderem können die Teilnutzen jeder Eigenschaft so skaliert werden, dass der am wenigsten bevorzugten Ausprägung jeweils ein Teilnutzen von „0“ zugewiesen wird (siehe Gleichung 5).714

E ijknorm

E ijk  min E ij

Gleichung 5715

mit

E ijk : E ijknorm : min Eij :

geschätzter Teilnutzen für k-te Merkmalsausprägung des j-ten Attributs beim i-ten Entscheidungsträger normierter Teilnutzen für k-te Merkmalsausprägung des j-ten Attributs beim i-ten Entscheidungsträger minimaler Teilnutzen des j-ten Attributs beim i-ten Entscheidungsträger

Eine weitere Möglichkeit, die Interpretation der geschätzten Teilnutzen zu erleichtern, wird im Zähler der Gleichung 7 dargestellt. Diese Variante bewirkt, dass die Teilnutzen eines Merkmals um den Nullpunkt zentriert werden, was die Interpretation der Daten erleichtert.716 Sicherstellung der Vergleichbarkeit der Schätzwerte zwischen verschiedenen Probanden

Eine Transformation auf Basis von Gleichung 5 erleichtert dem Marktforscher zwar die Interpretation der Schätzergebnisse, sie gewährleistet jedoch keinesfalls die Vergleichbarkeit der Teilnutzen zwischen den Entscheidungsträgern. Weil nicht sichergestellt ist, dass die Befragungsteilnehmer die verwendeten Bewertungsskalen in vergleichbarer Weise wahrgenommen und genutzt haben, ist eine Aggregation der Ergebnisse der Präferenzmessung nicht sinnvoll.717 Um diese zu ermöglichen, müssen die Variationsunterschiede der Einschätzungen zu-

713

Vgl. Bauer; Thomas (1984), 209; Reiners (1996), 138; Klein (2002), 26.

714

Vgl. Green; Krieger; Wind (2001), 61; Bauer; Thomas (1984), 209. Bei der grafischen Darstellung wird zumeist auf eine entsprechende Standardisierung zurückgegriffen (vgl. Gutsche (1995), 134) – siehe dazu Green; Krieger (1991), 24. So werden die Teilnutzen beispielsweise beim dekompositionellen Befragungsteil früher ACA-Versionen standardisiert (vgl. Johnson (1987), 255). Der Vorteil einer solchen Vorgehensweise liegt darin, dass die maximale Bandbreite der Teilnutzen für den Marktforscher sofort erkennbar ist und als Bedeutungsgewicht genutzt werden kann (vgl. Johnson (1987), 255). Zur Bestimmung der Bedeutungsgewichte siehe Kapitel 3.8. 715 Analog werden ebenfalls in Gleichung 8 und Gleichung 9 die Teilnutzen so normiert, dass der am wenigsten präferierten Ausprägung jeweils ein Wert von „0“ zugewiesen wird. Da der niedrigste Teilnutzen einer Eigenschaft bei Anwendung einer Dummy-Variablen Codierung negative Werte oder maximal einen Wert von „0“ annehmen kann, gilt: E  min E E  min E . ijk

716 717

ij

ijk

ij

Vgl. Reiners (1996), 138. Der Zähler in den folgenden Gleichungen (siehe Tabelle 10) dient somit lediglich als Interpretationshilfe, während durch die Formel im Nenner die Vergleichbarkeit der Schätzergebnisse zwischen den Entscheidungsträgern gewährleistet werden soll.

114

nächst normiert werden (2. Schritt). Dies kann gemäß der Gleichungen in Tabelle 10 erfolgen.718 Gleichung 6719

Eijk

E ijknorm

J

Kj

¦¦ j 1k j

Eijk

E ijknorm

Gleichung 7720 Kj 1 E ijk  * ¦ E ijk K j kj 1 j

Gleichung 8721 E ijknorm

E ijk  min E ij J

¦ (max j

E ij  min E ij )

1

Kj

J

¦¦

1

1k j

E ijk

1

Gleichung 9722 E ijknorm

E ijk   min E ij J

Kj

¦ ¦ (E j

1k j

ijk

 min E ij )

1

Tabelle 10: Möglichkeiten zur Standardisierung der geschätzten Teilnutzenwerte

Im Gegensatz zu Gleichung 5 werden durch den Nenner der Gleichungen in Tabelle 10 bei diesen Varianten der Standardisierung sämtliche geschätzten Teilnutzen aller untersuchten Produktmerkmale berücksichtigt. Auf diese Weise können die Teilnutzen so transformiert werden, dass sie zwischen verschiedenen Befragungsteilnehmern vergleichbar sind. Ein Nachteil bei der Anwendung von Gleichung 6 und Gleichung 7 ergibt sich daraus, dass einzelne „Ausreißer“ bei den geschätzten Teilnutzenwerten die Normierung stark beeinflussen können und so weniger robuste Werte die Folge wären. Auch bei der Gleichung 8 haben durch die Berücksichtigung der Spannweite der Eigenschaften dominante Eigenschaftsausprägungen einen hohen Einfluss auf die normierten Teilnutzen. Eine Normierung entsprechend der Gleichung 9 ist gegen Ausreißer relativ robust, da nicht nur die Spannweite der Eigenschaften, sondern sämtliche geschätzte Teilnutzen in die Standardisierung einbezogen werden. Als vorteilhaft bei der Anwendung von Gleichung 9 erweist sich ferner, dass diese die Interpretation der Ergebnisse erleichtert, da bei jedem Merkmal der am wenigsten bevor718

Unterbleibt dieser zweite Schritt oder werden die Schätzergebnisse lediglich entsprechend der im ersten Schritt beschriebenen Möglichkeiten standardisiert, sind die Teilnutzen nicht zwischen den Entscheidungsträgern vergleichbar. In der Folge können die Ergebnisse nicht aggregiert werden (für ein Beispiel siehe Backhaus; Erichson; Plinke; Weiber (2003), 567). 719 Vgl. Schweikl (1985), 132. 720

Vgl. Gutsche (1995), 133f.

721

Vgl. Gutsche (1995), 133f. Die Formel entspricht nach einigen Umformungen der von Backhaus; Erichson; Plinke; Weiber (2003, 566f.) oder Klein (2002, 27) beschriebenen Vorgehensweise. Diese Standardisierung ähnelt der Bestimmung der Bedeutungsgewichte (siehe Kapitel 3.8). Sie bewirkt, dass bei einer späteren Berechnung der Bedeutung der Eigenschaftsmerkmale die Summe der Bedeutungsgewichte „1“ ergibt (vgl. Reiners (1996), 139) und der Gesamtnutzen der Alternative, die bezüglich aller Eigenschaften die präferierte Ausprägung aufweist, „1“ beträgt (vgl. Backhaus; Erichson; Plinke; Weiber (2003), 566f.). Eine ähnliche Vorgehensweise zur Standardisierung nutzen Baier; Säuberlich (1997, 956); dabei wird der Nenner so angepasst, dass der Ausprägung, die den höchsten Teilnutzen aller Merkmale aufweist, insgesamt ein Teilnutzen von „1“ zugewiesen wird. 722 Vgl. Bauer; Thomas (1984), 209; Gutsche (1995), 133f.

115

zugten Ausprägung ein Teilnutzen von „0“ zugewiesen wird und die Summe aller Teilnutzen insgesamt „1“ ergibt.723 Erst nachdem die Schätzwerte der Präferenzmessung standardisiert wurden, können die Daten der verschiedenen Befragungsteilnehmer aggregiert werden. Ein typisches aggregiertes Maß sind die Bedeutungsgewichte der Eigenschaften, die zunächst auf individueller und danach auf aggregierter Ebene berechnet werden.

3.8

Berechnung der Bedeutung von Eigenschaften

Bei der praktischen Durchführung von Conjoint-Analysen wird vom Auftraggeber oftmals die Berechnung von Bedeutungsgewichten verlangt.724 Der Grund dafür ist offensichtlich: Merkmale, die einen hohen Einfluss auf die Präferenz der potenziellen Nachfrager ausüben, könnten gezielt bei der Gestaltung von Werbebotschaften oder im Rahmen der Produktentwicklung berücksichtigt werden.725 Interpretation und Berechnung des Bedeutungsgewichts eines Merkmals

Werden die Präferenzen mit Hilfe der Conjoint-Analyse erhoben, können die Bedeutungsgewichte der Eigenschaften jedoch nicht direkt ermittelt, sondern müssen auf Basis der geschätzten Teilnutzen der untersuchten Merkmalsausprägungen berechnet werden.726 Dabei wird die Bedeutung eines Merkmals durch die relative Bandbreite der Eigenschaftsausprägungen bestimmt. Das Bedeutungsgewicht gibt somit das Ausmaß der Präferenzänderung bei

einer Verbesserung von der am wenigsten zu der am meisten bevorzugten Ausprägung eines Merkmals wider.727 Da die Berechnung der Bedeutungsgewichte anhand der Nutzenunterschiede der untersuchten Merkmalsausprägungen erfolgt, ist die „Wichtigkeit“ einer Eigenschaft immer kontextabhängig, d.h. das Bedeutungsgewicht variiert je nachdem welche Eigenschaften und Ausprägungen untersucht werden.728 Die Bestimmung der Bedeutungsgewichte ist allein von den untersuchten Eigenschaftsausprägungen abhängig.729 Entsprechendes

723

Vgl. Gutsche (1995), 134f. Da bisher kaum Erkenntnisse über die Vorteilhaftigkeit der verschiedenen Varianten zur Standardisierung der Schätzwerte vorliegen, ist die Selektion einer bestimmten Vorgehensweise derzeit immer mehr oder weniger „willkürlich“ (Schweikl (1985), 132). 724 Vgl. Mishra; Umesh; Stem (1989), 605; Green; Krieger (1995), 253; Green; Srinivasan (1978), 116. 725

Vgl. Green; Krieger (1995), 253; Boya (1981), 306.

726

Im Gegensatz dazu wird bei kompositionellen Verfahren wie der Self-Explicated Methode oder dem AHP die Bedeutung der Eigenschaften direkt vom Befragungsteilnehmer eingeschätzt. Vgl. Green; Krieger (1995), 253; Jain; Acito; Malhotra; Mahajan (1979), 316; Akaah; Korgaonkar (1983), 190; Green; Wind (1975), 110; Klein; Bither (1987), 245; Theuerkauf (1989), 1183; Orme (2002d), 3; Green; Tull (1982), 455f. 728 Vgl. Green; Wind (1975), 111. 727

729

Siehe dazu Kapitel 2.2. Dies bedeutet auch, dass die Bestimmung der zu untersuchenden Eigenschaftsausprägungen einen kritischen Schritt darstellt, da diese die Höhe der Bedeutungsgewichte determiniert (vgl. Green; Tull (1982), 456).

116

gilt ebenfalls für die Präferenzen eines Entscheiders – diese sind stets von den am Markt verfügbaren Alternativen abhängig. Die Bedeutung einer Eigenschaft berechnet sich aus der Spannweite ihrer Teilnutzen im Verhältnis zu den Bandbreiten der Teilnutzen aller Eigenschaften.730 Werden nicht-standardisierte Werte zur Berechnung herangezogen, können die Bedeutungsgewichte der Merkmale anhand der Gleichung 10 berechnet werden. max E ij  min E ij

wj

J

¦ (max E j

mit wj :

ij

 min E ij )

Gleichung 10

1

Bedeutungsgewicht der j-ten Eigenschaft

Wurden die Teilnutzen entsprechend Gleichung 8 normiert, ergibt sich das Bedeutungsgewicht einer Eigenschaft unmittelbar durch den standardisierten Teilnutzen der jeweils präferierten Ausprägung (siehe Gleichung 11).731

wj

max E ijnorm

Gleichung 11

In diesem Fall kann das Bedeutungsgewicht direkt durch die jeweils präferierte Ausprägung bestimmt werden. Zudem wird durch die Normierung auf Basis von Gleichung 8 der am wenigsten präferierten Ausprägung jedes Attributs ein Teilnutzenwert von „0“ zugewiesen. Aus diesem Grund ergibt sich das Bedeutungsgewicht einer Eigenschaft bei der Anwendung von Gleichung 11 direkt aus dem Teilnutzen der jeweils präferierten Ausprägung.732 Für einen konkreten Entscheidungsträger können die Bedeutungsgewichte berechnet und ausgehend davon bestimmt werden, welchen „Anteil“ die Bandbreite der Ausprägungen einer Eigenschaft an einer konkreten Entscheidung ausmacht. Im Folgenden wird ein fiktives Beispiel für die Berechnung von Bedeutungsgewichten bei einem Entscheidungsträger präsentiert (siehe Tabelle 11).733

730 731 732 733

Vgl. Backhaus; Erichson; Plinke; Weiber (2003), 567; Verlegh; Schifferstein; Wittink (2002), 42; Albrecht (2000), 47f.; Melles (2001), 85; Jain; Malhotra; Mahajan (1979), 74. Vgl. Backhaus; Erichson; Plinke; Weiber (2003), 567. Vgl. Johnson (1987), 255; Backhaus; Erichson; Plinke; Weiber (2003), 567. Dieses Beispiel stammt von Orme (2002d, 3).

117

Eigenschaft

Bandbreite der Teilnutzen

Marke Farbe Preis

60 – 20 = 40 20 – 0 = 20 90 – 0 = 90 =

Bedeutungsgewicht 0,267 0,133 0,600 1

Tabelle 11: Beispiel für die Berechnung von Bedeutungsgewichten

Der in Tabelle 11 dargestellte Entscheidungsträger achtet bei seiner Wahlentscheidung vor allem auf den „Preis“ der Alternativen (60%); die Eigenschaften „Marke“ und „Farbe“ haben einen Einfluss von 26,7% bzw. 13,3%. Probleme bei der Interpretation der Bedeutungsgewichte

Wie bereits beschrieben, gibt das Bedeutungsgewicht einer Eigenschaft an, wie stark die Präferenzänderung bei einer Verbesserung von der individuell am wenigsten zu der individuell am meisten präferierten Ausprägung bei einem Entscheidungsträger ist.734 Dabei gehen einige Marktforscher davon aus, dass es so etwas wie ein „wahres“ Bedeutungsgewicht für Eigenschaften gibt und die Untersuchungsergebnisse verschiedener Studien zu diesem „wahren“ Bedeutungsgewicht konvergieren.735 Es wird deshalb teilweise angenommen, dass ein „allgemein gültiges“, von den Ausprägungen unabhängiges Bedeutungsgewicht für Eigenschaften existiert.736 Bedeutungsgewichte sind jedoch vom Untersuchungskontext abhängig; eine solche Variation der Bedeutungsgewichte wird dann von diesen Forschern als „lability“737 bezeichnet.738 Wie bereits mehrfach beschrieben, sind Präferenzen allerdings immer kontextabhängig (siehe Kapitel 2.2), d.h. eine Änderung des Entscheidungskontexts muss stets auch zu einer Änderung der Bedeutungsgewichte führen.739 Die Veränderungen der Bedeutungsgewichte

sind somit keinem verzerrenden Effekt, sondern der Kontextabhängigkeit von Bewertungen, zuzuschreiben. 734 735 736 737

Vgl. Backhaus; Erichson; Plinke; Weiber (2000), 567. Vgl. Mishra; Umesh; Stem (1989), 605. Vgl. Green; Krieger (1995), 255f. Green; Krieger (1995), 253.

738

Green; Krieger (1995, 253ff.) stellen beispielsweise fest, dass die mit Hilfe von Gleichung 10 berechneten Bedeutungsgewichte aufgrund ihrer „lability“ nur eine eingeschränkte Aussagekraft besitzen. Sie gehen jedoch davon aus, dass die Veränderung der Bedeutungsgewichte entsprechend des Untersuchungskontexts die Aussagekraft dieser Werte verringert und es so etwas wie kontextfreie Bedeutungsgewichte gibt. Deshalb schlagen sie eine neue Vorgehensweise zur Berechnung der Bedeutungsgewichte vor, bei der Trade-off Daten (z.B. mit Hilfe der Conjoint-Analyse) mit Auswahlbzw. Rangdaten bezüglich verschiedener Alternativen kombiniert werden. Bei der praktischen Anwendung wurden die Entscheidungsträger gebeten, zunächst 18 Alternativen im Rahmen einer Conjoint-Analyse zu bewerten. Im Anschluss wurden ihnen verschiedene Auswahlsets vorgelegt, wobei hier zunächst die präferierte Alternative ausgewählt und die restlichen Stimuli entsprechend ihrer Präferenz in eine Reihenfolge gebracht werden sollten. Die untersuchten Eigenschaften und Ausprägungen sind in beiden Phasen identisch (vgl. Green; Krieger (1995), 259f.). 739 Vgl. Pekelman; Sen (1976), 81; Orme (2002d), 3; siehe auch Kapitel 4.2.6.3. Bei Green; Krieger (1995, 253ff.) werden lediglich die Präferenzdaten unterschiedlicher Arten von Entscheidungen, d.h. Trade-off Entscheidungen auf Basis von Rating-Skalen und Auswahlentscheidungen bzw. Rangbildung miteinander kombiniert.

118

Aggregation der Bedeutungsgewichte

Werden nicht einzelne Entscheidungsträger, sondern alle Befragungsteilnehmer betrachtet, so könnte man das aggregierte Bedeutungsgewicht einer Eigenschaft aus: -

den durchschnittlichen Teilnutzen über alle Probanden oder durch die Aggregation individueller Bedeutungsgewichte berechnen.740

Die Nutzung durchschnittlicher Teilnutzenwerte zur Ermittlung der Bedeutungsgewichte von Eigenschaften ist allerdings mit erheblichen Problemen verbunden. So könnte beispielsweise beim Untersuchungsobjekt „Cola“ ein Teil der Befragungsteilnehmer sehr stark die Marke „Coca-Cola“ und ein anderer die Marke „Pepsi“ bevorzugen. Werden die Mittelwerte aus diesen sehr unterschiedlichen individuellen Einschätzungen gebildet, resultieren daraus aggregierte Teilnutzenwerte, die den von den Entscheidungsträgern wahrgenommenen Unterschied zwischen den beiden Marken nicht repräsentieren können. Das Bedeutungsgewicht für die Eigenschaft „Marke“ wäre durch diese Art der Bestimmung zu niedrig. Deshalb werden meist die Bedeutungsgewichte zunächst auf individuellem Niveau berechnet und aggregier-

te Werte durch Mittelwertbildung bestimmt.741 Probleme bei der Interpretation der aggregierten Bedeutungsgewichte

Die Interpretation dieser aggregierten Bedeutungsgewichte erweist sich jedoch als äußerst problematisch. Folgt man der Definition des Begriffs „Eigenschaften“ in Kapitel 4, so können Merkmale keinerlei „an sich Bedeutung“ besitzen. Produktmerkmale sind lediglich Beurteilungsmaßstäbe, die sicherstellen, dass die Alternativen überhaupt in eine Beziehung gebracht und miteinander verglichen werden können. Deshalb handelt es sich bei den durch Gleichung 10 berechneten „Bedeutungsgewichten“ um Maßzahlen, die den Einfluss der in einer konkreten Studie untersuchten Bandbreite der Ausprägungen eines Merkmals auf die Präferenzstruktur eines einzelnen Entscheidungsträgers bei dem jeweiligen, konkreten Untersuchungskontext (d.h. der Bandbreite der Teilnutzen) widerspiegeln.742 Ein solches Bedeutungsgewicht gibt die Relevanz743 einer Eigenschaft wieder und könnte auf Zielgruppenebene zur Selektion der im Folgenden weiter zu untersuchenden Merkmale genutzt werden. Weitere praktische Schlussfolgerungen auf Basis der aggregierten Bedeutungsgewichte,

z.B. für die Gestaltung von Werbebotschaften oder gar für die Produktentwicklung können

740 741 742 743

Vgl. Orme (2002d), 3. Vgl. Orme (2002d), 3. Vgl. Mishra; Umesh; Stem (1989), 605; Orme (2002d), 3. Siehe Kapitel 4.2.6.5.

119

dagegen nicht abgeleitet werden. Das Hauptproblem bei der Interpretation der aggregierten Bedeutungsgewichte zur Ableitung konkreter Entscheidungen besteht darin, dass die Maßzahlen von den jeweiligen Ausprägungen isoliert sind. Für jeden Entscheidungsträger kann die Bandbreite eines Attribute durch unterschiedliche Ausprägungen bestimmt sein, d.h. die Ausprägung, die ein Entscheidungsträger bevorzugt, kann im Extremfall bei einem anderen Befragungsteilnehmer die am wenigsten präferierte Ausprägung darstellen.744 Werden auf Basis dieser Bedeutungsgewichte beispielsweise Entscheidungen über die Gestaltung einer Werbebotschaft abgeleitet, kann daher bei einigen Entscheidungsträgern der gewünschte Effekt erzielt, bei anderen aber genau das Gegenteil erreicht werden.745 Dies bedeutet, dass die berechneten Bedeutungsgewichte nur dann aggregiert und auf aggregierter Ebene sinnvoll in konkrete Entscheidungen umgesetzt werden können, wenn über alle Entscheidungsträger jeweils die präferierte und die am wenigsten präferierte Ausprägung identisch sind und somit die Bandbreite bei allen Befragungsteilnehmern durch die gleichen Ausprägungen definiert wird. Durch Gleichung 10 wird dieser Aspekt allerdings nicht berücksichtigt. Vorschlag zur Berechnung eines entscheidungsorientierten Bedeutungsgewichts

Die Berechnung des Bedeutungsgewichts muss deshalb so angepasst werden, dass es zur Ableitung konkreter Entscheidungen, z.B. zur Ausgestaltung von Werbebotschaften, herangezogen werden kann. Ein Hersteller sollte (z.B. zur Werbebotschaftsgestaltung) möglichst die Eigenschaft betonen, bei der im Vergleich zu einem Konkurrenzprodukt eine hypothetische eigene Alternative den größten, positiven Nutzenunterschied aufweist. Ausgangspunkt der Berechnung von entscheidungsorientierten Bedeutungsgewichten sind demnach nicht die individuell am meisten bzw. am wenigsten bevorzugten Ausprägungen, sondern einerseits die konkreten Ausprägungen eines vom Auftraggeber der Studie als relevant erachteten Produkts und andererseits die Ausprägungen eines konkreten Konkurrenzprodukts. Ein entscheidungsorientiertes Bedeutungsgewicht könnte demzufolge folgendermaßen berechnet werden (siehe Gleichung 12).

wj

E ijkeigeneAlternative  E ijkKonkurrenz J

j

744

Gleichung 12

¦ (max {E ijkeigeneAlternative ; E ijkKonkurrenz }  min {E ijkeigeneAlternative ; E ijkKonkurrenz } ) 1

Bei der Gestaltung einer Werbebotschaft entsprechend des Beispiels in Tabelle 11 hat dieses Problem keinen gravierenden Einfluss, da die wichtigste Eigenschaft der „Preis“ ist. Hier könnte man vermuten, dass alle Entscheidungsträger der niedrigsten Ausprägung dieses Merkmals den höchsten Nutzen zugewiesen haben. Bei der Ausgestaltung einer Werbebotschaft könnte deshalb ein besonders „günstiger“ Preis des eigenen Produkts betont werden. Bei anderen Merkmalen kann keine eindeutige Reihenfolge der Vorziehenswürdigkeit der Eigenschaftsausprägungen aufgestellt werden. Dies führt dazu, dass anhand der berechneten Bedeutungsgewichte keinerlei konkrete Entscheidungen abgeleitet werden können. 745 Für ein Beispiel siehe Anhang III.

120

mit

E ijkeigeneAlternative : E ijkKonkurrenz :

beim i-ten Entscheidungsträger geschätzter Teilnutzen der Merkmalsausprägung k, die ein eigenes hypothetisches Produkt bei der j-ten Eigenschaft aufweist beim i-ten Entscheidungsträger geschätzter Teilnutzen der Merkmalsausprägung k, die ein Konkurrenzprodukt bei der j-ten Eigenschaft aufweist

Eine Aggregation der Bedeutungsgewichte ist innerhalb einer Zielgruppe durch Mittelwertbildung der individuellen Gewichte möglich. Das größte berechnete Bedeutungsgewicht gibt in diesem Fall an, durch welche Eigenschaft es möglich ist, sich am stärksten von einem Wettbewerber zu differenzieren und kann deshalb zur Werbebotschaftsgestaltung genutzt werden. Negative Werte weisen auf strategische Lücken, also Eigenschaften bei denen das unternehmenseigene Produkt schlechter als das Konkurrenzprodukt eingeschätzt wurde, hin. Neben der Berechnung von Bedeutungsgewichten können die Ergebnisse der Präferenzmessung auch zur Bestimmung von Zielgruppen sowie im Rahmen von Marktsimulationen eingesetzt werden. Im folgenden Kapitel werden die verschiedenen Möglichkeiten zur Durchführung entsprechender Analysen präsentiert.

3.9

Aggregation der Ergebnisse der Präferenzmessung und Berechnung von Marktanteilen

Die Erfassung der Präferenzen erfolgt meist auf individueller Ebene. Marktforscher und Hersteller interessieren sich jedoch typischerweise nicht für die individuellen Präferenzen einzelner Nachfrager, sondern für die Anforderungen verschiedener Zielgruppen746 - dabei handelt es sich um Entscheidungsträger mit ähnlichen Bedürfnissen.747 Um Aussagen auf Gruppenebene treffen zu können, müssen die individuellen Präferenzdaten aggregiert werden. So können: -

-

-

746

die Teilnutzen auf individueller Ebene berechnet und die standardisierten Werte durch Mittelwertbildung aggregiert werden,748 die individuellen Einschätzungen lediglich auf Gruppenebene ausgewertet werden; dabei wird auf Basis der individuellen Beurteilungen aller Entscheidungsträger eine Nutzenfunktion auf Gruppenebene geschätzt749 oder es werden Kundensegmente bestimmt und innerhalb dieser Zielgruppen die Teilnutzen aggregiert.750 Vgl. Hahn (1997), 80; Schubert (1991), 233.

747

Vgl. Smith (1956), 6. Das Finden von Kundensegmenten zählt deshalb zu den häufigen Anwendungsgebieten in der Präferenzmessung (vgl. Melles (2001), 85). 748 Vgl. Green; Rao (1971), 360; Perrey (1998), 75f.; Jain; Malhotra; Mahajan (1979), 75; Huber; Moore (1979), 64f. 749 750

Vgl. Green; Rao (1971), 360; Perrey (1998), 75f.; Albrecht (1997), 105; Moore (1980), 517; Jain; Malhotra; Mahajan (1979), 75; Huber; Moore (1979), 64f. Vgl. Green; Rao (1971), 360.

121

Das Ergebnis der beiden ersten Vorgehensweisen wäre ein „Durchschnittsprodukt“, das u.U. den Bedürfnissen der in der Präferenzmessung befragten Zielgruppen nicht gerecht wird. Diese Verfahren sind daher nicht zur Aufdeckung von Marktsegmenten geeignet.751 Bei praktischen Anwendungen stehen deshalb nicht über alle Befragungsteilnehmer hinweg aggregierte Teilnutzenwerte, sondern segmentspezifische Ergebnisse im Mittelpunkt.752 Erst auf der Basis segmentspezifischer Auswertungen können produktpolitische Entscheidungen getroffen werden.753 Die Segmentierung der Befragungsteilnehmer kann dabei vor oder nach der eigentlichen Erhebung der Präferenzen erfolgen (siehe Abbildung 12).754 Segmentierungsmöglichkeiten bei der Präferenzmessung A priori Segmentierung

Post hoc Segmentierung

Segmentierung auf Basis a priori erfasster Präferenzen Segmentierung anhand von Hintergrundvariablen

a priori erhobene Teilnutzen bzw. Bedeutungsgewichte der Eigenschaften

Alternativen im EvokedSet und deren relevanten Eigenschaften

Segmentierung anhand von Hintergrundvariablen

Segmentierung anhand der erhobenen Teilnutzen bzw. der relativen Wichtigkeit der Eigenschaften

Abbildung 12: Segmentierungsmöglichkeiten bei der Präferenzmessung (in Anlehnung an Green; Krieger (1991), 22)755

A priori Segmentierung der Befragungsteilnehmer

Eine a priori Segmentierung kann auf Basis von sog. „Hintergrundvariablen“ wie beispielsweise soziodemographischen Daten oder psychographischen Merkmalen (Lebensstile, Markenloyalität usw.) erfolgen. Diese Daten werden vor der eigentlichen Präferenzmessung erhoben und ermöglichen eine Einordnung der Befragungsteilnehmer zu verschiedenen Segmenten. Voraussetzung für eine solche Vorgehensweise ist, dass die relevanten Zielgruppen bereits vor der Untersuchung bekannt sind.756 Überdies können vor der eigentlichen Präferenzmessung Informationen über die Preissensitivität, die bevorzugte Marke oder zu diesem Zeit-

751

Vgl. Perrey (1998), 76; Hauser; Urban (1977), 603f.; Theuerkauf (1989), 1184; Moore (1980), 517; Huber; Moore (1979), 65. 752 Vgl. Green; Krieger (1996), 864. 753

Vgl. Albrecht (1997), 107.

754

Vgl. Albrecht (2000), 108; Wind (1978), 317; Green (1977), 64. Neben der a priori und der post hoc Segmentierung können hybride Ansätze genutzt werden. Dabei werden mit Hilfe der post hoc Segmentierung die a priori bestimmten Kundengruppen auf Konsistenz überprüft (vgl. Green (1977), 64ff.). 755 Green; Krieger (1991, 23ff.) beschreiben eine weitere Möglichkeit, um Entscheidungen bei der Produktgestaltung ableiten zu können. Im Gegensatz zu den anderen Segmentierungsansätzen wird nicht für einzelne Segmente getrennt jeweils ein Produkt entwickelt, sondern ein oder mehrere Alternativen bestimmt, die ein bestimmtes Zielkriterium (z.B. Deckungsbeitragsziele) über alle Nachfrager hinweg maximieren (vgl. Green; Krieger (1991), 23ff.). 756 Vgl. Green; Tull (1982), 507; Albrecht (2000), 108f.; Green; Krieger (1991), 22; Wind (1978), 317, 319f.; Myers (1988), 108, 110. Die Segmentierung aufgrund von Hintergrundvariablen bietet sich an, wenn vermutet wird, dass diese in einem engen Zusammenhang zu den geschätzten Teilnutzen bzw. den Bedeutungsgewichten der Eigenschaften stehen. Durch einen Vergleich der Ergebnisse der Präferenzmessung zwischen den ermittelten Gruppen kann anschließend der Einfluss der Hintergrundvariablen verifiziert werden (vgl. Albrecht (2000), 113). Zu solchen Hintergrundvariablen kann auch der Wohnort der Entscheidungsträger (geographische Segmentierung) gezählt werden (vgl. Haley (1968), 30). Diese geografischen oder soziodemografischen Merkmale sind allerdings selten dazu geeignet, das Verhalten von Entscheidungsträgern zu prognostizieren (vgl. Haley (1968), 30; Haley (1995), 59; Perrey (1998), 194f.).

122

punkt bekannte Teilnutzen für die Ausprägungen einer oder mehrerer Eigenschaften zur Segmentierung der Entscheidungsträger herangezogen werden.757 Eine a priori Segmentierung der Konsumenten nach bestimmten Teilnutzen bzw. der Wichtigkeit bestimmter Merkmale ermöglichen verschiedene hybride Verfahren zur Präferenzmessung. Die in einer ersten Phase gewonnenen Informationen über die Bedeutung einzelner vorgegebener Merkmale bzw. die Teilnutzen der präsentierten Ausprägungen können zur Segmentierung der Entscheidungsträger in einem zweiten Teil der Präferenzmessung genutzt werden.758 Zudem können Entscheidungsträger anhand ihrer in die engere Wahl gezogenen Alternativen, dem Evoked-Set, gruppiert werden. Dabei wird davon ausgegangen, dass Entscheidungsträger, die ähnliche Merkmale und Ausprägungen bei der letztendlichen Wahlentscheidung berücksichtigen und ähnliche Verwendungszwecke759 verfolgen auch ähnliche Bedürfnisse aufweisen und deshalb zu einer Zielgruppe zusammengefasst werden können.760 Post hoc Segmentierung der Befragungsteilnehmer

Eine post hoc Gruppenbildung kann analog zur a priori Segmentierung auf Basis verschiedener „Hintergrundvariablen“ oder der individuellen Präferenzen761 der Entscheidungsträger erfolgen. Werden die Gruppen auf Basis der standardisierten Teilnutzen der Merkmalsausprägungen bzw. den daraus abgeleiteten Bedeutungsgewichten der Eigenschaften gebildet, können anschließend innerhalb jeder Gruppe Durchschnittswerte762 für die Teilnutzen und Bedeutungsgewichte bestimmt werden. Nachdem die Segmente anhand der erhobenen Präferenzen ermittelt wurden, können diese durch demographische und psychographische Merkmale be-

757 758 759 760

Vgl. Green; Krieger (1991), 22. Vgl. Albrecht (2000), 109. Die Nutzungssituation (der Kaufgrund) bzw. das zu befriedigende Bedürfnis sind für eine Segmentierung der Kundengruppen gut geeignet (vgl. Perrey (1998), 197ff.). Diese Vorgehensweise wird ausführlich in Kapitel 6 beschrieben.

761

Eine post hoc Gruppenbildung sollte jeweils anhand der Teilnutzen und nicht lediglich auf Basis der Bedeutungsgewichte der Merkmale erfolgen, da Bedeutungsgewichte lediglich die Spannweite der Teilnutzen, aber nicht sämtliche Teilnutzen berücksichtigen (vgl. Schweikl (1985, 132). Neben den Präferenzen der Entscheidungsträger können auch unbefriedigte Bedürfnisse die Grundlage für eine Segmentierung darstellen (vgl. Myers (1988), 110). Sollen, wie bei der Anwendung der Conjoint-Analyse üblich, Präferenzen die Grundlage der Segmentierung bilden, müssen die individuellen Teilnutzen der Entscheidungsträger vor der Aggregation standardisiert werden (vgl. Albrecht (2000), 106f.; siehe auch Kapitel 3.7). Bei individualisierten Studien zur Präferenzmessung wie beispielsweise der ACA werden nur die individuell „wichtigsten“ Eigenschaften und teilweise nur die „präferierten“ Ausprägungen untersucht (siehe dazu Kapitel 3.1). Den nicht weiter untersuchten Eigenschaftsausprägungen wird ein Teilnutzen von „0“ zugewiesen (vgl. u.a. Schweikl (1985), 131) bzw. die Gewichtung erfolgt durch die Befragungsergebnisse aus dem kompositionellen Erhebungsteil. Diese Festlegung hat jedoch zur Folge, dass die Teilnutzen nur noch eingeschränkt über die Befragungsteilnehmer hinweg vergleichbar sind. Eine Aggregation der Ergebnisse macht in diesen Fällen nur Sinn, wenn die Merkmalsbeurteilungen der Entscheidungsträger möglichst homogen sind. Vor der eigentlichen Aggregation müssen deshalb durch Anwendung einer Cluster-Analyse Gruppen mit möglichst ähnlichen Anforderungen gebildet werden (vgl. Voeth (2000), 177). 762 Neben der Bildung von Mittelwerten kann weiterhin die Standardabweichung als Maß für die Heterogenität der Befragungsteilnehmer unterstützend zur Aggregation bzw. der Bestimmung von Segmenten herangezogen werden (vgl. Albrecht (1997), 106, 113; Sattler (1991), 162f.).

123

schrieben werden763 - eine entsprechende Vorgehensweise wird als Benefit-Segmentierung bezeichnet.764 Die jeweils berücksichtigten Hintergrundvariablen (z.B. soziodemographische Daten oder psychographische Variablen)765 können zur Schätzung verschiedener Diskriminanzfunktionen herangezogen werden, um zu überprüfen, ob diese Hintergrundvariablen eine signifikante Trennung der Zielgruppen ermöglichen.766 Präferenzunterschiede zwischen den Zielgruppen können zwar nicht immer durch die untersuchten Hintergrundvariablen erklärt werden. Trotzdem bieten die gewonnenen Daten auch bei nicht signifikanten Unterschieden zwischen den untersuchten Zielgruppen auf Basis der Hintergrundvariablen erste Anhaltspunkte zur Gestaltung der Marketing-Mix Elemente.767 Prognose von Marktanteilen

Auf Basis der durch die Präferenzmessung ermittelten Ergebnisse können zudem Kaufwahrscheinlichkeiten bzw. kann das Wahlverhalten von Nachfragern prognostiziert werden. Um entsprechende Ableitungen treffen zu können, ist es zunächst notwendig, zusätzliche Modellannahmen zu treffen, die den Zusammenhang zwischen Präferenzen und Wahlentscheidungen möglichst gut repräsentieren. Zu diesem Zweck werden die geschätzten Nutzen der Alternativen mit Entscheidungsregeln bzw. Produktwahlmodellen768 verknüpft.769 Erst durch die Berechnung von Wahl- bzw. Marktanteilen auf Segmentebene können „Wenn-Dann“-Aussagen zur Produktgestaltung getroffen werden.770 Zu diesem Zweck werden für die aus Sicht des 763

Vgl. Green; Carmone; Wind (1972), 296f.; Hauser; Urban (1977), 603f.; Theuerkauf (1989), 1184; Green; Rao (1971), 360; Albrecht (1997), 107; Perrey (1998), 193ff.; Schweikl (1985), 175; Green; Krieger (1996), 861. Vgl. Haley (1968), 31ff.; Green; Wind; Jain (1972a), 33; Hauser; Urban (1977), 603; Albrecht (2000), 109; Haley (1971), 3ff.; Haley (1983), 5ff.; Haley (1995), 59ff.; Huber; Moore (1979), 65. Eine Segmentierung der Entscheidungsträger auf Basis der Ergebnisse der Präferenzmessung bezeichnet Wind (1978, 322) als „flexible segmentation approach“. Diese Vorgehensweise entspricht allerdings weitgehend der hier beschriebenen Benefit-Segmentierung, wobei die Ergebnisse zusätzlich mit einem Marktsimulator kombiniert werden. Auch die von Green (1977, 68ff.) bzw. Green; Srinivasan (1978, 118f.) vorgeschlagene “Componential Segmentation” stimmt weitgehend mit dem Grundgedanken der BenefitSegmentierung überein. Zur Segmentierung dienen dabei jedoch simultan die Präferenzen und eine Reihe von Hintergrundvariablen (für einen ausführlichen Vergleich zwischen Benefit-Segmentierung und Componential Segmentation siehe Moore (1980), 518ff.). BUNDOS ist schließlich eine weitere Variante der Benefit-Segmentierung (vgl. Green; Krieger; Schaffer (1985), 10ff.); dabei werden auf Basis der Ergebnisse einer Vorstudie, Fokusgruppenbefragungen oder vorherigen Studien eine Reihe von hypothetischen Alternativen ermittelt. Die Entscheidungsträger wählen aus diesem Stimuliset eine vom Marktforscher bestimmte Anzahl an Alternativen aus, die sie am meisten bevorzugen. Diese Auswahlentscheidungen dienen zur Ermittlung der verschiedenen Kundengruppen. Für weitere Möglichkeiten zur Segmentierung von Kundengruppen entsprechend der erhobenen Präferenzdaten siehe ebenso Hagerty (1985), 168ff.; Kamakura (1988), 157ff. und Jain; Malhotra; Mahajan (1979), 75ff. 765 Vgl. Hausruckinger; Helm (1996), 274. 764

766 767

Vgl. Green; Wind; Jain (1972a), 34; Green; Wind; Jain (2000), 35. Vgl. Green; Wind; Jain (1972a), 34.

768

Für erste Anwendungen von Produktwahlmodellen siehe Westwood; Lunn; Beazley (1974), 239f. Für weitere Produktwahlmodelle siehe McCullough (2002b), 22. 769 Vgl. Balderjahn (1993), 101; Cattin; Wittink (1982), 50; Orme (2002e), 1. 770

Vgl. Schweikl (1985), 133. Vorteil einer Durchführung solcher Marktsimulationen ist, dass u.a. Kannibalisierungseffekte zwischen verschiedenen Produktalternativen untersucht und so die Folgen von Produktvariationen relativ einfach den entsprechenden Produktmanagern verdeutlicht werden können (vgl. Orme (2002e), 2f.). Bei der Nutzung von wahlbasierten Verfahren zur Präferenzmessung können die Ergebnisse der Präferenzmessung direkt in die Wahlsimulationen einfließen (vgl. Orme (2002a), 47; Louviere; Woodworth (1983), 351; Völckner; Sattler (2005a), 6; Jaeger; Hedderley; MacFie (2000), 1218).

124

Marktforschers bzw. Auftraggebers relevanten Alternativen anhand der individuellen Teilnutzen die Gesamtnutzen auf Ebene der Entscheidungsträger berechnet und mit Hilfe von Produktwahlmodellen in Kaufwahrscheinlichkeiten transformiert – diese ermöglichen dann eine Berechnung des Marktanteils für hypothetische Wettbewerbssituationen. Zur Prognose von Marktanteilen771 stehen verschiedene Produktwahlmodelle zur Verfügung. Dabei kann man

zwischen deterministischen und probabilistischen Modellen unterscheiden.772 Sollen die mit Hilfe der Conjoint-Analyse ermittelten individuellen Teilnutzen in Marktanteile für hypothetische Alternativen überführt werden, kommt üblicherweise das First-Choice Modell bzw. das BTL (Bradley Terry Luce) Modell zum Einsatz. 773 Das First-Choice Modell ist ein deterministisches Modell. Es basiert auf der Annahme, dass eine Person jeweils mit Sicherheit die Alternative wählt, die für sie aus einem Set an hypothetischen Produkten die höchste prognostizierte Gesamtpräferenz besitzt.774 Das First-Choice Modell kann entsprechend der Gleichung 13 beschrieben werden.775 Cimprob

­1, falls U im ® ¯ 0, sonst

max ^m 1, ..., M `

Gleichung 13

mit:

U im :

geschätzter Gesamtnutzen der m-ten Alternative beim i-ten Entscheidungsträger

Cimprob : Produktwahlwahrscheinlichkeit der m-ten Alternative beim i-ten Entscheidungsträger Beim First-Choice Modell ergibt sich der aggregierte Marktanteil, indem die Anzahl der Befragungsteilnehmer, die sich für eine Alternative entschieden haben, durch die Gesamtzahl der Probanden dividiert wird. Das BTL-Modell gehört demgegenüber zu den probabilistischen Produktwahlmodellen, bei denen davon ausgegangen wird, dass jede untersuchte Alternative vom Entscheidungsträger mit einer Wahlwahrscheinlichkeit von über 0% gewählt wird und die Produktwahlwahr771

Für erste Anwendungen von Produktwahlmodellen siehe Westwood; Lunn; Beazley (1974), 239f. Für weitere Produktwahlmodelle siehe McCullough (2002b), 22. Insbesondere bei individualisierten Studien zur Präferenzmessung bietet sich eine Nutzung von Wahlsimulationen zur aggregierten Auswertung der Befragungsergebnisse an. Wie bereits beschrieben, ist eine Aggregation der Teilnutzen bei individualisierten Analysen äußerst problematisch (vgl. Voeth (2000), 177). Um die Verfahren zur Wahlsimulation anwenden zu können, müssen die Schätzwerte nicht standardisiert werden, d.h. diese Methoden sind nicht von der Anforderung der interpersonellen Vergleichbarkeit betroffen. Durch die Nutzung von Wahlsimulationen kann beispielsweise jeweils die für einen Entscheidungsträger am meisten präferierte Alternative bestimmt und diese Wahldaten danach durch einfache Häufigkeitsauszählungen ausgewertet werden (vgl. Schweikl (1985), 133). Diese Vergleichbarkeit der geschätzten Marktanteile gilt jedoch nur dann, wenn davon ausgegangen wird, dass die jeweils nicht betrachteten Eigenschaften bzw. deren Ausprägungen tatsächlich keinerlei Einfluss auf die Präferenz der Entscheidungsträger besitzen (vgl. Schweikl (1985), 131). 772 Vgl. Albrecht (2000), 110. 773

Teilweise wird das Logit-Modell zur Prognose von Wahlanteilen genutzt (vgl. Green; Krieger (1988), 115; Green; Krieger (1991), 29; Huber; Moore (1979), 65f.). Für einen Überblick weiterer Produktwahlmodelle siehe Reiners (1996, 143ff.). 774 Vgl. Johnson (1987), 263; Huber; Wittink; Johnson (1992), 5. 775

Vgl. Huber; Moore (1979), 65f.

125

scheinlichkeit monoton mit der Gesamtpräferenz für die untersuchten Alternativen steigt.776 In Gleichung 14 wird BTL-Modell in allgemeiner Form dargestellt; häufig wird bei der praktischen Anwendung des BTL-Modells  auf einen Wert von „1“ gesetzt. Die Produktwahlwahrscheinlichkeit für ein Produkt m ergibt sich somit aus dem Verhältnis des Gesamtnutzens dieser Alternative zur Summe der Gesamtnutzen aller untersuchten Stimuli.777 C improb

D U im M

¦U D

Gleichung 14

im

m 1

mit: :

Exponent mit 1   < 

Die individuellen Auswahlwahrscheinlichkeiten beim BTL-Modell können durch einfache Bildung des arithmetischen Mittels über alle Entscheidungsträger innerhalb einer Zielgruppe aggregiert werden.778 Bei der Selektion eines Produktwahlmodells ist zu beachten, dass die prognostizierten Marktanteile je nach verwendetem Verfahren stark variieren können.779 Dies ist insbesondere deshalb problematisch, da die Entscheidung für oder gegen ein Produktwahlmodell auf Annahmen des Verhaltens der Konsumenten beruhen, die in realen Entscheidungssituationen nicht zutreffen müssen.780 Green; Krieger (1988, 118) gehen davon aus, dass das First-Choice Modell insbesondere bei Produktgruppen relevant ist, die relativ selten gekauft werden.781 Andere Modelle, wie das BTL-Modell, sollten demgegenüber eher bei wiederholten Entscheidungen genutzt werden. Als nachteilig bei der Nutzung des First-Choice Modells erweist sich, dass es durch die alleinige Berücksichtigung der bevorzugten Alternative sehr stark auf kleinere Änderungen der Teilnutzen reagieren kann, während bei der Anwendung des BTL-

776

Vgl. Albrecht (2000), 110f.

777

Vgl. Green; Krieger (1991), 29; Albrecht (2000), 111; Orme (2002e), 2; Green; Krieger (1996), 858f. Die Gleichung 14 wird auch als „Alpha-Regel“ bezeichnet (vgl. Skiera; Gensler (2002b), 261). Teilweise wird bei der praktischen Anwendung des BTL-Modells dem  ein Wert, der größer als „1“ ist, zugewiesen (vgl. Green; Krieger (1991), 29). Je größer der Exponent  gewählt wird, umso mehr entspricht diese Vorgehensweise der First-Choice-Regel (vgl. Skiera; Gensler (2002b), 261). 778 Vgl. Skiera; Gensler (2002b), 261. 779

Vgl. Green; Krieger (1996), 864; Orme (2002d), 4; Huber; Moore (1979), 67.

780

Vgl. Jaeger; Hedderley; MacFie (2000), 1218. Bei wahlbasierten Methoden (z.B. CBC) der Präferenzmessung ist , wie bereits beschrieben, dieser Schritt nicht notwendig, da direkt Informationen über das Wahlverhalten erhoben wurden und anhand dieser direkt die späteren Marktanteile prognostiziert werden können (vgl. Louviere; Woodworth (1983), 351; Völckner; Sattler (2005a), 6; Jaeger; Hedderley; MacFie (2000), 1218). Auch wenn mit Hilfe der CBC die Wahlanteile direkt und nicht über den Umweg von Produktwahlmodellen bestimmt werden können, sind diese Verfahren zur Präferenzmessung eher für Produktgruppen geeignet, bei denen die Eigenschaften „Marke“ und „Preis“ die Entscheidung dominieren – zur Ableitung von Entscheidungen über Produktverbesserungen bei komplexeren Gütern, zur Segmentierung der Entscheidungsträger und zur Prognose von Marktverhalten sind diese Verfahren dagegen weniger geeignet (vgl. Huber; Wittink; Johnson (1992), 9). 781 Im Gegensatz dazu gehen Louviere; Woodworth (1983), 351) davon aus, dass das Wahlverhalten von Entscheidungsträgern nicht mit Hilfe von deterministischen Produktwahlmodellen erfasst werden kann.

126

Modells durch die Berücksichtigung aller untersuchten Alternativen robustere Schätzungen erwartet werden können.782 Nachdem die Präferenzen der Entscheidungsträger erhoben und die Daten aggregiert wurden kann anhand verschiedener Maßzahlen die Güte der Präferenzmessung bestimmt werden.

3.10 Gütemaße zur Einschätzung der Ergebnisse der Präferenzmessung

Bevor auf Basis der Ergebnisse der Präferenzmessung produktpolitische Entscheidungen abgeleitet und umgesetzt werden können, muss die Güte der Schätzwerte überprüft werden. Dies ist zwingend notwendig, um sicherzustellen, dass die prognostizierten den realen Marktreaktionen möglichst entsprechen. Zu diesem Zweck können verschiedene Validitätsmaße herangezogen werden.783 In diesem Abschnitt werden auch Gütemaße berücksichtigt werden, die eine eher indirekte Einschätzung der Eignung einer Präferenzmessmethode erlauben. Im Mittelpunkt steht dabei die Analyse der vom Entscheidungsträger wahrgenommenen Befragungssituation sowie die von ihm genutzte Bewertungsstrategie zur Einschätzung der Alternativen.

3.10.1 Überblick verschiedener Validitätsmaße

Bevor auf Basis der Ergebnisse der Präferenzmessung produktpolitische Entscheidungen abgeleitet und umgesetzt werden können, muss die Güte der Schätzwerte überprüft werden. Dies ist zwingend notwendig, um sicherzustellen, dass die prognostizierten den realen Marktreaktionen möglichst entsprechen. Zur Einschätzung der mit Hilfe der Präferenzmessung erhobenen Daten und Schätzungen stehen verschiedene Gütemaße zur Verfügung, die in den folgenden Kapiteln vorgestellt werden sollen. Dabei unterscheidet man insbesondere zwischen Maßzahlen der Validität und Reliabilität.

Messmethoden sind reliabel, wenn sie bei wiederholten Erhebungen konsistente Resultate liefern. Demgegenüber spricht man von einer validen Messung, falls eine Methode tatsächlich das misst, was gemessen werden soll.784 Bei der Überprüfung der Validität geht es daher 782

Vgl. Green; Krieger (1996), 858ff. Aus diesem Grund wurden weitere Randomized First Choice Modelle entwickelt, die dieses Problem abschwächen sollen. Siehe dazu Orme; Huber (2000), 19; Deal (2003); McCullough (2002b), 22. 783 Zudem kann die Reliabilität untersucht werden. Messmethoden sind reliabel, wenn sie bei wiederholten Erhebungen konsistente Resultate liefern (vgl. Churchill (1979), 65). Auf eine Darstellung der verschiedenen Reliabilitätsmaße wird in dieser Arbeit verzichtet, da sie im Rahmen der folgenden empirischen Untersuchung nicht berücksichtigt werden. Für verschiedene Reliabilitätsarten siehe Bateson; Reibstein; Boulding (1987), 455ff.; Reibstein; Bateson; Boulding (1988), 272; Green; Srinivasan (1990), 11f.; Melles (2001), 91; Weisenfeld-Schenk (1989), 43; Segal (1982, 139ff. 784 Vgl. Churchill (1979), 65; Schweikl (1985), 68; Müller-Hagedorn; Sewing; Toporowski (1993), 125; Bateson; Reibstein; Boulding (1987), 453.

127

um die Frage, ob ein hypothetisches Konstrukt (die Präferenz) durch eine bestimmte Methode sinnvoll erfasst werden kann.785 Die verschiedenen Maße der zur Verfügung stehenden Gütearten hinsichtlich der Validität und Reliabilität werden in der Literatur nicht einheitlich eingeordnet. Die im Folgenden präsentierte Gruppierung ist deshalb nur eine Möglichkeit zur Einteilung. Da in der Praxis eine Vielzahl unterschiedlicher Maße zur Einschätzung der Güte der Präferenzmessung Anwendung finden, kann in den nächsten Kapiteln lediglich auf typische Maße eingegangen werden.786 Zudem sollen in diesem Kapitel weitere Gütemaße berücksichtigt werden, die eine eher indirekte Einschätzung der Eignung einer Präferenzmessmethode erlauben; eine Beschreibung

erfolgt in den Kapiteln 3.10.3 und 3.10.4. Im Mittelpunkt steht dabei die Analyse der vom Entscheidungsträger wahrgenommenen Befragungssituation sowie die von ihm genutzte Bewertungsstrategie zur Einschätzung der Alternativen.

3.10.1.1 Augenscheinvalidität

Bei der Augenscheinvalidität787 wird die Plausibilität der geschätzten Teilnutzen bzw. der Vorzeichen der Teilnutzen überprüft. Dies bedeutet, dass die Erwartungen des Marktforschers über die Vorziehenswürdigkeit bestimmter Ausprägungen erfüllt sein sollten.788 Eine

Überprüfung der Augenscheinvalidität kann deshalb nur bei solchen Merkmalen erfolgen, bei denen eine eindeutige Vorziehenswürdigkeit vermutet werden kann.789 So ist beispielsweise davon auszugehen, dass unter der Bedingung, dass alle anderen Ausprägungen weiterer Merkmale unverändert bleiben, ein Befragungsteilnehmer jeweils den niedrigsten Preis bevorzugen wird. Neben dem erwarteten Nutzenverlauf der Eigenschaftsausprägungen kann ebenfalls die erwartete relative Wichtigkeit der Merkmale Untersuchungsgegenstand der Augenscheinvalidität sein.790 Zusätzlich bzw. alternativ zu den Erwartungen des Marktforschers können auch vor der Präferenzmessung erhobene, direkte Einschätzungen bzw. Statements des Befragungsteilnehmers während der Präferenzmessung zur Beurteilung der Augenscheinvalidität genutzt werden.791

785 786 787 788 789 790 791

Vgl. Albrecht (1997), 301. Für einen Überblick verschiedener Maße siehe Bateson; Reibstein; Boulding (1987), 457ff., 472f. Auch Face-Validität genannt (vgl. Skiera; Gensler (2002b), 258). Vgl. Churchill (1979), 69f.; Skiera; Gensler (2002b), 258; Green; Srinivasan (1978), 115; Schweikl (1985), 71, 187; Stallmeier (1993), 132; Albrecht (1997), 303; Acito; Jain (1980), 108. Vgl. Acito; Jain (1980), 108; Baier; Säuberlich (1997), 967. Vgl. Albrecht (1997), 303. Vgl. Green; Srinivasan (1978), 115.

128

Als Maß für die Augenscheinvalidität dient die relative Häufigkeit der Erfüllung der a priori Annahme, d.h. der Anteil der Eigenschaftsausprägungen, bei dem die Reihenfolge der Teilnutzen den Erwartungen entsprechen. Zur Überprüfung signifikanter Unterschiede zwischen zwei Studien kann ein t-Test durchgeführt werden.792

3.10.1.2 Interne Validität

Je nachdem, welche Methode zur Parameterschätzung angewendet wird, können unterschiedliche Maße für die interne Validität berechnet werden.793 Das Bestimmtheitsmaß794 R2 wird beispielsweise als Standardmaßzahl für die interne Validität von Conjoint-Analysen angewendet, bei denen die Parameterschätzung mit Hilfe der Regressionsanalyse erfolgt.795 Es ergibt sich als Verhältnis von der durch das Modell erklärten Streuung im Vergleich zur Gesamtstreuung (siehe Gleichung 15).796

¦ ¦

R2

K k 1 K

k

( yˆ k  y ) 2

( yk  y ) 2 1

erklärteStreuung Gesamtstreuung

Gleichung 15

mit: yˆ k : y: yk : K:

durch die Regressionsanalyse geschätzter Wert der abhängigen Variablen arithmetisches Mittel der Ausprägungen der abhängigen Variablen tatsächlich beobachtete Ausprägung der abhängigen Variablen Zahl der Beobachtungswerte

Weiterhin kann bei der Conjoint-Analyse auf Basis von geschätzten Regressionsdaten das korrigierte Bestimmtheitsmaß (adjusted R2) zur Einschätzung der internen Validität genutzt

werden, um die Anzahl der geschätzten Parameter und die Anzahl der Beobachtungswerte zu berücksichtigen.797 Die Berechnung des korrigierten Bestimmtheitsmaßes entsprechend Gleichung 16 erfolgen. 792

Vgl. Schweikl (1985), 188.

793

Für einen Überblick weiterer Maßzahlen zur Einschätzung der internen Validität siehe Stallmeier (1993), 133f.; Schweikl (1985), 70; Green; Srinivasan (1978), 115. 794 Dieses wird auch als “goodness of fit” bezeichnet (vgl. Backhaus; Erichson; Plinke; Weiber (2003), 63). 795

Vgl. Stallmeier (1993), 133; Draper; Smith (1981), 204ff.; Schweikl (1985), 70; Melles (2001), 89; Chrzan (1991), 206; Boya (1981), 306. Eine Ausnahme ist die ACA, bei der der Korrelationskoeffizient der ACA/Sensus Trade-off als Indikator der internen Validität genutzt werden kann (vgl. Ernst (2000), 175; Chrzan (1991), 208). Andere Autoren gehen davon aus, dass bei Anwendung der ACA die interne Validität nicht überprüft werden kann (vgl. Hensel-Börner (2000), 144). Je nach Methode zur Parameterschätzung können unterschiedliche Maßzahlen berechnet werden. So kann bei Studien, die Teilnutzen auf Basis von Rangdaten mittels LINMAP schätzen, auf den Korrelationskoeffizienten nach Kendall zurückgegriffen werden (vgl. Hensel-Börner (2000), 144; Skiera; Gensler (2002b), 259). Green; Srinivasan (1978, 115) empfehlen den Pearson’s oder Spearman Korrelationskoeffizienten. 796 Vgl. Backhaus; Erichson; Plinke; Weiber (2003), 66. 797

Vgl. Skiera; Gensler (2002b), 259; Green; Srinivasan (1978), 115; Stallmeier (1993), 133. Alternativ könnte das korrigierte R2 entsprechend des Vorschlags von Green; Tull (1982), 299 berechnet werden. Siehe dazu weiterhin Schweikl (1985), 169; Green; Helsen; Shandler (1988), 394.

129

2 Rkorr

mit: R2 : J: K-J-1: K:

R2 

J * (1  R 2 ) K  J 1

Gleichung 16

Bestimmtheitsmaß Zahl der Regressoren Zahl der Freiheitsgrade Zahl der Beobachtungswerte

Green; Helsen; Shandler (1988, 395) gehen davon aus, dass auch die Entscheidungssituation, also die wahrgenommenen Nutzenunterschiede zwischen den Alternativen, einen hohen Einfluss auf die Höhe der internen Validität ausübt. Treten zwischen den zu bewertenden Alternativen große Nutzenunterschiede auf,798 ist damit zu rechnen, dass die Bewertung der Alternativen tendenziell einfacher und deshalb das R2 höher als in Entscheidungssituationen ist, bei denen die Nutzenunterschiede zwischen den Stimuli als eher gering wahrgenommen werden. Befinden sich im Eigenschaftsset Merkmale, die für die Entscheidungsträger weniger relevant sind, so ist gleichzeitig mit einer höheren internen Validität zu rechnen. Die Befragungsteilnehmer bewerten in diesen Fällen die Alternativen lediglich anhand einer Teilmenge der vorgegebenen Informationen, d.h. anhand der relevanten Merkmale, so dass die interne Validität tendenziell steigt.799 Je nach Schwierigkeitsgrad der Aufgabenstellung800 ist mit unterschiedlichen Ausprägungen des R2 zu rechnen. Insofern fällt es schwer, dieses Maß der internen Validität zwischen verschiedenen Studien zu vergleichen. Helm; Manthey; Scholl; Steiner (2003, 17f.) bezeichnen Entscheidungsträger mit einem R2 zwischen 0,9 und 1 als hoch konsistent. Werte unter 0,7 erscheinen demnach als nicht ausreichend.801 Die Anwendung des korrigierten Bestimmtheitsmaßes erleichtert insbesondere dann die Interpretation der Maße der internen Validität, wenn sich die Zahl der untersuchten Eigenschaften und Ausprägungen zwischen den Vergleichsstudien unterscheidet. Helm; Manthey; Scholl; Steiner (2003, 18) schlagen einen weiteren Test zur Überprüfung der internen Validität bei Conjoint-Analysen auf Basis von Paarvergleichen vor. Dabei wird für alle in der Studie untersuchten Stimulipaare überprüft, ob die Reihenfolge der empirisch er798

Dies ist beispielsweise eher der Fall, wenn die Bandbreite der untersuchten Eigenschaften sehr hoch ist.

799

Vgl. Huber (1987), 5. Die interne Validität kann somit nur sehr eingeschränkt zur Einschätzung der Art der vom Befragungsteilnehmer vorgenommenen Bewertungsprozesse herangezogen werden. So können zwar inkonsistente Entscheidungsträger bestimmt, aber nicht die Probanden ermittelt werden, die zur Einschätzung der Alternativen Entscheidungsheuristiken angewendet haben. Teilweise wird davon ausgegangen, dass zu weite Bandbreiten der Eigenschaften die Entscheidung der Befragungsteilnehmer erschweren und so die Konsistenz der Aussagen verringern können (vgl. Dellaert; Brazell; Louviere (1999), 145). 800 Der Schwierigkeitsgrad einer Bewertungssituation wird durch das Untersuchungsobjekt, die Anzahl der zu bewertenden Stimuli und insbesondere vom untersuchten Eigenschaftsset beeinflusst. 801 Vgl. Helm; Manthey; Scholl; Steiner (2003), 18f.

130

hobenen Vorziehenswürdigkeit der Alternativen mit der geschätzten Rangfolge der Vorziehenswürdigkeit übereinstimmt. Die Häufigkeit der richtig prognostizierten Paarvergleichseinschätzungen kann als Maß für die interne Validität genutzt werden. Ist es möglich, die in der Präferenzmessung untersuchten Stimuli anhand der erhobenen Präferenzdaten in eine Reihenfolge zu bringen, kann diese empirische Rangfolge mit der prognostizierten Rangfolge verglichen werden. Die Korrelation zwischen beobachteter und prognostizierter Rangfolge dient in diesem Fall als weiteres Maß für die interne Validität einer Untersuchung.802

3.10.1.3 Prognosevalidität

Ziel der Gütemaße der Prognosevalidität ist die Analyse der Übereinstimmung zwischen beobachteten Wahlentscheidungen und dem durch die Ergebnisse der Präferenzmessung prognostizierten Wahlverhalten. Dies entspricht dem Hauptanliegen der Methoden zur Präferenzmessung, d.h. der Prognose von möglichen Wahlentscheidungen. Deshalb steht die Einschätzung der Prognosevalidität einer empirischen Studie oft im Zentrum des Interesses.803 Bei der Überprüfung der Prognosevalidität werden häufig die direkten Einschätzungen von speziell für diesen Zweck ausgewählten Alternativen (die nicht in die Nutzenschätzung eingehen) mit den Schätzungen der Gesamtnutzen für diese Stimuli auf Basis der berechneten Teilnutzen verglichen.804 Um das Ausmaß der Prognosevalidität zu bestimmen, können Hold-out Sets805 oder weitere speziell konstruierte Stimuli im Rahmen einer Referenzmethode806 genutzt werden. Bei der Referenzmethode handelt es sich um eine einzelne Aufgabe, bestehend aus mehreren Alternativen, die zur Einschätzung der Prognosevalidität genutzt wird. Hold-out Sets beinhalten demgegenüber typischerweise mehrere Bewertungsaufgaben, die aus Paarvergleichen, Tripeln von Stimuli oder einer anderen Anzahl an Alternativen bestehen können. Die Anzahl der Hold-out Sets bzw. der Alternativen innerhalb einer Referenzmethode sollte möglichst der Zahl der geschätzten Parameter entsprechen.807

802 803 804

Vgl. Green; Srinivasan (1978), 115. Vgl. Green; Srinivasan (1990),12. Vgl. Schweikl (1985), 163; Helm; Manthey; Scholl; Steiner (2003), 18; Albrecht (1997), 304.

805

Vgl. Acito; Jain (1980), 108; Schweikl (1985), 163; Sawtooth Software (2002), 13; Johnson (1997), 1; Cattin; Wittink (1982), 50. Um die Stabilität der Lösung zu überprüfen, könnten zwischen Präferenzmessung und Einschätzung der Hold-out Sets mehrere Wochen liegen (vgl. Srinivasan; MaCarty (1998), 2). 806 Vgl. Helm; Manthey; Scholl; Steiner (2003),18; Schweikl (1985), 164. 807

Vgl. Klein (2002), 33.

131

Nutzung von Hold-out Sets zur Bestimmung der Prognosevalidität

Hold-out Sets entsprechen oft den Aufgabenstellungen der Bewertungsaufgaben der jeweiligen Präferenzmessmethode;808 sie gehen jedoch, wie beschrieben, nicht in die Schätzung der Teilnutzenwerte ein.809 Mit Hilfe einer wiederholten Einschätzung von Produktalternativen im Rahmen von Hold-out Tasks810 können weiterhin inkonsistente Befragungsteilnehmer identifiziert und evtl. eliminiert werden. Weiterhin dienen Hold-out Tasks im Rahmen der ACA zur Kalibrierung der geschätzten Teilnutzen. Im Rahmen dieser Phase der Präferenzmessung werden die Befragungsteilnehmer gebeten, in jedem Hold-out Task die bevorzugte Alternative zu kennzeichnen.811 Die Befragungsteilnehmer können ebenso die Alternativen in eine Rangfolge bringen bzw. anhand von Kaufwahrscheinlichkeiten oder einer anderen Skala einschätzen. Im Anschluss daran kann überprüft werden, ob die direkt erhobene Reihenfolge der Vorziehenswürdigkeit der Alternativen mit der prognostizierten Präferenzrangfolge korreliert. Bei Paarvergleichen kann zusätzlich untersucht werden, ob die jeweils beobachtete Präferenzrelation zwischen zwei Stimuli mit der prognostizieren Präferenzrelation übereinstimmt. Aufgrund der starken Ähnlichkeit zwischen Hold-out Task und der Aufgabenstellung der Präferenzmessung ist ein Vergleich dieser beiden Ergebnisse jedoch eingeschränkt aussagekräftig. Vielmehr ist durch die Übereinstimmung der Fragestellungen mit entsprechenden Verzerrungen zu rechnen.812 Eine besondere Art von Hold-out Tasks stellt der von Orme; Alpert; Christensen (1997a, 212 und 216ff.) vorgeschlagene „Super Hold-out Task“ dar. Die Autoren gehen davon aus, dass innerhalb von Hold-out Tasks die Entscheidungsfindung so real wie möglich gestaltet werden sollte. Insbesondere bei teuren Gütern erfolgen Entscheidungen nicht schnell, sondern erst nach einer ausgiebigen Informationssuche, z.B. indem auch die Meinungen anderer Personen berücksichtigt werden. Im Rahmen von Super Hold-out Tasks erfolgt deshalb die Alternativenbewertung nicht allein, sondern innerhalb von kleinen Gruppen von Entscheidungsträgern. In einem zweiten Schritt erfolgt dann eine weitere, jedoch individuelle Einschätzung dieser Stimuli. Dabei beobachteten Orme; Alpert; Christensen (1997a, 216), dass sich Gruppenentscheidung und individuelle Bewertung in dieser empirischen Studie nur selten voneinander unterschieden. Dies kann auf homogene Präferenzen innerhalb der Gruppe, gruppendynami-

808 809

Vgl. Orme; Alpert; Christensen (1997a), 209. Vgl. Melles (2001), 93.

810

Hold-out Sets bezeichnen im Folgenden die Alternativen, die vom Entscheidungsträger bewertet werden sollten. Als Hold-out Task wird dagegen die Bewertungsaufgabe bzw. werden die Einschätzungen der Befragungsteilnehmer beschrieben. 811 Vgl. Johnson (1997), 1f. 812

Vgl. Melles (2001), 95.

132

sche Effekte oder weniger motivierte Befragungsteilnehmer zurückgeführt werden.813 Gerade der Einfluss anderer Personen könnte allerdings die Ergebnisse der Präferenzmessung verzerren. Die Präferenzen wurden auf individueller Ebene erhoben, es handelt sich also um die Einschätzungen eines einzelnen Befragungsteilnehmers. Die verschiedenen Alternativen des Hold-out Sets werden dagegen im Rahmen von Gruppendiskussionen bewertet. Eine entsprechende Vorgehensweise kann zu einer Veränderung der Präferenzen des Entscheidungsträgers führen.814 Intendiertes Ziel des Super Hold-out Tasks war es aber, dass sich die Entscheidungsträger intensiver mit den zur Verfügung stehenden Informationen auseinander setzen – so wie es in der Realität bei hochwertigen Gütern der Fall ist. Es ist allerdings davon auszugehen, dass gruppendynamische Effekte zu einer unkontrollierbaren Veränderung der Präferenzen führen können, so dass die Ergebnisse der Präferenzmessung und die der Super Holdout Task nicht mehr vergleichbar sind. Orme; Alpert; Christensen (1997a, 221) kommen in ihrer Studie zu dem Schluss, dass die Gruppendiskussionen keine realistischere Entscheidungssituation hervorgerufen haben. Die Nutzung der „Super Hold-out“ Aufgabe führte nicht zu signifikant besseren Prognoseergebnissen.815 Nutzung einer Referenzmethode zur Analyse der Prognosevalidität

Alternativ zu einem Hold-out Task kann eine bestimmte Zahl von Stimuli im Rahmen einer Referenzmethode präsentiert und vom Entscheidungsträger direkt eingeschätzt werden.816

Eine Referenzmethode besteht aus verschiedenen Stimuli, die gleichzeitig präsentiert werden. Im Gegensatz zu den Hold-out Tasks gleicht die Bewertungsaufgabe nicht den Aufgaben der Präferenzmessmethode. Meist werden hier relativ einfache Entscheidungen erhoben. So können die Befragungsteilnehmer gebeten werden, Kaufwahrscheinlichkeiten für die jeweiligen Alternativen abzugeben, die Stimuli in eine Rangfolge zu bringen oder sie auf einer KonstantSummen-Skala zu bewerten. Maßzahlen zur Bestimmung der Prognosevalidität auf individueller Ebene

Zur Untersuchung der Konvergenz zwischen den beobachteten Präferenzen (durch Einschätzung von Hold-out Tasks bzw. der Referenzmethode) und den geschätzten Nutzen der hypothetischen Alternativen stehen eine Reihe möglicher Methoden zur Verfügung, die im Folgenden im Überblick vorgestellt werden. Dabei unterscheidet man vor allem zwischen HitRates, die lediglich einen Teil der zur Verfügung stehenden Informationen aus der Referenz-

813 814 815 816

Vgl. Orme; Alpert; Christensen (1997a), 216. Siehe dazu Kapitel 5.4. Vgl. Orme; Alpert; Christensen (1997a), 218ff. Vgl. Helm; Manthey; Scholl; Steiner (2003), 18.

133

methode nutzen und Korrelationskoeffizienten, die je nach Skalenart in der Referenzmethode erhobenen Daten ausgewählt werden und die Analyse aller erfassten Daten ermöglichen.817 Die folgenden Hit Rates können zur Bewertung der Übereinstimmung der Einschätzungen berechnet werden:818 First-Choice Hit Rate

(HR1): First-Second-Choice Hit Rate

(HR 12): First-Second-Third Choice Hit Rate

(HR 123): First-two Hit Rate

(HR{12}):

First-three Hit Rate

(HR{123}):

Es wird überprüft, ob die Alternative, die in der Referenzmethode bevorzugt wurde, auch den höchsten prognostizierten Nutzen aufweist.819 Untersuchung, ob die ersten beiden präferierten Alternativen zwischen Referenzmethode und berechneten Gesamtnutzen übereinstimmen.820 Untersuchung, ob die ersten drei präferierten Alternativen zwischen Referenzmethode und berechneten Gesamtnutzen übereinstimmen.821 Überprüfung, ob sich die in der Referenzmethode präferierte Alternative unter den ersten beiden bevorzugten Alternativen bei der prognostizierten Rangfolge befindet.822 Überprüfung, ob sich die in der Referenzmethode präferierte Alternative unter den ersten drei bevorzugten Alternativen bei der prognostizierten Rangfolge befindet.823

Da sich Konsumenten typischerweise für lediglich eine Produktalternative entscheiden und dabei oft die Alternative wählen, die aus ihrer Sicht den höchsten Nutzen stiftet, kommt der First-Choice Hit Rate als Maß für die Prognosevalidität eine besondere praktische Bedeutung zu.824 Aus diesem Grund ist die First-Choice Hit Rate das wohl üblichste Maß zur Validitätseinschätzung von Präferenzmessungen.825 Eine Beschränkung auf die First-Choice Hit Rate ist allerdings nicht vorteilhaft, wenn die gesamte Präferenzmessung eingeschätzt werden soll, da so nur ein Teil der erhobenen Daten tatsächlich berücksichtigt wird.826

817

Vgl. Albrecht (1997), 304.

818

Dabei werden die beobachteten und die prognostizierten Einschätzungen der Alternativen in eine Rangfolge gebracht und diese miteinander verglichen. Vgl. Helm; Manthey; Scholl; Steiner (2003), 18; Sattler (1994), 39; Melles (2001), 93; Reiners (1996), 159; Schweikl (1985), 71; Green; Krieger; Agarwal (1993), 375; Albrecht (1997), 304; McCullough (2002b), 22. Eine angepasste Variante der First-Choice Hit Rate ist die „Randomized First-Choice Hit Rate“, die um zwei Fehlerterme “product value variability” und “attribute value variability” erweitert wurde (vgl. Huber; Orme; Miller (1999), 1ff.; McCullough (2002b), 22). 820 Vgl. Helm; Manthey; Scholl; Steiner (2003), 18. 819

821 822 823 824 825 826

Vgl. Helm; Manthey; Scholl; Steiner (2003), 18. Vgl. Helm; Manthey; Scholl; Steiner (2003), 18. Vgl. Helm; Manthey; Scholl; Steiner (2003), 18. Vgl. Green; Krieger; Agarwal (1993), 375ff. Vgl. Orme; Alpert; Christensen (1997a), 213. Vgl. Green; Krieger; Agarwal (1993), 377f.

134

Können die Stimuli der Referenzmethode in eine Rangfolge gebracht werden,827 besteht die Möglichkeit Korrelationskoeffizienten wie den Spearman Rang-Korrelationskoeffizienten oder das Kendalls Tau zu berechnen.828 Liegen stattdessen metrische Daten vor, kann die Produkt-Moment-Korrelation nach Pearson zwischen den geschätzten und prognostizierten

Werten bestimmt werden.829 Weiterhin gibt es die Möglichkeit, den Prozentsatz von Rangpositionstreffern830 oder die Summe der absoluten Rangabweichungen831 zwischen den beobachteten und berechneten Rängen zu untersuchen.832 Der Spearman Rang-Korrelationskoeffizient analysiert die Übereinstimmung zweier Rangfolgen X und Y, die durch die Einschätzung verschiedener Stimuli innerhalb einer Referenzmethode direkt erhoben bzw. durch die Teilnutzen der Ergebnisse der Präferenzmessung geschätzt werden können. Die Ränge der jeweiligen Alternativen können mit xk und yk bezeichnet werden (k = 1,…,K). Der Spearman Korrelationskoeffizient kann entsprechend Gleichung 17 berechnet werden.833 RC

¦

¦ K k 1

K k 1

(x k  x ) * ( y k  y )

¦

( xk  x ) 2 *

K k 1

( yk  y ) 2



Gleichung 17

Da der berechnete Korrelationskoeffizient nicht auf intervallskaliertem Niveau vorliegt, müssen die einzelnen Werte vor einer Aggregation für jeden Befragungsteilnehmer z-transformiert werden.834 Die z-Transformation erfolgt entsprechend Gleichung 18. z

§ 1  RC · 1 ¸¸ * ln¨¨ 2 © 1  RC ¹

Gleichung 18

Die ermittelten z-transformierten Werte können nun durch Mittelwertbildung über alle Entscheidungsträger aggregiert werden. Sollen die Korrelationswerte verschiedener Gruppen von Befragungsteilnehmern mit Hilfe von t-Tests auf signifikante Mittelwertunterschiede hin überprüft werden, kann dies mit Hilfe der z-transformierten Werte erfolgen.835 Durch eine Z-

827 828 829 830 831 832 833 834 835

Für ein Beispiel siehe Orme; Alpert; Christensen (1997a), 213. Vgl. Melles (2001), 93; Green; Helsen; Shandler (1988), 395; Johnson (1974), 123. Vgl. Melles (2001), 94. Vgl. Akaah; Korgaonkar (1983), 195; Jain; Acito; Malhotra; Mahajan (1979), 318. Vgl. Acito; Jain (1980), 111; Jain; Acito; Malhotra; Mahajan (1979), 318. Vgl. Melles (2001), 93f. Zur Berechnung des Spearman Rangkorrelationskoeffizienten siehe auch Helm; Manthey; Scholl; Steiner (2003), 18f.; Fahrmeir; Künstler; Pigeot; Tutz (2003), 139ff. Vgl. Schweikl (1985), 166; Sachs (2004), 542ff.; Sheluga; Jaccard; Jacoby (1979), 171; Albrecht (2000), 315. Vgl. Schweikl (1985), 167. Für ein Beispiel siehe Green; Goldberg; Wiley (1983), 149f. oder Huber; Daneshgar; Ford (1971), 273.

135

Retransformation (Gleichung 19) erhält man den aggregierten Mittelwert des Spearman RangKorrelationskoeffizienten über alle Befragungsteilnehmer.

RC

e 2* z  1 e 2* z  1

Gleichung 19

Rangfolgen, die absolut identisch sind (d.h. RC=1), können jedoch nicht durch Gleichung 18 z-transformiert und aus diesem Grund nicht bei der Mittelwertbildung berücksichtigt werden. Eine Interpretation der Mittelwerte von Korrelationskoeffizienten ist folglich nur dann unproblematisch, wenn kein Fall mit RC = 1 auftritt. Auch das Kendalls Tau kann zur Analyse der Prognosevalidität bei Rangdaten angewendet werden.836 Wie der Spearman Rang-Korrelationskoeffizient beruht das Kendalls Tau auf zwei Rangdaten xk und yk für die Alternativen k. Die Ränge xk, die möglichst nicht doppelt vergeben wurden, werden zunächst so geordnet, dass x1 < x2 < … < xk gilt. Die Werte für die Ränge yk sind danach entsprechend der aufsteigenden Rangfolge von xk geordnet. Daran anschließend ergibt sich Pk aus der Anzahl der y-Werte, deren Rangzahlen größer als yk sind und in der obigen Anordnung rechts von yk stehen. Der Wert Qk wird aus der Anzahl der yWerte, deren Rangzahlen kleiner als yk sind und in der obigen Anordnung rechts von yk steK

hen berechnet. P ergibt sich dabei aus P

K

¦ P ; Q wird berechnet durch Q ¦ Q .837 i

k 1

i

k 1

Für den Fall, dass bei yk bestimmte Ränge doppelt vergeben wurden,838 kann das Kendalls Tau mit Hilfe von Gleichung 20 berechnet werden.839 PQ PQ

W*

Gleichung 20

Zur Aggregation der Rang-Korrelationskoeffizienten über verschiedene Befragungsteilnehmer wird hier auf die z-Transformation der Werte zurückgegriffen. Wurden in der Referenzmethode tatsächlich metrisch skalierte Daten erhoben, kann der Produkt-Moment-Korrelationskoeffizient berechnet werden. Schweikl (1985, 164) lässt beispielsweise im Rahmen eines Hold-out Tasks Paare von Stimuli anhand einer Dollar-Metrik

836 837

Vgl. Albrecht (1997), 306f. Vgl. Bosch (1993), 62ff.; Hartung; Elpelt (1995), 199ff.

838

Diese Form der Berechnung ist bei der praktischen Untersuchung relevant, da bestimmte Alternativen der Referenzmethode für einen Entscheidungsträger u.U. den gleichen Nutzen stiften und deshalb diesen ein identischer Rangplatz zugeordnet wird. 839 Vgl. Bosch (1993), 65. Bei der direkten Abfrage von Rängen oder Kaufwahrscheinlichkeiten im Rahmen einer Referenzmethode ist damit zu rechnen, dass Probanden bestimmten Alternativen identische Ränge zuweisen.

136

einschätzen, um sicherzustellen, dass die Ergebnisse den Anforderungen an das Skalenniveau entsprechen. Hier erfolgt eine Aggregation der Werte ebenfalls durch z-Transformation. Maßzahlen zur Bestimmung der Prognosevalidität auf aggregierter Ebene

Mit Hilfe der First-Choice Hit Rate oder anderen Methoden zur Prognose von Wahlanteilen (wie beispielsweise BTL)840 können auf aggregierter Ebene prognostizierte und beobachtete Wahlanteile verglichen werden. Typische Maßzahlen für die Prognosevalidität auf aggregierter Ebene sind der mittlere absolute Fehler (MAE)841 zwischen beobachteten und prognostizierten Wahlanteilen, der Prozentsatz richtig prognostizierter Wahlanteilsplätze (First-Choice Hit Rate),842 die Produkt-Moment-Korrelation843 zwischen beobachteten und prognostizierten Wahlanteilen sowie ein Maß für den mittleren quadrierten Fehler (Proportional Reduction in Mean Square Error of Prediction (PRMSEP).844 Bestimmung der Alternativen des Hold-out Sets bzw. der Referenzmethode

Die Nutzung von Hold-out Tasks und Stimuli einer Referenzmethode ist insofern problematisch, da es sich hierbei letztendlich lediglich um weitere multiattributive Urteile, vergleichbar zu denen der Conjoint-Analyse handelt, die das reale Entscheidungsverhalten nicht zwingend widerspiegeln.845 Zudem muss beachtet werden, dass die Höhe der Prognosevalidität über verschiedene Studien hinweg nur sehr begrenzt vergleichbar ist. Vielmehr hängt die Güte der Prognosevalidität sehr stark von der Anzahl und Auswahl der zu bewertenden Stimuli oder von der Bewertungsaufgabe selbst ab.846 Insbesondere die vom Marktforscher getroffene Auswahl der in der Referenzmethode zu bewertenden Stimuli hat einen erheblichen Einfluss auf die Ergebnisse der Prognosevalidität.847 So ist damit zu rechnen, dass die Ergebnisse der Prognosevalidität bei Stimuli, die sich bezüglich ihrer Nutzeneinschätzung sehr ähnlich sind, geringer als bei Stimuli mit großen Nutzenunterschieden sein wird.848 Orme; Alpert; Christensen (1997a, 210) nennen verschiedene, sehr allgemeine Richtlinien bei der Konstruktion von Hold-out Tasks - eine einheitliche Vorgehensweise zur Erstellung von Hold-out Stimuli existiert jedoch nicht.849 McCullough (2002b, 21) spricht sich dafür aus, die Alternativen des Hold-out Sets aus praktischen Gründen einfach durch den Auftraggeber 840 841 842 843 844 845 846 847 848 849

Siehe dazu auch Kapitel 3.9. Vgl. Green; Helsen (1989), 349. Vgl. Melles (2001), 93; Green; Helsen (1989), 349. Vgl. Green; Helsen (1989), 349. Vgl. Melles (2001), 93. Vgl. Melles (2001), 94. Vgl. Melles (2001), 95; Green; Krieger; Agarwal (1993), 377. Vgl. Griffin; Hauser (1993), 21. Vgl. Melles (2001), 95; Holling; Melles; Reiners (1999), 256. Vgl. Green; Krieger; Agarwal (1993), 377.

137

der Studie zur Präferenzmessung bestimmen zu lassen. Alternativ könnten die Stimuli so gestaltet werden, dass mit großen Nutzenunterschieden zu rechnen ist. Dies erleichtert möglichwerseise die Überprüfung des Modells. Im Gegensatz dazu gehen Ding; Grewal; Liechty (2005, 68) davon aus, dass die Stimuli innerhalb der Referenzmethode möglichst so gestaltet sein sollten, dass es keine dominante Alternative gibt. Man spricht in diesem Zusammenhang von „pareto-optimalen Choice Sets“.850 Allerdings sollten sich die Alternativen bezüglich ihrer Gesamtnutzen nicht zu ähnlich sein, weil dies die Einschätzung für die Befragungsteilnehmer erschwert und die Ergebnisse der Referenzmethode verzerrt sein könnten. Johnson (1997, 1) empfiehlt deshalb, mehrere Stimuli-Tripel zu präsentieren, die vermutlich Marktanteile von 50%, 30% und 20% erzielen werden. Um diese Empfehlung praktisch umsetzen zu können, wäre es jedoch notwendig, die Präferenzen eines Individuums schon vor der eigentlichen Präferenzmessung zu antizipieren und die Stimuli entsprechend zu gestalten.851 Wird mit Hilfe der Präferenzmessung eine Segmentierung der Kunden angestrebt, so schlägt Johnson (1997, 1) vor, die Alternativen im Hold-out Set so zu konstruieren, dass eine Alternative jeweils von einer einzigen Kundengruppe präferiert wird. In diesen Fällen müssten allerdings a priori Informationen über die Kundengruppen und deren Präferenzen vorliegen. Holling; Melles; Reiners (1999, 259) raten schließlich dazu, die Hold-out Stimuli mit Hilfe eines orthogonalen Designs852 zu bestimmen. Dies führt jedoch zu einer relativ hohen Zahl an Alternativen - im Beispiel von Holling; Melles; Reiners (1999, 259) mussten insgesamt 15 Stimuli bewertet werden. Diese 15 Alternativen ermöglichen eine eigene Nutzenschätzung. Letztendlich handelt es sich deshalb bei dieser Vorgehensweise nicht um eine Referenzmethode, sondern lediglich um eine weitere Präferenzmessung. In diesem Fall wird die konvergierende Validität zwischen zwei Verfahren der Präferenzmessung bestimmt. Der Marktforscher beeinflusst durch die subjektive Selektion der Hold-out Stimuli oder Alternativen in der Referenzmethode erheblich die Güte der Prognosevalidität.853 Orme; Alpert; Christensen (1997a, 212) empfehlen deshalb, die Stimuli innerhalb der Hold-out Sets bzw. Referenzmethode möglichst zufällig zu bilden. So kann zumindest der Einfluss des Marktforschers eliminiert werden. Zudem kann vermutet werden, dass die Ergebnisse der Prognosevalidität sehr stark davon abhängig sind, ob die tatsächlich entscheidungsrelevanten Eigenschaften berücksichtigt wurden. Ist beispielsweise nur ein Merkmal bzw. sind nur wenige Eigenschaften der untersuchten Stimuli tatsächlich entscheidungsrelevant, so wird der Befragungsteilnehmer lediglich 850 851 852 853

Für einen Überblick siehe Ding; Grewal; Liechty (2005), 68. Sind die Präferenzen bereits bekannt, müsste keine entsprechende Studie durchgeführt werden. Dafür könnte z.B. SPSS Orthoplan eingesetzt werden. Vgl. Griffin; Hauser (1993), 21.

138

diese Teilmenge der Informationen zur Bewertung der Alternativen nutzen. Nicht relevante Merkmale werden dagegen weniger bzw. nicht berücksichtigt, was die Beurteilung der Stimuli erleichtert. Sind demgegenüber alle untersuchten Attribute entscheidungsrelevant, steigen die kognitiven Anforderungen an den Probanden, weil mehr Informationen bei der Bewertung simultan zu berücksichtigen sind. Vergleicht man anschließend zwei Studien mit einer identischen Anzahl an Merkmalen, so ist aus diesem Grund damit zu rechnen, dass die Prognosevalidität bei der Studie scheinbar höher ist, bei der nicht relevante Eigenschaften untersucht wurden.854 Ein Vergleich der Ergebnisse der Prognosevalidität ist deshalb bei unterschiedlichen Stimulisets oder gar unterschiedlichen Studien nicht bzw. nur eingeschränkt möglich.855

3.10.1.4 Externe Validität

Ein „Sonderfall“ der Prognosevalidität ist die „externe Validität“, in deren Rahmen das tatsächliche Kaufverhalten im Bezug zu realen Produktalternativen untersucht wird.856 Die

Nutzung von Hold-out Sets oder die einer Referenzmethode ist folglich nicht zur Einschätzung der externen Validität geeignet.857 Die im Rahmen der Präferenzmessung gewonnenen Daten können auf individueller Ebene858 oder auf aggregierter Ebene mit Hilfe von realen Beobachtungen von Marktanteilen859 eingeschätzt werden. Bestimmung der externen Validität auf individueller Ebene

Auf individueller Ebene wird die externe Validität nur selten überprüft, da hierbei der Befragungsteilnehmer tatsächlich, eine dem Untersuchungsdesign vergleichbare, reale Kaufentscheidung mit eigenen finanziellen Mitteln treffen muss.860 Die Analyse der externen Validität ist auf individueller Ebene äußerst problematisch, da eine Überprüfung zum einen erhebliche Kosten bei der Datenerhebung verursachen würde und andererseits davon ausgegangen werden muss, dass die meisten Alternativen, die im Rahmen der Studie eingeschätzt wurden, am Markt so nicht existieren. Ein Vergleich des tatsächlichen Verhaltens mit den Ergebnissen 854 855 856 857 858 859 860

Vgl. Schweikl (1985), 163; Huber (1987), 5f. Vgl. Melles (2001), 95. Vgl. Schweikl (1985), 71. Vgl. Shocker; Zaltman (1977), 406; Srinivasan; MaCarty (1998), 2; Green; Srinivasan (1978), 115; Louviere (1988a), 112; Anderson; Donthu (1988), 287. Vgl. Backhaus; Brzoska (2004), 39ff.; Klein (2002), 33; Green; Srinivasan (1990),13. Vgl. Green; Srinivasan (1978), 115; Wittink; Cattin (1989), 94; Voeth (2000), 227; Srinivasan; MaCarty (1998), 3; Klein (2002), 33; Green; Srinivasan (1990), 13; Srinivasan; deMaCarty (1999), 29. Backhaus; Brzoska (2004), 40. Für einen Überblick über Studien, in denen die externe Validität überprüft wurde, siehe Albrecht (2000, 187). Die externe Validität der Präferenzmessung wird selten überprüft, da dies im Normalfall auch eine „Nicht-Wahl-Option (d.h. der Befragungsteilnehmer kauft keine der präsentierten Alternativen) einschließt (vgl. Voeth (2000), 227).

139

der Präferenzmessung ist daher nur in den seltensten Fällen möglich.861 Aus diesem Grund wurde in anderen Studien nach Vergleichsmaßen gesucht,862 die das reale Verhalten der Konsumenten möglichst gut widerspiegeln. Letztendlich wird in diesen Studien nicht mehr die externe Validität, sondern die Prognosevalidität überprüft.863 Backhaus; Brzoska (2004, 39ff.) nutzen beispielsweise Vickrey-Auktionen als Validierungskriterium für die externe Validität einer Conjoint-Analyse. Die Befragungsteilnehmer müssen dabei ein verbindliches Gebot abgeben. Leigh; MacKay; Summers (1984, 460) verwenden die Daten aus einer Tombola. Die Befragungsteilnehmer wurden gebeten ein Untersuchungsobjekt auszuwählen, dass sie in einer folgenden Verlosung tatsächlich gewinnen konnten. Bestimmung der externen Validität auf aggregierter Ebene

Aufgrund der Probleme, die bei der Überprüfung der externen Validität auf individueller Ebene auftreten, werden teilweise reale Marktdaten zur Überprüfung der externen Validität auf aggregierter Ebene genutzt. Beim Vergleich der Ergebnisse der Präferenzmessung auf aggregierter Ebene mit realen Marktanteilsdaten muss sichergestellt sein, dass in der Studie alle am Markt relevanten Marken berücksichtigt wurden, die Konsumenten diese kennen und diese am Markt tatsächlich uneingeschränkt verfügbar sind. Zudem muss die Stichprobe den realen Zielgruppen möglichst gut entsprechen. Dabei reicht es nicht aus, die Befragungsteilnehmer lediglich aufgrund von demografischen oder sozioökonomischen Merkmalen auszuwählen.864 Sind diese Voraussetzungen erfüllt, so zeigen verschiedene Studien, dass die ConjointAnalyse ein geeignetes Verfahren darstellt, um reales Marktverhalten zu prognostizieren.865 Allerdings ist es mit Hilfe der Präferenzmessung lediglich möglich, Einflussgrößen, die die Produktgestaltung betreffen, zu berücksichtigen. Die Auswirkungen anderer Marketing-Mix Elemente auf den Marktanteil werden auf diese Weise ausgeblendet.866 Wie bereits in Kapitel 2.3 beschrieben, haben neben dem eigentlichen Produkt eine Vielzahl weiterer Faktoren wie Bekanntheitsgrad des Produkts, Verfügbarkeit der Alternativen usw. einen Einfluss auf reale Kaufentscheidungen, so dass Abweichungen in den Prognosen nicht

861

Vgl. Anderson; Donthu (1988), 287; Melles (2001), 96.

862

Beispiele solcher Kaufverhaltenssurrogate bieten Anderson; Donthu (1988), 288; Scott; Keiser (1984), 54ff.; Mohn (1990), 49ff. Für einen Überblick weiterer Studien siehe Backhaus; Brzoska (2004), 40; Anderson; Donthu (1988), 287ff.; Melles (2001), 96 und Srinivasan; MaCarty (1998), 3. 863 Vgl. Backhaus; Brzoska (2004), 40. 864

Vgl. Wittink; Cattin (1989), 94.

865

Für einen Überblick verschiedener Studien siehe Louviere (1988a), 113f. und Srinivasan; MaCarty (1998), 2; Green; Srinivasan (1990), 13. Albrecht (1997, 308) beobachtet demgegenüber eine geringe Übereinstimmung, wobei hier jedoch Konsumgüter untersucht wurden, die nur eingeschränkt zur Untersuchung auf Basis von Methoden der Präferenzmessung geeignet erscheinen (siehe dazu Kapitel 2.3 und 2.5). 866 Vgl. Ding; Grewal; Liechty (2005), 68.

140

ohne weiteres der Güte der Präferenzmessung zugeschrieben werden können.867 Srinivasan; MaCarty (1998, 1ff.) schlagen deshalb vor, ausgewählte Elemente des realen Marketing-Mix in die Marktanteilsprognosen der Präferenzmessung aufzunehmen. Mögliche Einflussfaktoren wären dabei das Werbebudget oder Aufwendungen für die Distribution der Produkte. Durch Einbeziehung dieser Größen konnte in einer empirischen Untersuchung die Prognose der Marktanteile verbessert werden. Dazu sind indes Kenntnisse der Werbe- und Distributionsbudgets aller Wettbewerber notwendig.868 Problematisch an dieser Vorgehensweise ist überdies, dass alle relevanten Einflussgrößen in die Schätzung der Marktanteile aufgenommen werden sollten und diese auf metrischem Skalenniveau vorliegen müssen. Beispielsweise nutzten Srinivasan; MaCarty (1998, 4) das Werbebudget als eine Größe, um den Bekanntheitsgrad eines Produkts bei der Marktanteilsschätzung zu berücksichtigen. Studien869 wie die von Eastlack Jr.; Rao (1989, 62ff.) zeigen allerdings, dass die Werbebotschaft und die Mediaselektion einen größeren Einfluss auf die Absatzzahlen haben als das Werbebudget. Die von Srinivasan; MaCarty (1998, 4ff.) vorgeschlagene Überprüfung der externen Validität der Präferenzmessung kann deshalb nur einen Teilaspekt bei der Marktanteilsprognose berücksichtigen.

3.10.1.5 Konvergierende Validität

Mit Hilfe von Maßzahlen der konvergierenden Validität wird überprüft, inwiefern die Ergebnisse zweier unterschiedlicher Methoden zur Präferenzmessung, die ein identisches Konzept (d.h. ein identisches Eigenschaftsset) untersuchen, übereinstimmen.870 Die Art der Präferenzmessung kann, wie bereits beschrieben, einen erheblichen Einfluss auf die geschätzten Teilnutzen ausüben.871 In der Literatur findet sich deshalb eine Vielzahl an Studien,872 die verschiedene Methoden zur Präferenzmessung miteinander vergleichen und teilweise neue Verfahrensvarianten vorschlagen.873 Als Maße zur Überprüfung der konvergierenden Validität verschiedener Verfahren der Präferenzmessung können die Möglichkeiten, die zur Einschätzung der Prognosevalidität874 bzw.

867 868 869 870 871 872 873 874

Siehe dazu Srinivasan; MaCarty (1998), 1ff.; Green; Srinivasan (1990),13; Ding; Grewal; Liechty (2005), 68. Vgl. Srinivasan; MaCarty (1998), 5ff. Für einen Überblick siehe Eastlack Jr.; Rao (1989), 70. Vgl. Shocker; Zaltman (1977), 405; Churchill (1979), 70; Stallmeier (1993), 134; Schweikl (1985), 72; Albrecht (1997), 304f.; Bateson; Reibstein; Boulding (1987), 454; Cattin; Weinberger (1980), 781. Vgl. Reibstein; Bateson; Boulding (1988), 284. Für einen Überblick siehe u.a. Acito; Jain (1980), 106ff.; Agarwal (1988), 51ff.; Green; Krieger; Agarwal (1993), 369f.; Green; Helsen (1989), 346ff.; Müller-Hagedorn; Sewing; Toporowski (1993), 125; Agarwal (1988), 51ff. Siehe beispielsweise Reibstein; Bateson; Boulding (1988), 271ff.; Green; Krieger; Agarwal (1993), 369ff. Siehe Kapitel 3.10.1.3.

141

zeitlichen Stabilität875 der geschätzten Teilnutzen dienen, genutzt werden. Zur Analyse der konvergierenden Validität dienen jeweils die Ergebnisse zweier unterschiedlicher Präferenzmessmethoden.876

3.10.2 Reliabilität

Zur Überprüfung der Reliabilität der Präferenzmessung können folgende Varianten877 genutzt werden: 1. Reliabilität über die Zeit

-

zwei identische Studien zur Präferenzmessung werden zu zwei verschiedenen Zeitpunkten mit identischen fragungsteilnehmern durchgeführt.878

2. Reliabilität über verschiedene - die Stabilität der Schätzung einzelner (Kern-)Attribute wird überprüft, indem andere Eigenschaften des EigenAttributsets schaftssets variiert werden. 3. Reliabilität über verschiedene - identische Methoden zur Präferenzmessung und ein identisches Eigenschaftsset, jedoch ein Stimulisets unterschiedliches Erhebungsdesign werden genutzt, d.h. unterschiedliche Stimuli werden eingeschätzt. 4. Reliabilität über verschiedene - es werden unterschiedliche Methoden zur Präferenzmessung angewendet und die Ergebnisse Datenerhebungsmethoden verglichen. Bei genauerer Betrachtung dieser Einteilung in verschiedene Varianten der Reliabilität sind Redundanzen zu den bereits präsentierten Validitätsarten zu erkennen. So zählen Bateson; Reibstein; Boulding (1987, 464) alle Studien, die ein Hold-out Set (siehe Prognosevalidität in Kapitel 3.10.1.3) beinhalten zu den Analysen, deren Ziel die Überprüfung der Reliabilität über das Stimulus-Set ist. Die Überprüfung der Reliabilität über verschiedene Datenerhebungsmethoden879 wird in dieser Arbeit ebenfalls in die Gruppe der konvergierenden Validität eingeordnet.

875

Siehe Kapitel 3.10.2.

876

Siehe etwa Green; Krieger; Agarwal (1993), 374ff. Auch ein Vergleich der Methoden zur Bestimmung von Eigenschaften und den in der Präferenzmessung ermittelten Bedeutungsgewichten ist möglich. Schweikl (1985, 193ff.) überprüft beispielsweise, inwiefern die Rangfolge der Wichtigkeit von Eigenschaften aus der Methode zur Selektion der Merkmale und der Rangfolge der Bedeutungsgewichte übereinstimmt. Zu diesem Zweck werden die absoluten und relativen Häufigkeiten der Rangkorrelationskoeffizienten je nach Gruppe präsentiert. 877 Diese Übersicht stammt von Bateson; Reibstein; Boulding (1987, 455ff.), siehe ebenso Reibstein; Bateson; Boulding (1988), 272, Green; Srinivasan (1990), 11f.; Melles (2001), 91; Weisenfeld-Schenk (1989), 43. 878 Vgl. Cattin; Wittink (1982), 50. Die Reliabilität über die Zeit wird in der Literatur teilweise als “Test-Retest-Reliabilität” bezeichnet; siehe dazu beispielsweise Albrecht (2000, 119). Acito (1977, 82ff.) untersucht als Erweiterung dazu die Reliabilität über nicht nur zwei, sondern sechs verschiedene Zeitpunkte. Dabei wurden jedoch gewisse Lerneffekte beobachtet, die die Ergebnisse beeinflussen können. 879 Für einen Überblick siehe Bateson; Reibstein; Boulding (1987), 467ff.

142

Aufgrund der Kontextabhängigkeit der Präferenzmessung ist allerdings fraglich, ob die „Reliabilität über verschiedene Attributsets“ ein aussagekräftiges Gütemaß darstellt. Letztend-

lich werden hier zwei verschiedene Entscheidungssituationen präsentiert, die deshalb unterschiedliche Ergebnisse liefern sollten. Mit ähnlichen Ergebnissen ist lediglich dann zu rechnen, wenn die variierten Eigenschaften nicht für die eigentliche Entscheidung relevant sind. Green; Srinivasan (1990, 11) gehen deshalb davon aus, dass die “Core-Attributes”, d.h. die relevanten Eigenschaften, nicht variiert werden. Reibstein; Bateson; Boulding (1988, 462ff.) untersuchten beispielsweise die Reliabilität über verschiedene Attributsets,880 indem wichtige Eigenschaften im Attributset konstant blieben, während weniger wichtige Merkmale variiert wurden. Ergebnis dieser empirischen Studie ist, dass nicht relevante Eigenschaften die Schätzung der Teilnutzen der relevanten Attribute nicht signifikant beeinflussen.881 Reibstein; Bateson; Boulding (1988, 285) schließen aus diesem Ergebnis, dass wenn „the study had not found this, then the selection of the attributes for a study would have become a dominant theme for future academic research and managerial concern”.882 Bei dieser Art der Überprüfung der Reliabilität einer Untersuchung stellt sich jedoch die Frage, warum vor dem Hintergrund, dass die Conjoint-Analyse nur relativ wenig Merkmale berücksichtigen kann, überhaupt Eigenschaften in die Analyse aufgenommen werden sollten, die offensichtlich kaum einen Erklärungsbeitrag liefern. Vielmehr sollten lediglich relevante Merkmale berücksichtigt werden. Bei der Untersuchung der Reliabilität über die Zeit kann es sich um eine wiederholte Durchführung einer Präferenzmessung handeln. Dabei wird die konvergierende Validität beider Erhebungen bestimmt.883 Ein Beispiel für den Test der Reliabilität über die Zeit findet sich in Segal (1982, 139ff.); er untersucht die Reliabilität zweier Methoden zur Präferenzmessung (klassische Conjoint-Analyse auf Basis von Full-Profile Einschätzungen und Trade-off Matrizen). Die Probanden wurden im Rahmen einer empirischen Studie zu zwei verschiedenen Zeitpunkten gebeten, an der Befragung teilzunehmen. Die Studien fanden in einem Abstand von 7-10 Tagen statt. Zur Auswertung wurden die Ränge der untersuchten Stimuli mit Hilfe des Spearman-Rang-Korrelationskoeffizienten untersucht. Beide Methoden wiesen eine relativ hohe Reliabilität auf, wenngleich diese bei Full-Profile Einschätzungen tendenziell höher war.884 Bei der Einschätzung der Reliabilität über die Zeit kann allerdings der Unterschied, 880

Für einen Überblick verschiedener Studien siehe Bateson; Reibstein; Boulding (1987), 462ff.

881

Alternativ zählen Bateson; Reibstein; Boulding (1987, 462) eine Änderung der Anzahl der Eigenschaften oder Ausprägungen zu den Studien, die die Reliabilität über das Attributset untersuchen. 882 Reibstein; Bateson; Boulding (1988), 284. 883 884

Vgl. Green; Srinivasan (1978), 115; Weisenfeld-Schenk (1989), 42; Melles (2001), 90. Für einen Überblick über verschiedene Studien siehe Bateson; Reibstein; Boulding (1987), 460ff. Vgl. Segal (1982), 142f.

143

der durch eine geänderte Präferenz verursacht wird, nicht separiert werden. Dies führt letztlich zu einer scheinbar geringeren Reliabilität der Messung. Zwei aufeinander folgende Messungen können zudem zu entsprechenden Lerneffekten bzw. Trotzreaktionen aufgrund von inhaltlich identischen Befragungen führen.885 Insofern fällt es schwer, die Reliabilität über die Zeit bei Studien zur Präferenzmessung zu bestimmen. Zur Einschätzung der Reliabilität stehen, analog zur Prognosevalidität, eine Vielzahl verschiedener Maße zur Verfügung, deren Anwendbarkeit zur Überprüfung der Reliabilität jedoch nicht in jedem Fall gegeben ist.886 Letztendlich lassen sich die möglichen Maßzahlen zum Reliabilitätstest auf Korrelationsmaße wie Rang-Korrelationskoeffizienten, ProduktMoment-Korrelationen und den F-Tests zusammenfassen.887 Die Ergebnisse der in der Literatur veröffentlichten Studien sind aufgrund der Nutzung verschiedener Maßzahlen nur sehr eingeschränkt bzw. nicht vergleichbar.888

3.10.3 Einschätzung der wahrgenommenen Befragungssituation

Neben der Untersuchung der Validität und Reliabilität der Schätzwerte können weitere, eher indirekt auf die Ergebnisse der Präferenzmessung wirkende Gütemaße berechnet werden. So kann der Proband gebeten werden, die Befragungssituation aus seiner Sicht einzuschätzen.889 Faktoren wie die Motivation der Befragungsteilnehmer, empfundener Informationsgehalt des Eigenschaftssets, wahrgenommene kognitive Belastung bei der Beantwortung des Fragebogens und empfundene Übersichtlichkeit der Darstellung der Aufgaben können die Ergebnisse der Präferenzmessung und die notwendige Bearbeitungsdauer einer Umfrage beeinflussen.890

885 886

Vgl. Weisenfeld-Schenk (1989), 47; Melles (2001), 90. Vgl. Reibstein; Bateson; Boulding (1988), 272; Bateson; Reibstein; Boulding (1987), 457ff.

887

Für einen Überblick und eine Diskussion verschiedener Maße siehe Green; Srinivasan (1990, 12). Beide Ansätze zur Überprüfung der Reliabilität sind u.U. mit erheblichen Problemen verbunden. So ist der F-Test nur anwendbar, wenn die Fehlervarianz zwischen den beiden Messungen vergleichbar groß ist. 888 Vgl. Reibstein; Bateson; Boulding (1988), 273. Andere Methoden wie die Testhalbierungsmethode oder die Berechnung des Alpha-Koeffizienten sind nur anwendbar, wenn die Befragung in verschiedene Teile „zerlegt“ werden kann (vgl. Weisenfeld-Schenk (1989), 48). Dies ist bei Studien zur Präferenzmessung im Normalfall nicht möglich. Würden hier die Einschätzungen der Alternativen, d.h. das Erhebungsdesign geteilt, wären weniger stabile Schätzergebnisse die Folge. Möglicherweise wäre weiterhin das Erhebungsdesign nicht mehr orthogonal, so dass einige Teilnutzen gar nicht mehr geschätzt werden könnten. 889 Vgl. Hartmann; Sattler (2004), 14. 890

Vgl. Helm; Manthey; Scholl; Steiner (2003), 14; Helm; Steiner; Scholl; Manthey (2004), 9; Hartmann; Sattler (2004), 5; Johnson (1987), 264.

144

Die Ausprägungen dieser Faktoren werden durch Einflussgrößen wie: die Methode zur Präferenzmessung,891 die Präsentationsform der Stimuli (verbale vs. multimediale Beschreibung),892

-

Präferenzmessmethode

Proband

-

die kognitiven Fähigkeiten893 und Vertrautheit der gungsteilnehmer mit dem Untersuchungsobjekt,894 das Produkt- bzw. Kaufentscheidungsinvolvement895 und

-

die Eigenschaften sowie deren Ausprägungen beeinflusst.

Eigenschaftsset

-

In der folgenden Abbildung 13 werden diese Einflussgrößen sowie eine mögliche Operationalisierung dargestellt. Motivation der Befragungsteilnehmer

1. Wie empfanden Sie die Befragung? 2. Wie viel Spaß hat Ihnen die Befragung gemacht?

Empfundener Informationsgehalt

3. Waren die Ihnen zur Verfügung stehenden Informationen für die Bewertung von Laptops ausreichend? 4. Wie gut konnten Sie sich anhand der Präsentation der Eigenschaften und Ausprägungen die Entscheidungssituation in der „Realität“ vorstellen?

Wahrgenommene kognitive Belastung bei der Beantwortung Empfundene Übersichtlichkeit der Darstellung der Aufgaben

5. Wie sicher haben Sie sich bei der Bewertung der Eigenschaften und Ausprägungen gefühlt? 6. Wie schwierig haben Sie es empfunden, die Befragungsaufgabe zu bewältigen? 7. War die Darstellung der Eigenschaften und Ausprägungen verwirrend? 8. Hatten Sie das Gefühl, durch die Art der Darstellung der Eigenschaften und Ausprägungen die Fragen leichter beantworten zu können?

Abbildung 13: Fragen zur Operationalisierung der Befragungssituation beim Untersuchungsobjekt „Laptop“

Die Probanden werden direkt nach der Präferenzmessung gebeten, die Fragen anhand einer Rating-Skala einzuschätzen.896 Weiterhin kann auch die Bearbeitungszeit als Indikator für die Befragungssituation genutzt werden.897 Je länger ein Interview dauert, umso größer ist die Gefahr, dass die Motivation der

891

Vgl. Hartmann (2004), 42.

892

Die Art der Präsentation hat demnach einen Einfluss auf das Aufgaben- bzw. Task-Involvement (vgl. Ernst (2000), 103ff.; Strebinger; Hoffmann; Schweiger; Otter (2000), 55ff.). Entscheidungsträger verfügen über begrenzte kognitive Fähigkeiten bei der Einschätzung verschiedener Stimuli, die durch eine bestimmte Zahl an Eigenschaften und Ausprägungen beschrieben werden. Werden die individuelle Informationsverarbeitungskapazität überschritten, ist mit Vereinfachungsstrategien und einer geringeren Effizienz der Präferenzmessung zu rechnen (vgl. Ernst (2000), 106f.; Hartmann (2004), 46). 894 Vgl. Hartmann (2004), 45. 893

895 896 897

Vgl. Hartmann (2004), 42ff. Vgl. Helm; Manthey; Scholl; Steiner (2003), 15; Ernst (2000), 103ff.; Strebinger; Hoffmann; Schweiger; Otter (2000), 62. Vgl. Helm; Manthey; Scholl; Steiner (2003), 15; Reiners (1996), 152.

145

Befragungsteilnehmer sinkt und dies mittelbar die Validität der Präferenzmessung negativ beeinflusst.898

3.10.4 Maße zur Analyse des Entscheidungsverhaltens der Befragungsteilnehmer

Die Bewertung der präsentierten Eigenschaften und Ausprägungen auf Basis von Trade-off Entscheidungen ist eine grundlegende Voraussetzung, um die Verfahren zur Präferenzmes-

sung anwenden und deren Ergebnisse zur Ableitung produktpolitischer Entscheidungen einsetzen zu können. Die Analyse der vom Befragungsteilnehmer genutzten Bewertungsstrategien ist allerdings mit Hilfe der bisher präsentierten Gütemaße nur eingeschränkt möglich. Im Folgenden werden deshalb verschiedene Möglichkeiten präsentiert, die eine bessere Analyse der angewendeten Entscheidungsstrategien erlauben. Zur Untersuchung des Entscheidungsverhaltens der Befragungsteilnehmer können die Antworten im Rahmen der Präferenzmessung oder die Bewertungen der Referenzmethode analysiert werden. Hauptziel dieser Maßzahlen ist die Überprüfung, ob die Entscheidungsträger zur Bewertung der vorgegebenen Alternativen tatsächlich wohldefinierte Präferenzen in Form von Trade-off Entscheidungen abgeben oder eher auf Entscheidungsheuristiken zurückgreifen.

3.10.4.1 Analyse der Bewertungen im Rahmen der Referenzmethode

Die Einschätzungen bei der Bewertung der Alternativen der Referenzmethode könnten einen ersten Anhaltspunkt zur Untersuchung der vom Befragungsteilnehmer angewandten Bewertungsstrategie liefern. Kaufwahrscheinlichkeiten als Indikator für die Motivation eines Probanden

Sawtooth Software (2002, 20) schlagen zur Analyse des Entscheidungsverhaltens vor, die Kaufwahrscheinlichkeiten für verschiedene Alternativen im Rahmen einer Referenzmethode zu erheben und auf individueller Ebene zu untersuchen, wie stark der Zusammenhang zwi-

schen den für diese Alternativen geschätzte Nutzen und den Kaufwahrscheinlichkeiten ist. Wird Produktkonzepten, für die hohe Nutzen prognostiziert wurden, in der Referenzmethode eine niedrige Kaufwahrscheinlichkeit zugewiesen, könnte dies als Indiz für ein geringes In-

898

Vgl. Hartmann; Sattler (2004), 5.

146

volvement bzw. eine geringe Motivation bei der Beantwortung des Fragebogens gewertet werden.899 Die Variationsbreite der vom Probanden angegebenen Kaufwahrscheinlichkeiten kann als weiterer Indikator zur Einschätzung des Entscheidungsverhaltens dienen. Befragungsteilnehmer, die beispielsweise alle vorgegebenen Alternativen ähnlich bewerten bzw. jeweils lediglich relativ geringe Kaufwahrscheinlichkeiten angegeben haben, sollten nicht in Marktsimulationen einbezogen werden,900 da Kaufwahrscheinlichkeiten u.a. einen Indikator des „absolute level of interest in the category“901 darstellen. Vorschlag: Kaufwahrscheinlichkeiten zur Einschätzung eines Eigenschaftssets

Die Analyse der absoluten Höhe der Kaufwahrscheinlichkeiten ist aber auch deshalb wichtig, da sie möglicherweise Indizien für das Fehlen von wichtigen Informationen (fehlende relevante Eigenschaften und Ausprägungen) liefern könnte. Fehlen relevante Eigenschaften und Ausprägungen, kann man vermuten, dass die Motivation der Probanden sinkt und deshalb die Alternativen insgesamt schlechter bewertet werden.902 Weiterhin ist bei einer zu hohen Bandbreite der Eigenschaftsausprägungen (siehe Kapitel 5.7.1) eher damit zu rechnen, dass bestimmte Eigenschaftsausprägungen für die Entscheidungsträger nicht mehr akzeptabel sind. In diesen Fällen ist deshalb mit einem höheren Anteil der Alternativen zu rechnen, denen eine Kaufwahrscheinlichkeit von „0 %“ zugewiesen wird.

3.10.4.2 Analyse der Antworten während der Präferenzmessung

Höhere Bandbreiten903 der Merkmalsausprägungen haben somit vermutlich einen Einfluss auf die Einschätzung der Alternativen der Referenzmethode. Auch während der eigentlichen Präferenzmessung ist in diesen Fällen mit entsprechenden Verzerrungen bei der Bewertung der Stimuli zu rechnen. Je weiter die Bandbreiten der Eigenschaftsausprägungen sind, umso stärker muss mit dem Auftreten von Bewertungsschwellen gerechnet werden,904 die in Form von Bandbreiteneffekten die Schätzergebnisse verzerren können. 899

Letztendlich wird die Übereinstimmung zwischen der Referenzmethode, in der Kaufwahrscheinlichkeiten erhoben werden können und den Ergebnissen der Präferenzmessung bereits im Rahmen der Prognosevalidität überprüft. Auch die Variationsbreite der vom Probanden angegebenen Kaufwahrscheinlichkeiten kann dabei als Indikator zur Einschätzung des Entscheidungsverhaltens dienen. Befragungsteilnehmer, die beispielsweise alle vorgegebenen Alternativen ähnlich bewerten bzw. jeweils lediglich relativ geringe Kaufwahrscheinlichkeiten angegeben haben, sollten nicht in Marktsimulationen einbezogen werden (vgl. Sawtooth Software (2002), 20), da Kaufwahrscheinlichkeiten u.a. einen Indikator des „absolute level of interest in the category“ (Sawtooth Software (2002), 12) darstellen. 900 Vgl. Sawtooth Software (2002), 20. 901 902 903 904

Sawtooth Software (2002), 12. Vgl. Huber; McCann (1982), 332. Die Begriffe Bandbreite und Spannweite werden im Folgenden als Synonyme verwendet. Siehe Kapitel 5.7.1.

147

Wie in Kapitel 2.2 beschrieben, sind Präferenzen immer kontextabhängig. Eine Veränderung der Bandbreite eines Merkmals führt immer zu einer Veränderung des Bedeutungsgewichts dieser Eigenschaft (d.h. zu einer Veränderung der Spannweite der Teilnutzen). Diese Änderung muss, bei Unterstellung des Vektormodells,905 in einem bestimmten Verhältnis je nach Änderung der Bandbreite der Eigenschaft erfolgen. Variieren die Eigenschaftsgewichte der Merkmale nicht in einem definierten Verhältnis, so liegt ein Bandbreiteneffekt vor.906 Die praktische Nutzung der Ergebnisse der Präferenzmessung erscheint in diesen Fällen problematisch. Die Ableitung von Entscheidungen ist dann mehr oder weniger willkürlich.907 Eine Möglichkeit, die erhobenen Präferenzdaten auf Bandbreiteneffekte hin zu überprüfen, besteht in der Berechnung von Bandbreitensensitivitäten.908 Den Ausgangspunkt der Berechnung der Bandbreitensensitivitäten bildet eine lineare Nutzenfunktion909. Die Bandbreitensensitivität gibt dabei an, „inwieweit das aus Aussagen des Entscheiders abgeleitete Gewicht eines

Ziels bei einer Änderung der Bandbreite der Ausprägungen dieses Ziels der durch das Modell geforderten Änderung des Gewichts folgt“.910 Die geforderte Änderung lässt sich durch Extrapolation bzw. Interpolation der linearen Wertfunktion bestimmen. Die Voraussetzungen zur Berechnung von Bandbreitensensitivitäten sind, dass -

mit ausreichender Sicherheit angenommen werden kann, dass der Einschätzung der Ausprägungen eines zu untersuchenden Merkmals ein Vektormodell zugrunde liegt, die Ausprägungen der zu untersuchenden Eigenschaft sich auf einem metrischen Skalenniveau befinden, mindestens drei Ausprägungen je Merkmal untersucht wurden sowie die Augenscheinvalidität bei der zu untersuchenden Eigenschaft bestimmbar ist und im

-

Einzelfall vorliegt. Bestimmung von Bewertungsschwellen bei einer zu untersuchenden Eigenschaft

Mit Hilfe von Maßzahlen der Bandbreitensensitivität wird überprüft, wie stark die empirisch beobachtete und die theoretisch geforderte Änderung der Bandbreite differieren. Es kann untersucht werden, ob Bewertungsschwellen innerhalb der Ausprägungen einer Eigenschaft bei

905 906 907

Siehe Kapitel 2.6. Vgl. Sattler; Gedenk; Hensel-Börner (2002b), 954. Vgl. Sattler; Gedenk; Hensel-Börner (2002b), 954; von Nitzsch; Weber (1991), 972.

908

Vgl. von Nitzsch; Weber (1991), 971ff.; von Nitzsch; Weber (1993), 937ff.; Sattler; Gedenk; Hensel-Börner (2002b), 953ff. Die Voraussetzungen zur Berechnung von Bandbreitensensitivitäten sind, dass mit ausreichender Sicherheit angenommen werden kann, dass der Einschätzung der Ausprägungen eines zu untersuchenden Merkmals ein Vektormodell zugrunde liegt, die Ausprägungen der zu untersuchenden Eigenschaft sich auf einem metrischen Skalenniveau befinden, mindestens drei Ausprägungen je Merkmal untersucht wurden sowie die Augenscheinvalidität bei der zu untersuchenden Eigenschaft bestimmbar ist und im Einzelfall vorliegt. 909 Die Verwendung einer linearen Nutzenfunktion wird in Kapitel 5.7.1 erläutert. 910

von Nitzsch; Weber (1991), 974.

148

einem Entscheidungsträger vorhanden sind. Werden die Bandbreiten aus Konsumentensicht festgelegt, könnte man erwarten, dass weniger starke Bandbreiteneffekte auftreten.911 Problematisch an der von Nitzsch; Weber (1991, 971ff.) vorgeschlagenen Art zur Bestimmung von Bandbreitensensitivitäten ist allerdings, dass lediglich die Bandbreitensensitivität eines Attributs je Eigenschaftsset untersucht werden kann. Deshalb erscheint dieses Maß zur Einschätzung des gesamten Bewertungsverhaltens eines Entscheidungsträgers, d.h. für alle möglichen Merkmale, nicht geeignet. Vorschlag zur Bestimmung von Bewertungsschwellen

Ziel ist es, die Bandbreiten für möglichst viele Attribute zu berechnen. Zu diesem Zweck wird die Grundidee von Nitzsch; Weber (1991, 971ff.) aufgegriffen. Grundlage der Überlegungen ist deshalb, dass sich das Bedeutungsgewicht einer Eigenschaft aus den Bandbreiten der jeweils minimalen und maximalen Teilnutzen der Ausprägungen eines Attributs ergibt und Ausprägungen zwischen diesen beiden Extrempunkten einen Wert entsprechend einer linearen Wertfunktion aufweisen sollten. Dieser Zusammenhang wird in Abbildung 14 dargestellt. Es wird somit in Anlehnung an Nitzsch; Weber (1991, 971ff.) überprüft, wie stark sich die empirisch beobachtete und die theoretisch geforderte Änderung der Bandbreite unterscheiden.912 Teilnutzen 0,20 Bandbreite der Eigenschaft „Preis“ 0,2-0,1 = 0,1

Abweichung von der linearen Wertfunktion

0,15

Erwarteter Teilnutzen Abweichung von der linearen Wertfunktion

0,10

3,- Euro

4,- Euro

5,- Euro

Preis

Abbildung 14: Bestimmung der Abweichungen vom erwarteten Teilnutzen

Den Ausgangspunkt zur Berechnung der Bandbreitensensitivitäten bilden die Einschätzungen der Befragungsteilnehmer auf individueller Ebene, d.h. die Bandbreitensensitivitäten werden zunächst für jeden einzelnen Entscheider berechnet und danach aggregiert. In einem ersten

911 912

Siehe Kapitel 5.7.1. In dem dargestellten Beispiel wurden die Ausprägungen 3,- Euro, 4,- Euro und 5,- Euro des Attributs “Preis” untersucht. Als Bandbreite der Teilnutzen für die Eigenschaft „Preis“ ergibt sich hier ein Wert von „0,10“ aus den einzelnen Teilnutzen [0,20 (3,- Euro) – 0,10 (5,- Euro)]. Liegt eine lineare Wertfunktion vor, so ist als Teilnutzen der Ausprägung „4,Euro“ ein Wert von 0,15 zu erwarten. Abweichungen von diesem Wert weisen auf eine nicht-lineare Bewertungsfunktion - eben den Bandbreiteneffekt - hin.

149

Schritt wird die Bandbreite der Teilnutzen als Differenz der Teilnutzen zwischen den einzelnen Extrempunkten der Ausprägungen berechnet (in diesem Beispiel ergibt sich 0,2 – 0,1 = 0,1). Analog können die Abstände zwischen den Ausprägungen bestimmt werden - in diesem Beispiel (siehe Abbildung 14) ergibt sich eine Bandbreite der Merkmalsausprägungen von „2,- Euro“ (5,- Euro – 3,- Euro). In einem zweiten Schritt werden die relativen Abstände zwischen den Ausprägungen des untersuchten Merkmals bestimmt. In diesem Beispiel befindet die Ausprägung „4,- Euro“ genau zwischen den Ausprägungen „3,- Euro“ und „5,- Euro“. Liegt den Bewertungen des Befragungsteilnehmers eine lineare Wertfunktion zugrunde, sollte der Teilnutzen der Eigenschaftsausprägung dementsprechend genau 50% der gesamten Bandbreite plus dem Teilnutzen der am wenigsten bevorzugten Ausprägung entsprechen, d.h. in diesem Beispiel (0,10 + 0,05 =) 0,15. Dieser Wert wird im Folgenden als „erwarteter Teilnutzen“ bezeichnet. Durch einen Vergleich des erwarteten Teilnutzens mit dem tatsächlich beobachteten Teilnutzen lassen sich Abweichungen913 zu einer linearen Wertfunktion berechnen. Damit die Bandbreitensensitivität besser interpretiert und mit den Werten anderer Eigenschaften verglichen werden kann, wird in einem letzten Schritt berechnet, welchen Anteil die Abweichung an der gesamten Bandbreite der Teilnutzen einnimmt. Zur Aggregation der auf individuellem Niveau berechneten Anteile der Abweichungen kann anschließend jeweils der Mittelwert berechnet werden. Analyse der verwendeten Skalenpunkte als Indikator für das Antwortverhalten

Ein weiteres Maß zur Analyse des Entscheidungsverhaltens der Befragungsteilnehmer könnte die Analyse der Bewertungen während der Präferenzmessung darstellen. Werden beispielsweise Präferenzdaten auf einer Rating-Skala erhoben, können Häufigkeiten für die Nutzung bestimmter Skalenpunkte einen Anhaltspunkt für die vom Probanden angewendeten Entscheidungsstrategien darstellen. Bei einer zu hohen Bandbreite der Eigenschaftsausprägungen könnte man beispielsweise vermuten, dass die Befragungsteilnehmer im Vergleich zur Nutzung von relevanten Bandbreiten zu eher extremeren Bewertungen neigen. Untersuchung der Spannweite der Teilnutzen

Schweikl (1985, 135f.) und Schubert (1991, 237f.) weisen darauf hin, dass die Höhe der Validitätsmaße bei einer Studie, in der nicht die tatsächlich relevanten Eigenschaften überprüft werden, auf den ersten Blick „besser“ ausfallen kann, als bei Untersuchungen, die relevante Merkmale nutzen. Obwohl deshalb das falsch spezifizierte Modell zunächst „valider“ er913

Angenommen es wird für die Ausprägung „4,- Euro“ ein Teilnutzen von 0,12 geschätzt; in diesem Fall ergibt sich eine Abweichung von °0,15 – 0,12° = 0,03.

150

scheint, ist es nicht zur Prognose von realen Wahlentscheidungen der Entscheidungsträger geeignet. Befinden sich z.B. nicht relevante Merkmale im Attributset, so geht Schweikl (1985, 136) davon aus, dass die Spannweite der Teilnutzen extremer als bei der Untersuchung von relevanten Merkmalen verteilt ist. Auch Schubert (1991, 237) vermutet, dass die Anwendung von Entscheidungsheuristiken anhand der in der Präferenzmessung ermittelten Bedeutungsgewichte der Eigenschaften nachgewiesen werden kann. So ist bei vereinfachten Bewertungsstrategien davon auszugehen, dass wenige Merkmale ein hohes Gewicht, andere dagegen ein relativ kleines Bedeutungsgewicht aufweisen. Zur Überprüfung dieser Hypothese wurden von ihm zunächst die Bedeutungsgewichte (wm) der Eigenschaften berechnet und entsprechend der Gleichung 21 die Differenz aus der wichtigsten und unwichtigsten Eigenschaft gebildet.914 w*

max wm  min wm m

Gleichung 21

m

Im Anschluss wurden die Differenzen der Bedeutungsgewichte zwischen den verschiedenen Studien auf Mittelwertunterschiede untersucht.915 Da die berechneten Nutzengewichte neben den Einschätzungen der Befragungsteilnehmer von der Anzahl der untersuchten Eigenschaften abhängig ist, kann eine entsprechende Vorgehensweise nur dann angewendet werden, wenn die Struktur der zu untersuchenden Entscheidungssets vergleichbar ist. Zwischenfazit

Im vorangegangenen Kapitel wurden typische Gütemaße zur Einschätzung der Ergebnisse der Präferenzmessung präsentiert. Häufig beschränkt man sich bei der Einschätzung der Eignung der Schätzergebnisse auf Validitätsmaße wie die Prognosevalidität, die interne Validität, die Augenscheinvalidität und bei Methodenvergleichen auf die konvergierende Validität. Das Hauptaugenmerk liegt in praktischen Untersuchungen auf der Prognosevalidität, da sie als Maß für die Übertragbarkeit der Schätzergebnisse auf reale Wahlentscheidungen dient. Es zeigt sich jedoch, dass insbesondere die Gestaltung der Alternativen des Prognosesets das Ausmaß der Prognosegüte beeinflusst. Deshalb können zusätzlich die Befragungssituation als subjektive Einschätzung der Datenerhebung durch den Befragungsteilnehmer sowie die Bewertungen der Alternativen innerhalb der Präferenzmessung und bei der Einschätzung der Alternativen der Referenzmethode untersucht werden. Diese Gütemaße ermöglichen eine Analyse der angewendeten Bewertungsstrategie sowie eine subjektive Einschätzung der Übertragbarkeit der Ergebnisse auf reale Wahlentscheidungen.

914 915

Vgl. Schweikl (1985), 136. Vgl. Schweikl (1985), 173f. Da die berechneten Nutzengewichte neben den Einschätzungen der Befragungsteilnehmer von der Anzahl der untersuchten Eigenschaften abhängig ist, kann eine entsprechende Vorgehensweise allerdings nur dann angewendet werden, wenn die Struktur der zu untersuchenden Entscheidungssets vergleichbar ist.

151

Die Güte einer Studie zur Präferenzmessung wird, wie bereits beschrieben, von der Art der untersuchten Merkmale und deren Ausprägungen beeinflusst. Im folgenden Kapitel werden deshalb verschiedene Eigenschaftsarten beschrieben und deren Eignung innerhalb der Präferenzmessung diskutiert.

152

4 Eigenschaften und Eigenschaftsausprägungen

Die in einer Studie untersuchten Eigenschaften916 und Ausprägungen bilden die Bewertungsgrundlage aller Verfahren zur Präferenzmessung – sie nehmen somit eine zentrale

Stellung bei der Untersuchung von Konsumentenbedürfnissen ein. Ziel dieses Kapitels ist es, typische Abgrenzungskriterien zur Einordnung von Eigenschaften sowie deren Auswirkungen auf die Präferenzmessung darzustellen. Erst die Berücksichtigung dieser Faktoren ermöglicht eine systematische Bestimmung der zu untersuchenden Bewertungsdimensionen. Obwohl Eigenschaften und deren Ausprägungen den Ausgangspunkt aller Methoden zur Präferenzmessung darstellen, findet sich in der Literatur keine einheitliche Definition dieser Begriffe. Schubert (1991, 20) beschreibt Eigenschaften als Gestaltungselemente der Hersteller, die die objektive Beschaffenheit eines Produkts repräsentieren und von den Konsumenten mit Nutzenerwartungen in Verbindung gebracht werden. Demnach muss es sich um objektiv nachprüfbare Charakteristika handeln. Sehr viel weiter definiert Herrmann (1998, 138) den Begriff Merkmale, indem er sie als „das einem Ding Eigene, sein Wesen Ausmachende, ihm Zugehörende und aus ihm nur durch Abstraktion Herauslösbare“917 bezeichnet. Eigenschaften bilden demzufolge die Grundlage dafür, dass verschiedene Produkte in bestimmten Beziehungen918 zueinander stehen können; dabei beschränkt sich diese Definition nicht nur auf

objektiv nachprüfbare Eigenschaften. Auch Voeth (2000, 14) schließt die Untersuchung von subjektiv wahrgenommenen Attributen explizit nicht aus. Fischer (2001, 12) definiert im Gegensatz zu den oben genannten Autoren Eigenschaften als einem konkreten Produkt nicht zuweisbare und nicht bewertbare Beurteilungsdimensionen. Ähnlich beschreiben Keeney; Gregory (2005, 1) Eigenschaften lediglich als Maß, das

zur Einschätzung der Zielerreichung genutzt werden kann. Es kann nie eine „Wichtigkeit“ einer Eigenschaft „an sich“ bestimmt werden, diese ergibt sich vielmehr erst durch die Bandbreite der Ausprägungen.919 Im Folgenden wird eine Definition in Anlehnung an Fischer (2001, 12) und Keeney; Gregory (2005, 1) genutzt. Eigenschaften sind demnach lediglich Beurteilungskriterien, die dazu dienen, Produkte miteinander vergleichen zu können, d.h. es handelt sich um einheitliche Be916

Im Folgenden werden Begriffe wie „Kriterium“, „Attribut“, „Merkmal“, „Faktor“, „Objektdimension“ und „Charakteristikum“ als Synonym für „Eigenschaft“ verwendet (vgl. Herrmann (1998), 138; Stallmeier (1993), 31). In der betriebswirtschaftlichen Entscheidungsanalyse werden Eigenschaften teilweise als „Ziele“ bezeichnet (vgl. Klein; Scholl (2004), 325f.). 917 Herrmann (1998), 138. 918 919

Vgl. Herrmann (1998), 138. Vgl. Eisenführ; Weber (2003), 130.

153

urteilungsmaßstäbe, anhand derer die Alternativen in eine Beziehung gebracht und in Rela-

tion zueinander eingeschätzt werden können. Eigenschaften „an sich“ lassen sich keinem konkreten Produkt zuordnen, z.B. weist jedes Auto eine Farbe, eine PS-Zahl usw. auf. Deshalb können Eigenschaften „an sich“ auch nicht bewertet werden. Es ist unmöglich, die Wichtigkeit einer Eigenschaft ohne weitere Informationen zu den jeweiligen Eigenschaftsausprägungen einzuschätzen.920 Befragt man beispielsweise Probanden zum Untersuchungsobjekt „Jobangebote“ nach der Wichtigkeit der Eigenschaften „Jahresgehalt“ und „Entfernung vom Wohnort“, so werden die beiden Merkmale anhand der individuell wahrgenommenen Bandbreite von Eigenschaftsausprägungen am Markt eingeschätzt. Unterschiedliche Bewertungen ergeben sich deshalb aufgrund unterschiedlicher Erfahrungen der befragten Personen. Es kann allerdings nicht auf die generelle Wichtigkeit von Eigenschaften geschlossen werden. Gibt man den Befragungsteilnehmern jedoch eine bestimmte Bandbreite an Eigenschaftsausprägungen vor, so wird sich die Wichtigkeitseinschätzung entsprechend der vorgegebenen Ausprägungen ändern.921 Damit eine sinnvolle Einschätzung möglich ist, müssen Eigenschaften deshalb durch mindestens zwei Ausprägungen beschrieben sein.922 Erst die Eigenschaftsausprägungen der zur Verfügung stehenden Alternativen ermöglichen die Einschätzung der Beziehung verschiedener Stimuli untereinander.923 Die Definition von Herrmann (1998, 138) für den Begriff Eigenschaft bezieht sich aus diesem Grund genau genommen auf Eigenschaftsausprägungen. Eigenschaftsausprägungen werden im Folgenden als das eines Produkts Eigene definiert, das eine Einschätzung der Beziehungen der verschiedenen Alternativen erlaubt. Dies bedeutet, dass eine Änderung der Bandbreite der Ei-

genschaftsausprägungen immer mit einer Änderung der Bedeutungsgewichte der Eigenschaften einhergeht.924 Die Ergebnisse der Präferenzmessung sind infolgedessen immer nur auf (Teil-)Märkte übertragbar, bei denen die in Frage kommenden Produkte (d.h. die Alternativen im Evoked-Set) die in der Untersuchung präsentierten Ausprägungen aufweisen. Ändert sich die Bandbreite der Ausprägungen der Produkte z.B. durch am Markt eingeführte Produktinnovationen, so sind nun u.U. Eigenschaften entscheidungsrelevant, die zuvor einen geringen Einfluss auf die Kaufentscheidung ausübten. Die Bestimmung der entscheidungsrelevanten Eigenschaften kann somit nicht losgelöst von den entsprechenden Eigenschaftsausprägungen vorgenommen werden. 920

Siehe dazu die Kapitel 2.2, 4.2.6.3 und 5.2.2.1.

921

Während beispielsweise die Eigenschaft „Jahresgehalt“ bei der direkten Einschätzung als sehr wichtig eingestuft wurde, ist diese Eigenschaft weniger wichtig, wenn sich die zu bewertenden Job-Alternativen bezüglich dieser Eigenschaft in ihren Ausprägungen kaum unterscheiden. 922 Vgl. Orme (2002c), 1. 923 924

Produkte entsprechen deshalb eher Bündeln von Eigenschaftsausprägungen. Siehe Kapitel 2.2.

154

Die Gesamtheit der in eine Untersuchung aufgenommenen Eigenschaften und Ausprägungen wird im Folgenden als Eigenschaftsset bezeichnet.

4.1

Überblick verschiedener Arten und Unterscheidungsmerkmale von Eigenschaften

Die Verwendung verschiedener Arten und Unterscheidungsmerkmale von Merkmalen und Merkmalsausprägungen kann einen erheblichen Einfluss auf die Ergebnisse der Präferenzmessung ausüben. Dabei lassen sich die acht in Abbildung 15 präsentierten Eigenschaftsarten unterscheiden. Überblick über mögliche Eigenschaftsarten Informationsökonomische Eigenschaftstypologie

Objektive und subjektive Eigenschaften

Substantielle, erweiterte und generische Produkteigenschaften

Klassifizierung nach der Skala der Eigenschaftsausprägungen

Einzelne und gebündelte Eigenschaften

Natürliche, künstliche und Proxy-Merkmale

Schwelleneigenschaften, Trade-off Eigenschaften, Added-valueEigenschaften Extrinsische und intrinsische Merkmale

Abbildung 15: Überblick typischer Eigenschaftsarten

Im Folgenden werden diese verschiedenen Eigenschaftsarten vorgestellt und ihr Einfluss auf die Präferenzmessung diskutiert. Da die Unterscheidungen zwischen Schwellen- und Tradeoff Eigenschaften sowie zwischen objektiven und subjektiven Produktmerkmalen dabei einen hohen Stellenwert einnehmen, stehen diese Eigenschaftsarten im Mittelpunkt dieses Kapitels.

4.1.1 Informationsökonomische Eigenschaftstypologie

Bei der informationsökonomischen Eigenschaftstypologie werden die Eigenschaften je nach Ausmaß der Informationsasymmetrien zwischen Hersteller und Kunden klassifiziert. Man unterscheidet zwischen Sucheigenschaften (Inspektionseigenschaften, search quality), Erfahrungseigenschaften (experience quality) und Vertrauenseigenschaften (credence quality).925 Als Sucheigenschaften werden die Merkmale bezeichnet, deren Ausprägungen Konsumenten bereits vor dem Kauf einschätzen können (eine typische Sucheigenschaft ist der Preis). Die

925

Vgl. Trommsdorff (2003), 302; Höser (1998), 43f.

155

Ausprägungen von Erfahrungseigenschaften lassen sich demgegenüber erst durch den Geoder Verbrauch eines Gutes mit Sicherheit bestimmen (z.B. der Geschmack von Schokolade). Von Vertrauenseigenschaften926 spricht man, wenn die Eigenschaftsausprägungen auch nach dem Kauf nicht oder nur mit einem sehr hohen Aufwand bestimmt werden können. Der Konsument kann folglich das Vorhandensein einer vom Hersteller angegebenen Eigenschaftsausprägung nicht überprüfen (z.B. die Behandlung durch einen Arzt oder die langfristige Pflegewirkung von Zahnpasta).927 Die Methoden der Präferenzmessung wie die Conjoint-Analyse, der Analytic Hierarchy Process, die Nutzwertanalyse sowie die weiteren multiattributiven Verfahren basieren auf der Grundannahme, dass sichere Informationen vorliegen.928 Unsicherheit und Risiko können mit diesen Methoden nicht abgebildet werden.929 Insofern erscheinen Produkte, die vor allem durch Vertrauenseigenschaften beschrieben werden, für die Präferenzmessung weniger geeignet. Auch bei Produktinnovationen mit einem hohen Anteil an relevanten Erfahrungseigenschaften scheinen Verfahren der Präferenzmessung dann ungeeignet, wenn es sich um Ausprägungen handelt, die die Konsumenten aufgrund ihres bisherigen Vorwissens noch nicht mit Sicherheit einschätzen können. Ähnliches gilt für Dienstleistungen, bei diesen Gütern sind Schwankungen bezüglich der tatsächlichen Ausprägungen u.U. nicht ausgeschlossen, sie sind demnach mit einer gewissen Unsicherheit verbunden. Bei Sucheigenschaften ist demgegenüber nicht mit Problemen zu rechnen.930

4.1.2 Extrinsische und intrinsische Merkmale Intrinsische Eigenschaften bezeichnen physische bzw. funktionale Merkmale wie beispiels-

weise Geschmack, Geruch und die Funktionalität eines Produktes. Eine Veränderung der Eigenschaftsausprägungen führt somit auch immer zu einer Veränderung des Produktes. Im Gegensatz dazu besteht zwischen den extrinsischen Merkmalen und der Funktionalität eines Produkts kein direkter Zusammenhang. Diese Eigenschaften dienen dem Konsumenten je926

Heitmann; Herrmann (2005, 231f.) bezeichnen Vertrauenseigenschaften als „irrelevante Informationen“. Weil der Entscheider die Nutzenstiftung der Ausprägungen dieser Eigenschaften nicht überprüfen kann, gehen sie davon aus, dass diese Merkmale keinen Einfluss auf die Wahlentscheidungen ausüben. Relevant für die Produkteinschätzung sind aber nicht unbedingt die objektiv vorhandenen, sondern die vom Kunden wahrgenommenen Nutzenelemente, so dass auch Vertrauenseigenschaften einen Einfluss auf die Kaufentscheidung ausüben können (siehe dazu Kapitel 4.1.8). 927 Vgl. Trommsdorff (2003), 302; Satzinger; Helm (2000), 237. 928

Vgl. Klein; Scholl (2004), 325f.; Nitschke; Völckner (2006), 745ff.

929

Reale Kaufentscheidungen werden vom wahrgenommenen Risiko und den individuellen Präferenzen beeinflusst. Im Rahmen von empirischen Studien wird allerdings das Risiko ausgeblendet, so dass Wahlentscheidungen hier allein auf die Präferenzen des Befragungsteilnehmers zurückgeführt werden (vgl. Parker; Schneider (1988), 277f.). Die Messung der Präferenzen muss daher immer unter Sicherheit erfolgen. Unsicherheit und Risiko könnten demnach lediglich a posteriori, z.B. durch Gewichtung der ermittelten Präferenzwerte, berücksichtigt werden; für einen ersten Ansatz siehe Nitschke; Völckner (2006, 745ff.). 930 Vgl. Nitschke; Völckner (2006), 745, 755.

156

doch als Indikator für die Qualität. Beispiele für solche Eigenschaften sind die Marke, der Preis und das Herkunftsland,931 Testurteile aber auch Qualitätssiegel oder Geld-zurückGarantien.932 Können die Entscheidungsträger die Produktalternativen aufgrund fehlender Erfahrungen nicht eindeutig anhand der intrinsischen Merkmale beurteilen, spielen extrinsische Eigenschaften eine größere Rolle. Die Nutzung von extrinsischen bzw. intrinsischen Eigenschaften ist daher vom Vorwissen der Entscheidungsträger in dem betreffenden Produktbereich und von der Komplexität der Alternativenbewertung abhängig.933 Im Folgenden werden die Auswirkungen bei der Nutzung extrinsischer und intrinsischer Merkmale bei der Präferenzmessung beschrieben. Die Bedeutung extrinsischer Merkmale bei der Präferenzmessung

Extrinsische Eigenschaften können bei den Konsumenten verschiedene Assoziationen und damit unterschiedliche Nutzenerwartungen auslösen und zur Vereinfachung von Produktwahlentscheidungen herangezogen werden. Diese Eigenschaften dienen bei der Bewertung von verschiedenen Produktalternativen als Surrogat für andere Qualitäts- und Leistungsmerkmale.934 Im Folgenden wird die Eignung solcher Produktdimensionen für die Untersu-

chung im Rahmen der Präferenzmessung diskutiert. Der Preis als Eigenschaft

Der Preis ist bei vielen Produktgruppen eine Schlüsseleigenschaft für die Prognose des Wahlverhaltens von Konsumenten.935 Produktpreise umfassen zwei Effekte. Zum einen wird von den Entscheidungsträgern ein hoher Preis negativ eingeschätzt; er stellt daher eine monetäre Restriktion dar (Allokationseffekt). Andererseits verbinden die Käufer mit den Produkten, die einen höheren Preis aufweisen, oftmals eine höhere Leistung bzw. eine höhere Qualität (Informationseffekt des Preises).936 Innerhalb der Präferenzmessung wird der Gesamtpreiseffekt erhoben, der aus diesen beiden Einzeleffekten besteht und ebenfalls in realen Kaufent-

scheidungen die Produktwahl determiniert.937 931

Vgl. Gierl; Satzinger (2000), 262; Böcker; Helm (2003), 152.

932

Vgl. Green; Wind (1975), 109. Satzinger; Helm (2000, 236) bezeichnen die extrinsischen Attribute auch als “immaterielle Eigenschaften”. 933 Vgl. Böcker; Helm (2003), 152f.; Gierl; Satzinger (2000), 271ff. 934

Solche Eigenschaften rufen unterschiedliche Assoziationen bei den Entscheidungsträgern hervor, die auf individuellen Erfahrungen und Vorstellungen beruhen. Sie werden deshalb auch als „enriched attributes“ bezeichnet. Merkmale, die dagegen tendenziell eindeutiger interpretierbar sind, könnten als „comparable attributes“ beschrieben werden (vgl. Nowlis; Simonson (1997), 207f.). 935 Vgl. Reibstein; Bateson; Boulding (1988), 275; Hair; Anderson; Tatham; Black (1998), 407; Diller (2000), 203. 936

Vgl. Huber; Wittink; Johnson (1992), 2, 5; Völckner (2005), 1f.; Völckner; Sattler (2005b), 1; Sattler; Rao (1997), 1286; Schubert (1991), 26; Cattin; Wittink (1982), 52; Rao (2004), 389; Johnson (2001), 3; Hensel-Börner (2000), 70; Hair; Anderson; Tatham; Black (1998), 407; Völckner (2006), 474. Für ein Beispiel einer solchen Preis-Qualitäts-Irradiation siehe Balderjahn (1993), 110. 937 Vgl. Völckner; Sattler (2005b), 1.

157

Informations- und Allokationseffekt variieren je nach Produktgruppe. Völckner (2005, 21f.) untersuchte die Einflussfaktoren auf die Bedeutung des Informationseffekts des Preises. Sie konnte dabei bestätigen, dass insbesondere bei Bewertungssituationen, in denen nicht mit Trade-off Entscheidungen der einzelnen Leistungsmerkmale zu rechnen ist, der Informationseffekt bei Kaufentscheidungen eine wichtige Rolle spielt.938 Bei vielen Konsumgütern ist verstärkt mit der Anwendung von vereinfachten Entscheidungsheuristiken zu rechnen, so dass bei Produkten dieser Gruppe verstärkt mit Auswirkungen des Informationseffektes zu rechnen ist.939 Viele Methoden der Präferenzmessung sind allein für solche Entscheidungssituationen geeignet, in denen die Befragungsteilnehmer einen Trade-off der verschiedenen Eigenschaften sowie deren Ausprägungen vornehmen. Bei Trade-off Entscheidungen verringert sich durch die Berücksichtigung mehrerer Eigenschaften der Informationseffekt des Preises und damit häufig auch die Bedeutung dieses Merkmals, d.h. die Präferenzmessverfahren tendieren dazu, im Vergleich zu realen Entscheidungen den Allokationseffekt des Preises stärker und den Informationseffekt weniger zu gewichten.940 Verzerrte Teilnutzen und ein tendenziell zu hohes Bedeutungsgewicht sind für die Eigenschaft „Preis“ dann zu erwarten, wenn durch das untersuchte Eigenschaftsset Preis-QualitätsIrradiationen hervorgerufen werden. Diese sind wahrscheinlich, wenn das Entscheidungsproblem nicht vollständig beschrieben wurde und die Entscheidungsträger deshalb versuchen, anhand der Höhe der Ausprägungen des Merkmals „Preis“ auf Ausprägungen nicht beschriebener Qualitätsmerkmale zu schließen.941 Ferner ist bei der Berücksichtigung der Eigenschaft „Preis“ stärker als bei anderen Merkmalen mit Interaktionseffekten zu rechnen, die die Schätzung der Teilnutzen verzerren können. Insbesondere zwischen dem Preis und weiteren Qualitätsmerkmalen könnten solche Interak-

938

Dies ist insbesondere der Fall, wenn die Konsumenten Entscheidungsheuristiken zur Produktwahl nutzen, da z.B. ein Abwägen der jeweiligen Ausprägungen der Leistungsdimensionen für die Konsumenten zu komplex ist, diese mehr nach Exklusivität streben oder im Gegensatz dazu die Produkte für die Käufer nur eine geringe Relevanz besitzen (vgl. Völckner (2005), 21f.). 939 Vgl. Huber; Wittink; Johnson (1992), 2, 5, 8. 940

Vgl. Huber; Wittink; Johnson (1992), 6. Eine bei Konsumgütern weniger verzerrte Schätzung des Informationseffekts lassen möglicherweise wahlbasierte Methoden wie die Choice-Based Conjoint zu. Diese beruhen auf einfachen Einschätzungen der Befragungsteilnehmer, die keine tiefe Verarbeitung der vorgegebenen Informationen voraussetzen (vgl. Huber; Wittink; Johnson (1992), 6; Völckner; Sattler (2005b), 2ff.). Auch diese Verfahren zur Präferenzmessung beruhen allerdings auf einer linearen Nutzenfunktion, die lediglich bei Trade-off Entscheidungen angewendet werden kann. 941 Vgl. Hair; Anderson; Tatham; Black (1998), 407; Melles (2001), 38. Siehe dazu insbesondere Kapitel 4.2.1.

158

tionen auftreten.942 Eine Berücksichtigung des Attributs „Preis“ kann zudem dazu führen, dass der Entscheidungsträger möglicherweise unrealistische Alternativen bewerten muss.943 Zusammenfassend kann geschlussfolgert werden, dass Präferenzmessmethoden den Informationseffekt des Preises bei Konsumgütern tendenziell eher untergewichten. Mit einer Verzerrung der Schätzergebnisse ist deshalb vor allem bei Produkten zu rechnen, bei denen in realen Entscheidungssituationen kein Trade-off der jeweiligen Eigenschaften sowie deren Ausprägungen stattfinden würde, sondern einfache Entscheidungsheuristiken angewendet werden. Eigenschaften, die zur Vereinfachung der Kaufentscheidung dienen Marken, aber auch Attribute wie das Herkunftsland, Gütezeichen usw. dienen zur Vereinfachung von Kaufentscheidungsprozessen; sie sind sozusagen ein „Sammelbegriff“ für eine

Menge von Eigenschaftsausprägungen verschiedener Merkmale.944 Sie bewirken, dass andere Produktmerkmale, die bei der Bewertung eine Rolle spielen, nicht mehr explizit betrachtet werden, da der Entscheidungsträger diese mit einer bestimmten Marke verbindet. Mit der Wahrnehmung einer Marke erfolgt eine automatische gedankliche Vervollständigung anderer Informationen über die jeweilige Alternative. Dies hat zur Folge, dass u.U. kein vollständiger Trade-off sämtlicher Produktmerkmale stattfindet und einige Eigenschaften nicht mehr berücksichtigt werden.945 Überdies ist durch die Nutzung der Marke als eine Eigenschaft nicht ausgeschlossen, dass dieses extrinsische Merkmal die Wahrnehmung anderer Merkmalsausprägungen einer Alternative beeinflusst.946 Innerhalb der Conjoint-Analyse bzw. anderen Verfahren zur Präferenzmessung werden den Befragungsteilnehmern die relevanten Leistungsdimensionen übersichtlicher als bei realen Kaufentscheidungen präsentiert. Durch diese Darstellung, die eine einfachere und systematischere Wahrnehmung der Stimuli bzw. der einzelnen Merkmale sowie deren Ausprägungen erlaubt, werden bei Präferenzmessverfahren die in realen Bewertungssituationen typischen Assoziationen von einer bestimmten Marke weitgehend entkoppelt.947 Es kann daher davon ausgegangen werden, dass die geschätzten Teilnutzen der Eigenschaft „Marke“ tendenziell

942

Vgl. Hair; Anderson; Tatham; Black (1998), 407.

943

Dies kann wiederum der Fall sein, wenn die Ausprägung des Merkmals „Preis“ sehr hoch ist und andere Merkmale eine eher weniger präferierte Ausprägung aufweisen (vgl. Hair; Anderson; Tatham; Black (1998), 407). Siehe auch Kapitel 4.2.3.2. 944 Vgl. Schweikl (1985), 141; Cattin; Wittink (1982), 52. 945 946 947

Vgl. Kemper (2000), 18; Huber; Wittink; Johnson (1992), 1. Schweikl (1985, 141) verzichtet deshalb in einer empirischen Studie auf dieses Merkmal. Vgl. Satzinger; Helm (2000), 236. Dieser, im Vergleich zu realen Entscheidungen, verzerrende Effekt könnte gemildert werden, indem nicht verbale Beschreibungen, sondern bei der Untersuchung von Konsumgütern verstärkt multimediale Darstellungsformen oder virtuelle Prototypen zur Präsentation der Stimuli genutzt werden (siehe Kapitel 3.5).

159

geringer als in der Realität sind.948 Bei einer Analyse des Entscheidungsverhaltens von Befragungsteilnehmern wird dieser Effekt beispielsweise von Johnson; Orme (1996, 9-15) beobachtet. Der „Marke“ wird in ersten Befragungsphasen der Conjoint-Analyse oftmals ein höherer Einfluss auf die Entscheidung zugewiesen, während Eigenschaften wie „Preis“ bzw. andere Leistungsmerkmale erst im Laufe der Datenerhebung an Bedeutung gewinnen949 und folglich der Einfluss der „Marke“ auf die Präferenz sinkt. Der Einfluss der „Marke“ ist jedoch sehr stark von dem jeweiligen Untersuchungsgegenstand abhängig. So ist bei Konsumgütern davon auszugehen, dass die Marke einen erheblichen

Einfluss auf die Produktwahl ausübt. Bei Gebrauchsgütern ist bei den Bewertungen dagegen eher mit einem stärkeren Trade-off der verschiedenen Eigenschaften und deren Ausprägungen zu rechnen, so dass der Einfluss der Marke tendenziell geringer ist. Insofern sind Präferenzmessverfahren geeignet, den Einfluss der Ausprägungen für die Eigenschaft „Marke“ bei Gebrauchsgütern zu erfassen. Soll demgegenüber der Einfluss des Attributs Marke bei Konsumgütern untersucht werden, sind Präferenzmessmethoden, die auf einfachen Wahlentscheidungen beruhen, vorzuziehen.950 Testurteile als Untersuchungsmerkmale Testurteile in Zeitschriften und Magazinen haben häufig einen erheblichen Einfluss auf

Kaufentscheidungen.951 Deren Einfluss kann ebenfalls innerhalb von Studien zur Präferenzmessung untersucht werden; es handelt sich dabei letztlich ähnlich wie bei der Eigenschaft „Marke“ um Sammelbegriffe für die Leistungsfähigkeit bzw. die Qualität eines Produkts.952 Testurteile erscheinen jedoch als Eigenschaft im Attributset der Conjoint-Analyse ungeeignet, da es ein aggregiertes Maß für sämtliche Leistungsmerkmale einer Produktalternative ist. Die für das Testurteil geschätzten Teilnutzenwerte lassen sich außerdem nicht auf bestimmte Merkmalsausprägungen eines Produkts zurückführen. Die Methoden zur Präferenzmessung setzen zudem eine freie Kombinierbarkeit der Eigenschaftsausprägungen verschiedener Merkmale voraus.953 Dies ist bei Testurteilen nicht gegeben, da sie direkt von den Leistungsmerkmalen eines Produkts abhängen.954 Testurteile erscheinen somit nicht zur Präferenzmessung geeignet, wenn gleichzeitig Leistungsmerkmale 948 949 950 951 952 953 954

Vgl. Huber; Wittink; Johnson (1992), 3, 5. Vgl. Johnson; Orme (1996), 9ff. Vgl. Huber; Wittink; Johnson (1992), 6, 8. Vgl. Huber; Wittink; Johnson (1992), 6. Für ein Beispiel zur Nutzung von Testurteilen siehe Green; Wind (1975, 109), der ein Qualitätssiegel in einer ConjointAnalyse nutzt. Siehe dazu Kapitel 4.2.3.2. So erscheint es nicht sinnvoll, dass z.B. innerhalb der Conjoint-Analyse ein Stimulus aus relativ schlechten Eigenschaftsausprägungen besteht, jedoch bezüglich des Merkmals “Testurteil” eine vorteilhafte Bewertung aufweist.

160

untersucht werden. Testurteile können aber in die Untersuchung aufgenommen werden, wenn keine weiteren Leistungsmerkmale untersucht und der Einfluss eines Gütezeichens bestimmt werden soll. Zwischenfazit zu den Besonderheiten ausgewählter Eigenschaften Zusammenfassend kann festgestellt werden, dass Eigenschaften wie Preis und Marke, teil-

weise ebenfalls die Verpackung, insbesondere bei Konsumgütern eine außerordentlich wichtige Rolle spielen. Im Gegensatz dazu wirken Veränderungen der Ausprägungen anderer Merkmale relativ insensitiv auf die Präferenz der Konsumenten. Die Bewertung von Stimuli bzw. die Einschätzung einzelner Eigenschaften und Ausprägungen innerhalb von Studien zur Präferenzmessung verändert oft die mit einer Eigenschaft verbundenen Assoziationen. Funktionale Aspekte werden bei Konsumgütern im Rahmen von Studien zur Präferenzmessung tendenziell stärker als bei realen Entscheidungen berücksichtigt, während Qualitätsindikatoren wie Preis und Marke vermutlich eher untergewichtet werden.955 Bei Gebrauchsgütern ist damit zu rechnen, dass neben Qualitätsindikatoren wie „Preis“ und „Marke“ auch andere Merkmalsdimensionen einen entscheidenden Einfluss auf die Wahlentscheidung haben. Die Bedeutung der Attribute „Preis“ und „Marke“ ist dementsprechend bei realen Kaufentscheidungen meist niedriger als bei Konsumgütern. Die relevante Informationsmenge ist meist größer und wird vom Probanden eher anhand von Trade-off Bewertungsstrategien eingeschätzt. Dies entspricht weitgehend der Vorgehensweise, die die Verfahren zur Präferenzmessung voraussetzen.956 Johnson; Orme (1996, 15) fordern deshalb, dass die Art der Präferenzmessung und die nötige Anzahl der Einschätzungen dem jeweiligen Untersuchungsobjekt bzw. dem vermuteten realen Entscheidungsverhalten der Befragungsteilnehmer beim Kauf eines Produktes dieser Gütergruppe möglichst entsprechen sollte. Ist vor allem mit Impulskäufen zu rechnen, so sollte die Anzahl der Bewertungsaufgaben z.B. im Rahmen einer Choice-Based Conjoint-Analyse

möglichst gering gehalten werden. Je mehr Bewertungsaufgaben vom Probanden bewältigt werden, desto mehr ist mit Trade-off Entscheidungen zu rechnen. Trade-offs entsprechen jedoch einem Entscheidungsverhalten, dass insbesondere bei Gütern mit einem hohen Produktinvolvement während der Kaufentscheidung zu erwarten ist.957 Auch die Art der angewendeten Präferenzmessmethode hat einen Einfluss auf die Wichtigkeitseinschätzungen der Eigenschaften „Preis“ und „Marke“. Forciert die Präferenzmessmethode die Anwendung von Trade-off Entscheidungen, ist mit einem geringeren Einfluss dieser Eigenschaften zu rechnen, 955 956 957

Vgl. Huber; Wittink; Johnson (1992), 6. Vgl. Huber; Wittink; Johnson (1992), 6f. Vgl. Johnson; Orme (1996), 15

161

während bei der Anwendung der Choice-Based Conjoint-Analyse verstärkt mit der Anwendung von Entscheidungsheuristiken und damit mit höheren Bedeutungsgewichten für die Eigenschaften „Marke“ und „Preis“ zu rechnen ist. Die Anwendung der Choice-Based ConjointAnalyse führt daher bei Produkten, bei denen in realen Entscheidungssituationen mit Tradeoff Entscheidungen zu rechnen ist, eher zu verzerrten Schätzergebnissen.958

4.1.3 Qualitative und quantitative Eigenschaften

Man kann Eigenschaften auch nach dem Skalenniveau ihrer Ausprägungen differenzieren. Dabei unterscheidet man zwischen quantitativen und qualitativen959 bzw. zwischen nominalen, ordinalen und quantitativen Eigenschaften960 (siehe Abbildung 16). Eigenschaften je nach Skalenart der Ausprägungen qualitativ nominal

quantitativ ordinal

Abbildung 16: Überblick qualitativer und quantitativer Eigenschaftsarten

Im Rahmen der Präferenzmessung können alle in Abbildung 16 beschriebenen Eigenschaftsarten berücksichtigt werden. Insbesondere bei nominal skalierten bzw. qualitativen Eigenschaften ergeben sich verschiedene Besonderheiten. Bei nominal skalierten Eigenschaften können die Ausprägungen a priori in keine sinnvolle Reihenfolge der Vorziehenswürdigkeit gebracht werden,961 so dass bei diesen Merkmalen keine Maßzahlen zur Untersuchung der Augenscheinvalidität962 berechnet werden können. Zudem kann bei nominal skalierten Ausprägungen der Eigenschaften lediglich das Teilnutzenmodell unterstellt werden.963 Bei ordinal skalierten bzw. quantitativen Merkmalen ist es demgegenüber oft möglich, die Ausprägungen vor einer Studie in eine vermutete Reihenfolge entsprechend der Vorziehenswürdigkeit zu bringen. Dies gilt jedoch nur, wenn der Bewertung der Entscheidungsträger ein Vektormodell zugrunde liegt. Ist bei ordinalen oder quantitativen

958

Vgl. Huber; Wittink; Johnson (1992), 6; Sawtooth Software (1999), 5.

959

Vgl. Huber (1974), 1398; Reiners (1996), 50f. Siehe auch Quack (1980, 25), der zwischen kategorialen (qualitativen) und kontinuierlichen (quantitativen) Eigenschaften unterscheidet. 960 Vgl. Orme (2002c), 1. 961 962 963

Vgl. Orme (2002c), 1. Siehe Kapitel 3.10.1.1. Vgl. Reiners (1996), 50f.

162

Attributen stattdessen mit dem Vorliegen eines Idealpunktmodells zu rechnen, können die Ausprägungen a priori nicht in eine eindeutige Rangfolge gebracht werden.964 Teilweise wird davon ausgegangen, dass die Skalenart der Ausprägungen den Schwierigkeitsgrad der Einschätzungen eines Befragungsteilnehmers beeinflusst. So wurde in verschiedenen Studien beobachtet, dass Merkmale mit quantitativen Ausprägungen bei vergleichenden Einschätzungen mindestens zweier Alternativen tendenziell einfacher zu bewerten sind.965 Bei zu geringem Vorwissen über das Untersuchungsobjekt nutzen die Entscheidungsträger deshalb bei der Untersuchung von qualitativen Merkmalen eher „all or-nothing“966-Heuristiken. Während Eigenschaften wie „Festplattenkapazität“ und deren Ausprägungen (z.B. „40 GB“, „60 GB“ und „80 GB“) für einen Probanden relativ einfach einzuschätzen sind, fällt es ihm u.U. schwer, Eigenschaften wie „WLAN“ oder „Firewire“ (jeweils mit den Ausprägungen „vorhanden“ bzw. „nicht vorhanden“) zu bewerten. Möglicherweise wählt er in diesen Fällen deshalb einfach eine Alternative, die möglichst viele vorhandene Ausprägungen aufweist (und damit die teuerste Alternative) oder er entscheidet sich für das preiswerteste Notebook, welches gleichzeitig die wenigsten vorhandenen Ausprägungen besitzt.967 Notwendige Grundvoraussetzung, um überhaupt Präferenzen von Entscheidungsträgern sinnvoll erfassen zu können, ist jedoch die Nutzung von Trade-off Strategien zur Bewertung von Alternativen. Bei der Bestimmung des zu untersuchenden Eigenschaftssets muss sichergestellt werden, dass die Befragungsteilnehmer unabhängig von der Skala der Ausprägungen sämtliche Eigenschaften einschätzen können.968 Auf diese und weitere Aspekte wird gesondert in den Kapiteln 5.7 sowie 6.1.2 eingegangen.

4.1.4 Schwelleneigenschaften, Trade-off Eigenschaften und Added-value Eigenschaften

Westwood; Lunn; Beazley (1974, 237f.) schlagen eine Unterscheidung zwischen Schwelleneigenschaften (Threshold Features), Trade-off Attributen und Added-value Merkmalen vor. Bei Schwelleneigenschaften überprüft der Entscheidungsträger im Rahmen eines nichtkompensatorischen Entscheidungsprozesses, ob die jeweilige Ausprägung einer Alternative 964

Ein Beispiel dafür ist die Eigenschaft „Temperatur“ beim Untersuchungsobjekt Kaffee. Die Ausprägungen werden auf einer quantitativen Skala in °C beschrieben und liegen damit auf metrischem Skalenniveau vor. Die Ausprägungen können entsprechend der numerischen Werte in eine Rangfolge gebracht werden. Bei der Eigenschaft „Temperatur“ des Kaffees kann man jedoch davon ausgehen, dass ein Idealpunktmodell vorliegt, d.h. der Kaffee sollte nicht zu heiß, aber auch nicht zu kalt sein. Beträgt die von einem Entscheidungsträger als ideal empfundene Trinktemperatur beispielsweise 40°C, so können die Ausprägungen 30°C oder 50°C a priori nicht in eine sinnvolle Präferenzrangfolge gebracht werden. 965 Vgl. Nowlis; Simonson (1997), 205ff.; Heitmann; Herrmann (2006), 231. 966 967 968

Heitmann; Herrmann (2006), 231. Vgl. Heitmann; Herrmann (2006), 231. Siehe dazu Kapitel 4.2.6, 4.1.8, 2, und 6.

163

den individuellen Mindestanforderungen entspricht. Ist dies nicht der Fall, wird dieses Produkt abgelehnt und nicht weiter bewertet. Ist das geforderte Mindestniveau bei allen Schwelleneigenschaften erreicht, wird eine Alternative akzeptiert, die Eigenschaft jedoch nicht weiter im Entscheidungsprozess berücksichtigt. Bei Trade-off Merkmalen handelt es sich um für die letztendliche Wahlentscheidung „central features“.969 Da es unwahrscheinlich ist, dass es ein Produkt gibt, das bezüglich aller Eigenschaften die vom Entscheidungsträger präferierte Ausprägung aufweist, ist dabei ein Trade-off der einzelnen Merkmale notwendig. Added-value Merkmale spielen dann eine Rolle, wenn sich die im Evoked-Set befindlichen

Alternativen bezüglich der Ausprägungen der Trade-off Merkmale kaum unterscheiden. Während Trade-off-Attribute u.U. den Grundnutzen eines Produkts befriedigen, handelt es sich bei den Added-value Eigenschaften dagegen um „non-central features“, die zur Funktion des Produkts nicht unbedingt notwendig sind, aber die Kaufwahrscheinlichkeit beeinflussen können.970 Einordnung der Eigenschaften in die Phasen des Kaufentscheidungsprozesses

Um die Relevanz dieser Gruppierung der Merkmale zu erkennen, ist es notwendig, diese mit dem Kaufentscheidungsprozess und damit mit den vom Nachfrager angewendeten Bewertungsstrategien in Verbindung zu bringen. In Abbildung 17 werden die Beziehungen zwischen diesen einzelnen Elementen präsentiert.971

969

Westwood; Lunn; Beazley (1974), 237.

970

Vgl. Westwood; Lunn; Beazley (1974), 237. Eine ähnliche Einteilung erfolgt beim Kano-Modell der Kundenzufriedenheit (vgl. Bailom; Hinterhuber; Matzler; Sauerwein (1996), 117). Dabei werden die Eigenschaften in die drei Kategorien „Basisanforderungen“, „Leistungsanforderungen“ und „Begeisterungsanforderungen“ gegliedert. Basisanforderungen beschreiben Mindestausprägungen bestimmter Eigenschaften und entsprechen somit den „Schwelleneigenschaften“. Diese müssen erfüllt werden, da sonst mit extremer Unzufriedenheit des Kunden zu rechnen ist. Werden die Mindestanforderungen erreicht, so führt dies nicht zu einer höheren Zufriedenheit, da sie als gegeben vorausgesetzt werden. Basisanforderungen sind meist nicht salient. Differenzierungsmöglichkeiten ergeben für einen Hersteller nur, wenn er den Kundennutzen entscheidend steigern kann. Bei Leistungsanforderungen ist ein Ansteigen der Kundenzufriedenheit proportional zu der Erfüllung, d.h. einer Veränderung der Ausprägungen, zu erwarten. Es handelt sich um Eigenschaften, die vom Entscheidungsträger beim Kauf explizit berücksichtigt werden. Auch Begeisterungseigenschaften haben u.U. einen großen Einfluss auf die Kundenzufriedenheit. Sie werden von den Entscheidungsträgern, die sich nicht gerade im Kaufentscheidungsprozess befinden, jedoch nicht explizit erwartet (vgl. Bailom; Hinterhuber; Matzler; Sauerwein (1996), 118). Basisanforderungen haben, analog zu den Schwelleneigenschaften, auf die letztendliche Entscheidung keinen Einfluss, da im Evoked-Set lediglich Alternativen berücksichtigt werden, die alle Mindestanforderungen erfüllen. In die Präferenzmessung sollten deshalb vor allem Leistungsanforderungen und Begeisterungsanforderungen aufgenommen werden. Da Begeisterungsanforderungen nicht ohne weiteres vom Kunden erwartet werden, ist bei der Festlegung der zu untersuchenden Eigenschaften auf Basis von Kundenurteilen darauf zu achten, dass die Befragungsteilnehmer zunächst einen extensiven Informationssuchprozess durchlaufen haben. Griffin; Hauser (1993, 4) unterteilt deshalb die Eigenschaften in “basic needs”, “articulated needs“ und „exciting needs“. „Basic needs“ entsprechen den Grundanforderungen, „articulated needs“ sind einfach durch Befragung zu erheben und haben Einfluss auf die Zufriedenheit. Es handelt sich dabei um Trade-off Eigenschaften. „Exciting needs“ können, wie Added-value Eigenschaften, nicht ohne weiteres erhoben werden, da Konsumenten diese Ausprägungen vor einer Informationssuche typischerweise nicht kennen. 971 Dabei wird lediglich der Teil des Kaufentscheidungsprozesses dargestellt, bei dem die Alternativen dem Entscheidungsträger bekannt sind und er diese einschätzen kann.

164

Schwelleneigenschaften Phase im Kaufentscheidungsprozess

ProcessedSet

Trade-off Eigenschaften

Evoked-Set

Added-value Eigenschaften

Entscheidung

Hold-Set Inept-Set

Art der angewendeten Bewertungsstrategie

nicht kompensatorische Entscheidungsstrategien

Trade-off Bewertungen

Präferenzmessung

Abbildung 17: Relevanz von Eigenschaftsarten im Kaufentscheidungsprozess

Eine solche Darstellung (Abbildung 17) ist neu, aber zwingend notwendig, um die relevanten Eigenschaften und Ausprägungen überhaupt bestimmen zu können. Für die Präferenzmessung können daher nur Trade-off Eigenschaften und Added-value Merkmale relevant sein. Zudem wird anhand dieser Darstellung deutlich, dass der Entscheidungsträger die Phasen der Informationssuche und –bewertung im Rahmen des Kaufentscheidungsprozesses durchlaufen haben muss, um die Trade-off Merkmale und die Added-value Eigenschaften bestimmen zu können, da diese auf Basis des individuellen Evoked-Set ermittelt werden. Vorschlag zur Anpassung der Begriffsdefinitionen

In dieser Arbeit wird die Grundidee von Westwood; Lunn; Beazley (1974, 237f.) aufgegriffen und vor dem Hintergrund, dass Präferenzen immer kontextabhängig sind, präzisiert. Dies bedeutet, dass Eigenschaften nicht „von sich aus“ den Schwelleneigenschaften, Trade-off Eigenschaften oder Added-value Eigenschaften zugeordnet werden können, sondern die untersuchten Merkmalsausprägungen die Einordnung bestimmen. Dies bedeutet, dass eine Eigenschaft je nach betrachteten Merkmalsausprägungen im Extremfall alle drei Merkmalsarten repräsentiert. Beispielsweise könnte ein Nachfrager, der einen Laptop kaufen möchte, zunächst festlegen, dass der Preis nicht höher als 1600.- Euro sein darf. Das Attribut „Preis“ dient somit in dieser Phase der Selektion akzeptabler Alternativen als Schwelleneigenschaft. In diesem Beispiel könnten die aus Sicht des Entscheidungsträgers als akzeptabel angesehenen Notebooks bezüglich der Eigenschaft „Preis“ eine Bandbreite von 1200.- bis 1600.- aufweisen. Wird dieser Unterschied der Ausprägungen als präferenzrelevant wahrgenommen, d.h. hat er einen Einfluss auf die letztendliche Wahlentscheidung, so handelt es sich bei dem Merkmal „Preis“ in dieser konkreten Entscheidungssituation um eine Trade-off Eigenschaft. Andererseits kann ein Entscheider fordern, dass sämtliche akzeptablen Laptops über drei oder mehr USB2Schnittstellen verfügen; es handelt sich deshalb bei diesem Merkmal um eine Schwelleneigenschaft. Weisen beispielsweise alle Produkte im Evoked-Set des Nachfragers drei USB2Schnittstellen auf, so besitzt diese Eigenschaft keinerlei Unterscheidungskraft mehr und wird 165

in der folgenden Trade-off Phase nicht weiter berücksichtigt.972 Die Einordnung in die verschiedenen Merkmalsarten ist somit von den jeweils betrachteten Bandbreiten der Ausprägungen abhängig. Zusammenfassend kann festgestellt werden, dass Schwelleneigenschaften aufgrund einer bestimmten Bandbreite der Ausprägungen nicht-kompensatorische Bewertungsstrategien verursachen und deshalb nicht zur Berücksichtigung im Rahmen der Präferenzmessung geeignet sind. Dies bedeutet allerdings auch, dass während des Kaufentscheidungsprozesses unterschiedliche Merkmale relevant sind - so ist davon auszugehen, dass in den frühen Phasen

des Kaufentscheidungsprozesses (z.B. zur Einteilung der Alternativen in das Evoked-, Holdund Inept-Set) andere Eigenschaften und insbesondere andere Bandbreiten (Schwelleneigenschaften) als bei einem späteren Trade-off der im Evoked-Set aufgenommenen Produkte zur Bewertung (Trade-off und Added-value Eigenschaften) herangezogen werden. Eine Methode zur Bestimmung der Eigenschaften und Ausprägungen muss deshalb sicherstellen, dass in der Präferenzmessung lediglich Merkmale untersucht werden, die der Entscheider in der Phase des Trade-offs der Alternativen im Evoked-Set nutzt. In dieser Phase sind die Trade-off Eigenschaften bzw. wenn diese keine ausreichende Unterscheidungskraft aufweisen die Added-value Merkmale zu berücksichtigen. Eine Unterscheidung zwischen Trade-off Eigenschaften und Added-value Merkmalen spielt dabei keine Rolle, da beide auf Basis von Trade-off Einschätzungen bewertet werden können. Hierbei ist es jedoch bei Added-value Attributen besonders wichtig, dass der befragte Entscheider die Phasen der Informationssuche und –bewertung im Kaufentscheidungsprozess durchlaufen hat, da er diese Eigenschaften sonst u.U. gar nicht wahrgenommen hat und deshalb keine stabilen Bewertungen möglich wären.

4.1.5 Natürliche, künstliche und Proxy-Merkmale

In der Entscheidungsanalyse wird häufig zwischen natürlichen, künstlichen (bzw. konstruierten) und Proxy-Eigenschaften unterschieden.973 Als „natürliche“ Merkmale werden diejenigen Attribute bezeichnet, bei denen dem Entscheidungsträger eindeutig klar ist, welche Eigenschaft gemeint ist, diese allgemein gebräuchlich sind und die Ausprägungen von verschiedenen Entscheidungsträgern ähnlich interpretiert 972

Auch wenn sich die Ausprägungen in dieser Phase unterscheiden, z.B. einige Laptops drei und andere vier USB2Schnittstellen besitzen, so bedeutet dies nicht, dass diese Eigenschaft in einer Trade-off Situation weiter berücksichtigt wird. Nimmt ein Entscheidungsträger den Nutzenunterschied, den eine zusätzliche USB2-Schnittstelle stiftet, als nicht relevant wahr, so wird dieses Merkmal in der Trade-off Bewertungsphase keine Rolle spielen (siehe dazu Kapitel 4.2.6.4). 973 Vgl. Eisenführ; Weber (2003), 67.

166

werden.974 Ein typisches Beispiel für ein natürliches Attribut sind die „Kosten in Dollar“. Natürliche Eigenschaften können meist gezählt oder physisch gemessen werden.975 Können zur Bewertung keine natürlichen Eigenschaften genutzt werden, besteht die Möglichkeit, dass ein Entscheidungsträger „künstliche“ bzw. konstruierte Merkmale aus verschiedenen Einzelmerkmalen generiert.976 Ein Beispiel für eine künstliche Eigenschaft ist das Merkmal „Angst“. Für dieses Attribut kann nicht ohne weiteres ein natürliches Merkmal bestimmt werden. Die konstruierte Eigenschaft könnte so aus einer Reihe von weiteren Merkmalen, wie beispielsweise dem „Blutdruck“ oder dem „Verhalten“ ermittelt werden. Ein weiteres Beispiel ist der „Dow Jones“-Index als ein Indikator für die Marktentwicklung, der aus verschiedenen Aktien-Einzelwerten gebildet werden kann. Konstruierte Eigenschaften sind insbesondere dann sinnvoll, wenn die Entscheidungsträger, wie beispielsweise beim Dow Jones Index, die Nutzung des Indikators gewöhnt sind und sie verschiedene Ausprägungen leicht interpretieren können.977 Stehen weder natürliche noch künstliche Eigenschaften zur Verfügung, können ProxyEigenschaften zur Bewertung verschiedener Alternativen genutzt werden. Proxy-Merkmale

sind den natürlichen Eigenschaften insofern ähnlich, da sie auf einer natürlichen Skala gezählt oder gemessen werden können, das Ziel wird jedoch (im Beispiel der Präferenzmessung die Präferenz) nicht direkt beeinflusst. Will ein Unternehmen beispielsweise einen Indikator für die Qualität seiner Produkte bilden, so könnte man die Proxy-Eigenschaft „Anzahl der zurückgegebenen Produkte“ wählen. Da nur die Konsumenten berücksichtigt werden, die so stark von dem Produkt enttäuscht waren, dass sie es zurückgegeben haben, misst dieses Merkmal nur indirekt die Qualität. Kunden, die zwar von dem Produkt enttäuscht sind, es aber nicht zurückgegeben haben, werden nicht erfasst. Proxy-Attribute sind deshalb weniger „informativ“ als natürliche oder künstliche Merkmale.978 Keeney; Gregory (2005, 7) empfehlen bei der Festlegung der zu untersuchenden Eigenschaftsart ein stufenweises Vorgehen. Die Bewertung verschiedener Alternativen sollte möglichst auf natürlichen Attributen beruhen. Wenn verschiedene Eigenschaften die Bewertung

974 975 976

Vgl. Keeney; Gregory (2005), 2; Eisenführ; Weber (2003), 67. Vgl. Keeney; Gregory (2005), 2. Vgl. Keeney; Gregory (2005), 2; Eisenführ; Weber (2003), 67.

977

Vgl. Keeney; Gregory (2005), 2. Auch im Rahmen von Studien zur Präferenzmessung im Marketing wurden bereits künstliche Merkmale genutzt. Siehe als Beispiele u.a. Swoboda (2000, 155), bei dem die Ausprägungen der Eigenschaft „Zusatzleistungen“ als Index aus verschiedenen Einzelleistungen gebildet wurde bzw. Perrey (1998, 176f.), der übergeordnete Benefit-Eigenschaften (siehe Kapitel 4.1.8) durch eine Reihe von Beispielen für objektive Merkmalsausprägungen bildet. Ein weiteres praktisches Beispiel für künstliche Eigenschaften sind die Bezeichnungen für bestimmte Ausstattungspakete bei Automobilen (z.B. „Sport-Line“, „Comfort-Line“, „Premium-Line“ usw.), die für ein Bündel verschiedener objektiver Merkmale stehen und so die Beurteilung der Alternativen erleichtern sollen. 978 Vgl. Keeney; Gregory (2005), 2.

167

beeinflussen, können „Compound Attributes“979 oder künstliche Eigenschaften gebildet werden. Erst wenn keine natürlichen oder künstlichen Eigenschaften genutzt werden können, sollten Proxy-Attribute zur Einschätzung der Alternativen eingesetzt werden.

4.1.6 Einzelne und gebündelte Eigenschaften

Die Einteilung in einzelne sowie gebündelte Eigenschaften980 entspricht weitgehend der Grundidee der Unterteilung in natürliche und konstruierte Eigenschaften. In beiden Fällen, den konstruierten und den gebündelten Merkmalen, werden verschiedene Einzelattribute zu einer übergeordneten Eigenschaft zusammengefasst. Während jedoch bei den konstruierten Eigenschaften als Ausprägung ein Index mit einem bestimmten Punktwert als Ausprägung gebildet wird, werden die gebündelten Eigenschaften durch eine vollständige Kombination der Einzelausprägungen beschrieben. Diese neu gebildeten Merkmale bezeichnet man auch

als Superattribute, Compound-Attribute oder Composite-Attribute.981 Die Anzahl der Ausprägungen des Superattributs wird durch die Anzahl der Einzeleigenschaften und deren Ausprägungen bestimmt. Wird beispielsweise ein Compound-Attribut aus zwei Merkmalen mit jeweils 2 Ausprägungen gebildet, so weist dieses gebündelte Merkmal 2*2 = 4 Ausprägungen auf. Bei jeweils 3 Ausprägungen der ursprünglichen Merkmale besitzt das Compound-Attribut 9 Ausprägungen. Die Zahl der Ausprägungen des Superattributs kann deshalb je nach Anzahl der jeweiligen ursprünglichen Eigenschaften und Ausprägungen sehr stark ansteigen. Wird eine höhere Anzahl an Ausprägungen untersucht, erhöht sich die Befragungsdauer der Präferenzmessung und es ist verstärkt mit Ermüdungserscheinungen der Entscheidungsträger zu rechnen.982 Ein weiterer Nachteil gebündelter Merkmale ist, dass die Teilnutzen der ursprünglich einzelnen Ausprägungen nicht mehr getrennt geschätzt, sondern lediglich die Präferenzen für Ausprägungskombinationen berücksichtigt werden. Werden die Präferenzen der Konsumenten dagegen vor allem gemessen, um später Marktsimulationen durchzuführen, ist die Nutzung von Superattributen nicht nachteilig, da alle relevanten Kombinationen an Ausprägungen analysiert werden können.983 Gebündelte Eigenschaften sind dann sinnvoll einsetzbar, wenn Verzerrungen durch Interaktionseffekte zwischen bestimmten Merkmalen bzw. unrealistische Stimuli vermieden wer-

979 980 981 982 983

Siehe Kapitel 4.1.6. Die Bildung von gebündelten Eigenschaften geht auf einen Vorschlag von Green; Srinivasan (1978, 107) zurück. Siehe dazu Kapitel 4.2.3.1.1, 4.2.3.2 und Agarwal (1988), 56. Vgl. Johnson; Olberts (1996), 3. Vgl. Orme (2002c), 3.

168

den sollen.984 Die Anwendung von Superattributen ist somit insbesondere dann empfehlenswert, wenn die Präferenzen mit Hilfe einer Methode gemessen werden sollen, bei der sonst keine Interaktionseffekte berücksichtigt werden könnten.985

4.1.7 Substantielle, erweiterte und generische Produkteigenschaften

Kotler (1974, 415) ordnet Produkte je nach betrachteten Eigenschaftsarten in drei verschiedene Ebenen der substantiellen, erweiterten und generischen Produkte ein. Substantielle Produkte bezeichnen demnach alle objektiv nachweisbaren technisch-konstruktiven sowie physisch-chemischen Eigenschaften.986 Beispiele für solche Eigenschaften sind das Material, die Verpackung, die Marke und das Gewicht. Das erweiterte Produkt umfasst neben den substantiellen Eigenschaften alle Zusatzdienstleistungen wie Garantie- oder Finanzierungsdienstleistungen,987 Bedienungsanleitungen, Lieferservices usw. So wird dem Kunden nicht nur ein einzelnes Produkt, sondern ein entsprechendes System zur Problemlösung angeboten.988 Der generische Produktbegriff bezieht sich im Gegensatz zu dem substantiellen und erweiterten

Produkt nicht auf die chemischen und physischen Eigenschaften, sondern auf den „eigentlichen, essentiellen Nutzen“.989 Es sind nicht die substantiellen und erweiterten Produktmerkmale, die ein Kunde kauft, sondern vielmehr der damit verbundene Nutzen. Die Vermittlung entsprechender Nutzenvorstellungen über Produkte sollte demnach im Mittelpunkt einer Marketing-Strategie stehen. Eine Frau kauft beispielsweise einen Lippenstift nicht wegen seiner physischen und chemischen Eigenschaften, sondern sie kauft „Schönheit“. Hersteller sollten ihre Produkte aus Sicht der Kunden betrachten, die nicht objektive Eigenschaften, sondern Nutzen kaufen.990 In Tabelle 12 wird die von Kotler (1974, 415) vorgeschlagene Systematisierung zusammengefasst.

984 985 986 987 988 989 990

Siehe dazu die Kapitel 4.2.3.1.1 und 4.2.3.2. Vgl. Agarwal (1988), 56. Vgl. Schubert (1991), 20. Vgl. Schubert (1991), 20. Vgl. Kotler (1974), 415f. Kotler (1974), 416. Vgl. Kotler (1974), 416.

169

991

Beispiel EDV

Einordnung der Merkmale

Substantielle Erweiterte Produktmerkmale Produktmerkmale Speicherkapazität Instandhaltung Rechenleistung Programmierdienste objektive Merkmale

Generische Produktmerkmale Informationsverarbeitung Nutzen

Tabelle 12: Systematisierung von Eigenschaften nach Kotler (1974, 415)

Eine vergleichbare Einteilung der Eigenschaftsarten wird auch im Kapitel 4.1.8 genutzt. Deshalb wird die Eignung der verschiedenen Eigenschaftsarten im folgenden Abschnitt diskutiert.

4.1.8 Objektive und subjektive Eigenschaften

Neben den bisher beschriebenen Gruppierungsmöglichkeiten kann bei der Untersuchung der Merkmalsart weiterhin zwischen objektiven und subjektiven Eigenschaften unterschieden werden. Die Ausprägungen objektiver Eigenschaften beschreiben die „physikalischchemisch-technische Beschaffenheit“992 eines Produkts. Diese sind nach Herrmann (1998, 31) direkt beobachtbar, objektiv messbar und weisen eine endliche Zahl an diskreten Ausprägungen auf.993 Dabei kann man zwischen physischen und ökonomischen objektiven Eigenschaften unterscheiden (siehe Abbildung 18). Ein Beispiel für eine physische Eigenschaft bei einem Auto ist die „PS-Zahl“, das für ein ökonomisches Merkmal der „Preis“.994 Objektive Eigenschaften Physische Eigenschaften - PS-Zahl - Farbe

Ökonomische Eigenschaften - Preis

Abbildung 18: Einteilung objektiver Eigenschaften

Bei der Verwendung von subjektiven Eigenschaften werden dem Probanden dagegen direkt subjektive Interpretationsmöglichkeiten der objektiven Merkmale vorgegeben.995 Beispiele für subjektive Eigenschaftsausprägungen sind ein „Auto mit einer eleganten Form“996 oder ein Shampoo mit „good cleaning“ 997 Wirkung.

991 992 993 994 995 996 997

In Anlehnung an Kotler (1974), 416. Herrmann (1998) ,31. Siehe auch Lefkoff-Hagius; Mason (1993), 101, Reiners (1996), 47f. Vgl. Hammann; Erichson (1994), 327; Höser (1998), 108. Vgl. Reiners (1996), 47. Reiners (1996), 47. Lefkoff-Hagius; Mason (1993), 105.

170

Einteilung der Eigenschaften in Characteristics, Benefits und Imagery

Myers; Shocker (1981, 214) schlagen eine genauere Systematisierung der Eigenschaften vor, die zwischen „Characteristics“, „Benefits“ und „Imagery“ unterscheidet. Zu den objektiven Eigenschaften (Characteristics) zählen die Autoren „physical characteristics“ und „pseudophysical characteristics“. Die Ausprägungen der „physical chraracteristics“ sind dadurch gekennzeichnet, dass sie auf einer Art „physical scale“ messbar sind. Beispiele für „physical characteristics“ sind die Temperatur, die Farbintensität und Geldeinheiten. „Pseudo physical characteristics“ zählen zwar ebenfalls zu der Eigenschaftsart der “Characteristics“, die Aus-

prägungen dieser Eigenschaft können aber nicht auf einer bestimmten Skala gemessen werden. Allerdings ist sichergestellt, dass die Ausprägungen der „pseudo physical chraracteristics“ von den Konsumenten und Herstellern gleich wahrgenommen werden. Als Beispiele nennen Myers; Shocker (1981, 213) die „starke Würze“, ein „rauchiger Geschmack“, „hohe Cremigkeit“ usw. von Speisen (siehe Abbildung 19).

Characteristics Physical Characteristics - Temparatur - Geldeinheiten - Farbintensität

Pseudo physical Characteristics - „starke Würze“ - „rauchiger Geschmack“

Abbildung 19: Einteilung der objektiven Eigenschaften nach Myers; Shocker (1981, 213)

Die Einteilung von Myers; Shocker (1981, 213f.) wurde in den folgenden Jahren von einer Vielzahl von Autoren998 aufgegriffen und deren Bedeutung für die Präferenzmessung diskutiert. Dabei wurde diese Klassifizierung in modifizierter Form übernommen. Sämtliche Autoren verzichten beispielsweise auf eine Unterscheidung zwischen „physical characteristics“ und „pseudo physical characteristics“ bei den objektiven Merkmalen. Selbst Myers; Shocker (1981, 216f.) weisen darauf hin, dass eine eindeutige Einordnung der Eigenschaften mit der von ihnen vorgeschlagenen Klassifizierung nicht immer möglich ist. Eine klarere Abgrenzung nutzt deshalb Schubert (1991, 31ff.), der „Characteristics“ als Eigenschaften bezeichnet, deren Ausprägungen mittels objektiver Methoden (Messverfahren) überprüfbar sind. Dazu zählt er sämtliche Eigenschaften, „die einem Hersteller für die Gestaltung der (physischen) Produkte zur Verfügung stehen, unabhängig davon, ob sie wahrnehm-

998

Siehe Lefkoff-Hagius; Mason (1993), 101; Creusen; Schoormans (1997), 82; Reiners (1996), 48; Louviere; Woodworth (1988), 52; Schubert (1991), 30ff.; Perrey (1998), 46ff.

171

bar (Farbe) oder latent (Vitamingehalt) und ob sie konkret (Design) oder abstrakt (Angabe des Vitamingehalts auf der Verpackung sind“.999 Subjektive Eigenschaften wie Benefits und Imagery sind nach Schubert (1991, 32) das Re-

sultat der Produktwahrnehmung und –beurteilung durch die potenziellen Käufer eines Produkts. Die Basis für die Wahrnehmung und Bewertung sind frühere Erfahrungen aus Wahrnehmungs- und Lernprozessen. Subjektive Nutzenerwartungen werden auf Grundlage dieses Vorwissens mit objektiven Eigenschaftsausprägungen verknüpft. Benefits bezeichnet Schubert (1991, 32) wie Myers; Shocker (1981, 213f.) als subjektive Nutzenerwartungen an ein Produkt. Zu dieser Eigenschaftsart zählen Myers; Shocker (1981, 213) beispielsweise ein „gutes“ Design, ein „haltbares“ Produkt sowie ein Produkt mit einem „guten“ Geschmack.1000 Imagery-Eigenschaften werden analog zu Myers; Shocker (1981, 213f.) als Vorstellungen

der Konsumenten über sich selbst bezeichnet, die durch die Produktnutzung hervorgerufen werden. Sie beschreiben, was eine bestimmte Eigenschaftsausprägung einer Produktalternative über den Verwender aussagt. Imagery Eigenschaften werden vor allem durch Werbung vermittelt und besitzen keinen direkten Bezug zu dem Produkt.1001 In Abbildung 20 werden die Eigenschaftsarten im Überblick dargestellt.1002 Objektive Eigenschaften Characteristics

Subjektive Eigenschaften Benefits

Imagery

Definition

objektive (physikalisch, chemische) Eigenschaften des Produkts

subjektive, funktionale Nutzenerwartungen

symbolischer Nutzen, der sich durch die Zugehörigkeit zu einer sozialen Gruppe ergibt

Beispiel

3 Liter pro 100 km

„geringe laufende Benzinkosten“

Zugehörigkeit zur Gruppe „ökologisch bewusster Menschen“

Produktbezug

Produktbezug

Personenbezug

(am Merkmal Benzinverbrauch bei einem Auto)

Hervorgerufen durch

Abbildung 20: Eigenschaftseinteilung nach Myers; Shocker (1981), 214

Eignung der Eigenschaftsarten zur Analyse im Rahmen der Präferenzmessung

Autoren wie Hammann; Erichson (1994, 327), Berekoven; Eckert; Ellenrieder (2001, 282), Höser (1998, 108), Böcker (1986, 564) sowie Mengen (1993, 84) gehen davon aus, dass in-

999

Schubert (1991), 32. In der Literatur zur Einstellungsmessung wird eine ähnliche Einteilung vorgenommen, hier wird zwischen denotativen und konnotativen Produktmerkmalen unterschieden. Während denotative Eigenschaften direkt beobachtbar sind, stehen konnotative Merkmale für eine „metaphorische“ Bedeutung wie beispielsweise ein „sexy“ Pullover (vgl. Quack (1980), 24f.). Konnotative Attribute sind folglich mit den Imagery Eigenschaften vergleichbar. 1000 Vgl. auch Jaccard; Brinberg; Ackerman (1986), 265. 1001 1002

172

Vgl. Myers; Shocker (1981), 213. Die in diesem Beispiel vorgestellten Eigenschaftsausprägungen verdeutlichen, dass zwischen den drei Eigenschaftsarten enge Beziehungen bestehen. So hat der objektive Benzinverbrauch von „3 Liter je 100 km“ einen direkten Einfluss auf die „geringen laufenden Benzinkosten“ sowie auf das „Zugehörigkeitsgefühl zu einer Gruppe ökologisch bewusster Menschen“.

nerhalb von Conjoint-Analysen lediglich objektive Eigenschaften untersucht werden können. Als Vorteil wird bei der Nutzung von objektiven Eigenschaften vermutet, dass diese von den Probanden relativ ähnlich wahrgenommen werden.1003 Zudem lassen die Ergebnisse der Präferenzmessung so von den entsprechenden Produktmanagern und Ingenieuren leichter in reale Produkte umsetzen.1004 Deshalb werden sie ebenfalls als „actionable attributes“1005 bezeichnet.1006 Produkte werden von den Kunden allerdings neben objektiven Eigenschaften ebenfalls anhand von subjektiven Merkmalen bewertet. Lefkoff-Hagius; Mason (1993, 102f.) vermuten sogar, dass objektive Eigenschaften weniger als subjektive Merkmale geeignet sind, innerhalb der Präferenzmessung eingesetzt zu werden.1007 Sie begründen diese Schlussfolgerung am Beispiel eines Kopfschmerzmittels. Nicht die objektive, chemische Zusammensetzung des Präparates ist für einen Konsumenten nutzenstiftend und damit kaufentscheidungsrelevant, sondern dessen „schnelle Wirkung“.1008 Insofern könnte man davon ausgehen, dass bei bestimmten Produktgruppen nicht die objektiven Merkmale die Auswahlentscheidung determinieren, sondern die subjektiven Eigenschaften einen engeren Zusammenhang zur Präferenz besitzen.1009 Die Nutzung subjektiver Produktmerkmale erscheint zudem insbesondere dann sinnvoll, wenn Präferenzen für sehr komplexe Untersuchungsobjekte erhoben werden sollen. Subjektive Eigenschaften können dabei (analog zu konstruierten Attributen1010) als Sammelbegriff für eine Vielzahl objektiver Eigenschaften dienen.1011 Auch in frühen Phasen der Konzeptent-

1003

Vgl. Huber (1975), 290; Schubert (1991), 178; Mengen (1993), 84.

1004

Siehe Melles (2001), 34; Reiners (1996), 47f., Lefkoff-Hagius; Mason (1993), 101; Reiners (1996), 47; Vriens (1995), 30; Albrecht (2000), 21. Dieser Begriff geht auf Shocker; Srinivasan (1974, 925) zurück. Siehe diesbezüglich auch Schweikl (1985), 96; LefkoffHagius; Mason (1993), 101; Melles (2001), 34; Huber (1975), 290. 1006 Problematisch bei der Nutzung objektiver Attribute ist jedoch, dass nicht in jedem Fall davon ausgegangen werden kann, dass den Konsumenten der Zusammenhang zwischen den Eigenschaftsarten bewusst ist. Dies bedeutet, dass der Entscheider auf Basis seines Vorwissens in der Lage sein muss, anhand der objektiven Eigenschaftsausprägungen Nutzenvorstellungen (Benefits) abzuleiten (vgl. Lefkoff-Hagius; Mason (1993), 102). Bei objektiven Eigenschaftsausprägungen überlässt man es dem Probanden, die Nutzenstiftung selbst zu bestimmen, während diese bei subjektiven Eigenschaften explizit vorgegeben wird. 1007 Creusen; Schoormans (1997) und Lefkoff-Hagius; Mason (1993) untersuchen in verschiedenen Studien, welche Eigenschaftsarten im Rahmen von Präferenzentscheidungen genutzt werden. Anhand der Ergebnisse der Untersuchungen kann geschlussfolgert werden, dass die Konsumenten im Rahmen von Präferenzstatements die Alternativen eher auf Basis von Benefits einschätzen. Characteristics spielen dagegen bei Ähnlichkeitseinschätzungen eine tendenziell wichtigere Rolle. Siehe dazu auch Melles (2001), 34; Reiners (1996), 49f.; Wilkie; Pessemier (1973), 429; Albers (1989), 188. 1008 Vgl. Lefkoff-Hagius; Mason (1993), 102f. Siehe analog auch Reiners (1996), 47. 1005

1009 1010 1011

Vgl. Lefkoff-Hagius; Mason (1993), 102. Siehe dazu ebenfalls Gutsche; Herrmann; Kressmann; Algesheimer (2005), 638ff.; Melles (2001), 34; Albers (2000), 357. Siehe Kapitel 4.1.5. Ein Beispiel dafür sind „good living-conditions“ (Helm; Manthey; Scholl; Steiner (2003), 3) in einer Universitätsstadt.

173

wicklung können subjektive Eigenschaften genutzt werden, um zunächst ein bestimmtes Nutzen- oder Imageprofil zu konzipieren.1012 Gegen eine Anwendung von subjektiven Eigenschaften spricht u.U., dass nicht gewährleistet ist, dass die in einer Studie vom Marktforscher vorgegebenen subjektiven Eigenschaftsausprägungen von allen Probanden gleichartig wahrgenommen werden,1013 da die Interpretation der subjektiven Attribute von den bisherigen Produkterfahrungen des jeweiligen Entscheidungsträgers abhängt.1014 Entsprechendes gilt allerdings auch für die objektiven Merkmale, auch bei dieser Merkmalsart ist nicht gewährleistet, dass die Probanden gleichartige Nutzenvorstellungen auf Basis der objektiven Merkmale ableiten.1015 Die Probanden müssen vielmehr über ein ausreichendes Vorwissen verfügen, um anhand der objektiven Eigenschaften überhaupt Nutzenerwartungen ableiten zu können. Je nach bisherigen Produkterfahrungen werden mit den objektiven Eigenschaften deshalb unterschiedliche subjektive Eigenschaften sowie Ausprägungen verbunden. Es ist deshalb keine eindeutige Transformation von Characteristics in Benefits bzw. von Benefits in Characteristics auf aggregierter Ebene möglich, d.h. es kann keine, für alle Entscheider gültige Transformationsfunktion aufgestellt werden.1016 Vielmehr kann eine objektive Eigenschaft bei verschiedenen Befragungsteilnehmern unterschiedliche Nutzenvorstellungen hervorrufen, während ein bestimmter Nutzen ebenfalls durch mehrere objektive Merkmale beeinflusst werden kann (siehe Abbildung 21).1017

1012 1013 1014 1015 1016

Vgl. Schubert (1991), 179. Vgl. Schweikl (1985), 96. Vgl. Schubert (1991), 32. Vgl. Reiners (1996), 49.

Allerdings gibt es in der Literatur immer wieder Versuche, eine solche Transformationsfunktion aufzustellen, siehe dazu Hartmann (2004), 13; Myers; Shocker (1981), 231f.; Myers (1976), 23ff.; Shocker; Srinivasan (1979a), 162f. Schließlich können auch Methoden wie der Value-Tree (vgl. Goodwin; Wright (2000), 19f.), Laddering-Interviews und der Benefit-Chain Ansatz (siehe Kapitel 5.3.3) zumindest erste Hinweise zur Transformation von Eigenschaftsarten liefern. 1017 Dieser Aspekt wurde erstmals von Helm, Steiner (2006, 13ff.) beschrieben. Eine Transformation auf aggregierter Ebene wäre lediglich denkbar, wenn die Wahrnehmungen der Konsumenten bezüglich der Produkte weitgehend homogen sind, z.B. objektive Eigenschaften immer ähnliche Wahrnehmungen und Nutzenvorstellungen hervorrufen (vgl. Albers (1989), 193; Albers (2000), 358). Ein solcher Fall ist allerdings äußerst unwahrscheinlich, weshalb es unmöglich erscheint, eine eindeutige Transformationsfunktion auf aggregierter Ebene zu erstellen (vgl. Schweikl (1985), 96; Green (1975), 28; Shocker; Srinivasan (1979a), 14. Siehe analog Albrecht (2000), 21; Albers (1989), 193f.). Dies gilt insbesondere weil, wie beschrieben, die Verbindungen zwischen Characteristics und Benefits vom individuellen Vorwissen bzw. den individuellen Erfahrungen der Befragungsteilnehmer determiniert werden.

174

Objektive Eigenschaft (Characteristics) Ausprägung: 150 PS

Gewicht des Autos Fahrwerk

Subjektive Eigenschaft (Benefits) Ausprägung: Starke Beschleunigung Verbrauch Zugkraft

Abbildung 21: Mögliche Assoziationen eines Probanden bezüglich objektiver und subjektiver Eigenschaften sowie deren Ausprägungen (Quelle: Helm, Steiner (2006), 14)

Es könnte jedoch auf individueller Ebene eine Transformationsfunktion zwischen Benefits und objektiven Attributen erstellt werden. Eine Möglichkeit schlagen Helm; Manthey; Scholl; Steiner (2002, 16) im Rahmen einer empirischen Studie zum Untersuchungsobjekt „Wahl eines Studienorts“ vor. Dabei wurden neben den zu bewertenden Stimuli auch verschiedene reale Alternativen von den Probanden anhand von subjektiven Merkmalen eingeschätzt. Diese realen Universitäten könnten im Folgenden als Referenzpunkt genutzt werden, um die jeweils der Beurteilung zugrunde liegenden objektiven Merkmale zu bestimmen.1018 Die Nutzung von Benefits ist daher im Rahmen von Verfahren zur Präferenzmessung möglich, da die Ergebnisse durch Nutzung individueller Transformationsfunktionen in reale Produkte umgesetzt werden können.1019 Reiners (1996, 48) geht davon aus, dass innerhalb von Conjoint-Analysen theoretisch alle drei Eigenschaftsarten (Characteristics“, „Benefits“ und „Imagery“) untersucht werden können. Lefkoff-Hagius; Mason (1993, 104, 108) weisen dagegen auf erhebliche Probleme bei der Einbeziehung von „Imagery“-Merkmalen hin. Da diese personenbezogen sind, können sie nicht primär durch die Produktgestaltung beeinflusst werden. Ein Einbezug dieser Eigenschaftsart erscheint deshalb nicht ratsam. Zusammenfassend erscheint somit lediglich die Untersuchung objektiver Eigenschaften und die von Benefits möglich.1020 Um die bisherige praktische Relevanz der verschiedenen Eigenschaftsarten zu bestimmen, untersuchte Schubert (1991, 306 ff.) in einer umfangreichen Meta-Studie 128 Studien, die eine Variante der Conjoint-Analyse nutzen. Dabei wurden in keinem Fall Imagery-Attribute 1018

Eine ähnliche Vorgehensweise nutzen Dichtl; Schobert (1979, 30); dabei allerdings zur Verbindung von subjektiven Ähnlichkeitsurteilen mit objektiven Produkteigenschaften. Alternativ könnte eine Transformationsfunktion auch vom Marktforscher vorgegeben werden. Dabei handelt es sich letztendlich um „künstliche“ Eigenschaften (siehe Kapitel 4.1.5), d.h. um einen vom Marktforscher verbal beschriebenen Index verschiedener objektiver Merkmale. Der Zusammenhang zwischen den verbalen Beschreibungen und den objektiven Ausprägungen könnte durch entsprechende multimediale Beispiele (z.B. Videosequenzen), Bilder, Erfahrungsberichte usw. im Rahmen eines Warm-up Tasks (siehe Kapitel 6.2.3) dargestellt werden. 1020 Bei der praktischen Anwendung plädieren Reiners (1996, 96) und Albrecht (2000, 33) dafür, dass ausschließlich objektive bzw. von den subjektiven Eigenschaften lediglich die Merkmale innerhalb der Präferenzmessung untersucht werden, die leicht in objektive Merkmale zu übertragen sind. Durch die von Helm; Manthey; Scholl; Steiner (2002, 16) vorgeschlagene Vorgehensweise können allerdings auch subjektive Nutzenvorstellungen mit den objektiven Eigenschaften und Ausprägungen in Zusammenhang gebracht und produktpolitische Entscheidungen abgeleitet werden. 1019

175

verwendet. Characteristics sind bei dieser Meta-Studie die Eigenschaftsart, die am häufigsten eingesetzt wird (77,3 % nutzten diese). In nur 1,6 % der Fälle wurden ausschließlich Benefits eingeschätzt. Eine Kombination aus Characteristics und Benefits wurde jedoch immerhin in 18,0% der betrachteten Studien untersucht.1021 Benefits spielen somit zwar als alleinige Eigenschaftsart kaum eine Rolle, ihnen kommt dagegen in Verbindung mit Characteristics eine erhebliche Bedeutung zu.1022 Es stellt sich deshalb die Frage, welche der beiden potenziell möglichen Eigenschaftsarten (objektive Merkmals bzw. Benefits) in der Präferenzmessung untersucht werden sollte. Da die Bedeutung der Eigenschaftsarten sehr stark von dem jeweiligen Untersuchungsobjekt abhängt, erscheint eine allgemein gültige Antwort unmöglich.1023 Die Relevanz einer Eigenschaftsart variiert vielmehr je nach Produkttyp. Die Ergebnisse der Meta-Studie von Helm; Steiner (2006, 12) weisen allerdings nicht auf einen systematischen Zusammenhang zwischen Produkt- und der verwendeten Merkmalsart hin. Diese Beobachtung gilt jedoch nur, weil die Eigenschaften und Ausprägungen derzeit bei vielen wissenschaftlichen Studien zur Präferenzmessung durch den Marktforscher selbst und in lediglich 8% der Fälle allein durch die potenziellen Nachfrager bestimmt werden bzw. in 20% Experten- und Konsumentenbefragungen kombiniert wurden.1024 Indem die Marktforscher bzw. Experten die Eigenschaften und Ausprägungen bestimmen, legen sie gleichzeitig die in der Präferenzmessung verwendete Eigenschaftsart fest. Die in der Präferenzmessung zu untersuchende Eigenschaftsart sollte deshalb immer aus Sicht der Entscheidungsträger festgelegt werden.1025 Dabei ist zu beachten, dass verschiedene Zielgruppen je nach Vorwissen unterschiedliche Eigenschaftsarten zur Bewertung von Alternativen heranziehen.1026 Aus diesem Grund erscheint eine zielgruppengerechte Bestimmung der zu untersuchenden Eigenschaftsart notwendig.

1021

Auf Basis einer weiteren Meta-Studie beobachten Helm; Steiner (2006, 12) ebenfalls, dass objektive Eigenschaften (44%) innerhalb von Studien zur Präferenzmessung am häufigsten angewendet werden. Benefits kommen demgegenüber nur in 4% der berücksichtigten Studien als alleinige Eigenschaftsart zum Einsatz. Andererseits wird in 30% der untersuchten Studien eine Kombination aus Characteristics und Benefits als Bewertungsgrundlage verwendet. 1022 Vgl. Helm; Steiner (2006), 12. 1023 1024 1025 1026

176

Vgl. Lefkoff-Hagius; Mason (1993), 102. Vgl. Helm; Steiner (2006), 11. Siehe dazu auch Myers; Shocker (1981), 220, 229f.; Schubert (1991), 34). Bei der Nutzung objektiver Eigenschaften ist bei einem geringen Vorwissen beispielsweise nicht sichergestellt, dass die jeweiligen Entscheidungsträger diese überhaupt einschätzen können. Wenn objektive Produktmerkmale untersucht werden, sollten diese deshalb immer auf Basis der jeweils individuellen Nutzenvorstellungen - d.h. aus Kundensicht - bestimmt werden (vgl. Myers; Shocker (1981), 220, 229f.; Schubert (1991), 34). Dies gilt insbesondere, wenn Preise für die hypothetischen Alternativen bestimmt werden sollen (vgl. Diller (2000), 201).

4.1.9 Zwischenfazit

In diesem Kapitel wurden die in der Literatur diskutierten Eigenschaftsarten und Besonderheiten ausgewählter Attribute beschrieben. Es wird deutlich, dass nicht jede Merkmalsart im Rahmen von Studien zur Präferenzmessung sinnvoll in die Analyse einbezogen werden kann. Eine Methode, die zur Bestimmung eines zu untersuchenden Eigenschaftssets genutzt werden soll, muss dies explizit berücksichtigen. Den Ausgangspunkt müssen dabei die Eigenschaften und Ausprägungen der Alternativen des Evoked-Sets potenzieller Kunden bilden. Werden Schwelleneigenschaften in eine Studie zur Präferenzmessung aufgenommen, ist dagegen mit verzerrten Schätzwerten zu rechnen, da in diesem Fall Bewertungsheuristiken angewendet werden. Auch die Entscheidung über eine Aufnahme von Characteristics oder Benefits in die Untersuchung sollte aus Kundensicht getroffen werden. So kann nicht in jedem Fall davon ausgegangen werden, dass Entscheidungsträger objektive Merkmale sinnvoll bewerten können; in diesen Fällen ist es u.U. ratsam, Benefits zu untersuchen. Neben den Eigenschaftsarten müssen weitere Anforderungen der Präferenzmessmethoden an das Eigenschaftsset bei der Ermittlung der relevanten Merkmale und Ausprägungen berücksichtigt werden. Diese werden im Folgenden beschrieben.

4.2

Anforderungen an Eigenschaften und Ausprägungen bei der Präferenzmessung

Um ein Eigenschaftsset im Rahmen von Studien zur Präferenzmessung sinnvoll untersuchen zu können, müssen verschiedene grundlegende Bedingungen erfüllt sein. Das Ziel dieses Kapitels ist es, diese methodenübergreifenden und eigenschaftstypbezogenen Anforderungen vorzustellen und deren Auswirkungen auf die Ergebnisse der Präferenzmessung zu diskutieren. In Abbildung 22 werden die in der Literatur genannten Anforderungen an ein Eigenschaftsset in einem Überblick dargestellt. Anforderungen an Eigenschaften und Ausprägungen Realisierbarkeit/ Beeinflussbarkeit

Relevanz

Vollständigkeit

(Bekanntheit, Salienz, Wichtigkeit, Determinanz)

Unabhängigkeit

Kompensatorische Beziehungen

Eindeutigkeit

Abbildung 22: Anforderungen an das zu untersuchende Eigenschaftsset

Eigenschaften, die innerhalb der Präferenzmessung verwendet werden, müssen einen Einfluss auf die Kaufentscheidung ausüben. Dies bedeutet, dass es sich aus Sicht der Entscheidungs177

träger um relevante Eigenschaften handeln muss. Diese zentrale Anforderung bei der Bestimmung eines Eigenschaftssets wird im Kapitel 4.2.6 ausführlich diskutiert.

4.2.1 Vollständigkeit der Beschreibung durch das Eigenschaftsset

Das zu untersuchende Eigenschaftsset sollte die Bewertungssituation möglichst vollständig widerspiegeln, so dass vom Befragungsteilnehmer überhaupt Entscheidungen getroffen werden können.1027 Fehlen dagegen Informationen über die Ausprägungen relevanter Merkmale, kann man davon ausgehen, dass die Entscheidungsträger versuchen werden, diese Informationen anhand von anderen vorhandenen Daten abzuleiten. So kann die Ausprägung des Merkmals „Preis“ als Indikator für die Ausprägungen verschiedener weiterer Merkmale dienen.1028 Nimmt ein Entscheidungsträger eine Beurteilungsaufgabe als unvollständig wahr, ist weiterhin mit einer tendenziell sinkenden Motivation1029 bei der Bewertung der Alternativen als auch mit einer eher schlechteren Einschätzung1030 der Stimuli zu rechnen. Werden auf Basis von unvollständig beschriebenen Bewertungsaufgaben die Präferenzen der Entscheidungsträger erfasst, sind die geschätzten Teilnutzen „nicht mehr aussagekräftig“1031 und produktpolitische Entscheidungen mehr oder weniger „willkürlich“.1032 Die Forderung nach Vollständigkeit der Beschreibung eines Eigenschaftssets bedeutet aber auch, dass sich das Ausmaß der zu untersuchenden Informationen (d.h. die Anzahl der Eigenschaften und die Anzahl der Ausprägungen) an dem jeweiligen Entscheidungsproblem ausrichten muss. Gegen eine „wirklich“ vollständige Beschreibung des Entscheidungsproblems spricht, dass, wie bereits beschrieben, mit Hilfe der Methoden zur Präferenzmessung nur eine begrenzte Anzahl an Merkmalen untersucht werden kann. Der Erhebungsaufwand steigt mit der Zahl der Merkmale oft exponentiell an. Insofern ist es bei jeder Art Präferenzmessung notwendig, die Anzahl der zu untersuchenden Eigenschaften zu beschränken.1033 Ferner verfügen Entscheidungsträger lediglich über beschränkte Informationsverarbeitungskapazitäten. Werden zu viele Informationen auf einmal präsentiert, kann er diese nicht mehr simultan einschätzen.1034 In diesen Fällen ist verstärkt mit der Anwendung von Entscheidungsheuristiken zu 1027 1028 1029 1030 1031 1032 1033 1034

178

Vgl. Wilkie; Pessemier (1973), 429; Haedrich; Kuß; Kreilkamp (1986), 121; Wittink; Cattin (1989), 94. Vgl. Goodwin; Wright (2000), 65; Johnson; Levin (1985), 170ff.; Huber; McCann (1982), 324; Yamagishi; Hill (1981), 16f.; Alba; Cooke (2004), 383ff. Vgl. Johnson; Levin (1985), 174. Vgl. Huber; McCann (1982), 332. Bei unvollständigen Informationen ist schließlich verstärkt mit dem Auftreten von Framing-Effekten zu rechnen, die die Ergebnisse der Präferenzmessung verzerren können (vgl. Melles (2001), 186). Theuerkauf (1989), 1180. Vgl. Hammond; Keeney; Raiffa (1998), 143. Vgl. Perrey (1998), 67. Vgl. Goodwin; Wright (2000), 15.

rechnen.1035 Die Forderung nach einer möglichst „vollständigen“ Darstellung bedeutet deshalb nicht, dass sämtliche „möglichen“ Merkmalsausprägungen in die Betrachtung einbezogen werden sollten, sondern lediglich diejenigen, die für die Entscheidungssituation angemessen und somit relevant sind.1036 Schließlich ist nicht davon auszugehen, dass alle Entscheidungsträger die gleichen Eigenschaften und Ausprägungen in die Bewertung von Alternativen einbeziehen. Es ist vielmehr damit zu rechnen, dass unterschiedliche Zielgruppen verschiedene Produkte in das EvokedSet aufnehmen und unterschiedliche Eigenschaftssets zur Bewertung von Alternativen nutzen. So könnten bestimmte Ausprägungen und Eigenschaften für einen Teil der Befragungsteilnehmer irrelevant, für andere aber durchaus entscheidungsrelevant sein.1037

4.2.2 Realisierbarkeit und Beeinflussbarkeit

Eine Anforderung, die man häufig in der Literatur1038 findet, ist die Realisierbarkeit, d.h. die in der Präferenzmessung untersuchten Eigenschaftsausprägungen sollten vom Auftraggeber in reale Produkte überführbar sein. Die Anforderung an die Beeinflussbarkeit einer Eigenschaft ist sehr eng mit der Realisierbarkeit verbunden,1039 denn eine Eigenschaft, die nicht beeinflussbar ist, kann auch nicht in dem gewünschten Maße realisiert werden. Schubert (1991, 178) und Gutsche (1995, 90) gehen davon aus, dass diese Anforderung erfüllt sein muss, um die Ergebnisse der ConjointAnalyse praktisch nutzen zu können, da nur in diesem Fall ein Hersteller die Resultate der Präferenzmessung in entsprechende Produkte umsetzen kann.1040 Eigenschaften, die ein Hersteller nicht beeinflussen (z.B. das „Herkunftsland“ oder die „Marke“), sollten demnach nicht innerhalb der Präferenzmessung untersucht werden.

1035

Siehe Kapitel 3.3.

1036

Vgl. Keeney; Gregory (2005), 4; Böcker; Schweikl (1988), 16. Siehe im Gegensatz dazu Gibson (2001, 18), der fordert, dass „all the attributes and levels that could affect choice should be included“ (siehe analog auch Lürssen (1989), 172). Problematisch an dieser Forderung ist jedoch, dass einerseits nie wirklich „alle“ Einflussfaktoren auf das Wahlverhalten eines Entscheidungsträgers erfasst werden können und nicht für alle Entscheider die gleichen Merkmale und Ausprägungen relevant sind. Bestimmte Verfahren der Präferenzmessung ermöglichen zwar, eine Beschränkung der Präferenzmessung auf möglicherweise besonders relevante Merkmale. Diese Verfahren stellen allerdings nicht sicher, dass die tatsächlich relevanten Ausprägungen überhaupt in eine Untersuchung aufgenommen wurden. Schwachpunkt dieser Methoden ist weiterhin, dass die Selektion von Eigenschaften auf individueller Ebene nicht stabil ist, während auf aggregierter Ebene mit stabileren Einschätzungen zu rechnen ist (vgl. Huber (1987), 6). 1037 Siehe analog auch Gibson (2001), 18f. 1038 1039 1040

Vgl. Backhaus; Erichson; Plinke; Weiber (2003), 546; Schmidt-Gallas (1998), 31; Schubert (1991), 178; Mengen (1993), 85; Gutsche (1995), 90. Vgl. Schubert (1991), 178, Hahn (1997), 48; Balderjahn (1993), 95; Albrecht (2000), 32. Vgl. Backhaus; Erichson; Plinke; Weiber (2003), 548; Skiera; Gensler (2002a), 201; Mengen (1993), 85; Reiners (1996), 32 ff.; Perrey (1998), 49.

179

Schweikl (1985, 100f.), Voeth (2000, 25) und Schubert (1991, 186f.)1041 sprechen sich dagegen dafür aus, ebenfalls die relevanten Eigenschaften bzw. Eigenschaftsausprägungen in die Präferenzmessung aufzunehmen, die nicht von einem Hersteller beeinflusst oder realisiert werden können, da sonst die ermittelten Präferenzdaten nur einen sehr beschränkten Aussagewert besitzen. Wird beispielsweise ein Produkt untersucht, bei dem das „Herkunftsland“ eine wichtige Rolle bei der Produktwahl spielt, so sollte diese Eigenschaft in die Präferenzmessung aufgenommen werden, um Aussagen über reale Wahlentscheidungen ableiten zu können. In bestimmten Produktbereichen (z.B. Autos) kann das Ursprungsland bei einem Teil der befragten Personen sogar die wichtigste Eigenschaft darstellen. Wird diese jedoch nicht in die Untersuchung aufgenommen, bleibt z.B. unklar, ob andere Eigenschaften ein weniger präferiertes Herkunftsland überhaupt kompensieren können.1042 Anhand dieses Beispiels wird deutlich, dass die Berücksichtigung der Anforderungen an die Realisierbarkeit und Beeinflussbarkeit eher zu Verzerrungen der Ergebnisse führt und deren Übertragbarkeit auf reale Marktsituationen einschränkt. Wird der Begriff „realisierbar“ allerdings im Sinne von „realistisch“ interpretiert, ist dieser Forderung zuzustimmen, weil nicht davon ausgegangen werden kann, dass Entscheidungsträger bei Vorlage von unrealistischen Eigenschaftsausprägungen sinnvoll Nutzenvorstellungen ableiten können.1043

4.2.3 Unabhängigkeit der Ausprägungen

Die Ausprägungen der Eigenschaften sollten die Anforderung der Unabhängigkeit erfüllen. Man unterscheidet dabei zwischen Präferenzunabhängigkeit und empirischer Unabhängigkeit.1044

4.2.3.1 Präferenzunabhängigkeit Präferenzunabhängigkeit bedeutet, dass das Vorhandensein einer Eigenschaftsausprägung

keinerlei Einfluss auf die Einschätzung einer Ausprägung einer anderen Eigenschaft ausübt.1045 Als typisches Beispiel für das Auftreten von Interaktionen können die Eigenschaften „Marke“ und „Farbe“ beim Untersuchungsobjekt „Auto“ herangezogen werden. So könnte ein 1041 1042 1043 1044 1045

180

Einerseits plädiert Schubert (1991) dafür, nur realisierbare und beeinflussbare Eigenschaften in die Präferenzmessung aufzunehmen (Seite 178), andererseits spricht er sich auf Seite 186 gegen eine solche Vorgehensweise aus. Vgl. Schweikl (1985), 101. Siehe ausführlich dazu Kapitel 5.7.1. Vgl. Melles (2001), 34; Reiners (1996), 31; Wilkie; Pessemier (1973), 432. Vgl. Backhaus; Erichson; Plinke; Weiber (2003), 548; Reiners (1996), 31f.; Cattin; Wittink (1982), 46; Perrey (1998), 67; Theuerkauf (1989), 1186f.; Keeney; Raiffa (2003), 109ff.

Proband einen roten Ferrari gegenüber einem blauen präferieren, obwohl er sonst blaue Autos bevorzugt.1046 Die Ausprägung der Eigenschaft „Marke“ beeinflusst somit die Vorziehenswürdigkeit der Ausprägungen des Merkmals „Farbe“. Die Präferenzunabhängigkeit ist eine grundlegende Voraussetzung für die Anwendung einer additiven Nutzenfunktion.1047 Viele Verfahren der Präferenzmessung wie der AHP, die SelfExplicated Methoden, die SMART oder die Nutzwertanalysen beruhen auf einer additiven Wertfunktion, mit der der Gesamtnutzen einer Alternative als Summe der einzelnen Teilnutzen berechnet wird.1048 Da kompositionelle Methoden zur Präferenzmessung auf einer direkten Bewertung einzelner Ausprägungen und Eigenschaften basieren, sind diese nur dann geeignet, wenn keine starken Interaktionseffekte zwischen den untersuchten Produktmerkmalen vorliegen.1049 Die meisten Varianten der Conjoint-Analyse beruhen ebenfalls auf einer additiven Nutzenfunktion.1050 Die Berücksichtigung von Interaktionen ist allerdings bei einigen

Verfahrensvarianten zumindest theoretisch möglich.1051 Eine Anwendungsvoraussetzung für diese lineare Aggregationsfunktion ist, dass keinerlei Interaktionen zwischen den Eigenschaftsausprägungen verschiedener Eigenschaften vorhanden sind, d.h. Präferenzunabhängigkeit vorliegt.1052 In den meisten Untersuchungen werden bei der Anwendung der Conjoint-Analyse keine Interaktionen zwischen den Eigenschaftsausprägungen berücksichtigt.1053 Der Grund dafür ist häufig die Anwendung von fraktionierten Untersuchungsdesigns wie z.B. des Lateinischen Quadrats,1054 des Griechisch-Lateinischen Quadrats1055 oder der Addelman Pläne,1056 die lediglich die Schätzung der Haupteffekte (diese entsprechen den Teilnutzen der Ausprägungen), jedoch nicht die von Interaktionen ermöglichen.1057 Da die Zahl der möglichen Alternativen

1046 1047

Vgl. Melles (2001), 14. Vgl. Acito (1977), 83f.; Green; Rao (1971), 355.

1048

Vgl. Helm; Manthey; Scholl; Steiner (2003), 6; Eisenführ; Weber (2003), 119; Srinivasan; Park (1997), 288; Srinivasan (1988), 296; von Winterfeldt; Edwards (1986), 263. 1049 Für Self-Explicated Methoden siehe beispielsweise Hoepfl; Huber (1970), 413. 1050

Vgl. Green; Srinivasan (1978), 105; Green; Wind; Rao (1998), 12ff.; Green; Krieger; Wind (2001), 60. So können im Rahmen der ACA keinerlei Interaktionseffekte geschätzt werden (vgl. Sawtooth Software (2002), 16; Agarwal (1988), 56). Ferner können bei Anwendung der Bridging Conjoint-Analyse potenzielle Interaktionseffekte nicht berücksichtigt werden (vgl. Thaden (2002), 78). 1051 Siehe dazu u.a. Louviere (1988b), 16ff.; Melles (2001), 13 f.; Pras; Summers (1975), 276ff. Auch die CBC erlaubt die Schätzung von Interaktionseffekten (vgl. Klein (2002), 37; Sawtooth Software (1999), 5f., 14; Johnson; Orme (1996), 2). 1052 Vgl. Borcherding (1983), 111f.; Pöyhönen; Hämäläinen (1997), 2. 1053 1054 1055 1056 1057

Vgl. Curry (1997), 7. Vgl. Backhaus; Erichson; Plinke; Weiber (2003), 552f. Vgl. Kohli (1988), 25ff. Vgl. Addelman (1962), 21ff. Vgl. Pigeon; McAllister (1989), 249; Holland; Cravens (1973), 275; Huber (1987), 5ff.; Green; Srinivasan (1990), 6.

181

meist zu groß ist, um vollständig erhoben zu werden, ist eine Reduzierung der zu befragenden Stimuli meist notwendig.1058 Besondere Relevanz erfährt diese Problematik bei der Nutzung von Paarvergleichen, da zur Schätzung von Interaktionen überdies eine Reduktion der Paarvergleiche1059 nicht möglich wäre. Die Zahl der nötigen Einschätzungen wächst somit stark an, so dass die oftmals genannte Grenze von maximal 30 Paarvergleichen1060 bereits bei drei Eigenschaften mit jeweils 2 Ausprägungen erreicht wird. Mit starken Interaktionseffekten ist gleichwohl vergleichsweise selten zu rechnen. Treten diese allerdings auf, sollten sie entsprechend berücksichtigt werden, da ansonsten mit erheblichen Verzerrungen der Schätzwerte zu rechnen ist.1061 4.2.3.1.1 Möglichkeiten zur Berücksichtigung von Interaktionseffekten

Sind bestimmte Interaktionseffekte a priori nicht bekannt, muss zur Schätzung von Interaktionen auf ein vollständiges Design zurückgegriffen werden.1062 Vollständige Erhebungsdesigns bei der Conjoint-Analyse erlauben zwar die getrennte Schätzung einzelner Interaktionen,1063 allerdings ist bei Conjoint-Analysen auf Basis von Regressionen die simultane Betrachtung sämtlicher Interaktionen nicht möglich. Dies lässt sich bei der häufig eingesetzten OLS

Regression durch den Rang der Matrix nachweisen. Der Rang einer Matrix gibt die maximale Zahl der linear unabhängigen Spalten bzw. Zeilen1064 und damit die maximale Zahl der schätzbaren Parameter an. Ist der Rang einer Matrix kleiner als die Anzahl aller zu schätzenden Parameter, so können nicht alle Haupteffekte (Teilnutzen) und Interaktionen gleichzeitig ermittelt werden. Deshalb kann bei der Nutzung der OLS Regression u.U. selbst bei einem vollständigen Erhebungsdesign immer nur ein Teil der möglichen Interaktionseffekte simultan berücksichtigt werden.1065 Die Interaktionsterme können durch die Bildung von Kreuzpro-

1058 1059 1060 1061 1062 1063 1064 1065

182

Vgl. Backhaus; Erichson; Plinke; Weiber (2003), 552; Gupta (1985), 177. Siehe Kapitel 3.4. Eine Reduzierung der Paarvergleiche kann z.B. durch das Partially Balanced Incomplete Block Design (vgl. Green (1974), 63) oder durch die von Hausruckinger; Herker (1992, 99) vorgeschlagene Methode erfolgen. Vgl. Green; Srinivasan (1978), 109. Vgl. Huber (1987), 5ff.; Fenwick (1975), 208f.; Acito (1977), 85; Leigh; MacKay; Summers (1984), 456. Vgl. Green; Devita (1975), 146; Reibstein; Bateson; Boulding (1988), 281. Vgl. Green; Devita (1975), 146. Vgl. Opitz (1999), 227f; Ohse (1990), 71ff. Siehe dazu ebenfalls Green; Carroll; Carmone (1978, 116ff.), die eine entsprechende stufenweise Methode vorschlagen, bei der a priori keine Informationen über Interaktionseffekte vorliegen und die eine a posteriori Selektion von Interaktionseffekten ermöglicht.

dukten der jeweiligen Paare an Eigenschaftsausprägungen, zwischen denen Interaktionen

vermutlich bestehen, geschätzt werden.1066 Kompromissdesigns1067 erlauben eine Reduzierung der nötigen Stimuli und ermöglichen die

Schätzung von a priori bekannten Interaktionen. Die Zahl der nötigen Einschätzungen sinkt so zwar gegenüber vollständigen Designs; allerdings sind mehr Beobachtungen als bei ConjointAnalysen ohne Berücksichtigung von Interaktionen nötig, was sich in der Praxis als Haupthinderungsgrund bei der Anwendung dieser Verfahren herausgestellt hat.1068 Eine weitere Möglichkeit, Interaktionen innerhalb der Präferenzmessung zu berücksichtigen, bieten spezielle hybride Verfahren.1069 In der ersten kompositionellen Phase werden dabei die Präferenzen der Probanden mit einer Self-Explicated Analyse erhoben. Anhand dieser Daten können Gruppen von Befragten gebildet werden, die ähnliche Präferenzen aufweisen. Die Entscheider innerhalb einer Gruppe beantworten im Folgenden jeweils nur eine Teilmenge der zur Schätzung der Haupteffekte und Interaktionen notwendigen Stimuli eines vollständigen Erhebungsdesigns. Im Gegensatz zu den sonst üblichen Varianten der Conjoint-Analyse werden bei dieser Methode keine individuellen Präferenzen, sondern eine Nutzenfunktion für eine Gruppe von Befragten ermittelt. Die Gruppenbildung erfolgt unter der Annahme, dass Personen mit ähnlichen Haupteffekten (Teilnutzen) ähnliche Interaktionen aufweisen1070 und der Marktforscher vor allem an Interaktionseffekten auf Gruppenebene interessiert ist.1071 Diese von Green; Goldberg; Montemayor (1981, 35) vorgeschlagene Vorgehensweise ermöglicht den Einbezug einer größeren Zahl an Eigenschaften und Eigenschaftsausprägungen. Die methodischen Probleme bei der Schätzung von Interaktionen bei der Anwendung einer Regressionsanalyse bleiben jedoch weiterhin bestehen. So sind auch bei diesem Verfahren nicht alle Interaktionen simultan schätzbar. Schließlich besteht die Möglichkeit, Compound-Attributes1072 bei a priori bekannten Interaktionseffekten zwischen verschiedenen Eigenschaften zu bilden. Wird beispielsweise angenommen, dass zwischen den Eigenschaften „Farbe“ und „Stoff“ einer Hose Interaktionen be1066

Vgl. Louviere (1988b), 60f.; Green; Srinivasan (1978), 107; Teichert (2000a), 480f.; Melles (2001), 13f.; Akaah; Korgaonkar (1983), 190, 195; Green; Goldberg; Wiley (1983), 148; Holbrook; Moore (1981), 107. Vgl. Green; Srinivasan (1990), 5; Carmone; Green (1981), 87; Voeth (2000), 211; Weisenfeld-Schenk (1989), 34; Reibstein; Bateson; Boulding (1988), 285; Green; Devita (1975), 146; Green; Carroll; Carmone (1978), 111ff.; Albrecht (2000), 57. 1068 Vgl. Carmone; Green (1981), 93. 1067

1069

Man unterscheidet zwischen hybriden Verfahren zur Reduzierung der Anzahl der befragten Eigenschaften, wie z.B. die ACA, CCC oder CHIC (vgl. Hensel-Börner (2000), 50ff.) und den hier beschriebenen hybriden Verfahren, um Interaktionen zwischen Eigenschaften berechnen zu können (vgl. Green; Goldberg; Montemayor (1981), 35). Eine ähnliche Vorgehensweise schlagen auch Green; Devita (1975, 147, 151f.) vor. 1070 Vgl. Green; Goldberg; Montemayor (1981), 35. 1071 1072

Vgl. Green; Srinivasan (1978), 118. Diese werden teilweise ebenfalls als “Superattribute” bezeichnet (vgl. Perrey (1998), 72; Green; Srinivasan (1978), 107; Schubert (1991), 215; Green; Srinivasan (1990), 6).

183

stehen,1073 kann ein Compound-Attribute gebildet werden, das aus der Kombination beider Einzeleigenschaften besteht.1074 Interaktionen werden so nicht mehr separat, sondern im Verbund mit den anderen Eigenschaftsausprägungen geschätzt. Durch den Einsatz von „Compound Attributes“ können zudem mehr Interaktionseffekte berücksichtigt werden. In der folgenden Abbildung 23 wird ein Beispiel für die Bildung von „Compound Attributes“ präsentiert. Farbe blau braun Stoff Jeans Cord

Compound-Attribute aus Farbe und Stoff blaue Jeans braune Jeans blaue Cord-Hose braune Cord-Hose

Abbildung 23: Beispiel für ein Compound-Attribute

Johnson; Olberts (1996, 3) weisen allerdings auf verschiedene Probleme bei der Anwendung von Compound-Attributes hin. Die Zahl der Ausprägungen des neu gebildeten CompoundAttributes ist höher als die der beiden ursprünglichen Einzeleigenschaften. Dies kann zu einer größeren Zahl an nötigen Einschätzungen und zu verstärkten Ermüdungserscheinungen der Probanden führen. Johnson; Olberts (1996, 3) vermuten deshalb, dass diese CompoundAttributes nur bei einer geringen Anzahl an Eigenschaften anwendbar sind, da sonst die Komplexität der Erhebung so stark ansteigen kann, dass die geschätzten Ergebnisse praktisch nicht mehr zur Prognose von Kaufentscheidungen verwendet werden können.1075 Problematisch ist weiterhin, dass bei der Verwendung von Compound-Attributes keine Einzelnutzen für die einzelnen Eigenschaftsausprägungen (im Beispiel: die Eigenschaften „Preis“ und „Marke“) berechnet werden können, sondern wie beschrieben, lediglich die Teilnutzen der jeweiligen Kombinationen von Eigenschaftsausprägungen.1076 Geht man davon aus, dass der beobachtete Interaktionseffekt bei der Anwendung metrischer Bewertungsskalen lediglich durch die verwendete Skalenart verursacht wird, kann man den Interaktionseffekt durch eine monotone Transformation der Präferenzwerte eliminieren. Dabei werden die Präferenzdaten so umskaliert, dass die empirisch erhobene Präferenzrangfolge der untersuchten Alternativen bestehen bleibt und die Daten auf ein ordinales Skalenniveau ge-

1073 1074 1075 1076

184

Vgl. Curry (1997), 7. Vgl. Curry (1997),7; Johnson; Olberts (1996), 3. Vgl. Johnson, Olberts (1996), 3. Vgl. Green; Carroll; Carmone (1978), 110.

bracht werden können. Durch diese Vorgehensweise ließen sich zumindest Non-Cross-Over Interaktionen im nachhinein eliminieren.1077 Abschließend kann festgestellt werden, dass die Berücksichtigung von Interaktionseffekten bei Durchführung einer Conjoint-Analyse generell möglich ist. Aufgrund des höheren Aufwands bei der Datenerhebung stellt sich jedoch die Frage, unter welchen Umständen verstärkt mit Interaktionen und Verzerrungen der Ergebnisse zu rechnen ist. 4.2.3.1.2 Einflussfaktoren auf die Auswirkungen von Interaktionen

Carmone; Green (1981, 93) und Carmone; Green; Jain (1978, 300ff.) gehen davon aus, dass ein Ignorieren von Interaktionseffekten die Ergebnisse der Präferenzmessung und dabei insbesondere die First-Choice Hit-Rate erheblich verzerren kann. Dies hätte nicht optimale Entscheidungen bei der Produktentwicklungen zur Folge, weshalb Interaktionen im Rahmen der Präferenzmessung berücksichtigt werden sollten. Im Gegensatz dazu beobachteten Tscheulin (1996, 589) und Green; Srinivasan (1990, 9), dass eine Berücksichtigung von Interaktionseffekten die Ergebnisgüte u.U. sogar verschlechtert. Generelle Aussagen über die Vorteilhaftigkeit der Berücksichtigung von Interaktionseffekten scheinen deshalb nicht möglich. Die Auswirkungen von Interaktionen hängen vielmehr von der Art der untersuchten Eigenschaften1078 und der Art der Interaktionen1079 ab. Einfluss der Eigenschaftsart

Holbrook; Moore (1982, 103) sowie Carmone; Green (1981, 93) identifizieren „Design“, „Geschmack“, „Geruch“ und weitere „sensory phenomena“1080 als Produktmerkmale, bei denen Interaktionen besonders wahrscheinlich sind. Demgegenüber ist bei Eigenschaften, die eher „rational“ eingeschätzt werden, weniger mit Interaktionen zu rechnen. Je nach verwendeter Eigenschaftsart variiert somit die Wahrscheinlichkeit für das Auftreten von Interaktionseffekten. Einfluss der Art der Interaktionen

Insbesondere die Art der Interaktionen hat Auswirkungen auf die Validität einer Untersuchung. Man unterscheidet dabei zwischen Cross-Over und Non-Cross-Over Interaktio-

1077

Vgl. Green; Devita (1974), 56f.; Green (1973), 413f. Carmone; Green (1981, 93) beobachten allerdings, dass bei Anwendung der üblichen Haupteffektedesigns Non-Cross-Over Interaktionen kaum zu Verzerrungen führen. 1078 Vgl. Holbrook; Moore (1981), 103. 1079 1080

Vgl. Carmone; Green (1981), 88. Carmone; Green (1981), 93 und Green; Srinivasan (1990), 5. Ein Beispiel für Interaktionen bezüglich des Geschmacks findet sich auch bei Bamberg; Coenenberg (2000, 48f.); eines für Design in Eisenführ; Weber (2003, 120f.).

185

nen.1081 Bei Cross-Over Interaktionen ändert sich durch das Vorhandensein einer Eigen-

schaftsausprägung bei einer anderen Eigenschaft die Reihenfolge der Vorziehenswürdigkeit der betrachteten Ausprägungen.1082 Bei Non-Cross-Over Interaktionen ändert sich die Reihenfolge der Präferenz bezüglich der Eigenschaftsausprägungen demgegenüber nicht. Die Unterscheidung in Cross-Over und Non-Cross-Over Interaktionen ist deshalb wichtig, da insbesondere den Cross-Over Interaktionen ein größerer Einfluss auf die Ergebnisse der ConjointAnalyse zugeschrieben wird.1083 In der folgenden Abbildung 24 werden die Nutzenverläufe für das Vorliegen von Cross-Over Interaktionen, Non-Cross-Over Interaktionen und keinen Interaktionen dargestellt. Cross-Over Interaktionen

Non-Cross-Over Interaktionen

Keine Interaktionen

10

10

10

8

8

8

6

6

6

4

4

4

2

2

2

0

0

blau

braun

schwarz

0

blau

braun

schwarz

blau

braun Jeans

schwarz Cord

Abbildung 24: Darstellung der verschiedenen Arten von Interaktionen

Treten keinerlei Interaktionen zwischen den betrachteten Eigenschaftsausprägungen auf (Grafik rechts), so sind die Nutzengeraden der beiden Eigenschaftsausprägungen „Jeans“ und „Cord“ parallel. Im Gegensatz dazu verlaufen die Präferenzwerte bei Non-Cross-Over Interaktionen (mittlere Grafik) nicht mehr parallel. Somit verändert das Vorhandensein einer bestimmten Farbe die Präferenz für eine Stoffart. Die Präferenzrelationen ändern sich allerdings nicht. In diesem Beispiel bevorzugt der Entscheider bei jeder Farbe die Ausprägung „Jeans“ gegenüber „Cord“. Bei Cross-Over Interaktionen (Grafik links) ändert sich demgegenüber die Präferenzrangfolge bei der Eigenschaft „Stoff“ in Abhängigkeit von den Ausprägungen der Eigenschaft „Farbe“. In diesem Fall stiftet dem Probanden eine blaue Jeans einen höheren Nutzen, obwohl er sonst eher „Cord“ als Stoff wählen würde. Der präferierte Stoff ist also von der jeweiligen Farbe der Hose abhängig.1084

1081 1082 1083

Vgl. Tscheulin (1992), 41. Teilweise werden diese Interaktionen als „ordinal“ und „disordinal interactions“ bezeichnet (vgl. Green; Devita (1974), 56; Ross; Creyer (1993), 336). Vgl. Teichert (2000a), 481; Weisenfeld-Schenk (1989), 34.

Vgl. Green (1973), 415; Carmone; Green (1981), 88; Green; Devita (1975), 415f. Die generelle Berücksichtigung von potenziellen Interaktionen führt somit nicht zu einer Verbesserung der Ergebnisgüte der Präferenzmessung (vgl. Green; Krieger (1996), 854). 1084 Siehe auch Carmone; Green (1981), 88; Holbrook; Moore (1981), 110.

186

4.2.3.1.3 Auswirkungen von Interaktionseffekten innerhalb der Präferenzmessung

In der praktischen Anwendung führen Verstöße gegen die Anwendungsvoraussetzungen bei linearen Nutzenfunktionen selten zu größeren Verzerrungen.1085 Carmone; Green; Jain (1978, 300ff.) zeigen, dass das additive Nutzenmodell gegenüber Interaktionen relativ robust ist. Auch Gupta (1985, 177) geht davon aus, dass Haupteffekt-Modelle häufig einen Großteil der Varianz erklären können. Teichert (1994, 625) und Tscheulin (1996, 589f.) nehmen gleichwohl an, dass die Validität eines Haupteffekte Designs sinkt, wenn bedeutende Interaktionen auftreten. Insbesondere Cross-Over Interaktionen können die Ergebnisse der Präferenzmessung erheblich verzer-

ren.1086 Es scheint aus diesem Grund sinnvoll, das Eigenschaftsset bereits vor der eigentlichen Präferenzmessung auf potenzielle Interaktionseffekte zu überprüfen, die Art der Interaktion zu bestimmen und ggf. bestimmte Interaktionseffekte durch die in Kapitel 4.2.3.1.1 beschriebenen Möglichkeiten zu berücksichtigen. Methoden zur a priori Erfassung von möglichen Interaktionen sind in der Literatur meist

nur unzureichend beschrieben. Reiners (1996, 45) weist darauf hin, dass es bisher keine allgemeinen Regeln zur Ermittlung von möglichen Interaktionen gibt. Tscheulin (1996, 589) bestimmt demgegenüber mögliche Interaktionen aufgrund von „theoretischen Vorüberlegungen“. Carmone; Green (1981, 88) nennen Expertenbefragungen und „some preliminary testing“ als zur a priori Bestimmung von potenziellen Interaktionseffekten geeignete Methoden. Huber (1987, 10) untersucht Interaktionseffekte durch „specially designed questions“. Voeth (2000, 207ff.) beschreibt im Gegensatz zu den bisherigen Autoren eine systematische Vorgehensweise zur a priori Ermittlung von potenziellen Interaktionseffekten. Dabei werden alle möglichen Kombinationen der Ausprägungen von je zwei Eigenschaften gebildet, die von den Probanden bewertet werden. Interaktionen sind dann vorhanden, wenn die Ausprägungen eines Attributs je nach Ausprägung anderer Merkmale unterschiedlich beurteilt wurden. Problematisch ist allerdings, dass die Zahl der notwendigen Einzeleinschätzungen mit einer höheren Anzahl der Eigenschaften und Ausprägungen stark ansteigt, weshalb meist nur bestimmte potenzielle Interaktionseffekte untersucht werden können. Eine Unterscheidung zwischen Cross-Over und Non-Cross-Over Interaktionen erfolgt bei dieser Vorgehensweise jedoch nicht.1087

1085 1086 1087

Vgl. Carmone, Green, Jain (1978), 300ff.; Melles (2001), 14. Vgl. Green (1973), 415; Carmone; Green (1981), 88; Green; Devita (1975), 415f. Derzeit ist es somit nicht möglich, die Art der Interaktionseffekte a priori zu erkennen. Im Kapitel 6.1.6 wird deshalb eine Vorgehensweise vorgeschlagen, mit der vor der eigentlichen Präferenzmessung das Eigenschaftsset auf potenzielle Interaktionseffekte untersucht und erstmals auch die Art der vorhandenen Interaktionen bestimmt werden kann.

187

4.2.3.2 Empirische Unabhängigkeit

Empirische Unabhängigkeit bedeutet, dass durch die Ausprägung eines Merkmals nicht bereits die Ausprägung einer anderen Eigenschaft bestimmt wird, d.h. die Ausprägungen der Eigenschaften sind unabhängig voneinander realisierbar.1088 Die in der Untersuchung aufgenommenen Eigenschaftsausprägungen sollten daher völlig frei miteinander kombinierbar sein. Werden beispielsweise die Eigenschaften „Höchstgeschwindigkeit“ und „Verbrauch“ in eine Studie zum Untersuchungsobjekt „Auto“ aufgenommen, sollten durch die Ausprägungen des Merkmals „Höchstgeschwindigkeit“ nicht bereits die Ausprägungen der Eigenschaft „Verbrauch“ quasi „festgelegt“ sein. Dies ist aber nicht in jedem Fall gegeben, d.h. es besteht u.U. zwischen den Eigenschaften „Verbrauch“ und „Höchstgeschwindigkeit“ eine Beziehung.1089 Eine typische Folge bei der Nicht-Berücksichtigung dieser Problematik sind unrealistische Stimuli,1090 die die Ergebnisse der Präferenzmessung verzerren können.1091 Es sollten aber

möglichst nur realistische Alternativen untersucht werden.1092 Wie beim Auftreten von Cross-Over Interaktionen können in einem solchen Fall CompoundAttributes1093 eingesetzt werden, die eine Beschränkung der Kombinationsfähigkeit der Ei-

genschaftsausprägungen ermöglichen.1094 Die Anwendung solcher Compound-Attributes zur Einschränkung der Kombinierbarkeit der Eigenschaftsausprägungen ist allerdings mit den in Kapitel 4.2.3.1.1 beschriebenen Problemen verbunden. Andererseits könnten unrealistische Kombinationen einfach aus dem Erhebungsdesign gestrichen und so auf eine Einschätzung der Probanden verzichtet werden.1095 Eine solche Vorgehensweise sieht Orme (2002c, 2f.) dagegen als einen der am häufigsten begangenen Fehler im Rahmen von Conjoint-Analysen. Die Einschränkung der freien Kombinierbarkeit von Eigenschaftsausprägungen kann zu ungenauen und instabilen Nutzenschätzungen führen.1096 Weiterhin könnte das Erhebungsdesign so lange variiert werden, bis keine unrealistischen Alternativen mehr berücksichtigt werden.

1088

Vgl. Melles (2001), 34f.; Reiners (1996), 31; Balderjahn (1993), 95. Green; Carroll; Carmone (1978, 110) bezeichnen dies als “environmental correlation”. Vgl. Moore; Holbrook (1990), 490; Hahn (1997), 49. Siehe Green; Helsen; Shandler (1988, 392), die dies an den Eigenschaften „Preis“ und „Qualität“ erläutern. 1090 Vgl. Moore; Holbrook (1990), 490; Melles (2001), 35; Cattin; Wittink (1982), 51. 1089

1091 1092 1093

Vgl. Moore; Holbrook (1990), 491. Vgl. Green; Srinivasan (1978), 105; Moore; Holbrook (1990), 490f. Green; Carroll; Carmone (1978, 110) bezeichnen diese als “composite attributes”.

1094

Vgl. Green; Carroll; Carmone (1978), 110; Moore; Holbrook (1990), 491; Orme (2002c), 3. Auch in der Entscheidungsanalyse wird die Bildung von aggregierten Eigenschaften, die aus verschiedenen Einzeleigenschaften bestehen, empfohlen, wenn zwischen den Merkmalen empirische Abhängigkeit zu vermuten ist (vgl. Eisenführ; Weber (2003), 68). 1095 Vgl. Green; Carroll; Carmone (1978), 110; Moore; Holbrook (1990), 491; Berekoven; Eckert; Ellenrieder (2001), 281. 1096

188

Vgl. Orme (2002c), 3.

Dies ist jedoch nur bei Entscheidungssituationen möglich, in denen es lediglich sehr wenige unrealistische Stimuli gibt.1097 Zudem besteht die Möglichkeit, z.B. durch die Anwendung spezieller Erhebungsdesigns unrealistische Kombinationen von Ausprägungen so weit wie

möglich zu vermeiden und gleichzeitig noch einen möglichst hohen Grad an Orthogonalität des Erhebungsdesigns zu erreichen, was gleichwohl immer die Effizient der Schätzungen beeinflusst.1098 Allerdings scheint die Eliminierung unrealistischer Alternativen kaum Einfluss auf die Ergebnisgüte auszuüben, weshalb es sinnvoller erscheint, ein orthogonales Erhebungsdesign zu nutzen.1099 Orme (2002c, 3) spricht sich deshalb dafür aus, die Probanden zu Beginn der Befragung darauf hinzuweisen, dass einige Kombinationen von Eigenschaftsausprägungen in der Untersuchung derzeit noch nicht am Markt verfügbar sind. Die Befragten sollen solche Stimuli möglichst so einschätzen, als ob es sie tatsächlich gäbe.1100 Orme (2002c, 2) kommt zusammenfassend zu der Schlussfolgerung, dass die Einschränkung der Kombinierbarkeit der Ausprägungen „can lead to more realistic interviews, [but] it is often detrimental (and sometimes fatal) to prohibit levels from occurring with others.“ Mit Verzerrungen durch unrealistische Alternativen ist insbesondere dann zu rechnen, wenn die Bandbreite der Ausprägungen zu weit gewählt wurde.1101 Werden allerdings je nach Zielgruppe verschiedene Eigenschaftssets untersucht, könnte dieses Problem so weit wie möglich vermieden werden. Eng mit der empirischen Unabhängigkeit der Ausprägungen eines Attributsets ist auch die Forderung nach „mutually exclusive“1102 Ausprägungen verbunden, d.h. eine Eigenschaft sollte immer nur Ausprägungen aufweisen, die sich gegenseitig ausschließen. Ein Attribut, bei der die Ausprägungen nicht „mutually exclusive“ sind, könnte das Merkmal „Extras“ beim Untersuchungsobjekt „Autos“ mit den Ausprägungen „Sonnendach“, „GPS-Navigation“ oder „erweiterte Garantie“ sein. Untersucht man diese Ausprägungen der Eigenschaft „Extras“ mit Hilfe der Conjoint-Analyse, so können keinerlei Aussagen über die Vorziehenswürdigkeit eines Autos, dass sowohl ein Sonnendach als auch eine erweiterte Garantie aufweist oder über die Präferenz zu Autos ohne jegliche Extras getroffen werden.1103 Die Eigenschaftsausprägungen müssen demnach so formuliert werden, dass lediglich eine Ausprägung, nicht aber Kombinationen von Ausprägungen eines Merkmals in der Realität vorkommen können. Bei-

1097 1098 1099 1100 1101 1102 1103

Vgl. Green; Carroll; Carmone (1978), 110; Moore; Holbrook (1990), 491. Vgl. Moore; Holbrook (1990), 491f. Vgl. Moore; Holbrook (1990), 496; Green; Helsen; Shandler (1988), 395. Vgl. Orme (2002c), 3. Vgl. Balderjahn (1993), 95. Hoepfl; Huber (1970), 413; Orme (2002c), 2 oder Curry (1997), 7. Vgl. Orme (2002c), 2.

189

spielsweise kann bei der Eigenschaft „Farbe“ nur eine Ausprägung, z.B. „rot“ oder „blau“ realisiert werden.1104

4.2.4 Kompensatorische Beziehungen zwischen den Merkmalen

Die Verfahren zur Präferenzmessung beruhen auf einem Trade-off der zur Verfügung gestellten Informationen. Dies bedeutet, dass alle präsentierten Eigenschaften und Ausprägungen im Bewertungsprozess gegeneinander abgewogen werden sollten. Taboo Trade-offs und völlig unakzeptable Eigenschaftsausprägungen können allerdings dazu führen, dass die Eigenschaften nicht mehr in einem kompensatorischen Verhältnis zueinander stehen, sondern bestimmte Merkmalsausprägungen die Bewertung determinieren.1105 Taboo Trade-offs sollten im Rahmen von Präferenzmessungen generell vermieden werden.

Es handelt sich dabei um Entscheidungssituationen, bei denen extreme, sozial unerwünschte Entscheidungen oder aber gesundheitliche Schäden bzw. die Möglichkeit des Verlusts des Lebens als eine Eigenschaft explizit oder implizit in die Bewertung verschiedener Alternativen einbezogen wird. Bei entsprechenden Entscheidungssituationen ist damit zu rechnen, dass die Probanden die Bewertung der Alternativen generell ablehnen bzw. kein tatsächlicher Trade-off der einzelnen Eigenschaften stattfindet.1106 Ein Beispiel für Taboo Trade-offs wäre die Abwägung zwischen den Eigenschaften „Sicherheit“ und „Komfort“ beim Untersuchungsobjekt „Flugreise“. Ebenso können völlig unakzeptable Eigenschaftsausprägungen die Ergebnisse der Präferenzmessung erheblich verzerren,1107 indem sie nicht-kompensatorische Bewertungsstrategien hervorrufen. Eigenschaftsausprägungen gelten als völlig unakzeptabel, wenn ein Entscheidungsträger die Alternative, die diese Ausprägung aufweist, auf jeden Fall ablehnen wird.1108 Auch in diesem Fall handelt es sich nicht mehr um kompensatorische Beziehungen zwischen den Merkmalsausprägungen. Eine völlig unakzeptable Eigenschaftsausprägung kann nicht durch andere, evtl. besonders präferierte Ausprägungen ausgeglichen werden.1109 Die Existenz 1104

Ein Attribut, bei der die Ausprägungen nicht „mutually exclusive“ sind, könnte ein Merkmal wie „Extras“ beim Untersuchungsobjekt „Autos“ mit den Ausprägungen „Sonnendach“, „GPS-Navigation“ oder „erweiterte Garantie“ sein. Untersucht man diese Ausprägungen der Eigenschaft „Extras“ mit Hilfe der Conjoint-Analyse, so können keinerlei Aussagen über die Vorziehenswürdigkeit eines Autos, dass sowohl ein Sonnendach als auch eine erweiterte Garantie aufweist oder über die Präferenz zu Autos ohne jegliche Extras getroffen werden (vgl. Orme (2002c), 2). Eine Eigenschaft, wie das Attribut „Extras“ müsste dementsprechend in drei einzelne Merkmale aufgeteilt werden, die jeweils binär (d.h. Sonnendach vorhanden / nicht vorhanden) codiert sind. 1105 Für einen Überblick über nicht-kompensatorische Entscheidungsstrategien siehe Vriens (1995), 2. 1106 1107 1108 1109

190

Vgl. Keeney; Gregory (2005), 5. McGraw; Tetlock (2005), 3, 12f. Für ein Beispiel siehe Voeth (2000), 69ff. Vgl. Green; Krieger; Bansal (1988), 293; Green; Krieger; Bansal (1988), 293; Hahn (1997), 49; Voeth (2000), 69. Vgl. Voeth (2000), 69.

von völlig unakzeptablen Eigenschaftsausprägungen führt neben der Anwendung von Entscheidungsheuristiken weiterhin dazu, dass der Nutzenunterschied zwischen der völlig unakzeptablen und der präferierten Ausprägung bei dem jeweils betroffenen Merkmal sehr weit wird, d.h. die Bedeutung des Attributs steigt sehr stark an und dominiert die Beurteilungsaufgabe. Völlig unakzeptable Eigenschaftsausprägungen sollten deshalb aus dem Eigenschaftsset ausgeschlossen werden.1110 Dabei ist es möglich, völlig unakzeptable Eigenschaftsausprägungen vor oder nach der Datenerhebung zu eliminieren. Ein Ausschließen der völlig unakzeptablen Merkmalsausprägungen vor der eigentlichen Datenerhebung erscheint vorteilhaft, weil auf diese Weise weniger Einschätzungen vom Befragungsteilnehmer vorgenommen werden müssen, dies die Interviewdauer verkürzt und auf diese Weise indirekt die Motivation und damit verbunden, sich die Ergebnisgüte verbessern könnte.1111 Bestimmung von völlig unakzeptablen Ausprägungen vor der Präferenzmessung

Zur a priori Bestimmung von völlig unakzeptablen Eigenschaftsausprägungen stehen folgende Möglichkeiten zur Verfügung: -

-

direkte, isolierte1112 Einschätzung der Merkmalsausprägungen,1113 direkte, nicht isolierte Festlegung der völlig unakzeptablen Merkmalsausprägungen,1114 direkte, isolierte und „harte“1115 Wortwahl,1116 11-Punkte Rating-Skala, bei der der niedrigste Punktwert („0 Punkte“) die völlig unakzeptablen Eigenschaftsausprägungen bezeichnet und „weiche“ Wortwahl, 11-Punkte Rating-Skala, bei der der niedrigste Punktwert („0 Punkte“) die völlig unakzeptablen Eigenschaftsausprägungen bezeichnet und „harte“ Wortwahl.1117

Die völlig unakzeptablen Eigenschaftsausprägungen können, wie bei der ACA1118 üblich, isoliert vor der eigentlichen Präferenzmessung auf individueller Ebene erhoben und die jeweili-

gen Ausprägungen aus der Untersuchung ausgeschlossen werden, d.h. den Entscheidungsträ-

1110 1111 1112 1113

Vgl. Klein (1987), 154; Green (1984), 158; Mehta; Moore; Pavia (1992), 470; Green; Krieger; Bansal (1988), 293; Voeth (2000), 69, 272. Vgl. Klein (1987), 154; Mehta; Moore; Pavia (1992), 470. Die Ausprägungen eines Merkmals werden unabhängig von den Ausprägungen der anderen Attribute bewertet. Vgl. Klein (1987), 154.

1114

Vgl. Klein (1987), 155; Green (1984), 158f. Dabei werden den Entscheidern zunächst alle Eigenschaften sowie deren Ausprägungen präsentiert und der Befragungsteilnehmer selektiert danach alle Ausprägungen, die er unter Berücksichtigung des gesamten Eigenschaftssets als völlig unakzeptabel einschätzt. 1115 Dies bedeutet, dass die Befragungsteilnehmer explizit darauf aufmerksam gemacht wurden, dass Ausprägungen nur dann “völlig unakzeptabel” sind, wenn Alternativen, die diese Ausprägung aufweisen, auf keinen Fall gekauft werden würden. 1116 Vgl. Mehta; Moore; Pavia (1992), 471ff. 1117 1118

Vgl. Green; Krieger; Bansal (1988), 294. Vgl. Johnson (1987), 259.

191

gern werden die Eigenschaften mit deren Ausprägungen einzeln präsentiert und die Probanden wählen auf individueller Ebene alle völlig unakzeptablen Merkmalsausprägungen aus.1119 Eine solche Vorgehensweise ist allerdings problembehaftet, weil die Selektion völlig unakzeptabler Eigenschaftsausprägungen immer auch von den Ausprägungen aller anderen Merkmale im Eigenschaftsset abhängig, also kontextabhängig ist.1120 Die Eliminierung von Eigenschaftsausprägungen sollte deshalb nicht isoliert, sondern unter simultaner Berücksichtigung aller Eigenschaften und Ausprägungen erfolgen.1121 Aber auch die nicht isolierte Art der Bestimmung der völlig unakzeptablen Merkmalsausprägungen ist u.U. fehlerbehaftet. Es kann nicht ausgeschlossen werden, dass teilweise Ausprägungen als völlig unakzeptabel eingeschätzt werden, die ein Proband später trotzdem wieder akzeptiert.1122 Vermutlich liegt dies ebenfalls daran, dass die unakzeptablen Ausprägungen direkt (d.h. kompositionell), die Präferenzen später jedoch indirekt (und damit dekompositionell) durch eine Variante der Conjoint-Analyse erhoben wurden. Bestimmt man beispielsweise die völlig unakzeptablen Ausprägungen und die Präferenzen direkt (z.B. mit Hilfe der SelfExplicated Präferenzmessmethoden), so treten diese inkonsistenten Einschätzungen nicht1123 oder nur in geringem Maße1124 auf. Weiterhin kann die Wortwahl der Aufgabenstellung einen Einfluss auf die Bestimmung der völlig unakzeptablen Eigenschaftsausprägungen ausüben. Mehta; Moore; Pavia (1992, 474) wiesen beispielsweise die Entscheidungsträger durch die Wortwahl sehr viel deutlicher darauf hin, dass „völlig unakzeptabel“ nur jene Ausprägungen sind, die zur Folge haben, dass einer Alternative bei Vorhandensein dieser Ausprägung in jedem Fall eine Kaufwahrscheinlichkeit von 0% zugewiesen wird. Dies hatte zur Folge, dass im Vergleich zu einer eher „weicheren“ Wortwahl, bei der die Entscheidungsträger lediglich gebeten werden, „alle völlig unakzeptablen“ Ausprägungen zu selektieren, weniger Ausprägungen eliminiert wurden. Die Anzahl der als völlig unakzeptabel bestimmten Ausprägungen ist deshalb von der Wortwahl abhängig.1125 Jedoch auch bei Anwendung der „harten“ Wortwahl werden bei der Profileinschätzung Alternativen akzeptiert, die völlig unakzeptable Ausprägungen aufweisen.1126 Die Bestimmung von völlig unakzeptablen Eigenschaftsausprägungen ist somit derzeit häufig fehlerbehaftet.

1119 1120 1121 1122 1123 1124 1125 1126

192

Vgl. Green; Krieger; Bansal (1988), 293; Klein (1987), 154; Mehta; Moore; Pavia (1992), 472. Vgl. Klein (1987), 154; Mehta; Moore; Pavia (1992), 475. Vgl. Klein (1987), 155. Vgl. Klein (1987), 155ff.; Mehta; Moore; Pavia (1992), 470; Dorsch; Teas (1992), 45. Vgl. Srinivasan (1988), 301. Vgl. Bucklin; Srinivasan (1991), 64. Vgl. Green; Krieger; Bansal (1988), 296; Mehta; Moore; Pavia (1992), 474. Vgl. Green; Krieger; Bansal (1988), 296f.

Wurden völlig unakzeptable Eigenschaftsausprägungen bestimmt und aus der Untersuchung ausgeschlossen, so könnte diesen nicht untersuchten Eigenschaftsausprägungen im Anschluss ein so geringer (also negativer) Teilnutzenwert zugewiesen werden, dass die Alternativen, die diese Ausprägung aufweisen, in jedem Fall einen geringeren Gesamtnutzen bzw. eine geringere Kaufwahrscheinlichkeit als alle anderen Stimuli haben.1127 Es ist ebenso möglich, diesen Ausprägungen einen Teilnutzenwert von „0“ zuzuweisen. Dies würde aber lediglich bedeuten, dass die Ausprägung von den Entscheidungsträgern zwar nicht bevorzugt, aber dennoch auch nicht völlig abgelehnt werden, d.h. man geht dann davon aus, dass die Probanden auch völlig unakzeptable Ausprägungen mit Hilfe von kompensatorischen Entscheidungsstrategien bewerten.1128 Folgt man dieser Argumentation, stellt sich zwangsläufig die Frage, warum völlig unakzeptable Eigenschaftsausprägungen überhaupt erhoben werden sollten, denn letztendlich entstehen Verzerrungen gerade durch die Anwendung nicht-kompensatorischer Entscheidungsstrategien. Die a priori Entfernung von völlig unakzeptablen Eigenschaftsausprägungen führt zu einer einfacheren Entscheidungsaufgabe und damit für die Befragungsteilnehmer zu tendenziell sichereren Bewertungen.1129 Allerdings zeigen verschiedene Studien, dass sich die Ergebnisgüte der Präferenzmessung bei Entfernung dieser Ausprägungen nicht verbesserte bzw. teilweise sogar verschlechterte. Bei einer Untersuchung von Green; Krieger; Bansal (1988, 298) führte beispielsweise die Eliminierung völlig unakzeptabler Eigenschaftsausprägungen zu einer Verringerung der internen Validität. In den Studien von Klein (1986, 157) und Mehta; Moore; Pavia (1992, 473ff.) führt der Ausschluss der unakzeptablen Ausprägungen entgegen der Annahmen nicht zu einer Verbesserung der Prognosevalidität.1130 Bevor diese Ausprägungen ausgeschlossen werden können, muss der Marktforscher deshalb sicherstellen, dass die jeweilige Eigenschaftsausprägung tatsächlich für einen Entscheidungsträger völlig unakzeptabel ist. Dies ist notwendig, da Befragungsteilnehmer teilweise multiattributive Stimuli als akzeptabel ansehen, obwohl diese aus ihrer Sicht eigentlich völlig unakzeptable Ausprägungen enthalten.

1127 1128 1129 1130

Vgl. Mehta; Moore; Pavia (1992), 470; Bucklin; Srinivasan (1991), 64; Fischer (2001), 116. Vgl. Green; Krieger; Bansal (1988), 298. Vgl. Klein (1987), 157. Völlig unakzeptable Eigenschaftsausprägungen haben zur Folge, dass keine kompensatorischen Bewertungen, d.h. Trade-off Entscheidungen vom Befragungsteilnehmer vorgenommen werden – der verzerrende Effekt ist somit die Anwendung nicht-kompensatorischer Bewertungsstrategien. Es ist jedoch fraglich, ob mit Hilfe von Gütemaßen wie der internen Validität oder der Prognosevalidität überhaupt die Anwendung bestimmter Entscheidungsstrategien eingeschätzt werden kann. Dies bedeutet auch, dass eine bessere Repräsentation des Bewertungsprozesses keine höhere Vorhersagegüte garantiert (siehe dazu Klein (1987), 154).

193

Bestimmung von völlig unakzeptablen Ausprägungen nach der Präferenzmessung

Stellt sich nach der eigentlichen Befragung heraus, dass eine Eigenschaftsausprägung als völlig unakzeptabel wahrgenommen wurde, so könnten: -

-

alle Stimuli, die unakzeptable Ausprägungen aufweisen, aus der Untersuchung ausgeschlossen werden oder der völlig unakzeptablen Eigenschaftsausprägung ein so niedriger Teilnutzen zugewiesen werden, dass die Stimuli, die diese Ausprägung aufweisen, in einer Marktsimulation nicht mehr gewählt werden.1131

Eine einfache Eliminierung aller Alternativen, die eine völlig unakzeptable Ausprägung aufweisen, ist meist nicht möglich, da das resultierende Erhebungsdesign nicht mehr orthogonal ist und so u.U. die Haupteffekte (d.h. die Teilnutzen) gar nicht mehr geschätzt werden können. Auch die Zuweisung eines fiktiven, niedrigen Teilnutzenwertes ist problematisch, weil so die Bedeutungsgewichte der Eigenschaften, die wie in Kapitel 3.8 beschrieben, abhängig von der Bandbreite der Teilnutzenwerte sind, künstlich verzerrt werden – die Bandbreite wird so zum Teil völlig subjektiv vom Marktforscher festgelegt. Dies hat zur Folge, dass Eigenschaften, die in realen Kaufentscheidungsprozessen kaum eine Rolle spielen durch das Vorhandensein einer völlig unakzeptablen Eigenschaftsausprägung zur bedeutendsten Eigenschaft werden. Grenzen bei der Bestimmung unakzeptabler Stimuli

Ein weiteres Hauptproblem ist, dass das Vermeiden von Taboo Trade-offs oder die Eliminierung einzelner völlig unakzeptabler Eigenschaftsausprägungen nicht sicherstellt, dass tatsächlich alle zu bewertenden Stimuli von den Entscheidungsträgern als grundsätzlich akzeptabel eingeschätzt werden.1132 Die Akzeptanz aller Merkmalsausprägungen ist deshalb lediglich eine notwendige, allerdings keine hinreichende Bedingung für die Akzeptanz von multiattributiven Produktalternativen. Mit völlig unakzeptablen Eigenschaftsausprägungen ist nur zu rechnen, wenn innerhalb einer Studie zur Präferenzmessung sehr unterschiedliche Zielgruppen ein einheitliches Eigenschaftsset bewerten sollen. Die Bewertung einer Ausprägung als „unakzeptabel“ hängt von

den individuellen Referenzpunkten1133 - d.h. den bisherigen Produkterfahrungen - ab. Zudem führen zu große, vom Marktforscher bestimmte Bandbreiten der Merkmalsausprägungen zu unakzeptablen Ausprägungen und zur Anwendung nicht-kompensatorischer Entschei1131 1132 1133

194

Vgl. Hair; Anderson; Tatham; Black (1998), 408. Vgl. Dorsch; Teas (1992), 45. Vgl. Park; Jun; Macinnis (2000), 188f.

dungsregeln.1134 Die Bandbreiten der zu untersuchenden Ausprägungen sollten deshalb zielgruppenspezifisch und auf der Basis von Kundenbefragungen bestimmt werden.

4.2.5 Eindeutigkeit

Eigenschaften müssen konkret und eindeutig formuliert werden, um unterschiedliche Interpretationen der Entscheidungsträger und damit verzerrte Entscheidungen zu vermeiden.1135 Unkonkrete Beschreibungen wie „hohe“ Kosten sollten dagegen vermieden werden.1136 Au-

ßerdem darf die Ausprägung einer Eigenschaft keine Bandbreite darstellen. Die Ausprägung „Kosten in Höhe von 10 – 20 Euro“ kann beispielsweise nicht sinnvoll bewertet werden.1137 Bei der Nutzung von Bandbreiten als Merkmalsausprägungen kann ein Entscheider keinen einzelnen Nutzen, sondern lediglich mögliche Nutzenbandbreiten bestimmen. Eine Präferenzbewertung ist allerdings ein eindimensionales Urteil, d.h. eine einzelne Einschätzung zur Vorziehenswürdigkeit einer Alternative im Vergleich zu anderen Stimuli. Sollen deshalb Bandbreiten an Ausprägungen untersucht werden, so müssen diese in Form von verschiedenen, konkreten Einzelausprägungen untersucht und bewertet werden. Gleiches gilt für Merkmalsausprägungen wie „40 %-ige Wahrscheinlichkeit für Kosten von X“. Hier ist es einem Befragungsteilnehmer unmöglich, eine eindeutige Bewertung vorzunehmen. Zum einen ist die Ausprägung mit einem Risiko verbunden, der Proband kennt also die tatsächlich realisierte Ausprägung nicht und kann deshalb keine eindeutige Einschätzung vornehmen. Die Verfahren zur Präferenzmessung basieren deshalb auf sicheren Informationen bezüglich der Eigenschaften und der realisierten Ausprägungen.1138 Andererseits ist durch eine solche Beschreibung die Bandbreite der möglichen Ausprägungen aus Sicht des Entscheiders völlig offen. Eigenschaftsbeschreibungen wie „x %-ige Wahrscheinlichkeit für das

1134

Vgl. Klein; Bither (1987), 250.

1135

Vgl. Keeney; Gregory (2005), 3f.; Orme (2002c), 1; Ratneshwar; Shocker; Stewart (1987), 531; Schneider (2005), 717; McCullough (2002b), 21; Payne; Bettman; Schkade (1999), 245; Hair; Anderson; Tatham; Black (1998), 405f. Eng mit der Forderung nach Eindeutigkeit der Benennung der Eigenschaften und Ausprägungen ist die Anforderung an die Operationalisierbarkeit der Ausprägungen verbunden. Dies bedeutet, dass die Eigenschaftsausprägungen überhaupt mit einem angemessenen Aufwand sinnvoll bestimmt werden können. Während bei der Präferenzmessung dies typischerweise gegeben ist, weil potenzielle Konsumenten die Alternativen lediglich anhand der für sie wahrnehmbaren Eigenschaften einschätzen können (siehe Kapitel 2.3), ist die Operationalisierbarkeit von Ausprägungen im Rahmen der Entscheidungsanalyse nicht in jedem Fall gegeben. Hier ist es beispielsweise möglich, dass die tatsächlichen Ausprägungen von Indikatoren zur Einschätzung verschiedener Länder nicht ohne weiteres bestimmbar sind (vgl. Keeney; Gregory (2005), 5). 1136 Vgl. Keeney; Gregory (2005), 4; Schneider (2005), 717. 1137 1138

Vgl. Keeney; Gregory (2005), 4; Orme (2002c), 1. Vgl. Klein; Scholl (2004), 325f.; Nitschke; Völckner (2006), 745.

195

Eintreffen von Y“ sind somit keine eindeutige Entscheidungsgrundlage zur Ableitung von Präferenzen.1139 Beispiele für weitere nicht eindeutige Merkmalsausprägungen finden sich in der Studie von

Perrey (1998, 179). Einige der dort untersuchten Merkmale und Ausprägungen sollen im Folgenden präsentiert (siehe Tabelle 13) und kurz diskutiert werden. Eigenschaft Sauberkeit Sitzkomfort Spezialabteile Verspätung

Ausprägungen Standardreinigung, mehrfache Reinigung normal, verbessert nicht vorhanden, vorhanden mehr als 5 Minuten möglich, mehr als 5 Minuten nahezu ausgeschlossen

Tabelle 13: Beispiele für nicht eindeutige Merkmalsbeschreibungen beim Untersuchungsobjekt „Bahnreise“

Die Ausprägungen der Eigenschaft „Sauberkeit“ sowie „Sitzkomfort“ sind nicht eindeutig formuliert. Entsprechend der individuellen Vorkenntnisse mit dem Untersuchungsobjekt könnten die Ausprägungen „Standardreinigung“ und „normal(er)“ Sitzkomfort bei den Entscheidern sehr unterschiedliche Nutzenvorstellungen hervorrufen. Da die bisherigen Produkterfahrungen der Befragungsteilnehmer u.U. sehr stark differieren, können anhand der Ergebnisse der Präferenzmessung keine konkreten produktpolitischen Empfehlungen abgeleitet werden. Vielmehr müsste in einem zweiten Schritt auf individueller Ebene untersucht werden, welche Nutzenvorstellungen die Befragungsteilnehmer genau mit diesen Ausprägungen verbinden.1140 Bei den Ausprägungen „mehrfache Reinigung“ und insbesondere bei „verbessert(er)“ Sitzkomfort kann der Entscheidungsträger bei der Bewertung nicht auf bisherige Erfahrungen mit dem Untersuchungsobjekt zurückgreifen, vielmehr sind für diese Ausprägungen eine Vielzahl möglicher Assoziationen denkbar, die eine praktische Nutzung der Befragungsergebnisse stark einschränkt. Auch die Eigenschaft „Spezialabteile“ ist nicht eindeutig beschrieben. Zwar kann der Entscheidungsträger die Ausprägung „Spezialabteile nicht vorhanden“ bewerten, aber bezüglich der Ausprägung „vorhanden“ sind eine Vielzahl an Assoziationen möglich – z.B. Speisewagen, Schlafwagen, Fahrradabteile usw. Da jedoch keine eindeutige Ausprägung spezifiziert wurde, können die Ergebnisse nicht praktisch umgesetzt werden. Letztendlich erscheint die Formulierung der Merkmalsausprägungen der Eigenschaft „Verspätung“ als nicht geeignet. Zum einen werden hier risikobehaftete Ausprägungen untersucht, wobei Risiko aber nicht durch die Methoden der Präferenzmessung abgebildet werden dann. Andererseits handelt es sich bei diesen Beschreibungen nicht um Ausprägungen, sondern um nach oben offene Bandbreiten von Ausprägungen, die lediglich mit unterschiedli1139 1140

196

Vgl. Keeney; Gregory (2005), 4. Eine mögliche Vorgehensweise dazu schlagen Helm; Manthey; Scholl; Steiner (2003, 13). Siehe dazu auch Kapitel 4.1.8.

chen, verbal beschriebenen Eintrittswahrscheinlichkeiten verbunden sind. Letztendlich ist zu vermuten, dass eine Wortwahl wie „möglich“ und „nahezu ausgeschlossen“ zu sehr unterschiedlichen Wahrnehmungen der Entscheidungsträger und deshalb zu sehr unterschiedlichen Bewertungen des tatsächlichen Risikos führt. Eine Ableitung von produktpolitischen Entscheidungen auf Basis eines solchen Eigenschaftssets sollte deshalb kritisch hinterfragt werden. Schließlich ist bei der Nutzung symbolischer Eigenschaften wie „Design“ nicht in jedem Fall eine eindeutige Beschreibung der Merkmalsausprägungen möglich. In diesen Fällen bietet sich die Nutzung multimedialer Darstellungsformen wie Bilder oder Töne an, so dass die jeweiligen Ausprägungen von den Entscheidungsträgern relativ homogen wahrgenommen werden.1141

4.2.6 Relevanz der Eigenschaften

Wie bereits in Kapitel 2.4 beschrieben, bewerten Konsumenten Produkte als Nutzenbündel. Die intervenierende Variable „Nutzen“ ist für den Marktforscher allerdings nicht direkt beobachtbar. Aus diesem Grund muss zunächst ein entsprechendes Nutzenkonstrukt aufgestellt werden.1142 Eigenschaften, die das Konstrukt „Präferenz“ messen sollen, müssen in einem möglichst engen Zusammenhang zu den Nutzenvorstellungen eines Nachfragers stehen.1143 Dabei ist nicht die Sicht eines Anbieters bzw. der Marktforscher entscheidend, sondern allein die Kundensicht.1144

Bei der Selektion von Eigenschaften, die zur Präferenzmessung geeignet erscheinen, wird derzeit vor allem zwischen den Begriffen „Salienz“, „Wichtigkeit“ und „Determinanz“ unterschieden.1145 Im folgenden Kapitel sollen diese Konzepte zunächst vorgestellt und deren Eignung zur Erfassung des Konstrukts „Präferenz“ diskutiert werden. Es stellt sich die Frage, ob eine Eigenschaft im Rahmen der Präferenzmessung salient, wichtig und/oder determinant sein muss, um eine geeignete Beurteilungsdimension darzustellen. Merkmale, die eine enge Beziehung zur Präferenz aufweisen, werden hier als für eine Untersuchung „relevant“ bezeichnet. Grundvoraussetzung, damit Eigenschaften überhaupt relevant sein können, ist, dass die 1141

Vgl. Orme (2002c), 4; Keeney; Gregory (2005), 11. Siehe Kapitel 3.5.

1142

Vgl. Voeth (2000), 24. Homburg; Giering (1996, 5) unterscheiden in diesem Zusammenhang zwischen der Konzeptionalisierung und Operationalisierung von Konstrukten. Die Konzeptionalisierung umfasst die Bestimmung der zu untersuchenden Dimensionen, die Operationalisierung dagegen die Erstellung eines entsprechenden Messinstruments. Das Hauptaugenmerk dieser Arbeit liegt auf der Konzeptualisierung des Nutzenkonstrukts, d.h. der Bestimmung der relevanten Nutzendimensionen sowie deren Ausprägungen. 1143 Vgl. Schweikl (1985), 96ff.; Tscheulin (1991), 1271; Schmidt-Gallas (1998), 31; American Marketing Association (1992), 7; Green; Tull (1982), 464; Beckwith; Lehmann (1975), 265. 1144 Vgl. Hahn (1997), 48. 1145

Siehe beispielsweise Stallmeier (1993), 34ff.

197

Eigenschaften dem Entscheider bekannt sind und er die Ausprägungen einer Alternative wahrnehmen und damit einschätzen kann.

4.2.6.1 Bekanntheit und Wahrnehmbarkeit

Die Beschreibungen der Eigenschaften und Ausprägungen müssen für den Befragungsteilnehmer sinnvolle Informationen darstellen. Er muss die zur Verfügung gestellten Informationen verstehen und anhand dieser ein Urteil über die Alternativen bilden können.1146 Ausgeprägte Präferenzen sind jedoch nur für die Eigenschaften und Eigenschaftsausprägungen vorhanden, für die der Proband bereits über Erfahrungen verfügt; die ihm demnach bekannt sind.1147 Dabei handelt es sich typischerweise um die Merkmale und Ausprägungen durch die die Alternativen des Evoked-Sets beschrieben werden können.1148 Um eigene Produkterfahrungen und Nutzenerwartungen ausbilden zu können, müssen relevante Eigenschaften gleichzeitig auch wahrnehmbar sein, d.h. der Entscheider muss die unterschiedlichen Ausprägungen selbst erkennen und bewerten können.1149 Soll ein Befragungsteilnehmer allerdings Eigenschaften und Ausprägungen bewerten, die er nicht kennt und deren Ausprägungen er nicht wahrnehmen kann, sind keine sinnvollen Antworten zu erwarten1150 - dies betrifft insbesondere die Einschätzung wirklich neuartiger Merkmalsausprägungen.1151 Weiterhin ist bei einer Untersuchung von unbekannten Eigenschaften und Ausprägungen verstärkt mit der Anwendung von Entscheidungsheuristiken zu rechnen.1152 Um die Eigenschaften und Ausprägungen sinnvoll einschätzen zu können, ist es deshalb grundlegend, dass die vorgegebenen Informationen aus Sicht der Entscheider wahrnehmbar sind und aufgrund der bisherigen Erfahrungen diese eingeschätzt werden können.1153

Werden die zu untersuchenden Eigenschaften und Ausprägungen durch das Management festgelegt, kann nicht immer davon ausgegangen werden, dass die Befragungsteilnehmer zu allen Eigenschaften und Ausprägungen bereits über ausgeprägte Präferenzen verfügen. Erfolgt außerdem eine Befragung sehr unterschiedlicher Zielgruppen, ist nicht sichergestellt, dass für alle Befragungsteilnehmer die gleichen Eigenschaften und Ausprägungen aussage1146 1147 1148

Vgl. American Marketing Association (1992), 7; Wilkie; Pessemier (1973), 429; Keeney; Gregory (2005), 5f.; Shocker; Srinivasan (1979b), 14. Vgl. Payne; Bettman; Schkade (1999), 245; Stallmeier (1993), 39. Siehe Kapitel 2.3 und 4.1.4.

1149

Vgl. Herrmann (1998), 28. Siehe auch Kapitel 4.1.1. Eine Konsumentenbefragung zur Erhebung von relevanten Eigenschaften und deren Ausprägungen erscheint demzufolge eine geeignete Möglichkeit, um Eigenschaften und deren Ausprägungen zu bestimmen. Entscheidend ist dabei nicht die objektive Wahrnehmbarkeit von Eigenschaftsausprägungen, sondern die subjektive Wahrnehmung der Entscheidungsträger. 1150 Vgl. Payne; Bettman; Schkade (1999), 255, 262. 1151 1152 1153

198

Vgl. Stallmeier (1993), 39. Vgl. Ratneshwar; Shocker; Stewart (1987), 524 Vgl. Payne; Bettman; Schkade (1999), 256, 262.

kräftig sind. Verschiedene Kundengruppen verfügen vielmehr über unterschiedliche Kenntnisse und Erfahrungen. Auch aus diesem Grund bietet es sich an, verschiedenen Zielgruppen unterschiedliche Eigenschaftssets zur Bewertung vorzulegen.

4.2.6.2 Salienz

Der Begriff „Salienz“ wurde von Krech; Crutchfield (1948, 163) geprägt, die ihn folgendermaßen definieren: „saliency of beliefs is taken as an indication of the importance of beliefs. (...) Saliency refers to the fact that not all of man's beliefs stand out with equal prominence in his cognitive field. He may be more acutely aware of certain of his beliefs than others, they may enter his thoughts more readily, they may be more frequently verbalized - they are, in a word, salient.“1154 Salient sind somit jene Eigenschaften, die besonders leicht aus dem Gedächtnis abrufbar sind, also als erste zu einem bestimmten Untersuchungsobjekt genannt werden können.1155 Menschliche Entscheidungen beruhen in der Realität zumeist auf nur wenigen Eigenschaften bzw. deren Ausprägungen. Fishbein (1967, 395f.) geht davon aus, dass gerade saliente Eigenschaften die persönliche Einstellung zu einem Produkt determinieren.1156 Relevante Eigenschaften werden sehr viel eher mit einem Untersuchungsobjekt in Verbindung gebracht als irrelevante Produktmerkmale.1157 Salienz ist somit ein Indikator für die Relevanz von Eigenschaften.1158 Andererseits werden Eigenschaften, deren Ausprägungen alle ein vom jeweiligen Konsumenten gefordertes Mindestniveau erfüllen und kaum Unterscheidungskraft besitzen, oft als selbstverständlich angenommen und deshalb nicht sofort genannt.1159 Produkteigenschaften, die nicht zur Differenzierung dienen, sind aus diesem Grund typischerweise nicht salient.

Eigenschaften (bzw. deren Ausprägungen) sind tendenziell stärker salient, wenn sie neu sind, sich in einem Veränderungsprozess befinden oder vom Individuum hinterfragt werden.1160 Auch die letztmalige Konfrontation mit einer bestimmten Eigenschaft kann dazu führen, dass

1154

Auch in späteren Studien zu Bestimmung der Eigenschaften für die Präferenzmessung wurde auf diese Definition zurückgegriffen. Siehe u.a. Alpert (1980), 83 oder Stallmeier (1993), 35; Schubert (1991), 187; Reiners (1996), 33f.; Wilkie; Pessemier (1973), 432; Lürssen (1989), 172. 1155 Vgl. Reiners (1996), 33f.; Perrey (1998), 44. 1156 1157 1158 1159 1160

Siehe auch Kroeber-Riel; Weinberg (2003), 201 oder Alpert (1980), 84; Melles (2001), 142. Gierl (1995, 40) bezeichnet deshalb die salienten Eigenschaften sogar als die „Endauswahlmerkmale“. Vgl. Böhler (1979), 267. Vgl. Krech; Crutchfield (1948), 163; Wilkie; Pessemier (1973), 428. Vgl. Krech; Crutchfield (1948), 163f. Vgl. Krech; Crutchfield (1948), 164.

199

eine Eigenschaft besonders salient ist.1161 Aus diesem Grund kann die Kommunikationspolitik von Unternehmen einen Einfluss auf die Salienz von Eigenschaften und damit letztendlich auf Kaufentscheidungen ausüben. Saliente Eigenschaften können durch Methoden wie der Elicitation-Technique1162 oder die Repertory-Grid-Methode1163 erhoben werden. Obwohl Einigkeit darüber besteht, dass lediglich saliente Eigenschaften weiter untersucht werden sollten,1164 bereitet die praktische Umsetzung dieser Methoden immer dann Probleme, wenn die Probanden bei einigen Produktgruppen selbst nicht genau wissen, warum sie ein Produkt wählen.1165 Zudem sind einige der als salient bezeichneten Eigenschaften u.U. wichtiger als andere,1166 so dass eine Erhebung der salienten Eigenschaften allein nicht ausreicht. Die möglicherweise zahlreichen, von den Befragungsteilnehmern genannten Eigenschaften müssen daher auf die tatsächlich entscheidungsrelevanten Eigenschaften gekürzt werden.

4.2.6.3 Wichtigkeit

Es existiert eine Vielzahl an Definitionen für den Begriff „Wichtigkeit“ (bzw. „Importance“) von Eigenschaften, die eine sehr unterschiedliche Bedeutung besitzen.1167 Manchmal werden Eigenschaften als wichtig bezeichnet, wenn sie besonders präferenzrelevant sind.1168 Andere Autoren vermuten, dass sämtliche Produktmerkmale, die der Entscheidungsträger in irgendeiner Art und Weise bei der Produktbeurteilung heranzieht, „wichtig“ sind.1169 Teilweise wird davon ausgegangen, dass Eigenschaften so etwas wie eine „generelle“ bzw. Wichtigkeit „an sich“ besitzen, die unabhängig von den Ausprägungen ist.1170 Aufgrund dieser sehr unterschiedlichen Interpretationen dafür, was die „Wichtigkeit“ einer Eigenschaft ausmacht, muss bei der Wichtigkeitsabfrage mit irreführenden Ergebnissen gerechnet werden.1171

1161 1162 1163 1164

Vgl. Reiners (1996), 33f. Siehe Kapitel 5.2.1.1. Siehe Kapitel 5.2.1.2. Vgl. Wilkie; Pessemier (1973), 432; Stallmeier (1993), 35.

1165

Vgl. Stallmeier (1993), 35. Dies gilt insbesondere für Produkte, bei denen eher mit einem verkürzten Kaufentscheidungsprozess, d.h. keiner intensiven Informationssammlung bezüglich der Merkmale und Ausprägungen der am Markt verfügbaren Alternativen, zu rechnen ist (siehe dazu Kapitel 2.3). Es handelt sich dabei z.B. um Konsumgüter. Diese Produktgruppen sind aber generell weniger geeignet, um mit Hilfe von Verfahren zur Präferenzmessung Wahlentscheidungen zu prognostizieren. 1166 Vgl. Day (1972), 280. 1167

Vgl. Krech; Crutchfield (1948), 251; Day (1972), 280; Alpert (1980), 84; Stallmeier (1993), 36; Reiners (1996), 33; Alpert (1980), 84; Perrey (1998), 44f.; Neslin (1981), 80f.; Srinivasan (1988), 296; Böcker (1986), 561. Johnson (1987, 260) beschreibt deshalb den Begriff Wichtigkeit als „slippery idea“. 1168 Die Definition erfolgt damit analog zu Reiners (1996), 33 bzw. Wilkie; Pessemier (1973), 433. 1169 1170 1171

200

Vgl. Lürssen (1989), 172. Siehe u.a. Borcherding (1983), 114; Höser (1998), 56. Vgl. Wilkie; Pessemier (1973), 433.

Bei Eigenschaften handelt es sich jedoch gemäß der Definition in Kapitel 4 lediglich um Bewertungsdimensionen, die es ermöglichen, Alternativen überhaupt auf einem bestimmten Maßstab miteinander vergleichen zu können. Einem Bewertungsmaßstab „an sich“ kann aber kein Bedeutungsgewicht zugewiesen werden. Da die Bedeutung von Eigenschaften immer von der Bandbreite der Eigenschaftsausprägungen abhängt, erscheint eine allgemeingültige Einschätzung der Wichtigkeit einer Eigenschaft losgelöst von ihren Ausprägungen vielmehr unmöglich.1172 Die Erkenntnis, dass „allgemeine“ Wichtigkeitseinschätzungen von Eigenschaften nicht zur Prognose von Wahlentscheidungen geeignet sind, ist allerdings nicht neu.1173 Bereits Mikes; Hulin (1968, 397) untersuchten den Zusammenhang zwischen allgemeinen Wichtigkeitseinschätzungen von Merkmalen und Wahlentscheidungen. In dieser Studie wurden lediglich geringe Übereinstimmungen festgestellt. Daher verwundert es, dass, wie bereits beschrieben, einige Autoren davon ausgehen, dass Eigenschaften ein von den Ausprägungen unabhängiges Bedeutungsgewicht zugewiesen werden kann. Die Wichtigkeit einer Eigenschaft ist zusammenfassend kein geeignetes Maß um Eigenschaften, die im Rahmen einer Studie zur Präferenzmessung untersucht werden sollen, zu selektieren.

4.2.6.4 Determinanz

Determinanz bezeichnet Eigenschaften, die „decisive“ und damit für eine Entscheidung ausschlaggebend sind.1174 Dies bedeutet, dass eine direkte Beziehung zwischen den Eigen-

schaftsausprägungen und der Präferenz bezüglich eines Untersuchungsobjektes bestehen muss,1175 d.h. der von einem Entscheider individuell wahrgenommene Nutzenunterschied zwischen den untersuchten Ausprägungen einer Eigenschaft ist bei determinanten Merkmalen groß genug, um Einfluss auf die Wahlentscheidungen auszuüben. Im Rahmen von Studien zur Präferenzmessung interessieren lediglich die Merkmale, die in enger Beziehung zur Präferenz bzw. zur Kaufentscheidung stehen. Bestimmte Eigenschaf-

ten können zwar von den Konsumenten als „allgemein wichtig“ empfunden werden (z.B. das Attribut „Sicherheit“ bei Autos), wenn jedoch alle Produkte am Markt bzw. alle relevanten Alternativen gleiche oder ähnliche Ausprägungen aufweisen, verliert diese Eigenschaft ihre

1172 1173 1174 1175

Entsprechend werden die Ergebnisse bei reinen Wichtigkeitseinschätzungen oft kritisch gesehen. Siehe dazu beispielsweise eine Übersicht verschiedener Studien in Wilkie; Pessemier (1973, 432). Vgl. Mikes; Hulin (1968), 397. Siehe auch Gibson (2001), 18; Johnson (1987), 260. Siehe auch Kapitel 5.2.2.2. Vgl. Myers; Alpert (1968), 13. Siehe analog dazu auch Shocker; Srinivasan (1979b), 5; Hahn (1997), 49. Vgl. Keeney; Gregory (2005), 5.

201

Bedeutung bei der Präferenzbildung.1176 Determinante Eigenschaften geben deshalb Aufschluss über Differenzierungsmöglichkeiten der Produkte gegenüber den Wettbewerbern. Einige „wichtige“ Eigenschaften, die als selbstverständlich angesehen werden, führen zwar bei nicht Vorhandensein einer Mindestausprägung zu extremen Reaktionen der Konsumenten,1177 sind bestimmte Anforderungen jedoch erfüllt, würdigt dies der Kunde nicht besonders, da die anderen Anbieter am Markt ähnliche Ausprägungen aufweisen.1178 Diese Schwelleneigenschaften sind somit nicht determinant. Lediglich Eigenschaften, deren Ausprägungen einen entscheidungsrelevanten Nutzenunterschied aufweisen sind determinant und sollten in die Präferenzmessung aufgenommen werden. Dabei handelt es sich um Trade-off und Addedvalue Merkmale.1179 Die Determinanz von Eigenschaften ergibt sich aus den untersuchten Merkmalsausprägungen. Je nachdem, welche Ausprägungen die Konkurrenzprodukte aufweisen, ändert sich deshalb die Bedeutung der Eigenschaften für die Präferenzbildung.1180 Dies bedeutet, Determinanz ist wie die Präferenzmessung kontextabhängig - die untersuchten Bandbreiten der Eigenschaftsausprägungen bestimmen, welchen Einfluss ein bestimmtes Attribut auf die Kaufentscheidung ausübt.1181

4.2.6.5 Zwischenfazit zur Bestimmung der Relevanz von Eigenschaften

Es stellt sich nun die Frage, welche der oben genannten Anforderungen an die Eigenschaften und Ausprägungen in der Präferenzmessung erfüllt sein müssen, um diese als „relevant“ bezeichnen und sinnvoll in die Präferenzmessung einbeziehen zu können. Perrey (1998, 45) plädiert dafür, dass zur Selektion von Merkmalen für die Präferenzmessung die Wichtigkeit und nicht die Determinanz einer Eigenschaft als Auswahlkriterium genutzt werden sollte. Würde man sich allein auf determinante Merkmale beschränken, könnte es aus seiner Sicht zu Fehlinterpretationen bei einer späteren Segmentierung der Entscheidungsträger kommen. Deshalb sollten ebenso die „an sich“ wichtigen Merkmale berücksichtigt werden, 1176

Vgl. Myers; Alpert (1968), 14; Myers; Alpert (1997), 50; Hammond; Keeney; Raiffa (1998), 144; Goodwin; Wright (2000), 28f.; von Winterfeldt; Edwards (1986), 285. Lediglich Eigenschaften, deren Ausprägungen einen entscheidungsrelevanten Nutzenunterschied aufweisen, sind determinant und sollten in die Präferenzmessung aufgenommen werden. Dabei handelt es sich um Trade-off und Added-value Merkmale. Siehe Kapitel 4.1.4. 1177 Beispielsweise hat eine geringe Sicherheit bei einem Auto u.U. eine Ablehnung des Produkts zur Folge, ohne dass weitere Eigenschaften berücksichtigt werden. 1178 Vgl. Myers; Alpert (1997), 51. Insofern muss bei der Bestimmung der im Rahmen der Conjoint-Analyse zu untersuchenden Eigenschaften beachtet werden, dass vom Entscheidungsträger je nach Phase im Kaufentscheidungsprozess unterschiedliche Merkmale genutzt werden. 1179 Siehe Kapitel 4.1.4. 1180 1181

202

Vgl. Myers; Alpert (1997), 51. Siehe auch Kapitel 2.2.

selbst wenn diese nicht zur Aufdeckung von möglichen Wettbewerbsvorteilen dienen können.1182 Bei dieser Bewertung wird jedoch vernachlässigt, dass die Relevanz von Eigenschaften, analog zu den erhobenen Präferenzen, ein dynamisches Konzept und damit kontextabhängig ist, d.h. erst die Bandbreite der Nutzenunterschiede zwischen den Ausprägungen eines

Attributs determiniert die Bedeutung dieser Eigenschaft.1183 Ein Merkmal wird nicht dadurch wichtig, dass sie eine gewisse Wichtigkeit „an sich“ besitzt, sondern weil die Bandbreite der Ausprägungen entscheidungsrelevant ist. Eine grundlegende Anforderung an alle Modelle, die das Konsumentenverhalten analysieren, beschreiben Westwood; Lunn; Beazley (1974, 229); demnach muss jedes Verfahren die Grundvoraussetzung der “decision relevance” erfüllen. Dies bedeutet, dass Eigenschaften, die keinen Einfluss auf die Bewertungen ausüben, nicht in das zu untersuchende Eigenschaftsset aufgenommen werden sollten.1184 Relevant sind demnach nur Eigenschaften, die eine ausreichende Unterscheidungskraft aufweisen, dabei kann es sich lediglich um saliente oder determinante Merkmale handeln. Eigenschaften sind nur salient, wenn ihre Ausprägungen nicht als selbstverständlich angesehen werden und entscheidungsrelevante Unterschiede aufweisen.1185 Insofern besteht in der Literatur Einigkeit darüber, dass Eigenschaften im Rahmen der Präferenzmessung salient sein sollten.1186 Jedoch scheint „Salienz“ der Eigenschaften nicht als alleiniges Selektionskriterium von Merkmalen geeignet, da Konsumenten typischerweise eine Vielzahl von Eigenschaften nennen und diese Liste in einem zweiten Schritt reduziert werden muss.1187 Der Begriff „Determinanz“ berücksichtigt zudem explizit die Bandbreiten der wahrgenommenen Ausprägungen und weist einen engen Bezug zum tatsächlichen Kaufverhalten sowie zur Präferenz auf. Weiterhin beruht dies auf dem Konzept der Kontextabhängigkeit von Präferenzen.1188 Auf Basis von Einschätzungen der Determinanz könnte somit die Relevanz von Eigenschaften konkretisiert und die Merkmale selektiert werden, die innerhalb der Präferenzmessung weiter untersucht werden sollten.

1182

Vgl. Perrey (1998), 45. Stallmeier (1993, 35f.) geht, wie auch Perrey (1998, 45), davon aus, dass auch nicht kaufentscheidungsrelevante Eigenschaften, die die Konsumenten als wichtig einstufen, in die Präferenzmessung aufgenommen werden sollten. Er begründet dies an einem Automobil-Beispiel mit der Eigenschaft „Sicherheit“. Wenn alle Autos am Markt über vergleichbare Sicherheitsstandards verfügen, so handelt es sich bei diesem Attribut um keine determinante Eigenschaft. Würde ein Unternehmen die Sicherheit allerdings völlig außer Acht lassen und ein entsprechend unsicheres Produkt anbieten, wird diese Eigenschaft ein „entscheidendes Kriterium“ (Stallmeier (1993), 37). 1183 Dies entspricht der Berechnung der Bedeutungsgewichte im Rahmen der Conjoint-Analyse, die durch die Bandbreite der Teilnutzen einer Eigenschaft im Verhältnis zu den Bandbreiten der Teilnutzen aller Eigenschaften berechnet wird. Siehe beispielsweise Backhaus; Erichson; Plinke; Weiber (2003), 567. 1184 Siehe analog auch Goodwin; Wright (2000), 19. 1185 1186 1187 1188

Vgl. Krech; Crutchfield (1948), 163f.; Albrecht (2000), 32. Vgl. Stallmeier (1993), 35; Wilkie; Pessemier (1973), 432. Vgl. Kotler (1974), 417; Day (1972), 280. Vgl. Myers; Alpert (1997), 50f.

203

Da nicht determinante Merkmale keine Unterscheidungskraft besitzen und damit keine Auswirkungen auf die Bewertungen der Alternativen durch die Entscheidungsträger haben, ist eine Berücksichtigung dieser Eigenschaften im Rahmen der Präferenzmessung nicht sinnvoll.1189 Vielmehr stellen diese „allgemein wichtigen“ Merkmale, deren Ausprägungen keine

ausreichend starken Nutzenunterschiede aufweisen, nichts anderes als Grundanforderungen1190 an ein Produkt dar und somit ein Mindestkriterium, das erfüllt sein muss, damit eine

Alternative überhaupt in das Evoked-Set aufgenommen wird. Zusammenfassend gilt, dass die einem Entscheidungsträger bekannten Eigenschaften und wahrnehmbaren Ausprägungen durch die die Produkte des Evoked-Sets einer Zielgruppe beschrieben werden können und die sowohl salient als auch determinant sind (siehe Abbildung 25), als relevant für die letztendliche Wahlentscheidung für oder gegen eine Produktalternative bezeichnet werden können. Die Determinanz von bekannten und salienten Eigenschaften erscheint somit als ein geeignetes Maß für die letztendliche Selektion der zu untersuchenden Eigenschaften. Bekanntheit u. Wahrnehmbarkeit + Salienz + Determinanz

Beschränkung auf die Eigenschaften und Ausprägungen der Alternativen des Evoked-Set

Relevanz Abbildung 25: Anforderungen an relevante Eigenschaften und Ausprägungen

Die Ergebnisse der Präferenzmessung sind immer kontextabhängig.1191 Deshalb ist es nicht möglich, die geschätzten Teilnutzen bzw. Bedeutungsgewichte von Studien mit unterschiedlichen Bandbreiten zu vergleichen oder diese auf reale Marktverhältnisse zu übertragen, wenn dort andere Bandbreiten üblich sind.1192 Daher sollten schon im Vorfeld der Präferenzmes-

1189

Äußerst problematisch ist es deshalb, wenn die zu untersuchenden Eigenschaften mit Hilfe von Verfahren festgelegt werden, die lediglich die Eigenschaften, aber nicht gleichzeitig die relevanten Merkmalsausprägungen des Evoked-Sets erfassen. So könnten u.U. Merkmale in die Untersuchung aufgenommen werden, die zwar salient und „wichtig“, aber nicht determinant sind und sie letztendlich Grundanforderungen von Alternativen im Evoked-Set darstellen könnten. Werden zudem die zu untersuchenden Ausprägungen vom Marktforscher selbst festgelegt, ist damit zu rechnen, dass völlig unakzeptable Eigenschaftsausprägungen die Ergebnisse der Präferenzmessung verzerren. 1190 Dies entspricht der Definition von Schwelleneigenschaften, siehe Kapitel 4.1.4. Handelt es sich bei diesen als „allgemein wichtig“, aber nicht als determinant eingeschätzten Merkmalen um saliente Eigenschaften, so scheint es allerdings nicht ratsam, diese einfach völlig zu vernachlässigen. Sonst könnte ein Befragungsteilnehmer die Beschreibung der Entscheidungssituation evtl. als unvollständig wahrnehmen. Diese Merkmale werden deshalb im Folgenden lediglich zur Beschreibung des Untersuchungskontextes im Rahmen eines Warm-Up Tasks (siehe Kapitel 6.2.3) und somit als erfüllte Grundanforderungen beschrieben, aber nicht zur Nutzenschätzung herangezogen. 1191 Siehe Kapitel 2.2. 1192

204

Vgl. Sattler; Gedenk; Hensel-Börner (2002a), 24.

sung die für die jeweiligen Zielgruppen1193 relevanten Eigenschaftsausprägungen bestimmt und nur diese in der folgenden Studie untersucht werden.

1193

Zur Segmentierung der Entscheidungsträger sollten dabei sowohl die unterschiedlichen Grundanforderungen als auch die relevanten Eigenschaften und Ausprägungen herangezogen werden.

205

5 Methoden zur Identifizierung von entscheidungsrelevanten Eigenschaften und Ausprägungen

Im Folgenden sollen die wichtigsten Methoden zur Ermittlung von relevanten Eigenschaften vorgestellt und entsprechend ihrer Eignung bewertet werden. Ziel der folgenden Präsentation verschiedener Methoden zur Bestimmung von Eigenschaften ist nicht die detaillierte Beschreibung der Vorgehensweisen oder Auswertungsmöglichkeiten, vielmehr sollen die Verfahren entsprechend ihrer Eignung zur Bestimmung der relevanten Eigenschaften und deren Ausprägungen für eine spätere Conjoint-Analyse eingeschätzt werden. In Abbildung 26 wird ein allgemeiner Überblick über die Möglichkeiten zur Bestimmung von Eigenschaften innerhalb von Studien zur Präferenzmessung gegeben. Dabei unterscheidet man zwischen Verfahren ohne bzw. mit Einbezug potenzieller Kunden. Methoden zur Ermittlung entscheidungsrelevanter Eigenschaften Mit Einbeziehung der potenziellen Kunden Direkte Ansätze

Ohne Einbeziehung der potenziellen Kunden

Indirekte Ansätze

Abbildung 26: Methoden zur Erhebung von relevanten Eigenschaften auf individueller Ebene

Die Verfahren mit Einbezug der Konsumenten lassen sich in direkte und indirekte Vorgehensweisen einteilen.1194 Neben der Analyse auf individueller Ebene können ebenfalls Gruppenbefragungen zur Bestimmung der relevanten Eigenschaften eingesetzt werden, auch auf diese Möglichkeiten wird eingegangen. Da diese Methoden nicht die Ermittlung von relevanten Merkmalsausprägungen ermöglichen, wird in einem letzten Teil dieses Kapitels beschrieben, wie die Ausprägungen bisher festgelegt werden.

5.1

Bestimmung der Eigenschaften ohne Einbezug der Konsumenten

Die in der Präferenzmessung zu untersuchenden Eigenschaften können u.a. durch den Marktforscher selbst oder durch die Befragung von Experten bestimmt werden.1195 Legt der Markt-

1194 1195

Vgl. Quack (1980), 28. Vgl. Hair; Anderson; Tatham; Black (1998), 392. Gibson (2001, 18) geht sogar davon aus, dass es keine Alternative dazu gibt, dass Experten bzw. der Marktforscher selbst die Eigenschaften und Ausprägungen festlegen. Dabei ist ihm jedoch bewusst, dass diese vor der Präferenzmessung oft nicht einschätzen können, ob bestimmte Eigenschaften und Ausprägungen aus Sicht der Konsumenten relevant sind. Er plädiert deshalb dafür, möglichst alle Eigenschaften und Ausprägungen, die irgendwie Einfluss auf die Wahlentscheidung von Konsumenten haben könnten, in eine Untersuchung aufzunehmen.

207

forscher die Eigenschaften fest, so geht er dabei „von [seinem] Alltagsverständnis“ 1196 aus. Dabei unterstellt er, dass für die Befragungsteilnehmer die gleichen Eigenschaften und Ausprägungen relevant sind wie für ihn selbst.1197 Vermutlich wird diese „Methode“ zur Bestimmung der zu untersuchenden Eigenschaften relativ häufig in der Praxis genutzt,1198 denn nach einer Meta-Studie von Schubert (1991, 317) gaben immerhin 44,5% der untersuchten Studien nicht an, wie die zu untersuchenden Eigenschaften und deren Ausprägungen ermittelt wurden. Auch Experteninterviews werden zur Bestimmung der zu untersuchenden Eigenschaften in der Praxis oft eingesetzt. Man erhofft sich so „brauchbare“ Ergebnisse bei geringen Anstrengungen.1199 Hierbei können z.B. Mitarbeiter des Verkaufspersonals,1200 Produktmanager,1201 Mitarbeiter aus der Forschung und Entwicklung,1202 der jeweilige Auftraggeber1203 oder sonstige Experten1204 befragt werden. Diese Herangehensweise ist insofern problematisch, als das Management den Einfluss der Produktattribute erst durch die Präferenzmessung bestimmen möchte. Eine Beschränkung auf die von den Experten bestimmten Eigenschaften und Ausprägungen kann jedoch den Aussagewert der Präferenzmessung sehr stark verringern, z.B. wenn es sich bei diesen Eigenschaften nicht tatsächlich um die präferenzrelevanten Merkmale aus Konsumentensicht handelt.1205 Es besteht die Möglichkeit, dass den Experten die tatsächlich entscheidungsrelevanten Eigenschaften unbekannt sind, so dass diese in der späteren Conjoint-Analyse nicht berücksichtigt werden können.1206 Die Sicht und Bedürfnisse der Konsumenten werden durch diese Vorgehensweise möglicherweise ignoriert; „old ‚knowledge’ may be confirmed or refuted, but there is little likelihood of new learning”.1207 Obwohl Experteninterviews daher nur eingeschränkt

1196

Beck; Opp (2001), 287. Zudem ist es möglich, dass eine Liste von potenziell wichtigen Eigenschaften durch Konsumentenbefragungen ermittelt wird. Jedoch werden danach vom Marktforscher aufgrund seiner bisherigen Erfahrungen mit dieser Produktkategorie die im Folgenden zu untersuchenden Eigenschaftsausprägungen bestimmt (vgl. Reynolds; Gutman (1988),15). Eine ähnliche Vorgehensweise stellen „informelle Gespräche“ dar; zwei oder mehr Marktforscher legen dabei die relevanten Eigenschaften und deren Ausprägungen fest. 1197 Beispiele für diese Art der Bestimmung der relevanten Eigenschaften und deren Ausprägungen sind u.a. Wittink; Krishnamurthi; Nutter (1982), 471; Wittink; McLauchlan; Seetharaman (1999), 231; Wittink; Huber; Zandan; Johnson (1992), 5. 1198 Vgl. Wilkie; Pessemier (1973), 432; Stallmeier (1993), 40. 1199

Vgl. Stallmeier (1993), 40. Reibstein; Bateson; Boulding (1988, 275) bezeichnen Experteninterviews sogar als „typische“ Vorgehensweise bei der Entwicklung einer Conjoint Befragung. Siehe auch Acito; Jain (1980), 106; Mengen (1993), 84; Gierl; Helm (2000), 9; Wilkie; Pessemier (1973), 429; Perrey (1998), 55; Theuerkauf (1989), 1180. 1200 Vgl. Schweikl (1985), 92; Green; Srinivasan (1978), 105. 1201 1202 1203 1204 1205 1206 1207

208

Vgl. Schweikl (1985), 92; Green; Srinivasan (1978), 105; Albrecht (2000), 35. Vgl. Reibstein; Bateson; Boulding (1988), 275; Albrecht (2000), 35. Vgl. Cattin; Wittink (1982), 46; Hartmann (2004), 14; Hausruckinger (1993), 145. Vgl. Schmidt (1990), 271. Vgl. Schweikl (1985),100; Gibson; Marder (2002), 48. Eine Festlegung der zu untersuchenden Eigenschaften ist allerdings nie frei von subjektiven Einschätzungen der Experten (vgl. Green; Srinivasan (1978), 105). Vgl. Schubert (1991), 180. Gibson; Marder (2002), 47.

angewendet werden können, erfreuen sie sich in der Praxis bei den Marktforschern hoher Beliebtheit. Ein Grund für den häufigen Einsatz dürfte, wie beschrieben, in den vergleichsweise geringen Kosten zur Generierung von Produktattributen liegen.1208 Eine weitere Möglichkeit zur Ermittlung eines zu untersuchenden Merkmalssets besteht darin, einfach jene Eigenschaften zu nutzen, die bereits in anderen Studien verwendet wurden.1209 Bei der Anwendung einer solchen Vorgehensweise geht man davon aus, dass in der Studie, auf die Bezug genommen wird, die tatsächlich relevanten Eigenschaften und Ausprägungen bestimmt werden konnten und dass die Befragungsteilnehmer der beiden Studien ähnliche Bedürfnisse aufweisen. Eine solche Vorgehensweise setzt voraus, dass vergleichbare Zielgruppen befragt werden und die Präferenzen zeitlich relativ stabil sind, d.h. da die zweite Studie zeitlich der ersten nachgelagert ist, dürfen sich die Präferenzen und die Marktbedingungen nicht geändert haben. Dies ist z.B. dann nicht der Fall, wenn sich aufgrund von Produktneuheiten die Bandbreite der Eigenschaftsausprägungen verändert hat. Neuprodukteinführungen können außerdem bewirken, dass vorher nicht entscheidungsrelevante Produktdimensionen nun in die Befragung aufgenommen werden müssten. Insofern kann zusammenfassend festgestellt werden, dass die einfache Übernahme von Eigenschaften und Ausprägungen nur dann eine geeignete Methode darstellt, wenn identische Zielgruppen mit identischen Bedürfnissen unter gleichen Marktbedingungen befragt werden. Vorteil dieser Vorgehensweise ist, dass es sich wohl um die einfachste Art der Bestimmung von Eigenschaften und Ausprägungen handelt. Die Analyse von Sekundärmaterial wie Prospekten, Testberichten, Fachliteratur, Produktbeschreibungen in Geschäften, auf Verpackungen oder Websites ist eine weitere Möglichkeit, um die relevanten Eigenschaften zu bestimmen.1210 Hauptvorteil dieser Vorgehensweise ist wie bei allen bisher präsentierten Methoden, die sehr leichte Umsetzbarkeit.1211 Weiterhin können reale Produkte in ihre Bestandteile zerlegt und auf diese Weise Eigenschaften und Ausprägungen bestimmt werden.1212 Der Nachteil einer solchen Vorgehensweise ist, dass so zwar eine Vielzahl an Bewertungsdimensionen bestimmt werden könnte, jedoch keinerlei Informationen über deren Einfluss auf die Kaufentscheidung vorliegen. 1208

Vgl. Cattin; Wittink (1982), 46.

1209

Siehe zum Beispiel Reiners (1996), 190f.; Green; Krieger; Schaffer (1993), 346; Skim Software (2003), 1; Wittink; Seetharaman (1999), 273. Teilweise wird von den Autoren nicht einmal die entsprechende Quelle genannt. Siehe beispielsweise Jaccard; Brinberg; Ackerman (1986, 464); Huber; Wittink; Fiedler; Miller (1993,111); Rosko; DeVita; McKenna; Walker (1985, 29) und Steenkamp; Wittink (1994, 280), die lediglich schreiben, dass die Festlegung der zu untersuchenden Eigenschaften “based on previous research” ist. 1210 Vgl. Schweikl (1985), 92; Acito; Jain (1980), 106; Mengen (1993), 84; Schubert (1991), 180; Melles (2001), 39; Gierl; Helm (2000), 9; Höser (1998), 109, 154, 159f.; Voeth (2000), 237; Perrey (1998), 55f.; Albrecht (2000), 35; Theuerkauf (1989), 1180. 1211 Vgl. Schweikl (1985), 92. 1212

Melles (2001, 41) bezeichnet diese Vorgehensweise als „Attribut-Listing“.

209

Der Hauptvorteil aller Methoden ohne Einbezug von Kunden ist, dass diese relativ schnell, unkompliziert und zu geringen Kosten durchgeführt werden können.1213 Verfahren ohne Einbezug von Probanden sollten aber angesichts der diskutierten Nachteile allenfalls ergänzend zu den Methoden mit Einbezug von Kunden eingesetzt werden.1214 Sie können keineswegs garantieren, dass die für die Befragungsteilnehmer tatsächlich relevanten Eigenschaften bestimmt werden können.1215 Zudem ist unklar, ob die Befragungsteilnehmer die festgelegten Produktmerkmalsbeschreibungen, d.h. die Eigenschaften und deren Ausprägungen, überhaupt verstehen. Auch die Wortwahl sollte demnach aus Sicht der potenziellen Konsumenten erfolgen.1216 Diese „Methoden“ sollten deshalb keinesfalls zur endgültigen Bestimmung von entscheidungsrelevanten Attributen eingesetzt,1217 sondern die relevanten Eigenschaften aus Konsumentensicht festgelegt werden.1218

5.2

Direkte Methoden zur Bestimmung der Eigenschaften

Bei den direkten Methoden zur Erhebung der in der Präferenzmessung zu untersuchenden Eigenschaften aus Nachfragersicht (siehe Abbildung 27) unterscheidet man zwischen Verfahren, bei denen die Befragungsteilnehmer selbst die für sich relevanten Produktdimensionen benennen und Verfahren, bei denen die Probanden eine bereits existierende Attributliste einschätzen. Direkte Ansätze Offene Erhebung von potenziell relevanten Eigenschaften

Einschätzung eines vorgegebenen Attribut-Sets

- Elicitation-Technik - Repertory-Grid Methode - Erhebung von „idealen“ Ausprägungen

- Direkte Einschätzung der Wichtigkeit - Duale Befragung - Jaccard Subjective Probability Measure

Abbildung 27: Direkte Ansätze zur Bestimmung der relevanten Eigenschaften

Im Folgenden werden die verschiedenen Methoden genauer beschrieben sowie deren Vorund Nachteile bei der Bestimmung der für die Präferenzmessung relevanten Eigenschaften diskutiert.

1213 1214 1215 1216 1217 1218

210

Vgl. Cattin; Wittink (1982), 46. Vgl. Schubert (1991), 180. Vgl. Quack (1980), 28; Schubert (1991), 180. Vgl. Louviere (1988b), 52. Vgl. Quack (1980), 28. Vgl. Helm (2001), 31.

5.2.1 Direkte, offene Erhebung von potenziell relevanten Eigenschaften

Bei den direkten, offenen Verfahren zur Erhebung von potenziell relevanten Eigenschaften handelt sich um wenig standardisierte Interviews. Den Befragungsteilnehmern werden möglichst offene Fragen gestellt. Ein geringer Grad an Standardisierung soll dabei sicherstellen, dass die tatsächlich relevanten Eigenschaften erhoben werden können und die Befragungsteilnehmer nicht von den präferenzrelevanten Attributen abgelenkt1219 bzw. durch zu stark standardisierte Befragungsmethoden, die nicht die relevanten Dimensionen berücksichtigen, demotiviert1220 werden. Werden nur wenige Entscheider befragt, ist diese Vorgehensweise problembehaftet, da ein Proband bei der ungestützten Erhebung von Attributen eine für ihn eigentlich wichtige Eigenschaft vergessen könnte.1221 Beruht die Erhebung dagegen auf mehreren Probanden, ist davon auszugehen, dass dieser Effekt eine geringere Rolle spielt. Weitere Grundvoraussetzungen für die Anwendbarkeit dieser Methode sind, dass der Proband die tatsächlichen Kaufgründe kennt und fähig bzw. bereit ist, diese zu nennen.1222 Wie die Conjoint-Analyse selbst, ist die direkte offene Befragung demnach nicht für Produkte geeignet, bei denen habitualisierte Kaufentscheidungsprozesse dominieren.1223 Zur Erhebung der Eigenschaften sollten deshalb die befragten Entscheidungsträger bereits die Phase der Informationssuche und Bewertung im Rahmen des Kaufentscheidungsprozesses durchlaufen haben. Weiterhin kann bei bestimmten Produktkategorien sozial erwünschtes Antwortverhalten nicht völlig ausgeschlossen werden.1224 Dieses Problem betrifft jedoch alle Verfahren der Präferenzmessung. Die Auskunftswilligkeit der Befragungsteilnehmer ist daher eine Grundvoraussetzung für alle Schritte vor und während der Präferenzmessung. Letztendlich ist bei allen Methoden, die auf einen geringen Standardisierungsgrad der Antwortmöglichkeiten bzw. auf offene Fragen setzen, damit zu rechnen, dass das Ergebnis eine Vielzahl an Antwortmöglichkeiten beinhaltet, deren Auswertung und Aggregation mit verschiedenen Problemen verbunden sein kann.1225

1219 1220 1221 1222 1223 1224 1225

Vgl. Melles (2001), 39. Vgl. Schee; Catina (1993), 8. Vgl. Kotler (1974), 417. Vgl. Myers; Alpert (1968), 15f.; Obermiller (1980), 768; Schubert (1991), 182; . Quack (1980), 30. Vgl. Stallmeier (1993), 40f. Vgl. Stallmeier (1993), 40f. Vgl. Berekoven (1993), 106. Die potenziellen Probleme werden in Kapitel 5.2.1.4 diskutiert.

211

5.2.1.1 Elicitation Technik

Die Elicitation Technik ist eine relativ häufig angewendete Methode, um Eigenschaften für die Präferenzmessung festzulegen.1226 Dabei sind zwei verschiedene Verfahrensvarianten möglich: einerseits können die Eigenschaften direkt erhoben und andererseits allgemeine, mit einer Produktgruppe verbundene Assoziationen erfragt werden. So kann man den Probanden mit dem Untersuchungsobjekt konfrontieren und ihn direkt nach den Eigenschaften fragen, die ihm spontan zu der Produktkategorie einfallen.1227 Eine typische Frage wäre dabei: „Bitte nennen Sie die Produktmerkmale, an die Sie denken, wenn ich ... sage!“1228

Der Vorteil dieser Vorgehensweise besteht darin, dass die unmittelbare Reaktion der Befragungsteilnehmer im Vergleich zu den Verfahren, die die Eigenschaften vorgeben, eher realen Beurteilungsprozessen entspricht.1229 Bei der zweiten Variante der Elicitaion-Technik werden die Befragungsteilnehmer gebeten allgemeine Assoziationen, die ihnen spontan im Zusammenhang mit einem bestimmten Un-

tersuchungsobjekt einfallen, zu nennen.1230 Diese Vorgehensweise entspricht somit weitgehend der ersten Verfahrensvariante, wobei jedoch weniger direkt nach Eigenschaften gefragt wird.1231 Vielmehr werden hier eher allgemeine Nutzenvorstellungen erhoben.1232 Die Fragestellung könnte folgendermaßen lauten: „An was denken Sie, wenn ich [...] sage?“1233

Die genannten Assoziationen müssen nach der Erhebung vom Marktforscher interpretiert und in entsprechende Gruppen von Produktattributen zusammengefasst werden.1234 Das Ergebnis dieser beiden Varianten der Elicitation Technik ist meist eine sehr umfangreiche Liste mit möglicherweise relevanten Eigenschaften, die im weiteren Verlauf entsprechend

1226

Vgl. Perrey (1998), 56.

1227

Vgl. Gierl; Helm (2000), 9; Braun; Srinivasan (1975), 375; Lego; Shaw (1992), 389; Jaccard; Brinberg; Ackerman (1986), 464; Schweikl (1985), 93; Böhler (1979), 270. Häufig wird diese Methode der Erhebung der Attribute als „direkte Befragung“ bezeichnet (vgl. Quack (1980), 28). Siehe auch Myers; Alpert (1968), 15; Schubert (1991), 180; Stallmeier (1993), 40; Reiners (1996), 37f.; Müller (1997), 744. Kotler (1974, 417) bezeichnet diese Vorgehensweise als „direkte, unstrukturierte Vorgehensweise“. 1228 Schweikl (1985), 93. 1229

Vgl. Kotler (1974), 417.

1230

Vgl. Reiners (1996), 38. Eine ähnliche Vorgehensweise wird beim Kano-Modell genutzt. Dabei werden jedoch explizit Kundenprobleme und in einem zweiten Schritt Kundenwünsche analysiert (vgl. Bailom; Hinterhuber; Matzler; Sauerwein (1996), 119). 1231 Vgl. Reiners (1996), 38. 1232 1233 1234

212

Siehe Kapitel 4.1.8. Schweikl (1985), 93. Siehe dazu auch Alpert (1980), 83. Vgl. Myers; Alpert (1968), 15.

ihrer Salienz eingeschätzt werden können.1235 Dabei kann die relative Häufigkeit1236 oder die Reihenfolge1237 der Nennung als Entscheidungskriterium bei der Auswahl der relevanten Ei-

genschaften genutzt werden. Den genannten Eigenschaften könnte je nach Reihenfolge der Nennung ein Punktwert zugeordnet werden. Dabei wird zunächst vom Forscher festgelegt, wie viele Eigenschaften er für relevant einschätzt. Lego; Shaw (1992, 389) berücksichtigen beispielsweise lediglich die ersten fünf Attribute. Der zuerst genannten Eigenschaft wird ein Punktwert von „5“ zugewiesen, dem an zweiter Stelle genannten Merkmal ein Wert von „4“ usw. Nennt der Befragungsteilnehmer mehr als fünf Eigenschaften, so werden diese nicht weiter berücksichtigt. Sie erhalten (wie die nicht genannten Produktdimensionen) einen Punktwert von „0“.1238 Alle Eigenschaften, die über die vom Marktforscher subjektiv festgelegten Grenze hinausgehen, werden somit nicht weiter berücksichtigt. Es wird davon ausgegangen, dass diese Attribute völlig unwichtig sind, d.h. sie werden wie eine nicht genannte Eigenschaft behandelt. Dieser Vorgehensweise kann man entgegenhalten, dass der Entscheidungsträger das Merkmal nicht genannt hätte, wenn das Attribut absolut unwichtig wäre. Zudem ist eine solche Transformation von Rangdaten in Punktwerte generell nicht möglich, da so ordinale Daten auf ein Intervallskalenniveau „gehoben“ werden würden.1239 Eine weitere Vorgehensweise zur Auswertung der Rangfolge der genannten Eigenschaften nutzen Jaccard; Brinberg; Ackerman (1986, 464). Dabei werden wiederum den Rangdaten Punktwerte zugewiesen. Dies erfolgt entsprechend Gleichung 22: N i  rni  1 Ni

I ni

(i  I ; n  N )

Gleichung 22

mit: Ini:

Wichtigkeit der n-ten Eigenschaft für den i-ten Probanden,

rni:

Rang der n-ten Eigenschaft bei der Nennung durch den i-ten Probanden,

Ni:

Gesamtanzahl der vom i-ten Probanden genannten Eigenschaften.

1235 1236 1237 1238 1239

Vgl. Kotler (1974), 417. Vgl. Quack (1980), 28; Reiners (1996), 37f.; Lürssen (1989), 175; Braun; Srinivasan (1975), 375. Vgl. Quack (1980), 28; Lego; Shaw (1992), 389; Alpert (1980), 83; Lürssen (1989), 175; Schweikl (1985), 102; Jaccard; Brinberg; Ackerman (1986), 464. Vgl. Lego; Shaw (1992), 389. Vgl. Backhaus; Erichson; Plinke; Weiber (2003), 6.

213

Eigenschaften, die von einem Befragungsteilnehmer i nicht genannt wurden, wird ein Wert von „0“ zugewiesen. Zur Aggregation der Daten wird der Mittelwert der einzelnen Punktwerte berechnet.1240 In der folgenden Tabelle wird ein Beispiel für die Auswirkungen einer solchen Vorgehensweise präsentiert. Der Einfachheit halber wird dabei davon ausgegangen, dass die vier Befragungsteilnehmer die Eigenschaften alle in der gleichen Reihenfolge aufzählen und sich lediglich bezüglich der Anzahl der genannten Produktmerkmale unterscheiden.

Eigenschaft 1 Eigenschaft 2 Eigenschaft 3 Eigenschaft 4 Eigenschaft 5

Proband 1 (nennt 2 Eigenschaften) 1 ( 2 21  1 )

Proband 2 (nennt 3 Eigenschaften) 1 ( 3  31  1 )

Proband 3 (nennt 4 Eigenschaften) 1 ( 4 41  1 )

Proband 4 (nennt 5 Eigenschaften) 1 ( 5 51  1 )

0,5 ( 2  22  1 )

0,67 ( 3  32  1 )

0,75 ( 4  42  1 )

0,8 ( 5  52  1 )

0,68

0

0,33 ( 3  33  1 )

0,5 ( 4  43  1 )

0,6 ( 5  53  1 )

0,36

0

0

0,25

0,4

( 4  44  1 )

( 5  54  1 )

0,16

0

0,2 ( 5  55  1 )

0,05

0

0

Wichtigkeit (Mittelwert der einzelnen Punkte) 1

Tabelle 14: Beispiel für Wichtigkeitsratings anhand von Rangdaten

Anhand der Eigenschaft 2 in Tabelle 14 wird deutlich, dass die Bedeutung einiger Eigenschaften steigt, je mehr weitere Produktmerkmale vom Befragungsteilnehmer genannt werden.1241 Es ist aber unrealistisch anzunehmen, dass bei einer höheren Zahl an salienten Merkmalen die Bedeutung der (an zweiter und folgender Stelle) genannten Eigenschaften steigt. Vielmehr ist plausibel anzunehmen, dass die Bedeutung eines einzelnen Attributs sinkt, je mehr Produktmerkmale ein Proband bei seiner Entscheidung berücksichtigt. Generell ist jede Form der Punktvergabe problematisch, weil, wie beschrieben, den ordinalen Daten metrische Werte zugewiesen werden. Dies ist nicht zulässig.1242 Zudem zeigen verschiedene Untersuchungen, dass die Reliabilität der Reihenfolge der genannten Produktdimensionen meist nicht ausreichend hoch ist.1243 Insofern ist fraglich, ob die Reihenfolge der

1240

Vgl. Jaccard; Brinberg; Ackerman (1986), 464ff.

1241

Werden beispielsweise von einem Entscheider lediglich zwei Merkmale genannt, so erhält Eigenschaft 2 ein Bedeutungsgewicht von „0,5“, nennt ein Proband dagegen insgesamt fünf Attribute, so steigt die Bedeutung von Eigenschaft auf „0,8“ an. 1242 Vgl. Backhaus; Erichson; Plinke; Weiber (2003), 6. 1243

214

Für einen Überblick siehe Lürssen (1989), 175.

Nennung von Eigenschaften überhaupt ein Indiz für die Relevanz von Attributen sein kann.1244 Eine weitere Möglichkeit zur Auswertung der in der Elicitation Technik erhobenen Daten besteht darin, die relative Häufigkeit der Nennung von Eigenschaften als ein Kriterium für deren Bedeutung zu nutzen. Relevant sind demnach die Merkmale, die insgesamt am häufigsten genannt wurden.1245 Diese könnten innerhalb der Conjoint-Analyse weiter untersucht werden.1246 Insgesamt ist die Anwendung der Elicitation Technik zur Bestimmung der entscheidungsrelevanten Eigenschaften kritisch einzuschätzen, da die bisherigen Verfahrensvarianten nicht die salienten Eigenschaftsausprägungen erheben. Da die Bedeutung eines Merkmals jedoch durch die wahrgenommene und damit für den Entscheidungsträger relevante Bandbreite der Eigenschaftsausprägungen bestimmt wird, ist diese Methode ohne weitere Anpassungen nicht geeignet, um allein zur Bestimmung der präferenzrelevanten Eigenschaften im Rahmen der Conjoint-Analyse eingesetzt zu werden.

5.2.1.2 Repertory-Grid Methode

Die Repertory-Grid Methode1247 wurde von Kelly (1955, 219ff.) mit dem Ziel entwickelt, wichtige Bewertungsdimensionen1248 psychischer Prozesse auf individueller Ebene zu erfassen.1249 Ihren Ursprung hat sie in der „Theorie der persönlichen Konstrukte“, bei der davon ausgegangen wird, dass Individuen durch den Einsatz von „Konstrukten“ Ereignisse antizipieren. Als Konstrukte werden hierbei Begriffe, Einstellungen und Überzeugungen einer Person beschrieben, die dem Zweck dienen, die wahrgenommene Realität eines Individuums zu konstruieren.1250 In der ursprünglichen Variante dieses Verfahrens, dem „Role Repertory Test“, werden vom Entscheidungsträger bestimmte Personengruppen eingeschätzt.1251 Das

1244 1245 1246

Vgl. Lürssen (1989), 175. Vgl. Quack (1980), 28; Myers; Alpert (1968), 15. Vgl. Müller (1997), 744.

1247

Es werden weiterhin die Bezeichnungen Role Construct Repertory Test, Rep Test (vgl. Kelly (1955), 219), KonstruktGitter, Kelly-Matrix, Kelly-Grid oder Repgrid-Technik verwendet (vgl. Schee; Catina (1993), 9). Diese Bewertungsdimensionen werden als “persönliche Konstrukte” bezeichnet (siehe Scheer (1996), 14; Green; Tull (1982), 529; Herrmann (1996), 26ff.). 1249 Vgl. Scheer (1996), 16f.; Green; Tull (1982), 529. 1248

1250 1251

Vgl. Scheer (1996), 13f. Vgl. Kelly (1955), 219ff.; Scheer (1996), 16.

215

Ziel des Repertory-Grid Verfahrens im Rahmen der Anwendung auf die Präferenzmessung ist jedoch die Selektion der präferenzrelevanten, also der determinanten Eigenschaften.1252 Die Vorgehensweise bei dieser Methode ist relativ einfach; innerhalb von mehreren Befragungsrunden werden den Probanden jeweils Tripel verschiedener Produktalternativen vorgelegt und die Entscheidungsträger gebeten, jeweils zwei Produkte zu nennen, die einander relativ ähnlich und zu der dritten Alternative möglichst unähnlich sind. In nächsten Schritt wird der Befragungsteilnehmer aufgefordert, sämtliche Eigenschaften zu nennen, die diese Ähnlichkeitsunterschiede hervorrufen. Dem Probanden werden so lange Alternativen-Tripel vorgelegt, bis keine neuen Bewertungsdimensionen mehr genannt werden. Das Zwischenergebnis ist eine Liste mit möglicherweise relevanten Eigenschaften sowie deren Häufigkeit der Nennung.1253 Im Anschluss wird der Befragungsteilnehmer gebeten, möglichst gegensätzliche Ausprägungen für die genannten Attribute zu nennen; diese bilden den negativen und positiven Pol. Aus den gesammelten Daten kann eine Matrix (die „Grid“) erstellt werden.1254 Der Befragungsteilnehmer wird danach gebeten, die Alternativen einem der angegebenen Pole zuzuordnen, d.h. dichotome Urteile abzugeben (siehe Tabelle 15).1255

(1) (2) (3) (4)

positiver Pol eines Merkmals Sehr niedriger Preis Sehr wenige Kalorien Sehr niedriger Fruchtgehalt ...

Erfrischungsgetränk 7-up

Pepsi

Fanta

Sprite

Coke

Bluna

1

0

1

1

0

0

0

1

1

1

0

0

1

0

1

1

0

1

...

...

...

...

...

...

negativer Pol eines Merkmals Sehr hoher Preis Sehr viele Kalorien Sehr hoher Fruchtgehalt ...

1 = tatsächliche Ausprägung entspricht dem positiven Pol 0 = tatsächliche Ausprägung entspricht dem negativen Pol

Tabelle 15: Beispiel für eine Repertory-Grid Ergebnismatrix für einen Probanden mit dichotomen Einschätzungen (Quelle: in Anlehnung an Herrmann (1998), 369)

In diesem Beispiel schätzt der Befragungsteilnehmer eine „7-up“ als Getränk mit einem sehr niedrigen Preis, sehr vielen Kalorien und einem sehr niedrigen Fruchtgehalt ein.

1252

Vgl. Louviere (1988b), 50f.; Herrmann (1998), 368; Green; Srinivasan (1978), 105; Jain; Acito; Malhotra; Mahajan (1979), 315; Louviere (1984a), 148; Perrey (1998), 56f.; Albrecht (2000), 35; Hauser; Urban (1977), 589f. 1253 Vgl. Herrmann (1998), 368f.; Jain; Mahajan; Malhotra (1979), 248; Reiners (1996), 39. 1254 1255

216

Die sich nun anschließenden Verfahrensschritte sind zwar für die Ermittlung von entscheidungsrelevanten Eigenschaften nicht mehr relevant, werden hier jedoch der Vollständigkeit halber kurz erläutert. Vgl. Herrmann (1998), 368f.

Eine weitere Möglichkeit besteht darin, statt der dichotomen Zuordnungen zu den ExtremPolen eine Rating-Skala zu verwenden.1256 Die folgende Tabelle 16 zeigt ein Beispiel für das Produkt „Coca-Cola“. Erfrischungsgetränk Coca-Cola

positiver Pol eines Merkmals (1)

Sehr niedriger Preis

(2)

Sehr wenige Kalorien

(3) (4)

1

2

3

4

5

6

7

negativer

8

9

X

Sehr hoher Preis X

Sehr viele Kalorien

Sehr niedriger Fruchtgehalt X ...

...

Pol eines Merkmals

Sehr hoher Fruchtgehalt ...

...

...

...

...

...

...

...

...

X = Einschätzung der Ausprägung auf einer 9er Rating-Skala

Tabelle 16: Beispiel für eine Repertory-Grid Ergebnismatrix für einen Probanden mit Einschätzungen auf einer 9er Rating-Skala (Quelle: in Anlehnung an Herrmann (1998), 369)

Neben den dichotomen Einschätzungen und den Bewertungen auf Basis einer Rating-Skala können die Produkte je Attribut ebenfalls in eine entsprechende Rangfolge gebracht werden. Anhand der Einschätzungen der Probanden kann die wahrgenommene Ähnlichkeit der Produkte bestimmt werden. Hierzu dienen verschiedene Maße, z.B. der Matching-Score für dichotom bewertete Stimuli oder der Spearman bzw. weitere Korrelationsverfahren wie Bravis und Pearson für auf Rating-Skalen eingeschätzte Alternativen.1257 Wichtig bei der Anwendung dieses Verfahrens ist, dass die zu bewertenden Produkte für die zu befragende Zielgruppe „repräsentativ“ sind - die präsentierten Alternativen sollten also für alle Befragungsteilnehmer relevant und akzeptabel sein. Um mit der Repertory-Grid Methode die tatsächlich relevanten Eigenschaften und Bandbreiten der Eigenschaftsausprägungen ermitteln zu können, ist deshalb eine sorgfältige Vorauswahl der von den Probanden zu bewertenden Produkte notwendig, da diese letztendlich bestimmen, welche Eigenschaften genannt werden. Um die für die zu befragende Zielgruppe relevanten Produkte zu ermitteln, wäre dementsprechend eine Vorstudie notwendig, in der z.B. früheres Kaufverhalten der Befragungsteilnehmer erfasst wird. Aufgrund der hohen Komplexität dieser Befragungstechnik wird sie in der Praxis nur selten zur Bestimmung der relevanten Eigenschaften eingesetzt.1258 Im Gegensatz zur Elicitation Technik werden bei der Repertory-Grid Methode zwar Eigenschaftsausprägungen explizit berücksichtigt. Dabei werden allerdings nur die Extrempunkte der möglichen Eigenschaftsausprägungen erhoben, d.h. zwei extreme Eigenschaftsausprägungen, bei denen nicht klar ist, ob sie für den Befragungsteilnehmer in der tatsächlichen Wahlentscheidung überhaupt relevant sind. Letztlich sind die ermittelten Beschreibungen der Ex1256 1257 1258

Vgl. Herrmann (1998), 370. Vgl. Herrmann (1998), 369f. Vgl. Melles (2001), 41ff.

217

trempunkte nicht eindeutig. So ist die Interpretation der Beschreibung „sehr niedriger Preis“ stark von den eigenen Konsumgewohnheiten und bisherigen Erfahrungen abhängig. Durch die Einteilung der Eigenschaftsausprägungen in einen negativen und positiven Pol erscheint die Anwendung der Repertory-Grid Methode zudem nur für Eigenschaften sinnvoll, denen ein Vektormodell zugrunde liegt. Aus diesem Grund ist dieses Verfahren nur für bestimmte Eigenschaften geeignet. Produktmerkmale, denen das Idealpunkt- oder Teilnutzen-Modell1259 zugrunde liegt, können mit der Repertory-Grid Methode nicht bewertet werden. Die vom Befragungsteilnehmer genannten Produktmerkmale beruhen auf Ähnlichkeits- bzw. Unähnlichkeitseinschätzungen. Die Repertory-Grid Methode ist deshalb nicht zur Bestim-

mung von relevanten Eigenschaften geeignet, die beispielsweise im Rahmen einer ConjointAnalyse untersucht werden sollen. Dies ist nicht möglich, weil davon auszugehen ist, dass zur Einschätzung von Ähnlichkeiten andere Merkmale als zur Bewertung von Produkten im Kaufentscheidungsprozess genutzt werden.1260 Bei Ähnlichkeitseinschätzungen ist eher damit zu rechnen, dass Eigenschaften, die relativ einfach wahrnehmbar sind (z.B. Farbe, Art und Größe der Verpackung usw.) häufiger genannt werden, während bei Präferenzeinschätzungen dagegen die nutzenstiftenden Produktmerkmale im Vordergrund stehen.1261

5.2.1.3 Erhebung „idealer“ Ausprägungen von Produkten

Eine weitere Möglichkeit der direkten, offenen Befragung ergibt sich, indem man die Probanden bittet, aufgrund von relevanten Eigenschaften und Ausprägungen das für sie „ideale“ Unternehmen, Produkt oder Marke zu beschreiben.1262 Ein Vorteil dieser Vorgehensweise besteht darin, dass so ebenfalls saliente Eigenschaftsausprägungen explizit erfasst werden. Allerdings ist auch bei diesem Verfahren die Einschätzung der Produktmerkmale von den zu bewertenden Alternativen abhängig. Problematisch ist zudem, dass sich die Befragungsteilnehmer u.U. kein „ideales“ Produkt vorstellen können1263 und deshalb mit dieser Art der Befragung überfordert sind.1264 Weiterhin ist diese Methode nur dann sinnvoll anwendbar, wenn die Eigenschaftsausprägungen der Produktmerkmale auf Basis eines Idealpunktmodells be-

1259

Für einen Überblick der Nutzenmodelle siehe Kapitel 2.6.

1260

Vgl. Lefkoff-Hagius; Mason (1993), 100, 106; Creusen; Schoormans (1997), 81. Für einen Überblick empirischer Studien siehe Lefkoff-Hagius; Mason (1990), 100. 1261 Vgl. Lefkoff-Hagius; Mason (1990), 103. 1262

In einem zweiten Schritt können reale Unternehmen, Produkte bzw. Marken anhand der genannten Eigenschaften eingeschätzt werden. Durch einen Vergleich der Bewertungen ist es möglich, z.B. neben Eigenschaften auch „Lücken“ in der Konsumentenwahrnehmung zu bestimmen (vgl. Myers; Alpert (1968), 16; Myers; Alpert (1997), 54; Shocker; Srinivasan (1979b), 5f.). 1263 Vgl. Myers; Alpert (1968), 16. Siehe dazu auch Wilkie; Pessemier (1973), 435. 1264

218

Vgl. Stallmeier (1993), 41. Deshalb wurden bei der praktischen Anwendung dieser Methode oft eher enttäuschende Ergebnisse beobachtet (vgl. Wilkie; Pessemier (1973), 435).

schrieben werden können, d.h. die Ausprägungen tatsächlich einen Idealpunkt aufweisen. Beruhen die Eigenschaftsausprägungen stattdessen auf einem Vektormodell oder Teilnutzenmodell, so kann diese Methode nicht genutzt werden.1265 Schließlich werden lediglich hypothetische, positive Extrempole und nicht die gesamte, relevante Bandbreite der Eigenschaftsausprägungen berücksichtigt. Daher ist damit zu rechnen, dass unrealistische Alternativen beschrieben werden, die so nicht in reale Produkte umgesetzt werden können.

5.2.1.4 Auswertung der Erhebungsdaten offener, direkter Verfahren

Bei dieser direkten und wenig strukturierten Art der Erhebung werden saliente Eigenschaften1266 erfasst und somit jene Eigenschaften, die den Befragungsteilnehmern spontan einfallen. Dabei scheint zumindest die Elicitation Technik geeignet, um präferenzrelevante Eigenschaften zu ermitteln. Denn letztendlich sind es die salienten Eigenschaften, die eine Differenzierung vom Wettbewerb ermöglichen.1267 Ausprägungen werden bei der Elicitation Technik jedoch nicht explizit berücksichtigt. Mit Hilfe aller beschriebenen Methoden kann eine Liste mit potenziell relevanten Merkmalen erstellt werden. Die genannten Eigenschaften müssen in einem nächsten Schritt zu Merkmalskategorien zusammengefasst werden.1268 Die endgültige Liste der potenziell relevanten Attributen sollte frei von Doppeldeutigkeit und Redundanz der Eigenschaften sein. Redundanz1269 bedeutet, dass die Befragungsteilnehmer zwei verschiedene Bezeichnungen

für ein Attribut verwenden. So könnten die „Motorleistung“ und die „PS-Zahl“ bei einem Auto als Synonyme wahrgenommen werden und sollten deshalb nicht doppelt in einer Studie untersucht werden. Ein zweites Problem ist die mögliche Doppeldeutigkeit von genannten Attributen. Ein Beispiel im Zusammenhang mit dem Untersuchungsobjekt „Studentenwohnung“ wäre die Eigenschaft „Lage der Wohnung“. Diese Produktdimension ist nicht eindeutig, da unterschiedliche Interpretationsmöglichkeiten dafür bestehen, was der Befragungsteilnehmer damit genau ausdrücken wollte. Mögliche Eigenschaften sind z.B. eine „zentrale Lage zum Stadtzentrum“, eine „ruhige Lage“, eine Lage „in der Nähe der Universität“ usw. - letztendlich sind eine Reihe von Interpretationsmöglichkeiten dieser Eigenschaft denkbar. Diese doppeldeutigen Eigenschaften können nicht sinnvoll gruppiert oder im Rahmen von Studien zur Präferenzmessung untersucht werden.

1265 1266 1267 1268 1269

Vgl. Shocker; Srinivasan (1979b), 6. Siehe Kapitel 4.2.6.2. Vgl. Myers; Alpert (1968), 14. Vgl. Myers; Alpert (1968), 15. Vgl. Goodwin; Wright (2000), 21.

219

Die bisher präsentierten Methoden zur Ermittlung von entscheidungsrelevanten Produktmerkmalen können die Anforderungen nach Redundanzfreiheit und Eindeutigkeit der identifizierten Attribute nicht gewährleisten. Die Faktorenanalyse1270 und Ähnlichkeitsmatrizen1271 sind zwei potenzielle Möglichkeiten, um zumindest redundante Produktmerkmale zu identifizieren. Obwohl die Faktorenanalyse zunächst theoretisch geeignet erscheint,1272 kann sie in der Praxis nicht zur Eliminierung

von redundanten Eigenschaften eingesetzt werden. Hohe Korrelationen zwischen bestimmten Produktmerkmalen können nicht zwangsläufig darauf zurückgeführt werden, dass die Eigenschaften von den Befragungsteilnehmern auch als inhaltlich ähnlich empfunden werden. Die resultierende Gruppierung bzw. Zusammenfassung der Attribute ist deshalb häufig völlig künstlichen Ursprungs und nicht sinnvoll interpretierbar.1273 Bei der von Pras (1975, 75f.) vorgeschlagenen Ähnlichkeitsmatrix schätzt der Befragungsteilnehmer alle möglichen Kombinationen von Produktmerkmalen entsprechend ihrer wahrgenommenen inhaltlichen Ähnlichkeit ein. In Abbildung 28 wird eine typische Bewertungsaufgabe bei der Einschätzung von „Autoreifen“ dargestellt. Bitte schätzen Sie die folgenden Eigenschaftspaare entsprechend der von Ihnen wahrgenommenen Ähnlichkeit ein! keine extreme Zwischen den beiden Eigenschaften Ähnlichkeit Ähnlichkeit Sicherheit und Marke besteht:

interne Codierung

1 0

2 0,25

3 0,5

4 0,75

5 1

Abbildung 28: Beispiel für eine Ähnlichkeitseinschätzung zwischen zwei Attributen (interne Codierung analog zu Pras (1975), 76)

1270

Für Beispiele, bei denen die Faktorenanalyse zur Reduktion der Zahl der Eigenschaften genutzt wurde, siehe Pras (1975), 75; Louviere (1988b), 51; Backhaus; Erichson; Plinke; Weiber (2003), 607; Böhler (1979), 271; Albers (2000), 363; Louviere (1984a), 148; Perrey (1998), 60ff. Für einen weiteren Überblick zur Anwendung der Faktorenanalyse mit dem Ziel der Reduzierung der Attribute siehe auch Wilkie; Pessemier (1973), 432; Swoboda (2000), 154; Hauser; Urban (1977), 591. 1271 Vgl. Pras (1975), 75. Diese werden ebenfalls als “Similarity of Meaning Matrix” bezeichnet (vgl. Pras (1975), 75). 1272

Vgl. Reiners (1996), 39; Böhler (1979), 280f.; hier wird die Faktorenanalyse als ein geeignetes Verfahren zur Eliminierung von redundanten Eigenschaften beschrieben. 1273 Vgl. Pras (1975), 75; Shocker; Srinivasan (1974), 924. Selbst Befürworter der Faktorenanalyse zur Reduktion der Eigenschaftszahl stehen oft vor dem Problem, die mittels Faktorenanalyse gefundenen Dimensionen sinnvoll zu benennen. Teilweise findet man deshalb in der Literatur Bezeichnungen für die Faktoren, die eigentlich zwei oder mehr Produktmerkmale beinhalten. Als Beispiel sei hier Böhler (1979, 281) genannt, der in einer Studie zum Untersuchungsobjekt „Bier“ Eigenschaftsausprägungen wie „würzig“ und „verträglich“ zu „Geschmack/Qualität“ zusammenfasst, obwohl es sich letztendlich inhaltlich um zwei völlig unabhängige Produktmerkmale handelt (siehe dazu auch Schubert (1991), 191). Shocker; Srinivasan (1974, 924) weisen aus diesem Grund darauf hin, dass auch aus Herstellersicht die mittels Faktorenanalyse bestimmten Eigenschaften nicht zur Ableitung produktpolitischer Entscheidungen geeignet, d.h. nicht „actionable“ sind.

220

Danach wird der Mittelwert für die einzelnen Ähnlichkeitseinschätzungen über alle Probanden gebildet und in einer Ähnlichkeitsmatrix abgetragen. In Tabelle 17 wird ein Beispiel für eine fiktive Ähnlichkeitsmatrix dargestellt.

Sicherheit Marke Straßenhaftung Profil Grip

Sicherheit

Marke

Straßenhaftung

Profil

Grip

1

0,1 1

0,5 0,1 1

0,4 0,1 0,6 1

0,5 0,1 1 0,6 1

Tabelle 17: Beispiel für eine Ähnlichkeitsmatrix

Pras (1975, 75) geht davon aus, dass Eigenschaften, deren Ähnlichkeitswert größer bzw. gleich 0,6 ist, als “similar in meaning“1274 wahrgenommen werden. Nun werden schrittweise die Eigenschaftspaare, beginnend mit den Produktmerkmalen mit dem höchsten Ähnlichkeitswert, einzeln untersucht. Bei Eigenschaftspaaren mit einem Ähnlichkeitswert ab 0,6 wird jeweils das Merkmal aus der Liste entfernt, das weniger Einfluss auf die Präferenz ausübt.1275 Für den Fall, dass nach der Eliminierung der redundanten Merkmale weitere Attribute aus der Merkmalsliste gestrichen werden sollen, schlägt Pras (1975, 76) vor, den Mittelwert über alle Werte der Ähnlichkeitsmatrix zu bestimmen, und statt dem oben genannten Grenzwert, diesen Mittelwert als Eliminierungskriterium zu verwenden. Problematisch an dieser vorgeschlagenen Methode ist, dass die Liste der potenziell relevanten Eigenschaften meist sehr lang ist und deshalb eine Vielzahl an Einschätzungen benötigt werden. Da die Befragungsteilnehmer jedes mögliche Eigenschaftspaar entsprechend der Ähnlichkeit der Attribute einschätzen müssen, kann die Zahl der nötigen Bewertungen schnell so stark ansteigen, dass der Erhebungsaufwand zu hoch ist. Pras (1975, 74ff.) präsentiert seinen Vorschlag am Untersuchungsobjekt “Auto” und nennt 24 potenziell relevante Attribute. Um diese Produktmerkmale entsprechend ihrer Ähnlichkeit einschätzen zu können, sind jedoch von jedem Probanden (24*(24-1))/2 = 276 Ähnlichkeitsbewertungen notwendig. Sollen Ähnlichkeitseinschätzungen auf Basis mehrerer Entscheidungsträger erfolgen, so ist mit einem erheblichen Befragungsaufwand zu rechnen.

1274 1275

Pras (1975), 75. Pras (1975, 76) nutzt die Duale Befragung (siehe Kapitel 5.2.2.2) zur Bestimmung der Determinanz, d.h. des Einflusses eines Produktmerkmals auf die Präferenz. Ein weiterer Indikator für die Relevanz einer Eigenschaft könnte auch die Häufigkeit der Nennung eines Attributes sein.

221

Eine weitere Möglichkeit zur Vermeidung von Redundanzen besteht darin, in Anlehnung an die Echo-Technik,1276 die genannten Eigenschaften auf Karten zu drucken. Diese können von Befragungsteilnehmern, die aus einer Zielgruppe stammen, entsprechend ihrer Ähnlichkeit eingeschätzt werden. Dazu werden zunächst alle Karten zufällig unter den Probanden aufgeteilt, die diese so sortieren, dass sich in jedem Stapel inhaltlich identische Eigenschaften befinden. Nachdem auf individueller Ebene die Statements zusammengefasst wurden, können die verschiedenen Stapel, die jeweils einer aggregierten Eigenschaft entsprechen, zwischen den Befragungsteilnehmern zusammengefasst werden. Zu diesem Zweck wird eine Gruppendiskussion durchgeführt. Dabei nennt ein Teilnehmer eine Eigenschaft; besitzen die anderen Befragungsteilnehmer einen Stapel (d.h. ein Merkmal), den sie als ähnlich einschätzen, wird ein neuer Stapel aus den Eigenschaften der individuellen Gruppierungen gebildet. Diese Gruppenbildung erfolgt so lange, bis alle individuellen Eigenschaftsstapel zusammengefasst wurden. In einem nächsten Schritt kann die Kategorisierung der Eigenschaften verfeinert werden, indem die einem Produktmerkmal zugeordneten Statements von der Gruppe der Entscheidungsträger überprüft wird. Die Vorgehensweise endet, indem die Befragungsteilnehmer eine entsprechende Bezeichnung für das Attribut bestimmen. Dieses Verfahren versucht sicherzustellen, dass nicht der Marktforscher allein eine entsprechende Kategorisierung vornimmt, sondern Personen der jeweiligen Zielgruppe.1277 Eine Einordnung der Statements ist oft subjektiv. Indem man daher diese Aufgabe durch Befragungsteilnehmer aus der später zu befragenden Zielgruppe durchführen lässt, könnten Verzerrungen durch den Interviewer bei der Festlegung der weiter zu untersuchenden Attributbezeichnungen vermieden werden.

5.2.2 Direkte Einschätzung von vorgegebenen Eigenschaften

Im Rahmen dieser Methoden bewerten die Befragungsteilnehmer verschiedene, bereits auf einer Liste vorgegebene Produktdimensionen.1278 Diese Art der Einschätzung ist deshalb nicht geeignet, sämtliche relevanten Eigenschaften zu identifizieren;1279 sie dient vielmehr dazu, die möglicherweise lange Liste mit potenziell relevanten Eigenschaften auf die in der Präferenzmessung zu untersuchenden Eigenschaften zu kürzen.1280

1276

Vgl. Schaefer; Bavelas; Bavelas (1980), 83ff. Grundlage der Echo-Technik ist eine vorhandene Liste mit potenziellen Produktmerkmalen, die z.B. auf Basis der Elicitation-Technik bestimmt wurde (siehe auch Kapitel 5.2.1). Ziel der Echo-Technik ist es, Fragebögen möglichst so zu gestalten, dass aus Sicht der zukünftigen Befragungsteilnehmer die tatsächlich relevanten Statements abgefragt werden. Diese Vorgehensweise könnte auch allerdings auch zur Bestimmung von zu untersuchenden Produktmerkmalen genutzt werden. 1277 Vgl. Schaefer; Bavelas; Bavelas (1980), 84ff. 1278 1279 1280

222

Siehe Überblick im Kapitel 4.2.6. Vgl. Melles (2001), 39. Siehe Kapitel 5.5. Sie sind deshalb eher im Rahmen einer stufenweisen Bestimmung des Eigenschaftssets anzuwenden.

5.2.2.1 Direkte Einschätzung der Wichtigkeit von Eigenschaften

Die Wichtigkeit von Eigenschaften kann von den Probanden direkt: auf einer Rating-Skala,1281 Rangfolge,1282, durch eine Ankerpunkt-Methode,1283 anhand dichotomer Urteile,1284 Paarvergleiche1285 oder Konstant-Summen Skalen1286 eingeschätzt werden.

-

In Abbildung 29 wird ein Beispiel für eine solche Einschätzung auf einer 5 Punkte RatingSkala präsentiert. In diesem Fall bewertet der Befragungsteilnehmer die „Sicherheit“ von Autoreifen als sehr wichtig und die Eigenschaft „Marke“ als unwichtig. Wichtigkeit unwichtig

sehr wichtig

Sicherheit 1

2

3

4

5

Marke Abbildung 29: Direkte Befragung mit Einschätzung der Eigenschaften auf einer Rating-Skala am Beispiel Autoreifen

Eine ähnliche Vorgehensweise schlägt Kotler (1974, 417) vor, bei der dem Probanden zunächst eine Liste mit potenziell wichtigen Eigenschaften vorgelegt wird. In einem zweiten Schritt kann nun der Befragungsteilnehmer aus seiner Sicht fehlende relevante Produktmerk-

1281

Vgl. Myers; Alpert (1968), 16; Lürssen (1989), 176; Schweikl (1985), 102; Jaccard; Brinberg; Ackerman (1986), 465; Verlegh; Schifferstein; Wittink (2002), 42; Griffin; Hauser (1993), 16. Dabei sind normale Rating-Skalen z.B. mit Skalenwerten von 1 bis 6 als auch bipolare Skalen mit Skalenwerten von –3 bis +3 möglich (vgl. Wilkie; Pessemier (1973), 433f.). Diese Methode wird in der Literatur teilweise als „traditionelle Form der Self-Explicated-Methode“ bezeichnet; siehe dazu Hensel-Börner (2000, 17). 1282 Vgl. Myers; Alpert (1968), 14; Kotler (1974), 417; Wilkie; Pessemier (1973), 433; Schweikl (1985), 102. 1283

Die Einschätzungen auf einer Rating-Skala werden für den Entscheidungsträger vereinfacht, indem beispielsweise der wichtigsten Eigenschaft 10 Punkte zugewiesen und die verbliebenen Merkmale in Relation dazu eingeschätzt werden (vgl. Griffin; Hauser (1993), 16). 1284 Ein Beispiel dafür ist eine Einordnung in „wichtig“ bzw. „unwichtig“ (vgl. Wilkie; Pessemier (1973), 433); Schweikl (1985), 102). 1285 Eine häufig genutzte Frage wäre beispielsweise: “Welche dieser beiden Eigenschaften ist wichtiger – A oder B ?” Siehe Wilkie; Pessemier (1973), 433; Schweikl (1985), 102. 1286 Der Entscheidungsträger wird hierbei aufgefordert, z.B. 100 Punkte auf sämtliche Eigenschaften entsprechend ihrer empfundenen Wichtigkeit zu verteilen. Diese Methode erweist sich einerseits als vorteilhaft, da der Entscheidungsträger schon in dieser ersten Phase Trade-offs vornehmen muss. Andererseits stellen Konstant-Summen-Skalen bei der praktischen Anwendung aus Sicht der Befragungsteilnehmer oft zu schwere Fragen dar (vgl. Wilkie; Pessemier (1973), 433f; Heeler; Okechuku; Reid (1979), 61; Schweikl (1985), 102; Johnson; Meyer; Ghose (1989), 513; Griffin; Hauser (1993), 16; Pöyhönen; Hämäläinen (1997), 2). Siehe auch Kapitel 3.2.

223

male ergänzen und im Anschluss die Eigenschaften entsprechend ihrer Wichtigkeit in eine Rangfolge bringen.1287

Eine weitere Möglichkeit beschreiben Bailom; Hinterhuber; Matzler; Sauerwein (1996, 121) als „self-stated-Importance“; dabei wird je Eigenschaft lediglich eine Ausprägung mit Hilfe einer Rating-Skala bewertet. Es werden z.B. zur Einschätzung von Abfahrtsski verbale beschriebene Ausprägungen wie „guter Kantengriff“, „besonders gute Tiefschneeeigenschaften“ oder „kratzfeste Oberfläche“ direkt bewertet. Diese Bewertungen sollen als „Prioritäten“ bei der Produktentwicklung dienen.1288 Ein Trade-off verschiedener Eigenschaftsausprägungen erfolgt nicht. Zur Aggregation der Daten können bei der Verwendung von Rating-Skalen und KonstantSummen-Skalen der Mittelwert berechnet und bei erhobenen Rang-Daten der Median sowie bei dichotomen Urteilen einfache Häufigkeitsauszählungen verwendet werden. Wird die Wichtigkeit anhand von Paarvergleichen abgefragt, ist es möglich, auf individueller Ebene eine Rangfolge entsprechend der Wichtigkeit zu bilden. Auf aggregierter Ebene kann dann der Median als Indikator für die Wichtigkeit eines Merkmals genutzt werden. Bei der direkten Einschätzung der Wichtigkeit von Eigenschaften wird davon ausgegangen, dass den Produktmerkmalen „an sich“ eine bestimmte Bedeutung zugewiesen werden kann, d.h. die Attribute besitzen unabhängig von den Eigenschaftsausprägungen einen Einfluss auf die Präferenz. Wie bereits in Kapitel 4 beschrieben, handelt es sich bei Eigenschaften lediglich um Bewertungsdimensionen, deren Einfluss auf die Präferenz erst durch die untersuchten Merkmalsausprägungen bestimmt wird.1289 Insofern verwundert es nicht, dass die Nutzung einfacher Wichtigkeitseinschätzungen mit verschiedenen gravierenden Problemen verbunden ist. Die Befragungsteilnehmer werden oft nicht zu einem Trade-off der einzuschätzenden Attribute angehalten, weshalb dieser typischerweise alle bzw. viele Merkmale als „sehr wichtig“ einstuft.1290 In der Praxis ist damit zu rechnen, dass die Einschätzung von Eigenschaften wie „Sicherheit“ zu erheblichen Verzerrungen führt, da diese im Vergleich zu dem Einfluss bei einer realen Entscheidungssituation tendenziell wichtiger eingeschätzt werden.1291 Besonders kritisch bei der direkten Einschätzung der Wichtigkeit der Eigenschaften ist indes, dass die Unterscheidungskraft der Eigen-

1287 1288 1289 1290 1291

224

Vgl. Kotler (1974), 417. Vgl. Bailom; Hinterhuber; Matzler; Sauerwein (1996), 121. Siehe Kapitel 2.2. Vgl. Albers (1983), 212; Green; Krieger (2002a), 26; Lürssen (1989), 176; Albrecht (2000), 77. Vgl. Myers; Alpert (1968), 16. Bei diesen Eigenschaften handelt es sich um Schwelleneigenschaften, d.h. eine bestimmte muss Mindestausprägung erreicht sein, damit eine Produktalternative überhaupt akzeptiert wird. Siehe auch Kapitel 4.1.4.

schaftsausprägungen (d.h. deren Bandbreite) nicht explizit berücksichtigt wird. Deshalb sind diese Methoden nicht geeignet, um präferenzrelevante Eigenschaften zu identifizieren.1292 Es ist völlig unklar, welche Assoziationen die Entscheidungsträger mit dem Begriff „wichtig“ verbinden, so dass die Befragungsteilnehmer u.U. aufgrund sehr unterschiedlicher Interpretationen zu sehr unterschiedlichen Einschätzungen kommen.1293 Eisenführ; Weber (2003, 130) bezeichnen daher die Frage „nach der Wichtigkeit eines Attributs [als] in sich sinnlos“1294. Wichtig ist nicht die Eigenschaft, sondern lediglich die vom Entscheider wahrgenommenen Nutzenunterschiede, die durch die Bandbreite der Ausprägungen verursacht werden.

5.2.2.2 Duale Befragung

Die Duale Befragung1295 wurde erstmals von Myers; Alpert (1968, 16f.) vorgeschlagen. Es handelt sich dabei um eine Erweiterung der Methode der direkten Wichtigkeitseinschätzung. Durch eine zweistufige Vorgehensweise soll explizit berücksichtigt werden, dass einige Eigenschaften von den Probanden zwar als wichtig eingeschätzt werden, sich die real verfügbaren Produkte bezüglich dieser Eigenschaft jedoch kaum unterscheiden und aus diesem Grund keinen bzw. einen geringen Einfluss auf die Präferenz ausüben.1296 In Abbildung 30 wird ein Beispiel für die Duale Befragung präsentiert. Dem Befragungsteilnehmer wird eine Liste mit potenziell wichtigen Eigenschaften vorgelegt, die dieser entsprechend der Wichtigkeit und der von ihm am Markt wahrgenommenen Unterscheidungskraft einschätzt. Durch Multiplikation der beiden Bewertungen erhält man den Determinanzwert, der als Maß für den Einfluss einer Eigenschaft auf die Präferenz dienen soll.1297 Wichtigkeit

Eigenschaften

Unterscheidungskraft sehr wichtig sehr ähnlich

unwichtig

Determinanzwert

sehr unterschiedlich

Sicherheit

5*1=5 1

2

3

4

5

1

2

3

4

1

2

3

4

5

1

2

3

4

Marke

1*4=4

Abbildung 30: Duale Befragung am Beispiel Autoreifen (Fragenformulierung in Anlehnung an: Tscheulin (1992), 96; Skala in Anlehnung an: Anderson; Cox III; Fulcher (1976), 41)

1292 1293 1294

Vgl. Myers; Alpert (1968), 14; Alpert (1980), 84; Lürssen (1989), 176; Goodwin; Wright (2000), 28f. Vgl. Srinivasan (1988), 296. Eisenführ; Weber (2003), 130.

1295

Reiners (1996, 43) bezeichnet diese Methode als „Duale Frage“. Im ursprünglichen Artikel von Myers; Alpert (1968, 16) wird sie „dual questioning“ benannt. Vgl. Myers; Alpert (1968), 16; Tscheulin (1992), 96f.; Reiners (1996), 43; Stallmeier (1993), 36; Pras (1975), 73f.; Böhler (1979), 278ff. 1297 Vgl. Anderson; Cox III; Fulcher (1976), 41; Böhler (1979), 279. 1296

225

Die Bewertung der Wichtigkeit erfolgt in dem oben beschriebenen Beispiel ähnlich wie bei der direkten Einschätzung der Wichtigkeit von Eigenschaften (siehe Abbildung 29). In einer zweiten Frage wird dagegen die wahrgenommene Unterscheidungskraft der Produktmerkmale erhoben. Beispielsweise wird der Proband befragt, „wie unterschiedlich“ er die am Markt verfügbaren Autoreifen bezüglich der Eigenschaft „Sicherheit“ wahrnimmt. In dem in Abbildung 30 präsentierten Beispiel ist der Befragungsteilnehmer der Ansicht, dass sich die verschiedenen Autoreifen bezüglich der Eigenschaft „Sicherheit“ kaum unterscheiden (diesem Attribut wird ein Wert von „1“ für die Unterscheidungskraft zugewiesen). Andererseits wird das Produktmerkmal „Sicherheit“ als sehr wichtig eingestuft (es erhält einen Wert von „5“). Insgesamt ergibt sich dadurch ein Determinanzwert von 5*1 = 5. Analog können auf der Basis der Einschätzungen für alle untersuchten Merkmale die Determinanzwerte berechnet werden. Bezüglich der Anzahl der verwendeten Rating-Skalenpunkte gibt es in der Literatur verschiedene Möglichkeiten für die Duale Befragung. Anderson; Cox III; Fulcher (1976, 41) verwenden eine 5er Rating-Skala für die Einschätzung der Wichtigkeit und eine 4er Rating-Skala bei der Bewertung der Unterscheidungskraft. Die Multiplikation beider Werte miteinander bewirkt, dass die empfundene Wichtigkeit per se stärker als die Unterscheidungskraft gewichtet wird. Tscheulin (1992, 97) nutzt für beide Einschätzungen eine 5er Rating-Skala, so dass empfundene Wichtigkeit und wahrgenommene Unterscheidungskraft gleich gewichtet werden. Für welche der beiden hier präsentierten Skalen-Arten sich der Marktforscher entscheidet, letztendlich ist diese implizite Gewichtung in jedem Fall subjektiv und determiniert das Ergebnis der Dualen Befragung. Die individuellen Determinanzwerte können durch Mittelwertbildung über alle Probanden aggregiert, die Attribute in eine Rangfolge gebracht1298 und eine bestimmte Anzahl der Merkmale ausgewählt werden. Die Eigenschaften, die sowohl wichtig sind, als auch zur Unterscheidung der Alternativen beitragen, sollten in die Präferenzmessung aufgenommen werden.1299 Pras (1975) und Reiners (1996) weisen auf das Redundanzproblem hin, dass bei Studien zur Ermittlung der relevanten Eigenschaften besonders berücksichtigt werden muss.1300 Pras (1975, 74f.) schlägt vor, im Anschluss an die Duale Befragung die Liste der potenziell relevanten Eigenschaften um diejenigen Produktmerkmale zu reduzieren, die von den Befra-

1298

Dazu werden die Mittelwerte je Eigenschaft über alle Befragungsteilnehmer berechnet (siehe Pras (1975), 74). Neben den Mittelwerten der Determinanzwerte und den daraus resultierenden Rängen der einzelnen Produktmerkmale kann als weiteres Maß untersucht werden, ob der mittlere Determinanzwert signifikant von dem Gesamtmittelwert über alle Eigenschaften abweicht (vgl. Pras (1975), 74). 1299 Vgl. Tscheulin (1992), 97; Pras (1975), 73. 1300

226

Siehe dazu auch Kapitel 5.2.1.4.

gungsteilnehmern als ähnlich empfunden werden.1301 Ziel sollte es aber sein, das Redundanzproblem bereits vor der Phase der Einschätzung der Merkmale zu lösen, so dass redundante Attribute in den weiteren Stufen gar nicht mehr berücksichtigt werden müssen.

5.2.2.3 Jaccard Subjective Probability Measure

Bei dieser Methode wird die Bedeutung einer Eigenschaft aus der absoluten Differenz zweier Einschätzungen auf Rating-Skalen berechnet. Grundlage der Einschätzungen bildet eine Liste mit Eigenschaften sowie zwei Extrempunkten für jene Ausprägungen, die die Bandbreite der Eigenschaftsausprägungen repräsentieren.1302 In Abbildung 31 wird eine Aufgabenstellung für die Eigenschaft „Preis“ bei einem Auto präsentiert. Würden Sie dieses Auto bei der Kaufentscheidung berücksichtigen, d.h.könnten Sie sich vorstellen, dass dies ein Auto sein könnte, welches Sie sich kaufen?

Angenommen, ein Auto wäre: preiswert 0 1 ich würde es nicht in Betracht ziehen

2

3

4

5

6

7

8

9

10 ich würde es auf jeden Fall in Betracht ziehen

0

2

3

4

5

6

7

8

9

teuer 1

10

Abbildung 31: Beispiel für das Jaccard Subjective Probability Measure (vgl. Jaccard; Brinberg; Ackerman (1986), 465)

Für jede Eigenschaft werden insofern zwei Bewertungen erfasst. Die Wichtigkeit einer Eigenschaft ergibt sich aus der absoluten Differenz der beiden Bewertungen (in diesem Fall: |8 – 1| = 7). Im Rahmen dieser Vorgehensweise wird somit berücksichtigt, dass lediglich die Bandbreite der Nutzenunterschiede auf Basis der vorgegebenen Eigenschaftsausprägungen einen Einfluss auf die Relevanz eines Produktmerkmals ausübt. Um die Methode in der von Jaccard; Brinberg; Ackerman (1986, 465) beschriebenen Vorgehensweise anwenden zu können, müssen die Endpunkte der Bandbreite der relevanten Eigenschaftsausprägungen a priori bekannt sein. Alternativ kann anhand verschiedener Ratings die Bandbreite ermittelt werden (siehe Abbildung 32 für die Eigenschaft „Farbe“ bei einem Auto).

1301 1302

Diese Vorgehensweise wurde in Kapitel 5.2.1.4 beschrieben. Vgl. Jaccard; Brinberg; Ackerman (1986), 465.

227

Würden Sie dieses Auto bei der Kaufentscheidung berücksichtigen, d.h.könnten Sie sich vorstellen, dass dies ein Auto sein könnte, welches Sie sich kaufen?

Angenommen, ein Auto wäre: ich würde es auf jeden Fall in Betracht ziehen

ich würde es nicht in Betracht ziehen rot 0

1

2

3

4

5

6

7

8

9

10

0

1

2

3

4

5

6

7

8

9

10

0

1

2

3

4

5

6

7

8

9

10

blau

silber

Abbildung 32: Beispielaufgabe für die Jaccard Subjective Probability Measure bei drei Ausprägungen

Die Bandbreite und damit die Wichtigkeit einer Eigenschaft ergibt sich aus der absoluten Differenz der Extrempunkte der Bewertungen (in diesem Fall: |10 – 1| = 9). Problematisch bei dieser Vorgehensweise ist jedoch, dass die Attribute völlig isoliert voneinander eingeschätzt, d.h. die Bewertungen nicht in Relation zu den anderen Eigenschaften vorgenommen werden und infolgedessen kein Trade-off der untersuchten Merkmale erfolgt. Bei der Eigenschaft „Farbe“ bevorzugt in diesem Beispiel der Befragungsteilnehmer sehr stark ein „silbernes“ Auto, während er einen „blauen“ Pkw kaum noch in Betracht ziehen würde. Es ergibt sich ein Punktwert von „9“ für die Wichtigkeit der Eigenschaft „Farbe“. Bei der Einschätzung des Preises (siehe Abbildung 31) wurde eine Wichtigkeitsbewertung von „7“ erhoben. Dies bedeutet letztendlich, dass die Eigenschaft „Farbe“ ein höhere Bedeutung als das Attribut „Preis“ haben würde. Es ist fraglich, ob der Befragungsteilnehmer eine ähnliche Einschätzung treffen würde, wenn keine isolierte Bewertung der Produktmerkmale vorgenommen werden würde.

5.2.2.4 Interpretation von direkten Einschätzungen vorgegebener Eigenschaften

Werden Befragungsteilnehmer gebeten, die Wichtigkeit von Eigenschaften einzuschätzen, ohne dass explizit die jeweiligen Eigenschaftsausprägungen vorgegeben werden, kann man davon auszugehen, dass diese die Merkmale anhand der von ihnen individuell wahrgenommenen Nutzenunterschiede am Markt (d.h. durch die individuell als relevant eingeschätzten Bandbreite der Eigenschaftsausprägungen) bewerten. Diese, der Bewertung zugrunde liegende individuelle Bandbreite bleibt dem Marktforscher jedoch unbekannt, da sie im Rahmen dieser beschriebenen Methoden (Kapitel 5.2.2.1 und 5.2.2.2) nicht erhoben wird. Da nicht damit zu rechnen ist, dass sämtliche Befragungsteilnehmer bei der Einschätzung der Wichtigkeit die gleiche Bandbreite an Eigenschaftsausprägungen heranziehen, ist der Aussagegehalt einer solchen Wichtigkeitsbewertung äußerst fraglich. Eine Grundvoraussetzung, um die 228

Wichtigkeitseinschätzungen über verschiedene Befragungsteilnehmer aggregieren zu können, ist jedoch, dass diese die gleiche Bewertungsbasis nutzen, also die gleichen Eigenschaftsausprägungen in ihren Einschätzungen berücksichtigen. Dies ist bei den Methoden der direkten Bewertung (Kapitel 5.2.2.1) und der Dualen Befragung (Kapitel 5.2.2.2) nicht gewährleistet. Diese Verfahren sind aus diesem Grund nicht zur Bestimmung der relevanten Merkmale geeignet. Werden lediglich die Bandbreiten der Eigenschaften eingeschätzt (siehe Kapitel 5.2.2.3), bleibt unklar, in welchem Verhältnis die Eigenschaften an sich zueinander stehen, d.h. welche Merkmale bei einem Trade-off einen stärkeren Einfluss haben. Die Einschätzungen entsprechend des Jaccard Subjective Probability Measure sind somit ebenfalls nicht zur Bestimmung der relevanten Merkmale geeignet.

5.3

Indirekte Methoden

Alpert (1971, 185) definiert indirekte Methoden als die Verfahren, bei denen nicht direkt danach gefragt wird, warum ein bestimmtes Produkt gekauft wurde oder nicht.1303 Im Folgenden werden typische indirekte Methoden vorgestellt, die in der Literatur zur Bestimmung eines Eigenschaftssets als geeignet beschrieben wurden (für einen Überblick siehe Abbildung 33). Indirekte Ansätze Prozessverfolgungsmethoden

Projektive Verfahren

Gruppeninterviews / Fokusgruppen

Tiefenpsychologische Interviews

Multidimensionale Skalierung

Abbildung 33: Indirekte Ansätze zur Bestimmung der relevanten Eigenschaften

Man unterscheidet dabei zwischen Prozessverfolgungsmethoden, projektiven Verfahren, Gruppeninterviews, tiefenpsychologischen Interviews und der Multidimensionalen Skalierung. Diese Verfahrensgruppen werden im Folgenden vorgestellt sowie deren Eignung zur Bestimmung entscheidungsrelevanter Produktmerkmale eingeschätzt.

5.3.1 Prozessverfolgungsmethoden

Prozessverfolgungsmethoden wurden in erster Linie entwickelt, um die Reihenfolge der Informationsaufnahme und Art der Informationsverarbeitung während eines Entschei-

1303

Siehe ebenso Stallmeier (1993), 41; Myers; Alpert (1997), 54.

229

dungsprozesses zu untersuchen.1304 Die Grundlage der Studien bildet eine vom Marktforscher definierte bzw. vorgegebene Zahl an zu bewertenden Alternativen bzw. Produktmerkmalen mit deren entsprechenden Eigenschaftsausprägungen.

5.3.1.1 Protokolle Lauten Denkens

Der Proband wird bei dieser Art der Befragung1305 aufgefordert, bei einer realen oder fiktiven Kaufentscheidung alle Gedanken zu nennen, die ihm in den Sinn kommen. Der Befragungs-

teilnehmer kann völlig frei und mit seinen eigenen Worten den Entscheidungsprozess beim Kauf eines Produktes beschreiben.1306 Diese Aussagen werden vom Marktforscher protokolliert und später entsprechenden Beurteilungsdimensionen (d.h. Eigenschaften und Ausprägungen) zugeordnet.1307 In der Praxis werden diese Methoden im Vergleich zu den bereits präsentierten Verfahren relativ selten zur Bestimmung der relevanten Eigenschaften im Rahmen der Conjoint-Analyse eingesetzt.1308 Neben der Reihenfolge und Häufigkeit der Nutzung von Produktmerkmalen kann insbesondere die Art der Informationssuche und –verarbeitung untersucht werden.1309 Die Art der Entscheidungsprozesse hängt dabei vor allem vom Vorwissen in der entsprechenden Produktgruppe sowie von der jeweils betrachteten Marke ab. Protokolle Lauten Denkens werden aber auch als geeignete Verfahren bei der Bestimmung von Eigenschaften beschrieben.1310 Folgende Einflussgrößen können bei der Durchführung von Protokollen Lauten Denkens variiert werden: -

-

1304 1305

Befragung am Einkaufsort bzw. simulierte Entscheidungen im Rahmen von Laborexperimenten, 1311 simultan zur Entscheidungsaufgabe oder im Nachhinein aufgezeichnete Protokolle1312 und strukturierte1313 bzw. freie, nicht-strukturierte Protokolle.1314

Vgl. Aschenbrenner (1990), 155. Im Folgenden wird der Begriff “Gedankenprotokoll” als Synonym für Protokolle Lauten Denkens verwendet.

1306

Vgl. Douglas; Craig; Faivre (1981), 30f.; Day; Shocker; Srivastava (1979), 13f.; Grunert (2003), 46. Perrey (1998, 56) beschreibt diese Vorgehensweise als „sequentielle Ereignismethode“. Die Ergebnisse über den Ablauf der Bewertung der Produktalternativen können auch den Ausgangspunkt zur Strukturierung von Eigenschaften, die mit Hilfe von hierarchischen Methoden zur Präferenzmessung untersucht werden sollen, bilden (vgl. Perrey (1998), 56). 1307 Vgl. Reiners (1996), 40f.; Shocker; Srinivasan (1979b), 7. 1308 1309 1310 1311 1312

230

Vgl. Cattin; Wittink (1982), 46. Vgl. Aschenbrenner (1990), 156; Schweikl (1985), 104f.; Douglas; Craig; Faivre (1981), 29; Douglas; Craig; Faivre (1981), 48ff.; Day; Shocker; Srivastava (1979), 13f. Vgl. Bettman; Park (1980), 235f. Vgl. Kaas; Hofacker (1983), 82; Douglas; Craig; Faivre (1981), 31ff. Vgl. Kaas; Hofacker (1983), 82; Biehal; Chakravarti (1995), 269; Douglas; Craig; Faivre (1981), 37f.

Die Auswertung der erhobenen Daten ist sehr aufwendig. In der Regel werden die genannten Statements zunächst in Einzelnennungen zerlegt, welche in Bezug zu einem bestimmten Attribut gesetzt werden können.1315 Diese Daten können ebenfalls in einem Ablaufdiagramm grafisch dargestellt werden.1316 So ist es möglich, die Art der genutzten Attribute, die Reihenfolge der Verarbeitung der Produktmerkmale und die Art der Informationsverarbeitung zu untersuchen.1317 Diese Methode ist insofern problematisch, da der Befragungsteilnehmer stark für eine bestimmte Entscheidungssituation sensibilisiert wird und das Artikulieren jedes Gedankens den Entscheidungsfindungsprozess verlangsamt. Deshalb ist davon auszugehen, dass die Probanden überlegter und planvoller als in normalen Entscheidungssituationen reagieren.1318 Das laute Aussprechen der Gedanken kann aber gleichzeitig dazu führen, dass die Befragungsteilnehmer von der eigentlichen Wahlaufgabe abgelenkt werden und deshalb eine andere Alternative wählen, als es sonst der Fall gewesen wäre.1319 Bei der Auswertung ist ein sehr hoher Interviewereinfluss bei der Codierung der Daten in entsprechende Attribute oft nicht vermeidbar, so dass die Verwertbarkeit der gewonnenen Informationen sehr umstritten ist.1320 Darüber hinaus ist mit unterschiedlichen Ergebnissen zu rechnen, wenn die Befragungsteilnehmer das Gedankenprotokoll allein (z.B. auf ein Tonband) aufzeichnen oder dabei vom Interviewer durch entsprechende Fragen „unterstützt“ werden. Eine Hilfestellung bietet sich an, wenn die Probanden Probleme haben, die eigenen Gedanken zu verbalisieren. Auch bei der Informationssuche kann der Interviewer dem Entscheidungsträger durch Vorlesen entsprechender Eigenschaftsausprägungen die Aufgabe erleichtern. Diese Hilfestellung kann sich indes als äußerst problematisch erweisen, wenn der Interviewer

1313

Dabei handelt es sich meist um ex post erhobene Gedankenprotokolle, bei denen die Befragungsteilnehmer gebeten werden, die tatsächlichen intern abgelaufenen Informationsverarbeitungsprozesse einer Liste von vorgegebenen Informationsverarbeitungsstrategien zuzuordnen (vgl. Kaas; Hofacker (1983), 82). Andere Methoden der strukturierten Gedächtnisprotokolle nutzen vorgegebene Entscheidungsbäume, anhand derer ein mehrstufiger Informationsverarbeitungsprozess vereinfacht dargestellt werden kann (vgl. Kaas; Hofacker (1983), 90). Letztendlich dienen diese strukturierten Gedächtnisprotokolle eher der Analyse der Informationsverarbeitungs- und weniger der Informationsaufnahmeprozesse und sind deshalb nicht ohne weiteres zur Bestimmung der relevanten Eigenschaften geeignet. 1314 Meist werden in der Praxis unstrukturierte Gedächtnisprotokolle angewendet (vgl. Kaas; Hofacker (1983), 82). 1315

Vgl. Bettman; Park (1980), 239.

1316

Vgl. Aschenbrenner (1990), 156; Douglas; Craig; Faivre (1981), 39ff. Diese werden auch als Entscheidungsnetz bezeichnet, da sie aus einer Sequenz von „ja/nein“ Entscheidungen (deren Knoten jeweils mit den Entscheidungskriterien wie beispielsweise den Produktmerkmalen bezeichnet werden) bestehen (vgl. Kaas; Hofacker (1983), 83). 1317 Vgl. Aschenbrenner (1990), 156. 1318 1319 1320

Vgl. Stallmeier (1993), 42; Kaas; Hofacker (1983), 83; Biehal; Chakravarti (1989),84, 94; Biehal; Chakravarti (1995), 269. Vgl. Biehal; Chakravarti (1989), 84. Vgl. Aschenbrenner (1990), 156; Kaas; Hofacker (1983), 83. Indem mehrere Marktforscher die erhobenen Daten parallel codieren, kann versucht werden, Verzerrungen durch Fehlinterpretationen zu verringern (vgl. Biehal; Chakravarti (1989), 88).

231

zu stark in den Entscheidungsprozess eingreift und deshalb andere Wahlentscheidungen getroffen werden.1321 Da Entscheidungsprozesse zwischen Befragungsteilnehmern sehr unterschiedlich ablaufen können,1322 ergeben sich insbesondere bei der Aggregation der erhobenen Daten erhebliche Probleme. Selbst Maße zur Bestimmung der Ähnlichkeit von Entscheidungsprozessen lassen sich nur sehr schwierig bestimmen. Insbesondere diese Hindernisse führen dazu, dass bei der Anwendung von Gedächnisprotokollen meist nur eine kleine Stichprobe speziell ausgewählter Entscheidungsträger befragt werden kann.1323 Schließlich ist es äußerst fraglich, ob sämtliche im Gehirn ablaufende kognitive Prozesse von den Befragungsteilnehmern überhaupt artikuliert werden können. Häufig wird davon ausgegangen, dass die Validität der Gedankenprotokolle umso stärker abnimmt, je mehr man sich von der Phase der Informationsaufnahme entfernt, d.h. wenn Informationsverarbeitungsprozesse untersucht werden sollen.1324 Allerdings sind für die Präferenzmessung gerade die Eigenschaften von Interesse, die im Rahmen von Verarbeitungsprozessen und damit bei der Bewertung der Alternativen, genutzt werden.

5.3.1.2 Information-Display-Boards

Bei der Anwendung von Information-Display-Boards1325 wird dem Befragungsteilnehmer das Entscheidungsproblem anhand einer Attribut-x-Alternativen-Matrix1326 dargestellt. Bei der ursprünglichen Variante werden durch die Spalten der Matrix komplette Stimuli präsentiert; in den Zeilen sind jeweils die Ausprägungen der Produktmerkmale, durch die die Alternativen gekennzeichnet sind, verdeckt auf Kärtchen dargestellt.1327 Ziel dieser Methode ist die Messung der externen, aktiven Informationsaufnahme, also der bewussten Nutzung der vom Forscher vorgegebenen Informationen durch den Befragungsteilnehmer und der letztendlichen

1321 1322 1323 1324 1325 1326 1327

232

Vgl. Douglas; Craig; Faivre (1981), 36f. Vgl. Bettman; Park (1980), 235. Vgl. Kaas; Hofacker (1983), 83f. Vgl. Kaas; Hofacker (1983), 82f.; Grunert (2003), 46. Es werden auch die Begriffe “Informationstafeln” (vgl. Stallmeier (1993), 42) bzw. „Informations-Display-Matrizen“ (vgl. Kaas; Hofacker (1983), 76) verwendet. Vgl. Aschenbrenner (1990), 155. Vgl. Kaas; Hofacker (1983), 76; Aschenbrenner (1990), 155; Lürssen (1989), 44; Trommsdorff (2003), 261.

Entscheidung für eine Alternative.1328 Sie wird jedoch auch zur Bestimmung der beurtei-

lungsrelevanten Produktmerkmale angewendet.1329 Das „Klassische“ Information-Display-Board

Die Grundlage der Information-Display-Boards ist eine bereits vorhandene Liste mit möglicherweise relevanten Eigenschaften sowie deren Ausprägungen.1330 Der Befragungsteilnehmer wird gebeten, sich für eine der durch die Spalten präsentierten Alternativen zu entscheiden. Um eine Wahl treffen zu können, kann er so viele Kärtchen mit den jeweiligen Eigenschaftsausprägungen der Alternativen aufdecken, wie er zur Entscheidung benötigt. Dabei wird vom Marktforscher erhoben, welche und in welcher Reihenfolge er die Kärtchen aufdeckt.1331 In der folgenden Abbildung ist ein Beispiel für ein solches Information-DisplayBoard dargestellt. Produkte Eigenschaft

Alternative 1

Gewicht

Alternative 2

Alternative 3

Alternative 4

12 kg

15 kg

18 kg

Federgabel

keine Federung

Federung Sattel

Sport-Sattel

Komfort-Sattel

Farbe

blau

...

... verdeckte Kärtchen

...

...

...

aufgedeckte Kärtchen

Abbildung 34: Beispiel für ein Information-Display-Board bei dem Untersuchungsobjekt Mountainbike

„Neuere“ Varianten der Information-Display-Boards

Neben dieser „klassischen“ Vorgehensweise bei den Information-Display-Boards wurden im Laufe der Zeit weitere Varianten entwickelt. Ein Problem dieser klassischen Methode ist, dass ein wiederholter Zugriff auf bestimmte Informationen nicht ermittelt werden kann.1332 In einer alternativen Vorgehensweise besteht die Matrix deshalb aus einer regalartigen Fächerwand. 1328

Anhand dieser erhobenen Daten kann gleichwohl nicht bzw. nur sehr eingeschränkt auf die interne Informationsverarbeitung des Entscheidungsträgers geschlossen werden (vgl. Lürssen (1989), 54ff.). 1329 Vgl. Lürssen (1989), 171; Gierl; Satzinger (2000), 266f.; Schweikl (1985), 103; Böcker; Schweikl (1988), 17ff.; Albrecht (2000), 35. 1330 Vgl. Lürssen (1989), 177. Diese kann durch die im Kapitel 5.2.1 beschriebenen Methoden bestimmt werden. 1331 1332

Vgl. Aschenbrenner (1990), 155; Jaccard; Brinberg; Ackerman (1986), 464. Der wiederholte Zugriff auf bestimmte Informationen könnte ebenfalls als ein Indiz für die Bedeutung einer Eigenschaft interpretiert werden, andererseits könnte sie auch lediglich ein Zeichen für die Vergesslichkeit des jeweiligen Befragungsteilnehmers oder für die Komplexität der Befragungsaufgabe sein (vgl. Lürssen (1989), 183f.).

233

Jedes Fach repräsentiert eine Zelle, in der mehrere Karten mit jeweils einer Eigenschaftsausprägung, die eine Alternative beschreibt, verdeckt liegen. Der Befragungsteilnehmer wird nun gebeten, analog zur oben beschriebenen Vorgehensweise, sich für eine der präsentierten Alternativen zu entscheiden. Zur Unterstützung der Entscheidung kann er auf die Informationen auf den Kärtchen zurückgreifen, indem er sie den Fächern entnimmt, die dann im Gegensatz zur oben beschriebenen klassischen Information-Display-Matrix nach jedem Zugriff auf einen Stapel abgelegt werden. Dieser Stapel repräsentiert die Reihenfolge der aufgenommenen Informationen.1333 Statt einer Matrix können die Informationen auch durch Informationsblöcke auf Wandkalendern präsentiert werden. Für jede Alternative wird ein Wandkalender benutzt, auf dessen Blättern jeweils die Eigenschaftsausprägungen abgebildet sind und bei denen die oberen Blätter jeweils etwas kürzer als die darunter liegenden sind. Sofort sichtbar sind jeweils nur die Benennungen der Eigenschaften. Die Informationsaufnahme ist durch das Protokollieren des Aufschlagens der jeweiligen Ausprägungen nachvollziehbar.1334 Obwohl diese beiden „neueren“ Methoden den wiederholten Zugriff auf die Informationen erfassen, wird von ihnen nur selten Gebrauch gemacht, da diese Vorgehensweisen von dem Entscheidungsträger evtl. als eher „lästig“ empfunden werden.1335 Der Grundgedanke einer weiteren Variante des Information-Display-Boards ist, dass Befragungsteilnehmer bei der Anwendung der bereits beschriebenen Erhebungsverfahren mehr Informationen als in realen Entscheidungssituationen nutzen, weil sofort alle Produktmerkmale präsentiert werden. Geht der Proband beispielsweise davon aus, dass der Marktforscher bereits alle zur Entscheidung wichtigen Eigenschaften vorselektiert hat, so wird er diese Informationen entsprechend nutzen. Um dieses Problem zu vermeiden, schlagen Painton; Gentry (1985, 240ff.) vor, nur die für den jeweiligen Entscheidungsträger salienten Eigenschaften in das Information-Display-Board aufzunehmen. Dies bedeutet, dass nur die von ihm a priori genannten Produktmerkmale berücksichtigt werden. Problematisch an dieser Vorgehensweise ist, dass der Befragungsaufwand für den Probanden größer wird und er deshalb weniger Attribute in Betracht ziehen könnte.1336

1333 1334 1335 1336

234

Vgl. Kaas; Hofacker (1983), 76; Lürssen (1989), 45; Schweikl (1985), 104. Eine entsprechende computergestützte Vorgehensweise nutzen Jaccard; Brinberg; Ackerman (1986, 464). Vgl. Kaas; Hofacker (1983), 76. Vgl. Lürssen (1989), 72. Vgl. Painton; Gentry (1985), 240ff.

Bestimmung der Relevanz von Eigenschaften

Zur Bestimmung der Relevanz eines Produktmerkmals können bei allen Varianten der Information-Display-Boards folgende Indikatoren verwendet werden: -

die Nutzung bzw. Nicht-Nutzung eines Attributs, der Umfang der Nutzung einer Eigenschaft sowie die Reihenfolge der Nutzung von Produktmerkmalen.1337

Es wird davon ausgegangen, dass Eigenschaften, die im Informationsaufnahmeprozess überhaupt nicht berücksichtigt werden, keine Relevanz für den Entscheidungsprozess besitzen und deshalb nicht weiter untersucht werden müssen.1338 Eigenschaften, bei denen keine Ausprägung aufgedeckt wurde, werden deshalb gestrichen. Der Umfang der Informationsnutzung bei einem Produktmerkmal könnte ein Hinweis für die Relevanz eines Attributs sein. So können verschiedene Maßzahlen, wie die Häufigkeit der aufgerufenen Informationen je Eigenschaft oder der Anteil der Attribute an der gesamten Informationsaufnahme, berechnet werden. Je mehr Informationen bezüglich eines Produktmerkmals genutzt werden, desto höher ist vermutlich der Einfluss dieses Attributs auf die Auswahlentscheidung.1339 Der Vorteil der letztgenannten Maßzahl besteht darin, dass eine Aggregation der erhobenen Daten sehr leicht möglich ist.1340 Auch die Reihenfolge der Informationsnutzung könnte Aufschluss über die Relevanz einer Eigenschaft liefern. Dabei wird davon ausgegangen, dass wichtige Eigenschaften früher als unwichtige genutzt werden.1341 Als äußerst problematisch erweist sich allerdings die Aggregation der erhobenen Daten, da Randdaten generell auf einem ordinalen Skalenniveau erhoben werden.1342 Die verschiedenen Rangindizes werden allerdings z.B. durch Durchschnittsbildung so ermittelt, als ob die Ausgangsdaten auf metrischem Skalenniveau vorliegen würden. Zudem stellen Rangindizes nicht sicher, dass die Eigenschaften, die früher genutzt werden, auch anhand der Indizes als wichtiger eingestuft werden.1343

1337 1338

Vgl. Lürssen (1989), 178; Jaccard; Brinberg; Ackerman (1986), 464. Vgl. Lürssen (1989), 178.

1339

Vgl. Kaas; Hofacker (1983), 94; Heeler; Okechuku; Reid (1979), 61; Lürssen (1989), 67; Gierl; Satzinger (2000), 274. Schweikl (1985, 104f., 177ff.) verwendet die relative Häufigkeit der Informationsnutzung einer Eigenschaft zur Bestimmung der in der Conjoint-Analyse zu verwendenden Attribute. 1340 Vgl. Lürssen (1989), 178f. 1341 1342 1343

Vgl. Lürssen (1989), 179; Gierl; Satzinger (2000), 272; Schweikl (1985), 104f.; Stallmeier (1993), 42. Vgl. Backhaus; Erichson; Plinke; Weiber (2003), 6. Einige Beispiele für Probleme bei der Verwendung von Rangindizes beschreibt Lürssen (1989, 179ff.).

235

Aufgrund der aufwendigen Datenerhebung werden Untersuchungen mit Information-DisplayBoards häufig unter Laborbedingungen1344 durchgeführt. Deshalb ist oft nur eine Berücksichtigung weniger Befragungsteilnehmer möglich. Meist werden dazu studentische Probanden genutzt.1345

Unterschiede in der Präsentation der Informationen zwischen Laborsituation und Realität können jedoch die Ergebnisse der Erhebung beeinflussen. Während im Rahmen von Information-Display-Boards die nötigen Ausprägungen der Alternativen übersichtlich, strukturiert und mit einem gleichen Informationsgehalt1346 präsentiert werden, sind in der Realität die Packungsbeschreibungen nicht gleichartig strukturiert und nicht immer die gleichen Produktmerkmale beschrieben. Das Information-Display-Board ist deshalb nur dann eine geeignete Methode, wenn auch in der Realität die Informationen in Matrixform gegenübergestellt werden, wie dies bei vergleichender Werbung der Fall sein kann.1347 Dieses Problem betrifft allerdings die meisten Methoden zur Ermittlung von Eigenschaften sowie die Verfahren zur Präferenzmessung. Die Art der Informationsaufnahme und –verarbeitung zwischen Information-DisplayMatrizen und realen Entscheidungssituationen stehen im Gegensatz zueinander.1348 Bei realen Kaufentscheidungen stehen die Informationen simultan, d.h. gleichzeitig zur Verfügung. Das Verfahren der Information-Display-Boards zwingt dagegen den Entscheidungsträger dazu, die Informationen sequentiell aufzunehmen.1349 Bei der Anwendung von Information-DisplayBords muss sich der Befragungsteilnehmer seinen Informationsstand über die verschiedenen Alternativen selbst konstruieren. In der Realität selektiert er eher aus einer Vielzahl von Informationen die für ihn wichtigen Merkmale.1350 Im Hinblick auf den Informationsstand handelt es sich folglich um gegensätzliche Anfangssituationen und daraus resultierend um unterschiedliche Entscheidungsstrategien zur Verarbeitung der Informationen. Dies führt im Vergleich zu realen Entscheidungen zu einer geringen Konvergenz der Ergebnisse bezüglich des Ausmaßes der Informationsnutzung. Einerseits wurde festgestellt, dass bei der Anwendung von Information-Display-Boards wesentlich weniger Informationen genutzt werden als 1344

Eine Nutzung von Information-Display-Boards kann ebenfalls computergestützt erfolgen (vgl. Kaas; Hofacker (1983), 76; Painton; Gentry (1985), 241; Lürssen (1989), 45, 85). Eine der bekanntesten computergestützten Varianten ist “Mouselab” (für ein Anwendungsbeispiel siehe Dhar; Nowlis; Sherman (1999), 298f.). Daneben ist die Anwendung von Information-Display-Bords im Rahmen von schriftlichen Befragungen denkbar. Die Matrix ist dabei mit Klebestreifen abgedeckt. Die Befragungsteilnehmer werden gebeten, die abgezogenen Klebestreifen entsprechend der Reihenfolge der Informationssuche auf ein vorgegebenes Raster zu kleben (vgl. Kaas; Hofacker (1983), 76). 1345 Vgl. Kaas; Hofacker (1983), 76. 1346 1347 1348 1349 1350

236

Es werden jeweils immer die gleichen Eigenschaften bei jeder Alternative genutzt (vgl. Lürssen (1989), 58ff.). Vgl. Kaas; Hofacker (1983), 77. Vgl. Aschenbrenner (1990), 155. Vgl. Lürssen (1989), 60f. Vgl. Kaas; Hofacker (1983), 78.

z.B. im Vergleich zur Erfassung mit Blickregistrierungsgeräten1351 - dies wird darauf zurückgeführt, dass bei der Anwendung von Informationstafeln die Informationssuche sehr viel zielgerichteter als im Normalfall erfolgt.1352 Andere Forscher kommen demgegenüber zu dem Schluss, dass die Befragungsteilnehmer meist zunächst einen Großteil der vorhandenen Zellen aufdecken und erst dann mit der Informationsverarbeitung beginnen. Sie nutzen deshalb mehr Informationen als in der Realität, weil das Aufdecken einen sehr viel geringeren Aufwand als die Informationsverarbeitung und Entscheidung für eine Alternative darstellt.1353 Überdies ist nicht auszuschließen, dass die Probanden das Aufdecken der Informationskarten eher als eine Art „Spiel“ empfinden und deshalb das jeweilige Entscheidungsproblem anders als im Normalfall lösen.1354 Insofern sind ernsthafte Zweifel angebracht, ob Information-Display-Boards überhaupt tatsächliches Informationsaufnahmeverhalten messen.1355 Auch das Vorwissen der Befragungsteilnehmer hat einen entscheidenden Einfluss auf das Informationssuchverhalten.1356 So nutzt ein Entscheidungsträger evtl. nicht alle Informationen durch die eine Alternative beschrieben wird, weil bei einer Eigenschaft eine nicht akzeptable Ausprägung präsentiert wurde.1357 Ist dies der Fall, kann die Häufigkeit der Aufdeckung von Ausprägungen eines Merkmals nicht als Indiz für dessen Informationsnutzung verwendet werden. Mit ähnlich verzerrten Ergebnissen ist zu rechnen, wenn zusammen mit den Alternativen jeweils der entsprechende Markenname genannt wird. Der Befragungsteilnehmer nutzt in diesem Fall nicht alle zur Entscheidung notwendigen Informationen, da er die Ausprägungen anderer Eigenschaften bei bestimmten Marken bereits kennt.1358 Die Informationsaufnahme kann als Lernprozess mit einer eher zufälligen Sequenz verschiedener präsentierter Eigenschaftsausprägungen angesehen werden.1359 Die Häufigkeit und Sequenz der Informationsaufnahme könnte in diesem Fall nicht als Indikator der Bedeutung einer Eigenschaft, sondern stattdessen lediglich als Zufallsgröße interpretiert werden. Letztlich wird, wie bereits mehrfach beschrieben, in dieser Arbeit davon ausgegangen, dass die Bedeutung von Eigenschaften allein durch ihre jeweiligen Ausprägungen bzw. genauer durch die Nutzenunterschiede der Bandbreiten der Ausprägungen determiniert wird. Da

1351 1352 1353 1354 1355 1356 1357 1358 1359

Siehe Kapitel 5.3.1.3. Vgl. Aschenbrenner (1990), 158. Vgl. Kaas; Hofacker (1983), 78; Lürssen (1989), 73, 77. Vgl. Kaas; Hofacker (1983), 79; Lürssen (1989), 65. Vgl. Lürssen (1989), 64. Vgl. Lürssen (1989), 189ff.; Gierl; Satzinger (2000), 263ff. Vgl. Kaas; Hofacker (1983), 81. Vgl. Lürssen (1989), 181f. Zum Einfluss der Eigenschaft „Marke“ auf die von einem Entscheider angewendeten Bewertungsstrategien siehe Kapitel 4.1.2. Vgl. Lürssen (1989), 181f.

237

die jeweiligen Felder mit den Ausprägungen jedoch verdeckt präsentiert werden, sind diese dem Befragungsteilnehmer bis kurz vor Abschluss der Befragung nicht bekannt. Erst am Ende des Informationsaufnahmeprozesses, wenn also alle Felder einer Eigenschaft aufgedeckt sind, kann der Proband die Bandbreite und damit die Bedeutung einer Eigenschaft überhaupt einschätzen. Stellt der Entscheidungsträger nun fest, dass sich die Alternativen bezüglich eines Merkmals kaum unterscheiden, spielt diese Eigenschaft bei der Entscheidung für einen Stimulus kaum bzw. keine Rolle, auch wenn sämtliche Ausprägungen aufgedeckt wurden.1360 Die Nutzung der im Rahmen von Information-Display-Boards erhobenen Daten zur Bestimmung von relevanten Eigenschaften erscheint aus diesen Gründen nicht sinnvoll.

5.3.1.3 Blickregistrierung

Ziel der Verfahren zur Blickaufzeichnung ist es, wie bei der Methode der InformationDisplay-Boards, das Ausmaß der externen Informationsaufnahme zu bestimmen.1361 Menschen nehmen ihre Umgebung durch eine Vielzahl von unregelmäßigen Augenbewegungen visuell wahr. Das Auge kann jedoch nur scharf sehen, wenn es einen Augenblick ruht. Dieses „Ruhen“ der Augen zum scharf Sehen nennt man Fixation. Der Fixation schließt sich eine ruckartige Bewegung der Augen an, welche als Saccade bezeichnet wird. Der visuelle Wahrnehmungsprozess besteht deshalb aus Fixationen und Saccaden.1362 Die Blickaufzeichnung erfolgt durch spezielle Brillen, die den Verlauf der Pupillenbewegungen erfassen.1363 Der Grundgedanke bei der Blickregistrierung ist, dass nur Informationen, die das Auge fixiert, gerade aufgenommen und möglicherweise verarbeitet werden. Die Reihenfolge der Fixation von Objektinformationen ermöglicht somit eine Analyse der Aufnahme- und in Ansätzen der Verarbeitungsfolge von Informationen.1364 Dabei ist zu beachten, dass die Blickbewegungen nicht unbedingt bewusst beeinflusst werden können; visuelle Wahrnehmungsprozesse werden vielmehr durch Gewohnheiten und bisherige Erfahrungen unterbewusst gesteuert. Dementsprechend werden die Methoden der Blickaufzeichnung vor allem dazu genutzt, unterbewusste Wahrnehmungsprozesse zu erfassen.1365 Praktische Bedeutung besitzt die

Blickaufzeichnung insbesondere bei der Analyse von Gestaltungsoptionen in der Kommunikationspolitik, z.B. zur Analyse der aufgenommenen Informationen bei Anzeigen oder TV-

1360 1361 1362 1363 1364 1365

238

Vgl. Lürssen (1989), 182. Vgl. Lürssen (1989), 79; Schub von Bossiazky (1992), 51. Vgl. Schub von Bossiazky (1992), 51f.; Kroeber-Riel (1996), 55. Vgl. Trommsdorff (2003), 260. Vgl. Aschenbrenner (1990), 155; Kroeber-Riel (1996), 56; Felser (1997), 324f. Vgl. Schub von Bossiazky (1992), 52; Kroeber-Riel (1996), 55; Trommsdorff (2003), 260.

Spots.1366 Daneben werden die Methoden zur Blickaufzeichnung auch dazu verwendet, den Kaufentscheidungsprozess und die darin einfließenden Alternativen sowie die jeweils berücksichtigten Produktmerkmale genauer zu analysieren. Zu diesem Zweck wird die Anzahl sowie die Reihenfolge der Fixationen erhoben.1367 Eine wiederholte Informationsaufnahme durch den Befragungsteilnehmer ist bei Studien mit Blickaufzeichnung sehr einfach zu erfassen. Bei praktischen Anwendungen konnte festgestellt werden, dass Probanden im Vergleich zu Information-Display-Boards sehr viel häufiger von einer wiederholten Informationsaufnahme Gebrauch machen.1368 Ein Vorteil dieser Beobachtungsmethode ist also, dass nur relativ wenig in den Informationsaufnahmeprozess eingegriffen wird. Durch den sehr hohen apparativen Aufwand verteuert sich indes die Bestimmung der entscheidungsrelevanten Eigenschaften.1369 Außerdem ist damit zu rechnen, dass die Blickerfassungsgeräte das natürliche Informationsaufnahmeverhalten beeinflussen könnten.1370 Bei der Anwendung der Methoden zur Blickregistrierung muss beachtet werden, dass von der Informationsaufnahme nicht automatisch auf eine Relevanz der Merkmale geschlossen werden kann. Die wahrgenommenen Informationen könnten z.B. vergessen werden, bevor sie tatsächlich präferenzwirksam werden.1371 Allein aufgrund der Aufnahme von Informationen ist deshalb nicht ohne weiteres deren Bedeutung für die Präferenz bestimmbar. Mit der Blickaufzeichnung wird letztendlich nur die Chance gemessen, dass Informationen überhaupt verarbeitet werden können.1372 Insofern verwundert es nicht, dass zwischen den Verfahren der Blickaufzeichnung und den Bedeutungsgewichten der Conjoint-Analyse nur eine geringe Konvergenz besteht.1373 Viel stärker als die Information beeinflusst die Gestaltung bzw. Präsentation der Informationen (d.h. Kontraste, Farbe, Formen usw.) die Art und Reihenfolge der Informationsaufnahme.1374 Die Methoden der Blickerfassung sind aus diesem Grund zur Analyse der Informationsaufnahme, jedoch nicht zur Ableitung von Informationsverarbeitungsstrategien oder gar zur Bestimmung von relevanten Eigenschaften für die Präferenzmessung geeignet.1375

1366 1367 1368 1369 1370 1371 1372 1373 1374 1375

Vgl. Schub von Bossiazky (1992), 57; Trommsdorff (2003), 447. Vgl. Schub von Bossiazky (1992), 55ff. Vgl. Lürssen (1989), 72. Vgl. Aschenbrenner (1990), 155f. Vgl. Schub von Bossiazky (1992), 52. Vgl. Schub von Bossiazky (1992), 59. Vgl. Kroeber-Riel (1996), 56. Für einen Überblick verschiedener Studien siehe Kaas; Hofacker (1983), 96. Vgl. Kroeber-Riel (1996), 58f. Vgl. Trommsdorff (2003), 260f.

239

Schließlich muss insbesondere die Grundannahme aller Verfahren zur Blickaufzeichnung kritisch hinterfragt werden. Studien von Womelsdorf; Anton-Erxleben; Pieper; Treue (2006, 1ff.) zeigen, dass auch Informationen, die vom Auge nicht fixiert werden, aufgenommen und verarbeitet werden können. Insofern kann durch die Erfassung von Augenbewegungen nicht die tatsächliche Informationsaufnahme geschlossen werden.

5.3.1.4 Neuroökonomische Verfahren

Zu den neuroökonomischen Methoden der Prozessverfolgung zählen sämtliche Verfahren, bei denen die Probanden mit verschiedenen Stimuli konfrontiert und deren Reaktionen durch Messung der Gehirnströme, des Hautwiderstands, des Pulses, des Hormonpegels oder der Pupillenerweiterung erhoben werden.1376 Die Stärke bzw. die Muster der Messergebnisse werden als Indikator für die Wichtigkeit des Untersuchungsobjektes genutzt.1377 Messungen der Gehirnaktivität sollen weiterhin Aufschluss darüber geben, wie und anhand welcher Eigenschaften Konsumenten teilweise innerhalb von wenigen Sekunden Wahlentscheidungen tref-

fen. Beispielsweise kann auf diese Weise untersucht werden, welchen Einfluss Marken auf die Art des Entscheidungsprozesses ausüben.1378 Vergleichbar zu den Methoden der Blickregistrierung sind die neurologischen und physiologischen Reaktionen auf einen Reiz nicht bewusst durch den Entscheidungsträger steuerbar. Es ist aber problematisch, die jeweilige Reaktion der Probanden auf eine ganz bestimmte Produkteigenschaft zurückführen zu wollen. Darüber hinaus zeigen die Messungen lediglich eine Reaktion; ob diese positiv oder negativ ist, bleibt meist offen. Erhoben wird allein die Intensität der Reaktion auf bestimmte Reize.1379 Anwendungsgebiete sind daher eher in der deskriptiven Entscheidungstheorie zu sehen. Durch die Ergebnisse der Neuroökonomie könnten beispielsweise hedonistisches Verhalten oder die Wirkung von Vertrauen besser erklärt werden.1380 Zur Erfassung von entscheidungsrelevanten Eigenschaften und Ausprägungen erscheinen neuroökonomische Verfahren dagegen nur sehr eingeschränkt geeignet.

1376 1377

Vgl. Harford (2003). Siehe auch Kutter (2004), 87; Felser (1997), 341; Häusel (2004), 9ff.; Ahlert; Kenning (2006), 25ff. Vgl. Harford (2003); Glimcher (2002), 323; Ahlert; Kenning (2006), 33.

1378

Vgl. Kutter (2004), 85. Für ein Beispiel mit verschiedenen Produkten, bei denen der Einfluss der Eigenschaften mittels Gehirnstrommessung untersucht wird, siehe Häusel (2004, 16f.). Einen Überblick über weitere typische Anwendungsgebiete bietet Ahlert; Kenning (2006, 32). 1379 Vgl. Felser (1997), 341f.; Trommsdorff (2003), 80. 1380

240

Vgl. Ahlert; Kenning (2006), 36f.

5.3.1.5 Grenzen und Weiterentwicklungen der Methoden zur Prozessverfolgung

Mit Hilfe der Methoden zur Prozessverfolgung lassen sich sowohl quantitative als auch qualitative Informationen erfassen.1381

Zu den quantitativen Daten zählen beispielsweise: die Anzahl oder der Anteil der betrachteten Eigenschaftsausprägungen je Merkmal,1382 der Anteil der Produktmerkmale, die je Alternative, der Anteil der Stimuli und die Anzahl der Stimuli, die je Eigenschaft betrachtet wurden. Bei der qualitativen Analyse der Erhebungsdaten werden demgegenüber insbesondere die

-

Transitionen, d.h. die Übergänge von einer Information zur nächsten untersucht.1383 Ergebnis, der durch die Methoden der Prozessverfolgung ermittelten Daten, ist eine Liste der

zur Entscheidung herangezogenen Produktmerkmale. Dabei muss berücksichtigt werden, dass der Untersuchungskontext, also die Zahl sowie Präsentationsform der z.B. im Laborexperiment präsentierten Alternativen bzw. die Zahl der untersuchten Attribute, einen erheblichen Einfluss auf die Ergebnisse ausübt.1384 Je nachdem, wie die Ausgangsmenge der Alternativen bzw. Attribute gewählt wird, ist deshalb mit unterschiedlichen Ergebnissen zu rechnen. Dies betrifft in erster Linie den Anteil der verarbeiteten Informationen. Es werden bei einer höheren Zahl an präsentierten Eigenschaften zwar absolut mehr Informationen genutzt, die relative Informationsnutzung je Attribut sinkt jedoch.1385 Im Gegensatz zu realen Entscheidungssituationen ist bei dieser Art von Laborexperimenten immer auch mit einer veränderten Motivation der Befragungsteilnehmer zu rechnen. Den in Laborexperimenten getroffenen Entscheidungen fehlt es beispielsweise an Verbindlichkeit,1386 so dass von einer verringerten Motivation der Entscheidungsträger ausgegangen werden kann. Demgegenüber werden die Informationen meist übersichtlicher dargestellt,1387 so dass die Informationssuche tendenziell einfacher und schneller als in realen Entscheidungssituationen erfolgt und mit einer erhöhten Motivation zu rechnen ist. Welcher der beiden Effek-

1381 1382

Vgl. Aschenbrenner (1990), 156. Lediglich diese Kennzahl kann zur Bestimmung der entscheidungsrelevanten Produktmerkmale herangezogen werden.

1383

Vgl. Aschenbrenner (1990), 156f. Die Ergebnisse von Transitionsanalysen erlauben lediglich sehr grobe Interpretationen zur Informationsaufnahme, zudem sind die Kennzahlen nicht eindeutig. Die generelle Möglichkeit, überhaupt sinnvolle Schlussfolgerungen anhand von Transitionsanalysen treffen zu können, ist deshalb äußerst umstritten (vgl. Kaas; Hofacker (1983), 80). Für einen Überblick über verschiedene Maßzahlen bei der Analyse von Transitionen siehe Painton; Gentry (1985, 579ff.) 1384 Vgl. Aschenbrenner (1990), 157; Bettman; Park (1980), 238; Biehal; Chakravarti (1989), 94; Biehal; Chakravarti (1995), 269f. 1385 Vgl. Aschenbrenner (1990), 157f. 1386 1387

Dies betrifft indes fast alle der hier beschriebenen Verfahren. Vgl. Kaas; Hofacker (1983), 78f.; Lürssen (1989), 57ff.; Biehal; Chakravarti (1989), 94.

241

te im Einzelfall überwiegt, kann nicht bestimmt werden.1388 Es ist generell zu beobachten, dass die Befragungsteilnehmer aufgrund der Laborsituation typischerweise „reflektierter und zielbewusster“1389 als im Realfall Entscheidungen treffen. Angesichts der erheblichen Defizite der bisher beschriebenen Verfahren zur Prozessverfolgung wurde in weiteren Varianten versucht, durch parallelen oder interaktiven Einsatz mehrerer Methoden die Befragungsergebnisse zu verbessern. Ein Beispiel für solche Multimeasurement-Ansätze1390 ist das „offene“ Information-Display-Board, bei dem sämtliche Informa-

tionen sofort präsentiert werden. Die einzelnen Zellen sind bei dieser Methode mit Ziffern beschriftet. Die Aufgabe des Befragungsteilnehmers ist es, sämtliche Ziffern der Zellen zu benennen, die er bei der Entscheidungsfindung berücksichtigt. Durch diese Methode kann einerseits die sequentielle Informationsaufnahme im Vergleich zu traditionellen InformationDisplay-Board vermieden werden, andererseits sind keine eigenen verbalen Beschreibungen wie bei Gedankenprotokollen nötig. Allerdings ist auch bei dieser Methode nicht sichergestellt, dass sämtliche aufgenommenen Informationen vom Entscheidungsträger genannt werden.1391 Neben der Kombination von Information-Display-Boards mit Gedankenprotokollen können letztgenannte Methoden mit den Verfahren der Blickaufzeichnung verknüpft werden.1392 Vergleichende Untersuchungen zeigen, dass trotz allem relativ geringe Übereinstimmungen zwischen den Ergebnissen der Methoden zur Prozessverfolgung (Information-DisplayBoards, Protokolle Lauten Denkens und Blickaufzeichnung) und den in der Conjoint-Analyse ermittelten Bedeutungsgewichten bestehen.1393 Ferner ist bezüglich der Messung der Informationsnutzung im Rahmen von realen Auswahlentscheidungen fraglich, ob sich mittels Methoden der Prozessverfolgung überhaupt reale Entscheidungen simulieren lassen.1394 Deshalb erweisen sich die Methoden der Prozessverfolgung zur Bestimmung von entscheidungsrelevanten Eigenschaften sowie deren Ausprägungen als ungeeignet.

1388 1389 1390 1391 1392 1393 1394

242

Vgl. Kaas; Hofacker (1983), 78f.; Lürssen (1989), 57ff. Kaas; Hofacker (1983), 79. Siehe dazu auch Lürssen (1989), 57; Gierl; Satzinger (2000), 275f. Vgl. Kaas; Hofacker (1983), 93. Vgl. Kaas; Hofacker (1983), 84ff; Lürssen (1989), 85f. Vgl. Douglas; Craig; Faivre (1981), 35. Für einen Überblick siehe Kaas; Hofacker (1983), 96ff. Siehe zum Vergleich zwischen Conjoint-Analyse und Information-Display-Board auch Heeler; Okechuku; Reid (1979, 62). Für einen Überblick siehe Lürssen (1989), 79.

5.3.2 Psychologische Verfahren

Neben der Erhebung von Persönlichkeitsmerkmalen1395 können psychologische Verfahren auch zur Bestimmung der relevanten Eigenschaften, die im Rahmen der Conjoint-Analyse untersucht werden sollen, genutzt werden.1396 Häufig werden dabei Methoden wie Wortassoziationen,1397 Satzergänzungstests,1398 das Zeichnen bzw. die Interpretation von Cartoons1399 oder das Erfinden von Geschichten zu einem Bild als geeignet eingeschätzt, um relevante Eigenschaften im Rahmen der Conjoint-Analyse zu ermitteln.1400 In Abbildung 35 werden die psychologischen Methoden im Überblick dargestellt.1401 Psychologische Interviewtechniken Projektive Verfahren

Assoziative Verfahren

Zuordnungsverfahren

Abbildung 35: Psychologische Interviewtechniken im Überblick

Die Einordnung der verschiedenen psychologischen Verfahren erfolgt in der Literatur nicht einheitlich. So werden einige Vorgehensweisen manchmal als „projektive Verfahren“1402 bezeichnet, während andere Autoren sie dagegen zu den assoziativen Methoden bzw. den Zuordnungsverfahren zählen.1403 Auch bei anderen Verfahren1404 findet man sehr unterschiedliche Systematisierungsvorschläge für die verschiedenen psychologischen Interviewformen. Dies ist nicht zuletzt das Ergebnis einer eher uneinheitlichen Definition der verschiedenen Methoden.1405 Die hier vorgeschlagene Einordnung der Methoden kann deshalb nur eine, aber nicht die allein richtige Möglichkeit zur Gruppierung der Verfahren sein.

1395

Vgl. Green; Tull (1982), 128.

1396

Vgl. Reiners (1996), 41; Stallmeier (1993), 42; Holling; Melles; Reiners (1999), 41; Schweikl (1985), 93; Alpert (1971), 185; Myers; Alpert (1997), 54. 1397 Vgl. Reiners (1996), 41; Stallmeier (1993), 42. 1398 1399 1400

Vgl. Schweikl (1985), 93; Reiners (1996), 41; Stallmeier (1993), 42. Siehe dazu auch Myers; Alpert (1968), 17; Myers; Alpert (1997), 57. Vgl. Reiners (1996), 41; Schweikl (1985), 93. Vgl. Reiners (1996), 41.

1401

Die Gliederung der verschiedenen psychologischen Verfahren erfolgt in der Literatur nicht einheitlich - die Gruppierung der Methoden erfolgt hier analog zu Schub von Bossiazky (1992), 101ff.; Salcher (1995), 58ff. Für alternative Möglichkeiten zur Einordnung der Methoden siehe Reiners (1996), 41; Stallmeier (1993), 42; Schweikl (1985), 93. 1402 Reiners (1996), 41; Stallmeier (1993), 42; Schweikl (1985), 93. 1403 1404 1405

Siehe u.a. Schub von Bossiazky (1992), 101ff.; Salcher (1995), 71ff. Beispielsweise bezeichnet Salcher (1995, 63) die Methode der Bildzuordnungen/Collagen-Technik als projektive Verfahren, während Schub von Bossiazky (1992, 114) diese Interviewform als Zuordnungsverfahren einordnet. Vgl. Salcher (1995), 75.

243

Gemeinsamkeit aller psychologischer Interviewtechniken ist die Nutzung weitgehend offener Fragen. Der Proband soll in seinen Antwortmöglichkeiten so wenig wie möglich eingeschränkt werden.1406

5.3.2.1 Projektive Verfahren

Ihren Ursprung haben die projektiven Methoden in den Verfahren der Tiefenpsychologie.1407 Das Haupteinsatzgebiet dieser Methoden ist die Erhebung von Motiven bei Fragestellungen, auf die Befragungsteilnehmer meist nur sehr ungern antworten möchten bzw. nicht können.1408 Deshalb erfolgt die Befragung möglichst indirekt durch Projektion, d.h. der gedanklichen Übertragung der Fragestellung auf eine dritte Person.1409 Durch Projektion der zu untersuchenden Sachverhalte auf eine dritte Person und dadurch der Externalisation von inneren, affektgeladenen Wahrnehmungen wird erreicht, dass die Befragungsteilnehmer über eigene, evtl. sozial nicht erwünschte Motive sprechen.1410 Der Befragungszweck wird dem Probanden während der Untersuchung meist nicht genannt.1411 So kann durch Mehrdeutigkeit der präsentierten Aufgabenstellung das Ziel der Erhebung verschleiert und der Entscheidungsträger zur aktiven Projektion stimuliert werden. Durch eine nur vage formulierte Frage bzw. mehrdeutige Stimuli werden die Probanden angeregt, die jeweilige Situation anhand ihrer bisherigen Erfahrungen, Einstellungen und Werte zu interpretieren. Dabei werden die Befragungsteilnehmer oft auf spielerische Weise mit neuartigen Situationen konfrontiert, um ihre Motivation zu erhöhen und von der Künstlichkeit der Aufgabenstellung abzulenken.1412 Ergebnis sind keine konkreten, sondern eher „tendenzielle“1413 Antworten. Später werden diese vom Marktforscher in ein Set von Antwortmöglichkeiten eingeordnet.1414 Auch die projektiven Verfahren werden in der Literatur als eine geeignete Methode zur Bestimmung der zu untersuchenden Eigenschaften gezählt.1415 Bei einfachen projektiven Fragen wird nicht die eigene Meinung des Befragungsteilnehmern erhoben, er wird vielmehr gebeten, sich in eine dritte Person (z.B. einen Arbeitskollegen, einen durchschnittlichen Anwender eines bestimmten Produkts oder eine fiktive Person) 1406 1407 1408 1409 1410 1411 1412 1413 1414 1415

244

Vgl. Salcher (1995), 101. Vgl. Salcher (1995), 56; Kepper (2000), 183. Vgl. Hammann; Erichson (2000), 101ff.; Schub von Bossiazky (1992), 102; Chang (2001), 253. Vgl. Reiners (1996), 41. Vgl. Salcher (1995), 56f. Vgl. Hammann; Erichson (2000), 102; Schub von Bossiazky (1992), 102; Green; Tull (1982), 128; Kepper (2000), 183. Vgl. Kepper (2000), 184. Hammann; Erichson (2000), 102. Vgl. Hammann; Erichson (2000), 102; Schub von Bossiazky (1992), 102. Vgl. Albrecht (2000), 35; Sattler (1991), 83.

hineinzuversetzen und zu beschreiben, wie sich diese Person verhalten würde. Unklar bleibt allerdings, ob der Proband die eigene Meinung oder beispielsweise die des Arbeitskollegen wiedergibt.1416 Beim Ballontest1417 kann z.B. eine Kaufsituation durch ein Comic mit oft zwei Personen beschrieben werden. Die Aussagen dieser Personen werden durch Sprechblasen visualisiert, wobei jedoch nur eine Person etwas zu der anderen sagt, d.h. bestimmte Informationen vorgibt. Die Antwort soll danach vom Befragungsteilnehmer vervollständigt werden.1418 Diese Art der Befragung wird heutzutage nur noch selten eingesetzt, da die Antworten möglicherweise durch unterschiedliche Interpretationsmöglichkeiten der Untersuchungssituation und weniger durch die tatsächliche Motivation des Befragungsteilnehmers beeinflusst wird.1419 Im Rahmen von Bildwahrnehmungstests1420 werden den Probanden eine Reihe von Fotografien oder Zeichnungen präsentiert, die eine spezifische Situation in Zusammenhang mit dem jeweiligen Untersuchungsgegenstand darstellen und eher zweideutig wahrgenommen werden können. Im Gegensatz zu den Ballontests wird völlig auf verbale Beschreibungen verzichtet.1421 Die Befragungsteilnehmer werden gebeten, sich in die Person auf den Bildern hineinzuversetzen und diese zu charakterisieren1422 oder eine Geschichte zu den Fotos zu erfinden.1423 Ziel der Produkt-Personifizierungsmethode ist es, das Image, Verwendungsmotive und -barrieren eines Produktes zu untersuchen. Der Befragungsteilnehmer soll hierbei mit seinen eigenen Worten den typischen Käufer (Intensivnutzer) oder Nicht-Käufer einer bestimmten Marke bzw. eines bestimmten Produkts zu charakterisieren. Alternativ können verschiedene Bilder mit Personen der Gruppe der Käufer oder Nicht-Käufer zugeordnet werden.1424 Beim Erzähl-Test wird dem Befragungsteilnehmer der Anfang einer Geschichte vorgegeben, die dieser weiter erzählen soll. Als Ausgangsreiz dient häufig ein Dialog von Personen, die das Untersuchungsobjekt kurz vorstellen.1425

1416 1417 1418 1419

Vgl. Schub von Bossiazky (1992), 103; Salcher (1995), 59; Alpert (1971), 185. Teilweise wird diese Vorgehensweise auch als Picture-Frustration-Test bezeichnet (vgl. Salcher (1995), 59). Vgl. Salcher (1995), 59ff. Vgl. Schub von Bossiazky (1992), 103ff.

1420

Dieser wird in der Literatur auch als „thematischer Apperzeptionstest“ (vgl. Green; Tull (1982), 133), „Bilder-ErzählTest (vgl. Schub von Bossiazky (1992), 105; Salcher (1995), 61f.) bzw. „Proshansky Wahrnehmungstest“ (vgl. Krech; Crutchfield (1948), 240) bezeichnet. 1421 Vgl. Salcher (1995), 61. 1422 1423 1424 1425

Vgl. Green; Tull (1982), 133. Vgl. Krech; Crutchfield (1948), 240; Salcher (1995), 61f. Vgl. Schub von Bossiazky (1992), 105ff.; Salcher (1995), 62f. Vgl. Schub von Bossiazky (1992), 107; Salcher (1995), 66f.

245

Die hier präsentierten Verfahren scheinen zur Bestimmung der für die Präferenzmessung relevanten Eigenschaften weniger geeignet, da im Mittelpunkt weniger Produkte, sondern allgemeine Einstellungen stehen, denen der Produktbezug u.U. fehlt. Mit Hilfe dieser Verfahren kann eher das Erlebnisumfeld in bestimmten (Kauf-)Situationen untersucht werden. Sie könnten weiterhin zur Erfassung von Imagery-Eigenschaften genutzt werden; diese Eigenschaftsart kann indes nicht sinnvoll mit den Verfahren zur Präferenzmessung untersucht werden.

5.3.2.2 Assoziative Verfahren

Auch assoziative Verfahren können zur Bestimmung der in der Präferenzmessung zu berücksichtigenden Merkmale herangezogen werden.1426 Ziel der assoziativen Verfahren ist die „spontane und ungelenkte (automatische) Verbindung einzelner Gedächtnis- und Gefühlsinhalte.“1427 Wichtig ist somit, dass der Befragungsteilnehmer möglichst schnell auf die verschiedenen Fragen antwortet. Aufgabe des Interviewers ist es deshalb, „längeres Zögern oder Nachdenken bei der Testperson zu verhindern und sie zur freien Äußerung zu ermuntern“.1428 Daher sind hier nur persönliche Interviews geeignet. Bei den Methoden der assoziativen Verfahren differenziert man zwischen: -

freien Assoziationen, gelenkten Assoziationen und eingeschränkten Assoziationen (Wortassoziationen).1429

Bei den Methoden der freien Assoziationen kann man zwischen einer völlig freien Assoziation und der freien Assoziation unter Vorgabe eines Anfangsreizes unterscheiden. Eine mögliche Fragestellung für eine völlig freie Assoziation wäre: „Erzählen Sie mir bitte alles, was Ihnen so [zu einem bestimmten Untersuchungsobjekt ] in den Sinn kommt!“1430 Die Frageformulierung der Assoziation unter Vorgabe eines Anfangsreizes entspricht weitgehend der Variante der Elicitaion-Technik, bei der allgemeine Assoziationen zu einem Untersuchungsobjekt erhoben werden.1431 Eine typische Aufgabenstellung bei dieser Vorgehensweise ist beispielsweise: „Sagen Sie mir bitte alles, was Ihnen in den Sinn kommt, wenn Sie folgendes

1426 1427 1428 1429 1430 1431

246

Vgl. Albrecht (2000), 35; Schweikl (1985), 93; Sattler (1991), 83. Salcher (1995), 67. Salcher (1995), 71. Vgl. Schub von Bossiazky (1992), 108. Schub von Bossiazky (1992), 108. Siehe dazu auch Salcher (1995), 70. Siehe Kapitel 5.2.1.1 oder auch Schweikl (1985), 93.

Wort hören: [...].“1432 Dieser Ausgangsreiz (z.B. eine bestimmte Eigenschaft) wird jedoch relativ offen formuliert, so dass mit einer höheren Bandbreite der Assoziationen gerechnet werden kann.1433 Im Gegensatz zu den Methoden der ungelenkten Assoziationen wird das Assoziationsfeld bei den gelenkten Assoziationen auf einen bestimmten Teilbereich (durch Vorgabe eines eingeschränkten Schlüsselreizes) beschränkt.1434 Während beispielsweise bei den freien Assoziationsmethoden lediglich eine Produktgruppe (z.B. Waschmittel) vorgegeben werden kann, werden bei gelenkten Verfahren der Assoziation bestimmte Teilaspekte (z.B. Umweltverschmutzung durch Waschmittel) untersucht.1435 Satzergänzungstests1436 werden u.a. zu diesen Methoden der gelenkten Assoziationen gerechtet.1437 Sie verfolgen das gleiche Ziel wie die Methode der Wortassoziationen, mit dem Unterschied, dass keine einzelnen Wörter, sondern Satzfragmente vorgegeben werden, die der Befragungsteilnehmer vervollständigen soll.1438 Ein Beispiel für Satzergänzungstests, die zur Ermittlung von relevanten Eigenschaften verwendet werden könnte, ist: „Am wichtigsten bei der Auswahl einer bestimmten Marke von Haushaltsreinigern ist ... .“1439 Meist werden den Befragungsteilnehmern eine Reihe von unvollständigen Sätzen vorgelegt,1440 die möglichst schnell und unreflektiert vervollständigt werden sollen.1441 Bei Wortassoziationstests werden dem Befragungsteilnehmer eine Reihe von Schlagwörtern präsentiert, zu denen er möglichst unmittelbar seine Assoziationen nennen soll.1442 Dabei darf die Antwort des Befragungsteilnehmers jeweils nur aus einem Wort bestehen. Insbesondere durch die schnelle Vorgabe immer neuer Wörter wird erreicht, dass der Befragte spontan und relativ unkontrolliert antwortet.1443 Wichtig sind jedoch weniger die Antworten der Befragungsteilnehmer, sondern die Zeit zwischen Nennung des Schlüsselreizes und Antwort des Befragungsteilnehmers. Es wird davon ausgegangen, dass ein Zögern des Probanden einer gewisse Blockierung gleich zu setzen ist, die durch unangenehme Assoziationen mit dem vor1432 1433 1434 1435 1436 1437 1438 1439 1440 1441 1442 1443

Schub von Bossiazky (1992), 108. Siehe auch Salcher (1995), 70. Vgl. Schub von Bossiazky (1992), 108. Vgl. Salcher (1995), 71. Vgl. Schub von Bossiazky (1992), 109. Diese werden auch als Methode der „Lücken-Ergänzung“ bezeichnet (vgl. Schub von Bossiazky (1992), 107; Salcher (1995), 67, 71). Vgl. Schub von Bossiazky (1992), 109. Vgl. Green; Tull (1982), 131; Stallmeier (1993), 42. Schub von Bossiazky (1992), 109. Vgl. Schub von Bossiazky (1992), 109. Diese Methode wird teilweise als „Stress-Interwiew“ bezeichnet (vgl. Salcher (1995), 72). Vgl. Salcher (1995), 67. Vgl. Green; Tull (1982), 131. Vgl. Schub von Bossiazky (1992), 109f.

247

gegebenen Reiz verursacht werden können.1444 In der Marketingforschung wird diese Methode relativ selten angewendet. Ein Grund dafür ist, dass der Befragungsteilnehmer durch die schnelle Folge von Wörtern erheblich unter Druck gesetzt wird.1445 Die Methoden der assoziativen Verfahren werden in der Praxis vor allem dazu eingesetzt, das Erlebnisumfeld eines bestimmten Produktes bzw. einer Produktgruppe zu untersuchen und

Ableitungen zur Image-Positionierung zu treffen.1446 Bei den erhobenen Statements handelt es sich eher um Attribute der Eigenschaftsart „Imagery“, deren Untersuchung innerhalb von Verfahren der Präferenzmessung nur äußerst selten genutzt und hier mit erheblichen Problemen verbunden sind.1447

5.3.2.3 Zuordnungsverfahren

Ziel der Zuordnungsmethoden ist es, Farben, Formen, Fotos, Eigenschaften, Ausprägungen usw. bestimmten Produkten zuzuordnen. Die Vorgabe z.B. von Eigenschaften bzw. Eigenschaftsausprägungen soll die Befragungsteilnehmer bei der Beantwortung unterstützen.1448 Aus einer umfangreichen Liste mit verbalen Beschreibungen von Eigenschaftsausprägungen verschiedener Merkmale können somit diejenigen ausgewählt werden, die eine bestimmte

Marke am Besten beschreiben.1449 Neben einer kategorialen Zuordnung (zutreffend/nicht zutreffend) von Eigenschaftsausprägungen zu einem speziellen Untersuchungsobjekt kann ebenso eine Rangfolge bzw. eine Rating-Skala bezüglich der Assoziationsstärke zwischen einer oder mehreren Marke(n) bzw. Produkt(en) und einer Eigenschaftsausprägung genutzt werden.1450 Zur Erläuterung der Aufgabenstellung können verbale Beschreibungen, Bilder und Fotos von Personen genutzt und diese den einzelnen Produkten zugeordnet werden.1451 Dies ist beispielsweise dann relevant, wenn das Image einer bestimmten Marke untersucht werden soll.1452 Diese Vorgehensweise wird deshalb als Bildzuordnungen/Collagen-Technik1453 1444 1445 1446 1447 1448

Vgl. Salcher (1995), 73. Vgl. Schub von Bossiazky (1992), 109f.; Salcher (1995), 73. Vgl. Salcher (1995), 74. Siehe Kapitel 4.1.8. Vgl. Salcher (1995), 79f.; Schub von Bossiazky (1992), 110.

1449

Ein Beispiel für eine solche Zuordnung von Eigenschaftsausprägungen zu einem Produkt findet man in Schub von Bossiazky (1992, 111) oder Salcher (1995, 79). 1450 Vgl. Salcher (1995), 80ff.; Schub von Bossiazky (1992), 113. 1451

Eine mögliche Aufgabenstellung wäre dabei beispielsweise, anhand von mehreren Fotos von Personen eines auszuwählen, dass am besten zu einer bestimmten Marke passt, d.h. dem „typischen“ Käufer einer Marke entspricht (vgl. Schub von Bossiazky (1992), 112). 1452 Vgl. Schub von Bossiazky (1992), 112f. 1453

248

Vgl. Salcher (1995), 63. Weitere Bezeichnungen sind „Bildzuordnungen“ (vgl. Salcher (1995), 63) und „Gestalterische Zuordnungsverfahren“ (vgl. Schub von Bossiazky (1992), 114).

bezeichnet. Ziel ist die Erhebung von inneren Bildern der Konsumenten, die das Produktwahlverhalten bei Entscheidungen beeinflussen können und die sehr stark emotional geprägt sind.1454 Bei Bildzuordnungen werden dem Befragungsteilnehmer eine Reihe von Fotos mit verschiedenen Lebenssituationen von Personen präsentiert, von denen er die auswählen soll, die er am meisten mit der jeweiligen Marke/einem Produkt verbindet.1455 Auch Collagen können zur Visualisierung innerer Bilder genutzt werden. Der Proband erhält dabei einen Stapel mit verschiedenen Zeitschriften, aus denen er Fotos und Textteile ausschneiden und zu einer Collage, die das Produkt aus seiner Sicht repräsentiert, zusammenstellen soll. In der Praxis werden häufig verbale Beschreibungen genutzt. Die Verwendung von Fotos und Collagen ist problematisch, weil der Marktforscher zunächst die Bewertungsbasis anhand von mehr oder weniger subjektiven Gesichtspunkten auswählen müsste. Eine einheitliche Interpretation ist aufgrund von Wahrnehmungsunterschieden u.U. nicht möglich.1456 Die Grundlage der Zuordnungsverfahren bildet eine bereits bestehende Liste mit potenziell wichtigen Produkteigenschaften sowie deren Ausprägungen. Problematisch an dieser Vorgehensweise ist, dass der Befragungsteilnehmer auch zwei Eigenschaftsausprägungen eines Produktmerkmals einer Marke zuordnen kann, so dass die Auswertung letztlich nicht mehr eindeutig ist.1457 Eine weitere Möglichkeit, Bilder und Collagen zur Erhebung von relevanten Produkteigenschaften zu nutzen, bietet die Zaltman Metaphor Elicitation Technique (ZMET).1458 Das Hauptziel der ZMET ist die Erhebung innerer Bilder der Konsumenten; Produkteigenschaften repräsentieren einen Teil davon.1459 Dabei wird davon ausgegangen, dass Konsumenten

nicht wissen, warum sie ein Produkt einem anderen vorziehen und das Wahlverhalten entscheidend durch unbewusste Faktoren beeinflusst wird. Bewertungsstrategien und Wahlentscheidungen könnten somit nicht durch Anwendung der traditionellen Methoden untersucht werden. Menschen denken demnach eher in Bildern und Metaphern, die anhand von Collagen, bestehend aus je acht bis zehn Bildern, visualisiert werden können.1460

1454 1455 1456

Vgl. Salcher (1995), 63ff. Vgl. Salcher (1995), 64. Vgl. Salcher (1995), 64.

1457

Vgl. Salcher (1995), 77. Ein typisches Beispiel eines Zuordnungsverfahrens, bei dem keinesfalls ausgeschlossen ist, dass der Befragungsteilnehmer einer Eigenschaft (z.B. Geschmack eines Bieres) mehrere Ausprägungen zuordnen kann, findet man bei Salcher (1995, 81ff.). 1458 Teilweise wird dieses Verfahren als Zaltmans Metapher-Analyse-Technik bezeichnet (vgl. Morse (2002), 10). 1459 1460

Vgl. Coulter; Zaltman (1994), 502. Vgl. Tomlin (2002), 26.

249

Um die beschriebenen Probleme bei der traditionellen Collagen-Technik zu vermeiden, werden diese um persönliche Interviews erweitert. Die Befragungsteilnehmer erhalten in einem ersten Schritt eine Beschreibung des Untersuchungsobjekts und etwa zehn Tage Zeit, um anhand von Fotos aus selbst gewählten Magazinen und Zeitschriften bzw. mit eigenen sonstigen Fotos eine Collage über das Untersuchungsobjekt zu erstellen.1461 Da die Bilder von den Konsumenten selbst ausgesucht werden, ist die Interpretation für die Marktforscher oft unmöglich. Denn aus Forschersicht haben die Fotos häufig nichts mit dem Untersuchungsobjekt zu tun.1462 In einem zweiten Schritt werden die Probanden deshalb im Rahmen von persönlichen Interviews gebeten, die Bedeutung der verwendeten Fotos zu beschreiben. Dabei kommen Methoden wie die Repertory-Grid Technik1463 und Laddering-Interviews1464 zum Einsatz. Darüber hinaus werden die Probanden gefragt, ob sie sämtliche Bilder, die sie im Kopf hatten, finden konnten und in der Collage verarbeitet haben. Ist dies nicht der Fall, werden die Befragungsteilnehmer gebeten, diese fehlenden inneren Bilder zu beschreiben.1465 Die Befragungsteilnehmer nutzen zwar sehr unterschiedliche Fotos zur Illustration ihrer inneren Bilder, häufig liegen diesen aber die gleichen Gefühle zugrunde. Die Ergebnisse vieler Studien zeigen, dass bei bestimmten Produktarten emotionale Komponenten wichtiger als rationales Wissen sein können. Dies ist insbesondere bei Produkten der Fall, die anhand ihrer physischen Produktmerkmale absolut identisch sind (z.B. Markenprodukt eines Medikaments und die entsprechenden Generika). Hier konnte beobachtet werden, dass trotz identischer physischer Ausprägungen das Markenprodukt aufgrund des positiven inneren Bildes und den damit verbundenen positiven Emotionen bevorzugt wurde.1466 Es werden somit vor allem Imagery-Eigenschaften untersucht, die, wie bereits dargestellt, keinen Produktbezug aufweisen und deshalb nicht mit Hilfe der Verfahren zur Präferenzmessung untersucht werden können.

5.3.2.4 Auswertung der Befragungsergebnisse bei psychologischen Methoden

Die Interpretation der mit Hilfe der psychologischen Verfahren erhobenen Daten erfordert besonders geschulte Spezialisten.1467 Zudem erweist sich die Aggregation der Daten als problematisch. Wie bereits dargestellt, besteht eine Möglichkeit darin, die Statements zu Gruppen 1461 1462

Vgl. Coulter; Zaltman (1994), 502ff. Vgl. Tomlin (2002), 26.

1463

Es werden jeweils zufällig drei Fotos aus der Collage ausgewählt und der Befragungsteilnehmer aufgefordert zwei Fotos zu bestimmen, die einander ähnlich und zu dem dritten unähnlich sind. Der Proband wird danach gebeten, sämtliche Merkmale, bezüglich derer sich die Fotos unterscheiden, zu nennen (vgl. Coulter; Zaltman (1994), 503; siehe auch Kapitel 5.2.1.2) 1464 Siehe Kapitel 5.3.3. 1465 1466 1467

250

Vgl. Coulter; Zaltman (1994), 502ff. Vgl. Tomlin (2002), 26. Vgl. Salcher (1995), 58.

zusammenzufassen und dann entsprechend der absoluten Häufigkeit bzw. dem relativen Anteil der Gruppen auszuwerten. Allerdings findet man immer wieder Studien, bei denen ledig-

lich Einzelstatements präsentiert und anhand dieser individuellen Einschätzungen Schlussfolgerungen für die gesamte Zielgruppe abgeleitet werden.1468 Zusammenfassend sind die Ergebnisse meist nur sehr schwer quantifizierbar und deshalb die Ableitung konkreter Entscheidungen nicht möglich.1469 Ein weiterer Grund für die seltene praktische Anwendung der projektiven Verfahren zur Bestimmung von relevanten Eigenschaften im Rahmen der Conjoint-Analyse1470 könnte darin begründet sein, dass sie vor allem für Güter geeignet sind, die sich bezüglich der Produktqualität, den objektiven Merkmalen und dem Preis kaum unterscheiden.1471 Green; Tull (1982, 128) bezeichnet Produktgruppen wie Seife, Waschmittel, Benzin und Zigaretten als besonders geeignete Untersuchungsobjekte für die Anwendung von psychologischen Verfahren. Dabei handelt es sich meist um Produkte, bei denen der Entscheidungsträger nicht den gesamten, in Kapitel 2.3 beschriebenen, Kaufentscheidungsprozess durchlaufen. Bei diesen Produktgruppen ist eher mit der Anwendung vereinfachter Kaufentscheidungsstrategien zu rechnen, bei denen die letztendliche Wahlentscheidung nicht auf Basis ausgeprägter Trade-off Bewertungen der einzelnen Produktmerkmale, sondern mit Hilfe einfacher Entscheidungsheuristiken abgeleitet wird. Letztlich beziehen sich die oben beschriebenen Verfahren häufig nur auf ein ganz konkretes Produkt, so dass lediglich für dieses eine Untersuchungsobjekt relevante Bewertungsdimensionen ermittelt werden. Grundlage der Conjoint-Analyse ist aber die gesamte relevante Bandbreite der Eigenschaftsausprägungen für eine bestimmte Zielgruppe. Die psychologi-

schen Verfahren sind nicht geeignet, diese zu bestimmen.

5.3.3 Tiefenpsychologische Interviews

Bei den Systematisierungsvorschlägen zur Einordnung von tiefenpsychologischen Interviews reicht die Spanne der Methoden vom völlig offenen und unstrukturierten Interview bis zum stark strukturierten Fragebogen, der nur noch aufgrund seiner offenen Fragen als „Tiefeninterview“ eingeordnet werden kann.1472 Herrmann (1998, 374) bezeichnet sogar strukturierte

1468 1469 1470 1471 1472

Vgl. Green; Tull (1982), 130f. Vgl. Salcher (1995), 58. Vgl. Schweikl (1985), 93; Reiners (1996), 41. Vgl. Green; Tull (1982), 128. Vgl. Salcher (1995), 27.

251

Fragebögen, die auf geschlossenen Fragen (d.h. vorgegebene Antwortmöglichkeiten) beruhen als eine Art „tiefenpsychologisches Interview“. Trotz uneinheitlicher Definitionen des Begriffs „tiefenpsychologisches Interview“ kann man diese Methoden in die drei Hauptformen der nicht-direkten Technik, der halb-direkten Technik und der direkten Technik einordnen.1473 Weiterhin können Verfahren wie das Laddering-Interview und die Benefit-Chain zu den tiefenpsychologischen Methoden gezählt

werden. Bei der nicht-direkten Technik handelt es sich um ein völlig offenes Gespräch zu einem bestimmten Untersuchungsbereich. Die Aufgabe des Interviewers beschränkt sich auf das Ansprechen von bestimmten Themen und das Zuhören. Zudem ist er dafür verantwortlich, das Gespräch am Laufen zu halten sowie ein Abschweifen vom Thema zu verhindern. Im Gesprächsverlauf werden vom Interviewer keine konkreten Fragen gestellt; es geht vielmehr darum, die freien Assoziationen des Probanden zu erheben. Mit Hilfe der nicht-direkten Tiefeninterviews können eine Vielzahl an Informationen sowie vollständige Gedanken- und Assoziationsketten erhoben werden. Diese Vorgehensweise stellt aber sehr hohe Anforderungen an den jeweiligen Interviewer. Dieser darf nur eingreifen, wenn der Befragte tatsächlich Hilfe benötigt, um das Gespräch im Fluss zu halten. An die befragte Person werden ebenfalls hohe Anforderungen gestellt. Sie führt letztendlich das Gespräch und muss deshalb über eine hohe Verbalisierungsfähigkeit verfügen. Darüber hinaus erweist sich die Auswertung der erhobenen Daten als problematisch, da die Gespräche aufgrund der fehlenden Strukturierung sehr unterschiedlich verlaufen können. Aus diesem Grund wird diese Methode heute nur noch selten eingesetzt.1474 Im Gegensatz zu den nicht-direktiven Methoden besitzt der Interviewer bei den halbdirektiven Verfahren einen aufgeschlüsselten Themenleitfaden, durch den er gezwungen ist,

bestimmte vorgegebene Bereiche anzusprechen. In der Frageformulierung und der Reihenfolge der Fragestellung ist er indes weitgehend frei. Ziel ist es auch hier, möglichst wenig in das Gespräch einzugreifen, um eine natürliche Gesprächssituation aufzubauen. Bei der halbdirektiven Methode handelt es sich also um eine relativ offene Vorgehensweise, die jedoch einen gewissen Strukturierungsgrad aufweist und so die Vergleichbarkeit der Interviews erleichtert.1475

1473 1474 1475

252

Vgl. Salcher (1995), 36. Weitere alternative Systematisierungsvorschläge finden sich in Salcher (1995), 30f.; Herrmann (1998), 373. Vgl. Salcher (1995), 36ff. Vgl. Salcher (1995), 38f.

Die direktive Tiefeninterview-Technik beruht auf der Grundannahme, dass durch autoritäres Auftreten des Interviewers und sehr schnell hintereinander gestellte Fragen die „wahren“ Motive des Probanden erhoben werden können.1476 Durch die schnell hintereinander gestell-

ten Fragen wird dem Probanden keine Zeit gegeben, reflektiert zu antworten. Diese Methode wird in der Praxis kaum genutzt, da der Befragungsteilnehmer das Interview abbrechen wird, wenn der auf ihn ausgeübte Druck zu groß wird.1477 Das Ziel der Laddering-Interviews ist die zielgerichtete Erfassung von Nutzenvorstellungen sowie möglicher Zusammenhänge mit den damit verbundenen Produktmerkmalen.1478

Laddering-Interviews sind folglich geeignet, Werte bzw. Werthaltungen sowie individuelle Benefits1479 zu untersuchen und die Verbindungen zwischen diesen beiden Elementen sowie

den objektiven Eigenschaften (Characteristics) zu bestimmen.1480 Ergebnis dieser Methode sind allerdings, wie bei allen tiefenpsychologischen Untersuchungen, qualitative Daten.1481 Die Vorgehensweise bei Laddering-Interviews ist recht einfach; letztlich werden dem Befragungsteilnehmer lediglich eine Reihe „Warum“-Fragen gestellt.1482 Eine standardisierte, d.h. einheitliche Vorgehensweise der Interviews, die die Vergleichbarkeit der Daten unterstützen

würde, existiert jedoch nicht. Vielmehr hängt die Qualität der Laddering-Interviews von den Erfahrungen des Interviewers, sowie dessen Fähigkeit ab, den Befragungsteilnehmer aktivieren zu können.1483 Die Grundlage der Untersuchung bildet eine Liste an konkreten Produktattributen. Zunächst wird der Proband befragt, warum diese Eigenschaften für ihn wichtig sind. Anhand der gegebenen Antworten können verschiedene funktionale Nutzenmerkmale (analog zu Benefits) abgeleitet werden. Im Folgenden dienen die Antworten aus der vorhergehenden Befra-

gungsrunde als Ausgangspunkt für weitere „Warum“-Fragen, die das Ziel verfolgen, die Gründe für die Wichtigkeit bestimmter funktionaler Nutzendimensionen zu untersuchen, d.h. psychologische Nutzenbestandteile bzw. dahinter liegende Wertvorstellungen zu erheben.1484 Das folgende Beispiel, dass aus Herrmann (1998, 377) entnommen wurde, stellt einen möglichen Gesprächsverlauf im Rahmen eines Laddering-Interviews dar.

1476 1477 1478 1479 1480 1481 1482 1483 1484

Insofern ähnelt diese Methode den in Kapitel 5.3.2.2 beschriebenen Wortassoziationstests. Vgl. Salcher (1995), 39f. Vgl. Reynolds; Gutman (1988), 12; Herrmann (1998), 375; Skim Software (2003), 2; Griffin; Hauser (1993), 6. Siehe auch Kapitel 4.1.8. Vgl. Reynolds; Gutman (1988), 12. Vgl. Skim Software (2003), 2; Reynolds; Gutman (1988), 12. Vgl. Reynolds; Gutman (1988), 12; Herrmann (1998), 376; Morgan (1984), 50. Vgl. Herrmann (1998), 377. Vgl. Reynolds; Gutman (1988), 12; Herrmann (1998), 377.

253

„Forscher: Aus unserem bislang geführten Gespräch geht hervor, dass Sie auf einer Party mit Freunden sehr gerne zu einem alkoholarmen Bier greifen. Warum wählen Sie bei einer solchen Gelegenheit dieses Getränk? Proband: Alle Biermarken, die ich gerne trinke, enthalten nur wenig Alkohol. Forscher: Warum bevorzugen Sie auf einer Party diese Marken? Proband: Das weiß ich nicht. Darüber dachte ich noch nie nach. Forscher: Wann feierten Sie zum letzten Mal mit Freunden? Proband: Am vergangenen Samstag. Forscher: Versuchen Sie sich den Verlauf der Party vorzustellen. Irgendwann griffen Sie zu einem Bier. Warum nahmen Sie kein anderes Getränk? Proband: Ich wusste, dass die Party sehr lange dauern würde. Daher wollte ich nicht zuviel Alkohol zu mir nehmen. Forscher: Warum war es wichtig für Sie, nüchtern zu bleiben? Proband: Auf einer Party möchte ich mich mit Freunden unterhalten und andere Menschen kennen lernen. Es bedeutet mir sehr viel, einen festen Bekanntenkreis zu besitzen. Betrunkene Personen reagieren 1485 oft ausfallend, sind nicht kommunikativ und erhalten keine Einladung zur nächsten Party.“

Dieses Beispiel zeigt, dass sich mit Hilfe des Laddering-Interviews nähere Informationen zum Nutzungsverhalten erheben lassen. In diesem Fall werden die beiden Eigenschaften „Alkoholgehalt von Bier“ und „Biermarke“ untersucht. Allerdings müssten in einem entsprechenden Interview sämtliche potenziell wichtigen Eigenschaften näher betrachtet werden, um eine Auswahl der Produktmerkmale, die im Rahmen der Präferenzmessung näher untersucht werden sollen, zu ermöglichen. Es wird weiterhin deutlich, dass die Statements der Befragungsteilnehmer „an sich“ kaum Hilfe bei der Bestimmung der relevanten Eigenschaften liefern, vielmehr lassen sich entsprechende Rückschlüsse erst treffen, nachdem die Daten von speziell geschultem Personal analysiert wurden.1486 Bei der praktischen Anwendung ergeben sich durch die wiederholten „Warum“-Fragen innerhalb des Laddering-Interviews verschiedene Probleme, die insbesondere dadurch entstehen, dass dem Befragungsteilnehmer die Zusammenhänge zwischen den verschiedenen Nutzendimensionen selbst nicht bewusst sind und zudem die nötige Auskunftsbereitschaft der Probanden nicht immer gegeben ist.1487 Meist ist die Anzahl der Eigenschaf-

ten, die innerhalb eines Laddering-Interviews untersucht werden kann, deshalb relativ gering. So geht Reynolds; Gutman (1988, 18) davon aus, dass maximal zwei bis drei Produktmerkmale, in manchen Fällen nur eine Eigenschaft, betrachtet werden können. Zur Bestimmung der in der Präferenzmessung zu untersuchenden Eigenschaften sind Laddering-Interviews deshalb nicht geeignet. Diese Methode bietet indes erste Ansätze zur Erstellung von individuellen Transformationsfunktionen zwischen objektiven Merkmalen und Benefits.1488

1485 1486 1487 1488

254

Herrmann (1998), 377. Vgl. Herrmann (1998), 380. Vgl. Herrmann (1998), 376; Reynolds; Gutman (1988), 15. Siehe dazu Kapitel 4.1.8.

Die Zielsetzung und Vorgehensweise bei der Benefit-Chain1489 Methode entspricht weitgehend den Laddering-Interviews. Insofern ist mit ähnlichen Vor- und Nachteilen dieser Methoden zu rechnen.1490 Ziel dieser Vorgehensweise ist es, ausgehend von bestimmten Produktmerkmalen (hier: Characteristics) bzw. bestimmten Eigenschaftsausprägungen eines Produkts die daraus resultierenden emotionalen und psychologischen Nutzenkomponenten zu bestimmen.1491 Durch die Nutzung einer standardisierten Vorgehensweise ist jedoch im Gegensatz zum Laddering-Interview die Befragung einer Vielzahl von Probanden möglich.1492 Ähnlich wie bei der Anwendung von Laddering-Interviews dient eine bestimmte Eigenschaftsausprägung eines Produktmerkmals (Characteristic) oder bei dieser Methode ein kompletter Stimulus als Bewertungsgrundlage. Die weitere Befragung zielt darauf ab, dass der Befragungsteilnehmer jeweils zwei, von der/den objektiven Eigenschaftsausprägung(en) hervorgerufenen funktionalen Nutzenkomponenten nennt. Zu diesen zwei Statements soll er anschließend zwei weitere „praktische“ Nutzenkomponenten ableiten, die vom Probanden wiederum auf zwei emotionale Nutzen zurückgeführt werden sollen.1493 In der folgenden Abbildung wird ein Beispiel für die Benefit-Chain eines Entscheidungsträgers präsentiert. Produkt

funktionaler Nutzen

Bescheibung einer Eigenschaftsausprägung durch den Marktforscher Haarspray gibt den Haaren Halt und sie bleiben weich

praktischer Nutzen

emotionaler Nutzen

Nennung der Auswirkungen der objektiven Eigenschaftsausprägung auf weitere Nutzendimensionen „Haare sind einfacher zu stylen“

„man braucht nicht so viel Zeit für die Haare“

„ich kann andere Dinge tun, die ich machen will“

Abbildung 36: Stufen bei der Benefit-Chain (vgl. Young; Feigin (1975), 73)

Als Maß für die Wichtigkeit einer Assoziation dient die Häufigkeit der Nennung unter allen Befragungsteilnehmern.1494 Ähnlich wie bei den Laddering-Interviews ist die Benefit-Chain v.a. zur Bestimmung einer individuellen Transformationsfunktion zwischen objektiven Merkmalen und den Benefit-Eigenschaften, nicht jedoch zur Bestimmung der relevanten Eigenschaften und Ausprägungen geeignet.

1489

In der Literatur wird diese Methode als “Grey Benefit-Chain” bezeichnet, da sie in den 70er Jahren von der Werbeagentur Grey entwickelt wurde (vgl. Morgan (1984), 50). 1490 Vgl. Morgan (1984), 50. 1491 1492 1493 1494

Vgl. Gutman (1982), 64; Young; Feigin (1975), 72. Vgl. Young; Feigin (1975), 73. Vgl. Young; Feigin (1975), 73; Gutman (1982). 65. Vgl. Young; Feigin (1975), 73.

255

Zusammenfassend handelt es sich bei den tiefenpsychologischen Interviews zumeist um persönliche Befragungen, die häufig mit Tonbandgeräten aufgezeichnet werden, um den Gesprächsfluss so wenig wie möglich zu stören. Von den erhobenen Daten werden danach oft Abschriften angefertigt, die anhand von Heuristiken zur Interpretation von Texten ausgewertet werden. Neben der Interpretation der Statements der Befragungsteilnehmer werden häufig weitere Informationen, z.B. über das Umfeld des Probanden berücksichtigt.1495 Dabei wird zwischen Längs- bzw. Querschnitt-Analysen unterschieden. Anhand von LängsschnittAnalysen kann versucht werden, bestimmte Denk- und Erlebnisstrukturen abzuleiten. Um die erhobenen Daten auszuwerten, werden die einzelnen Protokolle komplett gelesen und entsprechend interpretiert.1496 Bei Querschnitt-Analysen werden die Protokolle nach bestimmten Äußerungen durchsucht (z.B. die Nennung von bestimmten entscheidungsrelevanten Eigenschaften) und die Häufigkeit der Nennung dieser Items über alle Befragungsteilnehmer als Maß für die Bedeutung berechnet.1497 Die Validität tiefenpsychologischer Interviews wird häufig angezweifelt, da eine Reihe von Zufallsfehlern einen erheblichen Einfluss auf die Befragungsergebnisse haben kann. So ist nicht davon auszugehen, dass die Art der Befragung zwischen verschiedenen Interviewern gleich ist, d.h. die unterschiedliche Fragenformulierung kann die Ergebnisse sehr stark beeinflussen. Daneben werden die Ergebnisse durch Sympathien bzw. Antipathien zwischen Befragungsteilnehmer und Interviewer bestimmt. Insofern ist keine Vergleichbarkeit zwischen verschiedenen Befragungsteilnehmern gegeben.1498 Tiefeninterviews bieten sich für eine erste Informationssammlung an, die aber eher dazu geeignet ist, typisches Nutzungsverhalten und situationsbezogene Kontextfaktoren zu untersuchen1499 bzw. erste Anhaltspunkte für hinter den Äußerungen stehende Triebkräfte zu bieten.1500 Die Stichprobe ist meist nur sehr klein und deshalb nicht repräsentativ. Zur Ableitung von Entscheidungen, z.B. welche Eigenschaften in einer Conjoint-Analyse weiter untersucht werden sollten, sind tiefenpsychologische Interviews nicht geeignet.1501 Zudem ist bei dieser Art der Erhebung von entscheidungsrelevanten Produktmerkmalen der Erhebungsaufwand vergleichsweise hoch.1502

1495

Vgl. Herrmann (1998), 380.

1496

Vgl. Salcher (1995), 40f. Diese werden auch als hermeneutisch-interpretative Methoden zur Inhaltsanalyse bezeichnet (vgl. Herrmann (1998), 380). Vgl. Salcher (1995), 42. Herrmann (1998, 380) beschreibt diese Vorgehensweise als empirisch-erklärende Analyseheuristik. 1498 Vgl. Salcher (1995), 42f.; Reiners (1996), 41; Young; Feigin (1975), 72. 1497

1499 1500 1501 1502

256

Vgl. Skim Software (2003), 1. Vgl. Herrmann (1998), 380. Vgl. Young; Feigin (1975), 72f. Vgl. Reiners (1996), 41.

5.3.4 Multidimensionale Skalierung

Das Ziel der Multidimensionalen Skalierung (MDS) ist die Erfassung von subjektiven Wahrnehmungen der jeweiligen Beurteilungsdimensionen von Konsumenten und die Posi-

tionierung der jeweiligen Untersuchungsobjekte in einem psychologischen Wahrnehmungsraum.1503 Diese mittels MDS bestimmten Bewertungsdimensionen könnten später als Bewertungsgrundlage in der Conjoint-Analyse dienen.1504 Generell sind verschiedene Vorgehensweisen bei der MDS anwendbar; einerseits können die Befragungsteilnehmer verschiedene Produkte anhand vorgegebener Eigenschaften einschätzen, andererseits können bestehende Produkte entsprechend ihrer Ähnlichkeit bzw. Unähnlichkeit bewertet und in einem Wahrnehmungsraum eingetragen werden. Zudem ist es möglich, beide Varianten sukzessive miteinander zu verknüpfen, d.h. die Entscheider bewerten zunächst eine vorgegebene Anzahl an Alternativen entsprechend der wahrgenommenen Ähnlichkeit und in einem zweiten Schritt diese Produkte auf Basis von vorgegebenen Eigenschaften1505 – auf diese Weise können die Merkmale bestimmt werden, die einen Einfluss auf die Ähnlichkeitsbewertungen der Alternativen ausüben.1506 Werden die Produkte anhand einer Liste von vorgegebenen Eigenschaften eingeschätzt, wird zumeist eine Faktorenanalyse in einem zweiten Schritt dazu genutzt, die Zahl der Merkmalsdimensionen zu reduzieren.1507 Die Einschätzung der Eigenschaftsausprägungen verschiedener Marken bzw. Produktalternativen dient dabei als Grundlage zur Erstellung einer Unähnlichkeitsmatrix.1508 Die Zahl der so bestimmten Dimensionen ist allerdings häufig sehr viel

1503

Vgl. Backhaus; Erichson; Plinke; Weiber (2003), 606; Kotler (1974), 418; Böhler (1979), 271f.; Sattler (1991), 95; Day; Shocker; Srivastava (1979), 14f.; Albers (2000), 360ff. Weiterhin existieren Varianten der MDS wie die Sammon Maps, die zur grafischen Darstellung von Entscheidungen innerhalb einer Gruppe geeignet sind (vgl. Condon; Golden; Wasil (2003), 1437ff.). Da diese Verfahren jedoch voraussetzen, dass die relevanten Merkmale und Ausprägungen bereits bestimmt wurden, werden diese Methoden hier nicht weiter beachtet. 1504 Vgl. Reiners (1996), 41. 1505

Die Eigenschaften werden dabei jeweils durch eine Ausprägung beschrieben (z.B. könnte eine Zeitschrift „viele praktische Anregungen“ bieten oder „preisgünstig“ sein). Die Befragungsteilnehmer schätzen im Folgenden die zu untersuchenden Stimuli danach ein, wie stark die vorgegebene Ausprägung auf die jeweilige Alternative zutrifft - so könnten die Produkte entsprechend des Vorhandenseins einer vorgegebenen Ausprägung in eine Rangfolge gebracht werden. Für ein Beispiel siehe Gierl (1995), 138). 1506 Vgl. Gierl (1995), 113ff., 125. Schließlich können auch Daten über Idealvorstellungen von Nachfragern in einen Objektraum aufgenommen werden, wobei dies jedoch lediglich bei Merkmalen möglich ist, deren Ausprägungen ein Idealpunkt- oder Vektormodell zugrunde gelegt werden kann (vgl. Gierl (1995), 130). Für einen Überblick verschiedener weiterer Varianten der MDS siehe Aaker; Kumar; Day (2000), 584. 1507 Vgl. Backhaus; Erichson; Plinke; Weiber (2003), 607. 1508

Vgl. Böhler (1979), 273. Alternativ besteht die Möglichkeit, den Befragungsteilnehmern eine Reihe von Marken/Produkten vorzugeben, die mit bestimmten Eigenschaftsausprägungen in Verbindung gebracht werden sollen. Anhand dieser Zuordnungen kann eine Assoziationsmatrix berechnet werden, deren Zellen die jeweiligen Mittelwerte der Assoziation einer Marke zu einer Eigenschaftsausprägung repräsentieren. Die mittlere Häufigkeit der Assoziation einer Marke mit einer Merkmalsausprägung wird dabei als Maß für die Ähnlichkeit zwischen Marke und Eigenschaftsausprägung interpretiert. Aus diesen Daten kann ein mehrdimensionaler Eigenschaftsraum erstellt werden (vgl. Böhler (1979), 272f.).

257

niedriger als die tatsächliche Anzahl der relevanten Eigenschaften.1509 Diese Variante der MDS erscheint deshalb nicht zur Bestimmung der relevanten Eigenschaften geeignet und wird im Folgenden nicht weiter berücksichtigt. Eine weitere Variante der MDS beruht auf Ähnlichkeitseinschätzungen bezüglich verschiedener Produktalternativen einer Produktklasse.1510 Da gesamte Stimuli eingeschätzt werden, handelt es sich um eine dekompositionelle Methode, bei der keine einzelnen Produktmerkmale oder deren Ausprägungen durch den Marktforscher vorgegeben werden.1511 Ziel ist die Ermittlung der kaufentscheidungsrelevanten subjektiven Bewertungsdimensionen (Benefits),1512 die im Rahmen einer folgenden Conjoint-Analyse genauer untersucht werden könnten.1513 In Abbildung 37 wird der typische Ablauf einer solchen MDS dargestellt. 1. Messung von Ähnlichkeiten 2. Wahl des Distanzmodells 3. Ermittlung der Konfiguration 4. Zahl und Interpretation der Dimensionen

Abbildung 37: Vorgehensweise bei der MDS (in Anlehnung an: Gierl (1995), 113ff.; Backhaus; Erichson; Plinke; Weiber (2003), 612)

In einem ersten Schritt wird von den Befragungsteilnehmern die Ähnlichkeit der vorgegebenen Produktalternativen auf Basis von Paarvergleichen der Alternativen eingeschätzt.1514

Nachdem die Ähnlichkeitsdaten erhoben wurden, können Distanzen zwischen den einzelnen Objekten berechnet und in einem Objektraum abgetragen werden.1515 In einem nächsten

1509

Vgl. Backhaus; Erichson; Plinke; Weiber (2003), 607. Problematisch an der Nutzung der Faktorenanalyse zur Merkmalsreduktion ist weiterhin, dass die resultierenden Bewertungsdimensionen oft nicht sinnvoll interpretierbar und künstlich sind (vgl. Pras (1975), 75; siehe auch Kapitel 5.2.1.4). 1510 Vgl. Albers (1989), 189f.; Backhaus; Erichson; Plinke; Weiber (2003), 606; Albers (2000), 360ff. 1511 1512 1513 1514

Vgl. Reiners (1996), 41f. Vgl. Albers (1989), 188ff. Vgl. Reiners (1996), 41f.

Dafür stehen verschiedene Möglichkeiten wie die Bildung einer Rangfolge entsprechend der Ähnlichkeit und die Ankerpunktmethode (jedes Produkt wird einmal als Vergleichobjekt, die Ähnlichkeit der anderen Produkte wird in Bezug zu dieser Alternative eingeschätzt) zur Verfügung. Ferner besteht die Möglichkeit, dass die Ähnlichkeit von Objektpaaren anhand von Rating-Skalen eingeschätzt wird (vgl. Backhaus; Erichson; Plinke; Weiber (2003), 613ff.; Kotler (1974), 418). 1515 Die Positionierung der Produkte erfolgt iterativ - ausgehend von einer ersten Positionierung (der Startkonfiguration) wird die Lösung schrittweise so verbessert, dass die Distanz im Objektraum zwischen unähnlichen Produktalternativen größer als die zwischen ähnlichen Produkten ist. Eine perfekte Übereinstimmung ist im Normalfall jedoch nicht möglich (vgl. Backhaus; Erichson; Plinke; Weiber (2003), 621ff.; Albers (1989), 189f.).

258

Schritt bestimmt der Marktforscher die Anzahl der relevanten Bewertungsdimensionen.1516 Auch die semantische Interpretation der jeweiligen Dimensionen und damit die inhaltliche Bezeichnung der relevanten Produktmerkmale obliegt dem Marktforscher.1517 In dem resultierenden Wahrnehmungsraum1518 lassen sich auch die Präferenzen der Befragungsteilnehmer durch Idealpunkte abbilden. Je weiter ein bestimmtes Produkt von dem Idealpunkt eines Konsumenten entfernt ist, desto weniger wird es entsprechend der Annahmen der MDS präferiert.1519 Bei der Anwendung dieser Variante der MDS, die allein auf allgemeinen Ähnlichkeitseinschätzungen basiert, erweist sich u.U. der hohe Marktforschereinfluss als problematisch, denn letztlich erfolgt die Festlegung der Anzahl der Dimensionen und insbesondere deren Interpretation nicht aus Sicht der Befragungsteilnehmer, sondern durch den Marktforscher. Es ist deshalb oft nicht möglich, anhand der erhobenen Daten konkrete Merkmalsausprägungen, die Grundlage für eine Studie zur Präferenzmessung sein könnten, zu bestimmen.1520 Da im Rahmen dieser Variante der MDS zudem häufig nur zwei bis drei Dimensionen aufgrund der ansonsten erhöhten Schwierigkeit bei der Interpretation bestimmt werden können,1521 erscheint die MDS zur Bestimmung der relevanten Eigenschaften bei der Conjoint-Analyse, in der oft bis zu sechs Eigenschaften berücksichtigt werden können, nicht geeignet.1522 Diese Schlussfolgerung ergibt sich ebenfalls aus der Tatsache, dass es bei einer MDS, die allein auf

1516

Vgl. Reiners (1996), 41f.; Albers (1989), 190. Hierbei beschränkt man sich meist auf zwei bis drei Produktmerkmale, da dies eine grafische Darstellung des Objektraums und der Ähnlichkeiten der Objekte untereinander erlaubt und die Interpretation der Dimensionen vereinfacht. Weiterhin kann der Stress-Wert (ein Gütemaß für die Konfiguration) oder der Datenverdichtungskoeffizient zur Bestimmung der Anzahl der Bewertungsdimensionen herangezogen werden. Die Interpretierbarkeit durch den Marktforscher ist jedoch das entscheidende Kriterium bei der Festlegung der Anzahl der Dimensionen. Indes ist auch bei dieser Vorgehensweise nicht sichergestellt, dass die ermittelten Dimensionen überhaupt sinnvoll interpretiert werden können (vgl. Backhaus; Erichson; Plinke; Weiber (2003), 632f.). 1517 Vgl. Reiners (1996), 41f.; Albers (1989), 190. Ein Problem bei der praktischen Anwendung der MDS ist aus diesem Grund der hohe subjektive Einfluss des Marktforschers bei der Festlegung und Benennung der Dimensionen (vgl. Backhaus; Erichson; Plinke; Weiber (2003), 607; Shocker; Srinivasan (1979b), 7). 1518 Dabei sollte darauf geachtet werden, dass der subjektive Wahrnehmungsraum aus Befragungsteilnehmern mit relativ homogenen Bedürfnissen besteht. Ist dies nicht der Fall, können die Befragungsteilnehmer zunächst zu homogenen Gruppen zusammengefasst und die Daten innerhalb einer Gruppe aggregiert werden. Für die Aggregation der Daten bestehen drei Möglichkeiten: 1. Mittelwertbildung der Ähnlichkeitsdaten und Durchführung einer MDS, 2. Durchführung einer MDS auf individueller Ebene und Aggregation dieser Daten sowie 3. der Einsatz spezieller Software, die eine gemeinsame Analyse der Ähnlichkeitsdaten erlaubt (vgl. Backhaus; Erichson; Plinke; Weiber (2003), 634f.; Gierl (1995), 121). 1519 Vgl. Albers (1989), 191. 1520

Vgl. Backhaus; Erichson; Plinke; Weiber (2003), 607. Die Bewertungsdimensionen resultieren vielmehr aus komplexen Ähnlichkeitseinschätzungen der Entscheidungsträger – es erscheint deshalb kaum möglich, diese auf einfache und kurze Beschreibungen von Produktmerkmalen zurückzuführen. Die Aussagekraft solcher Untersuchungen wird aus diesem Grund von einigen Marktforschern angezweifelt und eine Anwendbarkeit dieser Methode zur Bestimmung von Produktdimensionen verneint (vgl. Shocker; Srinivasan (1979b), 7, 17). 1521 Vgl. Backhaus; Erichson; Plinke; Weiber (2003), 632. 1522

Vgl. Green; Srinivasan (1990), 8.

259

Basis von allgemeinen Ähnlichkeitsurteilen durchgeführt wird, unmöglich ist, Bedeutungsgewichte für die bestimmten Dimensionen zu ermitteln.1523 Aufgrund dieser Probleme bei der Bestimmung und Interpretation von Beurteilungsdimensionen erscheint es empfehlenswert, eine entsprechende Dimensionierung auf Basis von Konsumentenurteilen vorzunehmen. Zu diesem Zweck werden, wie bereits angedeutet, in einem ersten Schritt „globale“ Ähnlichkeitseinschätzungen und in einem zweiten Schritt merkmalsspezifische Bewertungen erhoben, d.h. es wird überprüft, ob eine Reihe von vorgegebenen Merkmalen in die Ähnlichkeitseinschätzungen eingeflossen sind. Ziel ist es dabei, Eigenschaften in den auf Basis der Ähnlichkeitseinschätzungen ermittelten Objektraum einzupassen.1524 Eine solche Dimensionierung der Ähnlichkeitsdaten erleichtert die Interpretation der erhobenen Daten, ein erheblicher subjektiver Marktforschereinfluss bleibt allerdings weiterhin bestehen, so hat insbesondere die Auswahl der Untersuchungsobjekte große Auswirkungen auf die Ergebnisse.1525 Zur Ermittlung der entscheidungsrelevanten Merkmale erscheint auch diese Variante der MDS als nicht geeignet, da lediglich Eigenschaften, die durch jeweils eine Ausprägung beschrieben werden, in die Untersuchung eingehen. Es ist somit nicht möglich, die gesamte Bandbreite der relevanten Eigenschaftsausprägungen einer Zielgruppe zu bestimmen.1526

5.4

Befragung von Gruppen zur Ermittlung von entscheidungsrelevanten Attributen

Das innerhalb der Präferenzmessung zu untersuchende Eigenschaftsset könnte ebenso auf der Basis von Gruppenbefragungen ermittelt werden. Gruppendiskussionen1527 ermöglichen eine gleichzeitige Befragung mehrerer (meist 8-10)

Personen unter identischen Bedingungen und zu einem abgegrenzten Thema. Die Leitung der Befragung übernehmen speziell geschulte Diskussionsleiter, häufig Psychologen.1528 In der Praxis werden zu einem Untersuchungsobjekt oft mehrere (häufig 3-5) Gruppendiskussionen durchgeführt und auf Tonbandgeräte bzw. auf ein Video aufgezeichnet. Für die Durchführung von Gruppendiskussionen spricht die Annahme, dass aus einer Gruppendynamik heraus 1523 1524 1525

Vgl. Sattler (1991), 95. Vgl. Gierl (1995), 125ff. Vgl. Gierl (1995), 129f.

1526

Sämtliche Varianten der MDS beruhen ihrer Vorgehensweise nach auf subjektiven Ähnlichkeitseinschätzungen. Einige Forscher zweifeln allerdings einen direkten Bezug zwischen Ähnlichkeiten und Präferenzen an (siehe u.a. Shocker; Srinivasan (1979b), 7). Wie bereits in Kapitel 5.2.1.2 beschrieben, wird dabei teilweise davon ausgegangen, dass Entscheidungsträger bei Ähnlichkeitseinschätzungen und Präferenzbewertungen nicht die gleichen Eigenschaften zur Einschätzung von Produktalternativen heranziehen (vgl. Lefkoff-Hagius; Mason (1993), 106). 1527 Als Synonym wird der Begriff „Fokusgruppen“ verwendet (vgl. Melles (2001), 39). 1528

260

Vgl. Schub von Bossiazky (1992), 72; Salcher (1995), 44.

„bessere“ Lösungen als bei individuellen Befragungen gefunden werden können. Auf die Idee einer Person können andere Befragungsteilnehmer spontan reagieren, verschiedene Standpunkte diskutieren und so zu neuen Denkansätzen gelangen.1529 Die besondere Qualität der Gruppenbefragungen ergibt sich infolgedessen aus der Interaktion der Befragungsteilnehmer untereinander.1530 Deshalb werden Gruppendiskussionen als eine geeignete Methode eingeschätzt, um relevante Eigenschaften für die Conjoint-Analyse zu bestimmen.1531 Insgesamt lassen sich die folgenden vier typischen Gruppendiskussions-Kategorien -

der kumulativen Gruppenexploration, der kombinierten Gruppenexploration, der kontradiktorischen Gruppenexploration und der kreativen Gruppenexploration identifizieren.1532

Ziel der kumulativen Gruppendiskussions-Methoden ist die Erhebung einer Vielzahl von Informationen, wobei die Ergebnisse aus verschiedenen Gruppen verwendet werden. Zunächst wird in jeder Gruppe über das entsprechende Untersuchungsobjekt diskutiert. In einem zweiten Teil der Gruppendiskussion werden die Ergebnisse der anderen Gruppen präsentiert, zu denen die jeweiligen Gruppen Stellung nehmen sollen.1533 Auf diese Weise wird erreicht, dass verschiedene Gruppen mit andersartigen Ergebnissen konfrontiert und diese diskutiert werden.1534 Im Rahmen von kombinierten Gruppenbefragungen werden anfangs die Meinungen aller Probanden in Einzelinterviews erhoben. In der folgenden Gruppenbefragung wird eine gemeinsame Entscheidung bezüglich des Untersuchungsobjekts getroffen. Im Anschluss an die Gruppendiskussion werden die Probanden innerhalb von Einzelinterviews erneut befragt, um zu überprüfen, ob die in der Gruppe getroffene Entscheidung von den einzelnen Befragungsteilnehmern getragen wird. Ziel dieser Methode ist somit die Analyse von Meinungsbildungsprozessen sowie ein Test der Stabilität bei Entscheidungen, die im Spannungsfeld verschiedener Einzelmeinungen getroffen werden.1535 Ähnlich zu den in Kapitel 5.3.3 beschriebenen direktiven Methoden der tiefenpsychologischen Interviews setzen kontradiktorische Gruppendiskussionen darauf, dass durch Agg1529 1530

Vgl. Schub von Bossiazky (1992), 70ff.; Morgan (1998), 5. Vgl. Salcher (1995), 44; Morgan (1998), 10.

1531

Vgl. Melles (2001), 39; Wilkie; Pessemier (1973), 429; Theuerkauf (1989), 1180. Für Anwendungsbeispiele von Gruppendiskussionen zur Bestimmung des Eigenschaftssets siehe Louviere; Gaeth (1987), 30f. oder Akaah; Korgaonkar (1983), 188; Albrecht (2000), 35; Rosko; DeVita; McKenna; Walker (1985), 29. 1532 Vgl. Salcher (1995), 46ff. 1533 1534 1535

Dieser zweite Schritt entfällt bei der ersten Gruppe. Vgl. Salcher (1995), 50ff. Vgl. Salcher (1995), 52f.

261

ressionen und Konfrontation mit sehr unterschiedlichen Meinungen spontanere und unreflektiertere Antworten erhoben werden können. Unter den Probanden befindet sich bei dieser Befragungsform ein Marktforscher, dessen Aufgabe darin besteht, immer dann störend in die Diskussion einzugreifen, sobald sich ein Konsens unter den anderen Diskussionsteilnehmern abzeichnet. Ziel dieser Methode ist es, die Diskussion so lange wie möglich aufrecht zu erhalten und die gefundene Lösung auf ihre Stabilität hin zu überprüfen.1536 Im Rahmen von kreativen Gruppendiskussionen werden verschiedene Kreativitätstechniken zur Generierung von neuen Produktideen genutzt.1537 Eine Grundanforderung an die Befragungsteilnehmer ist, dass diese schon seit mehreren Jahren über intensive Produkterfahrung verfügen.1538 Als Beispiel für kreative Gruppendiskussionen soll im Folgenden eine von Salcher (1995, 210ff.) empfohlene Vorgehensweise präsentiert werden. Darüber hinaus sind viele weitere Arten von kreativen Gruppenexplorationen denkbar, bei denen die Befragungsteilnehmer z.B. im Rahmen von Gruppen-Workshops Collagen erstellen, Geschichten erfinden oder Rollenspiele nutzen.1539 Salcher (1995, 210ff.) beschreibt lediglich eine mögliche Vorgehensweise bei kreativen Gruppendiskussionen. Dabei werden in einem ersten Schritt zunächst Grundanforderungen (d.h. „minimale“ Eigenschaftsausprägungen) an die Produkte sowie mögliche Veränderungen der Bedürfnisse der Konsumenten diskutiert. In einem zweiten Schritt werden die Befragungsteilnehmer gebeten, einzeln die tägliche Verwendung des Produkts und bisherige Erfahrungen zu beschreiben. Diese Statements werden auf Video aufgezeichnet und an-

schließend in der Gruppe diskutiert. Zudem wird versucht, durch Personifizierung der Produkte das jeweilige Image einer Marke zu untersuchen. Ziel des dritten Schritts ist die Analyse der Unzulänglichkeiten eines am Markt vorhandenen Produkts und wie die Befragungsteilnehmer damit umgehen. Schließlich wird mit Hilfe von verschiedenen Kreativitätstechniken1540 nach neuen Lösungen zur Bedürfnisbefriedigung der Konsumenten gesucht. Eine da-

bei häufig genutzte Methode ist das Brainstorming1541, bei dem die Befragungsteilnehmer zunächst gebeten werden, alle möglichen Lösungsmöglichkeiten und Ideen zu nennen. Diese werden in diesem Schritt allerdings noch nicht von den anderen Befragungsteilnehmern 1536 1537 1538 1539

Vgl. Salcher (1995), 54. Vgl. Salcher (1995), 55; Melles (2001), 40; Schlicksupp (1992), 59ff. Vgl. Salcher (1995), 208.

Vgl. Schub von Bossiazky (1992), 82ff.; Haimerl; Lebok; Zerzer (2004), 28ff. Letztlich können beispielsweise die bereits in Kapitel 5.3.2.1 präsentierten projektiven Methoden auch im Rahmen von Gruppenbefragungen eingesetzt werden. 1540 Für einen Überblick über verschiedene Kreativitätstechniken siehe Schlicksupp (1992), 59ff.; Haupt (2000), 61ff. Für die Anwendung von Kreativitätstechniken im Rahmen von Gruppeninterviews zur Bestimmung der entscheidungsrelevanten Eigenschaften bei der Conjoint-Analyse siehe Reiners (1996), 38; Melles (2001), 40. 1541 Vgl. Haupt (2000), 61f.; Schlicksupp (1992), 103.

262

kommentiert. Vielmehr sollen die Probanden durch Bildung assoziativer Ketten, d.h. die Befragungsteilnehmer greifen die Ideen der anderen Gruppenmitglieder auf, neuartige Lösungsmöglichkeiten gefunden werden. Die Aufgabe des Diskussionsleiters besteht zunächst darin, die genannten Einzelstatements auf einem Flip-Chart niederzuschreiben und anschließend die Lösungsvorschläge mit den anderen Befragungsteilnehmern zu diskutieren. Im vierten und letzten Schritt wird unter Einsatz weiterer Kreativitätstechniken versucht, neue Lösungsmöglichkeiten zu finden. Dabei wird davon ausgegangen, dass die Befragungsteilnehmer erst jetzt genügend für die Problematik sensibilisiert sind - nur die in dieser Phase genannten Resultate werden später weiter verwendet.1542 Originäres Ziel der Kreativitätstechniken ist das Finden innovativer Produkte und Ideen.1543 Deshalb erscheinen diese Methoden nicht zur Bestimmung der derzeit relevanten Eigenschaften und der aktuellen Bandbreiten geeignet. Bei einer weiteren Variante der Gruppendiskussionen, der teil-strukturierten Gruppenbefragung, werden verschiedene ausformulierte Fragen, die jedoch eine weitgehend offene Be-

antwortung ermöglichen, genutzt.1544 Louviere (1988b, 51f.) schlägt beispielsweise eine solche teil-strukturierte Vorgehensweise zur Bestimmung der in der Conjoint-Analyse relevanten Eigenschaften vor.1545 Im Rahmen der Gruppenbefragung können Antworten auf folgende

Fragen gefunden werden: 1. Welche Produkte kaufen Sie oder erwägen Sie zu kaufen? 2. Welche Produkte kaufen Sie nicht oder erwägen Sie nicht zu kaufen? 3. Sie sagten, Sie würden „...“ (Wiederholung der Produkte aus 1) kaufen. Was macht diese Produkte für Sie attraktiv? 4. Sie sagten, Sie würden „...“ (Wiederholung der Produkte aus 2) nicht kaufen. Was macht diese Produkte für Sie unattraktiv? 5. Wenn Sie an Produkte denken, die Sie kaufen oder erwägen zu kaufen - was müsste der Hersteller tun, damit Sie sie nicht mehr kaufen? 6. Wenn Sie an Produkte denken, die Sie nicht kaufen oder nicht erwägen zu kaufen - was müsste der Hersteller tun, damit Sie sie kaufen?1546 Die innerhalb der Gruppendiskussion genannten Statements, werden von den Marktforschern entsprechend ihrer inhaltlichen Bedeutung bestimmten Eigenschaften zugeordnet. Die Häufigkeit der Nennung kann nun als Maß für die Wichtigkeit eines Produktmerkmals genutzt 1542 1543 1544 1545 1546

Vgl. Salcher (1995), 211ff. Vgl. Schlicksupp (1992), 15. Vgl. Louviere (1988b), 51. Siehe auch Stallmeier (1993), 43f. Vgl. Louviere (1988b), 51.

263

werden.1547 Problematisch an dieser Maßzahl ist allerdings, dass Gruppendiskussionen insbesondere deshalb durchgeführt werden, um Mehrfachnennungen zu vermeiden.1548 Typische Vorteile von Gruppendiskussionen sind die Schaffung eines kreativen Klimas, das das assoziative Denken anregt und somit zu differenzierteren Lösungen führt sowie die Vermeidung von Doppelnennungen der relevanten Eigenschaften.1549 Ein allgemeines Problem von Gruppenbefragungen besteht aber darin, dass häufig nicht genug Zeit für die einzelnen Befragungsteilnehmer bleibt, um ihre individuellen Meinungen zu äußern. Daher sind die Ergebnisse tendenziell oberflächlicher als bei individuellen Befragungen.1550 Das Hauptproblem ist, dass es keinen Indikator für die Wichtigkeit von Produktmerkmalen gibt, der sinnvoll eingesetzt werden kann. Die Häufigkeit der Nennung ist als Indikator für den Einfluss eines Attributs ungeeignet, da Gruppeninterviews dafür eingesetzt werden, Doppelnennungen zu vermeiden. Wird der Einfluss der Produktmerkmale dagegen direkt erhoben, setzen sich meist wenige Gruppenmitglieder mit ihren Einschätzungen durch, so dass die resultierenden Bewertungen nicht für alle Befragungsteilnehmer zutreffen können.1551 Sollen dagegen Entscheidungen auf Gruppenebene untersucht werden, sollten die Eigenschaften auch auf Gruppenebene festgelegt werden.1552 Typischerweise werden bei der Präferenzmessung jedoch Bewertungen auf Individualebene untersucht, d.h. die Entscheidung für oder gegen eine bestimmte Produktalternative trifft ein einzelner Entscheidungsträger und keine Gruppe von Entscheidern. Bei Gruppendiskussionen handelt es sich zudem um ein rein qualitatives Befragungsinstrument, das, wie beschrieben, keinerlei Bestimmung von Bedeutungs-

gewichten zulässt und dessen Ergebnisse oft sehr uneinheitlich und vielfältig interpretierbar sind.1553 Eine konkrete Vorgehensweise zur Analyse der Daten von Gruppenbefragungen gibt es nicht, sie müssen jeweils situationsspezifisch ausgewertet und entsprechende Ergebnisse abgeleitet werden.1554 Allerdings eignen sich Gruppendiskussionen, um den Einfluss gruppendynamischer Effekte auf die Meinungsbildung der Probanden zu untersuchen.1555 Sie sind insbesondere dann anwendbar, wenn es darum geht, zu testen, welchen Einfluss Mund-zu-Mund-Propaganda unter

1547 1548 1549 1550 1551 1552 1553 1554 1555

264

Vgl. Louviere (1988b), 51. Vgl. Reiners (1996), 38. Vgl. Reiners (1996), 38; Schub von Bossiazky (1992), 70. Vgl. Tomlin (2002), 27; Morgan (1998), 32. Vgl. Reiners (1996), 38; Morgan (1998), 63. Vgl. Edwards; Barron (1994), 307. Vgl. Schub von Bossiazky (1992), 75f.; Morgan (1998), 62f. Vgl. Morgan (1998), 69. Für einen Überblick über mögliche Ansatzpunkte zur Analyse von Fokusgruppen siehe Morgan (1998), 70. Vgl. Salcher (1995), 44.

Konsumenten haben kann. Zur Erhebung von individuellen Daten sind Fokusgruppen dagegen ungeeignet, da es meist eine dominante Person gibt, die die Antworten und Meinungen der anderen Befragungsteilnehmer bezüglich des Untersuchungsobjektes sehr stark beeinflusst.1556 Aufgabe des Diskussionsleiters ist es, Meinungsführer nicht zu dominant werden zu lassen. Dies kann indes zu einer gewissen Rivalität zwischen Diskussionsleiter und dem jeweiligen Meinungsführer führen.1557 Untersuchungen mit „Strohmännern“ in Fokusgruppen zeigen, dass einzelne Personen die Ergebnisse der Gruppendiskussion lenken und sogar die Wahrnehmungen anderer Befragungsteilnehmer bezüglich ihrer Erinnerungen beeinflussen können.1558 Durch Meinungsführer verursachte Verzerrungen sind kaum kontrollierbar. Die Ergebnisse einer Gruppendiskussion können deshalb nie das Meinungsspektrum aller Befragungsteilnehmer widerspiegeln.1559 Aus den hier genannten Gründen sind Gruppendiskussionen keine geeignete Methode zur Bestimmung von relevanten Eigenschaften und deren Ausprägungen, die später auf individueller Ebene untersucht werden sollen. Bei der praktischen Anwendung werden Gruppendiskussionen vor allem dann eingesetzt, wenn nur sehr wenige Informationen über das Untersuchungsobjekt vorliegen und erste Meinungen zu einem bestimmten Thema benötigt werden. Es handelt sich somit eher um eine Pre-Test Methode, deren Ergebnisse dafür genutzt werden, in weiteren Untersuchungsschrit-

ten planvoller vorgehen zu können.1560

5.5

Stufenverfahren

Die bisher beschriebenen Verfahren unterscheiden sich bezüglich ihrer Vorgehensweise, dem Untersuchungsziel, der Art der erhobenen Informationen sowie den methodenspezifischen Vor- und Nachteilen erheblich. Insofern ist es nicht verwunderlich, dass die auf Basis dieser Vorgehensweisen bestimmten Eigenschaftssets kaum Gemeinsamkeiten aufweisen. Jaccard; Brinberg; Ackerman (1986, 465ff.) stellen beispielsweise in einer empirischen Studie, in deren Rahmen verschiedene Methoden zur Bewertung der Wichtigkeit von Eigenschaften verglichen wurden, fest, dass die Ergebnisse der verschiedenen Verfahren kaum miteinander kor-

1556 1557 1558 1559 1560

Vgl. Tomlin (2002), 27; Morse (2002), 12; Reiners (1996), 38. Vgl. Salcher (1995), 45; Schub von Bossiazky (1992), 73. Vgl. Morse (2002), 12. Vgl. Salcher (1995), 44; Schub von Bossiazky (1992), 73ff.; Schubert (1991), 182. Vgl. Salcher (1995), 44; Morgan (1998), 12.

265

relieren.1561 Die Bestimmung der zu untersuchenden Eigenschaften und Ausprägungen ist somit sehr stark von dem jeweils verwendeten Verfahren abhängig.1562 Aufgrund der unterschiedlichen Ergebnisse der einzelnen Verfahren zur Bestimmung der relevanten Eigenschaften wird in der Literatur teilweise eine isolierte Nutzung verschiedener Verfahren bzw. eine stufenweise Kombination mehrerer Methoden vorgeschlagen.1563

Eine Möglichkeit, die Eigenschaften für die Präferenzmessung zu bestimmen, ist, mehrere Methoden isoliert voneinander zu verwenden.1564 Hausruckinger (1993, 120) schlägt vor,

anhand der jeweils gefundenen Wichtigkeiten der Eigenschaften für jedes Merkmal Durchschnittswerte der Relevanz zu ermitteln. Problematisch ist allerdings, dass die Skalen der verschiedenen Verfahren nicht miteinander kompatibel sind und möglicherweise nicht metrisch skalierte Daten vorliegen, so dass kein arithmetischer Mittelwert berechnet werden kann. Zudem wird bei dieser Art der Aggregation der einzelnen Befragungsdaten vernachlässigt, dass die verschiedenen Methoden unterschiedliche Arten von Informationen erheben, die nicht vergleichbar sind.1565 Stufenverfahren1566 berücksichtigen explizit, dass verschiedene Methoden unterschiedliche

Informationsarten erheben. Im Rahmen dieser Verfahren zur Bestimmung der relevanten Merkmale werden verschiedene Methoden systematisch miteinander kombiniert. In einem ersten Schritt werden saliente1567 Produktdimensionen erhoben - Ergebnis ist eine u.U. sehr umfangreiche Liste von möglichen Eigenschaften. Diese Merkmale werden in einem zweiten Schritt von den Probanden bewertet und eine Rangfolge der Relevanz gebildet.1568 Jain; Acito; Malhotra; Mahajan (1979, 315) schlagen ein erstes Stufenverfahren vor, bei dem zunächst potenziell relevante Eigenschaften mit Hilfe der Repertory-Grid-Methode auf individueller Ebene bestimmt und die von einem Befragungsteilnehmer genannten Merkmale danach auf einer 7-Punkte Rating-Skala bewertet werden. Dabei schätzt ein Proband lediglich die von ihm genannten Eigenschaften ein. Das Gesamt-Wichtigkeitsurteil einer Eigenschaft ergibt sich schließlich durch Kombination der Häufigkeit der Nennung (Stufe 1) mit den di1561 1562

Ein vergleichbares Ergebnis finden Helm; Scholl; Manthey; Steiner (2004, 16) und Böhler (1979, 287) bei den Methoden der Elicitation-Technik und Dualen-Befragung. Vgl. Böhler (1979), 287; Jaccard; Brinberg; Ackerman (1986), 465ff.; Schweikl (1985), 106.

1563

Vgl. Höser (1998), 109; Schweikl (1985), 92f.; Hausruckinger (1993), 120; Jain; Acito; Malhotra; Mahajan (1979), 315; Schweikl (1985), 106. Vgl. Hausruckinger (1993), 120; Höser (1998), 109; Schweikl 1985, 92; Schubert 1991, 180; Helm; Scholl; Manthey; Steiner (2004), 16. 1565 Vgl. Jaccard; Brinberg; Ackerman (1986), 465ff. Beispielsweise werden mit Hilfe der Elicitation Technik saliente Merkmale erfasst, während die Duale Befragung die Determinanz von Attributen bestimmt. 1566 Für Stufenverfahren auf Basis von Experteninterviews siehe Keeney; Gregory (2005), 7. 1564

1567 1568

266

Siehe Kapitel 4.2.6.2. Für einen Überblick siehe Shocker; Srinivasan (1979b), 11f.; Kotler (1974), 417; Reiners (1996), 43f. und Schubert (1991), 179. Zu den Methoden der Bewertung der Wichtigkeit von Eigenschaften siehe Kapitel 5.2.2.

rekten Wichtigkeitseinschätzungen (Stufe 2).1569 Wie genau die Gewichtung der beiden Stufen erfolgen soll, wird allerdings nicht beschrieben;1570 auch die Vorgehensweise zur Aggregation der Daten über alle Befragungsteilnehmer bleibt unklar. Pras (1975, 74) schlägt vor, zunächst mit Hilfe der Elicitation Technik1571 eine umfangreiche Liste an möglichen Merkmalen zu bestimmen. Diese setzt sich aus den nach Häufigkeit der Nennung geordneten Produktmerkmalen zusammen. Grundlage für den zweiten Schritt ist deshalb eine für alle Befragungsteilnehmer einheitliche Liste mit potenziell relevanten Eigenschaften. Im Folgenden werden diese mit Hilfe der Dualen Befragung1572 bewertet. Die ermittelten Determinanzwerte für jede Eigenschaft werden über alle Befragungsteilnehmer durch Mittelwertbildung aggregiert und diejenigen Merkmale ausgewählt, die über alle Probanden einen überdurchschnittlichen Determinanzwert aufweisen. In einem weiteren Schritt werden sämtliche ihrer inhaltlichen Bedeutung nach redundante Merkmale eliminiert.1573 Eine weitere stufenweise Vorgehensweise ist die Benefit Structure Analysis.1574 Ziel dieser Methode ist es, Reaktionen von Konsumenten auf eine Vielzahl von Produktcharakteristika und Benefits zu untersuchen. Im Rahmen dieses Verfahrens werden diese erhobenen Daten von den Befragungsteilnehmern direkt eingeschätzt und können deshalb als Methode zur Bestimmung von relevanten Eigenschaften genutzt werden. Neben Produktmerkmalen werden auch verschiedene Nutzungssituationen und -gewohnheiten berücksichtigt.1575 Die Ermittlung der potenziell relevanten Eigenschaften erfolgt bei diesem Verfahren im Rahmen von tiefenpsychologischen Interviews bzw. Fokusgruppen (erste Stufe). Die Befragungsteilnehmer werden aufgefordert, zunächst typische Situationen zu nennen, in denen das jeweilige Untersuchungsobjekt eingesetzt wird. Weiterhin werden in dieser ersten Stufe der erwartete Nutzen, die Gründe für den Kauf, die physischen Produktmerkmale usw. erhoben (in Tabelle 18 wird eine typische Fragenbatterie dargestellt).1576

1569

Wie genau die Gewichtung der beiden Stufen erfolgen soll, wird allerdings nicht beschrieben (vgl. Schweikl (1985), 106). Auch die Aggregation der Daten bleibt unklar. Eine Aggregation erscheint allerdings unmöglich, da die Entscheider jeweils individuelle und nicht zwischen den Probanden vergleichbare Eigenschaftssets bewerten. 1570 Vgl. Schweikl (1985), 106. 1571 1572 1573 1574 1575 1576

Siehe Kapitel 5.2.1.1. Siehe Kapitel 5.2.2.2. Vgl. Pras (1975), 74ff. Diese Methode wurde von Myers (1976, 23ff.) vorgeschlagen. Vgl. Shocker; Srinivasan (1979b), 8; Shocker; Srinivasan (1979a), 162. Vgl. Myers (1976), 23.

267

Stufe 1 der Benefit-Structure Analysis am Beispiel Reinigungsmittel 1.

2. 3. 4.

What was the cleaning chore? What applicator (if any) was used? What time of day was the work done; were other family members involved, etc.? What product(s) were used in this operation? What benefits were sought, or what were the objectives of this cleaning? What were the physical characteristics or attributes of the product(s) used?

Nutzungssituation

Evoked-Set Benefit objektive Eigenschaften (characteristics)

Tabelle 18: Typische Fragen in der ersten Phase der Benefit Structure Analysis (Quelle: in Anlehnung an Myers (1976), 24)

Das Ergebnis dieser ersten Stufe ist eine Liste mit möglicherweise relevanten objektiven Eigenschaften, Benefits, Nutzungssituationen und akzeptierten Produkten. In einem zweiten Schritt werden die Beziehungen zwischen den einzelnen Elementen genauer untersucht. Es wird beispielsweise analysiert, wie stark bestimmte Eigenschaften von den Befragungsteilnehmern gewünscht werden. Im Rahmen dieser Untersuchung nutzt Myers (1976) persönliche Interviews. Dabei wird zunächst erhoben, zu welchem Zweck ein Produkt überhaupt eingesetzt wird. Aus den von den Probanden genannten Nutzungssituationen wählt der Marktforscher eine aus, die dann im Fokus der weiteren Untersuchung steht. Die in Schritt 1 erhobenen Benefits dienen nun als Grundlage zur Bewertung der anderen genannten Elemente. So wird beispielsweise auf einer 4-stufigen Rating-Skala eingeschätzt, welche physischen Eigenschaften mit welchem Benefit in Verbindung gebracht werden (1). Weiterhin wird erfasst, wie stark die einzelnen Benefits von den Befragungsteilnehmern erwünscht sind (2). Resultat dieser Untersuchung ist eine „Complete Benefit Matrix“ in der der Zusammenhang zwischen Erwünschtheit eines Benefits und Wahrnehmung eines Benefits z.B. bezüglich einer Eigenschaft durch Differenzbildung in jeder Zelle (d.h. (2) – (1)) ermittelt wird. Über alle Probanden werden anschließend die Mittelwerte dieser Daten berechnet. Durch den Vergleich zwischen wahrgenommenen und erwünschten Benefits je Element sollen Nutzendefizite ableitbar werden.1577 Problematisch an dieser Vorgehensweise ist, dass lediglich bivariate Vergleiche auf aggregierter Ebene durchgeführt werden und die angewendete Rating-Skala zu grob erscheint. Die Grundannahme, dass die Beseitigung eines Defizits zu einer höheren Akzeptanz führt, ist äußerst fragwürdig, da dies evtl. das Produkt verteuern könnte. Trade-offs zwischen verschiedenen Elementen werden nicht berücksichtigt. Zudem ist davon auszugehen, dass zwischen der Vielzahl der untersuchten Eigenschaften und Benefits Interaktionen bestehen, so dass insgesamt die Prognosevalidität und Reliabilität der gefundenen Ergebnisse angezweifelt werden muss.1578

1577 1578

268

Vgl. Myers (1976), 24ff. Vgl. Shocker; Srinivasan (1979b), 8f.

Auch bei der von Reiners (1996, 42ff.) vorgeschlagenen Vorgehensweise werden in einem ersten Schritt alle potenziell relevanten Merkmale ermittelt. Danach wird die möglicherweise umfangreiche Liste an Eigenschaften z.B. mit Hilfe der Dualen Befragung auf die tatsächlich präferenzrelevanten Produktdimensionen reduziert. Die verbliebenen Eigenschaften werden auf empirische Unabhängigkeit1579 und mögliche Interaktionen1580 hin überprüft und schließlich das in der Conjoint-Analyse zu untersuchende Attributset festgelegt. Im Gegensatz zu den bisher beschriebenen Stufenverfahren setzt Reiners (1996, 42ff.) auf Expertenbefragungen.1581 Die hier dargestellten Stufen-Verfahren wurden entwickelt, da erkannt wurde, dass die verschiedenen Methoden unterschiedliche Informationsarten erheben. Zur Bestimmung der relevanten Merkmale werden dabei zunächst die salienten Merkmale erfasst und in einem zweiten Schritt deren Relevanz eingeschätzt. Allerdings werden dazu in jedem Schritt lediglich traditionelle Verfahren miteinander kombiniert, die die Anforderungen1582 an ein Eigenschaftsset

zur Präferenzmessung nicht berücksichtigen und deshalb nicht erfüllen können.

5.6

Zwischenfazit und praktische Relevanz der bisherigen Methoden zur Bestimmung des Eigenschaftssets

Bei allen bisher beschriebenen Methoden handelt es sich um Verfahren, die in verschiedenen Forschungsbereichen häufig angewendet werden und sich bewährt haben. Keine der beschriebenen Vorgehensweisen wurde allerdings speziell auf die Anforderungen der Präferenzmessmethoden hin entwickelt. Bereits bei der Beschreibung der verschiedenen Verfahren wurde deutlich, dass keine Methode ohne Anpassungen zur Bestimmung eines Eigenschaftssets, das innerhalb von Studien zur Präferenzmessung sinnvoll genutzt werden kann, geeignet ist. Im Folgenden werden die Hauptkritikpunkte bei der Anwendung dieser Methoden zusammengefasst. Viele Verfahren berücksichtigen nicht, dass die Relevanz der Merkmale auf Basis der vom Entscheider wahrgenommenen Nutzenunterschiede zwischen den Ausprägungen eines Merkmals bestimmt werden muss. Vielmehr wird davon ausgegangen, dass Eigenschaften „an sich“ eine Bedeutung bzw. „Wichtigkeit“ besitzen. Präferenzen sind allerdings immer von den untersuchten Eigenschaftsausprägungen abhängig – eine Methode zur Bestimmung eines Eigenschaftssets muss dieser grundlegenden Anforderung entsprechen.

1579 1580 1581 1582

Siehe Kapitel 4.2.3.2. Siehe Kapitel 4.2.3.1. Für eine Bewertung von Expertenbefragungen zur Bestimmung von Eigenschaftssets siehe Kapitel 5.1. Siehe Kapitel 4.2 und 4.2.6.

269

Um ein Eigenschaftsset für eine Gruppe von Entscheidungsträgern mit ähnlichen Anforderungen bestimmen zu können, müssen die erhobenen Daten sinnvoll und nachvollziehbar aggregiert werden können. Die Festlegung des Eigenschaftssets sollte demnach nicht nur auf

den Einschätzungen eines einzelnen Befragungsteilnehmers beruhen. Zudem wird bisher völlig vernachlässigt, dass in den verschiedenen Phasen eines Kaufentscheidungsprozesses unterschiedliche Merkmale entscheidend sind und deshalb lediglich die Eigenschaften, die in der Trade-off Phase relevant sind, im Rahmen von Studien zur Präferenzmessung untersucht werden können. Dies bedeutet, dass das Evoked-Set der Kunden den Ausgangspunkt der Präferenzmessung und somit auch bei der Bestimmung eines Eigenschaftssets bilden muss.1583 Dabei kann allerdings nicht davon ausgegangen werden, dass alle Entscheidungsträger über ein identisches Evoked-Set verfügen, vielmehr müssen zielgruppenspezifische Unterschiede explizit bei der Bestimmung eines Eigenschaftssets berücksich-

tigt werden. Auch die Art der erhobenen Informationen (Characteristics, Benefits, Imagery) ist für die Einschätzung der Verfahrensalternativen entscheidend. Wie in Kapitel 4.1.8 beschrieben, sollte die Merkmalsart aus Sicht der Entscheider festgelegt werden. Schließlich sollte es eine Methode ermöglichen, die ermittelten Merkmale und Ausprägungen auf Redundanzen und Präferenzunabhängigkeit zu untersuchen. Keines der hier beschriebenen Verfahren kann diesen grundlegenden Anforderungen entsprechen. Im Folgenden wird deshalb eine neuartige Methode entwickelt, die diese möglichst gut erfüllt. Neben diesen methodischen Anwendungsvoraussetzungen sollten allerdings auch praktische Gesichtspunkte bei der Gestaltung eines entsprechenden Verfahrens berücksichtigt werden. Die Anwendungshäufigkeit der traditionellen Methoden zur Bestimmung eines Eigenschaftssets kann dabei als ein Anhaltspunkt herangezogen werden. Anhand verschiedener Meta-Studien (siehe Tabelle 19) ist erkennbar, dass in der wissenschaftlichen Literatur der Ermittlung des Eigenschaftssets derzeit kaum Beachtung gewidmet wird. In einem Großteil der Studien wird beispielsweise nicht erwähnt, welches Verfahren zur Bestimmung des Eigenschaftssets genutzt wurde. Fasst man die Ergebnisse verschiedener Meta-Studien zur Anwendungshäufigkeit von Verfahren zur Bestimmung der zu untersuchenden Eigenschaften und Ausprägungen zusammen, wird deutlich, dass insbesondere die Nutzung von Experteninterviews eine wichtige Rolle spielt. Die Befragung von Konsumenten bzw. potenziellen Kunden zur Generierung eines Eigenschaftssets wird insgesamt bisher eher selten genutzt. Lediglich in der Meta-Studie von Cattin; Wittink (1982, 46) werden Verfahren wie die Repertory-Grid Methode, Protokolle Lauten Denkens und Gruppeninterviews vergleichsweise häu1583

270

Siehe dazu auch Kapitel 2.3 und 4.2.4.

fig genutzt, wobei diese Urteile jedoch in jedem Fall durch Expertenbefragungen ergänzt wurden.

Methode zur Bestimmung der Eigenschaften

Meta Studie

Autoren Stichprobengröße Untersuchungsregion Untersuchungszeitraum Expertenbefragung Sekundärdatenauswertung 1585 Direkte Befragung Repertory Grid Methode Protokolle Lauten Denkens Gruppeninterviews Sonstige Kombination verschiedener Verfahren Keine Angabe

Cattin, Wittink (1982), 46

Schubert (1991), 261, 317

Helm, Steiner (2006), 11

17 Marktforschungsinstitute

128 Einzelstudien

84 Einzelstudien

USA 1971-1980 1584 100 % 59 % 41 % 29 % 88 % 18 %

k.A. k.A. 16 % 4% 11 % -

k.A. 1980-2004 14 % 5% 8% -

-

24 %

18%

-

45 %

55 %

Tabelle 19: Praktische Relevanz verschiedener Methoden zur Bestimmung eines Eigenschaftssets

Angesichts der insgesamt geringen Nutzung konsumentenbasierter Urteile können aufgrund dieser Meta-Studien keine differenzierten Rückschlüsse über die praktische Bedeutung der einzelnen Verfahren zur Ermittlung eines Eigenschaftssets getroffen werden. Insgesamt deuten die Ergebnisse der Meta-Studien jedoch darauf hin, dass in der Praxis möglichst einfache Methoden bevorzugt eingesetzt werden. Dabei handelt es sich um Verfahren, die schnell durchführbar und mit geringem Aufwand verbunden sind.1586 Eine Eigenschaftsset besteht aus den zu untersuchenden Attributen und den jeweiligen Ausprägungen. Mit Hilfe der bisher vorgestellten Methoden ist es allerdings lediglich möglich, die Attribute zu bestimmen. Deshalb wird im folgenden Abschnitt die bisher übliche Vorgehensweise bei der Festlegung der zu untersuchenden Merkmalsausprägungen beschrieben.

5.7

Bestimmung der relevanten Eigenschaftsausprägungen

Präferenzen sind immer kontextabhängig; der Kontext wird dabei durch die Eigenschaftsausprägungen determiniert. Die Festlegung der zu untersuchenden Eigenschaftsausprägung hat 1584

Mehrfachnennungen waren möglich. Dies bedeutet, dass in jedem Fall der Auftraggeber in die Auswahl der zu untersuchenden Eigenschaften einbezogen wurde (vgl. Cattin; Wittink (1982), 46). Hier bleibt unklar, welche konkrete Vorgehensweise zur Bestimmung der Eigenschaften benutzt wurde. Cattin; Wittink (1982, 46) beschreiben diese Vorgehensweise als “the set of attributes may be based more heavily on direct consumer input”. Entsprechend dieser Erläuterung könnte es sich um eine Variante der Elicitation-Technik handeln. Schubert (1991, 317) bezeichnet diese Art der Erhebung der Eigenschaften als „Anwenderbefragung“. Auch dabei bleibt unklar, welche genaue Vorgehensweise zur Bestimmung der Merkmale genutzt wurde. Da bei Helm; Steiner (2006, 11) lediglich in 8% der untersuchten Fälle die Bestimmung der Eigenschaften allein auf Basis von Konsumentenurteilen basieren, wurden diese Verfahren zu einer Gruppe zusammengefasst. 1586 Siehe analog Melles (2001), 43. 1585

271

deshalb dominanten Einfluss auf die Ergebnisse der Präferenzmessung.1587 Insofern verwundert es, dass bisher keine systematische Vorgehensweise entwickelt wurde, um die aus Kundensicht relevanten Merkmalsausprägungen zu erfassen. Vielmehr werden diese derzeit vom Marktforscher festgelegt.1588 Im Folgenden werden verschiedene, bisher angewandte Mög-

lichkeiten zur Bestimmung der Attributstufen durch den Marktforscher und deren mögliche Folgen beschrieben. Um ein Eigenschaftsset bestehend aus Produktmerkmalen und deren Attributstufen festlegen zu können, müssen zunächst die Bandbreite (Endpunkteproblem), die Zahl der Attributstufen (Abstufungsproblem) und die Abstände bzw. die Benennung der Attributstufen be-

stimmt werden.1589

5.7.1 Bestimmung der Bandbreite bei Eigenschaften mit metrischen Ausprägungen

Die Bandbreite einer Eigenschaft gibt den vom Entscheider wahrgenommenen Nutzenunterschied zwischen der am wenigsten und der am meisten bevorzugten Eigenschaftsausprägung wieder.1590 Diese wird bei der Conjoint-Analyse meist vom Marktforscher1591, durch Expertengespräche1592 oder durch Nutzung von Sekundärdaten1593 ermittelt. Die Bestimmung der relevanten Bandbreite der Eigenschaftsausprägungen ist ein entscheidender Schritt bei der Festlegung des Eigenschaftssets für die Conjoint-Analyse, da diese sowohl die Schätzung der Teilnutzenwerte als auch die durch die Präferenzmessung geschätzte Bedeutung der Eigenschaften determiniert.1594 Je nachdem, wie weit die Bandbreite gewählt wurde, desto größer bzw. geringer wird der Einfluss eines Produktmerkmals.1595 Orme (2002c, 2) empfiehlt, die gesamte Bandbreite aller am Markt befindlichen Produkte und die vom Auftraggeber vorgegebenen Eigenschaftsausprägungen im Rahmen der Conjoint-Analyse zu untersuchen; die Bandbreite sollte demnach möglichst weit gewählt und

1587

Vgl. Hair; Anderson; Tatham; Black (1998), 407.

1588

Vgl. Reynolds; Gutman (1988), 15; Hair; Anderson; Tatham; Black (1998), 399; Schmidt (1990), 271. Meist wird die Bestimmung der Ausprägungen allerdings gar nicht beschrieben, siehe u.a. Theuerkauf (1989), 1180. 1589 Die Abstände zwischen den Eigenschaftsausprägungen lassen sich lediglich bei Eigenschaften bestimmen, deren Ausprägungen quantitativ bzw. kontinuierlich sind; bei Merkmalen mit qualitativen bzw. diskreten Abstufungen sind diese nicht bestimmbar (siehe Darmon; Rouziès (1989), 35). 1590 Teilweise wird auch der Begriff „Spannweite“ verwendet (vgl. Backhaus; Erichson; Plinke; Weiber (2003), 567). 1591 1592 1593 1594 1595

272

Vgl. Darmon; Rouziès (1989), 35; Reiners (1996), 51. Vgl. Swoboda (2000), 155. Vgl. Fröhling (1994), 1147. Siehe auch Kapitel 4 und 3.8. Vgl. Sattler; Gedenk; Hensel-Börner (2002b), 954; Nitzsch; Weber (1991), 972.

lediglich völlig unrealistische Eigenschaftsausprägungen vermieden werden.1596 Green; Srinivasan (1978, 109) gehen diesbezüglich sehr viel weiter; zwar ist die Beurteilungsaufgabe durch die Nutzung von am Markt üblichen Bandbreiten realistisch, allerdings vermuten sie, dass Bandbreiten der Eigenschaftsausprägungen, die sehr viel weiter als reale Bandbreiten sind, die Validität der Präferenzmessung verbessern könnten.1597 Sie plädieren deshalb dafür, dass „ranges be made larger than reality, but not so large as to be unbelievable.“1598 Die American Marketing Association (1992, 7) spricht sich demgegenüber dafür aus, eine Untersuchung extremer Bandbreiten zu vermeiden, da diese zu unrealistischen Stimuli führen könnten. Auch Dellaert; Brazell; Louviere (1999, 141) warnen davor, extreme Ausprägungen im Rahmen der Präferenzmessung zu untersuchen, weil dies die Güte der Ergebnisse verschlechtern könnte. Schließlich empfiehlt McCullough (2002b, 20) lediglich eine “minimum range of attribute levels”1599 in die Präferenzmessung aufzunehmen. Die Empfehlungen der Autoren zeigen, dass weitgehend Uneinigkeit darüber besteht, wie die Bandbreiten der Merkmalsausprägungen bestimmt werden sollten. Gegen eine generell weitere Bandbreite der Eigenschaftsausprägungen als in der Realität spricht die Anforderung, dass die in der Conjoint-Analyse untersuchten Eigenschaftsausprägungen überhaupt realisierbar sein müssen.1600 Die Wichtigkeit einer Eigenschaft wird im Rahmen der Conjoint-Analyse aus der jeweiligen Spannweite der Teilnutzen der Eigenschaftsausprägungen eines Attributs berechnet.1601 Wird die Bandbreite der Attributausprägungen weiter als in der Realität gewählt, ist damit zu rechnen, dass diese Eigenschaften überund andere Produktmerkmale in den Ergebnissen unterbewertet werden. Innerhalb von Studien zur Präferenzmessung sollten deshalb zumindest realistische Bandbreiten untersucht werden.1602 Aber auch die Verwendung zu kleiner Bandbreiten der Eigenschaften kann dazu führen, dass die Bedeutung bestimmter Merkmale unterschätzt wird und zudem das Entscheidungsproblem aus Sicht der Befragungsteilnehmer nicht mehr vollständig beschrieben ist, weil relevante Merkmalsausprägungen nicht berücksichtigt wurden.1603

1596

Siehe Reiners (1996), 51f. Schubert (1991, 196) plädiert auch dafür, lediglich die in der Realität vorkommenden Ausprägungen zu verwenden. Demnach wären alle Eigenschaftsausprägungen zu berücksichtigen, bei denen vermutet werden kann, dass diese dem Befragungsteilnehmer irgendeinen Nutzen stiften könnten, d.h. der Nutzen größer als „0“ ist (vgl. Reiners (1996), 51f.). 1597 Diese Annahme wird von Green; Srinivasan (1978, 109) jedoch nicht begründet. 1598 1599 1600 1601 1602 1603

Green; Srinivasan (1978), 109. Siehe dazu auch Hair; Anderson; Tatham; Black (1998), 408. McCullough (2002b), 20. Siehe Kapitel 4.2.2. Siehe Kapitel 3.8. Vgl. Creyer; Ross (1988), 508; Hausruckinger (1993), 123; Schubert (1991), 196. Siehe Kapitel 4.2.1.

273

Als problematisch erweist sich auch, dass lediglich bei bestimmten Eigenschaftsarten die Bandbreite überhaupt a priori bestimmt und damit bei der Definition des Eigenschaftssets explizit berücksichtigt werden kann. Die Festlegung der Bandbreite ist nur bei Eigenschaften möglich, bezüglich derer der Marktforscher die Ausprägungen im vorhinein in eine sinnvolle Präferenzrangfolge bringen kann1604 und es sich zudem um Attribute handelt, deren Ausprägungen metrische Werte annehmen bzw. bei Produktmerkmalen mit dichotomen Eigenschaftsausprägungen (z.B. vorhanden/nicht vorhanden). Bei Attributen wie „Farbe“, „Verpackungsart“ usw. kann jedoch die Bandbreite a priori nicht sinnvoll vom Marktforscher bestimmt werden. Bei Merkmalen mit quantitativen Eigenschaftsausprägungen ergibt sich möglicherweise bei der Festlegung der zu untersuchenden Bandbreite das Problem der Bandbreiteneffekte.1605 Die Bedeutung, von Produktmerkmalen sollte, wie bereits beschrieben, je nach Veränderung der Bandbreite der Eigenschaftsausprägungen in einem bestimmbaren Verhältnis variieren. Ist dies nicht der Fall, lassen sich die Bedeutungsgewichte der Produktmerkmale u.U. nicht konsistent bestimmen; man spricht dabei von Bandbreiteneffekten. Treten Bandbreiteneffekte auf, können diese die geschätzten Nutzenwerte so stark verzerren, dass die aus der Präferenzmessung abgeleiteten produktpolitischen Entscheidungen mehr oder weniger „willkürlich“ sind.1606 Zur Ermittlung solcher Effekte schlagen Nitzsch; Weber (1991, 972ff.) das Maß der Bandbreiten-Sensitivität vor, das bei einer Variation der Bandbreite die empirisch gemesse-

ne Änderung der Bedeutungsgewichte mit den theoretisch prognostizierten Bedeutungsgewichten vergleicht.1607 Diese Studien basieren auf der Grundannahme, dass keinerlei Bewertungsschwellen bei der Einschätzung von metrischen Produktmerkmalen existieren. Es ist jedoch bekannt, dass der Nutzenverlauf von Eigenschaftsausprägungen von den Entscheidungsträgern zumeist nicht linear wahrgenommen wird.1608 Ein typisches Beispiel für Sprünge bzw. Diskontinuitäten in den Einschätzungen der Konsumenten hinsichtlich der Ei-

1604

Der Marktforscher könnte beispielsweise vermuten, dass bezüglich der Eigenschaft „Preis“ bei einem Mountainbike die Bandbreite der Ausprägung von „400,- Euro“ bis zu „10.000.- Euro“ reicht. Erstmals wurde dieser Effekt von Creyer; Ross (1988, 505ff.) beschrieben (siehe auch Stallmeier (1993), 67). Dieser wird in der Literatur teilweise als Endpunkteproblem bezeichnet (vgl. Reiners (1996), 51). 1606 Vgl. Sattler; Gedenk; Hensel-Börner (2002b), 954; Nitzsch; Weber (1991), 972; Verlegh; Schifferstein; Wittink (2002), 44f.; Creyer; Ross (1988), 110. In früheren Untersuchungen wurde die Änderung der Bedeutungsgewichte bei einer Variation der Bandbreite bereits als Bandbreiteneffekt beschrieben, wobei dies jedoch keine Verzerrung der Ergebnisse, sondern lediglich eine Kontextabhängigkeit der Präferenzen widerspiegelt (vgl. Verlegh; Schifferstein; Wittink (2002), 44). 1607 Vgl. Nitzsch; Weber (1991), 972ff.; Nitzsch; Weber (1993), 938; Sattler; Gedenk; Hensel-Börner (2002a), 957ff. 1605

1608

274

Vgl. Albers (2000), 367; Albers (1989), 192. So ist bekannt, dass die Ausprägungen der Eigenschaft „Preis“ oft nicht linear eingeschätzt werden (vgl. McCullough (2002b), 20; Zicha (1991), 36).

genschaftsausprägungen eines Produktmerkmals sind Preisschwellen.1609 In der folgenden Abbildung 38 werden beispielhaft zwei Varianten von Preisabsatzfunktionen dargestellt. y

y

p Lineare Preisabsatzfunktion

p Gutenberg Preisabsatzfunktion

Abbildung 38: Vergleich zwischen einer linearen Preisabsatzfunktion und einer Gutenberg Preisabsatzfunktion (Quelle: in Anlehnung an Böcker; Helm (2003), 308ff.)

Bei der linearen Preisabsatzfunktion (linker Graph) sind keinerlei Bewertungsschwellen zu beobachten. Während innerhalb einer bestimmten Bandbreite die lineare und die Gutenberg Preisabsatzfunktion (rechter Graph) sehr ähnlich sind, weist die Gutenberg Preisabsatzfunktion ab einer bestimmten Bandbreite Sprünge in den Bewertungen der Konsumenten auf. Diese Abweichungen von der erwarteten Absatzmenge werden als Bandbreiteneffekte bezeichnet. Mit solchen Effekten ist insbesondere dann zu rechnen, wenn Ausprägungen untersucht werden, die von den typischen Merkmalsausprägungen einer Zielgruppe abweichen.1610 Je weiter die Bandbreiten von Eigenschaften (wie z.B. Preis) gewählt werden, umso stärker ist mit Schwelleneffekten in den Bewertungen der Nachfrager zu rechnen.1611 Daraus lässt sich schlussfolgern, dass zur Vermeidung von Bandbreiteneffekten nicht die gesamte am Markt mögliche oder sogar darüber hinaus gehende Bandbreite in der Präferenzmessung, sondern lediglich die relevante bzw. intuitive Bandbreite der jeweiligen Befragungsteilnehmer untersucht werden sollte.1612 Gegen eine Verwendung der gesamten am Markt vorhandenen Bandbreite an Ausprägungen spricht auch, dass nicht alle Produkte am Markt für die Befragungsteilnehmer überhaupt in Frage kommen. Vielmehr ist davon auszugehen, dass Kunden im Normalfall einen zweistufigen Kaufentscheidungsprozess durchlaufen, in dessen Rahmen zunächst alle nicht akzeptablen Alternativen eliminiert und danach lediglich zwischen den Produkten, die sich im EvokedSet befinden ein Trade-off der einzelnen Produktmerkmale sowie deren Ausprägungen durch1609 1610 1611 1612

Für ein Beispiel siehe Balderjahn (1993), 110f. Vgl. Diller (2000), 87. Vgl. Diller (2000), 138. Vgl. Sattler; Gedenk; Hensel-Börner (2002b), 973; Melles (2001), 123; Winterfeldt; Edwards (1986), 285.

275

geführt wird.1613 Wird innerhalb der Präferenzmessung stattdessen die gesamte am Markt mögliche Bandbreite der Eigenschaftsausprägungen untersucht, lässt sich nicht ausschließen, dass sich aus Sicht eines Entscheiders völlig unakzeptable Merkmalsausprägungen im Eigenschaftsset befinden.1614 Untersucht man dagegen lediglich die für eine bestimmte Zielgruppe relevante Bandbreite der Eigenschaften auf Basis der Alternativen im Evoked-Set, kann das Problem der völlig unakzeptablen Eigenschaftsausprägungen vermieden werden. Es sollten deshalb zunächst zielgruppenspezifische Bandbreiten der Eigenschaften aus Sicht der Befragungsteilnehmer erhoben und in der späteren Präferenzmessung untersucht werden.

5.7.2 Festlegung der Anzahl der Attributstufen

Da Präferenzen immer kontextabhängig sind und deshalb nur Aussagen über die in der Präferenzmessung untersuchten Eigenschaftsausprägungen getroffen werden können, empfehlen einige Marktforscher möglichst alle Eigenschaftsausprägungen, bei denen die Möglichkeit besteht, dass die relevant sind, in die Conjoint-Analyse aufzunehmen.1615 Neben der Zahl der Eigenschaften determiniert allerdings auch die Anzahl der Merkmalsausprägungen die Zahl der in der Präferenzmessung zu untersuchenden Stimuli und damit den Befragungsaufwand. Sollen in einer Studie beispielsweise fünf Eigenschaften mit je zwei Ausprägungen getestet werden, ergeben sich bei einem vollständigen Design (25 = ) 32 Stimuli, werden dagegen wiederum fünf Eigenschaften mit je drei Ausprägungen in die Analyse aufgenommen, steigt die Zahl der möglichen Stimuli auf (35 = ) 243.1616 Die Anzahl der in die Präferenzmessung aufzunehmenden Stimuli kann zwar in einem weiteren Schritt durch die Anwendung verschiedener fraktionierter orthogonaler Erhebungsdesigns wie den Addelman Plänen1617 reduziert werden, der Umfang der zu untersuchenden Stimuli und somit ebenfalls der Befragungsaufwand steigen jedoch stets mit der Zahl der untersuchten Ausprägungen überproportional stark an.1618 Je höher die Zahl der zu bewertenden Alternativen ist, desto eher werden die Entscheidungsträger auf vereinfachte Bewertungsstrategien zurückgreifen.1619 Die Anzahl der Eigenschaftsausprägungen hat daher einen starken Einfluss auf die Ergebnisgüte der Präfe-

1613 1614 1615 1616 1617 1618 1619

276

Siehe Kapitel 2.3. Siehe Kapitel 4.2.4. Vgl. Hair; Anderson; Tatham; Black (1998), 399. Vgl. Schubert (1991), 195. Vgl. Addelman (1962), 21ff. Vgl. Reiners (1996), 52. Siehe Kapitel 3.3.

renzmessung.1620 Die Anzahl der zu untersuchenden Merkmalsausprägungen muss deshalb auf die tatsächlich relevante Eigenschaftsausprägungen beschränkt werden.1621 Die Anzahl der Merkmalsausprägungen einer Eigenschaft kann zudem einen Einfluss auf die mittels Conjoint-Analyse geschätzten Teilnutzenwerte1622 und damit außerdem auf die geschätzte Wichtigkeit1623 bzw. Ergebnisse von Marktsimulationen1624 ausüben. So wurde in verschiedenen empirischen Studien beobachtet, dass Attribute, die durch eine große Anzahl an Eigenschaftsausprägungen beschrieben werden, oft als wichtiger wahrgenommen werden – diese Veränderung des Bedeutungsgewichts bei gleichen Bandbreiten der Ausprägungen nennt man Attributstufeneffekt.1625 Sämtliche bekannten Methoden zur Präferenzmessung sind von Attributstufeneffekten betroffen, allerdings sind diese bei dekompositionellen Methoden tendenziell stärker ausgeprägt.1626 Der Attributstufeneffekt bewirkt, dass alle Ergebnisse der Präferenzmessung von dem jeweiligen Befragungskontext, d.h. der jeweiligen Zahl

an Attributstufen abhängig sind und Bedeutungsgewichte sowie Ergebnisse von Marktsimulationen und damit unternehmerische Entscheidungen entscheidend von diesem Befragungskontext beeinflusst werden.1627 Innerhalb von weiteren empirischen Studien zur Untersuchung der Auswirkungen einer Variation von Attributstufen wurden sehr unterschiedliche Ergebnisse beobachtet. Creyer; Ross (1988,508) beobachten einen signifikanten Unterschied der Bedeutungsgewichte, wenn zwei und drei Ausprägungen untersucht, aber keine signifikanten Unterschiede, wenn zwei und vier Merkmalsausprägungen betrachtet werden. In anderen Studien steigt das Bedeutungsgewicht erwartungsgemäß mit einer höher Anzahl der Attributstufen.1628

1620 1621 1622

Vgl. Reibstein; Bateson; Boulding (1988), 274. Vgl. Höser (1998), 109; Reiners (1996), 52; Schubert (1991), 196; Klein (2002), 14. Vgl. Wittink; Huber; Zandan; Johnson (1992), 3.

1623

Erstmals wurde dieser Attributstufeneffekt von Currim; Weinberg; Wittink (1981, 72) und ausführlicher von Wittink; Krishnamurthi; Nutter (1982, 471) beobachtet und beschrieben. Siehe auch Creyer; Ross (1988), 506; Hausruckinger; Helm (1996), 272; Hair; Anderson; Tatham; Black (1998), 407; Orme (1998), 1; Wittink (1991), 44. 1624 Vgl. Wittink; McLauchlan; Seetharaman (1999), 238; Wittink; Seetharaman (1999), 279f. 1625

Vgl. Wittink; Huber; Zandan; Johnson (1992), 2f.; Wittink; Seetharaman (1999), 269; Perrey (1996), 107; Melles (2001), 118. Reiners (1996, 53) bezeichnet dies als “Anzahl-der-Stufen-Effekt”. Vgl. Wittink; Huber; Zandan; Johnson (1992), 1ff.; Wittink; Seetharaman (1999), 269. In anderen Studien wie beispielsweise Wittink; McLauchlan; Seetharaman (1999, 228); Green (1984, 162); Steenkamp; Wittink (1994, 285); Melles (2001, 119) wird davon ausgegangen, dass Self-Explicated Methoden nicht bzw. weniger stark vom Attributstufeneffekt betroffen sind. Auch in einer Studie von Wittink (1991, 51) werden bei dieser direkten Methode zur Präferenzmessung keinerlei Auswirkungen der Attributstufen festgestellt. 1627 Vgl. Wittink; Huber; Zandan; Johnson (1992), 2f. 1626

1628

Für einen Überblick verschiedener Studien und einer empirischen Überprüfung siehe Wittink; Huber; Zandan; Johnson (1992), 2ff. Siehe auch Wittink; Krishnamurthi; Nutter (1982), 472f.; Wittink (1991), 43.

277

Ursachen für Attributstufeneffekte

Attributstufeneffekte werden möglicherweise durch: -

-

Aufmerksamkeitseffekte,1629 Gleichverteilungseffekte,1630 durch den Marktforscher / Auftraggeber1631 oder

die verwendeten Skalen bei der Erhebung1632 bzw. Parameterschätzalgorithmen1633 hervorgerufen.

psychologische Ursache für den Attributstufeneffekt

Attributstufeneffekt

durch

die

verwendete Präferenzmessmethode

Die steigende Bedeutung von Produktmerkmalen mit einer höheren Anzahl an Eigenschaftsausprägungen kann dadurch verursacht werden, dass diese Attribute durch ihre höhere Anzahl an Ausprägungen den Entscheidungsträgern stärker auffallen und ihnen deshalb mehr Aufmerksamkeit gewidmet wird.1634 Die Ergebnisse bei der Untersuchung von Aufmerksam-

keitseffekten sind allerdings relativ widersprüchlich. Verlegh; Schifferstein; Wittink (2002, 49) konnte in einer Studie das Vorhandensein dieses Effektes bei der Untersuchung von fünf verschiedenen Methoden zur Präferenzmessung nicht bestätigen. Auch bei Wittink; Huber; Zandan; Johnson (1992, 10) oder Steenkamp; Wittink (1994, 284) spielte ein Aufmerksamkeitseffekt keine entscheidende Rolle. Das tatsächliche Bestehen eines solchen psychologischen Effekts ist jedoch angesichts der wenigen Studien zu diesem Effekt weiterhin unklar.1635 Eine weitere verhaltensbasierte Erklärung bieten Verlegh; Schifferstein; Wittink (2002, 45); sie gehen bei der Gleichverteilungshypothese davon aus, dass Befragungsteilnehmer dazu tendieren, die verschiedenen Eigenschaftsausprägungen auf der vorgegebenen Skala mehr oder weniger gleich zu verteilen, d.h. unabhängig der tatsächlich empfundenen Vorteilhaftigkeit der jeweiligen Ausprägungen werden diesen mehr oder weniger gleiche Abstände zugewiesen. In Abbildung 39 wird ein Beispiel für mögliche Antworten eines Befragungsteilnehmers für den Fall mit zwei und vier Eigenschaftsausprägungen bei einer direkten, unidimensionalen Bewertung präsentiert. Bei einer Befragung mit nur zwei Ausprägungen würde der Proband 1629 1630 1631 1632 1633 1634 1635

278

Dieser Effekt wird erstmals von Currim; Weinberg; Wittink (1981, 72) beschrieben. Vgl. Verlegh; Schifferstein; Wittink (2001), 6; Verlegh; Schifferstein; Wittink (2002), 45. Vgl. Currim; Weinberg; Wittink (1981), 72; Wittink; Krishnamurthi; Nutter (1982), 471. Vgl. Steenkamp; Wittink (1994), 278ff. Vgl. Currim; Weinberg; Wittink (1981), 72; Wittink (1991), 45. Vgl. Hausruckinger; Helm (1996), 272; Wittink; Krishnamurthi; Nutter (1982), 471; Wittink; Huber; Zandan; Johnson (1992), 4f.; Reiners (1996), 53; Klein; Bither (1987), 253; Melles (2001), 120. Vgl. Wittink; Krishnamurthi; Nutter (1982), 474; Wittink; Krishnamurthi; Reibstein (1989), 120; Wittink; McLauchlan; Seetharaman (1999), 228.

bei einer 10er Rating-Skala die Werte „4“ und „7“ vergeben. Diese weisen zu den Endpunkten der Skala und untereinander annähernd gleiche Abstände auf. Werden zwei weitere Eigenschaftsausprägungen in die Untersuchung aufgenommen, so würden entsprechend der Gleichverteilungshypothese sämtliche Eigenschaftsausprägungen neu auf der vorgegebenen Skala verteilt werden, so dass die Abstände möglichst gleich sind.1636 Eigenschaft: Preis (in Euro)

Ausprägungen: 1, 2, 5, 6

mögliche Einschätzungen eines Befragungsteilnehmers bzgl. einer Eigenschaft bei

am wenigsten bevorzugt

zwei Ausprägungen (Abfrage der Ausprägungen 1 und 6)

1

6 2

3

4

6 vier Ausprägungen (Abfrage der vier Ausprägungen 1, 2, 5 und 6)

1

2

3

5

6

5 4

am wenigsten bevorzugt

1

5

7

8

2 6

7

9

10

1 8

9

10

Abbildung 39: Auswirkungen der Variation der Zahl der Attributstufen nach der Gleichverteilungshypothese

Vertreter der Gleichverteilungshypothese gehen aus diesem Grund davon aus, dass der Befragungsteilnehmer die Einschätzung der Merkmalssausprägungen nicht rational und überlegt, sondern mehr oder weniger intuitiv vornimmt bzw. die Abstände zwischen den Einschätzungen nicht bestimmen kann. Im Gegensatz dazu setzt die Conjoint-Analyse Trade-off Entscheidungen voraus, im Rahmen derer der Proband die durch verschiedene Eigenschaften und Ausprägungen gebildeten Stimuli bewusst bewertet.1637 Weiterhin ist fraglich, ob die Hypothese, die anhand eines unidimensionalen Beispiels beschrieben wurde, ohne weiteres auf mehrdimensionale, d.h. multiattributive Entscheidungsprobleme übertragen werden kann. Green; Krieger; Agarwal (1991, 216, 219) vermuten, dass bei multiattributiven Entscheidungen (wie z.B. bei dem Paarvergleich bei der ACA) die Bewertungen nicht gleich verteilt werden, sondern die Befragungsteilnehmer eher zu den extremen Skalenwerten tendieren. Verlegh; Schifferstein; Wittink (2002, 45) konnten diesen Effekt in einer empirischen Studie lediglich bei zwei von fünf untersuchten Präferenzmessmethoden beobachten, wobei bei der direkten Einschätzung der Eigenschaften keine Gleichverteilungstendenz nachgewiesen werden konnte. In weiteren Studien wurde dieser Effekt bisher noch nicht untersucht. Zudem ist es möglich, dass die Skalenart bei der Datenerhebung und die Methode zur Schätzung der Teilnutzenwerte die unterschiedlichen Bedeutungsgewichte je nach Ausprägungs1636 1637

Vgl. Verlegh; Schifferstein; Wittink (2002), 45; Verlegh; Schifferstein; Wittink (2001), 6. Siehe auch Kapitel 2.3 und 2.4.

279

zahl verursacht.1638 Wittink (1991, 44) zeigt an einem Simulationsbeispiel, dass bei der Anwendung der Trade-off Matrix die Erhöhung der Anzahl der Eigenschaftsausprägungen zu einer Veränderung der Bedeutungsgewichte führt.1639 Auch bei traditionellen Varianten der Conjoint-Analyse auf Basis von Rangdaten wird der Attributstufeneffekt durch die Art der verwendeten Skala hervorgerufen.1640 Wittink; Krishnamurthi; Reibstein (1989, 115ff.) und Wittink (1991, 45) vermuten, dass mit Hilfe von Präferenzmessmethoden, die auf RatingSkalen beruhen, der Effekt gemildert bzw. bei hybriden Verfahren wie der ACA, die direkte

Einschätzungen der Self-Explicated Methode einbeziehen, ganz vermieden werden könnte.1641 Der Attributstufeneffekt wurde jedoch auch bei auf Rating-Skalen basierten ConjointAnalysen1642 und bei der Adaptive Conjoint-Analysis (ACA)1643 beobachtet. Wittink; Krishnamurthi; Reibstein (1989, 120ff.) haben beispielsweise bei Conjoint-Analysen auf Basis von Rating-Skalen einen vergleichbar starken Attributstufeneffekt wie bei den Conjoint-

Analysen auf Basis von Rang-Daten gefunden. Sie nehmen deshalb an, dass die Art der Rating-Skalen einen Einfluss auf die Stärke von Attributstufeneffekten ausübt. So könnte ein Befragungsteilnehmer nicht alle möglichen Skalenpunkte ausnutzen und dazu tendieren, nur bestimmte Skalenpunkte bei der Einschätzung der Alternativen zu verwenden, was zu Attributstufeneffekten führen könnte. Schließlich wird bei der Verwendung von Rating-Skalen häufig davon ausgegangen, dass sich die erhobenen Präferenzdaten auf Intervallskalenniveau befinden. Allerdings zeigen Untersuchungen wie die von Steenkamp; Wittink (1994, 285), dass nicht alle Probanden Daten auf Intervallskalenniveau liefern; vielmehr ähneln die Ergebnisse eher ordinal skalierten Daten, was ein Grund für den Attributstufeneffekt sein könnte.1644 Die beiden Autoren nutzen deshalb eine Magnituden-Skala1645, bei der die Wahrscheinlichkeit, metrisch skalierte Daten zu erheben, tendenziell höher ist. Dessen ungeachtet zeigen sich auch bei dieser Skalenart unterschiedliche Bedeutungsgewichte je nach Anzahl

1638

Vgl. Hausruckinger; Helm (1996), 272; Reiners (1996), 53; Verlegh; Schifferstein; Wittink (2002), 45; Wittink (1991), 44; Perrey (1996), 108; Melles (2001), 120. Siehe dazu Currim; Weinberg; Wittink (1981, 72) und Wittink; Krishnamurthi; Nutter (1982, 473). Hier wird anhand einer empirischen Studie als auch anhand von formalen Überlegungen gezeigt, dass analog zu den Trade-off Matrizen ebenfalls Conjoint-Analysen basierend auf einer Rangbildung bzw. ordinalen Paarvergleichen von diesem Problem betroffen sind. 1640 Vgl. Wittink; Krishnamurthi; Reibstein (1989), 115ff.; Wittink (1991), 45. Wittink; Krishnamurthi; Reibstein (1989, 113ff) vermuten deshalb, dass nur Eigenschaften mit der gleichen Anzahl an Ausprägungen vergleichbar sind. 1641 Vgl. Wittink; Krishnamurthi; Reibstein (1989), 122; Wittink (1991), 50f.; Steenkamp; Wittink (1994), 285. 1639

1642 1643 1644

Vgl. Wittink; Krishnamurthi; Reibstein (1989), 120; Wittink; McLauchlan; Seetharaman (1999), 230. Vgl. Wittink; McLauchlan; Seetharaman (1999), 234; Wittink; Seetharaman (1999), 279f.

Dabei ist unklar, warum bei manchen Befragungsteilnehmern metrische, bei anderen nicht-metrische Daten erhoben wurden. Es wird jedoch deutlich, dass neben der Skala und der verwendeten Methode auch die Befragungsteilnehmer den Attributstufeneffekt hervorrufen (vgl. Steenkamp; Wittink (1994), 285). 1645 Bei der Verwendung einer Magnituden-Skala schätzen die Befragungsteilnehmer den Stimulus anhand eines physischen Mediums, wie z.B. der Lautstärke eines Tons, der Länge einer Geraden, ein (vgl. Steenkamp; Wittink (1994), 278).

280

der Merkmalsausprägungen, so dass geschlussfolgert werden kann, dass nicht allein die verwendete Skala für das Auftreten von Attributstufeneffekten verantwortlich sein kann.1646 Die ACA (Adaptive Conjoint-Analyse) ist eine Methode der Präferenzmessung, bei der die Präferenzen in einem ersten Schritt mit einer Self-Explicated Methode erhoben und die ermittelten Ergebnisse mit Hilfe von Conjoint-Paarvergleichen verbessert werden sollen. Dazu gehen bei der ACA Version 3 die Self-Explicated Werte, die auf einer 4er Rating-Skala gemessen werden, direkt in die Schätzung der Teilnutzenwerte der Conjoint-Analyse ein, die im Rahmen von Paarvergleichen mit einer 9er Rating-Skala erhoben werden.1647 Orme (1998, 3f.) vermutet, dass dies bei der ACA Version 3 den Attributstufeneffekt verstärkt.1648 Deshalb wurde die Parameterschätzung in den neueren ACA Versionen geändert - die Nutzenfunktionen werden nun separat geschätzt und erst im Anschluss die Teilnutzen durch Gewichtung der Einzelnutzenfunktionen bestimmt.1649 In einer empirischen Untersuchung konnte durch die neuartige Gewichtung der Einzelergebnisse der Attributstufeneffekt bei der ACA zumindest gemildert werden. Da auch in weiteren Studien dieser Effekt beobachtet wurde, kann somit ein gewisser methodischer Einfluss auf den Attributstufeneffekt als gesichert angenommen werden.1650 Insgesamt sind kompositionelle Präferenzmessverfahren, wie beispielsweise die Self-Explicated Methode, weniger stark als dekompositionelle Methoden von dem Attributstufeneffekt betroffen.1651 Bei der Erhebung der Präferenzen mit Hilfe von wahlbasierten Präferenzurteilen können ebenso Attributstufeneffekte festgestellt werden. Wittink;

McLauchlan; Seetharaman (1999, 238) beobachten bei der Choice-Based Conjoint-Analyse (CBC) sogar einen stärkeren Einfluss der Anzahl der Merkmalsausprägungen als beispielsweise bei der ACA.1652 Auch der Marktforscher bzw. Auftraggeber selbst kann den Attributstufeneffekt hervorrufen, indem er die Eigenschaften, die aus seiner Sicht besonders bedeutsam sind, durch mehr Eigenschaftsausprägungen beschreibt als andere Produktmerkmale.1653 Gegen diese Annahme

1646 1647

Vgl. Steenkamp; Wittink (1994), 282. Vgl. Green; Krieger; Agarwal (1991), 216.

1648

Siehe Wittink; Seetharaman (1999), 277. Auch bei Green; Krieger; Agarwal (1991, 220f.) wurde die Vermischung von zwei verschiedenen Methoden und Skalenarten (neben anderen Problemen) als ein gravierender Schwachpunkt der ACA identifiziert, allerdings nicht mit dem Attributstufeneffekt in Verbindung gebracht. 1649 Für eine detaillierte Beschreibung der Gewichtung siehe Orme (1998), 3f.. 1650 1651 1652 1653

Vgl. Orme (1998), 3ff. Vgl. Wittink; Huber; Zandan; Johnson (1992), 5f. Siehe Wittink; Seetharaman (1999), 279f. Vgl. Currim; Weinberg; Wittink (1981), 72; Wittink; Krishnamurthi; Nutter (1982), 471; Perrey (1996), 107f.; Melles (2001), 120.

281

spricht jedoch, dass bei experimentellen Studien die Bedeutungsgewichte der Merkmale ebenfalls sehr stark von der Anzahl der Ausprägungen abhängen.1654 Zusammenfassend kann festgestellt werden, dass die genaue Ursache des Attributstufeneffekts bisher noch weitgehend unklar ist.1655 Ein Grund dafür ist, dass z.B. psychologische Effekte kaum isoliert von der Methode nachgewiesen werden können.1656 Entsprechend schwer lässt sich dieser Effekt vermeiden. Gewichtung der Bedeutungsgewichte zur Vermeidung von Attributstufeneffekten

Eine Möglichkeit zur Reduzierung des Attributstufeneffekts besteht u.U. darin, die mit Hilfe der Conjoint-Analyse basierend auf Rangdaten ermittelten Bedeutungsgewichte durch Zahl der Ausprägungen nachträglich zu gewichten. Currim; Weinberg; Wittink (1981, 72) schlagen vor, jeweils das geringste Bedeutungsgewicht einer Eigenschaft von den Produktmerkmalen mit der gleichen Anzahl an Ausprägungen zu subtrahieren. In einer empirischen Studie beobachten die Autoren, dass die Eigenschaften mit zwei Ausprägungen Bedeutungsgewichte zwischen 0,2 und 0,6 aufweisen, bei Produktmerkmalen mit drei Ausprägungen die Bedeutungsgewichte jedoch zwischen 0,4 und 0,8 variieren. Die Bedeutungsgewichte können neu berechnet werden, indem jeweils das minimale Bedeutungsgewicht (bei allen Eigenschaften mit zwei Ausprägungen wäre dies beispielsweise 0,2) von den berechneten Bedeutungsgewichten subtrahiert wird (siehe Tabelle 20).1657 Ursprüngliche Bedeutungsgewichte Eigenschaft 1 Eigenschaft 2 (minimales Bedeu- (maximales Bedeutungsgewicht) tungsgewicht) Eigenschaften mit je zwei Ausprägungen Eigenschaften mit je zwei Ausprägungen

0,2

0,6

0,4

0,8

Neue Bedeutungsgewichte Eigenschaft 1 Eigenschaft 2 (minimales Bedeu- (maximales Bedeutungsgewicht) tungsgewicht) 0,2 – 0,2 = 0,6 – 0,2 = 0,0 0,4 0,4 – 0,4 = 0,8 – 0,4 = 0,0 0,4

Tabelle 20: Neugewichtung der Eigenschaften je nach Anzahl der Attributstufen

Currim; Weinberg; Wittink (1981, 67) gehen davon aus, dass eine solche Gewichtung die Eigenschaften mit einer unterschiedlichen Anzahl an Ausprägungen vergleichbar macht. Sie bewirkt, dass die Unterschiede zwischen den Bedeutungsgewichten geringer werden.1658 Eine Grundannahme dieser Vorgehensweise ist allerdings, dass jeweils die Eigenschaften, die die geringsten Bedeutungsgewichte aufweisen, gleich wichtig sind, da diesen Produktmerkmalen ein Bedeutungsgewicht von „0“ zugewiesen wird. Eine solche Gewichtung ist willkürlich, da 1654 1655 1656 1657 1658

282

Siehe beispielsweise Wittink; McLauchlan; Seetharaman (1999), 238. Vgl. Reiners (1996), 53; Perrey (1996), 108. Vgl. Perrey (1996), 108. Siehe auch Wittink (1991), 44. Vgl. Wittink; Krishnamurthi; Nutter (1982), 474.

nicht davon ausgegangen werden kann, dass jeweils die Eigenschaften mit dem geringsten Bedeutungsgewichten einen gleichen Einfluss auf die Kaufentscheidung ausüben. Mit Hilfe dieser Art der Gewichtung werden zudem lediglich die Bedeutungsgewichte der Eigenschaften berücksichtigt. Gleichwohl sind sämtliche Schätzungen der Conjoint-Analyse, d.h. alle Teilnutzen, von den Verzerrungen betroffen.1659 Wittink (1991, 49) stellt ebenfalls fest, dass eine solche Art der Gewichtung von Eigenschaften zu inkonsistenten Ergebnissen führt und deshalb diese Vorgehensweise unakzeptabel erscheint.1660 Auch Wittink; Huber; Zandan; Johnson (1992, 7f.) schlagen die Berechnung eines alternativen Bedeutungsgewichts für die Fälle vor, in denen eine Eigenschaft durch sehr viele Aus-

prägungen beschrieben wird und man von einem monotonen Nutzenverlauf ausgehen kann. Dies ist z.B. bei der Eigenschaft „Preis“ gegeben - je niedriger die Ausprägung für dieses Produktmerkmal ist, desto stärker sollte der Stimulus (bei sonst konstanten anderen Eigenschaftsausprägungen) präferiert werden. Werden Eigenschaften durch sehr viele Ausprägungen beschrieben, wird die angenommene Monotoniebedingung jedoch häufiger verletzt, d.h. statt des niedrigsten Preises zieht ein Befragungsteilnehmer beispielsweise einen anderen Preis vor. Wie bereits in Kapitel 3.8 beschrieben, erfolgt die Berechnung des Bedeutungsgewichts auf Basis der Spannweiten der Teilnutzen. Wird die Monotoniebedingung eingehalten, entspräche diese dem höchsten und niedrigsten Preis. Kommt es dagegen zu einer Verletzung dieser Annahme, bilden andere Eigenschaftsausprägungen die Spannweite und gehen in die Berechnung des Bedeutungsgewichts ein. Wittink; Huber; Zandan; Johnson (1992, 7f.) schlagen daher vor, die Teilnutzen der a priori vom Marktforscher vermuteten Spannweite bei der Berechnung der Bedeutungsgewichte zu nutzen. In einer von ihnen durchgeführten empirischen Studie konnte durch die Anwendung dieser Vorgehensweise der Attributstufeneffekt bei der Berechnung der Bedeutungsgewichte reduziert werden. Problematisch an dieser Berechnungsweise ist dennoch, dass nicht für alle Eigenschaften eine a priori Reihenfolge der Vorziehenswürdigkeit gebildet werden kann und eine Mischung der Berechnungsweisen der Bedeutungsgewichte innerhalb einer Studie nicht sinnvoll erscheint, da unterschiedliche Arten von Bedeutungsgewichten nicht miteinander vergleichbar sind. Es existiert eine Reihe weiterer alternativer Gewichtungsvorschläge.1661 Es kann aber nicht bestimmt werden, welche davon die vorteilhafteste Variante ist.1662 Eine Gewichtung oder Neuberechnung der Bedeutungsgewichte kann überdies das eigentliche Problem des Attri1659 1660 1661 1662

Vgl. Wittink; Krishnamurthi; Reibstein (1989), 118. Vgl. Wittink; McLauchlan; Seetharaman (1999), 230. Zudem ist sie lediglich bei Conjoint-Analysen, die auf Rangdaten beruhen, möglich. Für einen Überblick siehe Wittink; Krishnamurthi; Reibstein (1989), 118f. Vgl. Wittink; Krishnamurthi; Reibstein (1989), 118.

283

butstufeneffekts, d.h. der evtl. verzerrten bzw. je nach Anzahl der Attributstufen unterschiedlichen Teilnutzenwerte der Eigenschaftsausprägungen, nicht lösen. Letztlich verwenden Produktmanager nicht die bloßen Bedeutungsgewichte, sondern Marktsimulationen, um produkt- und absatzpolitischer Maßnahmen ableiten zu können.1663 Das eigentliche Problem der verzerrten Teilnutzen führt folglich weiterhin zu einer Verfälschung der Simulationsergeb-

nisse. Ansätze zur Vermeidung von Attributstufeneffekten

Eine „Lösung“ des Attributstufeneffekts könnte darin bestehen, für alle Eigenschaften die gleiche Anzahl an Ausprägungen zu verwenden.1664 Dies hat allerdings eine unrealistische

Befragungssituation zur Folge, wenn aufgrund des Vorhandenseins von dichotomen Merkmalen1665 alle weiteren Eigenschaften nur durch zwei Ausprägungen beschrieben werden sollen.1666 Eine generelle Nutzung der gleichen Anzahl an Ausprägungen für alle Eigenschaften kann zudem dazu führen, dass sonst wichtige Produktmerkmale weniger bedeutsam eingeschätzt werden,1667 z.B. weil einige relevante Eigenschaftsausprägungen fehlen.1668 Deshalb sollten die Eigenschaften mit einer aus Kundensicht ausreichenden Zahl an Ausprägungen beschrieben werden.1669 Je größer der Einfluss eines Produktmerkmals auf die Präferenz ist, desto eher scheint u.U. das Einfügen weiterer Zwischenstufen angebracht.1670 Auch Wittink (1991, 48) geht davon aus, dass die Relevanz einer Eigenschaft (die durch die jeweiligen Ausprägungen bestimmt wird) den Attributstufeneffekt beeinflusst. Er erläutert dies für die Eigenschaft „Preis“. Demnach führt das Hinzufügen weiterer Ausprägungen bei wenig preissensiblen Befragungsteilnehmern zu keiner Verbesserung der Ergebnisse, während das Hinzufügen weiterer Ausprägungen bei preissensiblen Probanden (d.h. den Entscheidungsträgern, bei denen die Eigenschaft „Preis“ eine hohe Entscheidungsrelevanz besitzt) eine Verbesse-

1663

Vgl. Wittink; Huber; Zandan; Johnson (1992), 3; Wittink; McLauchlan; Seetharaman (1999), 237f.; Paffrath (1999), 241; Wittink; Seetharaman (1999), 280. Vgl. Höser (1998), 109f.; Wittink (1991), 48; Creyer; Ross (1988), 508; Hair; Anderson; Tatham; Black (1998), 407; Wittink; Krishnamurthi; Nutter (1982), 474; Wittink; Krishnamurthi; Reibstein (1989), 118; Wittink; Seetharaman (1999), 272; Melles (2001), 120f.; McCullough (2002b), 20; Vriens (1995), 33; McCullough (2002b), 20. Viele wissenschaftliche Studien weisen dementsprechend eine möglichst gleiche Anzahl der Eigenschaftsausprägungen auf (vgl. Wittink; McLauchlan; Seetharaman (1999), 230). Albers (2000, 365) empfiehlt sogar, dass Eigenschaften immer genau drei Ausprägungen aufweisen sollten. Auch Stallmeier (1993, 146) geht davon aus, dass Eigenschaften mit mehr als 3 Ausprägungen bei der Conjoint-Analyse aus „Gründen der Übersichtlichkeit“ vermieden werden sollten. 1665 Dichotome Eigenschaften haben immer nur zwei Ausprägungen, z.B. ABS ist bei einem Auto „vorhanden“ bzw. „nicht vorhanden“. 1666 Vgl. Wittink (1991), 48. 1664

1667 1668 1669 1670

284

Vgl. Hair; Anderson; Tatham; Black (1998), 407; Melles (2001), 121. Vgl. Wittink; Krishnamurthi; Nutter (1982), 474; Wittink; Krishnamurthi; Reibstein (1989), 118. Vgl. Wittink (1991), 50f.; Wittink; Krishnamurthi; Reibstein (1989), 121; Melles (2001), 121. Vgl. Wittink; Huber; Zandan; Johnson (1992), 10.

rung der Ergebnisse vermuten lässt. Das Design der Präferenzmessung sollte demnach entsprechend der zu befragenden Zielgruppe angepasst werden.1671 Wittink; Huber; Zandan; Johnson (1992, 3, 10) stellen darüber hinaus in einer Untersuchung zum Attributstufeneffekt fest, dass entscheidungsrelevante Eigenschaften weniger stark vom Attributstufeneffekt betroffen sind. Ein Attributstufeneffekt war besonders bei weniger präferenzbeeinflussenden Eigenschaften zu beobachten. „Wichtige“ Eigenschaften sollten demzufolge durch mehr Eigenschaftsausprägungen als „unwichtige“ beschrieben werden.1672 Wittink; McLauchlan; Seetharaman (1999, 228) schlagen auf Basis dieser Ergebnisse eine Anpassung der bestehenden ACA vor, bei der die Zahl der Merkmalsausprägungen entsprechend der individuell empfundenen Wichtigkeit variiert wird.1673 Die Grundlage der Anzahl der Eigenschaftsausprägungen bilden dabei die direkten Wichtigkeitseinschätzungen der Eigenschaften aus der Self-Explicated Methode. Entsprechend der Ergebnisse der ersten Phase könnte die Anzahl der Merkmalsausprägungen innerhalb der folgenden Conjoint-Analyse auf Basis von Paarvergleichen festgelegt werden. Wittink; McLauchlan; Seetharaman (1999, 229) beschreiben deshalb sehr wichtige Eigenschaften1674 mit Hilfe von fünf Ausprägungen, während Eigenschaften, die von dem Befragungsteilnehmer als weniger wichtig1675 eingestuft wurden, lediglich durch die beiden Extrempunkte, d.h. durch zwei Merkmalsausprägungen definiert sind. Das Ergebnis dieser empirischen Studie ist, dass durch die Individualisierung der Anzahl der Merkmalsausprägungen die Prognosevalidität gesteigert werden kann.1676 Die Zahl der Ausprägungen eines Attributs sollte daher anhand der salienten Ausprägungen der Alternativen des Evoked-Sets einer Zielgruppe festgelegt werden. Sie ergibt sich somit aus der zur Einschätzung der Stimuli notwendigen Informationsmenge aus Sicht der Nachfrager. Zudem sollte eine Methode gewährleisten, dass lediglich tatsächlich relevante Merk-

male in die Untersuchung aufgenommen werden, so dass die Auswirkungen von Attributstufeneffekten, die durch psychologische Effekte hervorgerufen werden, gemindert werden.

1671 1672 1673

Vgl. Wittink (1991), 48. Siehe dazu auch Wittink; Krishnamurthi; Reibstein (1989), 120; Wittink; McLauchlan; Seetharaman (1999), 229; Wittink; Seetharaman (1999), 272. Vgl. Wittink; Seetharaman (1999), 272.

1674

Innerhalb der ACA wurde die Wichtigkeit einer Eigenschaft auf einer 4 Punkte Rating-Skala gemessen, bei der mit „4“ sehr wichtige und mit „1“ weniger wichtige Merkmale beschrieben wurden (vgl. Wittink; McLauchlan; Seetharaman (1999), 229). 1675 Dies entspricht einem Rating von „1“. 1676

Zu einem ähnlichen Ergebnis kommen Wittink; Seetharaman (1999), 279f.

285

5.7.3 Benennung der Attributstufen bei Eigenschaften mit metrischen Ausprägungen

Die Art der Benennung von Eigenschaftsausprägungen kann ebenfalls erheblich die Ergebnisse der Präferenzmessung beeinflussen. Dies gilt sowohl für verbal beschriebene als auch für durch Zahlenwerte ausgedrückte Merkmalsausprägungen. Je nach Benennung ist es möglich, dass objektiv identische Entscheidungssituationen von den Befragungsteilnehmern unterschiedlich eingeschätzt werden.1677 Schmidt (1990, 271ff.) weist einen entsprechenden Effekt anhand von absoluten Zahlenwerten und relativen, d.h. in Prozent ausgedrückten Merkmalsausprägungen für das Untersu-

chungsobjekt „Auswahl eines idealen Parteiprogramms“ nach. Im Rahmen einer empirischen Studie wurden zwei Gruppen gebildet und zwei Merkmale jeweils einmal als absoluter Wert bzw. als Prozentzahl ausgedrückt (siehe Tabelle 21). Merkmal Arbeitslosigkeit Staatshaushalt

Inflation Budget öffentlicher Dienst

Merkmalsausprägungen Gruppe 1 Gruppe 2 12%, 9%, 5% 324.000, 243.000, 135.000 ausgeglichener Haushalt, ausgeglichener Haushalt, 15 Mrd. Schulden, 2,25 % des BSP, 30 Mrd. Schulden 4,5 % des BSP 11%, 6%, 2% 5%-ige Steigerung, unverändert, 5%-ige Verringerung

Tabelle 21: Eigenschaften und Ausprägungen in der Studie von Schmidt (1990, 271)

Die Studie ergab in diesem Fall, dass die Befragungsteilnehmer dazu tendieren, absoluten Zahlenwerten einen höheren Einfluss zuzuschreiben als mit Hilfe von Prozentwerten beschriebenen Merkmalsausprägungen. Die unterschiedlichen Formulierungen der Ausprägungen verursachen somit differierende Schätzwerte für die Teilnutzen und damit je nach Benennung unterschiedliche Prognosen bezüglich der Vorteilhaftigkeit verschiedener Alternativen bzw. unterschiedliche Ergebnisse bei der Marktanteilsschätzung.1678 Framing-Effekte sind mit den oben genannten Verzerrungen, die durch die Benennung der

Merkmalsausprägungen hervorgerufen werden, eng verbunden. Framing-Effekte bezeichnen Entscheidungssituationen, bei denen Paare von Objekten allein aufgrund der unterschiedlichen Wortwahl eines identischen Sachverhalts verschiedenartig bewertet werden.1679 Eine Variante der Framing-Effekte ist das Attribut-Framing. Dabei wird eine objektiv identische

1677 1678 1679

286

Vgl. Schmidt (1990), 273. Vgl. Schmidt (1990), 272f. Vgl. Melles (2001), 128; Hartmann (2004), 17. Man unterscheidet das „Risiko-Wahl-Framing“, das „Ziel-Framing“ und das „Attribut-Framing“. Für die Benennung der Eigenschaftsausprägungen ist insbesondere das „Attribut-Framing“ relevant, weshalb im Folgenden lediglich auf diesen Framing-Effekt eingegangen wird (vgl. Melles (2001), 128ff.; Janiszewski; Silk; Cooke (2003), 312).

Information einmal in einem positiven und einmal in einem negativen Frame präsentiert und von den Befragungsteilnehmern eingeschätzt (für Beispiele siehe Tabelle 22). Untersuchungsobjekt

Merkmalsausprägung Negativer Frame

Positiver Frame

Joghurt

0% Fett

100% fettfrei

Kondom

0,001% Fehlerwahrscheinlichkeit

99,999% Erfolgswahrscheinlichkeit

Tabelle 22: Beispiele für Entscheidungssituationen Attribut-Framing

Sind Framing-Effekte zu beobachten, so ist der Entscheidungsträger zwischen den beiden Frames nicht indifferent, obwohl beide identische Situationen beschreiben.1680 Für das Auftreten von Framing-Effekten gibt es verschiedene Erklärungsansätze,1681 dabei wird u.a. vermutet, dass Framing-Effekte insbesondere durch unvollständige Informationen aus Sicht des Entscheidungsträgers verursacht werden. Einen hohen Einfluss auf die Stärke des AttributFraming haben deshalb frühere Erfahrungen mit der jeweiligen Produktgruppe.1682 Ziel bei der Benennung der Merkmalsausprägungen sollte es zusammenfassend sein, einen „natürlichen“ Frame und demnach eine Benennung in der für den Befragungsteilnehmer üblichen

Weise zu bestimmen und in der Präferenzmessung zu nutzen.1683 Auch ungenaue Bezeichnungen der Eigenschaftsausprägungen, wie sie häufig in der Praxis zu beobachten sind, können die Ergebnisse der Präferenzmessung erheblich beeinflussen. Statt unpräzisen Beschreibungen wie „überdurchschnittlicher Preis“ oder „zukunftsorientierte Technologie“1684 sollten konkrete Merkmalsausprägungen genannt werden, die eindeutig in der Wahrnehmung der Befragungsteilnehmer sind.1685 Grundlage dafür ist jedoch eine ausreichend hohe Vertrautheit der Entscheider mit dem jeweiligen Produkt, so dass die konkreten Eigenschaftsmerkmale überhaupt eingeschätzt werden können.1686 Abschließend kann somit festgestellt werden, dass die Eigenschaftsausprägungen aus Sicht der Befragungsteilnehmer verständlich und möglichst eindeutig formuliert werden müssen.1687

1680 1681

Vgl. Helm; Satzinger (1999), 22. Für einen Überblick siehe Melles (2001), 131ff.

1682

Bei Befragungsteilnehmern, die über ausgeprägte Erfahrungen in dem jeweiligen Untersuchungsbereich verfügen und die Produktmerkmale ohne größeren kognitiven Aufwand interpretieren, d.h. die Auswirkungen eines negativen bzw. positiven Frames einschätzen können, ist mit keinen bzw. lediglich geringen Auswirkungen des Attribut-Framing zu rechnen (vgl. Janiszewski; Silk; Cooke (2003), 323; Melles (2001), 132f.). 1683 Vgl. Melles (2001), 186. 1684 1685 1686 1687

Vgl. Perrey (1996), 108. Siehe dazu Kapitel 4.2.5. Vgl. Schmidt (1990), 274. Siehe Kapitel 4.1.8. Vgl. Shocker; Srinivasan (1979b), 14.

287

5.7.4 Bestimmung der Abstände zwischen den Attributstufen bei Eigenschaften mit metrischen Ausprägungen

Bei kontinuierlichen Eigenschaften1688 mit mehr als zwei relevanten Ausprägungen müssen die Abstände zwischen den Eigenschaftsausprägungen festgelegt werden. Die Bestimmung dieser Abstände kann einen erheblichen Einfluss auf die Validität der Präferenzmessung ausüben.1689 Meist werden in der Praxis ohne weitere Begründung gleichmäßige Abstände verwendet.1690 Man findet allerdings häufig auch Studien, in denen eine ungleichmäßige Abstufung der kontinuierlichen Merkmale gewählt wurde.1691 Darmon; Rouziès (1989, 35ff.) untersuchten deshalb die Auswirkungen verschiedener Abstufungen von Eigenschaftsausprägungen auf die Validität der Conjoint-Analyse. Ergebnis dieser Untersuchung ist, dass bei Unkenntnis der zu erwarteten Nutzenfunktion gleich große Abstände zwischen den Merkmalsausprägungen bevorzugt werden sollten. Liegen jedoch Informationen über die aus Sicht der Befragungsteilnehmer relevanten Ausprägungen vor, kann eine Nutzung ungleichmäßiger Abstände die Ergebnisse der Conjoint-Analyse verbessern.1692 Ziel sollte es deshalb sein, die präferenzrelevanten Merkmalsausprägungen aus Sicht der Probanden zu bestimmen, die nicht notwendigerweise gleiche Abstände zwischen den Merkmalsausprägungen aufweisen müssen.

5.7.5 Benennung der Attributstufen bei Eigenschaften mit nicht-metrischen Ausprägungen

Eine sinnvolle Erhebung der Präferenzen und die Ableitung entsprechender produktpolitischer Entscheidungen setzt voraus, dass die Ausprägungen eindeutig beschrieben sind.1693 Bei Produktmerkmalen mit nicht-metrischen Ausprägungen, wie beispielsweise der „Marke“ oder der „Farbe“ können die zu untersuchenden Merkmalsausprägungen nicht ohne weiteres vom Marktforscher selbst festgelegt werden. Weiterhin ist es unmöglich, die Ausprägungen für die

1688 1689 1690 1691 1692 1693

288

Dies betrifft Produktmerkmale wie zum Beispiel „Preis“, „Länge“, „Größe“ usw. Vgl. Darmon; Rouziès (1989), 40. Vgl. Darmon; Rouziès (1989), 35; Huber; Wittink; Johnson (1992), 3f. Siehe dazu beispielsweise Acito; Jain (1980), 107; Agarwal; Green (1991), 142; Currim; Weinberg; Wittink (1981), 70. Vgl. Darmon; Rouziès (1989), 42f. Siehe dazu auch Kapitel 4.2.5. Interpersonelle Unterschiede sind insbesondere bei der Nutzung von BenefitEigenschaften zu erwarten, da diese auf dem jeweiligen Vorwissen bzw. den Erfahrungen der Befragungsteilnehmer beruhen. Für erste Lösungsansätze siehe Kapitel 4.1.8.

Präferenzmessung anhand einer „realen Bandbreite“ bzw. einer „weiteren Bandbreite“ festzulegen.1694 Das Problem der Bestimmung der zu untersuchenden Ausprägungen ergibt sich beispielsweise bei der Eigenschaft „Marke“. Der Marktforscher könnte anhand von Vermutungen über die Vorziehenswürdigkeit verschiedener Marken eine mehr oder weniger „reale“ Bandbreite festlegen. Durch diese Vorgehensweise ist allerdings nicht sichergestellt, dass für alle Entscheidungsträger die gleichen Extrempunkte der Bandbreiten relevant sind. Die Bestimmung einer Bandbreite, die über die derzeit am Markt verfügbaren Ausprägungen hinaus geht, scheint zudem bei der Eigenschaft „Marke“ nicht möglich. Auch die Abstände zwischen den Ausprägungen der Eigenschaft „Marke“ sind nicht ohne weiteres a priori bestimmbar. Lediglich bei dichotomen Eigenschaften steht die Anzahl der Ausprägungen, die Spannweite und oft die Bennennung der Attributstufen von vornherein fest.1695 Vermutlich aufgrund dieser Probleme wird die Bestimmung der nicht-metrischen Merkmalsausprägungen in der Literatur völlig vernachlässigt. Vielmehr werden derzeit die Eigenschaftsausprägungen allein vom Marktforscher festgelegt. Die Ergebnisse der Präferenzmessung sind aus diesem Grund nicht ohne weiteres auf tatsächliche Kaufentscheidungen übertragbar. Die Formulierung der Eigenschaftsausprägungen sollte möglichst der „natürlichen“ Wortwahl der Entscheidungsträger entsprechen, da sonst u.U. mit verzerrenden Effekten, wie beispielsweise Framing-Effekten, gerechnet werden muss.1696 Zudem kann so sichergestellt werden, dass die Entscheidungsträger die zu bewertenden Eigenschaftsausprägungen überhaupt kennen, sie einschätzen können1697 und diese relevant sind. Zusammenfassend ist erkennbar, dass eine Bestimmung der zu untersuchenden Eigenschaftsausprägungen durch den Marktforscher zu verzerrten Schätzergebnissen führen kann. Dies gilt insbesondere, weil keine einheitlichen und systematischen Richtlinien zur Festlegung der Ausprägungen existieren, vielmehr stehen die Empfehlungen der Marktforscher teilweise in Gegensatz zueinander. Letztlich ist die Bestimmung der Merkmalsausprägungen durch den Marktforscher immer problembehaftet, da eine solche Vorgehensweise nicht sicherstellen kann, dass die untersuchten Ausprägungen den Bedürfnissen der Befragungsteilnehmer entsprechen. Dies gilt insbesondere, weil keine einheitlichen und systematischen Richtlinien zur Festlegung der Ausprägungen existieren. Neben den Eigenschaften sollten somit auch die Ausprägungen immer aus 1694 1695 1696 1697

Siehe Kapitel 5.7.1. Vgl. Albrecht (2000), 34. Vgl. Melles (2001), 186. Siehe Kapitel 4.2.5 und 4.2.6.1.

289

Sicht der Kunden festgelegt werden - Ausgangsbasis dafür könnte das Evoked-Set der Be-

fragungsteilnehmer sein.

290

6 Vorschlag einer nachfragerorientierten Vorgehensweise zur Präferenzmessung

Um die Präferenzen von Befragungsteilnehmern erheben zu können, müssen zunächst die aus Sicht der Entscheider einer Zielgruppe relevanten Merkmale und Ausprägungen bestimmt werden. Ergebnis sind Eigenschaftssets, die die Bedürfnisse verschiedener Nachfragergruppen abbilden können und die Bewertungsgrundlage der Präferenzmessung darstellen. Aufgrund der verschiedenen Anforderungen an ein Eigenschaftsset1698 scheint eine stufenweise Methode, analog zu den in Kapitel 5.5 beschriebenen Stufenverfahren sinnvoll. Die zu be-

stimmende Vorgehensweise (siehe Kapitel 6.1) soll aus Sicht der Befragungsteilnehmer so einfach wie möglich gestaltet werden, um viele Entscheider in dieser Phase der Problemdefinition berücksichtigen zu können. Bisher wurden die Probanden vor und während der Präferenzmessung lediglich mit einem, für alle Zielgruppen identischen Eigenschaftsset konfrontiert. Da hier jedoch zielgruppenspezifische Eigenschaftssets bestimmt und untersucht werden sollen, ist es notwendig, die ersten Schritte vor der eigentlichem Präferenzmessung anzupassen - entsprechende Möglichkeiten werden im Kapitel 6.2 präsentiert.

6.1

Vorgehensweise zur Bestimmung der relevanten Eigenschaften und Eigenschaftsausprägungen

Im Folgenden wird eine neue Vorgehensweise zur Bestimmung eines Eigenschaftssets für die Präferenzmessung vorgeschlagen, bei der durch Neukombination und Anpassung verschiedener Methoden versucht wird, ein für die Präferenzmessung geeignetes Attributset zu ermitteln, das den Anforderungen an die zu untersuchenden Eigenschaften und Ausprägungen entspricht. Bei dieser neuartigen Vorgehensweise kann es sich, wie bei allen bisher präsentierten Verfahren auch, lediglich um einen heuristischen Prozess handeln, also um eine vereinfachte Methode, mit deren Hilfe ein möglichst geeignetes, aber nicht das für jeden einzelnen Entscheidungsträger „optimale“ Eigenschaftsset ermittelt werden kann. Grundvoraussetzung für eine erfolgreiche Studie zur Bestimmung des zu untersuchenden

Attributsets ist, dass die hier befragten Entscheidungsträger repräsentativ für die späteren Befragungsteilnehmer und die Zielgruppe des Auftraggebers sind.1699

1698 1699

Siehe Kapitel 4.2. Vgl. Pras (1975), 74; Schubert (1991), 180.

291

Nachdem zunächst die zu befragenden Entscheidungsträger festgelegt wurden, werden in einer ersten Phase die relevanten Produktalternativen, d.h. das Evoked-Set der Probanden und die sie beschreibenden salienten Eigenschaften und Eigenschaftsausprägungen ermittelt. Anhand der erhobenen Daten können Rückschlüsse auf das Vorhandensein unterschiedlicher Bedürfnisse der Entscheider und damit auf verschiedene Zielgruppen gezogen werden. Ist es möglich, unterschiedliche Zielgruppen zu identifizieren, werden die weiteren Schritte entsprechend den unterschiedlichen Anforderungen getrennt durchgeführt. So werden völlig unakzeptable Eigenschaftsausprägungen, die die Ergebnisse der Präferenzmessung verzerren

könnten, vermieden. Anhand der Häufigkeit der genannten Eigenschaften und Ausprägungen ist es möglich, erste Statements, die nur selten genannt wurden, zu eliminieren. In dieser Phase der Untersuchung werden auch die in den weiteren Schritten zu untersuchenden Eigenschaftsausprägungen entsprechend der Häufigkeit der Nennung festgelegt und somit eine einheitliche Bewertungsbasis zur weiteren Einschätzung der Produktmerkmale über alle Be-

fragungsteilnehmer geschaffen. In einem nächsten Schritt dient eine vereinfachte SelfExplicated Methode als Grundlage zur Bestimmung der Relevanz der Attribute auf individueller Ebene. Dabei wird zunächst die Bandbreite der Ausprägungen bestimmt, anhand derer anschließend die Bedeutung der Produktmerkmale bewertet werden kann. Zur Festlegung der Anzahl der zu untersuchenden Eigenschaften können Bewertungsschwellen in den Einschätzungen der Befragungsteilnehmer genutzt werden. Ist bei dem jeweiligen Untersuchungsobjekt mit Cross-Over Interaktionen zu rechnen, die die Ergebnisse der Präferenzmessung verzerren, können diese mittels Trade-off Matrizen bestimmt werden. Durch die Bildung von sog. Super-Attributen1700 besteht die Möglichkeit, vorhandene Interaktionen a priori zu berücksichtigen. Erst nachdem die Anzahl der Eigenschaften und Ausprägungen ermittelt wurde, kann eine Methode zur Messung der Präferenzen ausgewählt werden. Die verschiedenen Verfahren und Varianten unterscheiden sich hinsichtlich der Komplexität des Entscheidungsproblems, das mit ihnen untersucht werden kann, erheblich. In Abbildung 40 wird die vorgeschlagene Methode zur Bestimmung des Eigenschaftssets im Überblick dargestellt und in den nächsten Kapiteln ausführlich beschrieben.

1700

292

Siehe Kapitel 4.1.6.

Informationsbeschaffung

Vorüberlegungen des Marktforschers

Methode zur Bestimmung der entscheidungsrelevanten Eigenschaften und Ausprägungen

Überprüfung der Präferenzunabhängigkeit

Wahl der Methode zur Präferenzmessung Präferenzmessung

Gruppenbildung Aufwärmprozess vor entsprechend der Vorankündigung der Präferenzmessung Bedürfnisse der Befragungsteilnehmer

Analyse auf Zielgruppenebene

Festlegung der Anzahl an Eigenschaften

Bestimmung der Relevanz der Eigenschaften

3. Studie

(4. Studie)

Kapitel 6.1 Vorankündigung des Untersuchungsobjekts

Informationsbeschaffung der Befragungsteilnehmer

Kapitel 6.1.1 Kapitel 6.1.2

Marktforscher

2. Studie

Erhebung der salienten Eigenschaften und Ausprägungen

Gemeinsame Analyse über alle Entscheider

1. Studie

Marktforscher Festlegung des Kaufgrundes (eigene spätere Nutzung vs. Geschenk)

Definition des Untersuchungsobjekts

Direkte Erfassung der typischen Nutzungssituation

Direkte Erfassung der Alternativen im Evoked Set

Liste mit den Häufigkeiten der genannten Eigenschaften

Direkte Erfassung der salienten Eigenschaften sowie deren Ausprägungen

Prüfung der Daten auf Redundanz

Gruppierung der Ausprägungen metrischer Eigenschaften

Streichen von selten genannten Eigenschaften

(nur wenn keine „typischen“ Ausprägungen vorliegen)

Zusammenfassung der redundanten Daten

Kapitel 6.1.2.1

Streichen von selten genannten Ausprägungen

Kapitel 6.1.2.2 Kapitel 6.1.2.3

Gruppenbildung bei sehr unterschiedlichen Nutzungssituationen bzw. verschiedenen Alternativen im Evoked Set, d.h. bei Auftreten unterschiedliche Zielgruppen

Vorstudie zur Festlegung Kapitel 6.1.2.4 der zu untersuchen Ergebnis: den EigenKapitel 6.1.2.5 Liste mit potentiell relevanten Eigenschaften und deren Ausprägungen als einheitliche Bewertungsgrundlage für schaften und alle Befragungsteilnehmer einer Zielgruppe deren Ausprägungen Kapitel 6.1.3 Selbstselektion eines zielgruppenspezifischen Eigenschaftssets durch die Entscheider

Auf Zielgruppenebene: Festlegung der im weiteren Verlauf der Präferenzmessung zu untersuchenden Eigenschaftsausprägungen anhand der Häufigkeit der Nennung

Kapitel 6.1.4

Nutzung einer vereinfachten Self-Explicated Methode Einschätzung der Ausprägungen aller Eigenschaften Bestimmung der vom Befragungsteilnehmer bevorzugten Ausprägung je Merkmal

Bestimmung der vom Befragungsteilnehmer am wenigsten bevorzugten Ausprägung je Merkmal

Einschätzung der Relevanz der Eigenschaften

Bestimmung der Bandbreite einer Eigenschaft

(Stichprobe Bildung einer entspricht bezüglich ihrer Rangfolge der Entscheidungsrelevanz Bedürfnisse den später zu je Zielgruppe befragenden Entscheidungsträgern)

Kapitel 6.1.5 Bestimmung der Anzahl der zu untersuchenden Eigenschaften

Kapitel 6.1.6 Überprüfung der (wichtigsten) Eigenschaften auf Präferenzunabhängigkeit der jeweiligen Ausprägungen mittels Trade-Off Matrizen

Bildung von Super-Attributen bzw. Nutzung von Kompromissdesigns bei Cross-Over Interaktionen

Ergebnis: Liste mit der nach Entscheidungsrelevanz geordneten Eigenschaften, die frei von CrossOver Interaktionen sind

Festlegung der Methode zur Präferenzmessung

Kapitel 6.2 Vorankündigung des Untersuchungsobjekts

Informationsbeschaffung der Befragungsteilnehmer

Kapitel 6.2.1

Kapitel 6.2.2 Selbstselektion der Befragungsteilnehmer anhand von zielgruppenspezifischen Eigenschaftssets, „typischen“ Evoked Sets bzw. unterschiedlichen Nutzungssituationen

Warm-up Tasks bezogen auf Eigenschaften und Ausprägungen Vorstellung des Untersuchungsobjekts und des Eigenschaftssets

Erläuterungen zu fehlenden Eigenschaften und Ausprägungen

Erläuterungen zur empirischen Unabhängigkeit von Merkmalsausprägungen

Warm-up Tasks bezogen auf die Methode der Präferenzmessung

Phase der Präferenzmessung Kapitel 6.2.3

Erläuterung der Bewertungsskalen, Warm-up Stimuli

Durchführung der Präferenzmessung

Abbildung 40: Vorschlag einer Methode zur Bestimmung eines Eigenschaftssets 293

Um die Vorteile der bisher kurz vorgestellten Vorgehensweise während der Präferenzmessung nutzen zu können, sollten die ersten Phasen vor der eigentlichen Präferenzmessung stärker gewichtet werden. Dies betrifft z.B. die Phase der Vorankündigung der Befragung; wie bereits beschrieben, sollte das Untersuchungsobjekt den Befragungsteilnehmern vor der Präferenzmessung bekannt gegeben und genügend Zeit zur Verfügung gestellt werden, damit sich die Probanden mit dem Untersuchungsobjekt vertraut machen können. Da in dieser Arbeit davon ausgegangen wird, dass völlig unakzeptable Eigenschaftsausprägungen durch getrennte Untersuchung sehr unterschiedlicher Kundengruppen vermieden werden können, muss vor der eigentlichen Präferenzmessung eine Segmentierung der Befragungsteilnehmer vorgenommen werden. Dies geschieht durch Selbstselektion der Entscheidungsträger je nach bevorzugtem Eigenschaftsset, Evoked-Set oder nach der angestrebten Nutzungssituation. Die Warm-Up Phase ist ein weiterer, oft vernachlässigter Schritt vor der eigentlichen Präferenz-

messung. Obwohl verschiedene Studien zeigen, dass sich eine solche Phase positiv auf die Validität der Messergebnisse auswirken kann, wird häufig auf diesen Schritt verzichtet.1701

6.1.1 Vorankündigung und Informationssammlung der Befragungsteilnehmer

Um entscheidungsrelevante Eigenschaften und Präferenzen der Befragungsteilnehmer überhaupt erheben zu können, ist es nötig, dass diese die für sie akzeptablen Produktalternativen sowie die für sie wichtigen Bewertungsdimensionen kennen.1702 Die Art und Anzahl der als kaufrelevant eingeschätzten Eigenschaften und Ausprägungen sind somit vom Ausmaß der produktbezogenen Kenntnisse des Befragungsteilnehmers abhängig. Fehlt grundlegendes Vorwissen bezüglich des Untersuchungsobjekts, können die Befragungsteilnehmer keine stabilen Präferenzen formulieren.1703 Dies führt dazu, dass u.U. nicht einmal Vorstellungen über mögliche Alternativen oder notwendige Trade-off Entscheidungen existieren, so dass keine stabilen und eindeutigen Präferenzeinschätzungen möglich sind.1704 Im Extremfall könnten Eigenschaften, die zunächst weniger wichtig erscheinen, nach einer intensiven Informationssammlung und -bewertung als determinierende Bewertungsdimensionen eingeschätzt werden.1705

1701 1702 1703 1704 1705

294

Siehe dazu Kapitel 6.2.3. Siehe Kapitel 2.3. Vgl. Reiners (1996), 67. Vgl. Fischer (2001), 35, 39. Vgl. Heitmann, Herrmann (2006), 225f. Siehe auch Kapitel 6.2.1. Vgl. Heitmann, Herrmann (2006), 235. Dies gilt insbesondere für Added-value Merkmale, deren Ausprägungen und Relevanz Entscheider erst nach einer aktiven Informationssuche überhaupt wahrnehmen und bewerten können. Siehe Kapitel 4.1.4.

Insofern kann zu Beginn einer Studie zur Präferenzmessung nicht davon ausgegangen werden, dass die Befragungsteilnehmer ohne weiteres die für sie relevanten Alternativen, Eigenschaften und deren Ausprägungen kennen bzw. verbalisieren können.1706 Vielmehr setzen sich Entscheidungsträger bei vielen Produktgruppen erst kurz vor und während der Wahlentscheidung mit den Alternativen auseinander,1707 d.h. sie durchlaufen den in Kapitel 2.3 beschriebenen Kaufentscheidungsprozess, der die Phasen der Informationssuche und –bewertung umfasst. Ohne dieses spezielle produktspezifische Wissen vor der eigentlichen Präferenzmessung kann die Datenerhebung aus Sicht der Entscheidungsträger kognitiv sehr komplex werden, so dass diese Vereinfachungsstrategien1708 anwenden bzw. die Befragung abbrechen. Die Motivation der Befragungsteilnehmer sinkt deshalb umso stärker, je weniger sie über produktspezifisches Wissen verfügen.1709 Ziel der Vorankündigung des Untersuchungsobjekts ist es somit, die Produktvertrautheit und damit das produktbezogene Wissen sowie die Motivation der Entscheider zu erhöhen.1710 Das Untersuchungsobjekt der Befragung sollte daher den Entscheidungsträgern vor der eigentlichen Befragung bekannt gegeben werden, so dass diese selbst die für sie wichtigen Informationen suchen können.1711 Innerhalb der Phase der Vorankündigung werden den Befragungsteilnehmern ebenfalls grundlegende Begriffe wie „Eigenschaft“ und „Ausprägung“ erläutert. Vor der eigentlichen Präferenzmessung sollte zudem die Entscheidungssituation angekündigt werden. In dieser Phase der Untersuchung gilt ebenfalls, dass nicht alle Entscheider bezüglich des jeweiligen Untersuchungsobjekts gefestigte Präferenzen verfügen, die „gemessen“ werden können. Vielmehr ist damit zu rechnen, dass erst während der Erhebung entsprechende Bewertungsstrategien zur Einschätzung der Alternativen vom Probanden „konstruiert“ werden1712 - dieser Aspekt wird im Kapitel 6.2.1 genauer beschrieben. Die Vorankündigung des Untersuchungsobjekts nimmt in dieser Studie, insbesondere in der Phase der Bestimmung des relevanten Eigenschaftssets, eine zentrale Stellung ein. Die zu untersuchenden Merkmale sowie deren Ausprägungen werden auf Basis der individuellen 1706 1707

Siehe dazu auch Kapitel 2.3. Vgl. Berstell; Nitterhouse (2005), 10; Heitmann, Herrmann (2006), 225f.

1708

Zu typischen Vereinfachungsstrategien gehören Entscheidungsheuristiken, bei denen der Befragungsteilnehmer nur einen Teil der präsentierten Eigenschaften (typischerweise Preis und Marke) und Ausprägungen in die Bewertung einfließen lässt. Trade-off Entscheidungen, auf denen die Präferenzmessung beruht, finden so nicht mehr statt. Die Teilnutzen können in diesen Fällen nicht unverzerrt ermittelt werden. 1709 Vgl. Bettman; Park (1980), 244. 1710

Vgl. Fischer (2001), 35.

1711

Der Zeitraum zwischen Vorankündigung und der Datenerhebung ist vom Untersuchungsobjekt abhängig, d.h. er richtet sich nach dem vermuteten Ausmaß der für einen Entscheider notwendigen Informationssuche und –bewertung. In der folgenden empirischen Studie lag bei den Untersuchungsobjekten „Laptop“ und „Fernseher“ zwischen der Vorankündigung und der ersten Befragung ein Zeitraum von einer Woche. 1712 Vgl. Bettman; Luce; Payne (1998), 187ff.; Heitmann; Herrmann (2006), 225.

295

Evoked-Sets der Befragungsteilnehmer bestimmt. Um ein entsprechendes Evoked-Set aufzustellen, ist eine intensive Informationssuche und –bewertung im Vorfeld der Befragung eine grundlegende Voraussetzung.1713

6.1.2 Angepasste Elicitation Technik

Ziel der zweiten Phase des hier entwickelten Verfahrens ist die Erfassung der relevanten Eigenschaften sowie deren Ausprägungen mit Hilfe einer Methode auf Basis der Elicitation Technik,1714 bei der die Eigenschaften direkt erhoben werden. Dabei werden neben den Pro-

duktmerkmalen auch die Eigenschaftsausprägungen der Alternativen des Evoked-Sets der Entscheider erhoben.1715 Durch diese Vorgehensweise können bei der späteren Präferenzmessung völlig unakzeptable Eigenschaftsausprägungen und unrealistische Alternativen in der Präferenzmessung so weit wie möglich vermieden und zudem die empirische Unabhängigkeit erhöht werden.1716 Zudem wird die Nutzungssituation explizit erhoben, da die Präferenz für eine Alternative sehr stark von der intendierten Nutzung des Produkts abhängt.1717 Diese kann als weiteres Kriterium zu der in Kapitel 6.1.2.4 beschriebenen Gruppenbildung herangezogen werden. In der Abbildung 41 wird die genaue Vorgehensweise zur Ermittlung der für die Befragungsteilnehmer salienten Eigenschaften und Ausprägungen im Überblick dargestellt und im Folgenden genauer beschrieben.

1713 1714 1715

Entsprechendes gilt für die Phase der Präferenzmessung. Siehe dazu Kapitel 6.2.1. Siehe Kapitel 5.2.1.1.

Die Vernachlässigung des Evoked-Sets bei der Präferenzmessung galt bisher als ein gravierendes Problem (vgl. Balderjahn (1993), 285), das durch diese spezielle Art der Bestimmung der Eigenschaften und insbesondere der Ausprägungen vermieden werden kann. Grundvoraussetzung dieser Vorgehensweise ist jedoch (wie bei jeder Studie zur Präferenzmessung), dass die Befragungsteilnehmer eine Teilmenge der jeweils relevanten Zielgruppen darstellen (siehe dazu auch Cattin; Wittink (1982), 52). 1716 Siehe Kapitel 4.2.3.2. Dies lässt sich für die Eigenschaften „Marke“ und „Preis“ an einem Beispiel erläutern. Je nach befragter Zielgruppe sind unterschiedliche Eigenschaften, aber auch Eigenschaftsausprägungen für die letztendliche Kaufentscheidung relevant. Grundlage der konsumentenorientierten Bestimmung des Eigenschaftssets ist es, die Merkmalsausprägungen anhand des Evoked-Sets zu bestimmen. Befragt man eine eher preissensible Zielgruppe, so sind die Merkmalsausprägungen der Eigenschaft „Preis“ eher niedrig, allerdings können durch die Kopplung der Bestimmung der Ausprägungen an das Evoked-Set aber auch nur Ausprägungen für die Eigenschaft „Marke“ genannt werden, die in diesem Preissegment tatsächlich verfügbar und realistisch sind. 1717 Vgl. Voeth (2000), 23.

296

Vorgehensweise bei der angepassten Elicitation Technik

Berechnung der Häufigkeit der Nennung von Eigenschaften

Elicitation Technik: Erhebung der typischen Nutzungssituation, des Evoked-Sets sowie der Eigenschaften und Ausprägungen, durch die sich die Alternativen im Evoked-Set beschreiben lassen und die Einfluss auf die letztendliche Entscheidung haben

Gruppenbildung der Eigenschaften mit inhaltlich identischer Bedeutung

Zusammenfassung von Eigenschaftsausprägungen und Eliminierung von „Ausreißern“

Art der Eigenschaftsausprägungen

metrisch

nicht-metrisch

Berechnung der durchschnittlichen Anzahl der Nennungen einer Eigenschaft

Eliminierung der Eigenschaften, die unterdurchschnittlich häufig genannt wurden

Gruppenbildung bei Eigenschaften, deren Ausprägungen ein metrisches Skalenniveau aufweisen und bei denen keine „typischen“ Ausprägungen zu beobachten sind Erfassung der Bandbreite der Nennungen

Festlegung von gleich großen Intervallen, innerhalb derer die Eigenschaftsausprägungen zusammengefasst werden

Zusammenfassung der Eigenschaftsausprägungen auf individueller Ebene Berechnung des Mittelwerts der genannten Eigenschaftsausprägungen auf individueller Ebene

Berechnung des Mittelwerts der genannten Eigenschaftsausprägungen auf aggregierter Ebene zur Bestimmung der neuen Merkmalsausprägung

Bestimmung der Gruppierung der zu Befragungsuntersuchenden teilnehmer Eigenschafts- entsprechend ihrer ausprägungen Bedürfnisse

Eliminierung von „Ausreißern“ unter den Eigenschaftsausprägungen

Gruppenbildung der Befragungsteilnehmer anhand der genannten Eigenschaften und Ausprägungen

Berechnung der durchschnittlichen Anzahl der Nennung einer Eigenschaftsausprägung

Eliminierung der Eigenschaftsausprägungen, die unterdurchschnittlich häufig genannt wurden

Eigenschaftsset mit den im Folgenden zu untersuchenden Eigenschaften und Ausprägungen für jede Gruppe

Abbildung 41: Vorgehensweise der angepassten Elicitation Technik

6.1.2.1 Zusammenfassung der mehrfach erfassten Eigenschaften

Die genannten Eigenschaften und Ausprägungen müssen in einem ersten Schritt vom Marktforscher auf Redundanz geprüft und inhaltlich identische Merkmale in Gruppen zusammengefasst werden.1718 Problematisch an der in Kapitel 5.2.1.1 beschriebenen traditionellen Elicitation Technik ist, dass die Aussagen der Befragungsteilnehmer nicht in jedem Fall eindeutig interpretiert werden können. Nennt beispielsweise ein Befragungsteilnehmer die Eigenschaft „Lage der Wohnung“ bezüglich des Untersuchungsobjekts „Studentenwohnung“, so ist nicht eindeutig geklärt, welche Assoziationen d.h. Eigenschaftsausprägungen der Proband mit dieser Eigenschaft verbindet. Wie bereits beschrieben, wäre es möglich, dass er mit diesem Attribut eine eher „ruhige Lage“, eine „Lage in der Nähe des Stadtzentrums“, eine „Lage in der Nähe der Universität“ usw. meint. Werden demnach lediglich die Eigenschaften ohne die den Assoziationen zugrunde liegenden Ausprägungen erhoben, können diese Eigenschaften u.U. nicht

1718

Siehe auch Jaccard; Brinberg; Ackerman (1986), 464.

297

eindeutig interpretiert werden, was eine Gruppierung der genannten Statements erschwert bzw. die Ergebnisse verzerren kann. Erfolgt dagegen auch eine Erhebung der relevanten Eigenschaftsausprägungen, ist eine redundanzfreie Gruppierung durch den Marktforscher möglich, da die erfassten Bewertungsdimensionen nicht mehr doppeldeutig sind.1719 Erst durch die explizite Berücksichtigung der Merkmalsausprägungen wird eine Zusammenfassung inhaltlich identischer Statements ermöglicht. Werden beim Untersuchungsobjekt „Studentenwohnung“ zusätzlich zu der Eigenschaft „Lage der Wohnung“ auch die Ausprägungen (wie z.B. „1 km Entfernung von der Uni“, „3 km Entfernung von der Uni“ usw.) erhoben, ist die inhaltliche Interpretation der erfassten Eigenschaften unproblematisch möglich. Erst wenn die inhaltliche Bedeutung der erhobenen Attribute eindeutig ist, können mehrfach erfasste Merkmale gruppiert werden. Wurden beispielsweise beim Untersuchungsobjekt „Laptop“ von den Befragungsteilnehmern die Eigenschaften „Prozessor“, „Taktfrequenz“ und „Prozessorgeschwindigkeit“ jeweils durch Ausprägungen wie „1,2 GHz“, „1,3 GHz“ und „1,6 GHz“ beschrieben, so könnten diese Eigenschaften inhaltlich zu dem neuen Attribut „Prozessorgeschwindigkeit“ 1720 zusammengefasst werden.

6.1.2.2 Berechnung der Häufigkeit der Nennung von Eigenschaften

Nach der inhaltlichen Zusammenfassung der Eigenschaften sowie deren Ausprägungen kann die Häufigkeit der Nennung als Indikator für die Salienz der jeweiligen Produktdimension und deren Ausprägungen verwendet werden. Nur die häufig genannten Eigenschaften bzw. Ausprägungen werden in den weiteren Schritten untersucht. Eine erste Auswahl von Eigenschaften erscheint nötig, da die im Rahmen der Elicitation Technik erfasste Zahl der Eigenschaften meist sehr hoch ist.1721 Eine Möglichkeit für eine erste Selektion von Eigenschaften sowie Ausprägungen ist die Berechnung von „modal relevanten“1722 Eigenschaften, d.h. Eigenschaften, die für die meisten Befragungsteilnehmer relevant sind.1723 In diesem Fall müsste eine Eigenschaftsausprägung und ein Produktmerkmal von mindestens 50% der Befragungsteilnehmer genannt werden, um in die weiteren Untersuchungen aufgenommen zu werden. Bei Nutzung der modal relevanten 1719

Siehe Kapitel 5.2.1.4.

1720

Grundlage zur Beschreibung dieser Eigenschaft könnte die Salienz der Nennungen sein, d.h. es wird die Bezeichnung genutzt, die am häufigsten erhoben wurde. 1721 Siehe dazu z.B. Schubert (1991, 185), der praktische Fälle beschreibt, in denen bis zu 80 verschiedene Eigenschaften identifiziert wurden. 1722 Böhler (1979), 265. 1723

298

Vgl. Böhler (1979), 265; Schweikl (1985), 106.

Eigenschaften würden in diesem Schritt bereits viele Bewertungsdimensionen aus dem Eigenschaftsset entfernt, weshalb diese Art der Selektion im Folgenden nicht genutzt wurde.1724 Weiterhin kann eine „Mindestzahl“ der Nennung von Eigenschaften festgelegt werden. So werden lediglich die Bewertungsdimensionen ausgeschlossen, die relativ selten genannt wurden – beispielsweise könnte vom Marktforscher gefordert werden, dass die Attribute von mindestens 25% der Befragungsteilnehmer genannt werden sollten.1725 Da typischerweise die Gesamtanzahl der genannten Merkmale sehr groß ist und viele Eigenschaften lediglich einmal genannt werden, dient dieser Schritt vor allem der Eliminierung von „Ausreißern“.

6.1.2.3 Gruppierung von metrischen Merkmalsausprägungen

Die Häufigkeit der Nennung von Eigenschaftsausprägungen wird bei der hier vorgeschlagenen Vorgehensweise als Maßzahl für die Salienz der Ausprägungen genutzt. Es werden somit lediglich „typische“ Merkmalsausprägungen weiter betrachtet. Vergleichsweise selten ge-

nannte Ausprägungen werden dagegen aus der Untersuchung ausgeschlossen.1726 Im Gegensatz zu den bisher angewendeten Methoden werden also nicht alle am Markt verfügbaren Ausprägungen berücksichtigt, sondern nur diejenigen, die bei der Entscheidung der Konsumenten einer bestimmten Zielgruppe eine Rolle spielen, d.h. es handelt sich um häufig genannte Ausprägungen des jeweiligen Evoked-Sets der Befragungsteilnehmer. Eine Grundvoraussetzung für die Ermittlung der salienten Ausprägungen entsprechend der Häufigkeit ist die Vergleichbarkeit der Häufigkeitsmaße. Unterschiede ergeben sich dabei zwischen Merkmalen, bei denen „typische“ Eigenschaftsausprägungen existieren und denen, bezüglich derer am Markt sehr viele unterschiedliche Ausprägungen auftreten. Ein Beispiel für Attribute mit „typischen“ Ausprägungen ist die „Marke“ eines Produkts. Bei diesem Merkmal ist damit zu rechnen, dass bei Entscheidern, die ähnliche Bedürfnisse aufweisen, bestimmte Marken mehrfach genannt werden, so dass die Häufigkeit sinnvoll als Maß für die Salienz einer Ausprägung genutzt werden kann. Entsprechendes gilt für Eigenschaften, deren Ausprägungen sich auf einem nicht-metrischen Skalenniveau befinden bzw. die zwar metrisch sind, aber nur in bestimmten Ausprägungen am Markt vorkommen.1727 Bei diesen Attributen genügt die Berechnung der Häufigkeit der Nennung jeder Eigenschaftsausprägung. 1724

Siehe dazu auch Kapitel 7.3.2.

1725

Werden beispielsweise insgesamt 32 Probanden befragt, so könnte gefordert werden, dass jede weiter zu untersuchende Eigenschaft mindestens acht mal genannt wurde. Im Folgenden wird analog zur Eliminierung von Ausreißern eine Mindestzahl an Nennungen festgelegt – Ausprägungen, die seltener genannt wurden, werden nicht weiter berücksichtigt. 1727 Beispiele für metrische Eigenschaftsausprägungen, die nur in bestimmten Formen in der Realität vorkommen, sind der Arbeitsspeicher bei Computern (RAM) oder die Größe einer Festplatte. 1726

299

Bei Produktmerkmalen mit metrischen Ausprägungen kann dagegen nicht ohne weiteres die Häufigkeit der Nennung einer Ausprägung als Maßzahl für die Salienz einer Merkmalsausprägung genutzt werden. Dies gilt insbesondere, wenn es keine „typischen“ Ausprägungen bei einer Eigenschaft gibt; u.U. wird dann jede Ausprägung im Extremfall nur einmal genannt, so dass die Häufigkeit der Nennung nicht zur Bestimmung der salienten Ausprägungen herangezogen werden kann. Eine Festlegung der im Weiteren zu untersuchenden Merkmalsausprägungen erscheint in diesem Fall unmöglich. Deshalb werden diese Eigenschaftsausprägungen zunächst gruppiert – erst danach ist es sinnvoll, die Häufigkeit als Maß für die Salienz einer Ausprägung zu berechnen. Ein Beispiel für eine solche Eigenschaft, bei der möglicherweise keine „typischen“ Ausprägungen existieren, ist der „Preis“. Es gibt Produkte, bei denen es keine „typischen“ Preise gibt. Möglicherweise nennen Befragungsteilnehmer bei diesem Merkmal aber auch unterschiedliche Merkmalsausprägungen, weil diese je nach individuellem Produktwissen in dem jeweiligen Produktbereich die tatsächlichen Ausprägungen im Gedächtnis unterschiedlich kodieren und deshalb beispielsweise bei objektiv gleichen Ausprägungen des Merkmals „Preis“ unterschiedliche Ausprägungen im Gedächtnis gespeichert wurden.1728 Wird demnach bei Eigenschaften mit metrischen Ausprägungen eine Vielzahl von Merkmalsausprägungen erhoben, so müssen diese zunächst zu Gruppen zusammengefasst werden, bevor die Berechnung von Häufigkeiten als Maß für die Salienz von Gruppen ähnlicher Ausprägungen sinnvoll ist. Eine mögliche Vorgehensweise wird im Folgenden vorgeschlagen und an einem Beispiel erläutert. Den Ausgangspunkt der Gruppierung bildet die Bandbreite der erhobenen Ausprägungen einer Eigenschaft. Dieser Bereich wird vom Marktforscher in gleich große Intervalle aufgeteilt und jeweils alle Ausprägungen innerhalb eines Intervalls zu Gruppen zusammengefasst. Dazu werden zunächst die Eigenschaftsausprägungen auf individueller Ebene innerhalb eines Intervalls aggregiert, indem der Mittelwert gebildet wird. Die für alle Befragungsteilnehmer verwendete Merkmalsausprägung (d.h. die Ausprägungsbezeichnung für jede Gruppe) ergibt sich aus der Mittelwertbildung der individuellen Mittelwerte über alle Befragungsteilnehmer. Im Folgenden wird diese Vorgehensweise an einem vereinfachten Beispiel erläutert. Die Grundlage sind die in Tabelle 23 präsentierten Nennungen dreier Befragungsteilnehmer.

1728

300

Vgl. Diller (2000), 147.

Preis

von 5 bis 9,99 1729

von 10 bis 14,99

von 15 bis 19,99

Proband 1

5; 6,80; 7,99

12,49; 13,25

-

Proband 2

7,20

11,99; 12,45; 14,66

15,33; 17,49

Proband 3

-

12,45

16,99; 19,99

Anzahl der Nennungen

4

6

4

Tabelle 23: Einteilung der genannten Eigenschaftsausprägungen in vom Forscher festzulegende Intervalle

Anhand dieser Daten kann auf individueller Ebene ein Mittelwert für die Ausprägungen innerhalb eines Intervalls berechnet werden.1730 Preis

von 5 bis 9,99

von 10 bis 14,99

von 15 bis 19,99

Proband 1

6,601731

12,87

-

Proband 2

7,20

13,03

16,41

Proband 3

-

12,45

18,49

Anzahl der Nennungen

2

3

2

Mittelwert

6,901733

12,78

17,45

1732

über alle Probanden

Tabelle 24: Aggregation der Eigenschaftsausprägungen innerhalb der Intervalle und Festlegung der Eigenschaftsausprägungen

Die individuellen Mittelwerte dienen als Grundlage zur Bestimmung der Mittelwerte über alle Befragungsteilnehmer - es ergeben sich in diesem Beispiel die Ausprägungen 6,90 Euro; 12,78 Euro und 17,45 Euro - die im Folgenden weiter genutzt werden. Auch die Anzahl der Nennungen eines Merkmals muss, um Doppelnennungen eines Befragungsteilnehmers innerhalb eines Intervalls zu vermeiden, neu berechnet werden. Dies ist notwendig, damit die Er-

1729

Die Befragungsteilnehmer wurden gebeten, sämtliche Ausprägungen der Alternativen zu nennen, die sich in ihrem Evoked-Set befinden. In diesem Beispiel schätzt der Proband 1 fünf Alternativen als entscheidungsrelevant ein. Die Preise dieser fünf Produkte werden im Folgenden den entsprechenden Gruppen zugeordnet, d.h. die Preise dreier Alternativen können zu der Gruppe „von 5 bis 9,99“ und zwei Preise der Gruppe „von 10 bis 14,99“ zugeordnet werden. 1730 Grundgedanke dieses Zwischenschritts ist, dass jeder Befragungsteilnehmer einen gleich hohen Einfluss auf die neue Bezeichnung der zu bestimmenden Ausprägung ausüben sollte, d.h. die Aussagen von Proband 1 sollten ein identisches Gewicht wie die von Proband 2 haben. Deshalb werden zunächst auf individueller Ebene die Mittelwerte der Ausprägungen berechnet, die in einem zweiten Schritt die Grundlage zur Bestimmung des Mittelwerts auf Gruppenebene bilden. 1731 Dieser Wert ergibt sich aus dem Mittelwert der einzelnen Eigenschaftsausprägungen innerhalb eines festgelegten Intervalls. In diesem Beispiel (5 + 6,8 + 7,99)/3 = 6,60. 1732 Beispiel: Im Evoked-Set eines Probanden zum Untersuchungsobjekt „Laptop“ könnten sich zwei oder mehr Alternativen des Herstellers „HP“ befinden. Ist die Eigenschaft „Marke“ aus Sicht eines Entscheiders ein salientes Merkmal, wird er die Ausprägungen im Evoked-Set anhand dieser Eigenschaft beschreiben, d.h. er nennt „HP“ 1x als Ausprägung. Um die Vergleichbarkeit der Häufigkeitsberechnungen zwischen Nennungen metrischer und nicht metrischer Eigenschaftsausprägungen zu garantieren, müssen die Häufigkeiten beim Beispiel auch für den „Preis“ so neu berechnet werden, dass eine neu gebildete Ausprägung jeweils nur 1x von einem Befragungsteilnehmer erhoben wird. Siehe Kapitel 7.3.2. 1733 (6,60 + 7,20)/2 = 6,90.

301

gebnisse aus der Gruppierung von Eigenschaften mit metrischen Ausprägungen mit den Nennungen von nicht-metrischen Ausprägungen vergleichbar sind. Ein möglicher Kritikpunkt an der Gruppierung der genannten Eigenschaftsausprägungen ist, dass die zu untersuchenden Intervalle, d.h. die Anzahl der Intervalle sowie die jeweiligen Intervallgrenzen, durch den Marktforscher und nicht durch Konsumentenurteile bestimmt werden. Auf eine Einteilung auf Basis von Einschätzungen der Befragungsteilnehmer wurde allerdings bewusst verzichtet, da dies mit einem erheblichen Mehraufwand für die Probanden verbunden wäre.1734 Nachdem die Häufigkeiten der Merkmalsausprägungen für alle Eigenschaften ermittelt wurden, werden in einem nächsten Schritt die „Ausreißer“ unter den Eigenschaftsausprägungen eliminiert. Wie bereits beschrieben, ist üblicherweise mit einer Vielzahl an Nennungen der Befragungsteilnehmer zu rechnen. Die Eliminierung von Ausreißern soll die weitere Auswertung und insbesondere die Gruppenbildung erleichtern. Eine Möglichkeit, um selten genannte Ausprägungen auszuschließen, besteht darin, eine Mindestschwelle an Nennungen festzulegen, z.B. könnte man fordern, dass mindestens 10% der Befragungsteilnehmer eine Ausprägung genannt haben sollten.

6.1.2.4 Gruppenbildung von Befragungsteilnehmern mit ähnlichen Bedürfnissen

In den vorangegangenen Schritten wurden die Eigenschaften und Ausprägungen, die relativ selten genannt wurden, aus der weiteren Untersuchung ausgeschlossen – Ziel war vor allem die Eliminierung von Ausreißern. Die verbliebenen Daten können nun für eine erste Segmentierung der Befragungsteilnehmer herangezogen werden. Diese Gruppenbildung der Befragungsteilnehmer erfolgt analog zum Grundgedanken der Marktsegmentierung. Dabei teilt ein Hersteller den Markt in möglichst homogene Zielgruppen auf und bietet diesen spezielle Produkte an.1735 Die Grundlage dieser Vorgehensweise ist die Erkenntnis, dass je nach betrachteter Kundengruppe unterschiedliche Eigenschaften und Merkmalsausprägungen entscheidungsrelevant sind. Entsprechend nehmen unterschiedliche Konsumentengruppen verschiedene Produktalternativen (die durch unterschiedliche Eigenschaftsausprägungen beschrieben werden bzw. bei denen verschiedene Merkmale relevant sind) in die engere Kauf1734

Alternativ könnte der Grundgedanke der in Kapitel 5.2.1.4 präsentierten Echo-Technik zur Eliminierung redundanter Merkmale aufgegriffen und in angepasster Form zur Bestimmung von Intervallgrenzen bei metrischen Eigenschaftsausprägungen genutzt werden. Die Anwendung einer entsprechenden Methode würde allerdings bedeuten, dass die Vorstudie um einen Zwischenschritt erweitert werden müsste. Die Bestimmung des Eigenschaftssets sollte aber aus Sicht der Probanden möglichst schnell erfolgen, weshalb auf diese zusätzliche Befragungsstufe verzichtet wurde. Grundvoraussetzung zur Anwendung der Echo-Technik ist zudem, dass lediglich Entscheider einer Zielgruppe befragt werden. In dieser Phase der Vorstudie konnten allerdings noch keine Zielgruppen bestimmt werden - Ziel ist es vielmehr eine Bewertungsbasis zu schaffen, die die Identifizierung von unterschiedlichen Kundengruppen ermöglicht. 1735 Vgl. Böcker; Helm (2003), 23, 30.

302

entscheidung auf. Sie verfügen demnach über unterschiedliche Evoked-Sets.1736 Auch die angestrebte Nutzung des Untersuchungsobjekts kann einen erheblichen Einfluss auf die Präferenzen der Entscheidungsträger ausüben.1737 Sind zwischen den Befragungsteilnehmern unterschiedliche Nutzungssituationen erkennbar, sollten diese entsprechend in die Gruppierung einfließen. Gerade bei Untersuchungsobjekten, die nicht standardisiert angeboten werden1738 bzw. bei denen anhand des Evoked-Sets nicht auf unterschiedliche Zielgruppen geschlossen werden kann,1739 sind die von dem Entscheidungsträger angestrebte Nutzungssituation bzw. die genannten Eigenschaften und Ausprägungen Möglichkeiten, Kundengruppen zu identifizie-

ren. Ziel ist es somit herauszufinden, zu welchem konkreten Zweck das Untersuchungsobjekt eingesetzt wird1740 und welche unterschiedlichen Grundanforderungen bezüglich der Eigenschaften und Ausprägungen an die Produkte gestellt werden, d.h. zusammenfassend welche Eigenschaften und Ausprägungen als relevant erachtet werden. Werden innerhalb einer Studie Entscheider mit unterschiedlichen Präferenzen befragt, so besteht die Gefahr, dass bestimmte Eigenschaften und Ausprägungen für den einzelnen Befragungsteilnehmer bei realen Kaufentscheidungen nicht relevant sind. Zudem können bei differierenden Anforderungen der Entscheidungsträger völlig unakzeptable Eigenschaftsausprägungen die Schätzungen der Conjoint-Analyse verzerren.1741 Im Rahmen von indivi-

dualisierten Präferenzmessmethoden können deshalb vor der eigentlichen Datenerhebung die für den Entscheidungsträger relevanten Eigenschaften und Ausprägungen auf individueller Ebene bestimmt werden. Die Ergebnisse anhand von individuellen Präferenzmessungen1742 zeigen jedoch, dass die individuelle Selektion von Bewertungsdimensionen nicht stabil ist. Stattdessen sind auf aggregierter Ebene stabilere Ergebnisse zu erwarten.1743 Ziel sollte es deshalb sein, vor der eigentlichen Präferenzmessung Gruppen mit möglichst homogenen Wahrnehmungs- und Präferenzstrukturen zu bilden1744 und diese im Anschluss getrennt zu befragen.

1736 1737 1738

Vgl. Böhler (1979), 265. Vgl. Voeth (2000), 23. Dies ist z.B. beim Untersuchungsobjekt „Wohnungen“ der Fall.

1739

Ein Beispiel dafür sind Computer - viele Hersteller decken mit einer Marke verschiedene Marktsegmente ab, so dass von der Marke nicht in jedem Fall auf ein konkretes Produkt geschlossen werden kann. 1740 Vgl. Berstell; Nitterhouse (2005), 9f. 1741 1742 1743 1744

Siehe Kapitel 4.2.4. Für verschiedene Verfahren siehe Kapitel 3.1. Vgl. Huber (1987), 6. Vgl. Schubert (1991), 193.

303

Reale Teilmärkte lassen sich typischerweise durch bestimmte, für diese Zielgruppen relevante Produkte (zielgruppenspezifische Ausprägungsbündel) beschreiben. Dabei können sich die

einzelnen Teilmärkte bezüglich des Evoked-Sets u.U. überschneiden; auch die Nutzungssituation und einzelne Marken können zur Identifizierung von sehr unterschiedlichen Zielgruppen genutzt werden.1745 Eine weitere, hier angewendete Möglichkeit besteht darin, ausgehend von den Bedürfnissen (Nutzungssituation) der Befragungsteilnehmer zunächst ein individuelles Evoked-Set zu erheben und diese Produkte durch den jeweiligen Entscheidungsträger anhand der für ihn relevanten Merkmale und Ausprägungen beschreiben zu lassen. Diese Daten können im Folgenden für eine Gruppenbildung der Befragungsteilnehmer genutzt werden. Durch eine solche Segmentierung können völlig unakzeptable Eigenschaftsausprägungen weitgehend vermieden werden. Die Gruppenbildung kann beispielsweise mit Hilfe der Two-Step Clusteranalyse erfolgen.1746 Diese Art der Clusteranalyse wurde speziell zur Bestimmung von Kundengruppen entwickelt und ermöglicht die simultane Untersuchung von kategorialen und metrischen Variablen.1747 Die Clusterung der Entscheidungsträger erfolgt hierbei in zwei Schritten; zunächst werden die Probanden in einer „pre-cluster“ Phase zu verschiedenen, kleineren Gruppen innerhalb einer Baumstruktur (CF-Tree) entsprechend ihrer Ähnlichkeit1748 zusammengefasst. In einem zweiten Schritt werden diese Gruppen mit Hilfe einer agglomerativen hierarchischen Clusteranalyse zusammengefasst, die jedoch im Gegensatz zu anderen Verfahren der Clusteranalyse auf einer Log-Likelihood-Funktion (d.h. einer logarithmierten Classification Likelihood Funktion) beruht.1749 Analog zu den „klassischen“ agglomerativen hierarchischen Verfahren werden jeweils die beiden Gruppen vereinigt, deren Distanz zueinander am kleinsten ist.1750 Eine weitere Besonderheit dieser Variante der Clusteranalyse ist, dass die Anzahl der Kundengruppen nicht durch den Marktforscher, sondern durch Kombination verschiedener Maße eine „most appropriate“1751 Anzahl an Gruppen bestimmt wird.1752 Die Anzahl der im Folgenden weiter zu untersuchenden Cluster wird ausgehend von dem Bayes Informationskri1745

Vgl. Shocker; Srinivasan (1979b), 9; Böhler (1979), 287.

1746

Da die Antworten der Entscheidungsträger als kategoriale Daten vorliegen (d.h. die Antworten der Entscheidungsträger werden als Dummy-Variablen kodiert; vgl. Chiu; Fang; Chen; Wang et al. (2001), 263), könnten auch andere Arten von Cluster-Analysen auf Basis von Ähnlichkeitsdaten genutzt werden (siehe dazu Backhaus; Erichson; Plinke; Weiber (2003), 482ff.). 1747 Bei den Nennungen von Eigenschaften und Ausprägungen handelt es sich allerdings nur um kategoriale Daten. 1748

Bei Nutzung kontinuierlicher Variablen werden die Mittelwerte und die Varianz zur Berechnung von Ähnlichkeiten herangezogen, bei kategorialen Variablen werden die Häufigkeiten des gemeinsamen Auftretens von Variablen genutzt (vgl. SPSS (2001a), 4; Chiu; Fang; Chen; Wang et al. (2001), 265). 1749 Vgl. Chiu; Fang; Chen; Wang et al. (2001), 264; SPSS (2001a), 3f. Für eine formale Darstellung der Funktion siehe Bacher; Wenzig; Vogler (2004, 4). 1750 Vgl. Bacher; Wenzig; Vogler (2004), 5. 1751 1752

304

Chiu; Fang; Chen; Wang et al. (2001), 266. Vgl. Chiu; Fang; Chen; Wang et al. (2001), 266; SPSS (2001a), 1ff.; SPSS Inc. (2004), 503ff.; SPSS (2002), 1; Bacher; Wenzig; Vogler (2004), 5.

terium (BIC)1753 aus dem ersten Schritt und der Änderung (dem Ausmaß der Verschlechterung) einer Log-Likelihood-Funktion,1754 bei der Zusammenfassung zweier Gruppen aus dem zweiten Schritt ermittelt.1755 Lassen sich anhand der Two-Step Clusteranalyse Gruppen mit unterschiedlichen Anforderungen an die Produktalternativen identifizieren, werden diese im weiteren Vorgehen getrennt betrachtet und ausgewertet.

6.1.2.5 Festlegung der auf Zielgruppenebene weiter zu untersuchenden Eigenschaftsausprägungen und Eigenschaften

Für eine weitere Einschätzung der Produktmerkmale ist, um die Vergleichbarkeit der Ergebnisse zwischen verschiedenen Befragungsteilnehmern zu ermöglichen, eine einheitliche Bewertungsbasis notwendig. Diese kann anhand des Kriteriums „Salienz“ bestimmt werden.

Zur Festlegung der im weiteren Verlauf der Untersuchung zu berücksichtigenden Eigenschaftsausprägungen wird die Häufigkeit der Nennung der Ausprägungen als Maß für die

Salienz genutzt. Zu diesem Zweck kann der Mittelwert der Anzahl der Nennungen von Merkmalsausprägungen genutzt werden, um unterdurchschnittlich häufig genannte Ausprägungen zu streichen.1756 Nach der Eliminierung aller unterdurchschnittlich häufig genannten Ausprägungen besteht die Möglichkeit, dass bei einigen Merkmalen lediglich eine Ausprägung verblieben ist. Die Teilnutzen der Eigenschaften, die durch eine Ausprägung beschrieben werden, können im Rahmen der Conjoint-Analyse nicht geschätzt werden.1757 Dennoch können jene Eigenschaften und deren Ausprägung nicht ohne weiteres weggelassen werden, da die Befragungsteilnehmer sie offensichtlich in den Kaufentscheidungsprozess einbezogen haben. Diese Attribute mit der jeweils verbliebenen Ausprägung werden deshalb innerhalb der „Warm-Up Phase“ vor der

1753

Vgl. Chiu; Fang; Chen; Wang et al. (2001), 266. Dieses Maß dient als Ausgangspunkt zur Bestimmung der Anzahl von Gruppen und wird im ersten Schritt der Two-Step Clusteranalyse berechnet. Für eine formale Darstellung siehe Bacher; Wenzig; Vogler (2004, 5). 1754 Die Distanz zwischen zwei Gruppen wird bei der Two-Step Clusteranalyse durch eine Log-Likelihood Funktion beschrieben. Eine Anwendungsvoraussetzung dieser Funktion ist, dass die Eigenschaften unabhängig voneinander sind (vgl. Chiu; Fang; Chen; Wang et al. (2001), 263ff.; SPSS (2001a), 5). 1755 Für eine ausführliche Beschreibung der Vorgehensweise siehe Bacher; Wenzig; Vogler (2004), 5; SPSS (2001b). 1756

In einem ersten Schritt wird dabei die mittlere Anzahl der Nennungen einer Ausprägung berechnet - Ergebnis könnte beispielsweise sein, dass im Durchschnitt jede Ausprägung 9,79 mal genannt wurde. Dies bedeutet, dass sämtliche Ausprägungen, die neun mal und weniger häufig erfasst wurden, gestrichen werden. Eine solche Eliminierung hat u.U. zur Folge, dass bei einer Eigenschaft lediglich eine Merkmalsausprägung im Eigenschaftsset verbleibt. 1757 Vgl. Srinivasan; Park (1997), 287. Auch bei allen anderen Methoden zur Präferenzmessung können Merkmale, die nur eine saliente Ausprägung aufweisen, nicht sinnvoll untersucht werden, da diese Attribute keine Unterscheidungskraft besitzen.

305

Präferenzmessung als Grundanforderung1758 des jeweils zu untersuchenden Produkts genutzt. Ergebnis bis zu diesem Schritt ist eine Liste mit salienten Eigenschaften sowie deren salien-

ten Ausprägungen. Da die nun vorliegende Liste weiterhin sehr umfangreich sein kann, wird im nächsten Schritt die Relevanz der Eigenschaften bestimmt.

6.1.3 Selbstselektion zielgruppenspezifischer Eigenschaftssets durch die Befragungsteilnehmer

Im folgenden Schritt (siehe Kapitel 6.1.4) soll die Relevanz der bisher erhobenen Eigenschaften bestimmt werden. Bevor eine Bewertung der Merkmale auf Basis der Ausprägungen durch die Befragungsteilnehmer erfolgen kann, muss berücksichtigt werden, dass Befragungsteilnehmer verschiedener Zielgruppen unterschiedliche Eigenschaften und insbesondere andere Ausprägungen bei der Einschätzung von realen Produktwahlentscheidungen nutzen. Vor jeder Art von Bewertung durch Entscheidungsträger sollte deshalb sichergestellt werden, dass der jeweilige Proband die Eigenschaften, Ausprägungen oder Alternativen überhaupt beurteilen kann. Stabile Bewertungen von Eigenschaften und Ausprägungen oder Einschätzungen der Präferenzen sind jedoch nur dann zu erwarten, wenn diese Elemente den Anforderungen der Entscheider, d.h. deren Evoked-Set, entsprechen.1759 In dem zweiten Befra-

gungsschritt sollte somit sichergestellt sein, dass die Entscheider jeweils zielgruppenspezifische Eigenschaftssets bewerten. Dies hat zur Folge, dass von den Befragungsteilnehmern nicht alle Eigenschaften und Ausprägungen, sondern lediglich zielgruppenspezifische Eigenschaftssets sinnvoll bewertet werden können. Die in der vorangegangenen Stufe erhobenen, verschiedenen zielgruppenspezifischen Eigenschaftssets werden den Probanden vor der weiteren Bewertung zunächst präsentiert. Die Befragungsteilnehmer entscheiden nun selbst, welches Eigenschaftsset ihren Anforderungen am besten entspricht. Somit werden bei der weiteren Untersuchung Merkmalsausprägungen oder Eigenschaften vermieden, die für eine bestimmte Zielgruppe nicht entscheidungsrelevant oder gar völlig unakzeptabel sind und lediglich die Informationen untersucht, die die Entscheider überhaupt sinnvoll bewerten können.

1758 1759

306

Siehe auch Fischer (2001), 149. Vgl. Klein (2002), 8; Hahn (1997), 5.

6.1.4 Bestimmung der Relevanz der verbliebenen Eigenschaften

Da offene Befragungen meist eine umfangreiche Liste an Eigenschaften zur Folge haben1760 und bisher bezüglich der Eigenschaften lediglich die Ausreißer eliminiert wurden, muss diese Liste in einem zweiten Schritt weiter reduziert werden. Zudem ist nicht davon auszugehen, dass die Häufigkeit der Nennung von Merkmalen bzw. Ausprägungen als alleiniges Kriterium zur Bestimmung der Relevanz eines Merkmals ausreicht.1761 Wie bereits in Kapitel 5.5 dargestellt, wurden bisher zur Einschätzung der Eigenschaften oftmals direkte Bewertungen1762 von Eigenschaften genutzt. Dabei werden meist die Bedeutungsgewichte unter völliger Vernachlässigung der Bandbreite der Eigenschaftsausprägungen der untersuchten Merkmale ermittelt, obwohl gerade diese den Einfluss eines Attributs bei der Wahlentscheidung determinieren.1763 Eine Möglichkeit zur Berücksichtigung der Bandbreite der Merkmale ist die Anwendung einer gewichteten Self-Explicated Methode.1764 Bestimmung der Merkmalsgewichte bei der gewichteten Self-Explicated Methode

Die ursprüngliche Form, d.h. die traditionelle Self-Explicated Methode, entspricht weitgehend der in Kapitel 5.2.2.1 beschriebenen direkten Einschätzung der Bedeutungsgewichte von Attributen und kann deshalb nicht zur Bestimmung der Relevanz eines Merkmals herangezogen werden. Bei der ungewichteten Self-Explicated Methode werden demgegenüber lediglich die einzelnen Eigenschaftsausprägungen, aber nicht die jeweiligen Attribute eingestuft. Es findet somit kein Trade-off der verschiedenen Merkmale statt, so dass mit Hilfe dieser Methode keine Rückschlüsse auf die relevanten Eigenschaften gezogen werden können.1765 Bei der gewichteten Self-Explicated Methode werden schließlich sowohl die jeweiligen Eigenschaftsausprägungen als auch die Einflussstärken der Produktmerkmale berücksichtigt, was die Ermittlung von entscheidungsrelevanten Eigenschaften ermöglicht.1766 Eine Bewertung mittels der Conjunctive Compensatory Self-Explicated Methode erscheint nicht notwendig, da

1760 1761 1762 1763

Griffin; Hauser (1993, 4) gehen z.B. davon aus, dass es nicht ungewöhnlich ist, 200-400 unterschiedliche Bedürfnisse mit Hilfe einer offenen Befragung von Konsumenten zu erheben. Vgl. Griffin; Hauser (1993), 23. Siehe Kapitel 5.2.2.1. Siehe Kapitel 3.8, 4, 4.2.6 und 5.2.2.1 und vgl. Hensel-Börner (2000), 15.

1764

Srinivasan (1988, 304) zeigt in seiner Studie, dass die gewichtete Self-Explicated Methode besser als einfache Wichtigkeitseinstufungen zur Bewertung der Wichtigkeit geeignet ist. Letztendlich könnte zur Bestimmung der Bedeutungsgewichte der Eigenschaften auch ein Swing-Verfahren genutzt werden (vgl. u.a. Klein; Scholl (2004), 355f.; Eisenführ; Weber (2003), 129ff.), wobei die jeweils am wenigsten und am meisten bevorzugte Ausprägung analog zur gewichteten Self-Explicated Methode bestimmt werden könnten. 1765 Grundvoraussetzung für die Anwendbarkeit der ungewichteten Self-Explicated Methode ist, dass die Eigenschaften alle einen identischen Einfluss auf die Präferenz der Entscheidungsträger ausüben, wovon jedoch im Regelfall nicht ausgegangen werden kann (vgl. Green; Krieger; Agarwal (1993), 373; Hensel-Börner (2000), 16). 1766 Vgl. Hensel-Börner (2000), 15f.

307

bereits in einem ersten Schritt die für die jeweils befragte Zielgruppe akzeptablen Eigenschaftsausprägungen ermittelt wurden. Der allgemeine Ablauf bei der Verwendung der gewichteten Self-Explicated Methode wird in der folgenden Abbildung 42 dargestellt. 1. Präsentation aller Eigenschaften und deren Ausprägungen

2. Bewertung der Eigenschaftsausprägungen

3. Einschätzung der Produktmerkmale

2.1 Bestimmung der am meisten bevorzugten Ausprägung (diese Ausprägung erhält 10 Punkte)

3.1 Bestimmung der einflussreichsten Eigenschaft (diese erhält 10 Punkte)

2.2 Bestimmung der am wenigsten bevorzugten Ausprägung (diese Ausprägung erhält 0 Punkte)

3.2 Einordnung der restlichen Eigenschaften auf einer Skala von 1 bis 9 )

4. Aggregation der Daten und Bestimmung der relevantenAttribute

2.3 Einordnung der restlichen Ausprägungen auf einer Skala von 1 bis 9 )

Abbildung 42: Vorgehensweise bei der gewichteten Self-Explicated Methode

Nachdem sich der Befragungsteilnehmer in einem ersten Schritt mit sämtlichen Eigenschaften und deren Ausprägungen vertraut gemacht hat, wird er in einem nächsten Schritt gebeten, jeweils die Merkmalsausprägungen einer Eigenschaft direkt einzuschätzen. Durch die Nutzung einer Ankerpunktmethode kann die Bewertung der Ausprägungen erleichtert werden. Der Entscheidungsträger wird dabei zunächst aufgefordert, die am meisten bevorzugte und danach die am wenigsten bevorzugte Ausprägung eines Attributs auszuwählen - diese erhalten 10 bzw. 0 Punkte1767 und bilden die Bandbreite der Einschätzungen bezüglich eines Produktmerkmals. Danach können die verbliebenen Merkmalsausprägungen zwischen den beiden Extrempunkten auf einer Skala von „1“ bis „9“ eingeordnet werden.1768 Nachdem die Ausprägungen sämtlicher Attribute bewertet wurden, kann in einem dritten Schritt der Entscheidungsträger die Relevanz der Eigenschaften anhand der von ihm definierten Bandbreite bestimmen.1769 Die Einschätzung der Produktmerkmale beruht folglich nicht auf einer von den Ausprägungen losgelösten Bewertung, sondern erfolgt explizit auf deren Basis. Auch in diesem Schritt kann durch die Nutzung eines „Ankers“ die Einschätzung der Eigenschaften erleichtert werden. Dabei wird empfohlen, ein „critical attribute“1770 zu definieren, bei dem die Verbesserung von der am wenigsten präferierten zu der am meisten bevorzugten Ausprägung für den Antwortenden am wertvollsten ist. Dieses Merkmal erhält von dem Entscheidungsträger den höchstmöglichen Punktwert (10 Punkte) und dient bei der 1767 1768 1769 1770

308

Siehe auch Srinivasan (1988), 297; Huber (1974), 1398. Vgl. Hensel-Börner (2000), 191. Vgl. Hensel-Börner (2000), 16. Srinivasan (1988), 296.

Bewertung der restlichen Eigenschaften als Anker.1771 Ziel einer solchen Vorgehensweise ist es, die Aufgabe für den Probanden sowohl einfacher als auch verständlicher zu gestalten und damit die Wahrscheinlichkeit, dass die einzelnen Eigenschaften tatsächlich auf einer RatioSkala erhoben werden, zu erhöhen.1772 Anhand der ermittelten Werte kann der Gesamtnutzen für verschiedene Produktalternativen berechnet,1773 aber ebenso die Relevanz der Eigenschaften bestimmt werden.1774 Vorschlag zur Bestimmung der Relevanz von Eigenschaften

Um Aussagen über die Entscheidungsrelevanz von Eigenschaften treffen zu können, ist jedoch Schritt 2.3 (siehe Abbildung 42) nicht notwendig. Die Relevanz eines Merkmals ergibt sich lediglich aus den beiden Extrempunkten der Merkmalsausprägungen. Weil die Bestimmung des Eigenschaftssets auf einer möglichst einfachen und schnell durchführbaren Vorgehensweise beruhen soll, wird deshalb auf diesen Schritt verzichtet, d.h. ein Befragungsteilnehmer bestimmt jeweils lediglich die Bandbreite der Ausprägungen eines Merkmals. Im nächsten Schritt kann nun die Relevanz der untersuchten Eigenschaften auf Basis der individuellen Bandbreiten eingeschätzt werden (3. Schritt). Dabei wird im Gegensatz zu der oben beschriebenen Vorgehensweise bei der Einschätzung der Eigenschaften ein zweiter Anker genutzt. Die restlichen Produktmerkmale werden von den Befragungsteilnehmern zwischen den beiden Ankerpunkten eingeordnet.1775 2. Bewertung der Eigenschaftsausprägungen

1. Präsentation aller Eigenschaften und deren Ausprägungen

3. Einschätzung der Produktmerkmale

2.1

Bestimmung der am meisten bevorzugten Ausprägung

3.1 Bestimmung der wichtigsten Eigenschaft (diese erhält 100 Punkte)

2.2

Bestimmung der am wenigsten bevorzugten Ausprägung

3.2 Bestimmung der als am wenigsten wichtig eingestuften Eigenschaft (diese erhält 0 Punkte)

4. Aggregation der Daten und Bestimmung der relevantenAttribute

3.3 Einordnung der restlichen Eigenschaften auf einer Skala von 1 bis 99 )

Abbildung 43: Vereinfachte und angepasste Form der gewichteten Self-Explicated Methode zur Bestimmung der Relevanz von Eigenschaften

1771 1772

Vgl. Srinivasan (1988), 296; Hensel-Börner (2000), 192. Vgl. Srinivasan (1988), 296.

1773

Dabei wird ein additives Nutzenmodell unterstellt. Der Gesamtnutzen einer Alternative berechnet sich aus der Summe der Bewertungen für die jeweiligen Ausprägungen multipliziert mit dem entsprechenden Bedeutungsgewicht der Eigenschaft (vgl. Hensel-Börner (2000), 14). 1774 Die Relevanz der Merkmale wird im dritten Schritt direkt von einem Entscheidungsträger bestimmt. 1775

Durch Anwendung einer solchen Skala mit zwei Ankerpunkten soll vermeiden werden, dass die Befragungsteilnehmer sämtliche Eigenschaften als wichtig einstufen (vgl. Lürssen (1989), 176). Siehe auch Louviere (1988b), 56f.

309

Die auf individueller Ebene erhobenen Daten können durch Mittelwertbildung innerhalb der jeweiligen Zielgruppe aggregiert und anhand dieser Ergebnisse eine Rangfolge entsprechend der Relevanz der Produktmerkmale aufgestellt werden.

6.1.5 Bestimmung der Anzahl der zu untersuchenden Eigenschaften

Das Ergebnis des vorangegangenen Kapitels ist eine Liste mit der Einflussstärke der verschiedenen Bewertungsdimensionen. In einem nächsten Schritt muss die Anzahl der zu untersuchenden Eigenschaften festgelegt werden. Diese sollte sich nach dem Umfang der von den Entscheidungsträgern benötigten Informationen richten. Die Bestimmung der Anzahl der zu untersuchenden Eigenschaften ist generell ein mit Problemen verbundener Schritt bei der Festlegung eines Eigenschaftssets.1776 Da bisher die Zahl der zu untersuchenden Eigenschaften anhand von verfahrensspezifischen Restriktionen der jeweils eingesetzten Methode zur Präferenzmessung1777 festgelegt wurde, gibt es derzeit keine von den Verfahren der Präferenzmessung losgelöste Möglichkeit zur Bestimmung der Größe des Attributsets. Vorschlag zur Festlegung der Eigenschaftsanzahl

Den Ausgangspunkt für die Festlegung der Anzahl der zu untersuchenden Produktmerkmale bildet der Mittelwert der Relevanz-Einschätzungen über alle Entscheidungsträger einer Zielgruppe. Eine Möglichkeit zur Ermittlung der Anzahl der Eigenschaften könnte darin bestehen, eine Bewertungsschwelle der Entscheidungsträger zu suchen und lediglich die Eigenschaften in die Präferenzmessung aufzunehmen, die über dieser Schwelle liegen. Diese Vorgehensweise wird anhand eines hypothetischen Beispiels in Abbildung 44 dargestellt.

1776 1777

310

Vgl. Green; Srinivasan 1978, 105. Siehe Kapitel 3.1 und 3.3.

(Mittelwert über alle Befragungsteilnehmer einer Zielgruppe)

Einschätzung der Relevanz der Eigenschaften

100 90

Schwelle in den Einschätzungen der Befragungsteilnehmer

80

Merkmale

Mittelwert

(geordnet nach

der Einschätzungen

den Werten der

für die

Einschätzung)

Relevanz

70

1

60

2 3 4 5 6 7 8 9 10 11 12

50 40 30 20 10 0 1

2

3

4 5 6 7 8 9 Anzahl der Eigenschaften

10

11

12

94,3 88,9 84,8 82,3 80,2 52,3 42,3 38,6 32,5 28,9 23,4 12,4

Abbildung 44: Vorschlag für die Bestimmung der Anzahl der zu untersuchenden Eigenschaften

Eine Schwelle in den Mittelwerten der Einschätzungen ergibt sich hier nach der fünften Eigenschaft. Daher könnten in diesem Beispiel die wichtigsten fünf Eigenschaften innerhalb der anschließenden Präferenzmessung untersucht werden. Ist eine Bewertungsschwelle nicht deutlich erkennbar, so wäre es auch möglich, die Zahl der zu untersuchenden Eigenschaften anhand der Mittelwerte der Relevanzeinschätzungen festzulegen. So könnte man eine Grenze der Relevanzeinschätzungen bei „50“ bzw. einem Punkt in dieser Nähe festlegen, ab der die Eigenschaften nicht mehr berücksichtigt würden. In dem in Abbildung 44 beschriebenen Beispiel würden somit sechs Produktmerkmale in die Präferenzmessung einfließen.

6.1.6 Prüfung der Eigenschaftsausprägungen auf Präferenzunabhängigkeit

Ist mit Cross-Over Interaktionen zu rechnen, sollten die Eigenschaftsausprägungen auf Präferenzunabhängigkeit geprüft werden.1778 Solche starken Interaktionen zwischen verschiedenen Eigenschaftsausprägungen treten zwar relativ selten auf, ist dies jedoch der Fall, ist es vorteilhaft sie entsprechend zu berücksichtigen.1779 Wie bereits in Kapitel 4.2.3 beschrieben, ist derzeit die a priori Ermittlung potenzieller Interaktionseffekte sehr aufwendig. Darüber hinaus wurde bisher noch nicht die Art der Interaktion, d.h. Cross-Over vs. Non-Cross-Over Interaktionen berücksichtigt und das, obwohl Cross-

1778 1779

Siehe Kapitel 4.2.3.1. Vgl. Huber (1987), 5.

311

Over Interaktionen einen stärkeren Einfluss auf die Ergebnisse der Präferenzmessung ausüben.1780 Zur vereinfachten Bestimmung von Zwei-Wege Interaktionen1781 wird hier die Nutzung von Trade-off Matrizen vorgeschlagen. Trade-off Matrizen wurden ursprünglich als eigenständi-

ge Methode zur Präferenzmessung von Johnson (1974, 121ff.) bzw. Johnson (1976, 353ff.) entwickelt. Bei der Anwendung von Trade-off Matrizen werden jeweils zwei Eigenschaften mit den sie beschreibenden Ausprägungen in einer Tabelle gegenübergestellt. In der folgenden Tabelle 25 wird eine solche Bewertungsaufgabe präsentiert. Hier wurde ein Proband gebeten, Punktwerte von „1“ bis „10“ auf die vorgegebenen Produktalternativen zu verteilen. In diesem Beispiel bevorzugt der Entscheidungsträger eine blaue Jeans; diese erhält von ihm 9 Punkte. Am wenigsten präferiert er eine braune Cord-Hose (3 Punkte). Stoff

Farbe

Jeans

Cord

blau

9

6

braun

6

3

schwarz

8

5

Tabelle 25: Beispiel für eine Trade-off Matrix

Anhand der Bewertungen aller Merkmalskombinationen ist es letztendlich möglich, die Teilnutzen der verschiedenen Ausprägungen zu schätzen.1782 Die erhobenen Daten können aber auch zur Bestimmung von Interaktionseffekten herangezogen werden. Dies ist möglich, da die bisherigen Verfahren zur a priori Ermittlung von Interaktionseffekten identische Informationen erheben.1783 Interaktionen lassen sich durch die Anwendung von Trade-off Matrizen mathematisch und grafisch bestimmen. Dies soll anhand des Beispiels in der folgenden Abbildung 45 verdeutlicht werden, in der untersucht wird, ob die Ausprägungen der Eigenschaft „Farbe“ einen Einfluss auf die Präferenz der Ausprägungen des Merkmals „Stoff“ ausüben.

1780 1781

Siehe Kapitel 4.2.3.

Unter Zwei-Wege Interaktionen versteht man Präferenzabhängigkeiten zwischen den Ausprägungen zweier Eigenschaften. Typischerweise werden lediglich Zwei-Wege Interaktionen untersucht, da die Wahrscheinlichkeit von beispielsweise Drei-, Vier- usw. Wege Interaktionen geringer ist (vgl. Voeth (2000), 208). 1782 Zur Vorgehensweise bei der Berechnung von Teilnutzen mit Hilfe von Trade-off Matrizen siehe Green; Tull (1982, 448ff.). 1783 Für ein Beispiel zur bisher üblichen Bestimmung von Interaktionen siehe Voeth (2000), 207ff.

312

Proband 1: Cross-Over Interaktion Stoff

blau

Farbe braun schwarz

Proband 2: Non-Cross-Over Interaktion Stoff

Proband 3: Keine Interaktion Stoff

Jeans

Cord

Differenz

Jeans

Cord

Differenz

Jeans

Cord

Differenz

10

1

9

blau

9

2

7

blau

9

6

3

1

8

-7

Farbe braun

6

3

3

Farbe braun

6

3

3

2

7

-5

8

6

2

8

5

3

schwarz

schwarz

10

10

10

8

8

8

6

6

6

4

4

4

2

2

2

0

0

blau

braun

schwarz

0

blau

braun

Abbildung 45: Darstellung verschiedener Interaktionsarten

schwarz

blau

braun

Jeans

schwarz

Cord

Cross-Over Interaktionen lassen sich grafisch durch Überschneidungen der beiden Graphen bestimmen (siehe Proband 1). Treten keinerlei Interaktionen auf, sind die Linien zueinander parallel (Proband 3).1784 Bei Non-Cross-Over Interaktionen verlaufen die Graphen nicht parallel, schneiden sich jedoch nicht, d.h. die Präferenzrangfolge der Ausprägungen ändert sich nicht. Mathematisch weist ein Vorzeichenwechsel bei der Differenzbildung zwischen den unabhängigen Variablen (hier entspricht dies den beiden Ausprägungen „Jeans“ und „Cord“ der Eigenschaft „Stoff“) darauf hin, dass eine Cross-Over Interaktion vorliegt. Sind keine Interaktionen vorhanden, weisen die Differenzen jeweils identische Werte auf. In Abbildung 45 wurden die drei möglichen Interaktionsarten durch ein sehr einfaches Beispiel beschrieben. Im Folgenden soll die Vorgehensweise zur Bestimmung von Interaktionen anhand einer Trade-off Matrix mit zwei Merkmalen und jeweils drei Ausprägungen beschrieben werden. Bei der grafischen Darstellung der Vorziehenswürdigkeit der Eigenschaftsausprägungen in Abbildung 46 wird deutlich, dass bei diesem Befragungsteilnehmer die Eigenschaftsausprägung „40 GB“ des Merkmals „Festplattenkapazität“ eine Cross-Over Interaktion bei der Eigenschaftsausprägung „Sony“ des Attributs „Marke“ verursacht. Während der Entscheidungsträger bei den anderen Eigenschaftsausprägungen „60 GB“ und „80 GB“ die Marke „Sony“ jeweils ggü. der Marke „Fujitsu“ bevorzugt, ändert sich diese Präferenzrelation bei der Ausprägung „40 GB“, hier wird die Marke „Fujitsu“ präferiert. Diese Cross-Over Interaktion ist bei einer grafischen Darstellung durch ein Überschneiden des Nutzenverlaufs der Ausprägungen einer Eigenschaft erkennbar.

1784

Vgl. Holbrook; Moore (1981), 110.

313

Differenz

Marke

Festplattenkapazizät

Differenz

40 GB

60 GB

80 GB

40 GB-60 GB

40 GB-80 GB

60 GB-80 GB

Acer

25

30

40

-5

-15

-10

Fujitsu

35

40

50

-5

-15

-10

Sony

30

45

60

-15

-30

-15

Acer-Fujitsu

-10

-10

-10

Acer-Sony

-5

-15

-20

Fujitsu-Sony

+5

-5

-10

Tabelle 26: Beispiel für die Ermittlung von Interaktionen Einfluss der „Marke“ auf die Einschätzung der Ausprägungen der Eigenschaft „Festplattenkapazität“

Einfluss der „Festplattenkapazität“ auf die Einschätzung der Ausprägungen der Eigenschaft „Marke“

70

70

60

60 50

50 40 GB

40

Acer

40

Fujitsu

60 GB 30

80 GB

30

20

20

10

10

0

Sony

0

Acer

Fujitsu

Sony

40 GB

60 GB

80 GB

Abbildung 46: Beispiel für die Ermittlung von Interaktionen

Mathematisch können Cross-Over Interaktionen wie in Abbildung 45 durch eine Änderung

des Vorzeichens bestimmt werden. Dabei werden zunächst paarweise die Differenzen der Einschätzungen gebildet (siehe Tabelle 26). Die Differenzen repräsentieren, wie im bisherigen Beispiel, die Relationen der Eigenschaftsausprägungen zueinander. Die Vorziehenswürdigkeit der Ausprägungen „Acer“ und „Fujitsu“ wird in diesem Beispiel nicht durch das Attribut „Festplattenkapazität“ beeinflusst. In Abbildung 46 verlaufen die Geraden der Ausprägungen „Acer“ und „Fujitsu“ entsprechend parallel. Eine Cross-Over Interaktion verursacht, wie bereits beschrieben, die Eigenschaftsausprägung „40 GB“ bei der Merkmalsausprägung „Sony“. Neben der grafischen Darstellung kann dieser Interaktionseffekt ebenfalls durch Überprüfung der Präferenzrelationen für „Fujitsu-Sony“ bestimmt werden. Während die Differenz bei den Ausprägungen „60 GB“ (-5) und „80 GB“ (-10) negativ ist, wechselt das Vorzeichen bei der Eigenschaftsausprägung „40 GB“ auf „+5“, d.h. es liegt ein Wechsel der Präferenzrelationen vor. Durch die Überprüfung der Präferenzrelationen lassen sich mathematisch sehr schnell und einfach Cross-Over Interaktionseffekte ermitteln. Ein weiterer Vorteil der Anwendung von Trade-off Matrizen zur Bestimmung von Interaktionseffekten besteht darin, dass im Vergleich zu der von Voeth (2000, 207ff.) präsentierten 314

Methodik weniger Einzelurteile notwendig sind (siehe Tabelle 27). Bei der von Voeth (2000, 207ff.) vorgeschlagenen Vorgehensweise erfolgt die Erfassung aller potenzieller Interaktionseffekte einzeln. Werden nur zwei Eigenschaften mit jeweils zwei Ausprägungen untersucht, so ergeben sich acht Fragen, die die Probanden beantworten müssen. Bei zwei Eigenschaften mit je drei Ausprägungen steigt der Untersuchungsaufwand bereits auf 18 notwendige Einschätzungen der Befragungsteilnehmer, während bei der Anwendung von Trade-off Matrizen lediglich neun Bewertungen notwendig sind. je 2 Ausprägungen

je 3 Ausprägungen

Methode von Voeth (2000, 207ff.)

8

18

Trade-off Matrizen

4

9

Tabelle 27: Anzahl der notwendigen Bewertungen zur Überprüfung von Interaktionseffekten bei zwei Eigenschaften

Ein Nachteil von Trade-off Matrizen ergibt sich allerdings aus der Tatsache, dass der Bewertungsaufwand je nach Anzahl der betrachteten Eigenschaften und Ausprägungen stark ansteigen kann. Deshalb ist insbesondere bei der Untersuchung von Eigenschaften mit vielen Ausprägungen damit zu rechnen, dass aufgrund der hohen Anzahl an notwendigen Einschätzungen je Matrix verstärkt inkonsistente Bewertungen zu erwarten sind. Zur Ermittlung von möglichen Cross-Over Interaktionen scheint diese Vorgehensweise dennoch geeignet, da lediglich untersucht werden soll, ob sich die Relationen der Vorziehenswürdigkeit von Eigenschaftsausprägungen bei gleichzeitiger Berücksichtigung anderer Produktmerkmale ändern. Die Bestimmung von Eigenschaftsausprägungen, die Cross-Over Interaktionen hervorrufen, ist bei Attributen, die nur durch zwei Ausprägungen beschrieben werden, nicht ohne weiteres möglich,1785 da in diesen Fällen nicht erkennbar ist, welche Ausprägung den Interaktionseffekt hervorruft. Dieses Problem kann jedoch gelöst werden, indem man die Befragungsteilnehmer vor der Bewertung der Trade-off Matrizen bittet, die jeweiligen Eigenschaftsausprägungen isoliert in eine Präferenzrangfolge zu bringen. Werden bei bestimmten Merkmalskombinationen für die Eigenschaftsausprägungen mehrheitlich Cross-Over Interaktionen beobachtet, so können Superattribute aus den jeweiligen Einzelmerkmalen gebildet werden. Dennoch sollte, wie bereits in Kapitel 4.2.3.1 beschrieben, auf diese zusammengesetzten Produktmerkmale so weit wie möglich verzichtet werden, da bei einer vollständigen Kombination der Merkmalsausprägungen zweier Eigenschaften eine neue Bewertungsdimension mit sehr vielen Ausprägungen entsteht, so dass in der folgenden Präferenzmessung die Zahl der nötigen Bewertungen stark ansteigt.

1785

Dies ist allerdings auch nicht mit Hilfe der von Voeth (2000, 207ff.) beschriebenen Vorgehensweise möglich.

315

Eine weitere Möglichkeit Interaktionseffekte (zumindest im Rahmen von Conjoint-Analysen) zu berücksichtigen, besteht in der Nutzung von Kompromissdesigns.1786 Diese sind insbesondere dann sinnvoll, wenn nur zwischen ganz bestimmten Eigenschaftsausprägungen verschiedener Merkmalskombinationen Cross-Over Interaktionen zu beobachten sind. Es wird deshalb folgende Vorgehensweise vorgeschlagen: 1. Zunächst wird überprüft, ob und in welchem Ausmaß Cross-Over-Interaktionen in einer Trade-off Matrix zu beobachten sind. 2. Für den Fall, dass erhebliche Interaktionseffekte ermittelt wurden, sollte eine Überprüfung erfolgen, ob die Cross-Over Interaktionen zwischen bestimmten Kombinationen von Eigenschaftsausprägungen auftreten (siehe Abbildung 47).1787 Trade-off Matrizen zur Überprüfung von Merkmalskombinationen auf Präferenzunabhängigkeit Bestimmung der Art und des Ausmaßes von Interaktionseffekten je Trade-off Matrix (d.h. je Eigenschaftspaar)

Besteht ein hohes Ausmaß von Cross-Over Interaktionen?

nein

keine Berücksichtigung von Interaktionseffekten

ja

Nutzung von Kompromissdesigns

ja

Treten Cross-Over Interaktionen nur zwischen einzelnen Kombinationen von Eigenschaftsausprägungen auf?

nein

Bildung von Superattributen

Abbildung 47: Vorgehensweise zur Berücksichtigung von Interaktionseffekten

Nachdem die Eigenschaftssets und damit die Anzahl der zu untersuchenden Merkmale und Ausprägungen für alle Zielgruppen bestimmt wurden, kann die Methode zur Präferenzmessung vom Marktforscher festgelegt werden. In dieser Arbeit wird dagegen vorgeschlagen,

ausgehend von der Komplexität1788 und dem Auftreten möglichen Interaktionseffekten eine Präferenzmessmethode auszuwählen, die das Entscheidungsproblem möglichst gut abbilden

1786 1787

Siehe dazu Kapitel 4.2.3.1.

Wie bereits beschrieben, verzerren insbesondere Cross-Over Interaktionen die Ergebnisse der Präferenzmessung, weshalb diese Art der Präferenzabhängigkeit im Mittelpunkt der folgenden Betrachtungen steht. Die Schätzverfahren sind dagegen relativ robust gegen Verzerrungen, die durch Non-Cross-Over Interaktionen hervorgerufen werden. Siehe dazu auch Kapitel 4.2.3.1 und 3.6. 1788 Die Methodenwahl sollte sich immer an der Komplexität des Entscheidungsproblems ausrichten, da fehlende Informationen zu einer verzerrten Schätzung von Präferenzen führen können. Siehe dazu Kapitel 4.2.1 und 3.3.

316

kann.1789 Zur Auswahl eines entsprechenden Verfahrens können die in den Kapiteln 3.1 und 4.2.3.1 präsentierten Methoden genutzt werden, wobei eine systematische Selektion derzeit nur eingeschränkt möglich ist.

6.2

Unmittelbare Schritte vor der Präferenzmessung

Die in den vorangegangenen Kapiteln vorgeschlagene Methode zur Bestimmung von entscheidungsrelevanten Eigenschaften sowie deren Ausprägungen hat direkte Auswirkungen auf die Phasen vor der eigentlichen Präferenzmessung; so müssen u.a. die in der Vorstudie ermittelten Eigenschaftssets der verschiedenen Zielgruppen explizit berücksichtigt werden. Zudem wird im Folgenden auf die oft in Studien zur Präferenzmessung vernachlässigte Warm-Up Phase eingegangen.

6.2.1 Vorankündigung der Untersuchung

Idealerweise sollten im Rahmen der Präferenzmessung Probanden befragt werden, die kurz vor einer realen Kaufentscheidung in der zu untersuchenden Produktgruppe stehen und somit die Phasen einer intensiven Informationssuche und –bewertung bereits durchlaufen haben. Meist ist es aber nicht möglich, Entscheidungsträger, die kurz vor einer tatsächlichen Kaufentscheidung stehen, zu befragen. Dennoch ist es notwendig, dass die Befragungsteilnehmer die Phasen der individuellen Informationssuche und –bewertung durchlaufen haben, da sonst nicht mit Trade-off Entscheidungen, sondern vielmehr mit der Anwendung von vereinfachten Heuristiken bei der Bewertung der Alternativen zu rechnen ist.1790 Die Verfahren zur Präferenzmessung beruhen auf der Anwendung von Trade-off Strategien – ein ausreichendes Vorwissen der Entscheider bezüglich des Untersuchungsobjekts ist daher eine grundlegende Voraussetzung der Präferenzmessung. Die Präferenzbildung ist immer vom individuellen Kenntnisstand, d.h. der Produktvertrautheit und der Sachkenntnis, der jeweiligen Befragungsteilnehmer mit dem Untersuchungsobjekt abhängig.1791 Wenn Entscheidungsträger das Untersuchungsobjekt, das durch verschie-

dene Produktmerkmale und deren Ausprägungen beschrieben wird, nicht einschätzen können, ist nicht mit sinnvollen Antworten der Probanden innerhalb der Präferenzmessung zu rech-

1789

Es handelt sich hierbei um eine Erweiterung zu Helm; Steiner; Scholl; Manthey (2004, 20f.), die die Selektion einer Methode entsprechend der Komplexität eines Bewertungsproblems fordern und Vriens (1995, 31ff.), der sich lediglich auf Interaktions- und Attributstufeneffekte bezieht. 1790 Vgl. Ratneshwar; Shocker; Stewart (1987), 523f. 1791

Vgl. Alba; Hutchinson (1987), 411.

317

nen.1792 Vielmehr müssen die Probanden in diesen Fällen die Präferenzen bzw. Bewertungsstrategien erst während der Befragung „konstruieren“.1793 Die Übertragbarkeit der in diesen Studien bestimmten Teilnutzen auf reale Entscheidungssituationen sollte jedoch hinterfragt werden - dies gilt insbesondere, wenn das Eigenschaftsset vom Marktforscher festgelegt wurde. Die so abgeleiteten Prognosen werden in diesen Fällen eher durch situative Faktoren während der Datenerhebung beeinflusst. Ziel der Vorankündigung des Untersuchungsobjekts vor der eigentlichen Präferenzmessung

ist es deshalb, den zu befragenden Entscheidungsträgern ausreichend Zeit zur Verfügung zu stellen, selbst Informationen zu suchen und diese zu bewerten. Auf diese Weise können die Entscheider ein individuelles Evoked-Set aufstellen und Präferenzen bezüglich dieser Alternativen bilden, die anschließend mit Hilfe der Verfahren zur Präferenzmessung erhoben werden. Die Entscheider sollten folgerichtig nur die Eigenschaften und Ausprägungen einschätzen, die sie überhaupt bewerten können. Eine eigenständige Informationssuche und -bewertung kann für die Entscheidungsträger u.U. mit einem relativ hohen Aufwand verbunden sein. Um die Wahrscheinlichkeit zu erhöhen, dass sich die Probanden vor der Präferenzmessung intensiv mit dem Untersuchungsobjekt auseinandersetzen, könnte es notwendig sein, gezielt Incentives, z.B. finanzielle Anreize, zu nutzen, um die Motivation der Befragungsteilnehmer zu erhöhen. In dieser Studie wurden deshalb lediglich unter den Entscheidungsträgern Geldpreise verlost, die bei allen Gütemaßen ein vom Marktforscher bestimmtes Mindestmaß überschreiten.

6.2.2 Selbstselektion der Befragungsteilnehmer vor der Präferenzmessung

Grundvoraussetzung zur Messung der Präferenzen von Entscheidungsträgern ist, wie beschrieben, dass diese die Phasen der Informationssuche und –bewertung durchlaufen haben. Stabile Präferenzen werden allerdings lediglich bezüglich der Alternativen des Evoked-Sets

herausgebildet.1794 Dies bedeutet, dass bei Vorhandensein verschiedener Zielgruppen je nach Anforderungen andere Eigenschaften und Ausprägungen untersucht werden müssen. Die in der Vorstudie bestimmten Nutzungssituationen und die damit verbundenen Eigenschaften sowie deren Ausprägungen1795 werden deshalb den Befragungsteilnehmern zur Selbstselektion vorgelegt, d.h. ihnen werden verschiedene Eigenschaftssets präsentiert, aus denen sie das

Set auswählen, das ihren Bedürfnissen am Besten entspricht. 1792 1793 1794 1795

318

Vgl. Payne; Bettman; Schkade (1999), 255f.; Reiners (1996), 67f. Vgl. Bettman; Luce; Payne (1998), 188; Heitmann; Herrmann (2006), 226. Siehe Kapitel 2.3. Siehe Kapitel 6.1.3.

6.2.3 Aufwärmprozess vor der Präferenzmessung

Vor jeder Art von Präferenzmessung sollten den Befragungsteilnehmern grundlegende Informationen über die Studie gegeben werden.1796 Innerhalb verschiedener Aufwärmphasen werden die Entscheidungsträger mit der jeweiligen Nutzungs- und Kaufsituation1797 sowie den zu untersuchenden Eigenschaften und Ausprägungen vertraut gemacht.1798 Gleichzeitig wird die Bewertungsaufgabe mit den Bewertungsskalen spezifiziert,1799 bereits die Bewertung anhand von „Testaufgaben“ geübt1800 und den Entscheidungsträger der Zweck der Untersuchung genannt.1801 Ziel dieses Aufwärmprozesses ist es, die Entscheidung realistischer zu gestalten, den Befra-

gungsteilnehmern die Entwicklung eigener Bewertungsstrategien zu erleichtern und so die Motivation der Probanden und letztendlich indirekt die Güte der Präferenzmessung zu stei-

gern.1802 Obwohl die Vorteilhaftigkeit einer solchen Aufwärmphase anhand verschiedener Studien1803 nachgewiesen werden konnte, wird sie bisher kaum genutzt.1804 Anhand einer Meta-Studie von Helm; Steiner (2006, 19) wird beispielsweise deutlich, dass in über 70% der untersuchten Studien keine Möglichkeiten genutzt werden, um die Entscheidungsträger bei der Bewertung der Alternativen innerhalb der Präferenzmessung zu unterstützen. Die Beschreibungen des Eigenschaftssets, der Bewertungsaufgabe und -skalen innerhalb der Aufwärmphase sollen den Befragungsteilnehmern die folgenden Bewertungen erleichtern und müssen deshalb so einfach und direkt wie möglich gestaltet werden. Ferner ist darauf zu achten, dass die Erläuterungen eindeutig sind und keinen Platz für Fehlinterpretationen bieten.1805 Der Umfang der Aufwärmphase sollte sich an den Bedürfnissen der Entscheidungsträger orientieren. Werden die Probanden im Rahmen der Präferenzmessung zu Produkten befragt, zu denen sie sehr ausgeprägte Präferenzen1806 besitzen, so verfügen die Befragungsteilnehmer bereits über gefestigte Entscheidungsstrategien und können die Alternativen relativ leicht bewerten. In diesen Fällen spielt die Aufwärmphase eine geringere Rolle. Die Aufwärmphase ist 1796 1797 1798 1799 1800 1801 1802 1803 1804 1805 1806

Vgl. Louviere (1988b), 55; McCullough (2002b), 21. Siehe Kapitel 6.1.1. Vgl. Reiners (1996), 67; Louviere (1988b), 55; Strebinger; Hoffmann; Schweiger; Otter (2000), 59. Vgl. Jaccard; Brinberg; Ackerman (1986), 464; Louviere (1988b), 55. Vgl. Ofir (2004), 613. Vgl. Louviere (1988b), 55. Vgl. Reiners (1996), 67; Steenkamp; Wittink (1994), 284f.; Jaeger; Hedderley; MacFie (2000), 1221, 1231. Für einen Überblick siehe Huber; Wittink; Fiedler; Miller (1993), 106f. und Jaeger; Hedderley; MacFie (2000), 1221f. Vgl. Jaeger; Hedderley; MacFie (2000), 122. Vgl. Louviere (1988b), 55. Dies ist insbesondere der Fall, wenn Produkte untersucht werden, die die Entscheidungsträger relativ häufig kaufen und sich mit der entsprechenden Produktkategorie sehr gut auskennen (vgl. Jaeger; Hedderley; MacFie (2000), 1231f.).

319

umso wichtiger, je komplexer die Entscheidungen sind. Dies gilt insbesondere bei Produkten, die die Befragungsteilnehmer selten kaufen bzw. bei Alternativen, die durch viele Eigenschaften und Ausprägungen beschrieben werden.1807 Wird die hier präsentierte Vorgehensweise zur Bestimmung eines Eigenschaftssets genutzt, spielt die Aufwärmphase eine tendenziell geringere Rolle, da das Untersuchungsobjekt vor der eigentlichen Präferenzmessung angekündigt wird und die Befragungsteilnehmer so die Möglichkeit haben, selbst Informationen zu suchen und vor der Erhebung ein Evoked-Set zu bilden. Die unterschiedlichen Bedürfnisse der Entscheidungsträger können danach durch die Untersuchung zielgruppenspezifischer Eigenschaftssets berücksichtigt werden. Dies bedeutet, dass die Probanden lediglich Informationen bewerten, die sie in realen Entscheidungssituationen berücksichtigen würden und deshalb sinnvoll einschätzen können. Die Aufwärmphase sollte aber dennoch zur Erleichterung der Bewertungsaufgabe genutzt werden. Vorstellung des Untersuchungsobjekts und des Eigenschaftssets

Die Bekanntgabe des Eigenschaftssets vor der Präferenzmessung erhöht die Wahrscheinlichkeit, dass Trade-off Entscheidungen vorgenommen und nicht-kompensatorische Bewertungsstrategien vermieden werden.1808 Vor der eigentlichen Präferenzmessung ist es deshalb notwendig, die Attribute und Attributstufen in einer Aufwärmphase zumindest zu nennen1809 und ggf. zu erläutern.1810 So wird versucht, eine möglichst einheitliche Wahrnehmung der Bewertungsbasis zu schaffen sowie sicherzustellen, dass sämtliche Merkmale und Ausprägungen in den Einschätzungen berücksichtigt werden.1811 Um den Befragungsteilnehmern die Produktmerkmale zu erläutern, können u.a. einfache verbale Beschreibungen, Präsentationen bzw. Filme1812 oder andere Techniken wie InformationDisplay-Boards verwendet werden, damit sich die Befragungsteilnehmer mit den verschiedenen Eigenschaften und Ausprägungen selbst auseinander setzen.1813 Auch die nacheinander folgende Nutzung verschiedener Verfahren zur Präferenzmessung könnte eine Möglichkeit sein, um die Entscheidungsträger mit den zu untersuchenden Eigenschaften vertraut zu ma-

1807 1808 1809 1810 1811 1812 1813

320

Vgl. Jaeger; Hedderley; MacFie (2000), 1232f. Vgl. Klein; Bither (1987), 254. Vgl. Steenkamp; Wittink (1994), 281; Jaeger; Hedderley; MacFie (2000), 1221; Klein; Bither (1987), 253. Vgl. Payne; Bettman; Schkade (1999), 255f.; Reiners (1996), 67f.; Böcker; Schweikl (1988), 18; Green; Wind (1975), 109. Vgl. Jaeger; Hedderley; MacFie (2000), 1221. Vgl. Reiners (1996), 67f.; Nitschke; Völckner (2006), 745,755. Vgl. Gierl (1987), 460.

chen.1814 In der folgenden Abbildung 48 werden potenzielle Optionen im Überblick dargestellt. Möglichkeiten, die Befragungsteilnehmer mit dem Eigenschaftsset vertraut zu machen Beschreibung der Eigenschaften und Ausprägungen - verbale Beschreibungen - Präsentationen - Filme

Nutzung von anderen Methoden, die das Eigenschaftsset benutzen Information-Display-Boards

Präferenzmessmethoden - z.B. Self-ExplicatedMethoden

Abbildung 48: Möglichkeiten, Befragungsteilnehmer mit dem Eigenschaftsset vertraut zu machen

In der Literatur wird u.a. die Nutzung von zwei oder mehr verschiedenartigen Präferenzmessmethoden zur Verbesserung der Ergebnisse der Untersuchungen diskutiert.1815 Vergleichsstudien zwischen der Full-Profile Conjoint-Analyse und der gewichteten SelfExplicated Methode zeigen, dass oftmals die Methode, die an zweiter Stelle durchgeführt wurde, eine höhere Prognosevalidität aufweist.1816 Huber; Wittink; Fiedler; Miller (1993, 110f.) haben diesen Effekt systematisch innerhalb einer empirischen Studie analysiert und kommen zu dem Ergebnis, dass insbesondere die Prognosevalidität von dekompositionellen Verfahren der Präferenzmessung verbessert werden kann, wenn man vor der eigentlichen

Befragung eine kompositionelle Methode als Warm-Up Task nutzt. Auch andere Verfahren wie die ACA wurden daraufhin untersucht, ob sie als Warm-Up Aufgabe geeignet sind. Dabei stellten Huber; Wittink; Johnson (1992, 5) fest, dass die Nutzung verschiedener Präferenzmessmethoden hintereinander ebenfalls die gewählten Entscheidungsstrategien der Befragungsteilnehmer verändern kann.1817 Eine Verbesserung der Validität der Ergebnisse der Präferenzmessung durch Nutzung mehrerer Präferenzmessmethoden kann auf Lerneffekte der Befragungsteilnehmer zurückgeführt werden. Durch die mehrfache Auseinandersetzung mit den Eigenschaften und Ausprägungen können relativ stabile Entscheidungsstrategien entwickelt werden.1818 Diese Reihenfolgeeffekte können allerdings die Ergebnisse der Präferenzmessung verzerren.1819 Louviere (1988b, 1814 1815 1816

Vgl. Reiners (1996), 68. Vgl. Reiners (1996), 68; Huber; Wittink; Fiedler; Miller (1993), 105ff. Für einen Überblick an Studien siehe Huber; Wittink; Fiedler; Miller (1993), 106f.

1817

In diesem konkreten Fall wurden die Teilnutzen einer CBC mit und ohne ACA als Warm-Up Task miteinander verglichen. Dabei wurde festgestellt, dass sich die Ergebnisse der CBC systematisch ändern, wenn vorher die ACA angewendet wurde (vgl. Huber; Wittink; Johnson (1992), 4f.). Siehe für einen Überblick ebenfalls Albrecht (2000, 185f.). Auch „Produktkonfiguratoren“ könnten zu diesem Zweck genutzt werden; siehe dazu Heitmann, Herrmann (2006, 223ff.). 1818 Vgl. Louviere (1988b), 56; Johnson (1991), 223. 1819

Vgl. Louviere (1988b), 56. Verzerrungen können bei einer zu umgangreichen Aufwärmphase z.B. in Form von Ermüdungserscheinungen der Befragungsteilnehmer bei der eigentlichen Präferenzmessung auftreten (vgl. Huber; Wittink; Johnson (1992), 4).

321

56) bezeichnet dies als noch ungelöstes Problem; weist man beispielsweise die Entscheider darauf hin, dass die ersten Bewertungsaufgaben lediglich zu Übungszwecken dienen, werden die Probanden diese Aufgabe nicht ernst nehmen.1820 Ein solches Problem ergibt sich allerdings nur, wenn die Befragungsteilnehmer noch keine ausgeprägten Präferenzen zu einem bestimmten Untersuchungsobjekt besitzen und diese erst während der Befragung „konstruieren“, d.h. eine Entscheidungsstrategie entwickeln müssen.1821 Ist den Befragungsteilnehmern

das Untersuchungsobjekt bekannt, muss nicht mit entsprechenden Reihenfolgeeffekten gerechnet werden. Insofern ist es nicht verwunderlich, dass in anderen Studien, die ebenfalls kompositionelle und dekompositionelle Präferenzmessverfahren vergleichen nur sehr schwache bzw. keine entsprechenden Reihenfolgeeffekte festgestellt werden konnten.1822 Wie bereits beschrieben, können Warm-Up Tasks, innerhalb derer die Eigenschaften und Ausprägungen vorgestellt werden, die Ergebnisse der Präferenzmessung verbessern. Allerdings existieren bisher keine vergleichenden Studien zur Effektivität der verschiedenen Methoden. Deshalb bleibt es derzeit dem Marktforscher selbst überlassen, wie er den Befragungsteilnehmern die Eigenschaften und Ausprägungen einer Entscheidungssituation vorstellt. In dieser Arbeit wird eine Vorankündigung der Präferenzmessung genutzt, damit sich die Entscheidungsträger selbst mit den für sie relevanten Eigenschaften und Ausprägungen auseinandersetzen können. Zudem wird das Eigenschaftsset vor der Erfassung der Präferenzen verbal beschrieben. Erläuterungen zu fehlenden Eigenschaften und Ausprägungen

Johnson; Levin (1985, 174ff.) stellen in einer Studie fest, dass das Fehlen von zur Bewertung notwendigen Informationen einen Einfluss auf die Einschätzungen der präsentierten Eigenschaften und Ausprägungen hat. So werden aufgrund der vorhandenen Daten von den Ent-

scheidungsträgern Vermutungen über nicht präsentierte Informationen angestellt.1823 Innerhalb der Präferenzmessung können gleichwohl nicht alle potenziell relevanten Eigenschaften einbezogen werden, so dass auch bei Eigenschaftssets, die auf Basis von Kundenbefragungen erstellt wurden, nicht alle für einen einzelnen Entscheider relevanten Eigenschaften untersucht werden. Es ist deshalb sinnvoll, die Entscheidungsträger explizit darauf hinzuweisen, dass sich die Produktalternativen lediglich bezüglich der präsentierten Eigenschaften unterschei-

1820 1821 1822 1823

322

Vgl. Louviere (1988b), 56. Siehe Kapitel 6.1.1. Vgl. Helm; Manthey; Scholl; Steiner (2003), 23ff. und Helm; Steiner; Scholl; Manthey (2004), 15ff. Vgl. Johnson; Levin (1985), 170ff.

den und ansonsten identische und für das Marktsegment übliche Ausprägungen aufweisen.1824 In dieser Untersuchung wird zudem vorgeschlagen, die Eigenschaften, die -

in Schritt 6.1.2 zwar überdurchschnittlich häufig genannt, aber nur durch eine Ausprägung beschrieben wurden, mit dieser Ausprägung und

-

die in Schritt 6.1.5 ausgeschlossenen Eigenschaften mit der von den meisten Probanden bevorzugten Ausprägung in die Warm-Up Phase als Grundanforderungen, d.h. vorhandene Ausprägungen aller Alternativen zu nutzen.

Erläuterungen zur empirischen Unabhängigkeit von Ausprägungen

Im Erhebungsdesign von Studien zur Präferenzmessung können unrealistische Stimuli nicht immer vermieden werden; es treten in der Untersuchung also u.U. Alternativen auf, die so nicht am Markt existieren.1825 In der Aufwärmphase der Präferenzmessung sollten die Befragungsteilnehmer deshalb explizit darauf hingewiesen werden, dass innerhalb der Präferenzmessung Stimuli auftreten können, die so derzeit nicht am Markt erhältlich sind. Die Befragungsteilnehmer sollen diese Alternativen aber in der gleichen Art und Weise einschätzen wie die anderen Produktpräsentationen.1826 Erläuterung der Bewertungsskalen

Vor der Einschätzung der Produktalternativen innerhalb der Conjoint-Analyse bzw. der Bewertung von Eigenschaften und Ausprägungen innerhalb von kompositionellen Präferenzmessmethoden muss sichergestellt werden, dass alle Entscheidungsträger die Bewertungsskalen sowie die Fragestellungen bzw. das Präsentationsformat verstehen und wissen, wie

diese zu interpretieren sind.1827 Steenkamp; Wittink (1994, 285) vermuten beispielsweise, dass ein fehlendes Verständnis der Bewertungsskalen den Attributstufeneffekt1828 hervorrufen könnte und so die Schätzungen verzerrt. Eine Beschreibung der Skalen sowie ein Üben der Bewertungsaufgaben könn-

ten demnach die Ergebnisse der Präferenzmessung verbessern.1829 Die Vorgehensweise entspricht weitgehend der bereits beschriebenen Nutzung von zwei Präferenzmessverfahren. In diesem Fall wird jedoch nicht auf eine andere Methode zurückgegriffen, sondern es werden 1824 1825 1826 1827 1828 1829

Vgl. Elrod; Louviere; Davey (1992), 368f.; Steenkamp; Wittink (1994), 281. Siehe Kapitel 4.2.3.2. Vgl. Orme (2002), 3. Vgl. Jaccard; Brinberg; Ackerman (1986), 464; Jaeger; Hedderley; MacFie (2000), 1221; Louviere (1988b), 56. Siehe Kapitel 5.7.2. Vgl. Steenkamp; Wittink (1994), 285; McCullough (2002b), 21.

323

im Fall der Conjoint-Analyse zu Beginn der Befragung sog. „Warm-Up Stimuli“ präsentiert, die vom Aufbau den Alternativen der folgenden Präferenzmessung entsprechen, aber nicht in die Schätzung der Teilnutzenwerte eingehen.1830 Die Zahl solcher Warm-Up Stimuli sollte sich dabei an der Zahl der später zu untersuchenden Eigenschaften und Ausprägungen orientieren.1831 Zwischenfazit

Im vorangegangenen Kapitel wurde eine Methode zur Bestimmung eines Eigenschaftssets beschrieben, die speziell auf die Anforderungen der Verfahren zur Präferenzmessung abgestimmt ist. Den Ausgangspunkt zur Ermittlung der zu untersuchenden Merkmale und Ausprägungen bildet hier das Evoked-Set der betrachteten Zielgruppen, dabei handelt es sich um die aus Sicht der Befragungsteilnehmer für eine Wahlentscheidung relevanten Eigenschaften und Ausprägungen. Die Beschränkung der Untersuchung auf diese Informationen soll sicherstellen, dass tatsächlich Präferenzen gemessen und nicht erst während der Befragung vom Entscheider „konstruiert“ werden müssen. Zudem bietet die hier vorgeschlagene Vorgehensweise erstmals einen Ansatz, die relevanten Merkmalsausprägungen aus Kundensicht zu erfassen. Der Marktforschereinfluss auf die Ergebnisse der Präferenzmessung kann so minimiert und deshalb erstmals von einer kundenorientierten Präferenzmessung gesprochen werden. Im folgenden Kapitel wird im Rahmen einer empirischen Studie die praktische Anwendbarkeit der neu vorgeschlagenen Methode sowie deren Auswirkungen auf die Ergebnisse der Präferenzmessung untersucht.

1830

Vgl. Steenkamp; Wittink (1994), 281; Louviere (1988b), 56; Jaeger; Hedderley; MacFie (2000), 1221; McCullough (2002b), 21. 1831 Vgl. Louviere (1988b), 56. Elrod; Louviere; Davey (1992, 370) nutzen drei Warm-up Stimuli, wobei eine Alternative für alle Attribute aus den jeweils vermutlich attraktivsten Ausprägungen, eine aus eher mittelmäßigen Ausprägungen und eine aus den jeweils am wenigsten vorziehenswürdigen Ausprägungen besteht.

324

7 Empirischer Teil

In den folgenden Kapiteln wird anhand verschiedener empirischer Studien überprüft, welchen Einfluss das Eigenschaftsset auf die Ergebnisse der Präferenzmessung ausübt. Im Mittelpunkt der Untersuchung steht dabei die Frage, ob durch die in Kapitel 6 präsentierte Vorgehensweise zur Bestimmung eines Eigenschaftssets die Güte der Präferenzmessung und insbesondere die Übertragbarkeit der Schätzergebnisse auf reale Kaufentscheidungen verbessert werden kann.

7.1

Beschreibung der empirischen Studie

Um dies zu überprüfen, werden zunächst auf Basis zweier traditioneller Methoden (Gruppe 1 und 2) und im Anschluss mit der in Kapitel 6 vorgeschlagenen Vorgehensweise (Gruppe 3) Eigenschaftssets bestimmt und Probleme bei der Festlegung der Attribute sowie deren Ausprägungen diskutiert (siehe Kapitel 7.2 und 7.3). In dem zweiten Teil der empirischen Untersuchung werden die Präferenzen der Befragungsteilnehmer mit Hilfe einer Conjoint-Analyse für alle Gruppen erhoben und deren Güte verglichen. Ergebnis der Untersuchung sind Handlungsempfehlungen, welche Vorgehensweise bei der Bestimmung des Eigenschaftssets gewählt werden sollte und welche Auswirkungen dies auf die Übertragbarkeit der Ergebnisse der Präferenzmessung auf reale Kaufentscheidungen hat.

7.1.1 Untersuchungsobjekt

In einem ersten Schritt müssen die Untersuchungsobjekte, die im Rahmen einer empirischen Studie genutzt werden sollen, festgelegt werden. Gegenstand der empirischen Untersuchung können nur Produkte sein, die die Befragungsteilnehmer wahrscheinlich kennen und deshalb davon ausgegangen werden kann, dass die Probanden: -

die für sie relevanten Eigenschaften und Ausprägungen relativ einfach bestimmen und benennen können und

-

die Untersuchungsobjekte überhaupt realistisch einschätzen können.

Weiterhin können nur Produkte berücksichtigt werden, bei denen in realen Kaufsituationen mit der Anwendung von Trade-off Entscheidungsstrategien gerechnet werden kann.1832 Dies ist bei solchen Untersuchungsobjekten tendenziell eher der Fall, mit denen sich die Entschei1832

Siehe dazu Kapitel 2.3.

325

dungsträger vor dem Kauf intensiv beschäftigen, z.B. weil der Kauf mit einem gewissen Risiko verbunden ist und bedeutende Unterschiede zwischen den am Markt verfügbaren Alternativen wahrgenommen werden. Es sollte sich somit um Produkte handeln, bei denen in realen Entscheidungssituationen möglichst der gesamte Kaufentscheidungsprozess von aktiver Informationssuche, -verarbeitung und -bewertung durchlaufen wird. Produkte, bei denen eher mit habitualisierten Kaufentscheidungsprozessen und deshalb mit der Anwendung von Entscheidungsheuristiken bei der Bewertung zu rechnen ist, können nicht mit Hilfe der Verfahren zur Präferenzmessung untersucht werden. Letztlich sollten weiterhin produktspezifische ggü. situationsspezifischen Faktoren die Kaufentscheidung dominieren, d.h. bei der tatsächlichen Produktwahl sollten die Ausprägungen des Produktes die Wahlentscheidung determinieren, während z.B. Elemente wie einkaufsstättenspezifische Faktoren weniger entscheidend sind.1833 Um diesen Anforderungen an ein Untersuchungsobjekt möglichst zu entsprechen, wurden die Testprodukte Laptop und Fernseher ausgewählt. Anhand von Befragungen vor der eigentlichen Bestimmung der Untersuchungsobjekte konnte festgestellt werden, dass ein Großteil der Befragungsteilnehmer (hier: Studenten) Laptops und Fernseher nutzen und daher bereits über eigene Produkterfahrung verfügen. Zudem kann aufgrund der Komplexität der Produkte davon ausgegangen werden, dass nicht nur die Eigenschaften „Preis“ und „Marke“ die Kaufentscheidung determinieren, sondern weitere Merkmale entscheidend sind.

7.1.2 Selektion traditioneller Verfahren zur Bestimmung von Eigenschaftssets

Um die Vorteilhaftigkeit der neu vorgeschlagenen Methode einschätzen zu können, werden, wie bereits beschrieben, die Auswirkungen zweier traditioneller Verfahren zur Bestimmung eines Eigenschaftssets mit den Ergebnissen der neuen Vorgehensweise verglichen. Aus der Vielzahl der in Kapitel 5 vorgestellten Methoden wurden zwei Verfahren ausgewählt, die den Anforderungen an ein Eigenschaftsset so weit wie möglich gerecht werden.1834 Diese Methoden sollten zudem einfach durchzuführen sein, so dass möglichst viele Befragungsteilnehmer berücksichtigt werden können. In dieser Studie wurden deshalb die beiden Methoden: -

Elicitation Technik (Gruppe 1) und

-

Duale Methode (Gruppe 2) selektiert.

1833 1834

326

Siehe dazu Kapitel 2.3. Siehe Kapitel 5.

Die Elicitation Technik erhebt saliente Attribute,1835 während bei der Dualen Methode die Entscheidungsträger gebeten werden, die Eigenschaften direkt entsprechend ihrer Wichtigkeit und Unterscheidungskraft einzuschätzen. Anhand dieser beiden Werte kann eine entsprechende Maßzahl für die Relevanz eines Attributs berechnet werden.1836

7.1.3 Stichprobe

Im Rahmen der hier präsentierten Studie wurden Studenten der Wirtschaftswissenschaftlichen Fakultät der Friedrich-Schiller-Universität Jena befragt. Diese Auswahl soll sicherstellen, dass die verschiedenen Gruppen hinsichtlich der Präferenz und der Produktvertrautheit möglichst gut vergleichbar sind und die Bedürfnisstruktur der in der Vorstudie befragten Konsumenten den Anforderungen der in der Präferenzmessung befragten Personen entspricht. Die Befragungsteilnehmer für die Vorstudie wurden im Rahmen einer Übung im Hauptstudium rekrutiert. Dabei kam ein „within-subject-design“ zum Einsatz. Die Befragungsteilnehmer wurden demnach gebeten, alle drei Methoden zur Bestimmung eines Eigenschaftssets anzuwenden. Abweichungen zwischen den ermittelten Eigenschaftssets können somit allein auf die unterschiedlichen Methoden zur Festlegung der relevanten Eigenschaften und Ausprägungen zurückgeführt werden. Etwaige Lern- und Reihenfolgeeffekte konnten durch die Wahl der Reihenfolge der Nutzung der Methoden minimiert bzw. ausgeschlossen werden.1837 Um mögliche Verzerrungen durch die Beantwortung aller drei Teile der Vorstudie erkennen zu können, wurden bei jeder Methode und bei der neu entwickelten Vorgehensweise ebenfalls in jedem Zwischenschritt zusätzliche Auskunftspersonen befragt und im Anschluss die Ergebnisse dieser Probandengruppen1838 miteinander verglichen. Da zwischen den verschiedenen Gruppen, d.h. zwischen den Befragungsteilnehmern, die an der gesamten Erhebung und denen, die lediglich bei einem Zwischenschritt teilgenommen haben, keinerlei Unterschiede im Antwortverhalten festgestellt wurden, werden diese im Folgenden nicht weiter differenziert betrachtet. Für die Vorstudie ergibt sich folgende Verteilung der Befragungsteilnehmer (siehe Tabelle 28):

1835 1836 1837 1838

Siehe Kapitel 5.2.1.1. Siehe Kapitel 5.2.2.2. Siehe dazu Kapitel 7.1.4. Eine Gruppe setzt sich dabei aus allen Befragungsteilnehmern zusammen, die die Fragebögen aller drei Verfahren ausgefüllt haben, andere Probanden haben dagegen lediglich einen Fragebogen beantwortet.

327

Laptop Elicitation

Fernseher Duale Befragung

Neue Methode

Elicitation

Duale Befragung

Neue 1839 Methode 1. Phase

n= (befragte

41

42

Probanden)

1. Phase

34

2. Phase

52

3. Phase

49

34

2. Phase

41

Gruppe 1 27 Gruppe 2 24

43 3. Phase

Gruppe 1 26 Gruppe 2 23

Tabelle 28: Anzahl der Befragungsteilnehmer in der Vorstudie je nach Gruppe

Im Gegensatz zur Vorstudie wurde im Rahmen der Conjoint-Analyse auf ein sog. „betweensubject-design“ zurückgegriffen. Dies bedeutet, dass jeder Proband lediglich einen Fragebo-

gen beantwortet. Innerhalb jeder Erhebung wurden beide Untersuchungsobjekte (Laptop und Fernseher) abgefragt. Ein „between-subject-design“ wurde gewählt, um die Auskunftsbereitschaft der Befragungsteilnehmer durch einen zu langen Fragebogen nicht zu überfordern,1840

denn die Anzahl der notwendigen Einschätzungen ist innerhalb der Conjoint-Analyse sehr viel höher als in der Vorstudie.1841 Die Entscheidungsträger wurden den jeweiligen Gruppen zufällig zugeordnet. Insgesamt ergibt sich folgende Verteilung auf die einzelnen Fragebögen der Conjoint-Analyse (siehe Tabelle 29):1842 Laptop Elicitation

Fernseher Duale Befragung

Neue Methode

Elicitation

Duale Befragung

Neue Methode Gruppe 1

Gruppe 2

n= (befragte Probanden)

70

65

84

70

65

49

35

68

65

84

69

59

49

35

n= (vollständig ausgefüllt)

Tabelle 29: Anzahl der Befragungsteilnehmer in der Studie zur Präferenzmessung je nach Gruppe

1839

Beim Untersuchungsobjekt „Fernseher“ konnten mit Hilfe der neu entwickelten Methode zwei unterschiedliche Bedürfnisgruppen bestimmt werden. Sämtliche Auswertungen erfolgen danach auf Zielgruppenebene, d.h. die Daten werden getrennt ausgewertet. 1840 Vgl. Agarwal; Green (1991), 145; Ernst (2000), 134; Huber; Wittink; Fiedler; Miller (1993), 110; Sattler (1994), 34; Hensel-Börner (2000), 110. 1841 Siehe dazu auch Kapitel 7.4.1. 1842

328

Anhand Tabelle 29 wird deutlich, dass in allen Gruppen die Anzahl der unvollständig ausgefüllten Fragebögen relativ gering ist. Die selektierten Eigenschaften und Ausprägungen scheinen somit kaum Einfluss auf Abbruchquoten in der Präferenzmessung auszuüben.

7.1.4 Ablauf der Datenerhebung zur Bestimmung der relevanten Eigenschaften und Ausprägungen

In Abbildung 49 wird der Ablauf der Befragung in dieser Studie grafisch dargestellt, dieser wird im Folgenden genauer erläutert. Ablauf der Befragung 1.2. Befragung

Elicitation Technik

Duale Befragung

(freie Nennung von Eigenschaften)

(Einschätzung von Eigenschaften auf einer Liste)

Bestimmung der zu untersuchenden Eigenschaften in der Präferenzmessung

Bestimmung der zu untersuchenden Eigenschaften in der Präferenzmessung

Neue Methode Ankündigung der Befragung

2. Befragung

Nennung der als relevant erachteten Eigenschaften und Ausprägungen Aggregation der Daten durch den Marktforscher

3. Befragung

Vorstudie

Vorankündigung 2. Befragung

1. Befragung

1.1. Befragung

Bewertung der Eigenschaften und Ausprägungen

Präferenzmessung

4. Befragung

Untersuchung der Eigenschaften auf Interaktionen Bestimmung der zu untersuchenden Eigenschaften und Ausprägungen in der Präferenzmessung

Conjoint-Analyse auf Basis der Eigenschaften der

Conjoint-Analyse auf Basis der Eigenschaften der

Conjoint-Analyse auf Basis der Eigenschaften der

Elicitation Technik

Dualen Befragung

neu entwickelten Methode

1. Fragebogen: Laptop

1. Fragebogen: Laptop

1. Fragebogen: Laptop

2. Fragebogen: Fernseher

2. Fragebogen: Fernseher

2. Fragebogen: Fernseher

Abbildung 49: Ablauf der Befragung

Wie bereits beschrieben, wurden die Befragungsteilnehmer während der Vorstudie im Rahmen einer Marketing-Übung befragt. In der ersten Veranstaltung wurden die Studenten gebeten, zunächst den Fragebogen zur Elicitation Technik auszufüllen. Es wurden die Eigenschaften erhoben, die den Befragungsteilnehmern unmittelbar zu den Begriffen „Laptop“ und „Fernseher“ einfielen und zum Zeitpunkt der Erhebung kaufentscheidungsrelevant waren. Nachdem alle Antwortenden die Fragebögen ausgefüllt und zurück gegeben hatten, wurde der Fragebogen zur Dualen Befragung ausgegeben, in dessen Rahmen die Studenten potenziell relevante Eigenschaften, die ihnen vorgegeben wurden, bewertet haben. 329

In der folgenden Veranstaltung, die eine Woche später stattfand, wurde die nächste Befragung (der erste Schritt der neuen Methode) angekündigt – zwischen der Anwendung der traditionellen Verfahren (Elicitation Technik sowie Duale Befragung) und der Erhebung der salienten Eigenschaften und Ausprägungen mit Hilfe der neu vorgeschlagenen Methode lagen somit effektiv zwei Wochen.1843 Die Studenten wurden im Rahmen der Vorankündigung gebeten, bis zur nächsten Veranstaltung aus den am Markt verfügbaren Alternativen die verschiedenen Produkte auszuwählen, die für sie bei einem Produktkauf in die engere Wahl kommen würden (dies entspricht dem Evoked-Set). Lediglich diese Produkte sollten in der zweiten Befragung anhand der aus Sicht der Befragungsteilnehmer relevanten Eigenschaften beschrieben werden. Die Studenten sollten dabei zunächst die relevanten Bewertungsdimensionen und in einem zweiten Schritt die Eigenschaftsausprägungen, die die Alternativen des Evoked-Sets aufweisen, nennen. Die erhobenen Eigenschaften und Ausprägungen wurden im Folgenden gruppiert und besonders selten1844 genannte Eigenschaften sowie deren Ausprägungen eliminiert. Die verbliebenen Eigenschaften und Ausprägungen bilden die Grundlage für den zweiten Teil der Befragung. Anhand der Daten konnten für das Untersuchungsobjekt „Fernseher“ zwei grundsätzliche Zielgruppen1845 (Gruppe 3.1 und 3.2) identifiziert werden, die im Folgenden getrennt untersucht werden. Bei dem Untersuchungsobjekt „Laptop“ ergaben sich keine wesentlich unterschiedlichen Anforderungen zwischen den Befragungsteilnehmern. In der dritten Befragung (Anwendung der angepassten Self-Explicated Methode1846) wurde von den Probanden die Bandbreite der Eigenschaftsausprägungen der in der vorherigen Veranstaltung genannten Merkmale bestimmt und danach die Eigenschaften entsprechend dieser individuellen Bandbreite eingeschätzt. Die Vielzahl der Eigenschaften wurde nun anhand der Relevanzeinschätzungen auf die tatsächlich entscheidungsrelevanten Merkmale reduziert. In der vierten Veranstaltung wurden die relevanten Eigenschaften und Ausprägungen auf Präferenzunabhängigkeit1847 überprüft. Zu diesem Zweck wurden sämtliche Eigenschaften im Rahmen von Trade-off Matrizen miteinander kombiniert und die Ausprägungskombinationen von den Befragungsteilnehmern bewertet. Diese Einschätzungen erlauben eine Analyse von potenziellen Interaktionseffekten, die so schon vor der Präferenzmessung berücksichtigt werden können.

1843 1844 1845 1846 1847

330

So wurde sichergestellt, dass die Entscheidungsträger nicht einfach die Eigenschaften aus dem Fragebogen zur Dualen Befragung nutzen. Siehe zur konkreten Vorgehensweise Kapitel 6.1.2. Siehe Kapitel 7.3.2. Siehe Kapitel 6.1.4. Siehe Kapitel 6.1.6.

7.1.5 Ablauf der Präferenzmessung

Insbesondere bei Methoden, die, wie die Varianten der klassischen Conjoint-Analyse, relativ wenige Eigenschaften berücksichtigen können, spielt die Bestimmung des zu untersuchenden Eigenschaftssets eine bedeutende Rolle. Im empirischen Teil dieser Arbeit soll deshalb eine klassische Variante der Conjoint-Analyse auf Basis von abgestuften Paarvergleichen1848

durchgeführt werden. Analog zur ACA werden dabei die untersuchten Alternativenpaare auf einer 9 Punkte Rating-Skala miteinander verglichen.1849 Anhand der drei Vorstudien (Elicitation, Duale Befragung und neue Methode) wurden für jedes Untersuchungsobjekt je drei Eigenschaftssets1850 bestimmt, deren Eignung im Rahmen einer Studie zur Präferenzmessung genauer untersucht wurde. Die Präferenzen wurden daher in drei Studien auf Basis einer „klassischen“ ConjointAnalyse mit abgestuften Paarvergleichen erhoben. Die Befragung erfolgte zu Beginn ver-

schiedener Vorlesungen und Übungen an der Wirtschaftswissenschaftlichen Fakultät der Friedrich-Schiller-Universität Jena. Im ersten Teil des Fragebogens wurden jeweils die Präferenzen für das Untersuchungsobjekt „Laptop“ und im zweiten Teil die für das Untersuchungsobjekt „Fernseher“ erhoben (siehe Abbildung 50). 1. Studie: Elicitation Technik

2. Studie: Duale Befragung

Conjoint-Analyse

W arm-Up Task Laptop

Laptop

Conjoint-Analyse

3. Studie: neue M ethode

W arm -Up Task

Conjoint-Analyse

Referenzm ethode

Referenzmethode

W arm -Up Task

W arm -Up Task

W arm-Up Task

Conjoint-Analyse Referenzm ethode

Conjoint-Analyse Referenzm ethode

Fernseher

Referenzm ethode Fernseher

Fernseher

Laptop

W arm -Up Task

Conjoint-Analyse Referenzmethode

Abbildung 50: Ablauf der Präferenzmessung

Im Rahmen der Referenzmethode wurden sechs zufällig gebildete Alternativen anhand von Kaufwahrscheinlichkeiten von den Entscheidungsträgern bewertet. Auf Basis dieser Ein-

schätzungen kann bereits untersucht werden, ob es sich bei den Alternativen für den Entscheidungsträger tatsächlich um potenziell relevante Alternativen handelt.1851

1848

Für ein Beispiel einer solchen Bewertungsaufgabe siehe Abbildung 10 in Kapitel 3.4. Siehe auch Kapitel 3.1.1 zur Beschreibung dieser Variante der Conjoint-Analyse. 1849 Siehe auch Green; Srinivasan (1990), 8; Green; Srinivasan (1978), 112. 1850 1851

Da beim Untersuchungsobjekt „Fernseher“ zwei unterschiedliche Zielgruppen bestimmt werden konnten, wurden hier insgesamt vier Eigenschaftssets untersucht. Siehe dazu Kapitel 7.3. Siehe auch Hensel-Börner (2000), 75.

331

7.2

Bestimmung des Eigenschaftssets mittels traditioneller Methoden

Werden die zu untersuchenden Eigenschaften auf Basis von Konsumentenurteilen bestimmt, legt der Marktforscher in einem ersten Schritt die Anzahl der Merkmale fest. Diese richtet sich typischerweise nicht nach der Komplexität des Entscheidungsproblems aus Kundensicht, sondern wird anhand der vermuteten Eignung der Präferenzmessmethode bestimmt. Dies bedeutet, dass zunächst die Präferenzmessmethode selektiert und ausgehend davon die Zahl der zu untersuchenden Eigenschaften und Ausprägungen festgelegt wird. In dieser Studie wird eine Conjoint-Analyse auf Basis von Paarvergleichen angewendet (siehe Kapitel 3.1). Dabei sollen vier Eigenschaften mit jeweils drei Ausprägungen untersucht werden. Es ergeben sich auf Basis der in Kapitel 3.4 beschriebenen Erhebungs- und Differenzendesigns für jedes Untersuchungsobjekt neun Stimuli und 18 Paarvergleiche, die die Bewertungsbasis der Conjoint-Analyse darstellen. Bei fünf Eigenschaften steigt die Zahl der nötigen Paarvergleiche auf 48, was die Befragungsteilnehmer bereits überfordern könnte.

7.2.1 Bestimmung der relevanten Eigenschaften mittels Elicitation Technik

Wie bereits im Kapitel 5.2.1.1 beschrieben, stehen zwei Varianten der Elicitation Technik zur Verfügung. In dieser Studie wurden die entscheidungsrelevanten Eigenschaften direkt erhoben. Um sicherzustellen, dass alle Antwortenden den Begriff “Eigenschaft“ einheitlich interpretieren, wurde dieser vom Untersuchungsleiter zunächst anhand eines Beispiels zum Untersuchungsobjekt „Kartoffelchips“ erläutert. Eine typische Frage zur Ermittlung der salienten Eigenschaften lautet: „Bitte nennen Sie alle Eigenschaften, die Sie mit dem Begriff „Laptop“ verbinden!“

Um die erhobenen Daten auswerten zu können, wurden die Statements der Befragungsteilnehmer entsprechend der inhaltlichen Bedeutung gruppiert und die Häufigkeit der Nennungen als Maß für die Salienz eines Attributs berechnet. Ergebnisse für das Untersuchungsobjekt „Laptop”

Insgesamt wurden von den 41 Probanden 313 Statements abgegeben; diese konnten zu 61 verschiedenen Eigenschaften gruppiert werden. Anhand der Ergebnisse in Tabelle 30 wird

deutlich, dass sehr viele unterschiedliche Merkmale genannt wurden. Fast 70% der erhobenen Eigenschaften wurden lediglich 1-5 mal erfasst.

332

Häufigkeit der Nennungen von Eigenschaften mehr als 20 mal 16-20 11-15 6-10 1-5 Summe

1 4 4 10 42 61

(1,6%) (6,6%) (6,6%) (16,4%) (68,9%) (100,0%)

Tabelle 30: Häufigkeit der Nennungen von Eigenschaften (n = 41)

In der folgenden Tabelle 31 werden die 15 am häufigsten genannten Eigenschaften dargestellt.1852 Eigenschaft Preis Akkulaufzeit Gewicht Festplattenkapazität Größe Design CD-Brenner Marke/Hersteller DVD-Player Displaygröße Prozessortakt Software WLAN RAM/Arbeitsspeicher Garantie Prozessor

Rang

Häufigkeit der Nennung

1 2 3 4 5 6 6 6 9 10 10 12 12 14 15 15

24 20 18 17 16 12 12 12 11 10 10 9 9 8 7 7

Tabelle 31: Häufigkeit der Nennung von Eigenschaften bei der Elicitation Technik (n = 41)

Würde man die in der Präferenzmessung zu untersuchenden Eigenschaften auf die „modal relevanten“1853 Eigenschaften beschränken, d.h. mindestens 50% der Befragungsteilnehmer haben die Eigenschaft genannt, verbliebe lediglich ein Produktmerkmal („Preis“) in der Untersuchung. Die Durchführung einer Conjoint-Analyse wäre dann nicht sinnvoll. Wie beschrieben, wird bisher die Anzahl der im weiteren Verlauf zu untersuchenden Eigenschaften mehr oder weniger subjektiv vom Marktforscher festgelegt.1854 In dieser empirischen Studie sollen die ersten vier Eigenschaften und somit in diesem Fall „Preis“, „Akkulaufzeit“, „Gewicht“ und „Festplattenkapazität“ untersucht werden.

1852 1853 1854

Eine komplette Übersicht aller genannten Eigenschaften befindet sich im Anhang IV; siehe Tabelle 127. Der Fragebogen befindet sich im Anhang VIII. Böhler (1979), 265. Siehe dazu auch Kapitel 6.1.2.2. Siehe beispielsweise Acito (1977), 82 und Kapitel 3.3.

333

Ergebnisse für das Untersuchungsobjekt „Fernseher”

Von den 41 Befragungsteilnehmern wurden zum Untersuchungsobjekt „Fernseher“ insgesamt 207 Statements erhoben, die zu 35 Eigenschaften gruppiert werden konnten. Auch bei diesem Untersuchungsobjekt wird der überwiegende Teil der Produkteigenschaften nur 1-5 mal genannt (65,7%). Es ergeben sich zwei modal relevante Merkmale, d.h. Eigenschaften, die von mindestens der Hälfte der Antwortenden genannt wurden. Häufigkeit der Nennungen von Eigenschaften mehr als 20 mal 16 -20 11-15 6-10 1-5 Summe

2 1 4 5 23 35

5,7% 2,9% 11,4% 14,3% 65,7% 100,0%

Tabelle 32: Häufigkeit der Nennungen von Eigenschaften (n = 41)

In der folgenden Tabelle 33 werden die am häufigsten genannten Eigenschaften präsentiert; eine Übersicht aller genannter Statements befindet sich im Anhang IV (Tabelle 128). Eigenschaft Bildschirmdiagonale Preis Bildschirmqualität Design Fernbedienung Marke Videotext Projektionstechnik Lautsprecherleistung Garantie Gehäusefarbe Bild-in-Bild Ergonomie Menü integrierter DVD-Player Anzahl Programmspeicher Farbe vs. Schwarz-weiß Bild Gewicht Ergonomie

Rang

Häufigkeit der Nennung

1 2 3 4 5 6 6 8 9 10 11 11 13 13 13 13 13 13

28 22 19 15 12 11 11 10 9 7 6 6 4 4 4 4 4 4

Tabelle 33: Häufigkeit der Nennung von Eigenschaften bei der Elicitation Technik (n = 41)

Für alle Eigenschaften, die innerhalb der Präferenzmessung untersucht werden sollen, muss es möglich sein, entsprechende Ausprägungen festzulegen. Dafür ist es notwendig, dass die Bedeutung der Eigenschaften eindeutig definiert ist. Bei den Eigenschaften „Bildschirmqualität“ und „Design“ ist diese Anforderung nicht erfüllt. Hier ist nicht eindeutig, welche konkreten Assoziationen die Antwortenden mit den jeweiligen Eigenschaften verbunden haben. Mit 334

„Bildschirmqualität“ kann so beispielsweise der „Kontrast“, der jeweils „mögliche Blickwinkel“, die „Schärfe des Bildes“, die „Auflösung des Bildes“, die „Bildschirmfrequenz“ usw. gemeint gewesen sein. Entsprechendes gilt für die Eigenschaft „Design“. Hier lässt sich aus den Aussagen der Befragungsteilnehmer ebenfalls nicht ableiten, welche Designelemente des Fernsehers für eine Wahlentscheidung relevant sind und welche Ausprägungen diese aufweisen könnten. Beide Merkmale sind nicht eindeutig definiert und mussten aufgrund dieser Schwäche der traditionellen Elicitation Technik aus der Untersuchung ausgeschlossen werden. In die Conjoint-Analyse werden die Eigenschaften „Bildschirmdiagonale“, „Preis“, „Fernbedienung“ und „Marke“ aufgenommen. Hauptkritikpunkt bei der Durchführung der Elicitation Technik ist, dass die gefundenen Eigenschaften teilweise nicht eindeutig interpretierbar sind. Eine Überprüfung der erfassten Bewertungsdimensionen auf Redundanz und die Eliminierung inhaltlich identischer Produktmerkmale ist demnach immer in einem gewissen Maße subjektiv. Da die Befragung und das Untersuchungsobjekt den Probanden nicht vorher angekündigt wurde, ist zudem nicht davon auszugehen, dass diese bereits über ein ausgeprägtes EvokedSet im jeweiligen Produktbereich aufweisen. Deshalb ist nicht sichergestellt, dass die tatsächlich relevanten Eigenschaften erhoben werden können.1855 Schließlich ist zu vermuten, dass in einem solchen Befragungskontext möglicherweise zwar sehr viele unterschiedliche Eigenschaften, jedoch nur sehr wenige Produktmerkmale mehrfach genannt wurden.1856 Durch eine Vorankündigung des Untersuchungsobjekts könnte man möglicherweise erreichen, dass die Anzahl der unterschiedlichen Attribute sinkt und diese eindeutiger interpretierbar sind. In Kapitel 7.3 wird dieser Aspekt genauer untersucht.

1855 1856

Dies gilt insbesondere für Added-value Eigenschaften, siehe Kapitel 4.1.4. Die vielen, sehr unterschiedlichen Eigenschaften deuten auf den ersten Blick darauf hin, dass die Anforderungen an die Produkte innerhalb der Befragungsteilnehmer sehr heterogen sein können, d.h. sich viele, sehr unterschiedliche Zielgruppen in der Stichprobe befinden. Allerdings könnten diese auch lediglich ein Indiz dafür sein, dass es den Befragungsteilnehmern schwer fällt, die für sie wichtigen Merkmale ohne weiteres zu verbalisieren. Insbesondere die Nennung von nicht eindeutig interpretierbaren Eigenschaften unterstützt diese Vermutung.

335

7.2.2 Bestimmung der relevanten Eigenschaften mittels Dualer Methode

Die Duale Methode basiert auf einer vom Marktforscher vorgegebenen Liste mit potenziell relevanten Eigenschaften. In dieser Untersuchung wurden die Merkmale aufgenommen, die: -

in Testberichten (z.B. Fachzeitschriften),1857

-

zur Beschreibung von Produkten in Elektronikmärkten1858 und

-

in Werbeprospekten und Werbeflyern benutzt wurden.

Der Fragebogen einer Dualen Methode besteht, wie in Kapitel 5.2.2.2 beschrieben, aus zwei Teilen: -

zunächst werden die Befragungsteilnehmer gebeten, die Wichtigkeit einer Eigenschaft

-

danach die subjektiv wahrgenommene Unterscheidungskraft der Merkmale zu bewerten.

einzuschätzen und

Beide Einschätzungen werden anhand von Rating-Skalen vorgenommen (siehe Tabelle 34).1859 Eigenschaft

Wichtigkeit

Unterscheidungsgrad

für Auswahlentscheidung unwichtig

Marke

 1

2

3

4

5

 1

2

...

3

4

5

der Alternativen sehr

sehr

wichtig

ähnlich

 1

2

3

2

3

schiedlich

1

2

3

4

5



 1

sehr unter-

5





Preis

4

4

5

 1

2

3

4

5

Tabelle 34: Beispiel für Fragen in einem Fragebogen der Dualen Methode

Durch Multiplikation der Einschätzungen für die Wichtigkeit und die Unterscheidungskraft einer Eigenschaft wird der Determinanzwert als Maß für die Entscheidungsrelevanz eines Merkmals auf individueller Ebene berechnet. Durch Mittelwertbildung der individuellen Determinanzwerte über alle Befragungsteilnehmer erhält man jeweils den aggregierten Determinanzwert für eine Eigenschaft. In die Präferenzmessung werden die Eigenschaften mit den jeweils höchsten aggregierten Determinanzwerten aufgenommen.

1857 1858 1859

336

In dieser Studie wurden jeweils die aktuellsten Testberichte aus der Zeitschrift “test” der Stiftung Warentest und zusätzlich für das Untersuchungsobjekt Laptop Testberichte aus den Zeitschriften “ct” und “Notebook” verwendet. Dabei wurden die Elektronikmärkten“Media-Markt”, “ProMarkt” und “MediMax” berücksichtigt. In dieser Studie wurden analog zu Tscheulin (1992, 97) zur Einschätzung jeweils 5-stufige Rating-Skalen verwendet – für den Fragebogen siehe Anhang IX.

Ergebnisse für das Untersuchungsobjekt „Laptop”

Insgesamt konnten für das Untersuchungsobjekt „Laptop“ anhand der beschriebenen Sekundärquellen 39 potenziell relevante Eigenschaften bestimmt werden, die von insgesamt 42 Befragungsteilnehmern eingeschätzt wurden. In der folgenden Tabelle 35 werden die Eigenschaften mit den höchsten Determinanzwerten dargestellt.1860 Eigenschaft

Determinanz

Wichtigkeit

Unterscheidungskraft

Rang

Mittelwert

Rang

Mittelwert

Rang

Mittelwert

Preis

1

18,88

3

4,50

2

4,21

Akkulaufzeit

2

18,37

1

4,63

5

3,90

Austauschservice

3

14,81

11

3,93

6

3,76

Festplattenkapazität

4

14,67

4

4,38

12

3,31

Gewicht mit Akku

5

14,59

10

3,95

11

3,56

Marke

6

14,56

21

3,43

1

4,22

Lüftergeräusche

7

14,45

14

3,81

8

3,64

Größe des Arbeitsspeichers

8

13,90

7

4,17

14

3,24

Vor-Ort Service

9

13,74

15

3,76

9

3,62

Grafikchip

10

13,50

17

3,64

10

3,57

Netzwerkkarte

11

12,76

8

4,14

25

3,00

Größe des Laptops

12

12,55

9

3,98

22

3,07

Bildschirmauflösung

13

12,15

12

3,93

23

3,05

Taktfrequenz des Prozessors

14

11,74

20

3,48

19

3,12

Stoßfestigkeit

15

11,41

18

3,59

20

3,10

Tabelle 35: Ergebnisse der Dualen Befragung (n = 42)

Betrachtet man die grafische Darstellung der Determinanzwerte (siehe Abbildung 51), wird deutlich, dass bei dieser Methode die Bestimmung der Eigenschaften ebenfalls nicht unproblematisch ist. Während die ersten beiden Eigenschaften (Preis und Akkulaufzeit) im Vergleich zu den weiteren untersuchten Produktmerkmalen einen hohen Determinanzwert aufweisen, unterscheiden sich die Eigenschaften von Rang 3 bis Rang 10 nicht wesentlich im Hinblick auf die Bewertung ihrer Entscheidungsrelevanz (bezüglich der Eigenschaften auf Rang 3 bis 7 bestehen keine wesentlichen Unterschiede). Insofern ist auch bei dieser Methode eine Auswahl der weiter zu untersuchenden Merkmale nicht besonders stabil.

1860

Die Einschätzungen aller Merkmale werden in Tabelle 129 im Anhang V präsentiert.

337

20,00 19,00

Determinanzwert

18,00 17,00 16,00 15,00 14,00 13,00 12,00 11,00 10,00 1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

Eigenschaft (Rang) Abbildung 51: Grafische Darstellung der Determinanzwerte bei der Dualen Methode für das Untersuchungsobjekt „Laptop“

Untersucht man das Antwortverhalten der Befragungsteilnehmer über alle untersuchten Eigenschaften (siehe Tabelle 36), so ist feststellbar, dass zumindest für die Wichtigkeitseinschätzungen eine Tendenz dazu besteht, die Merkmale als eher wichtig einzustufen. Zudem ist offensichtlich, dass die Entscheider ein Rating von „1“ (d.h. unwichtig bzw. sehr ähnlich) gemieden haben. Dies führt bei einer Rating-Skala mit lediglich fünf Abstufungen dazu, dass die Aussagekraft der Befragung sinkt, da letztendlich nur vier Skalenpunkte tatsächlich genutzt werden. Hinsichtlich der Unterscheidungskraft scheinen die Befragungsteilnehmer eher zu „mittleren“ Werten zu tendieren. Wichtigkeit

Unterscheidungskraft

Häufigkeit der Einschätzung unwichtig

1 171 10,52%

Häufigkeit der Einschätzung sehr wichtig sehr ähnlich

2 262 16,12%

3 292 17,97%

4 466 28,68%

5 434 26,71%

1 136 8,44%

sehr unterschiedlich

2 369 22,89%

3 471 29,22%

4 376 23,33%

Tabelle 36: Häufigkeit der Einschätzungen auf der Rating-Skala bei der Dualen Methode

Auch bei dieser Methode wurden die ersten vier Eigenschaften: -

Preis,

-

Akkulaufzeit,

-

Austauschservice und

-

Festplattenkapazität

selektiert, die in einer Conjoint-Analyse genauer untersucht werden sollen.

338

5 260 16,13%

Ergebnisse für das Untersuchungsobjekt „Fernseher”

Analog zum Untersuchungsobjekt „Laptop“ wurden die Merkmale für das Untersuchungsobjekt „Fernseher“ anhand der beschriebenen Sekundärquellen ermittelt. Es ergaben sich 33 potenziell relevante Produktdimensionen, die von 43 Befragungsteilnehmern bewertet wurden. In Tabelle 37 werden die 15 Eigenschaften mit den jeweils höchsten Determinanzwerten dargestellt.1861 Determinanz

Eigenschaft Preis Bildschirmdiagonale Marke Vor-Ort Service Lautsprecherleistung Standardauflösung Projektionstechnik Gehäusefarbe Stromverbrauch im Betrieb Bildschirmformat Stromverbrauch Stand-by Garantie Eingebauter Digitaltuner Gewicht PC-Anschluss

Wichtigkeit

Unterscheidungskraft

Rang

Mittelwert

Rang

Mittelwert

Rang

Mittelwert

1 2 3 4 5 6 7 8

19,91 16,05 13,61 12,84 12,65 12,02 11,83 11,38

1 3 16 5 8 6 17 9

4,60 4,30 3,12 3,81 3,67 3,79 3,10 3,57

1 5 2 13 12 15 7 14

4,30 3,67 4,17 3,30 3,40 3,17 3,59 3,21

9

11,24

11

3,49

15

3,17

10

10,69

10

3,53

19

3,00

11

10,55

13

3,28

18

3,07

12

10,44

2

4,51

30

2,30

13

9,88

24

2,49

6

3,60

14 15

9,83 9,45

23 20

2,65 2,91

10 11

3,45 3,43

Tabelle 37: Ergebnisse der Dualen Befragung (n = 43)

Trägt man die Determinanzwerte in einem Diagramm ab (siehe Abbildung 52), so ergibt sich ein tendenziell ähnliches Bild wie beim Untersuchungsobjekt „Laptop“. Gleichwohl sind hier größere Unterschiede, d.h. weniger Eigenschaften mit einem ähnlichen Determinanzwert, in den Einschätzungen der Befragungsteilnehmer zu erkennen. Insgesamt weisen jedoch auch hier lediglich zwei Eigenschaften hohe Determinanzwerte auf, während die Unterschiede zwischen den anderen Merkmalen eher gering sind.

1861

Siehe Tabelle 130 im Anhang V für eine vollständige Übersicht der Befragungsergebnisse.

339

20,00 19,00

Determinanzwert

18,00 17,00 16,00 15,00 14,00 13,00 12,00 11,00 10,00 9,00 1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

Eigenschaft (Rang) Abbildung 52: Grafische Darstellung der Determinanzwerte bei der Dualen Methode für das Untersuchungsobjekt „Fernseher“

Bei der Analyse des Antwortverhaltens der Entscheidungsträger fällt im Gegensatz zum Untersuchungsobjekt Laptop keine generelle Tendenz auf, alle Eigenschaften als relativ wichtig zu bewerten. Allerdings ist bei diesem Untersuchungsobjekt bezüglich der Unterscheidungskraft der Merkmale ebenfalls zu beobachten, dass mittlere Bewertungen relativ häufig vorgenommen und die Skalenpunkte „1“ und „5“ gemieden werden. Wichtigkeit

Unterscheidungskraft

Häufigkeit der Einschätzung

Häufigkeit der Einschätzung

unwichtig

sehr wichtig sehr ähnlich

sehr unterschiedlich

1

2

3

4

5

1

2

3

4

5

335

177

247

377

267

179

277

380

341

201

23,88%

12,62%

17,61%

26,87%

19,03%

12,99%

20,10%

27,58%

24,75%

14,59%

Tabelle 38: Häufigkeit der Einschätzungen auf der Rating-Skala bei der Dualen Methode (n = 43)

Für dieses Untersuchungsobjekt wurden die vier Merkmale mit den höchsten Determinanzwerten, d.h.: -

Preis,

-

Bildschirmdiagonale,

-

Marke und

-

Vor-Ort Service

selektiert, die innerhalb der Conjoint-Analyse weiter untersucht werden. Betrachtet man die berechneten Determinanzwerte bei beiden Untersuchungsobjekten, ist auffällig, dass die Einschätzungen bezüglich vieler Eigenschaften relativ ähnlich sind. Die letzt340

endliche Bestimmung der zu untersuchenden Eigenschaften ist in diesen Fällen nicht eindeutig möglich, aufgrund der geringen Unterschiede nicht kann mit einer stabilen Lösung gerechnet werden. Darüber hinaus ist bei den Bewertungen zur „Unterscheidungskraft“ eine Tendenz der Befragungsteilnehmer zu „mittleren“ Einschätzungen auffällig.

7.2.3 Festlegung der zu untersuchenden Eigenschaftsausprägungen

Die Verfahren der Elicitation Technik und ebenso die Duale Befragung berücksichtigen keine Eigenschaftsausprägungen. Die Festlegung der zu untersuchenden Ausprägungen erfolgt deshalb bei diesen Verfahren durch den Marktforscher. Zunächst wurden mit Hilfe der in Kapitel 7.2.2 beschriebenen Sekundärquellen potenziell relevante Merkmalsausprägungen, die zum Zeitpunkt der Erhebung am Markt angeboten wurden, bestimmt. Da es sich bei diesen Quellen um weit verbreitete Medien und Werbemittel großer Elektronikmärkte handelt, ist nicht davon auszugehen, dass die gesamte, am Markt mögliche Bandbreite ermittelt werden konnte, wie es von manchen Forschern gefordert wird.1862 Auf Basis der Sekundärquellen konnte vielmehr eine am Markt weitgehend „übliche“ Bandbreite an Eigenschaftsausprägungen bestimmt werden, wobei die einzelnen Eigenschaftsausprägungen auf die Bedürfnisse unterschiedlicher Zielgruppen abgestimmt sind. Die Festlegung der Bandbreite der Eigenschaften soll hier anhand eines Beispiels dargestellt werden. Für das Untersuchungsobjekt „Fernseher“ wurden mit Hilfe der Dualen Methode1863 die Eigenschaften „Preis“, „Bildschirmdiagonale“, „Marke“ und „Vor-Ort Service“ als relevant bestimmt. Anhand der beschriebenen Sekundärquellen konnten folgende Merkmalsausprägungen ermittelt werden (siehe Tabelle 39).

1862

Siehe Kapitel 5.7.1. Werden die Ausprägungen z.B. auf Basis von Werbeflyern bestimmt, ist davon auszugehen, dass beispielsweise bei der Eigenschaft „Preis“ lediglich niedrigere bis mittlere Ausprägungen erfasst werden, d.h. bei den in den Prospekten präsentierten Alternativen handelt es sich eher um niedrige (Sonderangebote) bzw. mittlere Ausprägungen des Preises. Hochpreisige Artikel sind demgegenüber weniger häufig in Werbeprospekten zu erwarten – es kann somit nicht die gesamte, am Markt verfügbare Bandbreite ermittelt werden. Auch bezüglich anderer Eigenschaften ist nicht damit zu rechnen, dass typische Elektronikmärkte die gesamte Bandbreite der am Markt üblichen Ausprägungen abdecken können. Dies gilt, weil beispielsweise bestimmte Marken nur bei autorisierten Fachhändlern erhältlich sind (beim Untersuchungsobjekt „Fernseher“ ist dies z.B. für die Ausprägung „Bang&Olufsen“ beim Merkmal „Marke“ der Fall) oder weil es sich um Produkte für Spezialanwendungen handelt (beim Untersuchungsobjekt „Computer“ gilt dies z.B. für Workstations oder Server, die andere Komponenten (z.B. Prozessoren, Grafikkarten usw.) als die in Elektronikmärkten üblichen Produktalternativen aufweisen). 1863 Bei der Elicitation Technik (Gruppe 1) wird in identischer Weise vorgegangen.

341

Eigenschaft

Ausprägungen (auf Basis von Werbeprospekten und Testberichten)

Preis

65,- Euro, 79,95 Euro, 89,95 Euro, 199,- Euro, 225,- Euro, 399,- Euro, 499,- Euro, 599,- Euro, 799,- Euro, 1399,- Euro, 1499,- Euro, 1999,- Euro, 2300,- Euro 34 cm, 37 cm, 48 cm, 51 cm, 66 cm, 70 cm, 77 cm, 81 cm, 106 cm, 108 cm Philips, SEG, Thomson, Acer, Dell, Grundig, Sharp, Toshiba, Xoro, ICS, LG Electronics, Durabrand, Samsung, Medion, Sony, Daewoo, Welltech, Cinex Kein Vor-Ort Service, 1 Jahr Vor-Ort Austauschservice

Bildschirmdiagonale Marke Vor-Ort Service

Tabelle 39: Merkmalsausprägungen der Eigenschaften - Gruppe 2 „Duale Methode + Fernseher“

Anhand dieser Ausprägungen können zunächst die Bandbreiten der Merkmale ermittelt werden. Dies ist bei Eigenschaften, deren Ausprägungen Zahlenwerte darstellen, die in eine sinnvolle Rangfolge gebracht werden können oder bei Eigenschaften mit nur zwei Ausprägungen sehr einfach möglich. Hier wird lediglich der kleinste und größte Wert selektiert. Zur Festlegung der Bandbreite bei Eigenschaften, deren Ausprägungen ein nominales Skalenniveau aufweisen, ist diese Vorgehensweise nicht möglich. Es wurden deshalb Experten (Verkäufer der Elektronikmärkte „Mediamarkt“, „Medimax“ und „ProMarkt“) gebeten, die Bandbreite bezüglich der vermuteten Präferenz der Kunden bei der Eigenschaft „Marke“ zu bestimmen. Es ergaben sich folgende Bandbreiten für die Eigenschaften (siehe Tabelle 40). Eigenschaft

Ausprägungen1864

Preis

65,- Euro



2300,- Euro

Bildschirmdiagonale

34 cm



108 cm

Marke

Welltech



Philips

Vor-Ort Service

Kein Vor-Ort Service



1 Jahr Vor-Ort Austauschservice

Tabelle 40: Bandbreiten der Eigenschaften für das Untersuchungsobjekt „Fernseher” und die Duale Methode

Bei den Eigenschaften, für die am Markt mehr als zwei Ausprägungen existieren, müssen die weiteren zu untersuchenden Eigenschaftsausprägungen selektiert werden. In dieser Studie sollen, wie bereits in Kapitel 7.2.2 beschrieben, vier Eigenschaften mit jeweils maximal drei Ausprägungen untersucht werden.1865 Für die Eigenschaften „Preis“, „Bildschirmdiagonale“ und „Marke“ wurde eine weitere Merkmalsausprägung so ermittelt, dass, wie in der Praxis

1864

Die Bestimmung der Ausprägungen erfolgte auf Basis von Werbeprospekten und Testberichten. Die Bandbreiten (dabei wurde wie bisher üblich, die gesamte, in diesem Beispiel regional beschränkten Markt übliche Bandbreite berücksichtigt – siehe dazu auch Kapitel 5.7.1) bei den Eigenschaften, denen vermutlich ein Vektormodell (siehe Kapitel 2.7) zugrunde liegt, wurden vom Marktforscher bestimmt. Die Bandbreite der Eigenschaft „Marke“ wurde von Experten festgelegt. 1865 Für das Merkmal „Vor-Ort Service“ waren zum Zeitpunkt der Untersuchung lediglich zwei Ausprägungen am Markt üblich, so dass hier keine weiteren Ausprägungen bestimmt werden müssen.

342

üblich,1866 die Abstände zwischen den Merkmalsausprägungen möglichst gleich groß sind. Da die Ausprägungen der Eigenschaft „Marke“ ein nominales Skalenniveau aufweisen, wurden wiederum Experten (Verkäufer aus dem jeweiligen Produktbereich) befragt. Es ergeben sich für die Gruppe „Duale Befragung“ beim Untersuchungsobjekt „Fernseher“ folgende Eigenschaften und Ausprägungen, die in der Conjoint-Analyse genutzt wurden (siehe Tabelle 41). Eigenschaft

Ausprägungen

Preis Bildschirmdiagonale Marke Vor-Ort Service

65,- Euro, 1182,- Euro, 2300,- Euro 34 cm, 71 cm, 108 cm Welltech, Sharp, Philips Kein Vor-Ort Service, 1 Jahr Vor-Ort Austauschservice

Tabelle 41: Eigenschaftsset für das Verfahren „Duale Methode“ und das Untersuchungsobjekt „Fernseher“

Die Bestimmung der Eigenschaftsausprägungen für die anderen Gruppen („Elicitation Technik + Fernseher“; „Elicitation Technik + Laptop“ sowie „Duale Methode + Laptop“) erfolgte in analoger Vorgehensweise. Die jeweils weiter zu untersuchenden Eigenschaftsausprägungen sowie das der Conjoint-Analyse zugrunde liegende Eigenschaftsset werden in den folgenden Tabellen präsentiert. Gruppe

„Elicitation Technik + Fernseher“

Eigenschaft

Ausprägungen anhand von Prospekten und Testberichten

Bildschirmdiagonale

34 cm, 37 cm, 48 cm, 51 cm, 66 cm, 70 cm, 77 cm, 81 cm, 106 cm, 108 cm 65,- Euro, 79,95 Euro, 89,95 Euro, 199,- Euro, 225,- Euro, 399,- Euro, 499,- Euro, 599,- Euro, 799,- Euro, 1399,- Euro, 1499,- Euro, 1999,- Euro, 2300,- Euro ja / nein Philips, SEG, Thomson, Acer, Dell, Grundig, Sharp, Toshiba, Xoro, ICS, LG Electronics, Durabrand, Samsung, Medion, Sony, Daewoo, Welltech, Cinex

Preis

Fernbedienung Marke

Tabelle 42: Berücksichtigte Merkmalsausprägungen der Eigenschaften - Gruppe „Elicitation Technik + Fernseher“

Gruppe

„Elicitation Technik + Fernseher“

Bildschirmdiagonale Preis Fernbedienung Marke

34 cm, 71 cm, 108 cm 65,- Euro, 1182,- Euro, 2300,- Euro nein / ja Welltech, Sharp, Philips

Tabelle 43: Eigenschaftsset für die Gruppe „Elicitation Technik + Fernseher“

1866

Siehe Kapitel 5.7.4.

343

Gruppe

„Duale Methode + Laptop“

Eigenschaft

Ausprägungen anhand von Prospekten und Testberichten

Preis

699,- Euro, 749,- Euro, 799,- Euro, 899,- Euro, 999,- Euro, 1099,- Euro, 1199,- Euro, 1299,- Euro, 1599,- Euro, 2300,- Euro, 2799,- Euro 1 h, 2 h, 2,3 h, 3 h, 3,9 h, 4 h, 5 h, 7,8 h, 8,5 h 12 Monate Einsendung per Post, 12 Monate Abhol- und Lieferservice, 24 Monate Abhol- und Lieferservice 30 GB, 40 GB, 60 GB, 80 GB, 100 GB, 120 GB

Akkulaufzeit Austauschservice Festplattenkapazität

Tabelle 44: Berücksichtigte Merkmalsausprägungen der Eigenschaften - Gruppe „Duale Methode + Laptop“

Gruppe

„Duale Methode + Laptop“

Preis Akkulaufzeit Austauschservice

699,- Euro, 1749,- Euro, 2799,- Euro 1 h, 4,75 h, 8,5 h 12 Monate Einsendung per Post, 12 Monate Abhol- und Lieferservice, 24 Monate Abhol- und Lieferservice 30 GB, 75 GB, 120 GB

Festplattenkapazität

Tabelle 45: Eigenschaftsset für die Gruppe „Duale Methode + Laptop“

Gruppe

„Elicitation Technik + Laptop“

Eigenschaft

Ausprägungen anhand von Prospekten und Testberichten

Preis

699,- Euro, 749,- Euro, 799,- Euro, 899,- Euro, 999,- Euro, 1099,- Euro, 1199,- Euro, 1299,- Euro, 1599,- Euro, 2300,- Euro, 2799,- Euro 1 kg, 1,4 kg, 2 kg, 2,4 kg, 2,5 kg, 2,7 kg, 2,8 kg, 3 kg, 3,9 kg, 4 kg, 4,4 kg 1 h, 2 h, 2,3 h, 3 h, 3,9 h, 4 h, 5 h, 7,8 h, 8,5 h 30 GB, 40 GB, 60 GB, 80 GB, 100 GB, 120 GB

Gewicht Akkulaufzeit Festplattenkapazität

Tabelle 46: Berücksichtigte Merkmalsausprägungen der Eigenschaften – Gruppe „Elicitation Technik + Laptop“

Gruppe

„Elicitation Technik + Laptop“

Preis Gewicht Akkulaufzeit Festplattenkapazität

699,- Euro, 1749,- Euro, 2799,- Euro 1 kg, 2,7 kg, 4,4 kg 1 h, 4,75 h, 8,5 h 30 GB, 75 GB, 120 GB

Tabelle 47: Eigenschaftsset für die Gruppe „Elicitation Technik + Laptop“

344

7.3

Bestimmung des Eigenschaftssets mit Hilfe der neuartigen Methode

Im Folgenden wird die in Kapitel 6 vorgestellte Methode im Rahmen einer empirischen Untersuchung angewendet und ein Eigenschaftsset auf Grundlage der Bedürfnisse der Entscheider ermittelt, das die Grundlage für eine spätere Erfassung der Präferenzen bildet. Die einzelnen Schritte werden in den folgenden Kapiteln kurz erläutert sowie die Ergebnisse beschrieben.

7.3.1 Vorankündigung des Untersuchungsobjektes

Eine Woche vor der eigentlichen Erhebung der relevanten Eigenschaften und Ausprägungen wurde den Entscheidungsträgern das Untersuchungsobjekt bekannt gegeben und diese gebeten, alle Informationsquellen und potenzielle Einkaufsstätten zur Informationssammlung zu nutzen, die sie bei realen Kaufentscheidungen berücksichtigen würden.

Bis zur folgenden Datenerhebung hatten die Befragungsteilnehmer sieben Tage Zeit, in der sie zunächst alle Produktalternativen, die für den jeweiligen Entscheidungsträger in eine engere Auswahl kommen, bestimmen und dieses Evoked-Set anhand der für den jeweiligen Befragungsteilnehmer relevanten Eigenschaften und Ausprägungen beschreiben sollten. Ziel ist es, dass die Probanden jeweils die tatsächlichen bzw. wahrgenommenen Merkmalsausprägungen der relevanten Eigenschaften in einer folgenden Veranstaltung benennen können. Um mögliche Unklarheiten bezüglich der Definition der Begriffe „Eigenschaft“, „Ausprägung“ und „Evoked-Set“ so früh wie möglich zu vermeiden, wurde im Rahmen der Vorankündigung die bevorstehende Vorgehensweise der Datenerhebung an einem hypothetischen Untersuchungsobjekt „Kartoffelchips“ erläutert. Im Mittelpunkt stand dabei die in Abbildung 4 (Kapitel 2.3) beschriebene Vorgehensweise zur Selektion von Alternativen. Dies soll si-

cherzustellen, dass alle Entscheider den Begriff „Evoked-Set“ vergleichbar interpretieren und die Alternativen im folgenden Schritt beschreiben können.1867 Da eine intensive Informationssuche für die Befragungsteilnehmer mit einem relativ hohen Aufwand verbunden ist, erhielten alle Probanden, die an der Voruntersuchung teilnahmen, ein Incentive in Höhe von 10,- Euro.

1867

Wie in Kapitel 2.3 beschrieben, sind nur die Alternativen des Evoked-Sets für einen Entscheider akzeptabel; lediglich zwischen diesen Produkten kommt es zu Trade-off Entscheidungen. Es handelt sich somit um die Laptops, die vor einer Kaufentscheidung in eine engere Auswahl kommen. Damit die Probanden den Begriff „akzeptabel“ in der vom Marktforscher intendierten Form interpretieren, ist die Vorankündigung des Untersuchungsobjekts von entscheidender Bedeutung. Im Rahmen der Vorankündigung wurde den Befragungsteilnehmern deshalb anhand des Untersuchungsobjekts „Kartoffelchips“ ein Beispiel für die Herausbildung eines Evoked-Sets präsentiert.

345

Durch die Vorankündigung der Untersuchungsobjekte und des Befragungsziels sollte sichergestellt werden, dass -

eine eigene Informationssammlung der Entscheidungsträger auf Basis des individuellen Evoked-Sets stattfinden kann und

-

dies die spätere Verbalisierungsfähigkeit der Entscheidungsträger erleichtert, da die Probanden vorab wissen, welche Informationen später erhoben werden sollen.1868

7.3.2 Erhebung von salienten Eigenschaften und Ausprägungen mit Hilfe einer angepassten Elicitation Technik

Die angepasste Elicitation Technik besteht aus drei Bereichen: 1. Erhebung der Nutzungssituation, 2. Evoked-Set, 3. Erfassung der Eigenschaften und Ausprägungen.1869 Zunächst wird die Nutzungssituation erhoben, d.h. es wird untersucht, welche grundlegenden Bedürfnisse das jeweilige Produkt befriedigen soll. In dieser Studie wurde dazu folgende Formulierung für eine offene Frage genutzt: „Bitte notieren Sie, in welchen Situationen Sie typischerweise ein Notebook verwenden bzw. verwenden würden.“ Im nächsten Schritt wurden die Befragungsteilnehmer gebeten, alle Produktalternativen zu nennen, die sie bei einem Kauf in die engere Wahl ziehen würden. Die genannten Produktalternativen entsprechen dem Evoked-Set der Entscheidungsträger. „Notieren Sie bitte zunächst alle Produkt- und Markentypen, die aus Ihrer Sicht beim Kauf eines Laptops akzeptabel sind. Bitte achten Sie auf eine möglichst genaue Bezeichnung der Produkte.“ Im Hauptteil dieses Fragebogens werden schließlich die aus Sicht der Befragungsteilnehmer relevanten Eigenschaften erhoben, die danach durch ihre jeweiligen Merkmalsausprägungen der Alternativen im Evoked-Set beschrieben werden sollen. Zur Erfassung der Eigen-

schaften und Ausprägungen wurde folgende Formulierung genutzt:

1868

Indirekt besteht die Möglichkeit, dass die Vorankündigung die Art der erhobenen Eigenschaften (Characteristics vs. Benefits) beeinflusst. Man könnte davon ausgehen, dass mit einem höheren Produktwissen (zumindest bei komplexen Gütern wie technischen Produkten) die objektiven Eigenschaften eine stärkere Rolle spielen. 1869 Der Fragebogen befindet sich im Anhang X.

346

„Durch welche Eigenschaften und Ausprägungen lassen sich diese verschiedenen Produktund Markentypen aus Ihrer Sicht beschreiben? Nennen Sie dabei die Eigenschaften und Ausprägungen, die Ihnen beim Kauf eines Laptops wichtig sind.“ Ergebnisse der angepassten Elicitation Technik für das Untersuchungsobjekt „Laptop”

Insgesamt haben 34 Befragungsteilnehmer an dieser ersten Erhebung teilgenommen. Im Hauptteil der Elicitation Technik wurden insgesamt 402 Nennungen zu den Eigenschaften erhoben, die insgesamt 51 Produktmerkmale repräsentieren. Die Anzahl der erhobenen Merkmalsausprägungen ist erwartungsgemäß sehr viel höher als die der Attribute. Dies gilt

insbesondere für die Häufigkeit der Nennung unterschiedlicher Merkmalsausprägungen (siehe Tabelle 48); diese kann vor allem auf Merkmale mit kontinuierlichen Eigenschaftsausprägungen wie Preis, Gewicht usw. zurückgeführt werden. So wurden etwa 85 % der erhobenen Merkmalsausprägungen lediglich 1-5 mal genannt, mehr als die Hälfte der Ausprägungen wurde sogar nur einmal von den Befragungsteilnehmern angegeben (siehe Tabelle 49). Anzahl der Nennungen Anzahl der verschiedenen Nennungen

Eigenschaften 402

Eigenschaftsausprägungen 723

51

236

Tabelle 48: Anzahl der genannten Eigenschaften und Ausprägungen in der angepassten Elicitation Technik (n = 34) Anzahl der Eigenschaften von mehr als 50% der Befragungsteilnehmern genannt (mehr als 17 x) 16-20 11-15 6-10 1-5 davon lediglich 1x genannt Summe

8 9 5 7 30 20 51

Anzahl der Eigenschaftsausprägungen 1870

15,69 %

17,65 % 9,80 % 13,73 % 58,82 % 39,22 % 100,00 %

8

3,39 %

8 4 25 199 128 236

3,39 % 1,69 % 10,59 % 84,32 % 54,37 % 100,00 %

Tabelle 49: Häufigkeit der Nennungen von Eigenschaften (n = 34)

Aus der Vielzahl potenziell relevanter Eigenschaften wurden zunächst die Produktmerkmale eliminiert, die relativ selten genannt wurden (siehe auch Kapitel 6.1.2.2). Für das Untersuchungsobjekt „Laptop“ wurde dazu vom Marktforscher festgelegt, dass mindestens 25% der Befragungsteilnehmer die jeweilige Eigenschaft genannt haben sollten. Deshalb erfolgte eine Eliminierung aller Eigenschaften, die nicht mindestens 8 mal genannt wurden. In diesem Fall verbleiben von den insgesamt 51 genannten Eigenschaften 19 Produktmerkmale, die 339 1870

Dies bedeutet, dass insgesamt acht Merkmale von mehr als 50% der Befragungsteilnehmer genannt wurden – dies entspricht 15,69% der insgesamt genannten Eigenschaften.

347

Nennungen repräsentieren. Diese 19 Merkmale entsprechen 84% der Anzahl der ursprünglichen Nennungen. Ziel dieser ersten Eliminierung ist es, den Arbeitsaufwand für die folgenden Arbeitsschritte zu verringern, indem „Ausreißer“ nicht weiter berücksichtigt werden. Im folgenden Schritt werden die Eigenschaftsausprägungen der Eigenschaften mit kontinuierlichen, d.h. metrischen Ausprägungen gruppiert.1871 Eine Zusammenfassung der Ausprägungen ist bei den Merkmalen notwendig, die auf einer metrischen Skala erfasst werden können und bei denen keine „typischen“ Eigenschaftsausprägungen existieren. Für das Untersuchungsobjekt „Laptop“ betrifft diese Gruppierung beispielsweise die Ausprägungen der Eigenschaften „Preis“, „Akkulaufzeit“ und „Gewicht“. Die Vorgehensweise wird im Folgenden am Beispiel des Produktmerkmals „Preis“ demonstriert. Allgemein werden nachstehende Schritte vorgeschlagen: 1. Erfassung der Bandbreite der Eigenschaftsausprägungen, 2. Festlegung von jeweils gleich großen Intervallen, innerhalb derer die Ausprägungen zu einer neuen aggregierten Ausprägung zusammengefasst werden, 3. Zusammenfassung der Ausprägungen auf individueller Ebene und Berechnung des individuellen Mittelwerts der zusammengefassten Ausprägungen sowie 4. Berechnung des Mittelwerts der Eigenschaftsausprägungen auf aggregierter Ebene zur Festlegung der neuen Ausprägungsbezeichung (siehe auch Kapitel 6.1.2.3). Für die Eigenschaft „Preis“ ergab sich bei dem Untersuchungsobjekt „Laptop“ eine Bandbreite von 683 – 2687 Euro.

Als Intervall für jeweils eine Gruppe wurde ein Bereich von jeweils 149 Euro vom Marktforscher festgelegt;1872 es ergeben sich somit die folgenden zehn Gruppen (siehe Tabelle 50):

1871 1872

348

Siehe Kapitel 6.1.2.3. Hier wurde aus Praktikabilitätsgründen ein identisches Intervall für alle Gruppen vom Marktforscher festgelegt. Alternativ wäre es jedoch auch denkbar, auf Basis einer weiteren Vorstudie die Ausprägungen anhand der vom Entscheider empfundenen Nutzenähnlichkeit zu gruppieren. So könnte vermutet werden, dass Probanden den Nutzenunterschied von 650.- bis 799.- Euro u.U. größer als der Nutzenunterschied von 1850 bis 1999 Euro wahrnehmen. Innerhalb einer weiteren Vorstudie müsste somit das gesamte Preisintervall von 650.- bis 2599.- Euro nach Preisschwellen untersucht und die Ausprägungen zwischen den Schwellenwerten gruppiert werden. Dabei wäre zudem zu beachten, dass Entscheider unterschiedlicher Zielgruppen Preise bzw. Preisunterschiede unterschiedlich wahrnehmen könnten. Sollen die Ausprägungen somit auf Basis der Wahrnehmungen der Probanden gruppiert werden, müsste diese Zusammenfassung auf Zielgruppenebene erfolgen, was den Erhebungsaufwand erhöhen würde.

Gruppe 1

Gruppe 2

Gruppe 3

Gruppe 4

Gruppe 5

Gruppe 6

Gruppe 7

Gruppe 8

Gruppe 9 Gruppe 10

650-799

800-949

950-1099 1100-1249 1250-1399 1400-1549 1550-1699 1700-1849 1850-1999 2400-2599

Tabelle 50: Gruppen von Ausprägungen für die Eigenschaft “Preis” beim Untersuchungsobjekt „Laptop”

Die Merkmalsausprägungen, die innerhalb einer dieser Gruppen von einem Befragungsteilnehmer genannt wurden, werden zusammengefasst, indem der Mittelwert aus den jeweiligen Nennungen gebildet wird. Dies soll anhand des folgenden Beispiels verdeutlicht werden: Proband 25 hat im Intervall von 1100-1249 Euro (entsprechend Tabelle 50 ist dies Gruppe 4) die beiden Merkmalsausprägungen „1130,- Euro“ und „1159,- Euro“ genannt. Als indivi-

dueller Mittelwert aus den beiden Statements ergibt sich „1144,50 Euro“. Auf gleicher Weise werden für alle Befragungsteilnehmer in jeder Gruppe die individuellen Mittelwerte berechnet - diese entsprechen der neuen Bezeichnung der Eigenschaftsausprägungen auf individueller Ebene. Bei Gruppe 4 (1100-1249 Euro) wurden bei insgesamt 13 Befragungsteilnehmern Ausprägungen erhoben. Die Bezeichnung der neu zu bildenden Gruppe, d.h. die Bezeichnung der gruppierten Eigenschaftsausprägung auf aggregierter Ebene ergibt sich aus dem Gesamtmittelwert, der aus den individuellen Mittelwerten berechnet werden kann (in diesem Beispiel „1183“, siehe Tabelle 51). Analog wurden die neuen Bezeichnungen für alle weiteren Ausprägungen der Eigenschaft „Preis“ bestimmt. Nummer Gesamtdes Pro3 8 9 13 16 18 21 23 25 26 27 31 33 mittelbanden wert: (n = 13) Individuelle Mittelwerte 1189 1199 1199 1219 1227 1209 1100 1183 1145 1204 1150 1157 1199 1183 je Proband Tabelle 51: Zusammenfassung der individuellen Mittelwerte der Eigenschaftsausprägung zur Bestimmung der Bezeichnung der Merkmalsausprägung auf aggregierter Ebene bei Gruppe 4

Für das Untersuchungsobjekt „Laptop“ ergaben sich bei der Eigenschaft „Preis“ folgende Ausprägungen der Merkmale (siehe Tabelle 52). Gruppe1 Gruppe2 Gruppe3 Gruppe4 Gruppe5 Gruppe6 Gruppe7 Gruppe8 Gruppe9 Gruppe10 Intervall Bezeichnung der Ausprägungen

650-

800-

950-

1100-

1250-

1400-

1550-

1700-

1850-

2400-

799

949

1099

1249

1399

1549

1699

1849

1999

2599

750

910

1040

1183

1310

1440

1600

1700

1999

2687

Tabelle 52: Gruppierte Ausprägungen der Eigenschaft „Preis“ beim Untersuchungsobjekt „Laptop“

Auch die Häufigkeit der Nennungen muss nach der Gruppierung neu berechnet werden. Dies ist notwendig, damit die berechneten Häufigkeiten zwischen den untersuchten Eigen349

schaften vergleichbar sind. Den gedanklichen Ausgangspunkt zur Notwendigkeit der Neuberechnung der Häufigkeiten bilden die erhobenen Nennungen bei Merkmalen mit nichtmetrischen Ausprägungen. Dies soll anhand des folgenden Beispiels erläutert werden: Beispiel: Im Evoked-Set eines Befragungsteilnehmers befinden sich zwei Laptops der Marke „HP“ und drei der Marke „IBM“. Wird der Entscheider nun nach den für ihn relevanten Ausprägungen der Eigenschaft „Marke“ befragt, so wird er jeweils 1 mal die Marken „HP“ und „IBM“ nennen. Eine Eigenschaftsausprägung wird folglich einmal für jeden Befragungsteilnehmer gezählt. Entsprechend müssen die Häufigkeiten der neu gruppierten Merkmalsausprägungen neu berechnet werden. Das Ergebnis ist eine Liste mit vergleichbaren Häufigkeitsmaßen für die Ausprägungen aller erhobenen Eigenschaften. Nun können bei allen untersuchten Eigenschaften die Ausreißer bei den Ausprägungen eliminiert werden, um die Auswertung der genannten Daten zu vereinfachen. In dieser Studie

wurde festgelegt, dass eine Ausprägung von mindestens 10 % der Befragungsteilnehmer genannt werden musste. Dies entspricht einer geforderten Mindestzahl von vier Nennungen je Ausprägung.1873 Bei dem Untersuchungsobjekt „Laptop“ verbleiben 53 Ausprägungen, die 513 Nennungen der Befragungsteilnehmer widerspiegeln. Dies entspricht 71% aller Nennungen von Ausprägungen. Zwischenergebnis nach diesem Schritt ist eine Menge von potenziell relevanten Eigenschaf-

ten sowie Ausprägungen, bei denen die Ausreißer sowohl auf Ebene der Merkmale als auch auf der der Ausprägungen eliminiert wurden. Dieses Eigenschaftsset kann im Folgenden auf unterschiedliche Zielgruppen hin untersucht werden. Die Grundlage dieser Vorgehensweise

bildet die Erkenntnis, dass Befragungsteilnehmer, die unterschiedliche Bedürfnisse aufweisen, verschiedene Eigenschaften und Ausprägungen für ihre Entscheidung als relevant ansehen. Unterschiedliche Bedürfnisgruppen werden in dieser Studie mit Hilfe der „Two-Step Clusteranalyse“ der Firma SPSS ermittelt. Dabei handelt es sich um ein Verfahren, das die Untersuchung von kategorialen Variablen ermöglicht. Für das Untersuchungsobjekt „Laptop“ konnten unter den befragten Studenten keine unterschiedlichen Gruppen identifiziert werden.1874

1873 1874

350

Eine solche Vorgehensweise erleichtert die Auswertung der Daten erheblich, allerdings können so sehr kleine Zielgruppen so u.U. nicht mehr berücksichtigt werden. Auch anhand der Analyse der Nutzungssituation konnten keine unterschiedlichen Gruppen bestimmt werden.

In einem nächsten Schritt soll die Zahl der Ausprägungen innerhalb einer Zielgruppe weiter reduziert werden. Zu diesem Zweck wird die durchschnittliche Häufigkeit der genannten Ausprägungen über alle Merkmale berechnet. Für das Untersuchungsobjekt „Laptop“ ergibt sich ein Mittelwert von 9,79 Nennungen je Eigenschaft. Alle Ausprägungen, die 9 mal bzw. seltener und damit unterdurchschnittlich häufig erhoben wurden, werden ausgeschlossen. Es verbleiben 20 Ausprägungen, die insgesamt 311 mal genannt wurden. Eigenschaften, die nach der Eliminierung lediglich eine Ausprägung aufweisen, werden aus der weiteren Untersuchung ausgeschlossen, da diese über keinerlei Unterscheidungskraft mehr verfügen. Sie werden jedoch wieder in der Warm-Up Phase vor der Präferenzmessung zur Beschreibung des Evoked-Sets als grundlegende Anforderungen genutzt. Die verbliebenen Eigenschaften und Ausprägungen (siehe Tabelle 53) dienen als einheitliche Bewertungsgrundlage zur Einschätzung der Relevanz der Eigenschaften.

Eigenschaft Marke Preis Displaygröße Festplattengröße Optisches Laufwerk WLAN Akkulaufzeit Gewicht

Ausprägungen Acer, FujitsuSiemens, Sony 1040,- Euro, 1180,- Euro, 1310,- Euro 15 Zoll, 15,4 Zoll 40 GB, 60 GB, 80 GB DVD u. CD Brenner, DVD Double Layer u. CD Brenner vorhanden, nicht vorhanden 2,1 Stunden, 3,1 Stunden 2,8 kg, 3 kg

Grundlegende Anforderungen: - Taktfrequenz des Prozessors: 1,6 GHz - Arbeitsspeicher (RAM): 512 MB - Betriebssystem: Windows XP Home - USB-Standard: USB 2.0 Tabelle 53: Saliente Eigenschaften und Ausprägungen des Untersuchungsobjekts „Laptop“

Ergebnisse der angepassten Elicitation Technik für das Untersuchungsobjekt “Fernseher”

Die grundlegende Vorgehensweise zur Bestimmung von salienten Eigenschaften und Ausprägungen beim Untersuchungsobjekt „Fernseher“ entspricht dem in den Kapiteln 6.1.2 beschriebenen Ablaufschema. Bei dem Untersuchungsobjekt „Fernseher“ wurden 34 Studenten befragt. Insgesamt wurden 311 Nennungen zu 56 Eigenschaften erhoben. Zudem wurden 228 Ausprägungen (dies entspricht 524 Nennungen) erhoben (siehe Tabelle 54).

351

Eigenschaften

Eigenschaftsausprägungen

311

524

56

228

Anzahl der Nennungen Anzahl der verschiedenen Nennungen

Tabelle 54: Anzahl der genannten Eigenschaften und Ausprägungen in der angepassten Elicitation Technik (n = 34)

Auch beim Untersuchungsobjekt „Fernseher“ ist die Zahl erhobenen Eigenschaften und Ausprägungen sehr hoch. Anhand der Häufigkeitsverteilung der Nennungen in Tabelle 55 wird allerdings deutlich, dass viele Merkmale lediglich 1 bis 5 mal genannt wurden. Anzahl der Eigenschaften von mehr als 50% der Befragungsteilnehmern genannt (mehr als 17 mal) 16-20 11-15 6-10 1-5 davon lediglich 1 mal genannt Summe

Anzahl der Eigenschaftsausprägungen

6

10,71%

2

0,88%

6 3 6 41 18 56

10,71% 5,36% 10,71% 73,21% 32,14% 100,00 %

2 4 16 206 149 228

0,88% 1,75% 7,02% 90,35% 65,35% 100,00 %

Tabelle 55: Häufigkeit der Nennungen von Eigenschaften (n = 34)

In einem ersten Schritt werden wiederum die Ausreißer unter den genannten Eigenschaften eliminiert. Analog zum Untersuchungsobjekt „Laptop“ wurde eine Mindestanzahl von acht Nennungen festgelegt, d.h. Eigenschaften sollten von mindestens 25% der Befragungsteilnehmer angegeben worden sein. Es verbleiben so zwölf Eigenschaften mit 207 Nennungen. Dies entspricht etwa 67% der Gesamtzahl der Statements bezüglich der Eigenschaften. Danach werden die Ausprägungen der Eigenschaften gruppiert, die ein metrisches Skalenniveau aufweisen. Für das Untersuchungsobjekt „Fernseher“ sind dies die drei Merkmale „Bildschirmdiagonale“, „Preis“ und „Lautsprecherleistung“. Die Zusammenfassung der Eigenschaftsausprägungen erfolgt in identischer Weise zu dem bereits beim Untersuchungsobjekt „Laptop“ beschriebenen Beispiel. Nachdem die Ausprägungen der oben beschriebenen Merkmale gruppiert wurden, erfolgt die Neuberechnung der Häufigkeiten der gruppierten Ausprägungen sowie die Eliminierung aller Ausreißer. Bei dem Untersuchungsobjekt „Laptop“ wurde gefordert, dass eine Ausprägung

von mindestens 10% der Befragungsteilnehmer genannt werden sollte. Nutzt man diese Grenze, so müssen die Ausprägungen bei dem Untersuchungsobjekt „Fernseher“ mindestens vier mal genannt werden. Nach der Eliminierung verbleiben 38 verschiedene Ausprägungen mit insgesamt 323 Nennungen, dies entspricht 62% der ursprünglichen Statements. 352

Die bisher ermittelten Eigenschaften und Ausprägungen dienen anschließend als Basis für die Bestimmung unterschiedlicher Bedürfnisgruppen. Hier wurde wiederum auf die Two-Step Clusteranalyse zur Ermittlung von Kundengruppen zurückgegriffen. Dabei konnten für das Untersuchungsobjekt „Fernseher“ zwei verschiedene Zielgruppen identifiziert werden (siehe Tabelle 56).

Cluster

1 2

Gesamtwert

n

% der Gesamtsumme

18 16 34

52,9% 47,1% 100,0%

Tabelle 56: Unterschiedliche Bedürfnisgruppen für das Untersuchungsobjekt „Fernseher”

Zur Bestimmung der zu untersuchenden Eigenschaften werden diese beiden Bedürfnisgruppen im Folgenden getrennt ausgewertet.1875

Im nächsten Schritt erfolgt die Reduzierung der zu untersuchenden Merkmalsausprägungen je Segment. Dabei wird wiederum die durchschnittliche Anzahl der Nennung von Merkmalsausprägungen berechnet und als Entscheidungskriterium genutzt. Für Gruppe 1 ergibt sich ein Mittelwert von „4,5“, für Gruppe 2 ein Wert von „3,6“ für die durchschnittliche Anzahl der genannten Merkmalsausprägungen. Insofern werden in Gruppe 1 alle Ausprägungen eliminiert, die vier mal und seltener genannt wurden. Bei Gruppe 2 wurden alle Ausprägungen aus der weiteren Untersuchung ausgeschlossen, die nicht mindestens vier mal genannt wurden. Es verbleiben für „Gruppe 1“ 19 Ausprägungen mit insgesamt 133 Nennungen bzw. für „Gruppe 2“ 17 Ausprägungen mit 103 Nennungen. Eigenschaften mit lediglich einer verbliebenen salienten Ausprägung werden als Grundanforderung definiert und im Rahmen des Warm-Up Tasks genutzt. In Tabelle 57 werden die weiter zu untersuchenden Eigenschaften und Ausprägungen präsentiert. Diese bilden eine für die jeweilige Zielgruppe einheitliche Bewertungsgrundlage für alle weiteren Schritte.

1875

Unterschiedliche Nutzungssituationen wurden aufgrund der Stichprobenhomogenität der Befragungsteilnehmer (Studenten) nicht beobachtet und werden deshalb im Folgenden nicht berücksichtigt.

353

Gruppe 1 Marke Bildschirmdiagonale Bildschirmformat Gehäusefarbe

Gruppe 2

Philips, Sony, Thomson, JVC, Panasonic

Marke

4:3, 16:9 schwarz; silbern

Bildschirmdiagonale Bildschirmformat Gehäusefarbe

Preis

310,- Euro, 480,- Euro

Preis

Bildfrequenz Virtual Dolby Surround

50 Hz, 100 Hz vorhanden, nicht vorhanden normale Bildröhre, Real Flat Bildröhre

Projektionstechnik Virtual Dolby Surround

Bildröhre

52 cm,

70 cm

Grundanforderungen: - Videotext vorhanden - Lautsprecherleistung 20 Watt - Lautsprecher in Stereo Projektion: Röhrenfernseher

Philips, Sony, Panasonic 52 cm, 70 cm, 108 cm 4:3, 16:9 schwarz, silbern 480,- Euro, 730,- Euro, 920,- Euro LCD, Plasma vorhanden, nicht vorhanden

Grundanforderungen: - Videotext vorhanden - Videotextspeicher 40 Seiten - Standardauflösung 1280x768 Pixel

Tabelle 57: Saliente Eigenschaften und Ausprägungen des Untersuchungsobjekts „Fernseher“

Anhand einer Gegenüberstellung der salienten Eigenschaften und Ausprägungen (siehe Tabelle 57) werden die Unterschiede zwischen den beiden Bedürfnisgruppen offensichtlich. Gruppe 1 könnte als eher „preissensible“ Zielgruppe beschrieben werden, deren Mitglieder traditionelle Röhrenfernseher kaufen. Gruppe 2 besteht demgegenüber aus „anspruchsvolleren“ Konsumenten, die keine Röhrenfernseher mehr kaufen würden. Sie setzen stattdessen eher auf modernere Projektionstechniken wie LCD oder Plasma-Displays und sind dafür auch bereit, mehr Geld zu investieren.

7.3.3 Bewertung der Merkmalsausprägungen und Eigenschaften

Die verbliebenen salienten Eigenschaften und Ausprägungen werden in einer zweiten Befragungsphase von den Probanden hinsichtlich ihrer Entscheidungsrelevanz eingeschätzt. Wie bereits in den Kapiteln 2.2, 4.2.6.3, 5.2.2.4 und 6.1.4 beschrieben, ergibt sich die Relevanz einer Eigenschaft allein aus der Bandbreite der vom Entscheider wahrgenommenen Nutzenunterschiede der jeweils untersuchten Merkmalsausprägungen. Dieser Aspekt soll durch Anwendung einer vereinfachten Self-Explicated Methode zur Bestimmung der Relevanz von Eigenschaften zugrunde gelegt werden. Wurden unterschiedliche Bedürfnisgruppen wie beispielsweise beim Untersuchungsobjekt „Fernseher“ ermittelt, muss die Relevanz der Merkmale im Folgenden getrennt bestimmt werden, d.h. die Zielgruppen schätzen jeweils nur die ihren Anforderungen entsprechenden Eigenschaften und Ausprägungen ein. Zu diesem Zweck werden den Entscheidern zunächst alle gruppenspezifischen Eigenschaftssets präsentiert. Der Befragungsteilnehmer entscheidet 354

nun selbst, welches Eigenschaftsset die für ihn relevanten Eigenschaften und Ausprägungen enthält und bewertet nur diese. In einem ersten Bewertungsschritt wurden die Befragungsteilnehmer gebeten, die individuell wahrgenommene Bandbreite der Eigenschaften festzulegen. Diese wird vom Entschei-

dungsträger ermittelt, indem er für jedes Merkmal die Ausprägungen bestimmt, die er am meisten bzw. am wenigsten bevorzugt. Nach der Ermittlung der wahrgenommenen Nutzenunterschiede zwischen den Ausprägungen, die die Bandbreite eines Merkmals bilden, können in einem zweiten Schritt die Eigenschaften entsprechend ihrer Entscheidungsrelevanz eingeschätzt werden. Wie in Kapitel 6.1.4 be-

schrieben, wird vom Probanden zunächst die wichtigste und dann die am wenigsten wichtige Eigenschaft bestimmt, diesen werden „100“ bzw. „0“ Punkte zugewiesen. Zur Beschreibung der Merkmalsbewertungen wurden die folgenden Formulierungen verwendet, die sich an die Wortwahl, die innerhalb von Self-Explicated Methoden genutzt wird,1876 anlehnen: Wichtigste Eigenschaft

Bitte entscheiden Sie sich zuerst, welche der Eigenschaften für Sie die wichtigste ist. Erläuterung: Bei dieser Eigenschaft ist die Verbesserung von der schlechtesten zur besten Ausprägung für Sie am wertvollsten. Geben Sie dieser Eigenschaft einen Punktwert von „100“.

Unwichtigste Eigenschaft

Bitte entscheiden Sie sich nun, welche der Eigenschaften für Sie die am wenigsten wichtige ist. Erläuterung: Bei dieser Eigenschaft ist die Verbesserung von der schlechtesten zur besten Ausprägung für Sie am wenigsten wertvoll. Geben Sie dieser Eigenschaft einen Punktwert von „0“.

Tabelle 58: Frageformulierungen zur Bestimmung der wichtigsten und unwichtigsten Eigenschaften

Nachdem die beiden Anker (wichtigste und unwichtigste Eigenschaften) bestimmt wurden, können die weiteren Produktmerkmale bewertet werden, indem die Befragungsteilnehmer den Attributen entsprechende Punktwerte zwischen „0“ und „100“ zuweisen.

1876

Siehe dazu beispielsweise Hensel-Börner (2000), 192.

355

Zur Einschätzung der weiteren Eigenschaften wurden folgende Formulierungen genutzt: Bewerten Sie nun die restlichen Eigenschaften im Vergleich zu der wichtigsten und unwichtigsten Eigenschaft. Erläuterung: Je wichtiger die Eigenschaft ist, desto höher ist ihr Punktwert. Wenn Ihnen verschiedene Eigenschaften gleich wichtig sind, können Sie diesen den gleichen Punktwert geben.

Tabelle 59: Frageformulierung zur Einschätzung der Bedeutung von Merkmalen

Im Folgenden werden die Ergebnisse der Einschätzungen für die beiden Untersuchungsobjekte „Laptop“ und „Fernseher“ präsentiert. Bewertung der Merkmalsausprägungen und Eigenschaften für das Untersuchungsobjekt „Laptop“

Beim Untersuchungsobjekt „Laptop“ konnten, wie beschrieben, keine unterschiedlichen Bedürfnisgruppen identifiziert werden. Alle Befragungsteilnehmer beurteilen deshalb dasselbe Eigenschaftsset. Anhand der individuellen Einschätzungen wurde jeweils der Mittelwert berechnet, um ein aggregiertes Maß für die Relevanz einer Eigenschaft zu ermitteln. In der folgenden Tabelle 60 werden die Ergebnisse der Relevanzeinschätzungen präsentiert. Eigenschaft Preis Akkulaufzeit Festplattengröße Marke

Aggregierte Einschätzung der Relevanz 91,2 70,0 69,0 50,3

WLAN optisches Laufwerk Displaygröße

46,9 42,9 32,1

Gewicht

29,8

Tabelle 60: Ergebnisse der Einschätzung der Relevanz von Eigenschaften beim Untersuchungsobjekt „Laptop” (n = 52)

Zur Festlegung der Anzahl der im Weiteren zu untersuchenden Eigenschaften wurden in Kapitel 6.1.5 zwei Möglichkeiten vorgeschlagen. So könnten Bewertungsschwellen in den Einschätzungen der Befragungsteilnehmer als eine Möglichkeit zur Bestimmung der Zahl der zu untersuchenden Eigenschaften genutzt werden. In der folgenden Abbildung 53 werden deshalb die aggregierten Einschätzungen der Befragungsteilnehmer grafisch dargestellt.

356

Mittelwerte für die Einschätzung der Relevanz

100

50

0 1

2

3

4

5

6

7

8

Anzahl der Eigenschaften

Abbildung 53: Grafische Darstellung der Relevanzeinschätzungen für das Untersuchungsobjekt „Laptop“

Da in diesem Fall keine einzelne Bewertungsschwelle genau bestimmbar ist, wurde auf die zweite, in Kapitel 6.1.5 beschriebene Möglichkeit zurückgegriffen, d.h. ein vom Marktforscher a priori festgelegter Schwellenwert wird als Grenze für die Aufnahme von Eigenschaften gewählt. In dieser Studie wurde ein Wert von „50“ als Grenzwert definiert.1877 Alle Merkmale, deren Relevanzeinschätzungen deutlich darunter liegen, werden nicht weiter betrachtet. Es wurde a priori eine entsprechende Grenze gewählt, weil die Anzahl der Eigenschaften einerseits auf Basis der notwendigen Informationsmenge bestimmt werden sollte, andererseits eine klassische Variante der Conjoint-Analyse zur Präferenzmessung eingesetzt wird, bei der die Selektion der Eigenschaften eine besonders wichtige Rolle spielt, da vergleichsweise wenig Merkmale untersucht werden können. Bei einem Grenzwert um „50“ kann man davon ausgehen, dass zumindest die wichtigsten Bewertungsdimensionen innerhalb der Präferenzmessung berücksichtigt werden. Ein entsprechender Grenzwert garantiert bei diesem Untersuchungsobjekt zudem eine möglichst hohe Vergleichbarkeit der drei untersuchten Gruppen (Elicitation Technik, Duale Methode und Neue Methode). Es werden in allen drei Gruppen vier Merkmale untersucht. Unterschiedliche Ergebnisse in der Güte der Präferenzmessung können so bei diesem Untersuchungsobjekt ausschließlich auf das unterschiedliche Eigenschaftsset zurückgeführt werden. Es verbleiben die Eigenschaften „Preis“, „Akkulaufzeit“, „Festplatte“ und „Marke“. Es werden somit folgende Eigenschaften und Ausprägungen weiter untersucht (siehe Tabelle 61).

1877

Siehe Kapitel 6.1.2.5.

357

Eigenschaft

Ausprägungen

Preis Akkulaufzeit Festplattenkapazität Marke

1040,- Euro, 1180,- Euro, 1310,- Euro 2,1 Stunden, 3,1 Stunden 40 GB, 60 GB, 80 GB Acer, FujitsuSiemens, Sony

Tabelle 61: Eigenschaftsset für das Untersuchungsobjekt “Laptop”

Bewertung der Merkmalsausprägungen und Eigenschaften für das Untersuchungsobjekt „Fernseher“

Wie bereits beschrieben, konnten für das Untersuchungsobjekt „Fernseher“ zwei unterschiedliche Bedürfnisgruppen identifiziert werden, die sich im Hinblick auf die Anforderungen und deshalb ebenfalls bezüglich der relevanten Eigenschaften und Ausprägungen unterscheiden. In Tabelle 62 werden die Mittelwerte der Einschätzungen für Gruppe 1 präsentiert. Eigenschaft

Aggregierte Einschätzung der Relevanz 78,5 75,2 61,2 46,2 42,1 40,0 35,1 31,7

Preis Bildschirmdiagonale Bildfrequenz Bildschirmformat Bildröhre Virtual Dolby Surround Marke Gehäusefarbe

Tabelle 62: Ergebnisse der Einschätzung der Relevanz von Eigenschaften bei Gruppe 1 beim Untersuchungsobjekt „Fernseher” (n = 27)

Mittelwerte für die Einschätzung der Relevanz

Diese Werte können wie in der folgenden Abbildung 54 grafisch dargestellt werden. 100

50

0 1

2

3

4

5

6

7

Anzahl der Eigenschaften

Abbildung 54: Grafische Darstellung der Relevanzeinschätzungen der Gruppe 1 für das Untersuchungsobjekt „Fernseher“ (n = 27) 358

Auch bei dieser Darstellung ergaben sich keine eindeutigen Bewertungsschwellen, die zur Bestimmung der Anzahl von Eigenschaften genutzt werden könnten. Aus diesem Grund wurde wie beim Untersuchungsobjekt „Laptop“ bei Gruppe 1 die Zahl der zu untersuchenden Eigenschaften anhand der Schwelle von einem Relevanzwert von „50“ festgelegt, d.h. der Relevanzwert der untersuchten Eigenschaften sollte die festgelegte Grenze von „50“ nicht stark1878 unterschreiten. In diesem Fall trifft dies auf die Eigenschaften „Preis“, „Bildschirmdiagonale“, „Bildfrequenz“ und „Bildformat“ zu, die in der folgenden Präferenzmessung genauer untersucht werden sollen (siehe Tabelle 63). Eigenschaft

Ausprägungen

Preis

310,- Euro, 480,- Euro

Bildschirmdiagonale

52 cm,

Bildfrequenz

50 Hz, 100 Hz

Bildformat

4:3, 16:9

70 cm

Tabelle 63: Eigenschaftsset für das Untersuchungsobjekt „Fernseher“ für Gruppe 1

Für Gruppe 2 des Untersuchungsobjekts „Fernseher“ ergeben sich folgende Mittelwerte für die Relevanz der Eigenschaften (siehe Tabelle 64). Eigenschaft

Aggregierte Einschätzung der Relevanz

Preis

86,3

Bildschirmdiagonale

76,7

Projektionstechnik

55,0

Virtual Dolby Surround

54,2

Bildschirmformat

48,1

Marke

40,0

Gehäusefarbe

31,0

Tabelle 64: Ergebnisse der Einschätzung der Relevanz von Eigenschaften bei Gruppe 2 beim Untersuchungsobjekt „Fernseher” (n = 24)

Bei der grafischen Darstellung der Relevanzwerte (siehe Abbildung 55) wird deutlich, dass eine Bewertungsschwelle nach der zweiten Eigenschaft zu beobachten ist. Preis und Bildschirmdiagonale sind bei diesem Untersuchungsobjekt für Gruppe 2 die ausschlaggebenden Produktmerkmale.

1878

In dieser Studie wurden auch Eigenschaften aufgenommen, die die Grenze von „50“ zwar unterschritten haben, aber die Abweichung von diesem Wert kleiner als 5% war, d.h. es wurden auch Eigenschaften aufgenommen, deren Relevanzeinschätzungen größer als „47,5“ waren.

359

Mittelwerte für die Einschätzung der Relevanz

100

50

0 1

2

3

4

5

Anzahl der Eigenschaften

6

7

Abbildung 55: Grafische Darstellung der Relevanzeinschätzungen der Gruppe 2 für das Untersuchungsobjekt „Fernseher“ (n = 24)

Da zwei Eigenschaften für die Präferenzmessung ein möglicherweise zu stark vereinfachtes Entscheidungsproblem darstellen, wurde auch in diesem Fall die a priori festgelegte Grenze von „50“ genutzt. Alle Eigenschaften, die diesen Wert stark unterschritten haben,1879 wurden nicht in die weitere Untersuchung einbezogen; dies betrifft in die Attribute „Marke“ und „Gehäusefarbe“. Die fünf Eigenschaften „Preis“, „Bildschirmdiagonale“, „Projektionstechnik“, „Virtual Dolby Surround“ und „Bildschirmformat“ (siehe Tabelle 65) werden in der sich anschließenden Präferenzmessung weiter berücksichtigt. Eigenschaft

Ausprägungen

Preis Bildschirmdiagonale Projektionstechnik Virtual Dolby Surround Bildschirmformat

480,- Euro, 730,- Euro, 920,- Euro 52 cm, 70 cm, 108 cm LCD, Plasma nicht vorhanden, vorhanden 4:3, 16:9

Tabelle 65: Eigenschaftsset für das Untersuchungsobjekt „Fernseher“ für Gruppe 2

Im Vergleich zu den beiden Eigenschaftssets der „Elicitation Technik“ und der „Dualen Methode“ mit jeweils vier Produktmerkmalen werden in dieser Gruppe fünf Eigenschaften untersucht. Die Festlegung der Anzahl der Eigenschaften erfolgt für die beiden Gruppen 1 und 2 des Untersuchungsobjekts „Fernseher“ bei der neu vorgeschlagenen Methode auf Basis der Einschätzungen der Befragungsteilnehmer, d.h. der Mittelwerte der Relevanzeinschätzungen für eine Kundengruppe. Ziel ist es dabei, die Entscheidungssituation so darzustellen, dass sie

1879

360

Alle Eigenschaften, deren Abweichung größer als 5% von dem geforderten Mindestwert von „50“ ist, werden eliminiert.

das Problem aus Sicht der jeweiligen Entscheider möglichst „vollständig“ beschreibt, gleichzeitig aber nicht zu umfangreich ist und die Probanden überfordert. Zwischenfazit zur Bewertung der Eigenschaften und Ausprägungen

Durch die Bewertung der Eigenschaften auf Basis der wahrgenommenen Nutzenbandbreiten der Ausprägungen konnten die Produktmerkmale entsprechend ihrer Entscheidungsrelevanz bei einem konkreten Entscheidungsproblem in eine Rangfolge gebracht werden. Die Erhebung der Daten und deren Auswertung ist relativ einfach und schnell möglich. Allerdings ist die Festlegung der Anzahl der weiter zu untersuchenden Eigenschaften nicht in jedem Fall eindeutig. Zur Festlegung der Anzahl der zu untersuchenden Eigenschaften wurden in Kapitel 6.1.5 zwei alternative Vorgehensweisen vorgeschlagen: -

zum einen könnten Bewertungsschwellen in den Einschätzungen genutzt werden oder

-

es wird vom Marktforscher eine Bewertungsgrenze festgelegt. Eigenschaften, die diese Schwelle stark unterschreiten, werden nicht in die weitere Untersuchung aufgenommen.

Für die beiden Untersuchungsobjekte konnten zwar Bewertungsschwellen gefunden werden, diese schienen aber zur Bestimmung der Anzahl der zu untersuchenden Eigenschaften ungeeignet, da -

mehrere Bewertungsschwellen beobachtet wurden oder

-

bei Nutzung von Bewertungsschwellen zur Festlegung der Anzahl der Eigenschaften das Entscheidungsproblem sehr stark vereinfacht worden wäre.1880

Als weitere Möglichkeit zur Ermittlung der Anzahl der zu untersuchenden Produktmerkmale könnte eine Bewertungsgrenze festgelegt werden. Eigenschaften, die eine vom Marktforscher festgelegte Schwelle deutlich unterschreiten, werden aus der weiteren Untersuchung ausgeschlossen. In dieser Studie wurde für die beiden Untersuchungsobjekte eine Grenze von „50“1881 genutzt. Problematisch an dieser Vorgehensweise ist, dass die Festlegung -

der Bewertungsgrenze und

-

des Punkts, ab dem diese als „deutlich“ unterschritten gilt,

mehr oder weniger subjektiv durch den Marktforscher erfolgt.1882

1880

So würden bei der Nutzung von Bewertungsschwellen für Gruppe 2 beim Untersuchungsobjekt „Fernseher” lediglich zwei Eigenschaften in die Präferenzmessung eingehen. Dies entspricht einer „mittleren“ Ausprägung, da die Relevanzeinschätzungen in einem Intervall von „0“ bis „100“ liegen können. 1882 Entsprechendes gilt allerdings für die meisten Maßzahlen, die in der Marktforschung genutzt werden. So wurden von Fisher (1929, 59f.) die Grenzen bei Signifikanztests (p = 0,01 oder p = 0,05) auf Basis von Plausibilitätsüberlegungen festgelegt und später von anderen Marktforschern übernommen. 1881

361

Deshalb wird, wie in dieser Studie geschehen, vorgeschlagen, die eigentliche Bewertungsgrenze vor der Bewertung der Eigenschaften und Ausprägungen festzulegen.

7.3.4 Prüfung der Eigenschaften auf Präferenzinterdependenzen

Nachdem die in der Präferenzmessung zu untersuchenden Eigenschaften und Ausprägungen bestimmt wurden, müssen diese auf mögliche Interaktionen hin überprüft werden, da Interaktionen die Schätzungen verzerren können.1883 Lineare Nutzenfunktionen sind relativ robust gegenüber Interaktionseffekten,1884 so dass erst bei Cross-Over Interaktionseffekten mit einer sinkenden Validität der Ergebnisse gerechnet werden muss. Cross-Over Interaktionen haben einen entscheidenden Einfluss auf die Validität der Befragungsergebnisse, weil sich durch das Vorhandensein einer bestimmten Eigenschaftsausprägung beim Attribut A die Präferenzrangfolge der Eigenschaftsausprägungen bei Attribut B verändert.1885 Zur Bestimmung der Interaktionseffekte wird die in Kapitel 6.1.6 vorgeschlagene Vorgehensweise, d.h. die Nutzung von Trade-off Matrizen, angewendet. Wie bereits in Kapitel 6.1.6 beschrieben, können inkonsistente Antworten bei der Nutzung von Trade-off Matrizen nicht ausgeschlossen werden. Mit einer steigenden Anzahl von Eigenschaftsausprägungen wird die Einschätzung der Alternativen innerhalb der Tabelle unübersichtlicher, deshalb ist in diesem Fall mit einer höheren Wahrscheinlichkeit für inkonsistente Antworten bei der Bewertung der Trade-off Matrizen zu rechnen. Bei der Anwendung von Trade-off Matrizen zur Bestimmung von Interaktionseffekten kann somit nicht ohne weiteres zwischen inkonsistenten Antworten und tatsächlichen Cross-Over Interaktionen unterschieden werden.1886 Daher sollen im Folgenden Interaktionen erst ab einem bestimmten Schwellenwert innerhalb der Präferenzmessung berücksichtigt werden. In dieser Studie wurde festgelegt, dass Cross-Over Interaktionen nur dann (z.B. durch Bildung von Superattributen) berücksichtigt werden sollen, wenn sie bei mindestens 50% der Befragungsteilnehmer beobachtet werden.

1883 1884 1885 1886

362

Für eine ausführliche Beschreibung der Auswirkungen von Interaktionen siehe Kapitel 4.2.3.1 und 6.1.6. Vgl. Carmone; Green; Jain (1978), 302. Siehe dazu auch Kapitel 4.2.3. Entsprechendes gilt allerdings ebenso für die von Voeth (2000, 207ff.) beschriebene alternative Methode zur a priori Bestimmung von Interaktionseffekten.

Prüfung des Eigenschaftssets auf Präferenzunabhängigkeit für das Untersuchungsobjekt „Laptop“

In Tabelle 66 wird die Häufigkeit für das Auftreten von Cross-Over Interaktionen dargestellt. In der linken Spalte werden dabei die Eigenschaftspaare der untersuchten Trade-off Matrizen präsentiert.1887 In der zweiten Spalte der Tabelle werden die einzelnen Attribute und die Häufigkeit dargestellt, mit der diese bei den Befragungsteilnehmern eine Cross-Over Interaktion hervorgerufen haben.1888 In der dritten Spalte der Tabelle kann die Gesamtzahl der Probanden, bei denen Cross-Over Interaktionen innerhalb einer Trade-off Matrix beobachtet wurden, abgelesen werden.1889 Es ist somit anhand der Ergebnisse in Tabelle 66 erkennbar, ob und wie häufig eine Eigenschaft in Kombination mit einem anderen Attribut Cross-Over Interaktionen hervorruft (zweite Spalte) und wie häufig zwischen zwei Merkmalen insgesamt Cross-Over Interaktionen auftreten (dritte Spalte). Verursacht eine bestimmte Eigenschaft bzw. eine bestimmte Ausprägung eines Attributs verstärkt in Kombination mit einem anderen Merkmal Cross-Over Interaktionen, so könnte dieses Problem durch Nutzung von Kompromissdesigns berücksichtigt werden.1890 Ist demgegenüber zwischen zwei Attributen insgesamt mit dem Auftreten von Cross-Over Interaktionen zu rechnen, so könnten entsprechende Superattribute gebildet werden.1891 Bei der Interpretation der Ergebnisse wird schrittweise vorgegangen, d.h. zunächst wird überprüft, ob zwischen zwei Merkmalen insgesamt Cross-Over Interaktionen vorliegen, die über der maximalen Schwelle von 50% liegen (dritte Spalte) – ist dies der Fall kann weiterhin untersucht werden, welche Eigenschaft diese Cross-Over Interaktionen hervorruft (zweite Spalte). Verursacht ein bestimmtes Merkmal verstärkt Cross-Over Interaktionen, könnte in einem

1887

Zudem wird die Anzahl der Ausprägungen dieser Merkmale (d.h. die Komplexität der Matrix) und die Anzahl der in der Vorstudie von den Befragungsteilnehmern ausgefüllten Trade-off Matrizen dargestellt. In einer ersten Trade-off Matrix wurden beispielsweise die Eigenschaften „Akkulaufzeit“ und „Preis“ untersucht, dabei wird ein Merkmal durch zwei und ein anderes durch drei Ausprägungen beschrieben – es sind demnach sechs Einschätzungen notwendig. Insgesamt 48 Probanden haben diese Trade-off Matrix vollständig ausgefüllt. 1888 Bei der ersten Trade-off Matrix (Akkulaufzeit + Preis) hat die Eigenschaft „Preis“ bei drei Probanden (dies entspricht 6,25% der Antworten) Cross-Over Interaktionen hervorgerufen, bei der Eigenschaft „Akkulaufzeit“ bei fünf Entscheidern (dies entspricht 10,42% der Antworten). 1889 Bei der Trade-off Matrix „Akkulaufzeit + Preis“ haben die beiden Attribute bei insgesamt acht Entscheidern Cross-Over Interaktionen hervorgerufen, dies entspricht 16,67% der Befragungsteilnehmer. 1890 Verursacht eine Eigenschaftsausprägung in Kombination mit der Ausprägung bzw. den Ausprägungen eines anderen Attributs verstärkt Cross-Over Interaktionen, so kann mit Hilfe der Trade-Off Matrizen auch bestimmt werden, welche konkrete Merkmalsausprägung diese Interaktionseffekte hervorruft – diese Ausprägung(en) kann bzw. können innerhalb von Kompromissdesigns mit den Ausprägungen der anderen Eigenschaft vollständig kombiniert und so Interaktionen geschätzt werden (siehe Kapitel 6.1.6). 1891 Siehe dazu auch Abbildung 47 in Kapitel 6.1.6.

363

weiteren Schritt untersucht werden, ob eine bestimmte Ausprägung diese verzerrenden Effekte hervorruft.1892 Betrachtet man in Tabelle 66 die dritte Spalte, wird deutlich, dass bei keiner Trade-off Matrix die vom Marktforscher festgelegte Grenze von 50% überschritten wurde. Im Folgenden werden deshalb potenzielle Interaktionseffekte bei diesem Eigenschaftsset nicht weiter berücksichtigt. Trade-off Matrix

Cross-Over Interaktionen durch Ausprägungen der Eigenschaften

AkkulaufzeitPreis (1x2, 1x3 Ausprägungen; 6 Einschätzungen)

(n = 48) PreisFestplattenkapazität (2x3 Ausprägungen; 9 Einschätzungen)

(n = 48) AkkulaufzeitMarke (1x2, 1x3 Ausprägungen; 6 Einschätzungen)

(n = 49) PreisMarke (2x3 Ausprägungen; 9 Einschätzungen)

(n = 49) AkkulaufzeitFestplattenkapazität (1x2; 1x3 Ausprägungen; 6 Einschätzungen)

(n = 49) MarkeFestplattenkapazität (2x3 Ausprägungen; 9 Einschätzungen)

(n = 49)

Cross-Over Interaktionen insgesamt

n

Prozent

Preis

3

6,25%

Akkulaufzeit

5

10,42%

Festplattenkapazität

3

6,25%

Preis

4

8,33%

Marke

0

0,00%

Akkulaufzeit

4

8,16%

Marke

10

20,41%

Preis

6

12,24%

Festplattenkapazität

0

0,00%

Akkulaufzeit

0

0,00%

Marke

1

2,04%

Festplattenkapazität

5

10,20%

1893

n

Prozent

8

16,67%

6

12,50%

4

8,16%

12

24,49%

0

0,00%

5

10,20%

Tabelle 66: Häufigkeit von Cross-Over Interaktionen bei dem Untersuchungsobjekt „Laptop”

Prüfung des Eigenschaftssets auf Präferenzunabhängigkeit für das Untersuchungsobjekt „Fernseher“

Für das Untersuchungsobjekt „Fernseher“ wurden zwei Bedürfnisgruppen ermittelt - deshalb ist es notwendig, Interaktionseffekte jeweils getrennt zu untersuchen (siehe Tabelle 67 und Tabelle 68). Die Ergebnisse für Gruppe 1 werden in der folgenden Tabelle 67 präsentiert, auch hier wurde die vom Marktforscher festgelegte Schwelle (bei 50% der Befragungsteilnehmer treten Cross-

1892

Die Ermittlung der Ausprägungen, die verstärkt Cross-Over Interaktionen hervorrufen, wurde in Kapitel 6.1.6 beschrieben. In Tabelle 66 werden diese Ergebnisse jedoch nicht dargestellt, weil die vom Marktforscher definierte Grenze nicht überschritten wurde. 1893 Doppelzählungen wurden vermieden, d.h. wenn bei einem Probanden zwei Eigenschaftsausprägungen Cross-Over Interaktionen verursacht hatten, zählt dies insgesamt als eine Trade-off Matrix mit Interaktionseffekt.

364

Over Interaktionen auf) bei keiner der Trade-off Matrizen überschritten (siehe dritte Spalte), so dass in der folgenden Präferenzmessung keine Interaktionseffekte berücksichtigt werden. Trade-off Matrix

Cross-Over Interaktionen durch Ausprägungen der Eigenschaften n

Prozent

BildschirmdiagonalePreis

Bildschirmdiagonale

3

12,00%

Preis

2

8,00%

Bildfrequenz

2

8,00%

Preis

0

0,00%

Bildfrequenz

0

0,00%

Bildschirmdiagonale

0

0,00%

Bildschirmformat

2

7,69%

Bildschirmfrequenz

1

3,85%

Bildschirmdiagonale

3

11,54%

Bildschirmformat

1

3,85%

Bildschirmformat

3

11,54%

Preis

0

0,00%

(2x2 Ausprägungen; 4 Einschätzungen)

(n = 25) BildfrequenzPreis (2x2 Ausprägungen; 4 Einschätzungen)

(n = 25) BildfrequenzBildschirmdiagonale (2x2 Ausprägungen; 4 Einschätzungen)

(n = 26) BildschirmformatBildschirmfrequenz (2x2 Ausprägungen; 4 Einschätzungen)

(n = 26) BildschirmdiagonaleBildschirmformat (2x2 Ausprägungen; 4 Einschätzungen)

(n = 26) BildschirmformatPreis (2x2 Ausprägungen; 4 Einschätzungen)

(n = 26)

Cross-Over Interaktionen insgesamt n

Prozent

5

20,00%

2

8,00%

0

0,00%

3

11,54%

3

11,54%

3

11,54%

Tabelle 67: Häufigkeit von Cross-Over Interaktionen bei dem Untersuchungsobjekt „Fernseher” für Gruppe 1

In Tabelle 68 wird das Eigenschaftsset für das Untersuchungsobjekt „Fernseher“ bei Gruppe 2 auf Cross-Over Interaktionen überprüft. In einem ersten Schritt wird dabei erneut zunächst untersucht, ob zwischen zwei Merkmalen Cross-Over Interaktionen auftreten. Auch in dieser Gruppe wurde der festgelegte Schwellenwert, ab dem Interaktionen in der Präferenzmessung untersucht werden sollen, nicht erreicht. Bei Gruppe 2 werden deshalb potenzielle Interaktionseffekte nicht weiter berücksichtigt.

365

Trade-off Matrix

Cross-Over Interaktionen durch Ausprägungen der Eigenschaften n

Prozent

BildschirmdiagonalePreis

Bildschirmdiagonale

7

30,43%

Preis

6

26,09%

Preis

2

8,70%

Projektionstechnik

3

13,04%

(2x3 Ausprägungen; 9 Einschätzungen)

(n = 23) PreisProjektionstechnik (1x2, 1x3 Ausprägungen; 6 Einschätzungen)

(n = 23) PreisVirtualDolbySurround

Preis

2

8,70%

VirtualDolby (n = 23) Surround

4

17,39%

Preis

2

8,70%

Bildschirmformat

4

17,39%

Bildschirmdiagonale

2

8,70%

Bildschirmformat

5

21,74%

Bildschirmdiagonale

0

0,00%

Projektionstechnik

2

8,70%

Bildschirmdiagonale

3

13,04%

4

17,39%

Bildschirmformat

0

0,00%

Projektionstechnik

1

4,35%

VirtualDolby Surround

1

4,35%

0

0,00%

0

0,00%

1

4,35%

(1x2, 1x3 Ausprägungen; 6 Einschätzungen)

PreisBildschirmformat (1x2, 1x3 Ausprägungen; 6 Einschätzungen)

(n = 23) BildschirmdiagonaleBildschirmformat (1x2, 1x3 Ausprägungen; 6 Einschätzungen)

(n = 23) BildschirmdiagonaleProjektionstechnik (1x2, 1x3 Ausprägungen; 6 Einschätzungen)

(n = 23) BildschirmdiagonaleVirtualDolbySurround

VirtualDolby (n = 23) Surround

(1x2, 1x3 Ausprägungen; 6 Einschätzungen)

Bildschirmformat Projektionstechnik (2x2 Ausprägungen; 4 Einschätzungen)

(n = 23) VirtualDolbySurroundBildschirmformat (2x2 Ausprägungen; 4 Einschätzungen)

VirtualDolbySurroundProjektionstechnik

Cross-Over Interaktionen insgesamt

(n = 23) Bildschirmformat VirtualDolby Surround

(2x2 Ausprägungen; 4 Einschätzungen)

(n = 23) Projektionstechnik

n

Prozent

9

39,13%

4

17,39%

5

21,74%

4

17,39%

5

21,74%

2

8,70%

5

21,74%

1

4,35%

1

4,35%

1

4,35%

Tabelle 68: Häufigkeit von Cross-Over Interaktionen bei dem Untersuchungsobjekt „Fernseher” für Gruppe 2

7.3.5 Festlegung des Eigenschaftssets je nach Bedürfnisgruppe

In den vorangegangenen Kapiteln wurden die aus Sicht der Befragungsteilnehmer salienten Eigenschaften und Merkmalsausprägungen erhoben, entsprechend ihrer Relevanz eingeschätzt und die Eigenschaften, die die Auswahlentscheidung besonders stark beeinflussen, selektiert. Zudem wurde überprüft, ob erhebliche Interaktionseffekte zwischen den Ausprägungen der relevanten Eigenschaften existieren.

366

Da für die beiden Untersuchungsobjekte „Laptop“ und „Fernseher“ bei den in Kapitel 7.3.3 bestimmten Eigenschaftssets keine gravierenden Interaktionseffekte festgestellt wurden, können diese ohne weitere Anpassungen im Rahmen der Präferenzmessung genutzt werden. Es ergeben sich die Eigenschaftssets in Tabelle 69, Tabelle 70 und Tabelle 71, die im Folgenden untersucht werden. Eigenschaft

Ausprägungen

Preis

1040,- Euro, 1180,- Euro, 1310,- Euro

Akkulaufzeit

2,1 Stunden, 3,1 Stunden

Festplattenkapazität

40 GB, 60 GB, 80 GB

Marke

Acer, FujitsuSiemens, Sony

Tabelle 69: Eigenschaftsset für das Untersuchungsobjekt „Laptop”

Eigenschaft

Ausprägungen

Preis

310,- Euro, 480,- Euro

Bildschirmdiagonale

52 cm,

Bildfrequenz

50 Hz, 100 Hz

Bildformat

4:3, 16:9

70 cm

Tabelle 70: Eigenschaftsset für das Untersuchungsobjekt „Fernseher“ für Gruppe 1

Eigenschaft

Ausprägungen

Preis

480,- Euro, 730,- Euro, 920,- Euro

Bildschirmdiagonale

52 cm, 70 cm, 108 cm

Projektionstechnik

LCD, Plasma

VirtualDolbySurround

nicht vorhanden, vorhanden

Bildschirmformat

4:3, 16:9

Tabelle 71: Eigenschaftsset für das Untersuchungsobjekt „Fernseher“ für Gruppe 2

Mit der hier vorgestellten Methode ist es möglich, Eigenschaften und Ausprägungen ausgehend von den Bedürfnissen der Entscheider zu bestimmen. Den Ausgangspunkt bilden dabei die Evoked-Sets der Nachfrager, so dass auf Basis der Erhebungsdaten bereits unterschiedliche Zielgruppen identifiziert werden können. Im folgenden Kapitel wird untersucht, ob durch die Nutzung von zielgruppenspezifischen Eigenschaftssets die Güte der Präferenzmessung verbessert und so die Übertragbarkeit der Ergebnisse auf reale Wahlentscheidungen erhöht werden kann.

367

7.4

Empirischer Vergleich des Einflusses alternativer Methoden zur Bestimmung der relevanten Eigenschaften auf die Ergebnisse der Präferenzmessung

Ziel der Präferenzmessung ist es, tatsächliche Produktwahlentscheidungen zu prognostizieren. Dies ist nur möglich, wenn die Bewertungsaufgabe einer realer Entscheidungssituation möglichst gut entspricht. Im Folgenden werden deshalb die Auswirkungen unterschiedlicher Eigenschaftssets im Rahmen einer empirischen Studie überprüft. Wie in Kapitel 7.1.4 beschrieben wurden zu diesem Zweck drei Gruppen gebildet (siehe Abbildung 56). Die in den vorangegangenen Kapiteln mit Hilfe der Elicitation Technik (Gruppe 1) und der Dualen Befragung (Gruppe 2) bestimmten Eigenschaftssets dienen als Referenzpunkt zur Bewertung der Eignung der neu vorgeschlagenen Methode (Gruppe 3). Für alle drei Gruppen wurden die Präferenzen jeweils für die Untersuchungsobjekte „Laptop“ (1. Teil des Fragebogens) und „Fernseher“ (2. Teil des Fragebogens) erhoben. Die Ergebnisse der Präferenzmessung sollen im Folgenden anhand der in Kapitel 3.10 beschriebenen Gütemaße verglichen werden. Aufbauend auf diesen Daten kann die Vorteilhaftigkeit der in Kapitel 6 vorgeschlagenen Methode zur Bestimmung von Eigenschaftssets im Vergleich zu den traditionellen Verfahren eingeschätzt werden. Traditionelle Ansätze zur Festlegung des Eigenschaftssets

Vorschlag zur Festlegung des Eigenschaftssets

Gruppe 1

Gruppe 2

Gruppe 3

Conjoint-Analyse auf Basis der Eigenschaften der

Conjoint-Analyse auf Basis der Eigenschaften der

Conjoint-Analyse auf Basis der Eigenschaften der

Elicitation Technik

Dualen Befragung

neu entwickelten Methode

1. Fragebogen: Laptop

1. Fragebogen: Laptop

1. Fragebogen: Laptop

2. Fragebogen: Fernseher

2. Fragebogen: Fernseher

2. Fragebogen: Fernseher

Abbildung 56: Untersuchungsgruppen bei der Präferenzmessung

Die Befragungen fanden in der Zeit vom 20. Juni bis 01. Juli 2005 statt. Der zeitlich enge Rahmen sollte sicherstellen, dass unterschiedliche Ergebnisse der Präferenzmessung nicht durch mögliche Änderungen der am Markt verfügbaren Alternativen verursacht werden. Die Stichprobe bestand aus Studenten der wirtschaftswissenschaftlichen Fakultät der FriedrichSchiller-Universität Jena, die jeweils im Rahmen von unterschiedlichen Vorlesungen befragt wurden. Die Nutzung von Studenten einer Fakultät soll insbesondere gewährleisten, dass die drei Gruppen möglichst gut miteinander vergleichbar sind und Unterschiede in den Gütemaßen tatsächlich auf die verschiedenen Eigenschaftssets zurückgeführt werden können. Um die

368

Befragungsteilnehmer zu einer sorgfältigen Beantwortung des Fragebogens zu motivieren, wurden insgesamt 240,- Euro verlost.1894 Bei der Gruppe 1 (Elicitation Technik) wurden 70 Fragebögen ausgefüllt, der Fragebogen der Gruppe 2 (Duale Methode) wurde 65 mal beantwortet, während der Fragebogen der neu vorgeschlagenen Vorgehensweise (Gruppe 3) von 84 Studenten bearbeitet wurde (siehe Tabelle 72). Gruppe 1

Gruppe 2

Gruppe 3

(Elicitation Technik)

(Duale Befragung)

(Neue Methode)

70 68

65 65

84 84 84

69

59

(Gruppe 1: 49,

Fragebögen insgesamt Vollständig Laptop ausgefüllte FraFernseher gebögen

Gruppe 2: 35)

Tabelle 72: Anzahl der ausgefüllten Fragebögen im Rahmen der Präferenzmessung

Der strukturelle Aufbau und das Layout aller Fragebögen wurden, um entsprechende Einflüsse zu vermeiden, so ähnlich wie möglich gestaltet.1895 Der gesamte Fragebogen besteht aus zwei Einzelfragebögen – in einem ersten Teil wurden die Präferenzen zum Untersuchungsobjekt „Laptop“ und in einem zweiten Teil die für das Untersuchungsobjekt „Fernseher“ erhoben. Die genaue Struktur eines Einzelfragebogens wird in Abbildung 57 dargestellt. Gruppe 1 Elicitation Technik

1. Warm-Up Task (+ Selbstselektion)

2. Zeiterfassung

3. Conjoint-Analyse 4. Zeiterfassung

5. Befragungssituation 6. Referenzmethode

Gruppe 2 Duale Befragung

- Vorstellung der Entscheidungssituation - Präsentation aller Eigenschaften und Ausprägungen - Erläuterung der Vorgehensweise zur Bewertung der Paarvergleiche bei der Conjoint-Analyse

Gruppe 3 neue Methode zudem: - Präsentation aller Kundengruppen mit deren jeweils relevanten Eigenschaftssets - individuelle Einordnung der Probanden zu verschiedenen Zielgruppen - kurze Erläuterung der Eigenschaften

- Erfassung der Uhrzeit vor der Präferenzmessung

- Bewertung der Stimuli im Rahmen von Paarvergleichen

- Erfassung der Uhrzeit nach der Präferenzmessung

- Einschätzung verschiedener Statements auf einer Rating-Skala

- Bewertung von sechs zufällig gebildeten Alternativen mit Hilfe von Kaufwahrscheinlichkeiten

Abbildung 57: Aufbau des Fragebogens für ein Untersuchungsobjekt

1894 1895

Bei Gruppe 3 wurden bei dieser Verlosung entsprechend Kapitel 6.2.1 lediglich diejenigen Entscheidungsträger berücksichtigt, die bei beiden Untersuchungsobjekten und sämtlichen Gütemaßen ein Mindestmaß an Konsistenz aufwiesen. Siehe beispielsweise Anhang XII und XIII.

369

Im ersten Teil des Fragebogens sollen die Befragungsteilnehmer mit Hilfe eines Warm-Up Tasks auf die jeweiligen Untersuchungsobjekte eingestimmt werden. Dazu werden zunächst das Bewertungsproblem anhand der relevanten Eigenschaften, deren Ausprägungen sowie der Mindestanforderungen und die allgemeine Vorgehensweise zur Bewertung der Alternativen beschrieben. Konnten zudem bei der Anwendung der neuen Methode unterschiedliche Kundengruppen identifiziert werden, wurden die Befragungsteilnehmer gebeten, sich selbst einer dieser Gruppen zuzuordnen, d.h. ein Eigenschaftsset zu selektieren, bei dem die untersuchten Merkmale und Ausprägungen den Bedürfnissen den Entscheider am meisten entsprechen. Direkt vor und nach der eigentlichen Präferenzmessung wurde die aktuelle Uhrzeit erhoben, um die Dauer der Präferenzmessung berechnen zu können.1896 Zur Erfassung der individuellen Präferenzen wurde eine Conjoint-Analyse auf Basis von Paarvergleichen genutzt, bei der die relative Vorziehenswürdigkeit auf einer Rating-Skala erfasst wurde. Jeweils nach der Präferenzmessung wurden verschiedene Statements zur Einschätzung der Befragungssituation bewertet. Im letzten Teil der Fragebögen sollten die Probanden im Rahmen einer Referenzmethode jeweils sechs Alternativen mit Hilfe von Kaufwahrscheinlichkeiten bewerten.

7.4.1 Beschreibung der Methode zur Präferenzmessung

Die Präferenzen der einzelnen Entscheidungsträger sollen im Rahmen dieser Studie mit Hilfe einer klassischen Conjoint-Analyse auf Basis von abgestuften Paarvergleichen erhoben werden. Bei der Anwendung dieses Verfahrens können im Vergleich zu anderen Methoden relativ wenig Eigenschaften berücksichtigt werden, weshalb der Selektion der Eigenschaften und Ausprägungen eine besonders wichtige Rolle zukommt. Durch die Wahl dieser Verfahrensvariante der Conjoint-Analyse können aber auch die Auswirkungen einer Erhöhung der Anzahl der zu bewertenden Eigenschaften und Paarvergleiche untersucht werden. Wie bereits in Kapitel 3.3 beschrieben, wird davon ausgegangen, dass bei der Nutzung eines für den Entscheidungsträger relevanten Eigenschaftssets die Untersuchung von tendenziell mehr Informationen (d.h. mehr Eigenschaften und Ausprägungen bzw. eine höhere Anzahl an Paarvergleichen) möglich ist. Zudem stellen die klassischen Verfahren der Conjoint-Analyse sicher, dass jeder einzelne Schritt der Datenerhebung und Nutzenschätzung vollständig nachvollziehbar ist. Bei verschiedenen kommerziellen Standardverfahren zur Präferenzmessung wie der ACA oder der

1896

370

Die Bearbeitungsdauer dient dabei wie in Kapitel 3.10.3 beschrieben als ein Indikator zur Einschätzung der Befragungssituation. So könnte vermutet werden, dass mit steigender Interviewdauer die Motivation der Befragungsteilnehmer sinkt, was einen negativen Einfluss auf die Güte der Präferenzmessung haben könnte.

CBC ist dies nicht der Fall, da Teile der Datenerhebung und die Nutzenschätzung nicht vollständig veröffentlicht sind und diese somit eher Black-Box Verfahren darstellen.1897 Um die Teilnutzen anhand von Alternativenbewertungen schätzen zu können, muss vor der Erfassung der Präferenzen, wie in Kapitel 3.4 beschrieben, jeweils ein Erhebungsdesign gebildet werden. Dabei wurden die Addelman-Basispläne als Ausgangspunkt für die Erstellung eines orthogonalen Erhebungsdesigns genutzt.1898 In der folgenden Tabelle 76 wird ein entsprechendes orthogonales Ergebungsdesign dargestellt.1899 Preis 00 - 1040,- Euro

Produkt 1 Produkt 2 Produkt 3 Produkt 4 Produkt 5 Produkt 6 Produkt 7 Produkt 8 Produkt 9

1180,-

1310,-

1 0 1 1 0 0 0 0 0

0 1 0 0 0 0 0 1 1

Marke 00 - Acer Fujitsu Sony Siemens 1 0 1 0 0 1 0 0 0 0 0 1 1 0 0 0 0 1

Festplatte 00 - 40 GB

Akkulaufzeit 0 - 2,1 h

60 GB

80 GB

3,1 h

0 0 1 0 0 0 1 1 0

0 1 0 1 0 1 0 0 0

1 0 0 0 0 1 0 1 0

Tabelle 73: Orthogonales Design für die Neue Methode beim Untersuchungsobjekt „Laptop“

Für das Untersuchungsobjekt „Laptop“ ergaben sich nach Bestimmung eines orthogonalen Erhebungsdesigns auf Basis der Addelman-Pläne bei allen Gruppen neun Alternativen. Beim Untersuchungsobjekt „Fernseher“ wurden für die Gruppen 1 und 2 wiederum jeweils neun, für Gruppe 3.1 acht und für Gruppe 3.2 16 Stimuli bestimmt. Bei einer vollständigen Kombination von neun Alternativen zu Paarvergleichen müssten insgesamt 9*(9-1)/2 = 36 Paarvergleiche von den jeweiligen Entscheidungsträgern bewertet werden. In einem zweiten Schritt kann deshalb mit Hilfe eines quadratischen Partially Balanced Incomplete Block Designs die Zahl der notwendigen Paarvergleiche auf 18 reduziert werden.1900 Es ergeben sich für das Beispiel „Laptop“ bei der Gruppe 3 (Neue Methode) die in Tabelle 74 dargestellten Paarvergleiche, die in einer zufälligen Reihenfolge den Entscheidungsträgern zur Bewertung vorgelegt wurden.1901

1897 1898 1899 1900 1901

Siehe dazu auch Kapitel 3.1. Zur vereinfachten Erstellung der orthogonalen Designs wurde SPSS Orthoplan genutzt. Für alle weiteren orthogonalen Erhebungsdesigns für die sechs untersuchten Gruppen siehe Anhang VI. Siehe Kapitel 3.1. Die Differenzendesigns aller weiteren Gruppen werden im Anhang VI präsentiert.

371

Preis 00 - 1040,- Euro Paarvergleiche 5-6 4-5 8-9 2-3 1-2 4-6 5-8 1-3 6-9 2-8 3-6 7-9 2-5 1-4 3-9 7-8 1-7 4-7

1180,-

1310,-

0 1 0 -1 1 1 0 0 0 0 1 0 0 0 1 0 1 1

0 0 0 1 -1 0 -1 0 -1 0 0 -1 1 0 -1 -1 0 0

Marke 00 - Acer Fujitsu Sony Siemens 0 -1 0 0 0 -1 1 -1 0 0 0 -1 0 0 1 -1 0 0 1 0 0 0 1 -1 1 0 1 0 0 0 1 0 0 0 -1 0

Festplatte 00 - 40 GB

Akkulaufzeit 0 - 2,1 h

60 GB

80 GB

3,1 h

0 0 1 -1 0 0 -1 -1 0 -1 1 1 0 0 1 0 -1 -1

-1 1 0 1 -1 0 0 0 1 1 -1 0 1 -1 0 0 0 1

-1 0 1 0 1 -1 -1 1 1 -1 -1 0 0 1 0 -1 1 0

Tabelle 74: Differenzendesign mit zufällig angeordneten Paarvergleichen für die Neue Methode beim Untersuchungsobjekt „Laptop“

Auch bei der Gruppe 3.2 kann für das Untersuchungsobjekt „Fernseher“ die Zahl der Einschätzungen verringert werden. Den Ausgangspunkt dafür bilden die 16 bestimmten Alternativen des orthogonalen Erhebungsdesigns. Bei einer vollständigen Kombination aller Stimuli ergäben sich 120 Paarvergleiche. Durch Anwendung des Partially Balanced Incomplete Block Designs konnte die Zahl der notwendigen Bewertungen auf 48 reduziert werden, was dennoch eine vergleichsweise hohe Anzahl darstellt. Bei der Gruppe 3.1 (Untersuchungsobjekt „Fernseher“) konnte weder ein Partially Balanced Incomplete Block Design, noch die von Hausruckinger; Herker (1992, 104ff.) vorgeschlagene Methode angewendet werden,1902 so dass hier sämtliche möglichen Paarvergleichskombinationen gebildet und untersucht wurden. Es ergeben sich somit 8*(8-1)/2 = 28 notwendige Einschätzungen. In der folgenden Tabelle 75 wird die Anzahl der notwendigen Bewertungen im Überblick für alle Gruppen und Untersuchungsobjekte präsentiert. Untersuchungsobjekt Laptop Fernseher

Gruppe 1 18 18

Anzahl der Stimuli Gruppe 2 Gruppe 3 18 18 18 3.1: 28 3.2: 48

Tabelle 75: Anzahl der zu bewertenden Paarvergleiche

Bei den Gruppen 3.1 und 3.2 ist angesichts des Umfangs an notwendigen Einschätzungen möglicherweise mit Ermüdungserscheinungen der Entscheidungsträger und aus diesem Grund 1902

372

Siehe dazu Kapitel 3.4.

mit tendenziell schlechteren Bewertungen zu rechnen (siehe auch Kapitel 3.1 bzw. 3.3) - deshalb wäre hier der Einsatz einer anderen Methode zur Präferenzmessung sinnvoll gewesen. Eine Variation der Präferenzmessmethode hätte jedoch die Vergleichbarkeit der Gruppen eingeschränkt, weshalb identische Verfahren genutzt wurden. Die ungleiche Anzahl der notwendigen Bewertungen und die unterschiedliche Zahl der untersuchten Eigenschaften und Ausprägungen ermöglicht indessen die Prüfung, ob selbst in solchen Situationen, die Vorteile der Nutzung von relevanten Eigenschaften sowie Ausprägungen bestehen bleiben. Die vergleichsweise hohe Anzahl an nötigen Bewertungen bei Gruppe 3.1 und 3.2 wurde bewusst in Kauf genommen, weil so: -

alle aus Sicht der Entscheidungsträger als relevant bestimmten Merkmale und

-

die Auswirkungen einer unterschiedlichen Anzahl von Eigenschaften und Ausprägungen

Ausprägungen in die Untersuchung einbezogen werden konnten und bzw. Paarvergleichen bei einem Vergleich zwischen traditionellen und der neuen Vorgehensweise zur Bestimmung des Eigenschaftssets analysiert werden können. Die relative Vorziehenswürdigkeit der zu untersuchenden Alternativen wurde auf Basis von Paarvergleichen mittels einer 9 Punkte Rating-Skala1903 eingeschätzt. Die Eigenschaften und Ausprägungen wurden mit Hilfe von verbalen Beschreibungen präsentiert. Die Teilnutzenwerte wurden daraufhin auf individueller Ebene mit Hilfe der OLS Regression geschätzt1904 und auf Basis von Gleichung 91905 standardisiert. Auf Basis der Teilnutzen und der Gütemaße können nun die Auswirkungen unterschiedlicher Eigenschaftssets auf die Ergebnisse der Präferenzmessung untersucht werden.

7.4.2 Auswahl verschiedener Gütemaße zum Vergleich der untersuchten Gruppen

Um die Ergebnisse der drei Gruppen miteinander vergleichen zu können, stehen sämtliche in Kapitel 3.10 beschriebenen Gütemaße zur Verfügung. Die Reliabilität der Präferenzmessung soll im Rahmen dieser Arbeit nicht überprüft werden. Es handelt sich bei den ausgewählten Produkten um Gütergruppen mit relativ kurzen Produktlebenszyklen, so dass sich die relevanten Eigenschaftsausprägungen, aber aus diesem Grund auch die Präferenzen, in einem steten Veränderungsprozess befinden. Deshalb erscheint es unmöglich, Unterschiede in den Präferenzen zwischen den Ergebnissen zweier verschiedener Zeitpunkte allein auf die Methode zurückzuführen und methodenspezifische Effekte von einer Präferenzänderung der Entscheidungsträger zu separieren. 1903 1904 1905

Diese weist einen Wertebereich von „-4“…“0“ bis „+4“ auf, siehe als Beispiel Abbildung 10 in Kapitel 3.4. Siehe Kapitel 3.6. Siehe Kapitel 3.7.

373

Folgende Validitätsmaße werden im Rahmen dieser Studie zur Einschätzung der Güte der Präferenzmessung untersucht: -

Augenscheinvalidität,

-

interne Validität und

-

Prognosevalidität.

Ein Vergleich der Gruppen mit Hilfe von Maßzahlen der konvergierenden Validität ist nicht sinnvoll, da hier identische Verfahren zur Präferenzmessung genutzt werden, die Bewertungsgrundlage (d.h. die Eigenschaften und Ausprägungen) jedoch zwischen den Gruppen variiert. Auch die externe Validität wird nicht untersucht, da sich die befragten Entscheidungsträger nicht tatsächlich in einem Kaufentscheidungsprozess befanden und insbesondere bei den Gruppen 1 (Elicitation Technik) und 2 (Duale Befragung) u.U. keine entsprechenden Produkte am Markt erhältlich sind. Weiterhin stehen die Maße zur „Befragungssituation“ und die Analyse des Entscheidungsverhaltens im Zentrum des Interesses, da vermutet wird, dass die Nutzung von relevanten Eigenschaften und Ausprägungen die Anwendung von Trade-off Entscheidungen begünstigt und die Motivation der Entscheidungsträger erhöht. Diese Gütemaße nehmen eine zentrale Stellung ein, da untersucht werden kann, ob Trade-off Bewertungsstrategien vom Entscheider angewendet wurden und die Ergebnisse der Präferenzmessung auf reale Wahlentscheidungen übertragen werden können.

7.4.3 Augenscheinvalidität

Mit Hilfe der Augenscheinvalidität kann überprüft werden, ob die geschätzten Teilnutzen der Eigenschaftsausprägungen eines Merkmals plausibel sind, d.h. die Reihenfolge der Vorziehenswürdigkeit bestimmter Eigenschaften den Erwartungen des Marktforschers entspricht. Insofern kann die Augenscheinvalidität lediglich bei bestimmten Produktmerkmalen überprüft werden. Ein Vergleich zwischen den betrachteten Gruppen ist nur eingeschränkt möglich, weil in den drei Gruppen unterschiedliche Eigenschaften und insbesondere Ausprägungen untersucht werden. Deshalb erfolgt im Folgenden eine getrennte Analyse der Maßzahlen, so dass lediglich Tendenzaussagen möglich sind. Da in Gruppe 1 und 2 die Bandbreite der Ausprägungen größer ist, muss hier mit einer tendenziell höheren Augenscheinvalidität gerechnet werden. Dabei wird davon ausgegangen,

374

dass es dem Befragungsteilnehmer bei einer großen Bandbreite leichter fällt, die Ausprägungen in eine „sinnvolle“ Rangfolge zu bringen.1906 Überprüfung der Augenscheinvalidität für das Untersuchungsobjekt „Laptop“

In Gruppe 1 (Elicitation Technik) wurden die Eigenschaften „Preis“, „Akkulaufzeit“, „Gewicht“ und „Festplattenkapazität“, jeweils beschrieben durch drei Ausprägungen, untersucht. Bei allen vier Eigenschaften kann a priori eine plausible Rangfolge der Ausprägungen gebildet werden. So ist zu vermuten, dass bei sonst identischen Ausprägungen der Entscheidungsträger einen Laptop mit: -

einem niedrigeren Preis,

-

einer längeren Akkulaufzeit,

-

einem geringeren Gewicht und

-

einer höheren Festplattenkapazität bevorzugen wird.

Entsprechend kann eine plausible Rangfolge der Vorziehenswürdigkeit der Ausprägungen im Vorfeld der Untersuchung festgelegt werden (siehe Tabelle 76). Eigenschaft Preis Akkulaufzeit Gewicht Festplattenkapazität

plausible Rangfolge der Ausprägungen 1.) 699,- Euro

2.) 1749,- Euro

3.) 2799,- Euro

1.) 8,5 h

2.) 4,75 h

3.) 1 h

1.) 1 kg

2.) 2,7 kg

3.) 4,4 kg

1.) 120 GB

2.) 75 GB

3.) 30 GB

Tabelle 76: Vermutete Rangfolge der Vorziehenswürdigkeit der Ausprägungen bei Gruppe 1

In Tabelle 77 wird die Häufigkeit der Erfüllung dieser a priori vermuteten Rangfolge dargestellt.

Anzahl Prozent

Preis

Akkulaufzeit

Gewicht

63 93 %

46 68 %

26 38 %

Festplattenkapazität 57 84 %

Gesamt 11 16 %

Tabelle 77: Häufigkeit der Erfüllung der a priori Rangfolge bei Gruppe 1 (n = 68)

Insgesamt zeigt sich für die Eigenschaften „Preis“ und „Festplattenkapazität“ eine hohe Augenscheinvalidität. Bei dem Merkmal „Akkulaufzeit“ ist eine eher mittlere Augenscheinvalidität zu beobachten, während der Anteil der Entscheidungsträger, bei denen beim Attribut „Gewicht“ die vermutete und die tatsächlich beobachtete Rangfolge übereinstimmen, dras-

1906

Siehe Kapitel 3.10.1. Dies ist zumindest dann zu erwarten, wenn sich die Anzahl der Ausprägungen zwischen den betrachteten Gruppen nicht unterscheidet.

375

tisch sinkt. Betrachtet man zudem alle vier Eigenschaften gemeinsam, so entsprechen die geschätzten Teilnutzen lediglich in 16% der Fälle der a priori prognostizierten Reihenfolge. Bei Gruppe 2 (Duale Befragung) wurden die Merkmale „Preis“, „Akkulaufzeit“, „Austauschservice“ und „Festplattenkapazität“ untersucht, die jeweils durch drei Ausprägungen definiert wurden. Auch hier kann für jede Eigenschaft eine a priori Rangfolge aufgestellt werden (siehe Tabelle 127). Eigenschaft Preis Akkulaufzeit Austauschservice Festplattenkapazität

plausible Rangfolge der Ausprägungen 1.) 699,- Euro

2.) 1749,- Euro

3.) 2799,- Euro

1.) 8,5 h

2.) 4,75 h

3.) 1 h

1.) 24 Monate Vor-Ort

2.) 12 Monate Vor-Ort

3.) 12 Monate Einsendung

1.) 120 GB

2.) 75 GB

3.) 30 GB

Tabelle 78: Vermutete Rangfolge der Vorziehenswürdigkeit der Ausprägungen bei Gruppe 2

In Tabelle 128 wird die Häufigkeit der Erfüllung der a priori vermuteten Rangfolge der Teilnutzen präsentiert.

Anzahl Prozent

Preis

Akkulaufzeit

65 100 %

64 98 %

Austauschservice 31 48 %

Festplattenkapazität 63 97 %

Gesamt 29 45 %

Tabelle 79: Häufigkeit der Erfüllung der a priori Rangfolge bei Gruppe 2 (n = 65)

Bezüglich der Eigenschaft „Preis“ stimmt die vermutete mit der tatsächlich erhobenen Rangfolge der Vorziehenswürdigkeit einzelner Merkmalsausprägungen bei allen Entscheidungsträgern überein. Daneben ist bei den Merkmalen „Akkulaufzeit“ und „Festplattenkapazität“ ein hohes Ausmaß an Übereinstimmung der prognostizieren und beobachteten Reihenfolge zu erkennen. Bei allen drei Eigenschaften erscheint somit die Rangfolge der Teilnutzen sinnvoll. Dies trifft allerdings nicht für die Ausprägungen der Eigenschaft „Austauschservice“ zu, bei diesem Merkmal stimmt bei weniger als der Hälfte der Befragungsteilnehmer die vom Marktforscher vermutete mit der erhobenen Rangfolge der Vorziehenswürdigkeit der Merkmalsausprägungen überein. Bezüglich beider Gruppen ist zusammenfassend bei einigen Merkmalen eine hohe und anderen eine niedrige Augenscheinvalidität zu beobachten. Auch in Gruppe 3 (neu vorgeschlagene Methode) wurden vier Eigenschaften untersucht; von diesen vier Merkmalen lassen sich jedoch nur drei (Preis, Akkulaufzeit, Festplattenkapazität) in eine a priori sinnvolle Rangfolge bringen. Bei dem Attribut „Marke“ ist dies nicht möglich (siehe Tabelle 80). 376

Eigenschaft Preis Akkulaufzeit Festplattenkapazität Marke

plausible Rangfolge der Ausprägungen 1.) 1040,- Euro

2.) 1180,- Euro

1.) 3,1 h

2.) 2,1h

1.) 80 GB

2.) 60 GB

3.) 1310,- Euro 3.) 40 GB

Keine a priori Rangfolge möglich (Acer, FujitsuSiemens, Sony)

Tabelle 80: Vermutete Rangfolge der Vorziehenswürdigkeit der Ausprägungen bei Gruppe 3

Für die drei Eigenschaften Preis, Akkulaufzeit und Festplattenkapazität wird in Tabelle 81 die Häufigkeit der Übereinstimmung der a priori vermuteten Reihenfolge mit der beobachteten Reihenfolge dargestellt.

Anzahl Prozent

Preis

Akkulaufzeit

73 87%

82 98%

Festplattenkapazität 77 92%

Gesamt 66 79%

Tabelle 81: Häufigkeit der Erfüllung der a priori Rangfolge bei Gruppe 3 (n = 84)

Für alle drei untersuchten Merkmale kann ein hohes Ausmaß an Übereinstimmung zwischen a priori vermuteter und der durch die Präferenzmessung geschätzten Reihenfolge der Vorziehenswürdigkeit einzelner Ausprägungen beobachtet werden. Da bei Gruppe 3 die Anzahl der bei der Untersuchung der Augenscheinvalidität berücksichtigten Merkmale und Ausprägungen kleiner als in den Gruppen 1 und 2 ist und zudem andere Eigenschaften untersucht wurden, sind die Ergebnisse nur eingeschränkt vergleichbar. In Kapitel 7.4.3 wurde vermutet, dass es den Entscheidungsträgern bei großen Bandbreiten einfacher fallen sollte, die Merkmalsausprägungen in eine „plausible“ Rangfolge zu bringen. Dieser Zusammenhang konnte für das Untersuchungsobjekt „Laptop“ nicht nachgewiesen werden. Im Gegenteil, jeweils eine Eigenschaft wies bei den traditionellen Methoden zur Festlegung des Eigenschaftssets (Gruppe 1 und 2) in dieser Untersuchung ein geringes Maß an Augenscheinvalidität auf. Überprüfung der Augenscheinvalidität für das Untersuchungsobjekt „Fernseher“

Zur Beschreibung der Alternativen beim Untersuchungsobjekt „Fernseher“ wurden bei Gruppe 1 (Elicitation Technik) die Eigenschaften „Preis“, „Bildschirmdiagonale“, „Marke“

und „Fernbedienung“ genutzt. Auch in diesem Fall kann für alle vier Eigenschaften eine a priori vermutete Rangfolge der Vorziehenswürdigkeit gebildet werden, da die Ausprägungen vom Marktforscher so ausgewählt wurden, dass möglichst die gesamte am Markt verfügbare Bandbreite abgedeckt wurde. Dies gilt ebenfalls für die Eigenschaft „Marke“ (siehe Kapitel 7.2.3). Die Ausprägung „Philips“ bildet dabei den positiven, „Welltech“ den negativen Pol. Die weitere Ausprägung „Sharp“ wurde so gewählt, dass sie sich bezüglich der Vorziehens-

377

würdigkeit möglichst mit gleichen Abständen zwischen den beiden Polen befindet.1907 Es ergibt sich die in Tabelle 82 präsentierte vermutete Rangfolge der Vorziehenswürdigkeit der Ausprägungen. Eigenschaft Preis Bildschirmdiagonale Marke Fernbedienung

plausible Rangfolge der Ausprägungen 1.) 65,- Euro

2.) 1182,- Euro

3.) 2300,- Euro

1.) 108 cm

2.) 71 cm

3.) 34 cm

1.) Philips

2.) Sharp

3.) Welltech

1.) vorhanden

2.) nicht vorhanden

Tabelle 82: Vermutete Rangfolge der Vorziehenswürdigkeit der Ausprägungen bei Gruppe 1

Entsprechend dieser a priori vermuteten Rangfolge wird in Tabelle 83 die Häufigkeit der Erfüllung dieser Erwartungen dargestellt. Preis Anzahl Prozent

66 96 %

Bildschirmdiagonale 62 90 %

Marke 19 28 %

Fernbedienung 61 88 %

Gesamt 14 20 %

Tabelle 83: Häufigkeit der Erfüllung der a priori Rangfolge bei Gruppe 1 (n = 69)

Bei den Eigenschaften „Preis“, „Bildschirmdiagonale“ und „Fernbedienung“ kann man eine hohe Übereinstimmung zwischen prognostizierter und beobachteter Rangfolge der Vorziehenswürdigkeit der Attributstufen erkennen. Bei dem Merkmal „Marke“ ist demgegenüber das Ausmaß der Augenscheinvalidität gering. Bei der Gruppe 2 (Duale Befragung) wurden die Stimuli durch die Eigenschaften „Preis“, „Bildschirmdiagonale“, „Marke“ und „Vor-Ort Service“ beschrieben. Die Ausprägungen dieser vier Merkmale lassen sich ebenfalls in eine plausible Rangfolge entsprechend der Vorziehenswürdigkeit bringen (siehe Tabelle 84). Eigenschaft Preis Bildschirmdiagonale Marke Vor-Ort Service

plausible Rangfolge der Ausprägungen 1.) 65,- Euro

2.) 1182,- Euro

3.) 2300,- Euro

1.) 108 cm

2.) 71 cm

3.) 34 cm

1.) Philips

2.) Sharp

3.) Welltech

1.) 1 Jahr Vor-Ort Service

2.) kein Vor-Ort Service

Tabelle 84: Vermutete Rangfolge der Vorziehenswürdigkeit der Ausprägungen bei Gruppe 2

Die Häufigkeit der Übereinstimmung zwischen vermuteter und beobachteter Reihenfolge der Vorziehenswürdigkeit der Ausprägungen wird in Tabelle 85 dargestellt.

1907

378

Siehe dazu Kapitel 7.2.3.

Preis Anzahl Prozent

59 100%

Bildschirmdiagonale 52 88%

Vor-Ort Service 45 76%

Marke 17 29%

Gesamt 11 19%

Tabelle 85: Häufigkeit der Erfüllung der a priori Rangfolge bei Gruppe 2 (n = 59)

In dieser Gruppe 2 ergibt sich ebenfalls, bis auf die Eigenschaft „Marke“, eine hohe Übereinstimmung zwischen prognostizierter und vermuteter Reihenfolge. Bei Gruppe 3 (neu vorgeschlagene Methode) wurden in der Vorstudie zwei unterschiedliche Zielgruppen bestimmt, die im Folgenden als Gruppe 3.1 bzw. 3.2 bezeichnet werden. Innerhalb der Studie von Gruppe 3.1 wurden die Eigenschaften „Preis“, „Bildschirmdiagonale“, „Bildfrequenz“ und „Bildschirmformat“ mit Hilfe von jeweils zwei Ausprägungen beschrieben. Diese Ausprägungen können, wie in Tabelle 86 präsentiert, in eine vermutete Rangfolge entsprechend ihrer Vorziehenswürdigkeit gebracht werden. Eigenschaft Preis Bildschirmdiagonale Bildfrequenz Bildschirmformat

plausible Rangfolge der Ausprägungen 1.) 310,- Euro

2.) 480,- Euro

1.) 70 cm

2.) 52 cm

1.) 100 Hz

2.) 50 Hz

1.) 16:9

2.) 4:3

Tabelle 86: Vermutete Rangfolge der Vorziehenswürdigkeit der Ausprägungen bei Gruppe 3.1

Die tatsächlich beobachtete Reihenfolge der Vorziehenswürdigkeit der Merkmalsausprägungen stimmt in hohem Maße mit der vermuteten Präferenzrangfolge überein (siehe Tabelle 87). Es kann somit von einer hohen Augenscheinvalidität gesprochen werden. Für die Eigenschaften „Bildschirmdiagonale“ und „Bildfrequenz“ gab es bei keinem Probanden Abweichungen von der erwarteten Rangfolge. Preis Anzahl Prozent

48 98%

Bildschirmdiagonale 49 100%

Bildfrequenz 49 100%

Bildschirmformat 36 73%

Gesamt 35 71%

Tabelle 87: Häufigkeit der Erfüllung der a priori Rangfolge bei Gruppe 3.1 (n = 49)

Insgesamt kann man bei Gruppe 3.1 ein hohes Ausmaß an Augenscheinvalidität beobachten. Ein Vergleich der Ergebnisse mit den Gruppen 1 und 2 erscheint jedoch schwierig, da bei Gruppe 3.1 die Eigenschaften durch lediglich zwei Ausprägungen beschrieben wurden. In der Gruppe 3.2 erfolgte eine Untersuchung der fünf Eigenschaften „Preis“, „Bildschirmdiagonale“, „Projektionstechnik“, „Virtual Dolby Surround“ und „Bildschirmformat“. Bei dem Merkmal „Projektionstechnik“ kann allerdings keine a priori Rangfolge der Eigen379

schaftsausprägungen aufgestellt werden, da jede Technik bestimmte Vor- und Nachteile aufweist. Es ergibt sich die in Tabelle 88 präsentierte vermutete Rangfolge der Eigenschaftsausprägungen. Eigenschaft Preis Bildschirmdiagonale Projektionstechnik Virtual Dolby Surround Bildschirmformat

plausible Rangfolge der Ausprägungen 1.) 480,- Euro

2.) 730,- Euro

3.) 920,- Euro

1.) 108 cm

2.) 70 cm

3.) 52 cm

Keine a priori Rangfolge möglich (LCD-Display, Plasma-Fernseher) 1.) vorhanden

2.) nicht vorhanden

1.) 16:9

2.) 4:3

Tabelle 88: Vermutete Rangfolge der Vorziehenswürdigkeit der Ausprägungen bei Gruppe 3.2

In Tabelle 89 wird die Häufigkeit der Übereinstimmung zwischen „plausibler“ und beobachteter Rangfolge präsentiert. Preis Anzahl Prozent

30 86%

Bildschirmdiagonale 32 91%

VirtualDolby Surround 35 100%

Bildschirmformat 33 94%

Gesamt 26 74%

Tabelle 89: Häufigkeit der Erfüllung der a priori Rangfolge bei Gruppe 3.2 (n = 35)

Anhand der Ergebnisse in Tabelle 89 wird deutlich, dass ein hohes Ausmaß an Augenscheinvalidität vorliegt. Die hohe Augenscheinvalidität bei Gruppe 3.2 ist überraschend, denn hier wurden im Vergleich zu den anderen Gruppen insgesamt mehr Eigenschaften in die Untersuchung aufgenommen. Deshalb war hier eine höhere Zahl an Einschätzungen notwendig - so dass stärker mit der Anwendung von Entscheidungsheuristiken zu rechnen gewesen wäre. 1908 Fazit Augenscheinvalidität

Auch wenn die Maße der Augenscheinvalidität aufgrund der unterschiedlichen Eigenschaftssets nicht direkt zwischen den Gruppen vergleichbar sind, geben diese erste Anhaltspunkte zur Einschätzung des Bewertungsverhaltens der Befragungsteilnehmer. So ist dann mit einer geringen Übereinstimmung zwischen prognostizierter und beobachteter Rangfolge der Merkmalsausprägungen zu rechnen, wenn diese Eigenschaft nicht oder nur eingeschränkt bei der Bewertung der Alternativen innerhalb der Präferenzmessung berücksichtigt wurde. Ein geringes Ausmaß an Augenscheinvalidität für eine einzelne bzw. wenige Attribute kann folglich ein Indiz für die Anwendung von Entscheidungsheuristiken sein.

1908

380

Vgl. Payne; Bettman; Schkade (1999), 247.

Eine Annahme in dieser Arbeit ist, dass wahrgenommene Nutzenunterschiede zwischen den Ausprägungen eines Merkmals (dies entspricht der Bandbreite eines Attributs) die Bedeutung der Eigenschaften im Entscheidungsprozess determinieren. Sind die Bandbreiten aller Merkmale zu weit gewählt, so ist verstärkt mit dem Auftreten von unakzeptablen Ausprägungen zu rechnen, dies hat zur Folge, dass u.U. einige Merkmale die Einschätzung der Alternativen dominieren. Greift der Proband deshalb auf Entscheidungsheuristiken zurück, indem er beispielsweise nur noch einen Teil der präsentierten Merkmale bei der Bewertung der Stimuli berücksichtigt, findet hinsichtlich der weniger relevanten Eigenschaften kein Trade-off mehr statt. Kompensatorische Entscheidungsstrategien sind jedoch eine Grundvoraussetzung zur Nutzung der Verfahren zur Präferenzmessung. Die Anwendung entsprechender Heuristiken konnte bei den beiden Untersuchungsobjekten „Laptop“ und „Fernseher“ in den Gruppen 1 und 2 (d.h. bei den traditionellen Verfahren) beobachtet werden. In beiden Gruppen und bei beiden Untersuchungsobjekten ist jeweils bei einer Eigenschaft die Augenscheinvalidität auf einem niedrigen Niveau, während die weiteren Merkmale ein hohes Maß an Übereinstimmung zwischen prognostizierter und beobachteter Rangfolge der Vorziehenswürdigkeit der Ausprägungen aufweisen.1909 Bei Anwendung der neuen Methode sind solche Effekte nicht beobachtbar, sämtliche Eigenschaften weisen vergleichsweise hohe Werte für die Augenscheinvalidität auf.

7.4.4 Interne Validität

Mit Hilfe der internen Validität wird überprüft, ob das Modell die erhobenen Bewertungen gut replizieren kann.1910 Dabei wird die interne Validität der Conjoint-Analyse mit Hilfe des korrigierten R2 untersucht. Eine Anpassung des R2 ist notwendig, weil sich die verschiedenen Gruppen bezüglich der Anzahl der untersuchten Eigenschaften sowie Ausprägungen und damit der Zahl der zu schätzenden Parameter unterscheiden. Im Folgenden wird der Mittelwert des korrigierten R2 präsentiert. Zudem werden die Befragungsteilnehmer in drei Gruppen (hoch konsistente Probanden (R2 0,85), konsistente Probanden (0,7 R2 < 0,85) und inkonsistente Probenden (R2 < 0,7)) eingeteilt. Voraussetzung für diese Einteilung ist allerdings, dass bei allen Befragungsteilnehmern tatsächlich eine lineare Nutzenfunktion der Bewertung der Alternativen zugrunde liegt und keinerlei Entscheidungsheuristiken angewendet wurden. Ein niedriges R2 weist in erster Linie darauf hin, dass das verwendete Modell in diesem Fall nicht geeignet ist. 1909

Da sich die sonstigen Werte der Augenscheinvalidität auf einem vergleichbaren Niveau wie bei den Gruppen 3 (bei dem Untersuchungsobjekt „Laptop“ und „Fernseher“) befinden, kann eine durch die Motivation der Befragungsteilnehmer hervorgerufene geringere Augenscheinvalidität ausgeschlossen werden. 1910 Siehe Kapitel 3.10.1.

381

Da in allen Gruppen die gleiche Art der Conjoint-Analyse genutzt wird, sollten sich die Maße für die interne Validität kaum unterscheiden. Allerdings könnte man auch vermuten, dass das korrigierte R2 bei den Gruppen unter Verwendung der traditionellen Methoden zur Bestimmung des Eigenschaftssets höher ist als bei der neu vorgeschlagenen. Dies ist wahrscheinlich, da bei den traditionellen Methoden u.U. auch nicht wahlentscheidende Merkmale untersucht werden. Befinden sich im Eigenschaftsset nicht relevante Attribute, wird der Befragte diese bei der Einschätzung nicht bzw. kaum berücksichtigen. Der Entscheidungsträger beschränkt sich in diesen Fällen bei der Bewertung der Alternativen auf eine Teilmenge der präsentierten Eigenschaften. Je weniger Merkmale zur Beurteilung der Stimuli tatsächlich genutzt werden, um so einfacher ist die Einschätzung für den Befragungsteilnehmer, so dass mit einem konsistenteren Antwortverhalten als bei der Berücksichtigung aller vorgegebenen Informationen gerechnet werden kann, so dass das R2 steigt. Befinden sich im Eigenschaftsset jedoch lediglich relevante Bewertungsdimensionen, müssen die Befragungsteilnehmer komplexere Tradeoff Entscheidungen vornehmen, weshalb das R2 tendenziell geringer sein könnte.1911 Die Höhe des Bestimmtheitsmaßes ist zur Bewertung der internen Validität und der Eignung des Modells nur eingeschränkt geeignet. Dies gilt insbesondere bei der Anwendung von Rating-Skalen zur Bewertung der Alternativen.1912 Aus diesem Grund haben Helm; Manthey; Scholl; Steiner (2003, 18) eine weitere Möglichkeit zur Überprüfung der internen Validität vorgeschlagen.1913 Dabei wird auf der Ebene der Entscheidungsträger untersucht, ob die beobachtete Präferenzrelation (z.B. Stimulus A wird ggü. Stimulus B bevorzugt) für jeden Paarvergleich durch die Ergebnisse der Präferenzmessung korrekt wiedergegeben wird. Überprüfung der internen Validität für das Untersuchungsobjekt „Laptop“

Anhand der Ergebnisse (siehe Tabelle 90) wird deutlich, dass sich der Mittelwert des korrigierten Bestimmtheitsmaßes zwischen den drei Gruppen kaum unterscheidet. Insgesamt ergibt sich in allen drei Gruppen eine hohe interne Validität.

1911 1912 1913

382

Siehe analog auch Acito (1977, 84). Entscheidungsträger, die statt Trade-offs auf Entscheidungsheuristiken zurückgegriffen haben, wiesen in dieser Studie eine im Vergleich zu den anderen Befragungsteilnehmern hohe Konsistenz auf. Vgl. Birnbaum (1973), 239ff. Siehe Kapitel 3.10.1.

hoch konsistente Probanden (R2 0,85)

Gruppe 1 Elicitation Technik n = 68 22,1 % (n = 15)

Gruppe 2 Duale Befragung n = 65 27,7 % (n = 18)

Gruppe 3 Neue Methode n = 84 27,4 % (n = 23)

konsistente Probanden (0,7 R2 < 0,85)

57,4 %

(n = 39)

56,9 %

(n = 37)

57,1 %

(n = 48)

20,6 %

(n = 14)

15,4 %

(n = 10)

15,5 %

(n = 13)

2

inkonsistente Probanden (R < 0,7) Mittelwert korr. R2

0,761

0,789

0,782

Tabelle 90: Interne Validität der verschiedenen Gruppen für das Untersuchungsobjekt „Laptop“

Bei der Überprüfung, ob die empirisch beobachtete Präferenzrelation zwischen den zu bewertenden Paarvergleichen durch die Ergebnisse der Conjoint-Analyse korrekt prognostiziert werden kann, ergeben sich für alle drei Gruppen hohe Werte (siehe Tabelle 91). Gruppe 1 Elicitation Technik n = 68

Gruppe 2 Duale Befragung n = 65

Gruppe 3 Neue Methode n = 84

97 %

96 %

96 %

Übereinstimmung mit der prognostizierten Präferenzrelation

Tabelle 91: Rank Order Test für das Untersuchungsobjekt „Laptop”

Überprüfung der internen Validität für das Untersuchungsobjekt „Fernseher“

Auch beim Untersuchungsobjekt „Fernseher“ kann eine hohe interne Validität beobachtet werden. Die untersuchten Gruppen unterscheiden sich bezüglich des Mittelwerts des korrigierten R2 kaum. Lediglich bei den Gruppen 3.1 und 3.2 ist der Anteil der „hoch konsistenten Probanden“ geringer als in den Gruppen 1 und 2; in den Gruppen 3.1 und 3.2 sind dagegen weniger „inkonsistente Probanden“ zu finden (siehe Tabelle 92).

hoch konsistente Probanden (R2 0,85)

Gruppe 1 Gruppe 2 Elicitation Duale Technik Befragung n = 69 n = 59 13,0 % (n = 9) 11,9 % (n = 7)

Gruppe 3.1 Neue Methode n = 49 8,2 % (n = 4)

Gruppe 3.2 Neue Methode n = 35 2,9 % (n = 1)

konsistente Probanden (0,7 R2 < 0,85)

47,8 % (n = 33) 49,2 % (n = 29) 71,4 % (n = 35) 71,4 % (n = 25)

inkonsistente Probanden (R2< 0,7)

39,1 % (n = 27) 39,0 % (n = 23) 20,4 % (n = 10) 25,7 % (n = 9)

Mittelwert korr. R2

0,733

0,728

0,758

0,742

Tabelle 92: Interne Validität der verschiedenen Gruppen für das Untersuchungsobjekt „Fernseher“

Wie bereits beim Untersuchungsobjekt „Laptop“ ergeben sich insgesamt sehr hohe Werte beim Vergleich zwischen den beobachteten Einschätzungen der Paarvergleiche und den prognostizierten Präferenzrelationen (siehe Tabelle 93).

383

Übereinstimmung mit der prognostizierten Präferenzrelation

Gruppe 1 Elicitation Technik n = 69

Gruppe 2 Duale Befragung n = 59

Gruppe 3.1 Neue Methode n = 49

Gruppe 3.2 Neue Methode n = 35

96 %

97 %

96 %

93 %

Tabelle 93: Rank Order Test für das Untersuchungsobjekt „Fernseher”

Fazit interne Validität

Insgesamt konnte kein Zusammenhang zwischen dem verwendeten Eigenschaftsset und der Höhe der internen Validität festgestellt werden. Die Vermutung, dass die interne Validität bei den Gruppen, bei denen das Eigenschaftsset durch die neu vorgeschlagene Vorgehensweise bestimmt wurde, geringer ist, weil hier tendenziell komplexere Trade-off Entscheidungen notwendig sind, konnte nicht bestätigt werden.

7.4.5 Prognosevalidität

In dieser Studie wurden die Befragungsteilnehmer im Anschluss an die eigentliche Präferenzmessung gebeten, sechs Alternativen, die simultan präsentiert wurden, im Rahmen einer Referenzmethode1914 mit Hilfe von Kaufwahrscheinlichkeiten zu bewerten. Wie von Orme;

Alpert; Christensen (1997a, 212) vorgeschlagen, wurden diese Stimuli nach dem Zufallsprinzip gebildet.1915 Die Prognosevalidität wird anhand verschiedener Hit-Rates und RangKorrelationskoeffizienten eingeschätzt, die auf individueller Ebene, d.h. für jeden Befragungsteilnehmer, berechnet und anschließend aggregiert werden.1916 Neben der Analyse der Übereinstimmung zwischen Referenzmethode und Schätzergebnissen auf individueller Ebene können die Ergebnisse der Präferenzmessung mit denen der Referenzmethode auf aggregierter Ebene verglichen werden. Ein Vergleich auf aggregierter Ebene bedeutet, dass die Mittelwerte der Alternativen innerhalb der Referenzmethode1917 den Mittelwerten der Präferenzmessung1918 gegenübergestellt werden. So ist es möglich, die 1914

Siehe Kapitel 3.10.1.3.

1915

Die Alternativen der Referenzmethose beruhen auf den innerhalb der Präferenzmessung einer Gruppe untersuchten Eigenschaften und Ausprägungen. Da sich die Eigenschaftssets je nach untersuchter Gruppe voneinander unterscheiden, ergeben sich zwangsläufig auch innerhalb der Referenzmethode unterschiedliche Alternativen. 1916 Siehe Kapitel 3.10.1. 1917

Die Kaufwahrscheinlichkeiten, die innerhalb der Referenzmethode direkt erhoben wurden, wurden dabei zunächst auf individueller Ebene so skaliert, dass die Summe der Kaufwahrscheinlichkeiten eines Entscheiders 100 % ergab – dies ist nowendig, um die direkt erhobenen Werte mit den Schätzwerten der Präferenzmessung vergleichen zu können. Danach wurde die se Werte je Alternative über alle Befragungsteilnehmer einer Gruppe durch Mittelwertbildung aggregiert. 1918 Es wird hierbei zunächst der Gesamtnutzen der Alternativen auf individueller Ebene mit Hilfe der in der Präferenzmessung ermittelten Teilnutzen berchnet und danach auf Basis des BTL-Modells der Marktanteil prognostiziert. In einem zweiten Schritt kann dieser Wert je Alternative über alle Befragungsteilnehmer einer Gruppe durch Mittwelwertbildung aggregiert werden.

384

Marktanteile auf Basis der Ergebnisse der Präferenzmessung zu prognostizieren, Wahlanteile für die Einschätzungen der Referenzmethode bestimmen und beide miteinander zu vergleichen. Zur Berechnung der Marktanteile stehen die in Kapitel 3.9 beschriebenen Möglichkeiten zur Verfügung. Bei der Nutzung von First-Choice Modellen wird vermutet, dass die Entscheidungsträger jeweils das von ihnen am meisten bevorzugte Produkt kaufen. Allen anderen Alternativen wird eine Kaufwahrscheinlichkeit von 0% zugewiesen. Bei Anwendung dieser Vorgehensweise zur Prognose von Marktanteilen ist allerdings damit zu rechnen, dass die Kaufwahrscheinlichkeiten für weniger attraktive Produkte tendenziell unterschätzt werden.1919 Eine alternative Möglichkeit zur Prognose von Marktanteilen bietet das BTL-Modell (Bradley-Terry-Luce-Kaufwahrscheinlichkeiten). Hier werden die Kaufwahrscheinlichkeiten entsprechend ihrer prognostizierten Gesamtnutzen aufgeteilt. Je höher der Gesamtnutzen einer Alternative im Vergleich zu den anderen Produktvarianten ist, desto höher ist deren Kaufwahrscheinlichkeit. Im Folgenden wird zur Prognose von Marktanteilen auf aggregierter Ebene das BTL-Modell genutzt. Wie bereits in Kapitel 3.10.1 beschrieben, ist ein Vergleich der Prognosevalidität zwischen verschiedenen Untersuchungen problematisch, wenn Studien mit unterschiedlichen Eigenschaften und Ausprägungen betrachtet werden. Aufgrund verschiedener Eigenschaftssets ist dabei ein direkter Vergleich u.U. nicht möglich. Dies gilt insbesondere deshalb, weil dann keine identischen Alternativen in der Referenzmethode genutzt werden können. Die Gestaltung dieser Stimuli beeinflusst indes sehr stark die Höhe der Prognosevalidität.1920 Besonders in Studien, bei denen auch nicht relevante Merkmale untersucht werden, ist mit einer scheinbar höheren Prognosevalidität zu rechnen, da sich die Entscheidungsträger bei der Bewertung der Alternativen möglicherweise auf einen Teil der präsentierten Merkmale beschränken.1921 Wird zudem eine sehr große Bandbreite der Eigenschaften betrachtet, unterscheiden sich die zu bewertenden Alternativen stärker als bei einer Gruppe, bei der eine kleinere, aber relevante Bandbreite genutzt wurde. Ergeben sich in der Referenzmethode durch größere Bandbreiten bezüglich der Alternativen große wahrgenommene Nutzenunterschiede, so ist die Bewertung dieser Stimuli tendenziell einfacher und deshalb mit einer höheren Prognosevalidität zu rechnen.1922

1919 1920 1921 1922

Vgl. Hensel-Börner (2000), 158. Siehe Kapitel 3.10.1. Vgl. Schweikl (1985), 163. Siehe Kapitel 3.10.1.

385

Prognosevalidität für das Untersuchungsobjekt „Laptop“

Zur Einschätzung der Auswirkungen des Eigenschaftssets auf die Prognosevalidität wurden verschiedene Maßzahlen genutzt. Es wurden zunächst verschiedene Hit-Rates und danach die Rang-Korrelationskoeffizienten nach Spearman und Kendalls Tau berechnet. Zur Überprüfung der Übereinstimmung zwischen prognostizierten Werten und Referenzmethode wurde nicht auf den Produkt-Moment Korrelationskoeffizienten zurückgegriffen, weil anhand der Beobachtungswerte der Referenzmethode nicht davon ausgegangen werden konnte, dass sich die von den Entscheidungsträgern angegebenen Kaufwahrscheinlichkeiten auf einem metrischen Skalenniveau befinden. In Tabelle 94 werden die Hit-Rates für die untersuchten Gruppen präsentiert. Es ergeben sich für alle drei Gruppen relativ hohe Werte,1923 wobei jedoch bei Gruppe 2 (Duale Befragung) die Maße tendenziell niedriger ausfallen. Betrachtet man demgegenüber die Übereinstimmung der gesamten Rangfolge zwischen Referenzmethode und berechneten Gesamtnutzen der Alternativen (siehe Tabelle 95 und Tabelle 96), so zeigt sich bei Gruppe 2 insgesamt eine höhere Korrelation zwischen geschätzten und beobachteten Rängen der Alternativen.1924

First-Choice Hit Rate (HR1): First-Second-Choice Hit Rate (HR 12): First-Second-Third Choice Hit Rate (HR 123): First-two Hit Rate (HR{12}): First-three Hit Rate (HR{123}):

Gruppe 1 Elicitation Technik n = 68

Gruppe 2 Duale Befragung n = 59

Gruppe 3 Neue Methode n = 84

62 %

51 %

64 %

31 %

26 %

36%

18 %

22 %

23 %

81 %

77 %

85 %

99 %

95 %

95 %

Tabelle 94: Hit-Rates für das Untersuchungsobjekt „Laptop” bei einem Vergleich der Ergebnisse der Referenzmethode mit den Schätzwerten der Präferenzmessung

1923 1924

386

Siehe im Vergleich dazu beispielsweise Hensel-Börner (2000), 151ff. Alle Fälle, in denen RC = 1 ist, können bei der Mittelwertbildung nicht berücksichtigt werden (siehe Kapitel 3.10.1), was die Aussagekraft des Mittelwertes erheblich einschränkt – dies betrifft in Tabelle 95 und Tabelle 96 insbesondere Gruppe 2. In Tabelle 95 ist z.B. der Mittelwert der Rangkorrelationskoeffizienten bei den Gruppen 1 und 2 vergleichbar. Bei Gruppe 2 ist allerdings der Fall von RC = 1 häufiger zu beobachten, weshalb in diesem Fall insgesamt geschlussfolgert werden kann, dass bei Gruppe 2 der Zusammenhang zwischen den beobachteten Rängen der Alternativen der Referenzmethode und den auf Basis der Teilnutzen prognostizierten Rängen stärker ist. Auf einen Signifikanztest zur Überprüfung der Unterschiede der Korrelationskoeffizienten wird an dieser Stelle verzichtet. Im Rahmen eines Signifikanztests müssten ebenfalls die z-transformierten Werte genutzt werden (vgl. Schweikl (1985), 167; Sheluga; Jaccard; Jacoby (1979), 171f.). Dabei könnten jedoch sämtliche Fälle, in denen R = 1 ist, nicht berücksichtigt werden, was die Aussagekraft solcher Signifikanztests erheblich einschränkt.

Gruppe 1 Elicitation Technik n = 68 1,5 %

Gruppe 2 Duale Befragung n = 59 0,0 %

0,0 < RC  0,2

2,9 %

4,6 %

3,6 %

0,2 < RC  0,5

4,4 %

9,2 %

11,9 %

0,5 < RC  0,7

35,3 %

21,5 %

22,6 %

0,7 < RC  0,9

36,8 %

36,9 %

32,1 %

0,9 < RC < 1,0

17,6 %

20,0 %

22,6 %

RC  0,0

RC (Mittelwert für alle RC < 1) RC = 1,0

Gruppe 3 Neue Methode n = 84 6,0 %

0,77

0,75

0,63

1,5 %

7,7 %

1,2 %

Tabelle 95: Spearman Rang-Korrelationskoeffizient für das Untersuchungsobjekt „Laptop“ bei einem Vergleich der Ergebnisse der Referenzmethode mit den Schätzwerten der Präferenzmessung

RC  0,0

Gruppe 1 Elicitation Technik n = 68 1,5 %

Gruppe 2 Duale Befragung n = 59 0,0 %

Gruppe 3 Neue Methode n = 84 6,0 %

0,0 < RC  0,2

2,9 %

4,6 %

8,3 %

0,2 < RC  0,5

32,4 %

27,7 %

25,0 %

0,5 < RC  0,7

23,5 %

18,5 %

21,4 %

0,7 < RC  0,9

36,8 %

38,5 %

31,0 %

0,9 < RC < 1,0

0,0 %

0,0 %

0,0 %

0,63

0,65

0,47

2,9 %

10,8 %

8,3 %

RC (Mittelwert für alle RC < 1) RC = 1,0

Tabelle 96: Kendalls Tau Rang-Korrelationskoeffizient für das Untersuchungsobjekt „Laptop“ bei einem Vergleich der Ergebnisse der Referenzmethode mit den Schätzwerten der Präferenzmessung

Vergleicht man die mit Hilfe der Präferenzmessung und der Referenzmethode jeweils ermittelten Marktanteile auf Basis des BTL-Modells miteinander, so ergibt sich bei allen drei Gruppen wiederum eine hohe Übereinstimmung. Diese hohe Prognosevalidität wird durch die Korrelationskoeffizienten bestätigt (siehe Tabelle 97).

387

Gruppe 1

Gruppe 2

Gruppe 3

Elicitation Technik

Duale Befragung

Neue Methode

geschätzter Marktanteil

geschätzter Marktanteil

geschätzter Marktanteil

Referenz-

Präferenz-

Referenz-

Präferenz-

Referenz-

Präferenz-

methode

messung

methode

messung

methode

messung

Alternative 1

28,1 %

25,5 %

23,0 %

21,0 %

12,3 %

12,5 %

Alternative 2

5,3 %

11,2 %

6,9 %

9,7 %

14,5 %

16,3 %

Alternative 3

6,9 %

7,5 %

5,6 %

6,9 %

15,7 %

16,9 %

Alternative 4

22,3 %

18,4 %

26,5 %

24,7 %

19,3 %

17,9 %

Alternative 5

10,7 %

15,5 %

12,4 %

17,1 %

26,4 %

23,9 %

Alternative 6

26,7 %

21,8 %

25,5 %

20,7 %

11,8 %

12,4 %

Pearson Korrelationskoeffizent

0,94

0,96

0,98

Tabelle 97: Vergleich der prognostizierten Marktanteile mit den Ergebnissen der Referenzmethode beim Untersuchungsobjekt „Laptop“

Die Vermutung, dass die Prognosevalidität bei Nutzung der relevanten Eigenschaften und Ausprägungen sinkt, da tendenziell schwierigere Einschätzungen notwendig sind, kann somit für das Untersuchungsobjekt „Laptop“ nicht bestätigt werden. Vielmehr ergeben sich für alle drei Gruppen insgesamt vergleichbar hohe Werte für die Prognosevalidität. Prognosevalidität für das Untersuchungsobjekt „Fernseher“

Beim Untersuchungsobjekt „Fernseher“ wurden ebenfalls zunächst Hit-Rates und RangKorrelationskoeffizienten für den Vergleich zwischen den berechneten und den prognostizierten Gesamtnutzen der Alternativen der Referenzmethode ermittelt. Insgesamt ergeben sich bei dieser Untersuchung im Vergleich zum Untersuchungsobjekt „Laptop“ für alle vier betrachteten Gruppen höhere Werte (siehe Tabelle 98, Tabelle 99 und Tabelle 100). Zwischen den vier Gruppen sind kaum Unterschiede zu erkennen. Zwar sind die Hit-Rates bei Gruppe 3.2 niedriger als bei den anderen Gruppen (siehe Tabelle 98), bei der Untersuchung der RangKorrelationskoeffizienten bestehen demgegenüber kaum Unterschiede.1925

1925

388

Bei einem Vergleich der Rangkorrelationskoeffizienten sind in Tabelle 99 und Tabelle 100 die Unterschiede in der Häufigkeit des RC = 1 besonders auffällig. Siehe dazu beispielsweise Gruppe 3.1; hier weisen bei der Nutzung des Spearman Rangkorrelationskoeffizienten 14,3% einen RC von „1“ auf, während es bei dem Kendall Tau immerhin 40,8% der Befragungsteilnehmer sind. Diese verschiedenen Werte ergeben sich durch die unterschiedliche Art und Weise der Berechnung der Rangkorrelationskoeffizienten. Werden bestimmte Ränge doppelt vergeben, führt dies beim Spearman Rangkorrelationskoeffizienten dazu, dass auch bei einer Übereinstimmung der Ränge der RC kleiner als „1“ ist. Beispiel: Gegeben sind sechs Alternativen a1, a2,…, a6, die berechneten Ränge BR1, BR2, …, BR6 sowie die erhobenen Ränge ER1, ER2, …, ER6. Angenommen, es wurden folgende Ränge berechnet: BR1= 5, BR2= 4, BR3= 1, BR4= 6, BR5= 3 und BR6= 2 sowie die Ränge ER1= 5, ER2= 4, ER3= 1, ER4= 6, ER5= 2 und ER6= 2 beobachtet. Die beobachteten Ränge ER5 und ER6 sind somit identisch, ansonsten stimmen die beiden Rangfolgen genau überein. Bei Berechnung des Spearman Korrelationskoeffizienten ergibt sich jedoch ein Wert von 0,97. Die doppelte Vergabe eines Rangplatzes stellt demnach bei der Berechnung des Spearman-Korrelationskoeffizienten eine Abweichung zwischen den beiden Rängen dar. Dies ist bei der Ermittlung des Kendall Tau nicht der Fall. Die Unterschiede in der Häufigkeit des RC = 1 ergeben sich also durch mehrfach vergebene Ränge bei den beobachteten Rangfolgen im Rahmen der Referenzmethode.

Gruppe 1 Elicitation Technik n = 69 First-Choice Hit Rate (HR1): 91 % First-Second-Choice Hit Rate 56 % (HR 12): First-Second-Third-Choice 32 % Hit Rate (HR 123): First-two Hit Rate (HR{12}): 97 % First-three Hit Rate 99 % (HR{123}):

Gruppe 2 Duale Befragung n = 59 93 %

Gruppe 3.1 Neue Methode n = 49 90 %

Gruppe 3.2 Neue Methode n = 35 77 %

56 %

53 %

46 %

34 %

12 %

34 %

95 %

92 %

97 %

98%

92 %

100 %

Tabelle 98: Hit-Rates für das Untersuchungsobjekt „Fernseher” bei einem Vergleich der Ergebnisse der Referenzmethode mit den Schätzwerten der Präferenzmessung Gruppe 1 Elicitation Technik n = 69 1,4 %

Gruppe 2 Duale Befragung n = 59 0,0 %

Gruppe 3.1 Neue Methode n = 49 0,0 %

Gruppe 3.2 Neue Methode n = 35 0,0 %

0,0 < RC  0,2

1,4 %

1,7 %

0,0 %

2,9 %

0,2 < RC  0,5

1,4 %

8,5 %

4,1 %

5,7 %

0,5 < RC  0,7

15,9 %

18,6 %

0,0 %

14,3 %

RC  0,0

0,7 < RC  0,9

40,6 %

37,3 %

42,9 %

48,6 %

0,9 < RC < 1,0

26,1 %

22,0 %

38,8 %

17,1 %

RC (Mittelwert für alle RC < 1) RC = 1,0

0,85

0,81

0,91

0,81

13,0 %

11,9 %

14,3 %

11,4 %

Tabelle 99: Spearman Rang-Korrelationskoeffizient für das Untersuchungsobjekt „Fernseher“ bei einem Vergleich der Ergebnisse der Referenzmethode mit den Schätzwerten der Präferenzmessung Gruppe 1 Elicitation Technik n = 69 RC  0,0

2,9 %

Gruppe 2 Duale Befragung n = 59 1,7 %

Gruppe 3.1 Neue Methode n = 49 0,0 %

Gruppe 3.2 Neue Methode n = 35 0,0 %

0,0 < RC  0,2

0,0 %

1,7 %

2,0 %

2,9 %

0,2 < RC  0,5

11,8 %

22,0 %

2,0 %

17,1 %

0,5 < RC  0,7

20,6 %

22,0 %

4,1 %

17,1 %

0,7 < RC  0,9

47,1 %

30,5 %

51,0 %

48,6 %

0,9 < RC < 1,0

0,0 %

0,0 %

0,0 %

0,0 %

RC (Mittelwert für alle RC < 1) RC = 1,0

0,70

0,66

0,75

0,71

17,6 %

22,0 %

40,8 %

14,3 %

Tabelle 100: Kendalls Tau Rang-Korrelationskoeffizient für das Untersuchungsobjekt „Fernseher“ bei einem Vergleich der Ergebnisse der Referenzmethode mit den Schätzwerten der Präferenzmessung

Bei dem Untersuchungsobjekt „Fernseher“ können beim Vergleich der prognostizierten Marktanteile mit Hilfe des BTL-Modells zwischen den Ergebnissen der Präferenzmessung 389

und denen der Referenzmethode ebenfalls kaum Unterschiede beobachtet werden. Die Pearson Korrelationskoeffizienten weisen bei allen Gruppen auf eine hohe Übereinstimmung hin.

Alternative 1

Gruppe 1 Elicitation Technik

Gruppe 2 Duale Befragung

Gruppe 3.1 Neue Methode

Gruppe 3.2 Neue Methode

geschätzter Marktanteil

geschätzter Marktanteil

geschätzter Marktanteil

geschätzter Marktanteil

Referenz- Präferenz- Referenz- Präferenz- Referenz- Präferenz- Referenz- Präferenzmethode messung methode messung methode messung methode messung 18,3 % 16,2 % 19,3 % 17,4 % 14,2 % 13,6 % 15,9 % 18,4 %

Alternative 2

21,4 %

20,2 %

17,8 %

19,1 %

17,5 %

18,0 %

28,6 %

27,9 %

Alternative 3

8,5 %

12,2 %

6,1 %

10,7 %

30,9 %

31,9 %

17,5 %

15,1 %

Alternative 4

7,5 %

11,2 %

10,9 %

11,8 %

5,1 %

1,5 %

20,2 %

22,3 %

Alternative 5

5,1 %

9,5 %

6,1 %

9,8 %

13,0 %

12,3 %

12,8 %

11,3 %

Alternative 6

39,2 %

30,6 %

39,8 %

31,2 %

19,3 %

22,7 %

4,9 %

5,1 %

Pearson Korrelationskoeffizent

0,995

0,991

0,987

0,970

Tabelle 101: Vergleich der prognostizierten Marktanteile mit den Ergebnissen der Referenzmethode beim Untersuchungsobjekt „Fernseher“

Zwischenfazit zur Prognosevalidität

Die Vermutung, dass sich bei der Nutzung von relevanten Merkmalen tendenziell die Prognosevalidität verschlechtert,1926 wurde nicht bestätigt. Bei beiden Untersuchungsobjekten „Laptop“ und „Fernseher“ konnte für alle betrachteten Gruppen ein relativ hohes Ausmaß an Übereinstimmung zwischen den Schätzungen und der Referenzmethode beobachtet werden. Dieses Ergebnis ist insbesondere beim Untersuchungsobjekt „Fernseher“ überraschend. Bei den Gruppen 3.1 und 3.2 wurde ein, im Vergleich zu den Gruppen 1 und 2, komplexeres Untersuchungsproblem, dass durch mindestens doppelt so viele Paarvergleiche beschrieben wurde, von den Entscheidungsträgern bewertet. Eine größere Anzahl von Eigenschaften, Ausprägungen und Paarvergleichen führt somit entgegen der oftmals geäußerten Annahme1927 nicht zu verschlechterten Ergebnissen, wenn die aus Sicht der Entscheidungsträger tatsächlich relevanten Informationen berücksichtigt werden. Neben den bisher untersuchten Validitätsarten werden weitere Gütemaße genutzt, um die Ergebnisse der Präferenzmessung einschätzen zu können. So kann die vom befragten Entscheidungsträger wahrgenommene Befragungssituation Aufschluss darüber geben, welche Bewertungsstrategien von ihm angewendet wurden und ob er die Stimuli sinnvoll beurteilen konnte.

1926 1927

390

Vgl. Schweikl (1985), 163; Huber (1987), 5f. Vgl. Baier; Säuberlich (1997), 951; Lines; Denstadli (2004), 300.

7.4.6 Untersuchung der Befragungssituation

Die Befragungssituation wurde anhand der in Kapitel 3.10.3 beschriebenen Statements zu den Bereichen „Motivation“, „Informationsgehalt“, „kognitive Belastung“ und „Übersichtlichkeit der Darstellung“ untersucht. Die Entscheidungsträger wurden entsprechend gebeten, die jeweiligen Einzelstatements auf einer 9-stufigen Rating-Skala einzuschätzen. Es wird vermutet, dass bei der Untersuchung der relevanten Merkmale (Gruppe 3) der Informationsgehalt der in der Studie präsentierten Merkmale und Ausprägungen im Vergleich zu

den traditionellen Methoden höher eingeschätzt wird. Vermutlich hat die Nutzung der tatsächlich entscheidungsrelevanten Eigenschaften und Ausprägungen auch einen Einfluss auf die Motivation der Befragungsteilnehmer. So könnte vermutet werden, dass diese bei Gruppe 3

(neue Methode) höher ist als bei den traditionellen Verfahren zur Bestimmung des Eigenschaftssets (Gruppen 1 und 2). Bei den Gruppen 1 und 2 werden möglicherweise Informationen präsentiert, die bei einer realen Entscheidungssituation nicht relevant sind. Dies könnte einen negativen Einfluss auf die Motivation ausüben.1928 Zudem ist damit zu rechnen, dass bei der Nutzung sehr hoher Bandbreiten der Merkmalsausprägungen das Auftreten unrealistischer Alternativen wahrscheinlicher ist, was sich negativ auf die Motivation der Befragungsteilnehmer auswirken könnte. Im Hinblick auf die kognitive Belastung kann in Anlehnung an Schweikl (1985, 163) vermutet werden, dass sich die Befragungsteilnehmer bei der Nutzung von nicht relevanten Eigenschaften bei der Einschätzung auf eine Teilmenge der präsentierten Informationen beschränken und ihnen die Bewertung der Alternativen deshalb tendenziell leichter fällt. Werden dagegen lediglich relevante Merkmale untersucht, so ist die Menge der zu verarbeitenden Informationen und deshalb auch die kognitive Belastung höher, d.h. die Einschätzung der Stimuli schwieriger. Da identische Verfahren zur Präferenzmessung und zur Präsentation der Alternativen genutzt wurden, werden bei der Einschätzung der Übersichtlichkeit der Darstellung keine Unterschiede zwischen den Gruppen erwartet. Analyse der Befragungssituation für das Untersuchungsobjekt „Laptop“

Die drei untersuchten Gruppen unterscheiden sich zwar hinsichtlich der Art der Eigenschaften und der Anzahl der Ausprägungen, die daraus resultierende Anzahl an zu bewertenden Stimuli bzw. Paarvergleiche ist allerdings identisch.1929 Auch ist durch die Befragung von Studenten davon auszugehen, dass diese vergleichbare Merkmale aufweisen. Zwischen den Gruppen 1928 1929

Vgl. Johnson; Levin (1985), 174. In jeder Gruppe wurden 18 Paarvergleiche durchgeführt.

391

auftretende Unterschiede können somit allein auf die verschiedenen Attributsets zurückgeführt werden. In der folgenden Tabelle 102 werden die Mittelwerte der Einschätzungen der Befragungsteilnehmer dargestellt. Wie vermutet, ergeben sich bei der Gruppe 3 für die „Motivation“ und den „Informationsgehalt“ höhere Bewertungen im Vergleich zu den Gruppen 1 und 2. Jedoch wurden auch die Statements für die „kognitive Belastung“ und „Übersichtlichkeit“ bei der Gruppe 3 tendenziell höher, d.h. besser eingeschätzt. Indikatoren der Befragungssituation Motivation der Empfundene Befragungsteilnehmer Abwechslung Spaß bei der Beantwortung empfundener Einschätzung des Informationsgehalt Informationsgehalts Vorstellung der Alternativen in der Realität wahrgenommene Sicherheit bei der kognitive Belastung Beantwortung der Fragen Einschätzung des Schwierigkeitsgrads der Bewertungen Übersichtlichkeit der Einschätzung der Darstellung Übersichtlichkeit der Darstellung Einfluss der Darstellung auf die Bewertung

Gruppe 1 Elicitation Technik

Gruppe 2 Duale Befragung

Gruppe 3 Neue Methode

4,0

4,2

4,6

4,1

4,1

4,7

4,8

4,5

6,1

5,7

5,5

6,7

5,4

5,5

6,3

6,6

6,4

7,0

6,8

6,6

7,2

5,8

5,8

6,4

Tabelle 102: Mittelwerte der Einschätzung der Befragungssituation (9 Punkte Rating-Skala: 1- negati1930 ver Pol, 9 - positiver Pol ) beim Untersuchungsobjekt „Laptop“

Im Folgenden soll untersucht werden, ob die Mittelwertunterschiede in den Einschätzungen der Befragungsteilnehmer signifikant sind. Zu diesem Zweck wurde ein t-Test bei unabhängigen Stichproben durchgeführt.1931

1930

392

Die Einschätzungen sind jeweils so kodiert, dass ein hoher Wert positiv und ein niedriger Wert negativ zu interpretieren ist, d.h. ein hoher Wert bedeutet bei dem Item „Empfundene Abwechslung“, dass die Befragungsteilnehmer diese Erhebung als abwechslungsreich empfunden haben. Beim Item „Einschätzung des Schwierigkeitsgrades der Bewertungen“ sind die Ergebnisse analog zu interpretieren, d.h. auch hier bildet der Skalenpunkt „9“ den positiven Pol. Hohe Werte entsprechen somit einem aus Sicht der Befragungsteilnehmer geringen Schwierigkeitsgrad bei der Beantwortung.

Indikatoren der Befragungssituation

Vergleich der trad. Methoden Gruppe 1 vs. Gruppe 2

Motivation der Empfundene Befragungsteilnehmer Abwechslung Spaß bei der Beantwortung empfundener Einschätzung des Informationsgehalt Informationsgehalts Vorstellung der Alternativen in der Realität wahrgenommene Sicherheit bei der kognitive Belastung Beantwortung der Fragen Einschätzung des Schwierigkeitsgrads der Bewertungen Übersichtlichkeit der Einschätzung der Darstellung Übersichtlichkeit der Darstellung Einfluss der Darstellung auf die Bewertung

Vergleich traditionelle Methoden mit der neu vorgeschlagenen Vorgehensweise Gruppe 1 vs. Gruppe 2 vs. Gruppe 3 Gruppe 3

,764

,089

,166

,978

,053

,057

,331

,003**

,000**

,622

,002**

,000**(+)

,780

,005**(+)

,010**(+)

,551

,141

,047*(+)

,890

,070

,052

,782

,013*

,033*

Tabelle 103: Irrtumswahrscheinlichkeiten (p) der t-Tests auf Signifikanz der Unterschiede zwischen den untersuchten Gruppen beim Untersuchungsobjekt „Laptop“

Hoch signifikante Unterschiede ergeben sich, wie vermutet, beim empfundenen Informationsgehalt der Präferenzmessung. Die zur Verfügung gestellten Informationen sind demnach

bei Gruppe 3 aus Sicht der Entscheidungsträger hoch signifikant besser zur Einschätzung der Alternativen geeignet, gleichzeitig konnten sich die Entscheidungsträger diese Produkte hoch signifikant besser in der Realität vorstellen. Die Annahme von Schweikl (1985, 163), dass die wahrgenommene kognitive Belastung bei Untersuchung von relevanten Merkmalen steigt, konnte anhand der Einschätzung dieser Statements nicht bestätigt werden. Hier ist der gegenteilige Effekt signifikant. Die Nutzung relevanter Eigenschaften und Ausprägungen erleichtert folglich die Einschätzung der Alternativen innerhalb einer Studie zur Präferenzmessung. Dieser Effekt ist durchaus plausibel, da im Gegensatz zu Schweikl (1985) nicht nur die relevanten Eigenschaften, sondern auch die 1931

Um mehr als zwei Mittelwerte simultan miteinander zu verglichen, sollte die Varianzanalyse genutzt werden. Die Anwendungsvoraussetzungen der Varianzanalyse sind die Normalverteilung der Ausprägungen der metrischen Variable und die Homogenität der Varianzen zwischen den Vergleichsgruppen. Zudem sollten die verschiedenen Gruppen gleich stark besetzt sein (vgl. Janssen; Laatz (1999), 307; Backhaus; Erichson; Plinke; Weiber (2003), 150f.; Glaser (1978), 103ff.). Diese Anwendungsvoraussetzungen - insbesondere die Forderung nach Varianzhomogenität - werden in diesem Fall allerdings nicht erfüllt, weshalb auf entsprechende t-Tests zurückgegriffen wird. Bei der Durchführung des t-Tests wurde zunächst mit Hilfe des Levene-Tests überprüft, ob zwischen den Gruppen Varianzhomogenität vorliegt. Ist dies der Fall, kann auf den „klassischen“ t-Test bei unabhängigen Stichproben zurückgegriffen werden. Liegt keine Homogenität der Varianzen vor, wird der t-Test für unabhängige Gruppen mit ungleicher Varianz berechnet (siehe dazu auch Janssen; Laatz (1999), 297ff.) – diese Fälle werden in den folgenden Tabellen mit einem „(+)“ gekennzeichnet. Signifikante Unterschiede zwischen den Gruppen (p = 0,05) wurden mit einen „*“ und hoch signifikante Unterschiede „**“ mit gekennzeichnet.

393

Bandbreiten an die Anforderungen der Entscheidungsträger angepasst wurden. So ist davon auszugehen, dass es einem Befragungsteilnehmer einfacher fällt, die Ausprägungen einzuschätzen, zu denen er bereits über Produkterfahrung verfügt und er deshalb leichter eigene Nutzenvorstellungen ableiten kann. Ist die Bandbreite zu weit gewählt, befinden sich im Erhebungsdesign tendenziell mehr unrealistische Stimuli, die vermutlich schwerer zu beurteilen sind.1932 Der Einfluss der Darstellung wurde bei der Gruppe 3 signifikant besser als von den Befragungsteilnehmern der Gruppen 1 und 2 eingeschätzt. Nicht signifikant, aber tendenziell besser sind ebenfalls die Bewertungen der Statements für die Übersichtlichkeit der Darstellung sowie für die Motivation. Die Nutzung von entscheidungsrelevanten Merkmalen und deren Ausprägungen kann somit einen positiven Einfluss auf alle untersuchten Bereiche der Befragungssituation ausüben. In einem weiteren Schritt wurde die von den Entscheidungsträgern benötigte Zeit zur Einschätzung der Paarvergleiche des Fragebogens untersucht. Ein Vergleich der benötigten Zeit ist nur sinnvoll, wenn sich die Anzahl der notwendigen Bewertungen zwischen den Gruppen nicht unterscheidet. Dies ist in dieser Studie lediglich beim Untersuchungsobjekt „Laptop“ der Fall. Anhand der Ergebnisse in Tabelle 104 wird deutlich, dass keine generellen Aussagen über die Vorteilhaftigkeit bezüglich der benötigten Bearbeitungszeit bei den genutzten Methoden zur Bestimmung des Eigenschaftssets möglich sind. In diesem Beispiel sind kaum Unterschiede zwischen Gruppe 1 (5 Minuten) und 3 (6 Minuten) erkennbar, während Gruppe 2 deutlich mehr Zeit (9 Minuten) zur Bewertung der Stimuli benötigte.

Dauer der Befragung (Mittelwert in Minuten)

Gruppe 1 Elicitation Technik

Gruppe 2 Duale Befragung

Gruppe 3 Neue Methode

5 Minuten

9 Minuten

6 Minuten

Tabelle 104: Benötigte Zeit zur Einschätzung der Paarvergleiche innerhalb der Conjoint-Analyse beim Untersuchungsobjekt „Laptop“

Analyse der Befragungssituation für das Untersuchungsobjekt „Fernseher“

Beim Untersuchungsobjekt „Laptop“ ist die Zahl der notwendigen Einschätzungen zwischen den untersuchten Gruppen identisch. Dies ist beim Untersuchungsobjekt „Fernseher“ nicht der Fall: in den Gruppen 1 und 2 wurden jeweils 18 Paarvergleiche beurteilt, während bei der

1932

394

Siehe dazu Kapitel 4.2.3.2.

Gruppe 3.1 28 und bei der Gruppe 3.2 48 Bewertungen notwendig waren, um die Teilnutzen schätzen zu können.1933 In der folgenden Tabelle 105 werden die Mittelwerte der Bewertungen der Befragungssituation dargestellt. Unterschiede ergeben sich wiederum insbesondere bei dem „empfundenen Informationsgehalt“, der bei den Gruppen 3.1 und 3.2 höher eingestuft wurde. Bezüglich der

wahrgenommenen „kognitiven Belastung“ und der Einschätzung der „Übersichtlichkeit der Darstellung“ ergeben sich zwischen den Gruppen vergleichbare bzw. bei Gruppe 1 teilweise höhere Mittelwerte. Indikatoren der Befragungssituation

Gruppe 1 Elicitation Technik

Gruppe 2 Duale Befragung

4,2

4,3

4,1

4,2

4,2

4,3

4,3

4,2

5,2

5,8

6,2

6,7

5,5

6,1

6,4

6,5

6,3

6,4

6,3

5,8

7,0

6,7

6,4

5,9

7,1

6,7

6,7

6,5

6,0

6,3

6,3

5,9

Motivation der Empfundene Befragungsteilnehmer Abwechslung Spaß bei der Beantwortung empfundener Einschätzung des Informationsgehalt Informationsgehalts Vorstellung der Alternativen in der Realität wahrgenommene Sicherheit bei der kognitive Belastung Beantwortung der Fragen Einschätzung des Schwierigkeitsgrads der Bewertungen Übersichtlichkeit der Einschätzung der Darstellung Übersichtlichkeit der Darstellung Einfluss der Darstellung auf die Bewertung

Gruppe 3.1 Gruppe 3.2 Neue Methode Neue Methode

Tabelle 105: Mittelwerte der Einschätzung der Befragungssituation (9 Punkte Rating-Skala: 1- negativer Pol, 9 - positiver Pol) beim Untersuchungsobjekt „Fernseher“

Da die Entscheider die Befragungssituation offensichtlich ungleich bewertet haben, wird in der folgenden Tabelle 106 überprüft, ob sich diese Differenzen in den Mittelwerten zwischen den Gruppen signifikant unterscheiden.1934

1933 1934

Siehe dazu Kapitel 7.4.1. Da erneut die Anwendungsvoraussetzungen für die Durchführung einer Varianzanalyse nicht gegeben waren, wurden die Mittelwerte wiederum mit Hilfe von t-Tests untersucht. Bei der Einschätzung der Irrtumswahrscheinlichkeit wird analog zu Tabelle 103 vorgegangen.

395

Indikatoren der Befragungssituation

Motivation der Empfundene Befragungsteilnehmer Abwechslung Spaß bei der Beantwortung empfundener InforEinschätzung des mationsgehalt Informationsgehalts Vorstellung der Alternativen in der Realität wahrgenommene Sicherheit bei der kognitive Belastung Beantwortung der Fragen Einschätzung des Schwierigkeitsgrads der Bewertungen Übersichtlichkeit der Einschätzung der Darstellung Übersichtlichkeit der Darstellung Einfluss der Darstellung auf die Bewertung

Vergleich Vergleich traditionelle Methoden mit der Vergleich der trad. neu vorgeschlagenen Vorgehensweise der neuen Methoden Methoden Gruppe 1 Gruppe Gruppe Gruppe 1 Gruppe Gruppe vs. 1 vs. 2 vs. vs. 2 vs. 3.1 vs. Gruppe 2 Gruppe Gruppe Gruppe Gruppe Gruppe 3.1 3.1 3.2 3.2 3.2 ,762

,846

,631(+)

,995

,793

,866

,885

,901

,988

,915

,816

,829

,192

,022*(+)

,315

,001**(+)

,039*

,221

,091(+)

,020*(+)

,451

,031*

,340

,756

,812

,967

,860

,160

,117

,185

,400

,126

,466

,006**

,042*

,193

,230

,153

,814

,113(+)

,506(+)

,633(+)

,390

,334

,854

,847

,343

,302

Tabelle 106: Irrtumswahrscheinlichkeiten (p) der t-Tests auf Signifikanz der Unterschiede zwischen den untersuchten Gruppen

Wie erwartet, sind innerhalb der traditionellen Verfahren (Vergleich von Gruppe 1 und 2) keine signifikanten Unterschiede bei der Einschätzung der Befragungssituation zu beobachten. Auch zwischen den Gruppen 3.1 und 3.2 sind keine signifikanten Unterschiede vorhanden. Bei einem Vergleich zwischen den Gruppen der traditionellen und der neu vorgeschlagenen Vorgehensweise ergeben sich (bis auf den Vergleich zwischen Gruppe 2 und 3.1) für den wahrgenommenen Informationsgehalt signifikante bzw. hoch signifikante Unterschiede. Die zur Verfügung gestellten Informationen werden bei der neu vorgeschlagenen Vorgehensweise (Gruppen 3.1 und 3.2) von den Entscheidungsträgern als signifikant „ausreichender“ im Vergleich zu den Gruppen 1 und 2 wahrgenommen. Im Gegensatz zu Gruppe 1 konnten sich die Befragungsteilnehmer der Gruppen 3.1 und 3.2 zudem die Untersuchungsobjekte signifikant besser in der Realität vorstellen. Bei 48 notwendigen Paarvergleichen (Gruppe 3.2) wurde allerdings, im Vergleich zu den Gruppen 1 und 2 mit jeweils 18 Paarvergleichen, der Schwierigkeitsgrad der Bewertungen signifikant höher eingeschätzt. Die Anzahl der untersuchten Bewertungen hat somit einen negativen Einfluss auf den wahrgenommenen Schwierigkeitsgrad. Besonders interessant ist in 396

diesem Zusammenhang jedoch, dass die Anzahl der Einschätzungen bei den Gruppen 3.1 und 3.2 im Vergleich zu den Gruppen 1 und 2 keinen signifikant negativen Einfluss auf die Motivation der Probanden ausgeübt hat. Werden demnach die relevanten Merkmale und Ausprä-

gungen berücksichtigt, kann der Marktforscher tendenziell mehr Informationen untersuchen, ohne dass sich die Motivation der Entscheidungsträger im Vergleich zu den traditionellen Verfahren zur Bestimmung von Eigenschaftssets signifikant verschlechtert. Zwischenfazit zur Befragungssituation

Bei der Anwendung der neu vorgeschlagenen Vorgehensweise zur Bestimmung des Eigenschaftssets und einer identischen Anzahl an nötigen Bewertungen verbesserten sich sämtliche Indikatoren für die Befragungssituation (Untersuchungsobjekt: Laptop). Signifikante Unterschiede konnten bei den Statements zum Informationsgehalt beobachtet werden, d.h. mit Hilfe der vorgeschlagenen Vorgehensweise konnten sich die Befragungsteilnehmer die Alternativen signifikant besser in der Realität vorstellen, zudem wurden die zur Verfügung stehenden Informationen als signifikant „ausreichender“ zur Bewertung der Alternativen eingeschätzt. Die Nutzung von relevanten Eigenschaften und Ausprägung erleichtert darüber hinaus die Bewertung der Alternativen im Rahmen der Präferenzmessung signifikant. Beim Untersuchungsobjekt „Fernseher“ wurden bei der Gruppe 3.2 im Vergleich zu den anderen Gruppen mehr Eigenschaften untersucht. Insgesamt waren deshalb in den beiden Gruppen 3.1 und 3.2 jeweils mehr als doppelt so viele Paarvergleichsbewertungen als bei den Gruppen 1 und 2 (traditionelle Methoden) notwendig. Bei diesem Untersuchungsobjekt wurde der Informationsgehalt bei drei von vier Gruppenvergleichen bei der neu vorgeschlagenen Methode (Gruppen 3.1 und 3.2) als signifikant höher eingeschätzt. Die wesentlich höhere Anzahl an notwendigen Bewertungen hatte bei der Nutzung der relevanten Eigenschaften und Ausprägungen (Gruppe 3.1 und 3.2) zudem keinen signifikant negativen Einfluss auf die Motivation der Befragungsteilnehmer. Lediglich die Beurteilung des empfundenen Schwierigkeitsgrades stieg bei zwei von vier t-Tests signifikant. Werden somit die tatsächlich relevanten Eigenschaften und Eigenschaftsausprägungen genutzt, können tendenziell mehr Informationen mit Hilfe der Methoden der Präferenzmessung untersucht werden.

7.4.7 Analyse des Entscheidungsverhaltens der Befragungsteilnehmer

Zur Analyse des Entscheidungsverhaltens können einerseits die Antworten aus der Präferenzmessung (siehe Kapitel 3.10.4.2) sowie andererseits die Daten zur Einschätzung der Al-

ternativen der Referenzmethode (siehe Kapitel 3.10.4.1) herangezogen werden.

397

7.4.7.1 Untersuchung der absoluten Höhe der Kaufwahrscheinlichkeiten in der Referenzmethode

Wie in Kapitel 3.10.4.1 beschrieben, kann die absolute Höhe der Kaufwahrscheinlichkeiten aller Alternativen der Referenzmethode als Indikator für das Entscheidungsverhalten der

Befragungsteilnehmer genutzt werden. Fehlen beispielsweise wichtige Informationen (d.h. relevante Eigenschaften), die zur Bewertung eines Untersuchungsobjekts notwendig sind, könnte dies zu einer insgesamt schlechteren Einschätzung der vorgegebenen Alternativen führen.1935 Zur Untersuchung dieses Effekts wird der Mittelwert der Kaufwahrscheinlichkeiten berechnet und dieser zwischen den Gruppen verglichen. Die von einem Entscheider präferierten Alternativen sollten zudem eine möglichst hohe Kaufwahrscheinlichkeit aufweisen.1936 Im Folgenden werden deshalb jeweils die Kaufwahrscheinlichkeiten der präferierten Alternative sowie die der an zweiter bzw. dritter Stelle präferierten Stimuli untersucht. Analyse der Kaufwahrscheinlichkeiten beim Untersuchungsobjekt „Laptop“

In Tabelle 107 werden die Mittelwerte der Kaufwahrscheinlichkeiten, die für die Alternativen der Referenzmethode erhoben werden, präsentiert. Diese sind bei Gruppe 1 und 2 im Vergleich zu Gruppe 3 deutlich geringer. Entsprechendes gilt, wenn man jeweils den Mittelwert aus den individuellen maximalen und minimalen Kaufwahrscheinlichkeiten berechnet.1937

1935 1936

Vgl. Huber; McCann (1982), 332.

Vgl. Sawtooth Software (2002), 63. Die Rangfolge der Kaufwahrscheinlichkeiten der Alternativen wurde bereits im Rahmen der Prognosevalidität untersucht. In diesem Kapitel geht es dagegen um die absolute Höhe der Kaufwahrscheinlichkeiten. 1937 Anhand des Mittelwerts der Einschätzungen aller Alternativen der Referenzmethode kann untersucht werden, ob die Stimuli bei Anwendung der traditionellen Verfahren zur Festlegung eines Eigenschaftssets generell schlechter eingeschätzt werden. Die Kaufwahrscheinlichkeiten dienen dabei auch als Indikator für die Übertragbarkeit der Ergebnisse der Präferenzmessung, d.h. ist der Mittelwert der Kaufwahrscheinlichkeiten in einer Gruppe gering, deutet dies darauf hin, dass es sich aus Sicht eines Entscheiders nicht um relevante Produkte handelt. So könnte ein Proband den sechs präsentierten Stimuli der Referenzmethode lediglich Kaufwahrscheinlichkeiten von 0%, 5%, 10%, 10%, 20% und 30% zuweisen. Als Mittelwert ergibt sich bei diesem Befragungsteilnehmer eine Kaufwahrscheinlichkeit von 12,5%. Ein aggregierter Wert für alle Befragungsteilnehmer kann in einem zweiten Schritt durch erneute Mittelwertbildung berechnet werden. Werden in der Präferenzmessung Eigenschaften untersucht, deren Ausprägungen eine hohe Bandbreite aufweisen, ist zudem damit zu rechnen, dass die Bandbreite der Einschätzungen steigt. Zu diesem Zweck werden auch die Minimal- und Maximalwerte der Einschätzungen erfasst, als Minimalwert ergibt sich im obigen Beispiel eine Kaufwahrscheinlichkeit von „0%“ und eine maximale Kaufwahrscheinlichkeit von „30%“. Zur Aggregation der Werte über alle Entscheider einer Gruppe wurden Mittelwerte aus den individuellen Minimal- bzw. Maximalwerten berechnet.

398

Mittelwert Mittelwert des Minimums Mittelwert des Maximums

Gruppe 1 Elicitation Technik 43 % 6% 87 %

Gruppe 2 Duale Befragung 40 % 7% 81 %

Gruppe 3 Neue Methode 53 % 18 % 89 %

Tabelle 107: Aggregierte Maßzahlen der Kaufwahrscheinlichkeiten für die Alternativen der Referenzmethode

Untersucht man die Mittelwerte der Kaufwahrscheinlichkeiten der einzelnen Gruppen mit Hilfe einer Varianzanalyse1938 ergibt sich ein Signifikanzwert von p=0,000, d.h. die Methode zur Bestimmung eines Eigenschaftssets hat einen hoch signifikanten Einfluss auf den Mittelwert der Kaufwahrscheinlichkeiten. Durch Anwendung eines Post-Hoc Tests kann in einem zweiten Schritt überprüft werden, zwischen welchen Gruppen die signifikanten Unterschiede zu beobachten sind – um die Stabilität der Ergebnisse zu überprüfen, wurde hier auf zwei entsprechende Tests - den Sheffèund den LSD-Test - zurückgegriffen. Bei dem Sheffè-Test handelt es sich um einen sehr „strengen“ Test, der insbesondere auch bei unterschiedlich großen Gruppen geeignet ist. Der LSD-Test soll demgegenüber lediglich zur Verifizierung herangezogen werden, er entspricht weitgehend einem t-Test zwischen allen Gruppenpaaren.1939 Anhand der Ergebnisse in Tabelle 108 können zwischen den traditionellen Verfahren (Gruppe 1 und 2) keine signifikanten Unterschiede beobachtet werden. Vergleicht man dagegen die Mittelwerte der Kaufwahrscheinlichkeiten zwischen den traditionellen Methoden (Gruppe 1 bzw. 2) und dem neu vorgeschlagenen Verfahren (Gruppe 3), so ergeben sich jeweils hoch signifikante Unterschiede. Die Alternativen der Gruppen 1 und 2 werden demnach insgesamt schlechter eingeschätzt. Dies bedeutet allerdings auch, dass die Stimuli der Gruppe 3 aufgrund der signifikant höheren Kaufwahrscheinlichkeit eher im Rahmen einer Kaufentscheidung relevant sind. Mit Hilfe der hier vorgeschlagenen Vorgehensweise können somit Präferenzen erhoben werden, die eher einer realen Kaufsituation entsprechen.

1938

Die Anwendungsvoraussetzungen für die Durchführung einer Varianzanalyse sind in diesem Fall erfüllt. Die Normalverteilungsannahme wurde dabei mit Hilfe des Kolmogorov-Smirnov-Anpassungstests überprüft (es ergab sich ein pWert von 0,213, so dass davon ausgegangen werden kann, dass Normalverteilung vorliegt). Zum Test der Homogenität der Varianzen zwischen den Gruppen wurde auf einen Levene-Test zurückgegriffen (p = 0,328). 1939 Vgl. Janssen; Laatz (1999), 317.

399

Scheffé-Prozedur LSD-Test

Vergleich der trad. Methoden Gruppe 1 vs. Gruppe 2 ,341 ,143

Vergleich traditionelle Methoden mit der neu vorgeschlagenen Vorgehensweise Gruppe 1 vs. Gruppe 2 vs. Gruppe 3 Gruppe 3 ,000** ,000** ,000** ,000**

Tabelle 108: Irrtumswahrscheinlichkeiten (p) der Post-Hoc Tests bei der Varianzanalyse zur Analyse von Mittelwertunterschieden bei der Einschätzung von Kaufwahrscheinlichkeiten

Im Folgenden sollen die Mittelwerte der absoluten Höhe der Kaufwahrscheinlichkeiten für die Alternativen der Referenzmethode untersucht werden (siehe Tabelle 109). Die hier genutzte Rangfolge ergibt sich aus den auf individueller Ebene berechneten Gesamtnutzen der Stimuli.1940 Man kann erkennen, dass sich die absolute Höhe der durchschnittlichen Kaufwahrscheinlichkeiten der präferierten Produktalternativen zwischen der Gruppe 1 und 3 kaum unterscheidet. Da die Stimuli der Referenzmethode zufällig erstellt wurden,1941 ist bei Gruppe 1 nicht auszuschließen, dass sich eine dominante Alternative im Untersuchungsset der Referenzmethode befindet, die eine vergleichbar hohe Kaufwahrscheinlichkeit wie der präferierte Stimulus der Gruppe 3 aufweisen kann. Insgesamt ergab sich, wie bereits beschrieben, beim Mittelwertvergleich der Kaufwahrscheinlichkeiten bei den Gruppen 1 und 2 ein signifikant geringerer Wert als bei der Gruppe 3. Dieser resultiert insbesondere aus den weniger stark präferierten Stimuli des Untersuchungssets der Referenzmethode. Entsprechend sind bei einer sehr hohen Bandbreite der Eigenschaftsausprägungen dominierte und evtl. nicht akzeptable Alternativen wahrscheinlicher. Dies ist daran erkennbar, dass die Stimuli der Gruppen 1 und 2, die sich auf einem hinteren durch die Präferenzmessung prognostizierten Rangplatz befinden, eine deutlich niedrigere durchschnittliche Kaufwahrscheinlichkeit als die Produktalternativen bei Gruppe 3 aufweisen. Der Anteil der Produkte mit einer Kaufwahrscheinlichkeit unter 30% ist beispielsweise bei Gruppe 1 und 2 entsprechend höher als bei Gruppe 3.

1940

In dieser Studie bestand die Referenzmethode aus sechs Alternativen, die zufällig gebildet wurden (siehe auch Kapitel 3.10.1 und 7.4.5). Die Befragungsteilnehmer wurden gebeten, diese Stimuli anhand von Kaufwahrscheinlichkeiten zu bewerten. Auf Basis dieser Einschätzungen ist es möglich, die Alternativen in eine Reihenfolge entsprechend ihrer Vorziehenswürdigkeit zu bringen und die absolute Höhe der Kaufwahrscheinlichkeiten für die sechs Produkte zu untersuchen. Durch Mittelwertbildung können diese Kaufwahrscheinlichkeiten für die Alternativen eines Rangs, die auf individuellem Niveu erhoben wurden, über alle Probanden einer Gruppe aggregiert werden. 1941 Siehe dazu Kapitel 3.10.1.

400

Berechnete Rangfolge der Alternativen präferierte Alternative Alternative an 2. Stelle Alternative an 3. Stelle Alternative an 4. Stelle Alternative an 5. Stelle Alternative an 6. Stelle

Gruppe 1 Elicitation Technik 77 % 57 % 55 % 33 % 18 % 18 %

Gruppe 2 Duale Befragung 67 % 57 % 53 % 29 % 20 % 14 %

Gruppe 3 Neue Methode 78 % 67 % 57 % 48 % 39 % 28 %

Tabelle 109: Mittelwert der Kaufwahrscheinlichkeiten nach der prognostizierten Rangfolge

Für das Untersuchungsobjekt „Laptop“ kann zusammenfassend festgestellt werden, dass bei der Nutzung von u.U. nicht relevanten Merkmalen bzw. Bandbreiten der Eigenschaftsausprägungen die untersuchten Alternativen signifikant schlechter als bei Nutzung von relevanten Attributen und Ausprägungen eingeschätzt wurden. Je geringer jedoch die Kaufwahrscheinlichkeit der untersuchten Alternativen ist, um so fraglicher erscheint die Übertragbarkeit der Schätzwerte auf reale Kaufentscheidungen. Akzeptiert man die absolute Höhe der angegebenen Kaufwahrscheinlichkeiten als einen Indikator für die Übertragbarkeit von Ergebnissen der Präferenzmessung auf reale Kaufentscheidungen, so weist die neu vorgeschlagene Vorgehensweise signifikante Vorteile auf. Analyse der Kaufwahrscheinlichkeiten beim Untersuchungsobjekt „Fernseher“

Anhand der Ergebnisse in Tabelle 1101942 und Tabelle 1111943 ist bei dem Untersuchungsobjekt „Fernseher“ erkennbar, dass die Alternativen bei den traditionellen Verfahren (Gruppen 1 und 2) im Vergleich zu den Einschätzungen bei der neu vorgeschlagenen Vorgehensweise (Gruppen 3.1 und 3.2) hoch signifikant bzw. signifikant schlechter bewertet wurden. Zwischen den Gruppen 1 und 2 bzw. zwischen den Gruppen 3.1 und 3.2 bestehen dagegen, wie erwartet, keine signifikanten Unterschiede in der absoluten Höhe der Kaufwahrscheinlichkeiten. Die signifikanten Unterschiede der Kaufwahrscheinlichkeiten zwischen den traditionellen Verfahren und der neuen Methode können demnach allein auf das Eigenschaftsset zurückgeführt werden.

Mittelwert Mittelwert des Minimums Mittelwert des Maximums

Gruppe 1 Elicitation Technik 41 % 6% 92 %

Gruppe 2 Duale Befragung 39 % 6% 87 %

Gruppe 3.1 Neue Methode 52 % 16 % 93 %

Gruppe 3.2 Neue Methode 50 % 12 % 91 %

Tabelle 110: Aggregierte Maßzahlen der Kaufwahrscheinlichkeiten für die Alternativen der Referenzmethode

1942 1943

Die Berechnung erfolgte analog zu Tabelle 107. Eine Varianzanalyse konnte durchgeführt werden, da die Anwendungsvoraussetzungen – insbesondere bezüglich der Annahme der Normalverteilung (Test durch einen Kolmogorov-Smirnov Test mit p = 0,239) und der Homogenität der Varianzen zwischen den Gruppen ( der Levene-Test ergab einen p-Wert von 0,649) – erfüllt wurden.

401

Vergleich Vergleich traditionelle Methoden mit der Vergleich der trad. neu vorgeschlagenen Vorgehensweise der neuen Methoden Methoden Gruppe 1 Gruppe 1 Gruppe 2 Gruppe 1 Gruppe 2 Gruppe vs. vs. vs. vs. vs. 3.1 vs. Gruppe 2 Gruppe Gruppe Gruppe Gruppe Gruppe 3.1 3.1 3.2 3.2 3.2 Scheffé-Prozedur

,684

,000**

,000**

,015*

,001**

0,940

LSD-Test

,223

,000**

,000**

,001**

,000**

0,527

Tabelle 111: Irrtumswahrscheinlichkeiten (p) der Post-Hoc Tests bei der Varianzanalyse zur Analyse von Mittelwertunterschieden bei der Einschätzung von Kaufwahrscheinlichkeiten

Untersucht man die Kaufwahrscheinlichkeiten der weniger bevorzugten Alternativen genauer (siehe Tabelle 112),1944 so ist auffällig, dass diese bei den Gruppen 1 und 2 tendenziell schlechter eingeschätzt werden. Auch hier ist beispielsweise der Anteil der Alternativen mit einer Kaufwahrscheinlichkeit unter 30% bei den Gruppen 1 und 2 im Vergleich zu den Gruppen 3.1 und 3.2 höher.

präferierte Alternative Alternative an 2. Stelle Alternative an 3. Stelle Alternative an 4. Stelle Alternative an 5. Stelle Alternative an 6. Stelle

Gruppe 1 Elicitation Technik 90 % 56 % 42 % 28 % 19 % 14 %

Gruppe 2 Duale Befragung 85 % 51 % 39 % 25 % 18 % 14 %

Gruppe 3.1 Neue Methode 92 % 72 % 53 % 42 % 34 % 17 %

Gruppe 3.2 Neue Methode 87 % 62 % 56 % 45 % 33 % 17 %

Tabelle 112: Mittelwert der Kaufwahrscheinlichkeiten nach der prognostizierten Rangfolge

Zwischenfazit zur Analyse der Bewertungen bei der Referenzmethode

Die absolute Höhe der Kaufwahrscheinlichkeiten kann, wie bereits beschrieben, als ein Indikator für die Übertragbarkeit der Ergebnisse der Präferenzmessung genutzt werden. Weisen die Kaufwahrscheinlichkeiten der Alternativen der Referenzmethode insgesamt geringe Werte auf, so deutet dies darauf hin, dass diese Alternativen bei realen Kaufentscheidungen nicht relevant sind. Die Ergebnisse der Präferenzmessung sind in diesen Fallen nicht zur Ableitung produktpolitischer Entscheidungen geeignet, d.h. nicht auf reale Wahlentscheidungen übertragbar. Bei beiden Untersuchungsobjekten „Laptop“ und „Fernseher“ wurden die Alternativen der Referenzmethode bei der Bestimmung der Alternativen auf der Basis traditioneller Verfahren signifikant schlechter als die Alternativen auf Basis der neu vorgeschlagenen Methode eingeschätzt. Die Schätzwerte, die auf Basis der neu vorgeschlagenen Methode bestimmt wurden

1944

402

Die Berechnung erfolgte dabei analog zu Tabelle 109.

(dies betrifft Gruppe 3 bzw. 3.1 und 3.2), sind somit signifikant besser geeignet, tatsächliches Marktverhalten von Entscheidungsträgern vorherzusagen.

7.4.7.2 Analyse des Antwortverhaltens während der Präferenzmessung

Zur Analyse des Antwortverhaltens während der Präferenzmessung können zum einen die zur Bewertung der Paarvergleiche verwendeten Skalenpunkte untersucht werden. Werden extremere Skalenpunkte besonders häufig zur Beurteilung der Alternativen verwendet, kann dies ein Hinweis auf die Anwendung von Entscheidungsheuristiken darstellen.1945 Andererseits soll die Verteilung der in der Präferenzmessung ermittelten Bedeutungsgewichte untersucht werden. Weisen einige Eigenschaften ein sehr hohes, andere dagegen ein niedriges Bedeutungsgewicht auf, ist dies ein weiteres Indiz dafür, dass die Entscheidungsträger bei der Bewertung der Alternativen auf Entscheidungsheuristiken zurückgegriffen haben. In einem letzten Schritt wird das Antwortverhalten der Befragungsteilnehmer anhand von Bandbreitensensitivitäten analysiert. Dies ist allerdings nur bei den Eigenschaften möglich,

bei denen der Bewertung vermutlich das Vektormodell1946 zugrunde liegt. Eine Änderung der Merkmalsausprägung sollte bei diesen Attributen mit einer proportionalen Änderung des Teilnutzens einhergehen. Ändern sich die Teilnutzen der Ausprägungen nicht in dem prognostizierten Verhältnis, deutet dies auf das Auftreten von Bandbreiteneffekten, die die Schätzung verzerren können, hin.1947 Mit Bandbreiteneffekten ist, wie in Kapitel 3.10.4.2 beschrieben, vor allem dann zu rechnen, wenn die Bandbreite der untersuchten Merkmalsausprägungen aus Sicht der Entscheidungsträger zu weit gewählt wurde. 7.4.7.2.1 Untersuchung der verwendeten Skalenpunkte

Wie im Kapitel 3.10.4.2 beschrieben, ist davon auszugehen, dass größere Bandbreiten der Merkmalsausprägungen im Vergleich zur Nutzung relevanter Ausprägungen zur Anwendung extremerer Bewertungen führen könnte, da sich die Alternativen tendenziell stärker bezüglich der wahrgenommenen Nutzendifferenzen unterscheiden. Betrachtet man allerdings die ver-

1945 1946 1947

Siehe Kapitel 3.10.4.2. Siehe Kapitel 2.6. Siehe Kapitel 5.7.1.

403

wendeten Skalenpunkte beim Untersuchungsobjekt „Laptop“ (siehe Tabelle 113),1948 so kann diese Vermutung nicht bestätigt werden.

G1: Elicitation G2: Duale Befragung G3: Neue Methode

Anteil der verwendeten Skalenpunkte zur der Bewertung der Stimuli + 4 oder - 4 +3 oder - 3 + 2 oder - 2 + 1 oder -1 (0) 29 % 18 % 20 % 23 % (10 %) 30 % 19 % 21 % 21 % (9 %) 28 % 19 % 17 % 24 % (11 %)

Tabelle 113: Anteil der verwendeten Skalenpunkte zur der Bewertung der Stimuli beim Untersuchungsobjekt „Laptop“

Beim Untersuchungsobjekt „Fernseher“ ergeben sich jedoch deutliche Unterschiede in der Nutzung der zur Verfügung stehenden Skalenpunkte (siehe Tabelle 114). Hier wurden bei den Gruppen 1 und 2 häufiger extremere Skalenpunkte zur Einschätzung der Alternativen verwendet.

G1: Elicitation G2: Duale Befragung G3.1: Neue Methode – Gruppe 3.1 G3.2: Neue Methode – Gruppe 3.2

Anteil der verwendeten Skalenpunkte zur der Bewertung der Stimuli + 4 oder - 4 +3 oder - 3 + 2 oder - 2 + 1 oder -1 (0) 39 % 14 % 19 % 19 % (9 %) 40 % 21 % 16 % 15 % (8 %) 29 % 24 % 20 % 20 % (7 %) 25 % 23 % 22 % 23 % (7 %)

Tabelle 114: Anteil der verwendeten Skalenpunkte zur der Bewertung der Stimuli beim Untersuchungsobjekt „Fernseher“

Möglicherweise wurden die Bandbreiten der untersuchten Eigenschaften bei den Gruppen 1 und 2 beim Untersuchungsobjekt „Fernseher“ im Vergleich zum „Laptop“ als größer wahrgenommen. Ist dies der Fall, sollten auch die Bedeutungsgewichte bei dem Untersuchungsobjekt „Fernseher“ unterschiedlicher verteilt sein. 7.4.7.2.2 Untersuchung der Bedeutungsgewichte der Merkmale

Die berechneten Bedeutungsgewichte der untersuchten Merkmale können auch einen Hinweis auf die genutzte Bewertungsstrategie geben. Da in den verschiedenen Gruppen unterschiedliche Eigenschaften von den Befragungsteilnehmern bewertet wurden, ist die absolute Höhe der Bedeutungsgewichte allerdings nicht als Vergleichsgröße zwischen den Gruppen geeignet.

1948

404

Zur Beurteilung der Alternativen A und B innerhalb eines Paarvergleichs wurde in dieser Studie jeweils eine bipolare 9 Punkte Rating-Skala mit Skalenwerten von „+4“ bis“ –4“ genutzt, die verbal beschrieben wurden. Ein Wert von „+4“ bedeutet dabei, dass der Stimulus A „sehr viel“ stärker als B präferiert wurde; „-4“ entspricht dagegen einer Einschätzung, bei der ein Befragungsteilnehmer die Alternative B „sehr viel“ stärker als A bevorzugt hat. In diesem Abschnitt soll untersucht werden, ob die Nutzung großer Bandbreiten der Ausprägungen ebenfalls extremere Bewertungen zur Folge hat. Zu diesem Zweck wurde nicht zwischen den Skalenpunkten „+4“ oder „-4“ unterschieden, da diese Bewertung lediglich davon abhängt, welcher Stimulus innerhalb eines Paarvergleichs links bzw. rechts präsentiert wurde. Vielmehr soll das Ausmaß der Abweichungen von dem neutralen Punkt „0“ (die Alternativen sind „gleich gut“) untersucht werden - entsprechend wird in Tabelle 113 der Anteil der Nutzung der Skalenpunkte „+4 oder –4“, „+3 oder –3“ (eine der beiden Alternativen wurde „viel“ besser bewertet), „+2 oder –2“ (eine der beiden Stimuli wurde als „deutlich“ besser eingeschätzt) und „+1 oder –1“ (eine der beiden Alternativen wurde „etwas“ besser beurteilt) dargestellt.

Dagegen kann untersucht werden, wie stark die ermittelten Bedeutungsgewichte in jeder Gruppe schwanken. Je nachdem, wie die Bandbreiten der Eigenschaften gewählt wurden, ergeben sich unterschiedliche Bedeutungsgewichte für die Merkmale. Attribute, die kaum bei einer Bewertung beachtet werden, haben ein geringes Bedeutungsgewicht. Gründe für geringe Bedeutungsgewichte sind, 1.) dass die untersuchte Eigenschaft bei dem gegebenen Untersuchungskontext tatsächlich unwichtiger ist oder dass 2.) der Entscheidungsträger bei der Bewertung der Alternativen Entscheidungsheuristiken nutzt. Bei der Nutzung von traditionellen Methoden zur Bestimmung des Eigenschaftssets ist aufgrund der in Kapitel 5 beschriebenen Schwachpunkte nicht ausgeschlossen, dass evtl. auch nicht relevante Merkmale untersucht werden. Bei diesen Attributen ist mit einem entsprechend niedrigen Bedeutungsgewicht zu rechnen. Beim Einsatz der traditionellen Verfahren zur Bestimmung eines Eigenschaftssets ist zudem tendenziell stärker mit dem Anwendung von Entscheidungsheuristiken zu rechnen, da hier die Ausprägungen vom Marktforscher festgelegt werden und so aus Sicht der Entscheider unakzeptable Merkmalsausprägungen nicht ausgeschlossen werden können. Insofern ist damit zu rechnen, dass hier die Bedeutungsgewichte stärker als bei der Anwendung der vorgeschlagenen Methode streuen. Um diese Effekte zu untersuchen, wurden zunächst die Bedeutungsgewichte für alle Merkmale auf individueller Ebene berechnet. In einem zweiten Schritt werden die Abweichungen von dem Fall berechnet, in dem alle Eigenschaften gleich gewichtet wären.1949 Die Summe der absoluten Abweichungen zwischen Mittelwert bei Gleichgewichtung und tatsächlichem Bedeutungsgewicht auf individueller Ebene dient als Maß für die Unterschiedlichkeit der Bedeutungsgewichte. Durch Mittelwertbildung dieser Werte über alle Eigenschaften werden die

Daten zunächst auf Ebene der Befragungsteilnehmer und danach über alle Probanden aggregiert. Für das Untersuchungsobjekt „Laptop“ ergeben sich bezüglich der Mittelwerte der Abweichungen kaum Unterschiede. Beim Untersuchungsobjekt „Fernseher“ sind dagegen deutliche Unterschiede offensichtlich - wie vermutet sind hier die Abweichungen bei den traditionellen Methoden größer als bei der neu vorgeschlagenen Vorgehensweise (siehe Tabelle 115).

1949

Die Summe der Bedeutungsgewichte beträgt immer „1“, d.h. bei der Gleichgewichtung von vier Eigenschaften ergäbe sich jeweils ein Wert von „0,25“ als Bedeutungsgewicht.

405

Laptop Fernseher

Gruppe 1 Elicitation Technik 0,434 0,6121

Gruppe 2 Duale Befragung 0,392 0,7098

Gruppe 3 Neue Methode 0,450 0,3912 (G 3.1) 0,3907 (G 3.2)

Tabelle 115: Mittelwerte der Unterschiedlichkeit der Bedeutungsgewichte

Mit Hilfe einer Varianzanalyse kann wiederum untersucht werden, ob die Unterschiede zwischen den Mittelwerten der untersuchten Gruppen einen systematischen Charakter haben.1950 Dabei ergibt sich für den F-Test der Varianzanalyse beim Untersuchungsobjekt „Laptop“ ein p-Wert von 0,130, d.h. zwischen den Gruppen existieren keine signifikanten Unterschiede in den mittleren Abweichungen der Bedeutungsgewichte.1951 Beim Untersuchungsobjekt „Fernseher“ ergibt sich bei der Durchführung einer Varianzanalyse beim F-Test ein p-Wert von 0,000 – es bestehen somit hoch signifikante Gruppenunterschiede zwischen den mittleren Abweichungen der Bedeutungsgewichte. Ergebnis der folgenden post-Hoc Tests (siehe Tabelle 116) ist, dass sowohl zwischen den Gruppen 1 und 2 als auch zwischen den traditionellen Verfahren zur Bestimmung des Eigenschaftssets und der neu vorgeschlagenen Vorgehensweise hoch signifikante Unterschiede in den Schwankungen der Bedeutungsgewichte auftreten. Anhand der jeweiligen Mittelwerte (Tabelle 115) kann allerdings festgestellt werden, dass die größten Unterschiede zwischen den traditionellen und der neu vorgeschlagenen Vorgehensweise bestehen. Bei diesem Untersuchungsobjekt ist die Schwankung der Bedeutungsgewichte, wie vermutet, bei den traditionellen Methoden höher. Vergleich Vergleich traditionelle Methoden mit der Vergleich der trad. neu vorgeschlagenen Vorgehensweise der neuen Methoden Methoden Gruppe 1 Gruppe 1 Gruppe 2 Gruppe 1 Gruppe 2 Gruppe vs. vs. vs. vs. vs. 3.1 vs. Gruppe 2 Gruppe Gruppe Gruppe Gruppe Gruppe 3.1 3.1 3.2 3.2 3.2 Scheffé-Prozedur

,005**

,000**

,000**

,000**

,000**

1,000

LSD-Test

,000**

,000**

,000**

,000**

,000**

,987

Tabelle 116: Irrtumswahrscheinlichkeiten (p-Werte) der Post-Hoc Tests bei der Analyse von mittleren Abweichungen der Bedeutungsgewichte

Zusammenfassend deuten Ergebnisse dieser Analyse darauf hin, dass - zumindest beim Untersuchungsobjekt „Laptop“ - entgegen der Annahme die Bedeutungsgewichte bei den tradi-

1950

Die Voraussetzungen für die Anwendung der Varianzanalyse sind bei beiden Untersuchungsobjekten gegeben; Varianzhomogenität (der Levene-Test ergibt beim Untersuchungsobjekt „Laptop“ einen p-Wert von 0,139 und beim „Fernseher“ 0,814) und Normalverteilung (der p-Wert für den Kolmogorov-Smirnov Test ist beim Untersuchungsobjekt „Laptop“ 0,339 und beim „Fernseher“ 0,865) liegen vor. 1951 Da aufgrund des F-Tests keine signifikanten Unterschiede bestimmt werden konnten, wird auf eine Darstellung der Ergebnisse der Post-Hoc Tests verzichtet.

406

tionellen Verfahren nicht stärker als bei Anwendung der neuen Methode schwanken. „Dominante“ Eigenschaften oder wenig berücksichtigte Merkmale hätten den Wert für die Unterschiedlichkeit der Bedeutungsgewichte erhöht. Beim Untersuchungsobjekt „Fernseher“ ergeben sich dagegen, wie beschrieben, zwischen den traditionellen Methoden und der neu entwickelten Vorgehensweise bezüglich der Unterschiedlichkeit der Bedeutungsgewichte hoch signifikante Unterschiede. Es dominieren insbesondere bei der Gruppe 2 einzelne Merkmale die Entscheidung, während andere Eigenschaften kaum eine Rolle spielen. Dies wird auch anhand der berechneten Bedeutungsgewichte (siehe Tabelle 117) deutlich. Bei der Analyse der zur Einschätzung der Paarvergleiche verwendeten Skalenpunkte wurde ebenfalls festgestellt, dass bei diesem Untersuchungsobjekt eher Entscheidungsheuristiken Anwendung fanden.1952 Demnach beeinflussen beispielsweise bei Gruppe 2 die Merkmale „Preis“ und „Bildschirmdiagonale“ die Entscheidung, andere Eigenschaften wie „Marke“ und „Vor-Ort Service“ werden dagegen kaum berücksichtigt. Das Attribut „Preis“ dominiert dabei die Bewertungen der Entscheidungsträger. Preis 0,50

Bildschirmdiagonale 0,34

Marke 0,09

Vor-Ort Service 0,07

Tabelle 117: Bedeutungsgewichte der Eigenschaften bei Gruppe 2 (Duale Befragung) und dem Untersuchungsobjekt „Fernseher“

Bei diesem Eigenschaftsset ist nicht mehr mit einer tatsächlichen Trade-off Entscheidung, sondern vielmehr mit der Anwendung von Entscheidungsheuristiken zu rechnen. Auch bei der Gruppe 1 (Elicitation Technik, siehe Tabelle 118) dominieren die Eigenschaften „Preis“ und „Bildschirmdiagonale“ die Bewertungen der Befragungsteilnehmer. Die Merkmale „Marke“ und „Fernbedienung“ werden im Vergleich dazu bei der Bewertung der Alternativen kaum beachtet. Preis 0,46

Bildschirmdiagonale 0,31

Marke 0,09

Fernbedienung 0,13

Tabelle 118: Bedeutungsgewichte der Eigenschaften bei Gruppe 1 (Elicitation Technik) und dem Untersuchungsobjekt „Fernseher“

Im Gegensatz dazu wurde bei Anwendung der neu vorgeschlagenen Vorgehensweise in keiner der Gruppen eine vergleichbare Dominanz bestimmter Merkmale beobachtet (siehe Tabelle 119 und Tabelle 120).

1952

Siehe Kapitel 7.4.7.2.1.

407

Preis 0,33

Bildschirmdiagonale 0,22

Bildfrequenz 0,27

Bildschirmformat 0,17

Tabelle 119: Bedeutungsgewichte der Eigenschaften bei Gruppe 3.1 (neue Methode) und dem Untersuchungsobjekt „Fernseher“ Preis

Bildschirmdiagonale

Projektionstechnik

0,28

0,30

0,17

Virtual Dolby Surround 0,13

Bildschirmformat 0,12

Tabelle 120: Bedeutungsgewichte der Eigenschaften bei Gruppe 3.2 (neue Methode) und dem Untersuchungsobjekt „Fernseher“

Bei der Anwendung der traditionellen Methoden zur Bestimmung eines Eigenschaftssets ist somit tendenziell stärker mit dem Auftreten von dominanten Eigenschaften zu rechnen. Dies könnte ein Indiz dafür sein, dass die falschen Eigenschaften und Ausprägungen ermittelt und später untersucht wurden. Bei der Nutzung der neu vorgeschlagenen Vorgehensweise wurde die Dominanz einzelner Merkmale vermieden. 7.4.7.2.3 Analyse der Bandbreitensensitivitäten

Mit der Änderung der Bandbreite einer Eigenschaft müssen sich bei Vorliegen einer linearen Wertfunktion für die Ausprägungen (z.B. beim Vektormodell1953) auch die Eigenschaftsgewichte der Merkmale in einem bestimmten Verhältnis ändern. Ist dies nicht der Fall, kann der Entscheidungsträger u.U. die Eigenschaftsgewichte nicht konsistent bestimmen.1954 Bandbreitensensitivitäten können weiterhin lediglich für die Eigenschaften berechnet werden, deren Ausprägungen ein metrisches Skalenniveau aufweisen und bei denen mindestens drei Ausprägungen untersucht wurden. Zudem muss, um das Maß sinnvoll berechnen zu können, Augenscheinvalidität vorliegen – beispielsweise muss der Fall, dass ein niedrigerer Preis einem höheren Preis vorgezogen wird, gegeben sein. Sind diese Voraussetzungen erfüllt, können die Bandbreitensensitivitäten als Maß für die Art der Bewertungsstrategie auf Basis der in Kapitel 3.10.4.2 vorgeschlagenen Methode berechnet werden. Dieses Gütemaß gibt an, wie stark sich bei einer Variation der Bandbreite der Ausprägungen die empirisch beobachtete und die theoretisch geforderte Änderung der Nutzen unterscheiden. In Tabelle 121 werden die Mittelwerte der Abweichungen vom erwarteten Teilnutzen bei Vorliegen einer linearen Wertfunktion für das Untersuchungsobjekt „Laptop“ dargestellt.1955

1953 1954 1955

408

Siehe Kapitel 2.6. Vgl. Sattler; Gedenk; Hensel-Börner (2002b), 954. Die Mittelwerte der Bedeutungsgewichte der Eigenschaften beim Untersuchungsobjekt „Laptop“ werden im Anhang VII präsentiert.

Die Beobachtungswerte geben dabei den Anteil der Abweichungen der Teilnutzen an der gesamten Bandbreite eines Merkmals wieder.1956 Hohe Werte weisen somit auf das Vorhandensein eines Bandbreiteneffekts hin. Gruppe 1: Elicitation Technik Gruppe 2: Duale Befragung Gruppe 3: Neue Methode

Preis 20,72 % Preis 12,39 % Preis 15,94 %

Untersuchte Eigenschaften Akkulaufzeit Gewicht 21,98 % 25,11 % Akkulaufzeit 11,51 %

Festplattenkapazität 18,00 % Festplattenkapazität 14,04 % Festplattenkapazität 14,63 %

Tabelle 121: Mittelwerte der Abweichungen von dem erwarteten Teilnutzen für das Untersuchungsob1957 jekt “Laptop”

Anhand der Ergebnisse in Tabelle 121 weist lediglich die Gruppe 1 erhöhte Abweichungen bezüglich der zu erwartenden Teilnutzen auf. Entgegen der Vermutung sind die Abweichungen bei der Nutzung der neuen Methode somit nicht in jedem Fall kleiner als bei der Anwendung der traditionellen Verfahren zur Festlegung der zu untersuchenden Merkmale und der Ausprägungen (dies betrifft insbesondere den Vergleich zwischen Gruppe 2 und 3). Bei der Gruppe 1 ist jedoch auffällig, dass die Abweichung vom erwarteten Teilnutzen bei den Eigenschaften, die ein relativ geringes Bedeutungsgewicht aufweisen, tendenziell höher ist. Betrachtet man die Ergebnisse der Abweichungen beim Untersuchungsobjekt „Fernseher“ (siehe Tabelle 122), so wird bei der Eigenschaft „Preis“ deutlich, dass die Abweichungen bei allen drei untersuchten Gruppen vergleichsweise klein sind.

1956 1957

Für eine Erläuterung der Vorgehensweise siehe Kapitel 3.10.4.2. Die Anzahl der untersuchten Eigenschaften unterscheidet sich zwischen den betrachteten Gruppen 1, 2 und 3, da nicht alle Merkmale den Anforderungen entsprachen, um die Abweichungen vom erwarteten Teilnutzen berechnen zu können.

409

Gruppe 1: Elicitation Technik Gruppe 2: Duale Befragung Gruppe 3.2: Neue Methode

Untersuchte Eigenschaft Preis 12,08 % Preis 11,32 % Preis 10,72 %

Tabelle 122: Mittelwerte der Abweichungen von dem erwarteten Teilnutzen für das Untersuchungsob1958 jekt “Fernseher”

Insgesamt konnte anhand der Berechnung von Bandbreitensensitivitäten nicht bestätigt werden, dass Bandbreiten, die weiter als die Ausprägungen der Alternativen des Evoked-Sets gewählt wurden, zu einer stärkeren Verzerrung der Teilnutzen führen. Allerdings war die Berechnung der Bandbreitensensitivitäten nur bei einer Teilmenge der untersuchten Eigenschaften möglich, so dass insbesondere beim Untersuchungsobjekt „Fernseher“ die Aussagekraft der Maßzahlen stark eingeschränkt ist.

1958

410

Analog zur Auswertung in Tabelle 121 konnten die Abweichungen nur dann berechnet werden, wenn die Eigenschaften mindestens drei Ausprägungen aufwiesen und sich diese auf einem metrischen Skalenniveau befinden. Bei Gruppe 3.1 konnten keine Abweichungen ermittelt werden, da die Merkmale jeweils lediglich durch zwei Ausprägungen beschrieben wurden. Die Eigenschaft „Bildschirmdiagonale“ wurde nicht untersucht, weil nicht in jedem Fall davon ausgegangen werden kann, dass eine größere Bildschirmdiagonale einen höheren Nutzen stiftet. Dies gilt beispielsweise, wenn nicht genügend Platz für einen entsprechend großen Fernseher vorhanden ist.

8 Zusammenfassung, Diskussion und Ausblick

Bisher werden die in der Präferenzmessung zu untersuchenden Eigenschaften und Ausprägungen zumeist von Experten bzw. vom Marktforscher selbst und damit nicht aus Sicht der potenziellen Entscheidungsträger festgelegt. Durch diese Vorgehensweise ist nicht sichergestellt, dass die tatsächlichen Gründe für den Kauf eines Produkts untersucht werden, vielmehr ist davon auszugehen, dass „old ‚knowledge’ may be confirmed or refuted, but there is little likelihood of new learning.”1959 Zu Beginn einer Studie zur Präferenzmessung besteht demnach oft Unklarheit über die Relevanz verschiedener Merkmale. Deshalb wird teilweise empfohlen, dass Marktforscher bzw. Experten möglichst viele bzw. alle potenziell einflussreichen Eigenschaften selbst bestimmen und in eine Studie zur Präferenzmessung aufnehmen sollten.1960 Mit Hilfe der Verfahren zur Präferenzmessung kann allerdings meist nur eine relativ beschränkte Anzahl an Eigenschaften untersucht werden.1961 Dies gilt insbesondere für wahlbasierte Verfahren zur Präferenzmessung, bezüglich derer einige Marktforscher davon ausgehen, dass sie in Zukunft an Bedeutung gewinnen werden.1962 Aber ebenfalls aus erhebungsökonomischen Gründen können nicht alle potenziell relevanten Merkmale untersucht werden, da in jedem Fall die Anzahl der notwendigen Einschätzungen steigt, je mehr Eigenschaften bewertet werden sollen. Mit einem steigenden Erhebungsaufwand sind jedoch ebenfalls erhöhte Kosten bei der Präferenzmessung verbunden. Auch im Hinblick auf die Befragungsteilnehmer sollten nur relevante Informationen untersucht werden, da sonst mit einer geringeren Motivation bei der Einschätzung der Alternativen und verzerrten Schätzergebnissen gerechnet werden muss. Um diese Probleme zu vermeiden, können die in der Präferenzmessung zu untersuchenden Eigenschaften auf Basis von Kundenbefragungen bestimmt werden. In der Literatur werden eine Vielzahl an Methoden dafür als potenziell geeignet eingeschätzt. Allerdings wurde keines davon speziell unter Berücksichtigung der Anforderungen der Präferenzmessverfahren entwickelt. Hauptproblem aller bisherigen Methoden ist, dass die relevanten Eigenschaftsausprägungen nicht erhoben bzw. diese nicht ausreichend berücksichtigt werden. Vielmehr erfolgt die Festlegung der Ausprägungen durch den Marktforscher mehr oder weniger willkürlich - wobei zur Ermittlung der Eigenschaftsausprägungen teilweise äußerst widersprüchliche

1959 1960 1961 1962

Gibson; Marder (2002), 47. Vgl. Gibson; Marder (2002), 47. Siehe Kapitel 3.3. Vgl. Green; Krieger (2002a), 25ff.

411

Empfehlungen gegeben werden.1963 Mit der Bestimmung der zu untersuchenden Eigenschaftsausprägungen werden gleichwohl die Ergebnisse der Präferenzmessung determiniert. Die Schätzungen der Präferenzmessung werden somit bisher entscheidend vom Marktforscher selbst beeinflusst, was die Übertragbarkeit der Ergebnisse auf reale Wahlentscheidungen erheblich einschränken kann. Bei der Bestimmung der zu untersuchenden Informationen muss berücksichtigt werden, dass Eigenschaften lediglich Bewertungsmaßstäbe sind, die einen Vergleich verschiedener Alternativen ermöglichen. Merkmalen kann deshalb kein Bedeutungsgewicht zugewiesen werden. Allein die jeweiligen Eigenschaftsausprägungen bzw. genauer die vom Entscheidungsträger wahrgenommenen Nutzenunterschiede zwischen den Bandbreiten der Ausprägungen haben einen Einfluss auf die Wahlentscheidung.1964 Um die Ergebnisse der Präferenzmessung zur Prognose von realen Kaufentscheidungen nutzen zu können, müssen die Ausprägungen der zu untersuchenden Merkmale deshalb auf Basis der jeweiligen Kundenanforderungen, d.h. ausgehend vom Evoked-Set eines Entscheiders, festgelegt werden.1965 Dieser Aspekt wird allerdings von keinem bisherigen Verfahren zur Festlegung eines Eigenschaftssets berücksichtigt. Bei der Ermittlung eines Eigenschaftssets muss zudem beachtet werden, dass nicht für alle Entscheider bzw. Befragungsteilnehmer die gleichen Ausprägungen und Eigenschaften relevant sind. Insbesondere bei komplexen Gütern, die durch viele Eigenschaften beschrieben werden können, besteht sonst die Gefahr, dass individuell wichtige Merkmale nicht berücksichtigt werden1966 und das Entscheidungsproblem letztendlich unvollständig beschrieben wird. Das Ziel individualisierter Verfahren zur Präferenzmessung ist es deshalb, in einem ersten Schritt - ausgehend von einer Vielzahl von Eigenschaften und Ausprägungen – diejenigen Merkmale zu identifizieren, die der jeweilige Befragungsteilnehmer als relevant einschätzt oder die Ausprägungen auszuschließen, die völlig unakzeptabel erscheinen bzw. nur die präferierten Ausprägungen aufzunehmen.1967 Eine individuelle Selektion von relevanten Eigenschaften ist jedoch keineswegs reliabel. Dagegen sind bei der Anwendung von zielgruppen-

1963 1964 1965 1966 1967

412

Siehe Kapitel 5.7. Siehe dazu Kapitel 2.2, 4 und 4.2.6.3. Siehe Kapitel 2.3. Vgl. Böcker; Schweikl (1988), 15. Siehe Kapitel 3.1.

spezifischen Eigenschaftssets stabilere Einschätzungen zu erwarten.1968 Gleichzeitig stellt sich die Frage nach der praktischen Relevanz völlig individualisierter Eigenschaftssets, da Unternehmen typischerweise nicht völlig individualisierte Produkte, sondern Güter für eine bestimmte Kundengruppe konzipieren und produzieren.1969 Vor dem Hintergrund der beschriebenen Einschränkungen der bisherigen Verfahren wurde in dieser Arbeit eine neuartige Methode entwickelt, die bereits vor der eigentlichen Präferenzmessung die Bestimmung von Zielgruppen ermöglicht und bei der je nach Zielgruppe unterschiedliche bzw. möglicherweise sich überlappende Eigenschaftssets untersucht werden können. Die Ermittlung der relevanten Eigenschaften erfolgt dabei erstmals ausschließlich ausgehend von dem Evoked-Set der Entscheidungsträger, d.h. auf Basis der relevanten Eigenschaftsausprägungen, die eine Differenzierung vom Wettbewerb ermöglichen und zwischen denen mit Trade-off Entscheidungen zu rechnen ist. Im Rahmen einer empirischen Untersuchung wurde anschließend untersucht, ob die neu vorgeschlagene Methode im Vergleich zu zwei traditionellen Verfahren die Güte der Präferenzmessung verbessern kann. Als traditionelle Vorgehensweisen wurden die Elicitation Technik1970 und die Duale Befragung1971 ausgewählt. Um die Stabilität der Ergebnisse einschätzen zu können, wurden die Auswirkungen der Anwendung verschiedener Verfahren zur Bestimmung eines Eigenschaftssets anhand von zwei unterschiedlichen Untersuchungsobjekten („Laptop“ und „Fernseher“) analysiert. Die Zahl der zu berücksichtigten Eigenschaften und Ausprägungen wurde bei den traditionellen Methoden, wie bisher üblich, vom Marktforscher festgelegt.1972 Bei der neuen Vorgehensweise basiert die Anzahl der zur Bewertung präsentierten Eigenschaften dagegen stärker auf den Einschätzungen der Befragungsteilnehmer, so dass eher sichergestellt ist, dass die relevanten Beurteilungsdimensionen in die Präferenzmessung eingehen. In dieser Studie ergibt sich beim Untersuchungsobjekt „Laptop“ im Vergleich zu den traditionellen Verfahren eine identische Anzahl an Eigenschaften, was eine Vergleichbarkeit der Ergebnisse vereinfacht. Beim Untersuchungsobjekt „Fernseher“ konnten durch die neuartige Methode zwei unterschiedliche Zielgruppen identifiziert werden, für die unterschiedliche Eigenschaftssets relevant sind. Die Zahl der Eigenschaften bzw. die Anzahl der

1968

Vgl. Huber (1987), 6. Auch eine Eliminierung von völlig unakzeptablen Eigenschaftsausprägungen ist mit verschiedenen Problemen verbunden (siehe dazu Kapitel 4.2.4). Werden lediglich die präferierten Ausprägungen je Merkmal untersucht, ist vermehrt mit dem Auftreten unrealistischer Stimuli zu rechnen (z.B. Alternativen mit niedrigen Ausprägungen der Eigenschaft „Preis“ und sonst besonders vorteilhaften Ausprägungen). Dies gilt insbesondere, wenn extreme Bandbreiten (wie beispielsweise von Green; Srinivasan (1978, 109) vorgeschlagen) genutzt werden. Die so erhobenen Präferenzen können deshalb später nicht zur Prognose von realen Wahlentscheidungen genutzt werden. 1969 Vgl. Hahn (1997), 80; Schubert (1991), 233. 1970 1971 1972

Siehe Kapitel 5.2.1.1. Siehe Kapitel 5.2.2.2. Siehe dazu Kapitel 3.3 und 5.7.

413

notwendigen Bewertungen war in beiden Gruppen im Vergleich zu den traditionellen Verfahren höher; in jedem Fall mussten mindestens doppelt so viele Paarvergleiche eingeschätzt werden. Zur Bewertung der Güte der Schätzergebnisse wurden die üblichen Validitätsmaße wie die Augenscheinvalidität, die interne Validität, die Prognosevalidität und die Befragungssituation untersucht,1973 zudem wurden weitere Maße zur Analyse des Antwortverhaltens vorgeschlagen und in der empirischen Studie genutzt. Durch die Anwendung der neuartigen Vorgehensweise zur Bestimmung der relevanten Eigenschaften und Ausprägungen konnte die Augenscheinvalidität der geschätzten Teilnutzen erheblich verbessert werden.1974 Dabei ist auffällig, dass bei den traditionellen Methoden lediglich die Merkmale eine hohe Augenscheinvalidität aufweisen, denen ein besonders hohes Bedeutungsgewicht zugewiesen wurde. Die Augenscheinvalidität ist bei weniger relevanten Merkmalen demgegenüber auf einem erstaunlich niedrigen Niveau. Dies könnte darauf hinweisen, dass sich die Entscheidungsträger bei der Bewertung der Alternativen lediglich auf bestimmte Merkmale beschränkt haben, während andere Eigenschaften kaum bzw. nicht berücksichtigt wurden. Bei der Anwendung der traditionellen Verfahren zur Bestimmung eines Eigenschaftssets ist somit eher mit Entscheidungsheuristiken als mit tatsächlichen Trade-off Entscheidungen zu rechnen. Hinsichtlich der internen Validität und der Prognosevalidität ergaben sich zwischen den untersuchten Gruppen keine systematischen Unterschiede. Eine relativ hohe interne Validität und Prognosevalidität bei der Anwendung der traditionellen Verfahren zur Bestimmung eines Eigenschaftssets ist allerdings nicht verwunderlich. Wendet ein Entscheidungsträger zur Bewertung der Alternativen Entscheidungsheuristiken an, sinkt die Komplexität der Einschätzungen.1975 Demgegenüber ist die hohe interne Validität und Prognosevalidität bei den Gruppen unter Anwendung der neu vorgeschlagenen Methode zur Bestimmung der zu untersuchenden Eigenschaften und Ausprägungen erstaunlich. Aufgrund der Anwendung von Tradeoff Entscheidungen ist die Bewertung tendenziell komplexer, dies hatte hier allerdings keinen negativen Einfluss auf die Validitätsmaße. Insbesondere beim Untersuchungsobjekt „Fernseher“ überrascht die hohe Prognosevalidität, da typischerweise die Empfehlung gegeben wird, nicht mehr als 30 Paarvergleiche zu nutzen, da sonst die Validität der Messung sinkt.1976 Eine entsprechende Verschlechterung der Ergebnisgüte kann in dieser Studie bei der Nutzung der 1973 1974 1975 1976

414

Für einen Überblick siehe Kapitel 3.10. Im Gegensatz dazu konnte bei Studien auf Basis von individualisierten Methoden zur Präferenzmessung keine, durch die Individualisierung evtl. noch höhere Augenscheinvalidität beobachtet werden (vgl. Schweikl (1985), 188). Siehe Kapitel 3.10.1. Siehe dazu Green; Srinivasan (1978), 109; Hausruckinger; Herker (1992), 102 bzw. Kapitel 3.3.

relevanten Merkmale und Ausprägungen nicht beobachtet werden, obwohl insbesondere bei Gruppe 3.2 von jedem Befragungsteilnehmer insgesamt 48 Paarvergleiche bewertet wurden. Werden somit die Eigenschaftssets aus Sicht der Probanden festgelegt, können tendenziell komplexere Bewertungssituationen untersucht werden, was die Realitätsnähe der Präferenzmessung unter sonst gleichen Erhebungsbedingungen erhöht. Die bisherigen Erkenntnisse werden durch die Ergebnisse der Befragungssituation unterstützt. Demnach können sich die Befragungsteilnehmer die Alternativen bei den Gruppen unter Anwendung der neu vorgeschlagenen Methode zur Bestimmung des Eigenschaftssets signifikant besser in der Realität vorstellen. Darüber hinaus wurden die zur Verfügung stehenden Informationen (d.h. die Eigenschaften und Ausprägungen) für eine Bewertung der Stimuli signifikant „ausreichender“ bewertet. Vergleicht man gleich große Bewertungsaufgaben (Anzahl der nötigen Einschätzungen), so weisen sämtliche Indikatoren der Befragungssituation bei der Anwendung der neu vorgeschlagenen Methode einen höheren Wert auf. Untersucht man mit Hilfe der neu vorgeschlagenen Methode ein bedeutend größeres Problem (in diesem Fall bestand, wie beschrieben, die Bewertungsaufgabe beim Untersuchungsobjekt „Fernseher“ jeweils aus mehr als doppelt so vielen Paarvergleichen), so sind die Ergebnisse bezüglich des Informationsgehalts stabil, d.h. die vorgegebenen Informationen werden als „ausreichender“ wahrgenommen. Zwar steigt mit der Anzahl der nötigen Einschätzungen der empfundene Schwierigkeitsgrad der Einschätzungen, jedoch hat dies bei der Anwendung der neu vorgeschlagenen Methode zur Bestimmung des Eigenschaftssets keinen negativen Einfluss auf die Motivation der Befragungsteilnehmer. Mit Hilfe der in dieser Arbeit vorgestellten Vorgehensweise können in Präferenzmessung deshalb tendenziell mehr Informationen berücksichtigt werden. Diese Beobachtung ist von grundlegender Bedeutung, denn wie bereits beschrieben, kann mit den meisten Verfahren zur Präferenzmessung nur ein vergleichsweise kleines Entscheidungsproblem untersucht werden. In praktischen Anwendungen besteht dagegen häufig die Notwendigkeit mehr Informationen zu berücksichtigen. Die hier vorgestellte Methode zur nachfragerorientierten Definition eines zielgruppenspezifischen Eigenschaftssets kann dieses Problem mildern und wird daher den Anforderungen der Marktforschungspraxis eher gerecht. In einem letzten Schritt wurde das Entscheidungs- bzw. Bewertungsverhalten der Befragungsteilnehmer während der Präferenzmessung selbst und bei der Einschätzung der Alternativen der Referenzmethode analysiert. Zu diesem Zweck wurden im Rahmen der Referenzmethode Kaufwahrscheinlichkeiten für die untersuchten Stimuli erhoben. Ergebnis dieser Analyse ist, dass die Alternativen bei der Anwendung der traditionellen Methoden zur Festlegung des Eigenschaftssets signifikant schlechter als die Stimuli bei Anwendung der neu vorge415

schlagenen Vorgehensweise bewertet wurden. Nutzt man die absolute Höhe der Kaufwahrscheinlichkeiten als einen Indikator für die Übertragbarkeit der Ergebnisse auf reale Entscheidungssituationen, so ergeben sich bei der Nutzung der hier vorgeschlagenen Vorgehensweise somit erhebliche Vorteile. Bezüglich der zur Einschätzung der Paarvergleiche verwendeten Skalenpunkte sind beim Untersuchungsobjekt „Laptop“ zwischen den betrachteten Gruppen kaum Unterschiede erkennbar. Allerdings ist beim Untersuchungsobjekt „Fernseher“ auffällig, dass bei der Bestimmung von Eigenschaftssets auf Basis traditioneller Verfahren bei der Bewertung häufiger extreme Skalenwerte zur Einschätzung der Alternativen genutzt wurden - dies ist ein weiterer Hinweis darauf, dass bei diesem Untersuchungsobjekt verstärkt Entscheidungsheuristiken angewendet wurden. Diese Vermutung wird bei der Analyse der Bedeutungsgewichte der Eigenschaften bestätigt. Wurden die Eigenschaftssets auf Basis der traditionellen Methoden bestimmt, so dominieren beim Untersuchungsobjekt „Fernseher“ einige Produktmerkmale die Entscheidung, während andere kaum berücksichtigt werden. Bei der Analyse von Bandbreitensensitivitäten konnten zwischen den untersuchten Gruppen keine Unterschiede gefunden werden. Zusammenfassend kann festgestellt werden, dass durch die Berücksichtigung der aus Sicht der Entscheidungsträger relevanten Merkmale und Ausprägungen die Ergebnisse der Präferenzmessung verbessert werden können. Bei der Anwendung der neu vorgeschlagenen Me-

thode zur Bestimmung eines Eigenschaftssets basieren die Bewertungen der Entscheidungsträger stärker auf Trade-offs. Weiterhin sind die Ergebnisse der Präferenzmessung besser auf Auswahlentscheidungen in realen Marktsituationen übertragbar. Die Nutzung der hier vorgeschlagenen Methode zur Bestimmung eines Eigenschaftssets kann somit die Güte und die Übertragbarkeit der Ergebnisse aus der Präferenzmessung verbessern. Ziel der präsentierten Methode ist es weiterhin, den Einfluss des Marktforschers auf das zu untersuchende Eigenschaftsset im Vergleich zu bisherigen Verfahren zu minimieren, so dass tatsächlich die aus Sicht der Entscheidungsträger relevanten Eigenschaften und Ausprägungen untersucht werden. Der Marktforschereinfluss kann aber nicht völlig eliminiert werden. Dies gilt insbesondere bei der Festlegung der Anzahl der zu untersuchenden Eigenschaften und bei der Gruppierung der Ausprägungen von quantitativen Merkmalen. Die hier vorgeschlagene Methode ermöglicht es allerdings, dass das zu bewertende Eigenschaftsset auf Basis der Kundenanforderungen bestimmt wird und dieser Prozess für den Auftraggeber einer Studie systematisch nachvollziehbar ist.1977

1977

416

Die Nachvollziehbarkeit der Informationsgewinnung (hier der Festlegung eines Eigenschaftssets) ist eine zentrale Forderung, um auf Basis von empirischen Untersuchungen überhaupt Entscheidungen treffen zu können (vgl. Helm (2005), 12).

Ein grundlegender Schritt bei der Anwendung des neu vorgeschlagenen Verfahrens ist die Erfassung der salienten Eigenschaften und Ausprägungen. Um diese Informationen erheben zu können, müssen die Befragungsteilnehmer ausreichend motiviert sein und genügend Zeit zur selbstständigen Informationssuche bzw. –bewertung zur Verfügung haben. Im Rahmen dieser Studien wurden entsprechende monetäre Anreize genutzt, die sicherstellen sollten, dass eine intensive Auseinandersetzung mit dem Untersuchungsobjekt erfolgt. Durch eine Vorankündigung der Erhebung der salienten Eigenschaften und Ausprägungen konnte zudem sichergestellt werden, dass ausreichend Zeit zur eigenständigen Informationsbeschaffung und – bewertung vorhanden war. Die vorgeschlagene Methode sollte aus Sicht der Befragungsteilnehmer so einfach wie möglich gestaltet werden. Um den kognitiven Aufwand für die Befragungsteilnehmer zu minimieren, wurde die Bestimmung des Eigenschaftssets in verschiedene Phasen gegliedert. Eine solche Vorgehensweise ist für den Marktforscher im Vergleich zu anderen Verfahren mit einem höheren Erhebungsaufwand verbunden. Die bisher genutzten Methoden sind jedoch, wie bereits beschrieben, weniger gut zur Bestimmung eines relevanten Eigenschaftssets geeignet. Die Festlegung eines Eigenschaftssets, z.B. auf der Basis von Expertenurteilen, kann zwar sehr viel schneller erfolgen und u.U. mit geringeren Erhebungskosten verbunden sein. Wird in der Praxis aufgrund der bekannten Nachteile der bisherigen Verfahren allerdings eine umfangreiche Zahl an Eigenschaften und Ausprägungen in die Präferenzmessung aufgenommen, steigt damit der Erhebungsaufwand erheblich. Dies gilt insbesondere, weil in diesem Schritt typischerweise sehr viel mehr Entscheider als im Rahmen einer Vorstudie befragt werden. Bei der Anwendung der hier präsentierten Vorgehensweise ist demnach der Erhebungsaufwand in frühen Phasen höher, dieser kann allerdings in der Phase der Präferenzmessung dadurch reduziert werden, dass jeweils lediglich die tatsächlich relevanten Eigenschaften und Ausprägungen auf Zielgruppenebene untersucht werden. Insgesamt ist deshalb davon auszugehen, dass die Erhebungskosten gesenkt werden können. Neben der Bestimmung der in der Präferenzmessung zu untersuchenden Eigenschaften und Ausprägungen kann die hier vorgeschlagene Methode, wie bereits in Abbildung 21978 angedeutet, auch innerhalb eines Produktentwicklungsprozesses in der Phase der Ideengenerierung genutzt werden. Potenzielle Kundengruppen können so früher aktiv in die Produktent-

wicklung eingebunden werden, da durch die Anwendung der vorgeschlagenen Methode Zielgruppen früher identifiziert und deren Anforderungen analysiert werden können. Sollen die Auswirkungen von echten Innovationen auf die Präferenz untersucht werden, werden dazu bisher vom Auftraggeber bzw. Marktforscher die innovativen Ausprägungen in 1978

Siehe Kapitel 2.1.

417

das Eigenschaftsset aufgenommen. Innovative Ausprägungen können allerdings innerhalb der Präferenzmessung nicht ohne weiteres untersucht werden, da die Einschätzungen der Befragungsteilnehmer immer auf dem jeweiligen Vorwissen basieren. Typischerweise liegen bezüglich innovativer Eigenschaftsausprägungen bei den Entscheidungsträgern noch keine Erfahrungen vor, weshalb keine Nutzen abgeleitet und keine Präferenzen erfasst werden können.1979 Auch in diesem Anwendungsbereich kann die neue Methode erste Ansätze zur Problemlösung bieten. Hierzu sind allerdings verschiedene Anpassungen notwendig, da sämtliche Einschätzungen auf den Evoked-Sets der Entscheider beruhen, d.h. in der hier vorgeschlagenen Variante werden lediglich die bereits am Markt verfügbaren Alternativen berücksichtigt entsprechende Möglichkeiten werden im Folgenden kurz skizziert. Die Befragungsteilnehmer benötigen folglich zunächst Informationen über die Vorteilhaftigkeit einer innovativen Eigenschaftsausprägung. Home-Use-Tests bzw. Werbung können genutzt werden, um über spezifische, neuartige Nutzenelemente zu informieren.1980 Sollen die Auswirkungen innovativer Ausprägungen im Rahmen einer Studie zur Präferenzmessung untersucht werden, kann z.B. nach einem Home-Use-Test mit Hilfe der hier vorgeschlagenen Methode zunächst überprüft werden, ob die Neuerung aus Sicht des Kunden überhaupt einen Einfluss auf die Wahlentscheidung ausübt. Ist dies der Fall, kann mit Hilfe der Verfahren der Präferenzmessung der Einfluss einer Ausprägung auf die Wahlentscheidung genauer bestimmt werden. Für eine erfolgreiche Markteinführung von neuartigen Produkten ist die Identifikation von Innovatoren, d.h. jenen Zielgruppen, die eine Neuentwicklung vergleichsweise schnell über-

nehmen, entscheidend. Diese Nachfrager sind eher bereit, innovative Produkte zu kaufen und sollten deshalb gezielt im Rahmen der Neuprodukteinführung angesprochen werden.1981 Durch Anwendung des hier präsentierten Verfahrens ist es möglich, Informationen über zielgruppenspezifische Unterschiede bezüglich der Relevanz innovativer Ausprägungen zu erheben und diese bereits in den Neuentwicklungsprozess einzubeziehen. Die Innovatoren können somit bereits zu einem frühen Zeitpunkt, d.h. in der Phase der Ideengenerierung, identifiziert werden. Diese Kundengruppen nehmen die Produktinnovation als wahlentscheidend wahr und sie stiftet ihnen einen besonders hohen Nutzen. Werden neben den Anforderungen der Entscheider weitere soziodemographische oder psychographische Merkmale erhoben, können bereits in der Phase der Ideengenerierung umfangreiche Zielgruppenbeschreibungen entwi-

1979

Siehe dazu u.a. Hoeffler (2003), 406ff. Derzeit wird dieser Aspekt jedoch teilweise nicht beachtet, d.h. neuartige Eigenschaften und Ausprägungen werden vom Marktforscher einfach in die Untersuchung aufgenommen (siehe u.a. Fischer (2001), 140). 1980 Vgl. Braun; Srinivasan (1975), 373. 1981

418

Vgl. Kotler; Bliemel (2001), 564f.

ckelt werden, die als Ausgangsbasis für die Ausgestaltung weiterer Marketing-Mix Elemente dienen können.1982 Gleichzeitig könnte mit Hilfe dieses neuen Verfahrens überprüft werden, ob Werbebotschaften einen entsprechenden Einfluss auf das Evoked-Set und auf die Bewertung der zur Verfü-

gung stehenden Alternativen, d.h. auf die Salienz bestimmter Eigenschaften und Ausprägungen, ausüben. Die vorgeschlagene Methode kann demzufolge im Rahmen verschiedenster weiterer Anwendungsgebiete eingesetzt werden. In künftigen Studien sollte deshalb die Anwendbarkeit

dieser Vorgehensweise bei unterschiedlichen Untersuchungszielen analysiert werden. Erheblicher Forschungsbedarf besteht gleichwohl weiterhin hinsichtlich der Gütemaße der Präferenzmessung. Zur Einschätzung der ermittelten Präferenzwerte werden derzeit vor allem Maße der Prognosevalidität genutzt.1983 Dabei handelt es sich aber um eine trügerische Größe, deren Höhe insbesondere durch die Gestaltung der Alternativen der Referenzmethode und somit vom Marktforscher bestimmt wird.1984 So ist mit einer - scheinbar - höheren Prognosegüte zu rechnen, wenn die Alternativen der Referenzmethode große Nutzenunterschiede aufweisen. Dem Entscheidungsträger fällt es in diesem Fall einfacher, diese Stimuli zu bewerten.1985 Werden die Alternativen der Referenzmethode dagegen so gestaltet, dass die Nutzenunterschiede vermutlich relativ gering sind, ist eine - scheinbar - geringere Prognosevalidität die Folge. Um zumindest den Einfluss des Marktforschers zu eliminieren, wurden deshalb in dieser Studie die Alternativen zufällig gebildet.1986 Ein Vergleich der Prognosevalidität ist bei unterschiedlichen Alternativensets nur eingeschränkt möglich.1987 Insgesamt besteht deshalb weiterhin erheblicher Forschungsbedarf bezüglich der Art und Weise, wie die Prognosevalidität überprüft werden kann.1988 Die Analyse des Entscheidungsverhaltens der Befragungsteilnehmer sollte zudem in künftigen Studien als ein weiteres Gütemaß zur Einschätzung der Ergebnisse einer Studie genutzt werden. In dieser Arbeit werden verschiedene Möglichkeiten zur Einschätzung der vom Befragungsteilnehmer erfolgten Bewertungen vorgeschlagen. Deren Eignung sollte in künftigen

1982 1983 1984

Dies könnte analog zur Vorgehensweise bei der Benefit-Segmentierung erfolgen, siehe Kapitel 3.9. Vgl. Green; Srinivasan (1990), 12. Vgl. Griffin; Hauser (1993), 21; Tscheulin (1991), 1267.

1985

Siehe Kapitel 3.10.1. Eine solche Vorgehensweise ist bei der ACA möglich. Dabei können die Alternativen der Referenzmethode u.U. sogar auf individueller Ebene so bestimmt werden, dass sie möglichst gegensätzlich bezüglich der prognostizierten Nutzen sind (vgl. Johnson (1987), 261; Sawtooth Software (2002), 4ff.). 1986 Siehe dazu auch Orme; Alpert; Christensen (1997a), 212. 1987 1988

Vgl. Melles (2001), 95. Vgl. Albrecht (2000), 464; Johnson (1987), 265.

419

Studien weiter untersucht und diese ggf. angepasst bzw. weitere Gütemaße entwickelt werden.

420

Anhang Anhang I: Einflussgrößen auf den Entscheidungskontext bei der Präferenzmessung

Mit dem Begriff „Entscheidungskontext“ kann eine Vielzahl an Effekten beschrieben werden. In dieser Arbeit werden lediglich die zu einem bestimmten Zeitpunkt vorliegenden und zu bewertenden Informationen in Form von Eigenschaften und Ausprägungen als Entscheidungskontext berücksichtigt.1989 Da auch der Verwendungszweck, d.h. die Nutzungssituation, einen erheblichen Einfluss auf die Präferenzen ausübt,1990 wird diese im Folgenden explizit in die Problemdefinition einbezogen (siehe Kapitel 6.1.2). Andere Faktoren (etwa die kognitiven Fähigkeiten des Entscheidungsträgers, das soziale Umfeld, Zeitdruck usw.), die die Entscheidung der Nachfrager beeinflussen,1991 werden dagegen nicht weiter betrachtet. Zudem bleiben in dieser Arbeit Effekte durch die Art und Reihenfolge1992 der Präsentation von Merkmalen und Ausprägungen weitgehend unbeachtet. Entsprechende Verzerrungen der Schätzergebnisse, wie beispielsweise durch Reihenfolgeeffekte bei der Präsentation der Eigenschaften sind jedoch nur dann zu erwarten, wenn die Entscheidungsträger nicht ausreichend mit der zu untersuchenden Produktgruppe vertraut sind.1993 Grundvoraussetzung für eine sinnvolle Nutzung von Präferenzmessmethoden ist demnach, dass die Befragungsteilnehmer über ausreichende Kenntnisse in der jeweiligen Produktkategorie verfügen.1994 Um solche Kontexteffekte zu vermeiden, sollten nur die Ausprägungen untersucht werden, die die Entscheidungsträger als „geeignet“ einschätzen, so dass bei der Bewertung tatsächlich Trade-off Entscheidungen vorgenommen werden – bei der Anwendung dieser Bewertungsstrategie spielen diese Kontexteffekte eine weniger wichtige Rolle.1995 Weiterhin kann die Reihenfolge der Präsentation verschiedener Alternativen einen Einfluss auf die Ergebnisse der Präferenzmessung ausüben. Dieser Effekt ist teilweise zu beobachten, da die Bewertung der Alternativen zunächst einer Art Lernprozess ähnelt; die ersten Alternativen werden deshalb u.U. zunächst stärker gewichtet.1996 Entsprechende Verzerrungen können aber durch den Einsatz von „Warm-Up Tasks“, in denen der Entscheidungsträger zu Be1989 1990 1991 1992 1993 1994 1995 1996

Siehe Höser (1998), 29. Vgl Höser (1998), 53. Vgl. Höser (1998), 29ff. Zum Einfluss der Reihenfolge der Präsentation der Eigenschaften siehe u.a. Acito (1977), 82ff.; Hausruckinger; Helm (1996), 272; Schweikl (1985), 151; Stallmeier (1993), 66; Tharp; Marks (1990), 562ff.; Gierl; Höser (2002), 3ff. Vgl. Kumar; Gaeth (1991), 113ff. Vgl. Ratneshwar; Shocker; Stewart (1987), 523; Hoeffler (2003), 406. Vgl. Ratneshwar; Shocker; Stewart (1987), 523. Vgl. Höser (1998), 77ff.

421

ginn Alternativen einschätzt, die jedoch nicht in die Ergebnisse der Präferenzmessung eingehen, so weit wie möglich vermieden werden (siehe dazu Kapitel 6.2.3). Schließlich können die Ergebnisse der Präferenzmessung durch die Art der Präsentation der Eigenschaftsausprägungen, d.h. durch verbale, bildliche oder multimediale Beschreibungen, beeinflusst werden.1997 Auch dieser Aspekt wird in dieser Arbeit nicht weiter betrachtet. Weitere Untersuchungen zu Kontexteffekten überprüfen die Auswirkungen von Veränderungen des Eigenschaftssets bei extremen Bandbreiten der Merkmalsausprägungen1998 oder bei der Einbeziehung von für die Entscheidung irrelevanten Informationen.1999 Da in dieser Arbeit lediglich die aus Konsumentensicht relevanten Ausprägungen (die Ausprägungen der Alternativen des Evoked-Sets) betrachtet werden sollen, werden diese Studien nicht weiter berücksichtigt. Auch Framing-Effekte gehören zu den kontextabhängigen Effekten, sie werden durch die Wortwahl bei der Bestimmung der Eigenschaftsausprägungen2000 hervorgerufen. Mit diesen verzerrenden Effekten ist allerdings ebenfalls nur dann zu rechnen, wenn die Ausprägungen durch den Marktforscher festgelegt werden.2001

Anhang II: Einfluss des Entscheidungsträgers auf die Vorziehenswürdigkeit einer Präferenzmessmethode

Im Hinblick auf den Einfluss der berücksichtigten Entscheidungsträger finden sich in der Literatur unterschiedliche Beobachtungen. Während Tashchian; Tashchian; Slama (1982, 365) einen signifikanten Einfluss soziodemografischer Merkmale auf die Ergebnisgüte der Präferenzmessung nachweisen konnten, fanden Schoemaker; Waid (1982, 193) und Sattler; Hensel-Börner; Krüger (2001, 771ff.) keinen Zusammenhang zwischen soziodemografischen Merkmalen und der Prognosegüte. Auch Tscheulin; Blaimont (1993, 843ff.) konnten bei einigen soziodemographischen Merkmalen keinen Auswirkungen auf die Validität der Präferenzmessung nachweisen, andere Merkmale wie „Bildungsniveau“ und „Beruf der Probanden“ hatten allerdings einen signifikanten Einfluss auf die Prognosegüte. Eine Beziehung zwischen den Entscheidungsträgern und der Eignung einer Methode zur Präferenzmessung besteht deshalb vermutlich. Je nach betrachtetem Befragungsteilnehmer erscheinen somit un-

1997 1998 1999 2000 2001

422

Vgl. Ernst (2000), 224ff.; Ernst; Sattler (2000), 161; Dahan; Srinivasan (2000), 99ff.; Degeratu; Rangaswamy; Wu (2000), 55ff. Siehe dazu u.a. Simonson; Tversky (1992), 281ff.; Huber; Payne; Puto (1982), 90ff.; Huber; Puto (1983), 31ff. Vgl. Gierl; Elftheriadou (2004), 347ff.; Meyvis; Janiszewski (2002), 618ff. Houghton; Kardes; Mathieu; Simonson (1999), 107ff.; Melles (2001), 110ff. Vgl. Melles (2001), 126ff. Siehe Kapitel 5.7.3.

terschiedliche Verfahren zur Präferenzmessung als vorteilhaft.2002 Sproles; Kendall (1986, 267) und Hopkins; Larréché; Massy (1977, 374) untersuchen jeweils in empirischen Studien, ob Konsumenten unterschiedliche Entscheidungsstile bei Wahlentscheidungen nutzen. Dabei wurden verschiedene Variablen untersucht, die Einfluss auf die Art der Entscheidungsstrategie von Konsumenten haben könnten. Es handelt sich jedoch nicht um soziodemographische Daten; vielmehr wurden Indikatoren für die latenten Variablen Impulsivität, Markenbewusstheit, Spaß am Einkauf, Perfektionismus usw. genutzt, die in einem engen Zusammenhang mit der Wahl der Entscheidungsstrategie stehen können.

Anhang III: Beispiel für die Auswirkungen bei der Nutzung von Bedeutungsgewichtung zur Ableitung von Entscheidungen

Wie in Kapitel 3.8 beschrieben, ist es nicht möglich, aggregierte Bedeutungsgewichte, die auf Basis der bisherigen Vorgehensweise berechnet wurden, sinnvoll zu interpretieren und praktische Schlussfolgerungen abzuleiten. Das Hauptproblem an diesen Maßzahlen ist, dass die Entscheidungsträger unterschiedliche Ausprägungen als wahrgenommene Nutzenbandbreite definieren können. Im Extremfall ist die von einem Entscheider präferierte Eigenschaftsausprägung für einen anderen Befragungsteilnehmer die am wenigsten vorteilhafte Ausprägung. Auf Basis der traditionellen Bedeutungsgewichte werden diese Unterschiede allerdings nicht berücksichtigt. Die Nutzung der Bedeutungsgewichte zur Ableitung konkreter Entscheidungen kann deshalb negative Auswirkungen haben. Dies wird im folgenden Beispiel dargestellt. Gegeben seien die Ergebnisse der Präferenzmessung beim Untersuchungsobjekt „Cola“ für drei fiktive Entscheidungsträger.

2002

Vgl. Schoemaker; Waid (1982), 193; Orme (2002a), 46.

423

Proband 1 Teilnutzen der Ausprägungen

Marke

C Cola = 0,5

V Cola = 2

P Cola = 0

2

0,625

0,25 kcal= 0,2

24 kcal = 0,1

36 kcal = 0

0,2

0,063

0,66 € = 0

0,60 € = 0,4

0,57 € = 1

1

0,313

Kaloriengehalt je 100 ml Preis pro Liter

Bandbreite

Bedeutungs-

Eigenschaft

gewicht

Proband 2 Eigenschaft

Teilnutzen der Ausprägungen

Bandbreite

Bedeutungsgewicht

Marke

C Cola = 0

Kaloriengehalt je 0,25 kcal = 2

V Cola = 0,7

P Cola = 2

2

0,437

24 kcal = 0,5

36 kcal = 0

2

0,437

0,60 € = 0,3

0,57 € = 0,6

0,6

0,130

100 ml Preis pro Liter

0,66 € = 0

Proband 3 Eigenschaft

Teilnutzen der Ausprägungen

Bandbreite

Bedeutungsgewicht

Marke

C Cola = 2

Kaloriengehalt je 0,25 kcal= 3

V Cola = 1

P Cola = 0

2

0,345

24 kcal = 1

36 kcal = 0

3

0,517

0,60 € = 0,4

0,57 € = 0,8

0,8

,138

100 ml Preis pro Liter

0,66 € = 0

Tabelle 123: Beispiel für die Bestimmung von Bedeutungsgewichten

Werden die Werte durch Mittelwertbildung über alle Probanden aggregiert, ergeben sich folgende Bedeutungsgewichte (siehe Tabelle 124). Marke

Kaloriengehalt je 100 ml

Preis pro Liter

0,469

0,339

0,194

Tabelle 124: Aggregierte Bedeutungsgewichte

Die Bandbreite der Ausprägungen der Eigenschaft „Marke“ hat in diesem Beispiel den stärksten Einfluss auf die Präferenz (etwa 47%). Möchte beispielsweise das Unternehmen „C Cola“ dieses Bedeutungsgewicht zur Entscheidung für eine Werbebotschaft benutzen, so müsste entsprechend Green; Krieger (1995, 253) die „Marke“ innerhalb der Werbebotschaftsgestaltung betont werden. Mit einer Fokussierung der Werbebotschaft auf die Marke „C Cola“ könnte allerdings lediglich Proband 3 angesprochen werden. Bei den anderen beiden anderen Entscheidern würde jedoch gerade jene Eigenschaftsausprägung betont werden, die nicht vorteilhaft ist. 424

Werden dagegen die entscheidungsorientierten Bedeutungsgewichte auf Basis der vorgeschlagenen Gleichung 12 berechnet, müssen zunächst das zu testende unternehmenseigene Produkt und ein relevantes Konkurrenzprodukt (z.B. das Produkt eines Hauptkonkurrenten) spezifiziert werden (siehe Tabelle 125). Eigenschaft

Eigenes Produkt

Konkurrenzprodukt

Marke

C Cola

V Cola

Kaloriengehalt je 100 ml

0,25 kcal

24 kcal

Preis pro Liter

0,66 €

0,60 €

Tabelle 125: Ausprägungen des Produktkonzepts und des Konkurrenzprodukts

Ziel der Werbung ist eine Differenzierung von der jeweiligen Konkurrenz. Es sollte deshalb die Eigenschaftsausprägung betont werden, bei der die relativen Vorteile des eigenen Produkts am größten sind. In diesem Beispiel ergeben sich die in Tabelle 126 präsentierten entscheidungsorientierten Bedeutungsgewichte. Eigenschaft Marke Kaloriengehalt je 100 ml Preis pro Liter

Proband 1

Proband 2

Proband 3

Mittelwert

-0,75

-0,28

0,29

-0,25

0,05

0,6

0,57

0,41

-0,2

-0,12

-0,12

-0,15

Tabelle 126: Beispiel für entscheidungsorientierte Bedeutungsgewichte

Durch die Berechnung der entscheidungsorientierten Bedeutungsgewichte entsprechend der Gleichung 12 (siehe Kapitel 3.8) wird deutlich, dass in diesem Fall nicht die Marke, sondern der Kaloriengehalt der Cola im Mittelpunkt der Werbebotschaftsgestaltung stehen sollte. In diesem Beispiel können so insbesondere Proband 2 und 3 angesprochen werden. In beiden Fällen hat der Kaloriengehalt des Produktkonzepts von Unternehmen „C Cola“ bei der Entscheidung zwischen beiden Produkten einen höheren Einfluss als die beiden anderen Produkteigenschaften „Marke“ und „Preis“. Würden die auf traditionelle Weise berechneten Bedeutungsgewichte zur Bestimmung der Werbebotschaft herangezogen werden, müsste insbesondere bei Proband 2 mit negativen Folgen gerechnet werden, da die Marke „C Cola“ im Vergleich zu dem Konkurrenzprodukt einen kleineren Teilnutzen aufweist, d.h. ein relativer Produktnachteil würde betont.

425

Anhang IV: Ergebnisse der traditionellen Elicitation Technik Eigenschaft Rang Preis 1 Akkulaufzeit 2 Gewicht 3 Festplattenkapazität 4 Größe 5 Design 6 CD-Brenner 6 Marke/Hersteller 6 DVD-Player 9 Displaygröße 10 Prozessortakt 10 Software 12 Wlan 12 RAM/Arbeitsspeicher 14 Garantie 15 Prozessor 15 DVD-Brenner 17 Transportabilität 17 Anschlussmöglichkei17 ten Grafikkarte 20 Auflösung des Displays 20 Service 20 Zubehör 20 Leistung 20 Qualität 20 Betriebssystem 25 Präsentationen 25 Ausstattung 25 Stabilität 28 Internet 28 Multimedia 28

Häufigkeit 24 20 18 17 16 12 12 12 11 10 10 9 9 8 7 7 6 6 6 5 5 5 5 5 5 4 4 4 3 3 3

Eigenschaft Multimedia Tastatur Geräuschpegel Bildqualität Upgrademöglichkeiten CD-Laufwerk Flexibilität Hausarbeit Farbe Laufwerke USB2 Tasche Hitzeentwicklung Dauerbetrieb mögl. Flatscreen Textverarbeitung Kabellos praktische Handhabung CD's Datentransport Hardwarezubehör Computer Unabhängigkeit TV-Karte MP3-Player Komfort Disketten Mausanschluss Testergebnisse Infrarot-Schnittstelle klare Bedienung

Rang Häufigkeit 28 3 28 3 28 3 34 2 34 2 34 2 34 2 34 2 34 2 34 2 34 2 43 1 43 1 43 1 43 1 43 1 43 1 43 1 43 1 43 1 43 1 43 1 43 1 43 1 43 1 43 1 43 1 43 1 43 1 43 1 43 1

Tabelle 127: Ergebnisse der traditionellen Elicitation Technik für das Untersuchungsobjekt „Laptop“ (n = 41)

426

Eigenschaft Bildschirmdiagonale Preis Bildschirmqualität Design Fernbedienung Marke Videotext Projektionstechnik Lautsprecherleistung Garantie Gehäusefarbe Bild-in-Bild Ergonomie Menü integrierter DVD-Player Anzahl Programmspeicher Farbe vs. Schwarz-weiß Gewicht Ergonomie allg. Kontrast Standardauflösung Energieverbrauch im Betrieb Bildschirmfrequenz keine Nebengeräusche Größe integrierter Videorekorder Dolby-Surround PC-Anschluss Testergebnis Sleep-Timer Ergonomie Fernbedienung Verpackung Bildschirmformat Anzahl Scart-Anschlüsse Audio-Anschluss Transportfähigkeit

Rang 1 2 3 4 5 6 6 8 9 10 11 11 13 13 13 13 13 13 19 19 19 19 23 23 25 25 25 25 25 25 25 25 25 25 25

Häufigkeit 28 22 19 15 12 11 11 10 9 7 6 6 4 4 4 4 4 4 3 3 3 3 2 2 1 1 1 1 1 1 1 1 1 1 1

Tabelle 128: Ergebnisse der traditionellen Elicitation Technik für das Untersuchungsobjekt „Fernseher“ (n = 41)

427

Anhang V: Ergebnisse der Dualen Befragung

Determinanz Preis Akkulaufzeit Austauschservice Festplattenkapazität Gewicht mit Akku Marke Lüftergeräusche Größe des Arbeitsspeichers Vor-Ort Service Grafikchip Netzwerkkarte Größe des Laptops Bildschirmauflösung Taktfrequenz des Prozessors Stossfestigkeit Garantiedauer Zweitakku im Lieferumfang USB-Speicherchip Größe Display Größe des Grafikspeichers Kartenleser Prozessormarke Anzahl USB Optisches Laufwerk Notebooktasche im Lieferumfang Bürosoftware Voice-over-IP Bluetooth-Schnittstelle Soundkarte Wasser- und Staubschutz Touchpad Trackpoint TV-Anschluss Analoger/Digitaler Videoausgang Betriebssystem Bildschirmformat Firewire-Anschluss internes Mikro Bildschirmoberfläche Parallel-Anschluss

Rang 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39

Mittelwert 18,88 18,37 14,81 14,67 14,59 14,56 14,45 13,90 13,74 13,50 12,76 12,55 12,15 11,74 11,41 11,31 11,30 11,00 10,98 10,93 10,57 10,39 9,98 9,90 9,88 9,83 9,63 9,55 9,40 8,93 8,79 8,76 8,73 8,60 8,15 6,53 6,34 6,22 5,83

Wichtigkeit Rang 3 1 11 4 10 21 14 7 15 17 8 9 12 20 18 5 33 34 13 24 19 28 16 2 25 21 37 31 23 30 27 28 32 6 26 36 39 35 38

Mittelwert 4,50 4,63 3,93 4,38 3,95 3,43 3,81 4,17 3,76 3,64 4,14 3,98 3,93 3,48 3,59 4,31 2,80 2,74 3,86 3,14 3,50 3,00 3,67 4,62 3,10 3,43 2,36 2,90 3,40 2,95 3,07 3,00 2,88 4,21 3,08 2,40 2,12 2,41 2,19

Unterscheidungskraft Rang 2 5 6 12 11 1 8 14 9 10 25 22 23 19 20 34 7 4 29 13 18 15 32 38 17 24 3 16 30 21 31 25 28 39 33 36 25 35 37

Mittelwert 4,21 3,90 3,76 3,31 3,56 4,22 3,64 3,24 3,62 3,57 3,00 3,07 3,05 3,12 3,10 2,60 3,73 3,95 2,88 3,29 3,17 3,22 2,71 2,14 3,19 3,02 3,98 3,20 2,74 3,07 2,71 3,00 2,98 2,00 2,61 2,53 3,00 2,59 2,45

Tabelle 129: Ergebnisse der Dualen Befragung für das Untersuchungsobjekt “Laptop” (n=42)

428

Determinanz Preis Bildschirmdiagonale Marke Vor-Ort Service Lautsprecherleistung Standardauflösung Projektionstechnik Gehäusefarbe Stromverbrauch im Betrieb Bildschirmformat Stromverbrauch Stand-by Garantie Eingebauter Digitaltuner Gewicht PC-Anschluss Automatische Sendersuche Kontrast Betrachtungswinkel Fronteingang AV S-Video Zeit f. Programmwechsel Videoeingang analog/digital Anzahl Scart-Anschlüsse Bild-in-Bild Funktion HDTV-Tauglichkeit Videotext Automatische Namensgebung Anzahl Programmspeicher Bildschirmoberfläche Wandhalterung Sleep-Timer Größe Videotextspeicher Tischfuß Kindersicherung Unterstützte TV-Normen

Rang 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 30 32 33

Mittelwert 19,91 16,05 13,61 12,84 12,65 12,02 11,83 11,38 11,24 10,69 10,55 10,44 9,88 9,83 9,45 9,43 9,28 9,05 8,98 8,72 8,60 8,59 8,34 8,07 8,02 7,47 6,86 5,85 5,69 5,46 5,46 4,86 4,68

Wichtigkeit Rang 1 3 16 5 8 6 17 9 11 10 13 2 24 23 20 7 19 22 14 12 15 27 28 4 21 18 26 32 25 29 33 30 31

Mittelwert 4,60 4,30 3,12 3,81 3,67 3,79 3,10 3,57 3,49 3,53 3,28 4,51 2,49 2,65 2,91 3,77 3,02 2,73 3,21 3,47 3,19 2,32 2,20 4,19 2,88 3,05 2,38 1,48 2,47 2,02 1,33 1,88 1,85

Unterscheidungskraft Rang 1 5 2 13 12 15 7 14 15 19 18 30 6 10 11 28 19 17 23 25 22 8 9 33 21 30 24 3 32 29 4 27 26

Mittelwert 4,30 3,67 4,17 3,30 3,40 3,17 3,59 3,21 3,17 3,00 3,07 2,30 3,60 3,45 3,43 2,43 3,00 3,13 2,70 2,60 2,71 3,51 3,50 1,93 2,77 2,30 2,69 3,95 2,26 2,37 3,93 2,52 2,57

Tabelle 130: Ergebnisse der Dualen Befragung für das Untersuchungsobjekt “Fernseher” (n=43)

429

Anhang VI: Erhebungsdesign der Studien zur Präferenzmessung

Produkt 1 Produkt 2 Produkt 3 Produkt 4 Produkt 5 Produkt 6 Produkt 7 Produkt 8 Produkt 9

Preis (00 - 65,- Euro) 1182,- Euro 2300,- Euro 1 0 1 0 0 1 0 1 0 0 0 0 0 1 1 0 0 0

Bildschirmdiagonale (00 - 34 cm) 71 cm 108 cm 0 0 1 0 1 0 0 0 0 0 1 0 0 1 0 1 0 1

Marke (00 - Welltech) Sharp Philips 1 0 0 1 0 0 0 1 0 0 1 0 1 0 0 0 0 1

Fernbedienung (0 – nein) ja 0 0 0 1 0 1 0 1 0

Tabelle 131: Orthogonales Design für die Elicitation Technik beim Untersuchungsobjekt „Fernseher“

Preis (00 65,- Euro) Paarvergleiche 1182,- Euro 2300,- Euro 5-6 0 0 4-5 0 1 8-9 1 0 2-3 1 -1 1-2 0 0 4-6 0 1 5-8 -1 0 1-3 1 -1 6-9 0 0 2-8 0 0 3-6 0 1 7-9 0 1 2-5 1 0 1-4 1 -1 3-9 0 1 7-8 -1 1 1-7 1 -1 4-7 0 0

Bildschirmdiagonale (00 - 34 cm) 71 cm 108 cm -1 0 0 0 0 0 0 0 -1 0 -1 0 0 -1 -1 0 1 -1 1 -1 0 0 0 0 1 0 0 0 1 -1 0 0 0 -1 0 -1

Marke (00 - Welltech) Sharp Philips -1 0 0 1 0 -1 0 1 1 -1 -1 1 0 0 1 0 1 -1 0 1 -1 0 1 -1 0 1 1 -1 0 -1 1 0 0 0 -1 1

Fernbedienung (0 – nein) ja -1 1 1 0 0 0 -1 0 1 -1 -1 0 0 -1 0 -1 0 1

Tabelle 132: Differenzendesign mit zufällig angeordneten Paarvergleichen für die Elicitation Technik beim Untersuchungsobjekt „Fernseher“

430

Produkt 1 Produkt 2 Produkt 3 Produkt 4 Produkt 5 Produkt 6 Produkt 7 Produkt 8 Produkt 9

Preis 00 - 699,- Euro 1749,- Euro 2799,- Euro 0 1 0 0 0 1 1 0 1 0 0 0 0 0 1 0 0 1

Akkulaufzeit 00 - 1 h 4,75 h 8,5 h 0 1 1 0 0 0 0 0 0 1 0 0 0 1 1 0 1 0

Gewicht 00 - 1 kg 2,7 kg 4,4 kg 0 0 0 1 0 1 1 0 0 1 0 0 1 0 0 0 1 0

Festplattenkapazität 00 - 30 GB 75 GB 120 GB 1 0 1 0 0 1 1 0 0 0 0 0 0 1 0 1 0 0

Tabelle 133: Orthogonales Design für die Elicitation Technik beim Untersuchungsobjekt „Laptop“

Paarvergleiche 5-6 4-5 8-9 2-3 1-2 4-6 5-8 1-3 6-9 2-8 3-6 7-9 2-5 1-4 3-9 7-8 1-7 4-7

Preis 00 - 699,- Euro 1749,- Euro 2799,- Euro 1 0 0 0 1 -1 0 -1 0 1 1 0 0 0 0 0 0 -1 -1 0 0 1 0 -1 -1 0 -1 1 0 0 -1 0 0 1 1 0

Akkulaufzeit 00 - 1 h 4,75 h 8,5 h 0 1 0 -1 0 0 1 0 -1 1 0 0 -1 1 0 1 -1 0 0 0 0 0 -1 1 1 -1 0 1 -1 0 -1 1 0 0 0 -1

Gewicht 00 - 1 kg 2,7 kg 4,4 kg 0 1 1 -1 -1 0 0 0 0 -1 1 0 0 1 0 -1 -1 0 0 1 0 1 0 0 0 0 -1 0 -1 1 1 0 -1 0 0 0

Festplattenkapazität 00 - 30 GB 75 GB 120 GB 0 0 1 0 0 1 1 -1 0 0 1 0 0 -1 1 -1 0 0 1 -1 0 1 0 1 1 0 0 0 0 1 0 0 1 -1 1 -1

Tabelle 134: Differenzendesign mit zufällig angeordneten Paarvergleichen für die Elicitation Technik beim Untersuchungsobjekt „Laptop“

431

Produkt 1 Produkt 2 Produkt 3 Produkt 4 Produkt 5 Produkt 6 Produkt 7 Produkt 8 Produkt 9

Preis 00 - 699,- Euro 1749,2799,Euro Euro 0 1 0 1 1 0 1 0 1 0 0 0 0 0 0 1 0 0

Akkulaufzeit 00 - 1 h 4,75 h 1 0 0 0 1 0 0 0 1

8,5 h 0 1 0 1 0 1 0 0 0

Austauschservice 00 - 12 M. Einsendung 12 M. 24 M. Abholung Abholung 0 1 0 0 0 1 1 0 0 0 0 1 0 0 1 0 1 0

Festplattenkapazität 00 - 30 GB 75 GB 0 1 1 0 0 0 0 0 1

120 GB 0 0 0 0 1 1 0 1 0

Tabelle 135: Orthogonales Design für die Duale Befragung beim Untersuchungsobjekt „Laptop“

Paarvergleiche 5-6 4-5 8-9 2-3 1-2 4-6 5-8 1-3 6-9 2-8 3-6 7-9 2-5 1-4 3-9 7-8 1-7 4-7

Preis 00 - 699,- Euro 1749,2799,Euro Euro 1 0 0 0 0 1 -1 1 0 0 1 0 1 -1 -1 1 0 0 0 0 1 0 0 0 -1 1 -1 1 1 0 0 -1 0 1 1 0

Akkulaufzeit 00 - 1 h 4,75 h 1 -1 -1 0 1 0 1 1 -1 0 0 -1 -1 1 -1 0 1 0

8,5 h -1 1 0 1 -1 0 0 0 1 1 -1 0 1 -1 0 0 0 1

Austauschservice 00 - 12 M. Einsendung 12 M. 24 M. Abholung Abholung 0 -1 1 0 0 0 0 -1 0 1 1 -1 -1 0 0 0 -1 1 -1 0 0 0 -1 0 0 0 -1 1 -1 1 -1 0 0 1 1 0

Festplattenkapazität 00 - 30 GB 75 GB 0 0 -1 0 -1 0 0 -1 -1 1 1 -1 1 0 0 0 0 0

120 GB 0 -1 1 0 0 -1 0 0 1 -1 -1 0 -1 0 0 -1 0 0

Tabelle 136: Differenzendesign mit zufällig angeordneten Paarvergleichen für die Duale Befragung beim Untersuchungsobjekt „Laptop“

432

Produkt 1 Produkt 2 Produkt 3 Produkt 4 Produkt 5 Produkt 6 Produkt 7 Produkt 8 Produkt 9

Preis 00 - 65,- Euro 1182,- Euro 2300,- Euro 1 0 1 0 0 1 0 1 0 0 0 0 0 1 1 0 0 0

Bildschirmdiagonale 00 - 34 cm 71 cm 108 cm 0 0 1 0 1 0 0 0 0 0 1 0 0 1 0 1 0 1

Marke 00 - Welltech Sharp Philips 1 0 0 1 0 0 0 1 0 0 1 0 1 0 0 0 0 1

Vor-Ort Service 0 – kein VOS 1 Jahr VOS 0 0 0 1 0 1 0 1 0

Tabelle 137: Orthogonales Design für die Duale Befragung beim Untersuchungsobjekt „Fernseher“

Preis 00 - 65,- Euro Paarvergleiche 1182,- Euro 2300,- Euro 5-6 0 0 4-5 0 1 8-9 1 0 2-3 1 -1 1-2 0 0 4-6 0 1 5-8 -1 0 1-3 1 -1 6-9 0 0 2-8 0 0 3-6 0 1 7-9 0 1 2-5 1 0 1-4 1 -1 3-9 0 1 7-8 -1 1 1-7 1 -1 4-7 0 0

Bildschirmdiagonale 00 - 34 cm 71 cm 108 cm -1 0 0 0 0 0 0 0 -1 0 -1 0 0 -1 -1 0 1 -1 1 -1 0 0 0 0 1 0 0 0 1 -1 0 0 0 -1 0 -1

Marke 00 - Welltech Sharp Philips -1 0 0 1 0 -1 0 1 1 -1 -1 1 0 0 1 0 1 -1 0 1 -1 0 1 -1 0 1 1 -1 0 -1 1 0 0 0 -1 1

Vor-Ort Service 0 – kein VOS 1 Jahr VOS -1 1 1 0 0 0 -1 0 1 -1 -1 0 0 -1 0 -1 0 1

Tabelle 138: Differenzendesign mit zufällig angeordneten Paarvergleichen für die Duale Befragung beim Untersuchungsobjekt „Fernseher“

433

Produkt 1 Produkt 2 Produkt 3 Produkt 4 Produkt 5 Produkt 6 Produkt 7 Produkt 8

Preis 0 – 310,- Euro 480,- Euro 1 1 0 1 0 0 1 0

Bildschirmdiagonale 0 - 52 cm 70 cm 0 1 1 0 0 1 1 0

Bildfrequenz 0 – 50 Hz 100 Hz 1 1 1 0 0 0 0 1

Bildschirmformat 0 - 4:3 16:9 1 0 0 0 0 1 1 1

Tabelle 139: Orthogonales Design für die Neue Methode beim Untersuchungsobjekt „Fernseher“ für die Zielgruppe 1

Paarvergleiche 1-4 2-8 3-6 1-8 5-8 3-8 1-3 7-8 4-6 6-8 2-3 5-7 2-4 3-7 1-2 6-7 2-6 4-7 3-4 5-6 1-6 4-8 1-7 1-5 3-5 4-5 2-7 2-5

Preis 0 – 310,- Euro 480,- Euro 0 1 0 1 0 0 1 1 1 0 1 -1 0 -1 0 -1 1 0 -1 0 1 1 0 1 0 1 0 1

Bildschirmdiagonale 0 - 52 cm 70 cm 0 1 0 0 0 1 -1 1 -1 1 0 -1 1 0 -1 0 0 -1 1 -1 -1 0 -1 0 1 0 0 1

Bildfrequenz 0 – 50 Hz 100 Hz 1 0 1 0 -1 0 0 -1 0 -1 0 0 1 1 0 0 1 0 1 0 1 -1 1 1 1 0 1 1

Bildschirmformat 0 - 4:3 16:9 1 -1 -1 0 -1 -1 1 0 -1 0 0 -1 0 -1 1 0 -1 -1 0 -1 0 -1 0 1 0 0 -1 0

Tabelle 140: Differenzendesign mit zufällig angeordneten Paarvergleichen für die Neue Methode beim Untersuchungsobjekt „Fernseher“ für die Zielgruppe 1

434

Produkt 1 Produkt 2 Produkt 3 Produkt 4 Produkt 5 Produkt 6 Produkt 7 Produkt 8 Produkt 9 Produkt 10 Produkt 11 Produkt 12 Produkt 13 Produkt 14 Produkt 15 Produkt 16

Preis

Bildschirmdiagonale

00 - 480,- Euro 730,- Euro 920,- Euro 0 1 0 0 0 1 0 1 0 0 0 0 0 1 0 0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 1 0

00 - 52 cm 70 cm 108 cm 0 1 0 0 0 0 1 0 1 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0

Projektionstechnik 0 - LCD Plasma 1 0 0 0 1 1 1 0 1 1 0 0 0 1 1 0

Virtual Dolby Surround 0 - nicht vorh. vorhanden 1 1 0 1 0 1 0 1 1 1 0 0 0 0 0 1

Bildschirmformat 0 - 4:3 16:9 0 1 1 0 0 1 1 1 0 1 1 0 0 0 1 0

Tabelle 141: Orthogonales Design für die Neue Methode beim Untersuchungsobjekt „Fernseher“ für die Zielgruppe 2

435

Preis

Bildschirmdiagonale

00 - 480,- Euro 730,- Euro 920,- Euro 4-12 5-6 2-6 3-4 8-12 10-12 1-3 13-15 1-13 1-2 9-11 4-8 7-8 8-16 13-14 3-7 6-14 9-10 11-15 2-10 10-11 2-3 6-7 14-16 2-14 11-12 1-9 2-4 7-11 6-10 15-16 12-16 5-8 3-15 6-8 1-4 9-13 7-15 1-5 5-7 10-14 13-16 9-12 4-16 5-9 3-11 5-13 14-15

0 0 0 0 0 0 0 -1 0 0 0 0 0 -1 0 0 0 1 0 0 -1 0 0 -1 0 1 -1 0 -1 0 0 -1 0 -1 0 0 1 -1 0 0 0 -1 1 -1 -1 -1 0 -1

1 0 0 0 0 0 0 0 1 1 0 1 1 0 0 0 0 0 0 0 0 -1 -1 0 0 0 1 -1 1 0 0 0 0 1 0 0 0 1 1 -1 0 0 0 1 0 1 0 0

00 - 52 cm 70 cm 108 cm 1 0 -1 -1 0 0 0 0 0 0 -1 1 0 0 0 0 1 0 1 0 -1 0 1 0 0 1 0 -1 -1 1 0 0 1 0 1 -1 0 0 -1 1 0 0 0 1 1 -1 1 0

0 0 0 0 1 0 1 0 0 1 0 -1 -1 1 1 0 0 0 -1 0 0 0 0 0 0 0 1 0 0 0 1 0 -1 -1 -1 1 -1 -1 1 0 0 1 0 0 0 0 -1 -1

Projektionstechnik 0 - LCD Plasma 0 0 -1 0 0 1 1 -1 1 1 1 0 1 0 -1 -1 0 0 -1 -1 1 0 0 1 -1 0 0 0 1 0 1 0 1 -1 1 1 1 0 0 0 0 0 1 0 0 0 1 0

Virtual Dolby BildschirmSurround format 0 - nicht vorh. 0 - 4:3 vorhanden 16:9 1 -1 0 -1 1 1 1 0 1 0 1 0 -1 0 0 0 1 0 0 0 1 1 1 -1 1 0 0 0 0 0 -1 -1 -1 0 0 0 1 0 1 0 1 -1 1 0 -1 0 0 0

0 -1 0 1 1 1 -1 -1 0 -1 -1 -1 0 1 0 0 1 -1 0 0 0 0 0 0 1 1 0 1 0 0 1 0 -1 0 0 0 0 0 0 -1 1 0 0 0 0 0 0 -1

Tabelle 142: Differenzendesign mit zufällig angeordneten Paarvergleichen für die Neue Methode beim Untersuchungsobjekt „Fernseher“ für die Zielgruppe 2

436

Anhang VII: Bedeutungsgewichte der Eigenschaften beim Untersuchungsobjekt „Laptop“ Preis 0,35

Akkulaufzeit 0,21

Gewicht 0,14

Festplattenkapazität 0,30

Tabelle 143: Bedeutungsgewichte der Eigenschaften bei Gruppe 1 und dem Untersuchungsobjekt „Laptop“ Preis 0,35

Akkulaufzeit 0,28

Austauschservice 0,11

Festplattenkapazität 0,25

Tabelle 144: Bedeutungsgewichte der Eigenschaften bei Gruppe 2 und dem Untersuchungsobjekt „Laptop“ Preis 0,30

Marke 0,13

Festplattenkapazität 0,37

Akkulaufzeit 0,20

Tabelle 145: Bedeutungsgewichte der Eigenschaften bei Gruppe 3 und dem Untersuchungsobjekt „Laptop“

437

Anhang VIII: Fragebogen Elicitation Technik

438

Anhang IX: Fragebogen Duale Befragung

439

Anhang X: Fragebogen Neue Methode – angepasste Elicitation Technik

440

Anhang XI: Fragebogen Neue Methode – angepasste Self-Explicated Methode

441

442

443

Anhang XII: Beispielfragebogen für die Conjoint-Analyse bei der Gruppe - Duale Befragung beim Untersuchungsobjekt „Fernseher“

444

445

446

447

Anhang XIII: Beispielfragebogen für die Conjoint-Analyse bei der Gruppe - neue Methode beim Untersuchungsobjekt „Fernseher“

448

449

450

451

452

453

454

455

456

457

458

459

460

461

Literaturverzeichnis

Acito, F. (1977): An Investigation of some Data Collection Issues in Conjoint Measurement, in: American Marketing Association (Hrsg.), Educators' Proceedings, Chicago, S. 8285. Acito, F.; Jain, A.K. (1980): Evaluation of Conjoint Analysis Results: A Comparison of Methods, in: Journal of Marketing Research, Vol. 17, No. 1, S. 106-112. Addelman, S. (1962): Orthogonal Main-Effect Plans for Asymmetrical Factorial Experiments, in: Technometrics, Vol. 4, No. 2, S. 21-46. Agarwal, M.K. (1988): Comparison of Conjoint Methods, in: Sawtooth Software (Hrsg.), Proceedings of the Sawtooth Software Conference on Perceptual Mapping, Sun Valley, S. 51-57. Agarwal, M.K.; Green, P.E. (1991): Adaptive Conjoint Analysis versus Self-Explicated Models: Some empirical Results, in: International Journal of Research in Marketing, Vol. 8, No. 2, S. 141-146. Ahlert, D.; Kenning, P. (2006): Neuroökonomik, in: Zeitschrift für Management, Vol. 1, Nr. 1, S. 24-47. Akaah, I.P.; Korgaonkar, P.K. (1983): An Empirical Comparison of the Predictive Validity of Self-Explicated, Huber Hybrid, Traditional Conjoint, and Hybrid Conjoint Models, in: Journal of Marketing Research, Vol. 20, No. 2, S. 187-197. Alba, J.W.; Hutchinson, J.W. (1987): Dimensions of Consumer Expertise, in: Journal of Consumer Research, Vol. 13, No. 4, S. 411-454. Alba, J.W.; Cooke, A.D.J. (2004): When Absence Begets Inference in Conjoint Analysis; in: Journal of Marketing Research, Vol. 41, No. 4, S. 382-387. Albers, S. (1983): Schätzung von Nachfragereaktionen auf Variationen des Tarif- und Leistungsangebots im öffentlichen Personennahverkehr, in: Zeitschrift für Verkehrswissenschaft, 54. Jg., Nr. 4, S. 207-230. Albers, S. (1989): Gewinnorientierte Neuproduktpositionierung in einem Eigenschaftsraum, in: Schmalenbachs Zeitschrift für betriebswirtschaftliche Forschung (zfbf), 41 Jg., Nr. 3, S. 186-209. Albers, S. (2000): Auswahl optimaler Produkteigenschaften, in: Albers, S.; Herrmann, A. (Hrsg.), Handbuch Produktmanagement, Wiesbaden, S. 355-384. 463

Albers, S.; Herrmann, A. (2000): Ziele, Aufgaben und Grundkonzept des Produktmanagement, in: Albers, S.; Herrmann, A. (Hrsg.), Handbuch Produktmanagement, 1. Auflage, Wiesbaden, S. 3-20. Albers, S.; Kemnitz, U. (1985): Testmarktsimulator als Instrument des Produkttests für kleinere und mittlere Unternehmen, in: Zeitschrift für Betriebswirtschaft (ZfB), 55 Jg., Nr. 3, S. 236-262. Albrecht, J. (1997): Validitätsarten und ihre Überprüfung bei der Conjoint-Analyse, in: Bauer, S.; Herrmann, R.; Kuhlmann, F., Märkte der Agrar- und Ernährungswirtschaft: Analyse, einzelwirtschaftliche Strategien, staatliche Einflussnahme - vom 30. September bis 2. Oktober 1996 in Gießen, 1. Auflage, Münster-Hiltrup, S. 299-311. Albrecht, J. (2000): Präferenzstrukturmessung: Ein empirischer Vergleich der ConjointAnalyse mit einer kompositionellen Methode, Frankfurt a.M. Ali, A. (1994): Pioneering versus Incremental Innovation: Review and Research Propositions, in: Journal of Product Innovation Management, Vol. 11, No. 1, S. 46-61. Allenby, G.M.; Ginter, J.L. (1995): Using Extremes to Design Products and Segment Markets, in: Journal of Marketing Research, Vol. 32, No. 4, S. 392-403. Allenby, G.M.; Rossi, P.E. (2003): Perspectives Based on 10 Years of HB in Marketing Research, Sawtooth Software Research Paper, http://www.sawtoothsoftware.com/download/techpap/allenby.pdf, Seqium. Alpert, M.I. (1980): Unresolved Issues in Identification of Determinant Attributes, in: Advances in Consumer Research, Vol. 7, No. 1, S. 83-88. Alpert, M.I. (1971): Identification of Determinant Attributes: A Comparison of Methods, in: Journal of Marketing Research, Vol. 8, No. 2, S. 184-191. American Marketing Association (1992): Conjoint Analysis: A Guide for Designing and Interpreting Conjoint Studies, Chicago. Anderson, J.C. (1987): The Effect of Type of Representation on Judgments of New Product Acceptance, in: Industrial Marketing & Purchasing, Vol. 2, No. 2, S. 29-46. Anderson, J.C.; Donthu, N. (1988): A Proximate Assessment of the External Validity of Conjoint Analysis, in: Frazier, G.; Ingene, C.; Aaker, D.; Ghosh, A.; Kinnear, T.; Levy, S.; Staelin, R.; Summers, J. (Hrsg.), AMA Educators' Proceedings - Efficiency and Effectiveness in Marketing, No. 54, Chicago, S. 287-291.

464

Anderson, N.H. (1970): Functional Measurement and Psychophysical Judgment, in: Psychological Review, Vol. 77, No. 3, S. 153-170. Anderson, W.T.J.; Cox III, E.P.; Fulcher, D.G. (1976): Bank Selection Decisions and Market Segmentation: Determinant attribute analysis reveals convenience- and serviceoriented customers, in: Journal of Marketing, Vol. 40, No. 1, S. 40-45. Andrews, R.L.; Manrai, A.K. (1998): Simulation Experiments in Choice Simplification: The Effect of Task and Context on Forecasting Performance, in: Journal of Marketing Research, Vol. 35, No. 2, S. 198-209. Aschenbrenner, K.M. (1990): Entscheidung und Urteil, in: Hoyoy, C.; Kroeber-Riel, W.; von Rosenstiel, L.; Strümpel, B. (Hrsg.), Wirtschaftspsychologie in Grundbegriffen, München, S. 151-161. Ayag, Z. (2002): An Analytic-Hierarchy-Process based Simulation Model for Implementation and Analysis of Computer-Aided Systems, in: International Journal of Production Research, Vol. 40, No. 13, S. 3053-3073. Bacher, J.; Wenzig, K.; Vogler, M. (2004): SPSS TwoStep Cluster - A First Evaluation, Wirtschafts- und Sozialwissenschaftliche Fakultät, Friedrich-Alexander-Universität Erlangen-Nürnberg, Arbeitspapiere, 2. korrigierte Auflage, http://www.soziologie.wiso.unierlangen.de/publikationen/a-u-d-papiere/a_04-02.pdf. Backhaus, K.; Brzoska, L. (2004): Conjointanalytische Präferenzmessung zur Prognose von Preisreaktionen, in: Die Betriebswirtschaft (DBW), Vol. 64, Nr. 1, S. 39-57. Backhaus, K.; Erichson, B.; Plinke, W.; Weiber, R. (2000): Multivariate Analysemethoden: Eine anwendungsorientierte Einführung, 9. Auflage, Berlin. Backhaus, K.; Erichson, B.; Plinke, W.; Weiber, R. (2003): Multivariate Analysemethoden: Eine anwendungsorientierte Einführung, 10. Auflage, Berlin. Baier, D.; Säuberlich, F. (1997): Kundennutzenschätzung mittels individueller HybridConjointanalyse, in: Schmalenbachs Zeitschrift für betriebswirtschaftliche Forschung (zfbf), 49. Jg., Nr. 11, S. 951-972. Bailom, F.; Hinterhuber, H.H.; Matzler, K.; Sauerwein, E. (1996): Das Kano-Modell der Kundenzufriedenheit, in: Marketing ZFP, 18. Jg., Nr. 2, S. 117-126. Balderjahn, I. (1993): Marktreaktionen von Konsumenten: ein theoretisch-methodisches Konzept zur Analyse der Wirkung marketingpolitischer Instrumente, Berlin.

465

Balderjahn, I.; Scholderer, J. (2000): Benefit- und Lifestyle-Segmentierung, in: Albers, S.; Herrmann, A. (Hrsg.), Handbuch Produktmanagement, 1. Auflage, Wiesbaden, S. 267288. Bamberg, G.; Coenenberg, A.G. (2000): Betriebswirtschaftliche Entscheidungslehre, 10. Auflage, München. Bateson, J.E.; Reibstein, D.; Boulding, W. (1987): Conjoint Analysis Reliability and Validity: A Framework for Future Research, in: Houston, M. (Hrsg.), Review of Marketing, Chicago, S. 451-481. Bauer, H.; Thomas, U. (1984): Die Präferenzen von Arbeitnehmern gegenüber Tarifpräferenzen, in: Schmalenbachs Zeitschrift für betriebswirtschaftliche Forschung (zfbf), 36. Jg., Nr. 3, S. 200-228. Beck, M.; Opp, K. (2001): Der Faktorielle Survey und die Messung von Normen, in: Kölner Zeitschrift für Soziologie und Sozialpsychologie (KZfSS), 53. Jg., Nr. 2, S. 283-306. Beckwith, N.E.; Lehmann, D.R. (1975): The Importance of Halo Effects in Multi-Attribute Attitude Models, in: Journal of Marketing Research, Vol. 12, No. 3, S. 265-275. Berekoven, L.; Eckert, W.; Ellenrieder, P. (1993): Marktforschung: Methodische Grundlagen und praktische Anwendung, 6. Auflage, Wiesbaden. Berekoven, L.; Eckert, W.; Ellenrieder, P. (2001): Marktforschung: Methodische Grundlagen und praktische Anwendung, 9. Auflage, Wiesbaden. Berstell, G.; Nitterhouse, D. (2005): Let the Customer Make the Case, in: Strategy & Innovation - Harvard Business School Publishing, Vol. 3, No. 2, S. 9-12. Bettman, J.R.; Park, C.W. (1980): Effects of Prior Knowledge and Experience and Phase of the Choice Process on Consumer Decision Processes: A Protocol Analysis, in: Journal of Consumer Research, Vol. 7, No. 3, S. 234-248. Biehal, G.; Chakravarti, D. (1989): The Effects of Concurrent Verbalization on Choice Processing, in: Journal of Marketing Research, Vol. 26, No. 1, S. 84-96. Biehal, G.; Chakravarti, D. (1995): Understanding Consumer Decision Processes Using Verbalization Data: Substantive and Methodological Perspectives, in: Advances in Consumer Research, Vol. 22, No. 1, S. 269-270. Birnbaum, M.H. (1973): The Devil rides again: Correlation as an Index of Fit, in: Psychological Bulletin, Vol. 79, No. 4, S. 239-242.

466

Bither, S.W.; Wright, P. (1977): Preference between Product Consultants: Choice vs. Preference Functions, in: Journal of Consumer Research, Vol. 4, No. 1, S. 39-47. Borcherding, K. (1983): Entscheidungstheorie und Entscheidungshilfeverfahren für komplexe Entscheidungssituationen, in: Irle, M.; Bussmann, W. (Hrsg.), Methoden und Anwendungen in der Marktpsychologie, Band 5, Göttingen, S. 64-173. Bosch, K. (1993): Statistik - Taschenbuch, 2. Auflage, München. Boutellier, R.; Völker, R. (1997): Erfolg durch innovative Produkte: Bausteine des Innovationsmanagements, München. Boya, U.O. (1981): Some Issues in Measures of Predictor Variable Importance Based on Orthogonal Decompositions in Multiple Regression, in: Bernhardt, K.; Dolich, I.; Etzel, M.; Kehoe, W.; Kinnear, T.; Perreault Jr., W.; Roering, K. (Hrsg.), AMA Educators' Proceedings: The Changing Marketing Environment - New Theories and Applications, No. 47, Chicago, S. 306-308. Bradlow, E.T. (2005): Current Issues and a ''Wish List'' for Conjoint Analysis, in: Applied Stochastic Models in Business & Industry, Vol. 21, No.4/5, S. 319-323. Bradlow, E.T.; Hu, Y.; Ho, T. (2004): A Learning-Based Model for Imputing Missing Levels in Partial Conjoint Profiles, in: Journal of Marketing Research, Vol. 41, No. 4, S. 369381. Braun, M.A.; Srinivasan, V.S. (1975): Amount of Information as a Determinant of Consumer Behavior Towards New Products, in: Mazze, E.M.; Stillman W.P., (Hrsg.), American Marketing Association Combined Proceedings Series, No. 37, Chicago, S. 373-378. Braunstein, C.; Huber, F.; Herrmann, A. (2005): Ein Ansatz zur Erklärung der Kundenbindung auf Basis der Theorie des geplanten Verhaltens, in: Schmalenbachs Zeitschrift für betriebswirtschaftliche Forschung (zfbf), 57. Jg., Nr. 3, S. 187-213. Brockhoff, K. (1999): Produktpolitik, 4. Auflage, Stuttgart. Brockhoff, K. (2000): Produktinnovation, in: Albers, S.; Herrmann, A. (Hrsg.), Handbuch Produktmanagement, 1. Auflage, Wiesbaden, S. 25-54. Buchholz, W. (1996): Time-to-Market-Management, Stuttgart. Bucklin, R.E.; Srinivasan, V.S. (1991): Determining Interbrand Substitutability through Survey Measurement of Consumer Preference Structures, in: Journal of Marketing Research, Vol. 28, No. 1, S. 58-71.

467

Böcker, F. (1986): Präferenzforschung als Mittel marktorientierter Unternehmensführung, in: Schmalenbachs Zeitschrift für betriebswirtschaftliche Forschung (zfbf), 38. Jg., Nr. 78, S. 543-574. Böcker, F.; Helm, R. (2003): Marketing, 7. Auflage, Stuttgart. Böcker, F.; Schweikl, H. (1988): Better Preference Prediction with Individualized Sets of Relevant Attributes, in: International Journal of Research in Marketing, Vol. 5, No. 1, S. 15-24. Böhler, H. (1979): Beachtete Produktalternativen und ihre relevanten Eigenschaften im Kaufentscheidungsprozess von Konsumenten, in: Böhler, H. (Hrsg.), Konsumentenverhalten und Information, Wiesbaden, S. 261-289. Calantone, R.; Cooper, R. (1981): New Product Scenarios: Prospects for Success, in: Journal of Marketing, Vol. 45, No. 2, S. 48-60. Carmone, F.J.; Green, P.E. (1981): Model Misspecification in Multiattribute Parameter Estimation, in: Journal of Marketing Research (JMR), Vol. 18, No. 1, S. 87-93. Carmone, F.J.; Green, P.E.; Jain, A.K. (1978): Robustness of Conjoint Analysis: Some Montè Carlo Results, in: Journal of Marketing Research (JMR), Vol. 15, No. 2, S. 300-303. Cattin, P.; Weinberger, M.G. (1980): Some Validity and Reliability Issues in the Measurement of Attribute Utilities, in: Advances in Consumer Research, Vol. 7, No. 1, S. 780783. Cattin, P.; Wittink, D.R. (1982): Commercial Use of Conjoint Analysis: A Survey, in: Journal of Marketing, Vol. 46, No. 3, S. 44-53. Chandran, B.; Golden, B.; Wasil, E. (2005): Linear Programming Models for Estimating Weights in the Analytic Hierarchy Process, in: Computers & Operations Research, Vol. 32, No. 9, S. 2235-2254. Chang, J.E. (2001): The Revival of Projective Techniques: Past, Present, and Future Perspectives, in: Advances in Consumer Research, Vol. 28, No. 1, S. 253-254. Chiu, T.; Fang, D.; Chen, J.; Wang, Y.; Jeris, C. (2001): A Robust and Scalable Clustering Algorithm for Mixed Type Attributes in Large Database Environment, in: ACM Press (Hrsg.), Proceedings of the Seventh ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, New York, S. 263-268.

468

Chrzan, K. (1991): Unreliable Respondents in Conjoint Analysis - Their Impact and Identification, in: Metegrano, M. (Hrsg.), Sawtooth Software Conference Proceedings, Sun Valley, S. 205-228. Churchill, G.A. (1979): A Paradigm for Developing Better Measures of Marketing Constructs, in: Journal of Marketing Research (JMR), Vol. 16, No. 1, S. 64-73. Clatworthy, W.H. (1955): Partially Balanced Incomplete Block Designs with two Associate Classes and two Treatments per Block, in: Journal of Research of the National Bureau of Standards, Vol. 54, No. 4, S. 177-190. Cochran, W.G.; Cox, C.M. (1992): Experimental Designs, 2. Auflage, New York. Condon, E.; Golden, B.; Wasil, E. (2003): Visualizing Group Decisions in the Analytic Hierarchy Process, in: Computers & Operations Research, Vol. 30, No. 10, S. 1435-1445. Cooper, R.; Kleinschmidt, E. (1995): Benchmarking the Firm's Critical Success Factors in New Product Development, in: Journal of Product Innovation Management, Vol. 12, No. 5, S. 374-391. Corstjens, M.L.; Gautschi, D.A. (1983): Conjoint Analysis: A Comparative Analysis of Specification Tests for the Utility Function, in: Management Science, Vol. 29, No. 12, S. 1393-1411. Coulter, R.H.; Zaltman, G. (1994): Using the Zaltman Metaphor Elicitation Technique to understand Brand Images, in: Advances in Consumer Research, Vol. 21, No. 1, S. 501507. Creusen, M.E.; Schoormans, J.P. (1997): The Nature of Differences between Similarity and Preference Judgments: A Replication with Extension, in: International Journal of Research in Marketing, Vol. 14, No. 1, S. 81-87. Creyer, E.; Ross, W.T. (1988): The Effects of Range-Frequency Manipulations on Conjoint Importance Weight Stability, in: Advances in Consumer Research, Vol. 15, No. 1, S. 505-509. Currim, I.S.; Weinberg, C.B.; Wittink, D.R. (1981): Design of Subscription Programs for a Performing Arts Series, in: Journal of Consumer Research, Vol. 8, No. 1, S. 67-75. Curry, J. (1997): After the Basics, in: Marketing Research, Vol. 9, No. 1, S. 6-11. Dahan, E.; Srinivasan, V.S. (2000): The Predictive Power of Internet-Based Product Concept Testing using Visual Depiction and Animation, in: The Journal of Product Innovation Management, Vol. 17, No. 2, S. 99-109. 469

Darmon, R.Y.; Rouziès, D. (1989): Assessing Conjoint Analysis Internal Validity: The Effect of Various Continuous Attribute Level Spacings, in: International Journal of Research in Marketing, Vol. 6, No. 1, S. 35-44. Darmon, R.Y.; Rouziès, D. (1991): Internal Validity Assessment of Conjoint Estimated Attribute Importance Weights, in: Journal of the Academy of Marketing Science, Vol. 15, No. 4, S. 315-322. Darmon, R.Y.; Rouziès, D. (1994): Reliability and Internal Validity of Conjoint Estimated Utility Functions under Error-Free versus Error-Full Conditions, in: International Journal of Research in Marketing, Vol. 11, No. 5, S. 465-476. David, H.A. (1988): The Method of Paired Comparisons, 2. Auflage, New York. Dawes, R.M.; Corrigan, B. (1974): Linear Models in Decision Making, in: Psychological Bulletin, Vol. 81, No. 2, S. 95-106. Dawes; R.M. (1971): A Case Study of Graduate Admissions: Application of Three Principles of Human Decision Making, in: American Psychologist, Vol. 26, No. 2, S. 180-188. Day, G.S.; Shocker, A.D.; Srivastava, R.K. (1979): Consumer Oriented Approaches to identify Product Markets, in: Journal of Marketing, Vol. 43, No. 4, S. 8-19. Day, G.S. (1972): Evaluating Models of Attitude Structure, in: Journal of Marketing Research (JMR), Vol. 9, No. 3, S. 270-286. Deal, K. (2002): Get your Conjoint Online, in several Flavors, in: Marketing Research, Vol. 14, No. 4, S. 44-45. Deal, K. (2003): The Supply Side in Market Simulations, in: Marketing Research, Vol. 15, No. 3, S. 38-41. Degeratu, A.M.; Rangaswamy, A.; Wu, J. (2000): Consumer Choice Behavior in Online and Traditional Supermarkets: The Effect of Brand Name, Price, and other Search Attributes, in: International Journal of Research in Marketing, Vol. 17, No. 1, S. 5578. Dellaert, B.G.; Brazell, J.D.; Louviere, J.J. (1999): The Effect of Attribute Variation on Consumer Choice Consistency, in: Marketing Letters, Vol. 10, No. 2, S. 139-147. Dhar, R.; Nowlis, S.M.; Sherman, S.J. (1999): Comparison Effects on Preference Construction, in: Journal of Consumer Research, Vol. 26, No. 3, S. 293-306. Dichtl, E.; Schobert, R. (1979): Mehrdimensionale Skalierung, München. 470

Diller, H. (1988): Die Preis-Qualitäts-Relation von Konsumgütern im 10-Jahresvergleich, in: Die Betriebswirtschaft (DBW), 48. Jg., Nr. 2, S. 195-200. Diller, H. (2000): Preispolitik, 3. Auflage, Stuttgart. Ding, M.; Grewal, R.; Liechty, J. (2005): Incentive-Aligned Conjoint Analysis, in: Journal of Marketing Research, Vol. 41, No. 1, S. 67-82. Dorsch, M.J.; Teas, R.K. (1992): A Test of the Convergent Validity of Self-Explicated and Decompositional Conjoint Measurement, in: Journal of the Academy of Marketing Science, Vol. 20, No. 1, S. 37-48. Douglas, S.P.; Craig, C.S.; Faivre, J. (1981): Protocols in Consumer Research: Problems, Methods, and Uses, in: Research in Marketing, Vol. 5, No. 1, S. 29-58. Draper, N.R.; Smith, H. (1981): Applied Regression Analysis, New York. Dyer, J.S. (1990): Remarks on the Analytical Hierarchy Process, in: Management Science, Vol. 36, No. 3, S. 249-258. Eastlack Jr., J.O.; Rao, A.G. (1989): Advertising Experiments at the Campbell Soup Company, in: Marketing Science, Vol. 8, No. 1, S. 57-71. Edwards, W.; Barron, F.H. (1994): Smarts and Smarter: Improved Simple Methods for Multiattribute Utility Measurement, in: Organizational Behavior and Human Decision Processes, Vol. 60, No. 3, S. 306-325. Eisenführ, F.; Weber, M. (2003): Rationales Entscheiden, 4. Auflage, Berlin. Elrod, T.; Louviere, J.J.; Davey, K.S. (1992): An Empirical Comparison of Ratings-Based and Choice-Based Conjoint Models, in: Journal of Marketing Research (JMR), Vol. 29, No. 3, S. 368-377. Erichson, B. (2000): Prüfung von Produktideen und -konzepten, in: Albers, S.; Herrmann, A. (Hrsg.), Handbuch Produktmanagement, Wiesbaden, S. 385-410. Ernst, O. (2000): Multimediale versus abstrakte Produktpräsentation bei der Adaptiven Conjoint-Analyse: Ein empirischer Validitätsvergleich, Jena. Ernst, O.; Sattler, H. (2000): Multimediale versus traditionelle Conjoint-Analysen, in: Marketing ZFP, 22. Jg., No. 2, S. 161-172. Fahrmeir, L.; Künstler, R.; Pigeot, I.; Tutz, G. (2003): Statistik - Der Weg zur Datenanalyse, 4. Auflage, Berlin.

471

Felser, G. (1997): Werbe- und Konsumentenpsychologie - Eine Einführung, 1. Auflage, Stuttgart. Fenwick, I. (1975): A User's Guide to Conjoint Measurement in Marketing, in: European Journal of Marketing, Vol. 12, No. 2, S. 203-211. Fischer, G.W. (1995): Range Sensitivity of Attribute Weights in Multiattribute Value Models, in: Organizational Behavior and Human Decision Processes, Vol. 62, No. 3, S. 252266. Fischer, J. (2001): Individualisierte Präferenzanalyse: Entwicklung und empirische Prüfung einer vollkommen individualisierten Conjoint-Analyse, Wiesbaden. Fishbein, M. (1967): A Behavior Theory Approach to the Relations between Belief about an Object and the Attitude toward the Object, in: Fishbein, M. (Hrsg.), Readings in Attitude Theory and Measurement, New York, S. 389-399. Fisher, R.A. (1929): Tests of Significance in Harmonic Analysis, in: Proceedings of the Royal Society, Series A, Vol. 125, No. 796, S. 54-59. Fricke, G.; Lohse, G. (1997): Entwicklungsmanagement - Mit methodischer Produktentwicklung zum Unternehmenserfolg, Berlin. Fröhling, O. (1994): Verbesserungsmöglichkeiten und Entwicklungsperspektiven von Conjoint+Cost, in: Zeitschrift für Betriebswirtschaft (ZfB), 64. Jg., Nr. 9, S. 1143-1164. Gensler, S. (2006): Ermittlung von Präferenzen für Produkteigenschaften mit Hilfe der Choice-Based Conjoint Analyse, Teil II, in: Wirtschaftswissenschaftliches Studium (WiSt), 35. Jg., Nr. 6, S. 316-319. Gerstley, B.; Marder, E. (2002): Conjoint Analysis: How Right is it?, in: Marketing Research, Vol. 14, No. 2, S. 40. Gibson, L. (2002): Conjoint Analysis still Misses the Mark, in: Marketing Research, Vol. 14, No. 1, S. 49-50. Gibson, L.; Marder, E. (2002): Revisiting ''What's Wrong.'', in: Marketing Research, Vol. 14, No. 4, S. 47-48. Gibson, L.D. (1998): Defining Marketing Problems, in: Marketing Research, Vol. 10, No. 1, S. 4-12. Gibson, L.D. (2001): What's Wrong with Conjoint Analysis?, in: Marketing Research, Vol. 13, No. 4, S. 16-19. 472

Gierl, H. (1987): Von der Präferenz zum Kauf eines Markenartikels, in: Markenartikel, 49. Jg., Nr. 10, S. 458-467. Gierl, H. (1995): Marketing, Stuttgart. Gierl, H.; Elftheriadou, C. (2004): Beeinflussung der Präferenzen von Konsumenten durch New-Attribute-Phantome, in: Die Unternehmung, 58. Jg., Nr. 5, S. 347-372. Gierl, H.; Helm, R. (1999): Preisgarantien als Marketinginstrument des Handels, in: Beisheim, O. (Hrsg.): Distribution im Aufbruch: Bestandsaufnahme und Perspektiven, München, S. 823-842. Gierl, H.; Helm, R. (2000): Den Blick am Markt - Conjoint-Analyse für eine marktorientierte Innovationsplanung, in: QZ - Qualität und Zuverlässigkeit, 45. Jg., Nr. 9, S. 11341138. Gierl, H.; Helm, R. (2002): Generierung von Produktideen und -konzepten, in: Albers, S.; Herrmann, A. (Hrsg.), Handbuch Produktmanagement, Wiesbaden, S. 307-331. Gierl, H.; Höser, H. (2002): Der Reihenfolgeeffekt auf Präferenzen, in: Schmalenbachs Zeitschrift für betriebswirtschaftliche Forschung (zfbf), 54. Jg., Nr. 1, S. 3-18. Gierl, H.; Satzinger, M. (2000): Die Nutzung extrinsischer und intrinsischer Qualitätssignale in Abhängigkeit vom Vorabwissen, in: Jahrbuch für Absatz- und Verbrauchsforschung, 46. Jg., Nr. 3, S. 261-279. Glimcher, P.W. (2002): Decisions, Decisions, Decisions: Choosing a Biological Science of Choice, in: Neuron, Vol. 36, No. 10, S. 323-332. Goldberg, L.R. (1968): Simple Models or Simple Processes? Some Research on Clinical Judgments, in: American Psychologist, Vol. 23, No. 7, S. 483-496. Goldstein, W.M. (1990): Judgments of Relative Importance in Decision Making: Global vs local Interpretations of Subjective Weights, in: Organizational Behavior and Human Decision Processes, Vol. 47, No. 2, S. 313-336. Goodwin, P.; Wright, G. (2000): Decision Analysis for Management Judgment, New York. Green, P.E. (1973): On the Analysis of Interactions in Marketing Research Data, in: Journal of Marketing Research (JMR), Vol. 10, No. 4, S. 410-420. Green, P.E. (1974): On the Design of Choice Experiments Involving Multifactor Alternatives, in: Journal of Consumer Research, Vol. 1, No. 2, S. 61-68. Green, P.E. (1975): Marketing Applications of MDS: Assessment and Outlook, in: Journal of Marketing, Vol. 39, No. 1, S. 24-31. 473

Green, P.E. (1977): A New Approach to Market Segmentation, in: Business Horizons, Vol. 77, No. 1, S. 61-73. Green, P.E. (1984): Hybrid Models for Conjoint Analysis: An Expository Review, in: Journal of Marketing Research (JMR), Vol. 21, No. 2, S. 155-169. Green, P.E.; Carmone, F.J. (1969): Multidimensional Scaling: An Introduction and Comparison of Nonmetric Unfolding Techniques, in: Journal of Marketing Research (JMR), Vol. 6, No. 3, S. 330-341. Green, P.E.; Carmone, F.J.; Wind, Y. (1972): Subjective Evaluation Models and Conjoint Measurement, in: Behavioral Science, Vol. 17, No. 2, S. 288-299. Green, P.E.; Carroll, J.D.; Carmone, F.J. (1978): Some New Types of Fractional Factorial Designs for Marketing Experiments, in: Sheth, J. (Hrsg.), Research in Marketing, Greenwich, S. 99-122. Green, P.E.; Devita, M.T. (1974): A Complementarity Model of Consumer Utility for Item Collections, in: Journal of Consumer Research, Vol. 1, No. 3, S. 56-67. Green, P.E.; Devita, M.T. (1975): An Interaction Model of Consumer Utility, in: Journal of Consumer Research, Vol. 2, No. 2, S. 146-153. Green, P.E.; Goldberg, S.M.; Montemayor, M. (1981): A Hybrid Utility Estimation Model For Conjoint Analysis, in: Journal of Marketing, Vol. 45, No. 1, S. 33-41. Green, P.E.; Goldberg, S.M.; Wiley, J.B. (1983): A Cross-Validation Test of Hybrid Conjoint Models, in: Advances in Consumer Research, Vol. 10, No. 1, S. 147-150. Green, P.E.; Helsen, K. (1989): Cross-Validation Assessment of Alternatives to IndividualLevel Conjoint Analysis: A Case Study, in: Journal of Marketing Research (JMR), Vol. 26, No. 3, S. 346-350. Green, P.E.; Helsen, K.; Shandler, B. (1988): Conjoint Internal Validity under Alternative Profile Presentations, in: Journal of Consumer Research, Vol. 15, No. 3, S. 392-397. Green, P.E.; Krieger, A.M. (1985): Models and Heuristics for Product Line Selection, in: Marketing Science, Vol. 4, No. 1, S. 1-19. Green, P.E.; Krieger, A.M.; Schaffer, C.M. (1985): Quick and Simple Benefit Segmentation, in: Journal of Advertising Research, Vol. 25, No. 3, S. 9-17. Green, P.E.; Krieger, A.M. (1988): Choice Rules and Sensitivity Analysis in Conjoint Simulators, in: Journal of the Academy of Marketing Science, Vol. 16, No. 2, S. 114-127. 474

Green, P.E.; Krieger, A.M. (1991): Segmenting Markets with Conjoint Analysis, in: Journal of Marketing, Vol. 55, No. 4, S. 20-31. Green, P.E.; Krieger, A.M. (1995): Attribute Importance Weights Modification in Assessing a Brand's Competitive Potential, in: Marketing Science, Vol. 14, No. 3, S. 253-270. Green, P.E.; Krieger, A.M. (1996): Individualized Hybrid Models for Conjoint Analysis, in: Management Science, Vol. 42, No. 6, S. 850-867. Green, P.E.; Krieger, A.M. (2002a): What's Right with Conjoint Analysis?, in: Marketing Research, Vol. 14, No. 1, S. 24-27. Green, P.E.; Krieger, A.M. (2002b): An Apology and Defense, in: Marketing Research, Vol. 14, No. 2, S. 40. Green, P.E.; Krieger, A.M.; Agarwal, M.K. (1991): Adaptive Conjoint Analysis: Some Caveats and Suggestions, in: Journal of Marketing Research (JMR), Vol. 28, No. 2, S. 215-222. Green, P.E.; Krieger, A.M.; Agarwal, M.K. (1993): A Cross Validation Test of Four Models for Quantifying Multiattribute Preferences, in: Marketing Letters, Vol. 4, No. 4, S. 369-380. Green, P.E.; Krieger, A.M.; Bansal, P. (1988): Completely Unacceptable Levels in Conjoint Analysis: A Cautionary Note, in: Journal of Marketing Research (JMR), Vol. 25, No. 3, S. 293-300. Green, P.E.; Krieger, A.M.; Schaffer, C.M. (1993): An Empirical Test of Optimal Respondent Weighting in Conjoint Analysis, in: Journal of the Academy of Marketing Science, Vol. 21, No. 4, S. 345-351. Green, P.E.; Krieger, A.M.; Vavra, T.G. (1997): Evaluating New Products - Conjoint Analysis offers a Level of Detail that few Concept Testing Methods can Match, in: Marketing Research, Vol. 9, No. 4, S. 12-21. Green, P.E.; Krieger, A.M.; Wind, Y. (2001): Thirty Years of Conjoint-Analysis: Reflections and Prospects, in: Interfaces: an International Journal of the Institute for Operations Research, Vol. 31, No. 2, S. 56-73. Green, P.E.; Rao, V.R. (1971): Conjoint Measurement for Quantifying Judgmental Data, in: Journal of Marketing Research (JMR), Vol. 8, No. 3, S. 355-363. Green, P.E.; Srinivasan, V.S. (1978): Conjoint Analysis in Consumer Research: Issues and Outlook, in: Journal of Consumer Research, Vol. 5, No. 2, S. 103-123. 475

Green, P.E.; Srinivasan, V.S. (1990): Conjoint Analysis in Marketing: New Developments with Implications for Research and Practice, in: Journal of Marketing, Vol. 54, No. 4, S. 3-19. Green, P.E.; Tull, D.S. (1982): Methoden und Techniken der Marketingforschung, 4. Auflage, Stuttgart. Green, P.E.; Wind, J.; Rao, V.R. (1998): Conjoint Analysis: Methods and Applications, in: Dorf, R. (Hrsg.), The Technology Management Handbook, Boca Raton, S. 12/65 12/75. Green, P.E.; Wind, Y. (1973): Multiattribute Decisions in Marketing: A Measurement Approach, Hinsdale. Green, P.E.; Wind, Y. (1975): New Way to measure Consumers' Judgments, in: Harvard Business Review, Vol. 53, No. 4, S. 107-117. Green, P.E.; Wind, Y.; Jain, A.K. (1972a): Benefit Bundle Analysis, in: Journal of Advertising Research, Vol. 12, No. 2, S. 31-36. Green, P.E.; Wind, Y.; Jain, A.K. (1972b): Preference Measurement of Item Collections, in: Journal of Marketing Research (JMR), Vol. 9, No. 4, S. 371-377. Green, P.E.; Wind, Y.; Jain, A.K. (2000): Benefit Bundle Analysis, in: Journal of Advertising Research, Vol. 40, No. 6, S. 32-37. Griffin, A.; Hauser, J.R. (1993): The Voice of the Customer, in: Marketing Science, Vol. 12, No. 1, S. 1-27. Gruner, K.; Homburg, C. (1998): Customer Interaction as a Key to New Product Success, Institut für Marktorientierte Unternehmensführung, Fakultät für Betriebswirtschaftslehre, Universität Mannheim, Wissenschaftliches Arbeitspapier W016. Gruner, K.; Homburg, C. (1999): Innovationserfolg durch Kundenbindung - Eine empirische Untersuchung, in: Zeitschrift für Betriebswirtschaft (ZfB), 69. Jg., Ergänzungsheft 1, S. 119-141. Grunert, K.G. (2003): Can We Understand Consumers by Asking Them?, in: Marketing Research, Vol. 15, No. 2, S. 46. Gupta, S. (1985): Estimating Interactions in Conjoint Analytic Tasks: The Use of Sequential Designs, in: Advances in Consumer Research, Vol. 12, No. 1, S. 177-182. Gutman, J. (1982): A Means-End Chain Model based on Consumer Categorization Processes, in: Journal of Marketing, Vol. 46, No. 2, S. 60-72. 476

Gutsche, J. (1995): Produktpräferenzanalyse: Ein modelltheoretisches und methodisches Konzept zur Marktsimulation mittels Präferenzerfassungsmodellen, Berlin. Gutsche, J.; Herrmann, A.; Kressmann, F.; Algesheimer, R. (2005): Die Wirkung funktionaler, emotionaler und relationaler Nutzendimensionen auf die Markenloyalität, in: Schmalenbachs Zeitschrift für betriebswirtschaftliche Forschung (zfbf), 57. Jg., Nr. 7, S. 638-657. Haaijer, R.; Wedel, M.; Vriens, M.; Wansbeek, T. (1998): Utility Covariances and Context Effects in Conjoint MNP Models, in: Marketing Science, Vol. 17, No. 3, S. 236-252. Haedrich, G.; Kuß, A.; Kreilkamp, E. (1986): Der Analytic Hierarchy Process - Ein neues Hilfsmittel zur Analyse und Entwicklung von Unternehmens- und Marketingstrategien, in: Wirtschaftswissenschaftliches Studium (WiSt), 15. Jg., Nr. 3, S. 120-126. Hagerty, M.R. (1985): Improving the Predictive Power of Conjoint Analysis: The Use of Factor Analysis and Cluster Analysis, in: Journal of Marketing Research (JMR), Vol. 22, No. 2, S. 168-184. Hahn, C. (1997): Conjoint- und Discrete Choice-Analyse als Verfahren zur Abbildung von Präferenzstrukturen und Produktauswahlentscheidungen: Ein theoretischer und computergestützter empirischer Vergleich, Münster. Haimerl, E.; Lebok, U.; Zerzer, M. (2004): A New Approach to Market Research with Children: The Child Psychodrama as Diagnosis Tool for Marketing Strategies, in: GfK Yearbook of Marketing and Consumer Research, Vol. 2, No. 1, S. 22-39. Hair, J.F.; Anderson, R.E.; Tatham, R.L.; Black, W.C. (1998): Multivariate Data Analysis, 5. Auflage, Upper Saddle River. Haley, R.I. (1968): Benefit Segmentation: A Decision-Oriented Research Tool, in: Journal of Marketing, Vol. 32, No. 3, S. 30-35. Haley, R.I. (1971): Beyond Benefit Segmentation, in: Journal of Advertising Research, Vol. 11, No. 4, S. 3-8. Haley, R.I. (1983): Benefit Segmentation - 20 Years Later, in: Journal of Consumer Marketing, Vol. 1, No. 2, S. 5-13. Haley, R.I. (1995): Benefit Segmentation: A Decision-Oriented Research Tool, in: Marketing Management, Vol. 4, No. 1, S. 59-62. Hammann, P.; Erichson, B. (1994): Marktforschung, 3. Auflage, Stuttgart. Hammann, P.; Erichson, B. (2000): Marktforschung, 4. Auflage, Stuttgart. 477

Hammond, J.S.; Keeney, R.L.; Raiffa, H. (1998): Even Swaps: A Rational Method for Making Trade-offs, in: Harvard Business Review, Vol. 76, No. 2, S. 137-150. Harford, T. (2003): Features: In Search of the inside Story of Economics, http://search.ft.com/ s03/search/article.html?id=030930000947. Harker, P.T.; Vargas, L.G. (1990): Reply to "Remarks on the Analytic Hierarchy Process" by J.S. Dyer, in: Management Science, Vol. 36, No. 3, S. 269-273. Hartmann, A. (2004): Kaufentscheidungsprognose auf Basis von Befragungen: Modelle, Verfahren und Beurteilungskriterien, Wiesbaden. Hartmann, A.; Sattler, H. (2002): Preference Measurement in Marketing Research Practice, in: Proceedings of the 31. Annual Conference of the European Marketing Academy, 6 Seiten, veröffentlicht auf CD-ROM, Braga. Hartmann, A.; Sattler, H. (2004): Wie robust sind Methoden zur Präferenzmessung?, in: Schmalenbachs Zeitschrift für betriebswirtschaftliche Forschung (zfbf), 56. Jg., Nr. 1, S. 3-22. Hartung, J.; Elpelt, B. (1995): Multivariate Statistik - Lehr- und Handbuch der angewandten Statistik, 5. Auflage, München. Haupt, R. (2000): Industriebetriebslehre: Management im Lebenszyklus industrieller Geschäftsfelder, Wiesbaden. Hauser, J.R.; Urban, G.L. (1977): A Normative Methodology for Modeling Consumer Response to Innovation, in: Operations Research, Vol. 25, No. 4, S. 579-619. Hausruckinger, G. (1993): Herkunftsbezeichnungen als präferenzdeterminierende Faktoren Eine internationale Studie bei langlebigen Gebrauchsgütern, Frankfurt a.M. Hausruckinger, G.; Helm, R. (1996): Die Bedeutung des Country-of-Origin Effekts vor dem Hintergrund der Internationalisierung von Unternehmen - Eine teilweise individualisierte Conjoint-Analyse, in: Marketing ZFP, 18. Jg., Nr. 4, S. 267-278. Hausruckinger, G.; Herker, A. (1992): Die Konstruktion von Schätzdesigns für ConjointAnalysen auf Basis von Paarvergleichen, in: Marketing ZFP, 14. Jg., Nr. 2, S. 99-110. Heeler, R.M.; Okechuku, C.; Reid, S. (1979): Attribute Importance: Contrasting Measurements, in: Journal of Marketing Research (JMR), Vol. 26, No. 1, S. 60-63. Heitmann, M.; Herrmann, A. (2006): Produktkonfiguration als Präferenzkonstruktion, in: Die Unternehmung, 60. Jg., Nr. 3, S. 223-238. 478

Helm, R. (2001): Planung und Vermarktung von Innovationen - Die Präferenz von Konsumenten für verschiedene Innovationsumfänge unter Berücksichtigung des optimalen Stimulationsniveaus und marktbezogener Einflussfaktoren, Stuttgart. Helm, R.; Manthey, L.; Scholl, A.; Steiner, M. (2002): Preference Measurement with Conjoint Analysis and AHP: An empirical Comparison, in: Leopold-Wildburger, U.; Rendl, F.; Wäscher, G. (Hrsg.), Operations Research Proceedings, Berlin, S. 517-524. Helm, R.; Manthey, L.; Scholl, A.; Steiner, M. (2003): Empirical evaluation of preference elicitation techniques from marketing and decision analysis, Lorenz, H.; Scholl, A. (Hrsg.), Jenaer Schriften zur Wirtschaftswissenschaft, Friedrich-Schiller-Universität Jena, Nr. 2/2003. Helm, R.; Scholl, A.; Manthey, L.; Steiner, M. (2004): Measuring Customer Preferences in New Product Development: Comparing Compositional and Decompositional Methods, in: International Journal of Product Development, Vol. 1, No. 1, S. 12-29. Helm, R.; Steiner, M. (2006): Nutzung von Eigenschaftsarten im Rahmen der Präferenzanalyse - Eine Meta-Studie, Diskussion und Empfehlungen, Lorenz, H.; Scholl, A. (Hrsg.), Jenaer Schriften zur Wirtschaftswissenschaft, Friedrich-Schiller-Universität Jena, Nr. 1/2006. Helm, R.; Steiner, M.; Scholl, A.; Manthey, L. (2004): A Comparative Empirical Study on Common Methods for Measuring Preferences, Lorenz, H.; Scholl, A. (Hrsg.), Jenaer Schriften zur Wirtschaftswissenschaft, Friedrich-Schiller-Universität Jena, Nr. 2/2004. Hensel-Börner, S. (2000): Validität computergestützter hybrider Conjoint-Analysen, Jena. Hensel-Börner, S.; Sattler, H. (2000): Ein empirischer Validitätsvergleich zwischen der Customized Computerized Conjoint Analysis (CCC), der Adaptive Conjoint Analysis (ACA) und Self-Explicated Verfahren, in: Zeitschrift für Betriebswirtschaft (ZfB), 70. Jg., Nr. 6, S. 705-727. Herker, A. (1992): Eine Erklärung des umweltbewußten Konsumentenverhaltens - eine internationale Studie, Frankfurt a.M. Herrmann, A. (1996): Nachfrageorientierte Produktgestaltung: Ein Ansatz auf Basis der "means-end"-Theorie, Wiesbaden. Herrmann, A. (1998): Produktmanagement, München.

479

Herstatt, C.; Sander, J.G. (2004): Online-Kundeneinbindung in den frühen Innovationsphasen, in: Herstatt, C.; Sander, J. G. (Hrsg.), Produktentwicklung mit virtuellen Communities, Wiesbaden, S. 99-119. Hoeffler, S. (2003): Measuring Preferences for Really New Products, in: Journal of Marketing Research (JMR), Vol. 40, No. 4, S. 406-420. Hoepfl, R.T.; Huber, P. (1970): A Study of Self-Explicated Utility Models, in: Behavioral Science, Vol. 15, No. 5, S. 408-414. Hoffmann, P.J.; Slovic, P.; Rorer, L. (1968): An Analysis of Variance Model for the Assessment of Configural Cue Utilization in Clinical Judgment, in: Psychological Bulletin, Vol. 69, No. 5, S. 338-349. Holbrook, M.B.; Moore, W.L. (1981): Feature Interactions in Consumer Judgments of Verbal versus Pictorial Presentations, in: Journal of Consumer Research, Vol. 8, No. 1, S. 103-113. Holland, C.W.; Cravens, D.W. (1973): Fractional Factorial Experimental Designs in Marketing Research, in: Journal of Marketing Research (JMR), Vol. 10, No. 3, S. 270-276. Holling, H.; Melles, T.; Reiners, W. (1999): Evaluation verschiedener Formen von Paarvergleichen in der Conjoint-Analyse, in: Holling, H.; Gediga, G. (Hrsg.), Evaluationsforschung, Göttingen, S. 249-267. Homburg, C.; Giering, A. (1996): Konzeptualisierung und Operationalisierung komplexer Konstrukte, in: Marketing ZFP, 18. Jg., Nr. 1, S. 5-24. Hopkins, D.S.; Larréché, J.; Massy, W.F. (1977): Constrained Optimization of a University Administrator's Preference Function, in: Management Science, Vol. 24, No. 4, S. 365377. Houghton, D.C.; Kardes, F.R.; Mathieu, A.; Simonson, I. (1999): Correction Processes in Consumer Choice, in: Marketing Letters, Vol. 10, No. 2, S. 107-112. Howard, J.A.; Sheth, J.N. (1969): The Theory of Buyer Behavior, New York. Huber, G.P. (1974): Multi-Attribute Utility Models: A Review of Field and Field-Like Studies, in: Management Science, Vol. 20, No. 10, S. 1393-1402. Huber, G.P.; Daneshgar, R.; Ford, D.L. (1971): An Empirical Comparison of Five Utility Models for Predicting Job Preferences, in: Organizational Behavior and Human Performance, Vol. 6, No. 3, S. 267-282.

480

Huber, J. (1975): Predicting Preferences on Experimental Bundles of Attributes: A Comparison of Models, in: Journal of Marketing Research (JMR), Vol. 12, No. 3, S. 290-297. Huber, J. (1987): Conjoint Analysis: How We Got Here and Where We Are, Sawtooth Software Research Paper, Sequim. Huber, J. (1997): What we have learned from 20 Years of Conjoint Research: When to use Self-Explicated, Graded Pairs, Full Profiles or Choice Experiments, in: Sawtooth Software (Hrsg.), Proceedings of the Sawtooth Software Conference, Sequim, S. 243256. Huber, J.; Hansen, D. (1987): Testing the Impact of Dimensional Complexity and Affective Differences of Paired Concepts in Adaptive Conjoint Analysis, in: Advances in Consumer Research, Vol. 14, No. 1, S. 159-163. Huber, J.; Holbrook, M.B. (1982): Estimating Temporal Trends in Preferences Measured by Graded Paired Comparisons, in: Journal of Business Research, Vol. 10, No. 4, S. 459473. Huber, J.; McCann, J. (1982): The Impact of Inferential Beliefs on Product Evaluations, in: Journal of Marketing Research (JMR), Vol. 19, No. 3, S. 324-333. Huber, J.; Moore, W. (1979): A Comparison of Alternative Ways to Aggregate Individual Conjoint Analysis, in: Beckwith, N.; Houston, M.; Mittelstaedt, R.; Monroe, K.; Ward, S. (Hrsg.), 1979 AMA Educators’ Proceedings, No. 44, Chicago, S. 64-68. Huber, J.; Orme, B.K.; Miller, R. (1999): Dealing with Product Similarity in Conjoint Simulations,

http://www.sawtoothsoftware.com/download/techpap/prodsim.pdf,

Sawtooth

Software Research Paper, Sequim. Huber, J.; Payne, J.W.; Puto, C. (1982): Adding Asymmetrically Dominated Alternatives: Violations of Regularity and the Similarity Hypothesis, in: Journal of Consumer Research, Vol. 9, No. 1, S. 90-98. Huber, J.; Puto, C. (1983): Market Boundaries and Product Choice: Illustrating Attraction and Substitution Effects, in: Journal of Consumer Research, Vol. 10, No. 1, S. 31-44. Huber, J.; Wittink, D.R.; Fiedler, J.A.; Miller, R. (1993): The Effectiveness of Alternative Preference Elicitation Procedures in Predicting Choice, in: Journal of Marketing Research (JMR), Vol. 30, No. 1, S. 105-114.

481

Huber, J.; Wittink, D.R.; Johnson, E.M.M.R. (1992): Learning Effects in Preference Tasks: Choice-Based Versus Standard Conjoint, http://www.sawtoothsoftware.com/download/techpap/learneff.pdf, Sawtooth Software Research Paper, Sequim. Huber, J.C.; Wittink, D.R.; Fiedler, J.A.; Miller, R.L. (1991): An Empirical Comparison of ACA and Full Profile Judgments, http://sawtoothsoftware.com/download/techpap/ empcomp.pdf, Sawtooth Software Research Paper, Sequim. Häusel, H. (2004): Brain Script: Warum Kunden kaufen, Freiburg. Höser, H. (1998): Kontextabhängige Präferenzen - Die Relativität von Präferenzurteilen und ihre Bedeutung für Kaufentscheidungen von Konsumenten, Frankfurt a.M. Jaccard, J.; Brinberg, D.; Ackerman, L.J. (1986): Assessing Attribute Importance: A Comparison of Six Methods, in: Journal of Consumer Research, Vol. 12, No. 4, S. 463-468. Jacoby, J.; Speller, D.E.; Kohn, C.A. (1974): Brand Choice Behavior as a Function of Information Load, in: Journal of Marketing Research, Vol. 11, No. 1, S. 63-69. Jaeger, S.R.; Hedderley, D.; MacFie, H.J. (2000): Methodological Issues in Conjoint Analysis: A Case Study, in: European Journal of Marketing, Vol. 35, No. 11/12, S. 12171237. Jain, A.K.; Acito, F.; Malhotra, N.K.; Mahajan, V. (1979): A Comparison of the Internal Validity of Alternative Parameter Estimation Methods in Decompositional Multiattribute Preference Models, in: Journal of Marketing Research (JMR), Vol. 16, No. 3, S. 313322. Jain, A.K.; Mahajan, V.; Malhotra, N.K. (1979): Multiattribute Preference Models for Consumer Research: A Synthesis, in: Advances in Consumer Research, Vol. 6, No. 1, S. 248-252. Jain, A.K.; Malhotra, N.K.; Mahajan, V. (1979): Aggregating Conjoint Data: Some Methodological Considerations and Approaches, in: Beckwith, N.; Houston, M.; Mittelstaedt, R.; Monroe, K.; Ward, S. (Hrsg.), 1979 AMA Educators’ Proceedings, No. 44, Chicago, S. 74-77. Janiszewski, C.; Silk, T.; Cooke, A.D. (2003): Different Scales for Different Frames: The Role of Subjective Scales and Experience in Explaining Attribute-Framing Effects, in: Journal of Consumer Research, Vol. 30, No. 3, S. 311-384. Janssen, J.; Laatz, W. (1999): Statistische Datenanalyse mit SPSS für Windows, 3. Auflage, Berlin. 482

Johnson, E.J.; Meyer, R.J. (1984): Compensatory Choice Models of Noncompensatory Processes: The Effect of Varying Context, in: Journal of Consumer Research, Vol. 11, No. 1, S. 528-541. Johnson, E.J.; Meyer, R.J.; Ghose, S. (1989): When Choice Models Fail: Compensatory Models in Negatively Correlated Environments, in: Journal of Marketing Research (JMR), Vol. 26, No. 3, S. 255-270. Johnson, R.M. (1974): Trade-off Analysis of Consumer Values, in: Journal of Marketing Research (JMR), Vol. 11, No. 2, S. 121-127. Johnson, R.M. (1976): Beyond Conjoint Measurement: A Method of Pairwise Trade-off Analysis, in: Advances in Consumer Research, Vol. 3, No. 1, S. 353-358. Johnson, R.M. (1987): Adaptive Conjoint Analysis, in: Sawtooth Software (Hrsg.), Proceedings of the Sawtooth Software Conference on Perceptual Mapping, Conjoint Analysis, and Computer Interviewing, No. 1, Ketchum, S. 253-265. Johnson, R.M. (1991): Comment on ''Adaptive Conjoint Analysis: Some Caveats and Suggestions'', in: Journal of Marketing Research (JMR), Vol. 28, No. 2, S. 223-225. Johnson, R.M. (1997): Including Holdout Choice Tasks in Conjoint Analysis, http://www. sawtoothsoftware.com/download/techpap/inclhold.pdf, Sawtooth Software Research Paper, Sequim. Johnson, R.M. (2000): Understanding HB: An Intuitive Approach, http://www.sawtoothsoft ware.com/download/techpap/undhb.pdf, Sawtooth Software Research Paper, Sequim. Johnson, R.M. (2001): History of ACA, http://www.sawtoothsoftware.com/download/tech pap/ histaca.pdf, Sawtooth Software Research Paper, Sequim. Johnson, R.M. (2002): Gibson Errs on Points of Facts, in: Marketing Research, Vol. 14, No. 1, S. 47-48. Johnson, R.M.; Levin, I.P. (1985): More than Meets the Eye: The Effect of Missing Information on Purchase Evaluations, in: Journal of Consumer Research, Vol. 12, No. 2, S. 169-177. Johnson, R.M.; Olberts, K.A. (1996): Using Conjoint Analysis in Pricing Studies: Is One Price Variable Enough?, http://www.sawtoothsoftware.com/download/techpap/onevar .pdf, Sawtooth Software Research Paper, Sequim.

483

Johnson, R.M.; Orme, B.K. (1996): How many Questions should You ask in Choice-Based Conjoint Studies?, http://www.sawtoothsoftware.com/download/techpap/howmanyq .pdf, Sawtooth Software Research Paper, Sequim. Johnson, R.M.; Orme, B.K. (2003): Getting the Most from CBC, http://www.sawtoothsoft ware.com/download/techpap/cbcmost.pdf,

Sawtooth

Software

Research

Paper,

Sequim. Kaas, K.; Hofacker, T. (1983): Informationstafeln und Denkprotokolle - Bestandsaufnahme und Entwicklungsmöglichkeiten der Prozessverfolgungstechniken, in: Forschungsgruppe Konsum und Verhalten (Hrsg.), Innovative Marktforschung, Würzburg, S. 75103. Kamakura, W.A. (1988): A Least Squares Procedure for Benefit Segmentation with Conjoint Experiments, in: Journal of Marketing Research (JMR), Vol. 25, No. 2, S. 157-167. Kamenetzky, R. (1982): The Relationship between the Analytic Hierarchy Process and the Additive Value Function, in: Decision Sciences, Vol. 13, No. 4, S. 702-713. Kanninen, B.J. (2002): Optimal Design for Multinominal Choice Experiments, in: Journal of Marketing Research (JMR), Vol. 39, No. 2, S. 214-227. Keeney, R.L.; Gregory, R.S. (2005): Selecting Attributes to Measure the Achievement of Objectives, in: Operations Research, Vol. 53, No. 1, S. 1-11. Keeney, R.L.; Raiffa, H. (2003): Decisions with Multiple Objectives: Preferences and Value Tradeoffs, Cambridge. Kelly, G.A. (1955): A Theory of Personality, 1. Auflage, New York. Kemper, A.C. (2000): Strategische Markenpolitik im Investitionsgüterbereich, Lohmar. Kepper, G. (2000): Methoden der Qualitativen Marktforschung, in: Herrmann, A.; Homburg, C. (Hrsg.), Marktforschung, 2. Auflage, Wiesbaden, S. 159-202. King, W.C.; Hill, A.; Orme, B.K. (2005): The ''Importance'' Question in ACA: Can it be Omitted?, http://www.sawtoothsoftware.com/download/techpap/omitimp.pdf, Sawtooth Software Research Paper, Sequim. Klein, M. (2002): Die Conjoint-Analyse: Eine Einführung in das Verfahren mit einem Ausblick auf mögliche sozialwissenschaftliche Anwendungen, http://www.za.unikoeln.de/publications/pdf/ za_info/ZA-Info-50.pdf, in: ZA-Information, Nr. 50, S. 745.

484

Klein, N.M. (1987): Assessing Unacceptable Attribute Levels in Conjoint Analysis, in: Advances in Consumer Research, Vol. 14, No. 1, S. 154-158. Klein, N.M.; Bither, S.W. (1987): An Investigation of Utility-Directed Cutoff Selection, in: Journal of Consumer Research, Vol. 14, No. 2, S. 240-256. Klein, R.; Scholl, A. (2004): Planung und Entscheidung: Konzepte, Modelle und Methoden einer modernen betriebswirtschaftlichen Entscheidungsanalyse, München. Kohli, R. (1988): Assessing Interaction Effects in Latin Square-Type Designs, in: International Journal of Research in Marketing, Vol. 5, No. 5, S. 25-37. Korpela, J.; Kyläheiko, K.; Lehmusvaara, A.; Tuominen, M. (2002): An Analytic Approach to Production Capacity Allocation and Supply Chain Design, in: International Journal Production Economics, Vol. 78, No. 2, S. 187-195. Kotler, P. (1974): Marketing-Management: Analyse, Planung und Kontrolle, 2. Auflage, Stuttgart. Kotler, P. (2003): Marketing-Management, 11. Auflage, Upper Saddle River. Kotler, P.; Bliemel, F. (2001): Marketing-Management: Analyse, Planung und Verwirklichung, 10. Auflage, Stuttgart. Krapp, A.; Sattler, H. (2001): Rethinking Preference Measurement, http://www.henriksattler .de /publikationen/AK_HS_EMAC2001.pdf, in: Breivik, E.; Falkenberg, A.W.; Gronhaug, K. (Hrsg.), Conference Proceedings of Rethinking European Marketing - 30th EMAC Conference, Bergen. Krech, D.; Crutchfield, R.S. (1948): Theory and Problems of Social Psychology, 1. Auflage, New York. Kristensson, P.; Gustafsson, A.; Archer, T. (2004): Harnessing the Creative Potential Among Users, in: Journal of Product Innovation Management, Vol. 21, No. 1, S. 4-14. Kroeber-Riel, W. (1996): Bild-Kommunikation - Imagerystrategien für die Werbung, München. Kroeber-Riel, W.; Weinberg, P. (2003): Konsumentenverhalten, 8. Auflage, München. Kuhfeld, W.F. (1997): Efficient Experimental Designs using Computerized Searches, http://www.sawtoothsoftware.com/download/techpap/1997Proceedings.pdf, in: Sawtooth Software (Hrsg.), Proceedings of the Sawtooth Software Conference, Sequim.

485

Kumar, V.; Gaeth, G. (1991): Attribute Order and Product Familiarity Effects in Decision Tasks Using Conjoint Analysis, in: International Journal of Research in Marketing, Vol. 8, No. 2, S. 113-124. Kutter, S. (2004): Direkter Weg in den Kopf, in: Wirtschaftswoche, Nr. 36, S. 84-88. Köcher, W. (1997): Die Maik-Conjoint-Analyse, in: Marketing ZFP, 19. Jg. Nr. 3, S. 141152. Lans, I.A.v.d.; Heiser, W.J. (1992): Constrained Part-Worth Estimation in Conjoint Analysis using the Self-explicated Utility Model, in: International Journal of Research in Marketing, Vol. 9, No. 4, S. 325-344. Lans, I.A.v.d.; Wittink, D.R.; Huber, J.; Vriens, M. (1992): Within- and Across-Attribute Constraints in ACA and Full Profile Conjoint Analysis, in: Metegrano, M. (Hrsg.), 1992 Sawtooth Software Conference Proceedings, Seattle, S. 365-379. Lees, G.; Wright, M. (2004): The Effect of Concept Formulation on Concept Test Scores, in: Journal of Product Innovation Management, Vol. 21, No. 6, S. 389-400. Lefkoff-Hagius, R.; Mason, C.H. (1990): The Role of Tangible and Intangible Attributes in Similarity and Preference Judgements, in: Advances in Consumer Research, Vol. 17, No. 1, S. 135-143. Lefkoff-Hagius, R.; Mason, C.H. (1993): Characteristic, Beneficial, and Image Attributes in Consumer Judgment of Similarity and Preference, in: Journal of Consumer Research, Vol. 20, No. 1, S. 100-110. Lego, R.; Shaw, R.N. (1992): Convergent Validity in Tourism Research: An Empirical Analysis, in: Tourism Management, Vol. 13, No. 4, S. 387-393. Leigh, T.W.; MacKay, D.B.; Summers, J.O. (1981): On Alternative Experimental Methods for Conjoint Analysis, in: Advances in Consumer Research, No. 8, No. 1, S. 317-322. Leigh, T.W.; MacKay, D.B.; Summers, J.O. (1984): Reliability and Validity of ConjointAnalysis and Self-Explicated Weights: A Comparison, in: Journal of Marketing Research (JMR), Vol. 21, No. 4, S. 452-462. Lines, R.; Denstadli, J.M. (2004): Information Overload in Conjoint Experiments, in: International Journal of Market Research, Vol. 46, No. 3, S. 297-310. Loosschilder, G.H.; Rosbergen, E.; Vriens, M.; Wittink, D.R. (1995): Pictorial Stimuli in Conjoint Analysis - To Support Product Styling Decisions, in: Journal of Market Research Society, Vol. 37, No. 1, S. 17-34. 486

Louviere, J.J. (1984a): Hierarchical Information Integration: A New Method for the Design and Analysis of Complex Multiattribute Judgement Problems, in: Advances in Consumer Research, Vol. 11, No. 1, S. 148-155. Louviere, J.J. (1984b): Using Discrete Choice Experiments and Multinominal Logit Choice Models to Forecast Trial in a Competitive Retail Environment: A Fast Food Restaurant Illustration, in: Journal of Retailing, Vol. 60, No. 4, S. 81-107. Louviere, J.J. (1988a): Conjoint Analysis Modelling of Stated Preferences - A Review of Theory, Methods, Recent Developments and External Validity, in: Journal of Transport Economics and Policy, Vol. 22, No. 1, S. 93-119. Louviere, J.J. (1988b): Analyzing Decision Making - Metric Conjoint Analysis, Lewis-Beck, M.S. (Hrsg.), Sage University Paper, Series: Quantitative Applications in the Social Sciences, No. 67, Iowa. Louviere, J.J.; Gaeth, G.J. (1987): Decomposing the Determinants of Retail Facility Choice Using the Method of Hierarchical Information Integration: A Supermarket Illustration, in: Journal of Retailing, Vol. 63, No. 1, S. 25-48. Louviere, J.J.; Woodworth, G. (1983): Design and Analysis of Simulated Consumer Choice or Allocation Experiments: An Approach Based on Aggregate Data, in: Journal of Marketing Research (JMR), Vol. 20, No. 4, S. 350-367. Louviere, J.J.; Woodworth, G.G. (1988): On the Design and Analysis of Correlated Conjoint Experiments Using Difference Designs, in: Advances in Consumer Research, Vol. 15, No. 1, S. 510-517. Luce, R.D.; Tukey, J.W. (1964): Simultaneous Conjoint Measurement: A New Type of Fundamental Measurement, in: Journal of Mathematical Psychology, Vol. 1, No. 1, S. 127. Lynch, J.G.J. (1985): Uniqueness Issues in the Decompositional Modeling of Multiattribute Overall Evaluations: An Information Integration Perspective, in: Journal of Marketing Research (JMR), Vol. 22, No. 1, S. 1-19. Lürssen, J. (1989): Produktwissen und Kaufentscheidung: Einbeziehung des Produktwissens bei der Analyse von Kaufentscheidungen mit der Information-Display-Matrix, Frankfurt a.M. MacKay, D.B.; Ellis, M.; Zinnes, J.L. (1986): Graphic and Verbal Presentation of Stimuli: A Probabilistic MDS Analysis, in: Advances in Consumer Research, Vol. 13, No. 1, S. 529-533. 487

Malhotra, N.K. (1986): An Approach to the Measurement of Consumer Preferences Using Limited Information, in: Journal of Marketing Research (JMR), Vol. 23, No. 1, S. 3340. McCullough, D. (2002a): What's Wrong with Gibson's Arguments?, in: Marketing Research, Vol. 14, No. 1, S. 48-49. McCullough, D. (2002b): A User's Guide to Conjoint Analysis, in: Marketing Research, Vol. 14, No. 2, S. 19-23. McFadden, D. (1974): Conditional Logit Analysis of Qualitative Choice Behavior, in: Zarembka, P. (Hrsg.), Frontiers in Econometrics, New York, S. 105-142. McFadden, D. (1986): The Choice Theory Approach to Market Research, in: Marketing Science, Vol. 5, No. 4, S. 275-297. McGraw, A.P.; Tetlock, P.E. (2005): Taboo Trade-offs, Relational Framing, and the Acceptability of Exchanges, in: Journal of Consumer Psychology, Vol. 15, No. 1, S. 2-15. McLauchlan, W.G. (1991): Scaling Prior Utilities in Sawtooth Software's Adaptive Conjoint Analysis,

http://www.sawtoothsoftware.com/download/techpap/acascale.pdf,

Saw-

tooth Software Research Paper, Sequim. Meffert, H. (1998): Marketing: Grundlagen marktorientierter Unternehmensführung; Konzepte - Instrumente - Praxisbeispiele; mit neuer Fallstudie VW Golf, 8. Auflage, Wiesbaden. Meffert, H. (2000): Marketing: Grundlagen marktorientierter Unternehmensführung; Konzepte - Instrumente - Praxisbeispiele; mit neuer Fallstudie VW Golf, 9. Auflage, Wiesbaden. Mehta, R.; Moore, W.L.; Pavia, T.M. (1992): An Examination of the Use of Unacceptable Levels in Conjoint Analysis, in: Journal of Consumer Research, Vol. 19, No. 3, S. 470-476. Melles, T. (2001): Framing-Effekte in der Conjoint-Analyse: Ein Beispiel für Probleme der Merkmalsdefinition, Aachen. Melles, T.; Holling, H. (1998): Einsatz der Conjoint-Analyse in Deutschland - Eine Befragung von Anwendern, Westfälische Wilhelms-Universität, Arbeitspapier des Psychologischen Instituts IV.

488

Mengen, A. (1993): Konzeptgestaltung von Dienstleistungsprodukten: Eine Conjoint-Analyse im Luftfrachtmarkt unter Berücksichtigung der Qualitätsunsicherheit beim Dienstleistungskauf, Stuttgart. Meyvis, T.; Janiszewski, C. (2002): Consumers' Beliefs about Product Benefits: The Effect of Obviously Irrelevant Product Information, in: Journal of Consumer Research, Vol. 28, No. 4, S. 618-635. Mikes, P.S.; Hulin, C.L. (1968): Use of Importance as a Weighting Component of Job Satisfaction, in: Journal of Applied Psychology, Vol. 52, No. 5, S. 394-398. Mishra, S.; Umesh, U.; Stem Jr., D.E. (1989): Attribute Importance Weights in Conjoint Analysis: Bias and Precision, in: Advances in Consumer Research, Vol. 16, No. 1, S. 605-611. Mohn, N.C. (1990): Simulated-Purchase ''Chip'' Testing vs. Tradeoff (Conjoint) Analysis Coca-Cola's Experience, in: Marketing Research, Vol. 2, No. 1, S. 49-54. Moore, W.M. (1980): Levels of Aggregation in Conjoint Analysis: An Empirical Comparison, in: Journal of Marketing Research (JMR), Vol. 17, No. 4, S. 516-523. Moore, W.M.; Holbrook, M.B. (1990): Conjoint Analysis on Objects with Environmentally Correlated Attributes: The Questionable Importance of Representative Design, in: Journal of Consumer Research, Vol. 16, No. 4, S. 490-497. Moore, W.M.; Gray-Lee, J.; Louviere, J.J. (1998): A Cross-Validity Comparison of Conjoint Analysis and Choice Models at Different Levels of Aggregation, in: Marketing Letters, Vol. 9, No. 2, S. 195-207. Morgan, A.I. (1984): Point of View: Magic Town Revisited (A Personal Perspective), in: Journal of Advertising Research, Vol. 24, No. 4, S. 49-51. Morgan, D.L. (1998): The Focus Group Guidebook, London. Morse, G. (2002): Verborgenes Denken, in: Harvard Business Manager, 23. Jg., Nr. 6, S. 1012. Mulye, R. (1998): An Empirical Comparison of Three Variants of the AHP and Two Variants of Conjoint Analysis, in: Journal of Behavioral Decision Making, Vol. 11, No. 4, S. 263-280. Myers, J.H. (1976): Benefit Structure Analysis: A New Tool for Product Planning, in: Journal of Marketing, Vol. 40, No. 4, S. 23-32.

489

Myers, J.H. (1988): Attribute Deficiency Segmentation: Measuring Unmet Wants, in: Advances in Consumer Research, Vol. 15, No. 1, S. 108-113. Myers, J.H.; Alpert, M.I. (1968): Determinant Buying Attitudes: Meaning and Measurement, in: Journal of Marketing, Vol. 32, No. 4, S. 13-20. Myers, J.H.; Alpert, M.I. (1997): Determinant Buying Attitudes: Meaning and Measurement, in: Marketing Management, Vol. 6, No. 2, S. 50-56. Myers, J.H.; Shocker, A.D. (1981): The Nature of Product-Related Attributes, in: Sheth, J. N. (Hrsg.), Research in Marketing, Greenwich, S. 211-236. Müller, W. (1997): Produktpositionierung, in: Das Wirtschaftsstudium (WISU), 26. Jg., Nr. 89, S. 739-748. Müller-Hagedorn, L.; Sewing, E.; Toporowski, W. (1993): Zur Validität von ConjointAnalysen, in: Schmalenbachs Zeitschrift für betriebswirtschaftliche Forschung (zfbf), 45. Jg., Nr. 2, S. 123 - 148. Neslin, S.A. (1981): Linking Product Features to Perceptions: Self-Stated Versus Statistically Revealed Importance Weights, in: Journal of Marketing Research (JMR), Vol. 18, No. 1, S. 80-86. Nieschlag, R.; Dichtl, E.; Hörschgen, H. (2002): Marketing, 19. Auflage, Berlin. Nitschke, T.; Völckner, F. (2006) Präferenzmessung bei unsicheren Produkteigenschaften: Risikoberücksichtigung bei Ergebnissen aus Conjoint-Analysen, in: Schmalenbachs Zeitschrift für betriebswirtschaftliche Forschung (zfbf), 58. Jg., Nr. 6, S. 743-770. Nitzsch, R.v.; Weber, M. (1991): Bandbreiten-Effekte bei der Bestimmung von Zielgewichten, in: Schmalenbachs Zeitschrift für betriebswirtschaftliche Forschung (zfbf), 43. Jg., Nr. 11, S. 971-986. Nitzsch, R.v.; Weber, M. (1993): The Effect of Attribute Ranges on Weights in Multiattribute Utility Measurements, in: Management Science, Vol. 39, No. 8, S. 937-943. Nowlis, S.M.; Simonson, I. (1997): Attribute-Task Compatibility as a Determinant of Consumer Preference Reversals, in: Journal of Marketing Research (JMR), Vol. 34, No. 2, S. 205-218. Obermiller, C. (1980): Generating Product Ideas: A Modification of the Dual Questioning Technique, in: Advances in Consumer Research, Vol. 7, No. 1, S. 767-771.

490

Ofir, C. (2004): Reexamining Latitude of Price Acceptability and Price Thresholds: Predicting Basic Consumer Reaction to Price, in: Journal of Consumer Research, Vol. 30, No. 4, S. 612-621. Ohse, D. (1990): Mathematik für Wirtschaftswissenschaftler, 2. Auflage, München. Opitz, O. (1999): Mathematik: Lehrbuch für Ökonomen, 7. Auflage, München. Oppewal, H.; Louviere, J.J.; Timmermans, H.J. (1994): Modeling Hierarchical Conjoint Processes with Integrated Choice Experiments, in: Journal of Marketing Research (JMR), Vol. 31, No. 1, S. 92-105. Orme, B.K. (1996): Which Conjoint Method should I use?, Sawtooth Software Research Paper, Sequim. Orme, B.K. (1997): ACA, CBC or Both?, Sawtooth Software Research Paper, Sequim. Orme, B.K. (1998): Reducing the Number-of-Attribute-Levels Effect in ACA with Optimal Weighting, http://www.sawtoothsoftware.com/download/techpap/numlev.pdf, Sawtooth Software Research Paper, Sequim. Orme, B.K. (2002a): Conjoint Analysis has Value, in: Marketing Research, Vol. 14, No. 2, S. 46-47. Orme, B.K. (2002b): Perspectives on the Recent Debate over Conjoint Analysis and Modeling Preferences with ACA, http://www.sawtoothsoftware.com/download/techpap/perspect .pdf, Sawtooth Software Research Paper, Sequim. Orme, B.K. (2002c): Formulating Attributes and Levels in Conjoint Analysis, http://www. sawtoothsoftware.com/download/techpap/formatt.pdf, Sawtooth Software Research Paper, Sequim. Orme, B.K. (2002d): Interpreting Conjoint Analysis Data, http://www.sawtoothsoftware.com/ download/techpap/interpca.pdf, Sawtooth Software Research Paper, Sequim. Orme, B.K. (2002e): Introduction to Market Simulators for Conjoint Analysis, Sawtooth Software Research Paper, Sequim. Orme, B.K. (2003): Which Conjoint Method should I use?, http://www.sawtoothsoftware .com/ download/techpap/whichmth.pdf, Sawtooth Software Research Paper, Sequim. Orme, B.K.; Alpert, M.I.; Christensen, E. (1997a): Assessing the Validity of Conjoint Analysis - Continued, in: Sawtooth Software (Hrsg.), Proceedings of the Sawtooth Software Conference, Seattle, S. 209-225. 491

Orme, B.K.; Alpert, M.I.; Christensen, E. (1997b): Assessing the Validity of Conjoint Analysis - Continued, http://www.sawtoothsoftware.com/download/techpap/assess2.pdf, Sawtooth Software Research Paper, Sequim. Orme, B.K.; Huber, J. (2000): Improving the Value of Conjoint Simulations, in: Marketing Research, Vol. 12, No. 4, S. 12-20. Ossadnik, W.; Lange, O. (2000): Die Wahl des Vertriebssystems mit Hilfe des Analytischen Hierarchie-Prozesses, in: Das Wirtschaftsstudium (WISU), 29. Jg., Nr. 4, S. 524-534. Paffrath, R. (1999): Comment on Wittink, McLaughlan, and Seetharaman, in: Sawtooth Software (Hrsg.), Sawtooth Software Proceedings, Seattle, S. 241. Painton, S.W.; Gentry, J.W. (1985): Another Look at the Impact of Information Presentation Format, in: Journal of Consumer Research, Vol. 12, No. 2, S. 240-244. Palupski, R. (1995): Virtual Reality und Marketing, in: Marketing ZFP, 17. Jg., Nr. 4, S. 264272. Park, C.W.; Jun, S.Y.; Macinnis, D.J. (2000): Choosing what I Want versus Rejecting what I do Not Want: An Application of Decision Framing to Product Option Choice Decisions, in: Journal of Marketing Research (JMR), Vol. 37, No. 2, S. 187-202. Parker, B.R.; Srinivasan V.S. (1976): A Consumer Preference Approach to the Planning of Rural Primary Health-Care Facilities, in: Operations Research, Vol. 24, No. 5, S. 9911025. Parker, S.; Schneider, B. (1988): Conjoint Scaling of the Utility of Money using Paired Comparisons, in: Social Science Research, Vol. 17, No. 3, S. 277-286. Parry, M.E.; Song, X.M. (1994): Identifying New Product Successes in China, in: Journal of Product Innovation Management, Vol. 11, No. 1, S. 15-30. Paulson Gjerde, K.A.; Slotnick, S.A.; Sobel, M.J. (2002): New Product Innovation with Multiple Features and Technology Constraints, in: Management Science, Vol. 48, No. 10, S. 1268-1284. Payne, J.W.; Bettman, J.R.; Schkade, D.A. (1999): Measuring Constructed Preferences: Toward a Building Code, in: Journal of Risk and Uncertainty, Vol. 19, No. 1, S. 243-270. Pekelman, D.; Sen, S. (1976): Stochastic Weights in Multiattribute Decision Making, in: Advances in Consumer Research, Vol. 3, No. 1, S. 81-87. Perrey, J. (1996): Erhebungsdesign-Effekte bei der Conjoint-Analyse, in: Marketing ZFP, 18. Jg., Nr. 2, S. 105-117. 492

Perrey, J. (1998): Nutzenorientierte Marktsegmentierung - Ein integrativer Ansatz zum Zielgruppenmarketing im Verkehrsdienstleistungsbereich, Wiesbaden. Pessemier, E.; Burger, P.; Teach, R.; Tigert, D. (1971): Using Laboratory Brand Preference Scales to Predict Consumer Brand Purchases, in: Management Science, Vol. 17, No. 6, S. 371-385. Pigeon, J.G.; McAllister, P.R. (1989): A Note on Partially Replicated Orthogonal Main-Effect Plans, in: Technometrics, Vol. 31, No. 2, S. 249-251. Pinnell, J. (1994): Multistage Conjoint Methods to Measure Price Sensitivity, http://www. sawtooth-software.com/download/techpap/multstge.pdf, Sawtooth Software Research Paper, Sequim. Porter, M.E. (1998): The Competitive Advantage of Nations, in: Porter, M. E. (Hrsg.), On Competition, Boston, S. 155-195. Pras, B. (1975): Issues in Identifying Determinant Attributes, in: Der Markt, 14. Jg., Nr. 55, S. 72-77. Pras, B.; Summers, J. (1975): A Comparison of Linear and Nonlinear Evaluation Process Models, in: Journal of Marketing Research (JMR), Vol. 12, No. 3, S. 276-281. Pullman, M.E.; Dodson, K.J.; Moore, W.L. (1999): A Comparison of Conjoint Methods When There Are Many Attributes, in: Marketing Letters, Vol. 7, No. 3, S. 125-138. Pöyhönen, M.; Hämäläinen, R.P. (1997): On the Convergence of Multiattribute Weighting Methods, http://www.sal.hut.fi/Publications/pdf-files/rpoy97a.pdf, Working Paper Helsinki University of Technology, S. 1-16. Quack, H. (1980): Die Einstellungsrelevanz von Produktmerkmalen: Multidimensionale Messung und Bedeutung für die Wirkung von Werbebotschaften, Frankfurt a.M. Rao, V.R. (2004): Comments on Conjoint Analysis with Partial Profiles, in: Journal of Marketing Research (JMR), Vol. 41, No. 4, S. 388-389. Ratneshwar, S.; Shocker, A.D.; Stewart, D.W. (1987): Toward Understanding the Attraction Effect: The Implications of Product Stimulus Meaningfulness and Familiarity, in: Journal of Consumer Research, Vol. 13, No. 4, S. 520-533. Reibstein, D.; Bateson, J.E.; Boulding, W. (1988): Conjoint Analysis Reliability: Empirical Findings, in: Marketing Science, Vol. 7, No. 3, S. 271-286.

493

Reiners, W. (1996): Multiattributive Präferenzstrukturmodellierung durch die ConjointAnalyse: Diskussion der Verfahrensmöglichkeiten und Optimierung von Paarvergleichsaufgaben bei der adaptiven Conjoint-Analyse, Münster. Reynolds, T.J.; Gutman, J. (1988): Laddering Theory, Method, Analysis, and Interpretation, in: Journal of Advertising Research, Vol. 28, No. 1, S. 11-31. Rink, D.R. (1987): An Improved Preference Data Collection Method: Balanced Incomplete Block Designs, in: Journal of the Academy of Marketing Science, Vol. 15, No. 1, S. 54-61. Rosenbaum, P.R. (1999): Blocking in Compound Dispersion Experiments, in: Technometrics, Vol. 41, No. 2, S. 125-134. Rosko, M.; DeVita, M.; McKenna, W.F.; Walker, L.R. (1985): Strategic Marketing Applications of Conjoint Analysis: An HMO Perspective, in: Journal of Health Care Marketing, Vol. 5, No. 4, S. 27-38. Ross, W.T.J.; Creyer, E.H. (1993): Interpreting Interactions: Raw Means or Residual Means?, in: Journal of Consumer Research, Vol. 20, No. 2, S. 330-338. Rubin, D.B. (2004): Design and Modeling in Conjoint Analysis with Partial Profiles, in: Journal of Marketing Research (JMR), Vol. 41, No. 4, S. 390-391. SPSS (2001a): The SPSS TwoStep Cluster Component - A scalable Component enabling more efficient Customer Segmentation, SPSS, White Paper Series, Chicago. SPSS (2001b): TwoStep Cluster Analysis, http://www1.uni-hamburg.de/RRZ/Software/ SPSS/Algo rith.120/twostep_cluster.pdf. SPSS (2002): SPSS TwoStep Cluster Component, http://www.spss.com/spssetd/files/ twosteptech.pdf. SPSS (2004): SPSS 13.0 Base Benutzerhandbuch, Chicago. Saaty, T.L. (1980): The Analytic Hierarchy Process, New York. Saaty, T.L. (1990): An Exposition of the AHP in reply to the Paper ''Remarks on the Analytic Hierarchy Process'', in: Management Science, Vol. 36, No. 3, S. 259-268. Sachs, L. (2004): Angewandte Statistik - Anwendung statistischer Methoden, 11. Auflage, Berlin. Salcher, E.F. (1995): Psychologische Marktforschung, 2. Auflage, Berlin.

494

Salo, A.A.; Hämäläinen, R.P. (1997): On the Measurement of Preferences in the Analytic Hierarchy Process, in: Journal of Multi-Criteria Decision Analysis, Vol. 6, No. 6, S. 309-319. Sandor, Z.; Wedel, M. (2002): Profile Construction in Experimental Choice Designs for Mixed Logit Models, in: Marketing Science, Vol. 21, No. 4, S. 455-475. Sattler, H. (1991): Herkunfts- und Gütezeichen im Kaufentscheidungsprozeß, Stuttgart. Sattler, H. (1994): Die Validität von Produkttests - Ein empirischer Vergleich zwischen hypothetischer und realer Produktpräsentation, in: Marketing ZFP, 16. Jg., Nr. 1, S. 31-41. Sattler, H. (2001): Markenpolitik, Stuttgart. Sattler, H.; Gedenk, K. (2005): Range Effects in Measuring Attribute Importance, Arbeitspapier Universität Hamburg, Nr. 20, April. Sattler, H.; Gedenk, K.; Hensel-Börner, S. (2001): Bandbreiten-Effekte bei multiattributiven Entscheidungen: Ein empirischer Vergleich von Verfahren zur Bestimmung von Eigenschaftsgewichten, Arbeitspapier Universität Hamburg, März. Sattler, H.; Gedenk, K.; Hensel-Börner, S. (2002a): Bandbreiten-Effekte bei multiattributiven Entscheidungen: Ein empirischer Vergleich von Verfahren zur Bestimmung von Eigenschaftsgewichten, Arbeitspapier Universität Hamburg, Februar, http://www.henrik sattler.de/publikationen /HS_KG_SHB_ Bandbreiten_Effekte.pdf. Sattler, H.; Gedenk, K.; Hensel-Börner, S. (2002b): Bandbreiten-Effekte bei multiattributiven Entscheidungen: Ein empirischer Vergleich von Verfahren zur Bestimmung von Eigenschaftsgewichten, in: Zeitschrift für Betriebswirtschaft (ZfB), 72. Jg., Nr. 9, S. 953-977. Sattler, H.; Hartmann, A.; Kröger, S. (2003): Number of Tasks in Choice-Based Conjoint Analysis, Research Papers on Marketing and Retailing University of Hamburg, Universität Hamburg, Nr. 13, http://www.henriksattler.de/publikationen/HS_AH_SK_ Choicetasks.pdf. Sattler, H.; Hensel-Börner, S. (2000): A Comparison of Conjoint Measurement with SelfExplicated Approaches, in: Gustafsson, A.; Herrman, A.; Huber F. (Hrsg.), Conjoint Measurement: Methods and Applications, Berlin, S. 121-133. Sattler, H.; Hensel-Börner, S.; Krüger, B. (2001): Die Abhängigkeit der Validität von Conjoint-Studien von demographischen Probanden-Charakteristika: Neue empirische Befunde, in: Zeitschrift für Betriebswirtschaft (ZfB), 71. Jg, Nr. 7, S. 771-787. 495

Sattler, H.; Rao, V.R. (1997): Die Validität eines Ansatzes zur Separierung der Allokationsund Informationsfunktion des Preises, in: Zeitschrift für Betriebswirtschaft (ZfB), 67. Jg., Nr. 12, S. 1285-1307. Sattler, H.; Schrader, S. (1995): Innovationsmarketing, in: Schirm, K. (Hrsg.), Die Glaubwürdigkeit von Produkt-Vorankündigungen, Wiesbaden, S. 1-49. Satzinger, M.; Helm, R. (2000): Qualitätsmanagement im kundenorientierten Innovationsprozess, in: Helm, R.; Pasch, H. (Hrsg.), Kundenorientierung durch Qualitätsmanagement - Perspektiven, Konzepte und Praxisbeispiele, Frankfurt a.M. Sawalsky, R. (1995): Management und Controlling der Neuproduktentstehung: Gestaltungsansatz, Ziele und Maßnahmen, Wiesbaden. Sawtooth Software (1999): The CBC System for Choice-Based Conjoint Analysis, http://www.sawtooth-software.com/download/techpap/cbctech.pdf, Sawtooth Software Research Paper, Sequim. Sawtooth Software (2000): CBC Hierarchical Bayes Analysis Technical Paper, http://www. sawtooth-software.com/download/techpap/hbtech.pdf, Sawtooth Software Research Paper, Sequim. Sawtooth Software (2001): Choice-based Conjoint (CBC) Technical Paper, http://www.sawtooth-software.com/download/techpap/cbctech.pdf, Sawtooth Software Research Paper, Sequim. Sawtooth Software (2002): ACA 5.0 Technical Paper, http://www.sawtoothsoftware.com/ download/techpap/acatech.pdf, Sawtooth Software Research Paper, Sequim. Sawtooth Software (2003): ACA/Hierarchical Bayes v2.0 - Technical Paper, http://www.sawtooth-software.com/download/techpap/acahbtec.pdf, Sawtooth Software Research Paper, Sequim. Sawtooth Software (2004): The CBC Latent-Class Technical Paper (Version 3), http://www. sawtooth-software.com/download/techpap/lctech.pdf, Sawtooth Software Research Paper, Sequim. Sawtooth Software (2005a): The CBC Advanced Design Module - Technical Paper, http://www.sawtoothsoftware.com/download/techpap/admtech.pdf, Sawtooth Software Research Paper, Sequim.

496

Sawtooth Software (2005b): The CBC/HB System for Hierarchical Bayes Estimation Version 4.0 Technical Paper, http://www.sawtoothsoftware.com/download/techpap/hbtech.pdf, Sawtooth Software Research Paper, Sequim. Schaefer, B.A.; Bavelas, J.; Bavelas, A. (1980): Using Echo Technique to Construct StudentGenerated Faculty Evaluation Questionnaires, in: Teaching of Psychology, Vol. 7, No. 2, S. 83-86. Scheer, J.W.; Catina, A. (1993): Psychologie der Persönlichen Konstrukte und Repertory Grid-Technik, in: Scheer, J. W.; Catina, A. (Hrsg.), Einführung in die Repertory GridTechnik, Bern, S. 8-10. Scheer, J.W. (1996): A short Introduction to Personal Construct Psychology, in: Scheer, J. W.; Catina, A. (Hrsg.), Empirical Constructivism in Europe: the Personal Construct Approach, Gießen, S. 13-17. Schlicksupp, H. (1992): Innovation, Kreativität und Ideenfindung, 4. Auflage, Würzburg. Schmidt, M. (1990): Conjoint Analysis: How Sensitive are Parameter Estimates with Regard to Syntactical Variations in the Wording of Attribute Levels, in: American Marketing Association (Hrsg.), American Marketing Association Educators Proceedings, Washington, S. 270-275. Schmidt, R.; Steffenhagen, H. (2000): Quality Function Deployment, in: Albers, S.; Herrmann, A. (Hrsg.), Handbuch Produktmanagement, 1. Auflage, Wiesbaden, S. 643-659. Schmidt-Gallas, D. (1998): Nachfragerorientierte Produktgestaltung auf Investitionsgütermärkten, Wiesbaden. Schneider, D. (2005): Replik auf die Fallstudie ''Target Costing auf Basis der ConjointAnalyse'' von Jonen und Lingnau, in: Wirtschaftswissenschaftliches Studium (WiSt), 34. Jg., Nr. 12, S. 717-719. Schoemaker, P.J.; Waid, C.C. (1982): An Experimental Comparison of different Approaches to determining Weights in additive Utility Models, in: Management Science, Vol. 28, No. 2, S. 182-196. Scholl, A.; Manthey, L.; Helm, R.; Steiner, M. (2005): Solving Multiattribute Design Problems with Analytic Hierarchy Process and Conjoint Analysis: An Empirical Comparison, in: European Journal of Operational Research, Vol. 164, No. 3, S. 760-777. Schoner, B.; Wedley, W.C. (1989): Ambiguous Criteria Weights in AHP: Consequences and Solutions, in: Decision Sciences, Vol. 20, No. 3, S. 462-475. 497

Schub von Bossiazky, G. (1992): Psychologische Marketingforschung: Qualitative Methoden und ihre Anwendung in der Markt-, Produkt- und Kommunikationsforschung, München. Schubert, B. (1991): Entwicklung von Konzepten für Produktinnovationen mittels Conjointanalyse, Stuttgart. Schweikl, H. (1985): Computergestützte Präferenzanalyse mit individuell wichtigen Produktmerkmalen, Berlin. Scott, J.E.; Keiser, S.K. (1984): Forecasting Acceptance of New Industrial Products with Judgment Modeling, in: Journal of Marketing, Vol. 48, No. 2, S. 54-67. Segal, M.N. (1982): Reliability of Conjoint Analysis: Contrasting Data Collection Procedures, in: Journal of Marketing Research (JMR), Vol. 19, No. 1, S. 139-143. Sheluga, D.A.; Jaccard, J.; Jacoby, J. (1979): Preference, Search, and Choice: An Integrative Approach, in: Journal of Consumer Research, Vol. 6, No. 2, S. 166-176. Shocker, A.D.; Srinivasan, V.S. (1974): A Consumer-Based Methodology for the Identification of New Product Ideas, in: Management Science, Vol. 20, No. 6, S. 921-937. Shocker, A.D.; Srinivasan, V.S. (1979a): Multiattribute Approaches for Product Concept Evaluation and Generation : A Critical Review, in: Journal of Marketing Research (JMR), Vol. 16, No. 2, S. 159-180. Shocker, A.D.; Srinivasan, V.S. (1979b): Multiattribute Approaches for Product Concept Evaluation and Generation: A Critical Review, in: Shocker, A. D. (Hrsg.), Analytic Approaches to Product and Marketing Planning, Cambridge, S. 3-38. Shocker, A.D.; Zaltman, G. (1977): Validity Importance in Consumer Research: Some pragmatic Issues, in: Advances in Consumer Research, Vol. 4, No. 1, S. 405-408. Simon, H. (1996): Die heimlichen Gewinner: die Erfolgsstrategien unbekannter Weltmarktführer, 2. Auflage, Frankfurt a.M. Simonson, I.; Tversky, A. (1992): Choice in Context: Tradeoff Contrast and Extremeness Aversion, in: Journal of Marketing Research (JMR), Vol. 29, No. 3, S. 281-295. Skiera, B.; Gensler, S. (2002a): Berechnung von Nutzenfunktionen und Marktsimulation mit Hilfe der Conjoint-Analyse Teil 1, in: Wirtschaftswissenschaftliches Studium (WiSt), 31. Jg., Nr. 4, S. 200-205.

498

Skiera, B.; Gensler, S. (2002b): Berechnung von Nutzenfunktionen und Marktsimulation mit Hilfe der Conjoint-Analyse Teil 2, in: Wirtschaftswissenschaftliches Studium (WiSt), 31. Jg., Nr. 5, S. 258-262. Skim Software (2003): Revitalise your Portfolio with Soap - Understanding Consumers Needs, in: Skim Analytical FMCG Newsletter, S. 1-4. Smith, W.R. (1956): Product Differentiation and Market Segmentation as Alternative Marketing Strategies, in: Journal of Marketing, Vol. 21, No. 1, S. 3-8. Soni, P.K.; Lilien, G.L.; Wilson, D.T. (1993): Industrial Innovation and Firm Performance: A Re-Conceptualization and Exploratory Structural Equation Analysis, in: International Journal of Research in Marketing, Vol. 10, No. 4, S. 365-380. Sproles, G.B.; Kendall, E.L. (1986): A Methodology for Profiling Consumers' DecisionMaking-Styles, in: Journal of Consumer Affairs, Vol. 20, No. 2, S. 267-279. Srinivasan, V.S. (1988): A Conjunctive-Compensatory Approach to the Self-explication of Multiattributed Preferences, in: Decision Sciences, Vol. 19, No. 2, S. 295-305. Srinivasan, V.S.; de MaCarty, P. (1998): An Alternative Approach to the Predictive Validation of Conjoint Models, Stanford University Research Paper, No. 1483, March. Srinivasan, V.; de MaCarty, P. (1999): Predictive Validation of Multiattribute Choice Models, in: Marketing Research, Vol. 11, No. 4, S. 28-34. Srinivasan, V.S.; Park, C.S. (1997): Surprising Robustness of the Self-Explicated Approach to Customer Preference Structure Measurement, in: Journal of Marketing Research (JMR), Vol. 34, No. 2, S. 286-291. Srinivasan, V.S.; Shocker, A.D. (1973): Estimating the Weights for Multiple Attributes in a Composite Criterion using Pairwise Judgments, in: Psychometrika, Vol. 38, No. 4, S. 473-493. Stallmeier, C. (1993): Die Bedeutung der Datenerhebungsmethode und des Untersuchungsdesigns für die Ergebnisstabilität der Conjoint-Analyse, Regensburg. Steckel, J.H.; DeSarbo, W.S.; Mahajan, V. (1991): On the Creation of Acceptable Conjoint Analysis Experimental Designs, in: Decision Sciences, Vol. 22, No. 2, S. 435-442. Steenkamp, J.E.; Wittink, D.R. (1994): The Metric Quality of Full-Profile Judgements and the Number-of-Attribute-Levels Effect in Conjoint Analysis, in: International Journal of Research in Marketing, Vol. 11, No. 3, S. 275-286.

499

Steffenhagen, H. (2000): Wirkungen der Werbung: Konzepte, Erklärungen, Befunde, 2. Auflage, Aachen. Strebinger, A.; Hoffmann, S.; Schweiger, G.; Otter, T. (2000): Zur Realitätsnähe der Conjointanalyse - Der Effekt von Präsentationsformat, Involvement und Hemisphärizität auf die subjektive Beurteilung der Aufgabe durch die Auskunftspersonen und die Vorhersagevalidität, in: Marketing ZFP, 22. Jg., Nr. 1, S. 55-74. Swoboda, B. (2000): Messung von Einkaufsstättenpräferenzen auf der Basis der ConjointAnalyse, in: Die Betriebswirtschaft (DBW), 60. Jg., Nr. 2, S. 149-166. Tashchian, A.; Tashchian, R.; Slama, M.E. (1982): The Impact of Individual Differences on the Validity of Conjoint Analysis, in: Advances in Consumer Research, Vol. 9, No. 1, S. 363-366. Teichert, T. (1994): Zur Validität der in Conjoint-Analysen ermittelten Nutzenwerte, in: Schmalenbachs Zeitschrift für betriebswirtschaftliche Forschung (zfbf), 46. Jg., Nr. 7/8, S. 610-629. Teichert, T. (1998): Schätzgenauigkeit von Conjoint-Analysen, in: Zeitschrift für Betriebswirtschaft (ZfB), 68. Jg., Nr. 11, S. 1245-1266. Teichert, T. (2000a): Conjoint-Analyse, in: Hermann, A.; Homburg, C. (Hrsg.), Marktforschung - Methoden, Anwendungen, Praxisbeispiele, 2. Auflage, Wiesbaden, S. 471511. Teichert, T. (2000b): Auswirkungen von Verfahrensalternativen bei der Erhebung von Präferenzurteilen, in: Marketing ZFP, 22. Jg., Nr. 2, S. 145-159. Teichert, T. (2000c): Das Latent-Class Verfahren zur Segmentierung von wahlbasierten Conjoint-Daten, in: Marketing ZFP, 22. Jg., Nr. 3, S. 227-239. Thaden, C.v. (2002): Conjoint-Analyse mit vielen Merkmalen: Monte-Carlo-Untersuchung einer gebrückten Conjoint-Analyse, Frankfurt a.M. Tharp, M.; Marks, L. (1990): An Examination of the Effects of Attribute Order and Product Order Biases in Conjoint Analysis, in: Advances in Consumer Research, Vol. 17, No. 1, S. 562-570. Theuerkauf, I. (1989): Kundennutzenmessung mit Conjoint, in: Zeitschrift für Betriebswirtschaft (ZfB), 59. Jg., Nr. 11, S. 1179-1192. Tomczak, T. (1989): Situative Marktbearbeitungsstrategien - Grundsatzstrategien für "Dogs", Berlin. 500

Tomkovick, C.; Miller, C. (2000): Perspective - Riding the Wind: Managing New Product Development in an Age of Change, in: Journal of Product Innovation Management, Vol. 17, No. 6, S. 413-423. Tomlin, L. (2002): Hidden Minds, in: Harvard Business Review, Vol. 80, No. 6, S. 26-27. Torres-Lacomba, A. (2001): Correspondence Analysis and Categorial Conjoint Measurement, Department of Economics and Business, Universität Pompeu Fabra, Working Paper No. 569. Trommsdorff, V. (1975): Die Messung von Produktimages für das Marketing: Grundlagen und Operationalisierung, Köln. Trommsdorff, V. (2003): Konsumentenverhalten, 5. Auflage, Stuttgart. Tscheulin, D.K. (1991): Ein empirischer Vergleich der Eignung von Conjoint-Analyse und "Analytic Hierarchy Process" (AHP) zur Neuproduktplanung, in: Zeitschrift für Betriebswirtschaft (ZfB), 61. Jg., Nr. 11, S. 1267-1280. Tscheulin, D.K. (1992): Optimale Produktgestaltung - Erfolgsprognose mit Analytic Hierarchy Process und Conjoint-Analyse, Wiesbaden. Tscheulin, D.K. (1996): Determinanten der Validität der Conjoint-Analyse, in: Hüttner, M.; Ahsen, A. v.; Czenskowsky, T. (Hrsg.), Marketing und Marktforschung. Entwicklungen, Erweiterungen und Schnittstellen im nationalen und internationalen Kontext Festschrift für Prof. Dr. Manfred Hüttner, Hamburg, S. 585-598. Tscheulin, D.K. (1999): Analytic Hierarchy Process, in: Herrmann, A.; Homburg, C. (Hrsg.), Marktforschung, 1. Auflage, Wiesbaden, S. 579-606. Tscheulin, D.K.; Blaimont, C. (1993): Die Abhängigkeit der Prognosegüte von ConjointStudien von demographischen Probanden-Charakteristika, in: Zeitschrift für Betriebswirtschaft (ZfB), 63. Jg., Nr. 8, S. 839-847. Tscheulin, D.K.; Jacques, J. (1996): Goal Programming Approaches for Priorities in Saaty's Analytic Hierachy Process, in: Belgian Journal of Operational Research, Statistics and Computer Science, Vol. 36, No. 4, S. 189-203. Tumbusch, J.J. (1991): Validation of Adaptive Conjoint Analysis (ACA) versus Standard Concept Testing, http://www.sawtoothsoftware.com/download/techpap/validaca.pdf, Sawtooth Software Research Paper, Sequim. Uebele, H. (1988): Zur Praxis der Kreativitätstechniken - Anwendungsverfahren bei der Produktinnovation, in: Die Betriebswirtschaft (DBW), 48. Jg., Nr. 6, S. 777-785. 501

Urban, G.L.; Katz, G.; Hatch, T.; Silk, A. (1983): Assessor Pre-Test-Market Evaluation System, in: Interfaces: an International Journal of the Institute for Operations Research, Vol. 13, No. 6, S. 38-59. Urban, G.L.; Weinberg, B.; Hauser, J. (1996): Premarket Forecasting of Really-New Products, in: Journal of Marketing, Vol. 60, No. 1, S. 47-60. Urban, G.L.; Hauser, J.R. (1993): Design and Marketing of New Products, 2. Auflage, Upper Saddle River. Verlegh, P.W.; Schifferstein, H.N.; Wittink, D.R. (2001): Range and Number-of-Levels Effects in Derived and Stated Measures of Attribute Importance, in: Heijman, W. (Hrsg.), Mansholt Graduate School of Social Science, Working Paper Nr. 3, Wageningen. Verlegh, P.W.; Schifferstein, H.N.; Wittink, D.R. (2002): Range and Number-of-Levels effects in Derived and Stated Measures of Attribute Importance, in: Marketing Letters, Vol. 13, No. 1, S. 41-52. Voeth, M. (1999): 25 Jahre conjointanalytische Forschung in Deutschland, in: Zeitschrift für Betriebswirtschaft (ZfB), 69. Jg., Ergänzungsheft 2, S. 153-176. Voeth, M. (2000): Nutzenmessung in der Kaufverhaltensforschung: Die Hierarchische Individualisierte Limit Conjoint-Analyse (HILCA), Wiesbaden. Voeth, M.; Hahn, C. (1998): Limit Conjoint-Analyse, in: Marketing ZFP, 20. Jg., Nr. 2, S. 119-132. Vriens, M. (1995): Conjoint Analysis in Marketing: Developments in Stimulus Representation and Segmentation Methods, Capelle a/d IJssel. Völckner, F. (2005): Determinanten der Informationsfunktion des Preises: Eine empirische Analyse, Henrik Sattler (Hrsg.), Research Paper on Marketing and Retailing, University of Hamburg, Nr. 21, http://www.henriksattler.de/publikationen/ FV_Informations funktion.pdf. Völckner, F.; Sattler, H. (2005a): Separating Negative and Positive Effects of Price with Choice-Based Conjoint-Analyses, in: Marketing: Journal of Research and Management, Vol. 1, No. 1, S. 5-13.

502

Völckner, F.; Sattler, H. (2005b): Separating Negative and Positive Effects of Price with Choice-Based Conjoint-Analyses, Henrik Sattler (Hrsg.), Research Paper on Marketing and Retailing, University of Hamburg, Nr. 19, http://www.henriksattler.de/publi kationen/FV_HS_CBC.pdf. Völckner, F. (2006): Determinanten der Informationsfunktion des Preises: Eine empirische Analyse, in: Zeitschrift für Betriebswirtschaft (ZfB), 76. Jg., Nr. 5, S. 473-497. Weiber, R.; Rosendahl, T. (1997): Anwendungsprobleme der Conjoint-Analyse - Die Eignung conjointanalytischer Untersuchungsansätze zur Abbildung realer Entscheidungsprozesse, in: Marketing ZFP, 19. Jg., Nr. 2, S. 107-118. Weisenfeld-Schenk, U. (1989): Die Einflüsse von Verfahrensvariationen und der Art des Kaufentscheidungsprozesses auf die Reliabilität der Ergebnisse bei der ConjointAnalyse, Berlin. Westwood, D.; Lunn, T.; Beazley, D. (1974): The Trade-off Model and its Extensions, in: Journal of the Market Research Society, Vol. 16, No. 3, S. 227-241. Wiley, J.B.; MacLachlan, D.L.; Moinpour, R. (1977): Comparison of Stated and Inferred Parameter Values in Additive Models: An Illustration of a Paradigm, in: Advances in Consumer Research, Vol. 4, No. 1, S. 98-105. Wilkie, W.L.; Pessemier, E.A. (1973): Issues in Marketing's Use of Multi-Attribute Attitude Models, in: Journal of Marketing Research (JMR), Vol. 10, No. 4, S. 428-441. Wind, Y. (1978): Issues and Advances in Segmentation Research, in: Journal of Marketing Research (JMR), Vol. 15, No. 3, S. 317-337. Wind, Y.; Saaty, T.L. (1980): Marketing Applications of the Analytic Hierarchy Process, in: Management Science, Vol. 26, No. 7, S. 641-658. Winterfeldt, D.v.; Edwards, W. (1986): Decision Analysis and Behavioral Research, Cambridge. Wittink, D.R. (1991): Attribute Level Effects in Conjoint Results: The Problem and possible Solutions, in: Neal, W.D. (Hrsg.), First Annual Advanced Research Techniques Forum, June 24-27, 1990, Beaver Creek, Colorado, Chicago, S. 43-53. Wittink, D.R.; Cattin, P. (1981): Alternative Estimation Methods for Conjoint Analysis: A Montè Carlo Study, in: Journal of Marketing Research (JMR), Vol. 18, No. 1, S. 101106.

503

Wittink, D.R.; Cattin, P. (1989): Commercial Use of Conjoint Analysis: An Update, in: Journal of Marketing, Vol. 53, No. 3, S. 91-96. Wittink, D.R.; Huber, J.; Zandan, P.; Johnson, R.M. (1992): The Number of Levels Effect in Conjoint: Where does it come from and can it be Eliminated?, http://www.sawtooth software.com/download/techpap/noleveff.pdf, Sawtooth Software Research Paper, Sequim. Wittink, D.R.; Krishnamurthi, L.; Nutter, J.B. (1982): Comparing Derived Importance Weights Across Attributes, in: Journal of Consumer Research, Vol. 8, No. 4, S. 471474. Wittink, D.R.; Krishnamurthi, L.; Reibstein, D.J. (1989): The Effect of Differences in the Number of Attribute Levels on Conjoint Results, in: Marketing Letters, Vol. 1, No. 2, S. 113-123. Wittink, D.R.; McLauchlan, W.G.; Seetharaman, P. (1999): Solving the Number-of-AttributeLevels Problem in Conjoint Analysis, in: Sawtooth Software (Hrsg.), Sawtooth Software Proceedings, S. 227-240, Seattle. Wittink, D.R.; Reibstein, D.J.; Boulding, W.; Bateson, J.E.; Walsh, J.W. (1989): Conjoint Reliability Measures, in: Marketing Science, Vol. 8, No. 4, S. 371-374. Wittink, D.R.; Seetharaman, P. (1999): A Comparison of Alternative Solutions to the Number-of-Levels-Effect, in: Metegrano M. (Hrsg.), Proceedings of the Sawtooth Software Conference February 1999, Seattle, S. 269-281. Wittink, D.R.; Vriens, M.; Burhenne, W. (1992): Commercial use of Conjoint Analysis in Europe: results and critical reflections, http://www.sawtoothsoftware.com/download/ techpap/caeurope.pdf, Sawtooth Software Research Paper, Sequim. Wittink, D.R.; Vriens, M.; Burhenne, W. (1994): Commercial use of Conjoint Analysis in Europe: Results and Critical Reflections, in: International Journal of Research in Marketing, Vol. 11, No. 1, S. 41-52. Womelsdorf, T.; Anton-Erxleben, K.; Pieper, F.; Treue, S. (2006): Dynamic shifts of visual receptive fields in cortical area MT by spatial attention, in: Nature Neuroscience – Advance Online Publication, http://www.nature.com/neuro/journal/vaop/ncurrent/pdf/ nn1748.pdf. Yamagishi, T.; Hill, C.T. (1981): Adding versus Averaging Models Revisited: A Test of a Path-Analytic Integration Model, in: Journal of Personality and Social Psychology, Vol. 41, No. 1, S. 13-25. 504

Young, S.; Feigin, B. (1975): Using the Benefit Chain for Improved Strategy Formulation, in: Journal of Marketing, Vol. 39, No. 3, S. 72-74. Zahedi, F. (1986): The Analytic Hierarchy Process - A survey of the Method and its Application, in: Interfaces: an International Journal of the Institute for Operations Research, Vol. 16, No. 4, S. 96-108. Zelewski, S.; Peters, M.L. (2003): Lösung multikriterieller Entscheidungsprobleme mit Hilfe des Analytic Hierarchy Process, in: Das Wirtschaftsstudium (WISU), 32. Jg., Nr. 10, S. 1210-1218. Zicha, M.A. (1991): The Black Box of Conjoint Analysis: An Enlarged View, in: Neal, W. (Hrsg.), First Annual Advanced Research Techniques Forum, Chicago, S. 33-42.

505