Quantitative Marketingforschung in Deutschland: Festschrift für Klaus Peter Kaas zum 65. Geburtstag [1 ed.] 9783428519736, 9783428119738

Die vorliegende Festschrift ist Klaus Peter Kaas gewidmet. An diesem Werk anlässlich seines 65. Geburtstags haben neunun

130 109 3MB

German Pages 319 Year 2005

Report DMCA / Copyright

DOWNLOAD PDF FILE

Recommend Papers

Quantitative Marketingforschung in Deutschland: Festschrift für Klaus Peter Kaas zum 65. Geburtstag [1 ed.]
 9783428519736, 9783428119738

  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

Entrepreneurship, Marketing, Innovation Band 1

Quantitative Marketingforschung in Deutschland Festschrift für Klaus Peter Kaas zum 65. Geburtstag

Herausgegeben von Thorsten Posselt und Christian Schade

asdfghjk Duncker & Humblot · Berlin

THORSTEN POSSELT / CHRISTIAN SCHADE (Hrsg.)

Quantitative Marketingforschung in Deutschland

Entrepreneurship, Marketing, Innovation Herausgegeben von Prof. Dr. Christian Schade

Band 1

Quantitative Marketingforschung in Deutschland Festschrift für Klaus Peter Kaas zum 65. Geburtstag

Herausgegeben von

Thorsten Posselt und Christian Schade

asdfghjk Duncker & Humblot · Berlin

Bibliografische Information Der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar.

Alle Rechte, auch die des auszugsweisen Nachdrucks, der fotomechanischen Wiedergabe und der Übersetzung, für sämtliche Beiträge vorbehalten # 2005 Duncker & Humblot GmbH, Berlin Fremddatenübernahme und Druck: Berliner Buchdruckerei Union GmbH, Berlin Printed in Germany ISSN 1861-3144 ISBN 3-428-11973-8 Gedruckt auf alterungsbeständigem (säurefreiem) Papier ∞ entsprechend ISO 9706 *

Internet: http://www.duncker-humblot.de

Vorwort Dieses Buch ist eine Festschrift zum 65. Geburtstag unseres akademischen Lehrers, Professor Dr. Klaus Peter Kaas. Man hört zwar des Öfteren, dass Festschriften langsam aus der Mode kämen. Trotzdem haben wir uns dem Wagnis unterzogen, ein Buch mit hohem wissenschaftlichen Anspruch und entsprechender wissenschaftlicher Aktualität herauszugeben. Wir denken, dass uns dies gelungen ist, und der Grund dafür ist der Jubilar selbst. Die Tatsache, dass sich in dieser Festschrift äußerst interessante Beiträge eines großen Teils der wichtigsten und hervorragendsten Marketingwissenschaftler im deutschsprachigen Raum finden, lässt sich nur durch die große Anerkennung und Beliebtheit erklären, die unserem Lehrer, Professor Dr. Klaus Peter Kaas, unter deutschen Marketingforschern zuteil wird. Das Buch gibt in der vorliegenden Form einen Überblick über die quantitative Marketingforschung in Deutschland. Natürlich erheben wir keinen Anspruch auf Vollständigkeit, weder was die beteiligten Wissenschaftler noch was die in dem Buch behandelten Themen angeht. Die Autoren in diesem Buch haben wir nach zwei Kriterien ausgesucht, erstens der Nähe zu Klaus Kaas und zweitens der Visibility im Bereich „Quantitatives Marketing“. Unter Quantitativem Marketing verstehen wir dabei alle marketingbezogenen Arbeiten, die von Methoden der ökonomischen Theorie, der Ökonometrie oder der experimentellen Forschung Gebrauch machen. Warum ein Buch zum Quantitativen Marketing? Für diejenigen, die das Buch in der Hand haben (und daher vermutlich am Quantitativen Marketing interessiert sind), ist die Antwort sicher klar: Ohne Quantifizierung in Form von Theorie, Ökonometrie oder Experimenten gerät das Marketing rasch in den Verdacht, unpräzise zu sein und den Charakter einer gewissen Beliebigkeit anzunehmen. In einem Zeitalter zunehmender Datenmassen und Verhaltensunsicherheiten scheint es einfach prognostizierbar zu sein, dass die drei genannten Methoden an Bedeutung zunehmen werden. Deutlich sichtbar ist das vor allem für die Ökonometrie, die in vielen Untersuchungen in internationalen Marketing Journals zu dominieren scheint, aber auch für Untersuchungen auf Basis von Experimenten, die sich verstärkt in Marketing Journals finden. Die zunehmende Komplexität vieler Zusammenhänge im Marketingbereich erfordert jedoch auch eine klare Strukturierung, bei der die ökonomische Theorie sehr hilfreich sein kann. Wie passt ein Buch zum Quantitativen Marketing zu unserem Lehrer Professor Dr. Klaus Peter Kaas? Das Besondere am Wissenschaftler Kaas ist, dass er sich nicht so eindeutig auf wenige Fragestellungen, auf einen Bereich innerhalb des Marketings oder auf eine Methode festlegen lässt. Schaut man sich die wissen-

6

Vorwort

schaftliche Laufbahn von Klaus Kaas an, dann stellt man vor allem fest, dass sie durch eine Vielfalt gekennzeichnet ist, die man über die Zeit beinahe als Phasenmodell verstehen könnte: Zunächst der wissenschaftlichen Herkunft entsprechend eine verhaltenswissenschaftliche Phase, dann die Phase der Institutionenökonomik und schließlich eine Hinwendung zu den Behavioral Economics bzw. zur experimentellen Forschung (und damit im Grunde zu einer Verbindung der ersten beiden Phasen). Diese Phasen lassen sich übrigens gut an den am Lehrstuhl Kaas ausgebildeten Mitarbeitern und damit auch an uns nachvollziehen. Der Grund für die Identifizierbarkeit von Forschungsphasen liegt zum einen in der Person des Jubilars: Klaus Kaas ist ein Neuerer, der an wichtigen Entwicklungen in der Marketingforschung bereits in der Frühphase mitgewirkt oder diese begründet hat. Zwei weitere Aspekte werden dabei unseres Erachtens jedoch deutlich: (1) Jeder wissenschaftliche Ansatz, jede Methode leidet mit zunehmender Anwendungsdauer an einer Verringerung der Grenzerträge der Forschung, so dass entweder massive Fortschritte innerhalb einer Theorie oder einer Methode gefunden werden oder eine Ablösung durch neuere, andere Theorien, Konzepte und Methoden stattfindet. (2) Wissenschaft, erst recht im Marketing, ist und sollte durch Pluralismus bestimmt sein. Theorien, Methoden und Konzepte werden gegeneinander gestellt und konkurrieren miteinander um die beste Erklärung, die beste Entscheidungsunterstützung und die spannendsten Managerial Implications. Wir wissen, dass Klaus Kaas neben wissenschaftlichem Tiefgang diesen Pluralismus nicht nur zulässt, sondern für seine Umgebung verkörpert und fördert. Er ermuntert seine Schüler stets, sich neue Strömungen anzusehen, deren Potential auszuloten und sich ihnen gegebenenfalls zuzuwenden. In vielen Diskussionen und Arbeitskreisen in- und außerhalb des Lehrstuhls war er stets so begeisterungsfähig für „Neues“ wie die jüngeren Wissenschaftler – eben so begeisterungsfähig für ein Problem oder eine Methode wie es gute und aufstrebende Doktoranden sind. Er hat stets „Drive“ für die Wissenschaft und lässt sich auf Gespräche und Diskussionen immer ein. Wir sind sicher – natürlich ohne ihn gefragt zu haben –, dass Klaus Kaas ein Buch zum Quantitativen Marketing gefällt. Klaus Kaas besitzt eine deutliche Tendenz zur Formalisierung, zur Quantifizierung und zur theoretischen Stringenz, die sich in allen Forschungsphasen erkennen lässt. Hinzu kommt, dass er seit einigen Jahren zu den Neuerern in der Experimentellen Ökonomik gehört. Wird Klaus Kaas 65 Jahre? Der Kalender sagt ja, wir können es selber kaum glauben. Seitdem wir ihn kennen hat er sich persönlich nicht verändert. Er ist fit, energiegeladen und jugendlich wie immer. Trotz seiner starken Konzentration auf seine Arbeit haben wir stets das Gefühl, dass er es versteht, sein Leben in Balance zu führen: Gelegentlich ist eben auch Zeit für einen Rotwein und ein gutes Essen. Wir wünschen ihm und sind gleichzeitig gewiss, dass er im leider nahenden Leben „nach der Universität“, welches sicherlich nicht ohne Bezug zur Wissenschaft sein wird, weiter so energiegeladen, jugendlich und gleichzeitig menschlich reagiert, wie wir ihn über viele Jahre kennen gelernt haben. Wir wünschen ihm dabei alles

Vorwort

7

erdenklich Gute und bedanken uns in herzlichster Weise für das, was er uns gegeben und was er in uns angestoßen hat! Bevor Sie nun zu lesen beginnen, wollen wir Ihnen einen kurzen Überblick über die Beiträge geben, die Sie erwarten. Wir haben die Festschrift in drei Hauptteile gegliedert, die, konsistent mit der Orientierung auf die Themenstellung „Quantitatives Marketing“, anhand der jeweils angewendeten Hauptmethode eingeteilt sind. Die Beiträge sind innerhalb dieser Gliederungspunkte jeweils alphabetisch nach dem ersten Autor geordnet. Laborstudien In dem Beitrag von Karen Gedenk und Uta Sabine Mahler wird die Wirkung von Multi-Item-Promotions auf die Markenwahl und die Kaufmenge untersucht. Bei Multi-Item-Promotions erhalten Konsumenten einen Preisnachlass, wenn sie mehrere Einheiten eines Produktes kaufen. Im Mittelpunkt des Beitrags stehen zwei Typen von Multi-Item-Promotions: Multipacks (,Drei zum Preis von x‘) und BOGOs (,Buy one – get one free‘ bzw. ,Kaufen Sie zwei und bekommen Sie eins umsonst‘). In einem Befragungsexperiment werden diese Multi-Item-Promotions miteinander sowie mit Sonderangeboten verglichen. Die Autoren gehen der Frage nach, ob hinsichtlich der Markenwahl, der gekauften Menge und dem Gesamtabsatz Mengen- und Framing-Effekte dieser Preis-Promotions beobachtet werden können. Der Mengen-Effekt bezieht sich darauf, dass bei Multi-Item-Promotions eine Mindestkaufmenge im Gegensatz zu Sonderangeboten erforderlich ist. Der Framing-Effekt wird wiederum aus der unterschiedlichen Darstellung der MultiItem-Promotions abgeleitet. So gehen Gedenk / Mahler davon aus, dass ein Preisnachlass als reduzierter Verlust und ein kostenloses Extra-Produkt als Gewinn wahrgenommen wird. In dem Befragungsexperiment finden sich Hinweise sowohl für Mengen- als auch für Framing-Effekte. So können beispielsweise Multi-ItemPromotions die gekaufte Menge stärker steigern als Sonderangebote – in Abhängigkeit der Mindestkaufmenge. Weiterhin finden es Konsumenten attraktiver, ein kostenloses Extra-Produkt zu erhalten als einen Preisnachlass. Zudem zeigen sich Unterschiede in der Wirkung von Multi-Item-Promotions im Hinblick auf Konsumentencharakteristika, insbesondere bezüglich der Kaufmenge (Heavy- vs. Light-User). Andrea Gröppel-Klein, Anja Domke und Benedikt Bartmann untersuchen in einem Experiment Aktivierung und unbewusste Reaktionen von Konsumenten bei archetypischer Werbung und bei archetypischen Elementen in Filmen. In dieser Studie werden unterschiedliche Persönlichkeitstypen (Romantische Träumerinnen, Selbständige Verstandesmenschen, Frauen ohne Selbstwertgefühl) bzw. Männer und Frauen miteinander verglichen. In ihrer experimentellen Studie belegen die Autoren die Hypothese, dass märchenhafte Archetypen die Aktivierung und die bewusste Beurteilung der Konsumenten positiv beeinflussen. Darüber hinaus wird gezeigt, dass bestimmte Persönlichkeitstypen, insbesondere „Romantische Träu-

8

Vorwort

merinnen“ auf die Archetypen in der Werbung und in den Filmen besonders stark reagieren. Selbst emanzipierte weibliche „Selbständige Verstandesmenschen“ können sich jedoch dem Einfluss etwa von „Pretty Woman“ nicht entziehen. Thomas Nitschke und Henrik Sattler stellen auf Basis einer Choice-Based-Conjoint-Analyse eine Methodik zur Messung von individuellen Präferenzstrukturen und Zahlungsbereitschaften für Online-Videoangebote vor und überprüfen diese empirisch. Es zeigt sich, dass für kommerzielle Anbieter durchaus ein Markt vorhanden ist, wenn es ihnen gelingt, sich hinsichtlich bestimmter Produkteigenschaften, im untersuchten Fall betraf das besonders die Bildqualität, von kostenlosen Anbietern so genannter Tauschbörsen zu differenzieren. Martina Steul befasst sich in ihrem theoretischen Beitrag mit den wichtigsten Charakteristika von ökonomischen Experimenten. Sie erörtert Gründe für Anwendung und Schwerpunkte und diskutiert Vorteile und mögliche Grenzen dieser Methode. Darüber hinaus werden ökonomische und psychologische Experimente verglichen. Anschließend werden Anwendungsmöglichkeiten ökonomischer Experimente in der Marketingforschung dargestellt. In ihrem Beitrag zeigt Martina Steul, dass ökonomische Experimente zur Beantwortung vieler Forschungsfragen im Marketing geeignet sind. In ihrer experimentellen Studie untersuchen Peter Weinberg und Ralph Salzmann, auf welche Weise die Kombination von olfaktorischen (geruchsbezogenen) und akustischen Reizen das Einkaufserlebnis am Point of Sale beeinflusst. Im Rahmen dieser Studie werden unimodale (Einsatz nur eines Reizes) und multimodale (Einsatz mehrerer Reize gleichzeitig) Erlebnisvermittlung am Beispiel eines Reisebüros verglichen. Eines der wichtigsten Ergebnisse der Studie ist, dass die multimodale Erlebnisvermittlung zu einem höheren Gefallen und Erfüllungsdrang als die unimodale Erlebnisvermittlung führt, aber nur dann, wenn die Reize der multimodalen Erlebnisvermittlung zueinander passen, wie z. B. Duftmischung aus Kokosnuss, Vanille und exotischen Früchten und karibische Musik wie Merengue oder Reggae. Feld- und Expertenstudien Sönke Albers und Bernd Skiera stellen in ihrem Beitrag eine auf der ConjointAnalyse basierende Methode vor, mit welcher Zahlungsbereitschaftsfunktionen für kontinuierlich genutzte Dienstleistungen, wie beispielweise Strom- und Telekommunikationsdienste, ermittelt werden können. Für große Realitätsnähe wird gesorgt, indem sowohl mengen- als auch zeitbezogene Preisdifferenzierung berücksichtigt wird. Dies ermöglicht eine Prognose realen Tarifwahlverhaltens. Diese methodische Vorgehensweise wird für Mobilfunktarife empirisch getestet. Die Ergebnisse lassen darauf schließen, dass es sinnvoll ist, diese Methode weiter zu entwickeln. Franz-Rudolf Esch, Jörn Redler und Tobias Langner analysieren in ihrer Forschungsarbeit die Urteilsbildung von Konsumenten gegenüber Markenallianzen.

Vorwort

9

Im Vordergrund dieser Analyse steht das Anchoring-Phänomen. Die Ergebnisse einer empirischen Untersuchung bestätigen, dass die Beurteilung der Markenallianzen auf Basis der Wahrnehmung der einzelnen Marken gebildet wird und das Anchoring durch verschiedene Faktoren, wie beispielsweise Bekanntheit der Marke und relative Markenstärke, beeinflusst wird. Bruno Neibecker, Thomas Kohler und David Steenhard präsentieren in ihrem Beitrag eine weitere Anwendung der Conjoint-Analyse: die Ermittlung von Nutzenwerten auf Dimensionen wie Dynamik und Ästhetik / Eleganz. Die Autoren setzen in ihrer Studie verschiedene ökonometrische Methoden ein. Eine Faktoranalyse wird verwendet, um die Wahrnehmungsdimensionen des Produktdesigns festzustellen, und eine Clusteranalyse kommt zum Einsatz, um eine Segmentierung der Konsumenten vorzunehmen. Die Autoren kommen zu dem Ergebnis, dass die Conjoint-Analyse es ermöglicht, spezifische Wirkungen verschiedener Designelemente zu ermitteln. Marcel Paulssen und Susan Fournier analysieren die Heterogenität von Kunden bezüglich ihrer Bindungstendenzen in Beziehungen mit Anbietern anhand der Bindungstheorie. Im Mittelpunkt der Studie stehen Konstrukte wie Zufriedenheit, Loyalität und Vertrauen. Die Analyse wird am Beispiel der Beziehungen zwischen Kunden und ihren Automarken und Kunden und ihren Autohändlern durchgeführt. Sicherer persönlicher Bindungsstil erweist sich in dieser Studie als dominante Determinante von Zufriedenheit, Vertrauen und Loyalität bei männlichen Konsumenten. Im Gegensatz dazu erweist sich der ängstlich-ambivalente Bindungsstil als dominante Einflussgröße bei weiblichen Konsumenten. Volker Trommsdorff, Umut Asan und Tao Wang befassen sich mit dem chinesischen Markt, der in Zukunft wie kaum ein anderer an Bedeutung gewinnen wird. Dies gilt insbesondere für die Automobilindustrie, die sich beispiellosen Wachstumsraten gegenübersieht. Kein anderer Markt ist aber auch so stark umkämpft und erfordert derart weitreichende strategische Entscheidungen. In ihrem Beitrag wenden die Autoren eine wettbewerbsorientierte Szenarioplanung an, um die zukünftigen Schlüsselfaktoren in dieser Entwicklung zu identifizieren. Sie verbinden dabei Porters Fünf-Kräfte-Modell mit der Szenarioanalyse, um die so identifizierten Schlüsselfaktoren (Nachfrage, Angebot und Preis) einer Wettbewerbsanalyse zu unterziehen. In verschiedenen Szenarien spielen die Autoren die Entwicklung des chinesischen Automarktes in den kommenden acht Jahren durch und zeigen so, wie ihr Wettbewerbsscanner auch komplexe Wettbewerbssituationen umfassend abbilden und zur zukunftsanalytisch gestützten Strategieentwicklung entscheidend beitragen kann. Simulationsstudien Der Beitrag von Yasemin Boztug und Lutz Hildebrandt befasst sich mit Preisforschung und Preissetzung und ist vorrangig dem Test psychologischer Theorien der Preisbewertung gewidmet. Die Autoren stellen verschiedene psychologische

10

Vorwort

Theorien vor, die zur Erklärung der Existenz von Referenzpreisen verwendet werden bzw. Modellierungsansätze für deren Integration in Wahlmodelle liefern. Anschließend wird ein semiparametrisches Modell vorgestellt, welches unterschiedliche Referenzpreistheorien integrieren kann. Schließlich enthält der Beitrag eine Simulationsstudie und eine ausführliche Diskussion der Ergebnisse. Der Beitrag von Yulia Grishchenko und Christian Schade befasst sich mit Problemen hinsichtlich der Vorhersagekraft des Bass-Modells und möglichen Verzerrungen der Parameterschätzungen. Die Autoren führen dazu eine systematische Analyse der Schätzprobleme auf Basis von Datensimulationen durch. Aufgrund der Ergebnisse schlussfolgern die Autoren, dass das Kriterium der kleinsten Quadrate als Basis zur Schätzung des Bass-Modells ungeeignet ist. Sie diskutieren darüber hinaus, dass es erforderlich sein könnte, für Modelle vom Bass-Typ eigene Schätzmethoden zu entwickeln. In dem Beitrag von Thorsten Posselt und Dubravko Radic´ wird die Rolle von Weiterempfehlungen bei der Verbreitung von Dienstleistungen theoretisch und empirisch untersucht. Zunächst wird ein theoretisches Modell vorgestellt, in dem Weiterempfehlungen als ein Prozess modelliert werden, der von der Zahl der empfehlenden Personen, der Zahl der Empfehlungen pro Altkunde und der Konversion der Empfehlungen in Neukunden gespeist wird. Mit dem Modell lassen sich Aussagen über den Zusammenhang zwischen Preis und Prämienhöhe treffen. Auf Basis von Daten aus den drei Dienstleistungsbereichen Mobilfunkdienstleistungen, Bankdienstleistungen und Zeitungsabonnements werden diese Zusammenhänge empirisch mit einem Count-Data-Modell abgebildet. Auf Basis der daraus gewonnenen Parameter entwickeln die Autoren im Rahmen von Simulationen unter anderem Aussagen über die Zusammenhänge zwischen Kundenzufriedenheit, Kundenprämien und Weiterempfehlungen. Wir danken allen voran Yulia Grishchenko, Humboldt-Universität zu Berlin, die den größten Teil der Abwicklungs- und der technischen Arbeiten bei der Erstellung dieser Festschrift getragen hat. Ferner danken wir Dr. Dubravko Radic´, Dr. Martina Steul, beide Universität Leipzig, und Doreen Appelt, Humboldt-Universität zu Berlin, für ihre Unterstützung. Leipzig und Berlin, November 2005

Thorsten Posselt und Christian Schade

Inhaltsverzeichnis Laborstudien Karen Gedenk und Uta Sabine Mahler Die Wirkung von Multi-Item-Promotions auf Markenwahl und Kaufmenge . . . . . . . . .

15

Andrea Gröppel-Klein, Anja Domke und Benedikt Bartmann Bewußte und unbewußte Wirkungen von Archetypen in der Werbung und in Kinofilmen – Ergebnisse einer experimentellen Studie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

33

Thomas Nitschke und Henrik Sattler Präferenzenstrukturen und Zahlungsbereitschaften für Online-Medieninhalte: Eine empirische Analyse am Beispiel von Online-Videoangeboten . . . . . . . . . . . . . . . . . . . . . . .

59

Martina Steul Experimental Economics und Marketing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

81

Peter Weinberg und Ralph Salzmann Multimodale Erlebnisvermittlung am Point of Sale – eine empirische Analyse am Beispiel eines Reisebüros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

103

Feld- und Expertenstudien Sönke Albers und Bernd Skiera Einsatz einer erweiterten Form der Conjoint-Analyse zur empirischen Schätzung von Zahlungsbereitschaftsfunktionen für die mengen- und zeitbezogene Preisdifferenzierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

125

Franz-Rudolf Esch, Jörn Redler und Tobias Langner Zur „Rationalität“ der Urteilsbildung: Ankerheuristiken zur Vereinfachung der Beurteilung von Markenallianzen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

145

Bruno Neibecker, Thomas Kohler und David Steenhard Conjoint-Analyse von Automobildesign unter Berücksichtigung des hierarchischen Bayes-Verfahrens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

175

12

Inhaltsverzeichnis

Marcel Paulssen und Susan Fournier Konsumentenheterogenität im Beziehungsmarketing: Ein Bindungstheoretischer Ansatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

197

Volker Trommsdorff, Umut Asan und Tao Wang Wettbewerbsorientierte Szenarioplanung – Methodik der Zukunftsanalyse am Beispiel des chinesischen PKW-Marktes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

223

Simulationsstudien Yasemin Boztug˘ und Lutz Hildebrandt Eine Simulation zum Test psychologischer Theorien der Preisbewertung . . . . . . . . . . . .

253

Yulia Grishchenko und Christian Schade Schätzung des Bass-Modells mittels der Methode der kleinsten Quadrate: Eine Monte-Carlo-Simulationsstudie zu bekannten und unbekannten Problemen . . . . . . . . .

277

Thorsten Posselt und Dubravko Radic´ Management von Weiterempfehlungen: Eine theoretische und empirische Analyse

299

Vita Prof. Dr. rer. pol. Klaus Peter Kaas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

313

Autorenverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

315

Laborstudien

Die Wirkung von Multi-Item-Promotions auf Markenwahl und Kaufmenge Karen Gedenk und Uta Sabine Mahler

A. Problemstellung Für Hersteller und Händler von Konsumgütern sind Preis-Promotions ein wichtiges Marketing-Instrument. Die häufigste Form von Preis-Promotions sind Sonderangebote, bei denen der Preis eines Produktes während eines begrenzten Zeitraums, z. B. einer Woche, gesenkt wird. In einigen Ländern sind auch Coupons weit verbreitet, welche Konsumenten im Handel gegen einen Preisnachlass eintauschen können. Beiden Formen von Preis-Promotions ist gemeinsam, dass Konsumenten nur eine Einheit des Aktionsproduktes kaufen müssen, um in den Genuss des Preisnachlasses zu gelangen. Andere Arten von Preis-Promotions können dagegen nur beim Kauf einer größeren Menge genutzt werden. Unternehmen können z. B. statt den Preis zu senken, die Packung vergrößern (Diamond 1992; Hardesty / Bearden 2003; Ong 1999). Oder sie können Sonderpreise an den Kauf mehrerer Einheiten binden (Sinha / Smith 2000; Foubert 2004). Die letztgenannte Form von Promotions wird als Multi-Item-Promotion bezeichnet und soll in diesem Beitrag näher betrachtet werden. Bei Multi-Item-Promotions erhalten Konsumenten einen Preisnachlass, wenn sie mehrere Einheiten eines Produktes kaufen. Ein Händler kann z. B. drei Produkte zum Preis von x anbieten, wobei x geringer ist als das Dreifache des Einzelpreises. Möglich sind auch Angebote vom Typ ,Drei zum Preis von zweien‘ oder ,Kaufen Sie zwei – bekommen Sie eins umsonst‘. In Deutschland waren die Möglichkeiten für Multi-Item-Promotions bis Mitte 2001 stark durch das Rabattgesetz und die Zugabeverordnung eingeschränkt (Gedenk 2002, S. 33 ff.). So war nur die erstgenannte Variante zulässig, da hier ein neues Produkt zu einem eigenständigen Preis angeboten wurde. Die beiden letztgenannten Varianten galten dagegen als unzulässige Rabatte bzw. Zugaben. Seit Fall des Rabattgesetzes und der Zugabeverordnung im Juli 2001 sind jedoch auch diese Formen von Multi-Item-Promotions in Deutschland erlaubt, so dass das Interesse an diesem Preis-PromotionInstrument gestiegen ist. Für Hersteller und Händler bietet sich mit Multi-Item-Promotions die Möglichkeit, die gekaufte Menge stärker zu steigern als mit Sonderangeboten. Denkbar ist allerdings auch, dass weniger Konsumenten zur Aktionsmarke wechseln als bei

16

Karen Gedenk und Uta Sabine Mahler

Sonderangeboten, da sie die Mengenanforderungen der Multi-Item-Promotions nicht erfüllen wollen. Für Unternehmen ist es daher wichtig zu wissen, wie stark die entsprechenden Effekte auf Kaufmenge und Markenwahl sind. Des Weiteren ist das Framing von Multi-Item-Promotions von Interesse. So macht es für Konsumenten möglicherweise einen Unterschied, ob das Angebot als Preisnachlass präsentiert wird oder als zusätzliche kostenlose Menge (z. B. ,Kaufen Sie drei zum Preis von x‘ versus ,Kaufen Sie zwei – bekommen Sie eins umsonst‘). Bislang liegen nur sehr wenige empirische Erkenntnisse zu Multi-Item-Promotions vor. Foubert 2004 untersucht ihre Wirkungen auf Kaufmenge und Markenwahlwahrscheinlichkeit. Er betrachtet dabei jedoch nur den Spezialfall von MultiItem-Promotions, bei denen Konsumenten verschiedene Aktionsartikel selbst zu einem Bündel zusammen stellen können und einen Rabatt erhalten, wenn sie insgesamt mindestens eine bestimmte Menge kaufen. Framing-Effekte untersuchen Sinha / Smith 2000. Ihre abhängige Variable ist allerdings die Attraktivität der Promotions aus Sicht von Konsumenten, nicht aber das Kaufverhalten. In diesem Aufsatz sollen daher die Wirkungen unterschiedlicher PromotionFrames auf Markenwahl und Kaufmenge verglichen werden. Wir führen dazu ein Laborexperiment durch, in welchem wir für vier Produktkategorien unterschiedliche Promotion-Frames präsentieren und Entscheidungen zu Markenwahl und Kaufmenge erfragen. Wir untersuchen die Wirkungen der betrachteten Promotions auf aggregierter und auf Segmentebene. Im Einzelnen werden folgende Beiträge geleistet:  Die Wirkungen von Multi-Item-Promotions werden mit denen von Sonderangeboten verglichen.  Die Wirkungen unterschiedlicher Frames für Multi-Item-Promotions werden miteinander verglichen (Preisnachlass versus Extra-Menge).  Die Wirkungen auf Markenwahlwahrscheinlichkeit und Kaufmenge werden voneinander getrennt untersucht.  Wir untersuchen, inwieweit Unterschiede in den Wirkungen zwischen Konsumenten durch Konsumentencharakteristika erklärt werden können.

Im folgenden Abschnitt berichten wir, welche Erkenntnisse sich aus der bisherigen Literatur zu Multi-Item-Promotions gewinnen lassen. Anschließend leiten wir in Abschnitt C Hypothesen zur Wirkung von Multi-Item-Promotions auf Markenwahl und Kaufmenge ab. Abschnitt D beschreibt die Vorgehensweise bei unserem Experiment. In Abschnitt E berichten wir dessen Befunde auf aggregiertem Niveau, bevor wir in Abschnitt F den Einfluss von Konsumentencharakteristika auf die Wirkungen von Multi-Item-Promotions untersuchen. Der Aufsatz endet mit einer Zusammenfassung und Schlussfolgerungen in Abschnitt G.

Die Wirkung von Multi-Item-Promotions auf Markenwahl und Kaufmenge

17

B. Bisherige Erkenntnisse zu Multi-Item-Promotions Multi-Item-Promotions unterscheiden sich neben der Höhe des Preisnachlasses vor allem in folgenden Eigenschaften:  Einbezogene Artikel (einer oder mehrere),  Mindestmenge = Anzahl der Artikel, die gekauft werden müssen, um den Preisnachlass zu erhalten,  Framing.

Häufig werden bei Multi-Item-Promotions mehrere Einheiten eines und desselben Artikels zu einem Bündel zusammengefasst. Möglich ist jedoch auch, verschiedene Artikel in die Aktion einzubeziehen. Die Bündelung kann dann durch den Anbieter erfolgen, oder der Konsument kann selbst die Auswahl haben (Foubert 2004). Beispielsweise kann ein Preisnachlass beim Kauf von drei Packungen Chips gewährt werden, wobei der Konsument verschiedene Geschmacksrichtungen der Aktionsmarke auswählen kann. Bezüglich der Anzahl der zu kaufenden Artikel ist zu beachten, dass eine größere Mindestmenge das Potenzial hat, die gekaufte Menge stärker zu erhöhen. Wird jedoch der ,Mengendruck‘ zu groß, so entscheiden sich einige Konsumenten dagegen, die Aktion zu nutzen (Foubert 2004). Das Framing von Preis-Promotions kann generell einen starken Einfluss auf deren Wirkung ausüben (Gedenk 2002, S. 260 ff.; Krishna et al. 2002). Bei MultiItem-Promotions liegt eine zentrale Unterscheidung darin, ob der Preis für das Produktbündel gesenkt oder aber Einheiten des Produktes umsonst angeboten werden. Eine Preissenkung kann z. B. kommuniziert werden als ,Drei zum Preis von zweien‘ oder ,Drei zum Preis von x‘. Wir bezeichnen diesen Aktionstyp im Folgenden als Multipacks. Angebote mit der Botschaft ,Kaufen Sie n – bekommen Sie eins umsonst‘ werden dagegen oft als BOGOs bezeichnet (kurz für ,Buy one – get one free‘). Hier liegt rein technisch ebenfalls ein Preisnachlass vor, der Frame stellt aber zentral darauf ab, dass Konsumenten etwas umsonst erhalten. Dies nehmen Konsumenten möglicherweise als vorteilhafter wahr, wie in Abschnitt 3 näher erläutert wird. Empirisch sind Multi-Item-Promotions bislang vor allem in fünf Studien untersucht worden. Blattberg / Neslin 1990 und Wansink / Kent / Hoch 1998 berichten Befunde zu ihrer Wirkung auf Basis aggregierter Marktdaten. So zeigen Blattberg / Neslin 1990 (S. 350 f.) mit Hilfe von Handelspanel-Daten, dass die Absatzsteigerung bei Multipacks vom Typ ,N zum Preis von x‘ im Durchschnitt über mehrere Produktkategorien um 18 % größer ist als bei Sonderangeboten. Wansink / Kent / Hoch 1998 finden in einem Feldexperiment, dass Multi-Item-Promotions des gleichen Typs den Absatz im Durchschnitt über mehrere Produktkategorien um 165 % steigern im Vergleich zu einer Absatzsteigerung um 125 % bei Sonderangeboten. Dieser Effekt tritt auf, obwohl der Preisnachlass bei der Multi-Item-Aktion auch beim Kauf kleinerer Mengen gewährt wurde. Die Autoren erklären dies mit einem ,Anchoring and Adjustment‘-Effekt. D. h. die Konsumenten verwenden die in der Aktionswerbung angegebene größere Menge als Anker und passen ihre Kauf2 FS Kaas

18

Karen Gedenk und Uta Sabine Mahler

menge nach oben an. Beide genannte Studien können aufgrund der Verwendung von aggregierten Daten nicht in Markenwahl- und Kaufmengen-Effekte unterscheiden. Diese Unterscheidung nimmt Foubert 2004 vor, der auf Basis von Haushaltspanel-Daten Modelle des Kategoriekaufs, der Markenwahl und der Kaufmenge schätzt. Er betrachtet dabei den Spezialfall von Multi-Item-Promotions, die mehrere Artikel umfassen und bei denen Konsumenten ihr Bündel selbst zusammenstellen können. Foubert stellt fest, dass diese Multi-Item-Promotions die Wahrscheinlichkeit des Kategoriekaufs nicht beeinflussen, aber bei Käufern der Produktkategorie starke Effekte auf Markenwahl und Kaufmenge ausüben. In einer Simulation vergleicht er Multi-Item-Promotions mit Sonderangeboten. Die Ergebnisse hängen in starkem Maße davon ab, welche Produkte in die Aktion einbezogen werden und wie groß die Mindestabnahmemenge gewählt wird. Sinha / Smith 2000 vergleichen in einem Laborexperiment verschiedene Frames für Multi-Item-Promotions. Die zentrale abhängige Variable ist dabei die Attraktivität der Aktion aus Sicht von Konsumenten. Die Autoren stellen fest, dass BOGOs (,Buy one – get one free‘) als attraktiver wahrgenommen werden als Multipacks (,Buy two – get 50 % off‘). Besonders attraktiv finden die befragten Konsumenten Sonderangebote. Dabei ist jedoch zu beachten, dass die wahrgenommene Attraktivität eine wenig aussagekräftige Erfolgsvariable ist. Vermutlich präferieren die Konsumenten Sonderangebote, da hier keine Mindestmenge erforderlich ist. Welche Wirkungen die verschiedenen Preis-Promotion-Typen auf das Kaufverhalten haben, bleibt jedoch unklar. Schließlich untersuchen Laroche et al. 2003 in einer Befragung den Einfluss einiger Konsumentencharakteristika auf die Neigung von Konsumenten, ,Zwei-füreins‘-Promotions zu nutzen. Auch sie untersuchen dabei jedoch nicht die Wirkung von Multi-Item-Promotions auf Markentreue und Kaufmenge. Zusammenfassend bleibt damit festzuhalten, dass Erkenntnisse zu Markenwahl und Kaufmenge bei einem bestimmten Typ von Multi-Item-Promotions vorliegen sowie Vergleiche von Frames in Bezug auf die Attraktivität der Aktion. Ein Vergleich der Wirkung typischer Frames für Multi-Item-Promotions auf Markenwahl und Kaufmenge fehlt jedoch. Diese Forschungslücke möchte der vorliegende Beitrag schließen. Des Weiteren soll systematisch der Einfluss von Konsumentencharakteristika auf diese Wirkungen von Multi-Item-Promotions betrachtet werden.

C. Hypothesen zur Wirkung von Multi-Item-Promotions auf Markenwahl und Kaufmenge Im Folgenden sollen zwei Typen von Multi-Item-Promotions betrachtet werden: Multipacks (,Kaufen Sie drei zum Preis von x‘) und BOGOs (,Beim Kauf von zweien bekommen Sie eins geschenkt‘). Diese sollen miteinander sowie mit Son-

Die Wirkung von Multi-Item-Promotions auf Markenwahl und Kaufmenge

19

derangeboten verglichen werden. Die Multi-Item-Promotions unterscheiden sich von Sonderangeboten darin, dass Konsumenten eine Mindestmenge kaufen müssen, um die Aktion nutzen zu können. Die beiden Multi-Item-Promotions unterscheiden sich untereinander in ihrem Framing. Im Folgenden werden daher ein Mengen- und ein Framing-Effekt betrachtet, um Hypothesen zu Unterschieden in den Wirkungen der Preis-Promotion-Typen auf Markenwahl und Kaufmenge zu generieren. Der Mengen-Effekt entsteht dadurch, dass Multi-Item-Promotions im Gegensatz zu Sonderangeboten den Kauf einer Mindestmenge erfordern. Bezüglich der Markenwahl lässt der Mengen-Effekt erwarten, dass diese durch Multi-Item-Promotions weniger stark beeinflusst wird als durch Sonderangebote. Konsumenten, die nicht die Mindestmenge kaufen möchten, können nicht zum Markenwechsel bewegt werden. D. h. die Aktion zieht weniger Konsumenten an. So ist es insbesondere möglich, dass Konsumenten nicht die Mindestmenge kaufen wollen, weil  das Produkt schnell verderblich und ihr Konsum nicht so hoch ist,  begrenzter Platz für Lagerhaltung zur Verfügung steht,  sie nicht soviel Geld ausgeben wollen (Lastovicka et al. 1999) oder  sie sich selbst in ihrem Konsum beschränken möchten (Wertenbroch 1998).

Betrachtet man dagegen die gekaufte Menge pro Käufer, so lässt der MengenEffekt den umgekehrten Unterschied erwarten, nämlich dass Multi-Item-Promotions die gekaufte Menge stärker steigern als Sonderangebote. Sonderangebote führen typischerweise zu Mengensteigerungen (Gedenk 2002, S. 237 ff.). Bei Multi-Item-Promotions gilt dies aber auch für Konsumenten, bei denen ohne die Mindestmenge keine Kaufakzeleration aufgetreten wäre. Streng genommen könnte bei einer zu kleinen Mindestmenge auch ein ,Anchoring and Adjustment‘-Effekt auftreten, der die gekaufte Menge nach unten treibt. Dies gilt für Konsumenten, die normalerweise eine größere Menge kaufen als die Mindestmenge in der Aktion. Ein solch negativer Effekt dürfte jedoch typischerweise nicht dominierend sein. Der Framing-Effekt entsteht dadurch, dass Konsumenten bei BOGOs etwas umsonst erhalten, während bei Sonderangeboten und Multipacks ein Preisnachlass gewährt wird. In diesem Zusammenhang ist zu vermuten, dass Konsumenten es als besonders attraktiv empfinden, etwas umsonst zu bekommen, quasi ein Geschenk zu erhalten. Theoretisch lässt sich diese Erwartung mit Hilfe der Prospect-Theorie und des Mental Accounting begründen (Thaler 1985). So kann das Framing von Multi-Item-Promotions Einfluss darauf nehmen, ob die Aktion als Reduzierung von Verlusten oder als Gewinn wahrgenommen wird (Diamond 1992; Sinha / Smith 2000). Sonderangebote und Multipacks dürften mit einer höheren Wahrscheinlichkeit als Preisnachlass wahrgenommen werden, d. h. als reduzierter Verlust. Dafür spricht, dass der Preisnachlass in Geldeinheiten ausgedrückt wird, also in der gleichen Einheit wie der Preis. Außerdem wird bei Sonderangeboten und Multipacks der Nettopreis ausgewiesen, d. h. der reduzierte Aktionspreis. Beides dürfte dazu 2*

20

Karen Gedenk und Uta Sabine Mahler

führen, dass Konsumenten den Normalpreis und den Preisnachlass integrieren, d. h. einen reduzierten Verlust wahrnehmen. Bei BOGOs erhält der Konsument dagegen ein Produkt geschenkt, d. h. der Nachlass wird hier in Produkteinheiten ausgedrückt und separiert. Das kostenlose Extraprodukt dürfte daher mit einer höheren Wahrscheinlichkeit als Gewinn wahrgenommen werden. Nach dem ,Silver Lining‘-Prinzip von Thaler 1985 führt die Kombination eines großen Verlustes (Preis) mit einem kleinen Gewinn (Extra-Produkt) aber zu einem höheren Transaktionsnutzen als ein reduzierter Verlust (reduzierter Preis). Sowohl bezüglich der Markenwahl als auch bezüglich der gekauften Menge ist daher zu erwarten, dass BOGOs vorteilhafter wirken als Sonderangebote und Multipacks. Tabelle 1 fasst die geschilderten Effekte zusammen und zeigt, welche Wirkungen auf den Gesamtabsatz zu erwarten sind. Tabelle 1 Hypothesen

Markenwahl Mengen- FramingEffekt Effekt Multi vs. SA BOGO vs. SA BOGO vs. Multi

S S =

= B B

Gekaufte Menge Mengen- FramingEffekt Effekt M B =

= B B

Gesamtabsatz Mengen- FramingEffekt Effekt ? ? =

= B B

Multi: Multipack, SA: Sonderangebot, M / B / S: Multipack / BOGO / Sonderangebot hat den stärkeren Effekt, =: kein Unterschied, ?: Effekt unklar

D. Datenerhebung Wir untersuchen die Wirkung von Sonderangeboten und Multi-Item-Promotions in einer Befragung, deren Kern ein Choice-Experiment bildet. Den Konsumenten werden zwei Marken aus einer Produktkategorie präsentiert, und sie werden gefragt, welche Marke sie in welcher Menge kaufen würden. Bei einer der Marken (= ,Aktionsprodukt‘) werden vier verschiedene Promotion-Szenarien eingesetzt:  Keine Promotion,  Sonderangebot (,Normalerweise y – heute nur x‘),  Multipack (,Kaufen Sie drei zum Preis von x‘),  BOGO (,Beim Kauf von zweien bekommen Sie eins geschenkt‘).

Der Preisnachlass beträgt bei allen Promotions ein Drittel. Unterschiede in den Wirkungen können also nur aus dem Mengen- und dem Framing-Effekt entstehen. Abbildung 1 zeigt ein Beispiel für eine Abfrage mit einem BOGO.

Die Wirkung von Multi-Item-Promotions auf Markenwahl und Kaufmenge

21

Stellen Sie sich jetzt vor, Sie möchten Kaffee kaufen. Zur Wahl stehen folgende Angebote: (Dabei ist nur die Marke (Melitta/Jacobs), nicht die abgebildete Sorte entscheidend!)

500 g Paket DM 6,99

500 g Paket 1 Paket zu DM 6,99 Beim Kauf von 2 bekommen sie ein Packet geschenkt

Welche Marke und wie viele Pakete Kaffee würden Sie bei diesem Angebot kaufen? Kauf von _________ Paket(en) Melitta Kauf von _________ Paket(en) Jacobs Abbildung 1: Fragestellung

Diese Promotions werden in vier Produktkategorien mit je zwei Marken untersucht: Kaffee (Melitta und Jacobs), Schokolade (Milka und Ritter Sport), Joghurt (Almighurt und Müller) und Waschmittel (Ariel und Persil). Die Kategorien wurden so ausgesucht, dass Produkte mit unterschiedlichem Preisniveau und unterschiedlicher Lagerbarkeit vertreten sind, da diese Eigenschaften möglicherweise Einfluss auf die Wirkungen von Multi-Item-Promotions nehmen (Sinha / Smith 2000). Innerhalb der Produktkategorien wurden anhand von Käuferreichweiten der GfK jeweils zwei große und bekannte Marken gewählt. Aus der Kombination von vier Produktkategorien und vier Promotion-Szenarien ergeben sich 16 Treatments. Diese wurden in einem Lateinischen Quadrat-Design so zu vier Fragebogenvarianten zusammengefasst, dass jeder Proband zu allen vier Kategorien befragt wurde und dabei jeweils ein anderes Promotion-Szenario zum Einsatz kam. Die Daten wurden Ende 2001 in einer persönlichen Befragung von Konsumenten in zwei Verbrauchermärkten erhoben. Die Probanden wurden mit dem Quotenverfahren ausgewählt: In jeder der vier Gruppen wurde ein Anteil von 84 % Frauen und 50 % Probanden älter als 50 Jahre angestrebt. Diese Quoten entsprachen nach Auskunft von Research International der Grundgesamtheit der Haushaltsvorstände (hauptsächlich einkaufenden Personen) in Deutschland. Befragt wurden pro Gruppe 75 Probanden, insgesamt also 300 Konsumenten. Die vier Gruppen zeigen im Kruskal-Wallis-Test keine signifikanten Unterschiede

22

Karen Gedenk und Uta Sabine Mahler

in Demographie (Alter, Geschlecht, Haushaltsgröße, Bildung, Beruf, Einkommen) und Preissensitivität (zur Operationalisierung siehe Abschnitt 6), sind also vergleichbar. Über die vier Produktkategorien lagen so zunächst 1.200 Beobachtungen vor. Einige davon mussten ausgeschlossen werden, da die Befragten in einer oder mehreren Kategorien keine Auswahlentscheidung getroffen haben. Dies war meist dann der Fall, wenn die Probanden diese Kategorie grundsätzlich nicht kauften. In die Analyse gehen somit 999 Beobachtungen ein.

E. Aggregierte Befunde zur Wirkung auf Markenwahl und Kaufmenge Tabelle 2 zeigt die Absatzmenge des Aktionsproduktes, die Wahrscheinlichkeit, dass das Aktionsprodukt gewählt wird, sowie die gekaufte Menge, sofern das Aktionsprodukt gewählt wird, als Durchschnitt über die Probanden der jeweiligen Experimentalgruppe. Man erkennt zunächst, dass die Markenwahlwahrscheinlichkeit durch alle drei Typen von Preis-Promotions steigt. Nur Multipacks führen bei Kaffee und Waschmittel zu keinem signifikanten Markenwechsel. Dabei mag eine Rolle spielen, dass dies die beiden eher hochpreisigen Produktkategorien sind, so dass die Mindestabsatzmenge einen besonderen finanziellen Einsatz verlangt, um die Aktion zu nutzen. Wir finden bei der Markenwahl einige Belege für einen Framing-Effekt: In zwei von vier Produktkategorien führen BOGOs zu signifikant stärkerem Markenwechsel als Multipacks. Allerdings ist der Markenwechsel durch BOGOs bei Schokolade signifikant geringer als durch Multipacks. Für den Mengen-Effekt findet sich kaum Unterstützung. Er müsste sich besonders deutlich beim Vergleich von Multipacks mit Sonderangeboten zeigen. Nur bei Waschmittel ist jedoch die Markenwahlwahrscheinlichkeit beim Multipack signifikant geringer als beim Sonderangebot. Bei Joghurt und Kaffee treten keine signifikanten Unterschiede auf, und bei Schokolade ist der Markenwechsel beim Multipack sogar stärker. Bei der gekauften Menge zeigen sich etwas deutlichere Mengen-Effekte. Sie treten vor allem bei den hochpreisigen Kategorien Kaffee und Waschmittel in der erwarteten Richtung auf. Hier werden ohne Aktion eher kleine Mengen gekauft, und sowohl Multipacks als auch BOGOs erhöhen die gekaufte Menge signifikant stärker als Sonderangebote. Bei Schokolade zeigt sich dieser Effekt nur bei den BOGOs, wo vermutlich ein Framing-Effekt hinzukommt. Ein negativer Mengen-Effekt tritt dagegen bei den Multipacks in der Joghurt-Kategorie auf. Ohne Promotion kaufen die Probanden hier durchschnittlich 3,54 Joghurts der Aktionsmarke. Bei einem Sonderangebot steigt diese Menge auf 5,08 Becher. Bei einem Multipack sinkt sie dagegen auf 3,45. Offenbar wirkt sich hier negativ aus, dass die Mindestabsatzmenge unter der durchschnittlichen Kaufmenge ohne Aktion gewählt wurde. Dann tritt der in Abschnitt 3 diskutierte ,Anchoring and Adjustment‘-Effekt dergestalt auf, dass sich Konsumenten an dem Anker von drei orientieren und ihre Kaufmenge

Die Wirkung von Multi-Item-Promotions auf Markenwahl und Kaufmenge

23

nach unten anpassen. Bei den BOGOs tritt dieser ,Anchoring and Adjustment‘Effekt hinter den Framing-Effekt zurück, welcher dazu führt, dass BOGOs in der Joghurt-Kategorie die Menge signifikant stärker erhöhen als Multipacks. Tabelle 2 Aggregierte Befunde

Schokolade

Joghurt

Kaffee

Waschmittel

Gesamt

Markenwahlwahrscheinlichkeit Aktionsprodukt Keine Aktion

0,52

0,42

0,62

0,74

0,57

Sonderangebot

0,73 *

0,68 *

0,80 *

0,93 *

0,78 *

Multipack

0,88 *a

0,60 *

0,71

0,79 a

0,75 *

BOGO

0,71 *b

0,90 *ab

0,83 *

0,94 *b

0,84 *b

Gekaufte Menge Aktionsprodukt (wenn Marke gewählt) Keine Aktion

2,50

3,54

1,36

1,23

Sonderangebot

3,67 *

5,08 *

2,88 *

1,53 *

Multipack

3,28 * a

3,45

a

4,88

b

3,48 *

a

3,64 *

a

2,04 3,19 *

2,93 *

a

3,26 *a

3,25 *

a

3,95 *ab

BOGO

4,04 *

Keine Aktion

1,31

1,48

0,85

0,91

1,16

Sonderangebot

2,69 *

3,46 *

2,31 *

1,42 *

2,49 *

Multipack

2,88 *

2,08 a

2,47 *

2,32 *a

Gesamtabsatz Aktionsprodukt

BOGO

2,88 *

b

4,41 *

3,03 *

ab

3,05 *

ab

2,44 * 3,33 *ab

* Unterschied zur Kontrollgruppe signifikant a Unterschied zu Sonderangebot signifikant, b Unterschied zu Multipack signifikant p = 0,05

Am Gesamtabsatz wird schließlich deutlich, dass BOGOs unter den von uns untersuchten Promotions am vorteilhaftesten wirken. Insbesondere bei Kaffee und Waschmittel steigern sie den Absatz signifikant stärker als Sonderangebote und Multipacks. Hier handelt es sich um die beiden hochpreisigen Kategorien, wo der Mengen-Effekt besonders stark ist. Tabelle 3 fasst die Befunde noch einmal in ihrer Tendenz zusammen (basierend auf der über die vier Kategorien gepoolten Analyse) und stellt sie den in Abschnitt 3 formulierten Hypothesen gegenüber. Man erkennt einige Unterstützung sowohl für den Mengen- als auch für den Framing-Effekt. Bezüglich des Mengen-Effektes ist zu beachten, dass die Mindestmenge bei Multi-Item-Promotions nicht zu gering gewählt werden darf, da sonst eine Anpassung der gekauften Menge nach unten zu befürchten ist.

24

Karen Gedenk und Uta Sabine Mahler Tabelle 3 Vergleich von Hypothesen und Befunden

Markenwahl Gekaufte Menge Gesamtabsatz Men- FraFra- BeFraMenMenBeBegen- ming- fund gen- ming- fund gen- ming- fund Effekt Effekt Effekt Effekt Effekt Effekt S = = M = M ? = = S B = B B B ? B B

Multi vs. SA BOGO vs. SA BOGO vs. Multi

=

B

B

=

B

B

=

B

B

Multi: Multipack, SA: Sonderangebot, M / B / S: Multipack / BOGO / Sonderangebot hat den stärkeren Effekt, =: kein Unterschied, ?: Effekt unklar

F. Einflüsse von Konsumentencharakteristika auf die Wirkung von Multi-Item-Promotions Im Folgenden soll untersucht werden, inwieweit sich Konsumenten in ihrer Reaktion auf Multi-Item-Promotions unterscheiden und inwieweit die identifizierten Unterschiede durch Charakteristika der Konsumenten erklärt werden können. Dazu wird eine gepoolte Analyse über alle vier Produktkategorien durchgeführt. Wir schätzen ein Markenwahl- und ein Kaufmengen-Modell und bilden mit Hilfe eines Finite Mixture-Modells Segmente von Konsumenten mit unterschiedlichen Promotion-Parametern. Die Modelle werden simultan geschätzt, und die Wahrscheinlichkeit der Segmentzugehörigkeit wird dabei im Rahmen eines Concomitant Variable-Modells zu einer Funktion von Konsumentencharakteristika gemacht. Die Markenwahl bilden wir über ein Multinomial Logit-Modell ab (Guadagni / Little 1983; Train 2003), das zunächst auf der Segment-Ebene definiert ist: PBihs ˆ

…1† …2† mit:

eVihs 1 ‡ eVihs …i 2 I; h 2 H; s 2 S†

Vihs ˆ b0is ‡ b1s  SAih ‡ b2s  MULTIih ‡ b3s  BOGOih

…i 2 I; h 2 H; s 2 S†

PBihs

= Wahrscheinlichkeit, dass der h-te Proband in der i-ten Produktkategorie bei Zugehörigkeit zum s-ten Segment das Aktionsprodukt kauft

Vihs

= Nutzen des Aktionsproduktes der i-ten Produktkategorie für den h-ten Probanden bei Zugehörigkeit zum s-ten Segment

SAih

= 1, wenn für das Aktionsprodukt in der i-ten Produktkategorie beim h-ten Probanden ein Sonderangebot vorliegt, 0 sonst

Die Wirkung von Multi-Item-Promotions auf Markenwahl und Kaufmenge

25

MULTIih

= 1, wenn für das Aktionsprodukt in der i-ten Produktkategorie beim h-ten Probanden ein Multipack vorliegt, 0 sonst

BOGOih

= 1, wenn für das Aktionsprodukt in der i-ten Produktkategorie beim h-ten Probanden ein BOGO vorliegt, 0 sonst

b0is ; b1s ; b2s ; b3s = Parameter

Die Wahrscheinlichkeit, das Aktionsprodukt zu wählen, hängt ab von dessen Nutzen, welcher wiederum eine Funktion der vorhandenen Promotions ist. Die Markenwahlkonstanten b0is erfassen in den vier Produktkategorien jeweils die (Promotion-unabhängige) Präferenz für das Aktionsprodukt im Vergleich zu der anderen zur Wahl stehenden Marke. Die gekaufte Menge bilden wir über ein Poisson-Modell ab (Ailawadi / Neslin 1998). Hier spiegeln die Kategorie-Konstanten c0is wider, welche Menge in den vier Produktkategorien jeweils ohne Aktion gekauft wird: …ihs †nih 1†  nih !

…3†

PQihs ˆ

…4†

ihs ˆ ec0is ‡c1s SAih ‡c2s MULTIih ‡c3s BOGOih

mit:

…i 2 I; h 2 H; s 2 S†

…eihs

…i 2 I; h 2 H; s 2 S†

PQihs

= Wahrscheinlichkeit, dass der h-te Proband in der i-ten Produktkategorie bei Zugehörigkeit zum s-ten Segment die Menge n kauft

ihs

= Poissonparameter für die i-te Produktkategorie und den h-ten Probanden im s-ten Segment

nih

= Menge des Aktionsproduktes, die der h-te Haushalt in der i-ten Produktkategorie kauft

c0is ; c1s ; c2s ; c3s = Parameter

Die Modelle werden mit dem Maximum Likelihood-Verfahren simultan geschätzt. Dabei wird die Likelihood der Markenwahl mit derjenigen der Kaufmenge multipliziert, da sich die Wahrscheinlichkeit für die Absatzmenge des Aktionsproduktes aus der Wahrscheinlichkeit, das Aktionsprodukt zu wählen, und der bedingten Wahrscheinlichkeit, eine bestimmte Menge zu kaufen (gegeben die Wahl des Aktionsproduktes), ergibt. Im Rahmen des Finite Mixture-Modells (Kamakura / Russell 1989; Wedel / Kamakura 2000) gehören die Probanden mit bestimmten Wahrscheinlichkeiten zu den verschiedenen Segmenten. Die Likelihood-Funktion wird daher zunächst pro Proband auf der Segment-Ebene bestimmt. Anschließend wird mit den Wahrscheinlichkeiten der Segmentzugehörigkeit als Gewichten eine Gesamt-Likelihood für jeden Probanden ermittelt, bevor über Probanden aggregiert wird: …5†

LMarke ˆ hs

Yh PBihs  Dih ‡ …1 i

PBihs †  …1

i Dih†

…h 2 H; s 2 S†

26

Karen Gedenk und Uta Sabine Mahler Menge

…6†

Lhs

ˆ

Y

PQihs …nih †

…h 2 H; s 2 S†

i

…7†

YX



Menge

hs  LMarke  Lhs hs

h2H s2S

mit:

LMarke = Likelihood des Markenwahlmodells beim h-ten Probanden im s-ten Segment hs Dih

= Markenwahldummy (1, wenn das Aktionsprodukt gewählt wird, 0 sonst)

LMenge hs

= Likelihood des Mengenmodells beim h-ten Probanden im s-ten Segment

L

= Gesamt-Likelihood

hs

= A priori-Wahrscheinlichkeit, dass der h-te Haushalt zum s-ten Segment gehört

Die Wahrscheinlichkeit der Segmentzugehörigkeit ist im Rahmen eines Concomitant Variable-Modells (Gupta / Chintagunta 1994; Wedel / Kamakura 2000) eine Funktion von Konsumentencharakteristika: …8†

ePhs hs ˆ P P e hz

…h 2 H; s 2 S†

z2S

…9† mit:

Phs ˆ d0s ‡ d1s  ALTERh ‡ d2s  GESCHLECHTh ‡ . . . ALTERh

…h 2 H; s 2 S†

= Alter des h-ten Probanden

GESCHLECHTh = Geschlecht des h-ten Probanden d0s ; d1s ; d2s ; . . .

= Parameter

Dabei berücksichtigen wir die folgenden Konsumentencharakteristika:  Alter (6 Kategorien),  Geschlecht,  Haushaltsgröße (Anzahl Haushaltsmitglieder),  Bildung (5 Kategorien),  Berufstätigkeit (ja / nein),  Einkommen (4 Kategorien),  Preissensitivität.

Die Preissensitivität wurde über die Zustimmung zu folgenden 7 Items auf einer 5er-Skala erfasst:  Ich beachte die Anzeigen des Einzelhandels in Tageszeitungen und Postwurfsendungen.  Sonderangebotsanzeigen helfen mir bei meiner Einkaufsplanung.

Die Wirkung von Multi-Item-Promotions auf Markenwahl und Kaufmenge

27

 Ich vergleiche im Geschäft regelmäßig die Preise.  Ich besuche verschiedene Geschäfte, um das preisgünstigste Angebot ausfindig zu machen.  Es ist mir wichtig, für Produkte den besten Preis zu zahlen.  Mit dem Einkauf eines Artikels warte ich, bis ich auf ein besonders günstiges Angebot treffe.  Ich halte gezielt nach Sonderangeboten im Geschäft Ausschau.

Die Konstruktwerte wurden als ungewichtete Durchschnitte der Antworten gebildet (Cronbach’s alpha = 0,87). Alle Toleranzwerte für die Konsumentencharakteristika sind größer als 0,65 und lassen somit keine Multikollinearitätsprobleme erwarten. Das Modell wurde in GAUSS geschätzt. Nach Maßgabe des Bayesian Information Criterion (BIC) (Teichmann / Gensler 2005) ergibt sich eine 2-SegmentLösung. Die Parameter des Markenwahl- und des Mengenmodells in den beiden Segmenten sind in Tabelle 4 dargestellt. Man erkennt deutliche Unterschiede in den Parametern zwischen den Segmenten. Die Konstanten im Mengenmodell lassen erkennen, dass Konsumenten in Segment 1 in allen vier Kategorien in Situationen ohne Promotions größere Mengen kaufen als Konsumenten in Segment 2. In Segment 1 finden sich also tendenziell die Heavy-User, während Segment 2 eher die Light-User umfasst. Die Promotion-Parameter im Markenwahl- und Mengenmodell sind nur schwer zu interpretieren, da die Wirkung der Preis-Promotions in diesen nichtlinearen Modellen durch die Gesamtheit der Parameter beeinflusst wird. Elastizitäten lassen sich für Dummy-Variablen nicht sinnvoll berechnen. Wir bestimmen daher Elastizitäts-ähnliche Wirkungsmaße, die angeben, um wie viel Prozent sich die Markenwahlwahrscheinlichkeit bzw. die erwartete Kaufmenge ändern, wenn eine Promotion durchgeführt wird. Dies geschieht im Rahmen einer einfachen Simulation. In der Ausgangssituation liegt in jeder Kategorie für keine der beiden Marken eine Aktion vor. Dann setzen wir die Promotion-Dummy für die Aktionsmarke auf 1 und erfassen, um wie viel Prozent die Markenwahlwahrscheinlickeit bzw. die erwartete Menge steigen. Dies führen wir in jedem Segment und in jeder Produktkategorie für jeden der drei Promotion-Typen durch. Tabelle 5 zeigt die Befunde im Durchschnitt über die vier Produktkategorien. Im Markenwahl-Modell erkennt man wiederum einen Framing-Effekt in dem Sinne, dass BOGOs eine stärkere Wirkung auf die Markenwahl ausüben als Multipacks. In Segment 2 tritt auch ein Mengen-Effekt auf, der sich darin äußert, dass Multipacks zu einem geringeren Markenwechsel führen als Sonderangebote. Insgesamt ist die Wirkung von Multi-Item-Promotions auf den Markenwechsel geringfügig stärker in Segment 1. Dies ist plausibel, da für Heavy-User die Mindestmenge weniger eine Hürde darstellt als für Light-User (siehe dazu auch Foubert 2004).

28

Karen Gedenk und Uta Sabine Mahler Tabelle 4 Parameter Markenwahl- und Mengenmodell

Parameter (Signifikanzniveaus) Markenwahl

Kaufmenge

Segment 1

Segment 2

0,41 (0,28)

0,03 (0,90)

Konstante Joghurt

-0,28 (0,43)

-0,04 (0,88)

Konstante Kaffee

0,93 (0,05)

0,05 (0,82)

Konstante Waschmittel

1,18 (0,01)

0,96 (0,00)

Sonderangebot

1,19 (0,01)

0,94 (0,00)

Multipack

1,25 (0,00)

0,57 (0,02)

BOGO

1,83 (0,00)

1,20 (0,00)

Konstante Schokolade

1,13 (0,00)

0,45 (0,00)

Konstante Joghurt

1,44 (0,00)

0,99 (0,00)

Konstante Kaffee

0,99 (0,00)

-0,09 (0,54)

Konstante Waschmittel

0,39 (0,00)

0,15 (0,17)

Sonderangebot

0,58 (0,00)

0,09 (0,40)

Multipack

0,36 (0,00)

0,26 (0,01)

BOGO

0,61 (0,00)

0,47 (0,00)

33 %

67 %

Konstante Schokolade

Segmentgröße Tabelle 5

Elastizitäts-ähnliche Maße für die Wirkung der Preis-Promotions

Prozentuale Steigerung Markenwahl

Kaufmenge

Sonderangebot

Segment 1

Segment 2

36,95

37,51

Multipack

38,38

24,06

BOGO

49,38

45,78

Sonderangebot

25,79

4,48

Multipack

15,87

12,72

BOGO

27,17

23,51

Die Wirkung von Preis-Promotions auf die gekaufte Menge ist insgesamt höher in Segment 1. Dies ist plausibel, da Konsumenten, die viel in einer Kategorie konsumieren, finanziell stärker von der Aktion profitieren und eher dazu bewegt werden können, auf Vorrat zu kaufen. Allerdings ist in Segment 1 kein Vorteil

Die Wirkung von Multi-Item-Promotions auf Markenwahl und Kaufmenge

29

von Multi-Item-Promotions gegenüber Sonderangeboten erkennbar. Multipacks führen sogar zu einer geringeren Mengensteigerung als Sonderangebote. Dies ist insofern plausibel, als ein negativer ,Anchoring and Adjustment‘-Effekt eher bei Konsumenten mit einer größeren Kaufmenge auftreten dürfte. Ein positiver Mengen-Effekt von Multi-Item-Promotions lässt sich nur in Segment 2 feststellen. Light-User lassen sich durch Sonderangebote nur in sehr geringem Maße zum Kauf einer größeren Menge bewegen, durch Multi-Item-Promotions dagegen deutlich stärker. Neben der Unterscheidung in Heavy- und Light-User zeigt Tabelle 6 weitere Einflüsse von Konsumentencharakteristika. Die Tabelle beinhaltet die Parameter zum Einfluss der Konsumentencharakteristika auf die Wahrscheinlichkeit der Zugehörigkeit zu Segment 1 (siehe Gleichung 9). Signifikante Koeffizienten sind durch Fettdruck hervorgehoben. Man erkennt, dass Konsumenten in Segment 1 eher älter sind, größere Haushalte führen, ein geringeres Bildungsniveau aufweisen und mit einer höheren Wahrscheinlichkeit berufstätig sind als Konsumenten in Segment 2. Zudem ist die Preissensitivität in Segment 1 höher. Dabei ist es plausibel, dass sich im Segment der Heavy-User eher größere Haushalte finden, welche aufgrund der größeren Einkaufsmengen stärker auf Preissenkungen reagieren. Auch führt das niedrigere Bildungsniveau in diesem Segment offenbar zu einem niedrigeren Pro-Kopf-Einkommen, so dass trotz stärkerer Berufstätigkeit des Haushaltsvorstandes das HaushaltsEinkommen nicht höher ist. Tabelle 6 Parameter zum Einfluss der Konsumentencharakteristika auf die Wahrscheinlichkeit der Zugehörigkeit zu Segment 1

Einflussgröße Konstante Alter Geschlecht (0 = weiblich 1 = männlich) Haushaltsgröße Bildung Berufstätigkeit Haushalts-Einkommen Preissensitivität

Parameter (Signifikanzniveau) -6,00 (0,00) 0,59 (0,01) -0,60 (0,34) 0,75 (0,00) -0,41 (0,04) 1,19 (0,02) -0,11 (0,63) 0,58 (0,01)

30

Karen Gedenk und Uta Sabine Mahler

G. Zusammenfassung und Schlussfolgerungen Wir haben drei Arten von Preis-Promotions untersucht: Sonderangebote (,Normalerweise y – heute nur x‘), Multipacks (,Kaufen Sie drei zum Preis von x‘) und BOGOs (,Beim Kauf von zweien bekommen Sie eins geschenkt‘). Die beiden Multi-Item-Promotions unterscheiden sich von Sonderangeboten dadurch, dass Konsumenten eine Mindestmenge kaufen müssen, um in den Genuss des PreisNachlasses zu kommen. Dies kann zu einem Mengen-Effekt führen in dem Sinne, dass Multi-Item-Promotions die Markenwahlwahrscheinlichkeit weniger erhöhen als Sonderangebote, die gekaufte Menge dagegen stärker steigern. BOGOs unterscheiden sich von Multipacks und Sonderangeboten dadurch, dass Konsumenten eine Extra-Menge des Produktes umsonst bekommen im Gegensatz zu einem Preisnachlass. Dies kann zu einem Framing-Effekt führen, so dass BOGOs vorteilhafter wirken. In unserem Befragungsexperiment finden wir Belege sowohl für einen Mengenals auch für einen Framing-Effekt. Aufgrund des Mengen-Effektes können MultiItem-Promotions die gekaufte Menge stärker steigern als Sonderangebote. Allerdings geschieht dies nur, sofern die Mindestmenge deutlich größer gewählt wird als die ohne Aktion gekaufte Menge. Bei einer zu geringen Mindestmenge senken Multi-Item-Promotions die Kaufmenge, was durch einen ,Anchoring and Adjustment‘-Effekt erklärt werden kann. Die Mindestmenge sollte also ausreichend hoch gewählt werden. Gleichzeitig ist jedoch zu beachten, dass eine zu hohe Mindestmenge sich negativ auf den Markenwechsel zum Aktionsprodukt auswirken kann. Auch für den Framing-Effekt finden wir deutliche Belege. Er führt dazu, dass BOGOs unter den von uns untersuchten Promotion-Arten klar die vorteilhafteste Wirkung zeigen. Konsumenten finden es also attraktiver, ein Produkt geschenkt zu bekommen als einen Preisnachlass zu erhalten. Möglicherweise wirkt sich hier auch positiv aus, dass Konsumenten die Mindestmenge bei BOGOs als geringer wahrnehmen als bei Multipacks. Rein technisch müssen zwar bei beiden MultiItem-Promotions drei Einheiten abgenommen werden, um den Preisnachlass von einem Drittel zu erhalten. Beim BOGO lautet die Formulierung jedoch Kaufen Sie zwei . . .‘, während es bei Multipacks heißt ,Drei zum Preis von . . .‘. Schließlich kann als alternative Erklärung auch nicht ausgeschlossen werden, dass BOGOs in unserer Untersuchung eine so positive Wirkung hatten, weil dieser PromotionFrame in Deutschland zum Zeitpunkt der Studie noch neu war. Unsere Befragung wurde nur fünf Monate nach Fall des Rabattgesetzes begonnen. Schließlich finden wir Unterschiede in der Wirkung von Multi-Item-Promotions bei Heavy- versus Light-Usern. In einer disaggregierten Analyse ermitteln wir zwei Segmente, wobei zum Segment der Heavy-User tendenziell größere Haushalte mit einer höheren Preissensitivität gehören, die sich zudem durch ein höheres Alter, ein geringeres Bildungsniveau und eine höhere Wahrscheinlichkeit der Berufstätigkeit der haushaltsführenden Person auszeichnen. Unterschiede zwischen den beiden Segmenten treten vor allem bei der Wirkung von Preis-Promotions auf

Die Wirkung von Multi-Item-Promotions auf Markenwahl und Kaufmenge

31

die gekaufte Menge auf. Die Heavy-User sind eher bereit, bei Preis-Promotions ihre Kaufmenge zu erhöhen. Nur bei den Light-Usern zeigt sich allerdings eine Überlegenheit von Multi-Item-Promotions gegenüber Sonderangeboten. Insgesamt erweisen sich also BOGOs aufgrund des Framing-Effektes als besonders vorteilhaft. In diesem Zusammenhang wäre es interessant zu untersuchen, ob deutsche Konsumenten auch heute noch so stark auf dieses Promotion-Instrument ansprechen, nachdem es nun weniger neu ist. Der Mengen-Effekt führt dazu, dass Multi-Item-Promotions die gekaufte Menge besonders stark erhöhen können. Dabei ist auf der einen Seite zu beachten, dass die Mindestmenge nicht zu niedrig gesetzt werden darf, um bei Heavy-Usern kein ,Anchoring and Adjustment‘ nach unten auszulösen. Auf der anderen Seite darf die Mindestmenge jedoch auch nicht zu hoch gesetzt werden, um den Markenwechsel nicht zu stark zu reduzieren. Bei der Bestimmung der optimalen Mindestmenge ergibt sich also ein weiterer wichtiger Ansatzpunkt für zukünftige Forschung.

Literatur Ailawadi, Kusum L. / Neslin, Scott A. (1998): The Effect of Promotion on Consumption: Buying More and Consuming it Faster, in: Journal of Marketing Research, Vol. 35, S. 390 – 398 Blattberg, Robert C. / Neslin, Scott A. (1990): Sales Promotion. Concepts, Methods, and Strategies Diamond, William D. (1992): Just What is a „Dollar’s Worth“? Consumer Reactions to Price Discounts vs. Extra Product Promotions, in: Journal of Retailing, Vol. 68, S. 254 – 270 Foubert, Bram (2004): Essays on Product and Promotional Bundling in Retailing Gedenk, Karen (2002): Verkaufsförderung Guadagni, Peter M. / Little, John D. C. (1983): A Logit Model of Brand Choice Calibrated on Scanner Data, in: Marketing Science, Vol. 2, S. 203 – 238 Gupta, Sachin / Chintagunta, Pradeep K. (1994): On Using Demographic Variables to Determine Segment Membership in Logit Mixture Models, in: Journal of Marketing Research, Vol. 31, S. 128 – 136 Hardesty, David M. / Bearden, William O. (2003): Consumer Evaluations of Different Promotion Types and Price Presentation: The Moderating Role of Promotional Benefit Level, in: Journal of Retailing, Vol. 79, S. 17 – 25 Kamakura, Wagner A. / Russell, Gary J. (1989): A Probabilistic Choice Model for Market Segmentation and Elasticity Structure, in: Journal of Marketing Research, Vol. 26, S. 379 – 390 Krishna, Aradhna et al. (2002): A Meta-Analysis of the Impact of Price Presentation on Perceived Savings, in: Journal of Retailing, Vol. 78, S. 101 – 118

32

Karen Gedenk und Uta Sabine Mahler

Laroche, Michel et al. (2003): A Model of Consumer Response to Two Retail Sales Promotion Techniques, in: Journal of Business Research, Vol. 56, S. 513 – 522 Lastovicka, John L. et al. (1999): Lifestyle of the Tight and Frugal: Theory and Measurement, in: Journal of Consumer Research, Vol. 26, S. 85 – 98 Ong, Beng Soo (1999): Determinants of Purchase Intentions and Stock-Piling Tendency of Bonus Packs, in: American Business Review, Vol. 17, S. 57 – 64 Sinha, Indrajit / Smith, Michael F. (2000): Consumers’ Perceptions of Promotional Framing of Price, in: Psychology & Marketing, Vol. 17, S. 257 – 275 Teichmann, Maik-Henrik / Gensler, Sonja (2005): Bestimmung der Anzahl der Segmente in Finite Mixture Choice-Based Conjoint-Modellen, Arbeitspapier, Johann Wolfgang GoetheUniversität Frankfurt Thaler, Richard (1985): Mental Accounting and Consumer Choice, in: Marketing Science, Vol. 4, S. 199 – 214 Train, Kenneth (2003): Discrete Choice Methods with Simulation Wansink, Brian / Kent, Robert J. / Hoch, Stephen J. (1998): An Anchoring and Adjustment Model of Purchase Quantity Decisions, in: Journal of Marketing Research, Vol. 35, S. 71 – 81 Wedel, Michel / Kamakura, Wagner A. (2000): Market Segmentation. Conceptual and Methodological Foundations, 2. Aufl. Wertenbroch, Klaus (1998): Consumption Self-Control by Rationing Purchase Quantities of Virtue and Vice, in: Marketing Science, Vol. 17, S. 317 – 337

Bewußte und unbewußte Wirkungen von Archetypen in der Werbung und in Kinofilmen – Ergebnisse einer experimentellen Studie Andrea Gröppel-Klein, Anja Domke und Benedikt Bartmann

A. Problemstellung Sind Bücher wie „Harry Potter“, „Der Herr der Ringe“ oder „Die Nebel von Avalon“, Filme, die Arnold Schwarzenegger als den „Terminator“ zeigen oder Internet-Spiele wie „Everquest“ so erfolgreich, weil all diese Produkte Archetypen verwenden, die mehr oder weniger unbewußte, aber angeborene Wünsche und Bedürfnisse von Menschen ansprechen? Können daher auch Werbekampagnen, die archetypische Mythen zeigen, Konsumenten unweigerlich anziehen (Walle 1986)? Eine Inhaltsanalyse, bei der Anzeigen in Zeitungen und Zeitschriften ausgewertet wurden, zeigt, daß viele Marken (sogar Kreditinstitute oder seriöse Zeitungen wie die „Frankfurter Allgemeine Zeitung“ oder das „Handelsblatt“) archetypische Motive verwenden, z. B. tapfere Helden, unschuldige Mädchen wie „Dornröschen“, Märchenmotive wie „Cinderella“, „Der Froschkönig“, oder Tier-Archetypen wie das „getreue Pferd“ oder den “ tapferen Löwen“ (siehe Abbildung 1).

Abbildung 1: Beispiele archetypischer Werbung

Die theoretische Grundlage für die Beschäftigung mit Archetypen bilden die Prinzipien und Annahmen der Psychologie der Archetypen nach Carl Gustav Jung (1875 – 1961). In der Konsumentenverhaltensliteratur finden sich verschiedene 3 FS Kaas

34

Andrea Gröppel-Klein, Anja Domke und Benedikt Bartmann

Beiträge, die die Bedeutung von Archetypen aus einer qualitativen Forschungsperspektive untersuchen (z. B. Walle 1986, Veen 1994, Hirschman 2000). Allerdings scheint es keine empirischen Studien zu geben, die den Einfluß von Archetypen auf das Annäherungsverhalten und auf affektive Reaktionen behandeln. Daher versucht dieser Beitrag, diese Forschungslücke zu schließen und untersucht das Thema aus einer positivistischen Forschungsperspektive: 1. Beeinflussen Archetypen die bewußte Beurteilung von Werbung, Marken und Filmen einerseits und unbewußte Reaktionen andererseits? 2. Reagieren alle Konsumenten gleichermaßen oder können verschiedene Persönlichkeitstypen identifiziert werden, die mehr oder weniger stark von archetypischer Werbung und Filmen angesprochen werden bzw. existieren Unterschiede in der Wirkung der Archetypen zwischen Männern und Frauen? Um Einblicke in die unbewußten Reaktionen von Testpersonen zu gewinnen und die von archetypischer Werbung und Filmen hervorgerufene Aktivierung zu untersuchen, wurde ebenfalls die elektrodermale Reaktion gemessen.

B. Eine Einführung in die Theorie der Archetypen nach Jung Carl Gustav Jung (1875 – 1961) wurde von seinem Mentor Sigmund Freud beeinflußt und als dessen „Kronprinz der Psychoanalyse“ bezeichnet. Allerdings hatte sich Jung nie vollständig Freuds Theorie verschrieben (Boeree 1997). Freuds (1933) Therapieziel war es, das persönliche Unbewußte ins Bewußtsein zu bringen. Laut Freud werden unterdrückte persönliche Erfahrungen von primitiven, vergnügungssüchtigen und zerstörerischen Emotionen angetrieben, die über die Bewußtwerdung kontrolliert werden müssen (Enns 1994). Weiterhin war Freud, der zunächst Medizin studiert hatte, davon überzeugt, daß seine Theorie über die Relevanz unbewußter Instinkte eines Tages von modernen neurologischen Techniken (wie heutzutage beispielsweise durch die bildgebenden Verfahren in der Gehirnforschung, Behrens / Neumaier 2004, S. 10) bestätigt werden könnte. Jungs Theorie (1954 / 1959a, b) kann in drei Bereiche eingeteilt werden. Teil 1 ist der als das „Ego“ bezeichnete bewußte Verstand. Mit dem Ego eng verwandt ist der zweite Teil, das persönliche Unbewußte, das all das einschließt, was nicht derzeit bewußt ist: sowohl Erinnerungen, die leicht ins Gedächtnis gerufen werden können, als auch jene Ereignisse, die aus irgendeinem Grund unterdrückt worden sind. Jungs dritter Teil der Psyche wird das „kollektive Unbewußte“ genannt, und dieses Element macht seine Theorie unverwechselbar (Boeree 1997, S. 2). Das kollektive Unbewußte kann als das „psychische Erbe“ oder als die Art von Wissen charakterisiert werden, das allen Menschen angeboren ist. Eine Person ist sich dieses kollektiven Reservoirs an Erfahrungen nie direkt bewußt, aber es kann persönliche Gefühle und Verhalten indirekt beeinflussen. Wirkungen, die das Funktio-

Bewußte und unbewußte Wirkungen von Archetypen

35

nieren des kollektiven Unbewußten erläutern, sind Erfahrungen der ersten Liebe, „déja vu“-Erlebnisse und das unmittelbare Erkennen und Verstehen bestimmter Mythen. Im Gegensatz zur destruktiven Charakterisierung durch Freud (1933) betrachtete Jung (1961) das Unbewußte als eine „bedeutende Quelle der Erneuerung“. Der Inhalt des kollektiven Unbewußten wird durch die sogenannten „Archetypen“ charakterisiert. Diese stellen angeborene und universelle Konzeptionen dar, wie die Welt wahrzunehmen und zu erfassen ist, versorgen Individuen mit „Weisheit“ über die Vergangenheit und erklären, warum Individuen die Welt so erfahren, wie es bereits ihre Vorfahren taten. Auf diese Weise haben Archetypen eine instinktive oder biologische Funktion (Veen 1994, S. 332) und wirken als Regler und Anreize. Mit anderen Worten „aktivieren“ Archetypen menschliches Verhalten (=„Systeme der Bereitschaft zum Handeln“ (Stevens 1982, S. 62)). Als inhärente Erfahrungen der menschlichen Spezies sind sie unveränderlich über Zeit und Gesellschaften, können aber in typischen sinnbildlichen Darstellungen kulturell verschlüsselt werden. Die Vielfalt von archetypischen Abbildungen ist gewaltig. Im allgemeinen sind Archetypen mythologische oder ursprüngliche Abbildungen. Jung (1954 / 1959a, b) widmete einigen Archetypen besondere Aufmerksamkeit, die er als sehr wichtig für die Gestaltung des Verhaltens betrachtete. Alle zu erörtern, würde den Rahmen dieses Beitrags sprengen, drei Arten sind hier jedoch von größerer Relevanz und sollen ein wenig ausführlicher erklärt werden: (1) Anima und Animus Die „Anima“ beschreibt die unbewußte weibliche Seite der männlichen Psyche, während der „Animus“ die unbewußte maskuline Seite der Frau ausdrückt. Die Anima kann als ein junges Mädchen, eine gute Fee oder die „Mutter“ Erde dargestellt werden. Der Animus kann als kluger alter Mann oder als vernünftiger männlicher Charakter personifiziert werden. Nach Jung sind sowohl Anima als auch Animus in jedem menschlichen Wesen enthalten. Jedoch wird aufgrund gesellschaftlicher Regeln immer noch erwartet, daß Frauen weniger kämpferisch und verständnisvoller als Männer sind, während von letzteren erwartet wird, daß sie stärker sind und die emotionale Seite des Lebens mehr ignorieren als Frauen. Bolen (1984) argumentiert, daß, obwohl Archetypen universell sind, Menschen eine breite Vielfalt an Persönlichkeitsstilen zeigen, die die Entscheidung beeinflußt, der Psyche zu erlauben, bestimmte Inhalte des kollektiven Unbewußten ins Bewußtsein bringen zu dürfen. Denkbar ist dabei auch, daß spezifische Persönlichkeitsfaktoren wie Selbstbewußtsein und Klarheit des Selbstkonzepts (Campbell et al. 1996) die individuelle (unbewußte) Vorliebe für spezielle – z. B. romantische – Archetypen (Boeree 1997, Holbrook / Olney 1995) beeinflussen.

3*

36

Andrea Gröppel-Klein, Anja Domke und Benedikt Bartmann

(2) Held Archetypen werden als hilfreich für die Analyse von Mythen, Märchen und Literatur im allgemeinen angesehen. In vielen Märchen sind zwei Arten von Archetypen unübersehbar: der „Held“ und der „Cinderella“-Typus. Der „Held“ kann als der Mann charakterisiert werden, der sich in „selbstvergessener Demut“ bereiterklärt, die Schwierigkeiten der Welt auszurotten. Der Held ist der Sieger über den Drachen (Aziz 1990, S. 29) und derjenige, „der den Kampf aufnimmt und dem letztendlich aufgrund seiner Aufrichtigkeit die Stärke gegeben ist, den Drachen zu überwinden“ (Veen 1994, S. 332). Mit anderen Worten kann der Held alle Herausforderungen im Leben meistern. Außerdem ist der typische männliche Held in der Lage, eine unglückliche oder bedrohte Frau zu retten und ihr eine idyllische Existenz zu ermöglichen. (3) Cinderella In Märchen ist die weibliche Rolle oft die des „Aschenputtel-Stereotyps“. Die junge, unschuldige und schöne Frau, die in Verzweiflung oder Elend lebt oder von ihrer Stiefmutter mißhandelt wird, wird von einem prächtigen Prinzen errettet, der sie auf ewig beschützt und ihr ein wunderbares Leben frei von allen Sorgen verspricht. Dieses bereits 350jährige Märchen ist erhalten geblieben, weil es einerseits den „Unterlegenen der Gesellschaft eine Quelle der Hoffnung“ gibt, und weil die Geschichte andererseits „erblüht“ ist als „a paradigm of happily-ever-after, wishfulfilling romantic fantasy“ (Waters 2003). Es wird angenommen, daß Frauen von diesem Märchen angezogen werden, da es einen sentimentalen, aber optimistischen Ausweg aus einer komplizierten und schwierigen Realität verspricht, während bei Männern vermutet wird, daß sie sich mit dem heldenhaften und bewunderten Prinzen identifizieren möchten.

C. Archetypen und Konsumentenverhalten I. Inszenierung von Archetypen Einige Autoren (z. B. Walle 1986) schlagen die Inszenierung von Archetypen in Werbekampagnen vor. Walle (1986, S. 22) beschreibt Archetypen als „constitute valuable tools for practitioners such as strategic planners of promotional campaigns“, da archetypische Werbung unweigerlich angeborene menschliche Grundelemente und Bedürfnisse ansprechen würde. Veen (1994) behauptet, daß spezifische Archetypen, wie insbesondere der Held, hilfreich für die Erklärung des konkreten Kaufverhaltens seien (z. B. Autokauf), und daß Mythen im allgemeinen Produkten ein rituelles Image gäben. „Ritueller Konsum“ kann den Drang nach spiritueller Zufriedenheit und Selbstverwirklichung befriedigen (Rook / Levy 1983, Belk 1988, Solomon 1983, Belk et al. 1989). Nach Hirschman

Bewußte und unbewußte Wirkungen von Archetypen

37

(2000) schaffen Spielfilme, die bedeutungsvolle archetypische Figuren präsentieren, lebendige Ikonen, die von Verbrauchern als wichtige persönliche Anker verwendet werden. Dies könnte ein Grund für die Beliebtheit vieler Filme sein, die sich an archetypischen Motiven orientieren. Dieser Artikel soll u. a. dieser Hypothese auf den Grund gehen.

II. Feminismus und Cinderella-Archetypus Im Gegensatz zu obigen Überlegungen kritisiert die feministische Bewegung die Reduktion von Archetypen auf Stereotypen wie Aschenputtel oder Dornröschen. Feministinnen beklagen eine Fehldeutung der Jung’schen Theorie (z. B. Enns 1994, S. 73, Lauter / Rupprecht 1985). Sie weisen darauf hin, daß seine Vorstellung, ein unbewußter Mann existiere innerhalb der Frau (Animus) und eine unbewußte Frau innerhalb des Mannes (Anima), ein ausgewogenes Verhältnis der maskulinen und femininen Merkmale innerhalb eines Charakters impliziere und daß mental gesunde Leute sowohl eine gutentwickelte Anima als auch einen Animus besäßen. Allerdings schrieb Jung (1954 / 1959b, S. 82) in seinen Werken auch, daß Weiblichkeit mit „Gefühlen der Unterlegenheit“ verbunden wird. Da seine Arbeit in der Folgezeit überwiegend von Männern begutachtet worden ist, die in der Regel kein vitales Interesse an der Abschaffung patriarchalischer Strukturen hatten, führte diese vornehmlich aus männlicher Perspektive erfolgte Würdigung der Jung’schen Theorie dazu, daß patriarchalische Mythen gefördert und die Leistungen und Kräfte von Frauen (bzw. die Bedeutung der Anima) eher unterbewertet worden sind (Enns 1994). Lauter und Rupprecht (1985) erklären daher, daß Archetypen, obwohl stabil im Zeitablauf, dennoch in Sozialisationsprozesse eingebettet seien. Einerseits glauben Feministinnen, daß, je mehr Märchen über heldenhafte Männer und bedauernswerte Frauen existieren, es um so schwieriger für Frauen wird, stereotypische Rollenerwartungen zu verändern, wie beispielsweise: Männer sind tapfer und schlau, sie jagen und lösen Probleme, während Frauen zu Hause bleiben, sich um die Kinder kümmern, ein angenehmes Hausleben schaffen – und stets folgsam sind. Andererseits sind gegenwärtig mehr und mehr Studenten weiblich; sie erreichen oft bessere Prüfungsergebnisse als ihre männlichen Kommilitonen und mehr und mehr Frauen nehmen hohe Karrierepositionen ein. Auf diese Weise wird der Cinderella-Archetypus in Frage gestellt oder verändert sich. Das Buch „The Cinderella Complex“ (Dowling 1981) bezweifelt den völligen Verzicht der Frauen auf „Macht“ zugunsten der Männer und fragt, warum wir in den alten Märchen nie davon hören, was mit dem jungen Aschenputtel geschieht, nachdem es den Prinzen geheiratet hat. Wird Cinderella wirklich glücklich und zufrieden mit der Rolle der Ehegattin sein oder gibt es eine Tendenz, aus der zwar behüteten, aber repressiven „Schloß-existenz“ auszubrechen? Zusammenfassend können wir also fragen, ob eine junge Frau in heutiger Zeit noch davon träumt, einen prächtigen Prinzen zu finden, der sich um sie kümmert und ihr alle Sorgen abnimmt. Mit anderen Worten: Reflektieren typische Archetypen wie „Aschenputtel“ oder

38

Andrea Gröppel-Klein, Anja Domke und Benedikt Bartmann

„Dornröschen“ die Ideale der Frauen und können sie deshalb erfolgreich bei Werbestrategien verwendet werden? Die zweifellos zu beobachtende berufliche Emanzipation der Frau kann jedoch auch die Erwartungen und Lebenspläne der Männer verändert haben. Daher ist die Wirkung von Archetypen auch aus heutiger männlicher Sicht zu hinterfragen: Analog zu den obigen Ausführungen könnte man bezweifeln, daß Männer immer noch vom Heldenschema angezogen werden. Fühlt sich ein Mann immer dazu fähig oder motiviert, alle Hindernisse zu bewältigen, und ist er wirklich bestrebt, die Verantwortung für seine Ehefrau und Familie zu übernehmen? Oder führt die von ihm erwartete Heldenrolle zu einem Gefühl der Überforderung? In der Studie soll daher untersucht werden, ob Archetypen wie Aschenputtel oder Dornröschen in Werbung und Spielfilmen positive unbewußte und / oder bewußte Reaktionen verursachen. Diese allgemeine Forschungsfrage wird in den folgenden Abschnitten spezifiziert.

III. Persönlichkeit, Selbstkonzept und Archetypen Archetypen beziehen sich auf Tiefenstrukturen der menschlichen Psyche und agieren als „Organisationsprinzipien“. Es kann eine Beziehung zwischen Persönlichkeitsvariablen und bevorzugten Archetypen angenommen werden. Holbrook und Olney (1995) stellen fest, daß Menschen in ihrem Ausmaß variieren, sich entweder von Romantik (gemessen durch Items wie: „Ich denke, daß das Leben ein Ehrfurcht gebietendes Mysterium ist.“ oder „Es ist in Ordnung, sich Tagträumen hinzugeben.“) oder von der Gegendimension „Klassizismus“ (gemessen durch Items wie „Ich sehe die meisten Probleme aus wissenschaftlicher Sicht.“) angezogen zu fühlen, und daß Frauen im allgemeinen der Romantikdimension näherstehen. Dies führt zu der spezifischen Annahme, daß sich Frauen einerseits mehr durch romantische Archetypen wie Aschenputtel oder Dornröschen aktivieren lassen als männliche Personen, und daß andererseits ganz allgemein der individuelle Grad an Romantik- bzw. Klassizismus-Faibles (der auch bei Frauen unterschiedlich ausgeprägt sein kann) die wahrgenommene Anziehungskraft verschiedener Archetypen beeinflußt. In diesem Kontext können auch „Selbstkonzeptklarheit“ und „Selbstbewußtsein“ als weitere Persönlichkeitsfaktoren eine wichtige Rolle spielen. Selbstkonzeptklarheit kann definiert werden als „the extent to which self-beliefs are clearly and confidently defined, internally consistent, and stable“ (Campbell et al. 1996, S. 141). Die Klarheit des Selbstkonzepts zeigt also, ob eine Person eine genaue Vorstellung über sich selbst und ihr Leben hat. Selbstbewußtsein charakterisiert das Ausmaß, mit dem eine Person sich selbst überzeugt positive Eigenschaften oder Fähigkeiten zuschreibt. Menschen mit entweder hohem oder niedrigem Selbstbewußtsein unterscheiden sich in der Einschätzung ihrer eigenen individuellen Erfolge im Leben (Campbell et al. 1996). Im weiteren soll diskutiert werden,

Bewußte und unbewußte Wirkungen von Archetypen

39

ob „Selbstkonzeptklarheit“ und „Selbstbewußtsein“ auch die Reaktionen auf typische Archetypen beeinflussen. Hier wird angenommen, daß Individuen, die Fragen wie „Wer oder was bin ich?“ oder „Wie sehe ich mich selbst?“ noch nicht beantwortet und daher unklare Selbstkonzepte haben, eher von Cinderella-archetypischen Motiven angesprochen werden, da diese Märchen (wie bereits ausgeführt) eine Quelle der Hoffnung oder einen Anker geben, wie sich das Leben positiv ändern könnte – entweder in der Rolle des Helden (männliche Perspektive) oder der des geretteten Mädchens (weibliche Perspektive). Im Gegensatz zur Klarheit des Selbstkonzepts ist die Relevanz des Selbstbewußtseins nicht so eindeutig. Es wird vermutet, daß einerseits Frauen mit starkem Selbstbewußtsein weniger von Cinderella-Stereotypen und mehr von starken weiblichen Heldinnen angezogen werden. Weil diese selbstsicheren Frauen sich selbst als erfolgreich sehen, gibt es keinen Grund für sie, auf mutige Prinzen zu warten, die sie retten und alle Probleme für sie bewältigen (dies ist ein mehr feministisches Argument, wie oben erwähnt). Andererseits muß auch eine Frau, die von Aschenputtelgeschichten fasziniert ist, ein Minimum an Selbstbewußtsein besitzen, weil sie sonst niemals glauben könnte, daß sich eines Tages ein Prinz für sie interessiert. Folglich könnte eine Identifikation mit einem Cinderella-Archetyp gar nicht stattfinden, da es ihre kühnsten Träume sprengen würde, daß ein solcher Prinz ausgerechnet sie erretten könnte. Ebenso brauchen Männer ein Minimum an Selbstbewußtsein, weil sie anderweitig nicht in der Lage wären, sich mit dem Helden und seinen Fähigkeiten zu identifizieren. Zusammenfassend wird hier hypothetisch davon ausgegangen, daß prinzipiell alle Personen von Archetypen angesprochen werden können, daß es dabei aber verschiedene Faszinationsgrade in Abhängigkeit der erörterten Persönlichkeitseigenschaften gibt.

D. Forschungsperspektive I. Positivistische, experimentelle Forschungsperspektive In der Konsumentenverhaltensforschung gibt es bereits einige qualitative Ansätze, die die Bedeutung von Archetypen in der Werbung untersuchen (z. B. Veen 1994, Walle 1986, Hirschman 2000). Außerdem finden sich viele Artikel, die die Rolle von männlichen oder weiblichen Stereotypen in der Werbung analysieren (DeYoung / Crane 1992, Fenell 1984, Artz / Venkatesh 1991, Johar et al. 2003, Orth / Holancova 2004). Jedoch scheint es keine experimentellen oder positivistischen Studien zu geben, die die Wirkung und Effizienz von in der Werbung und in Filmen verwendeten Archetypen erkunden. Ein möglicher Grund für diesen Mangel an Forschung ist, daß Jung – im Gegensatz zu Freud, dessen Theorie mit den Naturwissenschaften

40

Andrea Gröppel-Klein, Anja Domke und Benedikt Bartmann

verbunden war und der dazu tendierte, stets in Ursache-Wirkungs-Beziehungen zu denken – an den „Synchronismus“ von Ereignissen glaubte, welcher nicht aus einer mechanistischen Perspektive oder mit Hilfe typischer Experimente erklärt werden kann. Synchronismus ist das (unerwartete) gleichzeitige Auftreten von zwei Ereignissen, die in ihrer Bedeutung miteinander in Beziehung stehen. Zum Beispiel greifen Menschen manchmal zum Telefon, um einen Freund anzurufen, um dann nur festzustellen, daß ihr Freund schon in der Leitung ist. Jung (1953) glaubte, daß das kollektive Unbewußte für das Auftreten synchroner Ereignisse verantwortlich sei. Wie schon erwähnt, war Freud von der Vorstellung fasziniert, daß seine Theorie eines Tages durch die neurologische Forschung bestätigt werden könne. Dagegen soll Jung an einer naturwissenschaftlichen Fundierung seiner Theorie nicht interessiert gewesen sein und dagegen erklärt haben: „Anyone who wants to know the human psyche will learn next to nothing from experimental psychology. He would better be advised to abandon exact science“ (zitiert in Boeree 1997, S. 1). Obwohl Jung somit der experimentellen Forschung skeptisch gegenüberstand (und sich vielleicht im Grabe umdrehen würde, wenn er diesen Beitrag lesen könnte), soll hier die Rolle von Archetypen in Werbung und Filmen mit Hilfe eines Experiments untersucht werden, bei dem die Reaktionen der Testpersonen auf archetypische Darstellungen gemessen werden. Dazu wurden sowohl männliche als auch hauptsächlich weibliche Studierende aller Fakultäten der Europa-Universität Viadrina im Oktober 2004 gebeten, an diesem Versuch teilzunehmen. Es wurden bewußt junge Studierende gewählt, um zu garantieren, daß die Testpersonen über Optionen zu grundsätzlich verschiedenen Lebensperspektiven (z. B. Fokus auf Karriere oder auf Familie) verfügten. Da es jedoch wahrscheinlich ist, daß viele Studierende sowohl die Wirkung von Aschenputtel-Stereotypen als auch den Widerstand der Feministinnen zu diesen Mythen kennen, muß das Problem sozial erwünschter Antworten berücksichtigt werden. Es könnte der Fall sein, daß weibliche Studierende sich zwar vom Cinderella-Märchen angezogen fühlen, aber nicht wagen, dies zuzugeben, weil sie befürchten, gegen eine ungeschriebene „feministische Studentenphilosophie“ zu verstoßen. Die Einstellungen der Testpersonen wurden deshalb nicht nur mit Hilfe verbaler Skalen gemessen, sondern ihre Reaktionen wurden auch mit Hilfe der Messung ihrer phasischen Aktivierung erfaßt. Letzteres Verfahren kann auch unbewußtes Annäherungsverhalten aufdecken. II. Psychophysiologische Perspektive und die Bedeutung der Aktivierung in der Werbung Aus psychophysiologischer Sicht wird Aktivierung als Erregungsvorgang verstanden, durch den das Individuum leistungsbereit und -fähig wird. Aktivierung kann als der grundlegende neurophysiologische Prozeß definiert werden, der allen Vorgängen im menschlichen Organismus zugrunde liegt. Auf diese Weise ist Akti-

Bewußte und unbewußte Wirkungen von Archetypen

41

vierung die Basis von Emotionen, Motivationen, Informationsverarbeitung und Verhaltensreaktionen (Buck 1988, Öhman et al. 1993, Bagozzi et al. 1999). Aktivierung kann von tiefem Schlaf über gemäßigte Werte bis hin zu Panik variieren. Es kann grundsätzlich zwischen tonischer und phasischer Aktivierung unterschieden werden. Die tonische Aktivierung bestimmt die länger anhaltende Bewußtseinslage (Wachheit) und die allgemeine Leistungsfähigkeit. Sie verändert sich nur langsam und ist häufig von tagesperiodischen Einflüssen oder lang andauernder bzw. intensiver externer Reizeinwirkung abhängig. Als phasische Aktivierung werden die kurzfristigen Aktivierungsschwankungen bezeichnet, die als Reaktionen auf bestimmte Reize auftreten und die spezielle Leistungsfähigkeit des Individuums bei einer Stimulusverarbeitung anzeigen. Die phasische Aktivierung ist eng mit dem Konstrukt Aufmerksamkeit verbunden, also mit der kurzfristig erhöhten Sensibilisierung des Organismus, die dafür sorgt, daß biologisch bedeutsame Reize aufgenommen und irrelevante Stimuli gehemmt werden. Auslöser von Aktivierung können sowohl innere (z. B. Stoffwechselprozesse, gedankliche Aktivitäten) als auch äußere Reize sein (Boucsein 1997). Marketingstudien zeigen die Relevanz der phasischen Aktivierung in der Marketingkommunikation. Kroeber-Riel (1979) untersuchte die Wirkung schwacher, mittlerer und hoher Aktivierungspotentiale von Anzeigen auf die Erinnerung und die Einstellungen zu den Anzeigen und zur dort abgebildeten Marke. Er fand Unterstützung für die Hypothese, wonach stark aktivierende Reize eine positive Wirkung auf die Werbeeffizienz ausüben. Empirische Studien am Point of Sale stellen fest, daß die empfundene Aktivierung zu mehr Freude am Einkaufen, zu einer längeren Verweildauer im Geschäft und einer höheren Wiederbesuchswahrscheinlichkeit führt sowie zu der Tendenz, mehr Geld im Geschäft auszugeben (Donovan /Rossiter 1982, Groeppel-Klein 1997, Groeppel-Klein / Baun 2001, Tai / Fung 1997, Van Kenhove / Desrumaux 1997). Auf diese Weise ist Aktivierung ein wichtiger Faktor für die Vorhersage des Annäherungsverhaltens. Da Konsumenten außerdem ihre Aktivierungsreaktionen nicht willentlich beeinflussen können, ist Aktivierung ein gültiger Indikator für unbewußte Reaktionen, und es besteht im Unterschied zu verbalen Erhebungen nicht die Gefahr sozial erwünschter Antwortreaktionen (Behrens / Neumaier 2004).

III. Hypothesen H1: Wenn ein Fernsehwerbespot einen typischen Märchen-Archetypus präsentiert, dann ruft dieser eine höhere phasische Aktivierung hervor als Werbefilme ohne einen solchen Archetypus. H2a: Spielfilme, die typische Cinderella-Archetypen als Charaktere zeigen, werden im allgemeinen eine höhere phasische Aktivierung hervorrufen und positiver beurteilt als Filme, die tapfere, kämpfende, aber auch eigennützige weibliche Charaktere präsentieren. Allerdings:

42

Andrea Gröppel-Klein, Anja Domke und Benedikt Bartmann

H2b: Frauen mit einem überdurchschnittlich klaren Selbstkonzept und einem unterdurchschnittlichen Sinn für Romantik werden weniger von CinderellaArchetypen angezogen als Frauen mit den entgegengesetzten Persönlichkeitseigenschaften. H3: Konsistenzhypothese: Konsumenten, die hohe phasische Aktivierungsreaktionen in bezug auf archetypische Fernsehwerbung zeigen, werden auch stark von archetypischen Spielfilmen aktiviert.

IV. Messung der Aktivierung Verschiedene verbale Methoden sind zur Messung der empfundenen Aktivierung verwendet worden. Jedoch sind die von diesen Skalen abgeleiteten Ergebnisse strittig und vor allem die mangelnde Diskriminanzvalidität der verbalen Operationalisierung der Aktivierung im Vergleich zur verbalen Messung von Emotionen wie „Freude“ oder „Vergnügen“ ist kritisiert worden (Van Kenhove / Desrumaux 1997, Vitouch 1997). Grundsätzlich gibt es drei Gründe für Kritik an verbalen Meßmethoden (ausführlich siehe Gröppel-Klein 2004): (1) Die Auswahl von passenden Items, die die wahrgenommene Aktivierung repräsentieren sollen. (2) Eine verbale Äußerung der Aktivierung erfordert eine Form der kognitiven Beurteilung durch das Individuum, das sich (in einem Nicht-Meßzustand) der Aktivierung eventuell gar nicht bewußt wäre (daher können verbale Skalen nur bewußte Reaktionen messen). (3) Verbale Messungen können nur mit einem gewissen Zeitverzug zur erlebten Situation durchgeführt werden, die erinnerte Aktivierung ist jedoch in der Regel abgeschwächter als im Moment ihrer Entstehung (Groeppel-Klein /Baun 2001). Im Gegensatz zu diesen Methoden sind die physiologischen Maße wie Herzfrequenz, Elektroenzephalogramm (EEG) und Elektrodermale Aktivität (EDA) valide Indikatoren der Aktivierung, weil die absichtliche Beeinflussung der von diesen Methoden erhaltenen Testergebnisse fast unmöglich ist. Außerdem ist EDA ein sehr empfindlicher und gültiger Indikator insbesondere bei niedrigen Aktivierungsreaktionen (Boucsein 1992, S. 263). Die elektrodermale Reaktion (EDR zeigt phasische Aktivierung) wird als Meßinstrument für Aktivierungsprozesse empfohlen, die sich im dritten System des dreidimensionalen Aktivierungsmodells von Boucsein (1997) manifestieren. Letzteres ist verantwortlich für (bewußtes und unbewußtes) Annäherungsverhalten (Boucsein 1997). Im Gegensatz zur Herzfrequenz zeigt EDR sogar die allerkleinste psychophysiologische Änderung an (Boucsein 1992). Es wird daher angenommen, daß EDR ein sensitiver Indikator der Aktivierung ist, der bedeutsam für das Verhalten ist und simultan mit der Wahrnehmung von Reizen aufgezeichnet werden kann. Aufgrund dieser Vorteile wurde

Bewußte und unbewußte Wirkungen von Archetypen

43

in diesem Experiment die elektrodermale Reaktion erhoben1. Zwei EDR-Parameter sind von besonderer Relevanz: (1) Die Amplitude beschreibt die Stärke jeder phasischen Aktivierungsreaktion (Boucsein 1992, Cacioppo et al. 1983)2. Nach Steiger (1988) kann die Intensität der wahrgenommenen Aktivierung über einen gewissen Zeitraum durch Aufsummieren aller einzelnen Amplituden erhalten werden, um die Summenamplitude zu berechnen. Die Summenamplitude ist der wichtigste Parameter für die phasische Aktivierung in Experimenten. (2) Der zweite wichtige Parameter ist die sogenannte Frequenz, die die Anzahl der Reaktionen angibt. Jede Hautleitreaktion demonstriert die besondere Aufmerksamkeit einer Person in Richtung eines Objekts (Steiger 1988).

E. Experimentalaufbau Die Studie wurde im Oktober 2004 an der Europa-Universität Viadrina in Frankfurt (Oder) durchgeführt. Hierzu wurden Studierende zufällig ausgesucht und gefragt, ob sie Interesse an der Teilnahme an einem Experiment zur Werbewirkungsforschung hätten, das dann in kleinen Gruppen zu jeweils zwei bis vier Teilnehmern durchgeführt wurde. Zunächst füllten alle Versuchsteilnehmer einen allgemeinen Fragebogen zu ihren Einstellungen bezüglich Karriere, Familie und typischen männlichen und weiblichen Stereotypen aus. Zusätzlich waren Items des Romanticism-Classicism-Index (Holbrook / Olney 1995) sowie Statements zur Messung der Klarheit des Selbstkonzeptes und des Selbstbewußtseins (Campbell et al. 1996) mit Hilfe einer fünfstufigen Rating-Skala zu bewerten. Bevor die Präsentation von sechs verschiedenen Werbespots sowie eines anschließenden Filmausschnitts begann, wurde ein Teilnehmer der Gruppe über Elektroden mit dem Aktivierungsmeßgerät verbunden. Dieser Teilnehmer wurde gebeten, sich ganz entspannt alle Filme anzusehen, so als ob er zu Hause vor dem Fernseher säße. 1 Für die Aufzeichnung wurde ein exosomatischer Ansatz gewählt, der auf Gleichstrom (0,4 V) und der Hautleitfähigkeit basiert. Die technische Ausrüstung umfaßt einen 12-Bit analog-digital (A / D) Konverter. Es wurden zwei mit einer 0,5 % NaCl Elektrodencreme gefüllten Ag / AgCl Elektroden verwendet. Die Elektroden wurden bei Rechtshändern an der linken Handfläche, bei Linkshändern umgekehrt, angeschlossen. 2 Um die Amplituden für alle Studien zu berechnen, wählten wir ein Minimalamplitudenkriterium von 0,01s, um die Aufnahme von Artefakten durch das Signal-Rausch-Verhältnis auszuschließen (Boucsein 1992, Venables / Christie 1980). Während der Messung der EDR kann die Überlappung von Amplituden auftreten, das heißt, eine zweite Amplitude folgt einer ersten, obwohl das Ausgangsniveau noch nicht erreicht worden ist. Bei überlappenden Amplituden wurde für die Datenanalyse das Ausgangsniveau jeder Amplitude für sich als Basis gewählt, ohne Rücksicht auf die Erholungszeit der vorangegangenen Amplitude (Boucsein 1992).

44

Andrea Gröppel-Klein, Anja Domke und Benedikt Bartmann

Im Gegensatz zu allen anderen Werbespots beinhaltete nur der dritte Werbespot ein archetypisches Motiv: Ein Prinz dringt in ein verwunschenes Märchenschloß ein, um Dornröschen zu retten. Er versucht, die schlafende Prinzessin wachzuküssen, doch alle Küsse bewirken nichts. Erst als der Prinz eine Packung Kekse (Prinzenrolle) hervorholt und der Prinzessin einen duftenden Keks unter die Nase hält, erwacht sie. Glückselig über ihre Rettung ist sie von ihrem edlen Helden begeistert, und beide liegen sich glücklich in den Armen. Nach den Werbespots sah die eine zufällig ausgewählte Hälfte der Versuchspersonen die letzte Szene des Films „Pretty Woman“ und die andere Hälfte einen Ausschnitt des Films „Vom Winde Verweht“. Während der EDR-Aufzeichnung wurde der Beginn jedes einzelnen Werbespots und des Filmausschnitts markiert, um auf diese Weise die Aktivierung pro Werbespot bzw. Filmausschnitt zu registrieren. Den Teilnehmern wurde erklärt, daß eine typische Werbeunterbrechung simuliert werden solle, wie sie bei Spielfilmen im Fernsehen vielfach anzutreffen ist. Tatsächlich aber wurden diese beiden Filme ausgewählt, da einerseits „Pretty Woman“ offensichtlich vom Cinderella-Archetyp geprägt ist, während andererseits in „Vom Winde Verweht“ mit Scarlett O’Hara eine selbständige, um die Plantage ihrer Familie kämpfende und nach heutigen Maßstäben durchaus emanzipierte Frau präsentiert wird. Eine Internet-Recherche ergab, daß Scarlett von Zuschauern charakterisiert wird als „a woman, who fought with her sweat and blood to keep her family’s plantation, a woman who rose after every war, every obstacle“ (unbekannter Rezensent, www.home-garden-shopping.com / vhs / Gone-with-the-Wind. asp) und daß „her incredible tenacity makes her a contender“ (Isaacs 2004, S. 4). Der Film war somit ein Teil des Experiments, wenngleich die Versuchsteilnehmer ihn als reine Ablenkungsphase empfanden und nicht ahnten (wie uns auch die Testpersonen später bestätigten), daß die Filmausschnitte mit Bedacht ausgesucht wurden, um die elektrodermale Reaktion zu dem Cinderella-Archetypus bzw. der emanzipierten Frauenfigur zu messen. Nach dem jeweiligen Filmausschnitt wurden der EDR-Testperson die Elektroden abgenommen und die gesamte Gruppe beantwortete weitere Fragen zu den Einstellungen zum Werbespot und zur Marke (reduzierte Adjektiv-Liste nach Edell / Burke 1987), der Einstellung zum Film sowie zu soziodemographischen Variablen. Da die Einstellungsmessung bezüglich aller Werbespots zu viel Zeit in Anspruch genommen hätte und das Hauptinteresse auf dem dritten Werbespot mit dem märchenhaften Archetyp lag, wurden nur die Reaktionen zu diesem Werbespot abgefragt. Um dieses besondere Interesse zu kaschieren, wurde den Versuchspersonen mitgeteilt, daß sie selbst per Los den zu bewertenden Werbespot bestimmen könnten. Die Lose waren manipuliert, damit stets der archetypische Werbespot gezogen und bewertet wurde. Insgesamt nahmen 59 männliche und 126 weibliche Testpersonen am Experiment teil. Nach Ausschluß von Artefakten (z. B. hervorgerufen durch Druck auf die Elektroden, Einzelheiten siehe Boucsein 1992) verblieben 92 valide EDR-Datensätze und 91 zusätzliche Datensätze ohne EDR-Daten. Bezüglich soziodemographischer

Bewußte und unbewußte Wirkungen von Archetypen

45

Variablen (Alter, verfügbares Einkommen, Studiengang) bestehen keine signifikanten Unterschiede zwischen den Teilnehmern, denen entweder „Pretty Woman“ oder „Vom Winde Verweht“ gezeigt wurde. Es muß jedoch betont werden, daß nur eine etwa neunminütige Schlüsselszene des jeweiligen Films gezeigt wurde und daß es einen signifikanten Unterschied zwischen den beiden Gruppen hinsichtlich des Bekanntheitsgrades der Filme gab („Vom Winde Verweht“ bereits gesehen: n ˆ 16, „Pretty Woman“ bereits gesehen: n ˆ 37). Für die weitere Analyse ist diese ungleiche Verteilung zu berücksichtigen, da bekannte Ereignisse normalerweise weniger hohe Aktivierung hervorrufen als neuartige Stimuli (Baltissen, 1994). Die Werbespots waren allen Teilnehmern bekannt, da es sich um aktuelle Werbekampagnen handelte.

F. Empirische Ergebnisse Vor der Überprüfung der Hypothesen wurde die Stichprobe nach Unterschieden zwischen Männern und Frauen bezüglich der Einstellung zu Karriere, Familie, Romantik, Selbstkonzept und Selbstbewußtsein untersucht. Es ergaben sich für die in Tabelle 1 dargestellten Statements signifikante Unterschiede zwischen männlichen und weiblichen Teilnehmern. Dies zeigt, daß sich auch heutzutage noch typische männliche und weibliche Stereotypen aufzeigen lassen. Tabelle 1 Unterschiede zwischen Männern und Frauen Varianzhomogenität Statement Fakten sind für mich wichtiger als Gefühle. Der Mann muß eine klare berufliche Perspektive haben, weniger die Frau.a) Ich glaube an die Liebe auf den ersten Blick. Meine Ansichten über mich selbst ändern sich regelmäßig.

Geschlecht

n

Mittelwert

männlich

59

0,287

weiblich

126

–0,119

männlich

59

0,330

weiblich

127

–0,157

männlich

59

–0,207

weiblich

127

0,104

männlich

59

–0,225

weiblich

127

0,109

ANOVA

LeveneStatistik

Sign.

F-Wert

Sign.

0,636

0,426

6,722

0,010

20,886

0,000

9,891

0,002

0,069

0,793

3,974

0,048

0,005

0,944

4,538

0,034

a) Aus Platzgründen wurde hier ein verkürztes Statement angegeben. Originalstatement: „Ich glaube, daß es auch in der heutigen Zeit letztendlich wichtiger ist, daß vor allem der Mann eine klare berufliche Perspektive hat, weniger die Frau.“

46

Andrea Gröppel-Klein, Anja Domke und Benedikt Bartmann

In einem zweiten Schritt wurde untersucht, ob signifikante Unterschiede zwischen männlichen und weiblichen Teilnehmern hinsichtlich der phasischen Aktivierung bei dem gezeigten archetypischen Werbespot und dem Film bestehen. Hier wurden keine signifikanten Unterschiede gefunden, was ein Beleg dafür sein könnte, daß sich entweder Männer vom Helden-Motiv und Frauen vom Cinderella-Motiv angesprochen fühlen oder nicht. Darüber hinaus zeigt dieses Ergebnis, daß bei der Prüfung der ersten Hypothese zwischen männlichen und weiblichen Testpersonen nicht differenziert werden muß. Die erhobenen Statements hinsichtlich Karriere, Familie, Romantik, Selbstkonzept, Selbstbewußtsein sowie Einstellung zum Werbespot, zur Marke und zum Film wurden mittels Faktorenanalysen verdichtet, wobei die Statements eindeutig auf den postulierten Dimensionen laden.

I. Ergebnisse der Hypothese 1 H1: Wenn ein Fernsehwerbespot einen typischen Märchen-Archetypus präsentiert, dann ruft dieser eine höhere phasische Aktivierung hervor als Werbefilme ohne einen solchen Archetypus. Um einen typischen Werbeblock im Fernsehen zu simulieren, wurden den Teilnehmern sechs Werbespots gezeigt. Dabei diente der erste Werbespot als „Eisbrecher-Spot“, damit sich die Testpersonen an die EDR-Elektroden gewöhnen konnten, und wurde daher bei der weiteren Analyse nicht berücksichtigt. Wie bereits erwähnt, beinhaltete nur ein Werbespot einen typischen Märchen-Archetypus („Dornröschen“, Prinzenrolle-Spot, siehe Tabelle 2). Tabelle 2 Inhalt der untersuchten Werbespots Werbespot

Kurzbeschreibung

Calgon (Wasserenthärter)

Eine Hausfrau berichtet von Problemen mit ihrer Waschmaschine, woraufhin ihr ein Techniker den Wasserenthärter von Calgon empfiehlt.

Prinzenrolle (Keks)

Alle Versuche eines Prinzen, Dornröschen wachzuküssen, mißlingen, bis er sie mit dem Duft der Prinzenrolle doch aufwecken kann. Dornröschen ist gerettet und sofort hingerissen vom heldenhaften Prinzen.

Lycos (Suchmaschine)

In einer Eislaufhalle bewerten mehrere Hunde ähnlich einer Eiskunstlaufjury verschiedene Internetseiten.

Jever (Bier)

Ein Mann spaziert an der Küste entlang, genießt die Landschaft und die Ruhe – und denkt dabei an das beworbene Bier.

D2 (Mobilfunk)

Zwei Frauen bringen in ihrem Großraumbüro gezielt ein Gerücht in Umlauf und beobachten, wie lange es dauert, bis sie das Gerücht als offizielle Nachricht per Voice-Mail wieder erreicht.

Bewußte und unbewußte Wirkungen von Archetypen

47

Für die Untersuchung der ersten Hypothese wurde ein Friedman-Test durchgeführt, um die fünf Werbespots hinsichtlich der Frequenz und Summenamplitude miteinander zu vergleichen. Die Ergebnisse des Tests (Tabelle 3) zeigen, daß der archetypische Spot sowohl bezüglich der Frequenz als auch der Summenamplitude den höchsten Rang im Vergleich zu den anderen Spots aufweist. Zusätzlich wurde ein Wilcoxon-Test als nichtparametrischer Test für verbundene Stichproben angewandt, um zu untersuchen, ob ein signifikanter Unterschied zwischen dem archetypischen Spot mit dem höchsten Rang und dem Werbespot mit dem jeweils zweithöchsten Rang (D2) besteht. Hier konnte ein signifikanter Unterschied zwischen den beiden Werbespots hinsichtlich der Frequenz (p ˆ 0; 011) ermittelt werden. Die Differenz zwischen den Summenamplituden (p ˆ 0; 081) der beiden Spots ist dagegen nicht auf dem Signifikanzniveau von 5 %, sondern nur auf einem 10 %-Niveau signifikant. Dennoch geben die Ergebnisse die vorausgesagte Richtung wieder, und eine Bestätigung der Hypothese 1 kann zumindest für die Frequenz, die die Anzahl der Aufmerksamkeitsreaktionen mißt, angenommen werden. Tabelle 3 Aktivierungsunterschiede zwischen den Werbespots EDR Parameter Frequenz

Friedman-Test Werbespot: Markenname

n

A: Calgon

Mittelwert

Mittlerer Rang

92

27,93

2,78

92

45,72

3,65

C: Lycos

92

34,20

3,13

D: Jever

92

21,54

2,17

E: D2

92

36,35

3,27

Summen- A: Calgon amplitude a) (in -Sie- B: Prinzenrolle mens) C: Lycos

92

1397,97

2,85

92

2092,27

3,72

92

1769,12

2,96

D: Jever

92

1126,94

2,22

E: D2

92

2060,91

3,26

B: Prinzenrolle

a) b)

a)

Statistik

Wilcoxon-Test (Werbespots B und E)

X 2 : 48,336 Z-Wertb): –2,532 Sign.: 0,000 Sign.: 0,011

X 2 : 45,002 Z-Wertb): –1,743 Sign.: 0,000 Sign.: 0,081

Werbespot B verwendet das archetypische Motiv. Basierend auf positiven Rängen.

Die durch den archetypischen Spot hervorgerufene Summenamplitude als metrische Variable wurde standardisiert und in eine nominal-skalierte Variable transformiert, um hochaktivierte (überdurchschnittlich aktivierte) von wenig aktivierten

48

Andrea Gröppel-Klein, Anja Domke und Benedikt Bartmann

(unterdurchschnittlich aktivierten) Testpersonen zu trennen. Der Vergleich dieser Gruppen zeigt, daß Personen, die durch den archetypischen Werbespot hoch aktiviert (HA) wurden, auch eine bessere Einstellung zum Werbespot und zum Produkt angaben, als diejenigen, die gering aktiviert (GA) wurden (M = Mittelwert): – Werbespot Faktorwert „unterhaltsam“: MHA = 0,527; MGA = –0,287 (p = 0,002); – Werbespot Faktorwert „wertvoll“: MHA = 0,475; MGA = –0,133 (p = 0,009); – Markenbewertung Faktorwert „wertvoll“: MHA = 0,260; MGA = –0,252 (p = 0,064; – Kaufwahrscheinlichkeit: MHA = 0,643; MGA = –0,381 (p = 0,000); – Weiterempfehlungswahrscheinlichkeit: MHA = 0,413; MGA = –0,312 (p = 0,009).

Diese Ergebnisse zeigen, daß eine hohe Aktivierung zu hoher Werbeeffizienz führt, und untermauern die Relevanz von Hypothese 2b, die untersucht, welche Persönlichkeitstypen besonders durch den archetypischen Werbespot aktiviert werden. Zunächst soll jedoch mit H2a die Aktivierungswirkung der Filmausschnitte untersucht werden. II. Ergebnisse der Hypothese 2a H2a: Spielfilme, die typische Cinderella-Archetypen als Charaktere zeigen, werden im allgemeinen eine höhere phasische Aktivierung hervorrufen und positiver beurteilt als Filme, die tapfere, kämpfende, aber auch eigennützige weibliche Charaktere präsentieren. Hypothese 2a unterstellt unterschiedliche Aktivierungs- und Einstellungswerte bei den beiden Filmen „Pretty Woman“ und „Vom Winde Verweht“. Wie bereits erwähnt, können neuartige Stimuli oftmals höhere Aktivierungswerte hervorrufen als bereits bekannte Stimuli. Um diese Verzerrung zu vermeiden und die Aktivierung durch die beiden Filme vergleichen zu können, wurden nur die Testpersonen in die folgende Analyse aufgenommen, die den Film zuvor schon einmal gesehen hatten (für die gesamte Stichprobe waren die Ergebnisse vergleichbar). Die Ergebnisse des Mann-Whitney-Tests (Tabelle 4) bestätigen die Hypothese 2a bezüglich der phasischen Aktivierung. Für den Vergleich der Einstellung zum Film zwischen beiden Gruppen wurde eine ANOVA durchgeführt, in die die Daten aller Probanden eingingen. Die Ergebnisse der ANOVA bestätigen die Hypothese 2a hinsichtlich der Einstellung zum Film (Tabelle 5).

Bewußte und unbewußte Wirkungen von Archetypen

49

Tabelle 4 Aktivierungsunterschiede zwischen den Filmen Mann-Whitney-Test EDR Parameter Frequenz

Summenamplitude (in -Siemens) a)

Film

na)

Pretty Woman

37

Vom Winde Verweht

Mittelwert

Mittlerer Rang

Rangsumme

854,30

30,01

1110,50

16

431,19

20,03

320,50

Pretty Woman

37

56031,68

29,84

1104,00

Vom Winde Verweht

16

23691,90

20,44

327,00

MannSign. Whitney(2-seitig) U-Wert 184,500

0,031

191,000

0,042

Nur Probanden, die den jeweiligen Film bereits kannten.

Tabelle 5 Unterschiede in der Einstellung zum Film zwischen den Gruppen Varianzhomogenität Faktor Einstellung zum Film a)

a)

Mittelwert

Film

n

Pretty Woman

97

0,288

Vom Winde Verweht

91

–0,307

ANOVA

LeveneStatistik

Sign.

F-Wert

Sign.

3,133

0,078

18,135

0,000

Alle Probanden.

III. Ergebnisse der Hypothese 2b H2b: Frauen mit einem überdurchschnittlich klaren Selbstkonzept und einem unterdurchschnittlichen Sinn für Romantik werden weniger von CinderellaArchetypen angezogen als Frauen mit den entgegengesetzten Persönlichkeitseigenschaften. Hypothese 2b untersucht den Zusammenhang zwischen Persönlichkeitstypen und der Beurteilung der Filme. Um unterschiedliche weibliche Persönlichkeitstypen (und damit die unabhängige Variable) zu bilden, wurde zunächst eine hierarchische Clusteranalyse durchgeführt (Ward-Verfahren mit quadrierten Euklidischen Distanzen), bei der sich mit Hilfe des Elbow-Kriteriums (Timm 2002) eine optimale Clusteranzahl von 3 ableiten ließ. Mit dieser Information wurde die endgültige Clusterlösung mittels einer Clusterzentrenanalyse gebildet. Die Charakteristika der drei Persönlichkeitscluster sind in Tabelle 6 dargestellt. 4 FS Kaas

50

Andrea Gröppel-Klein, Anja Domke und Benedikt Bartmann Tabelle 6 Clusterzentren der endgültigen Lösung

Faktoren

Cluster 1 (n ˆ 40)

2 (n ˆ 45)

ANOVA 3 (n ˆ 36)

romantische selbständige Frauen ohne TräumeVerstandes- Selbstwertrinnen menschen gefühl

F-Wert

Sign.

–0,25474

0,41172

–0,46601

10,282

0,000

0,69209

–0,93240

0,24009

69,440

0,000

–0,13521

0,17675

0,09415

1,456

0,237

Romantik

0,52714

–0,10732

–0,45509

10,879

0,000

Karriereorientierung

0,28771

0,23526

–0,54508

11,107

0,000

Wunsch nach Luxus

–0,02778

0,16764

–0,00725

0,476

0,623

Widerstand gegen traditionelle Werte

–0,18988

–0,12148

0,05535

0,650

0,524

Vertrauen auf die eigene Intuition

0,34830

0,04303

–0,00213

1,359

0,261

Unklares Selbstkonzept

0,76117

–0,45529

–0,19208

25,279

0,000

Hohes Selbstwertgefühl

0,43594

0,24945

–1,00675

40,562

0,000

Rationale Persönlichkeit Wunsch nach Geborgenheit und danach, beschützt zu werden Wunsch nach wenig aufregendem, aber sicher vorhersehbarem Leben

Gemäß der Ergebnisse der Clusteranalyse kann man die weiblichen Versuchsteilnehmer in drei Gruppen einteilen: Die Frauen des ersten Segments sind charakterisiert durch Romantik, sie geben sich gern Tagträumen hin und glauben an die Liebe auf den ersten Blick. Sie wollen durch ihren zukünftigen Ehemann beschützt werden und sehnen sich nach einem sorgenfreien Leben. Obwohl sie ein sehr hohes Selbstwertgefühl haben, ist ihr Selbstbild sehr unklar. Dieses Segment wird hier als „romantische Träumerinnen“ bezeichnet. Für die Mitglieder der zweiten Gruppe ist es wichtig, eher Fakten als Gefühlen zu vertrauen und immer einen kühlen Kopf zu bewahren. Sie haben ein klares Selbstbild und ebenfalls ein hohes Selbstwertgefühl. Daher wird diese Gruppe als die „selbständigen Verstandesmenschen“ umschrieben. Die dritte Gruppe ist durch einen extrem negativen Wert

Bewußte und unbewußte Wirkungen von Archetypen

51

der Variable „hohes Selbstwertgefühl“ gekennzeichnet, was sich dadurch begründet, daß diese Frauen sich selbst als erfolglos sehen. Da sie weder energisch noch karriereorientiert sind, geben sie sich nicht einmal Tagträumen, wie sie ihr Leben ändern könnten, hin. Nichtsdestotrotz wollen sie in ihrem Leben wohlbehütet sein. Die Mitglieder dieses Clusters sind somit „ohne Selbstwertgefühl“. Für die Prüfung der Hypothese 2b sind hauptsächlich die erste und zweite Gruppe von Relevanz, da sie durch entgegengesetzte Werte in bezug auf die Klarheit des Selbstkonzepts und Romantik unterschieden werden können. Bei der Prüfung auf Aktivierungsunterschiede zwischen den Persönlichkeitstypen konnten nur die Probandinnen berücksichtigt werden, für die EDR-Daten vorliegen, wodurch sich eine geringere Gruppengröße als in Tabelle 6 angegeben ergibt. Daher wurde mit dem Kruskal-Wallis-Test wiederum ein nichtparametrischer Test angewandt. In bezug auf die Aktivierung durch den archetypischen Werbespot ergeben sich signifikante Unterschiede zwischen den Persönlichkeitsgruppen sowohl für die Summenamplitude als auch für die Frequenz (Tabelle 7). Die Aktivierungsreaktionen in bezug auf den archetypischen Film „Pretty Woman“ weisen dagegen keine signifikanten Unterschiede zwischen den drei Gruppen auf. Leider waren die Gruppengrößen zu gering, um die Aktivierung durch den Film „Vom Winde Verweht“ zwischen den Gruppen miteinander vergleichen zu können. Insofern kann Hypothese 2b, derzufolge Frauen mit einem sehr klaren Selbstkonzept und geringem Sinn für Romantik (selbständige Verstandesmenschen) durch Cinderella-Archetypen weniger aktiviert werden als Frauen mit entgegengesetztem Charakter (romantische Träumerinnen), nur hinsichtlich des Werbespots, nicht aber bezüglich des Films bestätigt werden. Bedeutet dies vielleicht, daß sich auch Frauen mit kühlem Kopf nicht dem Einfluß der „Pretty Woman Story“ entziehen können? Oder besitzen die hier teilnehmenden Testpersonen beides, sowohl eine ausgeprägte Anima als auch einen ausgeprägten Animus? Neben den Tests auf Unterschiede in den unbewußten (Aktivierungs-)Reaktionen wurden mit Hypothese 2b außerdem die bewußten Einschätzungen der Mitglieder der drei Persönlichkeitsgruppen anhand der verbalen Werbewirkungsstatements untersucht (Tabelle 8). Mit Hilfe von Varianzanalysen konnten signifikante Unterschiede zwischen den Gruppen in bezug auf die Einschätzung des Werbespots als wertvoll (p ˆ 0; 037) sowie die Einschätzung der Marke als wertvoll (p ˆ 0; 047) ermittelt werden. Paarweise Vergleiche der einzelnen Gruppen zeigten jedoch, daß diese Ergebnisse hauptsächlich durch die Unterschiede zwischen den romantischen Träumerinnen und den selbständigen Verstandesmenschen hervorgerufen werden. Für weitere Einstellungsdimensionen konnten keine signifikanten Unterschiede festgestellt werden. Somit sind diese Ergebnisse wiederum als teilweise Bestätigung für Hypothese 2b anzusehen.

4*

52

Andrea Gröppel-Klein, Anja Domke und Benedikt Bartmann Tabelle 7 Aktivierungsunterschiede der Persönlichkeitstypen in bezug auf den archetypischen Werbespot Kruskal-Wallis-Tests EDR Parameter

Frequenz: Archetypischer Werbespot

Summenamplitude (in -Siemens): Archetypischer Werbespot

Persönlichkeitstyp

n

Mittelwert Mittlerer Rang

Romantische Träumerinnen

17

54,53

41,85

Selbständige Verstandesmenschen

24

29,33

25,92

Frauen ohne Selbstwertgefühl

22

41,36

31,02

Romantische Träumerinnen

17

2480,07

42,53

Selbständige Verstandesmenschen

24

1368,24

26,29

Frauen ohne Selbstwertgefühl

22

1930,62

30,09

X2

Sign. (Einzelvergleiche)

7,635

0,022 (1 – 2: 0,005 1 – 3: 0,079 2 – 3: 0,372)

8,176

0,017 (1 – 2: 0,003 1 – 3: 0,058 2 – 3: 0,582)

Tabelle 8 Unterschiede zwischen den Persönlichkeitstypen in bezug auf die Einstellung zum Werbespot und zur Marke Oneway ANOVA Faktoren

Einschätzung des Werbespots als wertvoll

Einschätzung der Marke als wertvoll

Persönlichkeitstyp

n Mittelwert

Romantische Träumerinnen

38

0,483

Selbständige Verstandesmenschen

41

–0,052

Frauen ohne Selbstwertgefühl

35

–0,084

Romantische Träumerinnen

37

0,333

Selbständige Verstandesmenschen

43

–0,122

Frauen ohne Selbstwertgefühl

35

–0,120

F-Wert

Sign. (Einzelvergleiche)

3,394

0,037 (1 – 2: 0,028 1 – 3: 0,025 2 – 3: 0,895)

3,139

0,047 (1 – 2: 0,027 1 – 3: 0,037 2 – 3: 0,992)

Bewußte und unbewußte Wirkungen von Archetypen

53

Um den Einfluß der Gruppenzugehörigkeit auf die Einstellung zum Film zu untersuchen, wurde ein Kruskal-Wallis-Test durchgeführt (vgl. Tabelle 9). Dessen Ergebnisse zeigen, daß die romantischen Träumerinnen eine signifikant positivere Einstellung zum archetypischen Film „Pretty Woman“ aufweisen als Mitglieder der beiden anderen Persönlichkeitsgruppen (p ˆ 0; 010). Dies ist wiederum als Teil-bestätigung für Hypothese 2b zu werten. Unter den Probandinnen, denen der Ausschnitt von „Vom Winde Verweht“ gezeigt wurde (der im Unterschied zum Cinderella-Archetyp in „Pretty Woman“ eine unabhängige, selbständige Frau zeigt), zeigen die selbständigen Verstandesmenschen eine tendenziell größere Sympathie zum Film als die beiden anderen Gruppen. Dieser Unterschied ist jedoch nicht signifikant (p ˆ 0; 214). Tabelle 9 Unterschiede zwischen Persönlichkeitstypen in bezug auf die Einstellung zum Film Kruskal-Wallis-Tests Faktoren

Einstellung zum archetypischen Film (Pretty Woman)

Einstellung zum nichtarchetypischen Film (Vom Winde Verweht)

Persönlichkeitstyp

Romantische Träumerinnen Selbständige Verstandesmenschen

n

21

Mittelwert Mittlerer Rang 0,757

39,43

0,209

29,83

24

Frauen ohne Selbstwertgefühl

16

–0,109

21,69

Romantische Träumerinnen

19

–0,188

30,45

Selbständige Verstandesmenschen

21

0,103

34,31

Frauen ohne Selbstwertgefühl

19

–0,622

24,79

X2

Sign. (Einzelvergleiche)

9,241

0,010 (1 – 2: 0,072 1 – 3: 0,003 2 – 3: 0,159)

3,086

0,214 (1 – 2: 0,448 1 – 3: 0,286 2 – 3: 0,090)

IV. Ergebnisse der Hypothese 3 H3: Konsistenzhypothese: Konsumenten, die hohe phasische Aktivierungsreaktionen in bezug auf archetypische Fernsehwerbung zeigen, werden auch stark von archetypischen Spielfilmen aktiviert. Um Hypothese 3 zu testen, wurden die Korrelationen zwischen der Frequenz bzw. der Summenamplitude des archetypischen Werbespots mit denen des archetypischen Films („Pretty Woman“) berechnet. Aufgrund der starken signifikanten Korrelationen kann die Hypothese 3 als bestätigt angesehen werden.

54

Andrea Gröppel-Klein, Anja Domke und Benedikt Bartmann Tabelle 10 Konsistenz der Aktivierung zwischen archetypischem Spot und Film Archetypischer Film

n ˆ 35

Frequenz

Archetypischer Werbespot a) b)

Frequenz Summenamplitude

Summenamplitude

0,761a) (0,000)b) 0,735a) (0,000)b)

Korrelationskoeffizient nach Pearson. 2-seitige Signifikanz.

G. Zusammenfassung, Ausblick und Diskussion Die Ergebnisse der empirischen Studie belegen, daß märchenhafte Archetypen, wie hier anhand eines Werbespots und eines Spielfilms untersucht, einen positiven Einfluß auf die Aktivierungsparameter (unbewußte Wirkungen, da EDR-Messungen nicht willentlich beeinflußt werden können) und die bewußte Beurteilung durch Konsumenten ausüben. Besonders Frauen, die Wert auf Romantik legen und ein unklares Selbstbild haben, sind von Archetypen fasziniert. Die Studie zeigt jedoch auch, daß sich selbst emanzipierte weibliche „Verstandesmenschen“ dem Einfluß von Cinderella-Geschichten wie „Pretty Woman“ nicht entziehen können. Hinsichtlich der Effekte der Werbespots und Filme konnten keine Unterschiede zwischen Männern und Frauen festgestellt werden. Dies könnte bedeuten, daß Männer sich mit der Rolle des Helden und Frauen mit der der geretteten Prinzessin identifizieren. Einige Einschränkungen der empirischen Ergebnisse sind noch zu erwähnen: Die Erkenntnisse basieren auf relativ kleinen Gruppengrößen, was hauptsächlich auf die aufwendige EDR-Messung zurückzuführen ist. Jede aufgenommene Reaktionskurve muß von Hand auf Artefakte hin geprüft werden. Da die Studie nur mit Studenten durchgeführt wurde, sollte sie mit Männern und Frauen jeglichen Alters und Einkommens wiederholt werden. Aufgrund der geringen Stichprobengröße besteht weiterer Forschungsbedarf. Erste Ergebnisse einer im Frühjahr 2005 durchgeführten zweiten Studie zu dieser Thematik (Gröppel-Klein / Domke / Bartmann 2005) unterstützen die bisher gewonnenen Erkenntnisse. Hier wurde der Dornröschen-Prinzenrolle-Spot mit einem eher informativen Spot von Prinzenrolle verglichen, bei dem mehrere Köche mit langen Kochmützen und weißen Schürzen die leckere Schokoladencreme für die Kekse zubereiten und voller Genuß kosten, sowie mit einem Hanuta-Spot, der eine fechtende Frau zeigt, die gegen einen der Musketiere gewinnt und dabei ein Hanuta erobert. Der Dornröschen-Spot löste signifikant höhere Aktivierung aus als die beiden anderen Werbefilme, was zeigt, daß weder der Markenname „Prinzenrolle“ noch die Produktkategorie „Süßigkeiten“ allein für die Ergebnisse verantwortlich

Bewußte und unbewußte Wirkungen von Archetypen

55

sind. Weiterhin wurde in der zweiten Studie „Pretty Woman“ mit dem Film „Erin Brockovich“ verglichen, der ebenfalls Julia Roberts in der Hauptrolle zeigt, doch nicht in einer Cinderella-Rolle, sondern als eine für die Gerechtigkeit kämpfende Frau. Auch bei diesem Vergleich schnitt „Pretty Woman“ signifikant besser ab. Nicht zuletzt wäre es interessant, die von uns ausgewählten Archetypen auch aus einer qualitativen Forschungsperspektive zu analysieren und solche qualitativen Erkenntnisse mit den bereits vorliegenden quantitativen Ergebnissen zu kombinieren sowie die Aktivierungsreaktionen der Filme auch anhand der Sympathy / Empathy-Skala von Escalas und Stern (2003) zu untersuchen.

Literatur Artz, Nancy / Venkatesh, Alladi (1991): Gender Representation in Advertising, in: Advances in Consumer Research, Vol. 18, S. 618 – 623 Aziz, Robert (1990): C. G. Jung’s Psychology of Religion and Synchronicity Bagozzi, Richard P. / Gopinath, Mahesh / Nyer, Prashanth U. (1999): The Role of Emotions in Marketing, in: Journal of the Academy of Marketing Science, Vol. 27, S. 184 – 206 Baltissen, Rüdiger (1994): Gewöhnung und Informationsverarbeitung. Assoziation, Gestalt und die Extrapolation der Erfahrung Behrens, Gerold / Neumaier, Maria (2004): Der Einfluß des Unbewußten auf das Konsumentenverhalten, in: Konsumentenverhaltensforschung im 21. Jahrhundert, S. 3 – 28 Belk, Russell W. (1988): Possessions and the Extended Self, in: Journal of Consumer Research, Vol. 15, S. 139 – 168 Belk, Russell W. / Wallendorf, Melanie / Sherry, John F. (1989): The Sacred and Profane in Consumer Behavior: Theodicy on the Odyssey, in: Journal of Consumer Research, Vol. 1, S. 1 – 38 Boeree, George C. (1997): Carl Jung (http: // www.ship.edu / ~cgboeree / jung.html) Bolen, Jean Shinoda (1984): Goddesses in Everywomen Boucsein, Wolfram (1992): Electrodermal Activity – (1997): Aktivierung, in: Luczak, Holger / Volpert, Walter (Hrsg.), Handbuch Arbeitswissenschaft, S. 309 – 312 Buck, Ross (1988): Human Motivation and Emotion, 2. Aufl. Cacioppo, John T. / Marshall-Goodell, Beverly S. / Gormezano, Isidore (1983): Social Psychology: Bioelectrical Measurement, Experimental Control, and Analog-to-Digital Data Aquisition, in: Cacioppo, John T. / Petty, Richard E. / Shapiro, David (Hrsg.), Social Psychology: A Sourcebook, S. 666 – 690 Campbell, Jennifer D. / Trapnell, Paul D. / Heine, Steven J. / Katz, Ilana M. / Lavellee, Loraine F. / Lehman, Darrin R. (1996): Self-Concept Clarity: Measurement, Personality Correlates, and Cultural Boundaries, in: Journal of Personality and Social Psychology, Vol. 70, S. 141 – 156

56

Andrea Gröppel-Klein, Anja Domke und Benedikt Bartmann

DeYoung, Susan / Crane, F. G. (1992): Females’ Attitudes Toward the Portrayal of Women in Advertising: A Canadian Study, in: International Journal of Advertising, Vol. 11, S. 249 – 256 Donovan, Robert J. / Rossiter, John R. (1982): Store Atmosphere: An Environmental Psychology Approach, in: Journal of Retailing, Vol. 28, S. 34- 57 Dowling, Colette (1981): The Cinderella Complex: Women’s Hidden Fear of Independence Edell, Julie A. / Burke, Marian Chapman (1987): The Power of Feelings in Understanding Advertising Effects, in: Journal of Consumer Research, Vol. 14, S. 421 – 433 Enns, Carolyn Zerbe (1994): Archetypes and Gender: Goddesses, Warriors, and Psychological Health, in: Journal of Counseling & Development, Vol. 73, S. 127 – 133 Escalas, Jennifer Edson / Stern, Barbara B. (2003): Sympathy and Empathy: Emotional Responses to Advertising Dramas, in: Journal of Consumer Research, Vol. 29, S. 566 – 578 Fenell, Geraldine (1984): Avoiding Sex Role Stereotyping in Advertising: What Questions Should We Ask?, in: Advances in Consumer Research, Vol. 11, S. 88 – 93 Freud, Sigmund (1933): New Introductory Lectures on Psychoanalysis Groeppel-Klein, Andrea (1997): The Influence of the Dominance Perceived at the POS on the Price-Assessment, in: European Advances in Consumer Research, Vol. 3, S. 303 – 344 – (2004): Aktivierungsforschung und Konsumentenverhalten, in: Konsumentenverhaltensforschung im 21. Jahrhundert, S. 29 – 66 Groeppel-Klein, Andrea / Baun, Dorothea (2001): The Role of Customers’ Arousal for Retail Stores – Results from An Experimental Pilot Study Using Electrodermal Activity as Indicator, in: Advances in Consumer Research, Vol. 28, S. 412 – 419 Groeppel-Klein, Andrea / Domke, Anja / Bartmann, Benedikt (2005): Pretty Woman or Erin Brockovich – Unconscious and Conscious Reactions to Commercials and Movie Shaped by Fairy Tale Archetypes, Europa Universität Viadrina (in Vorbereitung) Hirschman, Elizabeth C. (2000): Consumers’ Use of Intertextuality and Archetypes, in: Advances in Consumer Research, Vol. 27, S. 57 – 63 Holbrook, Morris B. / Olney, Thomas J. (1995): Romanticism and Wanderlust: An Effect of Personality on Consumer Preference, in: Psychology & Marketing, Vol. 12, S. 207 – 222 Isaacs, Susan (2004): Brave Dames and Wimpettes (http: // www.susanisaacs.com / bib / brave_dames.php) Johar, Gita Venkataramani / Moreau, Page / Schwarz, Norbert (2003): Gender Typed Advertisements and Impression Formation: The Role of Chronic and Temporary Accessibility, in: Journal of Consumer Psychology, Vol. 13, S. 220 – 230 Jung, Carl Gustav (1953): Two Essays on Analytical Psychology, in: The Collected Works of C. G. Jung, Vol. 7 – (1954 / 1959a): The Archetypes and the Collective Unconscious, in: The Collected Works of C. G. Jung, Vol. 9, Part I, S. 3 – 41 – (1954 / 1959b): Psychological Aspects of The Mother Archetype, in: The Collected Works of C. G. Jung, Vol. 9, Part I, S. 75 – 110 – (1961): Memories, Dreams, Reflections

Bewußte und unbewußte Wirkungen von Archetypen

57

Kroeber-Riel, Werner (1979): Activation Research: Psychobiological Approach in Consumer Research, in: Journal of Consumer Research, Vol. 5, S. 240 – 250 Lauter, Estella / Rupprecht, Carol (1985): Feminist Archetypal Theory Öhman, Arne / Esteves, Francisco / Flykt, Anders / Soares, Joaquim J.F. (1993): Gateways to Consciousness: Emotion, Attention, and Electrodermal Activity, in: Roy, Jean-Claude / Boucsein, Wolfram / Fowles, Don C. / Gruzelier, John (Hrsg.), Progress in Electrodermal Research, S. 137 – 157 Orth, Ulrich R. / Holancova, Denisa (2004): Men’s and Women’s Responses to Sex Role Portrayals in Advertisements, in: International Journal of Research in Marketing, Vol. 21, S. 77 – 88 Rook, Dennis W. / Levy, Sidney J. (1983): Psychosocial Themes in Consumer Grooming Rituals, in: Advances in Consumer Research, Vol. 10, S. 329 – 333 Solomon, Michael R. (1983): The Role of Products as Social Stimuli: A Symbolic Interactions Perspective, in: Journal of Consumer Research, Vol. 10, S. 319 – 329 Steiger, Andreas (1988): Computergestuetzte Aktivierungsmessung in der Marketingforschung Stevens, Anthony (1982): Archetypes: A Natural History of the Self Tai, Susan H. C. / Fung, Agnes M. C. (1997): Application of an Environmental Psychology Model to In-store Buying Behavior, in: The International Review of Retail, Distribution, and Consumer Research, Vol. 7, S. 311 – 337 Timm, Neil H. (2002): Applied Multivariate Analysis Van Kenhove, Patrick / Desrumaux, Patrick (1997): The Relationship Between Emotional States and Approach or Avoidance Responses in a Retail Environment, in: The International Review of Retail, Distribution and Consumer Research, Vol. 7, S. 351 – 368 Veen, Steve Vander (1994): The Consumption of Heroes and the Hero Hierarchy of Effects, in: Advances in Consumer Research, Vol. 21, S. 332 – 336 Venables, Peter H. / Christie, Margaret J. (1980): Electrodermal Activity, in: Martin, Irene / Venables, Peter H. (Hrsg.), Techniques in Psychophysiology, S. 3 – 67 Vitouch, Peter (1997): Psychophysiological Methods in Media Research, in: WinterhoffSpurk, Peter / van der Voort, Tom H. A. (Hrsg.), New Horizons in Media Psychology, S. 116 – 124 Walle, Alf (1986): Archetypes, Athletes and Advertising, in: Journal of Consumer Marketing, Vol. 3, S. 21 – 29 Waters, Jen (2003): Cinderella. A Biography of An Archetype, in: Washington Times, 31. Mai 2003

Präferenzstrukturen und Zahlungsbereitschaften für Online-Medieninhalte: Eine empirische Analyse am Beispiel von Online-Videoangeboten Thomas Nitschke und Henrik Sattler

A. Einleitung Einer der Wachstumsmärkte im Internet mit massiven Auswirkungen auf die traditionellen Wertschöpfungsketten ist die Online-Distribution von Medieninhalten, wie beispielsweise digitalisierte Musik oder Kinofilme. Mit der starken Verbreitung von privaten ADSL Breitbandzugängen zum Internet sowie dem großen Erfolg von benutzerfreundlichen Filesharing Tauschbörsen, wie zum Beispiel Napster und dessen Nachfolger, wurde das Internet zu einem bedeutenden Absatzkanal für Medieninhalte. Trotz der zeitweiligen Schließung von Napster und einer stärkeren rechtlichen Verfolgung von Copyright-Verletzungen erfreut sich der Austausch von Dateien im Internet, das so genannte Filesharing1, ungebrochener Beliebtheit. So nutzten im Oktober 2003 laut Nielsen / NetRatings 9,35 Millionen Europäer die derzeit größte Tauschbörse „KaZaA“, was 9,6 % aller privaten Internetnutzer entspricht. Diese nicht-kommerziellen und weitestgehend illegalen Angebote verursachen in der Medienindustrie ganz erhebliche Umsatzeinbußen.2 Gleichzeitig unterstreicht die starke Adoption des Internets als Absatzkanal auch das erhebliche Potenzial dieser neuen Distributionsform für kommerzielle Anbieter. Vor diesem Hintergrund arbeitet die Medienindustrie derzeit verstärkt an kommerziellen Geschäftsmodellen. Kostenpflichtige Musikinhalte bietet in Deutschland via Internet beispielsweise PhonoLine. Kinofilme können gegen Entgelt unter anderem bei T-Vison oder Arcor erworben werden. In den USA bietet MovieLink seit einiger Zeit einen vergleichbaren kommerziellen Service, der allgemein auch als „Video on Demand over IP“ (im folgenden kurz VoD) bezeichnet werden kann. Die technischen Barrieren für solche Angebote schwinden dabei zusehends. Aktu1 In diesem Beitrag bezeichnet Filesharing oder Filesharing-Netzwerk (im Deutschen auch als Tauschbörse bezeichnet) ein bestimmtes Anwendungsgebiet von Peer-to-Peer Technologien (vgl. Schoder / Fischbach 2003). 2 Allein die Filmindustrie beziffert in Deutschland ihren Schaden auf jährlich 800 Mio. Euro; o. V. (2004). Unter den Nutzern von Tauschbörsen wurde im Jahr 2002 ein Nachfragerückgang von 25 % verzeichnet; knapp 100 Mio. CD-Rohlinge wurden mit Filmkopien bespielt; vgl. GfK (2003).

60

Thomas Nitschke und Henrik Sattler

elle Software, wie zum Beispiel die Media Center Edition des Betriebssystems von Microsoft, ermöglichen es privaten Haushalten, Musik, Film oder Fernsehen in digitaler Form vom PC auf dem Fernseher oder über die Stereo-Anlage zu konsumieren. Eine gemeinsame Anstrengung von Filmindustrie, Geräteherstellern und Internetanbietern kann alle notwendigen Voraussetzungen schaffen, um diesen lukrativen Markt zu erschließen. Der beeindruckende Erfolg der Musikplattform iTune belegt dabei, dass durch eine klare Ausrichtung an den Bedürfnissen der Konsumenten und ein innovatives Preismodell trotz illegaler Wettbewerber hohe Umsätze erzielt werden können. Die Medienindustrie unternimmt derzeit große Anstrengungen, die kostenlose Verbreitung in Tauschbörsen zurückzudrängen. Durch juristische Maßnahmen und eigene legale Angebote konnten in den USA die Nutzerzahlen der Tauschbörse „KaZaA“ von März bis Oktober 2003 von 15,7 auf 11,5 Millionen zurückgedrängt werden (Nielsen / NetRatings 2003) Es bleibt aber fraglich, wie schnell und wie vollständig sich diese Angebote aus dem Markt verdrängen lassen. Auf nicht absehbare Zeit ist davon auszugehen, dass nicht-kommerzielle Tauschbörsen eine bedeutende Konkurrenz zu kommerziellen Angeboten darstellen. Aus Sicht der Medienunternehmen stellt sich die zentrale Frage, wie sie sich gegenüber dem weitgehend kostenlosen Angebot von nicht-kommerziellen Tauschbörsen differenzieren können und in welchem Maße Zahlungsbereitschaften für kommerzielle Angebote bestehen. Ansatzpunkte für eine Differenzierung können eine überlegene Produktqualität oder geringere Transaktionskosten darstellen. Im Gegensatz zu Musiktiteln, die in Tauschbörsen in weitestgehend hoher, konstanter Qualität innerhalb nur weniger Minuten bezogen werden können, ist der Erwerb von Filmen im Internet – dem empirischen Beispiel in diesem Beitrag – meist mit deutlich höherem Aufwand verbunden. Während die technischen Standards sich zunehmend vereinheitlichen, bleiben die Downloadzeiten sowie die Bild- und Tonqualität ein wesentliches Problem. Das Herunterladen von Kinofilmen (auch komprimiert etwa 200-fach größer als eine Musikdatei) benötigt derzeit über ADSL Breitbandnetze in etwa so lange wie die gesamte Spiellänge des Films. In Tauschbörsen werden solch hohe Download-Geschwindigkeiten aufgrund eines erheblichen Nachfrageüberhangs nicht erreicht, und das Herunterladen dauert in der Regel einige Tage, oftmals auch Wochen (vgl. Fetscherin 2003). Dabei ist es keineswegs sicher, den Film in akzeptabler Qualität zu erhalten. Die Qualität reicht von „DVD-ähnlich“ bis „kaum noch erkennbar“. Auch bewusst falsch benannte Dateien oder solche mit unbrauchbarer Qualität werden gezielt in die Tausch-börsen eingeschleust, teilweise direkt durch die Medienindustrie veranlasst, um die Suche zusätzlich zu verlängern. In welchem Maße eine unterschiedliche Bildqualität oder die Zeit, die für die Suche eines Films aufgewendet werden muss, tatsächlich präferenzdeterminierend sind, ist bislang wissenschaftlich nicht untersucht worden. In einer vergleichbaren Situation wie Musik- und Filmindustrie befinden sich im Internet auch andere Anbieter von digitalen Inhalten, wie beispielsweise Zeitungs-

Präferenzstrukturen / Zahlungsbereitschaften für Online-Medieninhalte

61

verlage oder Nachrichtensender. Auch hier könnte eine zuverlässige bzw. höhere Qualität und das Ersparen einer zeitaufwendigen Suche aus Sicht der Konsumenten ein Preis-Premium rechtfertigen. Die Literatur befasst sich allgemein sowohl mit den Auswirkungen von Qualitätsheterogenität auf das Wahlverhalten (vgl. z. B. Kahn / Meyer 1991) als auch mit dem Trade-off der Konsumenten zwischen monetärem und zeitlichem Aufwand (vgl. z. B. Okada / Hoch 2004). Bislang liegen jedoch keine wissenschaftlichen Studien dazu vor, wie Präferenzstrukturen und Zahlungsbereitschaften in diesem Kontext gemessen werden können. Ein erstes Ziel dieses Beitrags besteht darin, am Beispiel von Online-Videoangeboten eine Methodik zur Messung von Präferenzstrukturen und Zahlungsbereitschaften auf Basis einer Choice-Based-Conjoint-Analyse vorzustellen und empirisch zu testen. Als zweites Ziel sollen für eine wichtige Zielgruppe potenzieller Nachfrager von Online-Videoangeboten deren Präferenzen und Zahlungsbereitschaften ermittelt werden, um hierauf aufbauend Marktchancen und Handlungsempfehlungen für kommerzielle Anbieter ableiten zu können.

B. Untersuchungsdesign Die Datenerhebung erfolgte im Sommer 2003 an einer deutschen Universität als Bestandteil eines umfangreichen Laborexperiments. Die 288 Teilnehmer waren fast ausschließlich Studenten und Mitarbeiter aus verschiedenen Fakultäten. Voraussetzung für die Teilnahme waren Erfahrungen mit Filesharing-Netzwerken, jedoch nicht zwingend Expertenkenntnisse, sowie ein hohes Interesse an Kino bzw. Video. Die Incentivierung durch Videotheken-Gutscheine stellte zudem ein hohes Interesse der Teilnehmer am Thema Videodistribution sicher. Alle Teilnehmer sind aufgrund ihrer spezifischen Internet-Erfahrung potenzielle Kunden eines kommerziellen VoD-Service und daher für den Untersuchungsgegenstand dieser Studie besonders geeignet. Zudem kann für die folgenden Validitätsprüfungen vermutet werden, dass Studenten und Nicht-Studenten keine signifikanten Unterschiede aufweisen (vgl. Sattler et al. 2001). Untersuchungsgegenstände sind Online-Videoangebote, hier speziell Filme. Alle 20 in die Untersuchung einbezogenen Filme fanden sich in den VideothekenVerleih-Charts des Sommers 2003 und wurden gezielt so ausgewählt, dass eine möglichst hohe Attraktivität für die zumeist studentischen Versuchspersonen vermutet werden konnte. Die Messung der Präferenzstrukturen und der individuellen Zahlungsbereitschaft für die Online-Videoangebote erfolgte mittels einer computer-basierten Choice-based Conjoint-Befragung (CBC; vgl. Louviere / Woodworth 1983; Gensler 2003). Als zweite eigenständige Messung und auch zur Validitätsprüfung wurden vorab in einer schriftlichen Befragung Präferenzdaten zur Online-Video-Distribution direkt erhoben. Gerade die Analogie der Entscheidungssituation zu einer realen Auswahlsituation begründet die Annahme, dass CBC besonders gut reales Wahlverhalten abbilden kann. Diese besondere Eignung wurde

62

Thomas Nitschke und Henrik Sattler

in einer Vielzahl von Studien nachgewiesen und anhand von realen Marktdaten überprüft.3 In der CBC Erhebung wurden den Teilnehmern insgesamt 26 Auswahlentscheidungen abverlangt. 23 Auswahlentscheidungen mit randomisiertem Design flossen in die Bestimmung der Teilnutzenwerte ein, die verbleibenden drei dienten als Holdouts mit vorgegebenem Design. Bei jeder Auswahl galt es, drei vollständige Produktkonzepte bzw. Online-Videoangebote zu beurteilen. Zusätzlich war die so genannte „None-Option“ verfügbar, das heißt es konnte auch angegeben werden, keines der drei Konzepte zu wählen. Der geschätzte Nutzenwert dieser „None-Option“ bildet einen zentralen Referenzpunkt in den folgenden Auswertungen. Jedes Produktkonzept eines Choice Sets wurde anhand der Attribute Bildqualität, Downloadzeit, Nutzungsdauer und Preis mit den in Tabelle 1 aufgeführten Attributsausprägungen beschrieben. Alle Attribute und Ausprägungen wurden den Teilnehmern vor Beginn der Erhebung ausführlich erläutert. Die Bildqualität nimmt eine besondere Rolle ein, da die heterogene Qualität in Tauschbörsen ein wichtiges Differenzierungsmerkmal für kommerzielle Anbieter darstellen könnte. Diese ist bestimmt durch die Güte der Kopiervorlage und durch das Komprimierungsverfahren. In der Praxis führt dies zu einem Qualitätsspektrum von exzellenter Bildqualität auf einer oder mehreren CD-ROMs mit einer DVD als Vorlage bis hin zu kleinen Kopien von im Kinosaal mäßig abgefilmten Versionen, die kaum noch erkennbar sind. Die Bildqualität wurde in der Untersuchung variiert in den Stufen „hoch“, „mittel“ und „gering“. Die beste Ausprägung entspricht hier einer Bildqualität, die sich kaum von einer DVD unterscheidet. Die Qualität der mittleren Stufe fällt davon schon deutlich ab; das Bild ist beispielsweise grobkörnig oder läuft nicht ganz flüssig. Filme in Tauschbörsen liegen oftmals in dieser Form vor. Die geringste Qualitätsstufe ist gekennzeichnet durch eine deutlich beeinträchtigte Bildqualität, die weit unter dem Niveau eines Fernsehbildes liegt und bei der viele Details des Bildes nicht mehr erkennbar sind. Um sicherzustellen, dass jeder Teilnehmer diese Qualitätsstufen vergleichbar wahrnimmt, wurde allen Teilnehmern vorab eine kurze, bearbeitete Filmsequenz in den drei Qualitätsabstufungen vorgeführt. 3 Vgl. z. B. Hartmann (2004); Hartmann / Sattler (2004); Louviere et al. (2000); Toubia et al. (2004). Im deutschsprachigen Schrifttum bezweifeln jüngst Backhaus und Brzoska (2004) die externe Validität der CBC und ganz grundsätzlich deren Eignung in der Preisresponsemessung. Basierend auf der Arbeit von Brzoska (2003) vergleichen Backhaus und Brzoska (2004) Preisresponsefunktionen für DVD-Player, die zum einen auf CBC und zum anderen auf einer Vickrey Auktion beruhen. Allerdings sind die vorgenommene Einstufung der Gebote aus der Vickrey Auktion als „beobachtete Kaufanteile“ und die daraus abgeleiteten „realen Preisreaktionen“ (Backhaus / Brzoska 2004, S. 52) nicht nachvollziehbar. Lediglich ein einziges dieser Gebote erreicht den tatsächlichen Ladenpreis (vgl. Brzoska 2003, S. 209), und nur ein Bruchteil der ursprünglichen Gebote wird überhaupt in den Vergleich einbezogen, sodass auch die Schlussfolgerungen nicht überzeugen können.

Präferenzstrukturen / Zahlungsbereitschaften für Online-Medieninhalte

63

Tabelle 1 Attribute und Attributsausprägungen der CBC Attribut in CBC

Ausprägung 1

Ausprägung 2

Ausprägung 3

Bildqualität

hoch

mittel

gering

Wartedauer, bis Wiedergabe möglich (Downloadzeit)

Start sofort

1-2 Stunden

12-24 Stunden

Nutzungsdauer

48 Stunden

1 Monat

unbegrenzt

Preis

3,60 €

1,80 €

0,60 €

Ausprägung 4

4-6 Tage

0,00 €

Die Downloadzeit oder auch Wartedauer bis zum vollständigen Erhalt eines Films ist im Internet im Vorwege schwer einzuschätzen. Liegen die Filme in für hohe Qualität typischen Dateigrößen vor, so benötigt ein Konsument mit privatem Breitbandzugang zum Internet mindestens ebenso lange für das Herunterlanden des Films wie dessen Gesamtspielzeit. Kann also der Anbieter gewährleisten, dass für den Kunden tatsächlich konstant eine entsprechend hohe Datenrate verfügbar ist, so ist die Wiedergabe des Films theoretisch sofort möglich. Kommerzielle Anbieter können ein solches „echtes“ VoD bereits heute anbieten. Jedoch ist die garantierte Verfügbarkeit einer hohen Bandbreite auf der „letzten Meile“ bis zum Konsumenten mit erheblichem Aufwand verbunden und liegt im Einflussbereich des Internetzugangsanbieters nicht des VoD-Anbieters. Dieser Engpass würde sich deutlich entzerren, wenn die Konsumenten bereit wären, den Film ein bis zwei Stunden „vorzubestellen“ und erst mit dieser Verzögerung die Wiedergabe zu starten. Will ein Konsument den Film in einer Tauschbörse beziehen, muss mit deutlich längeren Wartezeiten gerechnet werden. Weit verbreitete Filme, die ein Massenpublikum ansprechen, können mit Glück innerhalb eines Tages heruntergeladen werden. Typischerweise dauert dies aber mehrere Tage oder auch (mehr als) eine Woche.4 Filme, die aus Tauschbörsen bezogen wurden, können beliebig oft wiedergegeben werden. Die Nutzungsdauer ist somit, wie auch beim käuflichen Erwerb einer DVD, unbegrenzt. Filme, die bei einem kommerziellen Anbieter online erworben werden, sind durch ein so genanntes „Digital Rights Management“ (vgl. Becker et al. 2003) geschützt. Diese Technologie erlaubt es dem Anbieter unter anderem zu bestimmen, wie oft bzw. in welchem Zeitraum der Film abgespielt werden darf. Existierende kommerzielle Anbieter ermöglichen diese Wiedergabe in der Regel für 24 oder 48 Stunden nach der ersten Wiedergabe und lehnen sich damit an die Nutzungsmodalitäten von Videotheken an. Im Vergleich zu Videotheken, denen Opportunitätskosten entstehen, wenn Filme über einen längeren 4 Laut einer Studie von Fetscherin (2003) können 40 % aller Film-Downloads in KaZaA nicht innerhalb von 48 Stunden erfolgreich abgeschlossen werden.

64

Thomas Nitschke und Henrik Sattler

Zeitraum vermietet werden, könnten Online-Anbieter die Nutzungsdauer ohne wesentliche zusätzliche Kosten verlängern (z. B. 1 Monat). Um das Bedeutungsgewicht des Preises zuverlässig zu messen und darauf aufbauend Zahlungsbereitschaften abzuleiten, muss aufgrund der nicht-kommerziellen Angebote als Untergrenze der Preis von 0,– A berücksichtigt werden. Die Obergrenze des Preisintervalls sollte sich an kommerziellen Anbietern orientieren, die für einen Film etwa vier Euro verlangen. Es sind weitere Attribute denkbar, die zur Erklärung der Präferenzstruktur beitragen könnten. Hierunter fallen beispielsweise die Wiedergabemöglichkeiten (nur auf dem PC oder auf dem Fernseher), die Sprachversion des Films oder auch die Legalität des Anbieters. Die verschiedenen technischen Standards und damit verbunden die Wiedergabetechnologien vereinheitlichen sich zur Zeit und werden voraussichtlich sehr bald keine Barriere mehr darstellen. Die Sprache des Films oder die Legalität eines Anbieters können ein wichtiges Entscheidungskriterium darstellen, sind jedoch in der Regel nicht kompensatorisch, widersprechen damit dem in Conjoint Analysen angenommenen Nutzenmodell und sollten daher in separaten Studien untersucht werden. Zudem kann angenommen werden, dass diese drei Kriterien in Relation zu den oben genannten Attributen für sehr viele Konsumenten eine eher nachrangige Rolle spielen.

C. Empirische Befunde Im folgenden Abschnitt wird zunächst die auf Basis der CBC Analyse ermittelte Präferenzstruktur, auch unter Berücksichtigung von Heterogenität, vorgestellt. Hierauf aufbauend wird der Nutzen eines kommerziellen VoD-Angebotes ohne nichtkommerzielle Wettbewerber ermittelt und die individuelle Zahlungsbereitschaft abgeleitet. Schließlich wird analysiert, inwieweit diese Zahlungsbereitschaft Bestand haben kann, wenn nicht-kommerzielle Anbieter in unmittelbaren Wettbewerb treten. I. Präferenzstruktur Um die Heterogenität der Befragten zu berücksichtigen und Teilnutzenwerte auf individueller Ebene zu erhalten, wurde auf den hierarchischen Bayes Ansatz zurückgegriffen (vgl. Gensler 2003; Moore 2004). Das Schätzmodell lässt sich wie folgt darstellen (vgl. ausführlich Gensler 2003): …1†

  exp ^h0 xi   ^ ph;i ˆ P exp ^h0 xi0

8h 2 H; i 2 Ca und Ca  I

i0 2Ca

…2†

^h  MVN …; †

8h 2 H

Präferenzstrukturen / Zahlungsbereitschaften für Online-Medieninhalte

65

wobei ^ph;j : geschätzte Auswahlwahrscheinlichkeit für das i-te Produkt bzw. Stimulus für den h-ten Konsumenten, ^h : Vektor der geschätzten Nutzenparameter für den h-ten Konsumenten, Ca : Indexmenge der Stimuli im a-ten Choice-Set, xi

: Vektor der Eigenschaftsausprägungen des i-ten Produktes bzw. Stimulus,



: Mittelwertvektor der Verteilung der Nutzenparameter, : Varianz-Kovarianz-Matrix der Verteilung der Nutzenparameter über alle Konsumenten hinweg.

Zur Schätzung des hierarchisches Bayes Modells in CBC wurde die Software Sawtooth eingesetzt. Die mittleren Teilnutzenwerte der Gesamtstichprobe sind in Tabelle 2 wiedergegeben. Vereinfachend und Linearität unterstellend werden die relativen Spannweiten der einzelnen Attribute allgemein als Bedeutungsgewicht dieser Eigenschaft interpretiert (vgl. Orme 2000b). Dem Preis kommt mit 32,5 % eine relativ hohe Bedeutung zu; diese wird jedoch von der Bildqualität mit 44,8 % deutlich übertroffen. Konsumenten sind bei Kinofilmen offenkundig nur ungern bereit, Qualitätseinbußen hinzunehmen; eine verminderte Qualität geht mit einem entsprechend starken Nutzenverlust einher. Dies ist auch ein erstes Anzeichen dafür, dass eine relativ höhere Qualität in der Tat ein gewisses Preis-Premium rechtfertigen könnte. In der Abwägung mit anderen Eigenschaften hat die Wartedauer einen mittelstarken Einfluss, wohingegen die Nutzungsdauer von eher geringerer Bedeutung ist. Letzteres erscheint gerade im Kontext von Filmen plausibel, die eher selten mehrfach konsumiert werden. Der Nutzenwert von „None“ ist verhältnismäßig hoch und damit auch die „Nichtkauf-Schwelle“. In dieser Studie kann vermutet werden, dass eine ganze Reihe von Kombinationen verschiedener Attributsausprägungen (zum Beispiel eine hohe Wartedauer für einen Film geringer Qualität oder ein hoher Preis bei nur mittlerer Qualität) kaum akzeptiert würden. Ein relativ hoher Wert für „None“ erscheint daher plausibel. Insgesamt kann den Teilnutzenwerten sowohl in Hinblick auf die Vorzeichen als auch die Stärke des Einflusses Face-Validity zugebilligt werden. Auch die Prüfung der Holdout-Validität ergab gute bis sehr gute Anpassungswerte. Eine weitere externe Messung der Präferenzen, die zur Konsistenzprüfung herangezogen werden soll, stellen die Angaben aus der direkten Befragung dar. Für alle in CBC verwendeten Attribute wurde ebenfalls direkt die Präferenz erhoben. Die individuellen Bedeutungsgewichte aus CBC und die direkten Präferenzangaben korrelieren dabei hochsignifikant (vgl. Tabelle 3).

5 FS Kaas

66

Thomas Nitschke und Henrik Sattler Tabelle 2 Präferenzstruktur der Online Video-Distribution

Attribut(CBC) Bildqualität

Wartedauer bis Wiedergabe möglich (Downloadzeit) Nutzungsdauer

Attributsausprägung hoch

Teilnutzenwert 5,624

Spannweite

Bedeutungsgewicht

mittel

0,263

11,520

44,8 %

gering

-5,887

3,455

13,4 %

2,377

9,2 %

8,359

32,5 %

4,586

---

Start sofort möglich 12-24 Stunden

-0,427

4-6 Tage

-1,855

48 Stunden

-1,005

1 Monat

-0,316

unbegrenzt Preis

1,451 0,830

1-2 Stunden

1,321

3,60 €

-4,605

1,80 €

-0,634

0,60 €

1,492

0,00 €

3,747 4,586

None

Tabelle 3 Korrelation der Bedeutungsgewichte aus CBC und der direkten Befragung Attribut (CBC)

Direkte Abfrage (Fragebogen)

Korrelation

Signifikanz

Bildqualität

„Wie wichtig ist Ihnen bei Filmen aus dem Internet die Bild- und Tonqualität?“[7er RatingSkala]

0,436

0,000

Downloadzeit (Wartedauer)

„Wie lange sind Sie maximal bereit, auf einen hochqualitativen 90 Minuten Film im Internet zu warten (...)?“ [in Tagen bzw. Stunden]

0,243

0,002

Nutzungsdauer

„Wie wichtig ist es Ihnen, einen Film nicht nur eine begrenzte Zeit von z. B. 48 Stunden, sondern dauerhaft nutzen zu können?“ [7er Rating-Skala]

0,249

0,000

Preis

„Wie viel sind Sie maximal bereit, für diesen Film (…) (zu Hause, ggf. auf TV, Top- Qualität, keine Wartezeit, 48 h Nutzung) zu bezahlen?“ [in Euro]

0,151

0,006

„Wären Sie grundsätzlich bereit, für ein Angebot, bei dem Geld an die Rechteinhaber fließt, einen gewissen Aufschlag zu bezahlen? Falls ja, wieviel ungefähr?“ [in Euro]

0,242

0,000

Präferenzstrukturen / Zahlungsbereitschaften für Online-Medieninhalte

67

Die direkte Befragung zur Zahlungsbereitschaft umfasste zum einen die maximale Zahlungsbereitschaft für einen VoD-Service, der in einem Szenario ausführlich beschrieben wurde und zum anderen eine gesondert erhobene Mehrzahlungsbereitschaft für ein kommerzielles Angebot gegenüber einem nicht-kommerziellen. Für letzteren Vergleich wurden bewusst keine zusätzlichen Angaben zu etwaigen Unterschieden in den Produkteigenschaften zwischen diesen Angeboten gemacht. Somit ist der erhobene Aufschlag auch abhängig von der individuellen Wahrnehmung und den damit verbundenen Erwartungen über die Produkteigenschaften von Tauschbörsen. Auf diese Zwischen-Subjekt-Unterschiede im Referenzpunkt, auf den sich die Mehrzahlungsbereitschaft bezieht, wird im weiteren Verlauf noch näher eingegangen. Präferenzstrukturen können zwischen Befragten erheblich variieren mit unter Umständen erheblichen Auswirkungen auf das Wahlverhalten. Für die Praxis ist es oftmals von Interesse, Segmente mit ähnlichen Präferenzen zu identifizieren und diese ggf. durch eine differenzierte Produktausgestaltung anzusprechen. Daher sollte geprüft werden, ob sich auch in diesem Fall Segmente mit sehr unterschiedlicher Präferenzstruktur auffinden lassen. Eine Clusteranalyse auf Basis der individuellen Teilnutzenwerte ermittelt eine Drei-Segment-Lösung, die in Abbildung 1 dargestellt ist.

100% 90% 29% 80%

43%

Bildqualität

52%

Bedeutungsgewicht

70% 16%

Wartedauer

12%

Nutzungsdauer

60% 14%

50% 40%

12% 9% Preis

30%

10% 42%

20%

34% 27%

10% 0% Segme nt 1

Segment 2

Segment 3

Abbildung 1: Bedeutungsgewichte innerhalb der gebildeten Segmente

Während die Gewichte der Eigenschaften Wartedauer und Nutzungsdauer nur gering zwischen den Segmenten variieren, verschieben sich insbesondere die Ge5*

68

Thomas Nitschke und Henrik Sattler

wichte von Preis und Bildqualität. Im Wesentlichen scheinen sich also die Befragten hinsichtlich ihres Trade-offs zwischen diesen beiden Attributen zu unterscheiden. Insbesondere das Segment 1 könnte dabei für kommerzielle Anbieter von besonderem Interesse sein, da hier evtl. vorhandene Qualitätsunterschiede vergleichsweise hohe Preisprämien rechtfertigen könnten. Aber selbst im Segment 3 ist der Einfluss von Bezugsdauer und Qualität zusammengenommen noch immer stärker als der des Preises. In den nachfolgenden Auswertungen werden diese Segmente an geeigneter Stelle separat betrachtet und insbesondere bei der Diskussion der Marktchance berücksichtigt.

II. Zahlungsbereitschaften ohne nicht-kommerzielle Wettbewerber Gerade vor dem Hintergrund der vorhandenen Präferenzheterogenität erscheint eine Bestimmung von Zahlungsbereitschaften oder eine Untersuchung von Wahlanteilen auf aggregierter Ebene ungeeignet. In dieser Untersuchung bilden daher die auf Basis des Hierarchical Bayes Ansatzes ermittelten individuellen Teilnutzenwerte die Grundlage für die zu bestimmenden individuellen Zahlungsbereitschaften. Ausgangspunkt für die Bestimmung von Zahlungsbereitschaften für eine Produkteigenschaft oder ein ganzes Produkt mittels Conjoint Analysen ist stets der Nutzenbeitrag des Attributes Preis. Bei der Betrachtung nur einer Produkteigenschaft wird der Nutzenbeitrag dieses Attributes ins Verhältnis zum Nutzen des Preises gesetzt. Ganz allgemein lässt sich unter Annahme des Vektormodells für die Nutzenfunktion zeigen, dass der monetäre Gegenwert eines Attributes der Relation seines Nutzenparameters zum Nutzen des Preises entspricht (vgl. z. B. Skiera 1999). Diese Form der monetären Interpretation einer Produkteigenschaft in Geldeinheiten findet in weiten Bereichen der Ökonomie breite Anwendung (vgl. z. B. Kaas 1978; Skiera 1999). Liegt, wie in dieser Studie, ein Teilnutzenwertmodell vor, so wird der monetäre Wert einer Produkteigenschaft durch Interpolation bestimmt. Bei der Bestimmung von Zahlungsbereitschaften ist jedoch in der Marketingforschung weniger der monetäre Gegenwert einer einzelnen Eigenschaft relevant, vielmehr interessiert der resultierende Gesamtwert eines Produktes, der als Zahlungsbereitschaft interpretiert werden kann. Dieser monetäre Gesamtwert lässt sich jedoch nicht unmittelbar über den Teilnutzen des Preises ableiten. Es wird ein individueller Referenzpunkt oder auch Schwellenwert benötigt, bis zu dem ein Befragter ein Produkt – hier das VoD-Angebot – tatsächlich wählen würde. Vom typischen Fall ausgehend, dass ein höherer Preis zu einem fallenden Gesamtnutzen führt, stellt sich folgende Frage: Wie weit kann der Preis eines Produktes maximal erhöht werden (und der Gesamtnutzen des Produktes damit sinken), sodass ein Konsument dieses Produkt gerade noch kauft? Diese Bedingung lässt sich wie folgt darstellen:5

Präferenzstrukturen / Zahlungsbereitschaften für Online-Medieninhalte …3†

^ uh;VoDjp ‡ ^ uh …p† ˆ ^ uh ‡ k

69 8h 2 H

wobei ^uh;VoDjp : Nutzen eines VoD-Angebotes ohne den Teilnutzenwert der Eigenschaft Preis für den h-ten Konsumenten, ^uh …p†

: Teilnutzenwert der Eigenschaft Preis in Abhängigkeit von Preis (p) für den h-ten Konsumenten,

^uh

: Nutzen des Schwellenwertes des h-ten Konsumenten,

k

: kleiner positiver Wert.

Die maximale Zahlungsbereitschaft für den h-ten Konsumenten (phVoD) entspricht dem p, für das die Gleichung (3) erfüllt ist. Bei diesem Preis wäre der Nutzen eines VoD-Angebotes gerade noch höher, als derjenige der zweitbesten bzw. aller übrigen Wahlalternativen. Die Annahme, dass ein Konsument immer sicher jenes Produkt wählt, welches den höchsten Nutzen stiftet, wird auch als First Choice Regel bezeichnet (vgl. z. B. Hartmann 2004). Der Schwellenwert, den es hier gerade noch zu überbieten gilt, könnte dabei der Gesamtnutzen des stärksten Konkurrenzproduktes oder im Rahmen der Produktliniengestaltung auch ein weiteres eigenes Produkt sein.6 Im Bereich der erweiterten klassischen Conjoint Analyse bietet der Ansatz der Limit Conjoint Analyse eine Möglichkeit, individuelle Nichtkaufschwellen zu bestimmen und daraus individuelle Zahlungsbereitschaften abzuleiten (vgl. Voeth / Hahn 1998; Voeth 2000). In CBC Analysen steht mit dem Schätzwert der „None-Option“ eine vergleichbare Nichtkaufschwelle zur Verfügung. Bis auf Nitschke und Völckner (2005) ist den Verfassern nicht bekannt, dass dieser Nutzenwert bereits zur Erhebung individueller Zahlungsbereitschaften herangezogen wurde. Beim Einsatz der „None-Option“ in Marktsimulationen wird ausdrücklich darauf hingewiesen, ebenso viele Produkte in die Simulation einzubeziehen, wie Konzepte in den Auswahlentscheidungen vorhanden waren, in diesem Fall also drei (vgl. Orme 2000a). Mit steigender Zahl der Wahlalternativen in der Simulation sinkt die Wahlwahrscheinlichkeit der None-Option, was nicht immer theoretisch zu untermauern ist. Außerdem stellt die None-Option in der Simulation eine einzigartige Alternative dar, die von verschiedenen Auswahlregeln systematisch unterschätzt wird (vgl. Orme 2000a). Beides stellt jedoch für die individuelle Auswertung der Zahlungsbereitschaft in dieser Studie kein Problem dar. Zum einen können, wie eingangs dargestellt, verschiedene Merkmalskombinationen auftreten, die aus individueller Sicht wenig attraktiv oder sogar inakzeptabel erscheinen. Mit steigender Zahl an Wahlmöglichkeiten sollte daher auch die Wahrscheinlichkeit steigen, dass ein Konsument hierunter mindestens eine Alternative 5 Die formale Darstellung erfolgt in Anlehnung an Kohli / Mahajan (1991) sowie Wübcker / Mahajan (1999). 6 Vgl. Wübcker / Mahajan (1999).

70

Thomas Nitschke und Henrik Sattler

kaufwürdig findet. Ein sinkender None-Anteil bei steigender Zahl an Wahlalternativen erscheint hier durchaus plausibel. Zum anderen hat die Einzigartigkeit der None-Option aufgrund der IIA-Eigenschaft (vgl. Louviere et al. 2000) der hier verwendeten Entscheidungsregel First Choice keinen Einfluss auf die Wahlentscheidung. Im Folgenden wird die Zahlungsbereitschaft entsprechend Gleichung (3) ermittelt mit den geschätzten individuellen Nutzenwerten der „None-Option“ als Schwellenwert ^uh . Diese Auswertung auf individueller Ebene ohne Berücksichtigung weiterer, nicht-kommerzieller Wettbewerber ergibt dabei eine durchschnittliche Zahlungsbereitschaft von 2,25 A (Standardabweichung: 1,11). Auch wenn die absolute Höhe der Zahlungsbereitschaft aufgrund eingeschränkter Repräsentativität nicht ohne weiteres auf die Praxis übertragbar ist, so zeigt sich doch erstens, dass der monetäre Wert eines VoD-Angebotes deutlich über Null liegt und er zweitens auch weit unter den derzeit am Markt geforderten Preisen (3 – 4 A, teilweise auch 5 A) rangiert. Nachdem, wie in Tabelle 3 dargestellt, das Bedeutungsgewicht des Preises in CBC mit der direkt erhobenen Zahlungsbereitschaft korreliert, soll die mittels CBC erhobene Zahlungsbereitschaft zum Zwecke der Validierung auch mit der Zahlungsbereitschaft aus der direkten Befragung verglichen werden. Der Mittelwert der direkten Befragung liegt bei 2,12 A (Standardabweichung: 0,99). Die Mittelwerte der Verteilungen unterscheiden sich dabei nicht signifikant (p-Wert: 0,135; T-Test). Dies kann als ein erster Hinweis gewertet werden, dass der Wert der None-Option durchaus konsistent eine Nichtkaufschwelle darstellt und damit die Grundlage einer Zahlungsbereitschaftsermittlung bilden kann. In Abbildung 2 sind zur besseren Vergleichbarkeit beide Verteilungen als aggregierte Wahlanteilsfunktionen abgetragen mit hoher Qualität, Wiedergabe sofort möglich und 48 Stunden Nutzungsdauer als Parameter für das VoD-Angebot. Nicht nur die Mittelwerte der beiden Verteilungen sondern deren gesamter Verlauf sind relativ gleichförmig. Trotz des relativ starken Schwellenwertes in der direkten Befragung bei 2,– A vermag sich die in CBC ermittelte PreisresponseFunktion gut den direkten Preisangaben anzupassen. Die Teilnutzenwerte aus CBC scheinen hier also geeignet, den Gesamtnutzen und dessen monetären Gegenwert zuverlässig zu messen. Stünde die Filmindustrie nicht im Wettbewerb mit nicht-kommerziellen Anbietern oder könnte sie diese vollständig verdrängen, so bestünde berechtigte Hoffnung, bei einem Preis von wenigen Euro auf eine entsprechende Nachfrage zu treffen. Tatsächlich gibt jedoch der Wert der „None-Option“ die zu übertreffende Nutzenschwelle für kommerzielle Angebote zur Zeit nicht zwangsläufig zutreffend wieder, da kommerzielle Anbieter ebenfalls mit kostenlosen Tauschbörsen konkurrieren müssen. Somit liegt der Referenzpunkt für den Kauf im VoD eventuell höher, da das VoD-Angebot sowohl die Nichtkaufschwelle als auch den Nutzen der Tauschbörsen übersteigen muss, um tatsächlich gewählt zu werden. Der fol-

Präferenzstrukturen / Zahlungsbereitschaften für Online-Medieninhalte

71

gende Abschnitt geht der Frage nach, inwieweit sich kommerzielle Anbieter auf Basis der vorliegenden Präferenzstruktur wirksam von diesem illegalen Wettbewerb abgrenzen können und welche Zahlungsbereitschaft ihnen dabei verbleibt. 1 0,9 0,8

Wahlanteil VoD

0,7 0,6 aus CBC/HB

0,5

direkte Befragung

0,4 0,3 0,2 0,1 0 0,00 0,20 0,40 0,60 0,80 1,00 1,20 1,40 1,60 1,80 2,00 2,20 2,40 2,60 2,80 3,00 3,20 3,40 3,60 Preis VoD in €

Abbildung 2: Vergleich der Preisresponse für VoD ohne nicht-kommerzielle Wettbewerber

III. Mehrzahlungsbereitschaft gegenüber nicht-kommerziellen Wettbewerbern Liegt die durchschnittliche Zahlungsbereitschaft für ein kommerzielles VoD ohne kostenlose Anbieter in dieser Studie noch bei circa 2,25 Euro, so muss davon ausgegangen werden, dass bei einem wettbewerbsfähigen Konkurrenzangebot zum Preis von Null in Tauschbörsen ein erheblicher Teil der Konsumenten dort seine Nachfrage befriedigt. Die bislang konstatierte Zahlungsbereitschaft für ein VoDAngebot würde sich verringern. Neben den Nutzenwert der „None-Option“ in Gleichung (3) tritt als möglicher Schwellenwert zusätzlich der Nutzen des Angebotes in der Tauschbörse, sodass gilt: …4†

 ^ uh;None ; ^ uh;FS uh ˆ max ^

8h 2 H

wobei ^uh;None : Nutzen der „None-Option“ für den h-ten Konsumenten, ^uh;FS

: Nutzen eines nicht-kommerziellen Filesharing Angebotes für den h-ten Konsumenten.

72

Thomas Nitschke und Henrik Sattler

Will man vor dem Hintergrund der hier aufgedeckten Präferenzstruktur beurteilen, wie stark dieser Substitutionseffekt ausfällt, so müssen zunächst Annahmen über die Attributsausprägung der nicht-kommerziellen Wettbewerber getroffen werden. Sollte die Ausgestaltung des Angebotes in Tauschbörsen sich nicht wesentlich von dem kommerzieller Anbieter unterscheiden, müsste von einer vollständigen Abwanderung zu den kostenlosen Anbietern ausgegangen werden. Für zwei der hier betrachteten präferenzdeterminierenden Eigenschaften können die Attributsausprägungen in Tauschbörsen als gegeben betrachtet werden: Angebote in Tauschbörsen haben immer einen Preis von 0,– A und unterliegen keinerlei Nutzungsbeschränkungen, sodass das Augenmerk auf Bildqualität und Bezugsdauer liegt. Bei der Ermittlung der verbleibenden Attributsausprägungen können auch die Erfahrungen der Probanden selbst einbezogen werden. Von den Befragten in dieser Studie waren zwar alle mit Filesharing Netzwerken vertraut, verfügten aber nicht unbedingt über einschlägige Erfahrungen im Bereich Film. 142 der 288 Teilnehmer sahen sich in der Lage, Tauschbörsen hinsichtlich der hier betrachteten präferenzdeterminierenden Eigenschaften im Hinblick auf Filme ausführlich zu beurteilen. Bezüglich der Bezugsdauer geben diese eine mittlere Downloadzeit von sieben Tagen an. Dieses arithmetische Mittel ist jedoch beeinflusst von extremen Werten am rechten Rand der Verteilung, die erneut die hohe Ambiguität dieser Eigenschaft reflektieren; der Median liegt aber noch immer bei 3 Tagen. Aufgrund dieser Einschätzungen soll zunächst die Bezugsdauer für das nicht-kommerzielle Angebot mit der Stufe „4 – 6 Tage“ angenommen werden. Die Festlegung bei der Bildqualität, dem – wie oben dargestellt – Attribut mit dem höchsten Bedeutungsgewicht, hat annahmegemäß den stärksten Einfluss auf die Zahlungsbereitschaft. Sollten nicht-kommerzielle Anbieter ebenfalls ein durchschnittlich hohes Qualitätsniveau aufweisen, so verbleibt für die kommerziellen Anbieter ausschließlich die Wartedauer als positiv abgrenzende Eigenschaft, und die Zahlungsbereitschaft für VoD sollte entsprechend stark zurückgehen. Bei einer lediglich geringen Qualität in Tauschbörsen hingegen wäre davon auszugehen, dass sich die in CBC geschätzte Zahlungsbereitschaft kaum von derjenigen ohne Konkurrenzeinfluss unterscheidet. In Abbildung 3 sind für die drei diskreten Ausprägungen der Eigenschaft Qualität die entsprechenden Preisresponse-Funktionen analog zur Abbildung 2 dargestellt (mit 4 – 6 Tagen Wartedauer, unbegrenzter Nutzung und einem Preis von 0,– A für das Filesharing-Angebot). Tatsächlich schrumpft die Zahlungsbereitschaft unter Berücksichtigung des kostenlosen Angebotes im Vergleich zur ausschließlichen Betrachtung der „NoneOption“ – im Folgenden interpretiert und bezeichnet als die Mehrzahlungsbereitschaft gegenüber einem nicht-kommerziellen Wettbewerber – bei Annahme einer hohen Qualität im Filesharing deutlich. Bereits bei einem Preis von ca. 1 A würde nicht einmal mehr ein Viertel der Befragten den kommerziellen Anbieter wählen. Dieses wären äußerst ungünstige Vorzeichen für kommerzielle Anbieter, da alleine aufgrund von fälligen Lizenzgebühren an die Filmverleiher geringere Nutzungs-

Präferenzstrukturen / Zahlungsbereitschaften für Online-Medieninhalte

73

entgelte als ein Euro kaum realistisch erscheinen. Allerdings steigt bereits bei einem Rückgang der wahrgenommenen Qualität in Tauschbörsen auf „mittel“ c. p. die Zahlungsbereitschaft merklich und nähert sich dem Verlauf ohne nicht-kommerziellen Wettbewerb an. Der Nutzen eines Filesharing-Angebotes mit geringer Qualität liegt für fast jeden Befragten unter dem individuellen Wert der NoneOption. Bei solch niedriger Qualität ist daher kaum noch ein Unterschied zur separaten Betrachtung von VoD in Abbildung 2 erkennbar. Zum besseren Vergleich ist der Funktionsverlauf als „ohne Filesharing“ auch in Abbildung 3 abgetragen.

1 0,9 0,8

Wahlanteil VOD

0,7 0,6 ohne Filesharing 0,5 Filesharing: Qualität gering 0,4 Filesharing: Qualität mittel

0,3

Filesharing: Qualität hoch 0,2 0,1 0 0,00 0,20 0,40 0,60 0,80 1,00 1,20 1,40 1,60 1,80 2,00 2,20 2,40 2,60 2,80 3,00 3,20 3,40 3,60 Preis VOD in €

Abbildung 3: Preisresponse von VoD in Abhängigkeit der Bildqualität im Filesharing

Will ein kommerzieller Anbieter abschätzen, welcher preispolitische Spielraum ihm in Abhängigkeit der jeweiligen Konkurrenzsituation verbleibt, so gilt es die verbleibende Mehrzahlungsbereitschaft in Abhängigkeit der Qualität der Mitanbieter abzuschätzen. Zusätzlich zur mittleren Auswirkung sollte auch die Qualitätssensitivität der einzelnen Konsumentensegmente gesondert betrachtet werden. Für die vorliegende Studie erfolgt diese Gegenüberstellung in Abbildung 4 mit der verbleibenden durchschnittlichen Mehrzahlungsbereitschaft als abhängiger Größe. Die durchschnittliche Zahlungsbereitschaft für ein VoD sinkt bei steigender Qualität des nicht-kommerziellen Filesharing deutlich. Wie bereits aus den Bedeutungsgewichten in Abbildung 1 ersichtlich, reagiert das Segment 1 sehr sensibel auf Qualitätsabstufungen. Bereits bei einem Rückgang der Qualität von „hoch“ auf „mittel“ sinkt der Gesamtnutzen von Tauschbörsen so stark, dass die maximale Zahlungsbereitschaft im Segment erreicht wird (hier knapp unter 2,00 A). Die Zah-

74

Thomas Nitschke und Henrik Sattler

Mittlere Mehrzahlungsbereitschaft für VOD vs. Filesharing

lungsbereitschaften in den Segmenten 2 und 3 hingegen werden erst von qualitativ mäßigen Wettbewerbern kaum noch beeinflusst. Im Vergleich zu einem qualitativ hochwertigen kostenlosen Wettbewerber, der also ausschließlich durch die längere Bezugsdauer gegenüber dem VoD zurückfällt, weisen jedoch alle Segmente nur noch eine mittlere Mehrzahlungsbereitschaft von unter einem Euro auf: Die Basis für ein kommerzielles Geschäftsmodell ginge so verloren.

2,50 € 2,00 € Segment 1 Segment 2 Segment 3

1,50 € 1,00 €

Gesamt

0,50 € 0,00 € gering

mittel

hoch

Bildqualität im Filesharing

Abbildung 4: Einfluss der Bildqualität im Filesharing auf die mittlere Zahlungsbereitschaft

Betrachtet man mit der Bezugsdauer die zweite variable Eigenschaft von Tauschbörsen separat und hält dabei diesmal die Qualität auf dem Niveau „mittel“ konstant, so lässt sich analog zur Darstellung in Abbildung 4 der Einfluss der Bezugs- bzw. Wartedauer auf die Mehrzahlungsbereitschaft separat darstellen (vgl. Abbildung 5). Auch hier zeigt sich ein vergleichbares Bild: Je besser die Downloadzeit, desto geringer die verbleibende Mehrzahlungsbereitschaft. Allerdings ergeben sich deutliche Unterschiede zwischen den drei Segmenten. Während Segment 3 erneut nur eine eher geringe Mehrzahlungsbereitschaft aufweist, die zudem merklich von der Wartedauer beeinflusst wird, ist der Einfluss der Wartedauer auf Segment 1 kaum wahrnehmbar. Insgesamt lässt sich feststellen, dass in Segment 3 unter nahezu allen Rahmenbedingungen die Mehrzahlungsbereitschaft relativ niedrig ausfällt. Während der Einfluss der Qualität auf die Zahlungsbereitschaft deutlich spürbar ist, ist dieser bei der Eigenschaft Wartedauer nur eingeschränkt feststellbar. Wie viel vom ursprünglichen monetären Wert des VoD tatsächlich als Zahlungsbereitschaft realisiert werden kann, hängt also unmittelbar davon ab, wie stark sich VoD bei wesentlichen Eigenschaften vom Filesharing abgrenzen kann.

Mittlere Mehrzahlungsbereitschaft für VOD vs. Filesharing

Präferenzstrukturen / Zahlungsbereitschaften für Online-Medieninhalte

75

2,50 € 2,00 € 1,50 €

Segment 1 Segment 2

1,00 €

Segment 3 Gesamt

0,50 € 0,00 € 1-2 Stunden

12-24 Stunden

4-6 Tage

Wartedauer im Filesharing

Abbildung 5: Einfluss der Wartedauer im Filesharing auf die mittlere Zahlungsbereitschaft

Auch im Zuge der direkten Befragung wurde erhoben, welchen Aufschlag, also welche Mehrzahlungsbereitschaft, die Befragten für ein kommerzielles Angebot zu zahlen bereit wären. Dieser Aufschlag liegt bei durchschnittlich 1,17 A und damit in dem Rahmen der eben diskutierten Mehrzahlungsbereitschaften. Zusammenfassend betrachtet scheint es möglich auf Basis der mittels CBC aufgedeckten Präferenzstruktur sowohl den allgemeinen Nutzen und damit die Zahlungsbereitschaft ohne Konkurrenz zu bestimmen als auch die Auswirkung von kostenlosen Anbietern auf die Zahlungsbereitschaft systematisch zu erklären.

D. Implikationen: Marktchancen für kommerzielle Medienanbieter im Internet Trotz aller Unsicherheit und eingeschränkter Repräsentativität der Stichprobe lässt sich festhalten, dass Konsumenten sehr wohl bereit wären, für ein VoD im Internet zu bezahlen. Der Preisspielraum schmilzt, solange weiterhin nichtkommerzielle Tauschbörsen im Markt als Wettbewerber verbleiben, und dennoch verbleibt auch unter diesen Umständen noch eine deutliche Zahlungsbereitschaft für VoD. Im Gegensatz zur Musikindustrie, die inzwischen mit eigenen Online-Diensten zum Preis von ca. 1,– A pro Musiktitel den Markt zu erschließen beginnt, hat die Filmbranche noch keinen vergleichbaren Erfolg vorzuweisen. Dies ist sicher zumindest zu einem großen Teil auf das vorherrschende Preisniveau bei VoD im Internet zurückzuführen. Die geforderten Preise liegen deutlich über der hier festgestellten mittleren Zahlungsbereitschaft von ca. 2,25 A und ganz wesentlich über

76

Thomas Nitschke und Henrik Sattler

dem beim momentanen Wettbewerbsumfeld durchsetzbaren Preisaufschlag, sodass diese Angebote die breite Masse nicht ansprechen können. Die Schuld hierfür ausschließlich bei den Tauschbörsen zu suchen wäre falsch, da auch bei deren vollkommener Verdrängung bei Preisen von beispielsweise 5,– A kaum Nachfrage zu erwarten wäre. Die Filmindustrie sollte daher nach Rahmenbedingungen suchen, unter denen sie, in Anlehnung an die jüngsten Erfolge der Musikbranche, den Online-Markt erfolgreich bearbeiten kann. Insbesondere die Bildqualität und auch die eigene Zeit scheinen für die Konsumenten hier einen Preisaufschlag zu rechtfertigen. Für ein VoD sollten dabei sowohl diejenigen Konsumenten gewonnen werden, die bislang Tauschbörsen nutzen, als vor allem auch solche, die bislang alle Online-Angebote meiden, hier dargestellt durch die None-Option. Eine vollständige Verdrängung von Filesharing Netzwerken mag dabei zwar das langfristige Ziel der Industrie bleiben, kurz- und mittelfristig jedoch erscheint dies wenig realistisch. Wie oben dargestellt sind eine geringere Qualität und längere Bezugsdauer im Filesharing von zentraler Bedeutung, um einen möglichst großen preispolitischen Spielraum zu erhalten. Setzt die Industrie ihren Druck insbesondere auf die Anbieter von Dateien fort, so verschärft dieses den Nachfrageüberhang und vermindert für Nachfrager die Wahrscheinlichkeit, in einer Tauschbörse eine Kopie in akzeptabler Qualität in überschaubarer Zeit zu finden. Können Nutzer solcher Tauschbörsen als Kunden für ein kommerzielles Angebot gewonnen werden, dämpft dieses zusätzlich die Verbreitung von illegalen Kopien. Der Nutzen der Filesharing Netzwerke sinkt somit aufgrund negativer Netzeffekte weiter. Eine lediglich mittlere Qualität und eine Bezugsdauer von 4 – 6 Tagen wären entsprechende Eigenschaftsausprägungen, auf die Tauschbörsen schon in absehbarer Zeit reduziert werden könnten. Unter diesen Umständen wären weniger die Tauschbörsen ein Problem, sondern ein Preis, der ganz unabhängig von illegalen Anbietern durch den Nutzen eines VoD derzeit aus Sicht der Kunden nicht gerechtfertigt erscheint und diese dazu bringt, vollständig vom Kauf abzusehen. Zusätzlich sollte die Filmindustrie daher auch bestrebt sein, den Nutzen der eigenen Angebote zu erhöhen. Auf Basis dieser Untersuchung kommen hierbei die Nutzungsdauer und der Preis in Frage. Weitere Berücksichtigung differenzierender Eigenschaften oder anderer Zusatzleistungen der kommerziellen Angebote könnte evtl. den Nutzen von VoD steigern und somit höhere Preise u. U. rechtfertigen. Auch mengenbezogene Preisdifferenzierung, Bündelung oder Produktdifferenzierung wären weitere Ansatzpunkte, um ein kommerzielles Angebot erfolgreich gegenüber Tauschbörsen abzugrenzen, und sind möglicherweise Gegenstand zukünftiger Untersuchungen. Die Erfahrungen der Musikindustrie haben gezeigt, dass auch kommerzielle Geschäftsmodelle mit Stückpreisen, die deutlich unter denen des klassischen Einzelhandels liegen, im Internet erfolgreich sein können. Jedoch ist die Video-Distribution im Internet, wie eingangs beschrieben, aufgrund der erheblichen Dateigrößen

Präferenzstrukturen / Zahlungsbereitschaften für Online-Medieninhalte

77

und der nur schwer zu garantierenden hohen Verfügbarkeit in der Massendistribution im Vergleich zur Musik wesentlich aufwendiger. Dieses resultiert in deutlich höheren Distributionskosten, die pro Gigabyte Daten-Volumen – und damit der ungefähren Größe eines zweistündigen Films – einen bis mehrere Euro ausmachen. Diese Distributionskosten (vgl. Becker / Clement 2004; Becker 2003) könnte die Filmindustrie externalisieren, das heißt auf die Konsumenten übertragen, indem die Industrie ebenfalls auf die Peer-to-Peer Technologie der Tauschbörsen zurückgreift. In diesem Fall würde ein kommerzieller Anbieter lediglich als Organisator des Marktplatzes auftreten und durch ein Digital Rights Management gewährleisten, dass fällige Lizenzgebühren an die Rechteinhaber abgeführt werden. Der Netzbetreiber hätte dabei zwar Einfluss auf die Inhalte, die distribuiert werden, jedoch nur noch mittelbaren Einfluss auf die tatsächliche Verfügbarkeit der Inhalte. Ein sofortiger Start der Filmwiedergabe wäre dabei kaum zu gewährleisten. Der Anbieter wäre zudem auf die Bereitschaft der Teilnehmer zum Bereitstellen der Inhalte angewiesen. Hierbei könnte jedoch Freeriding in einem noch viel stärkeren Maße auftreten, als bereits heute in Tauschbörsen zu beobachten ist. Dafür könnte ein Betreiber diejenigen Konsumenten, die durch Bereitstellen von Filmen in solchen kommerziellen Netzen zum Angebot beitragen, durch eine längere Nutzungsdauer der Filme oder auch durch Preisnachlässe für ihren Mehraufwand kompensieren. Konzeptionen für zu diesem Zweck geeignete technologische Plattformen werden zurzeit diskutiert (vgl. z. B. Loeser et al. 2003).

E. Zusammenfassung Die Online-Distribution von Medieninhalten, wie z. B. Musik oder Filme, bewirkt in der Medienindustrie erhebliche Strukturbrüche. Filesharing Tauschbörsen, wie Napster und dessen Nachfolger, verursachen Schäden in mehrstelligen EuroMilliarden-Beträgen. Als Reaktion hierauf arbeitet die Medienindustrie verstärkt an kommerziellen Geschäftsmodellen mit Online-Medieninhalten. Für die Neuproduktplanung der Medienunternehmen ist es von essenzieller Bedeutung, die Präferenzstrukturen und Zahlungsbereitschaften potenzieller Nachfrager für anzubietende Online-Medieninhalte zu messen. Beispielsweise gilt es zu klären, über welche Produkteigenschaften sich kommerzielle Anbieter gegenüber (illegalen) Tauschbörsen differenzieren können und in welcher Höhe Zahlungsbereitschaften für kommerzielle Angebote auch in Konkurrenz zu nahezu kostenlosen Tauschbörsen bestehen. Am Beispiel von Online-Videoangeboten zeigt der vorliegende Beitrag mittels einer empirischen Untersuchung auf, wie aus Sicht eines Medienunternehmens mit State-of-the-Art-Methoden (auf Basis von Choice-Based-Conjoint-Analysen) Präferenzstrukturen und Zahlungsbereitschaften gemessen werden können und wie die Präferenzen und Zahlungsbereitschaften bei einer wichtigen Zielgruppe ausgeprägt sind.

78

Thomas Nitschke und Henrik Sattler

Zur Bestimmung der Zahlungsbereitschaft wird ein Verfahren vorgeschlagen, das sowohl eine allgemeine Nichtkaufschwelle (None-Option) als auch zusätzlich die individuell bekundete Qualitätseinschätzung der kostenlosen Tauschbörsen berücksichtigt.

Literatur Backhaus, Klaus / Brzoska, Lars (2004): Conjointanalytische Präferenzmessung zur Prognose von Preisreaktionen, in: Die Betriebswirtschaft, Vol. 1, S. 39 – 57 Becker, Eberhardt / Buhse, Wilms / Günnewig, Dirk / Rump, Niels (2003): Digital Rights Management: Theoretical, Economic, Legal and Political Aspects Brzoska, Lars (2003): Die Conjoint-Analyse als Instrument zur Prognose von Preisreaktionen: Eine theoretische und empirische Beurteilung der externen Validität Fetscherin, Marc (2003): Analyzing Movie Piracy on Peer-to-Peer Networks, in: Proceedings of CTI Center for Tele-Information Conference, Copenhagen Gensler, Sonja (2003): Heterogenität in der Präferenzmessung: Ein Vergleich von hierarchischen Bayes-Modellen und Finite-Mixture-Modellen GfK (2003): Brenner-Studie 2003: Studie zum Kopieren und Downloaden von Spielfilmen, Sondererhebung erstellt für die Filmförderanstalt, Nürnberg Hartmann, Adriane (2004): Kaufentscheidungsprognose auf Basis von Befragungen Hartmann, Adriane / Sattler, Henrik (2004): Wie robust sind Methoden zur Präferenzmessung?, in: Schmalenbachs Zeitschrift für betriebswirtschaftliche Forschung, Vol. 56, S. 3 – 22 Kaas, Klaus Peter (1978): Ein Verfahren zur Messung von Produktpräferenzen durch Geldäquivalente, in: Topritzhofer, Edgar (Hrsg.), Marketing: Neue Ergebnisse aus Forschung und Praxis, S. 115 – 130 Kahn, Barbara E. / Meyer, Robert J. (1991): Consumer Multiattribute Judgments under Attribute-Weight Uncertainty, in: Journal of Consumer Research, Vol. 17, S. 508 – 522 Kohli, Rajeev / Mahajan, Vijay (1991): A Reservation-Price Model for Optimal Pricing of Multiattribute Products in Conjoint Analysis, in: Journal of Marketing Research, Vol. 28, S. 347 – 354 Loeser, Christoph / Altenbernd, Peter / Ditze, Michael / Müller, Wolfgang (2003): Distributed Video on Demand Services on Peer to Peer Basis (www.c-lab.de / vis / loeser / Distributed_Video_on_Demand_Services_on_P2P_Basis.pdf 01. 12. 2003) Louviere, Jordan J. / Hensher, David A. / Swait, Joffre D. (2000): Stated Choice Methods: Analysis and Application Louviere, Jordan J. / Woodworth, George (1983): Design and Analysis of Simulated Consumer Choice or Allocation Experiments: An Approach Based on Aggregate Data, in: Journal of Marketing Research, Vol. 20, S. 350 – 367

Präferenzstrukturen / Zahlungsbereitschaften für Online-Medieninhalte

79

Moore, William L. (2004): A cross-validity comparison of rating-based and choice-based conjoint analysis models, in: International Journal of Research in Marketing, Vol. 21, S. 299 – 312 Nielsen / NetRatings (2003): More Europeans consuming music online with KaZaA than in the US, (www.nielsen-netratings.com / pr / pr_031215_UK.pdf 09. 09. 2004) Nitschke, Thomas / Völckner, Franziska (2005): Präferenzmessung bei unsicheren Produkteigenschaften: Berücksichtigung von Risiko in Conjoint-Analysen. Research Papers on Marketing and Retailing, Universität Hamburg o. V. (2004): Schachmatt den Filmpiraten – Raubkopien und ihre Folgen für die Kinobranche, (www.filmstiftung.de / webEdition / we_cmd.php?we_cmd[0]=show&we_cmd[1]=2346& we_cmd[4]=207 21. 10. 2004) Okada, Erica M. / Hoch, Stephen J. (2004): Spending Time versus Spending Money, in: Journal of Consumer Research, Vol. 31, S. 313 – 324 Orme, Bryan (2000a): Choice-Based Conjoint Analysis 2.6 (Manual), Sequim, WA – (2000b): The Sawtooth Software Market Simulator (Manual), Sequim, WA Sattler, Henrik / Hensel-Börner, Susanne / Krüger, Beate (2001): Die Abhängigkeit der Validität von Conjoint-Studien von demographischen Probanden-Charakteristika: Neue empirische Befunde, in: Zeitschrift für Betriebswirtschaft, Vol. 71, S. 771 – 787 Schoder, Detlef / Fischbach, Kai (2003): Peer-to-Peer-Netzwerke für das Ressourcenmanagement, in: Wirtschaftsinformatik, Vol. 45, S. 313 – 323 Skiera, Bernd (1999): Mengenbezogene Preisdifferenzierung bei Dienstleistungen Toubia, Olivier / Hauser, John R. / Simester, Duncan (2004): Polyhedral Methods for Adaptive Choice-Based Conjoint Analysis, in: Journal of Marketing Research, Vol. 41, S. 116 – 131 Voeth, Markus (2000): Nutzenmessung in der Kaufverhaltensforschung. Die Hierarchische Individualisierte Limit Conjoint-Analyse (HILCA) Voeth, Markus / Hahn, Christian (1998): Limit Conjoint-Analyse, in: Marketing ZFP, 20, S. 119 – 132 Wübker, Georg / Mahajan, Vijay (1999): A Conjoint Analysis-Based Procedure to Measure Reservation Price and to Optimally Price Product Bundles, in: Fürderer, Ralph / Herrmann, Andreas / Wübcker, Georg (Hrsg.): Optimal Bundling: marketing strategies for improving economic performance, S. 157 – 174

Experimental Economics und Marketing Martina Steul

A. Einführung Im Marketing werden häufig Experimente als Untersuchungsmethode durchgeführt, um die Auswirkungen von Marketingmaßnahmen auf das Konsumentenbzw. Kaufverhalten zu untersuchen. Es geht z. B. um die Auswirkungen der Preis-, Produkt- und Verpackungsgestaltung oder des Werbemitteleinsatzes sowie um die Wirkung verschiedener Werbespots. Typische Fragestellungen, die mittels dieser Experimente untersucht werden, sind somit: Wie wirken verschiedene Werbemittel auf die Markenerinnerung? Wie wirken verschiedene Preise und Platzierungen auf den Produktkauf? Gibt es Interaktionseffekte zwischen den Preisen und den Produktplatzierungen?1 Es werden beispielsweise Befragungsexperimente und Produkttests, bei denen Probanden im Labor verschiedene Produkte bewerten, oder Store- und Markttests, die den Verkauf von Produkten im Feld umfassen, durchgeführt. Diese Experimente sind jedoch von den Experimenten abzugrenzen, die im Rahmen der Experimental Economics durchgeführt werden.2 Diese so genannten ökonomischen Experimente kommen aus der volkswirtschaftlichen Forschung und werden bisher kaum im Marketing eingesetzt. Bei ökonomischen Experimenten geht es wie auch bei anderen Experimenten um die kontrollierte Untersuchung der Auswirkungen einer oder mehrerer (unabhängiger) Variablen auf eine oder mehrere (abhängige) Variablen. Besonderes Erfordernis der Experimental Economics ist jedoch, dass sich die Teilnehmer eines Experiments wirklich so verhalten wie sie dies auch in der Realität tun würden. Dies wird dabei vor allem durch reale Zahlungen an die Teilnehmer und die Kopplung dieser Zahlungen an die Entscheidungen der Teilnehmer erreicht. Weiterhin zeichnet sich die experimentelle Ökonomik dadurch aus, dass theoriegeleitet nach Lösungen für reale ökonomische Probleme und Phänomene gesucht wird. Es werden nicht Vgl. Berekoven et al. (2004). Einen guten Überblick zur Forschungsrichtung „Experimental Economics“ liefert „The Handbook of Experimental Economics“ von den Herausgebern John Kagel und Alvin Roth (1995). Wegweisende Arbeiten zur „Experimental Economics“ sind u. a. Chamberlin (1948), Sauermann (1967), Allais (1953), Sauermann / Selten (1959), Friedman (1963) und Smith (1976). 1 2

6 FS Kaas

82

Martina Steul

durch vereinfachtes induktives Vorgehen einzelne Phänomene entdeckt und angesammelt.3 Diese Experimente werden in der Ökonomie bereits seit über 50 Jahren durchgeführt. Pioniere wie Chamberlin (1948) und Mosteller / Nogee (1951) haben die ökonomischen Experimente initiiert, die dann u. a. von Smith, Sauermann und Selten in den 50er und 60er Jahren weiterentwickelt wurden. Insbesondere werden die ökonomischen Experimente in dem Forschungsbereich „Behavioral Economics“, der ökonomische Theorien mit psychologischen Ansätzen verbindet, angewendet. Die Erfolgsgeschichte der Experimental Economics zeigt sich letztendlich auch in der Vergabe des Nobelpreises für Wirtschaftswissenschaften 2002 an Vernon Smith und Daniel Kahneman für ihre experimentellen Forschungsarbeiten. In diesem Beitrag sollen Kennzeichen und Besonderheiten von ökonomischen Experimenten aufgezeigt sowie der Einsatz dieser Experimente im Marketing vorgestellt werden. Zunächst werden dazu kurz die Gründe für die Anwendung ökonomischer Experimente und die Schwerpunkte der Experimental Economics erörtert. Danach werden die wesentlichen Kriterien zur Gestaltung des experimentellen Designs dargestellt sowie die Vor- und Nachteile ökonomischer Experimente diskutiert. Anschließend werden ökonomische Experimente direkt mit psychologischen Experimenten verglichen sowie die Anwendungsmöglichkeiten ökonomischer Experimente im Marketing aufgezeigt. Mit diesem Beitrag soll deutlich werden, dass die Methode der ökonomischen Experimente im Marketing sehr gut angewendet werden und zu einem Erkenntnisgewinn führen kann und dass aufgrund der Vorteile sogar ein Einsatz im Marketing für bestimmte Fragestellungen wünschenswert ist.

I. Gründe für ökonomische Experimente Smith (1994) als einer der führenden Wissenschaftler im Bereich Experimental Economics sieht vor allem folgende Gründe für die Anwendung von Experimenten in der Ökonomie:4  Testen von Theorien: Theoriegeleitete Hypothesen können mit den experimentellen Ergebnissen verglichen werden, um Aussagen über die Qualität von Theorien zu treffen. Je größer die Übereinstimmung zwischen den experimentellen Ergebnissen und den Vorhersagen der Theorien, desto besser sind die Theorien.  Suchen nach den Ursachen für das Versagen einer Theorie: Ursachen für die empirischen Abweichungen von den Aussagen einer Theorie können durch Experimente aufgedeckt werden. Falls die experimentellen Ergebnisse nicht mit den Vorhersagen einer Theorie übereinstimmen, sollte jedoch zuerst das experiVgl. Kubon-Gilke et al. (2003). Darüber hinaus gibt es noch weitere Gründe für ökonomische Experimente, vgl. Davis / Holt (1993). 3 4

Experimental Economics und Marketing

83

mentelle Design kritisch hinterfragt werden, damit sichergestellt werden kann, dass es sich wirklich um einen Fehler in der Theorie handelt.  Aufdeckung und Nachweis von empirischen Regelmäßigkeiten als Basis für die Entwicklung neuer Theorien.  Vergleich von Umweltbedingungen: Institutionen (z. B. Marktregeln, Auktionsmechanismen) können auf ihre Robustheit in unterschiedlichen Umweltbedingungen überprüft werden. So kann u. a. untersucht werden, unter welchen extremen Umweltbedingungen Institutionen nicht mehr funktionieren.  Vergleich von Institutionen: Verschiedene Institutionen und deren Wirkungen können unter konstanten Umweltbedingungen untersucht werden. So können beispielsweise verschiedene Auktionsmechanismen wie die Englische Auktion, die Holländische Auktion, die Höchstpreis-Auktion und die Vickrey-Auktion („second price sealed bit auction“) miteinander verglichen werden.5

Diese aufgeführten Gründe für die Anwendung von ökonomischen Experimenten treffen auch für den Einsatz in der Marketingforschung zu. So können Experimente u. a. zur empirischen Überprüfung von Marketingtheorien herangezogen werden. Eine ausführliche Darstellung dazu findet sich im Kapitel zur Anwendung ökonomischer Experimente im Marketing in diesem Beitrag.

II. Schwerpunkte der Experimental Economics Es können in der historischen Entwicklung der Experimental Economics vor allem drei Forschungsschwerpunkte unterschieden werden. Den aus historischer Sicht ersten Schwerpunkt in der Experimental Economics bilden die Marktexperimente. Diese ersten ökonomischen Experimente wurden von Edward Chamberlin (1948) durchgeführt und befassten sich hauptsächlich mit der Überprüfung der neoklassischen Markt- und Preistheorien. Dabei konnte u. a. gezeigt werden, dass die Macht der „unsichtbaren Hand“ existiert und eine rasche, zuverlässige Konvergenz von Preisen und Mengen hin zum theoretisch-prognostizierten Gleichgewicht besteht. So stellten sich Marktgleichgewichte auch ohne die stark restriktiven Prämissen der Markttheorien wie eine große Zahl von Marktteilnehmern, unendliche Reaktionsgeschwindigkeiten und vollkommene Informationen ein. Der Forschungsschwerpunkt Marktexperimente befasst sich mittlerweile mit der Untersuchung unterschiedlichster Märkte. So werden Marktexperimente u. a. zur Analyse von Finanzmärkten („experimental asset markets“) (vgl. z. B. Kroll et al. 1988, Weber /Camerer 1992) und Arbeitsmärkten (vgl. z. B. Fehr et al. 1993, Fehr / Falk 1999, Gächter / Fehr 2002) eingesetzt. Die zweite Forschungsrichtung der Experimental Economics befasst sich mit dem Testen der Implikationen der Spieltheorie wie beispielsweise dem Gefange5

6*

Vgl. u. a. Kagel (1995).

84

Martina Steul

nen-Dilemma und dem Ultimatum-Spiel. Der Vorteil der ökonomischen Experimente im Zusammenhang mit der Spieltheorie liegt darin, dass Versuchsdurchgänge mehrmals wiederholt und Interaktionen zwischen den Teilnehmern durchgespielt werden können. Durch die Wiederholungen der Versuchsdurchgänge können die Probanden die experimentelle Situation erfahren und besser durchdringen. Somit verstehen die Probanden das Experiment besser und lernen strategische Aspekte der Interaktionen. Beispielsweise macht es einen großen Unterschied, ob das Gefangenen-Dilemma nur einmal („single shot“), endlich häufig oder unbestimmt häufig wiederholt („indefinite“) gespielt wird. So ist bei dem einmaligen Spielen unkooperatives Verhalten und bei unbestimmt häufigem Spielen kooperatives Verhalten die optimale Strategie. Den Probanden wird dabei die Möglichkeit gegeben, dieses Wissen zu erwerben, da dies nicht vorausgesetzt werden kann.6 Bei dem dritten Schwerpunkt der Experimental Economics, den Experimenten zum individuellen Entscheidungs- oder Wahlverhalten, handelt es sich meist um Entscheidungsexperimente, die sich mit den Axiomen und Aussagen der Erwartungsnutzentheorie befassen.7 Anfänglich stand hier vor allem das Unabhängigkeitsaxiom der Erwartungsnutzentheorie im Blickpunkt der experimentellen Untersuchungen.8 Prominent sind in diesem Zusammenhang das Allais- und das Ellsberg-Paradoxon. So haben Allais (1953) und Ellsberg (1961) in ihren Experimenten gezeigt, dass Entscheider systematisch gegen das Unabhängigkeitsaxiom der (subjektiven) Erwartungsnutzentheorie verstoßen. Die Experimente zum individuellen Entscheidungsverhalten dienen auch der Entwicklung alternativer Theorien zur Erwartungsnutzentheorie. Die wohl bekannteste alternative Theorie, die auf Basis von Experimenten entwickelt wurde, ist die Prospect Theorie von Kahneman / Tversky (1979).

B. Experimentelles Design Das experimentelle Design ist das eigentliche Herzstück eines Experiments. Daher werden im Folgenden die grundlegenden Elemente eines ökonomischen Experiments, die im experimentellen Design festgelegt werden, und die Unterschiede zwischen Labor-, Feld- und Online-Experimenten erläutert. Besondere Bedeutung im Rahmen des Designs eines ökonomischen Experiments kommt dabei der Anreizgestaltung und der Anreizkompatibilität zu. Die Anreizkompatibilität ist das wesentliche Merkmal von ökonomischen Experimenten.

6 7 8

Vgl. Hertwig (1998). Vgl. Davis / Holt (1993). Vgl. Camerer (1995).

Experimental Economics und Marketing

85

I. Elemente eines ökonomischen Experiments Ein ökonomisches Experiment besteht grundsätzlich aus folgenden drei Elementen:9 1. Entscheidungsumfeld („environment“): Das Entscheidungsumfeld in einem Experiment umfasst die Teilnehmer, die durch Eigenschaften wie Präferenzen und Ressourcenausstattungen gekennzeichnet sind. Diese Eigenschaften werden dabei in den Experimenten „induziert“ („induced value“), d. h. die Teilnehmer eines kontrollierten Experiments sollen sich nur von den ihnen zugedachten Präferenzen und Ressourcenausstattungen leiten lassen. Dies wird wiederum durch Auszahlungen an die Teilnehmer erreicht. 2. Institutionen („institutions“): Institutionen sind die Regeln, die durch die experimentellen Instruktionen festgelegt werden und den Möglichkeitsraum der Teilnehmer im Experiment darstellen (z. B. wer ein Angebot abgeben oder akzeptieren kann, welche Informationen werden wie ausgetauscht, welcher Auktionsmechanismus liegt zugrunde). 3. Verhalten („behavior“): Das beobachtbare Verhalten der Teilnehmer wird mit den theoriegeleiteten Hypothesen verglichen. Die Institutionen legen innerhalb des Entscheidungsumfelds das Regelsystem fest und die Teilnehmer agieren vor diesem Hintergrund. Zusammenfassend lässt sich festhalten, dass der Versuchsleiter das Entscheidungsumfeld sowie die Institutionen kontrolliert und das Verhalten der Teilnehmer beobachtet. Aus dem Zusammenspiel von Entscheidungsumfeld und Institutionen prognostiziert die Theorie das Verhalten, welches mit den Experimentergebnissen verglichen werden kann. Damit die theoretische Verhaltensprognose mit dem im Experiment beobachteten Verhalten wirklich vergleichbar ist, muss das experimentelle Design die Strukturmerkmale der Theorie möglichst exakt implementieren.

II. Labor-, Feld- und Online-Experimente Grundsätzlich besteht die Möglichkeit, ein Labor- und / oder ein Feldexperiment durchzuführen. In der experimentellen Ökonomie werden zumeist Laborexperimente durchgeführt, Feldexperimente stellen bisher eher die Ausnahme dar. Laborexperimente sind dadurch gekennzeichnet, dass sie zumeist in kleinen Gruppen in einem dafür vorgesehenen Raum („Labor“) durchgeführt werden. Es handelt sich um eine künstliche Situation, die vollständig kontrolliert werden kann. Häufig sind die Teilnehmer eines solchen Laborexperiments Studenten. Feldexperimente werden in der experimentellen Ökonomie durchgeführt, um laborexperimentelle Ergebnisse im Feld zu replizieren und Probanden zu gewin9

Vgl. Smith (1989), Davis / Holt (1993).

86

Martina Steul

nen, die nicht an einem Laborexperiment teilnehmen würden, sowie möglicherweise Effekte zu identifizieren, die im Labor nicht zu beobachten sind. So kann beispielsweise die hypothetische Zahlungsbereitschaft aus dem Labor mit der tatsächlichen Zahlungsbereitschaft im Feld verglichen werden. Einige Feldexperimente beobachten das Verhalten von Personen sogar ohne deren Wissen (vgl. z. B. Camerer 1998). Wichtig dabei ist aber, dass die Personen sich in einer typischen Situation freiwillig befinden und nicht manipuliert werden. Im Vergleich zu Laborexperimenten haben Feldexperimente den Vorzug, dass der Handlungsspielraum der Teilnehmer weniger explizit festgelegt werden muss – was vor allem bei komplexen Entscheidungssituationen und bei fehlender Information über die Handlungsalternativen vorteilhaft sein kann. Dass Feldexperimente eher selten durchgeführt werden, kann mit den hohen Kosten durch den administrativen und personellen Aufwand erklärt werden.10 Feld- und Laborexperimente sind in ihren Vor- und Nachteilen komplementär zueinander, d. h. die Vorteile der Laborexperimente sind zugleich die Nachteile der Feldexperimente und umgekehrt. So haben Laborexperimente zumeist den Mangel der externen Validität, Feldexperimente haben dagegen eine hohe externe Validität. Bei Feldexperimenten ist wiederum normalerweise nur eine begrenzte Kontrolle der (Stör-)Variablen gegeben, so dass die interne Validität geringer ist als bei Laborexperimenten. Zunehmend werden ökonomische Experimente über das Internet als so genannte Web- oder Online-Experimente durchgeführt (vgl. u. a. Anderhub et al. 2001, Schräpler et al. 2003). Die Verwendung des Internets als Plattform weist einige Vorteile gegenüber Laborexperimenten auf. So ist eine größere Anzahl an Versuchspersonen zu erreichen, die zudem nicht nur Studenten sind, sondern auch bestimmte Experten sein können. Beispielsweise können Experten über Newsgroups, Chat-Foren oder themenspezifische Mailinglisten als Probanden gewonnen werden.11 Weiterhin sind die Online-Experimente meist kostengünstiger in der Durchführung. Für internetbasierte Experimente benötigt man nur einen Server und Programmierkenntnisse. Weiteren Vorteilen wie externer Validität, Experimentieren rund um die Uhr und der Tatsache, dass keine Versuchsleitereffekte auftreten, stehen aber einige Nachteile gegenüber. So besteht die Gefahr einer Selbstselektion, da die Teilnehmer über einen Computer mit Internetanschluss verfügen müssen. Zudem sind das durchschnittliche Einkommen und der Bildungsgrad bei Internetnutzern zurzeit noch höher als in der Gesamtbevölkerung. Ein weiterer Nachteil besteht darin, dass die Teilnehmer kaum einer Kontrolle unterliegen. So kann nicht beobachtet werden, mit welcher Ernsthaftigkeit und Konzentration die Versuchsperson an dem Experiment teilnimmt oder ob mehrere Personen an der Beantwortung der Fragen beteiligt sind. Auch besteht das Problem, dass die Teilnehmer das Experiment abbrechen können und die Gründe für den Abbruch nicht ersichtlich 10 11

Vgl. Oberholzer-Gee (2003). Vgl. Reips (2002).

Experimental Economics und Marketing

87

sind. Im Hinblick auf die Instruktionen ist vor allem wichtig, dass diese klar, verständlich und ausführlich sind, um Abbrüche zu verhindern und Verständnisfragen, die meist bei Online-Experimenten nicht gestellt werden können, nicht aufkommen zu lassen.12 III. Anreizkompatibilität und Anreizgestaltung Besonderes Augenmerk bei ökonomischen Experimenten liegt auf der Anreizkompatibilität und damit auf der Anreizgestaltung der experimentellen Designs. Die Anreizkompatibilität eines Experiments bedeutet dabei, dass die Teilnehmer die Entscheidungssituation ernst nehmen, sich auf das Experiment konzentrieren und sich so verhalten wie sie dies in der Realität tun würden sowie dass sie ehrliche Angaben machen, indem sie z. B. ihre wahren Zahlungsbereitschaften offen legen. Die Experimental Economics setzt dazu häufig anreizkompatible Methoden ein, die im Kapitel zur Anwendung ökonomischer Experimente im Marketing in diesem Beitrag näher spezifiziert werden. An die Anreizgestaltung experimenteller Designs in ökonomischen Experimenten gibt es folgende grundlegende Anforderungen:13 (1) Die Bezahlung der Teilnehmer soll von ihren Entscheidungen abhängen und diesen Zusammenhang müssen die Teilnehmer in jedem Fall erkennen („saliency“). (2) Es soll eine Nichtsättigung hinsichtlich der Bezahlung („nonsatiation“, „monotonicity“) bestehen, d. h. die Teilnehmer müssen „mehr“ Belohnung gegenüber „weniger“ Belohnung vorziehen. Es liegt die Annahme zugrunde, dass die Teilnehmer eine monoton steigende Nutzenfunktion für die Zahlungen haben. Um diese Bedingung der Nichtsättigung zu erfüllen, wird meistens reales Geld eingesetzt. (3) Es soll eine Dominanz der Zahlungen („dominance“) über andere nicht kontrollierte subjektive Kosten und Motive gegeben sein, d. h. die Bezahlung dominiert alle subjektiven Kosten, die mit der Experimentteilnahme verbunden sind. Als untere Schranke für eine ausreichende Dominanz dienen die Opportunitätskosten der Teilnehmer. Sind Studenten Teilnehmer des Experiments, entspricht dies dem durchschnittlichen Stundenlohn eines ortsüblichen Studentenjobs. (4) Die Teilnehmer sollen möglichst nur ihre eigenen Bezahlungen und Ausstattungen kennen, damit unkontrollierte Interaktionen zwischen den Teilnehmern vermieden werden („privacy“). Es besteht beispielsweise die Gefahr, dass die Teilnehmer sich miteinander vergleichen und Neid, Missgunst oder Mitleid ihre Entscheidungen beeinflussen. 12 13

Vgl. Schräpler et al. (2003). Vgl. Davis / Holt (1993), Beattie / Loomes (1997), Smith (1976).

88

Martina Steul

Diesen Anforderungen an die Anreizgestaltung liegt ein „effort“-Modell des Entscheidungsprozesses zugrunde, d. h. bessere Entscheidungen erfordern eine höhere kognitive Anstrengung. Demnach versucht der Experimentteilnehmer einen Ausgleich zwischen dem positiven Nutzen aus der Entscheidung und dem negativen Nutzen aus der kognitiven Anstrengung herzustellen. Daraus folgt die Annahme, je höher die Bezahlungen, desto besser sind die Entscheidungen im Sinne der normativen Theorien.14 So führen Smith / Walker (1993) an, dass „increased financial rewards [may] shift the central tendency of the data toward the predictions of rational models. . .“.15 Diese geforderte Anreizgestaltung in ökonomischen Experimenten ist aber nicht unumstritten und gestaltet sich in der Praxis teilweise schwierig. So besteht beispielsweise die Gefahr, dass die möglichen Auszahlungen unter Laborbedingungen zu gering sind bzw. aus Sicht der Probanden als zu gering empfunden werden, so dass das beobachtete Verhalten nicht dem Verhalten bei realen großen Geldbeträgen entspricht. So verändert sich der Charakter der Aufgabenstellung, wenn hohe hypothetische Zahlungen mit niedrigen realen Auszahlungen an die Probanden – oft aufgrund des knappen Forschungsbudgets – verknüpft werden. Als Lösung für dieses Problem wird eine Anreizgestaltung mit Hilfe der „random problem selection procedure“ bzw. des „random lottery incentive mechanism“ vorgeschlagen.16 Diese Verfahren kommen vor allem zum Einsatz, wenn die Probanden mehrere Entscheidungen in einem Experiment treffen. Mit Hilfe eines Zufallsmechanismus wird eine dieser Entscheidungen ausgewählt, die dann zahlungsrelevant und damit für den Teilnehmer real wird. Durch diese Anreizgestaltung soll in jedem Fall der Forderung nach „saliency“ nachgekommen werden. Häufig werden in Laborexperimenten auch so genannte Experimentwährungen eingeführt, die mit einem Umrechnungsfaktor den tatsächlichen Wert widerspiegeln. Die Experimentwährungen sind aber kritisch zu hinterfragen, da letztendlich dem Versuchsleiter nicht ersichtlich ist, ob die Probanden nun mit den fiktiven Werten oder mit den tatsächlichen, geringeren Zahlungen gerechnet und die Entscheidungen darauf ausgerichtet haben. Um weiterhin Kosten zu sparen, werden zum Teil die Zahlungen nicht an alle Teilnehmer getätigt, sondern nur an bestimmte, durch einen Zufallsmechanismus ausgewählte Teilnehmer.17 Hier besteht das Problem, dass unklar ist, ob die Teilnehmer bereits diesen Zufallsmechanismus in ihren Entscheidungen berücksichtigt haben. Ein weiteres Problem bei der Anreizgestaltung taucht auf, wenn die Probanden in einem Experiment Geld verlieren können. So ist es kaum möglich, Probanden 14 15 16 17

Vgl. Hertwig (1998). Smith / Walker (1993), S. 245. Vgl. u. a. Beattie / Loomes (1997), Cubitt et al. (2001). Vgl. u. a. Schade et al. (2002).

Experimental Economics und Marketing

89

zu finden, die diese Verluste aus eigener Tasche tragen. Zudem scheint es unmoralisch, Zahlungen von den Probanden für ihre Teilnahme zu verlangen. In diesem Fall werden die Probanden normalerweise vor dem Experiment mit Geld ausgestattet. Bei dieser Vorgehensweise besteht wiederum das Problem, dass abschließend nicht beurteilt werden kann, wie die Probanden dieses Geld bewerten. So wird das geschenkte Geld wahrscheinlich anders bewertet als das eigene Geld. Zudem gibt es eine grundsätzliche Diskussion darüber, ob monetäre Anreize und Bezahlungen der Probanden in Experimenten immer erforderlich sind.18 So lassen sich einige Beispiele finden, die die Bedeutung von monetären Anreizen hinterfragen.19 Tversky / Kahneman (1992) vertreten dazu folgende Auffassung: „However, we maintain that monetary incentives are neither necessary nor sufficient to ensure subjects’ cooperativeness, thoughtfulness, or truthfulness. The similarity between the results obtained with and without monetary incentives in choice between simple prospects provides no special reason for scepticism about experiments without contingent payment.“20 Weiterhin zeigen viele Studien kein einheitliches Bild hinsichtlich der Wirkung von Bezahlungen, denn teilweise wird kein signifikanter Verhaltensunterschied in Abhängigkeit einer anreizkompatiblen Bezahlung festgestellt.21 So haben Camerer / Hogarth (1999) genau untersucht, wann Anreize wirken und wann nicht. Sie stellen fest, dass Zahlungen den Einsatz der Probanden steigern können, was vor allem bei komplizierten Entscheidungssituationen wichtig erscheint.22 Letztendlich sollte für jedes Experiment überprüft und entschieden werden, ob und wie finanzielle Anreize eingesetzt werden müssen. Im Zweifelsfall plädiert die Experimental Economics jedoch für den Einsatz finanzieller Anreize.

C. Vor- und Nachteile ökonomischer Experimente Die wesentlichen Vorteile ökonomischer Experimente, insbesondere von Laborexperimenten, liegen in der gezielten Kontrolle der zu untersuchenden Variablen und der Experimentbedingungen sowie der Replizierbarkeit.23 Durch die Kontrolle der Experimentbedingungen können direkt Theorien und Hypothesen überprüft Vgl. Camerer (1989), Donkers / Melenberg / Soest (2001). Vgl. Hertwig (1998). 20 Tversky / Kahneman (1992), S. 316. 21 Camerer / Hogarth (1999) geben einen Überblick über 74 Experimente und untersuchen die Wirkung von Anreizen in diesen Experimenten. Sie kommen zu dem Ergebnis, dass in einigen Experimenten ein Effekt der Anreize festgestellt werden konnte, aber in vielen nicht. Donkers / Melenberg / Soest (2001) haben Hinweise aus Paneldaten dafür, dass bei einfachen Entscheidungsproblemen Zahlungen nicht notwendig sind. 22 Vgl. Donkers / Melenberg / Soest (2001). 23 Vgl. Davis / Holt (1993), Sauermann (1967). 18 19

90

Martina Steul

werden, die in realen Situationen oft nicht untersucht werden können, da die Annahmen der zu untersuchenden Zusammenhänge nicht isoliert in der Realität anzutreffen sind. Durch die Replizierbarkeit wird die Transparenz der Ergebnisse im Vergleich zu anderen empirischen Methoden erhöht. So kann jeder Wissenschaftler grundsätzlich die Experimente nachvollziehen und gegebenenfalls wiederholen. Diese Vorteile ökonomischer Experimente gehen einher mit einer hohen internen Validität als ein wichtiges Gütekriterium empirischer Forschung. Die Validität oder Gültigkeit eines Experiments bezieht sich dabei grundsätzlich auf das Ausmaß systematischer Fehler in einem Experiment und beinhaltet, inwiefern genau das gemessen wird, was gemessen werden soll. Die interne Validität beschreibt, ob die beobachteten Effekte wirklich auf die kontrollierenden Variablen zurückzuführen und unkontrollierte Störvariablen ausgeblendet sind. Bei ökonomischen Experimenten besteht normalerweise kein Problem hinsichtlich der internen Validität, da diese Experimente anreizkompatibel sind und sich durch die kontrollierte Variation einzelner Faktoren auszeichnen. Die interne Validität kann dennoch grundsätzlich u. a. durch biologisch-psychologische Veränderungen wie Hunger oder Müdigkeit der Teilnehmer sowie durch Ermüdungseffekte des Versuchsleiters (vgl. Campbell / Stanley 1966) gefährdet sein. Die externe Validität eines Experiments kann als die Generalisierbarkeit und Übertragbarkeit der Ergebnisse auf die Realität beschrieben werden.24 Sofern die experimentelle Situation wesentliche Strukturdeterminanten der Realität beinhaltet, ist eine Übertragung auf reale Entscheidungen normalerweise zulässig. Zudem nehmen experimentelle Ökonomen an, dass durch eine anreizkompatible Bezahlung der Probanden ebenso die externe Validität erhöht wird.25 Die Hauptbedrohungen der externen Validität von Experimenten liegen in der Auswahl der Teilnehmer und der Künstlichkeit der Experimente. Die externe Validität ist daher vor allem bei Laborexperimenten nicht unproblematisch. So werden häufig aus praktischen Gründen Studenten als Teilnehmer von Laborexperimenten eingesetzt. Sind die Ergebnisse von Laborexperimenten daher generell unbrauchbar, wenn Studenten als Probanden eingesetzt werden? Studenten als Probanden und die damit einhergehende Homogenität der Teilnehmer sprechen nicht grundsätzlich gegen die Ergebnisse von Laborexperimenten. Problematisch sind jedoch vor allem die Experimente, bei denen das Einkommen und der Bildungsgrad eine Rolle spielen könnten und dies zugleich Faktoren sind, wodurch sich die Teilnehmer nicht unterscheiden – wie dies häufig bei Studenten der Fall ist. In dieser Situation wären die Probanden nicht repräsentativ für die Untersuchung (vgl. Campbell / Stanley 1966). Ob Studenten als Probanden für ein Experiment geeignet sind, hängt somit vom experimentellen Design und den zu untersuchenden Variablen ab. So werden Studenten als Probanden in ökonomischen Experimenten auch gerade als vorteilhaft gesehen. 24 25

Vgl. Diekmann (2001). Vgl. Loewenstein (1999).

Experimental Economics und Marketing

91

Denn es kann beobachtet werden, dass Experten manchmal Probleme haben, sich vollständig auf die experimentelle Entscheidungssituation einzulassen, vor allem wenn diese Situation nicht ihren eigenen Erfahrungen entspricht. Um die externe Validität einer Untersuchung zu erhöhen, besteht die Möglichkeit, Feldexperimente durchzuführen. So kann man versuchen, Ergebnisse aus dem Labor in Feldexperimenten zu replizieren oder solche Situationen im Feld zu untersuchen, die im Labor aufgrund der Komplexität nicht umgesetzt werden können. Die externe Validität eines Experiments kann zudem gefährdet sein, wenn die Probanden sich der experimentellen Untersuchung bewusst sind und die wissenschaftliche Aufmerksamkeit und Beobachtung zu Verhaltensänderungen („Verzerrung durch Reaktivität“) führt. Dieser Effekt ist in der experimentellen Forschung auch als Hawthorne-Effekt bekannt, da dieser Zusammenhang erstmals in einer Untersuchung über die Arbeitsbedingungen in den Hawthorne-Werken der Western Electric Company in den 20er Jahren entdeckt wurde. Weiterhin wird kritisch angemerkt, dass die Entscheidungssituationen in Laborexperimenten häufig sehr einfach sind und stark abstrahieren. Wobei sich diese Kritik teilweise auf die zu überprüfenden Theorien bezieht. Denn das experimentelle Design wird auf die zu überprüfenden Theorien ausgerichtet. Wenn diese Theorien relativ einfach und abstrakt sind, dann ist dies auch das experimentelle Design. Generell lässt sich in diesem Zusammenhang ergänzend noch festhalten, dass Theorien, die aufgrund von einfachen Experimenten verworfen werden müssen, erst recht für die komplexere Realität ungeeignet sind.26 Im Hinblick auf die ökonomischen Experimente besteht somit ein Trade-off bezüglich der internen und externen Validität in Form der postulierten Kontrolle und Einfachheit der Experimente und der geforderten Realitätsnähe. So ist meistens ein Kompromiss zwischen der Vereinfachung und der Übertragbarkeit auf die Realität zu finden. Ein weiteres Gütekriterium empirischer Forschung stellt die Reliabilität dar. Die Reliabilität beinhaltet die Zuverlässigkeit einer Messung, d. h. bei wiederholten Messungen in der gleichen Entscheidungssituation müssen die Ergebnisse identisch sein. Die Reliabilität bezieht sich im Gegensatz zur Validität auf unsystematische Fehler in einem Experiment. Je geringer diese Fehler, desto höher ist die Reliabilität der Untersuchung. Ökonomische Experimente weisen zumeist eine hohe Reliabilität auf, da vor allem beim Einsatz von anreizkompatiblen Messmethoden die Fehlervarianz sinkt.27 Abschließend sei noch auf den zeitlichen und finanziellen Aufwand von Experimenten verwiesen, der nicht unterschätzt werden darf. So werden Laborexperimente häufig in kleinen Gruppen durchgeführt und jede Session kann eine halbe oder 26 27

Vgl. Davis / Holt (1993). Vgl. Schade (2004), Hertwig (1998), Smith / Wakker (1993).

92

Martina Steul

gar eine Stunde dauern. Auch sind die Teilnehmer bei ökonomischen Laborexperimenten angemessen zu entlohnen, damit überhaupt erst Teilnehmer gewonnen werden können und vor allem die Forderung der „saliency“ in der Anreizgestaltung erfüllt wird. Bei Feldexperimenten kann dabei der zeitliche und finanzielle Aufwand noch sehr viel größer sein. In diesem Zusammenhang sind vor allem OnlineExperimente vorteilhaft, da diese kostengünstig durchgeführt werden können.

D. Wodurch unterscheiden sich ökonomische Experimente von psychologischen Experimenten? Jedem Experiment liegt das Prinzip zugrunde, dass die Wirkungen einer oder mehrerer (unabhängiger) Variablen auf eine oder mehrere (abhängige) Variablen untersucht werden. Jedoch unterscheiden sich ökonomische Experimente von psychologischen Experimenten – wie sie häufig in der Marketingforschung eingesetzt werden – in einigen wesentlichen Aspekten. Im Folgenden wird daher ein Überblick über die wichtigsten Unterschiede zwischen ökonomischen und psychologischen Experimenten gegeben. Das Hauptmerkmal ökonomischer Experimente und zugleich der größte Unterschied zu psychologischen Experimenten liegt darin, dass ökonomische Experimente anreizkompatibel sind. In psychologischen Experimenten ist die anreizkompatible Bezahlung der Probanden eher die Ausnahme. Da die monetären Anreize die Fehlervarianz in Experimenten reduzieren kann, wird die Forderung, anreizkompatible Bezahlungen in psychologische Experimente vermehrt einzuführen, selbst von Psychologen (vgl. z. B. Hertwig 1998) immer stärker vertreten – auch wenn die Experimente damit teurer werden. Die experimentelle Ökonomik unterscheidet sich von anderen experimentellen Verhaltenswissenschaften auch dadurch, dass ökonomische Experimente in einem sehr engen Zusammenhang zu formalen Theorien stehen und damit stark theoriegeleitet sind. Nach Weimann (2003) „. . . weist die experimentelle Wirtschaftsforschung mehr Ähnlichkeiten zur experimentellen Physik als zur experimentellen Psychologie auf.“28 Darüber hinaus sind in der experimentellen Ökonomik Täuschungsexperimente im Gegensatz zur Psychologie tabu. Davis / Holt (1993) begründen diese Einstellung wie folgt: „The researcher should . . . be careful to avoid deceiving participants. Most economists are very concerned about developing and maintaining a reputation among the student population for honesty in order to ensure that subject actions are motivated by the induced monetary rewards rather than by psychological reactions to suspected manipulation. Subjects may suspect deception if it is present. Moreover, even if subjects fail to detect deception within a session, it may 28

Weimann (2003), S. 87.

Experimental Economics und Marketing

93

jeopardize future experiments if the subjects ever find out that they were deceived and report this information to their friends.“29 Experimentelle Ökonomen befürchten somit durch Täuschungsexperimente vor allem einen Verlust der Glaubwürdigkeit und der experimentellen Kontrolle.30

E. Anwendung ökonomischer Experimente im Marketing Obwohl bisher ökonomische Experimente nur selten im Marketing durchgeführt werden, können diese in ganz unterschiedlichen Gebieten des Marketings eingesetzt werden. Ein wichtiges Anwendungsgebiet der ökonomischen Experimente in der Marktforschung stellt die Aufdeckung und Messung der wahren Zahlungsbereitschaften durch den Einsatz von anreizkompatiblen Methoden dar. Deshalb werden im Folgenden diese anreizkompatiblen Methoden und die Messung von Zahlungsbereitschaften besonders hervorgehoben. Danach erfolgt eine Darstellung der möglichen Anwendungsgebiete der ökonomischen Experimente im Marketing anhand verschiedener Beispiele, die das Einsatzpotential dieser Experimente für die Marketingforschung aufzeigen. I. Messung von Zahlungsbereitschaften Die Messung und Aufdeckung der wahren Zahlungsbereitschaften („willingness to pay“) bzw. der Reservationspreise von Kunden hat große Bedeutung für das Marketing und ist zugleich ein grundlegendes Anliegen der Experimental Economics. Im Marketing wurden bisher vor allem Kaufdaten oder Präferenzdaten aus Preisbefragungen zur Aufdeckung von Zahlungsbereitschaften herangezogen. Jedoch ist die Validität bei Preisbefragungen aufgrund der hypothetischen Entscheidungssituation zweifelhaft und bei Kaufdaten weist der Preis meist eine zu geringe Varianz auf.31 In der Experimental Economics werden dagegen zur Messung der wahren Zahlungsbereitschaften anreizkompatible Methoden eingesetzt. Es handelt sich hier um anreizkompatible Methoden wie die Vickrey-Auktion oder den Becker-DeGroot-Marschak-Mechanismus (BDM-Mechanismus).32 Bei dem Auktionsmechanismus von Vickrey (1961) („second price sealed bit auction“) geben die Auktionsteilnehmer ihr Gebot geheim ab.33 Dabei erhält der Davis / Holt (1993), S. 23 – 24. Vgl. Hertwig (1998). 31 Vgl. Kaas / Ruprecht (2003). 32 Vgl. Vickrey (1961), Becker et al. (1964), Safra / Segal / Spivak (1990), Skiera / Revenstorff (1999); vgl. auch Wertenbroch / Skiera (2002), die eine Variation des BDM-Mechanismus in der Marktforschung eingesetzt haben. 33 Vgl. McAfee / McMillan (1987). 29 30

94

Martina Steul

Höchstbietende das Auktionsgut zu dem Preis in Höhe des zweithöchsten Gebots. Somit beeinflusst der Gewinner der Auktion nicht den Preis des Gutes, was wiederum zur Anreizkompatibilität beiträgt. Bisher wurde die Vickrey-Auktion sehr selten in der Marktforschung zur Erhebung von Zahlungsbereitschaften eingesetzt (vgl. u. a. Hoffman et al. 1993, Skiera / Revenstorff 1999), obwohl durch diese Auktionsform die Gebote und damit die Zahlungsbereitschaften von allen Teilnehmern anreizkompatibel erhoben werden können. Bei dem BDM-Mechanismus geben die Teilnehmer ebenso ein verdecktes Gebot ab. Jedoch wird hier der Preis des Gutes durch einen Zufallsmechanismus bestimmt – beispielsweise wird aus einer Urne mit 100 Kugeln eine Kugel gezogen, die einem zuvor festgelegten Preis entspricht. Falls das Gebot des Teilnehmers nun über diesem gezogenen Preis liegt, erhält er das Produkt zu dem gezogenen Preis – falls das Gebot darunter liegt, kann er das Produkt nicht kaufen. Da auch hier der Preis unabhängig von dem Gebot ist, liegt eine theoretische Anreizkompatibilität vor. Durch anreizkompatible Methoden wie der Vickrey-Auktion und dem BDMMechanismus sollen andere Motivationen der Probanden, die nicht der zu untersuchenden Entscheidungssituation entsprechen, in den Hintergrund treten. Schwierig ist dabei, die Methoden so zu gestalten, dass sie tatsächlich die wahren Zahlungsbereitschaften offen legen und die Probanden sich nicht strategisch verhalten. So zeigen einige experimentelle Studien, dass sich die Ergebnisse dieser anreizkompatiblen Methoden hinsichtlich der Zahlungsbereitschaften unterscheiden und eigentlich zwischen der theoretischen Anreizkompatibilität und der empirischen Anreizkompatibilität differenziert werden muss.34 Nach neueren Studien scheint dies auch auf die Vickrey-Auktion und den BDMMechanismus zuzutreffen. Beispielsweise neigen die Teilnehmer einer VickreyAuktion häufig zum Über- oder Unterbieten, was u. a. mit Verständnisproblemen des Auktionsmechanismus erklärt werden kann oder einer „Unschärfe“ in der Wahrnehmung und Bewertung der eigenen Zahlungsbereitschaft (vgl. Kaas / Ruprecht 2003). Nach den Untersuchungen von Kaas / Ruprecht (2003) und Sattler / Nitschke (2003) kommen somit Zweifel auf, ob die Vickrey-Auktion und der BDM-Mechanismus ohne weiteres zur Messung der wahren Zahlungsbereitschaft geeignet sind. Dem steht aber die Einschätzung von Skiera / Revenstorff (1999) gegenüber, die der Vickrey-Auktion eine relativ hohe Reliabilität und Validität bescheinigen. Wie diese unterschiedlichen Einschätzungen und Ergebnisse zeigen, ist zur Messung von Zahlungsbereitschaften noch keine abschließende Lösung gefunden worden, so dass hier noch weiterer Forschungsbedarf zur Validität der anreizkompatibel gemessenen Zahlungsbereitschaften auch im Marketing besteht. Grundsätzlich bieten die anreizkompatiblen Methoden, wie sie in der Experimental Economics 34

Vgl. Kaas / Ruprecht (2003).

Experimental Economics und Marketing

95

eingesetzt werden, dennoch eine sehr gute Basis für weitere Untersuchungen. So werden anreizkompatible Mechanismen u. a. in der Marketingforschung eingesetzt, um die Zahlungsbereitschaften der Probanden als Indikator für deren Präferenzen, Bewertungen oder Wahrnehmungen in Abhängigkeit der experimentellen Bedingungen zu untersuchen. In diesem Fall spielt natürlich die absolute Höhe der Zahlungsbereitschaften keine große Rolle, sondern nur der relative Vergleich der Zahlungsbereitschaften über die experimentellen Bedingungen. Dieser Vergleich geschieht dabei unter der Annahme, dass ein möglicher Messfehler über alle Experimentbedingungen gleichermaßen auftritt.

II. Marketingforschung Die zu Beginn aufgeführten Gründe für die Anwendung von ökonomischen Experimenten gelten natürlich auch für den Einsatz in der Marketingforschung. So können ökonomische Experimente ebenso zur Überprüfung von Marketingtheorien herangezogen werden, als auch die Basis zur Entwicklung neuer Theorien bilden. Dabei sind parallel zu den Schwerpunkten der Experimental Economics unterschiedliche Einsatzmöglichkeiten in der Marketingforschung denkbar. So können Wettbewerbs- und Marktmodelle (z. B. Markteintrittsstrategien) analog zu den Markt- und spieltheoretischen Experimenten der Experimental Economics Gegenstand von Experimenten sein. Ein Beispiel im Marketing dazu ist die theoretische und experimentelle Untersuchung von Amaldoss et al. (2000) zu strategischen Unternehmensallianzen. So überprüfen die Autoren mittels zweier ökonomischer Experimente ein von ihnen entwickeltes spieltheoretisches Wettbewerbsmodell, das den Einfluss der Gewinnverteilung und der Art der Allianz auf das Commitment der Allianzpartner bei der Entwicklung eines neuen Produktes beschreibt. Ein weiteres Beispiel stellt die Untersuchung von Camerer / Lovallo (1999) dar. Sie führen ökonomische Experimente zu der Frage durch, ob und wie eine Selbstüberschätzung („overconfidence“) von Managern die Markteintrittsentscheidung beeinflusst und ob damit letztlich ein Misserfolg des Markteintritts erklärt werden kann. Für das Marketing sind vor allem ökonomische Experimente im Zusammenhang mit dem individuellen Entscheidungsverhalten interessant, insbesondere zur Erforschung des Konsumentenverhaltens. Es wurde bisher eine Reihe von Experimenten zur Rationalität von Entscheidern durchgeführt, die zeigen, dass Entscheider systematisch gegen die Erwartungsnutzentheorie verstoßen und dazu neigen, Heuristiken zu verwenden.35 Diese Experimente bilden wiederum die Basis für die Entwicklung alternativer Theorien zur Erwartungsnutzentheorie wie dies im Bereich der Behavioral Decision Theories zu finden ist. Die Prospect Theorie von Kahneman / Tversky (1979), als ein Modell der mathematischen Psychologie, ist 35

Vgl. u. a. Camerer (1995), Kahneman et al. (1982).

96

Martina Steul

das prominenteste Beispiel dafür. Sie berücksichtigt Wahrnehmungsphänomene sowie Kontextabhängigkeiten bei Entscheidungen und modelliert deren Einflüsse auf das Entscheidungsverhalten. Seit den neunziger Jahren findet die Prospect Theorie immer mehr Beachtung in der Marketingtheorie. So lassen sich direkt aus der Prospect Theorie Marketingmaßnahmen ableiten, die beispielsweise die Produkt- oder Preisbewertung der Konsumenten betreffen.36 Ebenso wurde vielfach experimentell untersucht, wie das Mental Accounting (vgl. Thaler 1985, 1999) als kognitiver Verarbeitungsprozess das Kaufverhalten und die Präferenzen von Konsumenten beeinflusst. Demnach haben Konsumenten verschiedene psychologische Konten, auf denen sie Gewinne und Verluste verbuchen. Das Framing einer Entscheidungssituation, das häufig durch Marketingmaßnahmen bestimmt werden kann, beeinflusst wiederum die Aktivierung dieser mentalen Konten (vgl. Tversky / Kahneman 1981). So zeigt sich beispielsweise in einer experimentellen Untersuchung zum Framing von Investmentportfolios, dass die gebündelte Darstellung gegenüber der separaten Darstellung der einzelnen Kapitalanlagen eines Investmentportfolios zu Präferenzänderungen seitens privater Anleger führen kann (vgl. Steul 2003). Ein weiteres Phänomen, das mittels ökonomischer Experimente entdeckt und bestätigt wurde, ist der Besitztumseffekt („endowment effect“).37 Der Besitztumseffekt beschreibt das Auseinanderfallen von Kaufpreis („willingness-to-pay“) und Verkaufspreis („willingness-to-accept“). Die Wertschätzung eines Produktes hängt demnach von dem Besitz des Produktes ab. So zeigen Kahneman et al. (1990) u. a. in einem Experiment mit Kaffeetassen, dass die Gruppe der Probanden, die mit einer Kaffeetasse zu Beginn des Experiments ausgestattet wurden, einen sehr viel höheren Preis für den Verkauf ihrer Kaffeetasse verlangen als die Gruppe der Probanden, die die Option haben, eine Kaffeetasse zu kaufen. Der Besitztumseffekt kann vor allem mit der Verlustaversion der Verkäufer erklärt werden. Weiterhin wurde mittels ökonomischer Experimente untersucht, inwiefern die Zahlungsmittel der Konsumenten, z. B. Kreditkarte oder Bargeld, einen Einfluss auf das Kaufverhalten und die Zahlungsbereitschaften haben.38 Dazu führten Prelec / Simester (2001) zwei anreizkompatible Experimente mit realen Zahlungen durch. Zur Messung der Zahlungsbereitschaften wurde in dem ersten Experiment der Auktionsmechanismus von Vickrey (1961) und in dem zweiten Experiment der BDM-Mechanismus eingesetzt. Die Experimente zeigen, dass die Zahlungsbereitschaften der Konsumenten bei einer Kreditkartenzahlung im Vergleich zu einer Barzahlung steigen, vor allem bei Produkten mit einem ungewissen Marktwert. Dieser Einfluss der Zahlungsmittel auf die Zahlungsbereitschaften konnte dabei mit alternativen, empirischen Methoden zuvor nicht direkt nachgewiesen werden. 36 Vgl. u. a. Gierl et al. (2001), Hardie et al. (1993), Herrmann et al. (1997), Herrmann / Bauer (1996). 37 Vgl. Smith (1994), Kahneman et al. (1990). 38 Vgl. u. a. Soman (2003), Prelec / Simester (2001).

Experimental Economics und Marketing

97

F. Fazit Die Vorteile ökonomischer Experimente, wie die hohe interne Validität und die hohe Reliabilität, machen diese Forschungsmethode sehr interessant für das Marketing. So können mit Hilfe der ökonomischen Experimente Marketingtheorien entwickelt und überprüft werden. Es lassen sich gezielt Hypothesen mit diesen Experimenten testen, für die es bisher schwierig war, äquivalente Messmethoden zur Verfügung zu haben. Ein Beispiel hierzu stellt die Untersuchung des Zusammenhangs der Zahlungsmittel und des Kaufverhaltens dar, der nur unter Zuhilfenahme anreizkompatibler Experimente mit realen Zahlungen eindeutig nachgewiesen werden konnte (vgl. Prelec / Simester 2001). Jedoch sind die Schwierigkeiten ökonomischer Experimente wie gegebenenfalls eine niedrige externe Validität durch die Künstlichkeit im Labor oder eine ausreichende Anreizgestaltung nicht zu vernachlässigen. Hier liegt die besondere Herausforderung in der Anwendung ökonomischer Experimente. Verschiedene Lösungsansätze zu diesen Problemen wurden bereits diskutiert und vorgestellt. Darüber hinaus ist im Marketing zu beachten, dass sich ökonomische Experimente sehr viel schwerer umsetzen lassen, wenn es beispielsweise um die Untersuchung von komplexen und hochwertigen Produkten (z. B. Luxusautos oder Wohnungen)39 sowie Zeiteffekten oder Erfahrungen (z. B. langjährige Konsum- oder Produkterfahrungen) geht. Hier dürften die Grenzen im Einsatz der Experimental Economics im Marketing liegen. In diesem Beitrag konnte nur ein kleiner Ausschnitt der Anwendungsmöglichkeiten der Experimental Economics im Marketing gegeben werden. Aber dennoch wurde deutlich, dass der Einsatz ökonomischer Experimente als empirische Forschungsmethode im Marketing wünschenswert ist und zur Lösung vielfältiger Marketingfragen eingesetzt werden kann.

Literatur Amaldoss, W. / Meyer, R. / Raju, J. S. / Rapoport, A. (2000): Collaborating to Compete, in: Marketing Science, Vol. 19, S. 105 – 126 Anderhub, V. / Müller, R. / Schmidt, C. (2001): Design and Evaluation of an Economic Experiment via the Internet, in: Journal of Economic Behavior and Organization, Vol. 46, S. 227 – 247 Allais, M. (1953): Le Comportement de L’homme Rationnel Devant le Risque: Critique des Postulats et Axioms de L’ecole Americane, in: Econometrica, Vol. 21, S. 503 – 546 Beattie, J. / Loomes, G. (1997): The Impact of Incentives upon Risky Choice Experiments, in: Journal of Risk and Uncertainty, Vol. 14, S. 155 – 168

39 Schade (2005) verweist noch auf das Ausmaß der Umweltdynamik als Entscheidungskriterium für den Einsatz von ökonomischen Experimenten.

7 FS Kaas

98

Martina Steul

Becker, G. M. / DeGroot, M. H. / Marschak, J. (1964): Measuring Utility by a Single-Response Sequential Method, in: Behavioral Science, Vol. 9, S. 226 – 232 Berekoven, L. / Eckert, W. / Ellenrieder, P. (2004): Marktforschung: methodische Grundlagen und praktische Anwendung, 10. Aufl. Camerer, C. F. (1989): An Experimental Test of Several Generalized Utility Theories, in: Journal of Risk and Uncertainty, Vol. 2, S. 61 – 104 – (1995): Individual Decision Making, in: Kagel, J. H. / Roth, A. E. (eds), The Handbook of Experimental Economics, S. 587 – 703 – (1998): Can Asset Markets Be Manipulated? A Field Experiment with Racetrack Betting, in: Journal of Political Economy, Vol. 106, S. 475 – 482 Camerer, C. F. / Hogarth, R. M. (1999): The Effects of Financial Incentives in Experiments: A Review and Capital-Labor-Production Framework, in: Journal of Risk and Uncertainty, Vol. 19, S. 7 – 42 Camerer, C. F. / Lovallo, D. (1999): Overconfidence and Excess Entry: An Experimental Approach, in: American Economic Review, Vol. 89, S. 306 – 318 Campbell, D. T. / Stanley, J. C. (1966): Experimental and Quasi-Experimental Designs for Research Chamberlin, E. (1948): An Experimental Imperfect Market, in: Journal of Political Economy, Vol. 56, S. 95 – 108 Cubitt, R. / Starmer, C. / Sugden, R. (1998): On the Validity of the Random Lottery Incentive System, in: Experimental Economics, Vol. 1, S. 115 – 131 Davis, D. D. / Holt, C. A. (1993): Experimental Economics Diekmann, A. (2001): Empirische Sozialforschung – Grundlagen, Methoden, Anwendungen Donkers, B. / Melenberg, B. / Soest, A. van (2001): Estimating Risk Attitudes using Lotteries: A Large Sample Approach, in: Journal of Risk and Uncertainty, Vol. 22, S. 165 – 195 Ellsberg, D. (1961): Risk, Ambiguity, and the Savage Axioms, in: Quarterly Journal of Economics, Vol. 75, S. 643 – 669 Fehr, E. / Falk, A. (1999): Wage Rigidity in a Competitive Incomplete Contract Market, in: Journal of Political Economy, Vol. 107, S. 106 – 134 Fehr, E. / Kirchsteiger, G. / Riedl, A. (1993): Does Fairness Prevent Market Clearing? An Experimental Investigation, in: Quarterly Journal of Economics, Vol. 108, S. 437 – 460 Friedman, J. (1963): Individual Behavior in Oligopolistic Markets: An Experimental Study, in: Yale Economic Essays, Vol. 3, S. 359 – 417 Gächter, S. / Fehr, E. (2002): Fairness in the Labour Market – A Survey of Experimental Results, in: Bolle, F. / Lehmann-Waffenschmidt, M. (Hrsg.), Surveys in Experimental Economics – Bargaining, Cooperation and Election Stock Markets, S. 95 – 132 Gierl, H. / Helm, R. / Stumpp, S. (2001): Wertfunktion der Prospect-Theorie, Produktpräferenzen und Folgerungen für das Marketing, in: Zeitschrift für betriebswirtschaftliche Forschung, Vol. 53, S. 559 – 588

Experimental Economics und Marketing

99

Hardie, B. G. / Johnson, E. J. / Fader, P. S. (1993): Modeling Loss Aversion and Reference Dependence Effects on Brand Choice, in: Marketing Science, Vol. 12, S. 378 – 394 Herrmann, A. / Bauer, H. H. (1996): Ein Ansatz zur Preisbündelung auf der Basis der „prospect“-Theorie, in: Zeitschrift für betriebswirtschaftliche Forschung, 48. Jg., S. 675 – 694 Herrmann, A. / Bauer, H. H. / Huber, F. (1997): Wenn Käufer auch verkaufen – Preispolitische Implikationen der „prospect“-Theorie, in: Marketing ZFP, 19. Jg., S. 5 – 14 Hertwig, R. (1998): Psychologie, experimentelle Ökonomie und die Frage, was gutes Experimentieren ist, in: Zeitschrift für Experimentelle Psychologie, 45. Jg., S. 2 – 19 Hoffmann, E. / Menkhaus, D. / Chakravarti, D. / Field, R. A. / Whipple, G. D. (1993): Using Laboratory Experimental Auctions in Marketing Research: A Case Study of New Packaging for Fresh Beef, in: Marketing Science, Vol. 12, S. 318 – 338 Kaas, K. P. / Ruprecht, H. (2003): Sind die Vickrey Auktion und der BDM-Mechanismus wirklich anreizkompatibel? – Empirische Befunde und optimale Bietstrategien bei unsicheren Zahlungsbereitschaften, Arbeitspapier Nr. 11, Lehrstuhl für Marketing I, Johann Wolfgang Goethe-Universität Frankfurt a. M. Kagel, J. H. (1995): Auctions: A Survey of Experimental Research, in: Kagel, J. H. / Roth, A. E. (Hrsg.), The Handbook of Experimental Economics, S. 501 – 585 Kagel, J. H. / Roth, A. E. (1995): The Handbook of Experimental Economics Kahneman, D. / Slovic, P. / Tversky, A. (1982): Judgment under Uncertainty: Heuristics and Biases Kahneman, D. / Tversky, A. (1979): Prospect Theory: An Analysis of Decision under Risk, in: Econometrica, Vol. 47, S. 263 – 291 Kroll, Y. / Levy, H. / Rapoport, A. (1988): Experimental Tests of the Separation Theorem and the Capital Asset Pricing Model, in: American Economic Review, Vol. 78, S. 500 – 519 Kubon-Gilke, G. / Sturn, R. / Held, M. (2003): Experimente in der Ökonomik, in: Held, M. / Kubon-Gilke, G. / Sturn, R. (Hrsg.), Normative und institutionelle Grundfragen der Ökonomik, Jahrbuch 2, Experimente in der Ökonomik, S. 7 – 38 Loewenstein, G. (1999): Experimental Economics from the Vantage-Point of Behavioural Economics, in: The Economic Journal, Vol. 109, S. F25 – F34 McAfee, P. / McMillian, J. (1987): Auctions and Bidding, in: Journal of Economic Literature, Vol. 25, S. 699 – 728 Mosteller, F. / Nogee, P. (1951): An Experimental Measurement of Utility, in: Journal of Political Economy, Vol. 59, S. 371 – 404 Oberholzer-Gee, F. (2003): Arbeitslosigkeit und Beschäftigungschancen – Ein Feldexperiment, in: Held, M. / Kubon-Gilke, G. / Sturn, R. (Hrsg.), Normative und institutionelle Grundfragen der Ökonomik, Jahrbuch 2, Experimente in der Ökonomik, S. 169 – 190 Prelec, D. / Simester, D. (2001): Always Leave Home Without it: A Further Investigation of the Credit-Card Effect on Willingness to Pay, in: Marketing Letters, Vol. 27, S. 460 – 474

100

Martina Steul

Reips, U.-D. (2002): Standards for Internet-Based Experimenting, in: Experimental Psychology, Vol. 49, S. 243 – 256 Safra, Z. / Segal, U. / Spivak, A. (1990): The Becker-DeGroot-Marschak Mechanism and Nonexpected Utility: A Testable Approach, in: Journal of Risk and Uncertainty, Vol. 3, S. 177 – 190 Sattler, H. / Nitschke, T. (1993): Ein empirischer Vergleich von Instrumenten zur Erhebung von Zahlungsbereitschaften, in: Zeitschrift für betriebswirtschaftliche Forschung, 55. Jg., S. 364 – 381 Sauermann, H. (1967): Experimentelle Wirtschaftsforschung, in: Jahrbücher für Nationalökonomie und Statistik, 187. Jg., S. 299 – 312 Sauermann, H. / Selten, R. (1959): Ein Oligopolexperiment, in: Zeitschrift für die Gesamte Staatswissenschaft, 115. Jg., S. 427 – 471 Schade, Ch. (2004): Ökonomische Laborexperimente und Konsumentenverhalten, in: Gröppel-Klein, A. (Hrsg.), Konsumentenverhalten im 21. Jahrhundert, S. 565 – 584 – (2005): Dynamics, Experimental Economics, and Entrepreneurship, in: Journal of Technology Transfer, Vol. 30, S. 403 – 431. Schade, Ch. / Kunreuther, H. / Kaas, K. P. (2002): Low-Probability Insurance Decisions: The Role of Concern, Wharton Risk Center Working Paper Nr. 02 – 10-HK, Wharton School, University of Pennsylvania Schräpler, J.-P. / Wagner, G. G. / Ott, N. (2003): Internet-Experimente mit Survey-Teilnehmern: Lässt sich unterschiedliches Verhalten bei Common Pool Resource Spielen erklären?, in: Held, M. / Kubon-Gilke, G. / Sturn, R. (Hrsg.), Normative und institutionelle Grundfragen der Ökonomik, Jahrbuch 2, Experimente in der Ökonomik, S. 141 – 168 Skiera, B. / Revenstorff, I. (1999): Auktionen als Instrument zur Erhebung von Zahlungsbereitschaften, in: Zeitschrift für betriebswirtschaftliche Forschung, 51. Jg., S. 224 – 242 Smith, V. L. (1976): Experimental Economics: Induced Value Theory, in: American Economic Review, Vol. 66, S. 274 – 279 – (1989): Theory, Experiment and Economics, in: Journal of Economic Perspectives, Vol. 3, S. 151 – 169 – (1994): Economics in the Laboratory, in: Journal of Economic Perspectives, Vol. 8, S. 113 – 131 Smith, V. L. / Walker, J. (1993): Monetary Rewards and Decision Cost in Experimental Economics, in: Economic Inquiry, Vol. 31, S. 245 – 261 Soman, D. (2003): The Effect of Payment Transparency on Consumption: Quasi-Experiments from the Field, in: Marketing Letters, Vol. 14, S. 173 – 183 Steul, M. (2003): Risikoverhalten privater Kapitalanleger – Implikationen für das Finanzdienstleistungsmarketing Thaler, R. H. (1985): Mental Accounting and Consumer Choice, in: Marketing Science, Vol. 4, S. 199 – 214 – (1999): Mental Accounting Matters, in: Journal of Behavioral Decision Making, Vol. 12, S. 183 – 206

Experimental Economics und Marketing

101

Tversky, A. / Kahneman, D. (1981): The Framing of Decisions and the Psychology of Choice, in: Science, Vol. 211, S. 453 – 458 – (1992): Advances in Prospect Theory: Cumulative Representation of Uncertainty, in: Journal of Risk and Uncertainty, Vol. 5, S. 297 – 323 Vickrey, W. (1961): Counter Speculation, Auctions, and Competitive Sealed Tenders, in: Journal of Finance, Vol. 16, S. 8 – 37 Weber, M. / Camerer, C. (1992): Ein Experiment zum Anlegerverhalten, in: Zeitschrift für betriebswirtschaftliche Forschung, 44. Jg., S. 131 – 148 Weimann, J. (2003): Kooperation, Koordination und Reziprozität, in: Held, M. / Kubon-Gilke, G. / Sturn, R. (Hrsg.): Normative und institutionelle Grundfragen der Ökonomik, Jahrbuch 2, Experimente in der Ökonomik, S. 87 – 112 Wertenbroch, K. / Skiera, B. (2002): Measuring Consumer Willingness to Pay at the Point of Purchase, in: Journal of Marketing Research, Vol. 39, S. 228 – 241

Multimodale Erlebnisvermittlung am Point of Sale – eine empirische Analyse am Beispiel eines Reisebüros Peter Weinberg und Ralph Salzmann

A. Gegenstand des Beitrags Sowohl die Reisebürobranche als auch der Einzelhandel sehen sich zurzeit ähnlichen Rahmenbedingungen ausgesetzt. Beide versuchen, sich in schwierigen Zeiten auf Käufermärkten zu behaupten, die durch weitestgehend austauschbare Sortimente geprägt sind. Eine Profilierung über die Produktqualität erscheint demgemäß kaum möglich. Die gegenwärtige Angebotspolitik rund um „Geiz ist geil“ und „Ich bin doch nicht blöd“ verdeutlicht, dass die „Lösung“ der Problematik hauptsächlich mittels einer Profilierung über den Preis angestrebt wird. Von den mittelfristigen sozialen und volkswirtschaftlichen Konsequenzen dieser Vorgehensweise einmal ganz abgesehen, werden betriebswirtschaftlich zweierlei Dinge nicht berücksichtigt: Erstens handelt es sich beim Preis um das am leichtesten zu imitierende Instrument des Marketing-Mix. Ein Anbieter, der sich vorrangig über den Preis positioniert, behält einen Kunden nur so lange, wie er auch tatsächlich der günstigste Anbieter ist. Dass die Gewinne, die aus dem günstigsten Angebot erwirtschaftet werden, bei vergleichbarer Kostenstruktur auch die niedrigsten sind, versteht sich von selbst. Folglich steht ein derart transaktional ausgerichtetes Marketing bei verschwindend geringen Margen auf einem sehr wackligen Fundament. Zweitens – und wohl von größerer Bedeutung – läuft die überwiegende Mehrheit der Anbieter Gefahr, ein wichtiges Klientel nicht anzusprechen, die sogenannten Erlebniskäufer. Nach wie vor streben die Menschen nach Genuss, Spaß und Vergnügen, die es auch im Rahmen des Konsums zu vermitteln gilt. Versteht man Marketing im generischen Sinne als Mittel, Austauschbeziehungen zwischen Unternehmen und Konsumenten so zu gestalten, dass beide Parteien ihre Bedürfnisse befriedigen, so wird deutlich, dass die Strategie der Erlebnisvermittlung einen Lösungsansatz zu beiderseitigem Nutzen bieten kann. Durch die Kommunikation, das Produkt oder die Einkaufsstätte werden subjektiv wahrgenommene Erlebniswerte vermittelt, die zur Lebensqualität der Konsumenten beitragen. Dadurch wird eine emotionale Beziehung der Konsumenten zum Anbieter geschaffen und so ein Ausweg aus der Preisfalle hin zu einem dauer-

104

Peter Weinberg und Ralph Salzmann

haften Markterfolg eröffnet (vgl. Kroeber-Riel / Weinberg 2003, S. 116; Weinberg 1992, S. 3). Im Zentrum des vorliegenden Beitrags steht die multimodale Erlebnisvermittlung über die Ladengestaltung einer Einkaufsstätte. Es stellt sich hierbei die Frage, wie Erlebnisse zu vermitteln sind. Die Antwort darauf ist nahe liegend und intuitiv verständlich. Der Mensch erlebt dann am intensivsten, wenn er erstens über alle Sinne erlebt und zweitens alle Sinne das gleiche Erlebnis transportieren, also wenn eine multimodale kongruente Erlebnisvermittlung erfolgt. Ein Blick in die Handelspraxis verdeutlicht allerdings, dass sich zahlreiche Händler auf eine unimodale, nämlich optische Ansprache der Konsumenten beschränken. Diejenigen, die Raumdüfte und / oder Hintergrundmusik einsetzen, wählen häufig Stimuli aus, die den Konsumenten (vermeintlich) gefallen. Inwiefern die multimodalen Stimuli sich gegenseitig ergänzen und ein einheitliches Erlebnis vermitteln, bleibt meist unberücksichtigt. Im Folgenden werden zunächst relevante theoretische Grundlagen sowie ein theoretischer Bezugsrahmen der multimodalen kongruenten Erlebnisvermittlung am Point of Sale dargestellt. Nach einem kurzen Überblick über aktuelle Forschungsarbeiten werden Vorgehensweise und ausgewählte Ergebnisse einer empirischen Studie vorgestellt, in deren Rahmen untersucht wird, inwiefern die Kombination von olfaktorischen Reizen in Form eines Raumduftes und akustischen Reizen in Form von Hintergrundmusik ein multimodales Einkaufserlebnis inszenieren können.

B. Theoretische Grundlagen der multimodalen Wahrnehmung I. Neurowissenschaftliche Erkenntnisse Ein Verständnis der menschlichen Wahrnehmung setzt ein Verständnis neuronaler Prozesse voraus. Schließlich extrahiert das Nervensystem Reize aus der Umwelt und wandelt diese in Wahrnehmungen, Erinnerungen oder Verhaltensweisen um (vgl. Meredith 2002, S. 31). Neurowissenschaftler verfolgten im Rahmen der Wahrnehmungsforschung lange Zeit einen „sense-by-sense-approach“, indem sie die einzelnen Sinne und deren Funktionen isoliert voneinander erforschten. Dadurch geriet eine wesentliche Eigenschaft der menschlichen Wahrnehmung nahezu in Vergessenheit: Der Mensch nimmt multisensorisch und ganzheitlich wahr (vgl. Calvert et al. 2004, S. XI). Bereits Aristoteles beschäftigte sich in seinem Buch „De Anima“ mit diesem Phänomen und führte in erster Linie Argumente für die Einheit der Sinne auf. Er behauptete, es gebe über die fünf Sinne hinaus einen „sensus communis“, eine psychische Instanz, die die aus den einzelnen Sinnesmodalitäten stammenden Einzel-Informationen auf einer höheren Ebene integriert (vgl. Guski 2002).

Multimodale Erlebnisvermittlung am Point of Sale

105

Diese Sichtweise eines hierarchisch organisierten multimodalen Wahrnehmungsprozesses hat bis heute Bestand. Danach erfolgt eine rein unimodale Reizverarbeitung in den modalitätsspezifischen Arealen des Cortex, erst danach werden Impulse an zahlreiche heteromodale Zonen des Cortex weitergegeben, in denen eine Integration der verschiedenen modalitätsspezifischen Reize stattfindet. In jüngster Zeit liefern zahlreiche neurowissenschaftliche Untersuchungen (vgl. z. B. den Sammelband von Calvert et al. 2004) Anhaltspunkte dafür, dass ein derartiges Modell, das multisensorische Integration ausschließlich in „späten“ – hier geht es wohlgemerkt um Latenzen im Millisekundenbereich – Stadien der Reizverarbeitung proklamiert, der Komplexität der Realität nicht gerecht wird.1 So wurde festgestellt, dass die Sinne sogar in frühesten Stadien der kortikalen Reizverarbeitung Einfluss aufeinander ausüben. Folglich mehren sich die Hinweise, dass die multisensorische Integration in frühen und späten Stadien der Reizverarbeitung über ein Netzwerk von bidirektionalen Verbindungen erfolgt (vgl. Calvert / Thesen 2004, S. 192 f.; Thesen et al. 2004, S. 85). Wenngleich die Neurowissenschaftler im Rahmen ihrer Studien vorrangig (noch) mit elementaren Reizen arbeiten (und arbeiten müssen), die im Marketingkontext nicht derart vorliegen2, so lässt sich dennoch allgemeingültig festhalten: Wahrnehmung ist bereits auf der Ebene der neuronalen Rezeption ein multimodaler Vorgang, der Sinneseindrücke verschiedener Modalitäten ganzheitlich integriert.

II. Gedächtnistheoretische Ansätze Das Dreispeichermodell schlägt die Brücke zwischen der neuronalen Rezeption von Reizen und den Prozessen der Informationsverarbeitung und -speicherung. Im sensorischen Informationsspeicher erfolgt im Wesentlichen ein passives Festhalten der Sinneseindrücke für ganz kurze Zeit. In Abhängigkeit des Aktivierungspotenzials der Reize gelangen diese in den Kurzzeitspeicher, die zentrale Einheit der Informationsverarbeitung. Erst dort werden die gerade aus der Umwelt übernommenen Reize entschlüsselt und in kognitiv verfügbare Informationen umgesetzt. 1 Treiber für diese Entwicklung ist die Anwendung bildgebender Verfahren, die eine genaue Analyse der Routen der multisensorischen Integration des Menschen ermöglichen. So zeichnen sich die hämodynamischen Verfahren Positronenemissionstomographie (PET) und funktionelle Kernspintomographie (fMRI) insbesondere durch ihre hohe räumliche Auflösung aus und können demnach uni- bzw. heteromodale Areale genau lokalisieren. Die elektromagnetischen Methoden Elektroenzephalogramm (EEG) und Magnetenzephalogramm (MEG) hingegen sind durch ihre hohe zeitliche Auflösung in der Lage, den zeitlichen Ablauf der Reizverarbeitung wiederzugeben (vgl. Calvert / Thesen 2004, S. 196 ff.). 2 Österbauer et al. (2005) sowie Gottfried und Dolan (2003) bilden hier eine Ausnahme und untersuchen mittels fMRI das neurophysiologische Korrelat des crossmodalen Einflusses der Farbe eines visuellen Stimulus auf die hedonische Bewertung eines gleichzeitig dargebotenen Duftes. Sie behandeln damit eine Fragestellung, die beispielsweise in der Produktund Verpackungsgestaltung von Kosmetikprodukten von großer Bedeutung ist (vgl. dazu beispielsweise Mani 1999).

106

Peter Weinberg und Ralph Salzmann

Dazu muss der Kurzzeitspeicher die eintreffenden Reize mit aus der Vergangenheit stammenden Informationen zusammenbringen, indem er auf den Langzeitspeicher, der dem menschlichen Gedächtnis entspricht, zurückgreift (vgl. Kroeber-Riel / Weinberg 2003, S. 225 ff.). Zahlreiche gedächtnistheoretische Ansätze, die die innere Repräsentation von Wissen im menschlichen Gedächtnis thematisieren, beinhalten den Grundgedanken einer multimodalen Informationsverarbeitung und -speicherung. Die Theorie der semantischen Netzwerke geht davon aus, dass Wissen in Form von Netzwerken gespeichert wird (vgl. z. B. Anderson 2001). Letztere bestehen aus Knoten, die Bewusstseinsinhalte in Form von Wahrnehmungen, Vorstellungen, Begriffen und Gefühlen beinhalten, und Kanten, die die Beziehungen zwischen den Knoten wiedergeben (vgl. Grimm / Engelkamp 1981, S. 38; Anderson 2001, S. 150 ff.). Je näher die abgebildeten Beziehungen sind, d. h. je kürzer die Kanten zwischen zwei Knoten ausfallen, desto stärker ist deren gedankliche Verknüpfung (vgl. Kroeber-Riel / Weinberg 2003, S. 231). Untenstehende Abbildung zeigt die Struktur eines fiktiven semantischen Netzwerkes zum Begriff „Karibik“ (vgl. Abbildung 1).

Freude Genuss Cocktails Party

Tanzen

Abenteuer Merengue Exotik

karib. Musik

Reggae

Hitze Sonne Bräune

Karibik karib. Düfte

exot. Früchte

Insel Kokosnuss Meer

Strand

Palmen

blau

Tauchen

Urlaub

Sand

Erholung

Quelle: Eigene Darstellung.

Abbildung 1: Struktur eines fiktiven semantischen Netzwerkes

Von besonderer Bedeutung im Kontext der Multimodalität ist dabei die Theorie der Aktivierungsausbreitung (vgl. Anderson 2001, S. 185 ff.). Danach werden

Multimodale Erlebnisvermittlung am Point of Sale

107

durch dargebotene äußere Reize unterschiedlicher Modalitäten (oder innere Reize) bestimmte Vorstellungen aktiviert. Die Aktivierung breitet sich anschließend im semantischen Netz aus und erfasst die indirekt oder direkt mit einem Knoten assoziierten weiteren Knoten (vgl. Engelkamp 1984, S. 47). Die Stärke der Beziehungen zwischen den Knoten hängt davon ab, wie oft die Pfade durchlaufen wurden und beruht damit im Wesentlichen auf Erfahrungen. Während die Netzwerktheorie davon ausgeht, dass die miteinander verbundenen Knoten ungeordnet und unstrukturiert sind, postuliert die Schematheorie als eine spezielle Form der Netzwerktheorie eine geordnete, hierarchische Struktur der Knoten (vgl. Engelkamp 1990, S. 73). Demgemäß stellen Schemata „selbständige und abgrenzbare Teile eines semantischen Netzes dar, die standardisierte Vorstellungen und typische Merkmale (multisensorischer Art, d. Verf.) zu bestimmten Sachverhalten“ beinhalten (Woll 1997, S. 111). Schemata enthalten Informationen darüber, wie bestimmte Sachverhalte aussehen, riechen, sich anhören, sich anfühlen oder schmecken. Sie definieren dadurch, welche Reize aus der Umwelt einem Schema entsprechen, d. h. welche Reize (schema-)kongruent sind bzw. zueinander passen. Sie steuern die Wahrnehmung, vereinfachen Denkvorgänge und organisieren die Informationsspeicherung (vgl. Kroeber-Riel / Weinberg 2003, S. 234). Cohen und Basu (1987) konnten nachweisen, dass kongruente Reize über deren vereinfachte Kategorisierung zu positiven Affekten führen. Die multimodale Gedächtnistheorie von Engelkamp (1991) greift auf wesentliche Aspekte der Netzwerk- und Schematheorie, wie die Theorie der Aktivierungsausbreitung oder die hierarchische Netzwerkorganisation, zurück, ermöglicht allerdings differenziertere Aussagen über die modalitätsspezifische Verarbeitung und Speicherung von Reizen. Nach der multimodalen Gedächtnistheorie existiert auf einer übergeordneten Ebene ein semantisches bzw. konzeptuelles Gedächtnis, das Gedächtnisinhalte in abstrakter, modalitätsunspezifischer Form, Konzepte genannt, speichert. Auf einer untergeordneten Ebene liegen Repräsentationen von sensorischen Qualitäten in modalitätsspezifischen Subsystemen vor. Die ursprüngliche Form der Wahrnehmung wird in diesen Teilsystemen beibehalten. Dadurch werden Reize, die in multimodaler Form vorliegen, in verschiedenen Subsystemen und damit mehrfach gespeichert und folglich besser erinnert. Ferner führt die multimodale Ansprache zu intensiver erlebten Emotionen (vgl. Engelkamp 1991; Zimmer 1986, S. 56).

108

Peter Weinberg und Ralph Salzmann

3. Theoretischer Bezugsrahmen zur Analyse multimodaler Erlebnisvermittlung am Point of Sale I

S

a

O

V

R

·

A

·

·

Quelle: Eigene Darstellung in Anlehnung an und Erweiterung von Kroeber-Riel / Weinberg 2003; Mehrabian / Russell 1974; Bitner 1992; Gulas / Bloch 1995; Lam 2001.

Abbildung 2: Erweitertes SIR-Modell der multimodalen Erlebnisvermittlung am Point of Sale

Das obige Modell trennt gemäß dem Postulat des SIR-Modells zwischen direkt beobachtbaren Größen und den nicht beobachtbaren intervenierenden Variablen (vgl. Kroeber-Riel / Weinberg 2003, S. 30). Daher wird zunächst zwischen der physisch vorhandenen, objektiv gegebenen Ladenumwelt und deren interner Repräsentation, der subjektiv wahrgenommenen Ladenumwelt, unterschieden. Die auf der objektiven Ebene in unterschiedlichen Modalitäten und unabhängig voneinander vorliegenden Einzelreize 3 interagieren gemäß den Grundsätzen der multimodalen Rezeption (vgl. Kap. B.I.) und Informationsverarbeitung und -speicherung (vgl. 3 Anhand von olfaktorischen, visuellen und akustischen Reizen wurden diejenigen Reizkategorien aufgenommen, die für den Handel die größte Bedeutung besitzen. Darüber hinaus können selbstverständlich weitere Reize wie thermale, haptische oder gustatorische Reize integriert werden.

Multimodale Erlebnisvermittlung am Point of Sale

109

Kap. B. II.) miteinander und verschmelzen zu einer ganzheitlich wahrgenommenen Ladenumwelt. Dort sind Konstrukte wie Informationsrate, Anmutungsqualität oder Orientierungsfreundlichkeit einer Ladenumwelt (vgl. dazu z. B. Mehrabian / Russell 1974; Donovan / Rossiter 1982; Gröppel 1991; Bost 1987) anzusiedeln. Die subjektive Repräsentation der objektiven Wirklichkeit wird bereits moderiert von Persönlichkeitsvariablen. Die Leistungsfähigkeit der verschiedenen Wahrnehmungssysteme ist von physiologischen Prädispositionen abhängig. So nehmen beispielsweise die rezeptiven Fähigkeiten insbesondere des visuellen und akustischen Kanals mit fortschreitendem Alter ab, Frauen weisen i. d. R. ein besseres Riechvermögen als Männer auf (vgl. Goldstein 2003, S. 47 und S. 667; Vroon et al. 1999, S. 109 ff.). Seitens der psychischen Prädispositionen unterscheiden sich Menschen zunächst generell in ihrer Bereitschaft, äußere Reize aufzunehmen. Mehrabian und Russell (1974, S. 28 ff.) unterscheiden zwei Persönlichkeitstypen, sogenannte Abschirmer und Nicht-Abschirmer. Während die Nicht-Abschirmer bestrebt sind, mehr zu hören, zu sehen, zu riechen usw. und dadurch sehr intensiv auf eine reizstarke Umwelt reagieren, bemühen sich die Abschirmer, das Reizvolumen der Umwelt zu reduzieren. Gröppel (1991) konnte diese Unterscheidung anhand von indolenten und sensualistischen Konsumenten auch für den Handelskontext nachweisen4. Darüber hinaus ist das im Langzeitspeicher gespeicherte Wissen des Menschen verantwortlich dafür, wie die interne Repräsentation der äußeren Reize ausfällt; die vorhandenen Schemata steuern die Wahrnehmung und sorgen dafür, dass der Mensch externe Reize in Abhängigkeit von seinen Interessen und Erfahrungen selektiert und interpretiert (vgl. Kap. B.II.). Erst durch das Zusammenspiel aller Faktoren kann erklärt werden, warum gleiche Umwelten unterschiedlich wahrgenommen werden. Die wahrgenommene Ladenumwelt führt zu internen Reaktionen aktivierender und kognitiver Art. Die Fokussierung des im Rahmen der emotionalen Umweltpsychologie dominierenden Verhaltensmodells von Mehrabian / Russell, das ausschließlich die primären emotionalen Reaktionen der Aktivierung, des Gefallens und der Dominanz5 berücksichtigt, wird dadurch aufgehoben. Dies ist dringend erforderlich angesichts der Tatsache, dass die Marketingaktivitäten eines Anbieters, sofern sie der Positionierung dienen sollen, spezifische Erlebnisse vermitteln müssen (vgl. Kroeber-Riel / Weinberg 2003, S. 116 f.). Das Messinstrumentarium der 4 Ergänzend sei hier angemerkt, dass es sich hierbei lediglich um „Färbungen“ der Persönlichkeit handelt. Bezogen auf eine konkrete Konsumsituation spielt das situative Involvement eine zentrale Rolle bzgl. der Frage, wie viel Aufmerksamkeit eine Person einem bestimmten Stimulus widmet und wie stark die Verarbeitungstiefe der dargebotenen Reize ausfällt. Selbstverständlich kann daher auch ein Reizabschirmer sehr intensiv auf eine reizstarke Umwelt reagieren. 5 Die Dimension der Dominanz, bei der es sich um ein Attribut vorrangig kognitiver Vorgänge handelt, hat sich in empirischen Untersuchungen wenig bewährt und wurde daher bei späteren Anwendungen des Modells kaum berücksichtigt (vgl. Kroeber-Riel / Weinberg 2003, S. 430).

110

Peter Weinberg und Ralph Salzmann

emotionalen Ansätze der Umweltpsychologie6 ist hierfür schlichtweg zu grob. Es gilt zu bedenken, dass Emotionen nach weit verbreiteter Auffassung folgende Merkmale aufweisen:  die Aktivierung, d. h. die Stärke der mit der Emotion einhergehenden Erregung,  die Richtung der Emotion, d. h. ob sie als angenehm oder unangenehm empfunden wird,  die Qualität der Emotion, d. h. ihr Erlebnisinhalt und  das Bewusstsein über die Emotion (vgl. Woll 1997, S. 42).

Das Bewusstsein der Emotion ist ohnehin Voraussetzung für deren verbale Messung; den Dimensionen Aktivierung und Richtung wird Rechnung getragen, allerdings bleibt die Qualität der Emotion, der Erlebnisinhalt, unberücksichtigt. Der Erlebnisinhalt kommt der Benennung der Emotion gleich und wird stark von kognitiven Vorgängen, von gedanklichen Assoziationen geprägt (vgl. KroeberRiel 1983, S. 31). Folglich erfordert ein Modell zur Analyse der multimodalen Erlebnisvermittlung die explizite Aufnahme kognitiver Variablen. Diese Notwendigkeit begründet sich zusätzlich durch die Eigenschaften der eingehenden multimodalen Reize. Schließlich zeichnen sich gerade Musik und Duft nicht nur durch ihren affektiven Gehalt, sondern auch durch ihre konnotative Bedeutung aus (vgl. zu Musik z. B. Chebat et al. 2001, zu Duft z. B. Schifferstein / Blok 2002, S. 540). Die Persönlichkeitsvariablen wirken wiederum über vorhandene Schemata als Moderator zwischen der subjektiv wahrgenommenen Ladenumwelt und den resultierenden aktivierenden und kognitiven Reaktionen: Gemäß der Theorie der Aktivierungsausbreitung führt die subjektive Wahrnehmung der Ladenumwelt zur Aktivierung emotionaler Knoten, ebenso werden über weitere Knoten Assoziationen gebildet (vgl. Kap. B.II.). Die vorhandenen Schemata einer Person entscheiden somit nicht nur darüber, was sie wahrnimmt, sondern auch darüber, wie sie ihre Wahrnehmung kognitiv und emotional interpretiert. In Abhängigkeit von den internen Reaktionen fallen schließlich die beobachtbaren Verhaltensreaktionen 7 aus. Diese Reaktionen, von Mehrabian / Russell (1974) allgemein als Annäherungs- oder Vermeidungsverhalten bezeichnet, bestehen im Handelskontext z. B. in Form der Verweildauer im Laden, der Anzahl der begutachteten und / oder gekauften Waren, der Ausgabehöhe, der Interaktion mit anderen Kunden oder dem Verkaufspersonal usw.

6 Auch die Emotionsskalen von Plutchik und Izard, denen Machleit und Eroglu (2000) Überlegenheit gegenüber Mehrabian / Russell bescheinigen, halten dieser Kritik nicht stand. 7 Die Verhaltensabsichten fallen, da sie nicht beobachtbar sind, unter die internen Reaktionen.

Multimodale Erlebnisvermittlung am Point of Sale

111

D. Ausgewählte empirische Erkenntnisse zum Einfluss der Ladenumwelt Es existieren zahlreiche empirische Studien, die den Einfluss der Ladenumwelt, der sogenannten atmospherics (vgl. Kotler 1973), auf das Konsumentenverhalten zum Gegenstand haben. Da deren Auflistung den Rahmen dieser Veröffentlichung sprengen würde, wird stattdessen auf die bislang umfassendste Studie zur Duftwirkung im Handel von Stöhr (1998) sowie die Übersichtsartikel von Turley und Milliman (2000) bzw. Lam (2001) verwiesen. Es sei allerdings erwähnt, dass Letztere die Untersuchungsgegenstände der multimodalen ganzheitlichen Wahrnehmung sowie der Kongruenz zwischen atmosphärischen Reizen im Einzelhandel explizit als Forschungslücken bezeichnen (vgl. Turley / Milliman 2000, S. 208; Lam 2001, S. 190). Im Folgenden werden lediglich einige aktuellere Studien dieser spärlich bearbeiteten Forschungsfelder näher erläutert. Ebster und Jandrisits (2003) untersuchten im Rahmen einer Laborstudie die Wirkung kongruenten Duftes auf die Stimmung am Point of Sale. Als optischer Anker diente dazu ein erotisch positioniertes Dessousgeschäft, das in Abhängigkeit des Treatments in den Experimentalgruppen mit einem kongruenten erotischen oder inkongruenten frischen Duft beduftet wurde, bzw. in der Kontrollgruppe unbeduftet blieb. Beide Düfte wurden als annähernd gleich angenehm empfunden. Die Stimmung wurde über drei Subskalen in Form von gehobener Stimmung, gedrückter Stimmung und Missstimmung erhoben. Keiner der beiden Düfte war in der Lage, eine gehobene Stimmung der Probanden zu erzeugen. Weiterhin zeigten sich keine signifikanten Mittelwertunterschiede der negativen Stimmung zwischen den beiden Experimentalgruppen. Allerdings führte der erotische Duft im Gegensatz zum frischen Duft zu einer signifikant geringeren Ausprägung der gedrückten Stimmung und der Missstimmung im Vergleich zur unbedufteten Kontrollgruppe. Die Hypothese, dass der emotionalen Qualität des Point of Sale entsprechende Düfte eine positivere Wirkung auf die Stimmung am Point of Sale haben als nicht kongruente Düfte, konnte daher nicht abschließend als bestätigt angesehen werden. Ein möglicher Erklärungsansatz, den Ebster und Jandrisits anführen, besteht in der Tatsache, dass die Skala der gehobenen Stimmung, die Items wie „beschwingt“, „lebendig“ und „heiter“ enthält, den Erlebnisinhalt einer gehobenen erotischen Stimmung, der durch Begriffe wie „zärtlich“, „intim“ und „sinnlich“ belegt sein könnte, womöglich nicht abdecken kann. Anders formuliert: Eine derartige „Standardskala“ – die Autoren nutzten hier die Adjektivskala von Hampel (1977) – ist für die Erfassung spezifischer Erlebnisse zu grob und weist eine zu geringe Konzeptrelevanz auf. Schifferstein und Blok (2002) fokussieren weniger auf die Fähigkeit von Düften, eine angenehme Ladenatmosphäre zu schaffen, als auf deren aufmerksamkeitslenkende Signalfunktion. Sie analysierten in einer Feldstudie in einem Buchladen, ob produktkongruente Düfte in der Lage sind, den Abverkauf der relevanten Produkte zu steigern. Dazu wählten sie zwei Düfte aus: Grasduft wurde als kongruent zu

112

Peter Weinberg und Ralph Salzmann

Fußball-, Tier-, Natur- und Gartenzeitschriften eingestuft. Sonnenblumenduft passte zu Kosmetik- und Frauenzeitschriften. Es zeigte sich keinerlei Einfluss von kongruenten oder inkongruenten Düften auf die Verkaufszahlen. Erklärt werden die Befunde damit, dass die durch die Düfte ausgelösten Assoziationen womöglich nicht eindeutig genug waren und dass die Mehrzahl der Käufer von Magazinen habitualisiertes Kaufverhalten aufweist und somit durch Umfeldreize kaum zu beeinflussen ist. Fiore et al. (2001) integrieren zusätzlich zur Untersuchung des Einflusses von kongruentem Duft eine visuelle Komponente. In vier verschiedenen Treatments variieren sie im Rahmen einer Laborstudie die Präsentation eines Damen-Pyjamas: Dieser wird auf einem Kleiderbügel dargeboten oder in eine erlebnisorientierte Warenpräsentation eingebettet. Letztere Darbietungsform wird über den Einsatz eines kongruenten und eines inkongruenten Duftes ergänzt. Beide Düfte wurden als angenehm empfunden. Fiore et al. stellen fest, dass eine erlebnisorientierte Warenpräsentation alleine nicht ausreicht, um emotionale Reaktionen sowie Verhaltensabsichten signifikant zu beeinflussen. Dies gelingt erst durch die zusätzliche Darbietung kongruenten Duftes. Weiterhin führte der Einsatz des inkongruenten Duftes zu einer signifikanten Reduktion der Verhaltensabsichten im Vergleich zur Experimentalbedingung unter kongruentem Duft. Ob kongruenter Duft alleine in der Lage ist, eine optisch gegebene Ladenumwelt verhaltensrelevant anzureichern, klärt die Studie nicht abschließend. Während eine Beduftung der Experimentalsituation „Darbietung auf dem Kleiderbügel“ nicht in das Untersuchungsdesign aufgenommen wurde, führte die Beduftung der erlebnisorientierten Warenpräsentation zwar zu einer signifikanten Erhöhung der Kaufabsicht, die Einstellung sowie die Preisbereitschaft wiesen allerdings keine signifikanten Unterschiede auf (vgl. Fiore et al. 2001, S. 48).8 Baker et al. (2002) kritisieren den Mangel an Studien, die sich mit dem simultanen Einfluss mehrerer atmosphärischer Variablen im Handel beschäftigen. Sie orientieren sich in ihrer Untersuchung an der Einteilung Bakers (1987), die die atmosphärischen Variablen in „social“, „ambient“ und „design factors“ unterteilt. Musik und Duft werden nach dieser Einteilung den „ambient factors“ zugeteilt, optische Reize den „design factors“. Der „social factor“ bezieht Anzahl, Aussehen und Verhalten der Angestellten und weiterer Kunden ein. Baker et al. entwerfen ein 2  2  2-faktorielles Design, in dem die Faktoren in jeweils einer hochwertigen und einer minderwertigen Ausprägung vorliegen. Die Optik unterschied sich in der Farbwahl sowie der Art der Warenpräsentation, bzgl. des „ambient factors“ wurde klassische Musik als hochwertiger Stimulus und Top-40-Musik als weniger hochwertiger Stimulus eingesetzt. Der soziale Faktor wurde durch die Anzahl der Ver8 Die Wirkung kongruenter Musik wurde bislang vor allem im Bereich der Werbewirkungsforschung untersucht (vgl. dazu z. B. Hung 2000; Kellaris et al. 1993; MacInnis / Park 1991). Im Bereich der Ladengestaltung wurde dieser Aspekt bislang vernachlässigt (vgl. dazu Chebat et al. 2001, S. 121).

Multimodale Erlebnisvermittlung am Point of Sale

113

käufer, deren Kleidung und die Art der Begrüßung der Kunden variiert. Die verschiedenen Szenarios wurden den Probanden als Videoaufzeichnung vorgeführt. Leider führen Baker et al. keine varianzanalytische Analyse durch, die explizit veranschaulichen könnte, inwiefern die verschiedenen Ausprägungen der atmosphärischen Reize Einfluss auf die abhängigen kaufverhaltensrelevanten Variablen nehmen. Stattdessen werden die Manipulationen lediglich dazu genutzt, eine hinreichende Streuung der Daten der exogenen Variablen des aufgestellten Kausalmodells zu erzielen. Die Autoren stellen über eine Analyse der Pfadkoeffizienten einen stärkeren Einfluss der optischen Elemente im Vergleich zum Einfluss von Musik und sozialen Elementen fest. Die Ergebnisse von Babin et al. (2004), die in einem Shopping-Center signifikante Kongruenzeffekte auf kaufverhaltensrelevante Variablen wie die wahrgenommene Produktqualität, das empfundene Vergnügen, den funktionalen und hedonistischen Einkaufswert sowie Verhaltensabsichten feststellten, sind u. a. aufgrund der zweifelhaften Operationalisierung von Kongruenz sehr kritisch zu bewerten. Babin et al. (2004, S. 288) verstehen in ihrer Untersuchung „appropriateness“ (zu übersetzen mit angemessen / geeignet / passend) als Synonym der Kongruenz und beziehen diesen Term in die Operationalisierung von Kongruenz ein. Sie erfassen jeweils (d. h. völlig isoliert voneinander), wie „appropriate“ die visuellen, akustischen und olfaktorischen Komponenten des Shopping-Centers sind, ohne anzugeben, zu was sie „appropriate“ sind, also ohne einen notwendigen (kognitiven) Anker für die Beurteilung der Angemessenheit / Einung / Passung zu geben (vgl. Babin et al. 2004, S. 297). Folglich läuft die Frage, ob die Musik „appropriate“ ist, evtl. darauf hinaus, ob die Lautstärke oder das Tempo angemessen sind. Ebenso wird evtl. die Angemessenheit der Duftintensität gemessen. Darüber hinaus wird die Frage, ob ein Duft, eine Musik, eine optische Ladengestaltung als „appropriate“ empfunden werden, darauf hinauslaufen, ob die verschiedenen Stimuli gefallen oder nicht. Es besteht somit die große Gefahr, dass die Versuchsergebnisse damit letztlich eine Art self-fulfilling-prophecy darstellen: Fühlt der Proband sich in einer Atmosphäre wohl, so „müssen“ ihm auch die Einzelreize gefallen haben. Fühlt er sich nicht wohl, so „muss“ er auch die Einzelreize als unangenehm empfunden haben. Derartige Zusammenhänge werden dann durch die Pfadkoeffizienten kausalanalytischer Modelle bestätigt, geben allerdings nur unzureichende Antworten auf Kongruenzeffekte. Mattila und Wirtz (2001) untersuchen den Einfluss der Kongruenz von Duft und Musik in einem Geschenkeladen. Sie definieren die Frage der Kongruenz zwischen den beiden Stimuli allerdings völlig losgelöst von gedanklichen Verknüpfungen und betrachten stattdessen Stimuli unterschiedlicher Modalitäten dann als kongruent, sofern sie über ähnliche starke „arousal qualities“ verfügen. Demgemäß entstehen kongruente Stimuluskombinationen aus Lavendelduft mit entspannender Musik sowie aus Grapefruitduft mit erregender Musik. Es zeigt sich, dass die kongruenten Kombinationen zu signifikant stärker ausgeprägtem Annäherungsverhalten, mehr Impulskäufen sowie höherer Einkaufszufriedenheit führten. 8 FS Kaas

114

Peter Weinberg und Ralph Salzmann

Zusammenfassend kann festgehalten werden, dass die multimodale Erlebnisvermittlung am Point of Sale ein nach wie vor unzureichend erschlossenes Forschungsfeld darstellt. Im Folgenden werden erste Ergebnisse einer Forschungsarbeit, die dieses Feld zu bewirtschaften ersucht, beschrieben.

E. Empirische Untersuchung I. Formulierung der Hypothesen Die multimodale kongruente Erlebnisvermittlung am Point of Sale führt im Gegensatz zur unimodalen Ansprache dazu, dass über den zusätzlichen Einsatz von olfaktorischen und akustischen Reizen (Wahrnehmungs-)Knoten eines bestimmten Schemas angesprochen werden. Gemäß der Theorie der Aktivierungsausbreitung werden weitere Knoten des Schemas aktiviert. Diese Knoten bestehen einmal in vorwiegend kognitiven Vorgängen, in gedanklichen Assoziationen, die mit dem angesprochenen Schema verbunden sind und den Erlebnisinhalt bestimmen. Je mehr (schema-)kongruente Knoten aktiviert werden, desto präziser fällt der Erlebnisinhalt aus. Zum anderen werden emotionale Knoten des Schemas aktiviert, die zu intensiver erlebten Emotionen führen. Ist das Schema emotional positiv besetzt, so sind auch die aktivierten Emotionen von positiver Valenz. Weiterhin werden positive Affekte durch die vereinfachte Kategorisierung der eingegangen Reize und die vereinfachte Informationsverarbeitung ausgelöst. Die dadurch hervorgerufenen positiven emotionalen Reaktionen auf die Umwelt führen zu positiveren Verhaltensabsichten gegenüber dieser Umwelt (vgl. Kap. B. und Kap. C.). Daraus ergibt sich die folgende Hypothese H1. H1: Die multimodale kongruente Erlebnisvermittlung über Optik, Akustik und Olfaktorik führt zu einem höheren Gefallen, einem höheren Erfüllungsgrad des intendierten Erlebnisinhalts und positiveren Verhaltensabsichten als die unimodale Konsumentenansprache über die Optik. Der Einsatz inkongruenten Duftes und inkongruenter Musik führt im Gegensatz zur unimodalen und zur multimodalen kongruenten Erlebnisvermittlung dazu, dass dem Schema nicht zugehörige Knoten angesprochen werden. Über die Aktivierungsausbreitung werden weitere „schemafremde“ Verknüpfungen hergestellt. Dadurch steigt die Wahrscheinlichkeit, dass weder die (positiv besetzten) emotionalen Knoten noch die gedanklichen Assoziationen des Schemas aktiviert werden. Letztlich wird die Kategorisierung der Reize durch deren Inkonsistenz erschwert, was in negativen Affekten resultiert (vgl. Kap. B.). Hieraus werden die Hypothesen H2 und H3 abgeleitet. H2: Die multimodale kongruente Erlebnisvermittlung über Optik, Akustik und Olfaktorik führt zu einem höheren Gefallen, einem höheren Erfüllungsgrad des intendierten Erlebnisinhalts und positiveren Verhaltensabsichten als die multimodale inkongruente Konsumentenansprache.

Multimodale Erlebnisvermittlung am Point of Sale

115

H3: Die multimodale inkongruente Konsumentenansprache über Optik, Akustik und Olfaktorik führt zu einem niedrigeren Gefallen, einem niedrigeren Erfüllungsgrad des intendierten Erlebnisinhalts und negativeren Verhaltensabsichten als die unimodale Konsumentenansprache über die Optik.

II. Konzeptionelle Überlegungen und Voruntersuchungen Als multimodal zu inszenierendes Erlebnis wurde zunächst ein karibisches Urlaubserlebnis ausgewählt. Ein derartiges Erlebnis ist zum einen emotional positiv besetzt und zum anderen über Duft und Musik gut umsetzbar. Als Ort der Erlebnisvermittlung wurde nahe liegender Weise ein Reisebüro gewählt. Die Eignung, ein Karibik-Erlebnis in einem Reisebüro zu vermitteln, wurde dennoch zusätzlich überprüft. In einer Zuordnungsaufgabe zwischen sieben Erlebnissen und sieben Branchen ordneten 36 von 41 Probanden ein Karibik-Erlebnis einem Reisebüro zu. Anschließend wurde das Problem der Messung des Erlebnisinhaltes angegangen. Dazu wurden Spontanassoziationen zu einem Karibik-Erlebnis ermittelt. Eine Inhaltsanalyse führte zur Aufstellung eines Itempools für eine Skala zur Ermittlung des Erlebnisinhaltes, der aus Statements wie „erinnert mich an Strandurlaub“, „ruft mir Sonne und Wärme ins Gedächtnis“, „versetzt mich in Gedanken auf eine exotische Insel“ zusammengesetzt ist. Sodann wurden die Stimuli ausgewählt. Als optische Stimuli wurden vier Fotos eines Reisebüros ausgesucht. Zwei dieser Fotos zeigen karibische Elemente in Form einer Sitzgruppe aus Bastmöbeln, eines Wandgemäldes und einiger Pflanzen. Die übrigen beiden Fotos zeigen typische Büromöbel und Katalogwände, wie sie in jedem Reisebüro zu finden sind. Durch dieses Vorgehen sollte ein optischer Anker gegeben werden, der mit Karibik assoziiert werden kann. Die musikalischen und olfaktorischen Reize wurden in mehreren Pretests ausgewählt und zur Überprüfung der internen Konsistenz der aufgestellten Skala zur Messung des Erlebnisinhaltes genutzt. Die ausgewählten Düfte sowie die ausgewählte Musik unterschieden sich nicht bezüglich der Dimension Gefallen, wohl aber hinsichtlich ihrer Eignung, ein Karibik-Erlebnis zu vermitteln. So wurde als karibischer Duft eine Duftmischung aus Kokosnuss, Vanille und exotischen Früchten ausgewählt. Ein Minze-Duft stellte sich als inkongruenter, aber als gleich angenehm empfundener Duft heraus. Bezüglich der Musik wurden rein instrumentale Musiktitel getestet. Die ausgewählten karibischen Titel entstammen typisch karibischen Stilrichtungen wie Merengue oder Reggae, die inkongruenten Titel stellen unaufdringliche und leichtgängige JazzKompositionen dar.

8*

116

Peter Weinberg und Ralph Salzmann

III. Hauptstudie Die Hauptstudie wurde im Februar des Jahres 2005 am Institut für Konsum- und Verhaltensforschung der Universität des Saarlandes durchgeführt.9 Es wurden insgesamt 105 Probanden befragt, bei denen es sich überwiegend um Studenten handelte. Die Probanden wurden angewiesen, sich vorzustellen, dass sie sich gerade in dem per Beamer-Präsentation visualisierten Reisebüro befinden, um anschließend den ausgehändigten Fragebogen auszufüllen. Die vier oben beschriebenen Bilder wurden in einer Endlosschleife an die Wand des Labors projiziert. Die Befragung dauerte zehn bis fünfzehn Minuten. Zur Sicherstellung der internen Validität der Untersuchung wurden die Probanden zum einen in Kleingruppen von je vier bis maximal acht Personen in den Laborraum geführt, um Crowding-Effekte zu vermeiden. Zum anderen wurden die Kleingruppen hinsichtlich des Alters und des Geschlechts parallelisiert, um den Einfluss von Persönlichkeitsvariablen (vgl. Kap. C.) möglichst gering zu halten. Darüber hinaus wurde größte Sorgfalt bei der Präsentation der olfaktorischen und musikalischen Stimuli aufgewendet. Während die Sicherstellung einer konstanten Lautstärke der Musik in allen Kleingruppen unproblematisch war, wurde der Intensität des Duftes besondere Aufmerksamkeit geschenkt. So wurde der Raum nach jeder Beduftung für zehn Minuten durchlüftet; zehn Minuten vor Beginn der nächsten Erhebung wurde der Duft für drei Minuten im Raum verströmt, indem der Ventilator des Beduftungsgerätes auf die höchste Stufe gestellt wurde. Die untersuchten Konstrukte wurden jeweils über mehrere Items auf siebenstufigen Rating-Skalen abgeprüft. Dabei wiesen die Skalen von Gefallen, Erlebnisinhalt und Verhaltensabsicht Cronbachs Alpha-Werte größer 0,8 auf, so dass von einer hohen internen Konsistenz der Skalen ausgegangen werden kann. Die jeweiligen Ausprägungen der Konstrukte wurden über die Faktorwerte einer exploratorischen Faktorenanalyse bestimmt. Zur Überprüfung der Hypothesen bietet sich ein varianzanalytisches Vorgehen mit Posthoc-Paarvergleichen an. Allerdings lieferte ein Levene-Test auf Varianzhomogenität für sämtliche abhängigen Variablen Signifikanzniveaus kleiner als 0,05, weshalb die Anwendungsvoraussetzung der Varianzanalyse verletzt ist10 (vgl. Backhaus et al. 2003, S. 150). Infolge der großen Diskrepanzen, die in zwei von drei Fällen zu höchst signifikanten Werten des Levene-Tests führten, wurden verteilungsfreie Verfahren angewandt. Diese erreichen im Allgemeinen eine Effizienz von 95 % der entsprechenden parametrischen Tests (vgl. Bühl / Zöfel 2005, S. 294). Die Konzeption und Durchführung der Studie oblag Ralph Salzmann. Die mangelnde Varianzhomogenität ist im Wesentlichen darauf zurückzuführen, dass die Antworten im Treatment der multimodalen kongruenten Erlebnisvermittlung weniger stark streuten als in den übrigen beiden Treatments. Dies könnte ein Hinweis darauf sein, dass bei den meisten Befragten emotional und kognitiv ähnlich besetzte Karibikschemata aktiviert wurden. 9

10

Multimodale Erlebnisvermittlung am Point of Sale

117

Das parameterfreie Pendant der Varianzanalyse, der Kruskal-Wallis-Test, belegt jeweils signifikante Zusammenhänge zwischen dem Treatment und den Ausprägungen der abhängigen Variablen (vgl. Tabelle 1). Tabelle 1 Ergebnisse des Kruskal-Wallis-Tests

mittlerer Rang Treatment

Gefallen

Erlebnisinhalt

Verhaltensabsicht

1

40,00

41,46

37,18

2

50,18

52,00

52,34

3

67,54

63,40

68,15

Signifikanz

p = 0,001

p = 0,01

p < 0,001

Treatment 1 entspricht der multimodalen kongruenten Erlebnisvermittlung. Treatment 2 stellt die unimodale Konsumentenansprache über die Optik dar. Treatment 3 bezeichnet die multimodale Ansprache durch inkongruente Reize. Niedrige Werte des mittleren Ranges deuten auf eine positive Einschätzung der jeweiligen Variablen hin. Es zeigt sich hypothesenkonform, dass die multimodale kongruente Erlebnisvermittlung der unimodalen sowie der multimodalen inkongruenten Konsumentenansprache überlegen ist. Ebenso führt die unimodale Ansprache zu besseren Ergebnissen als der Einsatz multimodaler inkongruenter Reize. Zur Überprüfung der Hypothesen H1 bis H3 und zwecks einer detaillierteren Analyse der signifikanten Unterschiede zwischen den Treatments wurden Paarvergleiche anhand von U-Tests nach Mann und Whitney durchgeführt (vgl. Tabelle 2). Bezüglich H1 zeigt sich, dass sich durch den Einfluss kongruenter akustischer und olfaktorischer Stimuli eine signifikante Erhöhung der Verhaltensabsichten im Vergleich zur unimodalen Konsumentenansprache feststellen ließ. Die Probanden konnten sich demnach eher vorstellen, das Reisebüro zwecks Beratung aufzusuchen, eine Buchung dort vorzunehmen oder länger als geplant zu verweilen. Allerdings waren die Unterschiede der mittleren Rangwerte des Erlebnisinhaltes und des Gefallens nicht signifikant, weshalb H1 nur teilweise als bestätigt angesehen werden kann. Die Hypothese H2, dass die kongruente multimodale Erlebnisvermittlung zu positiveren Ausprägungen der untersuchten abhängigen Variablen führt als die inkongruente multimodale Konsumentenansprache, wird vollständig angenommen. Sämtliche Zusammenhänge sind hoch oder höchst signifikant.

118

Peter Weinberg und Ralph Salzmann Tabelle 2 Ergebnisse der U-Tests nach Mann und Whitney H

T

Gefallen mittlerer Rang

1

Erlebnisinhalt P

31,43

H1

mittlerer Rang

30,88 0,197

2

37,57

1

26,07

H2 45,12

2

30,10

H3 41,42

0,025 39,85

28,07

25,53 0,003

42,51

0,000 45,62

31,38

29,99 0,100

39,39

P

29,15

38,12

0,020 3

mittlerer Rang

0,131

0,000 3

P

Verhaltensabsicht

0,019 41,53

Die Hypothese H3 kann unter der Einschränkung, dass die Gruppe, die nur optisch angesprochen wurde, einen lediglich marginal signifikanten Unterschied bzgl. des Erlebnisinhalts aufwies im Vergleich zur multimodal inkongruent angesprochenen Gruppe, ebenfalls als bestätigt angesehen werden.

IV. Folgerungen für die multimodale Konsumentenansprache Da die Überprüfung der Hypothesen H2 und H3 hypothesenkonform verlief, kann hieraus gefolgert werden, dass beim Einsatz von Hintergrundmusik und Raumduft mit Vorsicht zu verfahren ist. So sollte darauf geachtet werden, dass diese nicht nur gefallen, sondern zusammen mit der Optik eine einheitliche Botschaft vermitteln. Insbesondere der Einsatz inkongruenter Reizkonstellationen wirkt sich negativ aus. Diese führen nämlich nicht nur dazu, dass ein über die Optik intendiertes Erlebnis nicht vermittelt wird und damit keine Positionierung des Anbieters über die Einkaufsstätte stattfinden kann, sondern auch zu negativen Affekten und Verhaltensabsichten. Die Tatsache, dass Hypothese H1 nur teilweise bestätigt wurde, könnte ein Indiz für die Dominanz der Optik sein. Allerdings besteht die Möglichkeit, dass dieser Effekt auf die Laborsituation zurückzuführen ist: So befinden sich die Probanden während der Laborbefragung in einer „high-involvement“-Situation. Es ist daher wahrscheinlich, dass die Probanden auf den visuellen Kanal fokussierten und periphere Umgebungsreize wie Duft und Musik nur wenig Wirkung entfalten konnten. In einer realen Kaufsituation unter „low-involvement“-Bedingungen kann kongru-

Multimodale Erlebnisvermittlung am Point of Sale

119

enten akustischen und olfaktorischen Reizen vermutlich eine höhere Bedeutung zugeschrieben werden. Um diese Fragestellung zu klären und die externe Validität der Untersuchungsergebnisse zu prüfen, steht in einem nächsten Schritt des Forschungsvorhabens eine Felderhebung in einem realen Reisebüro an. Darüber hinaus erfolgt eine Ausweitung des Untersuchungsdesigns, indem weitere Erlebnisse in verschiedenen Branchen multimodal inszeniert werden. Bis dahin kann unter Vorbehalt konstatiert werden: Erlebnisvermittlung im Einzelhandel ist dann am erfolgreichsten, wenn sie reale Erlebnisse naturgetreu nachstellt, kongruent und über alle Sinne.

Literatur Anderson, John, R. (2001): Kognitive Psychologie, 3. Aufl. Babin, Barrin J. / Chebat, Jean-Charles / Michon, Richard (2004): Perceived appropriateness and its effect on quality, affect and behavior, in: Journal of Retailing and Consumer Services, Vol. 11, S. 287 – 298 Backhaus, Klaus / Erichson, Bernd / Plinke, Wulff / Weiber, Rolf (2003): Multivariate Analysemethoden. Eine anwendungsorientierte Einführung, 10. Aufl. Baker, Julie (1987): The Role of the Environment in Marketing Services: The Consumer Perspective, in: Czepeil, John A. / Congram, Carole A. / Shanahan, James (Hrsg.), The Services Challenge: Integrating for Competitive Advantage, S. 79 – 84 Baker, Julie / Parasuraman, A. / Grewal, Dhruv / Voss, Glenn B. (2002): The Influence of Multiple Store Environment Cues on Perceived Merchandise Value and Patronage Intentions, in: Journal of Marketing, Vol. 66, S. 120 – 141 Bitner, Mary J. (1992): Servicescapes: The Impact of Physical Surroundings on Customers and Employees, in: Journal of Marketing, Vol. 56, S. 57 – 71 Bost, Erhard (1987): Ladenatmosphäre und Konsumentenverhalten Bühl, Achim / Zöfel, Peter (2005): SPSS 12. Einführung in die moderne Datenanalyse unter Windows, 9. Aufl. Calvert, Gemma A. / Spence, Charles / Stein, Barry, E. (2004): in: Calvert, Gemma A. / Spence, Charles / Stein, Barry E. (Hrsg.), Handbook of Multisensory Processes, S. XI – XVII Calvert, Gemma A. / Thesen, Thomas (2004): Multisensory integration: methodological approaches and emerging principles in the human brain, in: Journal of Physiology, Paris 98, S. 191 – 205 Chebat, Jean-Charles / Gélinas Chebat, Claire / Vaillant, Dominique (2001): Environmental background music and in-store selling, in: Journal of Business Research, Vol. 54, S. 115 – 123 Cohen, Joel B. / Basu, Kunal (1987): Alternative models of categorization: toward a contingent processing framework, in: Journal of Consumer Research, Vol. 13, S. 455 – 472

120

Peter Weinberg und Ralph Salzmann

Donovan, Robert J. / Rossiter, John R. (1982): Store Atmosphere: An Environmental Approach, in: Journal of Retailing, Vol. 58, S. 34 – 57 Ebster, Claus / Jandrisits, Marlies (2003): Die Wirkung kongruenten Duftes auf die Stimmung des Konsumenten am Point of Sale, in: Marketing – Zeitschrift für Forschung und Praxis, Vol. 25, S. 99 – 107 Engelkamp, Johannes (1984): Sprachverstehen als Informationsverarbeitung, in: Engelkamp, Johannes (Hrsg.), Psychologische Aspekte des Verstehens, S. 31 – 53 – (1990): Memory of Action Events and Some Implications for Imagery, in: Cornoldi, Cesare / McDaniel, Mark A. (Hrsg.), Imagery and Cognition, S. 278 – 299 – (1991): Das menschliche Gedächtnis, 2. Aufl. Fiore, Ann M. / Yah, Xinlu / Yoh, Eunah (2000): Effects of a Product Display and Environmental Fragrancing on Approach Responses and Pleasurable Experiences, in: Psychology & Marketing, Vol. 17, S. 27 – 54 Goldstein, Bruce E. (2002): Wahrnehmungspsychologie, 2. Aufl. Gottfried, Jay A. / Dolan, Raymond J. (2003): The Nose Smells What the Eye Sees: Crossmodal Visual Facilitation of Human Olfactory Perception, in: Neuron, Vol. 39, S. 375 – 388 Grimm, Hannelore / Engelkamp, Johannes (1981): Sprachpsychologie. Handbuch und Lexikon der Psycholinguistik Gröppel, Andrea (1991): Erlebnisstrategien im Einzelhandel. Analyse der Zielgruppen, der Ladengestaltung und der Warenpräsentation zur Vermittlung von Einkaufserlebnissen Gulas, Charles S. / Bloch, Peter H. (1995): Right Under Our Noses: Ambient Scent and Consumer Responses, in: Journal of Business and Psychology, Vol. 10, No. 1, S. 87 – 98 Guski, Rainer (2000): Wahrnehmung. Eine Einführung in die Psychologie der menschlichen Informationsaufnahme, 2. Aufl. Hampel, Rainer (1977): Adjektiv-Skalen zur Einschätzung der Stimmung (SES), in: Diagnostica, 23. Jg., Nr. 1, S. 43 – 60 Hung, Kineta (2000). Narrative Music in Congruent and Incongruent TV Advertising, in: Journal of Advertising, Vol. 29, No. 1, S. 25 – 34 Kellaris, James J. / Cox, Anthony D. / Cox, Dena (1993): The Effect of Background Music on Ad Processing: A Contingency Explanation, in: Journal of Marketing, Vol. 57, No. 4, S. 114 – 125 Kotler, Philip (1973): Atmospherics as a Marketing Tool, in: Journal of Retailing, Vol. 49, No. 4, S. 48 – 64 Kroeber-Riel, Werner (1983): Analyse des nicht-kognitiven Konsumentenverhaltens, in: Forschungsgruppe Konsum und Verhalten (Hrsg.), Innovative Marktforschung, S. 13 – 44 Kroeber-Riel, Werner / Weinberg, Peter (2003), Konsumentenverhalten, 8. Aufl. Lam, Shun Y. (2001): The Effects of Store Environment on Shopping Behaviors: A Critical Review, in: Advances in Consumer Research, Vol. 28, S. 190 – 197 Machleit, Karen A. / Eroglu, Sevgin A. (2000): Describing and Measuring Emotional Response to Shopping Experience, in: Journal of Business Research, Vol. 49, S. 101 – 111

Multimodale Erlebnisvermittlung am Point of Sale

121

MacInnis, Deborah J. / Park, Whan C. (1991): The Differential Role of Characteristics of Music on High and Low-Involvement Consumers‘ Processing of Ads, in: Journal of Consumer Research, Vol. 18, No. 3, S. 161 – 173 Mani, Gayathri (1999): Smells and Multimodal Learning: The Role of Congruency in the Processing of Olfactory, Visual and Verbal Elements of Product Offerings Mattila, Anna S. / Wirtz, Jochen (2001): Congruency of scent and music as a driver of instore evaluations and behavior, in: Journal of Retailing, Vol. 77, S. 273 – 289 Mehrabian, Albert / Russell, James A. (1974): An Approach to Environmental Psychology Meredith, Alex M. (2002): On the neural basis for multisensory convergence: a brief overview, in: Cognitive Brain Research, Vol. 14, S. 31 – 40 Österbauer, Robert A. / Matthews, Paul M. / Jenkinsons, Mark / Beckmann, Christian F. / Hansen, Peter C. / Calvert, Gemma A. (2005): The color of scents: chromatic stimuli modulate odor responses in the human brain, in press Schifferstein, Hendrik N. / Blok, Sylvia T. (2002): The Signal Function of Thematically (In-) congruent Ambient Scents in a Retail Environment, in: Chemical Senses, Vol. 27, S. 539 – 549 Stöhr, Anja (1998): Air-Design als Erfolgsfaktor im Handel. Modellgestützte Erfolgsbeurteilung und strategische Empfehlungen Thesen, Thomas / Vibell, Jonas F. / Calvert, Gemma A. / Österbauer, Robert A. (2004): Neuroimaging of multisensory processing in vision, audition, touch and olfaction, in: Cognitive Processing, Vol. 5, S. 84 – 93 Turley, L.W. / Milliman, Ronald. E. (2000): Atmospheric Effects on Shopping Behavior: A Review of the Experimental Evidence, in: Journal of Business Research, Vol. 49, S. 193 – 211 Vroon, Piet / Van Amerongen, Anton / de Vries, Hans (1996): Psychologie der Düfte. Wie Gerüche uns beeinflussen und verführen Weinberg, Peter (1992): Erlebnismarketing Woll, Erika (1997): Erlebniswelten und Stimmungen in der Anzeigenwerbung Zimmer, Hubert D. (1986): Affektive Bedeutungskomponenten im Modell der multimodalen Repräsentationen, Arbeiten der Fachrichtung Psychologie Nr. 99, Universität des Saarlandes

Feld- und Expertenstudien

Einsatz einer erweiterten Form der Conjoint-Analyse zur empirischen Schätzung von Zahlungsbereitschaftsfunktionen für die mengenund zeitbezogene Preisdifferenzierung Sönke Albers und Bernd Skiera

A. Problemstellung Viele Dienstleistungen werden nicht einmalig, sondern kontinuierlich genutzt (Skiera / Albers 2001, Lambrecht 2005). Anbieter von Infrastruktur, wie Energieund Telekommunikationsunternehmen sowie Unternehmen des Öffentlichen Verkehrs, bieten deshalb Tarife an, die nach Nutzung, d. h. genutzter Menge, differenziert sind (Mitchell / Vogelsang 1991, Skiera 1999, Büschken 1997, Clement 2000). Ähnliche Phänomene finden wir heute im Medienbereich, wo Buchklubs und Internet-Unternehmen wie Betreiber von Communities ihre Dienste anbieten (Albers 2001, Schulze 2005). Bereits Gossen (1854) hat mit dem nach ihm benannten ersten Gossen’schen Gesetz darauf hingewiesen, dass der Nutzen mit zunehmender Menge zwar zunimmt, aber mit abnehmender Grenzrate. Unternehmen, die sich in solchen Geschäftsfeldern bewegen, haben deshalb die Möglichkeit, ihre Preise nach der in verschiedenen Zeitperioden genutzten Menge zu differenzieren. Um eine optimale Gestaltung dieser Preise zu ermöglichen, ist es notwendig, Zahlungsbereitschaftsfunktionen in Abhängigkeit von der in verschiedenen Zeitperioden nachgefragten Menge zu schätzen (Tacke 1989, Wilson 1993, Skiera 1999). Die Schwierigkeit bei der Bestimmung optimaler mengenbezogener Preise besteht darin, dass die Vorteilhaftigkeit eines Tarifs von der nachgefragten Menge, diese jedoch wieder vom gewählten Tarif abhängt (Train / Ben-Akiva / Atherton 1989, Train / McFadden / Ben-Akiva 1987, Tacke 1989, Skiera 1999). So wird ein Konsument bei einem Pauschaltarif, also einem Tarif, bei dem die Nutzung pauschal durch die Zahlung eines nutzungsunabhängigen Grundpreises abgedeckt wird, eine höhere Menge in Anspruch nehmen als bei einem Pay-per-Use-Tarif, also bei einem Tarif, bei dem ausschließlich die Nutzung selbst bepreist wird. Diese unterschiedlich hohe Nutzung hat Auswirkungen auf die Kosten für den Anbieter eines solchen Tarifs. Deswegen reicht es nicht aus, wenn Marktforschungsverfahren wie beispielsweise die Conjoint-Analyse nur die Vorteilhaftigkeit von Tarifen in Form von Nutzenwerten ermitteln. Vielmehr ist es notwendig, neben der

126

Sönke Albers und Bernd Skiera

Vorteilhaftigkeit von Tarifen auch die mit den Tarifen verbundene nachgefragte Menge zu ermitteln. Dies ist mit Hilfe von Zahlungsbereitschaftsfunktionen möglich, die die Zahlungsbereitschaft abbilden, die die Nutzer für eine genutzte Menge zu zahlen bereit sind (Tacke 1989, Skiera 1999). Die Differenz aus Zahlungsbereitschaftsfunktion und dem zu zahlenden Rechnungsbetrag bildet die Konsumentenrente, die den mit der Nutzung verbundenen Nutzen abbildet (Oi 1971, Mitchell / Vogelsang 1991). Da diese Konsumentenrente mit der genutzten und vom Tarif abhängigen Menge variiert, kann über diese Konsumentenrente auch die Nutzen bzw. Konsumentenrente maximierende Menge bestimmt werden. Bei Unterstellung eines First-Choice-Verhaltens, also der Unterstellung, dass der Konsument stets den Tarif mit der höchsten Konsumentenrente wählt (Albers /Brockhoff 1985), wählen Konsumenten entweder stets genau einen oder keinen Tarif aus. Alternativ dazu kann auch ein so genanntes Probabilistic-Choice-Verhalten unterstellt werden. Dieses Verhalten führt dazu, dass Tarife nur noch mit einer bestimmten Wahrscheinlichkeit, die wiederum an die Höhe der Konsumentenrente geknüpft ist, gewählt werden. Damit kann beispielsweise auch Unsicherheit der Konsumenten hinsichtlich ihrer zukünftigen Nutzung erfasst werden (Lambrecht / Seim / Skiera 2005). Die simultane Modellierung von Tarif- und Mengenentscheidung bei Probabilistic-Choice-Verhalten kann über so genannte „Discrete Continuous Choice“-Modelle erfolgen (Hanemann 1984, Dubin /McFadden 1984, Hewitt / Hanemann 1995, Narayanan / Chintagunta / Miravete 2004, Iyengar 2004, Lambrecht / Seim / Skiera 2005). Sofern der Nutzen in diesen Modellen der hier unterstellten Konsumentenrente entspricht, unterscheiden sich diese Modelle lediglich von den nachfolgend unterstellten Modellen durch das Anwenden einer Probabilistic-Choice-Regel statt einer First-Choice-Regel. Skiera (1999) klassifiziert verschiedene Möglichkeiten zur Schätzung von Zahlungsbereitschaftsfunktionen. Eine besteht darin, Konsumenten direkt nach der Menge zu fragen, die sie bei einem bestimmten Nutzungspreis nachfragen würden. Schulze / Gedenk / Skiera (2005) zeigen für eine Anwendung im Bereich von Online-Zeitungen, wie damit auch segmentbezogene Zahlungsbereitschaftsfunktionen geschätzt werden können. Tacke (1989) und Skiera (1999) und darauf aufbauend auch Schulze (2005) haben eingehend untersucht, wie die klassische Form der Conjoint-Analyse zur Schätzung von Zahlungsbereitschaftsfunktionen erweitert werden muss. Keine von diesen Arbeiten hat sich aber bislang damit detaillierter auseinandergesetzt, wie die Conjoint-Analyse erweitert werden muss, damit Zahlungsbereitschaftsfunktionen ermittelt werden können, die auch für eine gemeinsame mengen- und zeitbezogene Preisdifferenzierung eingesetzt werden können. Deswegen ist es das Ziel dieses Beitrags, ein solches Vorgehen vorzustellen und dessen Güte in einer empirischen Studie zu validieren. Dazu wird in einem zweiten Abschnitt dargestellt, wie Zahlungsbereitschaftsfunktionen zur Abbildung des Tarifwahlverhaltens eingesetzt werden können. Aufbauend auf den vorgeschlagenen Funktionstypen wird im dritten Abschnitt eine Methode dargestellt, mit der man die Parameterwerte einer Zahlungsbereitschaftsfunktion schätzen kann. Im vierten Abschnitt wird das Design einer empirischen Anwendung vorgestellt. Im

Einsatz einer erweiterten Form der Conjoint-Analyse

127

fünften Abschnitt wird die Methode anhand eines Zahlenbeispiels illustriert. Im sechsten Abschnitt werden die Ergebnisse der empirischen Anwendung beschrieben. Im siebten Abschnitt folgt in einer Schlussfolgerung eine Bewertung der Ergebnisse und der wesentlichen Erkenntnisse.

B. Zahlungsbereitschaftsfunktionen und Konsumentenrente Gemäß dem Ersten Gossen’schen Gesetz wird plausibler Weise unterstellt, dass der Nutzen des Konsums eines Produktes mit zunehmender Menge zwar zunimmt, aber mit abnehmender Grenzrate (Gossen 1854). Je nach Produkt kann der Fall auftreten, dass der Nutzen bereits bei einer Menge von Null positiv ist. Einen solchen minimalen Nutzen U kann man z. B. bei Telefontarifen beobachten, die bereits einen Nutzen dadurch ermöglichen, dass man angerufen wird, selbst wenn man selbst kein einziges Gespräch geführt hat (Taylor 1994). Bei Telefondiensten gibt es eine Anzahl von Nutzern, die einen Vertrag mit einem Service-Provider hat, um ausschließlich im Notfall telefonieren zu können, ohne dass sie sonst Telefonate führen wollen (Kridel / Lehman / Weisman 1993). Ebenso darf man davon ausgehen, dass Nutzer für bestimmte Dienste ein maximales Budget zur Verfügung haben, so dass die Zahlungsbereitschaft ZB mit zunehmender Menge sich asymptotisch einer Sättigungsgrenze M nähert. Eine typische Funktion, die dieses abbildet, ist eine modifizierte Exponentialfunktion: …1†

 ZB ˆ M  1

e …a‡bx†



mit x als Menge sowie a, b und M (maximale Zahlungsbereitschaft) als zu schätzende Parameterwerte. Die Eigenschaften dieses Funktionsverlaufs im Vergleich zu anderen Funktionsverläufen werden ausführlich von Skiera (1999) untersucht. Die Zahlungsbereitschaftsfunktion gibt gemäß Abbildung 1 an, wie viel Geld ein Konsument auszugeben bereit ist, wenn er dafür eine bestimmte Menge eines Produktes in Anspruch nehmen kann (Wilson 1993, Srinagesh 1985). Differenziert man die Zahlungsbereitschaftsfunktion ZB nach der in Anspruch genommenen Menge x, so erhält man die Preisbereitschaftsfunktion PB, die den Preis angibt, den der Konsument für eine zusätzliche Einheit bereit zu bezahlen ist (Tacke 1989, Goldman / Leland / Sibley 1984). Wie man Abbildung 1 entnehmen kann, stellt die Preisbereitschaftsfunktion PB eine fallende Funktion dar, die sich für den Funktionstyp in (1) folgendermaßen ergibt: …2†

dZB ˆ PB ˆ M  e …a‡bx†  b dx

mit ZB als Zahlungsbereitschaft und PB als Preisbereitschaft.

128

Sönke Albers und Bernd Skiera

Abbildung 1: Zahlungs- und Preisbildungsfunktionen

Nutzen maximierende Konsumenten streben eine Maximierung ihrer Konsumentenrente, definiert als Differenz zwischen der Zahlungsbereitschaft und dem zu bezahlenden Rechnungsbetrag, an (Oren / Smith / Wilson 1983, Tacke 1989, Skiera 1999). Beide Größen variieren mit der Menge, so dass diese also nicht exogen vorgegeben, sondern Resultat von Optimierungsbestrebungen des Konsumenten ist. Verlangt der Anbieter als Preis einen linearen zweiteiligen Tarif mit einem fixen Grundpreis G und einem nutzungsabhängigen Preis p pro Mengeneinheit, dies entspricht den meisten Tarifen im Telekommunikationssektor, so maximiert der Konsument seine Konsumentenrente CR gemäß: …3†

 CR ˆ M  1

e …a‡bx†

 G

p  x ! max !

Die nutzenmaximale Menge kann man bestimmen, indem man die Funktion der Konsumentenrente CR nach der Menge x differenziert und diese erste Ableitung gleich Null setzt: …4†

dCR ˆ M  e …a‡bxmax †  b dx

Umformen führt zunächst zu: …5†

dann zu:

e …a‡bxmax † ˆ

p Mb

!

pˆ0

Einsatz einer erweiterten Form der Conjoint-Analyse  …6†

a ‡ b  xmax ˆ ln

129

 Mb p

und schließlich zur Konsumentenrente maximierenden Menge:

…7†

xmax ˆ

ln

  Mb p

a

b

Die Kenntnis dieser Optimalitätsbedingung kann man nun ausnutzen, die Parameterwerte der Zahlungsbereitschaftsfunktion a, b und M empirisch zu schätzen.

C. Schätzung der Zahlungsbereitschaftsfunktion Zur Schätzung der Parameterwerte der Zahlungsbereitschaftsfunktion kann man in unterschiedlicher Weise vorgehen. Üblicherweise kann man Verfahren unterscheiden, die auf der Basis von Präferenzen oder tatsächlichem Verhalten operieren. Tatsächliches Verhalten ist häufig sehr schwer heranzuziehen, da man immer nur einen Punkt pro Konsument kennt, nämlich die gewählte Menge in Abhängigkeit des Tarifs. Man bräuchte also mindestens zwei Tarifwechsel, um aus drei Beobachtungen auf die drei Parameterwerte schließen zu können, wobei man dabei keinen konstanten Nutzenwert für die Nullmenge, also keine nutzungsunabhängige Zahlungsbereitschaft, ermitteln könnte. Man ist also typischerweise darauf angewiesen, hypothetische Präferenzen zu erheben, um daraus Zahlungsbereitschaftsfunktionen ableiten zu können. Ein bewährtes Verfahren zur Erhebung von Präferenzen ist die Conjoint-Analyse (Green / Krieger / Wind 2001, Hensel-Börner 2000). Bei dieser Conjoint-Analyse kann man mit Rangreihen (traditionelle Conjoint-Analyse: Green / Rao 1971) oder mit Auswahlentscheidungen (Choice Based Conjoint Analysis: Louviere / Woodworth 1983) arbeiten. Bei letzterem Verfahren werden allerdings so wenige Daten erfragt, dass man damit nicht auf individueller Ebene Parameterwerte schätzen kann. Dies ist nur über den Umweg von SegmentSchätzungen oder den Einsatz von Hierarchischen Bayes-Modellen approximativ möglich (Gensler 2003). Im Folgenden wollen wir deshalb das Verfahren der traditionellen Conjoint-Analyse einsetzen, um damit individuelle Zahlungsbereitschaftsfunktionen zu schätzen. Dazu lässt man die Befragten verschiedene Tarife mit unterschiedlichen Grundpreisen und Nutzungspreisen in eine Präferenzrangfolge bringen und bestimmt dann mit Hilfe der nichtlinearen Regressionsanalyse die Parameterwerte der Zahlungsbereitschaftsfunktion. Da auf individueller Basis nur wenige Freiheitsgrade verbleiben, empfiehlt es sich, die minimale Zahlungsbereitschaft U und die maximale Zahlungsbereitschaft M direkt zu erfragen. Aus der Tatsache, dass die Funk9 FS Kaas

130

Sönke Albers und Bernd Skiera

tion (1) ihre minimale Zahlungsbereitschaft an der Stelle der Nullmenge …x ˆ 0† besitzt, kann man den ersten Parameterwert wie folgt errechnen:  UˆM 1

…8†

e …a‡b0†



Da die Werte von U und M direkt erfragt worden sind, führt Umformen zum Wert des gewünschten Parameters a: …9†



 ln 1

U M



Setzt man die Gleichungen (7) und (9) in die Zielfunktion der Konsumentenmenge CR (3) ein, so erhält man als Schätzgleichung:  …10†

CR ˆ M  1

e



ln Mb p

 ! G

0   Mb ln p B p@

 ln 1 b

U M

1 C A

Eine übliche Annahme bei der Durchführung der Conjoint-Analyse ist, dass die Rangordnungen nicht als ordinal-, sondern intervallskalierte Daten angesehen werden. Darmon / Rouzies (1994) zeigen in einer Simulationsstudie, dass diese Annahme zu keiner nennenswerten Verzerrung der Ergebnisse führt. Die Überführung der verhältnisskalierten Konsumentenrenten in intervallskalierte Daten kann durch eine Lineartransformation erreicht werden (Kaas 1977, Skiera 1999). Dazu multipliziert man die Konsumenterente mit einem Faktor Sa und addiert eine Konstante Sc . Bezeichnen Ri die erfragten Ränge verschiedener i-ter Tarife sowie Gi (Grundpreis) und pi (Minutenpreis) die Preiskomponenten der i-ten Tarife, so ergibt sich für einen bestimmten Befragten (für den wir den Index aus Vereinfachungsgründen nicht aufgeführt haben) folgende Schätzgleichung: (11)

2

Ri ˆ Sc ‡ Sa 4M 

 1

e

ln



Mb pi

 ! Gi

 13 0 Mb U ln pi ‡ ln M A5 ‡ "i …i 2 I† pi @ b

mit "i als Schätzfehler pro i-tem Stimulus und I als Indexmenge der Stimuli. Zur Schätzung der Parameterwerte b, M, Sc und Sa wird die Summe der Residuenquadrate "21 über alle Stimuli pro Befragtem minimiert. Leider erweist sich die simultane Schätzung der Parameterwerte für b, M, Sc und Sa als instabil, so dass die Parameterwerte alternierend geschätzt worden sind, d. h. nach Bestimmung der optimalen b und M wurden die optimalen Skalierungsparameterwerte bestimmt. Auf der Basis dieser Skalierung wurden dann wiederum die besten Parameterwerte

Einsatz einer erweiterten Form der Conjoint-Analyse

131

für b und M geschätzt, um danach wieder die Skalierung anzupassen. Typischerweise konvergierte dieses Verfahren schnell. Man kann das Ganze auch erweitern, indem man die Auswirkungen weiterer Tarifmerkmale in die Zahlungsbereitschaftsfunktion integriert. In der Festnetz- wie auch Mobilfunk-Telefonie differenziert man häufig zwischen Preisen tagsüber und Talzeiten wie abends oder an Wochenenden (Skiera 1998). Im Bereich der zeitlichen Preisdifferenzierung werden diese unterschiedlichen Zonen auch als Peakund Offpeak-Periode bezeichnet (Skiera / Spann 1998). Je nach Differenzierung der Tarife nach diesen Zeitzonen (z. B. Normaltarif und Talzeitentarif) ergeben sich andere Mengen und damit Konsumentenrenten. Betrachtet man nur zwei verschiedene Zeitzonen-Tarife, so kann man den Anteil, mit dem ein Konsument in dem Normaltarif telefoniert, mit Hilfe einer logistischen Funktion modellieren, die per Konstruktion nur Werte zwischen 0 und 1 annehmen kann und Grundlage binärer Logit-Modelle ist (Krafft 1997). In einer solchen Funktion müsste man die Konsequenzen unterschiedlich gestalteter Zeitzonen modellieren. So könnte man z. B. den Anteil der Menge im Normaltarif y von der Differenz der Anzahl von Stunden hN , für die der Normaltarif N gilt, abzüglich der Anzahl von Stunden hT , für die der Randzonentarif T gilt, sowie der Differenz der Nutzungspreise für den Randzonentarif pT und den Normaltarif pN abhängen lassen. Damit würde sich der Anteil der Menge im Normaltarif y wie folgt ergeben: …12†

1

yˆ 1‡e



c‡d…hN hT †‡f …pT pN †

Dabei reflektieren c, d und f als Parameterwerte die Stärke der einzelnen Einflüsse. Verwendet man diesen optimalen Anteil der Menge im Normaltarif y, so kann man diesen in die Bestimmung der Nutzen maximierenden Menge einsetzen. Dann modifiziert sich (7) zu:  ln …13†

xmax ˆ

bM pN y‡pT …1 y†

 a

b

Verwendet man die Parameterwerte a, b, U und M aus dem ersten Schritt so ergibt sich folgende Konsumentenrente CR: …14†

 CR ˆ M  1

e

a‡bxmax

 G

pN  y  xmax

pT  …1

y†  xmax

Zur Überführung der verhältnisskalierten Konsumentenrente in den durch die Rangordnung beschriebenen intervallskalierten Nutzen wird wiederum die schon bekannte Skalierung angewendet: 9*

132

Sönke Albers und Bernd Skiera

(15)

  Ri ˆ Sc ‡ Sa  M  1

e a‡bxmax

 Gi

pNi  y ‡ pTi  …1

  y†  xmax ‡ "i …i 2 I†

Setzt man die aus (13) resultierende Menge xmax und den aus (12) resultierenden Anteil y wiederum in die Funktion (15) ein, so erhält man eine Schätzfunktion in Abhängigkeit der verbliebenen Parameter c, d und f sowie der Skalierungsparameter Sc und Sa . Diese Werte müssen so geschätzt werden, dass die Summe der Residuenquadrate minimiert wird. Dafür müssen die Werte ebenso wie bei (11) alternierend geschätzt werden, d. h. nach Bestimmung der optimalen Werte für c, d und f werden die optimalen Skalierungsparameterwerte bestimmt. Auf der Basis dieser Skalierung werden dann wiederum die besten Werte für c, d und f geschätzt, um danach wieder die Skalierung anzupassen, bis beides konvergiert.

D. Design der empirischen Anwendung Die hier vorgestellte Methode zur Schätzung von Zahlungsbereitschaftsfunktionen in Abhängigkeit von der Menge ist im Bereich von Mobilfunk-Tarifen empirisch getestet worden. Aufgrund der Vermutung, dass Befragte am besten konkrete Tarife beurteilen können, soll hier beschrieben werden, wie die Zahlungsbereitschaftsfunktion hergeleitet worden ist. Dies ist mit Hilfe der Conjoint-Analyse geschehen, bei der die Befragten unterschiedliche Tarife in Rangfolgen zu bringen hatten. Zunächst einmal wurden die Probanden nach Ihren Telefoniergewohnheiten befragt. Sie sollten angeben, wie hoch ihre monatliche Mobilfunk-Rechnung ist, welchen Tarif sie gegenwärtig nutzen und welchen Anteil der Minuten sie tagsüber oder in der Talzeit telefonieren. Dies war erforderlich, um Stimuli konstruieren zu können, die für jeden einzelnen Befragten realistische Alternativen darstellten. Aus der Monatsrechnung und dem Wissen über den bisher geltenden Tarif sowie das Aufteilungsverhältnis zwischen tagsüber und Talzeit konnte auf die Anzahl der monatlich genutzten Mobilfunk-Telefonminuten zurück geschlossen werden. Je nach Anzahl dieser Minuten wurde dann für diese Untersuchung ein Vergleichstarif gemäß Tabelle 1 gewählt. Die vier Referenz-Tarife wurden noch mit 4 verschiedenen Aufteilungsverhältnissen zwischen Normal- und Talzeittarif kombiniert, nämlich 80:20, 60:40, 40:60 und 20:80. Um dominierte Tarife als Stimuli auszuschließen, wurden die anderen Tarife als Stimuli so konstruiert, dass höhere Grundpreise immer mit geringeren Preisen pro Minute verbunden waren und umgekehrt (siehe Abbildung 2).

Einsatz einer erweiterten Form der Conjoint-Analyse

133

Tabelle 1 Tarife zur Konstruktion der Referenz-Stimuli Tarif

Grundpreis

Preis pro Minute Preis pro Minute Bisher genutzte tagsüber Talzeit Minuten

Wenignutzer

29

2,69

0,99

Bis 30

Normalnutzer

49

1,99

0,39

30 – 90

Mehrnutzer

69

1,38

0,56

91 – 285

Vielnutzer

139

0,89

0,56

über 285

Gesamtpreis (DM)

Tarif 1 Tarif 2 (Vergleichstarif) Tarif 3 Tarif 4 KM(1/VT)

KM(1/VT)

KM(VT/3)

KM(VT/4)

KM(3/4)

Kritische Menge, ab der der Vergleichstarif günstiger als Tarif 1 ist

Menge (DM)

Abbildung 2: Konstruktion nicht-dominierter Tarife als Stimuli

Dabei wurden jeweils 4 Tarife im Grundpreis günstiger und 4 weitere im Grundpreis teurer als der Referenz-Tarif generiert. Um den Befragten die Konsequenzen der einzelnen Tarife besser vor Augen führen zu können, wurde auf den StimulusKarten der Hinweis gegeben, dass der jeweils betrachtete Tarif gegenüber dem Referenztarif günstiger ist, wenn man mehr als eine jeweils neu berechnete Minutenzahl telefonieren würde, aber um einen wiederum jeweils neu berechneten Betrag teurer wäre, wenn man weiterhin eine bestimmte Anzahl von Minuten telefonieren würde. Dabei wurde davon ausgegangen, dass diese Aussagen nur gelten, wenn sich die Aufteilung der Gesprächsminuten nicht zwischen tagsüber und der Talzeit ändert. Ein Beispiel für einen solchen Stimulus ist in Abbildung 3 angegeben. Zusätzlich wurden zwei Stimuli eingestreut, die dominiert waren, um testen zu können, ob dieses von den Probanden erkannt worden ist. Damit mussten insgesamt 9 ‡ 2 ˆ 11 Stimuli, die den Probanden auf Karten präsentiert wurden, in eine Rangfolge gebracht werden.

134

Sönke Albers und Bernd Skiera

Grundpreis

59,00 DM pro Monat

Verbindungspreis tagsüber

1,85 DM pro Minute

Verbindungspreis abends und an Wochenenden

0,36 DM pro Minute

Schon wenn Sie mehr als 60 Minuten im Monat telefonieren, ist dieser Tarif günstiger als der Vergleichstarif

83 Minuten

Wenn Sie jedoch weiterhin 60 Minuten im Monat telefonieren, so ist dieser Tarif teurer.

2,80 DM

Diese Aussagen gelten nur, wenn Sie die Aufteilung zwischen Gesprächen tagsüber und abends bzw. am Wochenende nicht ändern.

Abbildung 3: Beispiel für einen Stimulus zur Bestimmung der Zahlungsbereitschaftsfunktion

Zur Bestimmung der Präferenzfunktion für die Aufteilung der Nutzungsmenge auf die beiden Zeitzonen tagsüber und Talzeit wurde ebenfalls eine Conjoint-Analyse durchgeführt. Dazu mussten Trade-offs zwischen den Preisen pro Minute in den beiden Zeitzonen und der Länge dieser Zeitzonen gemacht werden. Um dies zu erreichen, wurden Stimuli konstruiert, bei denen zum einen der Preis pro Minute tagsüber bzw. in der Talzeit zurückging, dafür aber andererseits der Gültigkeitsbereich für „tagsüber“ zu Lasten der Talzeit erweitert wurde. Tabelle 2 zeigt die dabei verwendeten Werte für einen der Referenz-Tarife: Tabelle 2 Konstruktion der Stimuli zur Schätzung der Aufteilungsfunktion zwischen Normal- und Talzeittarif pN =pT =Zeitraum

pN =pT =Zeitraum

pN =pT =Zeitraum

pN =pT =Zeitraum

1,99 / 0,39 / 8 – 18h

1,99 / 0,34 / 8 – 19h

1,99 / 0,29 / 7 – 19h

1,99 / 0,24 / 7 – 20h

1,89 / 0,39 / 8 – 19h

1,89 / 0,34 / 7 – 19h

1,89 / 0,29 / 7 – 20h

1,79 / 0,39 / 7 – 19h

1,79 / 0,34 / 7 – 20h

1,69 / 0,39 / 7 – 20h pN : Preis pro Minute im Normaltarif (tagsüber) pT : Preis pro Minute in der Talzeit (abends und am Wochenende) Zeitraum: Gültigkeitsbereich des Normaltarifs „tagsüber“

Ähnlich wie bei der Schätzung der Zahlungsbereitschaftsfunktion wurden den Befragten die Konsequenzen der Wahl der einzelnen Tarife dadurch verdeutlicht, dass auf den Stimulus-Karten der Hinweis gegeben wurde, dass bei dem dargestellten Tarif ein bestimmter Rechnungsbetrag herauskommt, wenn der Befragte einen bestimmten Anteil von Minuten im Normaltarif telefoniert. Im Vergleich zu einem

Einsatz einer erweiterten Form der Conjoint-Analyse

135

Referenztarif ist der jeweils betrachtete Tarif um den jeweils berechneten Betrag günstiger, wenn man weiterhin das gegenwärtige Aufteilungsverhältnis wählen würde, während man nur einen bestimmten Betrag mehr bezahlen müsste, falls man ein anderes Aufteilungsverhältnis wählen würde. Ein Beispiel für einen solchen Stimulus ist in Abbildung 4 angegeben. Auch hier wurden zwei Stimuli eingestreut, die dominiert waren, um testen zu können, ob dieses von den Probanden erkannt worden ist. Damit mussten insgesamt 10 + 2 = 12 Stimuli, die den Probanden auf Karten präsentiert wurden, in eine Rangfolge gebracht werden. Verbindungspreis tagsüber

1,59 DM pro Minute

Verbindungspreis abends und am Wochenende

0,32 DM pro Minute

Abgrenzung „tagsüber“: montags bis freitags

7 – 20 Uhr

Für 110,80 DM (Rechnungsbetrag des Vergleichtarifes) können Sie bei diesem Tarif Ihre Telefonate tätigen

56 %

Sie sparen bei diesem Tarif gegenüber dem Vergleichstarif, wenn Sie weiterhin 40 % bzw. 24 Minuten tagsüber telefonieren

12,12 DM

Sie müssen bei dieser Kombination nur gegenüber dem Vergleichstarif mehr bezahlen, wenn Sie statt 40% jetzt 60% (36 Minuten) tagsüber telefonieren

3,12 DM

Abbildung 4: Beispiel für einen Stimulus zur Bestimmung der Aufteilungsfunktion zwischen Normal- und Talzeittarif

E. Zahlenbeispiel Die im 3. Abschnitt dargestellte Methode sei im Folgenden auf der Basis der im 4. Abschnitt beschriebenen empirischen Anwendung an Hand eines Zahlenbeispiels verdeutlicht. Im unteren Teil der Tabelle 3 sind die Ausprägungen der 9 Stimuli gegeben. Sie unterscheiden sich im monatlichen Grundpreis und dem Minutenpreis, wobei höhere Grundpreise mit niedrigeren Nutzungspreisen pro Minute einhergehen und umgekehrt. Im oberen Teil sind die erfragten Werte für die maximale Zahlungsbereitschaft M ˆ 550 und die Zahlungsbereitschaft für die Nullmenge U ˆ 70 angegeben. Auf dieser Basis kann gemäß Gleichung (9) der Parameterwert für a mit 0,1361 errechnet werden. Nimmt man nun einen bestimmten Wert für Parameter b an, hier z. B. 0,0034, dann kann man gemäß Gleichung (7) die die Konsumentenrente maximierende Nutzungsmenge xmax errechnen. Auf der Basis der Preise G und p und der Menge xmax können nun die Zahlungsbereitschaft für die verschiedenen Tarife gemäß Gleichung (1), der dann zu zahlende Gesamtpreis sowie die resultierende Konsumentenrente CR gemäß Gleichung (10) berechnet werden.

136

Sönke Albers und Bernd Skiera

Das Ziel besteht darin, einen solchen Parameterwert für b zu finden, der die erzielte Konsumentenrente CR für die 9 Tarife möglichst weitgehend mit den erfragten Rängen der Tarife in Überstimmung bringt. Dazu wird die Konsumentenrente CR durch Multiplizieren mit einem Faktor Sa und Addieren einer Konstanten Sc in eine skalierte Konsumentenrente (skal. CR) linear transformiert. In der letzten Spalte (Abw2) wird dann die quadrierte Abweichung zwischen den erfragten Rängen und den skalierten Konsumentenrenten bestimmt. Für die gewählten Parameterwerte ergibt sich dann im Zahlenbeispiel eine Abweichungssumme AQS von 5,90, aus der die erklärte Varianz (R2 ) bestimmt werden kann. Für den Parameterwert b ˆ 0; 0034 sowie die Skalierungsparameter Sc ˆ 30,81 und Sa ˆ0,6134 ergibt sich dann die hohe erklärte Varianz von R2 ˆ 90,1 %. Mit Hilfe nichtlinearer Optimierungsverfahren, z. B. dem im Solver von Microsoft Excel implementierten Newton- oder Gradientenverfahren (Fylstra et al. 1998, Nash 1998), kann man nun solche Parameterwerte b, Sc und Sa finden, die die Summe der Residuenquadrate minimieren. Die Werte für die beste Schätzung sind in Tabelle 3 angegeben. Tabelle 3 Zahlenbeispiel für die Methode zur Schätzung einer Zahlungsbereitschaftsfunktion in Abhängigkeit von einer Nutzungsmenge U 70

Stimulus

M 550

a 0,1361

Grund- Minutenpreis preis

b

Sc

AQS

Sa

0,0034 –30,81 0,6134

xmax

ZB

Gesamtpreis

R

2

5,90 90,1 %

CR

skal. CR

Rang

Abw2

1

37,00

1,23

86,23

193,54 143,07

50,47

0,15

1

0,73

2

45,00

1,10

118,61 231,21 175,47

55,74

3,38

2

1,91

3

53,00

1,01

143,34 257,29 197,78

59,52

5,70

5

0,48

4

61,00

0,94

164,16 277,58 215,31

62,27

7,38

7

0,15

5

69,00

0,89

180,00 292,07 229,20

62,87

7,75

9

1,56

6

77,00

0,85

193,33 303,66 241,33

62,34

7,42

8

0,33

7

87,00

0,81

207,30 315,26 254,91

60,35

6,20

6

0,04

8

96,00

0,78

218,23 323,95 266,22

57,73

4,60

4

0,36

9

104,00

0,76

225,76 329,75 275,58

54,17

2,41

3

0,34

Summe

5,90

Einsatz einer erweiterten Form der Conjoint-Analyse

137

F. Ergebnisse der empirischen Anwendung Zum Testen ihrer Eignung wurde die Methode an einem Convenience Sample getestet, das sowohl aus Geschäfts- und Privatleuten als auch aus bisherigen Nutzern und Nicht-Nutzern von Mobilfunktelefonen bestand und vor der Einführung des Euro stattfand. Die genaue Aufteilung ist in Tabelle 4 dokumentiert. Tabelle 4 Verteilung der Befragten Nutzer

Nicht-Nutzer

Summe

Private

11

32

43

Geschäftsleute

39

18

57

Summe

50

50

100

Jeder Proband musste zum einen 9 Stimuli und 2 dominierte Stimuli für die rein mengenbezogene Zahlungsbereitschaftsfunktion und zum anderen 10 Stimuli und 2 dominierte Stimuli für die Zeitzonen-Präferenzfunktion in jeweils eine Rangordnung bringen. Dabei dienten die beiden dominierten Stimuli dazu, die Konsistenz der Urteile abschätzen zu können. Um die externe Validität beurteilen zu können, mussten die Befragten zusätzlich 6 Tarife ohne weitere Kommentierung als Holdout-Stimuli in eine Rangfolge bringen. Schließlich wurden Daten über die Telefoniergewohnheiten, soziodemographische Merkmale und Urteile zur Schwierigkeit der Conjoint-Aufgabe erhoben. Aufgrund der bewussten Einbeziehung von dominierten Stimuli kann überprüft werden, in welchem Ausmaß dies den Befragten aufgefallen ist und auch sonst mit konsistenten Antworten zu rechnen ist. In Tabelle 5 werden deshalb die Ergebnisse des Konsistenztests für die verschiedenen Nutzergruppen dargestellt. Wie man den Werten der Tabelle 5 entnehmen kann, haben über 70 % der Befragten die Dominanz der beiden eingestreuten Stimuli erkannt und deshalb 0 Fehler begannen, während nur 3 – 5 % die Dominanz gar nicht begriffen hatten. Dabei zeigen die Nicht-Nutzer eine deutlich geringere Anzahl von Fehlern. Insgesamt kann man deshalb feststellen, dass die Befragten die Aufgabe der Rangreihung verstanden haben. Als nächstes soll die interne Validität beurteilt werden. Sie ist dann hoch, wenn mit den Parameterwerten für die postulierten Präferenz-Funktionen ein möglichst hoher Anteil der Varianz erklärt werden kann (Green / Srinivasan 1978, Tscheulin 1992). Die interne Validität kann grundsätzlich dadurch beeinträchtigt sein, dass die unterstellten Präferenzfunktionen nicht den wahren Funktionstypen entsprechen oder die Urteile inkonsistent abgegeben worden sind, so dass keine Kombina-

138

Sönke Albers und Bernd Skiera

tion von Parameterwerten die Rangordnung reproduzieren kann. Die erzielten R2 -Werte für die erklärte Varianz sind in Tabelle 6 angegeben. Tabelle 5 Konsistenz der Präferenz-Rangreihen-Urteile Nutzer Anzahl Fehler Geschäfts- Private leute Zahlungsbereitschaftsfunktion

Zeitzonen-Präferenz-Funktion

Nicht-Nutzer Geschäftsleute

Private

Insgesamt

0

67 %

64 %

67 %

78 %

70 %

1

28 %

36 %

28 %

22 %

27 %

2

5%

0%

6%

0%

3%

0

74 %

64 %

83 %

84 %

78 %

1

18 %

27 %

17 %

13 %

17 %

2

8%

9%

0%

3%

5%

39

11

18

32

100

Anzahl Fälle

Tabelle 6 Erklärte Varianz der Präferenzfunktionen nach Nutzergruppen Nutzer

Nicht-Nutzer Insgesamt

Geschäftsleute

Privat

Geschäftsleute

Privat

Zahlungsbereitschaftsfunktion

0,90

0,90

0,87

0,89

0,89

Zeitzonen-PräferenzFunktion

0,91

0,23

0,89

0,78

0,84

39

11

18

32

100

Anzahl Fälle

Die erzielten Werte in Tabelle 6 deuten auf eine hohe interne Validität, da Werte im Bereich von über 0,80 nicht leicht erzielbar sind. Die Werte sagen allerdings nicht aus, ob die unterstellte Zahlungsbereitschaftsfunktion einen wesentlich besseren Fit als andere Funktionen erbringt. Insbesondere interessiert, ob der Nutzer tatsächlich seine Nutzungsmenge, also die Anzahl telefonierter Minuten in den beiden Zeitzonen, nach der Annahme maximaler Konsumentenrente bestimmt hat. Insofern wollen wir die Ergebnisse mit einem naiven Modell vergleichen, bei dem für die vom Nutzer angegebene Menge an telefonierten Minuten und dem ebenfalls angegebenen Aufteilungsverhältnis zwischen Normal- und Talzeittarif die Gesamtpreise der einzelnen Stimuli bestimmt worden sind und dafür ebenfalls die erklärte

Einsatz einer erweiterten Form der Conjoint-Analyse

139

Varianz errechnet worden ist. In analoger Weise ist für die Aufteilungsfunktion zwischen Normal- und Talzeittarif errechnet worden, welche Konsumentenrente bei festem Aufteilungsverhältnis resultiert und in welchem Ausmaß damit die Varianz der erhobenen Urteile aufgeklärt wird. Tabelle 7 gibt die Ergebnisse des Vergleichs mit dem naiven Modell wieder. Tabelle 7 Vergleich der vorgeschlagenen Methode mit naivem Modell in Bezug auf die erklärte Varianz Nutzer

Nicht-Nutzer

Geschäftsleute

Private

Zahlungsbereitschaftsfunktion

82 / 8 / 10

Zeitzonen-PräferenzFunktion Anzahl Fälle

Geschäftsleute

Private

73 / 18 / 9

88 / 6 / 6

94 / 3 / 3

86 / 7 / 7

33 / 21 / 46

46 / 27 / 27

55 / 39 / 6

72 / 16 / 12

51 / 23 / 26

39

11

18

32

100

Insgesamt

82 / 8 / 10 bedeutet, dass in 82 % der Fälle die vorgeschlagene Methode besser ist, in 8 % gleich ist und in 10 % schlechter ist als das naive Modell.

Wie man Tabelle 7 entnehmen kann, spielt die Bestimmung der Nutzungsmenge nach Maßgabe maximaler Konsumentenrente bei der Zahlungsbereitschaftsfunktion eine größere Rolle als bei der Zeitzonen-Präferenz-Funktion. Bei der Zahlungsbereitschaftsfunktion verändert der Nutzer offenbar tatsächlich je nach angebotenem Tarif seine Nutzungsmenge, da die hier vorgestellte Methode in 86 % der Fälle bessere Ergebnisse bringt als die rein nach dem Preis bestimmte Präferenzrangfolge. Bei der Zeitzonenpräferenz ist dies nicht mehr so deutlich gegeben. Hier ist die vorgestellte Methode nur noch in 51 % der Fälle der naiven Methode überlegen und in 26 % der Fälle sogar schlechter. Dies hängt natürlich auch damit zusammen, dass in diesem Fall auch die naive Methode auf der Konsumentenrente aufbaut, allerdings das Aufteilungsverhältnis konstant hält. Insgesamt kann man behaupten, dass die vorgestellte Methode besser die Abwägungen des Konsumenten bei der Festlegung der Menge trifft als andere Methoden und deshalb einen wesentlichen Aspekt in der Modellierung darstellt. Interne Validität ist natürlich nur eine notwendige Bedingung für die Vorteilhaftigkeit von Methoden. Da man die Zahlungsbereitschaftsfunktionen zu dem Zweck schätzt, darauf aufbauend Simulationen durchzuführen, welche Umsätze und Erlöse mit verschiedenen Tarifen erzielt werden, sollte auch die externe Validität, also ihre Prognosefähigkeit, beurteilt werden. Dazu waren sechs Tarife aus einem Holdout-Sample ohne Kommentierung in eine Präferenzrangfolge zu bringen. Wir

140

Sönke Albers und Bernd Skiera

haben deshalb untersucht, inwieweit wir mit der vorgeschlagenen Methode den besten und die zwei besten Tarif(e) aus dem Holdout-Sample vorhersagen können sowie welcher mittlere Rangreihen-Korrelationskoeffizient erzielt werden kann. Zum Vergleich haben wir dies auch für die beiden naiven Methoden vorgenommen, zum einen dem naiven Modell mit erfragten Präferenzen für Zeitzonen (also das Modell mit maximaler Konsumentenrente, aber festem Aufteilungsverhältnis zwischen Normal- und Talzeittarif) und zum anderen dem naiven Modell mit fest vorgegebener Nutzungsmenge. Schließlich haben wir die Methoden auch direkt hinsichtlich ihrer Vorteilhaftigkeit für die Prognose der Präferenzen des HoldoutSamples getestet. Die Ergebnisse sind in Tabelle 8 angegeben. Tabelle 8 Externe Validität der vorgeschlagenen Methode im Vergleich zu zwei naiven Modellen Vorgeschlagene Methode

Naives Modell mit erfragten Präferenzen für Zeitzonen

Naives Modell mit fester Nutzungsmenge

Bester Tarif vorhergesagt

69 %

67 %

60 %

Zwei besten Tarife vorhergesagt

88 %

80 %

83 %

Mittlere Rangreihen-Korrelation

0,72

0,78

0,67

Vorgeschlagene Methode im Vergleich zu

Besser / gleich / schlechter

10 / 15 / 17

16 / 9 / 17

Wie man Tabelle 8 entnehmen kann, gelingt es den Methoden relativ gut, die besten Tarife vorherzusagen. Allerdings erweist sich die Überlegenheit der vorgeschlagenen auf der Maximierung der Konsumentenrente basierenden Methode gegenüber naiven Überlegungen nicht mehr als existent. Dies kann allerdings auch ein Ergebnis der Art der Holdout-Validierung sein. Die Holdout-Tarife mussten nämlich anders als bei der Durchführung der Conjoint-Analysen ohne jede Hilfestellung in eine Präferenz-Rangfolge gebracht werden. Hier zeigt sich, dass davon offenbar ein großer Einfluss ausgeht, der in der Konsequenz bedeutet, dass komplexe Tarife nur mit geeigneten Hilfen verstanden werden, was zugleich den Service-Providern, die Mobilfunk-Verträge anbieten, empfiehlt, die Komplexität durch gute Hilfen abzubauen. Auch wenn im Methodenvergleich bei der Holdout-Validierung keine Überlegenheit der hier vorgeschlagenen, auf der Maximierung der Konsumentenrente basierenden Methode erkennbar ist, zeigen alle anderen Gütemaße eine viel versprechende Methode an. Bei der Conjoint-Aufgabe werden nur wenige Konsistenz-

Einsatz einer erweiterten Form der Conjoint-Analyse

141

Fehler begangen, die erklärte Varianz ist hoch und auch im Vergleich zu naiven Methoden höher.

G. Schlussfolgerungen Zahlungsbereitschaften zu erheben, stellt nach wie vor ein schwieriges Problem dar (Ruprecht 2005, Wertenbroch / Skiera 2002). Dies gilt umso mehr für Situationen, in denen die Konsumenten mehr als eine Mengeneinheit von einem Produkt kaufen können. Dies ist der Fall bei den Angeboten von fast allen Energie-, Verkehrs- und Telekommunikationsanbietern. Des Weiteren ist dies für Medienunternehmen von Relevanz, da auch dort die Häufigkeit der Nutzung, z. B. bei Downloads von Musiktiteln oder Zeitschriftenartikeln, erheblich variieren kann (Becker 2004). In solchen Fällen ist die Ermittlung von Zahlungsbereitschaftsfunktionen erforderlich, da nur so eine Auswirkung von Tarifänderungen auf die Nutzungsmenge und damit die Kosten des Anbieters möglich ist. Die hier vorgeschlagene Methode erweitert die klassische Form der ConjointAnalyse dahingehend, dass nicht nur eine Maximierung des mit verschiedenen Tarifen verbundenen Nutzens, sondern eine Maximierung der Konsumentenrente vorgenommen wird. Die Höhe der Konsumentenrente wird sowohl von den mit dem Tarif verbundenen Preisen als auch von der gewählten Menge und deren Aufteilung auf die Zeitzonen beeinflusst. Die Berücksichtigung von Letzterem gestattet die Ermittlung von Zahlungsbereitschaftsfunktionen mit Hilfe der vorgestellten Methode. Diese Methode unterscheidet sich von bisher bekannten Methoden dadurch, dass die Zahlungsbereitschaftsfunktion auch zeitlich unterschiedlich gestaltete Preise berücksichtigt und es damit gestattet, Auswirkungen einer mengen- und zeitbezogenen Preisdifferenzierung auf das Tarifwahlverhalten zu prognostizieren. Diese neue Methode ist im Bereich von Mobilfunk-Tarifen empirisch getestet worden ist und hinsichtlich ihrer Validität umfangreich beurteilt worden ist. Die empirischen Ergebnisse deuten an, dass die neu vorgeschlagene Methode viel versprechend ist. Gibt man den Probanden Hilfestellungen bei der Beurteilung der einzelnen Tarife, dann werden dominierte Tarife erkannt und eine hohe erklärte Varianz der gewählten Tarife erzielt. Auch im Vergleich zu naiven Methoden, die mit festen Nutzungsmengen arbeiten, werden höhere erklärte Varianzen erreicht. Schließlich erweist sich die Methode auch bei der Prognose der Ränge für ein Holdout-sample als gut geeignet. Allerdings zeigt ein Vergleich mit den naiven Methoden, dass keine Überlegenheit mehr festzustellen ist. Dies könnte allerdings darauf zurückzuführen sein, dass die Rangbildung bei den Holdout-Tarifen ohne Hilfestellung zu vollziehen war. Insgesamt liegt eine neue Methode vor, die erhebliche Einsichten in die Bestimmung der Nutzungsmengen bei nutzungsabhängigen Tarifen erlaubt und weiter entwickelt werden sollte.

142

Sönke Albers und Bernd Skiera

Literatur Albers, Sönke (2001): Besonderheiten des Marketing für Interaktive Medien, in: Albers, Sönke / Clement, Michel / Peters, Kay / Skiera, Bernd (Hrsg.), Marketing mit Interaktiven Medien. Strategien zum Markterfolg, 3. Aufl., S. 11 – 23 Albers, Sönke / Brockhoff, Klaus (1985): Die Gültigkeit der Ergebnisse eines Testmarktsimulators bei unterschiedlichen Daten und Auswertungsmethoden, in: Schmalenbachs Zeitschrift für betriebswirtschaftliche Forschung, Vol. 37, S. 197 – 217 Becker, Jan U. (2004): File Sharing in Peer-to-Peer Netzwerken Büschken, Joachim (1997): Sequentielle nicht-lineare Tarife. Nicht-lineare Preispolitik bei Nachfrageunsicherheit Clement, Michel 2000): Interaktives Fernsehen. Analyse und Prognose seiner Nutzung Darmon, R. Y. / Rouzies, D. (1994): Reliability and Internal Validity of Conjoint Estimated Utility Functions under Free versus Error-Full Conditions, in: International Journal of Research in Marketing, Vol. 11, S. 465 – 476 Dubin, J. / McFadden, D. (1984): An Econometric Analysis of Residential Electric Appliance Holdings and Consumption, in: Econometrica, Vol. 52, S. 345 – 362 Fylstra, Daniel / Lasdon, Leon / Watson, John / Waren, Allan (1998): Design and Use of the Microsoft Excel Solver, in: Interfaces, Vol. 28, S. 29 – 55 Gensler, Sonja (2003): Heterogenität in der Präferenzanalyse Goldman, M. B. / Leland, H. E. / Sibley, D. S. (1984): Optimal Nonuniform Pricing, in: Review of Economic Studies, Vol. 51, S. 305 – 320 Gossen, Hermann H. (1854): Entwicklung der Gesetze des menschlichen Verkehrs und der daraus fließenden Regeln für menschliches Handeln Green, Paul E. / Krieger, Abba M. / Wind, Yoram (2001): Thirty Years of Conjoint Analysis: Reflections and Prospects, in: Interfaces, Vol. 31, S. 56 – 73 Green, Paul E. / Rao, Vithala (1971): Conjoint Measurement for Quantifying Judgemental Data, in: Journal of Marketing Research, Vol. 8, S. 355 – 363 Green, Paul E. / Srinivasan, V. (1978): Conjoint Analysis in Consumer Research: Issues and Outlook, in: Journal of Consumer Research, Vol. 5, S. 103 – 123 Hanemann, W. M. (1984): Discrete / Continuous Models of Consumer Demand, in: Econometrica, Vol. 52, S. 541 – 461 Hensel-Börner, Susanne (2000): Validität computergestützter hybrider Conjoint-Analyse Hewitt, Julie A. / Hanemann, W. Michael (1995): A Discrete / Continuous Choice Approach to Residential Water Demand under Block Rate Pricing, in: Land Economics, Vol. 71, S. 173 – 192 Iyengar, R. (2004): A Structural Demand Analysis for Wireless Service under Nonlinear Pricing Schemes, Working Paper, Columbia University, New York Kaas, K.P. (1977): Empirische Preisabsatzfunktionen bei Konsumgütern

Einsatz einer erweiterten Form der Conjoint-Analyse

143

Krafft, Manfred (1997): Der Ansatz der Logistischen Regression und seine Interpretation, in: Zeitschrift für Betriebswirtschaft, Vol. 67, S. 625 – 642 Kridel, D. J. / Lehman, D. E. / Weisman, D. L. (1993): Option Value, Telecommunication Demand, and Policy, in: Information Economics and Policy, Vol. 5, S. 125 – 144 Lambrecht, Anja (2005): Tarifwahl bei Internetzugangstarifen. Existenz, Ursachen und Konsequenzen von Tarifwahl-Biases Lambrecht, Anja / Seim, Katja / Skiera, Bernd (2005): Pricing Internet Access with Three-Part Tariffs, Working Paper, University of Frankfurt, School of Business and Economics Louviere, J. J. / Woodworth, G. (1983): Design and Analysis of Simulated Consumer Choice or Allocation Experiments: An Approach Based on Aggregated Data, in: Journal of Marketing Research, Vol. 20, S. 350 – 367 Mitchell, B. M. / Vogelsang, I. (1991): Telecommunication Pricing: Theory and Practice Narayanan, Sridhar / Chintagunta, P. K. / Miravete, Eugenio J. (2004): The Role of Self Selection and Usage Uncertainty in the Demand for Local Telephone Service, Working Paper, University of Chicago Nash, Stephen G. (1998): Nonlinear Programming, in: OR / MS Today, Vol. 25, S. 36 – 45 Oi, W. Y. (1971): A Disneyland Dilemma: Two-Part Tariffs for a Mickey Mouse Monopoly, in: Quarterly Journal of Economics, Vol. 85, S. 77 – 96 Oren, S. S. / Smith, S. A. / Wilson, R. B. (1983): Competitive Nonlinear Tariffs, in: Journal of Economic Theory, Vol. 29, S. 49 – 71 Ruprecht, Heidrun (2005): Anreizkompatible Erhebung von Zahlungsbereitschaften Schulze, Timo (2005): Nutzungspreise für Online-Zeitungen Schulze, Timo / Gedenk, Karen / Skiera, Bernd (2005): Segmentspezifische Schätzung von Zahlungsbereitschaftsfunktionen, in: Schmalenbachs Zeitschrift für betriebswirtschaftliche Forschung, Vol. 57, S. 401 – 422 Skiera, Bernd (1998): TACO: Eine neue Möglichkeit zum Vergleich von Mobilfunktarifen, in: Schmalenbachs Zeitschrift für betriebswirtschaftliche Forschung, Vol. 50, S. 1029 – 1047 – (1999): Mengenbezogene Preisdifferenzierung bei Dienstleistungen Skiera, Bernd / Albers, Sönke (2001): Tarifabhängige Nutzung, in: Albers, Sönke / Clement, Michel / Peters, Kay / Skiera, Bernd (Hrsg.), Marketing mit Interaktiven Medien. Strategien zum Markterfolg, 3. Aufl., S. 225 – 240 Skiera, Bernd / Spann, Martin (1998): Gewinnmaximale zeitliche Preisdifferenzierung für Dienstleistungen, in: Zeitschrift für Betriebswirtschaft, Vol. 68, S. 703 – 718 Srinagesh, P. (1985): Non-Linear Prices with Heterogeneous Consumers and Uncertain Demand, in: Indian Economic Review, Vol. 20, S. 299 – 315 Tacke, Georg (1989): Nichtlineare Preisbildung. Höhere Gewinne durch Differenzierung Taylor, Lester D. (1994): Telecommunications Demand in Theory and Practice Train, K. E. / Ben-Akiva, M. / Atherton, T. (1989): Consumption Patterns and Self-Selecting Tariffs, in: Review of Economic and Statistics, Vol. 1, S. 62 – 73

144

Sönke Albers und Bernd Skiera

Train, K. E. / McFadden, D. L. / Ben-Akiva, M. (1987): The Demand for Local Telephone Service: A Fully Discrete Model of Residential Calling Patterns and Service Choices, in: Rand Journal of Economics, Vol. 18, S. 109 – 123 Tscheulin, Dieter K. (1992): Optimale Produktgestaltung: Erfolgsprognose mit Analytic Hierarchy Process und Conjoint Analyse Wertenbroch, Klaus / Skiera, Bernd (2002): Measuring Consumer Willingness to Pay at the Point of Purchase, in: Journal of Marketing Research, Vol. 39, S. 228 – 241 Wilson, Robert (1993): Nonlinear Pricing

Zur „Rationalität“ der Urteilsbildung: Ankerheuristiken zur Vereinfachung der Beurteilung von Markenallianzen Franz-Rudolf Esch, Jörn Redler und Tobias Langner

A. Urteilsbildung und Markenallianzen Urteilsbildung zwischen Rationalität und Ökonomie: Lange Jahre ging man in der Konsumentenforschung bei der Urteilsbildung und der Entscheidung für ein Produkt oder eine Marke von einem rationalen Prozess aus. Demzufolge wäre ein solcher Prozess geprägt durch eine kognitive Algebra, bei der man aus der Bewertung aller Alternativen und vorhandener Eigenschaften einen entsprechenden Schluss ziehen und eine Entscheidung treffen würde (Kroeber-Riel / Weinberg 2003, S. 368 ff.). Dies wird auch deutlich, wenn man einen Rückgriff auf die psychologischen Grundlagen der Urteilsbildung vornimmt. Aus Sicht der kognitiven Sozialpsychologie ist die Informationsverarbeitung der grundlegende Prozess für menschliche Handlungen (Abbildung 1). Dieser lässt sich als eine Sequenz von mehreren Prozessen (Wahrnehmung – Einordnung – Organisation – Inferenz – Abruf – Entscheidung) auffassen (Fiedler 1996, S. 138, Brandner et al. 1989, S. 13 ff., auch Raaij 1988). Diese Prozesse sind eng miteinander verwoben und durch zahlreiche Rückkopplungen verbunden (Fiedler 1996, S. 138). Anders als zunächst in der kognitiven Forschung erwartet, laufen diese Prozesse nicht immer stark kognitiv kontrolliert, sondern oft weitgehend automatisiert und unbewusst ab (Fiedler 1996, Brehm et al. 2002, S. 124 f.). Die Prozesssequenz mündet in Urteilen und Entscheidungen (Fiedler 1996, S. 148, auch Raaij 1988). Urteile stellen das Ergebnis eines kognitiven Prozesses dar, sie werden jedoch nicht immer explizit und bewusst sichtbar (Fiedler 1996, S. 148, auch Perrig et al. 1993, S. 41 ff.). Entscheidungen und Verhalten gehen demnach aus mehreren Urteilsprozessen hervor. Dabei sind die ablaufenden Verarbeitungsprozesse, die zu der Urteilsbildung führen, nach Fiedler (1996, S. 148) stets ein Kompromiss aus Rationalität und Ökonomie. Urteilsbildung ist damit ein Basiselement menschlicher Informationsverarbeitungsprozesse (Fiedler 1996, Plous 1993). Sie sind einerseits Ergebnis von, andererseits aber auch Zwischenergebnis und Input bei Verarbeitungsprozessen. Das hat weit reichende Implikationen für die Wirkungen von Marken und Markenallianzen auf den Konsumenten.

10 FS Kaas

146

Franz-Rudolf Esch, Jörn Redler und Tobias Langner

Stimulus

Aufmerksamkeit Wahrnehmung

Enkodierung Einordnung

Inferenz Denken

Abruf Urteilsbildung Entscheidung und Verhalten

Quelle: In Anlehnung an Fiedler 1996, S. 139.

Abbildung 1: Urteilsbildung als kognitiver Informationsverarbeitungsprozess

Belege wider die Rationalität: Zahlreiche Erkenntnisse belegen, dass Urteile und Entscheidungsprozesse im Rahmen von Markenentscheidungen bei weitem nicht extensiv und in hohem Maße gedanklich stark kontrolliert ablaufen. Die theoretischen Überlegungen von Damasio (1994), nach denen das Entscheidungsverhalten stark emotional beeinflusst ist, wurden im Rahmen neuronaler Forschung wiederholt bestätigt (Esch / Möll 2004, Ambler et al. 2002). Diese Auffassung steht in starkem Kontrast zur Auffassung rationaler Optimierer (Bettman et al. 1998). In ihrer Studie „Salience and Choice“ konnten Ambler et al. (2002) eine Beziehung zwischen starken Marken und der Markenwahl ermitteln. Es zeigte sich, dass die Entscheidungszeiten bei starken Marken wesentlich kürzer sind als bei schwachen Marken. Zudem wurde ermittelt, dass Markenvertrautheit vor allem in der rechten Hirnhälfte, im sogenannten Parietalen Cortex, zu Aktivitäten führt. Marken sind demnach Anker zur Orientierung bei Entscheidungen und dienen als Entscheidungsbeschleuniger, weil sie verdichtete Informationen umfassen und Vertrauen stiften. Kenning et al. (2003) ermittelten ebenfalls einen signifikanten Zusammenhang zwischen Vorgängen im menschlichen Gehirn und dem Einfluss von Marken auf Wahlentscheidungen. Im Ergebnis führte eine starke Marke zu einer „kortikalen“ Entlastung im Entscheidungsprozess. Das bedeutet, dass die kognitiven Be-

Zur „Rationalität“ der Urteilsbildung

147

reiche weniger aktiv sind. Zudem kam es zu erhöhten Tätigkeiten in den Regionen, die dafür zuständig sind, Emotionen in Entscheidungen zu integrieren. Anscheinend setzt bei favorisierten Marken „schlicht der Verstand aus“. Die Gründe solcher Vereinfachungen sind vielfältig (Kaas 1982). Sie liegen zum einen in den Markt- und Kommunikationsbedingungen begründet, zum anderen in den Konsumenten selbst. Aufgrund der wachsenden Zahl der Produkte und Dienstleistungen, dem ständig zunehmenden Kommunikationsangebot und den wenig involvierten Konsumenten entsteht eine Informationsüberlastung, die es für Konsumenten erforderlich macht, ihre Urteilsbildung zu vereinfachen durch Heuristiken. Zudem verfügen Konsumenten gerade bei Marken und Produkten über vorhandenes Wissen und Einstellungen, die ebenfalls zu einer Urteils- und Entscheidungsvereinfachung bis hin zu einem gewohnheitsmäßigen Kauf führen können. Marken als Anker zur Vereinfachung der Urteilsbildung: Nach modernem Verständnis sind Marken vor allem ein sozialpsychologisches Phänomen (Kaas 1990, Keller 2003, S. 59 ff., de Chernatony / Riley 1998, S. 427). Sie werden als Vorstellungsbilder in den Köpfen der Konsumenten verstanden, die eine Identifizierungsund Differenzierungsfunktion übernehmen (Esch 2005, S. 23). Dies spiegelt sich in den mit Marken verbundenen Assoziationen wider, die auf verschiedene Arten repräsentiert werden (Esch 2005, S. 70 f., Keller 1993, S. 7, Aaker 1996, Franzen / Bouwman 2001, S. 144 ff.). Erfolgreiche Marken schaffen es zudem, ein inneres Bild in der Psyche des Konsumenten zu verankern. Sowohl die inneren Bilder als auch die mit Marken verbundenen Assoziationen üben einen Einfluss auf das Verhalten der Konsumenten aus (Esch 2005, de Chernatony / McDonald 1998, S. 9 f., Ruge 1988, S. 30 ff., Franzen / Bouwman 2001, S. 131 ff.). In den ausgelösten Konsumentenwirkungen ist der konsumentenbezogene Wert einer Marke zu sehen (Keller 2003, S. 60). Marken werden von den Markeneignern auf unterschiedliche Arten kapitalisiert. Eine typische Erscheinungsform sind Markendehnungs- und Lizenzierungsaktivitäten oder die Bildung von Markenallianzen (Esch et al. 2001, Esch / Redler 2005, Waters 1997, S. 26). Unter Markenallianzen werden Fälle verstanden, bei denen mehrere Marken gegenüber dem Konsumenten im Zusammenhang mit einem eigenständigen Leistungsangebot simultan dargeboten werden (Redler 2003, Esch / Redler 2005). Im weitesten Sinne handelt es sich bei Markenallianzen um die Integration und gleichzeitige Darbietung von zwei oder mehr Marken gegenüber dem Konsumenten (z. B. Simonin / Ruth 1998, S. 30). So nutzen beispielsweise Sony und Ericsson ihre Marken gemeinsam, um dadurch für eine angebotene Leistung eine verbesserte Durchsetzung zu erreichen: Unter der Markenallianz Sony Ericsson werden Mobiltelefone angeboten, obgleich die Marken Sony und Ericsson auch eigenständig bestehen. Derzeit sind Markenallianzen vor allem im Nahrungsmittelmarkt stark vertreten (Bengtsson 2002, S. 2). Beispiele aus dem deutschen Lebensmittelmarkt stellen Ritter Sport Smarties Tafelschokolade, Schöller Mövenpick Eiscreme oder die Eiscreme von Langnese Cremissimo und Milka dar. 10*

148

Franz-Rudolf Esch, Jörn Redler und Tobias Langner

Gerade bei Markenallianzen ist die Urteilsbildung von besonderem Interesse, da bei einem Urteil zur Markenallianz sowohl die Einschätzung der einen als auch der anderen Marke und deren Zusammenspiel erforderlich ist. Markenallianzen werden wahrscheinlich nur dann erfolgreich sein können, wenn aus der Kombination zweier Marken ein Mehrnutzen gegenüber einer einfachen Markendehnung erzielbar ist und zudem ein Fit zwischen den an einer Markenallianz beteiligten Marken vorhanden ist. Fraglich ist jedoch die Rolle der Marken bei der Beurteilung einer solchen Markenallianz. Die große praktische Bedeutung von Markenallianzen steht noch in einem auffälligen Missverhältnis zu den bisher hierzu unternommenen Forschungsaktivitäten (Cegarra / Michel 2000). Zur Wirkungsweise von Markenallianzen liegen derzeit lediglich vereinzelte Erkenntnisse vor (z. B. Baumgarth 2003, Bengtsson 2002, Levin / Levin 2000, Park et al. 1996, Rao et al. 1999, Redler 2003, Simonin / Ruth 1998, Washburn et al. 2000). Ungeklärt ist vor allem, wie sich konsumentenbezogene Prozesse wie beispielsweise Kaufverhalten oder Einstellungsbildung, die mit Markenallianzen verbunden sind, beschreiben und überprüfen lassen. Hier gilt es, entscheidende Forschungslücken zu schließen. Angesichts der Defizite im theoretischen Bereich können für die Praxis bislang nur wenige fundierte Handlungsempfehlungen gegeben werden. Damit Markenallianzen die angestrebten Wirkungen entfalten, ist ihre Akzeptanz durch den Konsumenten erforderlich. Nur wenn diese gegeben ist, sind weitere mit einer Markenallianz verfolgte Ziele realisierbar. Für die Akzeptanz einer Markenallianz sind speziell die vielfältigen Urteilsprozesse, die bei der Informationsverarbeitung eine Rolle spielen, von entscheidender Bedeutung. So bestimmen beispielsweise Urteilsprozesse bei der ersten Wahrnehmung einer Marke (z. B. darüber, ob die Marke als „ansprechend“ oder „sympathisch“ empfunden wird), welche weiteren Inhalte in der Vorstellung des Konsumenten evoziert werden, was wiederum beeinflusst, ob der Konsument eine tendenziell ablehnende oder zustimmende Haltung gegenüber der Markenallianz und der angebotenen Leistung einnimmt. Daher ist die Untersuchung der Urteilsbildungsprozesse, die ablaufen, wenn Konsumenten mit einer Markenallianz konfrontiert sind, als grundlegend anzusehen. Vor diesem Hintergrund wird in diesem Beitrag ein Ansatz vorgestellt, der die Urteilsbildung gegenüber Markenallianzen als ein Anchoring-Phänomen modelliert. Daraus resultierende Ableitungen werden anschließend empirisch überprüft und Implikationen für Theorie und Praxis angesprochen.

Zur „Rationalität“ der Urteilsbildung

149

B. Anker-Heuristiken als Zugang zur Erklärung der Urteilsbildung gegenüber Markenallianzen I. Urteilsbildung bei Markenallianzen durch Urteilsheuristiken Inwieweit ein Urteilsprozess eher gedanklich stark oder weniger stark gesteuert ist, hängt wesentlich von dem Involvement der Konsumenten ab. Unter dem Involvement versteht man das Engagement oder die Ich-Beteiligung, mit der sich Konsumenten einem Gegenstand oder Sachverhalt widmen (Kroeber-Riel / Esch 2004). Das Involvement selbst ist ein komplexes Konstrukt, das sich aus verschiedenen Dimensionen zusammensetzt (Kroeber-Riel / Weinberg 2003, S. 368 ff.). Wenn wir im Folgenden von Involvement sprechen, so meinen wir das Gesamtinvolvement einer Person während der Beurteilung einer Markenallianz, das sich aus dem Produkt- und Markeninvolvement, dem persönlichen Involvement sowie dem situativen Involvement ergibt (ebenda). In der Forschung differenziert man meist zwischen einem hohen und niedrigen Involvement als Ende eines Kontinuums. Man vernachlässigt dabei, dass das Involvement auch eine emotionale und kognitive Ausprägung haben kann (Mittal 1988, Jeck-Schlottmann 1988, Esch 2001). Allerdings ergeben sich daraus zwei extreme Prozesse, die auch für die Urteilsbildung von Bedeutung sind, so dass wir hier dieser Auffassung folgen. Bei wenig involvierten Konsumenten dominieren Prozesse, die dem peripheren Weg der Verarbeitung im Sinne des Elaboration-Likelihood-Modell (Petty / Cacioppo 1986) entsprechen (Assael 1995, S. 238). Diese laufen weniger aktiv (Assael 1995, S. 237) und mit geringerer Verarbeitungstiefe (Olson 1980, Craik / Lockhart 1972) ab. Vereinfachende Strategien werden bevorzugt herangezogen (Assael 1995, S. 247, Kroeber-Riel / Weinberg 2003, S. 298 ff.). Typische Muster dafür sind beispielsweise die Beschränkung auf hervorstechende Eigenschaften, die Nutzung von Schlüsselinformationen oder vereinfachte Schlüsse wie „Irradiation“ oder „Halo“ bei der Produktbeurteilung (Kroeber-Riel / Weinberg 2003, S. 298 ff.). Diese vereinfachenden Strategien werden als Heuristiken, also einfache „Faustregeln“ bezeichnet, welche ein hinreichend genaues Urteil bei geringem Verarbeitungsaufwand ermöglichen (Bösel 2001, S. 302, Brandner et al. 1989, S. 124 f., Plous 1993, S. 109, Bierhoff 1998, S. 224, Brehm et al. 2002, S. 104 f.). Sie reduzieren in erheblichem Maß den zeitlichen und kognitiven Aufwand für den Konsumenten (Plous 1993, S. 109). Menschen können dadurch vergleichsweise valide Urteile auf relativ ökonomische Art und Weise bilden. Da der Zusammenhang zwischen dem heuristischen Hinweisreiz und der tatsächlichen Ausprägung der Urteilsdimension allerdings nicht perfekt ist, ergeben sich Verzerrungen (Fiedler 1996, S. 148), die sich für das Individuum jedoch nur unter bestimmten Bedingungen negativ auswirken. Unter der Bedingung hohen Involvements finden tendenziell eher extensive Bewertungsprozesse statt. Diese erfolgen mit vergleichsweise hoher Verarbeitungstiefe (Olson 1980, Craik / Lockhart 1972), wobei viele Attribute des Objektes

150

Franz-Rudolf Esch, Jörn Redler und Tobias Langner

bewertet und diese Bewertungen integriert werden (Assael 1995, S. 247 f., Sujan 1985, Kroeber-Riel / Weinberg 2003, S. 368 ff.). Typisch ist zudem die Suche nach zusätzlichen Informationen (Assael 1995, S. 236, Kroeber-Riel / Weinberg 2003, S. 368 ff.). Eine Vielzahl von Betrachtungen zeigt, dass auch unter derartigen High-Involvement-Bedingungen heuristische Vereinfachungsprozesse ablaufen (z. B. Plous 1993, Tversky / Kahneman 1974, Kroeber-Riel / Weinberg 2003, S. 368 ff., Wilson et al. 1996, Switzer / Sniezek 1991). Urteilsheuristiken sind daher sowohl unter hohem als auch unter geringem Involvement ein zentraler Bestandteil der konsumentenbezogenen Urteilsbildung. Wichtige heuristische Prinzipien von großer Allgemeinheit sind beispielsweise: – die Verfügbarkeitsheuristik: Hier wird kognitiv leichter verfügbaren Ereignissen eine höhere Bedeutung beigemessen; – die Repäsentativitätsheuristik: Die subjektive Wahrscheinlichkeit für ein Ereignis wird um so größer eingeordnet, je repräsentativer das Ereignis für die Grundgesamtheit ist; – die Anchoring-Heuristik (s. u.); – die Simulationsheuristik: Urteile werden dadurch geprägt, dass man sich bestimmte Ergebnisse von Ereignissen besser vorstellen (mental simulieren) kann; – die Affekt-Heuristik: Hier orientiert sich die subjektive Wahrscheinlichkeit von Ereignissen an der abgerufenen affektiven Bewertung (z. B. Plous 1993, Fiedler 1996, S. 150 f., Tversky / Kahneman 1974, Slovic et al. 2002, Finucane et al. 2000).

Einen für die Erklärung der Urteilsbildung gegenüber Markenallianzen besonders relevanten Zugang stellt die Anchoring-Heuristik dar (Redler 2003, Esch / Redler 2005). Nach den Aussagen der Anchoring-Heuristik werden Urteile unter Unsicherheit gebildet, indem ein Hinweisreiz als Ausgangspunkt für das Urteil herangezogen (Anker) und dieses dann nach oben oder unten adjustiert wird (Tversky / Kahneman 1974, S. 1128). Es handelt sich um die Assimilation von Schätzungen an einen Vergleichsstandard (Mussweiler / Strack 1999, S. 137). Diese Konzeption ist für Markenallianzen deshalb von besonderem Interesse, weil in ihr explizit zwei Werte zu einem Urteil integriert werden. In Anwendung dieses Modells lässt sich das Urteil zur Markenallianz aus dem schon existenten Urteilswissen zu den beteiligten Marken erklären. Demnach kann man den Urteilsbildungsprozess wie folgt beschreiben: Zunächst wird das Urteil zu einer Marke abgerufen und als vorläufiger Ankerwert übernommen. Anschließend wird das Urteil zur zweiten Marke berücksichtigt und das temporäre Urteil in dessen Richtung adjustiert, bis ein akzeptabler Wert erreicht ist. Dadurch entsteht das endgültige Urteil als ein Integrationsergebnis aus den Urteilen zu den beteiligten Marken (Abbildung 2). Die Bewertung der Markenallianz ergibt sich als ein gewichteter Durchschnitt aus den Bewertungen zu den einzelnen Marken, wobei dieses Urteil in die Richtung der Ankermarke verzerrt ist.

Zur „Rationalität“ der Urteilsbildung

151

Wahrnehmung der Markenallianz und Orientierung über die Urteilsdimension i und die Elemente der Markenallianz

Wahl einer Marke als Ankermarke

Übernahme des Urteils zur Ankermarke auf der Urteilsdimension i als vorläufiges Urteil zur Markenallianz auf der Urteilsdimension i

Anpassen des Urteils in Richtung der anderen beteiligten Marke

Bildung des endgültigen Urteils zur Markenallianz auf der Urteilsdimension i

Quelle: Redler 2003, S. 110.

Abbildung 2: Makromodell zur Beschreibung des Anchoringeffektes bei der Urteilsbildung gegenüber Markenallianzen

In diesem Makro-Modell werden allerdings die hinter den Heuristiken stehenden, vollautomatisch ablaufenden Verarbeitungsprozesse nicht konkretisiert (Redler 2003). Es stellt eher eine nachträgliche Phänomenerklärung dar. So ist bei Anwendung dieses Modells erst retrospektiv erkennbar, in Richtung welcher Marke die Verzerrung stattfindet. Ein solches Makromodell hat daher im Zusammenhang mit Markenallianzen nur geringen diagnostischen und prognostischen Wert. Insofern ist eine Mikro-Fundierung anzustreben (Redler 2003, Esch / Redler, 2005). Dieses ist auf der Basis des kognitiven Modells SARA (Selective Activation, Reconstruction, and Anchoring) von Pohl und Eisenhauer (1997) möglich, das vollautomatische Prozesse der Ankerreizkodierung sowie die Generierung und Rekonstruktion von Schätzungen betrachtet, um Anchoringphänomene zu erklären.

152

Franz-Rudolf Esch, Jörn Redler und Tobias Langner

II. Erklärung von Urteilsverzerrungen bei der Urteilsbildung zu Markenallianzen durch das SARA-Modell 1. Aufbau des Prozessmodells SARA Das Prozessmodell SARA baut auf Überlegungen zum assoziativen Gedächtnismodell SAM von Raijmakers und Shiffrin (1982) auf. Dessen Architektur besteht aus einer Menge von Informationseinheiten im Langzeitgedächtnis (Images), die durch Abrufhinweise (Cues) aktiviert werden. Über den erfolgreichen Abruf von Informationen ins Arbeitsgedächtnis entscheidet ein jeweils vorliegendes Muster assoziativer Verknüpfungen zwischen den Cues und den Images. Diese Assoziationen werden durch Lern- und Vergessensprozesse verändert. Nach diesem Modell entstehen die Verzerrungseffekte beim Anchoring auf Grund einer selektiven Aktivierung bestimmter Informationen von pro Person und Item postulierten Wissensinhalten (Pohl et al. 2000, S. 79, Pohl et al. 2003). Ankereffekte sind somit das Ergebnis einer selektiven Aktivierung, eines verzerrten Informationsabrufs oder von beidem. In dem Prozessmodell SARA wird zwischen einem Langzeitgedächtnis, in dem alle Informationen gespeichert sind, und einem Arbeitsgedächtnis, in welchem erfolgreich abgerufene oder enkodierte Informationen weiterverarbeitet werden, unterschieden (Pohl et al. 2000, S. 80, Pohl et al. 2003). Die Kapazität des Langzeitgedächnisses gilt als unbeschränkt und das darin enthaltene Wissen ist nach semantischer Ähnlichkeit organisiert. Das Arbeitsgedächtnis hat hingegen eine auf wenige Einheiten beschränkte Kapazität. Die zeitliche Reihenfolge des Eintreffens von Informationen wird zusätzlich berücksichtigt. Den im Arbeitsgedächtnis zum jeweiligen Zeitpunkt vorhandenen Hinweisreizen (Cues) kommt eine wichtige Rolle für Suchprozesse im Langzeitgedächtnis zu. Sie können aus externen oder internen (aus abgerufenen Images) Quellen stammen (Pohl et al. 2000, S. 80, Pohl et al. 2003), also beispielsweise dadurch, dass man an den Marlboro-Cowboy denkt oder die typische Marlboro-Verpackung vor Augen hat. Urteilsaufgaben sind mit einer variablen Zahl von Images verknüpft, die das Image-Set bilden. Die in einem Image-Set enthaltenen Images sind assoziativ verbunden, wobei sich die Stärke der Assoziation nach der Ähnlichkeit der Elemente richtet (Pohl et al. 2000, S. 80, Pohl et al. 2003). Jeder Cue eines Image-Sets ist mit allen Images verknüpft, beeinflusst also die Organisation des Image-Sets und dadurch auch die Resultate nachfolgender Verarbeitungsprozesse (Pohl et al. 2000, S. 80, Pohl et al. 2003). Die Assoziationsstärken können sich verändern. Je stärker ein Cue mit einem Image verbunden ist, desto größer ist die Abrufwahrscheinlichkeit des Images durch den Cue im Vergleich zu anderen Images. Zwischen den Image-Sets einer Person können zudem Überschneidungen vorliegen (Pohl et al. 2000, S. 80, Pohl et al. 2003). Demnach würden bei Milka die Abrufwahrscheinlichkeiten des Markenimages größer sein, wenn man die lila Kuh oder

Zur „Rationalität“ der Urteilsbildung

153

die Farbe Lila als Hinweisreiz verwenden würde, als wenn man nur von „zarter Versuchung“ sprechen würde. Durch zyklische Such- und Abrufprozesse (Sampling) werden Informationen (sequenziell) aus dem Langzeitgedächtnis für das Arbeitsgedächtnis bereitgestellt. Dies ist bei der Enkodierung von Reizen oder Aufgaben der Fall. Überwiegend wird nur eine Auswahl potenziell nutzbarer Einheiten verwendet (Pohl et al. 2000, S. 80, Pohl et al. 2003). Die Zahl der Sampling-Durchgänge variiert intra- und interpersonell. Einfluss darauf nimmt die angestrebte Verarbeitungstiefe, die Motivation und die verfügbare Zeit (Pohl et al. 2000, S. 81; Pohl et al. 2003). Je größer die Zahl der Sampling-Zyklen, desto stärker verändert sich die Assoziationsstruktur des Image-Sets. Zentrale Bedeutung für das Sampling haben die vorhandenen Cues. Die Abrufwahrscheinlichkeit eines Images wird durch seine Gesamtaktivierung determiniert, die sich als Produkt aller Assoziationen dieses Images zu den gegebenen Cues ergibt. Nur wenn die Gesamtaktivierung eines Images relativ hoch ist, kann es aufgefunden werden. Zu einem Abruf dieses Images kommt es jedoch nur, wenn die Gesamtaktivierung auch absolut hoch ist, also eine definierte Abrufschwelle überschreitet (Pohl et al. 2000, S. 81, Pohl et al. 2003). Mit dem Abruf eines Images in das Arbeitsgedächtnis wird es automatisch zu einem weiteren Cue für die mit ihm assoziierten Images des Image-Sets. Dadurch bedingt verändern sich die Abrufwahrscheinlichkeiten der übrigen Images (Pohl et al. 2000, S. 81, Pohl et al. 2003). Das abgerufene Image besitzt eine relativ höhere Assoziationsstärke zu den ihm ähnlichen (nahestehenden) Images. Diese werden daher beim nächsten Sampling-Durchgang bevorzugt gefunden und abgerufen (Pohl et al. 2000, S. 81, Pohl et al. 2003). Da sich die Gesamtaktivierung eines Images als Produkt aller Assoziationsstärken ergibt, verringert sich der potenzielle Einfluss von abgerufenen Images auf das weitere Sampling mit der Anzahl der aktiven Cues im Arbeitsgedächtnis. Somit hat das erste Image den stärksten Einfluss, nachfolgend abgerufene Images einen immer geringeren (Pohl et al. 2000, S. 81). Die Assoziationsstärken im Image-Set werden durch den Abruf von Images erhöht. Dies geht mit der Reorganisation des Netzwerks durch den Sampling-Prozess einher. Für diejenigen Images, die sich gemeinsam im Arbeitsgedächtnis befinden, verändert sich also die Assoziationsstärkematrix (Pohl et al. 2000, S. 81). Mit jedem Sampling-Zyklus erhöhen sich die Assoziationsstärken zwischen den Images oder zwischen ihnen und sonstigen Cues um einen bestimmten Betrag (Pohl et al. 2000, S. 81). Wenn eines dieser Images in späteren Sampling-Prozessen gefunden und abgerufen wird, dann führt die höhere Assoziationsstärke aufgrund höherer Gesamtaktivierungen zu einem bevorzugten Abruf dieser Images. Dadurch werden Image-Konstellationen und neue Zusammenhänge gelernt. Diese Bevorzugung durch eine erhöhte Aktivierungsstärke und damit der Auffindewahrscheinlichkeit wird bei SARA als selektive Aktivierung bezeichnet (Pohl

154

Franz-Rudolf Esch, Jörn Redler und Tobias Langner

et al. 2000, S. 81, Pohl et al. 2003). Sie erklärt im Wesentlichen die verzerrende Wirkung bei Anchoringphänomenen.

2. Prozessablauf bei SARA Die Darbietung einer Urteilsaufgabe und eines Urteilsobjektes löst einen Prozess aus, der in einem Urteil mündet. Zunächst gelangen dazu die Aufgabe und das Objekt als Cues ins Arbeitsgedächtnis. Diese sind mit einer Zahl von Images des Langzeitgedächtnisses verbunden, mit jeweils unterschiedlichen Assoziationsstärken. Durch Sampling werden dann in mehreren Schritten Images ins Arbeitsgedächtnis geholt. Die Abrufwahrscheinlichkeit eines Images steigt mit der Gesamtaktivierung. Mit dem Sampling gehen Veränderungen in der Assoziationsstärkematrix einher. Die Images, die gemeinsam im Arbeitsgedächtnis sind, werden entsprechend der Verweildauer stärker miteinander assoziiert. Die Inhalte der ins Arbeitsgedächtnis gerufenen Images werden auf einer internen numerischen Skala abgebildet und dann in eine (erste) Schätzung integriert. Diese Schätzung geht als neues Image in das Image-Set ein, wobei (nach dem Prinzip der Ähnlichkeit) Assoziationen zu allen Images aufgebaut werden. Anschließend setzt ein Retentionsintervall (Vergessen) ein. (I) Fall ohne Anker I1

I2

I3

I4

I5

I6

I7

I8

I9

Images interne numerische Skala für Urteilsdimension i

Integration Schätzwert für die Urteilsdimension i S (II) Fall mit Anker I1

I2

I3

I4

I5

I6

I7

I8

I9

A

Images interne numerische Skala für Urteilsdimension i

Integration Schätzwert für die Urteilsdimension i S

E1

Quelle: Redler 2003, S. 104.

Abbildung 3: Schematische Abbildung der Prozesse bei der Ankerenkodierung

Zur „Rationalität“ der Urteilsbildung

155

Wird die Urteilsaufgabe unter Einwirkung eines Ankers vorgenommen, so werden dabei folgende zusätzliche Zusammenhänge bedeutsam: Die Darbietung des Ankers führt bei SARA zu einer Enkodierung des Ankers. Dadurch fungieren dann sowohl das Urteilsobjekt, die Urteilsaufgabe als auch der Anker als gemeinsame Cues im Arbeitsgedächtnis. Gleichzeitig zur Urteilsbildung wird die Wissensbasis abgesucht, um den Anker zu enkodieren. Die Enkodierung des Ankers erfolgt dadurch, dass im Langzeitgedächtnis durch Sampling ähnliche Informationen gefunden und mit dem Cue verknüpft werden. Die vorhandenen Cues bestimmen die Gesamtaktivierung der Images und damit deren Abrufwahrscheinlichkeit. Die dem Anker nahe liegenden Images haben wegen der stärkeren Assoziation zum Anker eine erhöhte Abrufwahrscheinlichkeit. Somit gelangen diese eher ins Arbeitsgedächtnis. Durch den Aufenthalt im Arbeitsgedächtnis steigen die Assoziationsstärken untereinander sowie zu den Cues an. Dadurch kommt es zu einer selektiven Aktivierung von Images, die dem Anker nahe stehen. Letztlich wird der Anker mit einer hohen Assoziationsstärke zur Urteilsaufgabe in das Image-Set übernommen. Wird nun die endgültige Schätzung vorgenommen, so wird auf dieses derart umorganisierte Wissen zurückgegriffen. Die bei der Ankerkodierung selektiv aktivierten Images sowie der enkodierte Anker selbst haben dabei eine erhöhte Wahrscheinlichkeit, abgerufen zu werden. Als Ergebnis der Integrationsprozesse ist das Urteil dann in Richtung des Ankers verzerrt. Schematisch gesehen kann die Entstehung der Urteilsverzerrung anhand der Abbildung 3 veranschaulicht werden. In (I) ist ein hypothetischer Fall ohne Ankereinwirkung dargestellt. Hier werden die durch den Sampling-Prozess abgerufenen Images auf einer internen numerischen Skala eingeordnet und diese Werte dann für die Urteilsaufgabe zu einem Wert S integriert. Wird nun die Enkodierung des Ankerreizes berücksichtigt, so resultiert der unter (II) dargestellte Fall. Durch die Enkodierung des Ankers werden beim Sampling bevorzugt Images abgerufen, die dem Anker ähnlich sind. Diese werden daher auch verstärkt bei der Urteilsintegration berücksichtigt. Entsprechend ergibt sich ein Urteilswert E1 , der im Vergleich zum hypothetischen Wert S in die Richtung des enkodierten Ankers verzerrt ist. Die simultane Wirkung mehrerer Anker ist in diesem Ansatz noch vergleichsweise wenig untersucht und modelliert. Pohl et al. (2003) berichten allerdings von Experimenten, bei denen im Rückschaufehlerdesign zwei Anker symmetrisch um die Originalschätzung angeordnet wurden. Im Ergebnis waren die erinnerten Schätzungen dann nicht verzerrt. Es kommt scheinbar zu einer Art Neutralisierung. Zudem beschreiben Pohl et al. (2003) einen Gesamteffekt der Ankerwirkungen, welcher der Wirkung eines hypothetischen mittleren Ankers entspricht. Dies gelte für den Fall, dass beide Anker auf der gleichen Seite im Vergleich zur Schätzung lägen, sie symmetrisch um die Schätzung angeordnet seien oder mehrere Anker benutzt würden. Die Lagen der Ankerwerte zeigen einen linearen Zusammenhang zu den Ankereffekten (Pohl 1996b). Effekte mehrfacher Anker können daher perfekt durch die Wirkung eines Ankers, der den Mittelwert der mehrfachen Ankerwerte darstellt, vorhergesagt werden (Pohl 1995, 1996b, Pohl et al. 2003). Diese

156

Franz-Rudolf Esch, Jörn Redler und Tobias Langner

Zusammenhänge werden bei Markenallianzen, bei denen zwei Marken als relevante Anker fungieren, bedeutsam.

III. Transfer der Erkenntnisse auf die Urteilsbildung bei Markenallianzen Annahme zur generellen Urteilsverzerrung: In Anwendung der Aussagen der Anchoring-Heuristik wird davon ausgegangen, dass der Urteilswert zur Markenallianz auf einer Urteilsdimension i in Richtung des Urteils einer der beteiligten Marken verzerrt ist. Wie die Ausführungen verdeutlicht haben, ist die Richtung der Urteilsverzerrung durch die konkrete Charakteristik der internen Anker, also der Marken, bedingt. Diese wiederum können aus verhaltenswissenschaftlicher Sicht nach bestimmten Kriterien beschrieben werden. Annahme zum Einfluss der Markenbekanntheit auf die Urteilsverzerrung: Wichtige Kriterien sind dabei zunächst die Markenbekanntheit und die gelernte Wissensstruktur zur Marke (Esch 2005, Keller 1993). Da die Images einer Marke mit hoher Bekanntheit besonders stark an den Marken-Cue angebunden sind, können diese aufgrund der hohen (Gesamt-)Assoziationsstärke leicht abgerufen werden. In die Urteilsintegration zu einer Markenallianz fließen diese somit auf Grund der selektiven Aktivierung dieser Images stärker ein. Daher wird angenommen, dass die Beurteilung einer Markenallianz aus zwei Marken mit unterschiedlicher Bekanntheit in Richtung des Urteils der bekannteren Marke verzerrt ist. Annahme zum Einfluss des Markenwissens (Markenimage) auf die Urteilsverzerrung: Eine zentrale Rolle bei der Urteilsbildung kommt den Wissensstrukturen zu den Marken zu. Diese spiegelt sich im Image-Set zu einer Marke wider und determiniert, wie viele Images mit der Marke assoziiert und wie hoch die Assoziationsstärken sind. Dies korrespondiert mit der Schemastärke von Marken (Esch 2005, S. 74). Da aus einem Image-Set vorrangig die Images selektiv aktiviert werden, die über die relativ höchsten Gesamtassoziationsstärken verfügen, ist anzunehmen, dass es sich dabei um Images handelt, die stärker mit einem der MarkenCues verbunden sind. Es resultiert eine vergleichsweise stärkere selektive Aktivierung von Images, die zu einer stärkeren Marke gehören. Daher ist zu erwarten, dass die Beurteilung einer Markenallianz aus zwei Marken mit unterschiedlich starken Wissensstrukturen in Richtung des Urteils zu der Marke verzerrt ist, zu der ausgeprägtere Wissensstrukturen vorliegen. Annahme zum Einfluss des Produktkategoriefits auf die Urteilsverzerrung: Bei Vorgabe einer Produktkategorie für die Markenallianz wirkt die Produktkategorie wie ein zu sätzlicher Cue im Arbeitsgedächtnis (Redler 2003). Da die Images nach den Annahmen von SARA entsprechend ihrer Ähnlichkeit organisiert sind, liegen die Images zu einer Marke mit einem hohen Produktkategoriefit näher an denen der Kategorie als die einer Marke mit geringem Kategoriefit. Erstere sind daher untereinander stärker assoziiert. Images, die besonders stark mit der Kategorie und

Zur „Rationalität“ der Urteilsbildung

157

der Marke verbunden sind, verfügen über eine im Vergleich höhere Gesamtaktivierung und werden daher vorrangig abgerufen. Es kommt zu einer selektiven Aktivierung von Images, die eng mit einer oder beiden Marken und der Kategorie verknüpft sind. Sind die Marken unterschiedlich ähnlich zur Kategorie, wird deshalb die Schätzung in Richtung des Urteils zu der Marke verzerrt, die die höhere Ähnlichkeit zur Kategorie aufweist. Es ist demnach zu erwarten, dass die Beurteilung einer Markenallianz in Richtung des Urteils zu der Marke verzerrt ist, die die höhere wahrgenommenen Nähe zur Produktkategorie aufweist (Produkt-Fit), in der sich die Markenallianz betätigen wird. Annahme zum Einfluss der Kommunikation auf die Urteilsverzerrung: Schließlich spielen neben den intern abrufbaren Reizen auch extern abrufbare Reize eine wichtige Rolle. Demnach sollte es möglich sein, das Urteil zu einer Markenallianz kommunikativ zu beeinflussen. Dies wäre dadurch möglich, dass man eine Marke in der Kommunikation dominant als Kopf der Markenallianz darstellt, während die andere Marke untergeordnet dargestellt wird. Durch die unterschiedlich dominante Kommunikation der an der Markenallianz beteiligten Marken ist ein Reihenfolgeeffekt beim Eintritt von Cues in das Arbeitsgedächtnis zu erwarten. Dadurch erhält die Marke, die als erster Cue in das Arbeitsgedächtnis gelangt, eine größere Bedeutung als die nachfolgende Marke. Somit müsste das Urteil der Markenallianz in Richtung der dominant kommunizierten Marke verzerrt sein.

C. Studien zu Ankereffekten bei der Urteilsbildung gegenüber Markenallianzen I. Überblick über die Studienreihe Die oben dargestellten Annahmen auf Basis der theoretischen Vorüberlegungen wurden in einer Studienreihe überprüft. Allen Studien waren folgende Überlegungen gemein: Ankereffekte äußern sich als Urteilsverzerrungen in Richtung eines Ankerwertes (z. B. Plous 1993, Mussweiler et al. 2000). In Bezug auf Markenallianzen bedeutet dies, dass das Urteil zu einer der beteiligten Marken einen derartigen Anker für das Urteil zur Markenallianz darstellen kann. Messzugang: Erfassung der Urteilsverzerrung durch Abstandsmessung zwischen der Markenallianz und den beteiligten Marken Messtheoretisch gesehen können Urteilsverzerrungen dadurch erfasst werden, dass ein Vergleich der Abstände zwischen den Urteilen zur Markenkombination und zu den einzelnen Marken vorgenommen wird: Sind die Abstände zwischen dem Urteil zur Markenallianz und dem Urteil zu einer der beteiligten Marken, d. h. in eine Richtung, konsistent geringer, ist die Existenz eines Ankerphänomens zu Gunsten dieser Marke anzunehmen. Verteilen sich diese Verzerrungen allerdings

158

Franz-Rudolf Esch, Jörn Redler und Tobias Langner

eher zufällig auf beide Richtungen, kann keine der Marken als Anker für das Urteil zur Markenallianz angesehen werden. Um die relevanten Abstände zwischen den Urteilswerten zu bestimmen, wurden sowohl die Urteile zur Markenallianz als auch zu den einzelnen Marken durch betragsmäßige Subtraktion ermittelt. Dies setzt die Erfassung der Urteile der gleichen Person zu den verschiedenen Objekten voraus. Die Erfassung der Abstände zwischen den Urteilen erfolgte in der Studienreihe durch die Skala zur Messung der Markenpersönlichkeit (Aaker 1997). Über alle Items des Messinstruments wurden die Abweichungsquadratsummen zwischen den Urteilen zur fiktiven Markenallianz und denen zu den beiden Marken berechnet. Die Quadratur der Abweichungen hat dabei den Effekt, dass eine Gleichrichtung erfolgt und zudem stärkere Abweichungen auch stärker gewichtet werden. Damit verwandt ist das Distanzmaß D (Globaldistanz) (Osgood et al. 1957, Cronbach / Gleser 1953). Es drückt die lineare Distanz zwischen zwei Bewertungen aus und berücksichtigt sowohl die Profilvariationen als auch die Mittelwertunterschiede der Profile. Mathematisch gesehen handelt es sich bei D um die Wurzel aus der Abweichungsquadratsumme. Weiterhin wird zur Beurteilung der Ähnlichkeit der relevanten Item-Profile die Q-Korrelation nach Hofstätter (1966, S. 258 ff.) herangezogen. Sie beschreibt anhand eines Koeffizienten Q, der zwischen den Grenzen ‡1,00 (maximale Ähnlichkeit) und 1,00 (Gegensätzlichkeit) liegt, wie ähnlich sich zwei Profile verhalten. Schriftliche Erhebung der Einflussfaktoren in getrennten Studien Alle Urteile wurden in Form schriftlicher Befragungen erhoben. Die Erhebungen wurden in einen anderen Untersuchungszusammenhang gestellt, um eine Sensibilisierung für den eigentlichen Untersuchungszweck zu vermeiden. Die Fragebögen waren in drei Blöcke gegliedert. Ein Block enthielt die Urteilsabfragen zur relevanten Markenallianz, die beiden anderen Blöcke die zu den beteiligten Marken. Zwischen den Urteilsabfragen wurden verschiedene filler tasks eingesetzt, die inhaltlich auf den vorgetäuschten Untersuchungsgegenstand abgestimmt waren. Die verwendeten fiktiven Markenallianzen stellten die Stimuli zur Manipula-tion der Untersuchungsbedingungen dar. Diese wurden in einer standardisierten Schriftart und -größe dargeboten. Entsprechend wurden die Markennamen bei der Abfrage der Urteile zu den einzelnen Marken gestaltet. Für jeden Einflussfaktor wurde jeweils eine eigene Studie durchgeführt. In diesen wurde durch eine entsprechende Wahl der zu beurteilenden Markenallianz die relevante zu untersuchende Variable manipuliert, während andere Größen möglichst konstant blieben.

Zur „Rationalität“ der Urteilsbildung

159

II. Wirkung der Markenbekanntheit auf die Urteilsverzerrung bei Markenallianzen Vorstudie zur Ermittlung von Marken mit hoher und niedriger Markenbekanntheit: Zur Ermittlung geeigneter Marken mit hoher und niedriger Bekanntheit zur Analyse des Einflusses der Markenbekanntheit auf die Urteilsverzerrung wurden in einer Vorstudie 20 Zahnpastamarken hinsichtlich ihrer aktiven und passiven Bekanntheit anhand von 34 Studierenden im Alter von 19 bis 38 Jahren der JustusLiebig-Universität Gießen untersucht. Die gewonnenen Daten wurden nach Topof-Mind-Awareness, Recall und Recognition ausgewertet. Im Ergebnis zeigte sich Colgate als bekannteste Marke. Weiterhin wurden die Marken Sensodyne und Signal als geeignete Marken mit geringer Bekanntheit identifiziert. Sie verfügen über geringe Top-of-Mind- und Recall-Werte, wiesen aber eine hohe Recognition auf, was im Hinblick auf die Response für die Hauptstudie bedeutsam ist. Zudem waren bei diesen beiden Marken die Parameter relativ identisch ausgeprägt. Auf Grundlage dieser Ergebnisse wurden die Markenallianzen Colgate Signal (Gruppe 1: bekannt-unbekannt) und Signal Sensodyne (Gruppe 2: unbekannt-unbekannt) als Stimuli für die weiteren Untersuchungen ausgewählt.

4,00

3,50

3,00

2,50

zäh

naturverbunden

weiblich

charmant

vornehm

zuversichtlich

erfolgreich

zuverlässig

unabhängig

jung

ursprünglich

ehrlich

bodenständig

1,50

modisch

2,00

Abbildung 4: Markenpersönlichkeitsprofile für Colgate Signal, Colgate und Signal

Hauptstudie zur Analyse von Urteilsverzerrungen durch die Markenbekanntheit: Für die anschließende Hauptstudie wurde im Dezember 2001 eine Stichprobe von 80 Studierenden an der Justus-Liebig-Universität Gießen und an der Philipps-Uni-

160

Franz-Rudolf Esch, Jörn Redler und Tobias Langner

versität Marburg schriftlich befragt. 58,75 Prozent der Befragten waren weiblich. Die Probanden wurden zufällig auf die zwei Untersuchungsgruppen aufgeteilt. Ergebnisse zur Markenbekanntheit: Die Itemmittelwerte in Gruppe 1 (bekannte Marke Colgate – unbekannte Marke Signal) zeigen deutlich, dass die Werte für die Markenallianz Colgate Signal in der Mehrzahl näher an den Werten von Colgate liegen als an den Werten von Signal. Dies ergibt sich auch aus den Verläufen der Profile (Abbildung 4). Wie sehr sich in dieser Untersuchungsbedingung die Beurteilung der Markenallianz an der stärkeren Marke Colgate ausrichtet, belegen folgende Parameter: Die Abweichungsquadratsumme zwischen den Profilen der Markenallianz und Signal ist mit X ˆ 2; 74 deutlich höher als die zwischen den Profilen der Markenallianz und Colgate mit X = 0,45. Die resultierenden Globaldistanzen betragen D ˆ 1; 66 (Colgate Signal / Signal) und D ˆ 0; 67 (Colgate Signal / Colgate). Zudem korreliert das Profil der Markenallianz stärker mit dem von Colgate (q ˆ 0; 97; die Korrelation ist auf dem Niveau von ˆ 0; 01 (2-seitig) signifikant) als mit dem von Signal (q ˆ 0; 68; die Korrelation ist auf dem Niveau von ˆ 0; 01 (2-seitig) signifikant).

4,00

3,50

3,00

2,50

2,00

zäh

naturverbunden

weiblich

charmant

vornehm

zuversichtlich

erfolgreich

zuverlässig

unabhängig

jung

modisch

ursprünglich

ehrlich

bodenständig

1,50

Abbildung 5: Markenpersönlichkeitsprofile bei Signal Sensodyne, Signal und Sensodyne

Bei der Betrachtung der Itemmittelwerte in der Gruppe 2 (unbekannte Marke Signal – unbekannte Marke Sensodyne) ist das Bild hingegen uneinheitlich. Bei sieben Items ist ein geringerer Abstand zwischen den Werten zur Markenallianz

Zur „Rationalität“ der Urteilsbildung

161

und denen von Sensodyne zu verzeichnen, bei sechs Items ist der Abstand zwischen den Urteilen zur Markenallianz und Signal geringer. Es ist festzustellen, dass es keine eindeutige Orientierungstendenz gibt. Auch die Itemprofile zeigen dies deutlich: Sie verlaufen nahezu deckungsgleich (Abbildung 5). Die Globaldistanzen zwischen den Profilen liegen nahe beieinander. Für den Vergleich des Profils der Markenallianz mit dem von Signal erhält man D ˆ 0; 65, während sie für den Vergleich des Profils der Markenallianz mit dem von Sensodyne einen Wert von D ˆ 0; 74 annimmt. Die Abweichungsquadratsummen zwischen den Profilen der Markenallianz und Signal (X ˆ 0; 43) und zwischen der Markenallianz und Sensodyne (X ˆ 0; 55) sind ähnlich hoch. Sehr hohe und fast identische Q-Korrelationen der Profile bringt die Ähnlichkeitsanalyse hervor. Sie betragen q ˆ 0; 95 (Signal Sensodyne / Signal) und q ˆ 0; 94 (Signal Sensodyne / Sensodyne). Beide sind auf dem Niveau von ˆ 0; 01 (2-seitig) signifikant. Diese Befunde stützen die Annahme, dass die Beurteilung einer Markenallianz in die Richtung der Marke verzerrt ist, die über die höhere Bekanntheit verfügt.

III. Wirkung der Schemastärke der Marken auf die Urteilsverzerrung von Markenallianzen Vorstudie zur Identifikation von Marken mit unterschiedlicher Schemastärke: In dieser Teilstudie wurden zwei Marken einer Produktkategorie identifiziert, die sich signifikant in ihrer Schemastärke unterscheiden (eine Marke mit einer hohen und eine mit einer geringen Schemastärke). Dazu wurden Marken aus der Kategorie Tafelschokolade betrachtet. Elf zu dieser Kategorie gehörige Marken wurden zunächst anhand von Expertenurteilen hinsichtlich der Schemastärke bewertet. Die Marken Zetti und Hachez erwiesen sich dabei als die am schwächsten eingeordneten Marken, Milka und Ritter Sport als die Marken mit der höchsten Schemastärke. Dieser Befund wurde anhand einer zusätzlichen Erhebung validiert. Dabei wurden für die vorausgewählten Marken Indikatoren für die Schemastärke sowie Bekanntheitswerte erfasst. Mittels Fragebögen wurde dazu im August 2001 auf dem Campus der Justus-Liebig-Universität Gießen eine Stichprobe von 40 Personen befragt. Die Probanden waren im Durchschnitt 25,65 Jahre alt. Die Geschlechter waren zu gleichen Teilen vertreten. 72,50 Prozent der Befragten waren Studierende. Die Abfolge der Marken wurde so variiert, dass sich zwei Fragebogenversionen ergaben. Je Fragebogenversion wurden zwei Marken hinsichtlich der Stärke des inneren Bildes sowie der Assoziationsstrukturen (offene Instruktion) betrachtet. Operationalisiert wurde die Schemastärke durch die Vividness des inneren Markenbildes, die Anzahl der Markenassoziationen, den Anteil positiver Assoziationen an allen Assoziationen, den Anteil emotionaler Assoziationen an allen Assoziationen sowie den Anteil nonverbaler Assoziationen an allen Assoziationen: Nonverbal, insbesondere bildlich repräsentierte Informationen sind leichter abrufbar und verhaltensrelevanter als verbal repräsentierte (Esch 2001, S. 134 ff.). Ein 11 FS Kaas

162

Franz-Rudolf Esch, Jörn Redler und Tobias Langner

hoher Anteil nonverbal repräsentierter Assoziationen deutet daher auf ein starkes Markenschema hin. Zur Auswertung der Assoziationsstrukturen wurden die von den Probanden genannten Assoziationen pro Marke von fünf unabhängigen Ratern markenweise danach kodiert, ob es sich um positive, emotionale und / oder nonverbale Nennungen handelte. Die erhobenen Daten zur Markenstärke bestätigten die Auswahl: Milka und Ritter Sport schnitten bei den Indikatoren zur Markenschemastärke deutlich besser ab als die Marken Hachez und Zetti (Redler 2003). Als fiktive Markenkombination für die Hauptstudie wurden daher Milka Ritter Sport und Milka Hachez ausgewählt. Hauptstudie zum Einfluss der Schemastärke auf die Urteilsverzerrung: In der Hauptstudie wurden Urteilswerte zu den fiktiven Markenallianzen sowie zu den beteiligten Marken erhoben. Es wurden zwei Gruppen gebildet: In Gruppe 1 wurde die Markenallianz mit unterschiedlich starken Markenschemata verwendet, in Gruppe 2 die Markenallianz mit gleich starken Marken. Die schriftliche Befragung fand an der Justus-Liebig-Universität Gießen statt. Die Stichprobe bestand pro Untersuchungsgruppe aus 40 Personen. In Gruppe 1 (Milka Hachez) waren 60 Prozent weiblich und 97,5 Prozent Studierende. In Gruppe 2 (Milka Ritter Sport) waren 45 Prozent weiblich und 75 Prozent Studierende. Das Durchschnittsalter lag in Gruppe 1 bei 23,85 und in Gruppe 2 bei 24,10 Jahren. Ergebnisse zur Markenschemastärke: Der Vergleich der Itemmittelwerte für die Beurteilung der Markenallianz und der einzelnen Marken zeigt, dass die Differenzen zwischen den Itemwerten zur Markenallianz in der Bedingung einer Marke mit starkem Markenschema (Milka) und einer mit schwachem Markenschema (Hachez) in der überwiegenden Zahl geringere Abstände zur Marke Milka aufweisen als zur Marke Hachez. Dieser Befund wird anhand der in Abbildung 6 wiedergegebenen Itemprofile sichtbar. Die Profile der Markenallianz Milka Hachez und von der Marke Milka verlaufen nahezu deckungsgleich, während das Profil der Marke Hachez einen deutlich anderen Verlauf nimmt. Die Abweichungsquadratsumme zwischen dem Profil der Markenallianz und dem von Hachez ist mit X ˆ 19; 49 deutlich höher als die zwischen dem Profil der Markenallianz und dem von Milka mit X ˆ 0; 72. Die Globaldistanzen berechnen sich zu D ˆ 4; 41 (Milka Hachez / Hachez) und D ˆ 0; 85 (Milka Hachez / Milka). Das Profil der Markenallianz korreliert nahezu vollständig in positiver Richtung mit dem von Milka (q ˆ 0; 98; die Korrelation ist auf dem Niveau von ˆ 0; 01 (2-seitig) signifikant). Zwischen dem Profil der Markenallianz und dem Profil von Hachez lässt sich keine signifikante Korrelation nachweisen. Vergleicht man die Itemmittelwerte der Urteile in der Versuchsbedingung mit zwei Marken mit ähnlicher Schemastärke, zeigt sich ein uneinheitliches Bild. Bei acht der Items sind die Abstände zwischen den Werten für die Markenallianz und für Ritter Sport geringer; in fünf Fällen sind die Abstände zwischen den Werten für die Markenallianz und für Milka geringer.

Zur „Rationalität“ der Urteilsbildung

163

7,00 6,00 5,00 4,00 3,00

freundlich-unfreundlich

nüchtern-heiter

exklusiv-alltäglich

dunkel-hell

innovativ-konservativ

erwachsen-kindlich

familiär-singlehaft

ausländisch-deutsch

sortenreich-sortenarm

klein-groß

natürlich-künstlich

traditionell-modern

städtisch-ländlich

zart-kräftig

1,00

gemütlich-hektisch

2,00

Abbildung 6: Markenpersönlichkeitsprofile für Milka Hachez, Milka und Hachez

Dementsprechend ergibt sich auch aus der Betrachtung der Profilverläufe kein homogenes Ergebnis (Abbildung 7). Die Abweichungsquadratsumme zwischen den Profilen der Markenallianz und Milka (X ˆ 4; 88) sowie die Abweichungsquadratsumme zwischen Markenallianz und Ritter Sport (X ˆ 5; 43) sind nicht signifikant verschieden. Die Werte für die Gobaldistanzen lassen mit D ˆ 2; 21 (Markenallianz und Milka) und D ˆ 2; 33 (Markenallianz und Ritter Sport) fast keinen Unterschied in den relativen Abständen der Profile erkennen. Auch die Q-Korrelationen der Profile sind nahezu identisch (q ˆ 0; 75 und q ˆ 0; 72). Beide sind auf dem Niveau von ˆ 0; 01 (2-seitig) signifikant. Die Ergebnisse bestätigen die Annahme, dass sich die Beurteilung einer Markenallianz an der Marke orientiert, die über das stärkere Markenschema verfügt.

11*

164

Franz-Rudolf Esch, Jörn Redler und Tobias Langner

7,00 6,00 5,00

4,00 3,00

freundlich-unfreundlich

nüchtern-heiter

exklusiv-alltäglich

dunkel-hell

innovativ-konservativ

erwachsen-kindlich

familiär-singlehaft

ausländisch-deutsch

sortenreich-sortenarm

klein-groß

natürlich-künstlich

traditionell-modern

städtisch-ländlich

zart-kräftig

1,00

gemütlich-hektisch

2,00

Abbildung 7: Markenpersönlichkeitsprofile für Milka Ritter Sport, Milka und Ritter Sport

IV. Wirkung des Kategoriefits auf die Urteilsverzerrung von Markenallianzen Zur Ermittlung von Marken mit unterschiedlichem Kategoriefit konnte auf vorhandene Studienergebnisse von Redler und Esch (2001) zurückgegriffen werden: In ihr wurden Assoziationsstrukturen zu Marken und zur Produktkategorie Waschmittel danach ausgewertet, wie stark eine Überlappung von Inhalten besteht. Dabei zeigte sich Frosch als eine Marke mit geringer Anbindung an die Produktkategorie Waschmittel, wohingegen die Marke Vizir eine sehr starke Anbindung an diese Kategorie aufweist. Auf der Grundlage dieser Befunde war es möglich, in Bezug auf die Produktkategorie Waschmittel eine fiktive Markenallianz Frosch Vizir zu bilden, bei der davon auszugehen war, dass jeweils eine Marke mit hohem und mit geringem Fit zur Kategorie Waschmittel enthalten ist. Vizir als Marke mit einem hohem Kategoriefit sollte einen Ankereffekt auslösen. In der Studie wurden insgesamt 62 Personen befragt. Das Durchschnittsalter der Stichprobe betrug 25,27 Jahre, wobei 66 Prozent Studierende waren. 67 Prozent der Befragten waren weiblich. Die Datenerhebung erfolgte im August 2001 an der Justus-Liebig-Universität Gießen.

Zur „Rationalität“ der Urteilsbildung

165

Die Mittelwerte der gemessenen Items lassen erkennen, dass die Mehrheit der Urteile für die Markenallianz Frosch Vizir näher an den Urteilswerten für Vizir liegen als an denen für Frosch (Abbildung 8).

5,00 4,50 4,00 3,50 3,00

zäh

charmant

vornehm

zuverlässig

erfolgreich

phantasievoll

modern

bodenständig

ehrlich

2,00

heiter

2,50

Abbildung 8: Markenpersönlichkeitsprofile für Frosch Vizir, Frosch und Vizir

Die Profilverläufe in Abbildung 8 verdeutlichen den Tatbestand. Hier wird sichtbar, wie sich in dieser Bedingung die Beurteilung der Markenkombination stärker an Vizir als an Frosch orientiert. Die Abweichungsquadratsumme zwischen dem Profil der Markenallianz und dem von Vizir ist mit X ˆ 0; 23 deutlich geringer als die zwischen dem Profil der Markenallianz und dem Profil von Frosch mit X ˆ 1; 67. Entsprechend resultieren Globaldistanzen von D ˆ 0; 48 (Frosch-Vizir / Vizir) und D ˆ 1; 29 (Frosch Vizir / Frosch). Der Verlauf des Markenallianz-Profils korreliert zudem stärker mit dem von Vizir (q ˆ 0; 92) als mit dem von Frosch (q ˆ 0; 77†. Die Korrelationen sind auf dem Niveau 0,01 (zweiseitig) statistisch signifikant. Anhand dieser Befunde ist davon auszugehen, dass bei der Urteilsbildung eine Orientierung an der Marke stattfindet, die den besseren Fit zur Kategorie aufweist. Die Forschungshypothese kann auf der Grundlage dieser Daten angenommen werden. V. Wirkung der Kommunikation auf die Urteilsverzerrung von Markenallianzen Um den Einfluss der Kommunikation auf die Urteilsverzerrung bei Markenallianzen zu testen, wurde eine fiktive Markenallianz für Milka und Uncle Ben’s für die Produktkategorie Frühstücksflocken gebildet. Für diese Markenallianz wur-

166

Franz-Rudolf Esch, Jörn Redler und Tobias Langner

den im Rahmen der kommunikativen Umsetzung zwei Verpackungsvarianten entwickelt: – eine Milka-typische Verpackung, die durch die Farbe Lila und den typischen Milka-Schriftzug geprägt war, der deutlich größer dargestellt wurde als der Uncle Ben’s Schriftzug, und – eine Uncle Ben’s-typische Verpackung, die durch die typische Farbe Orange und den Uncle Ben’s Schriftzug geprägt war, der deutlich größer dargestellt wurde als der Milka Schriftzug.

In einem Pretest mit 40 Probanden wurde sichergestellt, dass die Verpackungen die gewünschten Wirkungen erzielten. Bei der Milka-typischen Verpackung dachten 82 % der Befragten zuerst an Milka, bei der Uncle Ben’s typischen Verpackung dachten 77, 5 % zuerst an Uncle Ben’s.

7,00 6,50 6,00 5,50 5,00 4,50 4,00 3,50 3,00

warm

pikant

aus Reis

amerikanisch

eine zarte Versuchung

lila

die Welt der Alp en

fein körnig und locker

orange

natürlich

1,50 1,00

cremig

2,50 2,00

Abbildung 9: Urteilsbildung bei dominanter Uncle-Ben’s Verpackung

Die Hauptstudie erfolgte mit 80 Probanden an der Justus-Liebig-Universität Gießen. Die Probanden wurden zufällig auf die zwei Untersuchungsgruppen (Gruppe 1: Uncle Ben’s dominant, Gruppe 2: Milka dominant) verteilt. Im Ergebnis zeigt sich, dass sich in der Versuchsbedingung 1 die Beurteilung der Markenallianz stark an die Beurteilung von Uncle Ben’s anlehnt (Abbildung 9). Die Abweichungsquadratsumme zwischen den Profilen der Markenallianz und Milka ist mit X ˆ 80; 05 deutlich höher als die zwischen der Markenallianz und Uncle Ben’s mit X ˆ 13; 79. Entsprechend fällt die Globaldistanz für den Vergleich der Profile

Zur „Rationalität“ der Urteilsbildung

167

von Milka und der Markenallianz höher aus (D ˆ 8; 95) als die für den Vergleich der Markenallianz zu Uncle Ben’s (D ˆ 3; 71). Beide Korrelationen sind auf dem 5 %-Niveau signifikant (zweiseitig). In der Versuchsbedingung 2 lehnte sich die Beurteilung der Markenallianz hingegen stark an die Beurteilung von Milka an (Abbildung 10). Die Abweichungsquadratsumme zwischen den Profilen der Markenallianz und Milka ist mit X ˆ 6; 62 deutlich geringer als die zwischen der Markenallianz und Uncle Ben’s mit X ˆ 61; 94. Entsprechend fällt die Globaldistanz für den Vergleich der Profile von Milka und der Markenallianz niedriger aus (D ˆ 2; 57) als die für den Vergleich der Markenallianz zu Uncle Ben’s (D ˆ 7; 87). Beide Korrelationen sind auf dem 1 %-Niveau signifikant (zweiseitig). Diese Ergebnisse bestätigen die Annahme, dass durch die Kommunikation der Markenallianz die Urteilsbildung beeinflusst werden kann.

6,50 6,00 5,50 5,00 4,50 4,00 3,50 3,00 2,50 2,00 1,50

warm

pik ant

aus Reis

amerikanisch

cremig

eine zarte Versuchung

lila

die Welt der Alpen

feinkörnig und locker

orange

natürlic h

1,00

Abbildung 10 : Urteilsbildung bei dominanter Milka-Verpackung

In Zusammenfassung der Befunde wird damit auch die Annahme gestützt, dass bei der Urteilsbildung gegenüber Markenallianzen Ankereffekte auftreten.

VI. Diskussion der Studienergebnisse Die Studien belegen, dass die Beurteilung von Markenallianzen durch die Urteile der Konsumenten gegenüber den beteiligten Marken beeinflusst wird. Insgesamt

168

Franz-Rudolf Esch, Jörn Redler und Tobias Langner

wurden starke Ankereffekte bei der Urteilsbildung gegenüber Markenallianzen nachgewiesen. Die Urteilsbildung gegenüber Markenallianzen kann demnach durch ein ankerbasiertes Modell erfasst werden. Die Existenz auftretender Verzerrungen bei der Urteilsbildung gegenüber Markenallianzen konnte eindeutig belegt werden. Einen wesentlichen Einfluss auf die Ankerbildung üben die Faktoren Markenbekanntheit, verhaltenswissenschaftliche Markenstärke, Fit zur Produktkategorie sowie die kommunikative Umsetzung als Determinanten für die Richtung der auftretenden Urteilsverzerrungen aus. Wichtige Ableitungen über die Richtung der auftretenden Urteilsverzerrungen bei der Urteilsbildung gegenüber Markenallianzen werden damit möglich. Über einige Beschränkungen der Studien sollte dennoch nicht hinweggesehen werden. Einschränkungen der Generalisierbarkeit der Befunde ergeben sich zunächst aus den Involvementbedingungen. Die Studien wurden so konzipiert, dass die Probanden möglichst wenig für den Untersuchungszweck sensibilisiert wurden. Dadurch wurde vermieden, dass sich die Aufmerksamkeit der Probanden besonders auf den Untersuchungsgegenstand richtet. Jedoch ist auf Grund der Befragungssituation das situative Involvement der Probanden erhöht und entspricht daher tendenziell nicht dem sehr geringen Involvement von Konsumenten – wie beispielsweise beim Kauf von Konsumgütern. Herausforderungen für weitere Untersuchungen bestehen demnach darin, die Urteilsbildung unter möglichst realen Bedingungen zu untersuchen. Einige wichtige Aspekte betreffen auch das Untersuchungsdesign. In der Studienreihe wurde pro Teilstudie jeweils der Einfluss eines Faktors analysiert. Dazu wurde stets nur ein Faktor bei Konstanz anderer Einflussgrößen variiert, weil sich Effekte nur unter dieser Bedingung eindeutig auf den betrachteten Faktor zurückführen lassen. Auf diese Weise konnten die Einflüsse anhand der Empirie deutlich herausgearbeitet werden. Aufbauend auf diesen Ergebnissen sind weitere, multivariat aufgebaute Untersuchungen wünschenswert, um die Interaktion der Faktoren erkennbar zu machen. Bei der Transformation der Modellsprache in eine adäquate Messsprache stellten die Operationalisierungen besondere Herausforderungen dar. Die unabhängigen Variablen wurden dabei nicht direkt, sondern indirekt durch die Verwendung spezieller Repräsentanten als Untersuchungsstimuli (z. B. Milka als starke und Hachez als schwache Marke) operationalisiert. Wie die Ergebnisse belegen, scheint dadurch eine wirkungsvolle Manipulation erfolgt zu sein. Jedoch könnte die Tatsache, dass in der Mehrzahl pro Faktor nur ein Stimulus herangezogen wurde, restriktiv auf die Generalisierbarkeit der Befunde wirken. Daher sind auch hier weitere Untersuchungen mit anderen Repräsentanten bzw. weiteren Markenallianzen oder alternativen Operationalisierungen wünschenswert. Ein einschränkender Einfluss könnte weiterhin in der rein verbalen Stimulusdarbietung gesehen werden. Insofern wäre es zu begrüßen, wenn die Ergebnisse in zukünftigen Untersuchungen, bei denen Markenwissen durch Reize anderer Modalitäten evoziert wird, repliziert werden könnten.

Zur „Rationalität“ der Urteilsbildung

169

D. Implikation für die Marketingforschung und das Management Markenallianzen sind ein praktisch bedeutsames, aber wissenschaftlich wenig beachtetes Phänomen. Um diese Diskrepanz zu verringern, wurde ein Kernaspekt der konsumentenbezogenen Analyse, die Urteilsbildung gegenüber Markenallianzen, genauer untersucht. Aufgrund ihrer herausragenden Rolle standen dabei heuristische Urteilsprozesse im Vordergrund. Der theoretische Ansatz, der aufbauend auf Erkenntnissen zum Anker-Phänomen entwickelt wurde, erklärt die Urteilsbildung zu Markenallianzen aus den Urteilen, die Konsumenten zu den an einer Markenallianz beteiligten Marken bilden. Auf dieser Grundlage sind wichtige Prognosen über die Ausbildung von Urteilen gegenüber Markenallianzen möglich. Empirische Ergebnisse aus der Studienreihe bestätigen deutlich, dass – explizite oder implizite – Urteile zu Markenallianzen auf der Basis der Urteile zu den beteiligten Marken entstehen, wobei signifikante Ankereffekte zu verzeichnen sind. Die Untersuchungsergebnisse belegen, dass die Ankereffekte durch die relativen Markenstärken, die relative Bekanntheit der Marken sowie den Fit der Marken zum Betätigungsfeld der Markenallianz beeinflusst werden. Daraus ergeben sich wichtige wissenschaftliche und praktische Implikationen. Aus wissenschaftlicher Sicht erlaubt der theoretische Ansatz eine neue Perspektive auf Markenallianzen: Zentrale Ausschnitte der inneren Abläufe, die dem Verhalten von Konsumenten gegenüber Markenallianzen zu Grunde liegen, werden beschrieben und prognostiziert. Prozesse der Urteilsbildung, die auf dem Wissen zu zwei unterschiedlichen, aber kombinierten Marken beruhen, werden mit Hilfe des Zugangs erstmals modelliert und empirisch geprüft. Die Ankermethode eignet sich zudem auch sehr gut für andere Forschungsfelder, so etwa im Bereich der Markenarchitekturen. Weiterer Untersuchungsbedarf ergibt sich vor allem aus der Frage nach dem Ausmaß der auftretenden Verzerrung, um eine Vorhersage darüber, zu welchen Anteilen die Urteile zu den Einzelmarken in das Urteil zur Markenallianz einfließen, zu ermöglichen. Diesbezüglich wäre die Bestimmung und Kalibrierung eines Mittelwertmodells eine wichtige Weiterentwicklung. Auf der Basis der entwickelten Zusammenhänge könnten zudem weitere Aspekte der Urteils-, aber auch der Einstellungsbildung, beleuchtet werden. Dies kann u. a. durch die Aufnahme weiterer Faktoren, insbesondere auch emotionaler Wirkgrößen, sowie durch die Vernetzung von Faktoren erfolgen. Die Eruierung von Interaktionen einzelner Faktoren sowie die Identifikation von Moderator- und Mediator-Rollen wäre erstrebenswert. Deutlicher Forschungsbedarf ist zudem hinsichtlich des Rückwärtstransfers zu sehen, also einer Erörterung der Frage, wie sich die Einstellung zu Markenallianzen auf die Einstellung der an der Allianz beteiligten Marken auswirkt. Aus Managementsicht ist zunächst festzuhalten, dass strategische Entscheidungen darüber, welche Marken wie miteinander verbunden werden, starke Auswirkungen auf die Urteile der Konsumenten gegenüber der Markenallianz haben. Das unterstreicht die Aussage, dass derartige Entscheidungen einer gründlichen Fun-

170

Franz-Rudolf Esch, Jörn Redler und Tobias Langner

dierung bedürfen (Esch / Redler 2005). Dass die Beurteilung einer Markenallianz offenbar zunächst auf der Basis des Markenwissens zu den an der Markenallianz beteiligten Marken erfolgt, kann bei der Gestaltung von Markenallianzen direkt nutzbar gemacht werden. Die Konsumentenbeurteilung von neuen Markenallianzen kann den Befunden zufolge bereits durch die Ausgestaltung der Allianz an sich direkt gesteuert werden. Ein gezielter Rückgriff auf die Faktoren Produktkategoriefit, Markenbekanntheit und Markenschemastärke kann somit in hohem Maße beeinflussen, wie das Urteil ausfällt. Darüber hinaus kann man auch durch die kommunikative Gestaltung die Urteilsbildung beeinflussen, so dass sich daraus ein großer Handlungsspielraum für Marken ergibt.

Literatur Aaker, David A. (1996): Building Strong Brands Aaker, Jennifer L. (1997): Dimensions of Brand Personality, in: Journal of Marketing Research, Vol. 34, S. 347 – 356 Ambler, Tim / Stins, John / Bräutigam, Sven / Rose, Steven / Swithenby, Stephen (2002): Salience and Choice: Neural Correlates of shopping decisions, Working paper No. 01 – 902, Center for Marketing, London Business School Assael, Henry (1995): Consumer Behavior and Marketing Action Baumgarth, Carsten (2003): Wirkungen des Co-Brandings: Erkenntnisse durch Mastertechnikpluralismus Bengtsson, Anders (2002): Consumers and Mixed-Brands – On the Polysemy of Brand Meaning, Dissertation Lund University Bettman, James R. (1979): An information Processing Theory of Consumer Choice Bettman, James R. / Luce, Mary F. / Payne, John W. (1998): Constructive Consumer Choice Processes, in: Journal of Consumer Research, Vol. 25, S. 187 – 217 Bierhoff, Hans Werner (1998): Sozialpsychologie: Ein Lehrbuch, 4. Aufl. Bösel, Rainer M. (2001): Denken Brandner, Sylvia / Kompa, Ain / Peltzer, Ulf (1989): Denken und Problemlösen: Eine Einführung in die kognitive Psychologie Brehm, Sharon S. / Kassin, Saul M. / Fein, Steven (2002): Social Psychology Cegarra, Jean-Jack / Michel, Géraldine (2000): Co-branding: Clarification du concept et proposition d’un modèle d’evaluation, XVI Congrès de l’Association Française du Marketing, Montréal, Mai 2000; Papier de Recherche 2000.02 du GREGOR, IAE de Paris Craik, Fergus I. / Lockhart, Robert S. (1972): Levels of Processing: A Framework for Memory Search, in: Journal of Verbal Learning and Verbal Behavior, Vol. 11, S. 671 – 684 Cronbach, Lee J. / Gleser, Goldine C. (1953): Assessing Similarity between Profiles, in: Psychological Bulletin, Vol. 50, S. 456 – 473 Damasio, Antonio R. (1994): Descartes’ Error: Emotion, Reason and the Human Brain

Zur „Rationalität“ der Urteilsbildung

171

De Chernatony, Leslie / McDonald, Malcolm (1998): Creating Powerful Brands De Chernatony, Leslie / Riley, Dall’Olmo (1998): Defining A Brand: Beyond the Literature With Experts’ Interpretations, in: Journal of Marketing Management, Vol. 14, S. 417 – 443 Esch, Franz-Rudolf (2001): Wirkung integrierter Kommunikation, 3. Aufl. – (2005): Strategie und Technik der Markenführung, 3. Aufl. Esch, Franz-Rudolf / Fuchs, Marcus / Bräutigam, Sören / Redler, Jörn (2001): Konzeption und Umsetzung von Markenerweiterungen, in: Esch, Franz-Rudolf (Hrsg.), Moderne Markenführung, 3. Aufl., S. 755 – 791 Esch, Franz-Rudolf / Möll, Thorsten (2004): Mensch und Marke – Neuromarketing als Zugang zur Erfassung der Wirkung von Marken, in: Gröppel-Klein, Andrea (Hrsg.), Konsumentenverhaltensforschung im 21. Jahrhundert, S. 67 – 98 Esch, Franz-Rudolf / Redler, Jörn (2003): Markenallianzen bilden, in: Esch, Franz-Rudolf / Tomczak, Torsten / Langner, Tobias / Kernstock, Joachim (Hrsg.), Corporate Brand Management Esch, Franz-Rudolf / Redler, Jörn (2005): Anchoringeffekte bei der Urteilsbildung gegenüber Markenallianzen: Die Bedeutung von Markenbekanntheit, Markenimage und Produktkategoriefit, in: Marketing ZFP (im Druck) Fiedler, Klaus (1996): Processing Social Information for Judgements and Decisions, in: Hewstone, Miles / Stroebe, Wolfgang / Stephenson, Geoffrey M. (Hrsg.), Introduction to Social Psychology – A European Perspective, S. 135 – 166 Finucane, Melissa L. / Alhakami, Ali / Slovic, Paul / Johnson, Stephen M (2000): The Affect Heuristic in Judgements of Risks and Benefits, in: Journal of Behavioral Decision-Making, Vol. 13, S. 1 – 17 Franzen, Giep / Bouwman, Margot (2001): The Mental World of Brands – Mind, Memory and Brand Success Hofstätter, Peter R. (1966): Einführung in die Sozialpsychologie Jeck-Schlottmann, Gabi (1988): Anzeigenbetrachtung bei geringem Involvement, in: Marketing ZFP, Nr. 1, S. 33 – 43 Kaas, Klaus (1982): Consumer Habit Forming, Information Acquisition, and Buying Behavior, in: Journal of Business Research, Vol. 10, S. 3 – 15 – (1990): Langfristige Werbewirkung und Brand Equity. In: Werbeforschung & Praxis, 35. Jg., Heft 3, S. 48 – 52 Kahneman, Daniel / Tversky, Amos (1982): The Simulation Heuristic, in: Kahneman, Daniel / Slovic, Paul / Tversky, Amos (Hrsg.), Judgment under Uncertainty: Heuristics and Biases, S. 201 – 210 Kenning, Peter / Plassmann, Hilke / Deppe, Michael / Kugel, Harald / Schwindt, Wolfram (2003): Die Entdeckung der kortikalen Entlastung, Neuroökonomische Forschungsberichte – Teilgebiet Neuromarketing, Nr. 1 Keller, Kevin L. (1993): Conceptualizing, Measuring, and Managing Customer-Based Brand Equity, in: Journal of Marketing, Vol. 57, S. 1 – 22 – (2003): Strategic Brand Management, 2. Aufl.

172

Franz-Rudolf Esch, Jörn Redler und Tobias Langner

Kroeber-Riel, Werner / Esch, Franz-Rudolf (2004): Strategie und Technik der Werbung, 6. Aufl. Kroeber-Riel, Werner / Weinberg, Peter (2003): Konsumentenverhalten, 8. Aufl. Levin, Irwin P. / Levin, Aron M. (2000): Modelling the Role of Brand Alliances in the Assimilation of Product Evaluations, in: Journal of Consumer Psychology, Vol. 9, S. 43 – 52 Mittal, Banwari (1989): A Theoretical Analysis of two Recent Measures of Involvement, in: Advances in Consumer Research, Vol. 16, S. 679 – 702 Mussweiler, Thomas / Strack, Fritz (1999): Hypothesis-Consistent Testing and Semantic Priming in the Anchoring-Paradigm: A Selective Accessibility Model, in: Journal of Experimental Social Psychology, Vol. 35, S. 136 – 164 Mussweiler, Thomas / Strack, Fritz / Pfeiffer, Tim (2000): Overcoming the Inevitable Anchoring Effect: Considering the Opposite Compensates for Selective Accessibility, in: Personality and Social Psychology Bulletin, Vol. 26, S. 1142 – 1150 Olson, Jerry C. (1980): Encoding Processes: Levels of Processing and Existing Knowledge Structures, in: Olson, Jerry C. (Hrsg.), Advances in Consumer Research, Vol. 7, S. 267 – 286 Osgood, Charles E. / Suci, George J. / Tannenbaum, Percy H. (1957): The Measurement of Meaning Park, C. Whan / Jun, Sung Y. / Shocker, Allan D. (1996): Composite Branding Alliances: An Investigation of Extension and Feedback Effects, in: Journal of Marketing Research, Vol. 33, S. 453 – 466 Perrig, Walter / Wippich, Werner / Perrig-Chiello, Pasqualina (1993): Unbewußte Informationsverarbeitung Petty, Richard E. / Cacioppo, John T. (1986): Communication and Persuasion: Central and Peripheral Routes to Attitude Change Plous, Scott (1993): The Psychology of Judgment and Decision Making Pohl, Rüdiger (1995): Quantifying the Impact of Single and Double Anchors in a HindsightBias Paradigm, Paper präsentiert auf der SPUDM-15 (Subjective Probability, Utility, and Decision Making), Jerusalem / Israel – (1996a): Der Rückschaufehler – eine systematische Verfälschung der Erinnerung, in: Report Psychologie, Vol. 21, S. 596 – 609 – (1996b): Effects of Multiple Anchors on Judgment and Recall. Vortrag, 9th Congress of the European Society for Cognitive Psychology, Würzburg – (1998): The Effects of Feedback Source and Plausibility on Hindsight Bias, in: European Journal of Cognitive Psychology, Vol. 10, S. 191 – 212 Pohl, Rüdiger / Eisenhauer, Markus (1997): Ein kognitives Prozessmodell zur Erklärung systematisch verzerrter Urteile und Erinnerungen, in: Mandl, Heinz (Hrsg.), Bericht über den 40. Kongreß der Deutschen Gesellschaft für Psychologie in München 1996, Göttingen, S. 807 – 812 Pohl, Rüdiger / Eisenhauer, Markus / Hardt, Oliver (2003): SARA – A Cognitive Process Model to Simulate the Anchoring Effect and Hindsight Bias, in: Memory, Vol. 11, S. 337 – 356

Zur „Rationalität“ der Urteilsbildung

173

Pohl, Rüdiger / Hardt, Oliver / Eisenhauer, Markus (2000): SARA – Ein kognitives Prozessmodell zur Erklärung von Ankereffekt und Rückschaufehler, in: Kognitionswissenschaft, Vol. 9, S. 77 – 92 Raaij, W. Fred van (1988): Information Processing and Decision Making, in: Raaij, W. Fred van / Veldhoven, Gary M. van / Wärneryd, Karl E. (Hrsg.), Handbook of Economic Psychology, S. 74 – 106 Raijmakers, J. G. W. / Shiffrin, Richard M.(1982): SAM: A Theory of Probabilistic Search of Associative Memory, in: Bower, G. H. (Hrsg.), The Psychology of Learning and Motivation, Vol. 14, S. 207 – 262 Rao, Akshay R. / Qu, Lu / Ruekert, Robert W. (1999): Signalling Unobservable Product Quality Through A Brand Ally, in: Journal of Marketing Research, Vol. 36, S. 258 – 268 Redler, Jörn (2003): Management von Markenallianzen – eine Analyse unter besonderer Berücksichtigung der Urteilsbildung, Dissertation, Justus-Liebig-Universität Gießen Redler, Jörn / Esch, Franz-Rudolf (2001): Die Produkt- / Markenschema-Matrix zur Abschätzung des Erweiterungspotenzials von Marken, Arbeitspapier Nr. 2 des Instituts für Markenund Kommunikationsforschung an der Justus-Liebig-Universität Gießen Ruge, Hans-Dieter (1988): Die Messung bildhafter Konsumerlebnisse Simonin, Bernardine L. / Ruth, Julie A. (1998): Is a Company Known by the Company It Keeps? Assessing the Spillover Effects of Brand Alliances on Consumer Brand Attitudes, in: Journal of Marketing Research, Vol. 35, S. 30 – 42 Slovic, Paul / Finucane, Melissa / Peters, Ellen / MacGregor, Donald G. (2002): The Affect Heuristic, in: Gilovich, Thomas / Griffin, Dale / Kahneman, Daniel (Hrsg.), Heuristics and Biases – The Psychology of Intuitive Judgement, S. 397 – 420 Sujan, Mita (1985): Consumer Knowledge: Effects on Evaluation Strategies Mediating Consumer Judgements, in: Journal of Consumer Research, Vol. 12, S. 31 – 46 Switzer, Fred S. / Sniezek, Janet A. (1991): Judgement Processes in Motivation: Anchoring and Adjustment Effects on Judgement and Behavior, in: Organizational Behavior and Human Decision Processes, Vol. 49, S. 208 – 229 Tversky, Amos / Kahneman, Daniel (1974): Judgement under Uncertainty – Heuristics and Biases, in: Science, Vol. 185, S. 1124 – 1130 Washburn, Judith H. / Till, Brian D. / Priluck, Randi (2000): Co-Branding: Brand Equity and Trial Effects, in: Journal of Consumer Marketing, Vol. 17, No. 7, S. 591 – 604 Waters, Kevin (1997): Dual and Extension Branding, Using Research to Guide Design Decisions and Branding Strategy, in: Design Management Journal, Vol. 8, S. 26 – 32 Wilson, Timothy D. / Houston, Christopher E. / Etling, Kathryn M. / Brekke, Nancy (1996): A New Look at Anchoring Effects: Basic Anchoring and Its Antecedents, in: Journal of Experimental Psychology: General, Vol. 4, S. 387 – 402

Conjoint-Analyse von Automobildesign unter Berücksichtigung des hierarchischen Bayes-Verfahrens Bruno Neibecker, Thomas Kohler und David Steenhard

A. Grundlagen und Messung von Designwirkungen I. Produktdesign als Element der Produktpositionierung Im engeren Sinne umfasst das Design „die gesamte sinnlich wahrnehmbare Gestaltung durch Form und Farbe, Geruch, Geschmack und Geräusch“ (Weinberg 2001). Diese Wirkungsvielfalt, als Instrument zur Produktpositionierung eingesetzt, verspricht ein großes Potenzial. Im Produktdesign kann es sowohl zur Differenzierung gegenüber Wettbewerbsprodukten, als auch zur wirkungsvollen Ansprache der anvisierten Zielgruppe beitragen. Der zunehmende Wettbewerbsdruck und die intensive Ansprache von spezifischen Zielgruppen erfordern darüber hinaus immer ausgeklügeltere Positionierungsinhalte, die eine höhere Komplexität bei der Produktgestaltung nach sich ziehen. Beispielsweise reicht auf dem Automobilmarkt der Positionierungsinhalt sportlich längst nicht mehr aus, sondern erfolgt auf dem Niveau inhaltlicher Nuancen wie sportlich-elegant oder elegant-sportlich. Zur Unterstützung von Marketing und Design fehlen Instrumentarien zur Bestimmung der Wirkung verschiedener Gestaltungsalternativen. Kroeber-Riel forderte schon vor rund 20 Jahren die Entwicklung und Anwendung von Sozialtechniken zur Verbesserung der Zielgruppenansprache, insbesondere auch durch emotionales Produktdesign (vgl. Kroeber-Riel 1984). Es existiert jedoch nach wie vor ein Engpass bei der Umsetzung und Messung von Produktdesign (Kohler / Neibecker 2004, Neibecker / Kohler 2004). In diesem Beitrag konzentrieren wir uns auf die Möglichkeiten, wie mit Hilfe von wahlbasierten Entscheidungen aus vollständigen Produktabbildungen der Wirkungsbeitrag von Designelementen zur konkreten Positionierung gemessen und analysiert werden kann. Auf diese Weise erzielt man eine ganzheitliche Bewertung von visuellen Vorlagen. Neu und bislang wenig erforscht ist der Einsatz einstellungsbezogener, konkreter Attribute als Auswahlkriterium. Statistische Verfahren ermöglichen neuerdings die Berechnung individueller Nutzenwerte, so dass konsumentenorientierte Designwirkungen, in Bezug auf Kon-

176

Bruno Neibecker, Thomas Kohler und David Steenhard

zepte wie Sportlichkeit oder Eleganz, in den relevanten Zielgruppen nachweisbar sind. Erfreulicherweise erzielen diese individuellen Nutzenwerte vergleichbar gute Prognosewerte und bestätigen damit die „Validität“ dieser neuen Analyseme-thoden. II. Gestaltungsmittel und Formparameter für das Automobildesign Technologische Neuerungen wie auch Bedürfnisverschiebungen auf Seiten der Konsumenten wirken sich unmittelbar auf die Gestaltung von Automobilen aus. Dabei muss das Design auch gewandelten Konsumentenansprüchen hinsichtlich der Emotionalität nachkommen. Zum einen bringt der technische Fortschritt kontinuierlich neue Funktionen zum Vorschein (z. B. Kopfairbags), die in das Design eines Fahrzeugs integriert werden müssen. Zum anderen wird die Arbeit des Designs auch durch neue Technologien in der Entwicklung und Fertigung beeinflusst (z. B. neue Materialien). Aus diesen Gründen können auch die Rahmenbedingungen und Trends in der Automobilindustrie zum Verständnis des Automobildesigns nicht außer Acht gelassen werden. Dem Designer stehen als originäre Gestaltungsmittel Stoff (Material), Form und Farbe zur Verfügung. Im Automobildesign kommt der Form die größte Bedeutung zu, da das Material weitgehend feststeht (Blech, Kunststoff, Chrom usw.) und die Farbe durch Lackierung ohne große Einschränkungen geändert werden kann. Formen werden mit den Parametern Proportion, Größe, Kontur und Struktur beschrieben. Dabei werden die Formproportion, -größe und -kontur auch als die äußere Struktur eines Körpers bezeichnet, während man den Aufbau innerhalb einer Form als Formstruktur bezeichnet (Stark 1996). Abbildung 1 verdeutlicht die Formparameter am Beispiel der schematischen Darstellung eines Automobils. Die Formkontur, also der Umriss eines Körpers, ist bereits aus größerer Entfernung erkennbar und kann damit erheblich zur visuellen Differenzierbarkeit von Produkten beitragen. Bei der Gestaltung der Formkontur konzentrieren sich die Maßnahmen auf die Übergänge von zwei Flächen ein und desselben Körpers oder bei zusammengesetzten Körpern auf deren Verbindungsstellen. Um wirksamen Körpern Eigenständigkeit und Ausdruck zu verleihen, werden häufig Einschnürungen, Sicken oder Ausbuchtungen eingefügt. Bei Automobilen ist die Formkontur eng mit dem Fahrzeugkonzept und der -kategorie verbunden. So unterscheiden sich beispielsweise Kombis von Limousinen visuell maßgeblich in der Ausgestaltung der Heckpartie und damit in ihrer Formkontur. Die Formproportion gibt das Verhältnis der Seiten einer Fläche zueinander an. Die Analyse von Formproportionen beschränkt sich allerdings nicht nur auf Längenverhältnisse. Gerade bei der Betrachtung von größeren Körpern, die aus mehreren Elementen zusammengesetzt sind, gewinnen die Größenverhältnisse von Teilflächen oder -volumina an Bedeutung. Die Formproportionen von Flächen und

Conjoint-Analyse von Automobildesign

177

Volumina spielen bei der Erscheinung und Wirkung von Automobilen eine erhebliche Rolle. Grundlegende Proportionen eines Automobils werden beispielsweise durch das Verhältnis von Radstand zu Gesamtlänge des Fahrzeugs oder die Größe der Räder im Verhältnis zur Seitenfläche bestimmt.

Abbildung 1: Formparameter von Körpern, verdeutlicht am Automobil (erweitert in Anlehnung an Koppelmann 1997, S. 356)

Während die Formproportion die relativen Größenverhältnisse von Formen bezeichnet, richtet sich das Augenmerk bei der Formdimension auf die absoluten Größenabmessungen. Die Dimensionierung eines Produktes wird in erster Linie durch technische, funktionale und ergonomische Anforderungen bestimmt. So orientiert sich die Größe eines Autos unter anderem am Fahrzeugkonzept, an der Anzahl der Passagiere und dem notwendigen Laderaum. Die Formstruktur beschreibt das Zusammenwirken verschiedener Formelemente wie Linien und (Teil-)Flächen innerhalb der Formkontur. Die Struktur unterschiedlicher Teilelemente einer Form können dabei entweder betont (z. B. durch kontrastreiche Farbgebung) oder durch unauffällige Elementübergänge zu einer Gesamtheit verbunden werden. Im Automobildesign wird die Formstruktur in erster Linie vom Verlauf der Fugen für Türen, Motorhaube und Heckklappe sowie den Fensterlinien bestimmt. Darüber hinaus kommt der Ausführung und Einpassung von Produktteilen wie 12 FS Kaas

178

Bruno Neibecker, Thomas Kohler und David Steenhard

Front- und Heckleuchten, Kühlergrill oder Türgriff ein wesentlicher Beitrag zu. Neben den genannten rein funktionalen Aspekten finden sich in aller Regel jedoch auch strukturierende Elemente, die mehrheitlich ästhetisch motiviert sind, wie zum Beispiel Sicken auf der Motorhaube und Fahrzeugseite oder Schweller. Bei der Durchführung von Facelifts im Rahmen der Modellpflege wird versucht, mit möglichst einfachen und kostengünstigen Maßnahmen die Wirkung des Fahrzeugs sichtbar zu verjüngen und moderner erscheinen zu lassen. Dabei beschränken sich die Eingriffe am Design in der Regel auf die Formstruktur, indem einzelne Elemente (z. B. Stoßfänger, Front- und Heckleuchten) modifiziert werden.

III. Designphasen in der Automobilindustrie Das Design beginnt in der frühen Phase mit Entwürfen von Designkonzepten jeweils für das Interieur und Exterieur (Gessner 2001). Ziel dieser Phase ist die Findung von geeigneten Designthemen und den grundlegenden Proportionen für das neue Fahrzeug. Im Zuge der Ausarbeitung verschiedener Designkonzepte reift eine Designidee heran. Am Ende der Designfindung erfolgt die Auswahl eines Konzepts und das Projekt kann in die nächste Phase übergehen. Inhalt der Designumsetzungsphase ist die Darstellung der Designidee am Fahrzeug und seine Detaillierung. Zur Verbreiterung der Entscheidungsbasis werden dazu im Sinne eines Wettbewerbs Entwürfe von mehreren Designern verfolgt und mit Claymodellen (engl. Clay für Ton oder Plastilin) dargestellt. In einem mehrstufigen Go / No-Go-Prozess verringert sich sukzessive die Anzahl der Entwürfe, bis schließlich ein Modell, das zukünftige Fahrzeugdesign, feststeht. Ab diesem Zeitpunkt richten sich alle Bemühungen nur noch auf den Siegerentwurf und die Designumsetzungsphase wie auch die frühe Phase sind abgeschlossen. Das Modell wird zur geometrischen und fertigungstechnischen Integration vollständig in CADSystemen abgebildet. Es kommt schließlich zum Design- und Packagefreeze wonach keine weiteren Formänderungen vorgenommen werden dürfen. Diese Ausführungen verdeutlichen, dass Ergebnisse aus Marktforschungsstudien zum Design eines Neufahrzeugs nach dem Ende des Designfinish, d. h. zum Designfreeze, auf das Design keinen weitreichenden Einfluss nehmen können, bestenfalls kosmetische Veränderungen sind noch möglich. In der Designfindungsphase wird zwar Input aus den verschiedensten Richtungen dringend benötigt, jedoch weisen die Designthemen und -entwürfe noch einen unzureichenden Reifegrad auf, um sie als Stimuli zu Marktforschungszwecken einzusetzen. Es muss aber das Ziel der Marktforschung sein, möglichst frühzeitig im Prozess der Designentstehung mit belastbaren Ergebnissen einen Beitrag für kundenorientierte und zukunftsfähige Designideen zu leisten.

Conjoint-Analyse von Automobildesign

179

IV. Wirkungsmessung von Design Der Wahrnehmungsprozess erfolgt in zwei aufeinander folgenden Prozessen: der Musteranalyse und der Objekterkennung (Behrens 2001). In der Musteranalyse werden geometrische Figuren identifiziert, z. B. Linien und Bögen. Bei der Objekterkennung werden charakteristische Merkmale wahrgenommen, die zu Gestalten integriert und durch weitere Informationen stärker differenziert werden. Jede Wahrnehmung eines Produktes bzw. Reizes wird ferner vom Umfeld des Reizes mitbestimmt, den Kontextwirkungen (Kroeber-Riel / Weinberg 2003, Neibecker 1990). Man kann davon ausgehen, dass die Wahrnehmung und Bewertung von Produktdesign im Allgemeinen und von Automobildesign im Besonderen ganzheitlich erfolgt und insofern gestaltpsychologische Erkenntnisse relevant sind. Der Conjoint-Ansatz mit der Bewertung vollständiger Produktpofile und die anschließende Zerlegung in Teilpräferenzen (Luce / Tukey 1964, Green / DeSarbo 1978) kommt der Forderung der Gestaltpsychologie nach einer holistischen Wahrnehmung und Beurteilung von Produktdesign entgegen. Aus diesem Grund wird die Conjoint-Analyse von verschiedenen Autoren als aussichtsreiches Verfahren zur Untersuchung von Produktdesign und der Messung von Designwirkungen eingestuft (Veryzer 1999, Bloch 1995, Green / Srinivasan 1990). Die auswahlbasierte Conjoint-Analyse, auch als Choice-Based-Conjoint (CBC) oder als Discrete-Choice-Analyse bezeichnet, eignet sich für die Wirkungsmessung von Produktdesign in besonderem Maße. Sie gehört heute zu den am häufigsten verwendeten Conjoint-Ansätzen (Hartmann / Sattler 2002). Vor allem die hohen Softwarekosten stehen einer noch weiteren Verbreitung im Wege. Der auswahlbasierten Conjoint-Analyse liegt die stochastische Nutzentheorie zugrunde (McFadden 1974), die einen adäquaten Umgang mit zufälligen Schwankungen der Nutzeneinschätzungen (Hahn 1997) sowie nicht kontrollierbaren Nutzeneffekten erlaubt (Louviere / Hensher / Swait 2000) und zusätzlich die Ermittlung von Interaktionseffekten ermöglicht. Darüber hinaus bietet die CBC Vorteile bei der Datenerhebung, da sie auf kompositionelle Verfahrensschritte oder die Beurteilung von unvollständigen Produktdarstellungen verzichtet und die Auswahlentscheidung als einfachste Form der Präferenzermittlung anwendet. Dies wird durch die Verwendung von Auswahlsets möglich, aus denen jeweils eine Produktbeschreibung im direkten Vergleich mit den anderen Alternativen zu wählen ist. Um keine Auswahlentscheidung zu erzwingen, wird in jedem Auswahlset zusätzlich eine sogenannte No-Choice-Alternative (z. B. „Ich entscheide mich für keine der Alternativen.“) bzw. eine konstante Alternative vorgelegt (Haaijer / Kamakura / Wedel 2001). Die wenigen empirischen Studien, die sich bislang mit den Effekten von Präsentationsformaten, aber auch mit situativen, personenbezogenen Komponenten wie Involvement oder Produktvertrautheit auseinandergesetzt haben, liefern kein einheitliches Bild (Ernst 2001 mit vergleichenden Tabellen, Strebinger et al. 2000). 12*

180

Bruno Neibecker, Thomas Kohler und David Steenhard

Zusammenfassend lässt sich feststellen, dass für Designbeurteilungen visuelle Darstellungen besser abschneiden, realitätsnähere Einschätzungen ermöglichen und Informationsgleichheit zwischen Befragungs- und Kaufsituation fördern. So steigt z. B. die externe Validität auf individueller Ebene belegt durch eine bessere FirstChoice-Hit-Rate. Die Designwirkungen stehen hier im Vordergrund. Deshalb erfolgt eine Fokussierung auf die Wahrnehmungsdimensionen von Produktdesign. In einer OnlineBefragung mit insgesamt 350 Testpersonen und drei Untergruppen wurden verschiedene Skalen zur Messung von „Designdimensionen“ verwendet (Kohler 2003, Neibecker / Kohler 2004). Mit Hilfe von exploratorischen und konfirmatorischen Faktorenanalysen wurden sechs Dimensionen mit 69 % Varianzerklärung extrahiert. Die einzelnen Dimensionen mit Cronbach-Alpha-Reliabilitäten sind: Attraktivität / Gefallen (0,917), Dynamik (0,802), Abwechslung / Einzigartigkeit (0,747), Ästhetik / Eleganz (0,829), Exklusivität / Wertigkeit (0,805) und Innovation (0,823). Aus forschungsökonomischen Gründen konnten für die nachfolgende Conjoint-Untersuchung nur die beiden Dimensionen Dynamik und Ästhetik / Eleganz berücksichtigt werden. Trotz der unbestreitbaren Vorteile und hohen Realitätsnähe der Conjoint-Analyse können verarbeitungsbezogene Unterschiede in den Wahrnehmungsformen nicht unmittelbar erfasst werden. Man unterscheidet zwischen attributiver und funktionaler Wahrnehmung (Behrens 2001). Die attributive Wahrnehmung beinhaltet direkt wahrnehmbare, aber auch abstrakte Eigenschaften wie Formen, Farben, Leistungswerte usw. Die funktionale Wahrnehmung ist die Wahrnehmung von Objekten in einem komplexeren Zusammenhang. Dabei werden z. B. die Funktionen und Verwendungszwecke eines Produktes deutlich, die auch durch Kontextfaktoren beeinflusst werden. So kann eine Alufelge einmal nach der Ästhetik der Form bewertet werden, oder in einen funktionalen Zusammenhang gebracht werden. Dazu ist ein konzeptionelles Produktverständnis erforderlich, so dass kausale Zusammenhänge erkannt werden, z. B. ermöglicht eine Alufelge eine leichtere Radkonstruktion, die einen besseren Bodenkontakt und dadurch sportlicheres Fahren erlaubt. Kaas (1977) hat schon frühzeitig Nutzenmodelle und Präferenzurteile zur Bestimmung von paarweisen Preisresponsefunktionen eingesetzt. Balderjahn (1991) zeigt, wie durch den Einsatz multinomialer Logit-Modelle dieser Ansatz verallgemeinert werden kann. Wir verwenden den Conjoint-Ansatz in einem einstellungstheoretischen Marketingkontext und folgen damit der konstruktiven Zusammenführung von nutzen- und einstellungstheoretischen Ansätzen wozu Trommsdorff (2004) feststellt: „Die in der betriebswirtschaftlich-normativen Entscheidungstheorie üblichen multiattributiven Nutzenmodelle sind kaum von multiattributiven Einstellungsmodellen der Sozialpsychologie und der Marketingforschung zu unterscheiden“.

Conjoint-Analyse von Automobildesign

181

Die Verwendung tatsächlicher, monetärer Anreize, die in ihrer Höhe an das Verhalten geknüpft sind und im Rahmen von ökonomischen Laborexperimenten durch anreizkompatible Untersuchungsbedingungen hergestellt werden, stehen hier nicht im Vordergrund (Schade 2004). Trotzdem sollten Überlegungen nicht grundsätzlich ausgeschlagen werden, auch Conjoint-Experimente zumindest anreizkompatibler zu gestalten. V. Untersuchungsdesign Die inneren Formelemente bestimmen die Formstruktur eines Automobils. Es handelt sich dabei um alle Veränderungen der Form, die innerhalb einer gegebenen Formkontur, Formdimension und Formproportion wirksam werden. Als Designelemente der Formstruktur wurden vier Merkmale variiert, die gemeinsam mit Automobildesignern ausgewählt wurden (Abbildung 2). Das Bildmaterial wurde von einem professionellen Grafikspezialisten in photorealistischer Qualität aufbereitet. Als Ausgangspunkt diente eine unmodifizierte Seitenansicht der BMW 3er Limousine (Modelljahr 2001). Die Bezeichnung der Ausprägungen für jedes Merkmal sind in Tabelle 1 wiedergegeben.

Abbildung 2: Merkmale für die Untersuchung der Formstruktur

Als Basismerkmal wurde die Stoßleiste herangezogen und die konstante Alternative als No-Choice eingefügt (Haaijer / Kamakura / Wedel 2001). Aufgrund der gleichmäßigen Anzahl an Ausprägungsstufen (3  3 und 1  2) ist keine Verzerrung bei der Parameterschätzung durch den Ausprägungsstufeneffekt zu erwarten (Perrey 1996). Insgesamt ergeben alle Merkmale mit ihren Ausprägungen

182

Bruno Neibecker, Thomas Kohler und David Steenhard

54 (ˆ 3  3  3  2) Möglichkeiten. Mit Hilfe des Programmpakets SAS wurde ein effizientes Untersuchungsdesign gebildet (Kuhfeld / Tobias / Garratt 1994, Kanninen 2002). Dazu waren 16 Auswahlsets mit jeweils drei vollständigen Profilen notwendig. Tabelle 1 Ausprägungen der Merkmale zur Formstruktur Merkmal Stoßleiste

Steinschlagschutz (Rockerpanel)

Ausprägungen 1. ohne Stoßleiste, lackiert

Merkmal Felge

Ausprägungen 1. Aluminiumfelge, 7-Speichen

2. mit Stoßleiste, lackiert

2. Aluminiumfelge, 20-Speichen

3. mit Stoßleiste, unlackiert / schwarz

3. Stahlfelge

1. lackiert, ohne Sicke

1. nach Facelift

Leuchten 2. unlackiert, mit Sicke (Front und Heck)

2. vor Facelift

3. lackiert, mit Sicke

Die Berücksichtigung einer konstanten Alternative wird insgesamt als Verbesserung in der Gestaltung von choice-based Experimenten gesehen. Zum einen wird der Realitätsgrad der Entscheidungssituation gesteigert, zum anderen aber auch die Modellgüte verbessert. Nachteilig wirkt sich mitunter die kognitive Bequemlichkeit der Befragten aus, die lieber die No-Choice-Alternative wählen, als sich mit herausfordernden Auswahlentscheidungen zu befassen. Aus diesem Grund haben wir hier – unseres Wissens erstmalig – eine limitierte No-Choice-Alternative verwendet. Dies geschah durch die Möglichkeit, maximal drei Joker an Stelle einer Auswahlentscheidung zu wählen. Zusätzlich zu diesen 16 Auswahlsets wurden den Teilnehmern fünf Holdout-Sets zur Ermittlung der Validität vorgelegt (Tabelle 2). Damit wird es möglich, neben der inneren Validität auch die Prognosefähigkeit der geschätzten Modelle zu prüfen. Darüber hinaus wurde das erste und letzte Holdout-Set indentisch zusammengestellt, um einen Hinweis auf die Test-Retest-Reliabilität zu erhalten (Kohler / Neibecker 2004). Jeder Teilnehmer durchlief die 21 Auswahlsets für zwei zufällig rotierte Attribute („sportlich“ für die Dimension Dynamik und „elegant“ für die Dimension „Ästhetik / Eleganz“). Für „elegant“ liegen n ˆ 102 auswertbare Fälle vor und für „sportlich“ n ˆ 101. Zwanzig Abbrecher beendeten die Befragung vorzeitig, sonstige log-file-gestützte Eliminationen wurden nicht durchgeführt (Kohler 2003). Die Stichprobe setzte sich aus 30 % Frauen und 70 % Männern zusammen, mit einem Durchschnittsalter von 29. Die Dauer lag bei durchschnittlich 25 Minuten.

Conjoint-Analyse von Automobildesign

183

Tabelle 2 Zusammensetzung der Holdout-Sets (Set 1 und Set 5 identisch) Set

ohne Stoßleiste

lackierte Stoßleiste

schwarze Stoßleiste

Steinsch.

Felge

Leuchte Steinsch.

Felge

Leuchte Steinsch.

Felge

Leuchte

1

Lackiert o. Sicke

Alu 7

Vor Lackiert Facelift mit Sicke

Alu 7

Nach Lackiert Facelift mit Sicke

Stahlfelge

Vor Facelift

2

Lackiert o. Sicke

Alu 20

Nach Facelift

Alu 7

Vor schwarz / Alu 20 Facelift unlackiert mit Sicke

Nach Facelift

3

Lackiert o. Sicke

Alu 7

Nach Lackiert Alu 20 Facelift mit Sicke

Vor Lackiert Alu 20 Facelift mit Sicke

Nach Facelift

4

schwarz / unlackiert mit Sicke

Stahlfelge

Vor Lackiert Facelift mit Sicke

Stahlfelge

Vor Facelift

Lackiert o. Sicke

Alu 7

Nach Facelift

5

Lackiert o. Sicke

Alu 7

Vor Lackiert Facelift mit Sicke

Alu 7

Nach Lackiert Facelift mit Sicke

Stahlfelge

Vor Facelift

Lackiert o. Sicke

VI. Individuelle Nutzenschätzung mit dem hierarchischen Bayes-Verfahren Die klassische Auswertung der Auswahlentscheidungen erfolgt auf aggregiertem Niveau mittels des multinomialen Logit-Modells (MNL). Abweichend von den Angaben in Abbildung 3 werden jedoch keine individuellen, sondern Populationswerte ermittelt (Kuhfeld 2001). Technisch betrachtet, muss noch eine Erweiterung für mehrere Auswahlsets pro Teilnehmer, eine Skalierung der Nutzenkomponente durch eine konstante Alternative und die Wahl eines „effizienten“ Designs getroffen werden (Haaijer / Kamakura / Wedel 2001). Ferner unterliegt das Modell der Independence from Irrelevant Alternatives-Eigenschaft (IIA), die aber aufgrund der hier verwendeten Alternativenunterschiede vernachlässigt wird. In Abbildung 3 wird der hierarchische Charakter des Modells hervorgehoben. Die Ausführungen basieren auf den Arbeiten von Allenby / Ginter (1995), Chib / Greenberg (1995), Lenk et al. (1996), Sawtooth (2004) und Steenhard / Chou (2002). Jeweils ein Parameterset wird unter der Bedingung der Konstanz der beiden anderen Sets neu geschätzt. Diese Technik wird auch als „Gibbs sampling“ bezeichnet und konvergiert gegen die korrekte Verteilung der jeweiligen Parametersets. Mit den aktuellen - und D-Werten werden neue -Werte geschätzt. Dazu verwendet man den Metropolis-Hastings Algorithmus. Normalverteilte Zufallswerte mit einem Mittelwert von null und einer Kovarianzmatrix proportional zu D dienen der Bestimmung neuer -Werte. Die Zufallswerte dieser sogenannten „jumping distribution“ werden zu den alten -Werten addiert und erzeugen neue -Werte. Sind diese neuen Werte besser als die vorhandenen, werden sie übernommen,

184

Bruno Neibecker, Thomas Kohler und David Steenhard

andernfalls werden die alten beibehalten und der Zufallsprozess entsprechend adaptiert. Mit Hilfe der Bayes-Analyse werden die Werte aktualisiert. Aus den vorhandenen - und D-Werten werden A-priori-Wahrscheinlichkeiten für die -Werte berechnet. Die Auswahlwahrscheinlichkeiten, die nach dem MNL-Modell bestimmt werden, ergeben die bedingten Wahrscheinlichkeiten für die alten und neuen -Werte, unter der Berücksichtigung der vorhandenen Daten. Damit kann unter Rückgriff auf das Bayes-Theorem entschieden werden, welche -Werte als nächste, beste Schätzung für dieses Individuum verwendet werden.

,

Abbildung 3: Grundprinzip des hierarchischen Bayes-Verfahrens

Conjoint-Analyse von Automobildesign

185

Unter Verwendung der aktuellen - und D-Werte werden neue -Werte bestimmt. Mit den aktuellen Schätzwerten für und wird eine neue D-Matrix (mit der inversen Wishart-Verteilung) berechnet. Nachdem zunächst mit 1000 – 5000 Iterationen der Schätzprozess angestoßen wird, dienen die folgenden 1000 – 2000 Durchläufe zur temporären Speicherung der Schätzwerte und schließlich zur Bestimmung der Teilnutzenwerte pro Individuum als Mittelwert über die -Werte. Hierbei wird (aus Speicherplatzgründen) von den hier durchgeführten 1000 Iterationen jeder zehnte Wert zur Mittelwertberechnung berücksichtigt. Für die Auswertung des verwendeten Datensatzes benötigt ein 1 GHz PC-System mit der beschriebenen IML-Implementierung in dem Statistikpaket SAS ca. drei Stunden pro Lauf. Über die Zahl der benötigten Iterationen, um eine ausreichende, erste „Justierung“ zu erhalten, gibt es noch wenig Forschungsergebnisse. Für unseren Datensatz mit vergleichsweise wenigen Attributen und einer komfortablen Zahl an Auswahlentscheidungen wird eine kleinere Zahl ausreichen. Mit den Daten zur Dimension Sportlichkeit wurde zur Absicherung auch ein Lauf mit 5000 Iterationen durchgeführt. Die Ergebnisse stimmten aber weitgehend überein, so dass wir die Ergebnisse mit 1000 Initialiterationen vorstellen. Die Mittelwerte für das Attribut Stoßleiste: ohne, lackiert und schwarz, jeweils für 1000 und (5000) Iterationen sind: –0,681 (–0,695), 0,578 (0,586) und 0,103 (0,108).

B. Empirische Studie zur Designwirkung der Formstruktur I. Auswertung zur Dimension Sportlichkeit Die aggregierten Ergebnisse unter Berücksichtigung der Haupteffekte für das Attribut sportlich wurden bereits an anderer Stelle publiziert (Kohler 2003, Kohler / Neibecker 2004). Das MNL-Modell (mit Dummykodierung) leistet einen signifikanten Erklärungsbeitrag (bezogen auf 2 Log L) von 4480 – 3507. Der 2 -Wert von 973 bei 8 Freiheitsgraden ist mit p < 0; 0001 hochsignifikant. Diese aggregierten Ergebnisse bilden die Grundlage für die individuelle Schätzung der Nutzenwerte mit dem hierarchischen Bayes-Verfahren. Eine diskussionswürdige Frage betrifft die Dummy- versus Effektkodierung der Ausprägungen. Es gibt einige Gründe, die für eine Effektkodierung sprechen (Irwin / McClelland 2001, Sawtooth 2004). Haaijer / Kamakura / Wedel (2001) fassen diese wie folgt zusammen: „For instance, when price is a linear attribute in the design, the zero value for no-choice will correspond to a zero price. . . . this can lead to a biased estimate for the parameter of the linear attribute. . . . When all attributes are modelled with effect-type coding the bias discussed above does not arise, because all part-worths are now specified relative to the zero utility of the

186

Bruno Neibecker, Thomas Kohler und David Steenhard

no-choice alternative.“ Für die nachfolgende Schätzung der Individualwerte wird deshalb aus grundsätzlichen Erwägungen eine Effektkodierung verwendet. Da in unserer Untersuchung keine linearen Attribute vorhanden sind, wird dies keine grundlegenden Auswirkungen auf die Schätzergebnisse haben. Allerdings werden sich die Schätzungen marginal ändern, was sich in geringfügigen Verschiebungen der Attributgewichte zeigen wird, aber diese Umstellung der Kodierung wird nicht zu systematisch veränderten Nutzenwerten führen. Auf der Grundlage der individuellen Nutzenschätzungen wurde eine Segmentierung der Befragten durchgeführt. Entsprechend einem weithin akzeptierten Vorgehen (Backhaus at al. 2003, Teichert 2001) werden zunächst mittels des SingleLinkage-Verfahrens die Ausreißer eleminiert. Eine Person, die z. B. die Felgen gar nicht und den Steinschlagschutz extrem stark berücksichtigte, wurde als Ausreißer identifiziert und eliminiert. Mit Hilfe des sich anschließenden Ward-Verfahrens und unter Anwendung des Ellenbogenkriteriums (Abbildung 4) wurden drei Cluster mit jeweils 51, 30 und 19 Personen (P) bestimmt (man hätte auch eine Zwei-Clusterlösung akzeptieren können). Die Mittelwerte der individuellen Teilnutzenwerte und die Wichtigkeit zeigt Tabelle 3. Es fällt auf, dass die Leuchten insgesamt nach dem Facelift sportlicher bewertet werden. Alle drei Segmente (Cluster) berücksichtigen in ihrem Urteil die Leuchten mit einem mittleren Gewicht, wobei die Werte zwischen 14 % und 29 % schwanken.

0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 1

2

3

4

5

6

7

Abbildung 4: Bestimmung der Clusterzahl (schwarz = sportlich / weiß = elegant) auf der Grundlage der normierten Fehlersumme

Ganz anders die Situation bei den Felgen. Es gibt das Cluster 2 mit den „Felgenfreaks“, die sich in ihrem Urteil mit 59 % fast dominant von den Felgen leiten las-

Conjoint-Analyse von Automobildesign

187

sen. Stahlfelgen sind für diese Personen für ein sportliches Fahrzeug vollkommen  ˆ 3,47). Allerdings erzielen die beiden Alufelgen in etwa gleich undenkbar (X gute, positive Teilnutzenwerte. Hier wäre es bei zukünftigen Untersuchungen interessant, weitere Differenzierung in der Bewertung unterschiedlicher Alufelgen zu erzielen. Wenn man die Vielzahl unterschiedlicher Designalternativen bei den Alufelgen bedenkt, so sollte man mit einem noch stärker spezialisierten Untersuchungsdesign auch diese Unterschiede messtechnisch analysieren. Inwieweit die verwendeten Bildvorlagen aufgrund ihrer Auflösung eine differenziertere Bewertung nicht zuließen oder eventuell doch eine Indifferenz zwischen den beiden verwendeten Alualternativen besteht, kann mit diesen Ergebnissen nicht beantwortet werden. Tabelle 3 Teilnutzenwerte und Gewichtungsunterschiede zum Attribut sportlich Attribut Stoßleiste

Steinschlagschutz

Leuchten Felgen

Cluster 1 (51 P)

ohne

-1,49

lackiert

0,15

schwarz

1,34

lack. o. Sicke

-0,34

unl. mit Sicke

0,31

lack. mit Sicke

0,03

nach Facelift

0,63

vor Facelift

-0,63

Aluminium 7

0,74

Aluminium 20

0,72

Stahl

-1,47

Cluster 2 (30 P) -0,14

41%

1,05

0,51 22%

-0,91 -0,28 0,64

14%

-3,47

12%

0,96

29%

-0,96

1,72 1,75

-0,43 0,39

-0,64 32%

36%

0,04 5%

0,16 18%

0,95 -1,46

0,12 9%

Cluster 3 (19 P)

0,60 59%

0,29

23%

-0,89

Lediglich das relativ kleine Cluster 3 zeigt diese Differenzierung zwischen den Alufelgen zumindest im Ansatz. Aber auch für dieses Segment sind die Stoßleisten mit 36% Gewichtung das wichtigste Attribut für einen sportlichen Eindruck. Tendenziell wird aber ein ausgewogener Bewertungsstil herangezogen, wobei die Attribute Stoßleiste, Leuchten und Felgen eine fast gleichwertige Bedeutung erlangen. Das zahlenmäßig größte Cluster 1 zeichnet sich durch eine fast gleiche Berücksichtigung der zwei Attribute Stoßleiste und Felgen aus. Diese Personen fällen ihr Urteil offensichtlich nach dem ganzheitlichen Eindruck des Autos, wobei aber die Stoßleiste ein leichtes Übergewicht erhält. Man bevorzugt ferner die weniger extravagant wirkende schwarze Stoßleiste, die robuster und auch im Reparaturfalle günstiger ist. Gerade die Bevorzugung von schwarzen Stoßleisten könnte auf eine eher kognitive, von Zweckmäßigkeitskriterien überlagerte Urteilsbildung hinweisen. Auch die Bevorzugung eines unlackierten Steinschlagschutzes deutet darauf hin. Eine belastbare Antwort zu diesen Ursachen der Entscheidungs-

188

Bruno Neibecker, Thomas Kohler und David Steenhard

findung kann die Conjointanalyse auch mit individuellen Teilnutzenschätzungen nicht liefern. Hier wäre eine Kombination mit qualitativen Marktforschungstechniken wie z. B. einer kognitiven Reaktionsanalyse eine denkbare Erweiterung des Forschungsansatzes. Zur weiteren Charakterisierung der Cluster werden drei Fragen zur „Einstellung zum Design“ und sechs Statements zur allgemeinen Charakterisierung der Untersuchung und zur Aufgabenstellung herangezogen (Tabelle 4). Nur das Statement „Ich achte . . . auf Design“ deutet auf signifikante Unterschiede zwischen den Clustern hin. In die gleiche Richtung weist das zweite Statement. Die anderen Fragen weisen keine signifikanten Unterschiede auf, was darauf hindeutet, dass die Präferenzunterschiede nicht durch Probleme mit dem „Handling“ der Online-Befragung oder der Neuartigkeit der Aufgabenstellung verursacht wurden, sondern auf tatsächlichen Meinungsunterschieden zwischen den Clustermitgliedern beruhen. Interessant ist ferner, dass Cluster 2 zu 96,7 % aus Männern besteht und etwas weniger Angestellte enthält (Tabelle 5). Dieses Cluster erzielt auch die höchsten Werte bei der Prognosevalidität. Die Werte zwischen 53 % und 90 % sind extrem gut und die Reliabilität ist perfekt (Vergleich von Set 1 und Set 5). Der niedrige Wert von 53 % von Cluster 2 für Holdout-Set 2 erklärt sich mit den individuellen Teilnutzenwerten fast von selbst. Diese Gruppe legt besonderen Wert auf Alufelgen. Da aber in diesem Set lediglich die beiden Varianten Alu 7 und Alu 20 vorkommen, die aber in diesem Cluster nahezu gleich stark präferiert werden, fehlt es an entscheidungsrelevanten Attributausprägungen für dieses Set. Zur Berechnung der First-Choice-Hit-Rate wurden mit den individuellen Teilnutzenwerten jene Alternativen eines Holdout-Sets bestimmt, die nach dem MNLModell den größten Gesamtnutzen erzielen. Diese Alternative wurde mit der von den Testpersonen in erster Präferenz gewählten Alternative verglichen und die Übereinstimmungen (in Prozent) berechnet. In einer vergleichbaren Studie konnte Ernst (2001) mit multimedial präsentierten Produktprofilen einen Wert von 53,4 % erzielen. In dieser Studie wurde allerdings mit der adaptiven Conjoint-Analyse von „Sawtooth“ gearbeitet, die ergänzende multimediale Darstellungen zu Attributen vorsieht, allerdings keine ganzheitliche Darstellung wie in unserer Untersuchung ermöglicht (dafür aber andere Vorteile bietet, die hier nicht diskutiert werden können). Insgesamt können die erzielten Prognosewerte als relativ gut bewertet werden und auch die Reliabilitäten sind akzeptabel. Lediglich Cluster 3 zeigt beim Vergleich von Set 1 und Set 5 mit 68 % zu 47 % eine gewisse Schwäche bei der Reliabilität. Die prognostizierten Werte liegen deutlich über dem Erwartungswert von 33 %. Aus Platzgründen können wir nicht auf die wenigen Fälle eingehen, die bei der Reliabilitätsbetrachtung für Holdout-Set 1 entsprechend der prognostizierten Präferenz „richtig“ und bei Holdout-Set 5 „falsch“ ausgewählt haben (und umgekehrt).

Conjoint-Analyse von Automobildesign

189

Tabelle 4 Einstellung zum Design und zum Charakter der Untersuchung. Skala: stimmt ganz und gar nicht (1) – stimmt voll und ganz (7)(Statement 1 – 3, sonst entsprechend). Mittelwerte pro Cluster mit Signifikanzangaben Cluster 1

Cluster 2

Cluster 3

Ich achte beim Kauf von Produkten auf das Design. Ich kaufe lieber ein Produkt mit einem Design, das mir gefällt, auch wenn es etwas teurer ist. Das Design eines Produktes ist wichtiger als seine Funktion. Wie sicher haben Sie sich bei der Entscheidung für eine Alternative gefühlt?

Statement

5,74

6,5

5,74

0,024

p

5,33

6

5,26

0,105 (n.s.)

2,39

2,33

2,89

n.s.

5,14

5,1

5,05

n.s.

Ist es Ihnen leicht gefallen, sich für eine Alternative zu entscheiden? War die Aufgabe klar und verständlich? War die Befragung interessant?

5,06

4,73

4,74

n.s.

6,47

6,7

6,37

n.s.

5,39

5,5

5,37

n.s.

Fanden Sie die Untersuchung spannend? Hat Ihnen das Vergleichen der Bilder mit der Maus Spaß gemacht?

4,47

4,53

4,58

n.s.

5,51

5,03

4,84

n.s.

Tabelle 5 Prognosevalidität auf individueller Ebene und soziodemographische Angaben zu den Clustern Cluster 1

Cluster 2

Cluster 3

Holdout 1 First-Choice-Hit-Rate

58,80%

90,00%

68,40%

Holdout 2 First-Choice-Hit-Rate

49,00%

53,30%

79,00%

Holdout 3 First-Choice-Hit-Rate

52,90%

60,00%

57,90%

Holdout 4 First-Choice-Hit-Rate

74,50%

83,30%

36,80%

Holdout 5 First-Choice-Hit-Rate

54,90%

90,00%

47,40%

Geschlecht männlich

54,00%

96,70%

73,70%

29

26

29

55%

23%

42%

Durchschnittsalter in Jahren Angestellte in % (Rest gleich verteilt)

190

Bruno Neibecker, Thomas Kohler und David Steenhard

II. Auswertung zur Dimension Ästhetik-Eleganz Die aggregierten Ergebnisse unter Berücksichtigung der Haupteffekte für das Attribut elegant wurden ebenfalls in Kohler (2003) bzw. Kohler / Neibecker (2004) publiziert. Das MNL-Modell (mit Dummykodierung) leistet einen signifikanten Erklärungsbeitrag (bezogen auf –2 Log L) von 4524 – 3194. Der 2-Wert von 1330 bei 8 Freiheitsgraden ist mit p < 0; 0001 hochsignifikant. Diese aggregierten Ergebnisse bilden wiederum die Grundlage für die individuelle Schätzung der Nutzenwerte mit dem hierarchischen Bayes-Verfahren. Tabelle 6 Teilnutzenwerte und Gewichtungsunterschiede zum Attribut elegant Attribut

Stoßleiste

Steinschlagschutz Leuchten Felgen

Cluster 1

Cluster 2

(28 P)

(35 P)

ohne

3,39

lackiert

0,32

schwarz

-3,72

-1,04

lack. o. Sicke

0,54

-0,05

unl. mit Sicke

-0,52

lack. mit Sicke

-0,02

nach Facelift

0,06

vor Facelift

-0,06

-0,38

Aluminium 7

0,32

0,63

Aluminium 20

-0,31

Stahl

-0,01

(39 P)

-0,04 80%

12%

1,08

0,06

1,54 41%

7%

0,38

0,75 -1,38

1,09

59%

-2,63 0,18 2%

-0,01 1%

Cluster 3

-0,58

14%

0,4 15%

0,47

13%

-0,47 0,28 42%

0,35

14%

-0,63

Auf der Grundlage der individuellen Nutzenschätzungen wurde eine Segmentierung der Befragten durchgeführt. Es zeigten sich keine Ausreißer, so dass mit dem Ward-Verfahren eine Clusterung durchgeführt wurde, wobei wiederum nach dem Ellenbogenkriterium drei Cluster mit jeweils 28, 35 und 39 Personen bestimmt wurden. Die Mittelwerte über die individuellen Teilnutzenwerte und die Wichtigkeit zeigt Tabelle 6. In Cluster 1 und 3 wird die Eleganzwirkung eindeutig von der Stoßleiste dominiert. Nur Cluster 2 bezieht auch die Felgen in erkennbarem Umfang in die Beurteilung ein. Es hat den Anschein, als würde die Eleganz und Ästhetik sehr viel stärker von dem ganzheitlichen Erscheinungsbild geprägt. Erst an zweiter Stelle können Details im Design den globalen Gesamteindruck korrigieren. Betrachtet man die Wirkung der Einzelelemente, so fällt auf, dass in Cluster 1 eine differenzierte Wertung der Felgen durchgeführt wird. Erstaunlicherweise wird die Alufelge mit 20 Speichen als besonders unelegant eingestuft. Diese Gruppe

Conjoint-Analyse von Automobildesign

191

stößt sich offenbar an dem etwas „kräuseligen“ Erscheinungsbild dieser Felge und findet sogar die Radkappe der Stahlfelge, die allerdings einen optisch perfekten Eindruck hinterlässt, noch eleganter. Diese differenzierte Unterscheidung wurde von der aggregierten Analyse nicht aufgedeckt und zeigt, wie unterschiedlich die Präferenzen in Einzelaspekten des Designs ausfallen können. Zusammenfassend kann man sagen: Cluster 1 liebt großflächige, schnörkelfreie Formen. Selbst ein lackierter Steinschlagschutz mit Sicke fällt da schon negativ auf und stört die Eleganz. Die Ergebnisse zu den drei Fragen zur „Einstellung zum Design“ und zu den sechs Statements zur allgemeinen Charakterisierung der Untersuchung und zur Aufgabenstellung zeigt Tabelle 7. Unterschiede zwischen den Clustern sind bis auf zwei Ausnahmen nicht vorhanden. Cluster 1 fand diesen Teil der Befragung jedoch besonders spannend und interessant und fühlt sich in der Beurteilung von Eleganz offenbar besonders kompetent, zumindest ist man sich in seiner Entscheidung besonders sicher. Tabelle 7 Einstellung zum Design und zum Charakter der Untersuchung. Skala: stimmt ganz und gar nicht (1) – stimmt voll und ganz (7) (Statement 1 – 3, sonst entsprechend). Mittelwerte pro Cluster mit Signifikanzangaben. Statement

Cluster 1

Cluster 2

Cluster 3

Ich achte beim Kauf von Produkten auf das Design. Ich kaufe lieber ein Produkt mit einem Design, das mir gefällt, auch wenn es etwas teurer ist. Das Design eines Produktes ist wichtiger als seine Funktion. Wie sicher haben Sie sich bei der Entscheidung für eine Alternative gefühlt? Ist es Ihnen leicht gefallen, sich für eine Alternative zu entscheiden? War die Aufgabe klar und verständlich? War die Befragung interessant? Fanden Sie die Untersuchung spannend? Hat Ihnen das Vergleichen der Bilder mit der Maus Spaß gemacht?

6,18

6,18

5,82

n.s.

p

5,5

5,89

5,21

0,12 (n.s.)

3,04

2,48

2,41

n.s.

5,5

4,94

5,08

0,13 (n.s.)

5,07

4,94

4,77

n.s.

6,39

6,54

6,74

n.s.

5,71 4,89

4,91 4,02

5,66 4,67

0,01 0,036

5,43

5

5,41

n.s.

In Bezug auf Geschlecht, Alter und Beruf zeigen sich keine auffälligen Unterschiede zwischen diesen Clustern. Eine soziodemographische Segmentierung scheint für die Ästhetik- und Eleganzwahrnehmungen weniger zweckmäßig zu sein.

192

Bruno Neibecker, Thomas Kohler und David Steenhard

Auch zur Eleganz wurde die First-Choice-Hit-Rate ermittelt (Tabelle 8). Für Cluster 1 ist die Prognosegenauigkeit ausgezeichnet und liegt zwischen 75 % und 85,7 %. Auch die Übereinstimmung zwischen Set 1 und Set 5, als Reliabilitätskontrolle, ist perfekt. Etwas schlechter schneidet die zweite Gruppe ab. Noch akzeptabel, aber doch erkennbar schlechter, ist das Ergebnis für Cluster 3. Die Werte für dieses Cluster liegen immer noch in einem guten Bereich. Die prozentuale Verbesserung gegenüber dem Zufallsmodell liegen für einen Wert von 59 % immer noch bei (59 – 33) / (100 – 33) = 39 %. Es drängt sich jedoch die Frage auf, wieso etwa für Holdout-Set 4 mit 33 % praktisch keine Prognoseverbesserung existiert. Tabelle 8 Prognosevalidität auf individueller Ebene und soziodemographische Angaben zu den Clustern Cluster 1

Cluster 2

Cluster 3

Holdout 1 First-Choice-Hit-Rate

78,60%

77,10%

64,10%

Holdout 2 First-Choice-Hit-Rate

75,00%

57,10%

56,40%

Holdout 3 First-Choice-Hit-Rate

85,70%

48,60%

59,00%

Holdout 4 First-Choice-Hit-Rate

78,60%

48,60%

33,30%

Holdout 5 First-Choice-Hit-Rate

78,60%

68,60%

61,50%

Geschlecht männlich

60,70%

73,50%

76,90%

Durchschnittsalter in Jahren Angestellte in % (Rest gleich verteilt)

31

27

29

39%

40%

41%

Betrachtet man sich Holdout-Set 4 genauer, so fällt auf, dass für Cluster 3 eine negativ zu bewertende schwarze Stoßleiste durch Leuchten mit Facelift, Alufelgen und lackiertem Steinschlagschutz aufgewertet wird. Die zwei konkurrierenden Alternativen mit lackierter Stoßleiste bzw. ohne Stoßleiste, die grundsätzlich als eleganter eingestuft werden, erfahren durch Stahlfelgen und die „älteren“ Leuchten eine Abwertung. In Auswahlwahrscheinlichkeiten für Holdout-Set 4 und Alternative 1 – 3 ausgedrückt, ergeben sich 35 %, 58 % und 7 %. Bereits das in der Prognosevalidität zweitschlechteste Holdout-Set 2 erzielt wesentlich diskriminierendere Auswahlwahrscheinlichkeiten von 80 %, 19 % und 1 %. Bedenkt man die Unterschiede, die auch innerhalb eines relativ homogenen Clusters zwischen den einzelnen Teilnutzenschätzungen existieren, so ist es verständlich, dass für Holdout-Set 4 in diesem Cluster keine besseren Werte erzielt werden konnten.

Conjoint-Analyse von Automobildesign

193

C. Schlussfolgerungen Die Anwendung des hierarchischen Bayes-Verfahrens hat sich bereits in mehreren Studien als erfolgversprechender Ansatz zur Ermittlung individueller Teilnutzenwerte in Choice-Based-Conjoint-Studien (CBC) bewährt (Sawtooth 2004, Teichert 2001). Gerade für die Wirkungsmessung im Automobildesign eröffnen sich damit neue Möglichkeiten. Die Verwendung von fotorealistischen, gestaltpsychologischen Anforderungen genügenden Produktprofilen erhöhen den Realitätsgehalt der Befragung, die entsprechend unseren Ergebnissen als besonders klar, verständlich und auch spannend beurteilt wird. Ungeachtet der vielen Vorteile des klassischen CBC-Ansatzes fehlte es lange an der Möglichkeit, individuelle Teilnutzenwerte zu ermitteln und damit die zu vermutende Nutzenheterogenität zu berücksichtigen. Es hat sich auch in dieser Studie gezeigt, dass die Vorstellungen der Teilnehmer über einzelne Designelemente nicht nur innerhalb einer bestimmten Fragestellungen sehr unterschiedlich sind, sondern bei wechselnder Fragestellung die einzelnen Designelemente unterschiedliche Wirkungen entfachen. Für die unterschiedlichen Designwirkungen in Richtung „Sportlichkeit“ und „Ästhetik / Eleganz” sind sowohl die Cluster unterschiedlich zusammengesetzt, wie auch die Teilnutzenwerte für gleiche Attributausprägungen erkennbar unterschiedlich sind. Das eingesetzte Instrumentarium ermöglicht die systematische Einbindung von Designwirkungen in die Produktpositionierung. Schon während des Designprozesses kann die Gestaltung der äußeren Formparameter wie z. B. Fließheck oder Überhänge auf ihre spezifische Wirkung in positionierungsrelevanten Dimensionen überprüft werden. Unsere Studie zeigt auch, dass Conjointmessungen geeignet sind, einzelne, auch unscheinbare Designelemente der Formstruktur wie Leuchten, Sicken oder Alufelgen in ihren spezifischen Wirkungen zu erfassen. Die individuellen Nutzenwerte zeichnen sich fast durchgängig durch gute Prognosegenauigkeit und Reliabilitäten aus und belegen damit die Leistungsfähigkeit des zwar aufwendigen, aber wirkungsvollen hierarchischen Bayes-Verfahrens.

Literatur Allenby, Greg M. / Ginter, James L. (1995): Using Extremes to Design Products and Segment Markets, in: Journal of Marketing Research, Vol. 32, S. 392 – 403 Backhaus, Klaus / Erichson, Bernd / Plinke, Wulff / Weiber, Rolf (2003): Multivariate Analysemethoden Balderjahn, Ingo (1991): Ein Verfahren zur empirischen Bestimmung von Preisresponsefunktionen, in: Marketing ZFP, Vol. 13, S. 33 – 42 Behrens, Gerold (2001): Wahrnehmung, in: Behrens, G. / Esch, F. R. / Leischner, E. / Neumaier, M. (Hrsg.), Gabler Lexikon Werbung, S. 399 – 402 13 FS Kaas

194

Bruno Neibecker, Thomas Kohler und David Steenhard

Bloch, Peter H. (1995): Seeking the Ideal Form: Product Design and Consumer Response, in: Journal of Marketing, Vol. 59, S. 16 – 29 Chib, Siddhartha / Greenberg, Edward (1995): Understanding the Metropolis-Hastings Algorithm, in: The American Statistician Vol. 49, S. 327 – 335 Ernst, Olaf (2001): Multimediale versus abstrakte Produktpräsentationsformen bei der Adaptiven Conjoint-Analyse Gessner, Karsten (2001): Package-Features für die Kommunikation in den frühen Phasen der Automobilentwicklung. Berichte aus dem Produktionstechnischen Zentrum Berlin Green, Paul E. / DeSarbo, Wayne S. (1978): Additive Decomposition of Perceptions Data via Conjoint Analysis, in: Journal of Consumer Research, Vol. 5, S. 58 – 65 Green, Paul.E. / Srinivasan, V. (1990): Conjoint Analysis in Marketing Research – New Developments and Directions, in: Journal of Marketing, Vol. 54, S. 3 – 19 Haaijer, Rinus / Kamakura, Wagner / Wedel, Michel (2001): The ,no-choice‘ Alternative in Conjoint Choice Experiments, in: International Journal of Market Research, Vol. 43, S. 93 – 106 Hahn, Christian (1997): Conjoint- und Discrete Choice-Analyse als Verfahren zur Abbildung von Präferenzstrukturen und Produktauswahlentscheidungen – Ein theoretischer und computergestützter empirischer Vergleich Hartmann, Adriane / Sattler, Henrik (2002): Commercial Use of Conjoint Analysis in Germany, Austria, and Switzerland. Research Paper, University of Hamburg, No. 006 Irwin, Julie R. / McClelland, Gary H (2001): Misleading Heuristics and Moderated Multiple Regression Models, in: Journal of Marketing Research, Vol. 38, S. 100 – 109 Kaas, Klaus-Peter (1977): Empirische Preisabsatzfunktionen bei Konsumgütern Kanninen, Barbara J. (2002): Optimal Design for Multinomial Choice Experiments, in: Journal of Marketing Research, Vol. 39, S. 214 – 227 Kohler, Thomas (2003): Wirkungen des Produktdesigns – Analyse und Messung am Beispiel Automobildesign. Wiesbaden Kohler, Thomas / Neibecker, Bruno (2004): Onlinegestützte Wirkungsmessung von Automobildesign, in: Wiedmann, K.-P. (Hrsg.), Fundierung des Marketing, S. 495 – 518 Koppelmann, Udo (1997): Produktmarketing – Entscheidungsgrundlagen für Produktmanager, 5. Aufl. Kroeber-Riel, Werner (1984): Industrial Design – 10 Thesis on Design Problems. Working paper, Institute for Consumer and Behavioral Research, Saarbrücken Kroeber-Riel, Werner / Weinberg, Peter (2003): Konsumentenverhalten Kuhfeld, Warren F. / Tobias, Randall D. / Garratt, Mark (1994): Efficient Experimental Design with Marketing Research Applications, in: Journal of Marketing Research, Vol. 31, S. 545 – 557 Kuhfeld, Warren F. (2001): Multinomial Logit – Discrete Choice Modeling. SAS Institute TS-650E (http: // support.sas.com / 4. 10. 2004)

Conjoint-Analyse von Automobildesign

195

Lenk, Peter. J. / DeSarbo, Wayne S. / Green, Paul E. / Young, Martin R. (1996): Hierarchical Bayes Conjoint Analysis: Recovery of Partworth Heterogeneity from Reduced Experimental Designs, in: Marketing Science, Vol. 15, S. 173 – 191 Louviere, Jordan J. / Hensher, David A. / Swait, Joffre D. (2000): Stated choice methods Luce, R. Dunkan / Tukey, John W. (1964): Simultaneous Conjoint Measurement – A New Type of Fundamental Measurement, in: Journal of Mathematical Psychology, Vol. 1, S. 1 – 27 McFadden, Daniel (1974): Conditional Logit Analysis and Qualitative Choice Behavior, in: Zaremka, P. (Hrsg.), Frontiers in Econometrics, S. 105 – 142 Neibecker, Bruno (1990): Werbewirkungsanalyse mit Expertensystemen. Physica Neibecker, Bruno / Kohler, Thomas (2004): Messung von Designwirkungen bei Automobilen – Eine Conjoint-Studie mit Fotomontagen, in: Gröppel-Klein, A. (Hrsg), Konsumentenverhaltensforschung im 21. Jahrhundert, S. 517 – 539 Perrey, Jesko (1996): Erhebungsdesign-Effekte bei der Conjoint-Analyse, in: Marketing ZFP, Vol. 18, S. 105 – 116 Sawtooth Software: CBC Hierachical Bayes Analysis Technical Paper (version 3.2) (http: // www.sawtoothsoftware.com 2. 9. 2004) Schade, Christian (2004): Ökonomische Laborexperimente und Konsumentenverhalten, in: Gröppel-Klein, A. (Hrsg.), Konsumentenverhaltensforschung im 21. Jahrhundert, S. 565 – 584 Stark, Christian (1996): Architektur und Design als Grundlage für die Produktgestaltung, Fördergesellschaft Produkt-Marketing, Köln Steenhard, David / Chou, Nan-Ting (2002): Using SAS-IML to Perform Hierarchical Bayes Estimation for Discrete Choice Modeling (http: // www.wuss.org / Conference / papers2002. htm 1. 3. 2004) Strebinger, Andreas / Hoffmann, Sabine / Schweiger, Günter / Otter, Thomas (2000): Zur Realitätsnähe der Conjointanalyse, in: Marketing ZFP, Vol. 22, S. 55 – 74 Teichert, Thorsten (2001): Nutzenermittlung in wahlbasierter Conjoint-Analyse: Ein Vergleich von Latent-Class- und hierarchischem Bayes-Verfahren, in: zfbf, Vol. 53, S. 798 – 822 Trommsdorff, Volker (2004): Nutzen und Einstellung. Über ein Konstrukt der Theorie des Konsumentenverhaltens, in: Gröppel-Klein, A. (Hrsg.), Konsumentenverhaltensforschung im 21. Jahrhundert, S. 479 – 500 Veryzer, Robert W. (1999): A Nonconscious Processing Explanation of Consumer Response to Product Design, in: Psychology & Marketing, Vol. 16, S. 497 – 522 Weinberg, Peter (2001): Erlebnisbezogenes Design, in: Diller, Hermann (Hrsg.), Vahlens Großes Marketing Lexikon, S. 425

13*

Konsumentenheterogenität im Beziehungsmarketing Ein Bindungstheoretischer Ansatz Marcel Paulssen und Susan Fournier

A. Bindungsstile in Geschäftsbeziehungen Eine Vielzahl empirischer Untersuchungen konnte zeigen, dass sich individuelles Verhalten in zwischenmenschlichen Beziehungen mit Hilfe der Bindungstheorie vorhersagen lässt. Die vorliegende Arbeit befasst sich mit der Frage, inwiefern sich Kundenheterogenität in Kundenbeziehungen mit Hilfe der Bindungstheorie erklären lässt. Die Auswirkungen von Bindungsstilen auf zentrale Konstrukte des Beziehungsmarketing – Zufriedenheit, Loyalität und Vertrauen – werden in zwei unterschiedlichen Arten von Kundenbeziehungen empirisch überprüft: (1) zwischen Kunden und ihren Automarken sowie (2) zwischen Kunden und ihren Autohändlern. Bei männlichen Konsumenten erwies sich sicherer persönlicher Bindungsstil als dominante Determinante von Zufriedenheit, Vertrauen und Loyalität in den betrachteten Kundenbeziehungen. Bei weiblichen Konsumenten hingegen ist der ängstlich-ambivalente Bindungsstil die dominante Einflußgröße auf die Beziehungskonstrukte Zufriedenheit, Vertrauen und Loyalität. Die Autoren übertragen die Bindungstheorie auf die Konsumentenforschung und entwickeln eine Skala zur Messung sicheren Bindungsstils im Business-to-Consumer Bereich. Zwei Facetten sicherer Konsumentenbindung werden empirisch abgeleitet. „Sichere“ Konsumenten-Bindung bezeichnet dabei die Fähigkeit und Bereitschaft, sich sowohl auf Marken als auch auf Unternehmen zu verlassen, oder gar in eine Position der Abhängigkeit zu begeben. „Suche nach Nähe“ bezeichnet den Wunsch und die Motivation von Konsumenten, eine persönliche Beziehung zu Marken, Unternehmen bzw. Mitarbeitern eines Unternehmens aufzubauen. Sicherer Bindungsstil hat eine positive Auswirkung auf die Konstrukte Loyalität, Vertrauen und Zufriedenheit in beiden untersuchten Kundenbeziehungen. Suche nach Nähe beeinflusst die Präferenz für Beziehungsmarketing-Aktivitäten (z. B. Überraschungen / Geschenke, persönliche Veranstaltungen, etc.).

B. Einleitung Beziehungsmarketing – der Aufbau langfristiger Beziehungen zwischen Kunde und Unternehmen – hat die Marketing-Theorie nachhaltig beeinflusst und wird im

198

Marcel Paulssen und Susan Fournier

allgemeinen als eines der Leitmotive der Marketing-Praxis angesehen (Bendapudi / Berry 1997; Reinartz / Kumar 2003). Allerdings konnte die Konsumentenforschung zeigen, dass nicht jeder Konsument langfristige Beziehungen zu Unternehmen, Marken oder Mitarbeitern eines Unternehmens anstrebt (Barnes 1997; Fournier 1998; Price / Arnould 1999). Beziehungsmarketing-Aktivitäten, die auf derartige Kunden abzielen, müssen daher als Fehlinvestitionen betrachtet werden. Damit Beziehungsmarketing sein volles Potenzial entfalten kann, ist es notwendig, die Kunden identifizieren zu können, die eine hohe Bereitschaft haben, Beziehungen zu Unternehmen und Marken aufzubauen (Dowling / Uncles 1997). Da es zu diesem Thema bisher kaum empirische Forschung gibt, fehlen bisher geeignete Ansätze, Kunden auf der Basis ihrer Bereitschaft, Beziehungen zu Unternehmen einzugehen, zu segmentieren (Bendapudi / Berry 1997). Das zentrale Anliegen der vorliegenden Arbeit besteht daher darin, interindividuelle Unterschiede von Konsumenten hinsichtlich ihrer Disposition für Beziehungsmarketing zu untersuchen. Die grundlegende Frage lautet: Welche Konsumenten besitzen eine hohe Neigung, feste Beziehungen zu Unternehmen und Marken aufzubauen und warum? Erste Studien zu diesem Themenbereich stammen von Odekerken-Schröder, De Wulf und Schumacher (2003) und De Wulf, Odekerken-Schröder und Iacobucci (2001). Odekerken-Schröder, De Wulf und Schumacher haben ein kategoriespezifisches Maß von Beziehungsneigung entwickelt und konnten zeigen, dass dieses Maß Beziehungszufriedenheit beeinflusst. Obwohl die Beziehungsperspektive die Transaktionsperspektive im Marketing weitgehend ersetzt hat, ist sie in der Marketing-Theorie zum jetzigen Zeitpunkt noch nicht ausreichend zur Entfaltung gekommen (Fournier 1998). So sind insbesondere Befunde und Theorien zu persönlichen Beziehungen im Bereich der Konsumentenforschung bislang nur unzureichend genutzt worden. Dass sich individuelles Verhalten in zwischenmenschlichen Beziehungen anhand der Bindungstheorie vorhersagen lässt, konnte in vielen, Forschungsarbeiten gezeigt werden. Der Erklärungsansatz der Bindungstheorie wurde von der frühen Kindheit (Bowlby 1980) sukzessive auf das Erwachsenenalter (Hazan / Shaver 1987), sowie in neueren Arbeiten auch auf Freundschafts- (Asendorpf / Wilpers 2000; Trinke / Bartholomew 1997) und Arbeitsbeziehungen (Hazan / Shaver 1990) ausgeweitet. Die Autoren versprechen sich daher durch die Anwendung der Bindungstheorie auch ein besseres Verständnis von Kundenheterogenität in Marketingbeziehungen. Eine kürzlich erschienene explorative Studie von Johnson und Thomson (2003) konnte zeigen, dass Bindungsstile Einfluss auf Kundenzufriedenheit haben können. Leider beinhaltet das kurze Forschungsabstract von Johnson und Thomson keine empirischen Ergebnisse. So bleibt unter anderem unklar, wie Bindung gemessen wurde und wie stark ihr Einfluss auf Zufriedenheit war. Die vorliegende Arbeit verfolgt daher das Ziel, die Idee von Johnson und Thomson (2003) aufzugreifen und um folgende Punkte zu erweitern: Die Auswirkung von persönlichen Bindungsstilen soll auf die zentralen Konstrukte des Beziehungsmarketings (Zufriedenheit, Vertrauen und Loyalität) in zwei unterschiedlichen Business-to-Consumer Beziehungen untersucht werden.

Konsumentenheterogenität im Beziehungsmarketing

199

Die Bindungstheorie soll auf den Konsumbereich übertragen werden. Ein Maß für Kundenbindungsstile soll entwickelt werden, und dessen Auswirkung auf zentrale Konstrukte des Beziehungsmarketings soll überprüft werden. Der Beitrag hat folgenden Aufbau: Nach einer Einführung in die Bindungstheorie wird ein Modell mit Hypothesen zur Auswirkung des Bindungsstils auf die Konstrukte Zufriedenheit, Vertrauen und Loyalität im Beziehungsmarketing vorgestellt. Daran anschließend werden das Untersuchungsdesign und die empirischen Ergebnisse dargestellt. Die Arbeit schließt mit einer Zusammenfassung der Ergebnisse, den sich daraus ergebenden Implikationen für die Marketing-Praxis, Einschränkungen und weiterem Forschungsbedarf.

C. Theoretische Grundlagen der Bindungstheorie Die Bindungstheorie1 wurde von Ainsworth und Bowlby (1991) entwickelt und beschreibt die Disposition einer Person, eine starke affektive Bindung zu Bezugspersonen aufzubauen. Die Bindungstheorie nach Bowlby (1973, 1980, 1982) geht davon aus, dass aufgrund frühkindlicher Beziehungen zu primären Bezugspersonen (Mutter, Vater) sogenannte innere Arbeitsmodelle von Beziehungen entwickelt werden. Diese Arbeitsmodelle bestimmen dann auch in späteren Jahren Wahrnehmungen und Erwartungen in persönlichen Beziehungen. Ausgehend von Bowlby (1973) entwickelten Ainsworth et al. (1978) ein Drei-Kategorien-System zur Klassifizierung von Bindungsstilen, die sie als „sicher“, „ängstlich / ambivalent“ und „vermeidend“ bezeichneten. Während sich die Mehrzahl der ersten Studien mit der Beziehung zwischen Kleinkind und dessen engster Bezugsperson befassten, übertrugen Hazan und Shaver (1987) die Bindungstheorie auf Beziehungen im Erwachsenenalter und eröffneten damit ein neues Forschungsfeld. Auf Basis von Ainsworths Drei-Kategorien-System von Bindungsstilen, entwickelten Hazan und Shaver ein kategoriales Maß zur Messung von Bindungsstilen im Erwachsenenalter. Eine konzeptionelle Weiterentwicklung stellt das Modell von Bartholomew (1990) dar (siehe Abbildung 1). Dieses basiert auf Bowlbys Annahme, dass Bindungsmuster sich in den Arbeitsmodellen des Selbst und Arbeitsmodellen von Anderen manifestieren. Nach Bartholomew kann das Selbstbild einer Person in einen positiven Teil (das Selbst als würdig, Liebe und Fürsorge zu erfahren) und einen negativen Teil (das Selbst als unwürdig, Liebe und Fürsorge zu erfahren) dichotomisiert werden. Die Dimension „Modell des Selbst“ beschreibt damit das Ausmaß, in dem Individuen ihren eigenen Selbstwert verinnerlicht haben und aufgrund dessen erwarten, dass andere positiv auf sie reagieren. Im Modell von Bartholomew (1990) wird das Selbstbild mit dem Fremdbild kombiniert. Das 1 Das Konstrukt Bindung wurde in der Marketing-Forschung oft unterschiedlich verwendet (Ball / Tasaki 1992; Belk 1988). Ball und Tsaki definieren Bindung als Ausmaß, in dem ein von einem Individuum besessenes Objekt von diesem für die Aufrechterhaltung seines Selbst-Konzepts genutzt wird.

200

Marcel Paulssen und Susan Fournier

Fremdbild oder Modell von Anderen wird ebenso in positiv (Andere werde als vertrauenswürdig und fürsorglich wahrgenommen) oder negativ (Andere werden als abweisend, lieblos und distanziert wahrgenommen) dichotomisiert. Das „Modell von Anderen“ misst damit das Ausmaß der generellen Erwartung, dass Andere zur Verfügung stehen und hilfsbereit sind. Die vier prototypischen Bindungsstile von Bartholomew lassen sich dann anhand der Überschneidungen der beiden vorgestellten Dimensionen, Modell des Selbst und Modell von Anderen, beschreiben.

Positiv

Negativ

Positiv

Sicher

Ambivalent*

Negativ

Modell von Anderen

Modell des Selbst

Vermeidend

Ängstlich

* Ursprünglich als „Preoccupied“ bezeichnet.

Abbildung 1: Das Vier-Kategorien Modell der Bindungsstile nach Bartholomew und Horowitz (1991)

Die Forschung zu Erwachsenen-Bindungsstilen hat sich primär mit der Identifikation individueller Unterschiede in Bindungsstilen und deren Auswirkungen auf Beziehungen beschäftigt. Die Fülle der Forschungsarbeiten ist beeindruckend: Es existieren Hunderte von Untersuchungen zu derartigen Effekten. Bindungsstile wurden unter anderem mit Beziehungszufriedenheit, Loyalität, Konfliktbewältigungsstrategien und Beziehungsstabilität in Verbindung gebracht (vgl. Shaver, Collins und Clark 1996). Besonders erwähnenswert sind hierbei die unterschiedlichen Effekte sicherer und ängstlich-ambivalenter Bindungsstile. Da sie besondere Relevanz für das Beziehungsmarketing besitzen, wird nachfolgend näher auf diese eingegangen. I. Sicherer Bindungsstil Sicher gebundene Menschen verfügen über ein positives Arbeitsmodell des Selbst und ein positives Arbeitsmodell von Anderen. Sie sehen sich selbst als der Fürsorglichkeit, Liebe und Wertschätzung anderer wert und würdig. Ihre Beziehungspartner beurteilen sie generell als zuverlässig, vertrauenswürdig und unterstellen ihnen generell guten Willen. Menschen mit einem sicheren Bindungsstil

Konsumentenheterogenität im Beziehungsmarketing

201

fällt es leicht, enge Beziehungen zu Partnern einzugehen, sich auf diese zu verlassen und sich damit diesen gegenüber auch in Abhängigkeiten zu begeben (Hazan / Shaver 1987). Partnerschaften von sicher gebundenen Individuen lassen sich durch einen hohen Grad an Vertrauen, Zufriedenheit und Bindung charakterisieren (Collins / Read 1990; Simpson 1990).

II. Ängstlich-vermeidender Bindungsstil Personen mit einem ängstlich-vermeidenden Bindungsstil haben ein negatives Arbeitsmodell des Selbst. Sie fühlen sich unsicher und von Anderen missverstanden und unterschätzt. Beziehungspartner werden als abweisend wahrgenommen. Personen mit einem ängstlich-vermeidenden Bindungsstil machen sich häufig Sorgen, dass ihre Partner sie nicht wirklich lieben oder sie verlassen könnten (Hazan / Shaver 1987). Ihre Beziehungen sind durch ein geringes Maß an Vertrauen, Zufriedenheit, Bindung charakterisiert (Collins / Read 1990; Simpson 1990). Außerdem weisen sie die geringste Stabilität in ihren Beziehungen auf (Kirkpatrick / Hazan 1994).

D. Modellentwicklung Ursprünglich wurde der bindungstheoretischer Ansatz entwickelt, um die emotionale Bindung zwischen Mutter und Kind zu erklären. Schon Bowlby (1988) erweiterte diesen Ansatz und ging davon aus, dass auch im Erwachsenenalter enge zwischenmenschliche Beziehungen durch den persönlichen Bindungsstil beeinflusst werden. Obwohl sich Bowlby auf den Einfluss früher Bindungserfahrungen auf spätere enge Beziehungen konzentriert hat, konnten viele Forschungsarbeiten zeigen, dass bereits im frühkindlichen Stadium Bindungsstile auch auf wenig affektive Beziehungen zu Gleichaltrigen oder gar Fremden Einfluss haben können (siehe dazu Berlin / Cassidy 1999 für einen Überblick über die bestehende Forschung). Mikulincer und Shaver (2003) halten eine Beschränkung des Einflusses von Bindungsstilen auf romantische Liebesbeziehungen für zu restriktiv, da eine Vielzahl von Personen im Erwachsenenalter als Bindungspersonen fungieren können. Eltern, Freunde, Gruppen, Institutionen und abstrakte oder symbolische Figuren (z. B. Gott), sogar Lehrer und Vorgesetzte in akademischen und unternehmerischen Umfeldern können als Bindungs-Personen fungieren und Ziele bei der Suche nach Nähe und Unterstützung darstellen (Mikulincer / Shaver 2003). Entsprechend wurde die Bindungstheorie erfolgreich auf verschiedenste Beziehungsarten und -umfelder angewandt (so etwa auf Freundschaftsbeziehungen, Asendorpf / Wilpers 2000; Trinke / Bartholomew 1997 sowie auf Arbeitsbeziehungen, Hazan / Shaver 1990). Diese Anwendungen machen deutlich, dass der bindungstheoretische Ansatz auch für Beziehungen zwischen Konsumenten und Marken bzw. Unternehmen Erklärungspotential haben könnte. Schließlich basieren Bezie-

202

Marcel Paulssen und Susan Fournier

hungszufriedenheit, -vertrauen, und -bindung zu Anbietern und Marken auf den gleichen mentalen und emotionalen Prozessen wie dyadische Paarbeziehungen. Verhält sich ein Unternehmen oder eine Marke generell zuverlässig und agiert auch in Ausnahmesituationen (z. B. bei Problemen mit einem Produkt) so, dann fördert dieses Verhalten den Aufbau von Bindungssicherheit seitens des Konsumenten. Aufgrund interner Arbeitsmodelle von Anderen als generell verlässlich und vertrauenswürdig, haben sicher gebundene Personen positivere Erwartungen und wohlwollendere Erklärungen für das Verhalten von Unternehmen und Marken, als ängstlich gebundene Individuen. Wie auch in persönlichen Beziehungen, kann dies im Laufe einer Beziehung zu mehr Vertrauen, Zufriedenheit und Bindung führen. Auf Basis der Annahme, dass Zufriedenheit, Vertrauen und Bindung von Kunden durch die gleichen mentalen und emotionalen Prozesse beeinflusst werden wie in dyadischen Paarbeziehungen, werden im Folgenden Hypothesen zum Einfluss von Bindungsstilen auf Marketing-Beziehungen entwickelt.

I. Persönlicher Bindungsstil Die Autoren untersuchen die Auswirkung des persönlichen Bindungsstils auf die Qualität der Beziehungen im Business-to-Consumer Bereich. Ausgehend von Hazan und Shaver (1987) wurde eine große Auswahl von Instrumenten zur Messung des Bindungsstils im Erwachsenenalter entwickelt. Die vorliegende Arbeit folgt der Empfehlung von Fraley und Waller (1998), wonach Bindung am besten dimensional statt mittels kategorialer Prototypenzuordnungen gemessen wird. Daher werden dimensionale Maße für „sichere“ und „ängstliche“ Bindungsstile verwendet. Sicher gebundene Kunden nehmen aufgrund ihrer internen Arbeitsmodelle von Anderen als generell guten Willens und als vertrauenswürdig, wie bereits oben dargelegt, tendenziell positive Bewertungen und positive Erklärung für Eigenschaften und Verhaltensweisen eines Anbieters vor. Diese positive Disposition sollte sich nicht nur bei Paarbeziehungen sondern auch in Marketingbeziehungen durch höhere Ausprägungen von Vertrauen, Zufriedenheit und Bindung im Laufe einer Geschäftsbeziehung manifestieren. Daher gehen die Autoren davon aus, dass sicher gebundene Kunden höheres Vertrauen, größere Zufriedenheit und stärkere Bindung in Beziehungen mit Unternehmen und Marken erreichen werden. Ängstliche Menschen hingegen haben innere Arbeitsmodelle des Selbst, in denen sie sich missverstanden, unsicher und unterschätzt fühlen. Diese Disposition sollte zu Beziehungen führen, die durch geringe Ausprägungen von Vertrauen, Bindung und Zufriedenheit gekennzeichnet sind. Weitere Forschungsarbeiten zu Bindungsstilen konnten zeigen, dass diese Effekte durch das Geschlecht moderiert werden: Bei Frauen zeigte sich ängstlicher Bindungsstil als dominante Einflußgröße von Beziehungsqualität, während bei Männern Beziehungsqualität durch den sichereren Bindungsstil oder besser den Grad der sicheren Bindung determiniert wird (Collins / Read 1990; Feeney / Noller / Callan 1994; Feeney 1999). Daher wird postuliert:

Konsumentenheterogenität im Beziehungsmarketing

203

H1: Es besteht ein positiver Zusammenhang zwischen dem sicheren persönlichen Bindungsstil und Zufriedenheit, Vertrauen und Loyalität in Geschäftsbeziehungen bei männlichen Konsumenten. H2: Es besteht kein Zusammenhang zwischen dem sicheren persönlichen Bindungsstil und Zufriedenheit, Vertrauen und Loyalität in Geschäftsbeziehungen bei weiblichen Konsumenten. H3: Es besteht ein negativer Zusammenhang zwischen dem ängstlichen persönlichen Bindungsstil und Zufriedenheit, Vertrauen und Loyalität in Geschäftsbeziehungen bei weiblichen Konsumenten. H4: Es besteht kein Zusammenhang zwischen dem ängstlichen persönlichen Bindungsstil und Zufriedenheit, Vertrauen und Loyalität in Geschäftsbeziehungen bei männlichen Konsumenten.

II. Kunden-Bindungsstil Nach der ursprünglichen Definition von Bowlby (1980) wird Bindungsstil als ein Persönlichkeitszug betrachtet, den eine Person während der Kindheit entwickelt und der das Verhalten in späteren Beziehungen prägt. Mehrere Studien konnten jedoch nur eine geringe Reliabilität und Konsistenz von Bindungsstilen über verschiedene Beziehungsformen (z. B. Mutter, Vater, Freunde) hinweg feststellen (z. B. Asendorpf / Wilpers 2000; Baldwin et al. 1996; Crowell / Fraley / Shaver 1999). Gleichzeitig konnte lediglich eine moderate zeitliche Stabilität (Feeney / Noller / Callan 1994; Kirkpatrick / Hazan 1994) nachgewiesen werden. Der aktuelle Stand der Forschung postuliert daher, dass Menschen sowohl globale als auch beziehungsspezifische Modelle von ihrer engen Beziehungen besitzen (Collins / Read 1994; Crittenden 1990; Pierce / Lydon 2001). Da Bindungsstile beziehungsspezifischen Charakter besitzen, entwickeln wir ein spezifisches Messinstrument zur Erfassung des Bindungsstils in Geschäftsbeziehungen. In einem ersten Schritt zur Übertragung des Bindungsstil-Konstrukts auf den Konsumentenbereich konzentrieren wir uns dabei auf den Bindungsstil, der für den Bereich des Beziehungsmarketings am relevantesten erscheint: Den sicheren Bindungsstil. Obwohl Geschäftsbeziehungen einen anderen Beziehungsbereich repräsentieren als persönliche Beziehungen, erwarten wir eine beziehungsübergreifende Konsistenz sicheren Bindungsstils zwischen geschäftlichen und persönlichen Beziehungen. H5: Es besteht ein positiver Zusammenhang zwischen sicherem persönlichen Bindungsstil und sicherem Kunden-Bindungsstil. Die nächste Hypothese befasst sich mit dem Einfluss des sicheren Kunden-Bindungsstils auf Schlüsselkonstrukte des Beziehungsmarketings. In Anlehnung an den sicheren Bindungsstil in persönlichen Beziehungen postulieren wir, dass sicherer Kunden-Bindungsstil zu höheren Ausprägungen auf den Schlüsselvariablen Vertrauen, Zufriedenheit und Bindung in Business-to-Consumer-Beziehungen füh-

204

Marcel Paulssen und Susan Fournier

ren sollte. Da die Skala zur Messung von Kunden-Bindungsstil neu ist und Erklärungen für geschlechtsspezifische Effekte in persönlichen Beziehungen auf Geschlechtsrollen-Korrespondenz basieren (Collins / Read 1990; Feeney 1999), sehen wir keinen Grund zur Annahme eines geschlechtsspezifischen Effektes bei Kunden-Bindungsstilen. Trotzdem werden wir die Existenz geschlechtsspezifischer Unterschiede testen. H6: Es besteht ein positiver Zusammenhang zwischen sicherem Kunden-Bindungsstil und Zufriedenheit, Vertrauen und Loyalität.

Persönlicher Bindungsstil Ängstlich

Kunden-Bindungsstil H5+

Sicher

Sicher

Geschlecht

H1 H2

Marketing Beziehung Vertrauen

+ Loyalität

H3 H4

Zufriedenheit

H6+

+

Abbildung 2: Auswirkung des Bindungsstils auf Konstrukte des Beziehungsmarketing

III. Zusammenhang zwischen Zufriedenheit, Vertrauen und Loyalität Die Zusammenhänge zwischen Zufriedenheit, Vertrauen und Loyalität stehen nicht im Mittelpunkt dieser Studie. Der Zusammenhang zwischen Zufriedenheit und Loyalität wurde in einer Vielzahl von Studien untersucht und hat in verschiedensten Produkt- und Dienstleistungsbereichen empirische Bestätigung gefunden (Fornell et al. 1996; Szymanski / Henard 2001). Entsprechend sind die Aussagen zum positiven Zusammenhang zwischen Vertrauen und Loyalität überwiegend übereinstimmend (z. B. Geyskens / Steenkamp / Kumar 1999; Morgan / Hunt 1994). Wir verzichten daher darauf, in dieser Studie nochmals Hypothesen zu diesen Zusammenhängen zu postulieren, zu überprüfen und zu diskutieren.

Konsumentenheterogenität im Beziehungsmarketing

205

E. Methode I. Untersuchungsaufbau und Entwicklung des Messinstruments Die Automobilindustrie schien uns ein geeignetes Umfeld zur Untersuchung von Kundenheterogenität in Kundenbeziehungen, da die Produktkategorie durch hohes Involvement und eine weite Verbreitung von Beziehungsmarketing-Aktivitäten gekennzeichnet ist (Johnson et al. 1997). Die vorliegende Arbeit untersucht zwei Beziehungen in diesem Kontext: Beziehungen zwischen Konsumenten und deren Automarken sowie Beziehungen zwischen Konsumenten und deren Autohändlern. Wie bereits weiter oben ausgeführt, haben wir ein dimensionales Maß verwendet, um persönlichen Bindungsstil zu erfassen. Der Grossteil der veröffentlichten Studien mit dimensionalen Bindungsmaßen verwendet leider explorative Skalen-validierungstechniken (z. B. Collins / Read 1990). Eine der wenigen Anwendungen konfirmatorischer Analysen stellt die Studie von Sandford (1997) dar. Allerdings verfügt etwa die Hälfte der verwendeten Items lediglich über IndikatorReliabilitäten von unter 20. Daher sahen wir uns gezwungen, eine eigene Skala zur Messung persönlicher Bindungsstile zu entwickeln. Auf Basis der Skalen von Collins und Read (1990), Sanford (1997) und Asendorpf et al. (1997) haben wir einen vorläufigen Item-Pool erstellt. Anhand eines weiter unten beschriebenen Pretests wurden dann aus diesem Pool die endgültigen Items ausgewählt. Den Empfehlungen von Kassarjian und Sheffet (1991) folgend entwickelten wir unser eigenes Instrument zur Messung des Kunden-Bindungsstils. Wie schon zuvor fokussieren wir uns auf den sicheren Bindungsstil. In einem ersten Schritt wurden vier Fokusgruppen gebildet, in denen sich insgesamt 29 Kunden einer Automarke befanden. Alle Mitglieder der Fokusgruppen erhielten eine Aufwandsentschädigung für ihre Teilnahme. Zuerst wurden Teilnehmer gebeten, über ihre Automarke und ihren Autohändler zu sprechen, um ein tieferes Verständnis der Art der Bindung dieser potentiellen Beziehungspartner zu erlangen. Ähnlich wie bei den zitierten Studien aus dem Marketingbereich, beobachteten wir eine erhebliche Heterogenität in den Fokusgruppen. Einige Teilnehmer gaben an, dass Zuneigung und Bindung sich auf persönliche Beziehungen beschränken und in Beziehungen zu Produkten nicht existieren. Andere Teilnehmer hingegen empfanden eine starke Bindung zu ihrer Fahrzeugmarke und verwendeten Metaphern aus persönlichen Beziehungen, um die Art ihrer Bindung zu beschreiben: „Ist ein Partner, der 100 % zuverlässig ist“, „Ich habe schlechte Erfahrungen gemacht als ich fremdgegangen bin“, „Ich liebe mein Fahrzeug“, „Ich fühle mich der Marke zugehörig“, „Bietet Sicherheit“ usw. Auf der Basis dieser Ergebnisse und einer Literaturrecherche wurde ein vorläufiger Fragenbogen konstruiert. Der anfängliche Item-Pool zur Messung relevanter Konstrukte (Bindungsstil, Vertrauen, usw.) wurde von verschiedenen Experten (zwei Wissenschaftlern und vier Praktikern aus dem Automobilbereich) überprüft, um Verständlichkeit und Augenschein-Validität zu gewährleisten. Die Experten beurteilten Verständlichkeit und Übereinstimmung zwischen

206

Marcel Paulssen und Susan Fournier

Items und den entsprechenden Konstrukten, die die jeweiligen Items erfassen sollten. Items mit geringer Übereinstimmung oder geringer Verständlichkeit wurden entweder umformuliert oder eliminiert. Diese Ausgangsversion der Skala wurde, wie weiter unten noch dargelegt, in einem Pretest mit 20 Teilnehmern aus dem Kundenstamm des Herstellers überprüft. Basierend auf Item-zu-Total Korrelationen wurden noch einige Items umformuliert oder entfernt.

F. Datenerhebung Mit der Datenerhebung wurde ein etabliertes Marktforschungsunternehmen beauftragt. Insgesamt wurden 643 Telefonbefragungen mit Privatkunden eines Automobilherstellers durchgeführt. Die Probanden wurden zufällig aus einer internen Kundendatenbank des kooperierenden Herstellers gezogen. Aufgrund von Kundenbeschwerden über den persönlichen Charakter einiger Fragen zum Bindungsstil wurden die entsprechenden Items zur Erfassung des persönlichen Bindungsstils eliminiert, nachdem bereits 283 von insgesamt 643 zu führenden Gesprächen durchgeführt waren. Das Durchschnittsalter lag bei 54,22 Jahren (Standardabweichung ˆ 12,61). 82 % der Teilnehmer waren Männer. Zehn Prozent der Teilnehmer besaßen mehr als ein Fahrzeug des Automobilherstellers. Die Dauer der Geschäftsbeziehung zwischen den Studien-Teilnehmern und dem Automobilunternehmen wurde von den Teilnehmern geschätzt und betrug im Durchschnitt über alle Teilnehmer 10,65 Jahre (Standardabweichung ˆ 9,65).

G. Ergebnisse I. Validierung des Bindungs-Maßes 1. Persönliche Bindungsstile Prüfungen univariater und multivariater Schiefe und Wölbung legten die Existenz nicht-normalverteilter Daten nahe. Daher wurden alle Modelle mit MPLUS geschätzt, da im MLM-Schätzer die Satorra-Bentler-Korrektur implementiert ist (Satorra / Bentler 1988; Fouladi 2000). Der Empfehlung Sanfords (1997) folgend, wurde eine zweifaktorielle Lösung mit den von ihm als „Nähe“ und „Ängstlichkeit“ bezeichneten Dimensionen getestet. In der vorliegenden Studie zeigt das zweifaktorielle Modell von Sanford eine gute Anpassung des Modells mit 2 …43† ˆ 84:23 (p ˆ 0:00), RMSEA ˆ 0.058 und CFI ˆ 0.89. Weiter wurden zwei Items der „Nähe“-Dimension mit Indikator-Reliabilitätswerten unter 0.25 und substantiellen Modifikations-Indices2 auf der „Ängstlichkeit“-Dimension, was auf hohe 2 Es wurde mit dem Ml-Schätzer modelliert, da der Mlm-Schätzer keinen Modifikationsindex anbietet.

Konsumentenheterogenität im Beziehungsmarketing

207

Kreuzladungen hinwies, eliminiert. Das endgültige Modell zeigte eine hervorragende Anpassung – 2 …26† ˆ 34:36 (p ˆ 0:13), RMSEA ˆ 0.034 und CFI ˆ 0.97 – bei den Bindungsdimensionen „Nähe“, „Ängstlichkeit“ (vgl. Feeney, Noller und Callahan 1994). Die Dimension „Nähe“ wurde in „Sicher“ umbenannt, weil sie konzeptionell dem sicheren Typ von Hazan und Shaver (1987) entspricht. Die Korrelation zwischen den Dimensionen „Sicher“ und „Ängstlichkeit“ war negativ mit  ˆ 0:43 und stimmte damit mit Befunden vergleichbarer Studien (z. B. Feeney, Noller und Callahan 1994; Shaver, Belsky und Brennan 2000) überein. 2. Bindungsstil bei Konsumenten Bei der Entwicklung von Skalen zur Erfassung des Kunden-Bindungsstils wählten wir ein generelles Maß, d. h. Kunden-Bindungsstil wurde zu Unternehmen bzw. Marken im allgemeinen gemessen. Eine immer wieder geäußerte Kritik der sozialpsychologischen Bindungsforschung lautet, dass Beurteilungen beziehungsspezifischer Bindungsdimensionen (z. B. „Es fällt mir leicht, mich auf meinen Partner zu verlassen“) und beziehungsspezifischer Erfahrungen (z. B. „Ich bin davon überzeugt, dass mein Partner mich in Zukunft fair behandeln wird“) Teil eines semantischen Netzwerks sind und es daher trivial ist, wenn diese Konstrukte miteinander korreliert sind (Hazan und Shaver 1990; Asendorpf und Wilpers 2000). In dieser Arbeit bekamen die Teilnehmer daher folgende Anweisung: „Denken Sie bitte über wichtige Beziehungen zu Anbietern, Unternehmen bzw. Marken nach, in denen Sie Kunde sind, etwa Ihre Beziehung zu Ihrer Bank, Ihrem Steuerberater, Ihrer Automarke, einem Fachgeschäft usw.“. Items wie z. B. „Es fällt mir leicht, mich auf meine Anbieter zu verlassen“ erfassten folglich keinen spezifischen Konsumentenbindungsstil innerhalb einer Beziehung zu einem spezifischen Unternehmen oder einer Marke, sondern einen allgemeinen Konsumentenbindungsstil. Wie bereits erwähnt, wurden nur Items zur Messung der „sicheren“ Dimension der Konsumentenbindung entwickelt (Siehe Anhang 1 für Dimensionen und Items). Das postulierte einfaktorielle Modell konnte aber anhand der Daten nicht bestätigt werden 2 …14† ˆ 211:19 (p ˆ 0:00), RMSEA ˆ 0.16 und CFI ˆ 0.75. Bei näherer Betrachtung zeigte sich, dass die geschätzten Lambda-Werte der Items, die eine Bereitschaft, sich auf Anbieter bzw. Unternehmen zu verlassen, messen sollten, sämtlich unter 0.46 lagen. Andere Items schienen eher ein allgemeines Bedürfnis nach engem persönlichen Kontakt mit Geschäftspartnern zu messen. Dieses Ergebnis weist darauf hin, dass sich der sichere Bindungsstil in Business-to-Consumer Beziehungen auf zweierlei Art manifestiert: Die „Sicher“-Dimension, die die Fähigkeit und Bereitschaft der Konsumenten, Marken und Unternehmen zu vertrauen, erfasst und die „Suche nach Nähe“-Dimension, die eine allgemeine Bereitschaft und den Wunsch des Konsumenten, persönliche Bindung und enge Beziehungen mit Unternehmen oder Mitarbeitern aufzubauen, erfasst. Daraufhin wurde ein zweifaktorielles Modell mit getrennten Dimensionen für „Sicher“ und „Suche nach Nähe“ getestet. Nach Eliminierung eines Items wies

208

Marcel Paulssen und Susan Fournier

das zweifaktorielle Modell eine sehr gute Anpassung auf: 2 …8† ˆ 13:81 (p ˆ 0:09), RMSEA ˆ 0.037 und CFI ˆ 0.99. Die Korrelation zwischen den zwei Dimensionen der Konsumentenbindung liegt bei 0.40 kann als Hinweis auf diskriminante Validität verstanden werden. Dieses Ergebnis bedeutet, dass man in Business-to-Consumer Beziehungen eine hohe Fähigkeit und Bereitschaft aufweisen kann, sich auf Unternehmen oder Marken zu verlassen, ohne gleichzeitig ein Bedürfnis nach emotionaler Nähe zu Mitarbeitern, Anbietern oder Marken zu haben. Dieses Ergebnis bestätigt die Annahme von Asendorpf und Wilpers (2000), dass die Struktur von Bindungsdimensionen über verschiedene Beziehungsbereiche variieren kann.

H. Modelltest I. Auswirkung von Bindungsstilen auf Geschäftsbeziehungen In diesem Abschnitt wird die Auswirkung des Bindungsstils auf die Konsumenten-Bewertung ihrer Beziehungen zu ihrer Automarke bzw. ihrem Autohändler überprüft. Aufgrund der angesprochenen Kundenbeschwerden ist die Anzahl der Fälle bei den Modellen zum persönlichen Bindungsstil niedriger als bei den Modellen zum Kunden-Bindungsstil. Darüber hinaus führten wir einen listenweisen Fallausschluss für fehlende Werte durch, wodurch sich die Anzahl der Fälle zwischen den Modellen der Automarke und Modellen für Autohändler unterscheidet.

1. Persönlicher Bindungsstil Um geschlechtsspezifische Hypothesen zur Auswirkung des persönlichen Bindungsstils auf Beziehungskonstrukte zu überprüfen, mussten Modelle für männliche und für weibliche Kunden geschätzt werden. Der Forschung zu Bindungsstilen aus der Sozialpsychologie folgend, erfassten wir zunächst die Korrelationen zwischen persönlichen Bindungsstilen und Beziehungsvariablen. Eine konfirmatorische Faktorenanalyse wurde für die männlichen Kunden von Automarke (N ˆ 214) und Autohändlern (N ˆ 195) gerechnet. Vertrauen und Loyalität wurden sowohl in Bezug auf die Marke als auch in Bezug auf die Autohändler erfasst. Zusätzlich wurde die Zufriedenheit mit dem Fahrzeug und dem Verkauf erhoben (Siehe Anhang A2 zu Items und Konstrukten). Sowohl das Modell für die Automarke als auch das Modell für die Autohändler hat einen guten Fit: 2 …142† ˆ 212.18 (p ˆ 0:00), RMSEA ˆ 0.048 und CFI ˆ 0.96 und 2 …94† ˆ 96:35 (p ˆ 0.41), RMSEA ˆ 0.011 und CFI ˆ 0.99.

Konsumentenheterogenität im Beziehungsmarketing

209

Tabelle 1 Persönliche Bindungsstile und Beziehungskonstrukte (Männliche Kunden)

Alle Signifikanztests sind zweiseitig. * p ˆ< 0:10, ** p < 0:05, *** p0:05 < 0:05.

H1: Die Beziehung zwischen sicherem Bindungsstil und zentralen Beziehungsvariablen konnte teilweise bestätigt werden. Im Automobilhändler-Modell sind alle Koeffizienten positiv, aber die Korrelation zwischen sicherer Bindung und Loyalität mit den Automobilhändlern ist mit ( ˆ 0.15, t ˆ 1.61) nicht signifikant. Im Marken-Modell ist lediglich die Korrelationen zwischen sicherem persönlichen Bindungsstil und Vertrauen mit ( ˆ 0.23, p < 0.10) signifikant (siehe Tabelle 1). Die Korrelationen zwischen sicherem persönlichen Bindungsstil und Zufriedenheit mit dem Fahrzeug ( ˆ 0.12, t ˆ 1.37) sowie Loyalität zur Automarke ( ˆ 0.13, t ˆ 1.28) sind positiv jedoch nicht signifikant. Einige nicht-signifikante Effekte können auf die Löschung der Fragen zum persönlichen Bindungsstil aufgrund von Kundenbeschwerden und der damit einhergehenden geringeren Fallzahl und Teststärke erklärt werden. So ist die bivariate Korrelation der Faktorwerte siche-ren Bindungsstils und Zufriedenheit mit dem Automobil bei erhöhter Fallzahl (N ˆ 274) signifikant (p < 0:05) mit r ˆ 0:13. Im Marken-Modell sowie im Händler-Modell war für männliche Kunden keine der Korrelationen zwischen Beziehungsvariablen und Ängstlichkeit signifikant (p-Werte > 0.10 für alle Korrelationen). H4 konnte damit bestätigt werden. Für weibliche Kunden konnte aufgrund der geringen Stichprobengrößen (51 im Marken-Modell und 36 im Händler14 FS Kaas

210

Marcel Paulssen und Susan Fournier

Modell) leider kein Strukturgleichungsmodell geschätzt werden. Daher berechneten wir Korrelationen von Faktorwerten für Bindungsdimensionen und Beziehungsvariablen. Die Faktorwerte für Ängstlichkeit korrelieren mit (r ˆ –0.23, p < 0:10) mit den Faktorwerten der Zufriedenheit mit dem Fahrzeug, und mit (r ˆ –0.27, p < 0:10) mit den Faktorwerten der Markenloyalität. Die Korrelation mit den Faktorwerten des Markenvertrauen ist zwar negativ aber mit (r ˆ –0.20, p > 0:10) nicht signifikant. Für das Händler-Modell lagen die Korrelationen zwischen Ängstlichkeit und Zufriedenheit mit dem Verkauf bei (r ˆ –0.35, p < 0:05), mit Vertrauen zum Händler bei (r ˆ –0.28, p < 0:10), und mit Loyalität zum Händler bei (r ˆ –0.13, p > 0:10). Trotz des kleinen Stichprobenumfangs und der Abschwächung durch Messfehler konnte H3 tendenziell bestätigt werden. Die Ergebnisse deuten auf einen ähnlichen geschlechtsspezifischen Effekt hin, wie er aus persönlichen Beziehungen bekannt ist. Bei weiblichen Kunden hatte Ängstlichkeit tendenziell einen negativen Effekt auf die zentralen Beziehungsvariablen Zufriedenheit, Vertrauen und Loyalität. Die Korrelationen zwischen den Faktorwerten für sichere Bindung und den Beziehungsvariablen waren weder für das Markennoch für das Händler-Modell signifikant, wodurch H2 bestätigt wurde. Die schwachen Korrelationen zwischen persönlichen Bindungsstilen und beziehungsspezifischen Konstrukten bei Konsumenten stimmen mit der Aussage von Kassarjian und Sheffet (1991) überein, dass Persönlichkeitsmerkmale schwache Prädiktoren von Konsumentenverhalten darstellen. In der sozial-psychologischen Literatur konnte die Beziehung zwischen Bindungsstilen und Beziehungsvariablen in der Regel in einem spezifischen Beziehungskontext und nicht über verschiedene Beziehungsbereiche hinweg Bestätigung finden. Aufgrund dessen und in Anbetracht der moderaten Konsistenz von Bindungsstilen zwischen verschiedenen Beziehungen sind unsere größtenteils bestätigten Hypothesen klare Indikatoren für die Relevanz von Bindungsstilen im Konsumentenverhalten. Konsistent mit Ergebnissen aus der Sozialpsychologie zeigte sich, dass bei weiblichen Kunden Ängstlichkeit die dominante Determinante von Beziehungsqualität darstellt, während bei männlichen Konsumenten sichere Bindung die dominante Determinante von Beziehungsqualität darstellt. Die signifikanten und geschlechtsspezifischen Effekte unterstützen die generelle Hypothese, dass die Bindungstheorie auf den Konsumkontext übertragen werden kann. Die während der Studie aufgetretenen Probleme (Kundenbeschwerden) bestätigen die Notwendigkeit und Sinnhaftigkeit der Entwicklung eines adäquaten Instruments zur Messung von Kunden-Bindungsstilen. 2. Persönlicher Bindungsstil und Kunden-Bindungsstil Obwohl es Unterschiede zwischen Geschäftsbeziehungen und persönlichen Beziehungen gibt, gehen wir in H5 davon aus, dass eine gewisse Konsistenz zwischen sicherem Bindungsstil in persönlichen Beziehungen und sicherem Kunden-Bindungsstil besteht. Zur Überprüfung von H5 wurde eine konfirmatorische Faktorenanalyse mit dem Konstrukt „sichere persönliche Bindung“ und den zwei Facetten

Konsumentenheterogenität im Beziehungsmarketing

211

zur Konsumentenbindung, „Sicherheit“ und „Suche nach Nähe“, durchgeführt. Die Modellanpassung ist gut: 2 …41† ˆ 51:39 (p ˆ 0:13), RMSEA ˆ 0.031 und CFI ˆ 0.98. Es besteht eine signifikante positive Korrelation mit ( ˆ 0:19, p < 0:05) zwischen dem sicheren persönlichen Bindungsstil und dem sicheren Bindungsstil des Konsumenten. Tabelle 2 Konsumbindungsstil und Beziehungskonstrukte

Alle Signifikanztests sind zweiseitig. *p < 0.10, **p < 0.05, ***p < 0.01.

Die Korrelation zwischen der Facette Suche nach Nähe und sicherer persönlicher Bindung ist positiv, jedoch nicht signifikant mit ( ˆ 0:08, p > 0:10). In unserem Fall wurde eine neue Skala zur Erfassung der Konsumentenbindung entwickelt. Daher kann eine geringere Konsistenz erwartet werden. Crowell, Fraley und Shaver (1999) berichten von einer durchschnittlichen Kongruenz in Höhe von 0.15 über verschiedene Beziehungsbereiche und verschiedene Messmethoden für persönliche Beziehungen. In diesem Bereich liegt auch die Korrelation zwischen sicherem persönlichem und sicherem Kunden-Bindungsstil. H5 und die Annahme, dass eine Konsistenz zwischen Bindung in persönlichen Beziehungen und Bindung in Konsumentenbeziehungen besteht, kann daher nur teilweise bestätigt werden. 14*

212

Marcel Paulssen und Susan Fournier

3. Kunden-Bindungsstil H6, die sich mit dem Einfluss der Konsumenten-Bindung auf Beziehungskonstrukte befasst, wurde für beide Beziehungsarten getestet (Siehe Tabelle 2). Sowohl das Marken-Modell (N ˆ 492) –2 …94† ˆ 153:82 (p ˆ 0:00), RMSEA ˆ 0.036 und CFI ˆ 0.98 – als auch das Händler-Modell (N ˆ 350) –2 …55† ˆ 74:12 (p ˆ 0.04), RMSEA ˆ 0.032 und CFI ˆ 0.99 – zeigen eine hervorragende Anpassung. Im Marken-Modell hat sichere Konsumentenbindung sowohl einen starken Einfluss auf Zufriedenheit mit dem Fahrzeug ( 11 ˆ 0:39) als auch auf das Vertrauen in die Marke ( 21 ˆ 0:49). Der direkte Pfad auf Marken-Loyalität ist jedoch ( 31 ˆ 0:01) nicht signifikant (p > 0:10). Suche nach Nähe hat keine signifikante Auswirkung auf Zufriedenheit mit dem Fahrzeug, Vertrauen zur Marke und Marken-Loyalität. Der Einfluss von Vertrauen zur Marke und Zufriedenheit mit dem Fahrzeug auf Marken-Loyalität ist signifikant positiv ( 31 ˆ 0:49 und 32 ˆ 0:22). Die Ergebnisse für das Händler-Modell sind ähnlich. Sichere Konsumentenbindung besitzt einen starken Einfluss auf Zufriedenheit mit dem Verkauf ( 11 ˆ 0.47) und Vertrauen zum Händler ( 21 ˆ 0:51). Der Einfluss auf Loyalität zum Händler ist wiederum nicht signifikant. Suche nach Nähe besitzt einen negativen Einfluss auf Zufriedenheit mit dem Verkauf ( 12 ˆ 0:18) und einen signifikant positiven Einfluss auf Loyalität ( 32 ˆ 0:13). Der negative Einfluss ist vermutlich auf ein Multikollinearitätsproblem zurückzuführen, da beide Konstrukte einer konfirmatorischen Faktorenanalyse unkorreliert waren. Tatsächlich wird durch die Fixierung des Pfades von sicherem Bindungsstil auf Zufriedenheit mit dem Verkauf der Pfad von Suche nach Nähe auf Verkauf insignifikant ( 12 ˆ 0:03, t ˆ 0.57). Im Händler-Modell zeigt sich kein signifikanter Zusammenhang zwischen Zufriedenheit mit dem Verkauf und Loyalität zum Händler ( 31 ˆ 0:05). Dagegen besitzt Vertrauen zum Händler einen starken positiven Einfluss ( 32 ˆ 0:64) auf Loyalität zum Händler. Diese Befunde bestätigen klar H6 und unterstreichen die Bedeutung der sicheren Facette der Konsumentenbindung, denn sie beeinflusst Vertrauens- und Zufriedenheitswerte in beiden betrachteten Geschäftsbeziehungen. Die erklärte Varianz der Zufriedenheitswerte liegt zwischen 13 % (Fahrzeug) und 18 % (Verkauf). Die entsprechenden Werte für Vertrauen sind 21 % (Vertrauen zur Automarke) und 24 % (Vertrauen zum Händler). Abgesehen von einem positiven aber schwachen Effekt auf Loyalität zum Händler, hat die Suche nach Nähe keinen eigenen Einfluss. Obwohl in einer konfirmatorischen Faktorenanalyse sichere Konsumentenbindung in beiden Beziehungsarten signifikant positiv mit Loyalität korrelierte, ließ sich kein direkter Einfluss auf Loyalität nachweisen. Die Wirkung von Kunden-Bindungsstil auf Loyalität wird folglich über Zufriedenheitsurteile und Vertrauen mediiert. In getrennten Modellen für männliche und weibliche Konsumenten zeigten sich keine nennenswerten Unterschiede.

Konsumentenheterogenität im Beziehungsmarketing

213

I. Diskussion und Empfehlungen für die Praxis Wir haben die Bindungstheorie, die individuelles Verhalten in engen persönlichen Beziehungen erklären kann, auf den Konsumkontext angewendet, um Kundenheterogenität beim Verhalten in Marketingbeziehungen zu erklären. Trotz der hohen theoretischen und praktischen Relevanz dieser Forschungsfrage existieren in der Literatur bisher größtenteils deskriptive Ansätze zum Thema Kundenheterogenität in Business-to-Consumer Beziehungen. Der zentrale Beitrag der vorliegenden Arbeit liegt daher in der Entwicklung eines theoretischen Erklärungsansatzes für Kundenheterogenität im Business-to-Consumer-Kontext. Unsere Ergebnisse zeigen, dass die Bindungstheorie erfolgreich auf Kundenbeziehungen übertragen werden kann. Männer, die in ihren persönlichen Beziehungen zu Partnern sicher gebunden sind, zeigten auch in ihren Beziehungen zu Automarke und Autohändler ein größeres Maß an Zufriedenheit, Vertrauen und Loyalität. Für weibliche Kunden hingegen erwies sich der ängstlich-vermeidende Bindungsstil als die wesentliche Determinante von Qualität und Stärke von Marketingbeziehungen. Die aus dem Bereich persönlicher Beziehungen bereits bekannten Moderatoreffekte des Geschlechts konnten in Kundenbeziehungen repliziert werden. Die statistischen Beziehungen, die in Verbindung mit diesen Befunden ermittelt wurden sind zwar eher schwach, müssen aber im Kontext der unterschiedlichen Verhaltensbereiche, die sie überbrücken, interpretiert werden: Der Bindungsstil in Partnerbeziehungen führt zu Unterschieden in Beziehungen zu Unternehmen und Marken. Wie die erwähnten Kundenbeschwerden in unserer Untersuchung zeigte, ist die Anwendbarkeit persönlicher Bindungsstile auf praktische Problemstellungen begrenzt. Konsistent mit anderen Befunden zu Persönlichkeitsvariablen (siehe Kassarjian und Sheffet 1991) hat der persönliche Bindungsstil nur eine geringe Erklärungsstärke für die Bewertung von Beziehungsqualität im Konsumkontext. Die Autoren haben daher eine Skala zur Messung des Bindungsstils für den Konsumkontext entwickelt. Zwei Facetten sicherer Konsumentenbindung wurden empirisch abgeleitet. Die Facette „Sicherheit“ misst die Fähigkeit und Bereitschaft der Konsumenten, sich auf Marken und Unternehmen zu verlassen bzw. Marken und Unternehmen zu vertrauen; die Facette „Suche nach Nähe“ misst den Wunsch der Konsumenten und deren Motivation, persönliche Beziehungen mit Marken oder Mitarbeitern eines Unternehmens aufzubauen. Sichere Konsumentenbindung wirkt positiv auf Zufriedenheit, Vertrauen und Loyalität in Konsumentenbeziehungen. Die erklärte Varianz der Beziehungskonstrukte war eindeutig höher als für persönliche Bindung und kann für eine Persönlichkeitsvariable mit circa 20 % als hoch gelten. Zusammenfassend kann festgehalten werden: Sicher gebundene Kunden bauen starke Beziehungen zu Unternehmen und Marken auf, die durch ein hohes Maß an Zufriedenheit, Vertrauen und Loyalität gekennzeichnet sind. Die Facette „Suche nach Nähe“ erfasst die Präferenz und Motivation des Konsumenten, enge, persönliche Beziehungen zu einem Unternehmen oder dessen Mitarbeitern einzugehen. Praktische Relevanz ergibt sich durch den Einfluss auf die

214

Marcel Paulssen und Susan Fournier

Präferenz von Beziehungsmarketing-Aktivitäten. In einer kürzlich veröffentlichten Studie konnten De Wulf, Odekerken-Schröder und Iacobucci (2001) zeigen, dass interpersonale Kommunikation die Hauptdeterminante wahrgenommenen Beziehungs-Investments ist. Sie empfehlen daher Handelsunternehmen, bei der Einstellung von neuem Personal auf deren soziale Interaktionsfähigkeit (z. B. Fähigkeit, persönliche Gefühle zeigen) in Bezug auf Zielkunden zu achten. Die vorliegende Studie zeigt jedoch, dass nicht alle Kunden diese Art des Beziehungsaufbaus bevorzugen (siehe auch Barnes 1997, Price / Arnould 1999). In der Gruppe von Kunden, bei denen Suche nach Nähe unterdurchschnittlich ausgeprägt war, beurteilten 19 % die Maßnahme „Einladung zur Gesprächen mit Unternehmensführung oder Entwicklern über Erfahrungen, Wünsche und Ideen“ als ärgerlich oder nicht nötig, 40 % hatten daran schlichtweg kein Interesse.

J. Einschränkungen und weiterer Forschungsbedarf Unsere Ergebnisse sind vielsprechend und können als Ausgangspunkt weiterer Forschung mit dem Ziel, bindungstheoretische Ideen und Konzepte in den Beziehungsmarketing-Bereich zu übertragen, gesehen werden. Eine Replikation der berichteten Ergebnisse in anderen Marketingbereichen, so etwa Business-to-Business Beziehungen oder anderen Business-to-Consumer Beziehungen, bspw. im Servicebereich wäre ein sinnvoller nächster Schritt. Eine Einschränkung der Studie, die gleichzeitig ein vielversprechendes Forschungsfeld darstellt, liegt in der Messung von Bindungsstilen im Konsumkontext. In der vorliegenden Studie haben wir uns auf die Messung sicherer Konsumenten-Bindung beschränkt. Weitere Arbeiten sollten sich tiefergehend mit den Parallelen und Unterschieden zwischen Bindung in persönlichen und Bindung in Konsumentenbeziehungen beschäftigen. Das Modell von Bartholomew und Horowitz (1991) mit den beiden Dimensionen – Modell des Selbst und Modell von Anderen könnte dafür als Ausgangspunkt dienen. Weitere Einschränkungen der vorliegenden Studie müssen eingeräumt werden. Wir haben ein globales Maß für Vertrauen verwendet und konnten damit den Einfluss von Bindungsstilen auf einzelne Facetten von Vertrauen nicht untersuchen (z. B. Collins / Read 1990). Ein weitere Einschränkung dieser Studie besteht darin, dass wir ein Querschnittsdesign verwendet haben und daher Common-method-bias die untersuchten Zusammenhänge beeinflusst haben könnte. Ähnlich verhält es sich mit der Messung von Loyalität. Aufgrund des Querschnittdesigns konnte nur intentionale Loyalität gemessen werden. Der Einfluss von Bindungsstilen auf tatsächliche Loyalität und damit Beziehungsstabilität sollte darüber hinaus im Rahmen einer Längsschnittstudie untersucht werden. Die Ergebnisse der vorliegenden Studie zeigen, dass sicher gebundene Kunden zufriedenstellendere, und vertrauensvollere und damit loyalere Beziehungen zu ihrer Automarke und ihren Autohändlern besitzen als unsicher gebundene Kunden. Allerdings besitzt die Aussage von Simpson, Rholes und Nelligan (1992, S. 444):

Konsumentenheterogenität im Beziehungsmarketing

215

„Little, however, is known about what kinds of specific patterns of interaction might generate these global effects“ im Marketingkontext ebenfalls Gültigkeit. In einem nächsten Schritt sollte sich die Forschung mit den Mechanismen beschäftigen, die für die in dieser Studie beobachteten Effekte von Bindungsstilen verantwortlich sind. Jüngere Forschung im Bereich der Sozialpsychologie konnte zeigen, dass die Bindungstheorie eine Vielzahl individueller Unterschiede bei sozialen Bewertungen erklären kann, die für die auch in dieser Studie gezeigten, globalen Effekte verantwortlich sind (z. B. Shaver / Mikulincer 2003). Forschung zu Bindungsstilen in persönlichen Beziehungen konnte unterschiedliche Strategien bei der Bewältigung von Vertrauensverletzungen nachweisen. Sicher gebundene Individuen neigen dazu, Vertrauensverletzungen als unwichtig und ohne Bezug zur Persönlichkeit des Partners zu beurteilen und reagieren daher eher konstruktiv auf solche Vertrauensverletzungen (Gaines et al. 2000; Mikulincer 1998). Diese Ergebnisse weisen darauf hin, dass ein attributionstheoretischer Ansatz Unterschiede zwischen sicher und unsicher gebundenen Kunden bei Zufriedenheit und Aufbau von Vertrauen erklären könnte. Damit könnte man der Aufforderung Weiners (2000), sich in der Konsumentenverhaltensforschung wieder verstärkt mit der Attributionstheorie zu beschäftigen, folgen und frühe Arbeiten von Folkes (1984, 1988) weiterführen.

Literatur Ainsworth, Mary D. / Blehar, Marc C. / Waters, Everett / Wall, Sally (1978): Patterns of attachment: A psychological study of the strange situation, 1. Aufl. Ainsworth, Mary D. / Bowlby, John (1991): An ethological approach to personality development, in: American Psychologist, Vol. 46, S. 331 – 341 Asendorpf, Jens B. / Banse, Rainer / Wilpers, Susanne / Neyer, Franz J. (1997): Beziehungsspezifische Bindungsskalen für Erwachsene und ihre Validierung durch Netzwerk- und Tagebuchverfahren, in: Diagnostica, Vol. 43, S. 289 – 313 Asendorpf, Jens B. / Wilpers, Susanne (2000): Attachment security and available support: Closely linked relationship qualities, in: Journal of Social and Personal Relationships, Vol. 17, S. 115 – 138 Baldwin, Mark. W. / Keelan, John P. R. / Fehr, Beverley / Enns, Vicki / Koh-Rangarajoo, Evelyn (1996): Social-cognitive conceptualization of attachment working models: Availability and accessibility effects, in: Journal of Personality and Social Psychology, Vol. 71, S. 94 – 109 Ball, Dwayne A. / Tasaki, Lori H. (1992): The role and measurement of attachment in consumer behavior, in: Journal of Consumer Psychology, Vol. 1, S. 155 – 172 Barnes, James G. (1997): Closeness, strength, and satisfaction: Examining the nature of relationships between providers of financial services and their retail customers, in: Psychology & Marketing, Vol. 14, S. 765 – 790 Bartholomew, Kim (1990): Avoidance of intimacy: An attachment perspective, in: Journal of Social and Personal Relationships, Vol. 7, S. 147 – 178

216

Marcel Paulssen und Susan Fournier

Bartholomew, Kim / Horowitz, Leonard (1991): Attachment styles among young adults: A test of a four-category model, in: Journal of Personality and Social Psychology, Vol. 61, S. 226 – 224 Belk, Russell W. (1988): Possessions and the extended self, in: Journal of Consumer Research, Vol. 2, S. 157 – 164 Bendapudi, Neeli / Berry, Leonard L. (1997): Customers’ motivations for maintaining relationships with service providers, in: Journal of Retailing, Vol. 73, S. 15 – 37 Berlin, Lisa J. / Cassidy, Jude (1999): Relations among relationships–Contribution from attachment theory and research, in: Cassidy, Jude / Shaver, Philip R. (Hrsg.), Handbook of attachment – Theory, research, and clinical applications, 1. Aufl., S. 688 – 712 Bland, Martin (2000): An introduction to medical statistics, 3. Aufl. Bowlby, John (1973): Attachment and loss: Vol. 2. Separation: Anxiety, and anger, 1. Aufl. – (1980): Attachment and loss: Vol. 3. Loss: Sadness and depression, 1. Aufl. – (1982): Attachment and loss: Vol. 1. Attachment, 2. Aufl. – (1988): A secure base: Clinical applications of attachment theory, 1. Aufl. Brennan, Kelly A. / Clark, Catherine L. / Shaver, Phillip R. (1998): Self-report measurement of adult attachment: An integrative overview, in: Simpson, Jeffry A. / Rholes, Steven W. (Hrsg.), Attachment theory and close relationships, 1. Aufl., S. 46 – 76 Collins, Nancy L. / Read, Stephen J. (1990): Adult attachment, working models, and relationships quality in dating couples, in: Journal of Personality and Social Psychology, Vol. 58, S. 644 – 663 – (1994): Cognitive representations of attachment: The structure and function of working models, in: Bartholomew, Kim / Perlman, D. (Hrsg.)., Advances in personal relationships, Vol. 5, S. 53 – 90 Crittenden, Patricia M. (1990): Internal representational models of attachment relationships, in: Infant Mental Health Journal, Vol. ll, S. 259 – 277 Crowell, Judith A. / Fraley, R. Chris / Shaver, Phillip R. (1999): Measures of individual differences in adolescent and adult attachment, in: Cassidy, Jude / Shaver, Phillip R. (Hrsg.), Handbook of attachment: Theory, research, and clinical applications, 1. Aufl., S. 434 – 465 De Wulf, Kristof / Odekerken-Schröder, Gaby / Iacobucci, Dawn (2001): Investments in consumer relationships: A cross-country and cross-industry exploration, in: Journal of Marketing, Vol. 65, S. 33 – 50 Dowling, Grahame R. / Uncles, Mark (1997): Do customer loyalty programs really work?, in: Sloan Management Review, Vol. 38, S. 71 – 82 Feeney, Judith A. (1999): Adult romantic attachments and couple relationships, in: Cassidy, Jude / Shaver, Philipp R. (Hrsg.), Handbook of attachment: Theory, research and clinical applications, S. 355 – 377 Feeney, Judith A. / Noller, Patricia / Callan, Victor J. (1994): Attachment style, communication and satisfaction in the early years of marriage, in: Advances in Personal Relationships, Vol. 5, S. 269 – 308 Folkes, Valerie S. (1984): Consumer reactions to product failure–An attributional approach, in: Journal of Consumer Research, Vol. 10, S. 398 – 409

Konsumentenheterogenität im Beziehungsmarketing

217

Folkes, Valery S. (1988): Recent attribution research in consumer behavior – A review and new directions, in: Journal of Consumer Research, Vol. 14, S. 548 – 565 Fornell, Claes / Johnson, Michael D. / Anderson, Eugene W. / Cha, Jaesung / Bryant, Barbara E. (1996): The American customer satisfaction index: Nature, purpose and findings, in: Journal of Marketing, Vol. 60, S. 7 – 18 Fouladi, Rachel T. (2000): Performance of modified test statistics in covariance and correlation structure analysis under conditions of multivariate normality, in: Structural Equation Modeling, Vol. 7, S. 356 – 410 Fournier, Susan (1998): Consumers and their brands: Developing relationship theory in consumer research, in: Journal of Consumer Research, Vol. 24, S. 343 – 373 Fraley, R. Chris / Waller, Niels G. (1998): Adult attachment patterns: A test of the typological model, in: Simpson, Jeffry A. / Rholes, Steven W. (Hrsg.), Attachment theory and close relationships, 1. Aufl., S. 77 – 114 Gaines, Stanley O. Jr. / Work, Cecily / Johnson, Helena / Youn Page, Mary Sue / Lai, Kaycee (2000): Impact of attachment style and self-monitoring on individuals’ responses to accommodative dilemmas across relationship types, in: Journal of Social and Personal Relationships, Vol. 17, S. 767 – 789 Geyskens, Inge / Steenkamp, Jan-Benedict E. M. / Kumar, Nirmalya (1999): A meta-analysis of satisfaction in marketing channel relationships, in: Journal of Marketing Research, Vol. 36, S. 223 – 238 Hazan, Cindy / Shaver, Phillip R. (1987): Romantic love conceptualized as an attachment process, in: Journal of Personality and Social Psychology, Vol. 52, S. 511 – 524 – (1990): Love and work: An attachment-theoretical perspective, in: Journal of Personality and Social Psychology, Vol. 59, S. 270 – 280 Johnson, Michael D. / Herrmann, Andreas / Huber, Frank / Gustafsson, Anders (1997): Customer Retention in the Automotive Industry: Quality, Satisfaction and Loyalty 1. Aufl. Johnson, Allison R. / Thomson, Matthew T. (2003): Are consumer relationships different?, in: Advances in Consumer Research, Vol. 30, S. 350 Kassarjian, Harold H. / Sheffet, Mary J. (1991): Personality and consumer behavior: An update, in: Robertson, Thomas S. / Kassarjian, Harold H. (Hrsg.), Handbook of consumer behavior, 1. Aufl., S. 281 – 301 Kirkpatrick, Lee A. / Hazan, Cindy (1994): Attachment styles and close relationships: A four year propective study, in: Personal Relationships, Vol. 1, S. 123 – 142 Mikulincer, Mario (1998): Attachment working models and the sense of trust: An exploration of interaction goals and affect regulation, in: Journal of Personality and Social Psychology, Vol. 74, S. 1209 – 1224 Mikulincer, Mario / Shaver, Philipp R. (2003): The attachment behavioral system in adulthood: Activation, psychodynamics, and Interpersonal processes, in: Zanna, Mark P. (Hrsg.), Advances in experimental social psychology, Vol. 35 , S. 53 – 152 Morgan, Robert M. / Hunt, Shelby (1994): The commitment-trust theory of relationship marketing, in: Journal of Marketing, Vol. 58, S. 20 – 38

218

Marcel Paulssen und Susan Fournier

Odekerken-Schröder, Gaby / De Wulf, Kristof / Schumacher, Patrick (2003): Strengthening outcomes of retailer-consumer relationships. The dual impact of relationship marketing tactics and consumer personality, in: Journal of Business Research, Vol. 56, S. 177 – 190 Pierce, Tamarha / Lydon, John E. (2001): Global and specific relational models in the experience of social interactions, in: Journal of Personality and Social Psychology, Vol. 80, S. 613 – 631 Price, Linda L. / Arnould, Eric J. (1999): Commercial Friendships: Service Provider-Client Relationships in Context, in: Journal of Marketing, Vol. 63, S. 38 – 56 Reinartz, Werner J. / Kumar, V. (2003): The impact of customer relationship characteristics on profitable lifetime duration, in: Journal of Marketing, Vol. 67, S. 77 – 99 Sanford, Keith (1997): Two dimensions of adult attachment: Further validation, in: Journal of Social and Personal Relationships, Vol. 14, S. 133 – 143 Satorra, Albert / Bentler, Peter M (1988): Scaling corrections for chi-square statistics in covariance structure analysis, in: Proceedings of the Business and Economics Statistics Section of the American Statistical Association, S. 308 – 313 Shaver, Phillip R. / Belsky, Jay / Brennan, Kelly A. (2000): The adult attachment interview and self-reports of romantic attachment: Association across domains and methods, in: Personal Relationships, Vol. 7, S. 25 – 43 Shaver, Phillip R. / Collins, Nancy / Clark, Catherine L. (1996): Attachment styles and internal working models of self and relationship partners, in: Fletcher, Garth J. O. / Fitness, Julie (Hrsg.), Knowledge structures in close relationships: A social psychological approach., 1. Aufl., S. 25 – 61 Shaver, Philip R. / Mikulincer, Mario (2003): The psychodynamics of social judgments: An attachment theory perspective, in: Forgas, Joseph P. / Williams, Kipling D. / von Hippel, William, (Hrsg.), Social judgments: Implicit and explicit processes, 1. Aufl., S. 85 – 114 Sheth, Jagdish N. / Parvatiyar, Atul (1995): The Evolution of Relationship Marketing, in: International Business Review, Vol. 4, S. 397 – 418 Simpson, Jeffry A. (1990): Influence of attachment styles on romantic relationships, in: Journal of Personality and Social Psychology, Vol. 59, S. 971 – 980 Simpson, Jeffry A. / Rholes, William S. / Nelligan, Julia S. (1992): Support seeking and support giving within couples in an anxiety-provoking situation: The role of attachment styles, in: Journal of Personality and Social Psychology, Vol. 62, S. 434 – 446 Szymanski, David M. / Henard, David H. (2001): Customer satisfaction: A meta-analysis of the empirical evidence, in: Journal of the Academy of Marketing Science, Vol. 29, S. 16 – 35 Tabachnick, Barbara G. / Fidell, Linda S. (2000): Using multivariate statistics, 4. Aufl. Trinke, Shanna J. / Bartholomew, Kim (1997): Hierarchies of attachment relationships in young adulthood, in: Journal of Social and Personal Relationships, Vol. 14, S. 603 – 625 Weiner, Bernhard (2000): Attributional thoughts about consumer behavior, in: Journal of Consumer Research, Vol. 27, S. 382 – 387 Witkowski, Terrence H. / Thibodeau, Eric J. (1999): Personal bonding processes in international marketing relationships, in: Journal of Business Research, Vol. 46, S. 315 – 325

Konsumentenheterogenität im Beziehungsmarketing

219

Anhang 1 Konstrukte und Messung-Bindungsstile Standardisierte Ladung

Bindungsstil in Geschäftsbeziehungen Sicherheita)

0.71

Es fällt mir leicht, mich auf meinen Anbieter zu verlassen. Ich habe Schwierigkeiten, meinem Anbieter ganz zu vertrauen. (umkodiert) Auf meine Anbieter kann ich mich fast immer verlassen. Suche nach Nähe

0.91 0.47

0.83 0.22

0.59

0.35

a)

0.79

Ich versuche auch eine persönliche Beziehung zu meinem Anbieter oder dessen Mitarbeitern herzustellen. Ich finde es angenehm, eine persönliche Beziehung zu meinem Anbieter oder dessen Mitarbeitern zu haben. Ich finde es einfach zu meinem Anbieter oder dessen Mitarbeitern auch persönliche Beziehungen zu haben. Mir ist es wichtig, dass auch die persönliche Ebene zu meinen Anbieter oder dessen Mitarbeitern stimmt.

Bindungsstil in Partnerschaften

ItemUrsprung

0.67

0.45

0.79

0.62

0.77

0.59

entfernt

Standardisierte Ladung

Ängstlichkeita) Ich mache mir Sorgen, dass mein Partner mich verlassen könnte. Ich befürchte, von meinem Partner nicht akzeptiert zu werden. Ich sorge mich, dass mein Partner mich nicht so sehr schätzt, wie ich ihn schätze. Ich befürchte, dass mich meine Partner nicht wirklich liebt. Sicher

Item / Konstrukt Reliabilität

0.77 C, S

0.64

0.41

A

0.69

0.48

0.51

0.26

0.85

0.72

C, S

a)

Es fällt mir leicht, mich auf meine Partner / Innen zu verlassen. Ich finde es angenehm, meinem Partner gefühlsmäßig nahe zu sein. Wenn ich Probleme habe, sollte mein Partner für mich da sein. Ich verlasse mich gern auf meinen Partner.

Item / Konstrukt Reliabilität

0.75 A(ad)

0.46

0.21

A

0.76

0.58

A A, C(ad)

0.70 0.49

0.49 0.24

220

Marcel Paulssen und Susan Fournier

Fortsetzung Anhang 1 ItemUrsprung

Standardisierte Ladung

Ich habe Schwierigkeiten, meinem Partner ganz zu vertrauen.(recodiert)

A(ad), C, S

entfernt

Ich fühle mich unwohl, wenn mein Partner mir zu nahe kommt. (recodiert)

C, S

entfernt

Ich finde es einfach, meinem Partner nahe zu sein.

A, C, S

0.62

Bindungsstil in Partnerschaften

Item / Konstrukt Reliabilität

0.38

a) Items werden mit einer fünfstufigen Skala mit den Endpunkten „lehne völlig ab“ und „stimme völlig zu“ gemessen.

Alle Faktorladungen sind signifikant (p < 0:01). Kleinste t-Wert für persönliche Bindung = 4.52 und für Konsumentenbindung = 7.71. Ursprünge der Items: A = Asendorpf et al. (1997), C = Collins / Read (1990), S = Sanford (1997); (ad) bedeutet, dass das Item leicht umformuliert wurde.

Anhang 2 Konstrukte und Messung-Beziehungskonstrukte Beziehungskonstrukte Automarke: (Werte des Konsumentenbindungsmodell N ˆ 492)

Standardisierte Faktorladung

Loyalitäta)

Item / Konstrukt Reliabilität 0.91

Beim nächsten Kauf eines Fahrzeugs werde ich ein Fahrzeug der Marke X kaufen.

0.85

0.72

Wenn ich jetzt eines meiner Fahrzeuge ersetzen müsste (z. B. wegen Diebstahl, etc.), würde ich mich ein Fahrzeug von X wählen.

0.88

0.77

Ich werde der Marke X und ihren Fahrzeugen auch in Zukunft treu bleiben.

0.92

0.85

Zufriedenheit mit dem Fahrzeug

b)

0.79

Wie zufrieden sind Sie mit Ihren Fahrzeugen von X insgesamt?

0.49

0.24

Ich denke, dass ich mit den Fahrzeugen von X die absolut richtige Wahl getroffen habe.

0.83

0.69

Meine Erwartungen hinsichtlich der Fahrzeuge von X wurden voll und ganz erfüllt.

0.88

0.77

Konsumentenheterogenität im Beziehungsmarketing Beziehungskonstrukte Automarke: (Werte des Konsumentenbindungsmodell N ˆ 492)

Standardisierte Faktorladung

Vertrauenb) Ich glaube, dass ich in Zukunft von X fair behandelt werde. Ich bin der Überzeugung, dass X auch in Zukunft ein in jeder Hinsicht zuverlässiger Geschäftspartner sein wird. Ich glaube, dass X zukünfig die Beziehung zu mir effektiv und effizient gestaltet. Ich kann mich voll und ganz auf X verlassen.

Beziehungskonstrukte Händler: (Werte vom Konsumentenbindungsmodell N ˆ 337)

0.81

0.66

0.90

0.81

0.75 0.89

0.56 0.79

Standardisierte Faktorladung

Item / Konstrukt Reliabilität 0.90

0.84 0.97

Vertrauenb) Mein Händler wird alles tun, um mich als Kunde zufrieden zustellen. Mein Händler behandelt mich immer fair.

0.71 0.94 0.86

0.90 0.84

Zufriedenheit mit dem Verkaufc) Wie zufrieden waren Sie mit der Beratung des Händlers? Wie zufrieden waren Sie mit der Fachkompetenz des Händlers? Wie zufrieden waren Sie mit der Freundlichkeit und Hilfsbereitschaft des Händlers?

Item / Konstrukt Reliabilität 0.91

Loyalität / Bindunga) Wenn mein nächstes Fahrzeug ein X ist, würde ich es wieder bei meinem Händler kaufen. Ich werde auch in Zukunft meinem Händler treu bleiben.

221

0.81 0.71 0.91

0.85

0.72

0.93

0.87

0.85

0.72

a) Items werden mit einer fünfstufigen Skala mit den Endpunkten „sehr wahrscheinlich“ und „sehr unwahrscheinlich“ gemessen. b) Items werden mit einer fünfstufigen Skala mit den Endpunkten „lehne völlig ab“ und „stimme völlig zu“ gemessen. c) Items werden mit einer fünfstufigen Skala mit den Endpunkten „sehr unzufrieden“ und „sehr zufrieden“ gemessen.

Alle Faktorladungen sind signifikant (p < t ˆ 10:12). Kleinste t-Wert für Beziehungsgröße Marke ist t ˆ 10:12 und für Beziehungsgröße Marke ist.

Wettbewerbsorientierte Szenarioplanung – Methodik der Zukunftsanalyse am Beispiel des chinesischen PKW-Marktes Volker Trommsdorff, Umut Asan und Tao Wang

A. Einleitung Während der Automobilabsatz in allen hoch entwickelten Industrieländern stockt, boomt der PKW-Markt in China. 2002 wurden dort 1,3 Millionen PKW abgesetzt, 2003 bereits 2 Millionen. Auch wenn diese Rekordsteigerung nicht zu halten ist und durch die chinesische Wirtschaftspolitik inzwischen gebremst wird, ist diese Dynamik beispiellos. Entsprechend ist der chinesische Automobilmarkt, gemessen an Zuwachsraten und Marktpotential, der wichtigste Automobilmarkt der Welt. Vor dem Hintergrund gesättigter klassischer Märkte und Überkapazitäten in der Triade (Volkswagen, BMW und DaimlerChrysler) forciert das Investitionen der internationalen Automobilindustrie. Volkswagen, seit 1985 ältester westlicher Autoproduzent in China und lange Zeit Marktführer auf dem chinesischen Binnenmarkt, verkaufte dort zeitweise mehr Autos als in den USA (Kühl 2003). BMW startete im Oktober 2003 den Verkauf des ersten lokal produzierten Autos. Als letzter großer deutscher Autohersteller unterzeichnete DaimlerChrysler im September 2003 einen Rahmenvertrag mit BAIC (Beijing Automotive Industry Corporation), nach dem ab 2005 die E- und C-Klasse in Beijing produziert werden sollen. Außer diesen deutschen sind fast alle großen PKW-Hersteller der Welt mit Direktinvestitionen oder Joint Ventures in China vertreten, vgl. Abbildung 1. Die Wettbewerbsintensität nimmt stark zu, nicht zuletzt wegen dieser neuen deutschen Markteintritte. Anzeichen für Überkapazität, Preiskampf und Fusionsdrang sind schon deutlich. Von 100 Chinesen besitzt erst einer ein Auto, aber viele mehr können sich bald ein Auto leisten. Die Kunden werden wählerischer; das Auto soll nicht nur gut fahren und bezahlbar sein, sondern auch Prestige vermitteln (z. B. wie ein Drache aussehen: Stufenheck-Modelle, vgl. Schrieber 2003). Gemessen an 1,3 Mrd. Einwohnern fehlen in China noch 600 Millionen Autos (Rother 2003). Nach Schätzung von Nikkei Business werden 2010 in China 5,6 Mio. PKW nachgefragt (Park 2003, S. 3). Das Potenzial ist zwar groß, aber entsprechend hart umkämpft, und der Wettbewerb wird schnell härter. So reduzierte sich der Anteil des Marktführers VW (SVW und FAW-VW zusammen) von 50 % (2001) auf 33 % (2003) und die zwölf

224

Volker Trommsdorff, Umut Asan und Tao Wang

rein chinesischen Hersteller hielten 21 % Marktanteil, siehe Abbildung 2. Steigender Absatz bedeutet nicht automatisch höhere Erträge. Während die Volkswagen AG 2003 in China mehr Gewinn erwirtschaftete als in jedem anderen Land, war schon 2004 ein Verlustjahr.

Abbildung 1: PKW-Hersteller in China, Stand Anfang 2004

SVW 19,0% Others 23,1% FAW-VW 14,3%

Zhejiang Geely 3,3% SGM 9,7% FAW Honda 2,5% 5,6%

DPCA 5,0%

FAW-TAIC 5,5% Chang'an Suzuki 4,8%

SAIC CHERY 4,1% Dongfeng Ltd. 3,1% Quelle: O.V. 2004, China Car Market News Release.

Abbildung 2: PKW-Hersteller- Marktanteile

Wettbewerbsorientierte Szenarioplanung

225

Wie wird sich der chinesische PKW-Markt in Zukunft entwickeln? Wie wird die Wettbewerbssituation in Zukunft aussehen? Ob und wie lange wird VW seine Position als Marktführer noch halten können? Wie entwickeln sich die rein chinesischen PKW-Hersteller? Angesichts des aktiven Engagements der deutschen PKW-Hersteller in China ist die Analyse bzw. Prognose der zukünftigen Entwicklungen auf dem chinesischen Markt für deutsche PKW-Hersteller von hohem Interesse (O.V. 2004, Jahresbericht 2004 VDA). Untersuchungsfeld des vorliegenden Beitrags ist die künftige Wettbewerbssituation auf diesem Markt, um eine Methodik zu illustrieren, die am Marketinglehrstuhl der TU Berlin im Rahmen der Methodenforschung zur Abschätzung künftiger Wettbewerbsverhältnisse entwickelt wird: Die Wettbewerbsorientierte Szenarioplanung ist eine Integration der Szenariotechnik in die Wettbewerbsanalyse. Zur Demonstration dieser Methodik war ein zukunftsorientiertes Wettbewerbsmodell des chinesischen PKW-Markts zu entwickeln. Als „Zukunft“ wurde ein Zeithorizont von acht Jahren (bis 2012) gesetzt, was dem Zeitraum für die mittelfristige Planung in der Automobilindustrie entspricht. Auf Basis des Ist-Zustandes soll das Modell die künftige Entwicklung des Wettbewerbs übersichtlich visualisiert und umfassend beschreiben. Der Beitrag ist aus der Diplomarbeit von Tao WANG entstanden, am Marketinglehrstuhl der TU Berlin betreut von Umut ASAN, dessen Dissertation über diese Methodik vom Senior-Autor des Beitrags betreut wird.

I. Integration von Porters Wettbewerbsanalytik und Szenarioanalyse Nach Porter wird der Wettbewerb von fünf Kräften bestimmt: dem Markteintritt neuer Konkurrenten, der Gefahr von Ersatzprodukten, der Verhandlungsstärke der Abnehmer, der Verhandlungsstärke der Lieferanten und der Rivalität unter den vorhandenen Wettbewerbern (Porter 2000, S. 32). Über die Branchen hinweg sind nicht alle fünf Kräfte gleich bedeutsam. Für den charakteristischen Wettbewerb auf dem chinesischen PKW-Markt kann man die „Gefahr von Ersatzprodukten“ außer Acht lassen, denn im Zeithorizont von acht Jahren ist kein Ersatzprodukt für PKW zu erwarten, das die Marktstruktur grundlegend verändern könnte. Auch die „Verhandlungsstärke der Lieferanten“ ist zu vernachlässigen, weil in der Automobilbranche die Verhandlungsmacht ganz überwiegend bei den Herstellern liegt. Der aus Porters Theorie entwickelte analytische Rahmen ermöglicht es, sowohl komplexe Erscheinungen zu durchschauen und die für den Wettbewerb in einer Branche entscheidenden Einflussfaktoren herauszufinden, als auch die strategischen Innovationen zu entdecken, welche die Rentabilität am meisten verbessern würden. So sind im vorliegenden Demonstrationsfall der Wettbewerbsorientierten Szenarioplanung die zu analysierenden Wettbewerbskräfte auf drei zu reduzieren: 15 FS Kaas

226

Volker Trommsdorff, Umut Asan und Tao Wang

Markteintritt neuer Konkurrenten, Verhandlungsstärke der Abnehmer und Rivalität unter den vorhandenen Wettbewerbern. Das Verfahren selbst besteht aus fünf Schritten (Abbildung 3). Schritt I besteht aus der Bestimmung der Einflussbereiche und Einflussfaktoren für den chinesischen PKW-Markt. Schritt II umfasst den Pretest und die Hauptbefragung für die Einflussanalyse und damit einen wesentlichen Bestandteil der Szenarioplanung. Am Ende der Analyse werden die Schlüsselfaktoren festgelegt, die für die Szenarien von besonderer Bedeutung sind. Der Ist-Zustand der ausgewählten Schlüsseleinflussfaktoren wird im Schritt III detailliert geschildert. Anhand der Schlüsselfaktoren wird im Schritt IV – spezifisch für den chinesischen PKW-Markt – der „Wettbewerbsscanner“ aufgebaut. Der letzte Schritt gilt der Erstellung alternativer Szenarien. Hier sollen ein Trend und zwei Extremprojektionen (optimistisch und pessimistisch) des chinesischen PKW-Marktes entwickelt und dargestellt werden.

Bestimmung der Einflussbereiche und Einflussfaktoren

Einflussanalyse Pretest und Hauptbefragung

Ist-Zustand der Schlüsselfaktoren

Aufbau des Wettbewerbsscanners anhand der Schlüsselfaktoren

Alternative Zukunftsszenarien

Abbildung 3: Ablaufschritte der Wettbewerbsorientierten Szenarioplanung

Ein Modell ist die Abbildung eines Systems. Durch das geschickte Definieren von Variablen soll ein Modell ein komplexes System veranschaulichen. Um dieser Anforderung gerecht zu werden, müssen für unsere Methodik die Modellvariablen nicht nur aktuelle Zustände beschreiben können, sondern auch deren Zukunft – hier bezüglich des Wettbewerbs auf dem chinesischen PKW-Markt. Um das Modell „zukunftstauglich“ zu machen, wird die Szenariotechnik eingesetzt, die sich in den

Wettbewerbsorientierte Szenarioplanung

227

letzten drei Jahrzehnten als Kernmethode der Zukunftsforschung etabliert hat. Sie identifiziert die zukünftig wichtigen Faktoren, erkennt die relevanten Entwicklungen dieser Faktoren früh und leitet daraus Konsequenzen ab. Für den chinesischen PKW-Markt besteht die Aufgabe darin, die wichtigsten Einflussgrößen für die Entwicklung des Markts und des Wettbewerbs bis zum Jahr 2012 mit Hilfe der Szenariotechnik zu erfassen.

II. Das Szenariofeld und seine Einflussfaktoren Ein „Szenariofeld“ ist das Konzept, welches durch die Szenarien erklärt werden soll: Gestaltungsfeld, Umfeld oder Gesamtsystem (Gausemeier et al. 1995, S. 132 ff.). Zur Thematik „chinesischer PKW-Markt“ steht das Umfeld im Fokus. Um es umfassend beschreiben zu können, werden im Rahmen der SzenariofeldAnalyse die relevanten Einflussfaktoren herausgefiltert (Fink et al. 2001, S. 74 f.). Dabei ist darauf zu achten, dass die Faktoren aus allen relevanten Bereichen des Szenariofeldes ermittelt werden (Kiesel 2001, S. 23).

F1- Wirtschaftliche Entwicklung in China F2- Wirtschaftliche Entwicklung wel t F3- Import von PKW nach China F4- Export von PKW aus China F5- Entwicklung des Wechselkurses

Wirtschaft

Abbildung 4: Einflussbereiche und Einflussfaktoren

Nach der Kombination von systematischer Ermittlung, Expertenbefragung und Literaturrecherche kann der chinesische PKW-Markt durch fünf Einflussbereiche beschrieben werden: 1) Wirtschaft, 2) Märkte, 3) Politik / Gesetzgeber, 4) Technologie / Umweltschutz sowie 5) Kultur / Gesellschaft. Diese fünf Einflussbereiche setzen sich aus 26 Einflussfaktoren zusammen. Die Bildung von Einflussfaktoren liefert meist sehr viele potenzielle Einflussfaktoren, was zu exorbitantem Rechenaufwand führen kann. Deshalb sollten die für das Szenariofeld charakteristischen 15*

228

Volker Trommsdorff, Umut Asan und Tao Wang

Einflussfaktoren, die Schlüsselfaktoren, gezielt und selektiv ermittelt werden. Das trifft nach qualitativen Vorinformationen zum chinesischen Automobilmarkt zu für die Variablen Nachfrage, Marktanteil und Preis. Sie müssen unbedingt im Szenariofeld als Schlüsselfaktoren vertreten sein, und die Beziehungen zwischen ihnen und mit anderen Einflussfaktoren werden besonders ausführlich betrachtet. Abbildung 4 zeigt die Einflussbereiche und Einflussfaktoren stichwortartig. III. Einflussanalyse Mit der direkten oder indirekten Einflussanalyse (Godet 1994, 2001), die eine Einflussmatrix als Grundlage voraussetzt, lässt sich die Bedeutung des einzelnen Einflussfaktors für das Szenariofeld und damit seine Eignung als Schlüsselfaktor ermitteln. Angesichts der Komplexität des Systems „chinesischer PKW-Markt“ sowie des Arbeitsaufwandes für Erhebung, Analyse und Interpretation soll die Anzahl der Schlüsselfaktoren „so groß wie nötig und so klein wie möglich“ sein. Um die Einflussmatrix, in der die Beziehungen zwischen den Faktoren betrachtet wird, zu erstellen, wurde vorab ein Pretest der Einfluss- und Ähnlichkeitsanalyse im kleinen Kreis durchgeführt, um zu prüfen,  ob Probleme beim Design des Fragebogens vorhanden sind,  ob die Einflussfaktoren für die Analyse geeignet sind und  ob die Bearbeitungszeit angemessen ist.

Entsprechend den 26 Einflussfaktoren wurden 26 Fragen gleicher Struktur formuliert, so dass jeder Befragte alle 650 (=26*26 – 26) Faktorkombinationen bewertete, und zwar als Einflussstärke-Ratings von 0 bis 3. Aufgrund des Pretests wurden die Einflussfaktoren F2, F5, F11, F14 und F15 eliminiert. Unter Berücksichtigung der Ergebnisse aus der Ähnlichkeitsanalyse, die ähnliche Einflussfaktoren zusammenfasst (Gausemeier et al. 1995, S. 203) und damit den Umfang des Fragebogens reduziert, werden die Einflussfaktoren F18 / F19 / F20 / F21, F22 / F24, F25 / F26 zu drei neuen Einflussfaktoren zusammengefasst. Nach Eliminierung und Zusammenfassung von Einflussfaktoren war deren Anzahl von 26 auf 16 reduziert. IV. Hauptbefragung Nach demselben Vorgehen, jedoch nur noch mit 16 Einflussfaktoren, startete die zweite Runde der Befragung. Acht Personen, darunter vier deutsche Experten (Automobilzulieferer, Autofinanzdienstleister, zwei Automobilhersteller) und vier Chinesen (Autohändler, Taxiunternehmer, Beamter für Verkehrsverwaltung, Beamter für Technik & Sicherheit), wurden per deutschem bzw. chinesischem Fragebogen befragt. Nach jeder Befragung wurden die Antworten in einer Roh-Einflussmatrix kumuliert. Der Aufbau des Fragebogens und das Übertragen der Ergebnisse werden anhand eines fiktiven Beispiels mit nur drei Einflussfaktoren in Abbildung 5 erklärt.

Wettbewerbsorientierte Szenarioplanung

229

Frage 1: Wie würden folgende Faktoren von dem Faktor1 „AAA“ aus Ihrer Sicht beeinflusst? 0: kein; 1: schwach; 2: mittel; 3: stark.

Abbildung 5: Aufbau des Fragebogen und Eintrag in die Einflussmatrix

Die abgerundeten Mittelwerte aus den Roh-Einflussmatrizen wurden in einer Ergebnis-Einflussmatrix der Hauptbefragung zusammengefasst. In Abbildung 6 ist die endgültige Einflussmatrix abgebildet. Sie setzt sich aus der auf 16*16 reduzier-

230

Volker Trommsdorff, Umut Asan und Tao Wang

ten Ergebnis-Einflussmatrix aus dem Pretest und der Ergebnis-Einflussmatrix der Hauptbefragung zusammen. Diese Einflussmatrix geht als Input-Matrix in die indirekte Einflussanalyse ein. In der Matrix sind außer den Einflussbewertungen zwei wichtige Kennwerte zusammengestellt: Aktivsumme (ASi ) des Einflussfaktors i (Zeilensumme) und Passivsumme (PSi ) des Einflussfaktors i (Spaltensumme). „Die Aktivität eines Einflussfaktors zeigt die Stärke an, mit der ein Einflussfaktor direkt auf alle anderen Einflussfaktoren wirkt. Die Passivität ist ein Maß dafür, wie stark der jeweilige Einflussfaktor durch alle übrigen Einflussfaktoren beeinflusst wird.“ (Gausemeier et al. 1995, S. 194). Nr. F1 F2 F3 F4 F5 F6 F7 F8 F9 F1 0 F1 1 F1 2 F1 3 F1 4 F1 5 F1 6 PS

EinflussFaktoren Wirtschaftliche Entwickl in China. Import von PKW nach China Export von PKW aus China Nachfrage nach PKW in China Angebot von PKW in China Preisentwicklung von PKW in China Entwicklung der Zulieferindustrie Arbeitsmärkte in China Entwickl. d. Gebrauchtwagenmarktes Politik bzgl. Wettbew. & Invest.

F1 0 1 1 2 1 1 1 2 0 2

F2 2 0 1 2 2 2 1 0 0 2

F3 1 1 0 1 1 2 1 1 0 2

F4 2 1 0 0 2 2 0 1 2 1

F5 1 1 1 2 0 2 2 1 2 2

F6 1 1 1 2 2 0 2 1 2 2

F7 1 1 1 2 2 2 0 1 1 2

F8 2 0 1 2 1 0 1 0 0 2

F9 0 0 0 2 2 2 0 0 0 1

F10 F11 F12 F13 F14 F15 1 1 0 0 1 2 1 1 0 0 0 0 1 1 0 1 0 1 1 2 1 1 1 1 1 1 0 0 1 1 1 1 0 1 1 1 1 1 0 0 0 0 1 1 0 0 0 1 0 0 0 0 0 1 0 1 0 1 0 1

F16 1 0 0 2 1 1 0 0 1 1

AS 16 8 10 24 18 19 10 10 9 20

Stand der Technologie in China

2

1

1

1

2

2

2

1

0

1

0

1

1

0

0

1

16

Stand der Technologie weltweit

1

1

1

1

1

1

1

0

0

0

2

0

1

0

0

0

10

Ausgaben für F&E in China

1

0

1

1

1

1

1

0

0

0

2

0

0

0

0

0

8

Wandlung der Lebensstile

1

1

0

2

2

1

0

0

1

0

0

0

0

0

0

0

8

Entwickl. der Einkommens

2

2

0

2

2

1

1

1

1

0

0

0

0

1

0

1

14

Infrastruktur & Verkehr in China

1

0

0

2

1

0

0

0

0

0

0

0

0

1

0

0

5

19 17 13 20 23 20 18 11 9

9

14 2

6

6

9

9

Abbildung 6: Die endgültige Einflussmatrix

V. Direkte und indirekte Einflussanalyse Bevor die endgültige Auswahl nach bestimmten Kriterien erfolgt, wird auf Basis der Input-Einflussmatrix die direkte und indirekte Einflussanalyse durchgeführt, um sowohl direkte als auch indirekte Einflüsse zwischen den Faktoren zu prüfen. Die direkten Beziehungen werden berücksichtigt, indem die Kennwerte ASi und PSi für die Input-Einflussmatrix ermittelt und bei der Auswahl der Schlüsseleinflussfaktoren mit berücksichtigt werden. Indirekte Beziehungen können zu Einflussketten und Rückverkettungen führen. Obwohl indirekte Beziehungen mit Zeitverzögerung und abgeschwächt eintreten, ist die indirekte Einflussanalyse wichtig, denn gerade durch die Zeitverzögerung werden die Auswirkungen auf die Zukunft abgebildet. Indirekte (zwei- und mehrstufige) Einflussprozesse werden mit Hilfe

Wettbewerbsorientierte Szenarioplanung

231

der MICMAC-Methode (Cross-Impact Matrix – Multiplication Applied to Classification) in die Einflussanalyse einbezogen (Godet 1994, S. 93 f.). Hier werden die Faktoren nach der Anzahl aller von ihnen ausgehenden bzw. eingehenden indirekten Beziehungen geordnet. Ausgangsbasis ist die Input-Einflussmatrix Anxn ˆ …aij †. Um indirekte Zusammenhänge zwischen den Faktoren herauszukristallisieren, wird die Input-Einflussmatrix mehrere Male mit sich selbst multipliziert und die Matrizenfolge A2 ; A3 ; . . . gebildet. a2ij , zum Beispiel, zählt die indirekten Beziehungen der Weglänge 2 von Faktor i nach Faktor j. Anschließend nimmt man diejenige Einflussmatrix, ab der die Rangfolge der Kennwerte sich stabilisiert und ermittelt für sie die normierten Kennwerte (in dieser Arbeit A8 ). Zur anschaulichen Darstellung der Ergebnisse kann man die ermittelten Aktivitätswerte und Passivitätswerte des jeweiligen Einflussfaktors in einem System-Grid abbilden. Auf der Abszisse werden die Passivitätswerte und auf der Ordinate die Aktivitätswerte abgetragen. Auf beiden Achsen bildet der maximale Aktivitätsbzw. Passivitätswert das Ende der Skala. Mit einer horizontalen Linie in Höhe der durchschnittlichen Aktivsumme aller Einflussfaktoren und einer vertikalen Linie bei der durchschnittlichen Passivsumme wird das System-Grid in vier Felder unterteilt, die sich nach Aktivität und Passivität unterscheiden (von Reibnitz 1992, S. 37 ff.).  Bereich I – Ambivalente Einflussfaktoren: Überdurchschnittliche Aktivität und Passivität. Somit wirken sie einerseits sehr stark in das System, andererseits werden sie stark aus dem System heraus beeinflusst. Engster Auswahlkreis für Schlüsselfaktoren.  Bereich II – Aktive Einflussfaktoren: Überdurchschnittliche Aktivität und unterdurchschnittliche Passivität. Diese Faktoren beeinflussen alle anderen stark, werden aber wenig von anderen Faktoren beeinflusst.  Bereich III – Puffernde Einflussfaktoren: Unterdurchschnittliche Aktivität und Passivität. Sie beeinflussen das System wenig und werden selbst wenig vom System beeinflusst. Sie können bei der Auswahl von Schlüsselfaktoren vernachlässigt werden.  Bereich IV – Passive Einflussfaktoren: Überdurchschnittliche Passivität. Sie üben kaum Einfluss auf andere Faktoren aus, werden aber von anderen stark beeinflusst.

Abbildung 7 und 8 stellt jeweils das System-Grid des chinesischen PKW-Markts mit zugehörigen Kennwerten für die direkte und indirekte Einflussanalyse dar. In beiden Abbildungen bilden die Einflussfaktoren im Bereich I die Auswahlbasis für die Schlüsselfaktoren (vgl. Tabelle 1).

232

Volker Trommsdorff, Umut Asan und Tao Wang

F1 F2 F3 F4 F5 F6 F7 F8 F9 F10 F11 F12 F13 F14 F15 F16

PS 19 17 13 20 23 20 18 11 9 9 14 2 6 6 9 9

AS 16 8 10 24 18 19 10 10 9 20 16 10 8 8 14 5

Æ

12

12

24

AS F4

II

I

F10 20

F6 F5 16

F15

F1

F11

PS

12 0

4

8

12

20

F7

F3

8

F14

F12

16

F8 F9 F13

F2 4

F16 0

III

IV

Abbildung 7: System-Grid nach direkter Einflussanalyse

F1 F2 F3 F4 F5 F6 F7 F8 F9 F10 F11 F12 F13 F14 F15 F16

N-PS 19 19 14 19 23 21 20 13 11 11 14 2 6 7 11 10

N-AS 17 10 11 24 19 19 12 12 11 20 17 11 10 10 15 6

Æ

14

14

24

N -AS F4

II

F10

I F5

F6

20

F11

F1

16

F15

N-PS 0

4

8

12

F8 12

16

20

F7

F14 F3

F9

F12

F13

8

F16 III

F2

4

0

IV

Abbildung 8: System-Grid nach indirekter Einflussanalyse (MICMAC-Analyse) Tabelle 1 Auswahlbasis für Schlüsselfaktoren Auswahlbasis für die direkte Einflussanalyse F1: Wirtschaftliche Entwicklung in China F4: Nachfrage nach PKW in China F5: Angebot von PKW in China F6: Preisentwicklung von PKW in China F11: Stand der Technologie in China Auswahlbasis für die indirekte Einflussanalyse F1: Wirtschaftliche Entwicklung in China F4: Nachfrage nach PKW in China F5: Angebot von PKW in China F6: Preisentwicklung von PKW in China

Wettbewerbsorientierte Szenarioplanung

233

1. Schlüsselfaktoren – so viele wie nötig, so wenige wie möglich Zur Auswahl der Schlüsselfaktoren kann man auf Kennwerte aus der Einflussanalyse zurückgreifen. Danach können vier typische Auswahlkriterien unterschieden werden, nämlich nach abnehmendem Impuls-Index bzw. Dynamik-Index und nach abnehmender Aktivität bzw. Passivität (Gausemeier et al. 1995, S. 193): DIi : Dynamik-Index des Einflussfaktors i ˆ ASi  PSi IPIi : Impuls-Index des Einflussfaktors i ˆ ASi =PSi

Für das Szenariofeld „chinesischer PKW-Markt mit dem Schwerpunkt Wettbewerbssituation“ sind die Einflussfaktoren aus Bereich I der ambivalenten Einflussfaktoren zu bevorzugen. Denn dadurch werden die Entwicklungsmöglichkeiten – gerade auch die unvermuteten – in großem Umfang erfasst werden. Da es sich in unserem Fallbeispiel um Umfeldszenarien handelt, kann man sowohl für die direkte als auch für die indirekte Einflussanalyse die Rangfolge der Einflussfaktoren nach abnehmenden Dynamik-Index ermitteln. In Tabelle 2 werden die entsprechenden Kennwerte der Einflussfaktoren nach der direkten und indirekten Einflussanalyse zusammengefasst. N-AS, N-PS, N-DI bzw. N-IPI in Tabelle 2 sind die entsprechenden Abkürzungen für die normierten Kennwerte. Die Rangfolge der Einflussfaktoren ist nach absteigender DI ermittelt worden. Die Auswahl der Schlüsseleinflussfaktoren ist bis hierhin anhand der direkten und indirekten Einflussanalyse unabhängig erfolgt. Ein Vergleich der indirekten Einflüsse mit den direkten Einflüssen kann das Schlüsselfaktorenbündel nachhaltig verändern. Daher werden die beiden Rangfolgen der direkten und indirekten Beziehungen miteinander verglichen. Die Variablen mit starken Abweichungen in den Rangfolgen können grafisch ermittelt werden. Eine höhere Position in der Rangfolge bei den indirekten Einflüssen weist auf versteckte, nicht offensichtliche Beziehungen hin (Godet 1994, S. 96 f., Mißler-Behr 1993, S. 69). Die Rangfolge nach der direkten (RD ) und indirekten …RInd .) Einflussanalyse ist in Abbildung 9 zum Vergleich dargestellt. Nach den Erkenntnissen des SystemGrids in Abbildung 7 und 8 sollte die Zahl der Schlüsseleinflussfaktoren fünf nicht überschreiten. Das entspricht den kleinen Rechtecken links oben in Abbildung 9. Die Änderungen in den Rangfolgen sind nur schwach. Daraus erkennt man, dass F4, F5, F6 und F1 auf jeden Fall zu den Schlüsselfaktoren gehören, F7 und F11 sind Kandidaten. Wegen des geringen Unterschiedes zwischen F11 und F7 ist eine inhaltliche Betrachtung erforderlich. „Stand der Technologie in China“ (F11) umfasst den aktuellen Stand aller relevanten Technologien (u. a. technische Normen) für den Automobilsektor in China. Hinzu kommt das Problem der Imitation in der chinesischen Automobilbranche. Da F11 auch den Einflussfaktor Entwicklung der Zulieferindustrie (F7) überdurchschnittlich beeinflusst, ist F11 vorzuziehen. Damit sind

234

Volker Trommsdorff, Umut Asan und Tao Wang

Nachfrage nach PKW (F4), Angebot von PKW (F5), Preisentwicklung von PKW (F6), Wirtschaftliche Entwicklung (F1) und Stand der Technologie (F11) als Schlüsselfaktoren identifiziert, was mit der Vorfeldprämisse der Bedeutung von Nachfrage, Marktanteil und Preis harmoniert. Tabelle 2 Rangfolge der Einflussfaktoren nach absteigender DI (links: für die direkte Einflussanalyse; rechts: für die indirekte Einflussanalyse) Fak. F4 F5 F6 F1 F11 F7 F10 F2 F3 F15 F8 F9 F13 F14 F16 F12 Æ

Fak. F1 F2 F3 F4 F5 F6 F7 F8 F9 F10 F11 F12 F13 F14 F15 F16

RD. 4 8 9 1 2 3 6 11 12 7 5 16 13 14 10 15

AS 24 18 19 16 16 10 20 8 10 14 10 9 8 8 5 10 12

DI 480 414 380 304 224 180 180 136 130 126 110 81 48 48 45 20 181

PS 20 23 20 19 14 18 9 17 13 9 11 9 6 6 9 2 12

IPI 1,2 0,783 0,95 0,842 1,143 0,556 2,222 0,471 0,769 1,556 0,909 1 1,333 1,333 0,556 5 1

0

4 8 11 1 2 3 5 10 12 7 6 16 14 13 9 15

# 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Fak. F4 F5 F6 F1 F7 F11 F10 F2 F15 F8 F3 F9 F14 F13 F16 F12 Æ

N-AS 19 23 21 19 20 14 11 19 11 13 14 11 7 6 10 2 14

Rang nach direkter Einflußanalyse 4 6 8 10

RInd. 2

N-PS 24 19 19 17 12 17 20 10 15 12 11 11 10 10 6 11 14

N-DI 456 437 399 323 240 238 220 190 165 156 154 121 70 60 60 22 206,9

N-IPI 0,792 1,211 1,105 1,118 1,667 0,824 0,55 1,9 0,733 1,083 1,273 1 0,7 0,6 1,667 0,182 1,025

12

14

16

0 F4 2

F5 F6

Rang nach indirekter Einflußanalyse

# 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

4

F1 F7

6

F11 F10

8

F2 F15 F8

10 F3 12

F9 F14

14

F13 F16

16

Abbildung 9: Veränderung der Rangfolge nach direkter und indirekter Einflussanalyse

F12

Wettbewerbsorientierte Szenarioplanung

235

VI. Ist-Zustand der Schlüsselfaktoren Nach dem Identifizieren der Schlüsselfaktoren wird ihr Ist-Zustand beschrieben und als Ausgangspunkt für den weiteren Aufbau des Wettbewerbsmodells analysiert. Unsere umfassende Analyse kann im Rahmen des vorliegenden Beitrags nicht dargestellt werden, steht aber auf Anfrage beim Marketinglehrstuhl der TU Berlin zur Verfügung. Untersucht wurden (jeweils „in China“): 1) Wirtschaftliche Entwicklung, 2) Nachfrage nach PKW, 3) Angebot von PKW, 4) Preisentwicklung von PKW, 5) Stand der Technologie. Die Ergebnisse fließen aggregiert in die nachfolgenden Auswertungen ein.

B. Wettbewerbsscanner als Tool zur Wettbewerbsanalyse Eine Wettbewerbsanalyse bildet kurz und doch umfassend die Wettbewerbssituationen und ihre Entwicklungen des Systems ab und liefert Informationen für Wettbewerbsstrategien. Zu den bekanntesten klassischen Tools zählen SWOT-Analyse, Portfolio-Analyse, Stakeholder-Analyse, Porters five forces (Porter 2000), Spieltheoretische Ansätze (Myerson 1991), Positionierungsanalyse (Trommsdorff et al. 2004), Behavioral Theory (Meyer / Banks 1997) und CSI-Charting (Macmillan / Van Putten 2003). In der Regel bilden diese Tools nur gegenwärtige Wettbewerbssituationen ab. Ein Wettbewerbsmodell muss aber mehr denn je die Einflussfaktoren auf den Wettbewerb, ihre möglichen Entwicklungen in der Zukunft und deren systematisches Zusammenwirken erfassen, abbilden und für zukunftsrobuste Strategien umsetzbar machen. Am Marketinglehrstuhl der TU Berlin wird ein Wettbewerbsmodell (in Anlehnung an CSI-Charting) entwickelt, das die Schlüsselfaktoren durch zielgerichtete Definition der Variablen so abbildet, dass die relevanten aktuellen und zukunftsgerichteten Informationen über den Wettbewerb gezeigt werden, in unserem Beispiel also den chinesischen PKW-Markt. Das Wettbewerbsmodell wird hier als „Wettbewerbsscanner“ bezeichnet.

I. Einführung zum Wettbewerbsscanner (WS) Bisher wurden mit Hilfe der Szenariotechnik die Schlüsselfaktoren für den chinesischen PKW-Markt identifiziert. Diese Erkenntnisse werden jetzt für die Wettbewerbsanalyse eingesetzt. Für das Model werden drei Einflussfaktoren gebraucht: Nachfrage, Angebot und Preis. Bevor unsere exemplarische Wettbewerbsanalyse mit dem Wettbewerbsscanner erfolgt, werden zunächst der Aufbau und die Interpretationsmöglichkeiten des Wettbewerbsscanners anhand eines einfachen Beispiels erläutert.

236

Volker Trommsdorff, Umut Asan und Tao Wang

1. Beispielfall mit Ausgangswerten Angenommen, es gibt drei Klassen von PKW auf einem Markt: Klasse-1 bis Klasse-3. Vier PKW-Hersteller (I, II, III, IV) agieren auf diesem Markt. Sie bieten PKW in einer, zwei oder allen drei Klassen an. Die Variablen sind wie folgt definiert:  Marktanteil der k-Klasse vom h-ten PKW-Hersteller: akh ^ k ˆ 1; 2; 3 ^ h ˆ I,. . . , IV.

Im Beispiel: a2II ˆ 20 %, d. h. der PKW-Hersteller II hat einen Marktanteil von 20 % in Klasse-2.  Gesamter Marktanteil aller vom h-ten PKW-Hersteller angebotenen Klassen: Mh ˆ kˆ1...3 …akh † ^ k ˆ 1; 2; 3 ^ h ˆ I, II, III, IV.

Im Beispiel: MI ˆ 45 %, d. h. der PKW-Hersteller I hat einen gesamten Marktanteil von 45 % bei allen drei von ihm angebotenen Klassen.  Gesamter Marktanteil der k-Klasse aller PKW-Hersteller: K k ˆ hˆI...IV …akh † ^ k ˆ 1; 2; 3 ^ h ˆ I, II, III, IV.

Im Beispiel: K 3 ˆ 50 %, d. h. der gesamte Marktanteil der Klasse-3 von allen vier PKW-Herstellern beträgt 50 %. Die Marktanteile sind entsprechend in Tabelle 3 eingetragen. Die Zellenwerte sind aji, die Zeilensummen und Spaltensummen sind Mh bzw. K k . Tabelle 3 Marktanteile

I II III IV Kk

1 10%

2 20% 20%

10%

40%

3 15% 20% 10% 5% 50%

Mh 45% 40% 10% 5%

2. Inputwerte für den Wettbewerbsscanner Die Inputwerte für den Wettbewerbsscanner (Tabelle 4) kann man anhand der Ausgangswerte in Tabelle 3 berechnen. Rechenformel für die Inputwerte:  Marktanteil der k-Klasse des h-ten PKW-Herstellers im Verhältnis zum Gesamtmarktanteil aller von ihm angebotenen Klassen: Xhk ˆ akh =Mh . 3 Im Beispiel: XIII ˆ 100 %, d. h. für PKW-Hersteller III macht der Marktanteil von Klasse-3 100 % seines gesamten Marktanteils aus.

Wettbewerbsorientierte Szenarioplanung

237

 Summierter Marktanteil bezüglich der Klasse, z. B. Summieren nach aufsteigende K k : Y k ˆ summierte K k .

Im Beispiel: Y 1 ˆ K 1 ˆ 10 %, Y 2 ˆ K 1 ‡ K 2 ˆ 50 %, Y 3 ˆ K 1 ‡ K 2 ‡ K 3 ˆ 100 %.  Marktanteil der k-Klasse des h-ten PKW-Herstellers im Verhältnis zum gesamten Marktanteil der k-Klasse: Radius ˆ Rkh ˆ akh =K k .

Im Beispiel: R2I ˆ 50 %, d. h. der PKW-Hersteller I hat in Klasse-2 50 % des gesamten Marktanteils. Tabelle 4 Inputdaten zum Wettbewerbsscanner

I-1 I-2 I-3 II-2 II-3 III-3 IV-3

X hk 22% 44% 33% 50% 50% 100% 100%

Yk 10% 50% 100% 50% 100% 100% 100%

Rhk 100% 50% 30% 50% 40% 20% 10%

3. Zeichnen des Wettbewerbsscanners Die Grundlage des Wettbewerbsscanners ist ein übliches Koordinatensystem mit Abszisse und Ordinate. Die Blasen symbolisieren die Produktpalette von bestimmten Herstellern in einer bestimmten Klasse. Legende:  Gestrichelte Linie: Klasse k ^ k ˆ 1; 2; 3.  Blase: f …Xhk ; Yk ; Rkh †, d. h. Position und Größe der Blasen sind von Xhk (Abszisse), Y k (Ordinate) und Rkh (Radius) abhängig.  Abstand zwischen den gestrichelten Linien: K k .

In Abbildung 10 ist der Beispielfall mit den Inputwerten aus Tabelle 4 visualisiert.

238

Volker Trommsdorff, Umut Asan und Tao Wang

I-3

100%

II-3

Klasse- 3

III-3 IV-3

I-2

50%

II-2

Klasse- 2

I-1 Klasse- 1

10% -10%

20%

50%

80%

110%

Abbildung 10: Wettbewerbsscanner für den Beispielfall

4. Interpretation des Wettbewerbsscanners Anhand der Marktanteile positioniert man die Angebote auf einem Markt im Wettbewerbsscanner, aus dem die folgenden Informationen über die Wettbewerbssituationen leicht abgelesen werden können:  Wettbewerbsintensität innerhalb einer Klasse:

Je mehr Blasen auf einer gestrichelten Linie sind, desto höher ist die Wettbewerbsintensität innerhalb der Klasse. Im Beispielsfall gibt es 4 Blasen in Klasse-3, d. h. alle vier PKW-Hersteller bieten Produkte in dieser Klasse an, was zugleich auch die stärkste Wettbewerbsintensität auf diesen Markt bedeutet. Im Gegensatz dazu liegt bei Klasse-1 nur eine einzige Blase vor, d. h. der PKW-Hersteller I hat eine Monopolstellung in dieser Klasse. Wenn ein Unternehmen einen Markteintritt plant, so scheint dies am besten in der Klasse-1 möglich.  Identifizieren von Klassenführer / Marktführer:

Innerhalb jeder Klasse ist der Hersteller mit der größten Blase der Klassenführer. Z. B. ist der PKW-Hersteller II Klassenführer in Klasse-3. Entsprechend ist der Marktführer derjenige mit den meisten Blasen und der größten Gesamtfläche der Blasen. Im Beispielfall ist PKW-Hersteller I der Marktführer. Analog ist der „schwächste“ Wettbewerber der mit der kleinsten Blase.  Konzentration auf Kerngeschäft:

Je weiter rechts eine Blase liegt, desto höher ist der Konzentrationsgrad eines Herstellers auf eine bestimmte Klasse. Im Beispiel sind in Klasse-3 die Blasen von Hersteller III und IV am äußersten rechten Rand, denn sie bieten nur Produkte in dieser Klasse an. Sie weisen damit den höchsten Konzentrationsgrad, nämlich 100 %, auf. Der Konzentrationsgrad kann auch als „Bedeutung der Klasse für den

Wettbewerbsorientierte Szenarioplanung

239

Hersteller“ interpretiert werden. Je weiter rechts eine Blase liegt, desto wichtiger ist dieses Segment für ein Unternehmen. Diese Erkenntnis kann für die Auswahl der Konkurrenten eingesetzt werden, z. B. sollte man sich bei Indifferenz aller anderen Bedingungen eher links positionierte Wettbewerber als Gegner aussuchen, weil diese eher dazu neigen, sich auf andere Marktfelder (Klassen) zurückzuziehen. Stattdessen müssen Hersteller III und IV mit Konkurrenten die Auseinandersetzung in ihrem Marktbereich aufnehmen, da sie nicht auf Alternativen ausweichen können.  Marktanteile:

Auf der Ordinate kann man die Marktanteile der jeweiligen Klasse und das Verhältnis der Marktanteile zueinander ablesen. Wenn man den Wettbewerbsscanner über mehrere Perioden betrachtet, kann man aus den Veränderungen der Marktanteile in der jeweiligen Klasse Folgerungen ziehen, wie sich die Nachfrage verändert oder wie sich die Wirtschaft insgesamt entwickelt.

II. Die dritte Dimension Mit dem Wettbewerbsscanner wird versucht, den Marktanteil mit der Nachfrage so zu koppeln, dass man Informationen über die Nachfragestruktur sowie das Verhältnis zwischen Angebot und Nachfrage entnehmen kann. Umgesetzt wird dies durch den Bezug der Marktanteile auf den Absatz. Zunächst geben die Ausgangswerte in Tabelle 3 nur darüber Auskunft, wie groß die abgesetzten Anteile in der jeweiligen Klasse des h-ten PKW-Herstellers sind. Um das Verhältnis zwischen Nachfrage und Angebot abzubilden, wird eine dritte Dimension, die Zylinderhöhe Lz , eingefügt. Der Wettbewerbsscanner zeigt die Ansicht, während die Aufsicht Informationen darüber bietet, ob Nachfrage und Angebot im Gleichgewicht sind oder ob ein Überangebot bzw. eine nicht befriedigte Nachfrage vorhanden sind. Wegen technischer Beschränkungen wird das Nachfrage- / Angebot-Verhältnis in dem erweiterten Wettbewerbsscanner mit 3-D Effekt ersatzweise in einem Säulendiagramm dargestellt.

1. Beispielfall mit dem 3-D Wettbewerbsscanner Ergänzend zu Tabelle 4 werden die Informationen über das Verhältnis zwischen Nachfrage und Angebot als Höhe des Zylinders (Lz ^ z ˆ 1; 2; 3) in Abbildung 11 erfasst. L1: Die Höhe des Zylinders-1. Zylinder-1 ist im Diagramm hellgrau markiert. Er gibt an, wie viel Prozent der Nachfrage schon durch das entsprechende Angebot gedeckt ist. Z. B. bei I-2 ist L1 ˆ 90 %, d. h. die vom Hersteller II angebotene Produktpalette in Klasse-2 kann nur 90 % der entsprechenden Nachfrage decken.

240

Volker Trommsdorff, Umut Asan und Tao Wang

L2: Die Höhe der Zylinder-2. Zylinder-2 ist im Diagramm mittelgrau markiert. Er gibt an, wie groß der Anteil der unbefriedigten Nachfrage ist. Im selben Beispiel von I-2 beträgt L2 dann –10 %. Das Minus-Zeichen steht für die ungedeckte Nachfrage, 10 % entspricht dem Anteil der noch zu deckenden Nachfrage. L3: Die Höhe der Zylinder-3. Zylinder-3 ist im Diagramm dunkelgrau markiert. Er gibt an, wie groß der Anteil des Überangebots ist. Z. B. bei I-1, L3 ˆ 20 %. Dies bedeutet, dass das Angebot von Hersteller I in Klasse-1 um 20 % über die entsprechende Nachfrage hinaus geht. Die Nachfrage nach der Produktpalette des Herstellers ist im Säulendiagramm mit 100 % gekennzeichnet. Beim einfachen Wettbewerbsscanner (Tabelle 4) wird die Wettbewerbsintensität in Klasse 3 als stark eingeschätzt, weil dort die meisten Blasen positioniert sind. Hier ist auch zu folgern, dass bei Klasse 1 die beste Chance für einen neuen Markteintritt besteht. Unter Berücksichtigung der Erkenntnisse aus dem 3-D Wettbewerbsscanner verändert sich die Situation.

100%

-50%

I-1

I-2

I-3

II-2

II-3

III-3

IV-3

I-1 I-2 I-3 II-2 II-3 III-3 IV-3

L1 100% 90% 100% 100% 70% 90% 100%

L2 0% -10% 0% 0% -30% -10% 0%

L3 20% 0 0% 10% 0 0 0%

Abbildung 11: Nachfrage- / Angebot-Verhältnis und Höhe der Zylinder

 Wettbewerbsintensität:

Obwohl in Klasse-1 nur Hersteller I agiert, ist schon ein Überangebot von 20 % vorhanden, so dass keine guten Aussichten auf Absatz bestehen. Anders verhält es sich in Klasse-3. Alle vier Hersteller bieten ihre Produkte an, was auf eine stärkere Wettbewerbsintensität hindeuten könnte. Die Angebote von Hersteller I und IV decken gerade ihre Nachfrage, während bei der Produktpalette von Hersteller II und III insgesamt 40 % der Nachfrage unbefriedigt bleiben. Bei diesem Verhältnis zwischen Nachfrage und Angebot ist die Klasse-3 am besten für einen Marktneueintritt geeignet. Für die Wettbewerbsanalyse spielt nicht nur das Verhältnis zwischen Nachfrage und Angebot eine Rolle, die Nachfragestruktur enthält noch mehr Details.

Wettbewerbsorientierte Szenarioplanung

241

 Nachfragestruktur:

Der Sachverhalt in Klasse-2 ist ein gutes Beispiel: Die gesamten Angebote von Hersteller I und II entsprechen genau der gesamten Nachfrage. Die Produktpalette von Hersteller I leidet unter einem Überangebot, während der Hersteller II die Nachfrage nach seinen Produkten nicht vollständig bedienen kann. III. Dynamische Betrachtung Der Markt unterliegt ständigen Veränderungen, seien es in der Nachfragestruktur, in der wirtschaftlichen Lage oder in den politischen Rahmenbedingungen. Um der Dynamik des Marktes gerecht zu werden, muss die Wettbewerbsanalyse auch eine dynamische Betrachtung ermöglichen sowie den Vergleich der sich verändernden Wettbewerbssituation. Um diese Dynamik in einer Wettbewerbsanalyse zu erfassen, wird eine neue Variable in den Wettbewerbsscanner eingefügt, welche die zeitliche Entwicklung widerspiegelt. Gemäß der Definition verändern sich Xhk …Xhk ˆ akh =Mh † und Rkh …ˆ akh =K k † zwangsläufig bei einer Veränderung des Marktanteils akh . Daher könnten beide die Veränderung von akh wiedergeben. Die dazu besser geeignete Variable ist Rkh , weil die Veränderungen der Größe der Blasen leichter ablesbar sind als ihre Verschiebung in horizontaler Richtung. Aufbauend auf den Beispielsfall wird DRt;t‡1 ˆ Rkh …t ‡ 1† Rkh (t) definiert als die Differenz zwischen dem Radius der (selben) Blase in Periode t und t ‡ 1. In Tabelle 5 werden die Marktanteile in Periode t ‡ 1 und die Differenz des Radius zwischen t und t ‡ 1 zusammengefasst. In Abbildung 12 sind dann die Wettbewerbsscanner für Periode t und t ‡ 1 im Vergleich zu finden. Tabelle 5 Werte von Periode t + 1 I II III IV Kk(t+1)

1 100%

2 35% 65%

10%

40%

3 5% 65% 20% 10% 50%

Mh (t+1) 27% 59% 10% 5% 100%

I-1 I-2 I-3 II-2 II-3 III-3 IV-3

Rhk(t) 100% 50% 30% 50% 40% 20% 10%

Rhk(t+1) 100% 35% 5% 65% 65% 20% 10%

DR t, t+1 0 -15% -25% +15% +25% 0 0

Bei einem dynamischen Vergleich kann man im Wettbewerbsscanner (t ‡ 1) die größten Marktgewinner bzw. Marktverlierer mit Blockpfeilen, die Klassengewinner bzw. Klassenverlierer mit einfachen Pfeilen kennzeichnen, um das Ablesen zu erleichtern. Bei der dynamischen Betrachtung geht es weniger um die Identifizierung der Gewinner oder Verlierer, vielmehr sollen die Gründe dafür erforscht werden. Die Ergebnisse können nicht nur für strategische Entscheidungen eingesetzt 16 FS Kaas

242

Volker Trommsdorff, Umut Asan und Tao Wang

werden, sondern auch für die operative Maßnahmenplanung, um im Wettbewerb flexibel und schnell reagieren zu können.

100%

-10%

20%

50%

80%

110%

100%

-10%

20%

50%

80%

110%

Abbildung 12: Wettbewerbsscanner (links Periode t, rechts Periode t ‡ 1)

Natürlich kann man die Veränderung der Zahl der Blasen auch bei dynamischer Betrachtung berücksichtigen, z. B. als Folge eines Marktneueintritts bzw. -austritts. Dadurch verändert sich ja auch die Wettbewerbssituation. Ferner kann der Wettbewerbsscanner nach demselben Prinzip in unterschiedlichen Aggregationsstufen konstruiert (gezoomt) werden, z. B. für das Beispiel PKW-Markt in 4 Stufen: globale Ebene, Produktpaletten-Ebene, Modell-Ebene und Produkteigenschaften-Ebene.

C. Wettbewerbsscanner für den chinesischen PKW-Markt Nach dem Überblick über den Aufbau und die Interpretation des Wettbewerbsscanners wird dieses Tool jetzt für die Analyse der Wettbewerbssituationen auf dem chinesischen PKW-Markt eingesetzt. Für den chinesischen PKW-Markt wurden fünf spezifische Schlüsselfaktoren identifiziert, die für die Entwicklungen des Wettbewerbs auf dem chinesischen PKW-Markt ausschlaggebend sind. Sie werden jetzt in den Wettbewerbsscanner integriert. Die Schlüsselfaktoren sind wirtschaft-

Wettbewerbsorientierte Szenarioplanung

243

liche Entwicklung (F1), Nachfrage nach PKW (F4), Angebot an PKW (F5), Preisentwicklung von PKW (F6) und Stand der Technologie in China (F11). Klassifizierung nach Hubraum und Preis Im Modell des Wettbewerbsscanners sind Nachfrage nach PKW und Angebot an PKW als Zylinder und Blasen abgebildet. Mit Hilfe geeigneter Klassifizierungskriterien wird der Schlüsselfaktor Preis durch die Ordinate in der Ansicht des Wettbewerbsscanners (entspricht dem Blasendiagramm) dargestellt. Für die Klassifizierung der PKW gibt es mehrere Möglichkeiten. Nach Hubraum gehören die PKW bis zu 1000 ccm zu den Kleinwagen, Limousinen haben ein Volumen zwischen 1600 und 2000 ccm (O.V. 2003, VR China will Frankreich als Kfz-Hersteller überrunden). Nach dem Preis sind neben den entsprechenden Preisspannen auch die Modellbeispiele und die Anzahl der angebotenen Modelle innerhalb einer Klasse aufgelistet. So werden PKW auf dem chinesischen Markt nach Preis in 5 Klassen eingeteilt. Die Ordinate im Wettbewerbsscanner wird also in 5 Stufen aufgeteilt. Wirtschaftliche Entwicklung & Technologie als Umweltgröße Bis jetzt sind drei von fünf Schlüsselfaktoren schon in den Wettbewerbsscanner integriert. Die zwei noch nicht im Modell abgebildeten Schlüsselfaktoren „wirtschaftliche Entwicklung in China“ und „Stand der Technologie in China“ werden als Umweltgrößen betrachtet. Das sind Faktoren, die nicht spezifisch auf ein Systemelement wirken, sondern gleichermaßen auf alle Systemelemente. Wegen des hohen Technikgehaltes ist der Stand der Technologie für die Automobilindustrie die entscheidende Kraft. Ihre Entwicklung wirkt richtungsweisend auf das ganze System. Die wirtschaftliche Entwicklung wirkt ebenso auf das ganze Modell. Ihre Auswirkung auf das Modell ist ähnlich der eines Multiplikators. Obwohl das Modell „die wirtschaftliche Entwicklung in China“ nicht beinhaltet, liefert es dennoch Indizien für Aussagen über diese Entwicklung. Marktüberblick Auf dem chinesischen PKW-Markt gab es in 2003 genau 23 Joint Ventures und 12 reine chinesische Hersteller (O.V. 2003, China Car Market News Release, September 2003). Sie boten 38 Produktpaletten in 5 Preisklassen an, welche sich von unter 60 Tsd. RMB ( 6000 Euro) bis über 400 Tsd. RMB erstreckten. Für einen Überblick über den Markt und die Hersteller gibt Abbildung 13 einen Wettbewerbsscanner 2. Stufe wieder, d. h. eine Betrachtung auf der Produktpalettenebene. An der Zahl der hellen Kreise erkennt man, dass der größere Teil des Marktes (79 %) von Joint Ventures bedient wird. Die rein chinesischen Hersteller bieten ihre Produktpalette eher in der Unterklasse oder der unteren Mittelklasse an. Die wenigen rein chinesischen Hersteller, die auch in der Mittel- bzw. oberen Mittelklasse agieren, haben sehr kleine Marktanteile. Anhand der Größe der Blasen ist 16*

244

Volker Trommsdorff, Umut Asan und Tao Wang

zu erkennen, dass VW der Marktführer ist. Seine Produktpalette erstreckt sich über 4 von 5 Klassen, und in jeder dieser Klassen hat VW den größten Marktanteil. Die Informationen aus Abbildung 13 stimmen mit denen des Ist-Zustandes überein. Also lässt sich das System „chinesischer PKW-Markt“ gut mit dem Modell „Wettbewerbsscanner“ abbilden.

1

U UM VW

Preisklasse

M VW

VW OM O

VW -0,1

U: Unterklasse UM: Untere Mittelklasse M: Mittelklasse OM: Obere Mittelklasse O: Oberklasse Dunkel Kreise: rein chinesische PKW-Hersteller Helle Kreise: Joint Ventures

1,1 -0,2

Abbildung 13: Marktüberblick

I. Wettbewerbsorientierte Betrachtung des Marktes Wenn man jede Preisklasse als ein Wettbewerbsfeld betrachtet, spielen die Wettbewerbskräfte nach Porters Theorie in verschiedenen Preisklassen eine unterschiedliche Rolle. In der Oberklasse sollte man bei einer wettbewerbsorientierten Betrachtung besonderes Gewicht auf den „Markteintritt neuer Konkurrenten“ legen. In den drei Mittelklasse-Kategorien ist die Wettbewerbsintensität am höchsten. Aus diesem Grund wird später das Augenmerk auf den Marktführer VW gerichtet. Weil Unternehmen eine Wettbewerbsstruktur umformen können, tragen die Marktführer eine besondere Verantwortung. Die Maßnahmen der Marktführer können wegen ihrer Größe und ihres Einflusses auf Käufer, Lieferanten und andere Konkurrenten überproportionale Auswirkungen auf die Wettbewerbsstruktur haben. Gleichzeitig sorgen die großen Marktanteile der Marktführer dafür, dass sich jede Veränderung der allgemeinen Wettbewerbsstruktur auch auf sie selbst auswirkt. Ein führendes Unternehmen muss also seine eigene Wettbewerbsposition ständig gegen das Wohl der Branche als Ganzes abwägen (Porter 2000, S. 33 f.). In der Unterklasse ist neben dem Markteintritt neuer Konkurrenten auch die Rivalität unter den vorhandenen Wettbewerbern zu analysieren. Aus den Marktsituationen werden in der diesem Aufsatz zugrunde liegenden Diplomarbeit drei Thesen bezüglich des Wettbewerbs auf dem chinesischen PKWMarkt abgeleitet, von denen hier exemplarisch eine erörtert wird:

Wettbewerbsorientierte Szenarioplanung

245

These: Neuer Markteintritt in der Oberklasse wegen geringer Wettbewerbsintensität Wegen weniger Konkurrenten bestehen in der Oberklasse Chancen für einen Marktneueintritt. Um diese Aussage zu überprüfen wird in Abbildung 14 eine Aufsicht auf den Wettbewerbsscanner erstellt, wobei die Preisklasse als Ganzes unabhängig vom Hersteller hinsichtlich des Verhältnisses zwischen Angebot und Nachfrage analysiert wird. Für die Rechnung wurde vereinfacht die Produktionsmenge als Angebot und der Absatz als Nachfrage betrachtet. Differenz: D ˆ 100* (Produktion – Absatz) / Absatz. Die Ergebnisse bestätigen These 1, die eine Chance für einen neuen Markteintritt in die Oberklasse annimmt.

100

-10

pPR ‡ 4 Hzttlint ‡ "int |‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚{z‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚} Gain

mit RPint

Referenzpreis der Marke i des Konsumenten n zum Zeitpunkt t

IBedingung Indikatorfunktion, die Eins ist, wenn die „Bedingung“ gilt.

Modelle, die auf der Assimilations-Kontrast Theorie basieren, benötigen zusätzlich zu der Loss- bzw. Gain-Komponente eine weitere Komponente, die die Zone der Indifferenz beschreibt. Diese Komponente wird im Folgenden mit „Mid“ bezeichnet (siehe dazu auch Gleichung (4)). Für die Modellspezifikation wird hier als Erweiterung außerdem davon ausgegangen, dass auch im Assimilations-Kontrast-Ansatz die Wirkung der Loss- und Gain-Komponente unterschiedlich stark sein kann. Sie wird deshalb wie im Ansatz zur Prospekt Theorie (siehe Gleichung (16)) mit zwei Termen modelliert. Daraus folgt die Spezifikation für die Assimilations-Kontrast Theorie

Eine Simulation zum Test psychologischer Theorien der Preisbewertung …17†

265

Uint ˆ 0 ‡ 1 Pint ‡ 2 …Pint RPint †IPint >RPint ‡=2 |‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚{z‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚‚} Loss

‡ 3 …Pint RPint †IRPint =2