132 56
German Pages 145 Year 2023
BestMasters
Kathrin Elsner
Der Einsatz von Chatbots in Business-toBusiness-Märkten Eine empirische Analyse der Nutzerakzeptanz
BestMasters
Mit „BestMasters“ zeichnet Springer die besten Masterarbeiten aus, die an renommierten Hochschulen in Deutschland, Österreich und der Schweiz entstanden sind. Die mit Höchstnote ausgezeichneten Arbeiten wurden durch Gutachter zur Veröffentlichung empfohlen und behandeln aktuelle Themen aus unterschiedlichen Fachgebieten der Naturwissenschaften, Psychologie, Technik und Wirtschaftswissenschaften. Die Reihe wendet sich an Praktiker und Wissenschaftler gleichermaßen und soll insbesondere auch Nachwuchswissenschaftlern Orientierung geben. Springer awards “BestMasters” to the best master’s theses which have been completed at renowned Universities in Germany, Austria, and Switzerland. The studies received highest marks and were recommended for publication by supervisors. They address current issues from various fields of research in natural sciences, psychology, technology, and economics. The series addresses practitioners as well as scientists and, in particular, offers guidance for early stage researchers.
Kathrin Elsner
Der Einsatz von Chatbots in Business-toBusiness-Märkten Eine empirische Analyse der Nutzerakzeptanz
Kathrin Elsner Düsseldorf, Deutschland Masterarbeit, FOM – Hochschule für Ökonomie & Management, Düsseldorf, 2022
ISSN 2625-3577 ISSN 2625-3615 (electronic) BestMasters ISBN 978-3-658-43229-4 ISBN 978-3-658-43230-0 (eBook) https://doi.org/10.1007/978-3-658-43230-0 Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. © Der/die Herausgeber bzw. der/die Autor(en), exklusiv lizenziert an Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2023 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von allgemein beschreibenden Bezeichnungen, Marken, Unternehmensnamen etc. in diesem Werk bedeutet nicht, dass diese frei durch jedermann benutzt werden dürfen. Die Berechtigung zur Benutzung unterliegt, auch ohne gesonderten Hinweis hierzu, den Regeln des Markenrechts. Die Rechte des jeweiligen Zeicheninhabers sind zu beachten. Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informationen in diesem Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder der Verlag noch die Autoren oder die Herausgeber übernehmen, ausdrücklich oder implizit, Gewähr für den Inhalt des Werkes, etwaige Fehler oder Äußerungen. Der Verlag bleibt im Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutionsadressen neutral. Planung/Lektorat: Marija Kojic Springer Gabler ist ein Imprint der eingetragenen Gesellschaft Springer Fachmedien Wiesbaden GmbH und ist ein Teil von Springer Nature. Die Anschrift der Gesellschaft ist: Abraham-Lincoln-Str. 46, 65189 Wiesbaden, Germany Das Papier dieses Produkts ist recyclebar.
Inhaltsverzeichnis
1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1 Problemstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Zielsetzung und Aufbau der Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Methode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1 1 3 5
2 Theoretische Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 Chatbots . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1 Geschichtliche Einordnung . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.2 Funktionsweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.3 Klassifikation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Business-to-Business-Märkte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Konsumeration des B2B-Käuferverhaltens . . . . . . . . . . . . . 2.2.2 Integrationsmöglichkeiten von Chatbots . . . . . . . . . . . . . . . 2.2.3 Einsatzmotivationen und Vorbehalte . . . . . . . . . . . . . . . . . . 2.3 Zusammenfassende Erkenntnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7 7 9 12 15 18 20 21 24 28
3 Herleitung des eigenen Akzeptanzmodells . . . . . . . . . . . . . . . . . . . . . . . 3.1 Vorgehensweise der Modellentwicklung . . . . . . . . . . . . . . . . . . . . . . 3.2 Grundlagen zur Akzeptanzforschung . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1 Grundlegende Ansätze aus der Verhaltensforschung . . . . . 3.2.2 Technologie-Akzeptanz-Modelle . . . . . . . . . . . . . . . . . . . . . . 3.2.2.1 Technologie-Akzeptanz-Modell nach Davis et al . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.2.2 Technologie-Akzeptanz-Modell 2 nach Venkatesh und Davis . . . . . . . . . . . . . . . . . . . . . . . 3.2.2.3 Technologie-Akzeptanz-Modell 3 nach Venkatesh und Bala . . . . . . . . . . . . . . . . . . . . . . . . .
31 31 32 34 36 37 39 43
V
VI
Inhaltsverzeichnis
3.2.3 Überblick über weitere relevante Studien . . . . . . . . . . . . . . 3.3 Determinanten der eigenen Modellstruktur . . . . . . . . . . . . . . . . . . . 3.3.1 Grundlegende Modellstruktur . . . . . . . . . . . . . . . . . . . . . . . . 3.3.2 Abgeleitete Determinanten aus den Technologie-Akzeptanz-Modellen . . . . . . . . . . . . . . . . . . . . 3.3.3 Integration weiterer kontextbezogener Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4 Zeichnung der Akzeptanz-Modellstruktur und Aufstellen der Hypothesen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
46 52 52 53 55 57
4 Empirische Untersuchung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1 Methodische Aspekte und Vorgehensweise . . . . . . . . . . . . . . . . . . . 4.1.1 Spezifizierung der Messmodelle . . . . . . . . . . . . . . . . . . . . . . 4.2 Operationalisierung der Modellvariablen . . . . . . . . . . . . . . . . . . . . . 4.2.1 Formulierung der Messmodelle . . . . . . . . . . . . . . . . . . . . . . . 4.2.2 Konstruktion der Messvorschrift . . . . . . . . . . . . . . . . . . . . . . 4.3 Erhebungsmethode und Beschreibung der Stichprobe . . . . . . . . . . 4.3.1 Datenerhebung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.2 Stichprobenbeschreibung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4 Zeichnung des Strukturmodells . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5 Güteprüfung der Messmodelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5.1 Reliabilitätsprüfung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5.2 Validitätsprüfung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5.3 Messmodellprüfung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5.4 Zusammenfassende Bewertung der finalen Messmodelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6 Ergebnisse der Modellschätzung und Überprüfung des Model-Fit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.7 Evaluation der aufgestellten Hypothesen . . . . . . . . . . . . . . . . . . . . .
61 61 65 67 67 72 73 73 76 79 80 83 88 90
102 105
5 Diskussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1 Wesentliche Erkenntnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Limitationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 Implikationen für Forschung und Praxis und Fazit . . . . . . . . . . . .
109 109 111 113
Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
117
93
Abkürzungsverzeichnis
AGFI AIML ATT BI CFI C.R. DEV Df EFA FL FR GFI GLS IIK IR ITK JR KFA KI KITK KMO KOM ML MSA NLP NLU
Adjusted-Goodness-of-Fit-Index Artificial Intelligence Markup Language Einstellung Verhaltesabsicht Comparative Fit Index Critical Ratio Durchschnittliche extrahierte Varianz Freiheitsgrade Explorative Faktorenanalyse Faktorladung Faktorreliabilität Goodness-of-Fit-Index Generalized Least Square Inter-Item-Korrelation Indikatorreliabilität Item-to-Total-Korrelation Relevanz für den Beruf Konfirmatorische Faktorenanalyse Künstliche Intelligenz Korrigierte Item-to-Total-Korrelation Measure of Sampling Adequacy-Werte Kommunalität Maximum-Likelihood Measure of Sampling Adequacy Natural Language Processing Natural Language Understanding
VII
VIII
PCSM PEOU PI PU RMSEA RQ S. E. SGA SN SRMR T TAM TAM2 TAM3 TLI TPB TRA ULS
Abkürzungsverzeichnis
Möglichkeit zur Interaktion mit einem Mitarbeiter Wahrgenommene Benutzerfreundlichkeit Innovationsfreudigkeit Wahrgenommene Nützlichkeit Root-Mean-Square-Error of Approximation Ergebnisqualität Standard Error/ Standardfehler Strukturgleichungsanalyse Subjektive Norm Standardized Root Mean Square Residual Vertrauen Technologie-Akzeptanz-Modell Technologie-Akzeptanz-Modell 2 Technologie-Akzeptanz-Modell 3 Tucker-Lewis-Index Theory of Planned Behaviour Theory of Reasoned Action Unweighted Least Square
Symbolverzeichnis
βij γij δ ε ζ η ε δ λ y x F ξ
χ2 N S t x y
Beta, Pfadkoeffizient zwischen zwei endogenen Variablen Gamma, Pfadkoeffizient zwischen exogener und endogener Variable Delta, Residualvariable für eine Indikatorvariable x Epsilon, Residualvariable für eine Indikatorvariable y Zeta, Residualvariable für eine latente endogene Variable Eta, latente, endogene Variable Theta-Epsilon, Matrix der Kovarianzen zwischen den ε-Variablen Theta-Delta, Matrix der Kovarianzen zwischen den δ-Variablen Lamda, Korrelation zwischen Variable und Indikator (Korrelation) Lamda-x, Matrix der Pfade zwischen y und η-Variablen (Faktorladung) Lamda-y, Matrix der Pfade zwischen x und ξ-Variablen (Faktorladung) Phi, Korrelation zwischen latenten Variablen Ksi, latente, exogene Variable Sigma, modelltheoretische Varianz-Kovarianz-Matrix Chi-Quadrat (Testgröße) Stichprobengröße Empirische Varianz-Kovarianz-Matrix Zu schätzende Parameter Manifeste Indikatorvariable für latente exogene Variable Manifeste Indikatorvariable für latente endogene Variable
IX
Abbildungsverzeichnis
Abb. Abb. Abb. Abb. Abb. Abb. Abb. Abb. Abb. Abb. Abb. Abb.
1.1 2.1 2.2 2.3 2.4 2.5 3.1 3.2 3.3 3.4 3.5 3.6
Abb. 3.7 Abb. 3.8 Abb. 4.1 Abb. 4.2 Abb. 4.3 Abb. 4.4 Abb. 4.5
Aufbau der Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Grundlegende Funktionsweise von Chatbots . . . . . . . . . . . . . . . Klassifizierungsansätze von Chatbots . . . . . . . . . . . . . . . . . . . . . Abgrenzung Business-to-Business-Märkte . . . . . . . . . . . . . . . . . Anwendungsbereiche im B2B-Business . . . . . . . . . . . . . . . . . . . Übersicht der theoretischen Grundlagen . . . . . . . . . . . . . . . . . . Entwicklung der eigenen Modellstruktur . . . . . . . . . . . . . . . . . . Teilebenen der Akzeptanz nach Kollmann (1998) . . . . . . . . . . Theory of Reasoned Action (1980) . . . . . . . . . . . . . . . . . . . . . . Theory of Planned Behaviour (1985) . . . . . . . . . . . . . . . . . . . . . Technologie-Akzeptanz-Modell nach Davis et al. (1989) . . . . Technologie-Akzeptanz-Modell nach Venkatesh und Davis (2000) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Technologie-Akzeptanz-Modell nach Venkatesh und Bala (2008) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Eigene Modellstruktur zur Erfassung der Einstellungsakzeptanz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vorgehensweise der Strukturgleichungsmodellierung . . . . . . . . Relative Nutzung von Chatbots im privaten und beruflichen Umfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Überführung des Modells in ein reflektives Messmodell . . . . . Vorgehensweise bei der Bewertung der Messmodelle . . . . . . . Relevante Ergebnisse der Modellschätzung . . . . . . . . . . . . . . . .
4 14 16 19 22 29 32 33 35 36 38 40 43 58 63 77 80 81 104
XI
Tabellenverzeichnis
Tab. Tab. Tab. Tab. Tab.
3.1 3.2 3.3 3.4 3.5
Tab. 3.6 Tab. 3.7 Tab. 3.8 Tab. Tab. Tab. Tab. Tab. Tab. Tab. Tab. Tab. Tab. Tab. Tab. Tab.
3.9 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 4.10 4.11 4.12
Determinanten der sozialen Einflüsse . . . . . . . . . . . . . . . . . . . . Determinanten der kognitiven Faktoren . . . . . . . . . . . . . . . . . . Determinanten der Verankerungen . . . . . . . . . . . . . . . . . . . . . . . Determinanten der Anpassung . . . . . . . . . . . . . . . . . . . . . . . . . . Relevante Chatbot-Akzeptanzstudien mit Unterstützung von TAM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Determinanten der eigenen grundlegenden Modellstruktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Weitere abgeleitete Determinanten der TAM-Modelle . . . . . . Kontextbezogene Determinanten der eigenen Modellstruktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Abgeleitete Hypothesen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Fragenkatalog zur Spezifizierung des Messmodells . . . . . . . . . Indikatoren der endogenen Variablen . . . . . . . . . . . . . . . . . . . . Indikatoren der exogenen Variablen . . . . . . . . . . . . . . . . . . . . . Soziodemographische Merkmale der Teilnehmer . . . . . . . . . . . Reliabilitätskriterien auf Basis der EFA . . . . . . . . . . . . . . . . . . Reliabilitätskriterien der internen Konsistenz . . . . . . . . . . . . . . Lokale Gütekriterien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kriterien der Konstruktvalidität und Richtwerte . . . . . . . . . . . Inferenzstatistische Gütemaße und Richtwerte . . . . . . . . . . . . . Deskriptive Gütemaße und Richtwerte . . . . . . . . . . . . . . . . . . . Inkrementelle Gütemaße und Richtwerte . . . . . . . . . . . . . . . . . Finale Bewertung des Faktors wahrgenommene Nützlichkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
40 42 45 46 48 52 54 55 59 66 68 70 78 83 85 87 89 91 92 93 94
XIII
XIV
Tabellenverzeichnis
Tab. 4.13 Tab. Tab. Tab. Tab. Tab. Tab. Tab. Tab. Tab.
4.14 4.15 4.16 4.17 4.18 4.19 4.20 4.21 4.22
Finale Bewertung des Faktors wahrgenommene Benutzerfreundlichkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Finale Bewertung des Faktors Verhaltensabsicht . . . . . . . . . . . Finale Bewertung des Faktors Einstellung . . . . . . . . . . . . . . . . Finale Bewertung des Faktors Subjektive Norm . . . . . . . . . . . Finale Bewertung des Faktors Relevanz für den Job . . . . . . . . Finale Bewertung des Faktors Ergebnisqualität . . . . . . . . . . . . Finale Bewertung des Faktors Vertrauen . . . . . . . . . . . . . . . . . Prüfung auf Diskriminanzvalidität . . . . . . . . . . . . . . . . . . . . . . . Zusammenfassung des Model-Fit . . . . . . . . . . . . . . . . . . . . . . . Bewertung der aufgestellten Hypothesen . . . . . . . . . . . . . . . . .
96 97 97 98 99 100 100 102 105 106
1
Einleitung
1.1
Problemstellung
Die hohe Wettbewerbsintensität sowie steigende Kundenansprüche fordern stetige Weiterentwicklungen in Unternehmen. Um die Wettbewerbsfähigkeit aufrechtzuerhalten oder herzustellen, ist eine kontinuierliche Verbesserung der eigenen Prozesse notwendig.1 Innovative technologische Entwicklungen stellen einen starken Treiber für Veränderungen innerhalb von Unternehmen dar und gewinnen zukünftig immer mehr an Bedeutung.2 Die zunehmenden Möglichkeiten mit Kunden und anderen Unternehmen zu kommunizieren oder Informationen über diese zu sammeln werden als bedeutsame Trends angesehen.3 Die Technologie der Chatbots ermöglicht es Unternehmen an dieser Stelle anzuknüpfen. Sie bieten bisher noch nicht da gewesene Möglichkeiten in der Kommunikation und können vielfältigen Einsatz finden. Viele Unternehmen erwarten dadurch eine Verbesserung und Intensivierung der Interaktion mit Kunden oder Organisationen.4 Intelligente Chatbots sind mittlerweile in großer Anzahl verfügbar und ermöglichen vielfältige Nutzungsszenarien.5 Chatbots sind auch als maschinelle Agenten bekannt, die als natürliche Benutzerschnittstellen dienen. Durch den Einsatz von maschinellen Lernalgorithmen haben menschliche Nutzer die Möglichkeit auf Basis einer nicht formalisierten, natürlichen Sprache mit einer Maschine oder
1
Vgl. Almeida, A., Azevedo, A., Wettbewerb, 2016, S. 125 f. Vgl. Bititci, U. S. et al., Business Process, 2011, S. 852. 3 Vgl. Rust, R. T., Technological Trends, 2020, S. 16. 4 Vgl. Adamopoulou, E., Moussiades, L., Technology of Chatbots, 2020, S. 1 f. 5 Vgl. Dale, R., Intelligent Virtual Assistant, 2016, S. 813 ff. 2
© Der/die Autor(en), exklusiv lizenziert an Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2023 K. Elsner, Der Einsatz von Chatbots in Business-to-Business-Märkten, BestMasters, https://doi.org/10.1007/978-3-658-43230-0_1
1
2
1
Einleitung
einem Computer zu interagieren.6 Die Studie Vendor Opportunities & Market Forecast 2020–2024 prognostizierte, dass die technischen Fortschritte auch die Effektivität von Chatbots immer weiter vorantreiben.7 Globale Technologieunternehmen wie Microsoft und Google arbeiten bereits seit Jahren intensiv an der Weiterentwicklung und haben dadurch in jüngster Zeit den Einsatz für virtuelle Assistenten massentauglich gemacht.8 Auch Unternehmen greifen immer häufiger auf die Hilfe von Chatbots zurück, um Beratungszentren zu entlasten, die Servicequalität zu erhöhen und die Wettbewerbsfähigkeit am Markt zu verbessern.9 Schätzungen zu Folge wird der Einsatz von virtuellen Agenten bis zum Jahr 2023 zu Kosteneinsparungen in Höhe von 11,5 Milliarden US-Dollar führen.10 Auch in alltäglichen Situationen, wie z. B. zur Unterstützung von Kunden bei der Entscheidungsfindung, erfreuen sich Konversationsalgorithmen zunehmender Popularität.11 Unternehmen können KI-basierte Chatbots nutzen, um die Kaufgewohnheiten, Kaufpräferenzen und das Nutzerverhalten zu verstehen. Auf schriftliche Anfragen kann mit Unterstützung dieser Daten entsprechend reagiert werden.12 Auf Basis dieser Entwicklungen ist absehbar, dass Chatbots zukünftig eine Schlüsselrolle einnehmen. Virtuelle Assistenten verändern unsere Sicht auf neuartige Technologien und nehmen Einfluss auf unsere Erwartungshaltung. Der Einsatz virtueller Agenten ist im Endkundengeschäft bereits zentraler Bestandteil.13 Die vorliegende Arbeit thematisiert die Nutzerakzeptanz von Chatbots im B2B-Bereich. Künstliche Intelligenzen, wie z. B Chatbots, sind heute allgegenwärtig und durchdringen unser Arbeits- und auch unser Privatleben in unterschiedlichen Bereichen.14 Juniper Research weist darauf hin, dass im Bereich des Einzelhandels bis 2024 über 50 % der Chatbot-Interaktionen ohne den Eingriff eines Menschen erfolgreich abgeschlossen werden können und empfiehlt Chatbots als Bestandteil einer Omni-Channel-Einzelhandelsstrategie zu implementieren.15 Obwohl viele Studien die positiven Effekte im B2C-Bereich voraussagen, liegen 6
Vgl. Brandtzaeg, P. B., Følstad, A., Human–Chatbot Interaction, 2017, S. 1. Vgl. Juniper Research, Chatbots in Retail, 2020, o. S. 8 Vgl. Maedche, A. et al., Digital Assistants, 2019, S. 535. 9 Vgl. Brandtzaeg, P. B., Følstad, A., Human–Chatbot Interaction, 2017, S. 1. 10 Vgl. Bavaresco, R. et al., Conversational Agents, 2020, o. S. 11 Vgl. Zemˇ cík, T., History of Chatbots, 2019, S. 14. 12 Vgl. Chatbot Journal, Chatbot Trends, 2021. 13 Vgl. Melián-González, S. et al., Chatbots for Travel, 2021, S. 192 ff. 14 Vgl. Maedche, A. et al., Digital Assistants, 2019, S. 535. 15 Vgl. Juniper Research, Chatbots in Retail, 2020, o. S. 7
1.2 Zielsetzung und Aufbau der Arbeit
3
bisher nur unzureichende Einschätzungen über die Anwendung im B2B-Bereich vor. Die wenigen aktuellen Forschungsansätze stehen noch in ihren Anfängen.16 Für Unternehmen ist der zielgerichtete Einsatz von Technologien wie Chatbots essenziell, da eine fehlgeschlagene Implementierung negative Auswirkungen nach sich ziehen kann. Insbesondere finanzielle Risiken sollten bei der Einführung von Technologien nicht unterschätzt werden.17 Eventuelle Misserfolge können durch positive Erfahrungen im Umgang mit einer Technologie minimiert werden und so eine nachhaltige Nutzung sicherstellen.18 Die Nutzerakzeptanz gilt in diesem Zusammenhang als kritischer Faktor für den Erfolg einer Technologie.19 Aus diesem Grund ist es zwingend erforderlich ein Verständnis der Determinanten der Akzeptanz von Chatbots im B2B-Bereich zu entwickeln. Dies unterstützt eine erfolgreiche Implementierung von Technologien wie Chatbots.20 Eine Analyse der Nutzerakzeptanz im B2B-Segment stellte bisher keinen Bestandteil aktueller Studien dar, sodass eine nähere Betrachtung in diesem Kontext noch durchzuführen ist.
1.2
Zielsetzung und Aufbau der Arbeit
Die vorliegende Arbeit verfolgt das Ziel, ein geeignetes Messinstrument zu entwickeln, um erste Faktoren, die die Akzeptanz und Nutzung von Chatbots beeinflussen, zu identifizieren und diese Erkenntnisse im B2B-Kontext einzuordnen. In der Akzeptanzforschung ist es von essenzieller Bedeutung die Determinanten der Akzeptanz einer Technologie zu verstehen, um die Nutzung sicherstellen zu können.21 Da sich die Forschung noch in ihren Anfängen befindet, steht die generelle externe Kommunikation mit Kunden oder Organisationen im Fokus. Zudem soll innerhalb der vorliegenden Arbeit die Frage beantwortet werden, inwieweit Chatbots bereits im B2B-Bereich Anwendung finden. Unter Berücksichtigung der Zielsetzung dieser Arbeit wird ein Modell entwickelt und anschließend empirisch überprüft. Zu diesem Zweck ist der Aufbau der vorliegenden Untersuchung in fünf Kapitel gegliedert. Abb. 1.1 visualisiert den Aufbau. 16
Vgl. Bruhn, M., Hadwich, K., Künstliche Intelligenz, 2021, S. 20. Vgl. Kollmann, T., Akzeptanz von Nutzungsgütern, 1998, S. 4. 18 Vgl. Kruse Brandão, T., Wolfram, G., Digital Connection, 2018, S. 287. 19 Vgl. Wu, J.-H., Wang, S.-C., Mobile Commerce, 2005, S. 720. 20 Vgl. Kopsch, A., Marktabgrenzung, 2001, S. 3. 21 Vgl. Wu, J.-H., Wang, S.-C., Mobile Commerce, 2005, S. 720. 17
4
1
Einleitung
Einleitung (Kapitel 1)
2.1 Chatbots
Theoretische Grundlagen (Kapitel 2) 2.2 B2B-Märkte
Aufstellen des Akzeptanzmodells (Kapitel 3) 3.2 Grundlagen aus der Akzeptanzforschung 3.3 Entwicklung der eigenen Modellstruktur
Empirische Untersuchung (Kapitel 4) 4.5 Güteprüfung der Messmodelle 4.6 – 4.7 Modellbewertung
Diskussion (Kapitel 5)
Abb. 1.1 Aufbau der Arbeit. (Quelle: Eigene Darstellung)
Das erste Kapitel stellte bereits einen aktuellen Bezug zu Chatbots im B2BBereich her. Das zweite Kapitel nimmt eine Definition der benötigten Fachtermini auf Basis einer detaillierten Literaturrecherche vor. Dabei gliedert sich das Kapitel in zwei Abschnitte und nimmt zum einen eine Herleitung zum Untersuchungsgegenstand Chatbots vor und stellt zum anderen einen Bezug von Chatbots zum B2B-Kontext her. Außerdem werden mögliche Integrationsansätze von Chatbots im B2B-Bereich präsentiert sowie die Vorteile der Nutzung näher untersucht. Innerhalb des dritten Kapitels erfolgt die Herleitung der eigenen Modellstruktur. Dafür wird zunächst der Begriff der Akzeptanz definiert und aufbauend darauf bestehende Modelle zur Messung der Akzeptanz näher betrachtet. Darüber hinaus liegt ein weiteres Augenmerk auf Forschungsarbeiten, die im Bereich Chatbots veröffentlicht wurden, um daraus die eigene vorgeschlagene Modellstruktur zur Messung der Nutzerakzeptanz herleiten zu können. Auf Basis der Modellstruktur schließt das Kapitel mit der Herleitung des Hypothesensystems für die weitere empirische Untersuchung. Das vierte Kapitel umfasst die empirische Überprüfung des aufgestellten Akzeptanzmodells. Dazu beinhaltet das Kapitel zunächst eine Beschreibung der Vorgehensweise sowie die Operationalisierung und die Güteprüfung der Messmodelle, bevor anknüpfend daran die Durchführung der Hauptstudie erfolgt. Außerdem werden eine Überprüfung und eine Bewertung
1.3 Methode
5
der aufgestellten Hypothesen durchgeführt. Das sechste Kapitel dieser Arbeit beginnt mit einer Diskussion der gewonnen Erkenntnisse und begutachtet danach die Limitationen sowie die Implikationen für die weitere Forschung und Praxis, die mit dieser Arbeit einher gehen.
1.3
Methode
Die Arbeit beginnt mit einer systematischen Literaturrecherche, um ein einheitliches Verständnis für die Technologie von Chatbots zu schaffen. Eine Definition und Abgrenzung der wichtigen Elemente des B2B-Geschäfts schließt daran an. Die Literaturrecherche erfolgt an der FOM in Düsseldorf sowie an der Hochschule Düsseldorf. Der Fokus liegt dabei auf den Datenbanken Google Scholar, Elsevier ScienceDirect, IEEE Xplore, SpringerLink, Emerald Insight, ResearchGate und Web of Science. Auch für die Entwicklung eines geeigneten Modells, wird auf eine umfassende Auswertung der Literatur zurückgegriffen. Dafür findet eine Untersuchung der bisherigen Studien statt und auf Basis dieser Erkenntnisse wird ein geeignetes Modell mit B2B-Bezug abgeleitet und entwickelt. Als Grundlage dienen unterschiedliche Ausprägungen des Technologieakzeptanzmodells, wie beispielsweise das Technologie-Akzeptanz-Modell nach Davis. Die empirische Überprüfung des Hypothesensystems erfolgt unter dem Einsatz multivariater Analysemethoden mit Hilfe einer Strukturgleichungsanalyse (SGA). Die Güte der verwendeten Messmodelle bestimmt maßgeblich die Güte des aufgestellten Modells. Obwohl bei der Operationalisierung der latenten Variablen auf bestehende Messmodelle zurückgegriffen wird, erfolgt vorab eine Prüfung auf Reliabilität und Validität. Die Messmodelle werden daher sowohl auf Basis einer exploratorischen (Gütekriterien der ersten Generation) als auch auf Basis einer konfirmatorischen Faktorenanalyse (Gütekriterien der zweiten Generation) überprüft, um Fehler in den Schätzungen im Rahmen der späteren Kausalanalyse vermeiden zu können.22 Die aufgestellten Hypothesen spiegeln komplexe Ursache-Wirkungsgefüge wider, die im Rahmen der SGA eine Überführung in ein Strukturmodell erfahren. Der angewendete kovarianzanalytische Ansatz interpretiert latente Variablen als Faktoren und überführt ein vorformuliertes Hypothesensystem in eine formale Struktur, einem Strukturgleichungsmodell,
22
Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 128.
6
1
Einleitung
sodass eine empirische Prüfung vorgenommen werden kann.23 Auf Basis der empirischen Daten werden die postulierten Wirkungsbeziehungen des Strukturmodells auf die Stärke und Richtung geschätzt und mit den aufgestellten Hypothesen abgeglichen, um Rückschlüsse auf die Akzeptanz von Chatbots im B2B-Bereich ziehen zu können.24
23 24
Vgl. Wentura, D., Pospeschill, M., Multivariate Datenanalyse, 2015, S. 195. Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 7.
2
Theoretische Grundlagen
Im folgenden Kapitel werden die Grundlagen vorgestellt, die zum Verständnis des weiteren Verlaufs der vorliegenden Arbeit notwendig sind. Dabei findet eine Definition und Abgrenzung des Untersuchungsgegenstandes Chatbots sowie dessen Einordnung im B2B-Kontext statt. Das Kapitel schließt mit einer kurzen Zusammenfassung der theoretischen Grundlagen.
2.1
Chatbots
Eine Integration von Künstlicher Intelligenz findet zunehmend in unserem alltäglichen Leben statt. Intelligente Agenten, die durch die Weiterentwicklung und Analyse von intelligenter Software und Hardware entstanden sind, sind in der Lage eine große Menge an Aufgaben zu erledigen. Diese reichen vom Lösen einfacher Aufgaben bis hin zu komplexen Lösungswegen.1 Ein Chatbot ist eines der bekanntesten Beispiele für eine KI-basierte Mensch-Computer Interaktion. Der Begriff Chatbot leitet sich aus den englischen Wörtern chat (dt. plaudern) und Bot, einer Kurzform für Roboter, ab, wobei der Begriff Bot häufig als Synonym Anwendung findet.2 Unter einem Chatbot wird ein System verstanden, das als 1 2
Vgl. Bansal, H., Khan, R., Human Computer Interaction, 2018, S. 53. Vgl. Braun, A., Chatbots und Kundenkommunikation, 2003, S. 21.
Ergänzende Information Die elektronische Version dieses Kapitels enthält Zusatzmaterial, auf das über folgenden Link zugegriffen werden kann https://doi.org/10.1007/978-3-658-43230-0_2.
© Der/die Autor(en), exklusiv lizenziert an Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2023 K. Elsner, Der Einsatz von Chatbots in Business-to-Business-Märkten, BestMasters, https://doi.org/10.1007/978-3-658-43230-0_2
7
8
2 Theoretische Grundlagen
natürlichsprachliche Benutzerschnittstelle zu Daten und Diensten durch verbale oder schriftliche Eingabe dient und in der Lage ist mit menschlichen Benutzern in einen Dialog zu treten.3 Bei der vorliegenden Arbeit steht eine Betrachtung von textbasierten Chatbots im Fokus. Eine einheitliche Definition existiert bis heute nicht. Es ist allerdings ein starker Fokus in Bezug auf den Konversationscharakter ersichtlich. Aus diesem Grund spricht man in diesem Zusammenhang auch von Conversational Interfaces, die einen Gesprächspartner simulieren und Menschen in beruflichen und alltäglichen Aufgaben unterstützen.4 Nach Shawar und Atwell (2005) sind Chatbots „maschinelle Konversationssysteme, die mit menschlichen Benutzern über natürliche Konversationssprache interagieren“5 . Neff und Nagy (2016) definieren Chatbots spezifischer und zwar als ein reaktives Programm, das auf Nachrichten von Benutzern reagiert, indem ein passender Ausdruck aus einem zuvor programmierten Schemata ausgewählt oder der Inhalt durch den Einsatz von adaptiven maschinellen Lernalgorithmen hergeleitet wird.6 Ziel ist es den Nutzern das Gefühl zu geben sich mit einer lebendigen Person zu unterhalten.7 Chatbots dienen dazu, mit Menschen über natürliche Sprache, kommunizieren zu können und werden in der Regel für spezielle und wiederkehrende Aufgaben konzipiert. Chatbots können sowohl in der externen Kommunikation mit Kunden oder anderen Unternehmen eingesetzt werden als auch bei Prozessabläufen innerhalb des eigenen Unternehmens unterstützen.8 Aufgaben von Chatbots innerhalb des Unternehmens umfassen z. B. das Organisieren von Dateien auf einem Computer, das Vereinbaren von Terminen oder das Erstellen einer Aufgabenplanung.9 Für die vorliegende Arbeit stehen allerdings Chatbots im Fokus, die in der externen Kommunikation eingesetzt werden können, sodass Chatbots für die unternehmensinterne Verwendung nicht in Betrachtung kommen. Chatbots sind unter anderem in der Literatur als interaktive Agenten, digitale Agenten oder Smart Bots zu finden. Dadurch, dass Chatbots menschenähnliche Unterhaltungen nachahmen und mit Nutzern in Interaktion treten können, finden Chatbots in der externen Kommunikation bisher vorrangig im Business-to-Consumer (B2C) Verkauf, im Kunden-Service oder zu Marketingzwecken Anwendung.10 Durch 3
Vgl. Stucki, T. et al., Digitale Helfer, 2018, S. 3. Vgl. Hoffmann, A., Zukunft von Marketing, 2018, S. 19 f. 5 Shawar, B. A., Atwell, E. S., Machine-Learning Chatbot, 2005, S. 489. 6 Vgl. Neff, G., Nagy, P., Tay, 2016, S. 4915. 7 Vgl. Brandtzaeg, P. B., Følstad, A., Chatbot Applications, 2018, S. 38. 8 Vgl. Rainsberger, L., Intelligenz im Vertrieb, 2021, S. 75. 9 Vgl. ebd., S. 93. 10 Vgl. Ramesh, K. et al., Design Techniques, 2017, S. 336. 4
2.1 Chatbots
9
den bisherigen starken Bezug zum B2C-Bereich wurden Chatbots zu Beginn auf unterschiedlichen Kanälen in der Kommunikation mit Endkunden eingesetzt, wie z. B. Web- und Messaging-Plattformen.11
2.1.1
Geschichtliche Einordnung
Das Forschungsfeld der Künstlichen Intelligenz begann in den 1950iger Jahren. In der Literatur wird die Arbeit von Turing im Jahr 1950 als Geburtsjahr der KI-Forschung genannt. Turing leistete mit seinem berühmten Aufsatz „Computing and Machinery and Intelligence“ einen wichtigen Beitrag zum heutigen Verständnis des Forschungsfelds der Künstlichen Intelligenz. Er stellte die Frage, ob Maschinen in der Lage sind intelligente Verhaltensweisen zeigen zu können. Außerdem prägte er in diesem Zusammenhang den Turing-Test, einem Imitationsspiel, das dazu dienen soll bei einer Maschine menschenähnliche Intelligenz festzustellen.12 In den darauffolgenden Jahren fanden erste Versuche im Bereich von Chatbots statt, um die Kommunikation zwischen Menschen und Maschine voranzutreiben.13 15 Jahre, nachdem der Turing-Test vorgestellt wurde, zeigte Weizenbaums Programm ELIZA, dass Menschen immer weniger unterscheiden können, ob sie mit einer Maschine oder einem Menschen kommunizieren. 1966 veröffentlichte Weizenbaum einen scriptbasierten Bot, der eine MenschMaschine-Kommunikation mittels natürlicher Sprache erlaubte. Es war das erste Computerprogramm, das erfolgreich ein menschliches Wesen imitieren konnte.14 ELIZA simulierte einen Psychotherapeuten. Nutzer konnten mit ELIZA über eine Textnachricht eines Chats kommunizieren und auf Basis der eingegebenen Informationen psychologische Ratschläge erhalten.15 Durch das Stellen von offenen Fragen wie ‚Können Sie mehr dazu sagen?‘ konnte der Unterschied zwischen Menschen und Maschine nur schwer festgestellt werden. ELIZA folgte bei den Unterhaltungen einfachen Regeln, Mustererkennungstechniken und Substitutionsmethoden, indem Schlüsselwörter in den Gesprächen identifiziert und 11
Vgl. Quah, J. T. S., Chua, Y. W., Marketing in Financial Service, 2019, S. 107 f. Vgl. Turing, A. M., Computer Intelligence, 1950, S. 433 ff. 13 Vgl. Stucki, T. et al., Digitale Helfer, 2018, S. 4. 14 Vgl. Crevier, D., Artificial Intelligence, 1995, 139. 15 Vgl. Hoffmann, A., Zukunft von Marketing, 2018, S. 19 ff. 12
10
2 Theoretische Grundlagen
anschließend in einen Kontext gebracht wurden.16 Auch, wenn die Konversationsfähigkeit eher einfache Züge aufwies, reichte es aus, um Menschen zu verwirren und gab den Anstoß für die Entwicklung weiterer Chatbots.17 Aufbauend auf diesen Erkenntnissen entwickelte der Psychiater Kenneth Colby im Jahre 1972 einen Chatbot mit Namen PARRY. Dieser Chatbot galt als fortschrittlicher als ELIZA, da er eine Persönlichkeit aufwies. PARRY imitierte einen Patienten mit Schizophrenie. Er formuliert seine Antworten auf Basis einer Kombination aus Annahmen und emotionaler Reaktionen, die durch die Äußerungen der Nutzer unterschiedlich stark aktiviert werden konnten.18 Sowohl ELIZA als auch PARRY griffen auf regelbasierte Architekturen zurück. Chatbots, die auf Basis s. g. Pattern-Matching-Algorithmen konzipiert wurden, stellen eine schwache Form künstlicher Intelligenz dar und simulieren lediglich tatsächliches Verständnis.19 Als ein weiterer Schritt in der geschichtlichen Entwicklung von Chatbots gilt die Entwicklung von ALICE im Jahr 1995. ALICE wurde von Richard Wallache entwickelt.20 In seiner ursprünglichen Form basierte ALICE ebenfalls auf ELIZA und beinhaltete Pattern-Matching-Algorithmen.21 Jahre später konnte ALICE, durch die Weiterentwicklung und Integration einer für diesen Zweck geschaffenen Sprache AIML, den Loebner-Preis für das beste menschenähnliche Programm gewinnen.22 ALICE besitzt, ähnlich wie ELIZA, kein wirkliches Verständnis, sondern ist auf das Erkennen von Mustern programmiert. Im Gegensatz zu ELIZA ist ALICE in der Lage, über einen möglichst langen Zeitraum mit Menschen über das Internet zu kommunizieren. Während ELIZA über etwa 200 Schlüsselwörter und Regeln verfügte, beinhaltete ALICE über 41.000 Vorlagen und dazugehörige Muster.23 Weitere Chatbots wie SmarterChild aus dem Jahr 2001 wurden für MessengerAnwendungen entwickelt und vielen Nutzern über unterschiedliche Plattformen zur Verfügung gestellt. SmarterChild war in der Lage mit den Nutzern zu interagieren. Die meisten Fragen basierten auf Informationen, die über Suchmaschinen 16
Vgl. Weizenbaum, J., ELIZA, 1966, S. 36 ff. Vgl. Klopfenstein, L. C. et al., Bots, 2017, S. 556 f. 18 Vgl. Colby, K. M. et al., PARRY, 1972, S. 202 ff. 19 Vgl. Kruse Brandão, T., Wolfram, G., Digital Connection, 2018, S. 287. 20 Vgl. Heller, B. et al., Educational Chatbots, 2005, S. 3914. 21 Vgl. Marietto, B. et al., AIML, 2013, S. 2. 22 Vgl. Shum, H. et al., Social Chatbots, 2018, S. 12. 23 Vgl. Heller, B. et al., Educational Chatbots, 2005, S. 3914. 17
2.1 Chatbots
11
erhalten werden konnten, wie Sportergebnisse oder Aktienkurse. Nutzer verbachten zu Beginn der 2000er Jahre viel Zeit mit chatten. Durch den Chatbot konnte es Nutzern ermöglicht werden Informationen zu erhalten, ohne das Chatfenster verlassen zu müssen. Durch die stark begrenzten und standardisierten Anwendungsbeispiele war den Nutzern allerdings bewusst, dass die Kommunikation mit einer Maschine geführt wurde. Trotzdem ist seit jeher die kommerzielle Nutzung von Chatbots stark gestiegen: Werbetreibende haben das Potenzial von Chatbots erkannt, sodass viele Unternehmen wie eBay einfache Messaging-Bots zu Marketingzwecken einsetzten.24 Diese Chatbots waren die ersten Bots, die Menschen bei täglichen Aufgaben unterstützen konnten und auf Informationen aus Datenbanken zurückgriffen. Diese Entwicklung besitzt bis heute sowohl im Bereich der Künstlichen Intelligenz als auch in der Mensch-Computer-Kommunikation einen hohen Stellenwert. Erstmals wurde im alltäglichen Bereich durch den Dialog mit einem Chatbot auf Informationssysteme zurückgegriffen.25 Auf Basis dieser Ereignisse investierten viele Unternehmen in die weitere Entwicklung und kontinuierliche Verbesserung persönlicher Assistenten, wie z. B. Apple in Siri (2012), Microsoft in Cortana (2014) und Amazon in Alexa (2015).26 Diese persönlichen Agenten werden vorwiegend auf Smartphones genutzt und wurden für die Beantwortung einer Reihe vieler Fragen konzipiert.27 In der Literatur gilt das Jahr 2016 als Geburtsjahr von Chatbot-Anwendungen. Seither ist ein steigendes Interesse an Chatbots zu beobachten.28 Social Media Plattformen ermöglichten es Unternehmen Chatbots für ihre Marke oder ihren Zweck zu entwickeln. Kunden konnte es somit ermöglicht werden, alltägliche Handlungen über die integrierten Messaging-Anwendungen durchzuführen.29 2016 existierten ca. 34.000 Chatbots, die in unterschiedlichen Bereichen, wie z. B. Marketing, Unterhaltung und Bildung Anwendung fanden. Viele textbasierte Chatbots mit spezifischen Funktionen wurden auch für industrielle Lösungen entwickelt.30 Weitere Entwicklungen wie das Internet der Dinge haben eine neue
24
Vgl. Szakál, A., Chatbots for Education, 2018, S. 197 f. Vgl. Adamopoulou, E., Moussiades, L., Technology of Chatbots, 2020, S. 3. 26 Vgl. Sarikaya, R., Personal Digital Assistants, 2017, S. 68. 27 Vgl. Shum, H. et al., Social Chatbots, 2018, S. 10. 28 Vgl. Dale, R., Intelligent Virtual Assistant, 2016, S. 811. 29 Vgl. Adamopoulou, E., Moussiades, L., Technology of Chatbots, 2020, S. 3. 30 Vgl. Dale, R., Intelligent Virtual Assistant, 2016, S. 816. 25
12
2 Theoretische Grundlagen
Ära eingeleitet, die den Einsatz von Conversational Agents vorantreiben und die Kommunikationsmöglichkeiten weiter verbessern können.31
2.1.2
Funktionsweise
Grundsätzlich können Chatbots auf Basis eines regelbasierten oder eines selbstlernenden Ansatzes Anwendung finden. Regelbasierte Chatbots greifen auf logisch abbildbare Beziehungen wie ‚wenn, …dann…oder…‘ zurück. Auf Basis dieser Regeln werden über Stichwörter passende Antworten zugeordnet. Die ausgegebenen Antworten erfolgen allerdings nur im Rahmen der vorab definierten Regeln, sodass eine Zuordnung von unbekannten Wörtern nicht möglich ist und der Chatbot mit einer standardisierten Antwort reagiert. Daher findet oftmals eine Definition von kompletten Chat-Dialogen statt, um eventuellen Fehlern vorzugreifen.32 Selbstlernende Chatbots hingegen basieren auf Prinzipien der Künstlichen Intelligenz wie z. B. Deep oder Machine Learning. Sie gelten als effektivere Art, da Sie durch ihre Programmierung die menschliche Sprache, unabhängig von Formulierung oder Rechtschreibfehlern, verstehen können.33 Der Chatbot lernt anhand von geführten Konversationen und kann somit selbstständig auf unerwartete Fragen antworten, indem neue Verknüpfungen erstellt werden. Sie berücksichtigen den gesamten Dialogkontext, wobei vorgefertigte Antworten nicht benötigt werden.34 Ein Konzept stellt das Natural Language Processing (NLP) dar. NLP ist dem Bereich der Künstlichen Intelligenz zuzuordnen. NLP ermöglicht es Computern die menschliche Sprache zu verstehen und zu analysieren, indem verschiedene Methoden aus den Sprachwissenschaften mit modernen Ansätzen der Informatik und der Künstlichen Intelligenz verknüpft werden.35 Um natürliche Ausdrucksweisen zu verstehen, werden Techniken gebildet, die das Wissen und auch das Verständnis über eine Sprache sammeln mit dem Ziel eine Vielzahl von Aufgaben lösen zu können.36 Ziel der natürlichen Sprachverarbeitung ist es, die unstrukturierten Informationen in eine strukturierte und 31
Vgl. Kar, R., Haldar, R., Internet of Things, 2016, o.S. Vgl. Stäcker, O., Stanoevska-Slabeva, K., Chat Roboter, 2018, S. 39. 33 Vgl. Salah, A. A. et al., Digitale Assistenzsysteme, 2021, S. 409. 34 Vgl. Stäcker, O., Stanoevska-Slabeva, K., Chat Roboter, 2018, S. 39 ff. 35 Vgl. Salah, A. A. et al., Digitale Assistenzsysteme, 2021, S. 408. 36 Vgl. Jung, S., Natural Language Understanding, 2019, S. 130 ff. 32
2.1 Chatbots
13
verständliche Form zu übersetzen.37 Viele NLP-Techniken basieren auf Konzepten des maschinellen Lernens und auf Natural Language Understanding (NLU). NLU wird benötigt, um einen Text zu verstehen. Generell liegt die Herausforderung nicht in der reinen Bedeutung der einzelnen Wörter, sondern vielmehr in der Semantik. Die eigentliche Kernaussage muss unabhängig von der Grammatik, der Intention und kulturellen Besonderheiten des Nutzers erkannt werden.38 Über den vorrangingen Einsatz beider Chatbot-Arten sind in der Literatur unterschiedliche Meinungen zu finden. Tiwari und Kumar (2017) sowie Stäcker und Stanevsko-Slabeva (2018) gehen von einem überwiegenden Einsatz von regelbasierten Chatbots aus, da diese Art der Chatbots als weniger aufwendig zu bewerten sind und keine umfangreichen Programmierungskenntnisse benötigen.39 Salah et al. (2021) hingegen sehen den Einsatz von selbstlernenden Chatbots als präferierte Art in der Praxis, da so ein besserer Menschersatz imitiert werden könne.40 Generell sind in der Literatur viele unterschiedliche Ansätze für die Gestaltung von Chatbots zu finden. Die Architektur eines Chatbots ist von vielen Faktoren, wie Sprach- oder Texteingabe, der verwendeten Musterabgleichtechnik (z. B. AIML) oder konkreten Anwendungsfällen abhängig.41 So stellen Khanna et al. (2015)42 und Reshmi und Balakrishnan (2018)43 ein auf AIML-basiertes Design für regelbasierte Chatbots vor. Colace (2018) schlägt in seinem Werk einen Ansatz vor, der sich auf Grund des Anwendungsbezugs auf lediglich drei Hauptkomponenten bezieht.44 Für die vorliegende Arbeit soll ein möglichst allgemeiner Ansatz vorgestellt werden. Adamopoulou und Moussiades (2020) stellen einen solchen Ansatz vor, der in Abb. 2.1 vereinfacht dargestellt wird.45
37
Vgl. Cahn, J., Chatbot Design, 2017, S. 10. Vgl. Salah, A. A. et al., Digitale Assistenzsysteme, 2021, S. 408. 39 Vgl. Mukherjee, A. B. et al., Machine Intelligence, 2017, S. 80. 40 Vgl. Salah, A. A. et al., Digitale Assistenzsysteme, 2021, S. 409. 41 Vgl. Abdul-Kader, S. A., Woods, J., Conversation Systems, 2015, S. 78. 42 Vgl. Khanna, A. et al., Machine Intelligence, 2015, S. 277 ff. 43 Vgl. Reshmi, S., Balakrishnan, K., Business Intelligence, 2018, S. 629 ff. 44 Vgl. Colace, F. et al., Intelligent Support, 2018, S. 530. 45 Vgl. Adamopoulou, E., Moussiades, L., Technology of Chatbots, 2020, S. 8 ff. 38
14
2 Theoretische Grundlagen
User Interface Component
Texteingabe
User Message Analysis Component
Kontextinformationen Antwortgenerierung
Response Generating Component
Dialog Management Component Daten
Backend
Abb. 2.1 Grundlegende Funktionsweise von Chatbots. (Quelle: Eigene Darstellung in Anlehnung an Adamopoulou, E., Moussiades, L., Technology of Chatbots, 2020, S. 8 f.)
Zu Beginn einer Interaktion nimmt der Nutzer eine Eingabe in Text- oder Sprachform über die Benutzerschnittstellenkomponente vor. Dies kann z. B. eine Social Media Plattform oder eine unternehmenseigne Website darstellen (User Interface Component). Anschließend analysiert eine weitere Komponente die Benutzernachricht mittels Mustervergleichen, um die Absicht des Nutzers zu ermitteln.46 Hier finden Techniken wie NLP Anwendung, um eine Extraktion von semantischen Informationen aus gesprochener oder geschriebener Sprache vorzunehmen. NLP dient dazu grammatikalische Datenstrukturen aufzubauen, die von der darauffolgenden Komponente verstanden und verarbeitet werden können (User Message Analysis Component).47 Die Dialog Management Component aktualisiert stetig den Gesprächskontext und trägt somit maßgeblich zur weiteren Verarbeitung bei.48 Es werden alle kontextrelevanten Informationen gespeichert. Sollten notwendige Informationen fehlen, wird der Benutzer gebeten diese mitzuteilen.49 Nachdem die Dialog Management Component die Absicht des Nutzers erfasst hat, wird entweder direkt eine Antwort zurückgegeben oder die Informationen werden an die nächste Komponente weitergegeben. Die dafür benötigte 46
Vgl. Adamopoulou, E., Moussiades, L., Technology of Chatbots, 2020, S. 8. Vgl. Cahn, J., Chatbot Design, 2017, S. 10. 48 Vgl. Bohus, D., Rudnicky, A. I., Dialog Management, 2009, S. 333. 49 Vgl. Kucherbaev, P. et al., Human-Aided Bots, 2018, S. 37. 47
2.1 Chatbots
15
Komponente stellt das Backend dar. Das Backend versorgt den Chatbot mit Informationen, die für die Erfüllung der Eingabe des Nutzers benötigt werden. Bei regelbasierten Chatbots erfolgt eine Kommunikation mit einer Wissensdatenbank. Um möglichst viele Benutzeranfragen beantworten zu können, bedarf es einer Vielzahl von handgeschriebenen Antwortmöglichkeiten.50 Eine Wissensbasis kann durch semantische Konzepte zusätzlich unterstützt werden.51 Die letzte Komponente dient zur Antwortgenerierung. Die Antwort wird auf Basis drei unterschiedlicher Modelle formuliert. Musterbasierte Modelle erhalten ihre Antwort aus der Wissensbasis im Backend. Chatbots gleichen die zugrundliegenden Frage-Antwort-Muster ab und es werden Platzhalterwerte übergeben, um eine passende Antwort ausdrücken zu können.52 Ein retrievelbasiertes Modell ist hingegen etwas flexibler aufgebaut. Sie wenden neben vordefinierte Antworten Heuristiken an, um eine geeignete Antwort geben zu können.53 Das generative Modell ist das intelligenteste der vorgestellten Modelle bei der Generierung von Antworten. Die Antworten werden durch einen s. g. Natural Language Generator und auf Basis von früheren und aktuellen Eingaben gegeben.54
2.1.3
Klassifikation
Chatbots können in unterschiedliche Kategorien eingeteilt werden. In der Literatur sind viele Ansätze zu finden. So schlägt Nuruzzamann (2018) eine Klassifizierung nach der Chatbot-Funktion vor.55 Barker (2017) hingegen ordnet Chatbots nach ihrer Anwendung ein, während Mason (2017) wiederum eine Unterteilung nach Business-Cases vornimmt. Die jeweiligen Ansätze sind in Abb. 2.2 dargestellt.
50
Vgl. Khanna, A. et al., Machine Intelligence, 2015, S. 278 f. Vgl. Adamopoulou, E., Moussiades, L., Technology of Chatbots, 2020, S. 10. 52 Vgl. Ramesh, K. et al., Design Techniques, 2017, S. 341. 53 Vgl. ebd., S. 347. 54 Vgl. Hien, H. T. et al., Intelligent Assistants, 2018, S. 71. 55 Vgl. Nuruzzaman, M., Hussain, O. K., Chatbot Implementation, 2018, S. 55. 51
16
2 Theoretische Grundlagen
Klassifizierung Funktion nach Nuruzzaman (2018)
Anwendung nach Barker (2017)
Geschäftsvorgang nach Mason (2017)
Ziel-basiert
Service
Support
Wissen-basiert
Beratung
Skill
Service-basiert
Handel
Assistant
Antwort-basiert
Unterhaltung
Abb. 2.2 Klassifizierungsansätze von Chatbots. (Quelle: Eigene Darstellung)
Nuruzzamann (2018) nimmt eine Einteilung in vier Gruppen vor: zielorientierte, wissensbasierte, dienstbasierte und antwortgenerierende Chatbots. Zielorientierte Chatbots werden konzipiert, um eine von dem Nutzer definierte Aufgabe zu erfüllen. Diese können das Ziel verfolgen Informationen zu liefern, eine Unterhaltung zu führen oder den Nutzer bei einer konkreten Aktion zu unterstützen. Unternehmen können Chatbots z. B. auf der unternehmenseigenen Website einsetzen, um bei der Beantwortung von Fragen der Kunden zu helfen. Wissensbasierte Chatbots beruhen auf den zugrunde liegenden Daten. Die beiden bedeutendsten Datenquellen sind Open- und Closed-Domains.56 Wenn Menschen miteinander kommunizieren, sind sie in der Lage ein Gespräch mit einem anderen Thema zu beginnen und es mit einem anderen zu beenden. Open-Domain basierende Modelle sind demnach nicht auf einen bestimmten Zweck ausgerichtet.57 In einer Closed-Domain Umgebung sind die Eingabe- und Ausgabemöglichkeiten begrenzt. Technischer Kundensupport oder Einkaufsassistenten sind Beispiele für Chatbots, die lediglich eine bestimmte Aufgabe möglichst effizient erledigen sollen.58 Können Nutzern bestimmte Leistungen zur Verfügung gestellt werden, handelt es sich um Service-basierte Chatbots. Sie werden für den kommerziellen bzw. persönlich Nutzen erschaffen. Ein Beispiel stellt ein Logistik- oder Handelsunternehmen dar. Kopien von Versand- und Lieferdokumenten können über Chatbots angefragt werden, anstatt zu telefonieren. Die letzte Klassifizierung nach Nuruzzamann (2018) stellen antwortgenerierende Chatbots dar. Sie basieren auf der durchgeführten Aktion bei der Generierung von Antworten. Es existieren 56
Vgl. Nuruzzaman, M., Hussain, O. K., Chatbot Implementation, 2018, S. 55. Vgl. Ramesh, K. et al., Design Techniques, 2017, S. 348. 58 Vgl. Rainsberger, L., Intelligenz im Vertrieb, 2021, S. 93. 57
2.1 Chatbots
17
unterschiedliche Antwortmodelle, wie Generative Modelle oder Retrievel-basierte Modelle. Außerdem können Chatbots nach ihrer Anwendung in Service-, Beratungs-, Handels-, Unterhaltungs-, Chatbots eingeteilt werden. Die Entwicklung von Service-Chatbots fand statt, um Kunden Unterstützung zu bieten.59 Sie verfolgen unter anderem das Ziel das generelle Anrufaufkommen bei Service Mitarbeitern zu reduzieren.60 Diese Art von Bots stellt einen der häufigsten Anwendungsfälle dar. Kundenservice-Bots unterstützen dabei Kundenanfragen zu beantworten. Kunden haben so den Vorteil ein Call-Center zu umgehen und schnell eine Lösung für das individuelle Anliegen zu erhalten.61 Es können Fragen zu Öffnungszeiten oder FAQs gestellt werden.62 Beratungs-Bots hingegen sind darüber hinaus in der Lage, Ratschläge zu geben oder Wartungs- und Reparaturarbeiten anzubieten. Beratungs-Chatbots können einen Nutzer direkt kontaktieren und bei Bedarf unterstützen und Beratungshilfe offerieren. Handels-, oder auch Kommerzielle Chatbots genannt, dienen den Kunden zur Vereinfachung von Einkäufen. Entertainment-Bots verfolgen hingegen das Ziel die Nutzer zu unterhalten. Diese Art von Bots finden aber durch den fehlenden Kontextbezug keine weitere Betrachtung.63 Aus unternehmerischer Sicht stellt Mason (2017) die drei am häufigsten verwendeten Chatbot-Klassen vor: Support-, Skill- und Assistenten-Chatbots. Support-Chatbots werden entwickelt, um Wissen über einen speziellen Bereich zu beherrschen, wie z. B. über ein bestimmtes Unternehmen. Um eine breite Palette an FAQ-Fragen beantworten zu können, sollte der Chatbot eine Persönlichkeit, eine Multi-Turn-Fähigkeit und Kontextbewusstsein aufweisen. Dies ist außerdem wichtig, um den Nutzer durch alle wichtigen Geschäftsprozesse führen zu können. Für Support-Chatbots ist es von essenzieller Bedeutung, dass diese einfach zu navigieren sind und dass die gewünschten Aktionen schnell ausgeführt werden können, die dem Nutzer wirklich wichtig sind.64 Skill-Chatbots verfügen über kein kontextbezogenes Bewusstsein. Sie umfassen in der Regel eine Funktion, die das Leben erleichtern sollen und oft im Bereich Smart-Home oder bei personalisierten Objekten Anwendung finden. Für Skill-Chatbots wird die Steuerung via Sprache empfohlen, damit Nutzer nicht auf Tasten klicken müssen, 59
Vgl. Barker, S., Chatbots, 2017, S. 30. Vgl. Nuruzzaman, M., Hussain, O. K., Chatbot Implementation, 2018, S. 56. 61 Vgl. Kruse Brandão, T., Wolfram, G., Digital Connection, 2018, S. 282. 62 Vgl. Shevat, A., Designing Bots, 2017, S. 34. 63 Vgl. Nuruzzaman, M., Hussain, O. K., Chatbot Implementation, 2018, S. 56. 64 Vgl. Mason, M., Business Chatbots, 2017, o. S. 60
18
2 Theoretische Grundlagen
um z. B. ein Gerät einzuschalten.65 Assistenz-Chatbots weisen sowohl Charakterzüge von Support- als auch von Skill-Chatbots auf. Die beste Funktionalität ist gewährleistet, wenn diese über grundlegendes Wissen zu einer Vielzahl von Themen verfügen. Assistenten-Chatbots sollten eine hohe Konversationsfähigkeit aufweisen und auf viele Eingaben reagieren. Das Angebot von Unterhaltung ist ebenfalls wichtig. Apples Siri ist ein aktuelles Beispiel: Sollte Siri auf eine Frage die Antwort nicht geben können, antwortet es meistens mit einem unterhaltsamen Spruch.66
2.2
Business-to-Business-Märkte
Nachdem im vorangegangenen Abschnitt eine Definition und ein grundlegendes Verständnis für Chatbots geschaffen wurde, erfolgt innerhalb von diesem Abschnitt eine Abgrenzung des B2B-Geschäftes sowie eine Einordnung von Chatbots in diesem Kontext. Im B2B-Bereich werden Produkte und Dienstleistungen zwischen mindestens zwei Unternehmen oder sonstigen Organisationen vermarktet und verkauft. Auch Verbände und staatliche Institutionen zählen zu den Aktionären.67 Die Betrachtung von Austauschprozessen zwischen Unternehmen bildet seit den 1970er Jahren ein eigenständiges Forschungsfeld in Deutschland.68 Investitionsgüter-, Industriegüter- und industrielle Märkte werden häufig als Synonym verwendet. Obwohl große Überschneidungsbereiche bestehen, sind die drei Begriffe aufgrund weniger Vermarkungsinstanzen klar abzugrenzen. Während B2B-Märkte den Groß- und Einzelhandel mit in die Betrachtung einbeziehen, werden diese auf Industrie- und Investitionsgütermärkten ausgeklammert.69 Auch der Bereich der Konsumgüter ist getrennt von den bereits vorgestellten Segmenten zu betrachten. Auf Konsumgütermärkten werden fertiggestellte Produkte an private Haushalte bzw. Endverbraucher verkauft und nicht wie im B2B-Bereich an Unternehmen.70 Abb. 2.3 verdeutlicht die Abgrenzung zwischen den einzelnen Märkten.
65
Vgl. ebd. Vgl. López, G. et al., Commercial Chatbots, 2017, S. 243. 67 Vgl. Kleinaltenkamp, M., Business-to-Business-Marketing, 2000, S. 173. 68 Vgl. Kleinaltenkamp, M., Business-to-Business-Kommunikation, 1994, S. 77. 69 Vgl. Backhaus, K., Voeth, M., Industriegütermarketing, 2015, S. 19. 70 Vgl. Wright, R., Marketing in Business, 2004, S. 4. 66
2.2 Business-to-Business-Märkte
Business-to-Business-Märkte
Konsumgütermärkte
Hersteller Hersteller
19
Großhändler
Einzelhändler
Konsument
Einzelhändler
Konsument
Hersteller
Konsument
Industriegütermärkte Hersteller
Abb. 2.3 Abgrenzung Business-to-Business-Märkte. (Quelle: Eigene Darstellung in Anlehnung an Foscht, T. et al., Organisationales Käuferverhalten, S. 273)
B2B-Märkten unterscheiden sich zudem von B2C-Märkten.71 Generell können B2B-Märkte durch folgende Eigenschaften charakterisiert werden: • Marktstruktur: Es bestehen oligopolistische Marktstrukturen. Im Verhältnis stehen wenigen Anbietern wenige Nachfrager gegenüber.72 • Abgeleiteter Bedarf: Güter im B2B-Bereich besitzen einen abgeleiteten Charakter. Die Nachfrage richtet sich nach dem Bedarf anderer Organisationen. Produkte oder Güter werden für die weitere Nutzung oder auch Weiterverarbeitung verwendet.73 Resultierend daraus können Anbieter die Nachfrage nicht direkt beeinflussen.74 • Käuferverhalten: Die Entscheidungen in einem Einkaufsprozess werden, in Abhängigkeit der Produkte, von mehreren Personen in einem Buying-Center getroffen.75 Außerdem steht der direkte Kundenkontakt im Fokus. Anbieter und Nachfrager kennen sich häufig und der persönliche Kontakt spielt eine wichtige Rolle. Die Akteure neigen tendenziell dazu eine Beziehung aufzubauen.76 Zudem sind Entscheidungen im B2B-Sektor rational geprägt und weniger emotional als im Konsumgüterbereich.77
71
Vgl. Foscht, T. et al., Organisationales Käuferverhalten, 2015, S. 273. Vgl. Plinke, W., Investitionsgütermarketing, 1991, S. 172 ff. 73 Vgl. Budt, M. et al., Vertriebsmanagement, 2020, S. 77. 74 Vgl. Eckardt, G. H., Käuferverhalten, 2010, S. 5. 75 Vgl. Backhaus, K., Voeth, M., Industriegütermarketing, 2015, S. 22. 76 Vgl. Kuß, A., Marketing, 2013, S. 250. 77 Vgl. Backhaus, K., Voeth, M., Industriegütermarketing, 2015, S. 22. 72
20
2 Theoretische Grundlagen
• Geschäftsbeziehung: Die Geschäftsbeziehungen sind eher langfristig geprägt. Sie sind häufig stark individualisiert und Aktivitäten laufen durch die hohe Komplexität der Güter routiniert und formalisiert ab.78 Auf B2B-Märkten kann zwischen industriellen und konsumbezogenen Gesichtspunkten unterschieden werden. Produkte für den Ge- oder Verbrauch werden als Konsumgüter bezeichnet. Sie umfassen Güter des alltäglichen Bedarfs, sowie Nahrungsmittel aber auch die Nutzung des öffentlichen Nahverkehrs.79 Bei Industriegütern handelt es sich um Güter, die dem industriellen Bedarf dienen. Dies können Rohstoffe, Hilfsstoffe, Anlagen oder Maschinen sein.80
2.2.1
Konsumeration des B2B-Käuferverhaltens
Der elektronische Austausch zwischen Unternehmen, z. B. über EDIAnbindungen, besteht bereits seit den 1990er Jahren. Bislang haben nur wenige B2B-Anbieter das Online-Geschäft für sich entdeckt.81 Angetrieben durch den Erfolg der B2C-Anbieter, erkennen Unternehmen die Notwendigkeit weitere Plattformen zu integrieren. Daher ist laut Experten mit einem signifikanten Online-Wachstum im B2B-Segment zu rechnen.82 Einer der größten Treiber für die Veränderungen im B2B-Segment stellt ein grundsätzlicher Wandel innerhalb des Einkäuferverhaltens dar. Laut Statista sind ca. 70 % der Weltbevölkerung der Generation Y (geboren zwischen 1980 – 1994) und der Generation Z (geboren ab 1995) zugehörig. Weitere 25 % stellt die Generation X mit Geburtsjahren zwischen 1965 – 1979 dar.83 Während die Generationen Y und Z bereits mit neuen Technologien aufgewachsen sind, ist auch, insbesondere auf der Managementebene, eine Änderung im Käuferverhalten zu beobachten. Etwa die Hälfte aller B2B-Entscheider sind unter 34 Jahre alt, s. g. Digital Natives. Diese Zahl wird laut einer digitalen Umfrage von Google und Millward Brown jedes Jahr weiter steigen.84 Recherchen werden daher zunehmend auf digitale Medien
78
Vgl. Kuß, A., Kleinaltenkamp, M., Grundlagen Marketing, 2011, S. 84 ff. Vgl. Kotler, P., Bliemel, F., Marketing-Management, 2006, S. 719. 80 Vgl. ebd., S. 6. 81 Vgl. Heinemann, G., B2B Online-Handel, 2020, S. 35. 82 Vgl. ebd., S. 1. 83 Vgl. Statista, Arbeitskräfte, 2020, o. S. 84 Vgl. Google und Millward Brown, B2B-Markting, 2015, o. S. 79
2.2 Business-to-Business-Märkte
21
umgestellt.85 Diese Generationen passen ihr B2B-Einkaufsverhalten an ihr privates Nutzungsverhalten an, sodass die Unterschiede zwischen B2C und B2B immer weniger zu beobachten sein werden. Viele Verbraucher haben bei persönlichen Einkäufen positive Erfahrung gemacht und erwarten die einfachen Strukturen auch im B2B-Umfeld.86 Dieses Phänomen ist in der aktuellen Literatur unter dem Begriff der Konsumeration des B2B-Käuferverhaltens zu finden.87 Die Besonderheit im B2B-Bereich stellt dar, dass es neben der Dimensionen Kunde, die sowohl Unternehmen als auch Organisationen darstellen können, und der Dimension Produkte eine Dritte Dimension zu beachten ist: die Organisation selbst und deren Prozesse.88 Während im B2C eCommerce das Maximieren von Umsätzen im Vordergrund steht, streben B2B Unternehmen an die Effizienz der Prozesse zu erhöhen.89 Im B2C-Segment unterstützen KI-basierte Technologien, wie Chatbots, bei der Kaufentscheidung. Im B2B-Bereich hingegen können diese Technologien zu Prozessverbesserungen im gesamten Unternehmen führen.90 B2B-Unternehmen haben zudem die Möglichkeit, bei Bestellabwicklung von geringeren Transaktionskosten zu profitieren.91
2.2.2
Integrationsmöglichkeiten von Chatbots
Es bestehen viele Möglichkeiten für B2B-Unternehmen Chatbots in internetbasierten Anwendungen zu integrieren. Um diese Tatsache zu verdeutlichen, wird die Arbeit von Porter herangezogen, der in seinem Werk „Strategy and the Internet“ mögliche Anwendungsbereiche für Unternehmen entlang des Wertschöpfungskette nennt. Neben HR, der Produktentwicklung und der Beschaffung thematisiert Porter die Bereiche Marketing & Sales sowie After-Sales Services, die für die vorliegende Arbeit im Fokus der Betrachtung stehen.92 In der Literatur werden unterschiedliche Möglichkeiten aufgezeigt, den Kaufentscheidungsprozess strukturiert darzustellen. Kotler (2000) teilt den Prozess in
85
Vgl. Hauk, N. et al., Technology Acceptance, 2018, S. 304 ff. Vgl. Steward, M. D. et al., B2B Buying Process, 2019, S. 288. 87 Vgl. Dinana, H. O., Sales Management, 2020, S. 69 ff. 88 Vgl. Kett, H. et al., Veränderungstreiber für Geschäftsmodelle, 2021, S. 65. 89 Vgl. Heinemann, G., B2B Online-Handel, 2020, S. 2. 90 Vgl. Kett, H. et al., Veränderungstreiber für Geschäftsmodelle, 2021, S. 65. 91 Vgl. Hutt, M. D., Speh, T. W., Marketing Management, 2010, S. 311. 92 Vgl. Porter, M. E., Internet Strategy, 2001, o. S. 86
22
2 Theoretische Grundlagen
ein fünf-stufiges Modell, bestehend aus der Bedarfserkennung, der Informationssuche, der Bewertung einer Option, der Kaufentscheidung und der Bewertung nach dem Kauf.93 Andere Autoren charakterisieren den Kaufentscheidungsprozess in ein dreistufiges Modell, bestehend aus der Vor-Kaufphase, der Kaufphase und der Nach-Kaufphase.94 Für die vorliegende Arbeit wird der drei-stufige Ansatz verwendet, da dieser die grundlegenden Stufen sowie alle Schritte nach Kotler beinhaltet. Abb. 2.4 zeigt B2B Anwendungsmöglichkeiten entlang der unterschiedlichen Kaufphasen im Internet.
Informationsbeschaffung
Auftragsabwicklung
Vor-Kaufphase
Kaufphase
Service & Support Nach-Kaufphase
Produktinformationen auf Websites oder Marktplätzen
Kundenindividuelle Auftragsverfolgung [Tracking]
Chat-Funktionen mit „Call-menow“ Option
Produktkataloge
Dokumentenmanagement und Versand [QM-Vereinbarungen,
Feedbackmöglichkeiten
E-Mail Newsletter
Lieferscheine, Rechnungen]
Beschwerdemanagement
Umfragen zur Informationsgewinnung
Bestell- und Terminänderungen
Video-Diagnose
Virtueller Shopping-Assistent
Maßgeschneiderter OnlineZugang mit Bestandsübersichten
FAQs eLearning
Abb. 2.4 Anwendungsbereiche im B2B-Business. (Quelle: Eigene Darstellung95 )
Die Vor-Kaufphase ist geprägt durch die Wahrnehmung des Kunden und seiner Suche nach Informationen. Das Image des Unternehmens, der Service und die Kommunikation sind entscheidende Kriterien für die Kaufentscheidung.96 Mit Unterstützung des Internets können Produktinformationen über Online-Kataloge, der unternehmenseigenen Website oder auf Marktplätzen potenziellen Kunden zur Verfügung gestellt werden.97 In der Kaufphase findet die eigentliche Kaufentscheidung und die tatsächliche Abwicklung des Kaufs statt. Produkte können über
93
Vgl. Kotler, P., Keller, K. L., Competitive Advantages, 2015, S. 194. Vgl. Wannenwetsch, H., Nicolai, S., E-Supply-Chain-Management, 2004, S. 169. 95 Abbildung basierend auf den Werken von Wannenwetsch, H. und Nicolai, S. (2004), Porter, M. (2001), McIvor, R. (2000), Körner, M. (2002), sowie Rietschel, J. (2011). 96 Vgl. Rietschel, J., Qualitative Marktforschung, 2011, S. 638 f. 97 Vgl. Porter, M. E., Internet Strategy, 2001, o. S. 94
2.2 Business-to-Business-Märkte
23
Front-End-Systeme, wie z. B. Online-Shops oder Marktplätze angeboten werden.98 Kunden können das Tracking von Aufträgen, Echtzeit Bestandseinsichten und Bestell- und Terminänderung individuell vornehmen.99 Auch EDI-bezogene Aspekte zur automatisierten Auftragsübermittlung fallen in den Bereich der Kaufphase.100 Der Kaufprozess endet mit der Nach-Kaufphase und damit mit der Anwendung oder Weiterverarbeitung des Produkts.101 In der Nach-Kaufphase können über internetbasierte Plattformen FAQs zur Verfügung gestellt und Kunden die Möglichkeit zur Feedbackabgabe gegeben werden. Außerdem ist ein Angebot von Video-Diagnosen und Chats möglich.102 Auch der B2B-Bereich hat sich durch die Entwicklung neuer Technologien weiterentwickelt. Eine der wichtigsten Veränderung stellt die Einführung von Techniken und Softwares dar, die auf Grundlagen der Künstlichen Intelligenz beruhen. Das Problem vieler Unternehmen stellt der Mangel an Mitarbeitern dar, um Kunden während bevorzugter Kontaktzeitpunkte die gewünschten Informationen bereitstellen zu können.103 KI gestützte Anwendungen werden eingesetzt, um die Effizienz solcher im E-Business stattfindenden Anwendungen zu optimieren und weiterhin effizienter zu gestalten.104 Durch KI-basierte Technologien gehen die Anwendungen über die Erfüllung von Aufträgen und Statusmeldungen hinaus. Der interaktive Informationsfluss dient dazu Nutzern ein besseres Erlebnis zu bieten.105 KI wird zukünftig Marketingstrategien, Verkaufsprozesse und Serviceoptionen beeinflussen.106 Studien über den KI-gestützten Einsatz im B2B-Bereich sind erst in den letzten Jahren zu finden. Paschen et al. (2020) befassen sich in ihrem Werk über den Einsatz von KI entlang des Vertriebstrichters und leisten einen Beitrag dazu, wie die großen Datenmengen im Vertriebsprozess effizient eingesetzt werden können. Sie kommen zu dem Schluss, dass KI durch die enorme Informationsverarbeitungskapazitäten und wiederholbare menschliche Aufgaben im B2B-Vertrieb ersetzen können. Sie weisen aber auch darauf hin, dass der Einsatz von menschlichen Instanzen für die Interpretation und den
98
Vgl. Wannenwetsch, H., Nicolai, S., E-Supply-Chain-Management, 2004, S. 169. Vgl. Porter, M. E., Internet Strategy, 2001, o. S. 100 Vgl. McIvor, R. et al., Electronic Commerce, 2000, S. 123 f. 101 Vgl. Rietschel, J., Qualitative Marktforschung, 2011, S. 638 f. 102 Vgl. Körner, M., E-Service-Support, 2002, S. 47. 103 Vgl. Prentice, C., Nguyen, M., Retaining Customers, 2020, o.S. 104 Vgl. Davenport, T. et al., Future of Marketing, 2020, S. 24. 105 Vgl. Rust, R. T., Lemon, K. N., Information Web Service, 2001, S. 85 ff. 106 Vgl. Davenport, T. et al., Future of Marketing, 2020, S. 24 f. 99
24
2 Theoretische Grundlagen
Aufbau von Geschäftsbeziehungen von größter Bedeutung sind.107 Eine weitere Arbeit von Sura et al. (2021) befasst sich mit KI-basierenden CRM-Systemen im B2B-Umfeld.108 Publikationen in Bezug auf den Einsatz von Chatbots gibt es bisher nur in einer geringen Anzahl. Seit 2018 sind vermehrt Arbeiten zu finden, die sich mit dem Einsatz von Chatbots in B2B-Sektor beschäftigen.109 Als Beispiel sind Kushwaha et al. (2021) zu nennen, die in ihrem Werk zeigen, dass der Einsatz von Chatbots im B2B-Bereich das Kundenerlebnis positiv beeinflussen kann.110 Für einen vollständigen Überblick über die bisher publizierte Literatur wird auf Anhang 1 des elektronischen Zusatzmaterials verwiesen.
2.2.3
Einsatzmotivationen und Vorbehalte
Chatbots können die Art der Kommunikation zwischen B2B-Unternehmen und den Kunden verändern. Durch die Kombination von Messenger-Apps und Chatbots eröffnen sich Unternehmen neue Möglichkeiten mit ihren Kunden in einer Eins-zu-Eins-Kommunikation interagieren zu können. Viele Nutzer wenden die Messenger-Apps z. B. über Social-Media-Plattformen vorwiegend im privaten Umfeld an.111 Laut einer Studie im Jahr 2021 haben 63 % der Befragten bereits mit einem Chatbots interagiert, was eine Steigerung von 23 % im Vergleich zum Jahr 2018 bedeutet.112 Auch B2B-Unternehmen haben die Möglichkeit von diesen Entwicklungen zu profitieren. Chatbots bieten unterschiedliche Vorteile gegenüber herkömmlichen Kommunikationskanälen, wie Telefon- oder Mailbetreuung durch einen Mitarbeiter des Unternehmens oder der unternehmenseigenen Website.113 Neben Einsparungspotenzialen und der Informationsgewinnung gelten die Steigerung der Effizienz bei gleichzeitiger Steigerung der zur Verfügung stehenden Daten gleichermaßen als Hauptgründe für viele Unternehmen Chatbots einzusetzen. Während sich die Steigerung des Servicepotenzials und die Steigerung der Kundenbindung direkt auf die Wahrnehmung des Kunden oder einer Organisation auswirken, sind Einsparpotenziale und die Informationsgewinnung als interne Faktoren zu bewerten. Diese erklären den Einsatz von 107
Vgl. Paschen, J. et al., Collaborative Intelligence, 2020, S. 412. Vgl. Saura, J. R. et al., AI Digital Marketing, 2021, S. 161 ff. 109 Vgl. Anhang 1 des elektronischen Zusatzmaterials. 110 Vgl. Kushwaha, A. K. et al., B2B Customer Experience, 2021, S. 207 ff. 111 Vgl. Zumstein, D., Hundermark, S., Interactive Technology, 2017, S. 101. 112 Vgl. Monard, F. et al., Chatbot Studie, 2021, S. 13. 113 Vgl. Mehner, M., Service Automation, 2019, S. 151. 108
2.2 Business-to-Business-Märkte
25
Chatbots innerhalb von B2B-Unternehmen und wirken sich nicht direkt auf die Wahrnehmung oder Akzeptanz von Chatbots aus. Daher steht die Steigerung des Servicepotenzials und die Steigerung der Kundenbindung im Fokus dieses Abschnitts. Die Steigerung des Servicepotenzials ist als zentraler Faktor zu betrachten.114 Kunden sind heutzutage immer anspruchsvoller und selbstbewusster. Sie haben hohe Ansprüche an den Service und erwarten zunehmend einen Service, der zu jeder Uhrzeit, unabhängig von den Öffnungszeiten eines Unternehmens, erreichbar ist.115 Mit Unterstützung von Chatbots können Unternehmen es ihren Kunden ermöglichen 24 Stunden am Tag und sieben Tage die Woche Kontakt aufzunehmen, um eine Antwort zu erhalten.116 Unternehmen sparen so auf der einen Seite Personalkosten und auf der anderen Seite können die bestehenden Mitarbeiter effizienter eingesetzt werden. Dadurch, dass die Kommunikation in Echtzeit stattfinden kann, können Anfragen sofort nach Eingang bearbeitet und beantwortet werden.117 Außerdem ermöglichen es Chatbots mit einer Vielzahl von Nutzern gleichzeitig zu kommunizieren.118 Laut einer Studie des Beratungsunternehmens buw Consulting führen die zuvor genannten Einsparungen nicht zu einer Verschlechterung der Servicequalität, denn Unfreundlichkeit und ein Mangel an Fachwissen stehen oft an der Tagesordnung. Zudem neigen Menschen dazu an Produktivität zu verlieren, wenn es um das Erledigen von wiederholten und einfachen Aufgaben geht.119 Chatbots weisen diese Schwachstellen nur bedingt auf, da sie niemals krank, gestresst oder unfreundlich auf Anfragen reagieren.120 Sie haben so die Möglichkeit einfache Fälle zu bearbeiten, wobei sich die Antwortzeiten wiederum verkürzen und generell mit einer höheren Arbeitszufriedenheit gerechnet werden kann.121 Aus Anwendersicht profitieren Nutzer daher durch die Schnelligkeit, da ihnen mühsame Zeit erspart bleibt, um mit Unternehmen in Kontakt zu treten.122 Auch die Steigerung der Kundenbindung schlägt sich auf die externe Wahrnehmung von Chatbots nieder. Bereits seit einiger Zeit liegt der Fokus der Nutzer 114
Vgl. Rainsberger, L., Intelligenz im Vertrieb, 2021, S. 95 f. Vgl. Cook, S., Customer Excellence, 2011, S. 3. 116 Vgl. Zumstein, D., Hundermark, S., Interactive Technology, 2017, S. 101. 117 Vgl. Holland, H., Automation im Dialogmarketing, 2020, S. 6. 118 Vgl. Kaiser, M. et al., Automatisierte Kommunikation, 2019, S. 3. 119 Vgl. Waghmare, C., Bots for Business, 2019, S. 153. 120 Vgl. Braun, A., Chatbots und Kundenkommunikation, 2003, S. 36 f. 121 Vgl. ebd., S. 37. 122 Vgl. Rainsberger, L., Intelligenz im Vertrieb, 2021, S. 117. 115
26
2 Theoretische Grundlagen
weniger auf den physischen Aspekten der Produkte, wie Preis, Qualität und Funktionalität,123 sondern vorrangig darauf Werte für den Kunden zu schaffen.124 Das Schaffen eines Kundenerlebnisses geht über die reine Kundenzufriedenheit hinaus und zielt auf eine dauerhafte und langfristige Kundenbeziehung ab.125 Der Mittelpunkt verlagert sich von der Maximierung des Profits zu einem Streben nach langfristiger Kundenbindung.126 Aus diesem Grund ist eine zielgerichtete Betreuung der Kunden unumgänglich, um Kundenloyalität zu schaffen mit dem Ziel die Akquisitionskosten zu senken.127 . Kunden erwarten zunehmend einen einfachen, schnellen und automatisierten Dialog. An dieser Stelle können Chatbots ansetzen und nicht nur dieses Kundenbedürfnis erfüllen, sondern darüber hinaus das Kundenerlebnis generell zu steigern.128 Zusätzlich bestehen weitere Einsatzmotivationen, die den Nutzen aus unternehmerischer Sicht positiv beeinflussen. Vorrangig begründen diverse Einsparungspotenziale den Einsatz von Chatbots. Chatbots führen zu Einsparungen im Kunden-Service, da die Anzahl an Standardanfragen bei menschlichen Mitarbeitern reduziert wird.129 Chatbots bieten eine Lösungsmöglichkeit für den Kompromiss zwischen Kosten und Effektivität im Kunden-Service, indem sie automatisiert in den Dialog treten, bei Problemen unterstützen und die Anfragen effektiv sowie wesentlich kostengünstiger beantworten können als menschliche Arbeitskräfte.130 Chatbots sollen bis zum Jahr 2023 für Kosteneinsparungen von ca. 11,5 Milliarden US$ verantwortlich sein.131 Die Kosten für die Einführung und Entwicklung eines Chatbots erscheinen im Vergleich zu einer menschlichen Arbeitskraft als hoch. Durch maschinelles Lernen ist bei Chatbots allerdings mit geringen Wartungskosten zu rechnen, während Menschen eher Lohnerhöhungen bei längerer Betriebszugehörigkeit fordern.132 Auch die Gewinnung von Kundeninformationen führt zu einem vermehrten Einsatz von Chatbots. Für Unternehmen ist es von entscheidender Bedeutung über mehr und bessere Informationen zu
123
Vgl. Mascarenhas, O. A. et al., Customer Loyalty, 2006, S. 397. Vgl. McAlexander, J. H. et al., Brand Community, 2002, S. 38. 125 Vgl. Mascarenhas, O. A. et al., Customer Loyalty, 2006, S. 397. 126 Vgl. Hildebrand, V. G., Kundenbindung, 1998, S. 56. 127 Vgl. Buschmann, M., Dialogführungssysteme, 2003, S. 102. 128 Vgl. Kett, H. et al., Veränderungstreiber für Geschäftsmodelle, 2021, S. 55 ff. 129 Vgl. Braun, A., Chatbots und Kundenkommunikation, 2003, S. 38. 130 Vgl. Mott, B. et al., Computational Linguistics, 2005, S. 3. 131 Vgl. Bavaresco, R. et al., Conversational Agents, 2020, S. 1. 132 Vgl. Göbel, T., Kundenservice, 2018, S. 17 ff. 124
2.2 Business-to-Business-Märkte
27
verfügen als die Konkurrenz. Ziel ist es auf Basis dieser Informationen erfolgreicher auf dem Markt agieren zu können.133 Die Gewinnung von Informationen gilt schon lange als große Herausforderung.134 Chatbots bieten hier große Vorteile, da Unterhaltungen dokumentiert und ausgewertet werden. Chatbots sind in der Lage nicht beantwortete Fragen zu speichern und können dem Unternehmen direkt Feedback geben.135 Durch die Auswertung dieser Daten können Verbesserungsanforderungen z. B. auf der Website identifiziert oder Lücken in der Datenbank geschlossen werden.136 Insbesondere Machine-Learning-Technologien führen zu einem Paradigmenwechsel in Bezug auf Entwicklungsmöglichkeiten bei der Verarbeitung von Kundeninformationen. Sie sind in der Lage große Datenmengen zu analysieren und können sofortige Erkenntnisse für den Markt ableiten.137 Eine Studie von Forbes Insights und Ernst & Young zeigte, dass B2B-Unternehmen die Datenanalyse für wichtige Geschäftsentscheidungen nutzen konnten und sich so Wettbewerbsvorteile gegenüber Konkurrenten, in Bezug auf Umsatzgenerierung, Gewinne und bei generellen Marktinformationen und Trends, sichern konnten.138 Trotz der vielen genannten Vorteile bestehen bis heute Vorbehalte bei der Nutzung von KI-basierten Technologien wie Chatbots. Forbes Insights und Ernst & Young stellten ebenso heraus, dass viele Entscheidungsträger in B2BUnternehmen Vorbehalte gegenüber KI-Technologien besitzen.139 Mangelndes Verständnis über den Mehrwert von Chatbots und mangelndes Vertrauen in die Sicherheit der Technologie gelten als größte Hindernisse.140 Unternehmen benötigen teilweise sensible Daten, um individuell auf die Bedürfnisse eingehen zu können. Daher bestehen bisher offene Fragen in Bezug auf den Datenschutz oder von Kontrollmöglichkeiten bei der Verwendung von sensiblen Daten.141 Außerdem befürchten Unternehmen Akzeptanzprobleme, aufgrund des Fehlens von zwischenmenschlichen Fähigkeiten. Das B2B-Geschäft funktioniert unterschiedlich zu B2C-Geschäften – auch in Bezug auf die Kommunikation. Die Entscheidungen sind langfristig, eher rational und durch persönlichen Kontakt geprägt. Obwohl Chatbots durch den stetigen technologischen Fortschritt immer 133
Vgl. Weiber, R., Jacob, F., Kundenbezogene Informationsgewinnung, 2000, S. 523 f. Vgl. Braun, A., Chatbots und Kundenkommunikation, 2003, S. 38. 135 Vgl. Radde, B., Digital Experience, 2017, S. 149 ff. 136 Vgl. Braun, A., Chatbots und Kundenkommunikation, 2003, S. 39. 137 Vgl. Mehendale, A., Sherin, N., Sales Forecasting, 2018, S. 17 ff. 138 Vgl. Forbes Insights, Analytics, 2017, o. S. 139 Vgl. ebd. 140 Vgl. Rainsberger, L., Intelligenz im Vertrieb, 2021, S. 7. 141 Vgl. Neuhüttler, J. et al., Smart-Service-Systeme, 2020, S. 207 ff. 134
28
2 Theoretische Grundlagen
weiter in der Entwicklung voranschreiten und Techniken wie Deep Learning diese Fortschritte immer weiter verbessern, scheinen B2B-Entscheider zu vermuten, dass Chatbots nicht persönlich genug seien und die enge Beziehung zu ihren Kunden leidet.142 Zudem sind insbesondere regelbasierte Chatbots noch sehr starr in ihren Antwortmöglichkeiten. Bei selbstlernenden Chatbots stellt sich hingegen oft die Frage, ob sich die Investition tatsächlich lohnt.143 Aufbauend auf der Kritik an Chatbots soll an dieser Stelle nicht unerwähnt bleiben, dass der Nutzen von Chatbots in Kombination mit der Komponente Mensch als größter hervorgesagt wird.144 Luo et al. (2021) konnten mittels eines Feldexperimentes nachweisen, dass die Kombination Mensch und Maschine auf höhere Akzeptanz stoßen kann als einer der beider Komponenten allein.145
2.3
Zusammenfassende Erkenntnisse
Seit dem Jahr 1966 und dem Einführen von ELIZA beschäftigt sich die Forschung mit Chatbots. Die kommerzielle Verwendung von Chatbots startetet allerdings erst im Frühjahr 2016. Die Gründe lagen auf der einen Seite in den großen Fortschritten der Künstlichen Intelligenz und auf der anderen Seite in der zunehmenden Nutzung von sozialen Medien, die den Einsatz von Chatbots als neue Technologie im B2C-Bereich weiter begünstigten. Seither können Chatbots auf Basis der stetigen Entwicklung der Techniken, wie Deep-Lerning, immer besser in der Kommunikation mit Menschen Anwendung finden und auf die Besonderheiten der menschlichen Sprache reagieren. Maschinen konnten zunächst nur menschliches Verhalten imitieren. Schon bald konnten sie aus Daten lernen und in ihrem heutigen Entwicklungsstadium sich sogar selbstständig über die bestehende Datengrundlage hinaus weiterentwickeln. Es konnte gezeigt werden, dass der Fokus der akademischen Forschung lange auf B2C-Märkten bzw. dem Einzelhandel lag. Durch die positiven Entwicklungen, die im B2C-Bereich zu beobachten sind, ist es nicht überraschend, dass auch im B2B-Bereich ähnliche Prinzipien in Bezug auf die Ansprache von Kunden zunehmend zu beobachten sind.146 Auch bei B2B-Kunden wächst die Erwartungshaltung, schnell an eine
142
Vgl. Rapp, A. et al., Text-based Chatbots, 2021, S. 102630. Vgl. Stäcker, O., Stanoevska-Slabeva, K., Chat Roboter, 2018, S. 45. 144 Vgl. Paschen, J. et al., Collaborative Intelligence, 2020, S. 403 ff. 145 Vgl. Luo, X. et al., Intelligent Sales Agents, 2021, S. 14. 146 Vgl. Heinemann, G., Geschäftssysteme im E-Commerce, 2019, S. 40. 143
2.3 Zusammenfassende Erkenntnisse
29
Vielzahl von Informationen zu gelangen. Abb. 2.5 nimmt eine Zusammenfassung der vorgestellten theoretischen Erkenntnisse vor und setzt diese in Bezug.
B2B-Unternehmen (Unterabschnitt 2.2) Vor-Kaufphase
Kaufphase
Nach-Kaufphase
Informationsbeschaffung
Auftragsabwicklung
Service & Support
Regelbasierte oder selbstlernende Chatbots (Unterabschnitt 2.1) Beratungs-Chatbots
Service-Chatbots
Handels-Chatbots
Können bei Produkt- oder Bestandsfragen unterstützen (Technische Beratung)
Unterstützen dabei Kundenanfragen zu beantworten (FAQs)
Nachträgliches zur Verfügung stellen von Dokumenten (Lieferpapiere)
Abb. 2.5 Übersicht der theoretischen Grundlagen. (Quelle: Eigene Darstellung)
Während der obere Teil der Abbildung die unterschiedlichen vorgestellten Kaufphasen aus Unterabschnitt 2.2 berücksichtigt, zeigt der untere Teil mögliche Chatbots, die in B2B-Unternehmen integriert werden können und in Unterabschnitt 2.1 vorgestellt wurden. Der B2B-Bereich bietet durch die zunehmende Integration von E-Anwendungen viele Ansatzpunkte Chatbots in die bestehenden Prozesse zu integrieren. Die Kundenbetreuung ist als wesentlicher Bestandteil von B2B-Unternehmen zu sehen. Die Prioritäten werden durch die Erwartungshaltung nach einem persönlichen, individuellen und schnellen Service bestimmt. Um die Wettbewerbsfähigkeit beizubehalten, investieren B2B-Unternehmen zunehmend in Kundenbetreuungslösungen.147 Chatbots stellen in diesem Zusammenhang einen Lösungsansatz dar, der auf der einen Seite Einsparungspotenziale bietet und auf der anderen Seite das Servicepotenzial steigern kann.148 Anwender haben die Möglichkeit, durch schnelle Antwortzeiten zu profitieren. Je nach Anwendung, Komplexität oder Budget können unterschiedliche regelbasierte oder selbstlernende Chatbots in allen Kaufphasen des B2B-Bereichs eingesetzt werden. 147 148
Vgl. Adamopoulou, E., Moussiades, L., Technology of Chatbots, 2020, S. 1. Vgl. Sangroya, A. et al., Customer Care, 2017, S. 128 f.
30
2 Theoretische Grundlagen
Kunden treten aus unterschiedlichen Gründen zu unterschiedlichen Zeitpunkten innerhalb des Kaufprozesses mit einem Unternehmen in Kontakt. Je nach Kaufphase und benötigtem Nutzen können unterschiedliche Arten von Chatbots in der jeweiligen Phase den Kunden bei der Informationsbeschaffung, bei der Auftragsabwicklung oder bei nachträglichen Anliegen, unterstützen. Eine klare Abgrenzung der Klassifizierungsansätze von Chatbots innerhalb der unterschiedlichen Phasen kann nur schwer erfolgen. Abbildung 2.4 berücksichtigt beispielhaft die Klassifizierung nach Barker (2017). Bisher erfolgten lediglich Publikationen, die sich mit der speziellen Anwendung von Chatbots in Bezug auf den B2B-Kundenservice auseinandersetzen.149 Es konnte jedoch gezeigt werden, dass zahlreiche Ansatzpunkte für den Einsatz von Chatbots im B2B-Bereich bestehen. Welche Faktoren die Akzeptanz der Nutzer beeinflussen, wurde bislang nur unzureichend betrachtet und bedarf einer weiterführenden Betrachtung.
149
Vgl. Anhang 1 des elektronischen Zusatzmaterials.
3
Herleitung des eigenen Akzeptanzmodells
Im folgenden Kapitel wird zunächst eine nähere Betrachtung des Akzeptanzbegriffes vorgenommen. Anschließend erfolgt eine Darstellung bestehender Akzeptanzmodelle. Diese stellen den theoretischen Rahmen dar, der Anwendung findet, um ein geeignetes Modell zur Akzeptanzmessung von Chatbots im B2BBereich entwickeln zu können. Ziel ist es auf Basis der gewonnen Erkenntnisse fundierte und aus der Theorie abgeleitete Hypothesen aufzustellen.
3.1
Vorgehensweise der Modellentwicklung
Um ein geeignetes Modell zur Messung der Nutzerakzeptanz von Chatbots erstellen zu können, wurde eine systematische Analyse bestehender Modelle vorgenommen. Die Vorgehensweise der eigenen Modellentwicklung ist Abb. 3.1 zu entnehmen und wird folgend erläutert. Um geeignete Annahmen innerhalb dieser Arbeit treffen zu können, erfolgt zunächst eine allgemeine Betrachtung des Akzeptanzbegriffs und eine Einordnung unter technologiebezogenen Aspekten. Darauf aufbauend findet im zweiten Schritt eine nähere Betrachtung bestehender Akzeptanzmodelle statt. Zu Beginn erläutert diese Arbeit grundlegende Modelle der Akzeptanzmessung, bei denen es einen Nachweis von Einflüssen auf die allgemeine Akzeptanz gab. Anknüpfend daran findet eine Darstellung jener Akzeptanzmodelle statt, die explizit für die Akzeptanzmessung von Technologien entwickelt wurden. Diese sind in der Literatur unter dem Namen Technologie-Akzeptanz-Modelle (TAM) bekannt. Anschließend erfolgt im dritten Schritt der Modellentwicklung eine Darstellung von weiteren relevanten Akzeptanzmodellen mit Bezug zur Akzeptanzmessung
© Der/die Autor(en), exklusiv lizenziert an Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2023 K. Elsner, Der Einsatz von Chatbots in Business-to-Business-Märkten, BestMasters, https://doi.org/10.1007/978-3-658-43230-0_3
31
32
3
Herleitung des eigenen Akzeptanzmodells
Theoretische Grundlagen (Abschnitt 3.2) Festlegung der betrachteten Akzeptanzebene
Bestehende Technologieakzeptanzmodelle (Unterabschnitt 3.3.1 und 3.3.2) TRA, TPB TAM + Erweiterungen
Technologieakzeptanzmodelle im Mittelpunkt akademischer Forschung (Unterabschnitt 3.3.3)
Auswertung bisheriger Studien mit Fokus Akzeptanzforschung von Chatbots
Vermutete Modellstruktur und Ableiten von Hypothesen (Abschnitt 3.4)
Abb. 3.1 Entwicklung der eigenen Modellstruktur. (Quelle: Eigene Darstellung)
von Chatbots. Diese Resultate werden im Anschluss auf Basis der in der Theorie erarbeiteten Besonderheiten aus den Forschungsrichtungen Chatbots und B2B-Märkte diskutiert und basierend auf diesen Erkenntnissen in ein themenbezogenes vermutetes Modell integriert. Aus dem aufgestellten Modell resultieren im Anschluss die Hypothesen, die im darauffolgenden Kapitel 4 empirisch überprüft werden.
3.2
Grundlagen zur Akzeptanzforschung
Ein allgemeingültiger Definitionsansatz für den Begriff der ‚Akzeptanz‘ besteht bisher nicht. Der Akzeptanzbegriff stammt von dem lateinischen Wort ‚accipere‘ ab und bedeutet übersetzt ‚gutheißen‘ oder ‚billigen‘.1 Während Hilbig (1984) die Akzeptanz als eine „mehr oder weniger zustimmende Einstellung eines Individuums oder einer Gruppe gegenüber einem Objekt, Subjekt oder sonstigen Sachverhalt“2 definiert, beschreibt Nielson (1993) den Begriff der Akzeptanz als grundsätzliche Frage, ob ein System gut genug ist, um alle Anforderungen und Bedürfnisse der Nutzer gerecht zu werden.3 In der einschlägigen Fachliteratur wird die Akzeptanz vor diesem Hintergrund als Absicht definiert, inwiefern 1
Vgl. Krone, J., Pinkl, V., Medienakzeptanz, 2018, S. 3. Hilbig, W., Akzeptanz, 1984, S. 320. 3 Vgl. Nielsen, J., Usability Engineering, 1993, S. 24. 2
3.2 Grundlagen zur Akzeptanzforschung
33
Akzeptanzebene
eine Technologie freiwillig genutzt wird.4 Der Begriff ist ein latentes Konstrukt und das Ergebnis komplexer subjektiver und objektiver Wahrnehmungsprozesse.5 Akzeptanzmodelle liefern einen Erklärungsansatz auf die Fragen, welche Faktoren die Akzeptanz beeinflussen und aus welchen Bestandteilen sie besteht. Seit Jahrzehnten rückt auch die Fragestellung in den Fokus, inwiefern neue Technologieprodukte oder -services von Nutzern am Arbeitsplatz angenommen werden.6 Erfolgreich implementierte Technologien oder Systeme können die Produktivität eines Unternehmens steigern, währenddessen fehlgeschlagene Systeme negative Folgen haben können, wie z. B. finanzielle Verluste und unzufriedene Mitarbeiter.7 Daher ist es insbesondere in der kundenbezogenen Akzeptanzforschung von essenzieller Bedeutung, die Determinanten der Akzeptanz einer Technologie zu verstehen, um die Nutzung sicherzustellen. Die Nutzerakzeptanz ist als kritischer Faktor für den Erfolg neuer Technologien zu betrachten und wichtig, um die Wettbewerbsfähigkeit des Unternehmens am Markt zu gewährleisten.8 Kollmann formuliert 1998 ein Modell, um den dynamischen und prozessualen Charakter der Akzeptanzbildung bei technischen Innovationen, zu verdeutlichen. Das Modell ist in Abb. 3.2 dargestellt.
Einstellungsphase
Handlungsphase
Nutzungsphase
Erwartete Nutzungsebene
Erwartete Nutzungsebene
Nutzungsebene
Erwartete Handlungsebene
Handlungsebene
Handlungsebene
Einstellungsebene
Einstellungsebene
Einstellungsebene
Zeitverlauf Vor der Nutzung
Übernahme
Bei der Nutzung
Abb. 3.2 Teilebenen der Akzeptanz nach Kollmann (1998). (Quelle: Eigene Darstellung in Anlehnung an Kollmann, T., Akzeptanz von Nutzungsgütern, 1998, S. 67) 4
Vgl. Davis, F. D., User acceptance, 1993, S. 478. Vgl. Lucke, D., Akzeptanzforschung, 1998, S. 20. 6 Vgl. Morgan-Thomas, A., Veloutsou, C., Brand Relationships, 2013, S. 22. 7 Vgl. Moore, G. C., Benbasat, I., Information Technology Innovation, 1991, S. 192 f. 8 Vgl. Wu, J.-H., Wang, S.-C., Mobile Commerce, 2005, S. 720. 5
34
3
Herleitung des eigenen Akzeptanzmodells
Da Chatbots erst seit einigen Jahren in den Fokus gerückt sind, kann dieses Modell auch auf die Akzeptanz von Chatbots übertragen werden. Das Modell unterteilt die Akzeptanzbildung in drei Ebenen: die Einstellung-, Handlungs- und Nutzungsebene.9 Kollmann nennt drei zeitliche Eckpunkte, die eine Phase vor der Nutzung (Einstellungsphase), den Übernahmezeitpunkt selbst (Handlungsphase) und eine Phase bei der Nutzung (Nutzungsphase), umfasst. Im jeweiligen Anschluss der drei genannten Phasen, werden Zwischenakzeptanzen gebildet, die in Summe die Gesamtakzeptanz widerspiegeln.10 Nutzer durchlaufen jedoch nur dann alle Phasen, sofern auf jeder Ebene positive Akzeptanzbeiträge gebildet werden konnten. Sollte aus einer Phase eine negative Zwischenakzeptanz gebildet werden, führt dies zur Ablehnung einer Technik.11 Wie in den vorangegangenen Kapiteln erläutert, steht die Nutzung von Chatbots im B2B-Bereich erst in ihren Anfängen und hat sich noch nicht flächendeckend am Markt etabliert. Daher ist davon auszugehen, dass die Handlungsund Nutzungsakzeptanz von Chatbots als neue Technik noch nicht empirisch zu messen sind.12 Es wird auf Basis dieser Erkenntnis angenommen, dass eine Prognose über die Akzeptanz von Chatbots vorwiegend über die Einstellungsphase zu erfolgen ist. In der Literatur wird keine spezifische Methode zur Technologie-AkzeptanzMessung von Chatbots genannt. Eine allgemein akademisch anerkannte und erforschte Methode der generellen Technologieakzeptanz kann im Rahmen von Technologie-Akzeptanz-Modellen beschrieben und auf Chatbots übertragen werden. Technologie-Akzeptanz-Modelle bauen auf wesentlichen Erkenntnissen der Verhaltensforschung auf. Daher erfolgt zunächst eine Betrachtung der elementaren Bestandteile der allgemeinen Verhaltensforschung.
3.2.1
Grundlegende Ansätze aus der Verhaltensforschung
Die Absicht zu handeln, geht zwangsläufig der tatsächlichen Ausführung des Verhaltens voraus. Auf Basis dieser Argumentation wird die Absicht als Vermittler zwischen Einstellung und der tatsächlichen Handlung bewertet. Innerhalb der Sozialforschung wurden diese Annahmen konzeptualisiert. Es bestehen zwei Modelle, die die Basis für viele Akzeptanzmodelle bilden. Diese ursprünglichen 9
Vgl. Kollmann, T., Akzeptanz von Nutzungsgütern, 1998, S. 68. Vgl. Kollmann, T., Akzeptanzprobleme, 1999, S. 35. 11 Vgl. Bauer, H. H. et al., Konsumentenakzeptanz, 2004, S. 10. 12 Vgl. ebd., S. 12. 10
3.2 Grundlagen zur Akzeptanzforschung
35
Modelle beinhalten noch keinen klaren Technologiebezug, sondern thematisieren das Verhalten im Allgemeinen.13 Die beiden bekanntesten Ansätze stellen die Theory of Reasoned Action (TRA) sowie die darauf aufbauende Theory of Planned Behaviour dar.14 Die TRA wurde 1980 von Azjen und Fishbein entwickelt.15 Die Wirkungszusammenhänge sind in Abb. 3.3 dargestellt.
Einstellung Verhaltensabsicht
Verhalten
Subjektive Norm
Abb. 3.3 Theory of Reasoned Action (1980). (Quelle: Eigene Darstellung in Anlehnung an Ajzen, I., Fishbein, M., Social Behavior, 1980, S. 7 ff.)
Die TRA stellt einen erklärten Zusammenhang zwischen dem Verhalten und der Verhaltensabsicht her, wobei die Verhaltensabsicht das tatsächliche Verhalten bestimmt. Die Verhaltensabsicht beschreibt die Wahrscheinlichkeit eine bestimmte Handlung durchzuführen und wird durch die Einstellung zum Verhalten und durch die Subjektive Norm beeinflusst. Ajzen und Fishbein (1980) definieren dabei die Subjektive Norm als wahrgenommenen sozialen Druck, der zu einem bestimmten Verhalten führt.16 Die Determinante Einstellung zum Verhalten besitzt persönlichen Charakter, während die Subjektive Norm soziale Einflüsse wiedergibt. Darüber hinaus erfolgt von Ajzen und Fishbein keine Nennung von weiteren Einflussfaktoren, die das Verhalten zusätzlich beeinflussen. Sie werden lediglich als externe Variablen klassifiziert.17 Die TRA setzt die Betrachtung aller zur Verfügung stehenden Alternativen und eine bewusste Entscheidung zur Handlung voraus.18 Letztendlich gilt die Aussagekraft der TRA als begrenzt, da sie von rational geprägten Verhalten ausgeht und stets bewusste Entscheidungen voraussetzt.19 Die TRA wurde daher im Jahre 1985 zur Theory of Planned Behaviour (TPB) weiterentwickelt. Das Modell ist Abb. 3.4 zu entnehmen. 13
Vgl. Raaij, E. M. van, Schepers, J. J., Virtual Learning Environment, 2008, S. 840. Vgl. Madden, T. J. et al., TRA und TPB, 1992, S. 3. 15 Vgl. Ajzen, I., Fishbein, M., Social Behavior, 1980, S. 7. 16 Vgl. ebd., S. 58. 17 Vgl. ebd., S. 82 ff. 18 Vgl. Schlohmann, K., Innovatorenorientierte Akzeptanzforschung, 2012, S. 118. 19 Vgl. Ajzen, I., Actions, 1985, S. 12. 14
36
3
Herleitung des eigenen Akzeptanzmodells
Einstellung
Subjektive Norm
Verhaltensabsicht
Verhalten
Wahrgenommene Verhaltenskontrolle
Abb. 3.4 Theory of Planned Behaviour (1985). (Quelle: Eigene Darstellung in Anlehnung an Ajzen, I., Theory of Planned Behaviour, 1991, S. 182)
Ziel war es, komplexere Verhaltensweisen, die nicht unbedingt der eigenen Kontrolle unterliegen, erklären zu können. Das Modell bewertet die Verhaltensabsicht ebenfalls als einen zentralen Faktor innerhalb des Modells.20 Die TPB postuliert, dass das Verhalten, neben den drei in der TRA thematisierten Determinanten, zusätzlich durch die wahrgenommene Verhaltenskontrolle erklärt wird.21 Unter der wahrgenommenen Verhaltenskontrolle wird verstanden, wie eine Person selbst einschätzt, ein geplantes Verhalten, auf Basis der zur Verfügung stehenden Informationen und Ressourcen, auch tatsächlich ausführen zu können. Je positiver eine Person die Beurteilung über die zur Verfügung stehenden Ressourcen vornimmt, desto größer fällt die wahrgenommene Verhaltenskontrolle in Bezug auf das tatsächliche Verhalten aus.22 Obwohl das Modell des geplanten Verhaltens empirisch bestätigt werden konnte, zeigen andere Studien keinen Zusammenhang zwischen der Einstellung und dem tatsächlichen Verhalten.23
3.2.2
Technologie-Akzeptanz-Modelle
Technologie-Akzeptanz-Modelle adaptieren die theoretischen Überlegungen der TRA, die bereits eine Verknüpfung zwischen kognitiven Bewertungsvorgängen und der tatsächlichen Handlung vornahm. Im Gegensatz zur TRA liegt der Fokus von TAM nicht auf der allgemeinen Verhaltensforschung. Das TAM untersucht die persönliche Wahrnehmung von Informationstechnologien und stellt einen
20
Vgl. Ajzen, I., Theory of Planned Behavior, 1991, S. 181. Vgl. ebd., S. 183. 22 Vgl. Madden, T. J. et al., TRA und TPB, 1992, S. 4. 23 Vgl. Armitage, C. J., Conner, M., Behaviour Measures, 2001, S. 489. 21
3.2 Grundlagen zur Akzeptanzforschung
37
expliziten Bezug zwischen dem Verhalten und einer Technologie her.24 Durch eine Vielzahl von Studien konnte belegt werden, dass das TAM einen hohen Anteil der Varianz (ca. 40 %) durch die Absicht zur Nutzung erklären konnte und ist daher eines der häufigsten verwendeten Modelle zur Akzeptanz von Technologie im Arbeitskontext. Weitere Gründe für die breite Nutzung sind auf die einfachen Strukturen und die Verständlichkeit zurückzuführen.25 Jedoch werden nicht alle Beziehungen in allen Studien gleichermaßen bestätigt. Es bestehen teilweise große Unterschiede bei der vorhergesagten Wirkung in Abhängigkeit von den Benutzern und den untersuchten Systemen.26 Das ursprüngliche TAM-Modell aus dem Jahr 1989 nach Davis erfuhr im Laufe der Jahre weitere Überarbeitungen durch die Ergänzung weiterer Faktoren. Venkatesh und Davis nahmen im Jahr 2000 erste Anpassungen vor, indem bisher nur am Rande erwähnte Konstrukte in Bezug auf die wahrgenommene Nützlichkeit mit in das Modell, unter dem Namen TAM2, integriert wurden. Eine weitere Erweiterung stellt das im Jahr 2008 von Venkatesh und Bala entwickelte TAM3 dar. Das Modell beinhaltet Konstrukte, die mögliche Effekte auf die wahrgenommene Benutzerfreundlichkeit nach sich ziehen. Die Modelle werden nachfolgend vorgestellt und dienen ebenso als Grundlage für die Modellentwicklung der vorliegenden Arbeit in Bezug auf die Akzeptanz von Chatbots im B2B-Bereich.
3.2.2.1 Technologie-Akzeptanz-Modell nach Davis et al Im Jahr 1989 entwickelte Davis das ursprüngliche TAM. Ein wesentliches Ziel war es, die Auswirkung von externen Variablen auf interne Überzeugungen, wie der Einstellung oder der Verhaltensabsicht beurteilen zu können.27 Analog zu der TPA geht auch das TAM davon aus, dass tatsächliche Nutzung maßgeblich von der Nutzungsabsicht (BI) abhängt. Das Modell nimmt an, dass zwei primäre neue Prädikatoren zur Erklärung der Absicht ein System zu nutzen, bestehen: die wahrgenommene Nützlichkeit (PU) und die wahrgenommene Benutzerfreundlichkeit (PEOU). Die wahrgenommene Nützlichkeit definiert Davis als „the degree to which a person believes that using a particular system would enhance his or her
24
Vgl. Mathieson, K., Predicting User Intentions, 1991, S. 177. Vgl. King, W. R., He, J., Technology, 2006, S. 740 ff. 26 Vgl. Legris, P. et al., Information Technology, 2003, S. 202. 27 Vgl. Legris, P. et al., Information Technology, 2003, S. 192 f. 25
38
3
Herleitung des eigenen Akzeptanzmodells
job performance“28 . Der Fokus liegt dabei auf der subjektiven Unterstützungsleistung einer verwendeten Technik.29 Die wahrgenommene Benutzerfreundlichkeit beschreibt Davis als „the degree to which a person believes that using a particular system would be free of effort“30 . Je einfacher ein Nutzer die Bedienbarkeit einer Informationstechnologie einschätzt, desto eher ist die Person bereit diese tatsächlich zu nutzen.31 Abb. 3.5 zeigt die Zusammenhänge der Determinanten nach Davis et al. Wahrgenommene Nützlichkeit Nutzungsabsicht
Tatsächliche Nutzung
Wahrgenommene Benutzerfreundlichkeit
Abb. 3.5 Technologie-Akzeptanz-Modell nach Davis et al. (1989). (Quelle: Eigene Darstellung in Anlehnung an Davis, F. et al., Technology Acceptance Model, 1989, S. 320)
Die Nutzungsabsicht wird durch die wahrgenommene Nützlichkeit und durch die wahrgenommene Benutzerfreundlichkeit beschrieben, die wiederum Einfluss auf die tatsächliche Nutzung nimmt. Die Einstellung zur Nutzung einer Technologie wird im TAM nicht berücksichtigt, da nur ein schwacher Zusammenhang zwischen Einstellung und wahrgenommenen Nützlichkeit festgestellt werden konnte. Ein starker Zusammenhang stellte sich hingegen zwischen der wahrgenommenen Nützlichkeit und der Nutzungsabsicht heraus.32 Das Ausklammern der Einstellung unterstützt den Einfluss der wahrgenommenen Benutzerfreundlichkeit und der wahrgenommenen Nützlichkeit auf die abhängige Variable Nutzungsabsicht (BI). Darüber hinaus beinhaltet das TAM die Vermutung, dass der wahrgenommene Benutzerfreundlichkeit Einfluss auf die wahrgenommene Nützlichkeit nimmt. Sollten zwei funktionsgleiche Geräte zur Verfügung stehen, wird der Anwender eben dieses wählen, dass er durch eine einfache Handhabung und Bedienung bequemer nutzen kann.33 28
Davis, F. D., Technology Acceptance Model, 1989, S. 320. Vgl. Jakobs, E.-M. et al., Techniknutzung, 2008, S. 7 ff. 30 Davis, F. D., Technology Acceptance Model, 1989, S. 320. 31 Vgl. Simon, B., E-Learning, 2001, S. 96. 32 Vgl. Davis, F. D., Technology Acceptance Model, 1989, S. 985 ff. 33 Vgl. Venkatesh, V., Perceived Ease of Use, 2000, S. 343. 29
3.2 Grundlagen zur Akzeptanzforschung
39
Zahlreiche Studien wie z. B. Adams et al. (1992),34 Hendrickson et al. (1996)35 und Szajna (1994)36 konnten insbesondere den Zusammenhang der Determinanten PU und PEOU validieren. Kritiker des TAM wiesen hingegen darauf hin, dass, aufgrund der Komplexität des Akzeptanzbegriffs, die bisher verwendeten Einflussgrößen nicht ausreichend seien. Legris et al. (2003) zogen den Schluss, dass das TAM entscheidende Faktoren vernachlässige, da nur ca. 40 % der Technologienutzung erklärt werden konnten.37 Straub (1994) konnte ebenfalls die Strukturen des TAM bestätigen und darüber hinaus in seiner Studie unterschiedliche Ergebnisse in Abhängigkeit der Kultur, konkret zwischen Japan und den USA, feststellen.38
3.2.2.2 Technologie-Akzeptanz-Modell 2 nach Venkatesh und Davis Eine Vielzahl empirischer Studien konnten die Variable wahrgenommene Nützlichkeit als starke Determinante der Verhaltensintention bestätigen. Daher entwickelten, auf Basis der zunehmenden Kritik am ursprünglichen TAM, Venkatesh und Davis im Jahr 2000 das TAM2. Im Fokus lag es die Variable wahrgenommene Nützlichkeit zu verstehen und inwiefern sich ein möglicher Einfluss mit zunehmender Erfahrung der Nutzung mit einem System verändert. Ziel ist es, die Aussagekraft des Modells in Bezug auf die Nutzerakzeptanz zu erhöhen, um anschließend Implikationen für die Praxis geben zu können.39 Die Zusammenhänge des TAM2 werden in Abb. 3.6 dargestellt. Venkatesh und Davis definieren die externen Variablen der wahrgenommenen Nützlichkeit und unterteilen diese in soziale Einflüsse und in kognitive Instrumente. Die Subjektive Norm, die Selbstdarstellung und die Freiwilligkeit beeinflussen die wahrgenommene Nützlichkeit als soziale Komponenten, während die Relevanz für den Beruf , die Ergebnisqualität und die Darstellbarkeit der Ergebnisse als kognitiv-instrumentelle Faktoren mit in das Modell einfließen. Wie zu erkennen ist, bleibt das ursprüngliche TAM, sowie deren Bezüge und Einflussrichtungen im erweiterten Modell bestehen. Nachfolgend wird eine nähere Betrachtung der im TAM2 enthaltenen Determinanten vorgenommen. Zunächst erfolgt eine Betrachtung der sozialen Einflüsse 34
Vgl. Adams, D. A. et al., Usage of Information Technology, 1992, S. 227 ff. Vgl. Hendrickson, A. R., Collins, M. R., Structure of TAM, 1996, S. 61 ff. 36 Vgl. Szajna, B., Validation of the Technology Acceptance, 1994, S. 319 ff. 37 Vgl. Legris, P. et al., Information Technology, 2003, S. 202. 38 Vgl. Straub, D. W., IT Diffusion, 1994, S. 38 ff. 39 Vgl. Venkatesh, V., Davis, F. D., Technology Acceptance Model 2, 2000, S. 187. 35
40
3
Erfahrung
Herleitung des eigenen Akzeptanzmodells
Freiwilligkeit
Sozial Subjektive Norm TAM nach Davis et al. (1989)
Selbstdarstellung Wahrgenommene Nützlichkeit
Relevanz für den Beruf
Nutzungsabsicht
Ergebnisqualität
Darstellbarkeit der Ergebnisse Kognitiv
Tatsächliche Nutzung
Wahrgenommene Benutzerfreundlichkeit
Abb. 3.6 Technologie-Akzeptanz-Modell nach Venkatesh und Davis (2000). (Quelle: Eigene Darstellung in Anlehnung an Venkatesh, V., Davis, F., Technology Acceptance Model 2, 2000, S. 187)
und anschließend eine Betrachtung der kognitiven Determinanten. Tab. 3.1 nimmt eine Definition der Determinanten der sozialen Einflüsse vor. Tab. 3.1 Determinanten der sozialen Einflüsse Determinante
Definition
Quelle
Subjektive Norm
Die Wahrnehmung einer Person, ob für die Person wichtige Menschen denken, dass ein bestimmtes Verhalten ausgeführt oder nicht ausgeführt werden sollte.
Venkatesh und Davis (2000)
Selbstdarstellung
Beschreibt das Ausmaß, indem die Nutzung einer Technologie zu einem höheren Status in einem sozialen System führt.
Moore und Benbasat (1991)
Freiwilligkeit der Nutzung
Beschreibt den Grad, indem Anwender die Entscheidung zur Nutzung als nicht verpflichtend empfinden.
Venkatesh und Davis (2000)
Erfahrung
Berücksichtigt, dass sich soziale Einflussfaktoren mit Venkatesh zunehmender Erfahrung im Umgang mit einer und Davis Technik verändern. (2000)
Quelle: Eigene Darstellung
Die sozialen Einflüsse umfassen sowohl die Subjektive Norm, die Freiwilligkeit der Nutzung und die Erfahrung mit Definitionen nach Venkatesh und Davis
3.2 Grundlagen zur Akzeptanzforschung
41
(2000)40 als auch die Selbstdarstellung nach Moore und Benbasat (1991)41 . Auf Basis der TRA (1975) und der TPB (1991) wird die Subjektive Norm als soziale Einflussgröße wieder in das Akzeptanzmodell integriert. Beide Modelle berücksichtigten die Subjektive Norm als direkte Determinante der Verhaltensabsicht. Die Autoren begründen diesen Effekt dadurch, dass Menschen sich, aufgrund der Meinung einer wichtigen Bezugsperson, entgegen ihrer eigenen Meinung, für ein Verhalten entscheiden können.42 Wie in Abb. 3.6 zu sehen ist, wird zusätzlich die wachsende Erfahrung mit einer Technologie als moderierende Variable im TAM2 berücksichtigt. Sie nimmt sowohl Einfluss auf die Subjektive Norm als auch direkt auf die BI selbst. Zusätzlich nimmt die Freiwilligkeit der Nutzung als weitere moderierende Variable Einfluss auf die Subjektive Norm.43 In der akademischen Forschung sind geteilte Meinungen zu den Determinanten des TAM2 zu finden. Davis et al. (1989) konnten keinen signifikanten Einfluss feststellen, sodass die Subjektive Norm im ursprünglichen Modell keine Anwendung fand. Sie hielten aber auch fest, dass es weiterer Untersuchung bedarf, um die Auswirkungen von sozialen Einflüssen auf das Nutzungsverhalten bestimmen zu können.44 Höhere soziale Anerkennung, beschrieben durch die Determinante Selbstdarstellung, kann positiven Einfluss auf die Arbeitsleistung haben, was gemäß des TAM2 den Einfluss der Selbstdarstellung auf die wahrgenommene Nützlichkeit unterstreicht. Das TAM2 postuliert, dass die Subjektive Norm einen Einfluss auf die Selbstdarstellung hat. Die Selbstdarstellung wiederum nimmt Einfluss auf die wahrgenommene Nützlichkeit, unabhängig von einer freiwilligen oder obligatorischen Nutzung einer Technik.45 Hartwick und Barki (1994) fanden heraus, dass die Subjektive Norm vor Systemeinführung einen signifikanten Einfluss hatte, dieser allerdings drei Monate nach Einführung weniger signifikant war. Laut beider Autoren liegt dies darin begründet, dass das Wissen vor der Entwicklung eines Systems schlecht sei und sich die eigene Meinung eher auf Basis fremder Einschätzung gebildet wird.46 TAM2 berücksichtigt diese Erkenntnisse durch das Hinzufügen der moderierenden Determinante Erfahrung
40
Vgl. Venkatesh, V., Davis, F. D., Technology Acceptance Model 2, 2000, S. 187 ff. Vgl. Moore, G. C., Benbasat, I., Information Technology Innovation, 1991, S. 203. 42 Vgl. Venkatesh, V., Davis, F. D., Technology Acceptance Model 2, 2000, S. 187. 43 Vgl. Maranguni´ c, N., Grani´c, A., History of TAM, 2015, S. 86. 44 Vgl. Davis, F. D., Technology Acceptance Model, 1989, S. 999. 45 Vgl. Venkatesh, V., Davis, F. D., Technology Acceptance Model 2, 2000, S. 189. 46 Vgl. Hartwick, J., Barki, H., User Participation in IT, 1994, S. 458 f. 41
42
3
Herleitung des eigenen Akzeptanzmodells
mit Einfluss auf die Subjektive Norm und einen direkten Einfluss auf die Verhaltensintention selbst. Während die Freiwilligkeit der Nutzung lediglich Einfluss auf die Verhaltensintention hat.47 Die kognitiv-instrumentellen Faktoren werden in Tab. 3.2 definiert. Sie basieren auf drei grundlegenden Hauptbereichen: der Arbeitsmotivationstheorie, der Handlungstheorie aus dem Bereich der Sozialpsychologie und aus der Entscheidungsfindung aus dem Forschungsfeld der Verhaltenstheorie. Tab. 3.2 Determinanten der kognitiven Faktoren Determinante
Definition
Quelle
Job-Relevanz
Beschreibt, inwiefern ein Anwender annimmt, dass die Technik auf den Beruf anzuwenden ist.
Venkatesh und Davis (2000)
Ergebnisqualität
Gibt an, in welchem Ausmaß eine Technik die jobrelevanten Aufgaben gut ausführen kann.
Venkatesh und Davis (2000)
Nachweisbarkeit der Ergebnisse
Drückt aus, ob und in welchem Moore und Benbasat (1991) Grad die erzielten Ergebnisse der Nutzung einer Technik, konkret diesem System zugeordnet werden können, beobachtbar und kommunizierbar sind.
Quelle: Eigene Darstellung
Sowohl die Job-Relevanz und die Ergebnisqualität nach Venkatesh und Davis (2000)48 als auch die Determinante Nachweisbarkeit der Ergebnisse nach Moore und Benbasat (1991)49 gehen davon aus, dass das tatsächliche Verhalten durch übergeordnete Ziele oder Zwecke beeinflusst wird. Aufbauend auf diesen Erkenntnissen postuliert das TAM2, dass Anwender die wahrgenommene Nützlichkeit auf Basis einer Übereinstimmung zwischen wichtigen Arbeitszielen und den daraus resultierenden Konsequenzen der Nutzung bewerten.50
47
Vgl. Venkatesh, V., Perceived Ease of Use, 2000, S. 342. Vgl. Venkatesh, V., Davis, F. D., Technology Acceptance Model 2, 2000, S. 191. 49 Vgl. Moore, G. C., Benbasat, I., Information Technology Innovation, 1991, S. 203. 50 Vgl. Venkatesh, V., Davis, F. D., Technology Acceptance Model 2, 2000, S. 191. 48
3.2 Grundlagen zur Akzeptanzforschung
43
3.2.2.3 Technologie-Akzeptanz-Modell 3 nach Venkatesh und Bala Auf Grundlage der im TAM nach Davis et al. und TAM2 nach Venkatesh und Davis gewonnen Erkenntnisse, erweiterten Venkatesh und Bala (2008) das Modell erneut und veröffentlichten es unter dem Namen Technologie-Akzeptanz-Modell 3 (TAM3). Das Ziel beider Autoren bestand darin, ein Modell abzuleiten, dass es Führungskräften oder Managern in Entscheidungssituationen erlaubt, Faktoren anzupassen, um die Technologienutzung ihrer Mitarbeiter beeinflussen zu können. In Abb. 3.7 werden die Einflussfaktoren des TAM und deren Erweiterungen gezeigt, sowie die Integration der neuen Determinanten gemäß TAM3.
TAM2 nach Venkatesh/ Davis (2000)
Erfahrung
Freiwilligkeit
Subjektive Norm Selbstdarstellung Relevanz für den Beruf
TAM nach Davis et al. (1989) Wahrgenommene Nützlichkeit
Ergebnisqualität Darstellbarkeit der Ergebnisse
Nutzungsabsicht
Verankerung
Tatsächliche Nutzung
Selbstwirksamkeit Wahrnehmung externe Kontrolle
Wahrgenommene Benutzerfreundlichkeit
Angst vor System Spielerischer Umgang mit System
Wahrgenommenes Vergnügen Wahrgenommene einfache Benutzung
Anpassung
Abb. 3.7 Technologie-Akzeptanz-Modell nach Venkatesh und Bala (2008). (Quelle: Eigene Darstellung in Anlehnung an Venkatesh, V., Bala, H., TAM3, 2008, S. 280)
44
3
Herleitung des eigenen Akzeptanzmodells
Aufbauend auf dem Klassifizierungsansatz nach Cooper und Zmud (1990) konnten Benutzerreaktionen und -aktivitäten in Phasen vor und nach der Implementierung eines Systems zugeordnet werden.51 Ähnlich wie bereits im TAM2, werden die grundsätzlichen Annahmen der vorherigen Modelle beibehalten: die tatsächliche Nutzung eines Systems wird aufbauend auf dem TAM durch die Verhaltensintention beeinflusst. Eine Beeinflussung dieser Komponenten erfolgt wiederum durch Determinanten der wahrgenommenen Nützlichkeit und der wahrgenommenen Benutzerfreundlichkeit. Auch die sozialen Einflüsse und kognitiven Instrumente aus dem TAM2 blieben im TAM3 enthalten. Während die Anpassungen im TAM2 ausschließlich die Determinante wahrgenommene Nützlichkeit beeinflussten, fokussierten die Erweiterungen innerhalb des TAM3 Einflüsse auf die wahrgenommene Benutzerfreundlichkeit.52 Die zusätzlichen Determinanten basieren auf einem von Venkatesh im Jahre 2000 entwickelten Modell. Bereits frühe Forschungsarbeiten aus der Informationsgesellschaft und der Psychologie konnten zeigen, dass die tatsächliche Verhaltenserfahrung die wahrgenommene Benutzerfreundlichkeit beeinflussen kann.53 Venkatesh (2000) nimmt in seinem Werk Bezug auf Verankerungs- und Anpassungsprozesse, die innerhalb der Theorie der Entscheidungsfindung als allgemein wichtige Urteilsheuristik Anwendung finden.54 Venkatesh und Bala gehen davon aus, dass sich die Determinanten der wahrgenommenen Benutzerfreundlichkeit und der wahrgenommenen Nützlichkeit nicht gegenseitig bedingen. Das bedeutet, dass innerhalb des TAM3 keine Cross-over Effekte bestehen.55 Venkatesh integriert diverse Anker in das Modell, da eine frühe Meinungsbildung über die wahrgenommene Benutzerfreundlichkeit eines Systems mit der grundsätzlichen Einstellung zusammenhängt, die eine Person gegenüber von Computern innehat.56 Die Definitionen der Determinanten nach Venkatesh und Bala werden in Tab. 3.3 vorgestellt. Die genannten Anker stellen die Selbstwirksamkeit mit Definition nach Compeau und Higgins (1995),57 die Wahrnehmung der externen Kontrolle nach Venkatesh et al. (2003), die Angst vor einem System nach Venkatesh (2000)58 51
Vgl. Venkatesh, V., Bala, H., TAM3, 2008, S. 291 ff. Vgl. Davis, F. D., Technology Acceptance Model, 1989, S. 320 ff. 53 Vgl. Davis, F. D. et al., User Acceptance of Computer, 1989, S. 982 ff. 54 Vgl. Tversky, A., Kahneman, D., Judgment under Uncertainty, 1974, S. 1128. 55 Vgl. Venkatesh, V., Bala, H., TAM3, 2008, S. 279. 56 Vgl. Venkatesh, V., Perceived Ease of Use, 2000, S. 344 ff. 57 Vgl. Compeau, D. R., Higgins, C. A., Computer Self-Efficacy, 1995, S. 190. 58 Vgl. Venkatesh, V., Perceived Ease of Use, 2000, S. 349. 52
3.2 Grundlagen zur Akzeptanzforschung
45
Tab. 3.3 Determinanten der Verankerungen Determinante
Definition
Quelle
Selbstwirksamkeit
Beschreibt, inwiefern eine Person glaubt eine bestimmte Aufgabe mit Hilfe einer Technologie auszuführen zu können.
Compeau & Higgins (1995)
Wahrnehmung der externen Kontrolle
Beschreibt den Grad, indem Venkatesh et al. (2003) eine Person glaubt, dass genügend organisatorische und technische Ressourcen zur Verfügung stehen, um die Nutzung einer Technologie unterstützen zu können.
Angst vor System
Beschreibt das Ausmaß an Angst oder Besorgnis einer Person bei der Nutzung einer Technologie.
Venkatesh (2000)
Spielerischer Umgang mit System
Beschreibt das Ausmaß kognitiver Spontanität innerhalb von Mikrocomputerinteraktionen.
Webster & Martocchio (1992)
Quelle: Eigene Darstellung
und der Spielerische Umgang mit einem System nach Webster und Martocchio (1992)59 dar. Alle Determinanten beeinflussen gleichermaßen die wahrgenommene Benutzerfreundlichkeit eines Systems. Während die vorab genannten Anker als Urteilsheuristik die Meinungsbildung der Benutzerfreundlichkeit beeinflussen, führen die mit einem System gemachten Erfahrungen dazu, dass die zuvor gebildete Meinung angepasst wird. Sie werden unter dem Themenbereich der Anpassung in das Modell integriert.60 Das bedeutet, sie werden dann relevant, wenn die bisherigen Erfahrungen nicht mit den ursprünglichen Erfahrungen konform sind.61 Tab. 3.4 beinhaltet die Definitionen der Determinanten der Anpassung nach Venkatesh und Bala.
59
Vgl. Webster, J., Martocchio, J. J., Microcomputer Playfulness, 1992, S. 204. Vgl. Venkatesh, V., Davis, F. D., PEOU, 1996, S. 454. 61 Vgl. Venkatesh, V., Perceived Ease of Use, 2000, S. 345. 60
46
3
Herleitung des eigenen Akzeptanzmodells
Tab. 3.4 Determinanten der Anpassung Determinante
Definition
Wahrgenommenes Vergnügen
Beschreibt das Ausmaß, in der die Nutzung einer Venkatesh Technik als angenehm empfunden wird. Diese (2000) Beurteilung erfolgt unabhängig von der empfundenen Nützlichkeit eines Systems.
Autoren
Wahrgenommene einfache Benutzung
Beschreibt, inwiefern anderen Techniken bestimmte Aufgaben gleichwertig erledigen können.
Venkatesh (2000)
Quelle: Eigene Darstellung
Die Determinanten wahrgenommenes Vergnügen und wahrgenommene einfache Benutzung finden als Anpassungsprozesse innerhalb des TAM3 Berücksichtigung.62 Der Einfluss der Anpassungsprozesse auf die wahrgenommene Benutzerfreundlichkeit wird durch die moderierende Variable Erfahrung beeinflusst. Das bedeutet, dass sie mit steigender Erfahrung an Einfluss verlieren. Gleichermaßen werden auch die Ankerprozesse Selbstwirksamkeit und Wahrnehmung externer Kontrolle durch steigende Erfahrung beeinflusst. Der Einfluss bleibt bei diesen Determinanten bei steigender Erfahrung hingegen bestehen.63
3.2.3
Überblick über weitere relevante Studien
Neben den vorgestellten TAM-Modellen bestehen weitere Studien, die im Folgenden vorgestellt und bei der Herleitung der eigenen Modellstruktur Berücksichtigung finden. Bei der Einführung von neuen Technologien ist es notwendig, die Gründe für eine Annahme oder Ablehnung zu verstehen.64 Erst seit 2018 ist eine vermehrte Nutzung von Chatbots im B2B-Kontext zu beobachten und damit einhergehend auch zunehmend Gegenstand akademischer Forschung. Chatbots stellen ein junges Forschungsfeld dar und sind daher als neue Technologie zu betrachten. Aus diesem Grund bestehen bis heute nur wenige Arbeiten, die sich mit der Akzeptanz von Chatbots beschäftigen. Tab. 3.5 gibt einen Überblick über bestehende Forschungsarbeiten, die die Akzeptanz von Chatbots untersuchen. Die abhängigen Variablen der vorgestellten Modelle werden jeweils hervorgehoben. 62
Vgl. Venkatesh, V., Perceived Ease of Use, 2000, S. 348. Vgl. ebd., S. 345. 64 Vgl. Graaf, M. M. de, Ben Allouch, S., Acceptance of social robots, 2013, S. 1476. 63
3.2 Grundlagen zur Akzeptanzforschung
47
Im Folgenden findet eine nähere Betrachtung der Ergebnisse der weiteren als relevant erachteten Studien statt. Im Fokus stehen dabei die Arbeiten von Eeuwen (2017), Kasilingam (2020) und Ashfaq et al. (2020). Die Arbeiten von Araújo und Casais (2019) und Rese et al. (2021) werden genannt, aber nicht näher beschrieben. Eeuwen (2017) war einer der ersten Autoren, der die Akzeptanz von Chatbots aus der Perspektive des mobilen Einkaufens näher untersuchte. Das aufgestellte TAM berücksichtigte fünf Determinanten, die die Einstellung zu Chatbots beeinflussen. Eeuwen unterstellt basierend auf dem TAM einen Einfluss der Einstellung auf die Verhaltensabsicht. Von den fünf unabhängigen Variablen können die Variablen wahrgenommene Nützlichkeit, Kompatibilität und das Bedenken in Bezug auf Datenschutz im Internet ca. 66 % der Varianz der Einstellung erklären. Es konnte allerdings kein signifikanter Einfluss der wahrgenommenen Benutzerfreundlichkeit auf die Einstellung in dem betrachteten Kontext festgestellt werden. Eeuwen weist außerdem darauf hin, dass weitere Determinanten wie das wahrgenommene Vergnügen, wahrgenommenes Risiko und Vertrauen bei zukünftigen Forschungen zu berücksichtigen seien, um ein umfassenderes Modell aufstellen zu können.65 Kasilingam (2020) untersuchte inwieweit Nutzer Chatbots im Rahmen von sozialen Medien akzeptieren. In dem von Kasilingam aufgestellten Modell stellen die Einstellung und die Verhaltensintention die abhängigen Variablen dar, wobei die Verhaltensintention zusätzlich durch die Einstellung beeinflusst wird. Allen weiteren sieben Variablen wurde ein gleicher Einfluss auf beide abhängigen Variablen unterstellt. Kasilingam kam zu dem Ergebnis, dass die Variablen Preisbewusstsein, wahrgenommene Freude, wahrgenommene Benutzerfreundlichkeit, persönliche Innovativität, wahrgenommenes Risiko und die wahrgenommene Nützlichkeit die Absicht zur Nutzung eines Chatbots, indirekt über die Variable Einstellung, beeinflussen. Bei der Variable Vertrauen konnte allerdings kein Einfluss herausgestellt werden. Jedoch konnte das Vertrauen als Kernvariable identifiziert werden, die direkten Einfluss auf die Verhaltensintention nimmt. Der Autor konnte insbesondere den Einfluss der Variablen Vertrauen und Risiko zeigen und die Bedeutung im Zusammenhang mit Chatbots aufzeigen. Darüber hinaus konnte gezeigt werden, dass die Einflüsse der moderierenden Variablen Erfahrung, Alter und Geschlecht zu weiterführenden Erkenntnissen in Bezug auf die Akzeptanz von Nutzern führen können.66 Eine von Ashfaq et al. (2020) durchgeführte Studie zielte darauf ab die Zufriedenheit bei der Nutzung von Chatbots, sowie die Absicht Chatbots weiterhin zu nutzen, zu messen. 65 66
Vgl. Eeuwen, M., Mobile Conversational Commerce, 2017, S. 11. Vgl. Kasilingam, D. L., Chatbots for smartphones, 2020, S. 10 ff.
48
3
Herleitung des eigenen Akzeptanzmodells
Tab. 3.5 Relevante Chatbot-Akzeptanzstudien mit Unterstützung von TAM Autor, Artikel (Jahr) und Stichprobe
Befragung
Konstrukte
Modelle
Eeuwen (2017) Akzeptanz von Chatbots im Mobile Commerce (B2C) über Messenger (textbasierter) Chatbots Millenials bis 36 Jahre (n = 239)
Demonstration von Chatbots über Demo-Video. Anschließend Online-Befragung mit Unterstützung eines Fragebogens.
Behavioral Intent
TAM
Perceived Ease of Use
TAM
Perceived Usefulness
TAM
Attitude
TAM
Compatibility
Diffusions-Theorie
Internet Privacy Concern
Kontextbezogene Erweiterung nach Eeuwen (2017)
Attitude Towards Mobile Advertisement
Kontextbezogene Erweiterung nach Eeuwen (2017)
Behavioral Intent
TAM
Perceived Ease of Use
TAM
Perceived Utility
TAM
Attitude
TAM
Compatibility
Diffusions-Theorie nach Eeuwen (2017)
Concern about privacy on the internet
Kontextbezogene Erweiterung nach Moore und Bensebat (1991)
Attitude towards mobile Advertising
Kontextbezogene TAM-Erweiterung nach Eeuwen (2017)
Perceived Usefulness
TAM
Perceived Ease of Use
TAM
Attitude
TAM
Intenation to Use
TAM
Araújo, T., Casais, B. (2019) Araújo, T., Casais, B. (2019) Kunden-Akzeptanz von textbasierten Chatbots im E-Commerce (B2C) 90 % unter 34 Jahre (n = 237)
Kasilingam (2020) Akzeptanz eines Facebook e-Commerce (B2C) textbasierten Chatbot (n = 350)
Demonstration von Chatbots über Demo-Video. Anschließend Online-Befragung mit Unterstützung eines Fragebogens.
Online-Befragung mit Unterstützung eines Fragebogens. Verteilung des Fragebogens über Amazon-Plattform MTurk.
(Fortsetzung)
3.2 Grundlagen zur Akzeptanzforschung
49
Tab. 3.5 (Fortsetzung) Autor, Artikel (Jahr) und Stichprobe
Befragung
Konstrukte
Modelle
Age
UTAUT – Moderierende Variable
Gender
UTAUTModerierende Variable
Experience
TAM2 – Moderierende Variable
Perceived Enjoyment
Kontextbezogene TAM-Erweiterung nach Teo (1999)
Price Consciousness Kontextbezogene TAM-Erweiterung nach Kasilingam (2020)
Ashfaq et al. (2020) Messung der Zufriedenheit von Nutzern textbasierte ChatbotKundenservices (B2C) zu nutzen Ø Alter 30 Jahre (n = 370)
Nutzung des Facebook E-Commerce Chatbot. Anschließend Online-Befragung mit Unterstützung eines Fragebogens.
Perceived Risk
Kontextbezogene TAM-Erweiterung
Trust
Kontextbezogene TAM-Erweiterung nach Dahlberg et al. (2003)
Personal Innovativeness
Kontextbezogene TAM-Erweiterung nach Herrero Crespo und Rodríguez del Bosque (2008)
Perceived Usefulness
TAM/ ExpectationConformity-Theory
Perceived Ease of Use
TAM
Perceived Enjoyment
TAM
Information Quality
IS Succes Model (Fortsetzung)
50
3
Herleitung des eigenen Akzeptanzmodells
Tab. 3.5 (Fortsetzung) Autor, Artikel (Jahr) und Stichprobe
Rese et al. (2021) Akzeptanzmessung von textbasierten Chatbots in der Vor-Kaufphase des Online-Händlers Zalando (B2C) Studenten, 90 % unter 25 Jahre (n = 205)
Befragung
Funktionalitäten des Chatbots wurden vorab erläutert und präsentiert. Anschließend Befragung mit Unterstützung eines Fragebogens.
Quelle: Eigene Darstellung
Konstrukte
Modelle
Service Quality
IS Succes Model
Satisfaction
ExpectationConformity-Theory
Need for interaction with a service employee
Moderierende Variable nach Dabholkar und Bagozzi (2002)
Continuance Intention
ExpectataionConformity-Theory
Perceived Usefulness
TAM
Perceived Ease of Use
TAM
Perceived Enjoyment
TAM
Behavioral Intention
TAM
Intended usage frequency
Uses & Gratification Theory
Authenticity of conversation
Uses & Gratification Theory
Convenience
Uses & Gratification Theory
Enjoyment
Uses & Gratification Theory
Pass time
Uses & Gratification Theory
Privacy concerns
Uses & Gratification Theory
Immature technology
Uses & Gratification Theory
3.2 Grundlagen zur Akzeptanzforschung
51
Ashfaq kombinierte dazu Variablen der Expectation-Conformity-Theory und des IS Success Modells mit den Konstrukten des TAM wahrgenommene Nützlichkeit, wahrgenommene Benutzerfreundlichkeit und wahrgenommenes Vergnügen. Außerdem fügen Ashfaq et al. die moderierende Variable Möglichkeit der Interaktion mit einem Service-Mitarbeiter hinzu. Die Studie konnte bestätigen, dass die Informations- und Servicequalität die Zufriedenheit der Nutzer positiv beeinflusst haben. Außerdem konnte gezeigt werden, dass die wahrgenommene Freude, die wahrgenommene Nützlichkeit und die wahrgenommene Benutzerfreundlichkeit als signifikante Prädikatoren für die Absicht der Nutzung zu sehen sind. Die Variable Möglichkeit der Interaktion mit einem Service-Mitarbeiter moderiert die Auswirkungen der wahrgenommenen Benutzerfreundlichkeit und der wahrgenommenen Nützlichkeit.67 Eine zentrale Erkenntnis stellt dar, dass digitale Technologien, wie Chatbots in Kombination mit menschlichen Mitarbeitern zu nutzen sind, um die Nutzer zufriedenstellen zu können.68 Ashfaq et al. weisen jedoch darauf hin, dass zusätzlich die Variablen des wahrgenommenen Risikos und die Sorge um Privatsphäre in zukünftige Modelle zu integrieren sind.69 In Bezug auf Chatbots, fällt bei der Analyse bisheriger Studien wie z. B. den weiteren vorgestellten Studien von Araújo, T. und Casais, B. (2019) und Rese et al. (2021) auf, dass bestehende Forschungsansätze unter Einbezug des TAM und dessen Erweiterungen ausschließlich B2C-Bereiche in den Fokus der Betrachtung stellen. Dabei werden Prozesse innerhalb des E-Commerce oder des M-Commerce untersucht. Es liegt die Vermutung nahe, dass dieser Umstand auf vorerst starke Nutzung im B2C-Bereich zurückzuführen ist. Viele Studien verknüpfen das TAM und dessen Erweiterungen mit weiteren Modellen, um Aussagen über die Akzeptanz von Chatbots treffen zu können. Alle Studien basieren jedoch auf den Grundzügen des TAM nach Davis et al. (1989) und nutzen die Variablen wahrgenomme Nützlichkeit und wahrgenommene Benutzerfreundlichkeit gleichermaßen, um Rückschlüsse auf die Verhaltensabsicht und dadurch auf die Akzeptanz von Chatbots ziehen zu können. Außerdem fällt auf, dass von den Autoren fast ausnahmslos eine junge Zielgruppe bis 30 Jahren in den Fokus gestellt und für eine Auswertung in Betracht gezogen wurde.70 Studien in Bezug auf die Akzeptanz und Nutzung von Chatbots im B2B-Umfeld fanden bisher nicht statt und gilt es noch durchzuführen. 67
Vgl. Ashfaq, M. et al., AI-powered service agents, 2020, S. 19 ff. Vgl. ebd., S. 24. 69 Vgl. ebd., S. 23. 70 Vgl. Araújo, T., Casais, B., Shopping-Assistant Chatbots, 2020; Vgl. Rese, A. et al., Chatbots in Retail, 2020; Vgl. Ashfaq, M. et al., AI-powered service agents, 2020. 68
52
3.3
3
Herleitung des eigenen Akzeptanzmodells
Determinanten der eigenen Modellstruktur
Auf Basis der theoretischen Ergebnisse, soll im Folgenden eine vermutete Modellstruktur für die Akzeptanz von Chatbots im B2B-Kontext formuliert werden. Ziel ist es, die Einstellungsakzeptanz von B2B-Mitarbeitern in Bezug auf Chatbots zu erfassen. Die bisher vorgestellten und diskutierten Modelle und Variablen werden aufgegriffen und vermutete Zusammenhänge hergestellt.
3.3.1
Grundlegende Modellstruktur
Seit Veröffentlichung des TAM im Jahr 1989 nutzen viele wissenschaftliche Forschungsarbeiten das Modell, was die Popularität des Modells im Forschungsbereich der Technologie-Akzeptanz verdeutlicht.71 Auch die Stärke wird in zahlreichen Studien bestätigt, sodass eine breite Anwendbarkeit auf unterschiedliche Technologien abzuleiten ist.72 Aus diesem Grund wird das grundlegende Konzept des TAM nach Davis 1989 zur Akzeptanzbewertung von Chatbots im B2B-Bereich zu Grunde gelegt. Tab. 3.6 zeigt die Determinanten, die in der eigenen Modellstruktur Berücksichtigung finden. Tab. 3.6 Determinanten der eigenen grundlegenden Modellstruktur Determinante
Ursprung
Quelle
Wahrgenommene Nützlichkeit
TAM
Davis (1989)
Wahrgenommene Benutzerfreundlichkeit
TAM
Davis (1989)
Einstellung
TRA/ TPB
Ajzen und Fishbein (1980)
Nutzungsabsicht
TAM
Davis (1989)
Quelle: Eigene Darstellung
Es wird vorgeschlagen, die Variable wahrgenommene Benutzerfreundlichkeit und wahrgenommene Nützlichkeit als Basiskomponenten in die vermutete Modellstruktur zu integrieren. Da der Einfluss beider Determinanten in Abhängigkeit der untersuchten Technologie zu unterschiedlichen Ergebnissen im B2C Kontext führte, gilt es auch diese Zusammenhänge durch die Konsumeration des B2B-Bereiches (Vgl. Unterabschnitt 2.2.1) in diesem Kontext zu überprüfen. Die 71 72
Vgl. Chung, J., Tan, F. B., Perceived Playfulness, 2004. Vgl. Maranguni´c, N., Grani´c, A., History of TAM, 2015, S. 92.
3.3 Determinanten der eigenen Modellstruktur
53
wahrgenommene Benutzerfreundlichkeit kann dabei sowohl auf die wahrgenommene Nützlichkeit als auch auf die Einstellung Einfluss nehmen. Obwohl viele Studien einen Einfluss der Variable Einstellung nicht bestätigen konnten, wird aufbauend auf der TRA und TPB und auf Basis der aktuellen B2C-Studie von Kasilingam (2020) die Variable Einstellung in die vermutete Struktur integriert. Wie bereits in Abschnitt 3.2 auf Basis der Teilebenen der Akzeptanz nach Kollmann (1998) erläutert, sollte die Bewertung der Akzeptanz von Chatbots über die Einstellungsphase erfolgen, da weitere Ebenen der Akzeptanz aufgrund des innovativen Charakters von Chatbots als nur schwer messbar zu bewerten sind. Gemäß der TRA hat die Einstellung Einfluss auf die Verhaltensintention und wirkt somit indirekt auch auf die tatsächliche Nutzung einer Technik. Die tatsächliche Nutzung einer Technik findet aus gleichen Gründen keine Berücksichtigung in der vorgeschlagenen Modellstruktur, da davon auszugehen ist, dass eine tatsächliche Nutzung von Chatbots im Arbeitsumfeld bisher noch nicht flächendeckend integriert ist.
3.3.2
Abgeleitete Determinanten aus den Technologie-Akzeptanz-Modellen
Neben der vorgestellten grundsätzlichen Struktur sollen weitere Determinanten in die eigene Modellstruktur integriert werden, um die Akzeptanz im B2BKontext bestmöglich erfassen zu können. Es wird aufbauend auf Erkenntnissen der Marketingforschung nach Churchill (1979) vermutet, dass auch die vermutete Modellstruktur zur Messung der Einstellungsakzeptanz über mehrere beobachtbare Variablen zu erfolgen ist.73 Bei allen vorgestellten Chatbots-Studien konnte ein klarer Fokus auf den B2C-Bereich beobachtet werden. Der B2C-eCommerce konzentriert sich auf das Maximieren der Umsätze durch erhöhte Verkaufszahlen und begründet somit eine gleichrangige Betrachtung der Determinanten wahrgenommene Nützlichkeit und wahrgenommene Benutzerfreundlichkeit in den vorgestellten Technologie-Akzeptanz-Modellen. Im B2B-Bereich hingegen gilt es die unternehmensinternen Prozesse effizienter zu gestalten.74 Wie ursprünglich von Davis (1989) argumentiert, ist die wahrgenommene Nützlichkeit als zentraler Faktor für die Akzeptanz von Technologien zu betrachten.75 Es wird vermutet, dass Mitarbeiter im B2B-Umfeld Chatbots am wahrscheinlichsten nutzen, wenn 73
Vgl. Churchill, G. A., Developing Marketing Constructs, 1979, S. 66. Vgl. Franz, E. J., Hegeler, R., Supply Chain Management, 2001, S. 235. 75 Vgl. Kasilingam, D. L., Chatbots for smartphones, 2020, S. 2. 74
54
3
Herleitung des eigenen Akzeptanzmodells
sie von dem Einsatz profitieren können. Aus diesem Grund ist es bei der Formulierung des vorläufigen Akzeptanzmodells in diesem Kontext notwendig, vorerst eine vorrangige Betrachtung der Variablen vorzunehmen, die die wahrgenommene Nützlichkeit beeinflussen. Tab. 3.7 zeigt die Determinanten, die auf Basis des TAM2 in die eigene Modellstruktur integriert wurden. Tab. 3.7 Weitere abgeleitete Determinanten der TAM-Modelle Determinante
Ursprung
Quelle
Relevanz für den Beruf
TAM2
Venkatesh und Davis (2000)
Ergebnisqualität
TAM2
Venkatesh und Davis (2000)
Subjektive Norm
TAM2
Venkatesh und Davis (2000)
Quelle: Eigene Darstellung
Infolgedessen werden die kognitiv-instrumentellen Determinanten Relevanz für den Beruf und die Ergebnisqualität als Einflussfaktoren, aufbauend auf dem TAM2, auf die Determinante wahrgenommenen Nützlichkeit vorgeschlagen. Die Relevanz für den Beruf bedeutet, inwieweit Chatbots bei der Übereinstimmung von Arbeitszielen und ausgeführten Tätigkeiten unterstützen können. Die Ergebnisrelevanz besagt in diesem Kontext, inwieweit Chatbots auch die benötigten Aufgaben erfüllen können.76 Das im TAM2 vorgeschlagene Konstrukt Darstellbarkeit der Ergebnisse findet im vorgestellten Modell keine Berücksichtigung, da sowohl eine Bewertung der Ergebnisse von Chatbots direkt erfolgt als auch eine Zuordnung zwischen Output und Anwendung besteht und es daher keiner weiteren Bewertung bedarf. Es wird darüber hinaus angenommen, dass die Variable Subjektive Norm als sozialer Faktor Einfluss auf die wahrgenommene Nützlichkeit nimmt. Bereits die ursprünglichen Modelle TRA und TPB berücksichtigten die Variable Subjektive Norm, sodass diese auch in das TAM2 integriert wurde.77 Viele B2C-Studien konnten den Einfluss der Subjektiven Norm auf die wahrgenommene Nützlichkeit und auf die Verhaltensintention selbst nachweisen, wobei unterschiedliche Ergebnisse in Abhängig der Zielgruppe zu beobachten waren.78 Infolgedessen wird eine Integration dieser Determinante in die vermutete Modellstruktur vorgenommen, da es den Einfluss des sozialen Umfelds bei der Nutzung von Chatbots im B2B-Bereich zu untersuchen gilt. Bei den weiteren sozialen Variablen Freiwilligkeit der Nutzung und Selbstdarstellung, wird durch 76
Vgl. Venkatesh, V., Davis, F. D., Technology Acceptance Model 2, 2000, S. 191 f. Vgl. Venkatesh, V., Davis, F. D., Technology Acceptance Model 2, 2000, S. 187. 78 Vgl. Schepers, J., Wetzels, M., Subjective Norm, 2007, S. 100. 77
3.3 Determinanten der eigenen Modellstruktur
55
den B2B-Kontext kein signifikanter Einfluss vermutet und daher aus der vorläufigen Modellstruktur ausgeschlossen. Eine Verwendung von Chatbots erfolgt somit vorrangig durch den Nutzen, beeinflusst durch kognitiv-instrumentelle Faktoren.
3.3.3
Integration weiterer kontextbezogener Determinanten
Außerdem erfolgte die Integration weiterer Determinanten, die keinen Bestandteil der vorgestellten TAM darstellte. Auf Basis der in Unterabschnitt 3.2.3 vorgestellten aktuellen Studien werden weitere Determinanten vorgeschlagen. Diese sind Tab. 3.8 zu entnehmen. Tab. 3.8 Kontextbezogene Determinanten der eigenen Modellstruktur Determinante
Quelle
Vertrauen
Kasilingam (2000); Euwen (2017)
Innovationsfreudigkeit
Kasilingam (2000)
Möglichkeit zur Interaktion mit einem Mitarbeiter
Ashfaq et al. (2021)
Quelle: Eigene Darstellung
Die Determinante Vertrauen findet in der eigenen B2B-Modellstruktur Berücksichtigung. Die betrachteten Studien von z. B. Euwen (2017) und Kasilingam (2020) empfahlen die Variable zu berücksichtigen und in zukünftige Modelle zu integrieren. Vertrauen gilt als ein entscheidendes Merkmal bei unzähligen Interaktionen im wirtschaftlichen und sozialen Zusammenhang, die durch Unsicherheit geprägt sind.79 Und ebenso ist Vertrauen ein wichtiger Prädikator für Beziehungen zwischen Anbietern und Nachfragern.80 Ein signifikanter Einfluss konnte in vielen weiteren Studien im B2C-Kontext nachgewiesen werden.81 Daher ist Vertrauen als wichtiges Element in Bezug auf die Akzeptanz von Techniken anzusehen, die maßgeblichen Einfluss auf Entscheidungen nehmen kann. Insbesondere im unternehmerischen Kontext kann angenommen werden, dass Vorbehalte hinsichtlich Datenschutz und Sicherheit bestehen.82 Daher kann auch ein Einfluss der Variable Vertrauen im B2B-Umfeld auf die wahrgenommene Nützlichkeit unterstellt werden. Da Chatbots als neue Technologie zu betrachten sind, lässt sich 79
Vgl. Bhide, A., Stevenson, H., Trust, 1992, S. 191 ff. Vgl. Castaldo, S. et al., Conceptualizations of Trust, 2010, S. 657. 81 Vgl. Schurr, P. H., Ozanne, J. L., Buyers’ Preconceptions, 1985, S. 939 ff. 82 Vgl. Chong, A. Y.-L. et al., Consumer Decisions, 2012, S. 36. 80
56
3
Herleitung des eigenen Akzeptanzmodells
zusätzlich ein indirekter Einfluss auf die Einstellung zur Akzeptanz von Chatbots vermuten. Venkatesh und Bala (2008) beschreiben in ihrem vorgestellten TAM3 Anker und Anpassungen, die auf die wahrgenommene Benutzerfreundlichkeit wirken. Es liegt die Vermutung nahe, dass alle vorgestellten Determinanten der Verankerung im B2B-Kontext nicht passend formuliert sind, sondern eher in B2C-Studien Anwendung finden. Die Wahrnehmung der externen Kontrolle entfällt, da alle benötigten Ressourcen durch ein Unternehmen zur Verfügung gestellt werden. Generell sind die Determinanten der Verankerung als zu detailliert für den betrachteten Kontext zu sehen. Gewisse Kenntnisse mit dem Umgang von computergestützten Anwendungen gelten durch eine berufsbedingte Verwendung83 sowie durch die Teilnahme an der durchgeführten Online-Studie als gegeben. Die Determinanten zielen darauf ab, die Einstellung in Bezug auf die Nutzung von Computern zu erklären. Durch den innovativen Charakter von Chatbots erfolgt der Vorschlag, analog zu der vorgestellten Studie von Kasilingam (2020), stattdessen die Integration der Variable Innovationsfreudigkeit vorzunehmen. Die Variable wird allgemein als Schlüsselvariable in Online-Umgebungen betrachtet.84 Der Fokus sollte vorwiegend auf dem Umgang mit einer neuen Technologie, wie Chatbots, und weniger auf der Computernutzung im Allgemeinen liegen. Die im TAM3 vorgestellten Anpassungsprozesse finden durch das Fehlen der Variable Erfahrung keine Berücksichtigung. Um die Erfahrung als soziale Komponente im TAM2 mit einer Technik zu bewerten, wurden Umfragen zu unterschiedlichen Zeitpunkten durchgeführt.85 Da dies den Umfang der vorliegenden Arbeit übersteigt findet diese Determinante in der vermuteten Modellstruktur keine Berücksichtigung. Entscheidungen sind auf B2B-Märkten eher rational geprägt und persönliche Beziehungen stehen noch oft im Fokus.86 Infolgedessen scheint es in diesem Kontext als sinnvoll eine Variable in das Modell einzubinden, die die Möglichkeit zur Interaktion mit einem Mitarbeiter berücksichtigt. Der ehemalige CEO von IBM sagte, dass die Kombination Mensch und Maschine immer bessere Ergebnisse hervorrufen werde als nur der Mensch oder eine Maschine allein.87 Diese Aussage sollte auch in Bezug auf Chatbots Berücksichtigung finden. Es verdeutlicht, dass die Rolle des Menschen bei der Mensch-Maschine-Kommunikation zu 83
Vgl. Statista, Computernutzung in Unternehmen, 2022, o. S. Vgl. San Martín, H., Herrero, Á., Psychological Factors, 2012, S. 344. 85 Vgl. Venkatesh, V., Davis, F. D., Technology Acceptance Model 2, 2000, S. 187 ff. 86 Vgl. Backhaus, K., Voeth, M., Industriegütermarketing, 2015, S. 22. 87 Vgl. Hyken, S., Smart Working, 2018, o. S. 84
3.4 Zeichnung der Akzeptanz-Modellstruktur und Aufstellen …
57
berücksichtigen ist. Viele Studien wie Dabholkar und Bagozzi (2002) konnten bereits einen Einfluss der Variable nachweisen. Sie wiesen darauf hin, dass der menschliche Kontakt bei der Erbringung von Dienstleistungen für einige Verbraucher ein wichtiger Akzeptanzbaustein darstellen kann.88 Obwohl die Studie den tatsächlichen persönlichen Mensch-zu-Mensch Kontakt im B2C-Umfeld berücksichtigt, können darauf aufbauend Vermutung für den B2B-Kontext formuliert werden. Auch Ashfaq et al. (2021) nutzten diese Erkenntnisse und nahmen eine Integration der Variable Möglichkeit zur Interaktion mit einem Mitarbeiter in Bezug auf Chatbots in ihrem Modell vor.89 Die Integration der Variablen wird darüber hinaus dadurch gestützt, dass eine weitere Arbeit von Pötinen (2021) aus dem Jahr 2021 zu dem Ergebnis kam, dass die beste Möglichkeit der Integration von KI-gestützten Technologien (wie Chatbots) darin besteht, Menschen in B2B-Unternehmen zu ergänzen, anstatt diese zu ersetzen.90 Daher kann die Vermutung über einen Zusammenhang im B2B-Kontext erfolgen und die Variable in der eigenen Modellstruktur Berücksichtigung finden.
3.4
Zeichnung der Akzeptanz-Modellstruktur und Aufstellen der Hypothesen
Die aus der Theorie und aus bestehenden Studien abgeleiteten möglichen Determinanten, die auf die Akzeptanz von Chatbots im B2B-Umfeld Einfluss haben, wurden in den vorangegangenen Abschnitten vorgestellt. Dies konnte die Komplexität des Konstrukts der Einstellungsakzeptanz verdeutlichen. Daher findet die Akzeptanz ebenfalls als theoretisches Konstrukt in der vermuteten Modellstruktur Berücksichtigung. Die Einstellungsakzeptanz wird als latente Variable betrachtet, die nicht direkt zu beobachten oder messbar ist.91 Sie erhält ihre Bedeutung durch formale Verbindungen in Bezug auf empirische Konzepte.92 Aufbauend auf den betrachteten Modellen und der Komplexität des Konstrukts geht der Autor von einer mehrdimensionalen Struktur aus, da die Vermutung erfolgt, dass die Einstellungsakzeptanz über mehrere Faktoren zu messen ist.93
88
Vgl. Dabholkar, P. A., Bagozzi, R. P., Consumer Traits, 2002, S. 188. Vgl. Ashfaq, M. et al., AI-powered service agents, 2020, S. 2 ff. 90 Vgl. Pöntinen, A., AI in B2B Sales, 2021, S. 84 ff. 91 Vgl. Döring, N., Bortz, J., Forschungsmethoden, 2016, S. 224. 92 Vgl. Bagozzi, R. P., Phillips, L. W., Organizational Theories, 1982, S. 465. 93 Vgl. Homburg, C., Giering, A., Operationalisierung, 1996, S. 6. 89
58
3
Herleitung des eigenen Akzeptanzmodells
Im Folgenden wird die eigene Modellstruktur mit den Zusammenhängen und Beziehungsstrukturen aufgezeichnet. Abb. 3.8 zeigt den abgeleiteten und angestrebten Modellvorschlag zur Messung der Einstellungsakzeptanz von Chatbots.
Vorgeschlagene B2B-bezogene Erweiterungen H6+
Subjektive Norm H5+ H8+
Vertrauen H7+
Relevanz für den Beruf
H1+
H9+ H10+
Grundlegende Struktur nach Davis et al. (1989)
Wahrgenommene Nützlichkeit
Einstellung
H3+
Ergebnisqualität H2+
Kognitiv
H12+
Innovationsfreudigkeit
Möglichkeit zur Interaktion mit Mitarbeiter
H11+
Nutzungsabsicht H4
+
Wahrgenommene Benutzerfreundlichkeit
H13+
Abb. 3.8 Eigene Modellstruktur zur Erfassung der Einstellungsakzeptanz. (Quelle: Eigene Darstellung)
Die grundlegende Struktur aus Unterabschnitt 3.3.1 nach Davis et al (1989), ergänzt um die Variable Einstellung, ist in grau hinterlegt. Außerdem werden die vermuteten Determinanten sowie deren mögliche Zusammenhänge dargestellt. Die vorliegende vermutete Modellstruktur zeigt mögliche Einflussfaktoren auf die wahrgenommene Nützlichkeit. Auf Basis der durchgeführten Literaturrecherche sind mögliche Einflüsse auf die Akzeptanz von Chatbots im B2B-Sektor durch die Faktoren Subjektive Norm, Vertrauen, Relevanz für den Beruf , Ergebnisqualität zu erklären. Obwohl der Fokus der Modellstruktur auf der Dimension der wahrgenommenen Nützlichkeit beruht, sind Einflüsse der Variablen Möglichkeit zur Interaktion mit Mitarbeitern und Innovationsfreudigkeit auf die wahrgenommene Benutzerfreundlichkeit ebenfalls denkbar. Analog zu der Annahme von Venkatesh und Bala (2008) liegt aber die Vermutung nahe, dass die Determinanten der wahrgenommenen Nützlichkeit und der wahrgenommenen Benutzerfreundlichkeit sich gegenseitig nicht bedingen und keine Cross-over Effekte vorliegen. Zusätzlich
3.4 Zeichnung der Akzeptanz-Modellstruktur und Aufstellen …
59
sind in Abb. 3.8 die aufgestellten Hypothesen sowie die jeweilige Wirkungsrichtung mit einem „+“ eingezeichnet. In Tab. 3.9 erfolgt eine Überführung der Modellstruktur in ein formales Hypothesensystem. Tab. 3.9 Abgeleitete Hypothesen Hypothesen H1
Je höher die wahrgenommene Nützlichkeit von Chatbots im B2B-Umfeld, desto positiver ist die Einstellung zu Chatbots.
H2
Je höher die wahrgenommene Benutzerfreundlichkeit von Chatbots im B2B-Umfeld, desto positiver ist die Einstellung zu Chatbots.
H3
Je höher die wahrgenommene Benutzerfreundlichkeit von Chatbots im B2B-Umfeld, desto positiver ist die wahrgenommene Nützlichkeit.
H4
Je positiver die Einstellung zu Chatbots im B2B-Umfeld ausfällt, desto höher fällt die Absicht diese zu nutzen aus.
H5
Je positiver die Subjektive Norm in Bezug auf die Nutzung von Chatbots im B2B-Umfeld ausfällt, desto höher ist die Wahrgenommene Nützlichkeit.
H6
Je positiver die Subjektive Norm in Bezug auf die Nutzung von Chatbots im B2B-Umfeld ausfällt, desto positiver ist die Einstellung zu Chatbots.
H7
Je höher das Vertrauen in Bezug auf die Nutzung von Chatbots im B2B-Umfeld, desto höher ist die wahrgenommene Nützlichkeit.
H8
Je höher das Vertrauen in Bezug auf die Nutzung von Chatbots im B2B-Umfeld, desto positiver ist die Einstellung zu Chatbots.
H9
Je höher die Relevanz für den eigenen Job in Bezug auf die Nutzung von Chatbots im B2B-Umfeld ausfällt, desto höher ist die wahrgenommene Nützlichkeit.
H10
Je höher die erwartete Ergebnisqualität in Bezug auf die Nutzung von Chatbots im B2B-Umfeld ausfällt, desto höher ist die wahrgenommene Nützlichkeit.
H11
Je eher die Möglichkeit zur Interaktion mit einem Mitarbeiter bei der Nutzung von Chatbots im B2B-Umfeld besteht, desto höher fällt die wahrgenommene Benutzerfreundlichkeit aus.
H12
Je eher die Möglichkeit zur Interaktion mit einem Mitarbeiter bei der Nutzung von Chatbots im B2B-Umfeld besteht, desto positiver fällt die Einstellung aus.
H13
Je höher die Innovationsfreudigkeit der Mitarbeiter, desto höher fällt die wahrgenommene Benutzerfreundlichkeit von Chatbots im B2B-Umfeld aus.
Quelle: Eigene Darstellung
Während die Hypothesen H1 bis H4 die ursprünglichen Zusammenhänge des TAM nach Davis berücksichtigen, thematisieren die Hypothesen H5 bis H10 mögliche Einflussfaktoren, die sich positiv auf die wahrgenommene Nützlichkeit
60
3
Herleitung des eigenen Akzeptanzmodells
auswirken. Die Hypothesen H11 und H13 greifen die postulierten Wirkungsbeziehungen auf, die auf die wahrgenommene Benutzerfreundlichkeit beziehen. Die Hypothesen H6 , H8 und H12 berücksichtigen die vermuteten positiven Auswirkungen, die zusätzlich direkt auf die Einstellung wirken. Mit Aufstellen der Hypothesen gilt dieses Kapitel als abgeschlossen, sodass eine Überprüfung des Hyothesensystems im daruaffolgenden Kapitel durchgeführt werden kann.
4
Empirische Untersuchung
Im nachfolgenden Kapitel erfolgt die empirische Überprüfung des aufgestellten Modells und die Bewertung der aufgestellten Hypothesen. Neben einer literaturbasierten Operationalisierung liegt das Augenmerk dieses Kapitels auf der Güteprüfung der gewählten Messmodelle hinsichtlich ihrer Reliabilität und Validität. Ferner wird das in Kapitel 3 aufgestellte Akzeptanzmodell in ein Strukturmodell überführt, um eine Evaluation der aufgestellten Hypothesen im Rahmen der Kausalanalyse vornehmen zu können.
4.1
Methodische Aspekte und Vorgehensweise
Im vorangegangenen Kapitel erfolgten auf Basis von bestehenden Akzeptanzmodellen, sachlogische Überlegungen in Bezug auf die Beziehung zwischen den Variablen, die die Einstellungsakzeptanz von Chatbots erklären. Es gilt, die theoretisch fundierten Hypothesensysteme mit Unterstützung einer Strukturgleichungsanalyse empirisch zu überprüfen.1 Im folgenden Abschnitt soll ein grundsätzliches Verständnis von Strukturgleichungsmodellen (SGM) hergestellt werden. Durch SGM können mittels empirisch erhobener Daten die Wirkungsbeziehungen durch ein Strukturmodell im Hinblick auf die Stärke und Richtung 1
Vgl. Backhaus, K. et al., Multivariate Analysemethoden, 2016, S. 67.
Ergänzende Information Die elektronische Version dieses Kapitels enthält Zusatzmaterial, auf das über folgenden Link zugegriffen werden kann https://doi.org/10.1007/978-3-658-43230-0_4.
© Der/die Autor(en), exklusiv lizenziert an Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2023 K. Elsner, Der Einsatz von Chatbots in Business-to-Business-Märkten, BestMasters, https://doi.org/10.1007/978-3-658-43230-0_4
61
62
4
Empirische Untersuchung
geschätzt und mit den vorab getroffenen Vermutungen abgeglichen werden.2 Das Ziel ist, die vorab aufgestellten Wirkungszusammenhänge in ein lineares Gleichungssystem zu überführen und die Parameter innerhalb des Modells so zu schätzen, dass die Variablen möglichst gut reproduzieren werden können. In SGM werden die Beziehungen in einem Pfaddiagramm, bestehend aus den Kovarianzen oder auch aus den Korrelationen der Indikatorvariablen, errechnet. Den Ausgangpunkt für die Analyse bilden somit die aus den empirischen Daten errechnete Kovarianz- oder Korrelationsmatrix. Demzufolge ist von einem kovarianzanalytischen Ansatz zu sprechen, da eine Analyse auf Ebene der aggregierten Daten erfolgt.3 Damit besitzen Strukturgleichungsanalysen einen konfirmatorischen Charakter und stellen ein hypothesenprüfendes Verfahren dar.4 SGM sind in der Lage latente, d. h. nicht direkt messbare Variablen, zu verarbeiten und die aufgestellten Hypothesen in Form von Beziehungen zwischen den hypothetischen Konstrukten abzubilden. Dabei wird bei latenten Variablen zwischen endogenen, d. h. abhängigen, latenten Variablen und exogenen, d. h. unabhängigen, latenten Variablen unterschieden.5 Während endogene Variablen durch die unterstellten Beziehungen erklärt werden, gelten exogene Variablen von außen vorgegeben und werden nicht durch postulierte Beziehungen erklärt.6 Sollte eine Variable sowohl eine abhängige als auch eine unabhängige Größe darstellen, wird von intervenierenden Variablen gesprochen.7 Eine besondere Stärke von SGM liegt in der bewussten Berücksichtigung von Messfehlern. Insbesondere bei latenten Variablen ist diese Tatsache von Bedeutung. Eine fehlerfreie Messung sollte nicht angenommen werden, sondern vielmehr sollten mögliche Fehler bewusst in ein Modell integriert werden.8
2
Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 7. Vgl. Backhaus, K. et al., Analysemethoden, 2015, S. 69. 4 Vgl. Backhaus, K. et al., Multivariate Analysemethoden, 2016, S. 67. 5 Vgl. ebd., S. 68. 6 Vgl. Kline, R. B., Modelling, 2016, S. 190. 7 Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 7. 8 Vgl. Hair, J. et al., Multivariate Data Analysis, 2010, S. 637. 3
4.1 Methodische Aspekte und Vorgehensweise
63
Die Vorgehensweise der vorliegenden Untersuchung orientiert sich an dem von Weiber und Mühlhaus (2014) vorgeschlagenen achtstufigen Prozess und wurde geringfügig auf Basis der einschlägigen Literatur angepasst. Die Strukturgleichungsmodellierung umfasst „den gesamten Prozess von der theoretischen […] Formulierung eines Strukturmodells und seiner Messmodelle bis hin zur Beurteilung der empirisch mittels Strukturgleichungsanalyse gewonnenen Ergebnisse“9 . Die Vorgehensweise ist in Abb. 4.1 abgebildet. Die Stufen eins bis vier umfassen die erforderlichen Vorarbeiten, die bei der Formulierung von empirisch testbaren Hypothesensystemen durchzuführen sind. Ab Stufe fünf erfolgt die eigentliche empirische Prüfung des Strukturmodells.10
1) Hypothesen- und Modellbildung (Kapitel 3)
2) Operationalisierung (Abschnitt 4.2)
3) Modellspezifikation und Modellstruktur (Abschnitt 4.4)
4) Güteprüfung der Messmodelle (Abschnitt 4.5)
5) Modellschätzung und Model-Fit (Abschnitt 4.6)
6) Evaluation der aufgestellten Hypothesen (Abschnitt 4.7)
7) Interpretation der Ergebnisse (Kapitel 5)
Abb. 4.1 Vorgehensweise der Strukturgleichungsmodellierung. (Quelle: Eigene Darstellung in Anlehnung an Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 85 ff)
Die Grundlage der Strukturgleichungsmodellierung bildet eine theoretische oder sachlogische Begründung der a-priori aufgestellten Hypothesenstruktur. Die Herleitung der Hypothesen wurde bereits in Kapitel 3 umfassend erläutert und findet daher innerhalb der vorgestellten Vorgehensweise keine weitere Beachtung. Der vorgeschlagene Prozess von Weiber und Mühlhaus beinhaltet zusätzlich 9
Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 86. Vgl. ebd., S. 87.
10
64
4
Empirische Untersuchung
eine Konzeptualisierung der theoretischen Konstrukte.11 Dieser Schritt entfällt durch begründete Plausibilitätsbetrachtung durch die Sachlogik selbst.12 Dieser Prozessschritt findet in der zugrundliegenden Vorgehensweise keine Betrachtung, da diese bereits umfassend innerhalb von Kapitel 3 erfolgt ist. Der zweite Prozessschritt umfasst die Operationalisierung der im Modell enthaltenen Variablen. Die Operationalisierung umfasst sowohl die Spezifizierung und Formulierung der Messmodelle als auch die Konstruktion der Messvorschrift. Anschließend folgt die dritte Stufe, die keinen Prozessbestandteil nach Weiber und Mühlhaus (2014) darstellt, sondern die Zeichnung des Strukturgleichungsmodells umfasst. Backhaus et al. (2015) schlagen vor, anknüpfend an die Operationalisierung, das vollständige Kausaldiagramm in Form eines Pfaddiagramms aufzuzeigen. Auf die Aufstellung der Gleichungssysteme wird durch den konfirmatorischen Charakter dieser Arbeit verzichtet.13 Anschließend erfolgt die Güteprüfung der Messmodelle, wobei zunächst eine Erläuterung der gängigsten Gütekriterien in Bezug auf die Reliabilität und Validität der Messmodelle stattfindet. Im fünften Schritt werden die Modellparameter, unter Anwendung des Statistikprogramms AMOS©, empirisch geschätzt.14 Nachdem eine Schätzung der im Modell enthaltenen Parameter erfolgt ist, gilt es die gesamte Modellstruktur zu überprüfen. Auf Basis der vorherigen Stufen liegen an dieser Stelle ausreichende Informationen vor, um die aufgestellten Hypothesen zu beurteilen und abschließend die Ergebnisse interpretieren zu können.15 Die vorgeschlagene achte Stufe der Modifikation der Modellstruktur nach Weiber und Mühlhaus entfällt, da die Strukturgleichungsanalyse die konfirmatorische Struktur verlässt und eine explorative Ausrichtung in den Vordergrund rückt.16
11
Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 86. Vgl. ebd., S. 95. 13 Vgl. Backhaus, K. et al., Analysemethoden, 2015, S. 76 ff. 14 Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 87. 15 Vgl. Wentura, D., Pospeschill, M., Multivariate Datenanalyse, 2015, S. 214 ff. 16 Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 87. 12
4.1 Methodische Aspekte und Vorgehensweise
4.1.1
65
Spezifizierung der Messmodelle
In Zusammenhang mit der Operationalisierung der Modellvariablen ist der Spezifizierung der Messmodelle besondere Beachtung zu schenken und es gilt, die Beziehung zwischen Indikatoren und Variablen genau zu betrachten.17 Je nach Wirkungsrichtung der Beziehung ist diese entweder reflektiv oder formativ.18 Bei formativen Messmodellen weist die Wirkungsrichtung von der Beobachtungsebene hin zur theoretischen Ebene. Es wird unterstellt, dass das latente Konstrukt durch Indikatoren beschrieben wird.19 Diesem Modell liegt zu Grunde, dass die relevanten Informationen fehlerfrei gemessen werden. Entgegen dem, gehen reflektive Messmodelle davon aus, dass das latente Konstrukt durch die Indikatoren bedingt wird und ein rein modellgeleiteter Ansatz ist. Eine Veränderung des latenten Konstrukts hat somit Auswirkungen auf alle weiteren Indikatoren.20 Es können unterschiedliche Erkenntnisse in Bezug auf die Korrelation der Indikatorvariablen von formativen oder reflektiven Messmodellen abgeleitet werden. Bei formativen Messmodellen sollten die Indikatoren nur schwach miteinander korrelieren. Bei reflektiven Modellen wird hingegen von einer hohen Korrelation zwischen den Indikatoren ausgegangen, mit dem Ziel diese Korrelationen als Anzeichen für eine valide und reliable Operationalisierung nutzen zu können. Bei formativen Messmodellen wird empfohlen, diejenigen Indikatoren zu eliminieren, die hohe Korrelationen aufweisen und sich untereinander zu stark ähneln, um eine verbesserte Modellgüte zu erhalten. Eine Verbesserung der Modellgüte von reflektiven Messmodellen kann hingegen über das Eliminieren von nur schwach korrelierenden Indikatoren erreicht werden.21 Verschiedene Autoren wie z. B. Bagozzi (1981) oder Anderson und Gerbing (1982) forderten, dass der Spezifikation von Messmodellen mehr Aufmerksamkeit geschenkt werden sollte.22 Daraufhin entwickelten Jarvis et al. (2003) einen Fragenkatalog, der eine praktische Möglichkeit bietet, um zwischen reflektiven und formativen Messmodellen zu entscheiden.Tab. 4.1 zeigt die Entscheidungsfragen.
17
Vgl. Bagozzi, R. P., Phillips, L. W., Organizational Theories, 1982, S. 458 f.. Vgl. Borsboom, D. et al., Latent Variables, 2003, S. 208. 19 Vgl. Bollen, K., Lennox, R., Measurement, 1991, S. 306. 20 Vgl. Coltman, T. et al., Formative Measurement Models, 2008, S. 1251. 21 Vgl. Bollen, K., Lennox, R., Measurement, 1991, S. 308. 22 Vgl. Bagozzi, R. P., Structural Models, 1981, S. 376.; Vgl. Anderson, J. C., Gerbing, D. W., Measurement Models, 1982, S. 453. 18
66
4
Empirische Untersuchung
Tab. 4.1 Fragenkatalog zur Spezifizierung des Messmodells Fragenkatalog Richtung der Kausalität 1.
Sind die Indikatoren definierende Charakteristika oder Manifestationen der latenten Variablen? (R: Manifestationen / F: definierende Charakteristika)
2.
Würden Änderungen in der Ausprägung der Indikatoren eine Veränderung der latenten Variablen verursachen? (R: nein / F: ja)
3.
Würden Änderungen in der Ausprägung der latenten Variablen eine Veränderung der Indikatoren verursachen? (R: ja / F: nein)
Austauschbarkeit der Indikatoren 4.
Haben die Indikatoren den gleichen beziehungsweise einen ähnlichen Inhalt oder beziehen sich auf ein gemeinsames Thema? (R: ja / F: nicht erforderlich)
5.
Würde die Elimination eines Indikators den konzeptionellen Inhalt der latenten Variablen verändern? (R: nein / F: möglich)
Kovarianz zwischen den Indikatoren 6.
Sind Veränderungen in der Ausprägung eines Indikators verbunden mit gleichgerichteten Veränderungen der übrigen Indikatoren? (R: ja / F: nicht erforderlich)
Nomologisches Netz der Indikatoren 7.
Haben die Indikatoren dieselben Antezedenzien und Konsequenzen? (R: ja / F: nicht erforderlich)
Quelle: Eigene Darstellung in Anlehnung an Jarvis, C. B. et al., Refelctive Models, 2003, S. 203
Jarvis et al. schlagen eine Kombination aus Fragen aufgeteilt in vier Gruppen vor, die auch innerhalb dieser Arbeit bei der Bestimmung des Messmodells Anwendung fanden. Ziel ist es, mit Unterstützung dieser Fragen ein geeignetes Messmodell bestimmen zu können.23 Antwortmöglichkeiten, die auf ein reflektives Modell hinweisen, sind mit einem ‚R‘ gekennzeichnet. Ein ‚F‘ hingegen deutet auf ein formatives Modell hin. Alle verwendeten Indikatoren wurden so formuliert, dass auch auf Basis der Entscheidungsfragen ein reflektives Messmodell für die vorliegende Arbeit zugrunde gelegt werden kann. Auch in der Marketingforschung kommen vorrangig reflektive Modelle zum Einsatz. Der Grund liegt darin, dass bei reflektiven Modellen die Indikatoren als fehlerbehaftetete Messungen der Variablen berücksichtigt werden.24 Diese reflektive 23 24
Vgl. Jarvis, C. B. et al., Reflective Models, 2003, S. 202 f. Vgl. Homburg, C., Kundennähe, 1998, S. 70.
4.2 Operationalisierung der Modellvariablen
67
Beziehung zwischen Variable und Indikator, soll auch für die in Abb. 3.8 dargestellten vermuteten Modellstruktur unterstellt werden. Fornell und Bookstein (1982) unterstützen diese Vorgehensweise, indem sie postulierten, dass in der Regel Konstrukte wie z. B. die Einstellung über reflektive Messmodelle gemessen werden.25
4.2
Operationalisierung der Modellvariablen
Eine Überprüfung der aufgestellten hypothetischen Konstrukte ist nur durch eine Operationalisierung der Modellvariablen möglich. Latente Variablen, wie z. B. die Einstellung, können nicht direkt beobachtet werden und bedürfen einer Operationalisierung. Es ist notwendig, für jede Variable ein geeignetes Messmodell zu bestimmen. Messmodelle sind formalisierte und mathematische Anweisungen, die bei der Bestimmung von latenten Variablen unterstützen. Die jeweiligen Ergebnisse der realen Beobachtungswerte werden in Form von Indikatoren, s. g. manifesten Variablen, erfasst und auf dessen Basis Aussagen über die latenten Variablen abgeleitet.26 Daher wird ein hypothetisches Konstrukt durch eine oder mehrere Indikatorvariablen beschrieben. Von einer direkten Abfrage von latenten Variablen wird in der Literatur abgeraten, da die Befragten ein unterschiedliches Verständnis aufweisen können, sodass vergleichbare Ergebnisse der Messung von mehreren Personen nicht sichergestellt werden können.27 Im ersten Schritt der Operationalisierung soll das zugrunde liegende Messmodell eingeordnet werden. Anschließend erfolgt die Formulierung der Indikatoren, aufgeteilt nach der in der aufgestellten Modellstruktur enthaltenen endogenen und exogenen Variablen. Im letzten Schritt wird die Konzeption der verwendeten Messvorschrift vorgenommen.
4.2.1
Formulierung der Messmodelle
Neben der Spezifizierung des Messmodells gilt es, geeignete Indikatoren zu identifizieren, um die nicht zu beobachtenden Variablen messbar zu machen. Dies wird im Rahmen der Strukturgleichungsmodellierung als Formulierung der Messmodelle bezeichnet. Weiber und Mühlhaus (2014) empfehlen eine intensive 25
Vgl. Fornell, C., Bookstein, F. L., Equation Models, 1982, S. 442. Vgl. Backhaus, K. et al., Analysemethoden, 2015, S. 75. 27 Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 40. 26
68
4
Empirische Untersuchung
Sichtung der bestehenden einschlägigen Literatur, da für viele Konstrukte bereits umfangreiche Messinstrumente zur Verfügung stehen.28 Innerhalb der reflektiven Messmodelle, hat sich das Konzept multipler Indikatoren durchgesetzt und findet häufig bei der Messung von komplexen sozial-wissenschaftlichen Konstrukten Anwendung.29 Peter (1979) empfiehlt, dass bei reflektiven Messmodellen mit mehr als einem hypothetischen Konstrukt, jedes Konstrukt mit mindestens zwei Indikatoren zu messen ist.30 Da die aufgestellte Modellstruktur auf Basis bestehender Modelle abgeleitet wurde, empfiehlt es sich daher auch für die vorliegende Arbeit auf potenziell bestehende Indikatoren zurückzugreifen. Im Folgenden werden die Indikatoren für die im Modell enthaltenen endogenen Variablen der ATT, BI, PU und PEOU operationalisiert. Tab. 4.2 zeigt die Indikatoren, die für die Messung der endogenen Variablen herangezogen werden, sowie dessen Quellen.
Tab. 4.2 Indikatoren der endogenen Variablen Item
Indikatoren
Quelle
Wahrgenommene Nützlichkeit (PU) – intervenierend PU1
Ich empfinde Chatbots bei meiner Arbeit als nützlich.
PU2
Der Einsatz von Chatbots verbessert meine Arbeit.
PU3
Der Einsatz von Chatbots erhöht meine Produktivität auf der Arbeit.
PU4
Der Einsatz von Chatbots erhöht meine Effektivität in meinem Job.
Davis (1989)
Wahrgenommene Benutzerfreundlichkeit (PEOU) – intervenierend PEOU1
Ich finde Chatbots bei der Arbeit einfach zu benutzen.
PEOU2
Ich finde es einfach, Chatbots bei der Arbeit dazu zu bringen, das zu tun, was ich möchte.
Davis (1989)
(Fortsetzung)
28
Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 105. Vgl. Diekmann, A., Empirische Sozialforschung, 2007, S. 201. 30 Vgl. Peter, J. P., Reliability, 1979, S. 12. 29
4.2 Operationalisierung der Modellvariablen
69
Tab. 4.2 (Fortsetzung) Item
Indikatoren
PEOU3
Die Interaktion mit Chatbots bei der Arbeit erfordert keine große geistige Anstrengung von mir.
PEOU4
Meine Interaktion mit Chatbots bei der Arbeit ist klar und verständlich.
Quelle
Verhaltensintention (BI) BI1
Vorausgesetzt, ich habe bei der Arbeit Zugang zu Chatbots, werde ich sie nutzen.
BI2
Sollte ich bei der Arbeit Zugang zu Chatbots haben, denke ich, dass ich sie nutzen werde.
Venkatesh/ Davis (2000)
Einstellung (ATT) – intervenierend ATT1
Der Einsatz von Chatbots bei der Arbeit ist eine gute Idee.
ATT2
Ich benutze gerne Chatbots bei der Arbeit.
ATT3
Der Einsatz von Chatbots bei der Arbeit wäre angenehm.
Taylor/ Todd (1995)
Quelle: Eigene Darstellung
Während die PU und die PEOU mit vier Indikatoren nach Davis (1995) gemessen werden31 , finden bei ber Messung der Variable ATT drei Indikatoren nach Taylor und Todd (1995) Berücksichtigung.32 Die Messung der BI wird mittels zwei Indikatoren nach Venkatesh und Davis (2000) vorgenommen.33 Bei den Variablen PU, PEOU und BI handelt es sich um Variablen, die bereits in den ursprünglichen TAM-Modellen Anwendung fanden (Vgl. Unterabschnitt 3.2.2).34 Deshalb wird bei diesen Variablen auf bereits etablierte Formulierungen aus der einschlägigen Literatur zurückgegriffen. Während die Variablen der PU und der PEOU jeweils von den exogenen Variablen beschrieben werden, sind diese Variablen als endogen, intervenierend zu betrachten. Intervenierende Variablen stellen 31
Vgl. Davis, F. D., Technology Acceptance Model, 1989, S. 340. Vgl. Taylor, S., Todd, P., Attitude, 1995, S. 624. 33 Vgl. Venkatesh, V., Davis, F. D., Technology Acceptance Model 2, 2000, S. 201. 34 Auf eine erneute Definition der Variablen wird an dieser Stelle verzichtet. Anstelle dessen wird auf das Unterabschnitt 3.2.2 in dieser Arbeit verwiesen. 32
70
4
Empirische Untersuchung
zugleich abhängige als auch unabhängige Variablen dar.35 Die Variable BI wird durch die Variable ATT beeinflusst und ist daher ebenfalls als endogen zu betrachten. Zusätzlich fließt die Variable ATT mit in die Modellstruktur ein und muss daher ebenfalls operationalisiert werden. Bei der Einstellung wird sowohl ein Einfluss durch die Variable PU als auch durch die Variable PEOU postuliert. Daher ist auch ATT als endogene, intervenierende Größe zu betrachten. Auch die Indikatoren dieser Variable sind Tab. 4.2 zu entnehmen. Die Variablen SN, JR, RQ und T werden für die Erklärung der Variablen PU herangezogen. Die Variablen PCSM und PI hingegen zur Erklärung der Variable PEOU. Diese Variablen sind daher als exogen zu betrachten. Tab. 4.3 zeigt die Indikatoren, die bei der Messung der exogenen Variablen herangezogen wurden. Die Messung der Variablen SN, JR, RQ erfolgt mittels zwei Indikatoren nach Venkatesh und Davis (2000).36 Für die Messung der Variablen T, PCSM und PI wurden hingegen drei Indikatoren verwendet. Während die Indiakatoren nach Chong et al. (2012) für die Messung der Variable T berücksichtigt werden,37 finden die Indikatoren nach Dabholkar und Bagozzi (2002) zur Messung der PSCM Anwendung.38 Die Messung der Variable PI erfolgt hingegen auf Basis der Arbeit von Goldsmith und Hofacker (1991).39 Tab. 4.3 Indikatoren der exogenen Variablen Item
Indikatoren
Quelle
Subjektive Norm (SN) SN1
Menschen, die mein Verhalten beeinflussen, Venkatesh/ Davis (2000) denken, dass ich Chatbots bei der Arbeit einsetzen sollte.
SN2
Menschen, die mir wichtig sind, denken, dass ich Chatbots bei der Arbeit nutzen sollte. (Fortsetzung)
35
Vgl. Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 7. Vgl. Venkatesh, V., Davis, F. D., Technology Acceptance Model 2, 2000, S. 201. 37 Vgl. Chong, A. Y.-L. et al., Consumer Decisions, 2012, S. 41. 38 Vgl. Dabholkar, P. A., Bagozzi, R. P., Consumer Traits, 2002, S. 199. 39 Vgl. Goldsmith, R. E., Hofacker, C. F., Consumer Innovativeness, 1991, S. 211 ff. 36
4.2 Operationalisierung der Modellvariablen
71
Tab. 4.3 (Fortsetzung) Item
Indikatoren
Quelle
Relevanz für Job (RJ) JR1
In meinem Beruf ist der Einsatz von Chatbots wichtig.
JR2
In meinem Beruf ist der Einsatz von Chatbots relevant.
Venkatesh/ Davis (2000)
Ergebnisqualität (EQ) EQ1
Die Qualität der Ergebnisse, die ich von Chatbots bei der Arbeit erhalte, ist hoch.
EQ2
Ich habe kein Problem mit der Qualität des Outputs von Chatbots bei der Arbeit.
Venkatesh/ Davis (2000)
Vertrauen (T) T1
Ich glaube, dass Aktionen, die über Chatbots Chong et al. (2012) getätigt werden, sicher verarbeitet werden.
T2
Ich glaube, dass die über Chatbots durchgeführten Transaktionen sicher sind.
T3
Ich bin zuversichtlich, was die Sicherheitsmaßnahmen von Chatbots angeht.
Möglichkeit zur Interaktion mit Mitarbeiter (PCSM) PCSM1
Der menschliche Kontakt macht Prozesse für mich angenehm.
PCSM2
Die persönliche Betreuung durch den Servicemitarbeiter ist für mich sehr wichtig.
PCSM3
Es stört mich, einen Chatbot zu benutzen, wenn ich stattdessen mit einem Menschen sprechen könnte.
Dabholkar/ Bagozzi (2002)
Innovationsfreudigkeit (PI) PI1
Im Allgemeinen bin ich zögerlich, wenn es darum geht, neue Anwendungen/ Technologien wie Chatbots auszuprobieren.
PI2
Wenn ich von einer neuen Anwendung/ Technologie wie Chatbots höre, würde ich nach Möglichkeiten suchen, damit zu experimentieren.
PI3
In meinem Freundeskreis bin ich normalerweise der Erste, der neue Anwendungen/Technologien wie Chatbots ausprobiert.
Quelle: Eigene Darstellung
Goldsmith/ Hofacker (1991)
72
4.2.2
4
Empirische Untersuchung
Konstruktion der Messvorschrift
Erst nach der Auswahl einer geeigneten Messvorschrift, auch Skalierung genannt, können die Einschätzungen der Befragten mit Unterstützung von Zahlenwerten abgebildet werden. Im Rahmen von Strukturgleichungsmodellierungen kommen häufig Rating-Verfahren zur Anwendung.40 Im Rahmen von Rating-Verfahren werden die Probanden gebeten, den Grad ihrer Zustimmung zu einem Indikator anzugeben. Likert-Skalen stellen die am häufigsten verwendete Rating-Skala dar, um mit mehreren Indikatoren ein hypothetisches Konstrukt zu erfassen.41 Likert-Skalen kommen häufig bei der Einstellungsbewertung zum Einsatz, in dem gemessen wird, was eine Person über sich selbst glaubt und wie sie bestimmte Aktivitäten wahrnimmt oder fühlt. Bei der Anwendung von Likert-Skalen werden die Teilnehmer gebeten, auf eine Reihe von Aussagen zu antworten. Typischerweise umfasst eine Likert-Skala dabei fünf Stufen in denen Teilnehmer die Richtung und Stärke ihrer Meinung ausdrücken können.42 Der Vorteil von ungeraden Likert-Skalen liegt darin, dass bei Unentschlossenheit den Teilnehmern eine Option geboten wird, eine neutrale Antwortmöglichkeit zu geben. Sie werden durch die Struktur der Antwortmöglichkeiten nicht dazu gezwungen, sich für eine Tendenz zu entscheiden.43 Dadurch kann der Gefahr der Verzerrung von Antworten entgegengewirkt und ein frühzeitiger Abbruch der Befragung vermieden werden.44 In gleicher Weise kann die Verwendung einer 5er-Likert Skala zu einer höheren Datenqualität führen, da die Teilnehmer keine klare Meinung äußern müssen. Krosnick et al. (2010) fanden allerdings bei der Modellierung von Fehlerstrukturen heraus, dass Teilnehmer einer Befragung dazu neigen, die Alternative zu wählen, die der neutralen mittleren Alternative am nächsten gestanden hätte.45 O’Muircheartaigh et al. (2001) erklärten hingegen, dass neutrale Antwortmöglichkeiten sowohl die Reliabilität als auch die Validität der Befragung positiv beeinflussen.46 SGMs erfordern, das metrische, d. h. mindestens intervallskalierte Skalen, vorliegen. Es wird in der Literatur empfohlen, fünfstufige Likert-Skalen zu verwenden, da diese Art der Messskalierung gezeigt hat, dass Probanden die 40
Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 115 f. Vgl. Döring, N., Bortz, J., Forschungsmethoden, 2016, S. 269. 42 Vgl. Gay, L. R., Mills, G. E., Analysis, 2019, S. 174 f. 43 Vgl. Croasmun, J. T., Ostrom, L., Likert-Type Scales, 2011, S. 20. 44 Vgl. Randall, D. M., Fernandes, M. F., Response Bias, 1991, S. 805 ff. 45 Vgl. Krosnick, J. A., Presser, S., Questionnaire Design, 2010, S. 274. 46 Vgl. O’Muircheartaigh, C. et al., Middle Alternatives, 2000, S. 222. 41
4.3 Erhebungsmethode und Beschreibung der Stichprobe
73
Antwortmöglichkeiten in annähernd gleichabständigen Stufen betrachten.47 Dies ist in Bezug auf die statistischen Analysemethoden von besonderer Bedeutung, da nur unter diesen Umständen von einem intervallskalierten, d. h. metrischen Skalenniveau, ausgegangen werden kann.48 Die Beschriftung der Skalenpunkte erfolgte gemäß der einschlägigen Literatur in einfacher und eindeutiger Formulierung.49 Jeder Skalenpunkt wurde von 1 (Stimme gar nicht zu) bis hin zu 5 (Stimme voll und ganz zu) beschriftet.50
4.3
Erhebungsmethode und Beschreibung der Stichprobe
Bevor die empirische Untersuchung erfolgen kann, bedarf es einer detaillierten Beschreibung der verwendeten Erhebungsmethode sowie einer Bewertung der Objektivität. Außerdem werden in diesem Abschnitt Angaben über die Beschaffenheit des Stichprobenumfangs gemacht. So wird ein grundlegendes Verständnis über die Datengrundlage hergestellt.
4.3.1
Datenerhebung
Bei empirischen Untersuchungen ist die Wahl der Datenerhebungsmethode von elementarer Bedeutung.51 Für die vorliegende Studie wurde ein standardisierter Fragebogen angewendet, der in Form einer Online-Befragung durchgeführt wurde. Vollstandardisierte Fragebögen kommen insbesondere in der quantitativen Forschung häufig zum Einsatz.52 Der Fragebogen ist in Anhang 3 des elektronischen Zusatzmaterials einzusehen. Um allgemeine Aussagen über den B2B-Bereich treffen zu können, ist ein großer Stichprobenumfang von Bedeutung. Auch die Literatur spricht sich in Bezug auf die später angewandten Analysemethoden, wie z. B. der EFA, für einen großen Stichprobenumfang aus.53 Aus diesem Grund wurde ein elektronischer und standardisierten Fragebogen als 47
Vgl. Döring, N., Bortz, J., Forschungsmethoden, 2016, S. 241. Vgl. Bühner, M., Fragebogenkonstruktion, 2011, S. 114. 49 Vgl. Gay, L. R., Mills, G. E., Analysis, 2019, S. 175. 50 Vgl. Döring, N., Bortz, J., Forschungsmethoden, 2016, S. 269. 51 Vgl. Homburg, C., Kundennähe, 1998, S. 78. 52 Vgl. Döring, N., Bortz, J., Forschungsmethoden, 2016, S. 398. 53 Vgl. Bühner, M., Fragebogenkonstruktion, 2011, S. 344 ff. 48
74
4
Empirische Untersuchung
Erhebungsmethode gewählt, da dieser die Möglichkeit bietet tendenziell höhere Fallzahlen zu erheben. Die Gründe liegen in einer Reihe von Vorteilen gegenüber alternativen Befragungsmethoden. Online-Befragungen ermöglichen eine schnellere sowie zeitlich und räumlich unabhängige Teilnahme.54 Außerdem kann der Zeitpunkt der Durchführung selbstständig von den Teilnehmern gewählt werden.55 Neben Vorteilen, die sich durch höhere Teilnehmerzahlen ausdrücken, bestehen weitere Gründe auf standardisierte, elektronische Fragebögen zurückzugreifen. Durch eine computergestützte Durchführung können Fehler gegenüber einer manuellen Erfassung von Daten vermieden werden. Ferner liegt ein wesentlicher Vorteil in einem geringen finanziellen Aufwand, da weniger bis gar keine Kosten für das Erstellen und Verteilen der Fragebögen anfallen.56 Neben den genannten Vorteilen, bestehen einige Nachteile, die es zu benennen gilt. Generell besteht weniger Kontrolle über die Qualität der gegebenen Antworten. Antworten können durch mangelnde Motivation oder fehlendes Erinnerungs- oder Vorstellungsvermögen voreilig gegeben werden.57 Daher ist es bei der Durchführung der Online-Befragung von besonderer Bedeutung, dass die Motivation der Mitarbeiter durch seriöses Auftreten sowie motivierende Anschreiben und Reminder sichergestellt wird.58 In der einschlägigen Literatur wird außerdem die Abhängigkeit von Computer und Internet als naheliegender Nachteil gegenüber weiteren Befragungsmethoden genannt.59 Diese können die Repräsentativität der Befragung durch das Nichterreichen der Zielgruppe gefährden.60 Da die Teilnahme an der durchgeführten Studie einen Umgang mit Computern und dem Internet voraussetzt, können allerdings negative Einflüsse auf die Repräsentativität ausgeschlossen werden. Die Fragen innerhalb des Fragebogens wurden ausschließlich in geschlossener Form gestellt, um sowohl vergleichbare Antworten der Teilnehmer zu erhalten als auch diese auswerten zu können. Bei geschlossenen Fragen besteht die Gefahr, dass Teilnehmer ihre gewünschte Antwort nicht in den vorgegebenen Aussagen wiederfinden.61 Vor diesem Hintergrund kam eine 5er-Likert-Skala zur Anwendung. 54
Vgl. Blasius, J., Brandt, M., Repräsentativität, 2009, S. 158. Vgl. Wagner, P., Hering, L., Online-Befragung, 2014, S. 662 f. 56 Vgl. Nayak, S., Narayan, G. A., Strengths of Surveys, 2019, S. 31 ff. 57 Vgl. Taddicken, M., Befragung über Computer, 2013, S. 213. 58 Vgl. Wagner, P., Hering, L., Online-Befragung, 2014, S. 663. 59 Vgl. Evans, J. R., Mathur, A., Online Surveys, 2005, S. 201. 60 Vgl. Wagner, P., Hering, L., Online-Befragung, 2014, S. 663. 61 Vgl. Porst, R., Fragebogen, 2014, S. 56. 55
4.3 Erhebungsmethode und Beschreibung der Stichprobe
75
Um ein einheitliches Verständnis zu gewährleisten, wurde zu Beginn der Befragung mittels einer Filterfrage abgefragt, ob dem jeweiligen Teilnehmer bekannt ist, was ein Chatbot ist und wofür diese Einsatz finden. Bei Beantwortung der Frage mit Nein, wurden dem Teilnehmer weitere Informationen zur Verfügung gestellt, sowie beispielhaft ein Chatbot in einer Abbildung gezeigt. Da eine Beurteilung der Akzeptanz über die Einstellungsebene zu erfolgen ist, wurde zudem eine Frage über die bisherige Nutzungserfahrung im beruflichen Umfeld ergänzt, sodass ein einheitlicher Wissensstand der Teilnehmer, sowie eine vergleichbare Datenbasis gewährleistet werden konnte. Die Zusammenstellung des Fragebogens erfolgte über die OpenSource Software SoSci Survey. Der Grund lag in der Fülle an Funktionen, der einfachen Bedienung und der großen Auswahl an Designs. Außerdem verfügt die Plattform über PreTest-Funktionen und besitzt ein hohes Datenschutz-Niveau.62 Potenzielle Teilnehmer wurden über unterschiedliche Wege angeschrieben. Die Umfrage wurde sowohl an Studierende der Hochschule für Ökonomie und Management verschickt, sowie auf unterschiedlichen Online-Plattformen, wie Facebook und LinkedIn, geteilt. Die geschlossenen Fragestellungen erfolgten auf Basis bestehenden Forschungsarbeiten. Trotzdem empfiehlt es sich vor der Hauptuntersuchung einen Pretest durchzuführen.63 Ziel ist es herauszufinden, ob eine verständliche Formulierung der Fragen stattgefunden hat, um die Motivation bei der Beantwortung sicherzustellen. Der Pretest wurde über die Plattform SoSci Survey an 15 Teilnehmer verteilt, sodass eine Erfassung und Überprüfung möglich waren. Der Pretest kam zu dem Ergebnis, dass der Fragebogen einem verständlichen Aufbau folgte und es keinen Ansatz für die Umformulierung der Fragen vorlagen. Durch die Gestaltung des Fragebogens sollte eine Überprüfung des Gütekriterium der Objektivität an dieser Stelle stattfinden.64 Die Objektivität eines Messmodells gibt an, inwieweit ein Ergebnis unabhängig von der Person ist und wird anhand von drei Elementen geprüft: der Durchführungs-, Auswertungsund Interpretationsobjektivität.65 Das Gütekriterium der Durchführungsobjektivität ist durch die Verwendung eines vollstandardisierten Fragebogens als erfüllt zu betrachten. Die Einführung in das Thema zu Beginn des Fragebogens ebenso 62
Vgl. SoSci, Funktionen, o. J., o. S. Vgl. Porst, R., Fragebogen, 2014, S. 190. 64 Neben der Objektivität sind die Gütekriterien Reliabilität und Validität zu überprüfen. Eine Überprüfung wird in Abschnitt 4.5, bei der Betrachtung der einzelnen Messmodelle, vorgenommen. 65 Vgl. Döring, N., Bortz, J., Forschungsmethoden, 2016, S. 442. 63
76
4
Empirische Untersuchung
wie die Instruktionen zu Beginn der Fragen lassen keinen Spielraum für subjektive Abweichungen. Die Auswertungsobjektivität kann durch eine sorgfältige Dokumentation und Aufbereitung der Daten, sowie vollständig ausgefüllten Fragebögen als erfüllt betrachtet werden.66 Die Interpretationsobjektivität findet bei quantitativen Auswertungen oftmals keine Anwendung, da die Interpretation der Ergebnisse der subjektiven Einschätzung des Autors unterliegen kann.67
4.3.2
Stichprobenbeschreibung
Um eine ausreichend große Repräsentativität der empirischen Untersuchung und um Rückschlüsse auf die Grundgesamtheit ziehen zu können, wurde ein besonderer Fokus auf die Stichprobe gelegt. Die Stichprobenziehung erfolgte im Rahmen einer Teilerhebung mittels einer Zufallsstichprobe.68 Ziel ist es über den vollstandardisierten, elektronischen Fragebogen Selbstauskünfte von Betroffenen zu erhalten. Der Fragebogen richtet sich ausschließlich an potenzielle Nutzer von Chatbots, die innerhalb von B2B-Unternehmen tätig sind und über einen Internetzugang verfügen. Die Fragebögen sollen unabhängig voneinander und jeder Person einzeln ausgefüllt werden, da die Einschätzung des jeweiligen Individuums von Bedeutung ist.69 Da sich die Forschung über die Akzeptanz von Chatbots im B2B-Bereich noch in ihren Anfängen befindet und nur wenige Studien in diesem Forschungsfeld mit B2B-Bezug bestehen (Vgl. Anhang 1, elektronisches Zusatzmaterial), wurden keine weiteren Einschränkungen in Bezug auf die Grundgesamtheit vorgenommen. Daher konnten potenzielle Teilnehmer unabhängig von ihrer Funktion, der Branche und Position an der Online-Umfrage teilnehmen. Um eine zielgruppengerechte Teilnahme zu gewährleisten und Rückschlüsse auf die Grundgesamtheit ziehen zu können, wurde sowohl im Anschreiben als auch in der Einleitung der Umfrage selbst explizit darauf hingewiesen, dass eine Teilnahme nur bei einer Tätigkeit im B2B-Umfeld möglich ist. Ziel der Studie ist es nicht die Akzeptanz eines speziellen Chatbots zu bewerten, sondern eine generelle Einschätzung über die Akzeptanz von Chatbots in der externen Kommunikation mit Kunden, Lieferanten oder Dienstleistern, zu erhalten. Daher konnten die Befragten die Situation bzw. den Grund für den Einsatz von Chatbots frei wählen. 66
Vgl. Krebs, D., Menold, N., Gütekriterien, 2014, S. 427. Vgl. ebd., S. 426. 68 Vgl. Döring, N., Bortz, J., Forschungsmethoden, 2016, S. 294 ff. 69 Vgl. ebd., S. 400. 67
4.3 Erhebungsmethode und Beschreibung der Stichprobe
77
Der Fragebogen wurde über einen Zeitraum von ca. drei Wochen, vom 01.04.2022 bis zum 25.04.2022, auf unterschiedlichen Plattformen bereitgestellt. Bei der Stichprobe handelt es sich um eine zufällig ausgewählte Stichprobe. Insgesamt nahmen 201 Personen an der Umfrage teil, wovon 151 Personen die Umfrage abschlossen. Die Beendigungsquote liegt somit bei 75,1 % und ist als akzeptabel anzusehen. Die Teilnehmer wurden zu Beginn der Umfrage gebeten ihren bisherigen Kenntnisstand in Bezug auf Chatbots mitzuteilen. Die Ergebnisse sind Abb. 4.2 zu entnehmen. Privates Umfeld
Berufliches Umfeld 7%
11% 21%
18%
71% 72%
Ja
Nein
Nicht bewusst
n = 151
Abb. 4.2 Relative Nutzung von Chatbots im privaten und beruflichen Umfeld. (Quelle: Eigene Darstellung)
Die Ergebnisse zeigen, dass 71 % der Teilnehmer angaben einen Chatbot bereits in ihrem privaten Umfeld genutzt zu haben, wobei weitere 11 % sich nicht sicher waren, ob eine Nutzung schon erfolgt ist. 18 % der Teilnehmer gaben an, noch keinen Chatbot genutzt zu haben. Neben der Nutzung im privaten Umfeld wurde in Anbetracht der vorliegenden Studien zusätzlich die Nutzung im Beruf erfragt. Lediglich 7 % der Teilnehmer gaben an einen Chatbot im beruflichen Kontext genutzt zu haben, während 72 % der Teilnehmer noch keinen Kontakt, bzw. 21 % noch keinen bewussten Kontakt zu Chatbots hatten. Da eine Messung des Konstrukts der Akzeptanz über die Einstellungsebene definiert wurde, fand in der weiteren Auswertung nur eine Berücksichtigung der Fragebögen statt, bei
78
4
Empirische Untersuchung
denen die Teilnehmer beruflich noch keinen Kontakt zu Chatbots hatten. Somit kamen 140 gültige Teilnahmen für die weitere Auswertung in Frage. Diese wurden vor Beginn der empirischen Auswertung, mit Hilfe der Mahalanobis Distanz, um 21 Ausreißer bereinigt. Somit konnten 119 maßgebende Fälle für die Analyse herangezogen werden. Die folgende Tab. 4.4 zeigt die absoluten und relativen Häufigkeiten der demographischen Daten der Teilnehmer. Tab. 4.4 Soziodemographische Merkmale der Teilnehmer Demographische Daten der Stichprobe
Absolut
Prozent
n
119
100 %
Männlich
65
55 %
Weiblich
54
45 %
0
0%
Geschlecht
Divers Alter
Bildung
24 Jahre oder jünger
8
7%
25 bis 39 Jahre
63
53 %
40 bis 54 Jahre
35
29 %
55 bis 64 Jahre
13
11 %
65 oder älter
0
0%
Keinen beruflichen Ausbildungsabschluss
2
2%
Beruflich-betriebl. Anlernzeit mit Abschlusszeugnis
0
0%
Abgeschlossene gewerbl./ landwirtschaftliche Lehre
1
1%
17
14 %
Berufsfachschulabschluss/ Fachschulabschluss
1
1%
Meister-, Techniker- oder Fachschulabschluss
4
3%
Fachhochschulabschluss
25
21 %
Hochschulabschluss
Abgeschlossene kaufmännische Lehre
60
50 %
Promotion
5
4%
Keine Angabe
4
3%
Quelle: Eigene Darstellung
Wie Tab. 4.4 zu entnehmen ist, ist der Anteil zwischen männlichen und weiblichen Teilnehmern mit 55 % und 45 % nahezu ausgeglichen. Mit ca. 53 % liegt über die Hälfte des Alters der Probanden zwischen 25 – 39 Jahre. Weitere 29 % weisen ein Alter von 40 – 54 Jahre auf, sodass in Summe 82 % der Befragten zwischen 25 und 54 Jahren alt sind. Lediglich 7 % sind jünger als 24
4.4 Zeichnung des Strukturmodells
79
Jahre und 13 % sind älter als 55. Neben dem Geschlecht und dem Alter wurde als weiteres soziodemographisches Merkmal der Bildungsstand der Teilnehmer abgefragt. Mit 50 % weist der größte Anteil der Probanden einen Hochschulabschluss und weitere 21 % einen Fachhochschulabschluss auf. 17 % gaben als höchsten Bildungsabschluss eine abgeschlossene kaufmännische Lehre an.
4.4
Zeichnung des Strukturmodells
Das in Abschnitt 3.4 aufgestellte Modell stellt noch kein Strukturmodell im eigentlichen Sinne dar, da innerhalb dieses Modells nur Determinanten enthalten sind. Daher gilt es, das aufgestellte Modell auf Basis der in der Forschung basierenden Konventionen in ein Strukturmodell zu überführen. Ein Pfaddiagramms unterstützt die theoretischen Vorüberlegungen. Ein Strukturgleichungsmodell besteht aus dem eigentlichen Strukturmodell und aus den jeweiligen Messmodellen der exogenen und endogenen Variablen, die bereits in Unterabschnitt 4.2.2 bei der Formulierung der Messmodelle vorgestellt wurden. Abb. 4.3 zeigt das für die vorliegende Arbeit aufgestellte Strukturmodell, das unter Berücksichtigung der Empfehlungen zur Erstellung von Pfaddiagrammen aufgestellt wurde.70 In der unten aufgeführten Abb. 4.3 befindet sich mittig das Strukturmodell, während linksseitig das Messmodell der exogenen Variablen und rechtsseitig das Messmodell der endogenen Messvariablen zu sehen ist.71 Eine Unterscheidung zwischen endogenen und exogenen Variablen erfolgt im Strukturmodell anhand von griechischen Kleinbuchstaben. Exogene Variablen werden mit Ksi (ξ) abgekürzt und endogene Variablen mit Eta (η).72 Die jeweiligen latenten Variablen sind durch Ellipsen und die Messfehlervariablen durch Kreise gekennzeichnet. Eine Darstellung der direkt zu beobachtenden Variablen (X und Y) erfolgt in Form von Kästchen. Kausale Beziehungen werden durch Pfeile verdeutlicht.73 Die Zuordnungen zwischen den Variablen des aufgestellten Modells und der Bestandteile des Strukturmodells sind in Anhang 3 des elektronischen Zusatzmaterial einzusehen.
70
Für einen detailierten Überblick über die gängigsten Konventionen wird auf das Werk von Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 190 verwiesen. 71 Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 45. 72 Vgl. Wentura, D., Pospeschill, M., Multivariate Datenanalyse, 2015, S. 201. 73 Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 45.
80
Θδ11
4
X1
Λx11
X2
Λx22
Empirische Untersuchung
γ12
ξ1
Θε10 γ13
Θδ22
Θδ33
X3
Λx33
ξ2
γ31
Θδ44
X4
X5
Λx55
Θδ66
X6
Λx66
ζ1
η1
β1
η3
ξ4
ξ5
ξ6
ζ3
β2
ζ4
γ41
β3 γ51
Θδ55
γ22
Λy11
ξ3
φ Λx44
Y1 γ21
η2
β4
Λy33
η4 Λy44
Y3
Y4
Θε30
Θε40
Λy22 γ61
ζ2
Y2
Θε20
γ71
Abb. 4.3 Überführung des Modells in ein reflektives Messmodell. (Quelle: Eigene Darstellung)
Bei Strukturgleichungsmodellen handelt es sich um Mehrgleichungssysteme, die nur gelöst werden können, wenn die Anzahl der vorliegenden Gleichungen mindestens der Anzahl der zu schätzenden Parameter entspricht.74 Es gilt dann als lösbar, wenn die Zahl der Freiheitsgrade größer oder auch gleich null ist. Die Anzahl der Freiheitsgrade können AMOS© direkt entnommen werden: somit stehen 300 Varianzen und Kovarianzen 65 zu schätzenden Paramtern gegenüber, woraus sich 235 Freiheitsgraden ergeben (Vgl. Anhang 4, elektronisches Zusatzmaterial). Daher ist das aufgestellte Strukturmodell als lösbar zu definieren, sodass die Güteprüfung der einzelnen Messmodelle erfolgen kann.
4.5
Güteprüfung der Messmodelle
Ziel der SGA ist es die theoretischen Zusammenhänge von latenten Variablen mithilfe von theoretischen Konstrukten innerhalb des Strukturmodells zu prüfen. Nun gilt es, die vorab getroffenen Zuordnungen zwischen den nicht zu beobachtenden 74
Vgl. Wentura, D., Pospeschill, M., Multivariate Datenanalyse, 2015, S. 202.
4.5 Güteprüfung der Messmodelle
81
Größen zu überprüfen, da die Güte der Parameterschätzungen maßgeblich von der Güte der Messmodelle bestimmt wird. Daher liegt der Fokus auf der Güteprüfung der aufgestellten Messmodelle.75 Abb. 4.4 zeigt die nach Weiber und Mühlhaus (2014) empfohlene Vorgehensweise bei der Überprüfung der Messmodelle, die auch bei der vorliegenden Arbeit Anwendung findet.
4.5.1 Reliabilitätsprüfung Gütekriterien der ersten Generation Prüfung auf Eindimensionalität der Itemstruktur (EFA) - Anhang 4 Prüfung der Indikator- und Konstruktreliabilität (Interne Konsistenz) – Anhang 5 Gütekriterien der zweiten Generation – Lokale Gütemaße Prüfung auf Multinormalverteilung - Anhang 6 EFA über alle Konstrukte - Anhang 7 Reliabilitätsprüfung auf Basis der KFA – Anhang 8
4.5.2 Validitätsprüfung Gütekriterien der zweiten Generation – Lokale Gütemaße Inhaltsvalidität Konstruktvalidität – Anhang 9 – 10 4.5.3 Messmodellprüfung Globale Gütemaße – Anhang 11 Inferenzstatistisch Deskriptiv Inkrementell 4.5.4 Zusammenfassende Betrachtung
Abb. 4.4 Vorgehensweise bei der Bewertung der Messmodelle. (Quelle: Eigene Darstellung in Anlehnung an Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 131 ff)
Um die Qualität der Messmodelle der latenten Variablen beurteilen zu können, werden diese hinsichtlich ihrer Reliabilität und Validität überprüft.76 Obwohl auf bereits erprobte Messmodelle zurückgegriffen wird, sollten die Messmodelle aufgrund des Bezuges auf Chatbots einer entsprechenden Prüfung unterzogen werden.77 Die Überprüfung der Güte der Messmodelle erfolgt innerhalb von 75
Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 128. Vgl. Carmines, E. G., Zeller, R. A., Reliability and Validity, 1979, S. 11 f. 77 Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 128. 76
82
4
Empirische Untersuchung
drei Stufen. Es erfolgt eine Betrachtung der Reliabilität, der Validität, sowie eine Betrachtung auf Messmodellebene. In Unterabschnitt 4.5.1 erfolgt eine Erläuterung der Gütekriterien der Reliabilität. Analog zu der vorgeschlagenen Vorgehensweise nach Fornell (1982) findet bei der Reliabilitätsprüfung der reflektiven Messmodelle eine differenzierte Betrachtung zwischen Kriterien der ersten und der zweiten Generation statt.78 Zunächst erfolgt eine Betrachtung der Gütekriterien der ersten Generation indem sowohl eine Prüfung auf Eindimensionalität der einzelnen Messmodelle als auch die Prüfung auf interne Konsistenz vorgenommen wird. Bevor die Gütekriterien der zweiten Generation Anwendung finden, findet aufbauend auf der Empfehlung von Weiber und Mühlhaus (2014) eine Überprüfung auf Multinormalverteilung und eine EFA über alle Konstrukte statt. Die Reliabilitätsprüfung endet mit einer Betrachtung der Gütekriterien der zweiten Generation, auch lokale Gütemaße genannt, die auf Basis einer KFA mittels AMOS© Graphics erzeugt werden. Die Ergebnisse werden in den Anhängen 5 bis 9 dargestellt. Die Reliabilität wird als eine notwendige, nicht aber als eine hinreichende Bedingung für die Validität eines Messinstruments gesehen.79 Ein valides Messinstrument ist „immer auch reliabel [..], während eine reliable Messung nicht […] valide sein muss“80 . Daher findet anschließend in Unterabschnitt 4.5.2 eine Darstellung der Gütekriterien statt, die bei der Bewertung der Validität innerhalb dieser Arbeit herangezogen werden. Die Bewertung erfolgt dabei auf Basis der lokalen Gütemaße. Es werden die Validitätsarten Inhalts- und Konstruktvalidität beschrieben und Ansätze zur Bewertung vorgestellt. Auf eine Überprüfung der Kriteriumsvalidität wurde im Rahmen dieser Messung verzichtet, da kein Außenkriterium bei der Bewertung heranziehbar war.81 Die detaillierten Ergebnisse sind Anhang 10 und 11 des elektronischen Zusatzmaterials zu entnehmen. Unterabschnitt 4.5.3 nimmt eine Beschreibung der globalen Gütemaße vor. Dabei werden die inferenzstatistischen, deskriptiven und inkrementellen Bewertungskriterien sowie -grundlagen erläutert. Eine detaillierte Beschreibung der Ergebnisse ist in Anhang 12 des elektronischen Zusatzmaterials zu finden. Eine abschließende Bewertung aller Messmodelle erfolgt in Unterabschnitt 4.5.4. Um die Übersichtlichkeit innerhalb der Arbeit und eine Mehrfachnennung
78
Vgl. Churchill, G. A., Developing Marketing Constructs, 1979, S. 64 ff. Vgl. Peter, J. P., Reliability, 1979, S. 6. 80 Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 129. 81 Vgl. ebd., S. 138. 79
4.5 Güteprüfung der Messmodelle
83
der einzelnen Faktoren zu vermeiden, werden nach den in den Unterabschnitten 4.5.1 bis 4.5.3 vorgestellten Bewertungskriterien und Schwellenwerte, die Ergebnisse zusammengefasst und bewertet.
4.5.1
Reliabilitätsprüfung
Im Rahmen der Reliabilitätsprüfung wird sowohl auf Kriterien der ersten Generation als auch der zweiten Generation zurückgegriffen. Die Gütekriterien der ersten Generation basieren auf Ansätzen aus der Psychometrie und greifen im Leitgedanken auf Korrelationsbetrachtungen zurück.82 Die Kriterien der zweiten Generation basieren auf der KFA und gelten als leistungsstärker als die ursprünglichen Gütekriterien der ersten Generation.83 Die Reliabilität einer Messung gibt nach Peter (1979) an, inwieweit eine Messung frei von Zufallsfehlern ist und bei wiederholter Durchführung die gleichen Resultate erzielt.84 Als Zufallsfehler werden variable Fehler bezeichnet, die jede Messung, ohne erkennbare Systematik und in unterschiedlicher Stärke, beeinflussen können.85 Indikatoren stellen also dann eine reliable Messung der dazugehörigen Faktoren dar, wenn ein „wesentlicher Anteil ihrer Varianz durch die Assoziation mit dem Faktor erklärt wird“86 . Innerhalb dieser Arbeit kommen die explorative Faktorenanalyse (EFA), die Interne Konsistenz und eine konfirmatorische Faktorenanalyse (KFA) zum Einsatz. Tab. 4.5 zeigt zunächst die Bewertungskriterien der EFA sowie die zugrundliegenden Richtwerte und Betrachtungs-ebenen, die für die vorliegende Arbeit als Grundlage dienen und im Folgenden beschrieben werden. Tab. 4.5 Reliabilitätskriterien auf Basis der EFA
Kriterien
Richtwert
Ebene
Faktorladungen (FL)
>0,5
Konstrukt
Kommunalitäten (KOM)
>0,5
Konstrukt
KMO-Kriterium
>0,6
Konstrukt
Quelle: Eigene Darstellung
82
Vgl. Cronbach, L. J., Test Reliability, 1947, S. 1 ff. Vgl. Homburg, C., Giering, A., Operationalisierung, 1996, S. 8. 84 Vgl. Peter, J. P., Reliability, 1979, S. 6. 85 Vgl. Churchill, G. A., Developing Marketing Constructs, 1979, S. 65. 86 Vgl. Peter, J. P., Reliability, 1979, S. 6 ff. 83
84
4
Empirische Untersuchung
Mit Hilfe der EFA wird ein Set von Indikatoren auf die zugrunde liegende Faktorenstruktur überprüft. Sie zählt zu den Gütekriterien der ersten Generation. Im Rahmen der Strukturgleichungsanalyse ist das Vorgehen als quasi-explorativ zu betrachten, da diejenigen Indikatoren eliminiert werden sollen, die entgegen der Vermutung nicht auf einen Faktor bzw. eine latente Variable laden, d. h. nicht aureichend hoch korrelieren. Daher wird mit der Unterstützung der EFA eine Ein-Faktorstruktur überprüft, sodass die Eindimensionalität der Faktoren bestätigt werden kann.87 Eine EFA ist, analog zu der Annahme innerhalb des Konzepts multipler Indikatoren, nur dann geeignet, wenn zwischen den Variablen und Indikatoren Korrelationen nachgewiesen werden können. Wesentliche Prüfkriterien stellen die Measure of Sampling Adequacy-Werte (MSA-Werte), die Kommunalitäten und die Faktorladungen dar. Werte, die kleiner als 0,5 sind, sind aus der EFA auszuschließen, da nur ein geringer Varianzanteil erklärt werden kann. Außerdem werden das Kaiser-Meyer-Olkin-Kriterium (KMO-Kriterium) und der Bartlett-Test genutzt, um zu prüfen, in welchem Umfang die Variablen zusammengehören.88 Während das KMO-Kriterium einen Wert von 0,6 nicht unterschreiten sollte89 , sollte der Bartlett-Test nach Backhaus et al. (2016) mit p < 0,5 zu einer Ablehnung der Nullhypothese führen, d. h. dass Variablen aus einer nicht-korrelierenden Grundgesamtheit stammen.90 Eindimensionale Messmodelle stellen die Grundvoraussetzung für die weitere sinnvolle Reliabilitätsprüfung dar und sollte für jedes Messmodell einzeln erfolgen.91 Die Prüfung auf Eindimensionalität findet auf Basis der vorgeschlagenen Vorgehensweise nach Backhaus et al. (2016) pro Messmodell statt. Als Extraktionsmethode findet die Hauptachsenanalyse mit schiefwinkligem Rotationsverfahren ‚Promax‘ Anwendung. Die detaillierten Ergebnisse dieses Analyseschrittes sind in Anhang 5 des elektronischen Zusatzmaterials einzusehen. Weiber und Mühlhaus (2014) empfehlen nach Prüfung der Eindimensionalität eine Prüfung der internen Konsistenz. Die interne Konsistenz findet bei Messungen satt, bei denen die Variablen mit mehreren Indikatoren gemessen werden. Sie beschreibt, inwieweit die reflektiven Indikatoren einer Variablen den gleichen Sachverhalt messen. Die Prüfung erfolgt vorrangig anhand der Kriterien Cronbachs Alpha (CA), Inter-Item-Korrelation (IIK), Item-to-Total-Korrelation (ITK)
87
Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 132. Vgl. ebd. 89 Vgl. Kaiser, H. F., Rice, J., Psychological Measurement, 1974, S. 111. 90 Vgl. Backhaus, K. et al., Multivariate Analysemethoden, 2016. 91 Vgl. Hildebrandt, L., Temme, D., Validierung, o. J., S. 624. 88
4.5 Güteprüfung der Messmodelle
85
und der Korrigierten ITK (KITK).92 Die Bewertungskriterien, die Schwellenwerte und die Betrachtungsebene sind Tab. 4.6 zu entnehmen. Tab. 4.6 Reliabilitätskriterien der internen Konsistenz
Kriterien
Richtwert Ebene
Cronbachs Alpha (CA)
>0,7
Indikator
Inter-Item-Korrelation (IIK)
>0,3
Konstrukt
Korrigierte Item-to-Total (KIITK) >0,5
Indikator
Quelle: Eigene Darstellung
Das CA kann einen Wertebereich von null bis eins annehmen. Die Reliabilität wird als hoch betrachtet, je näher der Wert an eins grenzt.93 Die zugrunde zu liegenden Schwellenwerte gelten in der Literatur als umstritten. Nach dem Vorschlag von Nunnally (1978) soll für die vorliegende Arbeit ein Richtwert in Hohe von 0,7 festgelegt werden.94 Das dritte Kriterium zur Überprüfung der Reliabilität stellt die ITK dar. Diese sollte einen Wert von 0,5 nicht unterschreiten. Sollte ein Indikator ein zu niedriges Cronbachs Alpha aufweisen, so kann durch die Eliminierung des Indikators mit der geringsten ITK die Reliabilität gesteigert werden.95 Zusätzlich sollte, insbesondere bei kleinen Indikatorzahlen, die KITK hinzugezogen werden. Auch hier sollte einen Schwellenwert von 0,5 nicht unterschritten werden.96 Die IIK beschreibt die durchschnittliche Korrelation aller Indikatoren, die für die Messung eines Konstrukts herangezogen werden. Der Richtwert beträgt > 0,3.97 Sollten Indikatoren als nicht reliabel gelten, gilt zu prüfen, ob diese Indikatoren zu eliminieren sind. Die Prüfung auf interne Konsistenz sollte mit einem reduzierten Set an Indikatoren wiederholt werden, bis alle Messmodelle als geeignet eingestuft werden können.98 Die detaillierten Ergebnisse der Bewertung der internen Konsistenz können Anhang 6 des elektronischen Zusatzmaterials entnommen werden. Die Gütekriterien der ersten Generation gelten in der Literatur nur bedingt als geeignet für die Messung der Reliabilität,99 da partiell sehr restriktive Annahmen 92
Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 136. Vgl. Homburg, C., Giering, A., Operationalisierung, 1996, S. 8. 94 Vgl. Nunnally, J. C., Psychometric Theory, 1978, S. 245. 95 Vgl. Homburg, C., Giering, A., Operationalisierung, 1996, S. 7 f. 96 Vgl. Nunnally, J. C., Psychometric Theory, 1978, S. 263. 97 Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 138. 98 Vgl. Churchill, G. A., Developing Marketing Constructs, 1979, S. 69. 99 Vgl. Bagozzi, R. P., Phillips, L. W., Organizational Theories, 1982, S. 459 ff. 93
86
4
Empirische Untersuchung
zugrunde gelegt werden.100 Aus diesem Grund findet eine zusätzliche Betrachtung der Gütekriterien der zweiten Generation statt. Diese basieren auf einer KFA und bedürfen sachlogisch fundierten Überlegungen. Sie offenbaren die Möglichkeit, entgegen der EFA, Messfehlervarianzen abzuschätzen und ermöglichen Rückschlüsse auf die Diskriminanz-validität. Die mit Hilfe der KFA ermittelten Gütekriterien, die auch unter Gütekriterien der zweiten Generation bekannt sind, werden dazu genutzt, um Rückschlüsse auf die Reliabilität von Konstrukten zuziehen.101 Bevor die KFA durchgeführt werden kann, sollte eine EFA über alle Konstrukte erfolgen, um zu kontrollieren, ob die einzelnen Indikatoren auch die unterstellten Konstrukte widerspiegeln und entsprechend gruppiert werden können.102 Die Ergebnisse sind Anhang 8 des elektronischen Zusatzmaterials zu entnehmen. Die KFA führt eine Schätzung der Parameter des Messmodells durch. Bevor die Gütekriterien der zweiten Generation Anwendung finden, empfehlen Weiber und Mühlhaus (2014) zusätzlich eine Prüfung auf Multinormalverteilung durchzuführen, da auf Basis dessen die Wahl der Schätzmethode abzuleiten ist. Die Maximum-Liklihood-Methode stellt die häufigste verwendete Methode zur Parameterschätzung dar, setzt allerdings eine Multinormalverteilung der erhobenen Daten voraus.103 Die Prüfung auf Multinormalverteilung findet gemäß der vorgeschlagenen Vorgehensweise nach Weiber und Mühlhaus (2014), auf Basis der Schiefe, Kurtosis und des Mardia´s Koeffizienten der multinormalen Wölbung statt. Obgleich eine weitestgehend normale Verteilung auf Indikatorebene festgestellt wurde, konnte auf Basis des Mardias Test von keiner multivariaten Normalverteilung vorbehaltlos ausgegangen werden. Der Mardia´s Wölbungskoeffizient weichtmit 8,644 von dem geforderten Richtwert von 2,57 ab. Die detaillierten Ergebnisse sind Anhang 7 des elektronischen Zusatzmaterials zu entnehmen. Trotzdem soll die Maximum-Likelihood-Methode innerhalb dieser Arbeit Anwendung finden.104 Sie gilt als relativ robust gegenüber Verletzungen der Normalverteilungsannahme.105 Diese Methode wird auf Basis der
100
Vgl. Hildebrandt, L., Temme, D., Validierung, o. J., S. 624. Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 143. 102 Vgl. ebd., S. 144. 103 Vgl. Backhaus, K. et al., Analysemethoden, 2015, S. 136 ff. 104 Für die weitere Argumentation in Bezug auf die Wahl der Schätzmethode ist Anhang 7 des elektronischen Zusatzmaterials einzusehen. 105 Vgl. Wentura, D., Pospeschill, M., Multivariate Datenanalyse, 2015, S. 215. 101
4.5 Güteprüfung der Messmodelle
87
Empfehlung von Bühler (2011) bei der Parameterschätzung um den Bollen-StineBootstrap, ergänzt.106 Mittels der KFA können die Reliabilitätskriterien Indikatorrealiabilität (IR), Faktorreliabilität (FR) und die durchschnittliche je Faktor extrahierte Varianz (DEV) berechnet werden. Die Kriterien sind auch als lokale Gütekriterien bekannt und sind in Tab. 4.7 einzusehen. Tab. 4.7 Lokale Gütekriterien Kriterien
Richtwert
Ebene
Indikatorreliabilität (IR)
>0,4
Indikator
Faktorreliabilität (FR)
>0,6
Konstrukt
Durchschnittliche extrahierte Varianz (DEV)
>0,5
Konstrukt
Quelle: Eigene Darstellung
Die Indikatorreliabilität gibt an, welcher Anteil der Varianz der einzelnen Indikatoren durch die jeweiligen Faktoren erklärt werden kann und ist damit ein Bestimmtheitsmaß für den Indikator. AMOS© gibt die Indikatorreliabilität unter Squared Multiple Correlation direkt aus.107 Sie sollte den Wert 0,4 nicht unterschreiten, um Instabilitäten in der Modellschätzung zu vermeiden.108 Die Faktorreliabilität ist der Indikatorreliabilität auf Konstruktebene gleichzusetzen und gibt den Grad der Abdeckung eines Faktors durch die jeweiligen Indikatoren an. Der Schwellenwert von 0,6 sollte nicht unterschritten werden.109 Die DEV hingegen beschreibt die Streuung des latenten Konstrukts. Diese wird über alle Indikatoren durchschnittlich erklärt und sollte keine Werte > 0,5 annehmen.110 Die Faktorreliabilität und die DEV werden von AMOS© nicht direkt ausgegeben und bedürfen einer manuellen Berechnung. Die Berechnungen der Gütekriterien und die detaillierten Ergebnisse der KFA sind Anhang 9 des elektronischen Zusatzmaterials zu entnehmen.
106
Vgl. Bühner, M., Fragebogenkonstruktion, 2011, S. 432. Vgl. Bagozzi, R. P., Yi, Y., Evaluation, 1988, S. 80. 108 Vgl. Homburg, C., Giering, A., Operationalisierung, 1996, S. 13. 109 Vgl. Bagozzi, R. P., Yi, Y., Evaluation, 1988, S. 82. 110 Vgl. Fornell, C., Larcker, D. F., Measurement Error, 1981, S. 45 ff. 107
88
4.5.2
4
Empirische Untersuchung
Validitätsprüfung
Die vorangegangen Reliabilitätsprüfungen der Messmodelle stellen eine notwendige Bedingung dar, um eine Prüfung auf Validität durchführen zu können. Ein Messinstrument kann als valide bezeichnet werden, wenn ein Messinstrument das misst, was gemessen werden soll.111 Der Validität einer Messung sollte besondere Beachtung geschenkt werden, da sie als ein zusammenfassendes Maß für die Güte der Messung gilt und durch systematische Messfehler beeinflusst werden kann.112 Systematische Fehler treten im Gegensatz zu Zufallsfehlern, bei wiederholter Durchführung der Messung, unabhängig von den zufälligen Einflussgrößen, in gleicher Höhe auf.113 Vorab ist zu nennen, dass die Validität von latenten Variablen nicht direkt zu messen ist. Vielmehr kann eine Schlussfolgerung auf Basis der lokalen Gütekriterien erfolgen.114 Bei der Bewertung können die Validitätsarten Inhalts- und die Konstruktvalidität als Hilfskriterien herangezogen werden. Unter Inhaltsvalidität wird der Grad verstanden, indem die jeweiligen Indikatoren den inhaltlich-semantischen Bereich eines Konstrukts abdecken. Darüber hinaus sollen die Indikatoren alle Facetten des Konstrukts abbilden.115 Um eine inhaltlich valide Messung zu erzielen, bedarf es demzufolge einer fundierten Konzeptualisierung der Konstrukte.116 Bereits bei der Herleitung der aufgestellten Modellstruktur erfolgte eine sorgfältige Konzeptualisierung und eine sachlogische Ableitung der Bestandteile des Akzeptanzmodells. Jedes Konstrukt wird über mehr als einen Indikator gemessen und es bestehen zwischen diesen ausreichend hohe Korrelationen, die ebenfalls auf Inhaltsvalidität hinweisen. Die Durchführung eines Pretests konnte zudem auf Inhaltsvalidität schließen lassen. Die Messung der Konstruktvalidität kann in Form der nomologischen Validität, der Konvergenzvalidität und der Diskriminanzvalidität erfolgen. Tab. 4.8 gibt eine Übersicht über die Bewertungskriterien der Ausprägungen der Konstruktvalidität und zeigt die für diese Arbeit verwendeten Richtwerte.
111
Vgl. Churchill, G. A., Developing Marketing Constructs, 1979, S. 65.; Peter, J. P., 1979, S. 6 112 Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 156. 113 Vgl. Peter, J. P., Reliability, 1979, S. 6. 114 Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 137. 115 Vgl. Homburg, C., Giering, A., Operationalisierung, 1996, S. 7. 116 Vgl. Sireci, S. G., Content Validity, 1998, S. 105.
4.5 Güteprüfung der Messmodelle Tab. 4.8 Kriterien der Konstruktvalidität und Richtwerte
89
Kriterien
Richtwert
Nomologische Validität
Kontext
Konvergenzvalidität
DEV (ξj ) > 0,5
Diskriminanzvalidität
DEV(ξj ) ≥ F2 ij
Quelle: Eigene Darstellung
Peter und Churchill (1986) beschreiben die nomologische Validität damit, dass eine Einbindung des Konstrukts in einen übergeordneten theoretischen Rahmen erfolgen muss.117 Es gilt die Abhängigkeitsbeziehungen, die durch eventuelle übergeordnete Theorien bestehen, festzustellen. Die nomologische Validität umfasst dabei die Beziehung sowohl zwischen Variablen als auch zwischen den Variablen und ihren Messindikatoren.118 Die Bewertung der nomologischen Validität kann mit Unterstützung der KFA und der im Rahmen der Reliabilitätsprüfung erzeugten Parameterschätzung erfolgen. Sollten die Faktoren sowohl untereinander als auch in Bezug auf die Indikatoren inhaltlich begründbare Beziehungen aufweisen, so kann dies als Anzeichen für das Vorliegen von nomologischer Validität gewertet werden.119 Die Konvergenzvalidität stellt den zweiten Teilaspekt zur Messung der Konstruktvalidität dar. Nach Peter (1981) drückt die Konvergenzvalidität aus, inwieweit unterschiedliche Messungen des gleichen Konstrukts miteinander korrelieren.120 Dies bedeutet, dass sowohl zwischen Indikatoren und Faktoren als auch zwischen den Faktoren hohe Zusammenhänge nachzuhalten sind.121 Aus messtheoretischer Perspektive ist es nicht möglich die Konvergenzvalidität zu messen, sofern die empirischen Daten mit nur einer Messmethode erhoben wurden. In der Praxis erfolgt jedoch häufig die Datenerhebung mehrfach mit nur einer Methode, indem mehrere Indikatoren für nur ein Konstrukt erhoben werden.122 Mit dem Prinzip multipler Indikatoren kann daher nur auf ein konvergentes Messverfahren und nicht auf konvergente Validität geschlossen werden.123 Weiber und Mühlhaus (2014) betrachten die Konvergenzvalidität in Anlehnung nach Fornell und Larcker (1981) dann als gegeben, wenn 117
Vgl. Peter, J. P., Churchill, G. A., Rating Scales, 1986, S. 2. Vgl. Peter, J. P., Construct Validity, 1981, S. 135. 119 Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 161. 120 Vgl. Peter, J. P., Construct Validity, 1981, S. 136. 121 Vgl. Homburg, C., Giering, A., Operationalisierung, 1996, S. 7. 122 Vgl. Bagozzi, R. P., Structural Models, 1981, S. 378. 123 Vgl. ebd., S. 376. 118
90
4
Empirische Untersuchung
die DEV-Werte für alle Konstrukte oberhalb von 0,5 liegen.124 Der dritte Aspekt der Konstruktvalidität stellt die Diskriminanzvalidität dar.125 Diskriminanzvalidität gilt als gegeben, wenn sich die Messungen von verschiedenen Konstrukten signifikant von Null unterscheiden. Die Prüfung der Diskriminanzvalidität kann über die EFA über alle Messindikatoren erfolgen. Sollten dabei geringe Querladungen zu anderen Konstrukten bestehen, ergibt sich ein Rückschluss auf diskriminante Validität. Ein strengeres Bewertungskriterium stellt das FornellLarcker-Kriterium dar, das zusätzlich zur Herleitung der Diskriminanzvalidität herangezogen werden soll. Demnach ist Diskriminanzvalidität dann gegeben, wenn der DEV-Wert des Konstrukts größer ist als die quadrierten Korrelationen zwischen zwei Konstrukten.126 Die Ergebnisse sind in Anhang 10 und 11 des elektronischen Zusatzmaterials einzusehen.
4.5.3
Messmodellprüfung
Um eine Beurteilung des Modell-Fits vorzunehmen, finden ergänzend zu den lokalen Gütemaßen, die bisher zur Beurteilung der Reliabilität und Validität herangezogen wurden, Gütemaße auf globaler Ebene Anwendung. Sie geben Aufschluss darüber, inwieweit die mit Unterstützung der Parameterschätzer auf gestellte modelltheoretische Varianz-Kovarianz-Matrix ( ) mit den empirisch gewonnen Varianz-Kovarianz-Matrix (S) übereinstimmt.127 Weiber und Mühlhaus (2014) empfehlen im Rahmen der Modellüberprüfung zunächst eine Beurteilung der Teilstrukturen vorzunehmen.128 Daher findet vorab eine Überprüfung der einzelnen Messmodelle statt, bevor die gleichen Gütekriterien bei der Beurteilung des Gesamtmodells in Abschnitt 4.6 Anwendung finden. Bei der Konsistenzprüfung der Varianz-Kovarianz-Matritzen stehen inferenzstatistische und deskriptive Gütekriterien zur Verfügung. Tab. 4.9 zeigt die inferenzstatistischen Gütekriterien, die bei der Bewertung der Güte auf Modellebene herangezogen werden.
124
Vgl. Fornell, C., Larcker, D. F., Measurement Error, 1981, S. 45 ff. Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 134. 126 Vgl. ebd., S. 165. 127 Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 160. 128 Vgl. ebd., S. 200. 125
4.5 Güteprüfung der Messmodelle Tab. 4.9 Inferenzstatistische Gütemaße und Richtwerte
91
Kriterien
Richtwert
Chi-Quadrat-Test (χ2 )
p > 0,1
χ2 /
0,5
>0,5
1
>0,5
>0,7
PU_01
0,966
0,750
1
0,839
0,944
PU_02
0,898
0,758
0,843
PU_03
0,871
0,807
0,865
PU_04
0,866
0,932
0,921
Kriterien der 2. Generation Indikatoren
FL (KFA) IR (KFA)
FR (KFA)
DEV (KFA)
Schwellenwerte
>0,5
>0,4
>0,6
>0,5
PU_01
0,856
0,729
0,9
0,8
PU_02
0,864
0,743
PU_03
0,915
0,837
PU_04
0,967
Lokal
Global χ2 -Tests RMSEA χ2 /d.f
0,937 GFI
AGFI TLI
p > 0,1
≤ 0,1
0,5 0,893 0,796 0,757 0,688
Schwellenwerte
PEOU_01
PEOU_02
PEOU_03
PEOU_04
0,1
Quelle: Eigene Darstellung
0,05
0,922 χ2 /d.f
PEOU_03
RMSEA
0,728
PEOU_02
PEOU_04
0,807
PEOU_01
Lokal
χ2 -Tests
0,655
Schwellenwerte
0,04
≤0,1
SRMR
0,824
0,524
0,666
0,452
>0,4
IR (KFA)
0,797
0,573
0,633
0,474
>0,5
KOM (EFA)
0,96
≥0,9
GFI
0,9
>0,6
FR (KFA)
1
1
Faktorextraktion (EFA)
0,82
≥0,9
AGFI
0,793
0,692
0,716
0,642
>0,5
KITK
0,89
≥0,9
TLI
0,6
>0,5
DEV (KFA)
0,861
>0,7
CA
0,96
≥0,9
CFI
4
Global
FL (KFA) >0,5
Indikatoren
Kriterien der 2. Generation
FL (EFA)
Indikatoren
Kriterien der 1. Generation
Tab. 4.13 Finale Bewertung des Faktors wahrgenommene Benutzerfreundlichkeit
96 Empirische Untersuchung
4.5 Güteprüfung der Messmodelle
97
Tab. 4.14 Finale Bewertung des Faktors Verhaltensabsicht Kriterien der 1. Generation Indikatoren
FL (EFA)
KOM (EFA)
Faktorextraktion (EFA)
KITK
CA
Schwellenwerte
>0,5
>0,5
1
>0,5
>0,7
BI_01
0,973
0,947
1
0,948
0,973
BI_02
0,973
0,947
0,948
Kriterien der 2. Generation Indikatoren
FL (KFA)
IR (KFA)
FR (KFA)
DEV (KFA)
Schwellenwerte
>0,5
>0,4
>0,6
>0,5
Lokal
BI_01
0,992
0,978
1
0,9
BI_02
0,955
0,918
Quelle: Eigene Darstellung Tab. 4.15 Finale Bewertung des Faktors Einstellung Kriterien der 1. Generation Indikatoren
FL (EFA)
KOM (EFA)
Faktorextraktion (EFA)
KITK
CA
Schwellenwerte
>0,5
>0,5
1
>0,5
>0,7
ATT_01
0,986
0,741
1
0,830
0,93
ATT_02
0,868
0,754
0,736
ATT_03
0,861
0,973
0,834
Kriterien der 2. Generation Indikatoren
FL (KFA)
IR (KFA)
FR (KFA)
DEV (KFA)
Schwellenwerte
>0,5
>0,4
>0,6
>0,5
Lokal
ATT_01
0,870
0,759
0,9
0,8
ATT_02
0,898
0,806
ATT_03
0,957
0,914
Quelle: Eigene Darstellung
98
4
Empirische Untersuchung
Die Kriterien der ersten Generation zeigen auf Basis der durchgeführten EFA und der Prüfung auf interne Konsistenz sehr gute Reliabilitätswerte oberhalb der Schwellenwerte. Auch die Kriterien der zweiten Generation lassen auf eine hohe Güte des Messmodells schließen. Eine Prüfung auf globaler Ebene ist durch das vorliegende Set von drei Indikatoren nicht möglich. Die Indikatoren ATT_01 -ATT_03 können beibehalten werden. Das Konstrukt ATT kann in dieser Form in der Strukturgleichungsanalyse Berücksichtigung finden. Ferner fand eine Bewertung des Faktors Subjektive Norm (SN) statt. In Tab. 4.16 können die zentralen Werte zur Überprüfung des Messmodells entnommen werden. Tab. 4.16 Finale Bewertung des Faktors Subjektive Norm Kriterien der 1. Generation Indikatoren
FL (EFA)
KOM (EFA)
Faktorextraktion (EFA)
KITK
CA
Schwellenwerte
>0,5
>0,5
1
>0,5
>0,7
SN_01
0,910
0,828
1
0,828
0,91
SN_02
0,910
0,828
0,828
Kriterien der 2. Generation Indikatoren
FL (KFA)
IR (KFA)
FR (KFA)
DEV (KFA)
Schwellenwerte
>0,5
>0,4
>0,6
>0,5
Lokal
SN_01
0,944
0,824
0,9
0,8
SN_02
0,877
0,833
Quelle: Eigene Darstellung
Das Konstrukt SN weist sowohl auf Basis der Gütekriterien der ersten Generation als auch auf Basis der zweiten Generation (lokalen Gütemaße) Werte oberhalb der geforderten Schwellenwerte auf. Gütemaße auf globaler Ebene fanden aufgrund des vorliegenden Indikatorensets keine Anwendung. Das Konstrukt konnte in Form der zwei Indikatoren SN_01 und SN_02 beibehalten werden. Außerdem fand eine Bewertung des Faktors Relevanz für den Job (JR) statt. Tab. 4.17 gibt eine Übersicht über die Kriterien der ersten und der zweiten Generation und zeigt die Ergebnisse.
4.5 Güteprüfung der Messmodelle
99
Tab. 4.17 Finale Bewertung des Faktors Relevanz für den Job Kriterien der 1. Generation Indikatoren
FL (EFA)
KOM (EFA)
Faktorextraktion (EFA)
KITK
CA
Schwellenwerte
>0,5
>0,5
1
>0,5
>0,7
JR_01
0,938
0,880
1
0,881
0,94
JR_02
0,938
0,880
0,881
Kriterien der 2. Generation Indikatoren
FL (KFA)
IR (KFA)
FR (KFA)
DEV (KFA)
Schwellenwerte
>0,5
>0,4
>0,6
>0,5
Lokal
JR_01
0,959
0,917
0,9
0,9
JR_02
0,919
0,847
Quelle: Eigene Darstellung
Bei dem Faktor Relevanz für den Job (JR) wurden beide Indikatoren als reliabel eingestuft. Sowohl die Bewertung der Kriterien der ersten Generation als auch die Kriterien der zweiten Generation ließen diesen Schluss zu. Auch bei dem Faktor JR ist eine Bewertung auf Basis der globalen Gütemaße nicht zulässig. Das Konstrukt kann in Form der Indikatoren JR_01 und JR_02 mit in die weitere Analyse einfließen. Der Faktor Ergebnisqualität (RQ) ist mit zwei Indikatoren ebenfalls einer Bewertung mit Unterstützung der Gütekriterien der ersten und zweiten Generation unterzogen worden. Tab. 4.18 zeigt die Ergebnisse. Auch das Konstrukt RQ konnte auf Basis zufriedenstellender Gütekriterien der ersten und zweiten Generation als reliabel angesehen werden. Gloable Gütemaße konnten aufgrund von zwei Indikatoren keine Anwendung finden. Allerdings ist anzumerken, dass das Konstrukt auf Basis der durchgeführten EFA über alle Indikatoren nicht klar einem Faktor zugeordnet werden konnte (Vgl. Anhang 8, elektronisches Zusatzmaterial). Es bestand eine hohe Querladung auf die Variable wahrgenommene Benutzerfreundlichkeit. Da das Messmodell trotzdem beibehalten wurde, erfordert diese Tatsache allerdings Berücksichtigung in der späteren Auswertung und Analyse. Außerdem fanden die Gütekritrien Anwendung, um eine Bewertung des Faktors Vertrauen (T) vorzunehmen. In Tab. 4.19 ist eine Zusammenfassung der Ergebnisse der Güteprüfung zu entnehmen.
100
4
Empirische Untersuchung
Tab. 4.18 Finale Bewertung des Faktors Ergebnisqualität Kriterien der 1. Generation Indikatoren
FL (EFA)
KOM (EFA)
Faktorextraktion (EFA)
KITK
CA
Schwellenwerte
>0,5
>0,5
1
>0,5
>0,7
RQ_01
0,905
0,819
1
0,819
0,9
RQ_02
0,905
0,819
0,819
Kriterien der 2. Generation Indikatoren
FL (KFA)
IR (KFA)
FR (KFA)
DEV (KFA)
Schwellenwerte
>0,5
>0,4
>0,6
>0,5
Lokal
RQ_01
0,959
0,917
0,9
0,9
RQ_02
0,919
0,847
Quelle: Eigene Darstellung Tab. 4.19 Finale Bewertung des Faktors Vertrauen Kriterien der 1. Generation Indikatoren
FL (EFA)
KOM (EFA)
Faktorextraktion (EFA)
KITK
CA
Schwellenwerte
>0,5
>0,5
1
>0,5
>0,7
T_01
0,950
0,825
1
0,876
0,95
T_02
0,915
0,903
0,906
T_03
0,908
0,838
0,881
Kriterien der 2. Generation Indikatoren
FL (KFA)
IR (KFA)
FR (KFA)
DEV (KFA)
Schwellenwerte
>0,5
>0,4
>0,6
>0,5
Lokal
T_01
0,908
0,823
0,9
0,9
T_02
0,950
0,904
T_03
0,915
0,837
Quelle: Eigene Darstellung
4.5 Güteprüfung der Messmodelle
101
Der Faktor T konnte mit den drei anfänglich formulierten Indikatoren auf Basis von Chong et al. (2012) in seiner Form bestätigt werden. Die Gütekriterien der ersten und der zweiten Generation ließen diese Schlussfolgerung zweifelsfrei zu. Daher kann das Konstrukt, mit den Indikatoren T_01 bis T_03, unverändert in der weiteren Analyse berücksichtigt werden. Die Variable Innovationsfreudigkeit (PI) wurde im Rahmen der Reliabilitätsprüfung aus der Analyse ausgeschlossen. Nachdem zunächst eine Reduzierung des Sets an Indikatoren auf Basis der geringsten Kommunalität des Indikators PI_02 erfolgt ist, konnte die Annahme auf interne Konsistenz der bestehenden Indikatoren nicht ohne Vorbehalte erfolgen. Da neben den mangelhaften Kommunalitäten zusätzlich ein geringes Cronbachs Alpha und geringe KITK-Werte vorherrschten, führte dies schließlich zum Ausschluss der Variable. Auch der Faktor Möglichkeit zur Interaktion mit einem Mitarbeiter (PCSM) wurde nicht weiter in die Analyse integriert. Zunächst erfolgte eine Betrachtung auf Basis der drei vorgeschlagenen Indikatoren von Dabholkar und Bagozzi (2002). Es fand eine Elimination des Indikators PCSM_01 durch einen mangelhaften Kommunalitätswert im Rahmen der EFA statt, da dies darauf schließen lässt, dass nur ein sehr geringer Anteil der Streuung durch den Indikatoren PCSM_01 erklärt werden kann. Allerdings zeigten sich Schwierigkeiten in Bezug auf die Konstruktvalidität, was zum Ausschluss des gesamten Konstrukts führte. Eine detaillierte Validitätsbetrachtung folgt im nächsten Abschnitt. Die Reliabilitätsbetrachtung der einzelnen Messmodelle ist damit abgeschlossen. Daher erfolgt anknüpfend daran eine Bewertung der Validität der Faktoren. Um die Validität beurteilen zu können, bedarf es einer Betrachtung der Konstruktvalidität. Diese beinhaltet die nomologische, konvergente und diskriminante Validität. Eine Beurteilung der nomologischen Validität kann auf Basis der postulierten Beziehungen getroffen werden. Bei Betrachtung der Korrelationsmatrix fällt auf, dass alle Variablen außer der Variable PCSM positive Werte aufzeigen. Negative Korrelationen zwischen allen Konstrukten und PCSM können zwar sachlogisch erklärt werden, indem sich die Möglichkeit zur Interaktion mit einem Mitarbeiter potenziell negativ auf die Nutzung von Chatbots generell auswirkt. Somit widerspricht diese Aussage allerdings den im Vorfeld positiv postulierten Zusammenhang mit dem Faktor PEOU. Daher kann von nomologischer Validität nur unter Ausschluss des Konstrukts PCSM ausgegangen werden. (Vgl. Anhang 10, elektronisches Zusatzmaterial). Außerdem kann der Rückschluss auf konvergente Validität erfolgen, da die DEV-Werte bei allen Konstrukten größer als die geforderten Schwellenwerte von 0,5 sind. Dementsprechend liegt kein Indiz vor, dass auf das Nichtvorhandensein von konvergenter Validität schließen lässt (Vgl. Anhang 11, elektronisches
102
4
Empirische Untersuchung
Zusatzmaterial). Um eine vollständige Bewertung der Konstruktvalidität vornehmen zu können, erfolgt zusätzlich die Betrachtung der diskriminanten Validität. Tab. 4.20 gibt die Ergebnisse je Messmodell wieder und zeigt im Inneren die Korrelationsmatrix, sowie in der ersten Spalte und Zeile das Fornell-LarckerKriterium. Tab. 4.20 Prüfung auf Diskriminanzvalidität DEV (ξj) Konstrukt
0,812
0,617
0,826
0,948
0,829
0,882
0,900
0,855
PU
PEOU
ATT
BI
SN
JR
RQ
T
0,812
PU
1
0,617
PEOU
0,355
1
0,826
ATT
0,591
0,539
1
0,948
BI
0,352
0,356
0,591
1
0,829
SN
0,193
0,110
0,094
0,027
1
0,882
JR
0,269
0,179
0,307
0,168
0,174
1
0,900
RQ
0,406
0,487
0,176
0,168
0,132
0,259
1
0,855
T
0,063
0,105
0,198
0,130
0,010
0,083
0,176
1
Quelle: Eigene Darstellung
Wie Tab. 4.16 zu entnehmen ist, weist das Fornell-Larcker-Kriterium bei allen Faktoren auf diskriminante Validität hin. Alle DEV-Werte liegen oberhalb der jeweilig quadrierten Faktorkorrelationen. Alle Indikatoren eines Faktors weisen dementsprechend untereinander höhere Korrelationen auf als zu Indikatoren von anderen Faktoren. Aufbauend auf den Erkenntnissen der nomologischen, konvergenten und diskriminanten Validität kann daher für die vorliegenden Messmodelle von Konstruktvalidität ausgegangen werden. Eine Überprüfung der Messmodelle in Bezug auf die Reliabilität und Validität ist somit an dieser Stelle abgeschlossen.
4.6
Ergebnisse der Modellschätzung und Überprüfung des Model-Fit
Da im Anschluss der Überprüfung der einzelnen Messmodelle von reliablen und validen empirischen Daten ausgegangen werden kann, erfolgte anschließend eine Überprüfung des aufgestellten Hypothesensystems und eine Bewertung des Gesamtmodells. Innerhalb dieses Abschnittes werden die in der KFA ermittelten Werte dargestellt. Es werden zwischen den vorliegenden Faktoren und den
4.6 Ergebnisse der Modellschätzung …
103
jeweiligen Indikatoren, die Faktorladungsmatrix so geschätzt, dass die empirische Korrelationsmatrix möglichst gut reproduziert werden kann. Durch die Schätzung der Parameter können anschließend die vermuteten Zusammenhänge in Abschnitt 4.7 überprüft werden.147 Um die Parameter schätzen zu können, bedarf es allerdings einer ausreichend großen Menge an empirischen Daten. In der Literatur wird diese Überprüfung als Identifizierbarkeit des Modells betitelt. Eine erneute Bewertung ist aufgrund des reduzierten Sets an Variablen innerhalb des Modells erneut durchzuführen. Nach Eliminierung einzelner Messvariablen stehen nun 253 empirische Varianzen und Kovarianzen insgesamt 60 zu schätzenden Parametern gegenüber.148 Durch Bildung der Differenz zwischen der Anzahl der zur Verfügung stehenden Gleichungen und der Anzahl der der zu schätzenden Parameter, kann die Anzahl der Freiheitsgrade ermittelt werden. Ein Strukturmodell gilt nur dann als lösbar, wenn die Anzahl der Freiheitsgrade größer oder mindestens gleich Null ist. Für das vorliegende Strukturmodell ergeben sich somit 193 Freiheitsgraden. Damit gilt die notwenige Bedingung für die Identifizierbarkeit als erfüllt. Zusätzlich wird die Identifizierbarkeit des Modells durch AMOS© selbst unterstützt. Eine Identifizierbarkeit des Modells setzt voraus, dass die Gleichungen linear unabhängig voneinander sind. Da AMOS© die für die Schätzung notwendigen Matritzeninversionen vornehmen kann und keine Warnmeldungen ausgegeben werden, lässt auch diese Prüfung den Schluss auf die Identifizierbarkeit des Modells zu.149 Darüber hinaus liegen keine Heywood-Cases, in Form von negativen Varianzen oder Kommunalitäten größer als eins vor.150 Demzufolge kann die Strukturgleichungsanalyse auf Basis der zur Verfügung stehenden Daten mit Unterstützung von AMOS© erfolgen. Um das Modell schätzen zu können, wurde das in Anhang 13 (zu finden im elektronischen Zusatzaterial), Abb. 21 aufgezeigte Strukturmodell mit Unterstützung von IBM SPSS AMOS© 28 Graphics und auf Basis der in Abschnitt 4.4 genannten Aspekte erstellt. Dabei kam die ML-Methode unter Berücksichtigung des Bollenstine-Bootstrap zur Anwendung. Abb. 4.5 zeigt die relevanten Ergebnisse der Parameterschätzungen.
147
Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 57. Der Output wird ebenfalls von IBM SPSS AMOS© 28 Graphics ausgegeben und ist in Abb. 20: Modell Notes des aufgestellten Strukturmodells in Anhang 13 des elektronischen Zusatzmaterials einzusehen. 149 Vgl. Backhaus, K. et al., Analysemethoden, 2015, S. 86 f. 150 Vgl. Weiber, R., Mühlhaus, D., Strukturgleichungsmodellierung, 2014, S. 202. 148
104
4
Empirische Untersuchung
Vorgeschlagene B2B-bezogene Erweiterungen Subjektive Norm
0,220* 0,247***
Vertrauen 0,209*
Grundlegende Struktur nach Davis et al. (1989)
Wahrgenommene Nützlichkeit 0,575***
Relevanz für den Beruf 0,367***
0,278***
Einstellung
Ergebnisqualität
Nutzungsabsicht
0,736*** 0,401***
Kognitiv Innovationsfreudigkeit
Wahrgenommene Benutzerfreundlichkeit
Möglichkeit zur Interaktion mit Mitarbeiter
Abb. 4.5 Relevante Ergebnisse der Modellschätzung. (Quelle: Eigene Darstellung)
Ergebnisse, die bei der Auswertung der Wirkungszusammenhänge Berücksichtigung finden können, sind mit durchgehenden schwarzen Pfeilen und den jeweiligen standardisierten Regressionskoeffizienten beschriftet. Die Werte der Faktoren Subjektiven Norm und Relevanz für den Beruf in Bezug auf die wahrgenommene Nützlichkeit sind mit einem Stern (*) versehen, da diese, abweichend zu den weiteren Pfadkoeffizienten, mit einem Signifikanzniveau von 5 % zu berücksichtigen sind. Die Werte der übrigen Pfadkoeffizienten sind hingegen zu einem Signifikanzniveau von 1 % signifikant (***). Pfadkoeffizienten bei denen entgegen der a-priori formulierten Vermutung keine relevante und nennenswerte Beziehung festgestellt werden konnte, werden im Modell in Abb. 4.4 mit gestrichelten Pfeilen dargestellt. Da die Konstrukte Innovationsfreudigkeit und Möglichkeit zur Interaktion mit einem Mitarbeiter aufgrund mangelnder Reliabilität oder Validität aus dem Modell ausgeschlossen wurden, sind diese grau hinterlegt, da hier keine Rückschlüsse auf die Beziehungen zulässig sind. Eine detaillierte Bewertung der Ergebnisse ist Anhang 14 des elektronischen Zusatzmaterials zu entnehmen. Aufbauend auf den in Unterabschnitt 4.5.3 erläuterten Gütekriterien bei der Beurteilung der Messmodelle, erfolgt nun eine Bewertung des gesamten Model-Fits. Es finden ebenfalls die inferenzstatistischen Gütemaße χ2 -Test und
4.7 Evaluation der aufgestellten Hypothesen
105
χ2 / df und die deskriptiven Gütemaße RMSEA, SRMR, GFI und AGFI Anwendung. Aufbauend auf der Argumentation in Unterabschnitt 4.5.3 sollen dem GFI und dem AGFI nur eine untergeordnete Beachtung geschenkt werden. Außerdem erfolgt eine Betrachtung der inkrementellen Gütekriterien TLI und CFI. Sowohl die Schwellenwerte als auch die Ergebnisse der globalen Gütemaße des Strukturmodells sind in Tab. 4.21 zusehen. Tab. 4.21 Zusammenfassung des Model-Fit Inferenzstatistisch
Deskriptiv
Inkrementell
χ2-Tests
RMSEA
χ2/d.f
SRMR
GFI
AGFI
TLI
p > 0,1
≤0,1