Mensch und Computer 2015 – Tagungsband 9783110443929, 9783110443349

These conference proceedings include the specialized academic lecture and brief contributions presented at the Humans an

249 56 10MB

German Pages 504 Year 2015

Report DMCA / Copyright

DOWNLOAD PDF FILE

Table of contents :
Inhaltsverzeichnis
Vorwort
Langbeiträge
Gemeinsam Arbeiten
Flexible Zusammenarbeit in Workshops mittels mobiler Geräte
Förderung von informellen Kontexten und Awareness in Scrum-Teams
Search Trails as Collaboration Artifacts – Evaluating the UX
Methoden und Werkzeuge
Klassifikationsschema für Usability-Evaluationsmethoden
Evaluation des iRequire-Ansatzes: Anforderungsermittlung in der Praxis
„Das stand doch auf Facebook“: Museen in sozialen Netzwerken
Beyond Usability
Gendergerechtes Forschungsdesign an der Schnittstelle Mensch - Technik
Übersichtlichkeit als Mediator zwischen Ästhetik und Usability?
Fürsorge, Gemeinsamkeiten, Pläne – Technik für Fernbeziehungen gestalten
MCI in der Praxis
User Experience bei Softwareanbietern
Praktiken der Nutzerintegration im Entwicklungsprozess von KMU
Geschlechterstereotype in Persona- Beschreibungen
Interaktion in 3D
3D-Visualisierung zur Eingabe von Präferenzen in Empfehlungssystemen
Natural 3D Interaction Techniques for Locomotion with Modular Robots
Comparative Evaluation of Gesture and Touch Input for Medical Software
Im Auge des Nutzers
The Uncanny Valley and the Importance of Eye Contact
Blickbasierte Awarenessmechanismen zur Kollaborationsunterstützung
Empirische Validierung von Gestaltungsmustern
Interaktive Anwendungen
Interactive Human-Guided Optimization for Logistics Planning
Make Me Laugh: Recommending Humoristic Content on the WWW
Soziale Assistenzsysteme – respektvoll handeln im Straßenverkehr
Für ältere Benutzer
Impact Factors on Social TV Research in Real Elderly Persons’ Households
Let me Introduce Myself: I am Care-O-bot 4, a Gentleman Robot
Touch und Gesten
Usability of Gesture-based Mobile Applications for First-time Use
Die Berührungsdauer eines Button- Klicks bei stationären Touchscreens
Kurzbeiträge
3D User Interfaces for Interactive Annotation of Vascular Structures
Accuracy of a Low-Cost 3D-printed Head-Mounted Eye Tracker
An Intuitive Textile Input Controller
Assisting Mouse Pointer Recovery in Multi-Display Environments
Bedürfnislandschaft älterer Menschen in Österreich
Computerbezogene Attributionsstile: Ein Persona-Toolkit für UE-Prozesse
Der Gender-Check im menschzentrierten Gestaltungsprozess
Die Intuitivitäts-Illusion: Intuitives Nutzererleben durch Attributionsfehler
Eine haptische Lichtsteuerung für Senioren in Smart Environments
Einflussfaktoren der Beanspruchung durch gestenbasierte Eingabegeräte
Erinnerungsfenster für Demenzkranke
Evaluation einer ähnlichkeitsbasierten Produktsuche für Kleidung
Evaluation von Buttons im Kontext des Gestaltungsstils Flat Design
Herausforderungen und Erwartungen an 3D-Technologien
Incentive Guidance of Crowds by Smart City Lights
Integrierte Entwicklungsumgebung 5Code für Programmieranfänger
Interaktive Schutzbekleidung für industrielle Arbeitsumgebungen
Kontextspezifisches Nutzerfeedback in einer Desktop-Anwendung
Kommunikation von Verbundenheit mittels Smartwatch
Kulturkonflikte vermeiden – Mobiles Lernen für China
Linkshändigkeit als Privileg oder Nachteil bei Notebookeingabegeräten?
Lumicons: Mapping Light Patterns to Information Classes
Multimodale Mensch-Roboter- Interaktion im privaten Haushalt
Nähe auf Distanz - sensible Gestaltung von Kommunikationstechnik
Parameterized Facial Animation for Socially Interactive Robots
Plattformübergreifende interaktive Tischanwendungen mittels TUIOFX
PQ4Agile – Steigerung der Produktqualität in agilen Projekten
Reagierende Schriftzeichen
Sichere Mensch-Roboter- Kollaboration durch Prädiktion
Towards Software Support for Collaborative Morphological Analysis
Unterstützung eines manuellen Verwiegeprozesses per Smartwatch
Using Tag Clouds to Explore Text Documents on Small Mobile Devices
Virtual Twins for Online Clothing Shoppers
Vom Wunsch zum Ziel?! Potential von Technologien zur Selbstverbesserung
Vorhersagbarkeit von Produktpräferenzen durch Eyetracking
Websitebewertung: Der spontane Ersteindruck
Wofür brauchen Informatiker_innen das Soziale?
Zeitstabilität der Nutzerwahrnehmung: Bewertung von Website-Inhalten
Interaktive Demos
A Voice Driven Type Design Demo
Eine adaptive Online Banking Anwendung
HapRing: A Wearable Haptic Device for 3D Interaction
Interaktion mit entfernten Displays durch See-Through Augmentation
Interaktive Kletterwand
iSkin: Stretchable On-Body Touch Sensors for Mobile Computing
Kollaboratives Text Lesen: Adaptive Text Scroll Geschwindigkeit
Mid-Air Gestures for Window Management on Large Displays
persona.fractalis - eine körpergesteuerte 3D-Installation
Remote Drawing on Vertical Surfaces with a Self-Actuated Display
The death of a genre: self-driving cars and car racing video games
The Roaring Hammock
Towards an Optimal Viewpoint in Third-Person out-of-body Experiences
Virtual Tones
Visual Analytics in der Studienverlaufsplanung
VR-Demonstration „DeepGrip“
Weit weg und doch nah – zwei Technikkonzepte im Familieneinsatz
Programmkomitees
Autoren
Recommend Papers

Mensch und Computer 2015 – Tagungsband
 9783110443929, 9783110443349

  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

Sarah Diefenbach, Niels Henze, Martin Pielot (Hrsg.) Mensch und Computer 2015 – Proceedings

Weitere empfehlenswerte Titel Mensch-Maschine-Interaktion Andreas Butz, Antonio Krüger, 2014 ISBN 978-3-486-71621-4, e-ISBN 978-3-486-71967-3

Prozessführungssysteme Michael Herczeg, 2014 IISBN 978-3-486-58445-5, e-ISBN 978-3-486-72005-1, Set-ISBN 978-3-486-79087-0

Data Mining Jürgen Cleve, Uwe Lämmel, 2014 ISBN 978-3-486-71391-6, e-ISBN (PDF) 978-3-486-72034-1, e-ISBN (EPUB) 978-3-486-99071-3

IT-Sicherheit, 9. Auflage Claudia Eckert, 2014 ISBN 978-3-486-77848-9, e-ISBN 978-3-486-85916-4

Vernetzte Organisation Alexander Richter (Hrsg.), 2014 ISBN 978-3-486-74728-7, e-ISBN 978-3-486-74731-7, Set-ISBN 978-3-486-98957-1

Informatik und Gesellschaft Andrea Kienle, Gabriele Kunau, 2014 ISBN 978-3-486-73597-0, e-ISBN 978-3-486-78145-8

Mensch und Computer 2015 – Proceedings Herausgegeben von Sarah Diefenbach, Niels Henze, Martin Pielot

Herausgeber Prof. Dr. Sarah Diefenbach Ludwig-Maximilians-Universität München Department Psychologie Lehrstuhl Wirtschafts- und Organisationspsychologie Leopoldstraße 13 80802 München [email protected]

Prof. Dr. Niels Henze Universität Stuttgart Institut für Visualisierung & Interaktive Systeme Pfaffenwaldring 5a 70569 Stuttgart [email protected]

Martin Pielot 08006 Barcelona Spanien [email protected]

ISBN 978-3-11-044334-9 e-ISBN (PDF) 978-3-11-044392-9 e-ISBN (EPUB) 978-3-11-043557-3 Set-ISBN 978-3-11-044393-6 Library of Congress Cataloging-in-Publication Data A CIP catalog record for this book has been applied for at the Library of Congress. Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.dnb.de abrufbar. © 2015 Walter de Gruyter GmbH, Berlin/Boston Druck und Bindung: CPI books GmbH, Leck ♾ Gedruckt auf säurefreiem Papier Printed in Germany www.degruyter.com

Inhaltsverzeichnis Vorwort . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . XIII

Langbeiträge Gemeinsam Arbeiten Flexible Zusammenarbeit in Workshops mittels mobiler Geräte Moritz Wiechers, Alexander Nolte, Nina Christmann, Thomas Herrmann, Andrea Kienle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3

Förderung von informellen Kontexten und Awareness in Scrum-Teams Jan Schwarzer, Susanne Draheim, Kai von Luck . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 Search Trails as Collaboration Artifacts – Evaluating the UX Sebastian Franken, Ulrich Norbisrath, Wolfgang Prinz . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

Methoden und Werkzeuge Klassifikationsschema für Usability-Evaluationsmethoden Christoph Ohl, Gabriele Schade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 Evaluation des iRequire-Ansatzes: Anforderungsermittlung in der Praxis Melanie J. C. Stade, Hanna J. Wittkugel, Norbert Seyff . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 „Das stand doch auf Facebook“: Museen in sozialen Netzwerken Verena Holtkötter, Michael Prilla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

Beyond Usability Gendergerechtes Forschungsdesign an der Schnittstelle Mensch - Technik Dorothea Erharter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 Übersichtlichkeit als Mediator zwischen ästhetik und Usability? Martin Schrepp, Kerstin Eva Müller . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 Fürsorge, Gemeinsamkeiten, Pläne – Technik für Fernbeziehungen gestalten Wei-Chi Chien, Marc Hassenzahl, Eva Lenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

VI

Inhaltsverzeichnis

MCI in der Praxis User Experience bei Softwareanbietern Magdalena Laib, Michael Burmester, Chiara Ficano, Nora Fronemann, Bianca Kolb, Anne Krüger, Marie-Luise Quesseleit, Katharina Schippert, Marina Shinkarenko . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 Praktiken der Nutzerintegration im Entwicklungsprozess von KMU Oliver Stickel, Corinna Ogonowski, Timo Jakobi, Gunnar Stevens, Volkmar Pipek, Volker Wulf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 Geschlechterstereotype in Persona-Beschreibungen Nicola Marsden, Jasmin Link, Elisabeth Büllesfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

Interaktion in 3D 3D-Visualisierung zur Eingabe von Präferenzen in Empfehlungssystemen Johannes Kunkel, Benedikt Loepp, Jürgen Ziegler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 Natural 3D Interaction Techniques for Locomotion with Modular Robots Dennis Krupke, Paul Lubos, Gerd Bruder, Jianwei Zhang, Frank Steinicke . . . . . . . . . 133 Comparative Evaluation of Gesture and Touch Input for Medical Software Patrick Saalfeld, André Mewes, Maria Luz, Bernhard Preim, Christian Hansen . . . . . 143

Im Auge des Nutzers The Uncanny Valley and the Importance of Eye Contact Valentin Schwind, Solveigh Jäger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 Blickbasierte Awarenessmechanismen zur Kollaborationsunterstützung Philipp Schlieker-Steens, Christian Schlösser, Andreas Harrer, Andrea Kienle . . . . . . 163 Empirische Validierung von Gestaltungsmustern Vanessa Petrausch, Christian Schild . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

Interaktive Anwendungen Interactive Human-Guided Optimization for Logistics Planning Nikita Mattar, Philipp Kulms, Stefan Kopp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183 Make Me Laugh: Recommending Humoristic Content on the WWW Daniel Buschek, Ingo Just, Benjamin Fritzsche, Florian Alt . . . . . . . . . . . . . . . . . . . . . . . 193 Soziale Assistenzsysteme – respektvoll handeln im Straßenverkehr Kai Eckoldt, Matthias Laschke, Marc Hassenzahl, Thies Schneider, Josef Schumann, Stefan Könsgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203

Inhaltsverzeichnis

VII

Für ältere Benutzer Impact Factors on Social TV Research in Real Elderly Persons’ Households Claudia Müller, Johanna Schnittert, Magdalena Walczuch, Malek Alaoui, Myriam Lewkowicz, Lin Wan, Volker Wulf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213 Let me Introduce Myself: I am Care-O-bot 4, a Gentleman Robot Ralf Kittmann, Tim Fröhlich, Johannes Schäfer, Ulrich Reiser, Florian Weißhardt, Andreas Haug . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223

Touch und Gesten Usability of Gesture-based Mobile Applications for First-time Use Ben Heuwing, Ina Köller, Viktor Schanz, Thomas Mandl . . . . . . . . . . . . . . . . . . . . . . . . . . 233 Die Berührungsdauer eines Button-Klicks bei stationären Touchscreens Martin Seeger, Tobias Stein, Bernd-Burkhard Borys, Ludger Schmidt . . . . . . . . . . . . . . 243

VIII

Inhaltsverzeichnis

Kurzbeiträge 3D User Interfaces for Interactive Annotation of Vascular Structures Patrick Saalfeld, Sylvia Glaßer, Bernhard Preim . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255 Accuracy of a Low-Cost 3D-printed Head-Mounted Eye Tracker Valentin Schwind, Norman Pohl, Patrick Bader . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259 An Intuitive Textile Input Controller Florian Heller, Hyun-Young (Kriz) Lee, Philipp Brauner, Thomas Gries, Martina Ziefle, Jan Borchers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263 Assisting Mouse Pointer Recovery in Multi-Display Environments Florian Fortmann, Dennis Nowak, Kristian Bruns, Mark Milster, Susanne Boll . . . . . 267 Bedürfnislandschaft älterer Menschen in Österreich Dorothea Erharter, Elka Xharo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271 Computerbezogene Attributionsstile: Ein Persona-Toolkit für UE-Prozesse Adelka Niels, Monique Janneck . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275 Der Gender-Check im menschzentrierten Gestaltungsprozess Nicola Marsden, Maren Haag . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279 Die Intuitivitäts-Illusion: Intuitives Nutzererleben durch Attributionsfehler Stefan Tretter, Daniel Ullrich, Sarah Diefenbach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283 Eine haptische Lichtsteuerung für Senioren in Smart Environments Steffen Dielmann, Alina Huldgtren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287 Einflussfaktoren der Beanspruchung durch gestenbasierte Eingabegeräte Max Bernhagen, André Dettmann, Angelika C. Bullinger . . . . . . . . . . . . . . . . . . . . . . . . . 291 Erinnerungsfenster für Demenzkranke Fabian Mertl, Bastian Dewitz, Uli Braas, Arthur Glomb, Alina Huldtgren, Anja Vormann, Christian Geiger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295 Ethik in Technikforschung und Technikentwicklung: Erfahrungen Stefan Brandenburg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299 Evaluation einer ähnlichkeitsbasierten Produktsuche für Kleidung Alexander Piazza, Christian Zagel, Sebastian Huber, Jana Bernotat . . . . . . . . . . . . . . . 303 Evaluation von Buttons im Kontext des Gestaltungsstils Flat Design Malte Lücken, Gerd Bruder, Frank Steinicke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307 Herausforderungen und Erwartungen an 3D-Technologien Daniel Schubert, Stephan Hörold, Angelika C. Bullinger, Heidi Krömker . . . . . . . . . . . 311

Inhaltsverzeichnis

IX

Incentive Guidance of Crowds by Smart City Lights Andreas Sieß, Kathleen Hübel, Daniel Hepperle, Andreas Dronov, Christian Hufnagel, Julia Aktun, Matthias Wölfel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315 Integrierte Entwicklungsumgebung 5Code für Programmieranfänger Markus Dahm, Frano Barnjak, Moritz Heilemann . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319 Interaktive Schutzbekleidung für industrielle Arbeitsumgebungen Dmitrij Boger, Michael Lawo, Jürgen Pannek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323 Kontextspezifisches Nutzerfeedback in einer Desktop-Anwendung Sven Bittenbinder, Dominique Winter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327 Kommunikation von Verbundenheit mittels Smartwatch Bianca Gockel, Timo Sackmann, Claudia Müller . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331 Kulturkonflikte vermeiden – Mobiles Lernen für China Sissy-Josefina Ernst, Andreas Janson, Matthias Söllner, Jan Marco Leimeister . . . . . . 335 Linkshändigkeit als Privileg oder Nachteil bei Notebookeingabegeräten? Michael Oehl, Julia Stein, Christine Sutter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339 Lumicons: Mapping Light Patterns to Information Classes Maria Rauschenberger, Andrii Matviienko, Vanessa Cobus, Janko Timmermann, Heiko Müller, Andreas Löcken, Jutta Fortmann, Christoph Trappe, Wilko Heuten, Susanne Boll . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343 Multimodale Mensch-Roboter-Interaktion im privaten Haushalt Sascha Herr, Tom Gross . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 347 Nähe auf Distanz - sensible Gestaltung von Kommunikationstechnik Thies Schneider, Marc Hassenzahl, Eva Lenz, Kirstin Kohler, Wasili Adamow, Patrick Beedgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 351 Parameterized Facial Animation for Socially Interactive Robots Steffen Wittig, Matthias Rätsch, Uwe Kloos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 355 Plattformübergreifende interaktive Tischanwendungen mittels TUIOFX Mirko Fetter, David Bimamisa, Tom Gross . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 359 PQ4Agile – Steigerung der Produktqualität in agilen Projekten Hartmut Schmitt, Dominik Magin, Dominik Rost . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 363 Reagierende Schriftzeichen Angelo Stitz, Matthias Wölfel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 367 Sichere Mensch-Roboter-Kollaboration durch Prädiktion Patrick Zeising, Stefan Brending, Michael Lawo, Jürgen Pannek . . . . . . . . . . . . . . . . . . . 371

X

Inhaltsverzeichnis

Towards Software Support for Collaborative Morphological Analysis Marin Zec . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 375 Unterstützung eines manuellen Verwiegeprozesses per Smartwatch Daniel Zsebedits, Steffen Günter, Gerrit Meixner, Sebastian Rauh . . . . . . . . . . . . . . . . . 379 Using Tag Clouds to Explore Text Documents on Small Mobile Devices Tanja Döring, Annika Kaltenhauser, Rainer Malaka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383 Virtual Twins for Online Clothing Shoppers Rainer Blum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 387 Vom Wunsch zum Ziel?! Potential von Technologien zur Selbstverbesserung Sarah Diefenbach, Jasmin Niess . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 391 Vorhersagbarkeit von Produktpräferenzen durch Eyetracking Laura Ackermann, Michael Domhardt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 395 Websitebewertung: Der spontane Ersteindruck Leonie Flacke, Rafael Jaron, Meinald T. Thielsch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 399 Wofür brauchen Informatiker_innen das Soziale? Maren Haag, Nicola Marsden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403 Zeitstabilität der Nutzerwahrnehmung: Bewertung von Website-Inhalten Dustin Witte, Gerrit Hirschfeld, Meinald T. Thielsch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 407

Inhaltsverzeichnis

XI

Interaktive Demos A Voice Driven Type Design Demo Matthias Wölfel, Angelo Stitz, Tim Schlippe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413 Eine adaptive Online Banking Anwendung Patrick Münster, Sebastian Kelle, Gottfried Zimmermann . . . . . . . . . . . . . . . . . . . . . . . . . 417 HapRing: A Wearable Haptic Device for 3D Interaction Oscar J. Ariza Nunez, Paul Lubos, Frank Steinicke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 421 Interaktion mit entfernten Displays durch See-Through Augmentation Stefan Kahl, Benedikt Etzold, Maximilian Eibl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 425 Interaktive Kletterwand Fabian Fiess, Felix Hundhausen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 429 iSkin: Stretchable On-Body Touch Sensors for Mobile Computing Martin Weigel, Jürgen Steimle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433 Kollaboratives Text Lesen: Adaptive Text Scroll Geschwindigkeit Christian Lander, Norine Coenen, Sebastian Biewer, Antonio Krüger . . . . . . . . . . . . . . 437 Mid-Air Gestures for Window Management on Large Displays Lars Lischke, Pascal Knierim, Hermann Klinke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 439 persona.fractalis - eine körpergesteuerte 3D-Installation Okan Köse, Christian Mayer, Fabian Bünting, Christian Geiger . . . . . . . . . . . . . . . . . . . 443 Remote Drawing on Vertical Surfaces with a Self-Actuated Display Patrick Bader, Norman Pohl, Valentin Schwind, Niels Henze, Katrin Wolf, Stefan Schneegass, Albrecht Schmidt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 447 The death of a genre: self-driving cars and car racing video games Jens Dobberthin, Jian Wu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 451 The Roaring Hammock Sabiha Ghellal, Nick Mussin, Ann Morrison . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 455 Towards an Optimal Viewpoint in Third-Person out-of-body Experiences Robin Boldt, Matthias Hoppe, Thomas Kosch, Markus Funk, Pascal Knierim, Bastian Pfleging, Niels Henze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 459 Virtual Tones Felix Schäfer, Patrick Schäfer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 463 Visual Analytics in der Studienverlaufsplanung Annette Baumann, Maximilian Endraß, Arturo Alezard . . . . . . . . . . . . . . . . . . . . . . . . . . . 467

XII

Inhaltsverzeichnis

VR-Demonstration „DeepGrip“ Ronja Scherz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 471 Weit weg und doch nah – zwei Technikkonzepte im Familieneinsatz Wasili Adamow, Patrick Beedgen, Eva Lenz, Thies Schneider, Kirstin Kohler, Marc Hassenzahl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 475 Programmkomitees . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 479 Autoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 485

Vorwort Elektronische Medien und digitale Kommunikation sind heute ein fester Bestandteil unseres Alltags. Computertechnologien verändern unser Leben. Software schafft neue Erlebnisse. Informationssysteme ermöglichen neue Formen der Arbeit. Vieles, was heute alltäglich ist, ist ohne moderne Informations- und Kommunikationstechnologie nicht denkbar. Die Gestalterinnen und Gestalter digitaler Technologien haben einen sehr großen Spielraum mit ganz direkten Auswirkungen auf die Lebenswirklichkeit einzelner Menschen. Damit liegt eine große Verantwortung in den Händen der Entwicklerinnen und Entwickler. Auf der Fachkonferenz Mensch und Computer 2015 in Stuttgart präsentieren Forscher und Forscherinnen neue Entwicklungen, diskutieren Ideen und reflektieren über diese Veränderungen. Mit dem Motto „Gemeinsam – Arbeit – Erleben“ wird der Fokus bewusst auf die vielfältigen Herausforderungen im modernen Arbeitsleben gelegt. Der vorliegende Tagungsband enthält die auf der Konferenz präsentierten wissenschaftlichen Lang- und Kurzbeiträge sowie die Dokumentation der interaktiven Demos. Alle Beiträge werden auch in der Digital Library des Fachbereichs MCI unter der URL http://dl.mensch-und-computer.de zur Verfügung gestellt. Die eingereichten Langbeiträge des wissenschaftlichen Teils wurden in einem Doppelblind-Verfahren begutachtet und bei einem Treffen der Associate Chairs in Stuttgart diskutiert. Dabei konnten 25 der 69 eingereichten Beiträge angenommen werde. Ebenfalls im Doppelblind-Verfahren wurden die 63 eingereichten Kurzbeiträge begutachtet und 39 Beiträge angenommen. Durch Expertinnen und Experten begutachtet wurden gleichermaßen die 19 eingereichten interaktiven Demos, von denen 17 angenommen werden konnten. Wir danken an dieser Stelle den Autoren und Autorinnen für die Erstellung der Beiträge. Außerdem bedanken wir uns bei Katrin Wolf und Julie Wagner, den Leiterinnen des Programmkomitees für wissenschaftliche Kurzbeiträge sowie bei Jürgen Scheible und Bastian Pfleging, den Leitern des Programmkomitees für interaktive Demos. Ein besonderer Dank geht an die Associate Chairs, die im Mai den Weg nach Stuttgart auf sich genommen haben, um die Langbeiträge zu diskutieren, und an die Programmkomitees für die Begutachtung und Auswahl der auf der Tagung vorgestellten Beiträge. Die Associate Chairs und die Mitglieder der drei Programmkomitees sind am Ende dieses Bandes aufgelistet. Ein besonderer Dank geht auch an die Proceedings Chairs Miriam Greis, Bastian Pfleging und Valentin Schwind, die

XIV

Vorwort

in mühevoller Kleinarbeit und zahlreicher Kommunikation mit den Autorinnen und Autoren dafür gesorgt haben, die Publikationen im Konferenz- und Workshopband zusammenzuführen. Mensch-Computer-Interaktion zu erleben ist essenziell, um neue Ideen zu verstehen. Unser Fach lebt vom Anfassen, Ausprobieren, Interagieren und Diskutieren. Wir hoffen, die Teilnehmerinnen und Teilnehmer der Konferenz zu inspirieren und den Lesern und Leserinnen einen Überblick über aktuelle Themen der Mensch-Computer Interaktion zu bieten. Stuttgart, im Juli 2015 Sarah Diefenbach, Niels Henze, Martin Pielot

Vorwort

XV

Ein herzliches Dankeschön gilt allen Sponsoren der Mensch und Computer 2015! Platin

Förderschwerpunkt MittelstandDigital, Bundesministerium für Wirtschaft und Energie (BMWi)

Tobii Pro

Gold

Agentur Siegmund GmbH

artop GmbH

Ergosign Ergonomie und Design GmbH

Noldus Information Technology GmbH

Robert Bosch GmbH

SensoMotoric Instruments GmbH (SMI)

User Interface Design GmbH

XVI

Vorwort

Silber

1&1 Internet SE

chilli mind GmbH

Intuity Media Lab GmbH

Mangold International GmbH

Phoenix Design GmbH + Co. KG

Usability.de

UserZoom GmbH

UXQB – International Usability and User Experience Qualification Board e.V.

Walter de Gruyter GmbH

Langbeiträge

S. Diefenbach, N. Henze & M. Pielot (Hrsg.): Mensch und Computer 2015 Tagungsband, Stuttgart: Oldenbourg Wissenschaftsverlag, 2015, S. 3-12.

Flexible Zusammenarbeit in Workshops mittels mobiler Geräte Moritz Wiechers1, Alexander Nolte1, Nina Christmann1, Thomas Herrmann1, Andrea Kienle2 Lehrstuhl für Informations- und Technikmanagement, Ruhr Universität Bochum1 Fachbereich Informatik, FH Dortmund2 Zusammenfassung Wenn man in Workshops mit einer typischen Größe von 6-12 Teilnehmer/innen gemeinsam Modelle von komplexen Sachverhalten (Architekturpläne, Prozessabläufe etc.) erörtert und überarbeitet, ist die Arbeitsteilung häufig ineffizient. Während eine Person Vorschläge unterbreitet, sind andere auf das Zuhören und Beobachten beschränkt und folglich in ihrer Produktivität begrenzt. Daher sieht die Moderation solcher Workshops den Wechsel zwischen Einzelarbeit, Bearbeitung in Kleingruppen sowie Erörterung in der Gesamtgruppe vor. Dienen komplexen Dokumente als Arbeitsgegenstand des Workshops, ist dieser Wechsel zwischen verschiedenen Kooperationsformen schwierig und bedarf technischer Unterstützung. Das Konzept des Einsatzes mobiler Geräte, um mittels Fotografien von Ausschnitten grafischer Modelle die Arbeit zwischen Kleingruppen zu verteilen, wurde implementiert und evaluiert. Das Feedback der Evaluationsteilnehmer charakterisiert den Ansatz als erfolgreich.

1

Einleitung

Moderierte Workshops werden häufig durchgeführt, um Experten mit unterschiedlichen Hintergründen an der Analyse und Neu- bzw. Umgestaltung von Artefakten zu beteiligen (z.B. bei Workshops zur Erarbeitung von Systemanforderungen (Pohl 2010)). Stakeholder erarbeiten dabei gemeinsam ein Workshopergebnis, das zuvor durch einen Moderator festgelegt wurde. Bødker et al. (2009) beschreiben Workshops als einen Teil von IT Design, wobei diese z.B. eingesetzt werden, um den zukünftigen Einsatz eines IT-Produkts zu skizzieren. Dabei werden alle benötigten Informationen gesammelt und gemeinsam analysiert. Das Beispiel von Workshops zur Analyse und Gestaltung von Arbeits- oder Geschäftsprozessen anhand grafischer Modelle erreicht in der Praxis eine hohe Komplexität. Es müssen verschiedene Akteure beteiligt und geeignete Formen der Moderation und der technischen Unterstützung angewendet werden. Entsprechende Ansätze sind unter dem Begriff collaborative modeling in Forschung und Praxis weit verbreitet (Prilla et al. 2013; Renger et al.

4Flexible Moritz Wiechers, Alexander Nolte, Nina Christmann, Thomas Herrmann, Andrea Kienle2 Zusammenarbeit in Workshops mittels mobiler Geräte 2008). Im Zentrum dieser Ansätze stehen graphische Modelle, um Prozesse zu analysieren und sinnvolle Veränderungen zu erörtern (vgl. Dumas, La Rosa, Mendling, & Reijers, 2013). Ein zentrales Problem solcher Ansätze besteht in der Fokussierung auf den Moderator. Dadurch, dass er Wortmeldungen der Teilnehmer entgegennimmt und zurückspiegelt, kann jeweils immer nur ein Teilnehmer gleichzeitig gehört werden. Dieser als facilitator bottleneck (Rouwette et al. 2002) bezeichnete Effekt kann unter Umständen zu langen Wartezeiten und Frustration führen (Prilla & Nolte 2010). Weiterhin kann production blocking (Diehl & Stroebe 1987) auftreten, da Teilnehmer ihre Ideen nicht direkt äußern können, sondern darauf warten müssen, bis sie an der Reihe sind. Um diesem Problem zu begegnen, wurden Ansätze entwickelt, bei denen Teilnehmer jederzeit Ideen beitragen können (Herrmann et al. 2013). Zusätzlich existieren Lösungen, die es verteilten Gruppen erlauben, gemeinsam Prozessmodelle zu bearbeiten (Decker et al. 2008). Entsprechende, auf Tabletops basierte Systeme existieren auch zur Unterstützung synchroner Kollaboration in Workshops (Kolb et al. 2013). Darüber hinaus sind Formen technischer Unterstützung erforderlich, die es Workshopteilnehmern erlauben, sich weitgehend selbständig zu koordinieren und ihre Arbeit in Kleingruppen so aufzuteilen, dass sie phasenweise ohne Moderation auskommen. Daher haben wir einen Ansatz entwickelt und evaluiert, der mobile Endgeräte (Smartphones und Tablets) verwendet, um den Übergang zwischen der Zusammenarbeit in der Gesamtgruppe und Kleingruppenarbeit zu erleichtern. Der Ansatz basiert darauf, dass die Beteiligten mit einem mobilen Endgerät Fotos von Prozessausschnitten anfertigen und als Ausgangspunkt für die spätere Kleingruppenarbeit nutzen. Neben diesem nahtlosen Übergang sind insbesondere Fragen zur Awareness relevant, beispielsweise ob, zu welchem Zeitpunkt und wie Teilnehmer über die Fortschritte der anderen Beteiligten informiert werden müssen. Die in Kapitel 4 beschriebene Evaluation konzentriert sich auf Awareness und den reibungslosen Übergang zwischen Arbeit in der Gesamtgruppe und Kleingruppenarbeit. Im Folgenden werden zunächst aus der Literatur Anforderungen an die technische Unterstützung abgeleitet (Kapitel 2). Anschließend beschreiben wir die Umsetzung (Kapitel 3), die im Rahmen einer Studie evaluiert wurde (Kapitel 4). Wir schließen mit einem Überblick über künftige Entwicklungen und Forschungsfragen (Kapitel 5).

2

Anforderungen an eine Unterstützung flexibler Zusammenarbeit in Workshops

Zur Konzeptionierung des Systemdesigns wurden Anforderungen systematisch anhand von Literatur erhoben. Der Anforderungsfokus liegt dabei auf der Umsetzung von Kollaboration an mobilen Geräten. Der Erfolg von Workshops hängt maßgeblich von den Fähigkeiten des Moderators ab (Bostrom et al. 1993). Zu seinen Hauptaufgaben zählt die Vorbereitung und Strukturierung des Workshops sowie die Auswahl geeigneter Teilnehmer. Die Frage, ob von einer einmal festgelegten Vorgehensweise bei Bedarf abgewichen werden darf (Andersen & Richardson 1997) oder nicht (Bostrom et al. 1993), ist in der einschlägigen Literatur umstritten. Ent-

Flexible Flexible Zusammenarbeit Zusammenarbeit in in Workshops Workshops mittels mittels mobiler mobiler Geräte Geräte

53

scheidend in beiden Fällen ist, dass der Moderator dafür Sorge trägt, dass alle Teilnehmer sich gleichermaßen einbringen können. Dazu ist es bei der Arbeit mit komplexen Artefakten, beispielsweise Prozessmodellen, notwendig, dass sich die Teilnehmer auf fachliche Fragen konzentrieren können, ohne zu sehr von der Bedienung der technischen Unterstützung abgelenkt zu sein. Es ist daher erforderlich, dass das zu verwendende System möglichst einfach und intuitiv zu bedienen ist (Anforderung 1). Arbeiten mehrere Personen gleichzeitig an einem Artefakt, ist bei der Kleingruppenarbeit Awareness (Dourish & Bellotti 1992) über die Aktionen der anderen erforderlich, so dass z.B. für alle sichtbar ist, wer gerade welchen Teil des Artefaktes bearbeitet (Anforderung 2). Wird dasselbe Artefakt von verschiedenen Personen gleichzeitig bearbeitet, kann es passieren, dass die verschiedenen Personen konfliktäre Änderungen am selben Element durchführen. Deshalb müssen Ansätze der Concurrency Control (Ellis & Gibbs 1989) eingesetzt werden, damit das System Inkonsistenzen bei der parallelen Arbeit an einem Artefakt vorbeugt bzw. diese behandeln kann (Anforderung 2). Wie bereits thematisiert kann es vorkommen, dass nicht alle Teilnehmer zu allen Aspekten, die im Rahmen eines Workshop besprochen werden, gleichermaßen beitragen können (bspw. Prilla & Nolte 2010). Aus diesem Grund muss ein möglichst flüssiger und nahtloser Übergang zwischen verschiedenen Kollaborationsformen ermöglicht werden (Anforderung 3). In einem Pretest wurde deutlich, dass der Koordination der Aufgaben eine besondere Rolle zukommt. Es sollte für die Teilnehmer jederzeit möglich sein, die von ihnen zu bearbeitenden Aufgaben anzuzeigen. Das System muss ermöglichen, dass man Informationen über die Aufgaben, die während der Arbeit in der Gesamtgruppe besprochen wurden, später in der Kleingruppenarbeit abrufen kann (Anforderung 5). Nach der Arbeit in Kleingruppen muss der Übergang zurück zur Gesamtgruppenarbeit unterstützt werden. Obwohl die Teilnehmer jederzeit alle Modifikationen mitverfolgen können, ist es notwendig, Gründe für Modifikationen zu erfahren. Dazu gehört eine technische Unterstützung zur Zusammenführung der Ergebnisse aus den Kleingruppen (Anforderung 4).

3

Umsetzung

Zur Umsetzung der zuvor identifizierten Anforderungen wurde ein System entwickelt, das den Übergang zwischen der Arbeit in der Gesamtgruppe und der Arbeit in Kleingruppen durch den Einsatz mobiler Geräte unterstützt. Im Folgenden wird zuerst das Vorgehen und anschließend die technische Realisierung beschrieben.

3.1 Vorgehen Die Basis des Systems bildet ein Prozessmodell, das von den Workshopteilnehmern gemeinsam erarbeitet wird, um einen Prozess graphisch darzustellen. Das entstehende Modell ist während des gesamten Workshops für alle Teilnehmer auf einer Präsentationsfläche sichtbar

6Flexible Moritz Wiechers, Alexander Nolte, Nina Christmann, Thomas Herrmann, Andrea Kienle4 Zusammenarbeit in Workshops mittels mobiler Geräte (siehe Anforderung 2) und wird, basierend auf den Aussagen der Teilnehmer, direkt angepasst. Unterstützt werden die Teilnehmer von einem Moderator, der den Workshop strukturiert und die Diskussion leitet.

Abbildung 1: Schematische Darstellung des Vorgehens

Der Wechsel von der Arbeit in der Gesamtgruppe hin zur Kleingruppenarbeit wird durch den Moderator eingeleitet. Dieser legt gemeinsam mit der Gruppe Aufgaben für die Kleingruppen fest. Die Kleingruppen können sich dann für Aufgaben entscheiden, indem sie von den zugehörigen Bereichen im Modell Fotos anfertigen. Durch das Abfotografieren wird der entsprechende Modellausschnitt auf dem Tablet als Arbeitsbereich für die Gruppe gespeichert und kann zur Bearbeitung aufgerufen werden (siehe Anforderung 5). Dieses Vorgehen kombiniert die Aufgabenverteilung und die Bereitstellung des zu bearbeitenden Artefakts durch das „Mitnehmen“ von Arbeitsbereichen mit mobilen Geräten (siehe Anforderung 4). Da jede Bearbeitung des Modells über die Tablets direkt in dem auf der Präsentationsfläche dargestellten Modell passiert, kann unmittelbar nach der Bearbeitung der Aufgaben mit der Ergebnispräsentation begonnen werden (siehe Anforderung 6).

3.2 Technische Unterstützung Zur Unterstützung des zuvor beschriebenen Vorgehens wurde ein mehrbenutzerfähiger, webbasierter Modellierungseditor entwickelt und im Hinblick auf einfache Bedienung (siehe Anforderung 1) an mobile Endgeräte angepasst (Wiechers et al. 2014). Neben der Anzeige des Modells ermöglicht der Client zahlreiche Veränderungen am Modell. Elemente und Relationen können erzeugt, verschoben, verändert und gelöscht werden.

Flexible Flexible Zusammenarbeit Zusammenarbeit in in Workshops Workshops mittels mittels mobiler mobiler Geräte Geräte

75

Abbildung 2: Die GUI des Editors; Rote Markierung: Element, dass durch einen anderen Benutzer bearbeitet wird.

Beim Wechsel der Kooperationsform werden die Kameras der mobilen Geräte eingesetzt.Der funktionale Ablauf ist in Abbildung 3 dargestellt. Um einen Modellbereich aufzunehmen und zu speichern, wird der gewünschte Bereich des Modells mit der Kamera fokussiert und fotographiert (Schritt 1). Das entstandene Bild wird an einen Server übermittelt (Schritt 2). Der Server vergleicht das Bild mit den Gesamtbildern aller verfügbaren Modelle und nutzt dazu Key-Point-Matching Algorithmen. Zur Feature-Detection wurde der SURF Algorithmus von Bay et al. (2008), zur Descriptor-Extraction der SIFT Algorithmus von Lowe (1999) und zum Descriptor-Matching die FLANN (Fast Library for Approximate Nearest Neighbors)1 benutzt (Schritt 3).2

Abbildung 3: Ablauf der Fotoverarbeitung von Modellbereichen

Die identifizierten Schlüsselpunkte werden für die Ermittlung einer Transformationsfunktion für die Abbildung des aufgenommenen Bildes in das Gesamtbild des Modells benutzt 1

http://www.cs.ubc.ca/research/flann/

2

Die benutzten Algorithmen wurden anhand eines Testsets von Modellen und fotografierten Bereichen ausgewählt.

8Flexible Moritz Wiechers, Alexander Nolte, Nina Christmann, Thomas Herrmann, Andrea Kienle6 Zusammenarbeit in Workshops mittels mobiler Geräte (Schritt 4). Mit Hilfe dieser Abbildungsfunktion werden die Eckpunkte des aufgenommenen Bildes in das Gesamtbild des Modells projiziert und in entsprechende Dokumentkoordinaten des Modells umgerechnet (Schritt 5). Die Ergebnispunkte werden nach dem Übersenden an den Client (Schritt 6) in einer Vorschau angezeigt, die dem Benutzer noch Möglichkeiten zur Korrektur des Bereichs bietet (Schritt 7). Abschließend kann der Benutzer diesen Bereich als Arbeitsbereich für sich lokal abspeichern (Schritt 8) und so später in der Kleingruppenarbeitsphase auf diesen zugreifen (siehe Anforderung 5). Während der Bearbeitung in Kleingruppen wird jeweils der aktuelle Zustand des Modells auf den Tablets und auch auf der Projektionsfläche angezeigt. Zusätzlich werden die Bereiche angezeigt, die die einzelnen Kleingruppen gerade auf ihren jeweiligen Tablets bearbeiten (siehe Anforderung 2). Dadurch können alle Teilnehmer jederzeit sowohl Modifikationen am Modell als auch am Bereich nachvollziehen, an dem eine andere Gruppe gerade arbeitet. Um Inkonsistenzen und Konflikten, die bei gleichzeitiger Arbeit an einem Artefakt auftreten können, zu begegnen, werden ausgewählte Elemente und Relationen für alle anderen Bearbeiter gesperrt und entsprechend hervorgehoben (siehe Anforderung 3, Abbildung 2).

4

Evaluation

4.1 Studienaufbau und Durchführung Die Evaluation diente dazu, Verbesserungsmöglichkeiten des Konzeptes aufzudecken und Empfehlungen für die einzusetzende Awarenessunterstützung abzuleiten. Die Studie sah einen Workshop vor, bei dem ein vorgegebenes Modell verbessert werden sollte. Inhaltlich ging es dabei um die Behandlung eines Wasserrohrbruchs in einer Wohnung. An dem Workshop nahmen sechs Personen teil, die die Rolle der Prozessbeteiligten einnahmen. Zu Beginn des Workshops wurden potentielle Aufgaben für die Kleingruppen besprochen. Diese Phase dauerte ca. 30 Minuten. Die anschließende Kleingruppenphase dauerte ca. 70 Minuten und die Präsentation der Ergebnisse 18 Minuten. Im Anschluss wurde ein Brainstorming durchgeführt, bei dem Fragen bezüglich des Vorgehens und des technischen Systems behandelt wurden (z.B. „Was hat Ihnen bei der Koordination der Zusammenarbeit beim Übergang von Large Screen zu Tablet und zurück gut gefallen?“, „Welche Verbesserungen wünschen Sie sich bzgl. dieser Koordination?“ und „Welche Zukunftswünsche haben Sie zur Unterstützung des Wechsels zwischen Gesamtgruppe und Kleingruppenarbeit?“). Zusätzlich wurde der gesamte Workshop per Video aufgezeichnet und ein Fragebogen zur Usabilityevaluation eingesetzt. Die Studie verlief gemäß dem in Abschnitt 3 beschriebenen Vorgehen: Zu Beginn haben die Beteiligten grob die gewünschten Änderungen am Modell in der Gesamtgruppe diskutiert und aufgeteilt. Die Kleingruppen haben dazu mittels der Tablets den zu ändernden Bereich auf der Präsentationsfläche abfotografiert, um diesen als Arbeitsbereich für die Kleingruppe zu definieren. Nach dieser Phase begann die parallele Modellierung an den Tablets. Dabei konnten die Gruppen frei entscheiden, in welcher Reihenfolge sie die zuvor definierten Auf-

Flexible Flexible Zusammenarbeit Zusammenarbeit in in Workshops Workshops mittels mittels mobiler mobiler Geräte Geräte

97

gaben bearbeiten. Anschließend haben die Kleingruppen ihre Ergebnisse vorgestellt. Auf die Bearbeitung folgte ein Brainstorming, bei dem die Teilnehmer Anmerkungen bezogen auf das Vorgehen der Studie und die technische Unterstützung machen konnten.

4.2 Studienergebnisse Die Antworten der Teilnehmer während des Brainstormings und die Auswertung der Fragebögen zeigen, dass das eingesetzte System bei der Koordination der Zusammenarbeit von der Gesamtgruppe hin zur Kleingruppenarbeit zu einem reibungslosen Übergang beiträgt. So wurde die Möglichkeit des Abfotografierens als „überaus hilfreich“ beschrieben und als ein „nahtloser Übergang vom Arbeiten an der Präsentationsfläche zum Arbeiten auf dem Tablet“ bezeichnet (siehe Anforderung 4). Das Erstellen von Arbeitsbereichen wurde als angenehme „Merkfunktion“ bewertet und stellte für die Teilnehmer eine alternative „Navigation im Modell“ dar. Das Fotografieren und Abspeichern der Arbeitsbereiche erleichterte es den Teilnehmern bei späterer Bearbeitung zur gemerkten Stelle bzw. festgehaltenen Aufgabe zu springen (siehe Anforderung 5). Neben Anmerkungen zur Benutzbarkeit, wie der Prototyp „läuft flüssig“, ist „einfach zu bedienen“ und das „schnelle ‘Mitnehmen‘ hat geklappt“, wurde die „Sichtbarkeit der Arbeitsbereiche“ und der „Überblick auf Large Screen“ besonders positiv hervorgehoben (siehe Anforderung 1 und 2). Die Präsentationsphase wurde als „angenehme Alternative“ zur klassischen Präsentation vor der Gruppe und als „Möglichkeit schüchterne Personen stärker zu involvieren“ angesehen und führte laut Aussagen der Teilnehmer dazu, die Veränderungen der anderen Gruppen nachzuvollziehen (Anforderung 6). Zur Untermauerung der zuvor beschriebenen Anmerkungen kam ein Usability-Fragebogen zum Einsatz, der auf den Fragen von Nielsen (1994) basiert. Der Fragenbogen wurde um Fragen bezogen auf den Gesamteindruck erweitert. Die Software wurde insgesamt positiv bewertet [µ = 4.83, σ = 0.373]. Vier der sechs Teilnehmer gaben an, dass die angebotenen Funktionen schnell und auf unterschiedliche Weise erreicht werden und Aufgaben effizient erledigt werden konnten. (siehe Anforderung 1). Die anderen zwei Teilnehmer bewerteten diese Aussage mit „neutral“. Lediglich bezogen auf den Punkt Reversibilität [µ = 2, σ = 0.577] sahen die Teilnehmer Verbesserungsbedarf. Neben ersichtlichen Ergebnissen von Interaktionen [µ = 3.83, σ = 1.067] und klaren, verständlichen Formulierungen [µ = 4, σ = 1.155] wurde die einheitliche Gestaltung des Prototypen positiv bewertet [µ = 4.17, σ = 0.687]. Die Ergebnisse bestätigen, dass das entwickelte Konzept einen reibungslosen Wechsel zwischen den beschriebenen Kollaborationsformen ermöglicht. Im Folgenden werden Verbesserungsvorschläge bezogen auf die Gestaltung von Systemen zur Unterstützung der Integration verschiedener Kollaborationsformen innerhalb eines Workshops beschrieben. Awarenessunterstützung anpassen Wie eingangs beschrieben, stellt die Awareness bezogen auf die Tätigkeit anderer Akteure im Rahmen von Joint-Editing eine große Herausforderung dar (Anforderung 2). Die Teilnehmer der Studie gaben an, dass es für sie eine Hilfe sei, zu sehen, an welcher Stelle eines Artefakts andere Gruppen aktiv sind und welche Elemente sie bearbeiten. Allerdings wurde

10 Moritz Wiechers, Alexander Nolte, Nina Christmann, Thomas Herrmann, Andrea Kienle8 Flexible Zusammenarbeit in Workshops mittels mobiler Geräte auch angemerkt, dass z.B. das kontinuierliche Anzeigen der Sichtbereiche von anderen Gruppen auf dem Tablet störend und überfordernd sei und deshalb nur auf der Präsentationsfläche angezeigt werden sollte. Einige Teilnehmer merkten zusätzlich an, dass sie einen Hinweis darauf benötigen, welchen Aufgabenbereich die anderen Gruppen bereits abgearbeitet haben und an welcher Aufgabe sie im Moment arbeiten. Dazu müssten Aufgaben als erledigt markiert werden können. Arbeitsbereiche benötigen zusätzliche Metainformationen Obwohl den Teilnehmern nach eigener Angabe in vielen Fällen eine bildhafte Darstellung des Arbeitsbereichs zur Identifizierung der damit verbundenen Aufgabe ausreicht, gaben sie an, dass es für andere Gruppen hilfreich sei, sich z.B. anhand eines Stichwortes an die zuvor besprochene Aufgabe zu erinnern. Zusätzlich ermögliche diese Art von Metainformationen eine sinnvollere Darstellung der gesammelten Aufgaben in Form von Arbeitsbereichen auf dem mobilen Gerät. Aufgabenverteilung sollte durch das System unterstützt werden Ein Großteil der Verbesserungsvorschläge bezog sich auf das Vorgehen bezüglich der Aufgabenverteilung. So wurde vorgeschlagen, dass Aufgaben direkt nach deren Besprechung in der Gesamtgruppe mit der Kamera aufgenommen werden sollten und nicht wie in der Studie alle Aufgaben zunächst gesammelt (z.B. in Form einer separaten Aufgabenliste) und im Anschluss abfotografiert werden. Um den Übergang zur Kleingruppenarbeit noch nahtloser zu gestalten, wurde vorgeschlagen, nach der Aufnahme eines Aufgabenbereichs vom System automatisch eine Aufgabenliste erstellen zu lassen (siehe Anforderung 4) und eine zentrale Aufgabenliste auf der Projektionsfläche anzuzeigen. Dynamische Zuordnung von Aufgaben kann Problemen vorbeugen Manche Gruppen waren in der Aufgabenbearbeitung schneller als andere Gruppen. Dies könnte einerseits an der Arbeitsgeschwindigkeit der jeweiligen Gruppe liegen oder andererseits an der Unterschiedlichkeit der Aufgaben. Um diesem Problem entgegenzuwirken, sollte es laut Aussagen der Teilnehmer möglich sein, Aufgaben während der Bearbeitungsphase neu zu verteilen. Die Umsetzung könnte bspw. zentral über die Präsentationsfläche ermöglicht werden. Zusätzlich könnte dies durch die Kleingruppen initiiert werden, wenn sie selbst Unterstützung benötigen oder dies bei anderen Kleingruppen bemerken. Als Indikator zur Selbsteinschätzung könnte anhand der zuvor beschriebenen Möglichkeit, Aufgaben als erledigt zu markieren, ein Fortschrittsindikator für jede Gruppe in der zentralen Aufgabenliste angezeigt werden.

5

Fazit und Ausblick

Die Ergebnisse der Studie zeigen, dass das entwickelte System den Anforderungen gerecht wird und der entstandene nahtlose Übergang von der Arbeit in der Gesamtgruppe hin zur Kleingruppe eine Möglichkeit bietet, Kleingruppenarbeit in Prozessmodellierungsworkshops

Flexible Flexible Zusammenarbeit Zusammenarbeit in in Workshops Workshops mittels mittels mobiler mobiler Geräte Geräte

119

flexibel einzusetzen. Zusätzlich wurden Verbesserungsvorschläge bezogen auf das Vorgehen und auf das technische System gesammelt, die zu einer höheren Flexibilität beitragen. Prozessmodellierung ist nur ein Beispiel für die gemeinsame Arbeit an Artefakten. Auch in anderen Szenarien, wie der Erarbeitung von Systemanforderungen (Pohl 2010) oder dem Skizzieren des zukünftigen Einsatzbereichs eines IT-Produkts (Bødker et al. 2009), wird an gemeinsamen Artefakten gearbeitet. Die gewonnenen Erkenntnisse sind auf diese Bereiche übertragbar. Auch im Rahmen von Workshops zur Systemanforderungserhebung kommt es bei dem Wechsel der Kollaborationsform darauf an, diesen möglichst nahtlos zu gestalten und eine flexible Aufgabenumverteilung während der parallelen Arbeit zu ermöglichen. Selbiges gilt für die Gestaltung der Awarenessunterstützung. Unabhängig von dem Zweck des Workshops sollte bei paralleler Arbeit stets genau überlegt werden, welche Informationen in welcher Form wann dem Benutzer angezeigt werden, um ihn auf der einen Seite genügend über die Aktivität der anderen zu informieren, auf der anderen Seite nicht mit zu vielen Informationen zu überfordern. Das hier entwickelte System ermöglicht neben der in der Studie durchgeführten Kombination von Arbeit in der Gesamtgruppe und Kleingruppe auch den Wechsel von der Arbeit in der Gesamtgruppe zur individuellen, parallelen Arbeit. So ist es auch denkbar, dass sich nur ein kleiner Teil der Beteiligten eines Workshops aus diesem zurückzieht und in Kleingruppen parallel dazu arbeitet. Neben der Verteilung anstehender Aufgaben im Rahmen eines Workshops ist eine weitere Anwendungsmöglichkeit für das System die Ausgestaltung von Alternativvorschlägen bei Unstimmigkeiten über einzelne Aspekte des Artefakts in der Gruppe, die anschließend vergleichend in der Gesamtgruppe besprochen werden können. Ein weiterer Aspekt, der im Rahmen der Studie nicht betrachtet wurde, ist, inwieweit sich eine parallele Arbeit z.B. in Kleingruppen im Vergleich zur gemeinsamen Bearbeitung des Artefaktes auf die Qualität und auf das gemeinsame Verständnis der Teilnehmer bezüglich des Inhaltes des Artefaktes auswirkt. Referenzen Andersen, D.F. & Richardson, G.P. (1997). Scripts for group model building. System Dynamics Review. 13(2), 107–129. Bay, H., Ess, A., Tuytelaars, T. & Gool, L. Van (2008). Speeded-up robust features (SURF). Computer vision and image understanding. 110(3), 346–359. Bødker, K., Kensing, F. & Simonsen, J. (2009). Participatory IT Design: Designing for Business and Workplace Realities. MIT press Bostrom, R.P., Anson, R. & Clawson, V.K. (1993). Group facilitation and group support systems. in Jessup, L.M. & Valacich, J.S. (eds.): Group support systems: New perspectives. Macmillan, S. 146–168. Decker, G., Overdick, H. & Weske, M. (2008). Oryx–an open modeling platform for the BPM community. in Business process management. Springer, S. 382–385. Diehl, M. & Stroebe, W. (1987). Productivity loss in brainstorming groups: toward the solution of a riddle. Journal of personality and social psychology. 53(3), 497–509.

12 Moritz Wiechers, Alexander Nolte, Nina Christmann, Thomas Herrmann, Andrea Kienle Flexible Zusammenarbeit in Workshops mittels mobiler Geräte 10 Dourish, P. & Bellotti, V. (1992). Awareness and coordination in shared workspaces. CSCW ’92: Proceedings of the 1992 ACM conference on Computer-supported cooperative work, 107–114. New York, NY, USA: ACM. Dumas, M., Rosa, M. La, Mendling, J. & Reijers, H.A. (2013). Fundamentals of Business Process Management. Springer. Ellis, C.A. & Gibbs, S.J. (1989). Concurrency control in groupware systems. SIGMOD ’89: Proceedings of the 1989 ACM SIGMOD international conference on Management of data, 399–407. New York, NY, USA: ACM. Herrmann, T., Nolte, A. & Prilla, M. (2013). Awareness support for combining individual and collaborative process design in co-located meetings. Computer Supported Cooperative Work (CSCW). 22(2), 241–270. Kolb, J., Rudner, B. & Reichert, M. (2013). Gesture-Based Process Modeling Using Multi-Touch Devices. International Journal of Information System Modeling and Design. 4(4), 48–69. Lowe, D.G. (1999). Object recognition from local scale-invariant features. Computer vision, 1999. The proceedings of the seventh IEEE international conference on. 2, 1150–1157. Ieee. Nielsen, J. (1994). Heuristic Evaluation. Usability inspection methods, 25–62. Wiley. Pohl, K. (2010). Requirements engineering: fundamentals, principles, and techniques. Springer Publishing Company, Incorporated. Prilla, M., Nolte, A., Herrmann, T., Kolfschoten, G. & Lukosch, S. (2013). Collaborative Usage and Development of Models: State of the Art, Challenges and Opportunities. International Journal for e-Collaboration. Prilla, M. & Nolte, A. (2010). Fostering self-direction in participatory process design. Proceedings of the eleventh conference on Participatory Design 2010, 227–230. ACM Renger, M., Kolfschoten, G.L. & Vreede, G.J. De (2008). Challenges in collaborative modelling: a literature review and research agenda. International Journal of Simulation and Process Modelling. 4(3), 248–263. Rouwette, E.A.J.A., Vennix, J.A.M. & Mullekom, T. (2002). Group model building effectiveness: a review of assessment studies. System Dynamics Review. 18(1), 5–45. Wiechers, M., Nolte, A., Ksoll, M. & Herrmann, T. (2014). Using mobile devices to overcome idle times in modelling workshops. Mensch & Computer 2014-Workshopband.

S. Diefenbach, N. Henze & M. Pielot (Hrsg.): Mensch und Computer 2015 Tagungsband, Stuttgart: Oldenbourg Wissenschaftsverlag, 2015, S. 13-22.

Förderung von informellen Kontexten und Awareness in Scrum-Teams Jan Schwarzer, Susanne Draheim, Kai von Luck Department Informatik, Hochschule für Angewandte Wissenschaften Hamburg Zusammenfassung Awareness und informelle Kommunikation sind zentrale Bestandteile einer effektiven Zusammenarbeit in Scrum-Teams. Oft fehlt es jedoch an wichtigen Informationen für die tägliche Arbeit, da diese z. B. in den verwendeten Systemen versteckt oder nicht zugänglich sind. Auch werden informelle Kontexte nur unzureichend technisch unterstützt. Das Ambient Surface-System als ein Ambient Display ermöglicht es, diesen Herausforderungen zu begegnen. Neben der Förderung von Awareness, macht es Informationen in informellen Situationen zugänglich. Dieser Beitrag untersucht eine solche Lösung und ihren Einfluss auf die täglichen Arbeitsprozesse in einem agilen Software-Entwicklungsumfeld. Es wurden quantitative und qualitative Nutzungsdaten erhoben und inhaltsanalytisch sowie statistisch ausgewertet. Präsentiert werden ausgewählte Ergebnisse aus einer seit Februar 2014 andauernden Fallstudie, welche in Kooperation mit einem Projektpartner aktuell durchgeführt wird.

1

Einleitung

Im Forschungsfeld der Computer Supported Cooperative Work (CSCW) hat die Untersuchung von Awareness in ihren unterschiedlichen Ausprägungen mittlerweile eine breite Erkenntnisbasis erbracht (Dourish & Bellotti 1992; Röcker et al. 2004). Die grundsätzliche Förderung von Awareness erlaubt zum einen die Vermeidung doppelter Arbeitsschritte und zum anderen fein abgestimmte Prozesse (Dourish & Bellotti 1992). Awareness ist damit ein wichtiger Bestandteil kollaborativer Arbeiten (Röcker et al. 2004). Auch in SoftwareEntwicklungsteams spielt Awareness eine wichtige Rolle (Kraut & Streeter 1995). Neben der Verständigung auf ein gemeinsames Projektziel sind beispielsweise der regelmäßige Informationsaustausch oder das Abhalten von Meetings typische Arbeitsschritte. Ein großer Unterschied zu Gruppenkontexten, wo gemeinsames Arbeiten und dessen Schritte für jede Person einsehbar sind, ist, dass in der Software-Entwicklung dies durch den Einsatz digitaler Tools nachzubilden versucht wird. Gleichzeitig erhöht dies jedoch deutlich den Aufwand, sich über die stattfindenden Veränderungen in dieser geteilten und hybriden Welt bewusst zu bleiben (Biehl et al. 2007).

14 Jan Schwarzer, Susanne Draheim, Kai von Luck2 Förderung von informellen Kontexten und Awareness in Scrum-Teams Agile Methoden finden in der Software-Entwicklung zunehmend Verbreitung (Cho 2009). Diese Ansätze versuchen unter anderem durch kurze und iterative Entwicklungszyklen, die Team-Awareness und -Interaktion zu fördern (Biel et al. 2007). Ganz allgemein rücken agile Vorgehensmodelle vermehrt Individuen und ihre Interaktionen in den Fokus und weniger Prozesse und Tools an sich (Cho 2009). Scrum, als ein beliebter Vertreter dieser Methoden, bringt eine Vielzahl von Methoden und Werkzeugen mit sich (Cho 2009). Neben unterschiedlichen Rollen und Verantwortlichkeiten der Team-Mitglieder (z. B. Scrum Master oder Product Owner) sieht Scrum zudem unterschiedliche Modelle zur regelmäßigen (z. B. Sprint Planning) sowie teilweise täglichen (z. B. Daily Scrum) Koordination vor. Gleichwohl fehlt es häufig an Möglichkeiten, die fortlaufenden Aktivitäten von Team-Mitgliedern effektiv sichtbar zu machen (Biehl et al. 2007). Nach Kraut und Streeter (1995) erlaubt der Einsatz formaler Arbeitstechniken (z. B. Sprachspezifikationen) heutzutage das Entwickeln qualitativ hochwertiger Software-Lösungen. Dennoch helfen diese Techniken nur bedingt, wenn es um die Koordination von Prozessen geht. Es fehlt an Lösungen, die die Unterstützung informeller Kommunikation in den Blick nehmen. Informelle Kommunikation ist der primäre Kanal des Informationsflusses in Software-Entwicklungsabteilungen und erleichtert darüber hinaus den Zugang zu Informationen. In einer Studie zeigen LaToza et al. (2006), dass Software-Entwickler/innen bis zu 40 % ihrer täglichen Arbeitszeit damit verbringen, über produzierten Quelltext in (nicht) geplanten Meetings oder beispielsweise über E-Mail miteinander zu kommunizieren. Das Ambient Surface-System, eine Kombination aus einer Software-Lösung und einem interaktiven Bildschirm, nimmt sich dieser Herausforderung an und macht gezielt Informationen im sozialen Kontext von Team-Strukturen zugänglich. Dies erreicht es durch (a) die Installation des Systems als ein Ambient Display (Röcker et al. 2004) in das periphere Umfeld der Teams und (b) die Präsentation von relevanten und prozessbezogenen Informationen, die zuvor in Interviews sowie Beobachtungen identifiziert wurden. Seit 2013 entwickelt sich das System in mehreren Teilstudien (z. B. Schwarzer et al. 2013) weiter und ist aktuell seit Februar 2014 im Einsatz bei einem weiteren Projektpartner. Bisherige Untersuchungen zeigen das Potential der Anwendung und den Mehrwert für die tägliche Arbeit der dortigen ScrumTeams. Insbesondere über den in der Literatur (Koch & Ott 2011) beschriebenen Neuheitseffekt hinaus, zeigt das System einen Nutzen für die Mitarbeiter/innen. Dieser Beitrag fasst ausgewählte Ergebnisse der laufenden Nutzungsstudien des vergangenen Jahres zusammen.

2

Forschungskontext

Eine Vielzahl von Forschungsarbeiten im Bereich von CSCW widmet sich bereits der Untersuchung von Ambient-Lösungen in unterschiedlichen Anwendungskontexten. Im Folgenden werden einige ausgewählte Arbeiten vorgestellt und die Schwerpunkte der eigenen Herangehensweise erläutert und abgegrenzt.

Förderung Förderung von von informellen informellen Kontexten Kontexten und und Awareness Awarenessin inScrum-Teams Scrum-Teams

153

2.1 Verwandte Arbeiten Ein System zur Förderung von Awareness sowie zur Steigerung der Sichtbarkeit und damit Wertschätzung der Arbeit sind so genannte IdeaMirrors (Koch & Ott 2011). Bei dieser Lösung werden große und interaktive Bildschirme dazu eingesetzt, Innovationsprozesse in Unternehmen zu optimieren. Dies geschieht zum einen durch die aktive Einbindung aller Beteiligten der Wertschöpfungskette in den Prozess der Ideengenerierung und zum anderen durch die Platzierung des Systems im semi-öffentlichen Raum des Unternehmens. Über ein Web-basiertes Formular können Personen eigene Ideen einbringen, welche im Anschluss auf den Bildschirmen sichtbar sind. Über die interaktive Oberfläche können alle Ideenvorschläge eingesehen und bewertet werden. Die grundlegende Motivation ist die Tatsache, dass Innovationen in Unternehmen insbesondere von der Motivation der eigenen Belegschaft, Kunden und Partner abhängen, um letztendlich Produkte wie auch Prozesse zu verbessern. Die CommunityWall (Snowdon & Grasso 2002) ist ein System zur generellen Förderung des Informationsaustauschs in Abteilungen. Auch dieses System nutzt eine Web-basierte Plattform zum Beitragen neuer Informationen. Als Basis dient hier ein Vorschlagssystem, welches automatisch um Kommentare und Feedback angereicherte Informationen sichtbar macht. Zwei interaktive Bildschirme an unterschiedlichen Standorten wurden genutzt, um den Zugang zu diesen Informationen zu ermöglichen. Die CommunityWall fokussiert insbesondere das Aufheben von Informationsbarrieren, die durch die Zerstreuung wichtiger Informationen auf unterschiedlichen Systemen in Unternehmen auftreten können. FASTDash (Biehl et al. 2007) ist beispielsweise eine Anwendung, welche die Sichtbarkeit der Aktivitäten einzelner Team-Mitglieder in der agilen Software-Entwicklung verbessern soll. Grundlage ist hierbei die Randbedingung, dass Software-Entwickler/innen einen Großteil ihrer Arbeitszeit damit verbringen, sich über die Aktivitäten von Kolleg/innen zu informieren. Darüber hinaus fördert dieses System die Möglichkeiten des informellen Austauschs. Erreicht wird dies durch ein in die Entwicklungsumgebung eingebettetes Plug-in, die Nutzung von so genannter Revision Control Software und das Projizieren der erfassten Informationen über einen Beamer im Entwicklungsbüro.

2.2 Abgrenzung In hohem Maße existieren bisher Evaluationsstudien, welche nur in begrenzten Testzeiträumen (z. B. wenige Wochen) Untersuchungen durchführen, so dass die Ergebnisse auf einen längeren Einsatz schwer übertragbar sind (Satyanarayan et al. 2013; McCarthy et al. 2008). Es fehlt an längerfristigen Erfahrungen mit solchen Ambient-Systemen, welche sich im Unternehmenseinsatz nachhaltig durchsetzen können (Koch & Ott 2011) aber auch an DesignEmpfehlungen für solche Anwendungen (Huang et al. 2006). Uns sind bislang keine Arbeiten bekannt, welche Ambient Displays in Scrum-Teams einsetzen und die sich daraus ergebenen Veränderungen von Arbeitsprozessen sowie die Entstehung neuer Nutzungskontexte in einer Langzeitstudie untersuchen und dokumentieren. Unsere Arbeiten fokussieren sich auf den langfristigen Einsatz von Ambient-Ansätzen im Kontext von Scrum-Teams. Die zugrunde liegende Prämisse der begleitenden Nutzungsstudien ist dabei der anhaltende For-

16 Jan Schwarzer, Susanne Draheim, Kai von Luck4 Förderung von informellen Kontexten und Awareness in Scrum-Teams schungsbedarf im Bereich von Evaluationsmethoden bei der Nutzung von SoftwareSystemen sowie auch innerhalb der Software-Entwicklung selbst. In jüngerer Zeit gibt es vermehrt Studien, die die Bedeutung von deskriptiven und empirischen Methoden aus der qualitativen Sozialforschung wie etwa (teilnehmender) Beobachtungen sowie Interviews betonen (Tichy & Padberg 2007). Allerdings sind solche Vorgehensweisen sowohl bei der Datenerhebung als auch in ihrer Auswertung notwendigerweise aufwändig und gehen mit hohem Ressourcenaufwand einher. Gleichwohl ist der Mehrwert von sogenannten mixed methods – und Feldarbeit im Besonderen – nicht hoch genug einzuschätzen. Ergebnisse quantitativer Erhebungen können durch qualitative Verfahren kontextualisiert, mit Nutzer/innen (kommunikativ) validiert werden und bieten damit hohes Erkenntnispotential für die nachhaltige Implementierung von Software-Systemen (Tichy & Padberg 2007).

2.3 Ambient Surface-System Grundlage für die Untersuchungen ist das Ambient Surface-System. Es besteht aus einer Hardware- (Touch-fähiger Bildschirm) und Software-Komponente, welche für das Selektieren und Visualisieren von Daten zuständig ist. In mehreren Experten-Meetings wurde bis Februar 2014 am System und seinem Informationsangebot gearbeitet. Zwei Ziele haben dabei insbesondere die Abstimmungen und Arbeiten beeinflusst: (1) Die Steigerung der generellen Sichtbarkeit der für die Entwicklungsabteilung wichtigen Informationen und (2) der Zugang zu den Informationen in informellen Kontexten. Die für die tägliche Arbeit der Scrum-Teams wichtigen Tools (Atlassian JIRA, Atlassian Confluence und Jenkins) wurden untersucht und relevante von nicht relevanten Informationen in Abstimmung abgrenzt. Im Ergebnis stellt das Ambient Surface-System vier unterschiedliche Informationsartefakte zur Verfügung: (1) Aktivitäten (Arbeiten an Vorgängen) aus JIRA, (2) Build-Informationen aus Jenkins, (3) Sprint Chart-Diagramme der Teams aus JIRA und (4) eine Wiki-Seite mit weiterführenden Informationen zu den Vorgängen in JIRA aus Confluence. Alle Inhalte werden automatisch bezogen und in regelmäßigen Abständen aktualisiert. Es bedarf keiner Administration oder aktiven Inhaltsgenerierung, damit das System arbeiten kann. Weiter wird sich verschiedener Mechanismen bedient, um beispielsweise neue Inhalte hervorzuheben (alternative Farbgebungen oder blinkende Effekte). Außerdem existieren unterschiedlich granulare Informationsebenen, um das Informationsangebot entsprechend aufzubereiten. Die Default-View zeigt Informationen in abstrakter Form, hauptsächlich mit Hilfe von Icons oder farblichen Hervorhebungen. Die Detail-View, welche durch einen Klick auf ein Element der Default-View sichtbar wird, präsentiert hingegen weiterführende Informationen (z. B. Fehlerinformationen aus Jenkins). Neben einer Ansicht zweier Informationsbereiche (rechts), zeigt Abbildung 1 die derzeitige Installation des Systems (links). Der Projektpartner beschäftigt rund 400 Mitarbeiter/innen und hat sich auf die Produktentwicklung für die Pharma- und Biotech-Industrie spezialisiert. Seit einigen Jahren wird für die fünf Produktteams Scrum als agiles Vorgehensmodell eingesetzt. Trotz der sich daraus ergebenen Vorteile für die Abteilung, existieren weiterhin Herausforderungen. Neben der teilweise geringen Sichtbarkeit von bestimmten Informationen sowie Prozessabläufen, steigt der Kommunikationsbedarf und es bleibt eine permanente Aufgabe, die verschiedenen Scrum-Teams täglich untereinander zu synchronisieren.

Förderung Förderung von von informellen informellen Kontexten Kontexten und und Awareness Awarenessin inScrum-Teams Scrum-Teams

175

Das Gebäude besitzt ein Unter- und Obergeschoss und bietet Platz für bis zu 70 Mitarbeiter/innen. Personen unterschiedlicher Verantwortlichkeiten arbeiten in diesem Haus. Dazu zählen Software-Entwickler/innen, Scrum Master, Product Owner, die Abteilungsleitung sowie Administrator/innen. Im Untergeschoss (Aula-Bereich) wurde das System in Form eines 46 Zoll großen und Touch-fähigen Monitors in einer Ständerinstallation platziert.

Abbildung 1: Das Ambient Surface-System bei dem Projektpartner im Einsatz (links) und zwei ausgewählte Informationsbereiche (rechts).

Dieser Ort zeichnet sich insbesondere dadurch aus, dass in diesem (a) die meisten Durchquerungen am Tag passieren, (b) sich Getränke, ein Billard-Tisch und Drucker befinden und (c) tägliche Meetings durchgeführt werden. Weiterhin ist dieser Raum der einzige Zugang zu den meisten Büros (gesamtes Obergeschoss), zur Küche und zum Konferenzraum. Durch die Wahl dieser Lokation ist das Ambient Surface-System im sozialen Umfeld den Menschen zugänglich, fern ab vom herkömmlichen Arbeitsplatzrechner.

3

Forschungsdesign

Die vorliegende Herangehensweise verbindet methodisch die Erhebung und Auswertung von deskriptiven und quantitativen Nutzungsdaten (d. h. Interaktionsdaten der Anwendung). Auch qualitative Daten, wie Feldnotizen aus teilnehmender Beobachtung, ein inhaltsanalytisch ausgewertetes Experteninterview und Ergebnisse regelmäßiger Gespräche mit Mitarbeiter/innen sowie E-Mails, zählen dazu. Dies macht informelle Kommunikationsprozesse für agile Software-Entwicklung explizit und für die nachhaltige Systementwicklung nutzbar. Die zugrunde liegenden leitenden Fragestellungen der begleitenden Evaluation sind: 1. Wie wird das Ambient Surface-System in der täglichen Arbeit eingesetzt (z. B. Einsatz am Rande von Meetings)? Zentral ist hierbei, wie diese Nutzung in (bestehenden) informellen und spontanen Situationen konkret aussieht. 2. Welche neuen informellen Kontexte können durch den Systemeinsatz ausgemacht werden (z. B. individuelle Informationsaufnahme im Vorbeigehen)? 3. Welchen Einfluss nimmt das System auf die Informationssichtbarkeit? Gibt es z. B. veränderte Arbeitsprozesse aufgrund von sichtbar gemachten Informationen?

18 Jan Schwarzer, Susanne Draheim, Kai von Luck6 Förderung von informellen Kontexten und Awareness in Scrum-Teams Die bisherigen Datenerhebungen und -auswertungen sind in zwei Phasen durchgeführt worden, die in der Gesamtauswertung in Anlehnung an die Grounded Theory nach Glaser & Strauss (2010) integriert werden sollen. Dies ist Teil zukünftiger Forschungsaktivitäten. Die in der vorliegenden Fallstudie verwendeten Datenerhebungs- und Auswertungsschritte sind: • Phase I – Datenerhebung: Erheben von Interaktionsdaten des Ambient SurfaceSystems über insgesamt rund zehn Monate. • Phase I – Datenauswertung: Begleitende statistische Auswertung und visuelle Aufbereitung von Nutzungsverläufen. Diese bilden die Grundlage für die Erstellung des Leitfadens für das Experteninterview. Das Endergebnis dieser Erhebungsphase ist die inhaltsanalytische Auswertung des Experteninterviews (Mayring 1993). • Phase II – Datenerhebung: Durchführung teilnehmender Beobachtung (eine Arbeitswoche zu den täglichen Kernarbeitszeiten im Unternehmen). In dieser Beobachtungsphase werden anlassbezogen Ad-hoc-Interviews mit Systemnutzer/innen im direkten Arbeitsumfeld und am Ambient Surface-System selbst durchgeführt. • Phase II – Datenauswertung: Das Ergebnis dieser Erhebungsphase sind umfangreiche Feldnotizen, aufbereitet in einem Beobachtungsprotokoll (Flick 2012).

4

Ergebnisse

Das Ambient Surface-System befindet sich seit Februar 2014 im Einsatz. Dieser Abschnitt präsentiert erste Ergebnisse aus dieser Zeit. Besonderes Augenmerk wird dabei auf Erkenntnisse aus der Phase nach dem einleitend beschriebenen Neuheitseffekt gelegt.

4.1 Log-Ereignisse Zunächst wird ein Einblick in die Nutzung des Systems auf Basis von Interaktionsdaten präsentiert, welche gleichzeitig nur einen Ausschnitt (Veränderungen der aktuellen Sicht) der tatsächlichen Nutzung vor Ort zeigen. Die Auswertung basiert auf der Protokollierung verschiedener Interaktionstypen in einer Log-Datei im Dateisystem. Neben Touchdown-Events (d. h. eine Person berührt die Oberfläche), werden hier Touchmove-Events (d. h. eine Person bewegt ihren Finger über die Oberfläche) sowie Touchup-Events (d. h. eine Person löst den Kontakt mit der Oberfläche wieder) erfasst und unterschieden. Abbildung 2 zeigt die Nutzung des Systems zwischen den Kalenderwochen 25 und 48 im Jahr 2014. Aufgrund von Krankheitswellen, Urlauben, Schulungen oder Ereignissen, wie Sprint-Planungen oder -abschlüssen, variierte die Nutzung in dem genannten Zeitraum zum Teil sehr stark (vgl. Kalenderwochen 26 und 38). In der gesamten Zeitspanne fielen durchschnittlich 203 Interaktionen (Touchdown-Events) mit dem System pro Woche an. Zum Vergleich: In der Zeit nach der Installation des Systems (KW 8–13) belief sich der Durchschnitt noch auf knapp 2.180 Interaktionen (Touchdown-Events) pro Woche. Grund dafür war vor allem der anfängliche „Entdecker- und Spieltrieb“ (Koch & Ott 2011).

Förderung Förderung von von informellen informellen Kontexten Kontexten und und Awareness Awarenessin inScrum-Teams Scrum-Teams

197

Anzahl Interaktionen (Touchdown-Events)

500 450 400 350 300 250 200 150 100 50 0 25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

Kalenderwochen (2014)

Abbildung 2: Interaktionen (Touchdown-Events) pro Kalenderwoche.

Am häufigsten wurde das System zur Mittagszeit, zwischen 12:00 Uhr und 14:00 Uhr, verwendet. Neben diesem Nutzungshoch, gab es höhere Ausschläge am Morgen (10:30 Uhr) und am Nachmittag (16:00 Uhr), was insbesondere durch Meetings auf dem Flur und spontane Anlässe (z. B. ein Getränk holen) zu begründen ist. In der zuvor genannten Zeitspanne konnten 138.469 Touch-Events (davon 4.865 Touchdown-Events) mit dem System ermittelt werden. Der Tag mit der höchsten Nutzung war der Mittwoch (1.295), gefolgt von Donnerstag (965), Dienstag (960), Freitag (843) sowie Montag (802). Die insgesamt vier Informationsbereiche des Systems zeigten unterschiedliche Nutzungsmuster auf. So entfielen 42 % aller Interaktionen auf das Hauptfenster. Dies ist dadurch zu begründen, dass die derzeit gewählte Darstellung der Informationen mehr Platz einnimmt, als der Bildschirm in der Breite (1920 Pixel) zur Verfügung stellt. D. h. in manchen Fällen war ein manuelles Scrollen durch das Informationsangebot in horizontaler Richtung notwendig. Die restlichen 58 % verteilten sich wie folgt: 19 % JIRA-Aktivitätsströme, 7 % Jenkins Build-Ansicht, 15 % Sprint Chart-Diagramme und 17 % Confluence-Seite. In den meisten Fällen war die Default-Ansicht eines Informationsbereichs ausreichend. Lediglich die Jenkins Build-Ansicht zeigte im Vergleich eine höhere Nutzung der Detail-Ansichten, in welchen insbesondere für die Entwickler/innen wichtige und detailliertere Informationen (z. B. Changesets) zu den Builds sichtbar wurden. Das Ambient Surface-System wurde 2014 in mindestens 1.824 unterschiedlichen Situationen eingesetzt (≈ 10,8 pro Tag). Grundlage hierbei war die Unterteilung des Zeitstrahls der an 169 Tagen ermittelten Interaktionen (22.683 Touchdown-Events) in 5-Minutenblöcke. Ein einzelner Block enthielt dabei immer mindestens eine Interaktion mit dem System. In 20 % der Fälle folgte ein weiterer Interaktionsblock binnen der nächsten fünf Minuten. Die Ergebnisse dieser Datenreihe liegen im Mittel um ca. 46 Minuten auseinander. Der Median beträgt in etwa 24 Minuten, die Standardabweichung beläuft sich auf ungefähr 58 Minuten. Diese Ergebnisse sind dadurch zu erklären, dass an manchen Tagen Interaktionen um mehrere Stunden auseinanderlagen – an anderen wiederum dicht zusammenhingen. Häufungen sind beispielsweise zur Mittagszeit aber auch am Morgen oder Nachmittag feststellbar. Längere Zeiträume der Inaktivität (z. B. Nächte oder Wochenenden) wurden bei dieser Berechnung ausgenommen, um unnötige Verzerrungen auszuschließen.

20 Jan Schwarzer, Susanne Draheim, Kai von Luck8 Förderung von informellen Kontexten und Awareness in Scrum-Teams

4.2 Feldforschung Da die Log-Ereignisse für sich genommen nur einen Auszug der konkreten Nutzung zeigen (aktive Interaktionen), wurde im Frühjahr 2015 eine erste Beobachtungsphase über fünf Werktage inklusive Gesprächen mit Mitarbeiter/innen sowie ein Gruppeninterview durchgeführt. Ziel war es, neue Nutzungskontexte und Entwicklungspotentiale sichtbar zu machen, die aus den bislang vorwiegend quantitativen Erhebungen nicht hervorgingen. Der gewählte Installationsstandort des Systems erwies sich als günstig. An zwei Werktagen konnten in knapp 14 Stunden über 1.100 Durchquerungen des Bereichs unmittelbar vor dem System protokolliert werden. Es wurde weiterhin ersichtlich, dass in dem Beobachtungszeitraum das System mindestens so oft passiv wie aktiv eingesetzt wurde. D. h. die tatsächliche Anzahl der Situationen, in welchen das System eingesetzt wurde, übersteigt die Zahl, die durch die ausschließliche Betrachtung der Interaktionsstatistiken feststellbar ist. Die Nutzungsdauer in solchen passiven Szenarien belief sich dabei auf wenige Sekunden bis hin zu einigen Minuten. Ob kurze Blicke beim Vorbeigehen aber auch Situationen, in welchen Personen vor dem Bildschirm stehenblieben, konnten mehrfach beobachtet werden. Auch Zweiergruppen blieben immer mal wieder vor dem Bildschirm stehen (z. B. in der Mittagspause), um über die Inhalte zu sprechen. Es gab außerdem Personen, die das System häufiger nutzten als andere. In Meeting-Situationen wurde zudem hin und wieder das Informationsangebot beiläufig beobachtet oder aktiv auf sichtbare Informationen eingegangen. Weiterhin sind es vor allem die spontanen Situationen des Arbeitsalltags, in denen das System vorrangig verwendet wurde und weniger geplante oder regelmäßig stattfindende Events. Damit sind beispielsweise das Holen eines Getränks aus der Küche oder das zufällige Zusammentreffen im Flur gemeint. Das System motivierte in der Vergangenheit immer wieder neue Gesprächssituationen. Grund dafür waren beispielsweise humorvoll gemeinte Kommentare zu den Sprint-Fortschritten anderer Teams oder auch gescheiterte Build-Prozesse. Mehrere Personen unterschiedlicher Rollen gaben in Gesprächen an das System grundsätzlich nicht mehr missen zu wollen und betonten den Nutzen für die tägliche Arbeit. In Ad-hoc-Gesprächen konnte zudem festgestellt werden, dass die Ansprüche an das System rollenabhängig variieren können. Während Personen aus der Software-Entwicklung den Fokus auf Informationen aus dem Jenkins-System legten (z. B. Informationen über fehlgeschlagene Builds), interessierten sich die Abteilungsleitung oder auch die Scrum Master mehr für abstraktere und aggregierte Informationen (z. B. Sprint-Fortschritte).

4.3 Diskussion Der grundsätzliche Mehrwert des Ambient Surface-Systems ist auf mehreren Ebenen feststellbar. Dies spiegeln die Nutzungsstatistiken der Log-Erhebungen aber auch die (teilnehmende) Beobachtung und die geführten Gespräche wider. Das System wird vor allem in spontanen Alltagssituationen verwendet, eben dann, wenn Mitarbeiter/innen gerade nicht an ihrem Arbeitsplatzrechner sitzen. Dies ist oftmals zu den Morgenstunden, zur Mittagszeit und am späten Nachmittag der Fall. Auch sorgt es für neue Gesprächsanlässe, direkt am System oder im Nachhinein durch zuvor wahrgenommene Informationen und aktives Zuge-

Förderung Förderung von von informellen informellen Kontexten Kontexten und und Awareness Awarenessin inScrum-Teams Scrum-Teams

219

hen auf Personen. Diese Gespräche sind sowohl fachlicher Natur, können aber auch einen Gossip-Charakter besitzen. Das System steigert die Sichtbarkeit von Informationen, begründet durch das Anzeigen von sowohl Team-internen als auch Team-übergreifenden Informationen und deren „Live“-Status. Gleichzeitig ersetzt es aber nicht die täglichen formalen Abstimmungen (z. B. Daily Scrums) in den Teams untereinander. Es zeigt sich, dass das System vor allem die nicht-formalen Arbeitsprozesse im Unternehmen mitgestaltet und den Austausch untereinander fördert, vorrangig gesteuert durch den Zufall der spontanen Nutzung. Kontinuierliche Veränderungsprozesse in der Software-Entwicklungsabteilung (Einsatz von Tools, Team-Strukturen, Abläufe etc.) geben immer wieder Anlass dazu, das System kontinuierlich den Bedürfnissen und Prozessen anzupassen. So werden in Rücksprache regelmäßig Änderungen an den bestehenden Informationsbereichen durchgeführt, wie auch neue hinzugefügt. Diese begleitenden Arbeiten am System wirken sich grundsätzlich positiv auf die Nutzungshäufigkeit aus. Wichtig ist dabei, gewohnte Aufbereitungen von Informationen aus den täglich genutzten Tools bei deren Darstellung auf dem System entsprechend zu berücksichtigen. Es ist auch entscheidend, Personen beim Vorbeigehen mehr die für sie interessanten Informationen zu präsentieren, macht es aber gleichzeitig schwierig, das zufällige Finden insbesondere Team-übergreifender Informationen zu unterstützen. Ein weiteres Resultat der Untersuchungen ist die geplante Installation eines zusätzlichen Bildschirms, um so a) dem informationsabhängigen Bedarf der verschiedenen Teams besser gerecht zu werden und b) mehr Raum für die Aufbereitung des Informationenangebots zu haben.

5

Schluss

Dieser Beitrag diskutiert den anhaltenden Langzeiteinsatz einer Ambient Display-Lösung im Kontext von Scrum-Teams, welcher durch qualitative wie auch quantitative Verfahren der Evaluation begleitet wird. Herausforderungen in Bezug auf die Awareness und informelle Kommunikation machen den Bedarf solcher Lösungen in agilen Software-Entwicklungsabteilungen deutlich. Zukünftige Untersuchungen sollen dabei helfen, das Ambient SurfaceSystem weiter zielführend zu entwickeln und den praktischen Nutzen zu erhöhen. Im Vordergrund steht dabei auch der Einsatz weiterer Erhebungsverfahren, wie beispielsweise EyeTracking, um die Erkenntnisse weiter zu fundieren. Neben einer Intensivierung der aktuellen Zusammenarbeit, existiert das grundsätzliche Bestreben nach neuen Kooperationen mit Scrum-Teams anderer Unternehmen. Danksagung Wir bedanken uns ganz herzlich bei unseren Projektpartner für die konstruktive Zusammenarbeit und hoffen auf eine weiterhin spannende und gleichzeitig anregende Kooperation. Literaturverzeichnis Biehl, J. T., Czerwinski, M., Smith, G. & Robertson, G. G. (2007). FASTDash: a visual dashboard for fostering awareness in software teams. In Proc. SIGCHI Conference on Human Factors in Computing Systems (CHI '07). ACM, New York, NY, USA, S. 1313–1322.

22 Jan Schwarzer, Susanne Draheim, Kai von Luck Förderung von informellen Kontexten und Awareness in Scrum-Teams 10 Cho, J. J. (2009). An Exploratory Study on Issues and Challenges of Agile Software Development with Scrum. Ph.D. Dissertation. Utah State Univ., Logan, UT, USA. Advisor(s) David H. Olsen. Dourish, P. & Bellotti, V. (1992). Awareness and Coordination in Shared Workspaces. In Turner, J. & Kraut, R. (Hrsg.): Proc. Intl. Conf. on Computer-Supported Cooperative Work. Toronto, Canada: ACM Press, S. 107–114. Flick, U. (2012). Qualitative Sozialforschung – Eine Einführung. 5. Aufl. Reinbeck: Rowohlt Verlag. Glaser, B. G. & Strauss, A. L. (2010). Grounded Theory – Strategien qualitativer Sozialforschung. 3. Aufl. Bern: Hans Huber Verlag. Huang, E. M., Mynatt, E. D., Russell, D. M. & Sue, A. E. (2006). Secrets to Success and Fatal Flaws: The Design of Large-Display Groupware. IEEE Comput. Graph. Appl. 26, 1 (Jan 2006), S. 37–45. Koch, M. & Ott, F. (2011). CommunityMirrors als Informationsstrahler in Unternehmen. InformatikSpektrum Volume 34, Issue 2, S. 153–164. Kraut, R. E. & Streeter, L. A. (1995). Coordination in software development. Commun. ACM, 38(3), S. 69–81. LaToza, T. D., Venolia, G. & DeLine, R. (2006). Maintaining mental models: a study of developer work habits. In Proc. of the 28th international conference on Software engineering (ICSE '06). ACM, New York, NY, USA, S. 492–501. Mayring, P. (1993). Qualitative Inhaltsanalyse – Grundlagen und Techniken. 4. erw. Aufl. Weinheim: Deutscher Studien Verlag. McCarthy, J. F., Congleton, B. & Harper, F. N. (2008). The context, content & community collage: sharing personal digital media in the physical workplace. In Proc. of the 2008 ACM conference on Computer supported cooperative work (CSCW '08). ACM, New York, NY, USA, S. 97–106. Röcker, C., Prante, T., Streitz, N. & van Alphen, D. (2004). Using Ambient Displays and Smart Artefacts to Support Community Interaction in Distributed Teams. In Proc. of the OZCHI Conference 2004. Australia: University of Wollongong. Satyanarayan, A., Strazzulla, D., Klokmose, C., Beaudouin-Lafon, M. & Mackay, W. (2013). The CHI 2013 Interactive Schedule. In CHI EA '13: ACM Extended Abstracts on Human Factors in Computing Systems. ACM, S. 2987–2990. Schwarzer, J., Barnkow, L., Kastner, P. & von Luck, K. (2013). Hin zu mehr Sichtbarkeit und Wertschätzung in der Softwareentwicklung. In Boll, S., Maaß, S. & Malaka, R. (Hrsg.): Mensch & Computer 2013: Interaktive Vielfalt. München: Oldenbourg Verlag, S. 341–344. Snowdon, D. & Grasso, A. (2002). Diffusing information in organizational settings: learning from experience. In Proc. SIGCHI Conference on Human Factors in Computing Systems (CHI '02). ACM, New York, NY, USA, S. 331–338. Tichy, W. & Padberg, F. (2007). Empirische Methodik in der Softwaretechnik im Allgemeinen und bei der Software-Visualisierung im Besonderen. In Bleek, W.-G., Raasch, J. & Züllighoven, H. (Hrsg). Software Engineering 2007 – Beiträge zu den Workshops Fachtagung des GI-Fachbereichs Softwaretechnik (27.–30.03.2007). Hamburg: Gesellschaft für Informatik e.V., S. 211–222.

Kontaktinformationen { Jan.Schwarzer | Susanne.Draheim }@haw-hamburg.de, [email protected]

S. Diefenbach, N. Henze & M. Pielot (Hrsg.): Mensch und Computer 2015 Tagungsband, Stuttgart: Oldenbourg Wissenschaftsverlag, 2015, S. 23-32.

Search Trails as Collaboration Artifacts – Evaluating the UX Sebastian Franken1, Ulrich Norbisrath2 , Wolfgang Prinz1 Fraunhofer FIT, Sankt Augustin1 University of Applied Sciences Upper Austria, Hagenberg2 Summary Users tend to share search results such as links or excerpts from web pages when performing complex search tasks. We developed a system called SearchTrails that enables sharing of complete search logs in the form of directed graphs, resembling the users’ trails through the Internet. We conducted a study with 29 participants in which we used both written reports and search trails as collaboration artifacts. We researched the value of search trails as artifacts for collaborative search compared to written reports. We did this by evaluating the user experience (UX) with both artifacts. By evaluating a user experience questionnaire (UEQ), we can confirm that search trails can support collaborative search better than written reports containing the essential information of the search trails.

1

Introduction

The sharing of search results is mostly done by sending notes or links via e-mail or verbal communication (Ringel Morris 2013). Even when some users are supposed to work on the same topic, dedicated collaborative search supporting tools are only used rarely (Kelly & Payne 2014). Such tools often work on specified datasets in which users already rated information for subsequent users of such systems. SearchTrails is an approach for supporting asynchronous collaborative search by capturing the users’ trail through the Internet, which allows exchanging, recreating, and continuing search trails between users. We conducted a study with 29 participants. In this paper, we address the research question if search trails as collaboration artifacts have an advantage over written reports containing the essential information of the search trails during collaborative search with regards to user experience (UX). For our study, we divided our participants in two groups (14 and 15 participants). One group received an average report from a previous search session with our tool. The other group received the corresponding search trail from the same session. We expected the

24

Sebastian Franken, Ulrich Norbisrath, Wolfgang Prinz2

participants to base their search on the given material to create a new report on a related complex search task. After this, we let them evaluate the UX of SearchTrails with the user experience questionnaire (UEQ). The results indicate that search trails have a major impact on the quality of the search process. Using search trails as collaboration artifacts improves the UX during asynchronous complex search and the quality of the created reports. The work presented here is based on the SearchTrails tool for the support of complex search tasks. An early version of SearchTrails was evaluated in a qualitative study with seven participants, conducted in early 2014. This version allowed the creation of a search trail, the capturing of highlights in pages and the extraction of keywords from pages. During the first study, we found that it is possible with SearchTrails to give support for complex search tasks by creating search trails (Franken & Norbisrath 2014a, published at ‘M&C 2014’). We could also show that the generated search trails help evaluators with assessing and evaluating the outcome of complex search tasks (Franken & Norbisrath 2014b). Further implementation led to a second version of SearchTrails, which enabled exchanging search trails between users and therefore the collaboration between searchers. While the first study proved the feasibility of the selected approach, the here presented second study goes beyond the first study in the technical capability of SearchTrails and a significantly larger number of participants. In the following sections, we will present the underlying theoretical concepts and approaches for logging search behavior as well as for collaborative search. We will then describe the architecture and implementation of the recent version of SearchTrails and present our study. The last sections will elaborate on the study results and give an outlook on future work.

2

Theoretical background and related work

Today’s search engines get better and better in helping users to find fact-based information (Jansen 2006), but lack support for gathering many pieces of information on one specific topic (e.g. organizing a trip, including comparing means of transport, hotels, and leisure activities) (Singer et al. 2012). These well-supported fact searches are often small and repeated parts of a more complex exploration process, which currently lacks support. Our approach does exactly this: it visually logs the users’ path when traversing the web, offers possibilities to capture specific information, and provides a way back to information already seen in earlier stages of the search process. The idea of creating, storing, and exchanging trails through hypertext dates back to (Bush 1945). He suggests that the navigation through the hypertext gets stored in so-called ‘trails’ that could later be recalled and extended. Bush even proposes exchanging trails between persons being interested in the same topic: “And his trails do not fade [...] [He] photographs the whole trail out, and passes it to his friend for insertion in his own memex, there to be linked into the more general trail“. To this day, this is not possible, and SearchTrails follows this idea. Bush’s idea influenced (Bates 1989), who suggests that the search process is comparable to ‘Berrypicking’, in which highly qualitative information bits get picked during a search. She opposes this to classic information retrieval, in which a query is tried to be answered by a perfectly matching document.

Search Trails as Collaboration Artifacts – Evaluating the UX

253

Besides other approaches of classifying search tasks (e.g. Broder 2002), Marchionini classified search activities into the three categories of ‘Lookup’, ‘Learn’, and ‘Investigate’ (Marchionini 2006). He defined exploratory search tasks as consisting of the overlapping ‘Learn’ and ‘Investigate’ activities and specified sub tasks for each search activity. (Singer 2012) based his definition of ‘Complex search’ on that. He defines complex search tasks as interactive, labor-intensive, and time consuming tasks that need at least one of the three tasks aggregation, discovery, or synthesis of information. We stick to this definition, as it covers a wider range of search tasks and includes tasks that do not necessarily involve learning. (Franken & Norbisrath 2014a) holds a comparison of search characteristics. There have been several approaches that try to capture the searchers' course through the Internet. One of the first was a logging system by (Fox et al. 2005), who developed an add-in for the Internet Explorer, that collected both implicit feedback about the searchers actions and explicit feedback by presenting small questionnaires to the searcher. A later approach was the ‘Wrapper’ system by (Jansen et al. 2006), which was installed on the user's system, and recorded the user's interaction with the browser and the browser's interaction with the system. This approach could show that users search for long times and make use of different information systems for their searches. (Singer et al. 2011) developed the SearchLogger system that consisted of a Firefox plug-in and recorded all user actions on a central server. SearchLogger allowed proving the existence of complex search tasks and their classification. Common to all presented approaches is that the users had no chance to interact with the data gathered during the search. Therefore, no support during complex search tasks was given. The value and the rising impact of collaborative search is shown by (Ringel Morris 2013), remarking that only lightweight approaches have the chance to be accepted by users. Studies of collaborative search support tools have confirmed those findings, as they state that the actual success of such systems have been limited, which may be due to high effort of installation and during usage (Kelly & Payne 2014). Recent publications prove emerging interest in the concept of generating trails during search and offering trail information to searchers, as it was found that ‘Individual items may be insufficient for vague or complex information needs’ (Singla et al. 2010). This approach has taken logs from web browser plug-ins which were interpreted as trails and evaluated with respect to trail length, breadth, or diversity. Later approaches talk about similarities in trails and provide suggestions to users based on the trails other users took (Awadallah et al. 2014). Several methods for measuring the UX of interactive products exist. We decided for the user experience questionnaire (UEQ), as it is a standard approach for such measurements, judging the impact of the product on the user in general (Rauschenberger et al. 2013).

3

SearchTrails

We created SearchTrails to support searchers by (1) visualizing their search trails, (2) supporting search task evaluation, and (3) the exchanging of search trails to ease collaborative search. Designing the tool, we were guided by the idea to support aggregation,

26

Sebastian Franken, Ulrich Norbisrath, Wolfgang Prinz4

discovery, and synthesis. We support aggregation by recording the trail with all its paths and side tracks, and synthesis by enabling the user to select valuable information pieces from websites and collecting them into the highlights overview. We support discovery by a visual representation of the search process as well as search term suggestions to guide the searcher into related, but new search directions. The search trails are stored on a remote server, conserving the context of search results and allowing the exchange of search trails. User selections of valuable information (highlights) are labeled in the search trail and displayed in an overview, keeping relevant information and its sources together. We realized our tool by building an extension for the Google Chrome browser, which unobtrusively logs the users’ actions while working with the browser. Realizing SearchTrails this way poses only very minor installation effort and allows free-form, open-ended search processes. Our design also helps to avoid cluttering the visualization with commercial ads (Singer 2012), as SearchTrails stores only URLs. We have chosen a force directed graph as this is a proven concept for visualizing large information collections (Eades & Huang 2000).

Figure 1: SearchTrails architecture supporting the exchange of search trails.

The internal structure of the now evaluated version of SearchTrails consists of three parts and the user interface (Fig. 1): The logging engine logs all events and builds a logical representation of the search process as a JSON Object. The storage engine stores the JSON trail object remotely and reports about the changes, which are translated into the visualization by the rendering engine. In addition to the version evaluated qualitatively in (Franken & Norbisrath 2014a), this version allows exchanging search trails IDs, which trigger the recreation of trails in the collaborators’ instance of SearchTrails. SearchTrails monitors the opening, closing, and switching between tabs and the change of URLs with the help of a logging engine which logs, filters, and interprets the user interactions. It also catches metadata from the web pages and generates keywords from the pages’ content. The users’ navigation is transformed into nodes in the graph visualization (c.f. Fig. 2) by the rendering engine and shown in a separate tab, which itself is excluded from being logged. The metadata gets attached to the nodes and is visible to the user. The visualization is based on a directed graph in a forced-directed layout (2 in Fig. 2). For each visited URL, important keywords are derived (1), stored and displayed in a table on the right, if a keyword appears on two or more pages the user has visited. This metadata gets also stored in the search logs. If more than three nodes belong to the same host, they are clustered

Search Trails as Collaboration Artifacts – Evaluating the UX

275

by a colored hull (4) and can be closed using a mouse click to reduce the complexity of the visualization, but still being sensible to user interactions. Irrelevant nodes can be deleted. The storage engine stores the search trail JSON object regularly on a remote server which allows the authors to access all data, while restricting access for the participants.

Figure 2: SearchTrails with a trail from the user study.

Besides the visualization, users can interact with the following features: To ease the synthesis of information (as one of the key points of complex search), users can select text and store it as a highlight by pressing ALT. This stores the selected text in an overview table, together with its source URL, and the corresponding node in the visualization being marked blue (3), which allows the users to immediately recognize the highlight-pages in the graph. Highlights can also be added as text from other sources, to allow manual enrichment of the information, and erroneously set highlights can be removed. A tap on ‘-‘ marks a page in the search trail red, to signal that it was not helpful. The JSON object corresponding to the search can be viewed, imported, and exported, although this was mainly used for evaluation purposes. The views of the highlights and JSON can be switched on or off. The keywords derived from the pages’ contents are shown as a table and are selectable; this results in the nodes with the matching keywords being marked in the visualization. A click on ‘Search’ starts a search for the selected keywords in a new tab. Technically, the visualization is done by making use of the ‘Data-Driven Documents’ Java Script framework d3js (http://d3js.org/), which allows highly dynamic and efficient visualization of large data structures. The browser plug-in inserts JavaScript code into all the pages the user visits, to be able to extract keywords from the pages. Updates as well as the keywords are shared within the application by message passing. On every loading of a site, a new node is created in the visualization. When this is finished, the node is updated by the keyword information and some page metadata, such as the description of a page. When a

28

Sebastian Franken, Ulrich Norbisrath, Wolfgang Prinz6

searcher moves from one URL to another by using the back button or by switching browser tabs the nodes corresponding to this URL are connected. A search session starts with opening SearchTrails and entering a username and a title for the search. After that, a unique SearchTrails ID is stored locally under which the trail is stored on the server. While searching, the search trail is stored automatically every five minutes, as well as on closing SearchTrails. For continuing a search, SearchTrails uses the stored trail ID to trigger the trail being fetched from the logging server. This way, also a trail ID received via e-mail can be used to fetch a trail from another user. This trail can then be used as a starting point for the users’ own search and be extended by highlights and annotations.

4

User study

For our second user study, we selected 29 students of a university lecture on Computer Supported Collaborative Work (CSCW) in a master course as a representative example of tech-savvy users, having experience with web search. We equipped all participants with the Google Chrome Browser and the SearchTrails extension and made sure the installation went well. We developed two search tasks, to avoid biasing the study results by the selection of just one topic. The tasks required the evaluation of given artifacts and checked to fulfill the seven characteristics of complex search tasks in (Kules & Capra 2009). The search tasks were: Topic 3D ‘3D printing’: ‘Based on the given material, find applications of 3D-Printing in the car manufacturing domain. Which applications exist, which ones will come? Will 3DPrinting change the way of manufacturing cars in the future?’ and Topic HA ‘Home automation’: ‘Based on the given material, find applications of home automation dealing with home security. Which applications exist, which ones will be available? Which applications would you prefer?’. The participants were assigned two different topics per group to avoid biasing the results by the selected topic. The topics were handed out with alternating groups through the rows of the lecture hall. This prevented plagiarism and neighboring students being assigned to the same group. This resulted in four sub groups. Based on the groups the students were assigned to, the topic and the given artifact differed: Group A: 3D+Report; B: HA+Report; C: 3D+Trail; D: HA+Trail. We provided the participants either a written report or the corresponding search trail for one of the topics. For the same topic (3D or HA), these artifacts came from one average student who performed a similar search process (leaving out more specific information about cars or home security) and therefore contained basic information in each artifact. By providing a search artifact we simulated asynchronous collaboration between two searchers on the same topic and ensured a comparable level of given information for all participants. The participants were asked to use the given information for creating a new report on the extended question. This report should contain all relevant information from the search, needed to inform someone who did not do the search about the task. Including URLs was not mandatory, and we did not request a minimum amount of text, to avoid the production of filler text. The study was started as a subsidiary part of the lecture and the participants were given six days to do a search on the given task

Search Trails as Collaboration Artifacts – Evaluating the UX

297

finishing with the preparation of a report. At the sixth day, tardy participants were reminded via e-mail to hand in the reports. In the evaluation, the participants generated search trails which were stored on the server. From our participants, we received 26 search trails and UEQs and 21 reports. After the week of the study, all participants met again for the final questionnaire session. In this session, we handed out a self-developed questionnaire and the UEQ to evaluate specific opinions on SearchTrails and the general UX. We consider the UEQ an indicator for the quality of support during the search process. Only when the participants are content with the support during the search process, the UEQ will result in positive scores. After the study, we evaluated the UEQ results and split them depending on the type of the provided artifact. All three authors also independently graded the participants’ reports to achieve some level of objectivity. As the reports were requested to be able to inform someone who did not perform it about its key results, we graded the reports by their quantitative breadth and their qualitative depth of information. Based on this, the reports of group C+D were better with regards to breadth and depth. Additionally, the statistical data of the generated search trails was evaluated.

5

Evaluation results

This user study was intended to show the impact of using search trails as collaboration artifacts. First, it had to be ensured that the selected topics did not influence the study results. For this we split and compared our study results with respect to the topics. Our analyses of the UEQ, the grades of the reports, and the statistical results with respect to the two different topics show that no significant differences between the different topics can be found. This proves that our search tasks did not influence the study results.

Figure 3: Search Trails UEQ scores split by the report and the trail as collaboration artifacts.

We then split our UEQ results with respect to the given artifact. The UEQ groups its 26 items pairs into the six categories of novelty, stimulation, dependability, efficiency, perspicuity, and attractiveness. Fig. 3 shows the UEQ scores for the groups that received the report and the search trail and their respective confidence intervals (p=0.05). Note that the scale of the UEQ reaches from -3 to +3, but for spacing reasons, we just show the positive half of the diagrams, as the negative parts are empty. The fact that all values are above 0.8 (except for the dependability, which is 0.72) show that the overall rating for each scale can

30

Sebastian Franken, Ulrich Norbisrath, Wolfgang Prinz8

be considered explicitly positive. Cronbach’s Alpha coefficient is a measure for the consistency of a scale, which is generally accepted if it is above 0.7. It was calculated for all six scales, and in case of the report group, we gain acceptable values for all scales but dependability and novelty. For the trail group, we gain acceptable values for all scales but efficiency, implying that the results for most of the scales can be considered meaningful. When the users received a trail to start their search from, all UEQ item values are higher (Fig. 3) than for the group that received a report, and some values increase significantly. These values are even more impressive when taking into account that the participants worked with SearchTrails for the first time, and did not know its functions before. The value for perspicuity almost doubles and increases from 0.80 to 1.58. Similarly, the value for dependability increases by more than 0.5; from 0.72 to 1.23. The general increase of all scales for the trail group and the especially good values for perspicuity and dependability can be explained by the use of the search trail as an initial artifact. The trail group discovered the trail, which obviously represents the collaborators actions. This results in a high perspicuity. Similarly, the trail feels more steerable and dependable for this group, as it offers possibilities for interaction. The report group may experience the trail as a less transparent visualization of their navigation, which they interacted with much less than the trail group. Our analyses of the reports’ grades show that also their quality improved when the group received a trail to start from. Their average grade was 2.21 and as such statistically significant (p=0.05) roughly one full grade better than for the report group, which was graded 3.20 on average. The influence of the trail on the resulting report shows that the value added by the search trail is more than in UX, but also impacts the efficiency the participants worked with the information. This can also be seen on the value for dependability, which scored lower for the report group, as these participants conceived the force directed trail less predictable and steerable. The high values for the trail group can be explained by the fact that the participants especially liked that the trail was laid out automatically and a flexible layout offered them the chance to explore the given data much more efficiently. Fig. 4 shows the UEQ results from all participants in a benchmark comparison with 163 studies with 4818 participants (data is provided in the UEQ evaluation sheet). Taking all user data together, Cronbach’s alpha is acceptable for all scales but novelty, where the value is 0.59. This value is influenced by the weak value for the report group, which already scored low in that scale. SearchTrails scores ‘Above average’ or ‘Good’ on all scales except dependability (‘Below average’). A reason for that is in the low dependability scores of the report group, influencing the overall value.

Figure 4: Search Trails UEQ benchmark comparison for all participants of the study.

Search Trails as Collaboration Artifacts – Evaluating the UX

6

319

Conclusion and outlook

The results presented here show that SearchTrails as a system is a valuable tool to support complex search tasks. Further analyses of the UEQ results with respect to the type of artifact show that the value of SearchTrails itself is more in collaboration than in individual searching: Users engaged in collaborative search much more appreciate the value of a search trail than the value of a report. Based on these results, we can answer the research question if search trails have an advantage compared to written reports as search artifacts during collaborative search with regards to user experience (UX) positively. Although the study shows that a good matching use case has a strong impact on the UX, the impact of the search trail was more than UX, as the grades for the reports were better for the trail group. Preliminary experiments could show that the grades of the reports and the individual satisfaction with SearchTrails’ features improve through practice with SearchTrails. This indicates that participants have to get acquainted with a system before they can fully appreciate its features. Our results may even have improved when we would have trained the report group more on how to efficiently use SearchTrails for their search tasks. We decided not to do too much training apart from explaining core features, to avoid any influence on the results. Apart from a certain training time that might influence the use of features, the influence of the artifact remains substantial. This is due to the type of artifact. Going back to the deconstruction of complex search into aggregation, discovery, and synthesis, a report itself is an artifact of synthesis. It consists of processed information, leaving the reader unaware of the landscape of information that lead to it. When it comes to collaborative search, less processed artifacts of collaboration are important. This is the value of a search trail, as it captures all paths, side tracks, and sources that lead to a result. Users can prevent redundant searches by knowing about the side tracks of their collaborators. Although the study went well in technical regards, a potential flaw is that even if students are a tech savvy user group, they usually do only necessary tasks. Their behavior is less intrinsically motivated than the behavior of e.g. researchers, who can more easily spot the value of tools for complex search. Summing up, we argue in favor of the value of search trails as primary artifacts of aggregation and discovery, which are able to prevent redundant searches. We also consider SearchTrails itself a tool for enhancing synthesis of information, leading to better overview of valuable search results. The work on SearchTrails will continue to further investigate the impact on collaborative complex search. Acknowledgments We thank the reviewers for their work and comments that helped improving the clarity of this paper. We furthermore thank our study participants from the CSCW course of B-IT for their time invested in our study. References Awadallah, A., White, R. W., Pantel, P., Dumais, S., Wang, Y. (2014). Supporting Complex Search Tasks. In: Proc. of CIKM ’14, Shanghai. ACM Press, pp. 829-838.

32

Sebastian Franken, Ulrich Norbisrath, Wolfgang Prinz 10

Bates, M.J. (1989). The Design of Browsing and Berrypicking Techniques for the Online Search Interface. Online Information Reviews, Vol. 13, Issue 5, pp. 407-424. Broder, A. (2002). A taxonomy of web search. In: SIGIR Forum, Fall 2002, Vol. 36, No. 2, pp. 3-10. Bush, V. (1945). As we may think. In: The Atlantic Monthly 176, July 1945. Eades, P., Huang, M.L. (2000). Navigating Clustered Graphs Using Force-Directed Methods. In: Journal of Graph Algorithms and Applications, Vol. 4, Np. 3, pp. 157-181. Fox, S., Karnawat, K., Mydland, M., Dumais, S., White, T. (2005). Evaluating Implicit Measures to Improve Web Search. In: ACM Transactions on Inf. Syst. Vol.23, No.2, Apr. 2005, pp. 147-168. Franken, S., Norbisrath, U. (2014a). Trail Building During Complex Search Tasks. In: M. Koch, A. Butz & J. Schlichter (Hrsg.): Mensch und Computer 2014, München: Oldenbourg, pp. 135-144. Franken, S., Norbisrath, U. (2014b). Supporting the Evaluation of Complex Search Tasks with the SearchTrails Tool. In: CASCON 2014, Toronto. IBM Corp. Riverton, NJ, USA, pp. 262-274. Jansen, B.J. (2006). Using Temporal Patterns of Interactions to Design Effective Automated Searching Assistance. In: Communications of the ACM, April 2006/Vol. 49, No. 4, pp. 72-74. Jansen, B.J., Ramadoss, R., Zhang, M., Zang, N., (2006). Wrapper: An Application for Evaluating Exploratory Search Systems Outside of the Lab. In: Proc. of SIGIR 2006, Aug. 6-11, Seattle. Kelly, R., Payne, S. J. (2014). Collaborative Web Search in Context: A Study of Tool Use in Everyday Tasks. In: Proceedings of CSCW’14, Baltimore. ACM Press. pp. 807-819. Kules, B., Capra, R., (2009). Designing Exploratory Search Tasks for User Studies of Information Seeking Support Systems. JCDL ’09, June 15-19, Austin, Texas, p. 419. Marchionini, G. (2006). Exploratory Search: From Finding to Understanding. In: Communications of the ACM, April 2006/Vol. 49, No. 4, pp. 41-46. Rauschenberger, M., Schrepp, M., Perez Cota, M., Olschner, S., Thomaschewski, J. (2013). Efficient Measurement of the User Experience of Interactive Products. In: IJIMAI, Vol. 2, Nº 1, pp. 39-45. Ringel-Morris, M. (2013). Collaborative Search Revisited. In: Proc. of CSCW ’13, San Antonio, Texas. ACM Press, pp. 1181-1192. Singer, G. (2012). Web search engines and complex information needs. Dissertationes Mathematicae Universitatis Tartuensis, Order No. 446, ISSN: 1024-4212. Singer, G., Danilov, D., Norbisrath, U. (2012). Complex search: aggregation, discovery, and synthesis. In: Proceedings of the Estonian Academy of Sciences, 2012, 61, 2, pp. 89-106. Singer, G., Norbisrath, U., Vainikko, E., Kikkas, H., Lewandowski, D. (2011). Search-Logger Analyzing Exploratory Search Tasks. In: SAC’11, March 21-25, Taichung. Taiwan, pp. 751-756. Singla, A., White, R. W., Huang, J. (2010). Studying Trailfinding Algorithms for Enhanced Web Search. In: Proc. of SIGIR ’10, Geneva, ACM Press, pp. 443-450.

Contact information Sebastian Franken & Prof. Wolfgang Prinz, PhD, Fraunhofer FIT, Sankt Augustin. {sebastian.franken, wolfgang.prinz}@fit.fraunhofer.de. Dr. Ulrich Norbisrath, University of Applied Sciences Upper Austria, Hagenberg. [email protected].

S. Diefenbach, N. Henze & M. Pielot (Hrsg.): Mensch und Computer 2015 Tagungsband, Stuttgart: Oldenbourg Wissenschaftsverlag, 2015, S. 33-42.

Klassifikationsschema für Usability-Evaluationsmethoden Christoph Ohl1, Gabriele Schade2 Institut für Informatik, Friedrich-Schiller-Universität Jena1 Fachrichtung Angewandte Informatik, Fachhochschule Erfurt2

Zusammenfassung Nicht immer ist innerhalb von Software-Projekten das notwendige Usability-Wissen zur zielgerichteten und effizienten Auswahl geeigneter Methoden vorhanden. Zur Unterstützung eines Auswahlprozesses, welche Methode ist wann die am besten geeignete, ist es von Vorteil, wenn das Wissen über die Methoden in strukturierter Form vorliegt und angemessene Kriterien zur Unterscheidung gefunden werden können. Bisherige diesbezügliche Lösungen sind hier nur bedingt zur Unterstützung des Auswahl-prozesses geeignet. In diesem Beitrag wird ein Klassifikationsschema vorgeschlagen, dass der Ein- und Zuordnung von Usability-Evaluationsmethoden dienen soll und einen Ausgangspunkt zur besseren Auswahl geeigneter Verfahren im Usability-Engineering darstellen kann.

1

Einleitung

Zur Bewertung von Mensch-Maschine-Schnittstellen existieren mittlerweile unzählige Usability-Evaluationsmethoden, die sich jeweils für bestimmte Einsatzzwecke eignen und im Vergleich zueinander ganz verschiedene Charakteristika aufweisen. Durch die große Anzahl und die zum Teil doch eher formlosen Beschreibungen dieser Methoden seitens der Autoren wird es immer schwieriger, deren Unterschiede und Gemeinsamkeiten zu überblicken. Eine genauere Betrachtung der Methodenvielfalt lässt den Schluss zu, dass die Auswahl von geeigneten Usability-Methoden für einen konkreten Anwendungsfall keine triviale Aufgabe ist und dazu eine entsprechende Expertise vorliegen muss. Häufig sind in den (vielfach auch kleinen und mittelständischen) Unternehmen aber keine Usability-Experten vorhanden. So schätzen die mittelständischen Unternehmen in Deutschland im Jahre 2011 ihr Wissen zu Usability-Methoden als eher gering ein (Woywode et al. 2012). Da für eine planvolle Auswahl eine gewisse Methodenkompetenz und somit grundlegendes Überblickswissen über die bestehenden Methoden notwendig ist, kann davon ausgegangen werden, dass die Auswahl der Methoden im Usability-Engineering bei mittelständischen Produzenten in Deutschland

34 Usability-Evaluationsmethoden

Christoph Ohl, Gabriele Schade2

aufgrund fehlender Methodenkenntnis meist ohne zugrundeliegende Systematik erfolgt. Während die Methodenvielfalt wächst, besteht die Aufgabe seitens der Experten nun darin, eine gemeinsame Wissensbasis und somit ein größeres Verständnis im Hinblick auf die einzelnen Verfahren zu schaffen. Die Grundlage einer solchen Wissenssammlung setzt unter anderem eine genaue Definition von Kriterien zur Unterscheidung sowie in diesem Zusammenhang ein gut strukturiertes Klassifikationsschema zur Einordnung der Methoden voraus. In der Literatur lassen sich bereits von Experten veröffentlichte Klassifikationsschemen zur Ordnung von Usability-Methoden finden (Siehe Kapitel 2). Diese stellen gute Lösungen dar, um die Methoden logisch zu gruppieren und um ein entsprechendes Überblickswissen zu vermitteln. Es werden jedoch nur eine relativ geringe Anzahl von Merkmalen zur Klassifikation genutzt. Die Vergleichbarkeit der Methoden unter Zuhilfenahme der Klassifikationsschemen ist dabei auf wenige Unterscheidungsmerkmale limitiert. Der vorliegende Beitrag bietet eine Klassifikationslösung an, die sich zum Aufbau einer Wissenssammlung zu den Methoden der Usability-Evaluation eignet und Potenzial besitzt, unterstützend bei der Auswahl geeigneter Evaluationsverfahren im Usability-Engineering zu sein. Letztendlich kann auf dieser Grundlage ein Instrumentarium entstehen (z. B. digitalen Assistenten), das sowohl für Neueinsteiger im Themenfeld Usability oder für UsabilityExperten eine Hilfe darstellt. Je nach Adressat des Instrumentariums kann die letztendliche Ausgestaltung stark variieren (z. B. Nutzung von Begrifflichkeiten und Abfolge der Arbeitsschritte).

2

Verwandte Arbeiten

Es existiert eine Reihe von Veröffentlichungen zu Klassifikationsschemen zur Ordnung von Usability-Evaluationsmethoden. Für eine detaillierte Beschreibung der einzelnen Klassifikationen, sei an dieser Stelle auf die zugehörigen Literaturangaben verwiesen (Whitefield et al. 1991; Ivory & Hearst 2001; Christos et al. 2007; Zhang 2007, Law et al. 2009, S.7 ff.; Seffah & Metzker 2009, S.17 f.; Krannich 2010; Sarodnick & Brau 2011). Eine aufbereitete Gegenüberstellung dieser Klassifikationen in tabellarischer Form ist in Ohl (2014) zu finden. Bei näherer Betrachtung wird deutlich, dass die Mehrzahl der existierenden Klassifikationssysteme bezüglich der Basisklassen einen mehr oder weniger ähnlichen Aufbau aufweist. Je nach Autoren variieren die Bezeichnungen. Die Klassen werden entweder aggregiert oder weiter untergliedert. Dennoch lassen sich bei der Gegenüberstellung deutlich mehr Gemeinsamkeiten als Unterschiede erkennen. In den meisten Fällen wird danach klassifiziert, in welcher Art und Weise die Nutzer und das zu untersuchende System am Evaluationsprozess beteiligt sind. Sehr deutlich wird diese Differenzierung beispielsweise in der Kreuzklassifikation von Whitefield und Kollegen (siehe Abbildung 1). Neben den inhaltlichen Aspekten sind Unterschiede und Gemeinsamkeiten hinsichtlich der grundsätzlichen Struktur erkennbar. Die Mehrheit der gefundenen Lösungen zur Klassifikation verwendet eine präkombinierte und eindimensionale hierarchische Struktur. Diese eignen sich sehr gut für eine grobe und einfach zu verstehende Unterteilung bzw. Einsortierung der Methoden. Daneben existieren aber auch Lösungen, die eine mehrdimensionale Struktur aufweisen und somit umfangreichere Gliederungen und Einordnungen erlauben (Whitefield et al. 1991; Ivory & Hearst

Klassifikationsschema für Usability-Evaluationsmethoden Usability-Evaluationsmethoden

353

2001; Law et al. 2009; Sarodnick & Brau 2011). Eine Klassifikation, die sich dabei von den restlichen abhebt, bieten Ivory und Hearst (2001). Dabei handelt es sich um eine Postkombinierte Klassifikation bzw. Facettenklassifikation, bei der neben der allgemeinen Methodenklasse („Method Class“) und dem konkreten Methodentypen („Method Type“), ebenfalls nach dem Grad der technischen Unterstützung („Automation Type“) sowie nach dem Aufwand zur Durchführung der Methode („Effort Level“) klassifiziert wird. Die Vorteile beim Einsatz von Facetten werden hier bereits sehr deutlich, was auch zur Inspiration des eigenen Lösungsansatzes diente, der in den nachfolgenden Kapiteln erläutert wird.

Abbildung 1: Kreuzklassifikation von Usability-Evaluationsmethoden nach Whitefield et al. (1991)

3

Anforderungen

Im Folgenden werden die von den Autorinnen und Autoren dieses Beitrags benannten Anforderungen (Siehe Kapitel 1) an ein Klassifikationsschema formuliert, welches es erlaubt, gut zwischen einzelnen Usability-Evaluationsmethoden zu differenzieren und zugleich eine Entscheidungshilfe zur Auswahl geeigneter Evaluationsverfahren darstellt. •



Abgrenzung: Die Abgrenzung zu anderen Methoden im Themenbereich Usability, also solche die nicht im direkten Zusammenhang mit der Evaluation eines Untersuchungsgegenstandes stehen, muss erkenntlich sein. Flexibilität: Das Klassifikationsschema soll neben der rationellen Handhabung von Wissen über die Methoden auch der Wissenserkenntnis dienen. Dafür sollten auch komplexe Sachverhalte dargestellt werden können und verschiedene Sichtweisen auf die Methoden realisierbar sein. Eine mögliche Fragestellung mit einem vergleichsweise geringerem Komplexitätsgrad, die in diesem Kontext beantwortet werden könnte, lautet beispielsweise wie folgt: Gibt es UsabilityEvaluationsmethoden, die mir quantifizierbare Ergebnisse über wenige, ausgesuchte

36 Usability-Evaluationsmethoden

• •

4

Christoph Ohl, Gabriele Schade4

Untersuchungskriterien liefern, wenn ich eine abschließende Bewertung eines Designergebnisses (Mockup) anstrebe, dass in den frühen Phasen des Projektes entstand? Pflege und Erweiterbarkeit: Das Klassifikationsschema soll leicht erweitert oder geändert werden können. Einfache Anwendbarkeit: Das Klassifikationsschema soll einfach anzuwenden sein und gute Selektionsmöglichkeiten über alle erfassten Methoden bieten.

Klassifikationsschema

4.1 Vorgehensweise Zur Erfüllung der zuvor definierten Anforderungen wurde die Entwicklung einer postkombinierten Klassifikation angestrebt. Dabei zeigte sich die Facettenklassifikation als gut geeignet, weil sie es erlaubt, die Methoden der Usability-Evaluation aus verschiedenen Blickwinkeln zu betrachten und so große Mengen von Elementen sinnvoll zu differenzieren. Der eigentlichen Klassifizierung ging eine Analyse der Usability-Evaluationsmethoden, also der zu klassifizierenden Elemente, voraus. Hierbei ist als Bezugsquelle die in Kapitel 2 vorgestellten Klassifikationssysteme sowie weitere Fachliteratur zu diesem Themengebiet zu nennen (allen voran Sarodnick & Brau 2011; Freymann 2008; Bortz & Döring 2006). Anschließend fand eine Unterteilung der Methoden entsprechend ihrer Merkmale in Einfachklassen statt. Daraufhin erfolgte die Kombination und Zusammenfassung der klassifizierten Merkmale zu mehreren gleichrangigen, voneinander unabhängigen, Kategorien, den Facetten.

4.2 Facettenanalyse Es konnten mehrere Merkmale bestimmt werden, die sich schließlich zur Klassifizierung der Methoden eignen. Daraus ließen sich einzelne Klassen ableiten, die wiederum in Facetten eingruppiert wurden. Grundsätzlich lassen sich hierbei zwei Arten von Facetten unterscheiden: Facetten, die eine dimensionale Klassifizierung erlauben und dadurch auf Dimensionen wie Ort und Zeit abbildbar sind und Facetten, die eine kategoriale Klassifizierung unterliegen und zur Abgrenzung voneinander hinsichtlich bestimmter Merkmale dienen. Facetten mit einer dimensionalen Klassifizierung sind für direkte Auswahlprozesse als zweitrangig einzustufen. Letztere bieten aber bei der dokumentarischen Betrachtung der Methoden im historischen Kontext einen hohen Mehrwert und werden daher ergänzend aufgeführt. Die zusammengetragenen Facetten werden nun kurz vorgestellt.

Klassifikationsschema für Usability-Evaluationsmethoden Usability-Evaluationsmethoden I

375

Dimensionale Klassifizierung A.

B.

C.

Erscheinungsjahr / Release Date: Jede Methode wurde zu einem bestimmten Zeitpunkt erstmals publiziert und damit öffentlich bekannt gemacht. Das Datum der Veröffentlichung erlaubt die Klassifizierung hinsichtlich der zeitlichen Einordnung der Methoden. Entwicklungsstandort / Development site: Jede Methode kann einem Entwicklungsstandort zugeordnet werden. Dieser Ort erlaubt eine Klassifizierung hinsichtlich der geographischen Lage der Methoden. Erfinder oder Herausgeber / Developer or publisher: Jede Methode wurde von einer oder mehreren Personen erfunden bzw. erstmals publiziert. Dadurch ist eine Klassifizierung hinsichtlich der Erfinder der Methoden möglich.

II Kategoriale Klassifizierung D.

E.

F.

Untersuchungszweck / Purpose of investigation: Grundsätzlich lassen sich zwei Evaluationsformen gegenüberstellen: die formative und die summative Evaluation (Sarodnick & Brau 2011). Methoden, die bereits während eines Designprozesses angewandt werden können und auf ein direktes Feedback zur Optimierung des Untersuchungsgegenstandes abzielen, zählen zur formativen Evaluation. Meist werden diese Evaluationsverfahren iterativ eingesetzt und dienen zur Qualitätssicherung. Im Gegensatz dazu stehen Methoden, die der summativen Evaluation zugeordnet werden und erst nach dem Abschluss eines Designprozesses anwendbar sind. Dadurch erlauben sie eine zusammenfassende oder vergleichende Bewertung des zu untersuchenden Systems. Diese Evaluationsverfahren dienen somit vorrangig der Qualitätskontrolle. Es existieren etliche Methoden, die sich sowohl zur formativen als auch zur summativen Evaluation anbieten. Untersuchungskriterien / Test criteria: Die Usability als solche lässt sich in einzelne Prüfkriterien zerlegen (DIN ISO 9241-11 1998). Viele Methoden verfolgen einen holistischen Ansatz, bei denen allgemeine Aussagen über die Usability eines Systems angestrebt werden. Andere Methoden beziehen sich bei der Prüfung wiederum auf bestimmte Kriterien der Usability, weshalb in solchen Fällen von einer partiellen Prüfung der Usability ausgegangen werden kann. Eine weitere Unterteilung der partiellen Prüfung in einzelne Usability-Kriterien ist möglich und erscheint sinnvoll. Da der Qualitätsbegriff Usability nach Meinung der Autorinnen und Autoren dieses Beitrags aber noch nicht erschöpfend definiert wurde und es noch Diskussionsbedarf seitens der Experten bedarf, können an dieser Stelle keine festen Kriterien mit eingebracht werden. Untersuchungsgegenstand / Object of investigation: Die Anwendbarkeit einer Methode ist von verschiedenen Vorbedingungen abhängig. Entscheidend ist zum Beispiel die Form, in der ein Untersuchungsgegenstand vorliegt (Freymann 2008). Während bei einigen Methoden konzeptionelle Beschreibungen oder Papierskizzen ausreichen, sind für andere wiederum prototypische Umsetzungen oder sogar voll funktionsfähige Systeme notwendig.

38 Usability-Evaluationsmethoden G.

H.

I.

J.

Christoph Ohl, Gabriele Schade6

Präsenz des Untersuchungsgegenstandes / Presence of the object of investigation: Generell kann danach unterschieden werden, in welcher Art der Untersuchungsgegenstand während des Evaluationsprozesses beteiligt ist. Whitefield und Kollegen unterscheiden hierbei zwischen „real“ und „repräsentativ“ (Whitefield et. al. 1991). Dabei ist die Eigenschaft „real“ so zu verstehen, dass auch Prototypen und Simulationen eines Systems in gewisser Weise als reales Untersuchungsobjekt zählen. Im Gegensatz dazu können für eine Evaluation auch Modelle und Spezifikationen genutzt werden, die eine mentale Repräsentation des Untersuchungsgegenstandes darstellen und demnach der Untersuchungsgegenstand nur „repräsentativ“ zur Verfügung steht. Gutachter / Evaluator: Eine Einteilung der Methoden ist in Abhängigkeit davon möglich, wer an der Untersuchung beteiligt ist bzw. wer als Gutachter fungiert. Bei den empirischen bzw. benutzerbasierten Verfahren werden die Informationen über Befragung und Beobachtung der tatsächlichen oder potentiellen Nutzer gewonnen. Bei den analytischen bzw. expertenbasierten Verfahren werden hingegen die Beurteilung von Usability-Experten vorgenommen, die versuchen, sich in die Situation der echten Nutzer zu versetzen (Sarodnick & Brau 2011: 119f.). Analyseform / Forms of analysis: Die Evaluationsverfahren können danach betrachtet werden, auf welche Art und Weise die Untersuchungsergebnisse ermittelt werden. Dabei wird zwischen qualitativen und quantitativen Methoden unterschieden (Bortz & Döring 2006: 137ff.). Qualitative Methoden beinhalten Ergebnisbeschreibungen in verbaler Form, die typischerweise detailliert, ganzheitlich und umfassend sind. Quantitative Methoden liefern hingegen Ergebnisse über wenige, ausgesuchte Untersuchungskriterien, welche systematisch operationalisiert bzw. quantifiziert werden. Während quantitative Untersuchungen objektive Erkenntnisse auf breiter Basis liefern, erzielt das qualitative Vorgehen tiefere Einsichten zu einem Untersuchungsaspekt, wobei in einigen Fällen ein hohes Maß an Interpretation nötig ist. Bei vielen Methoden werden sowohl qualitative als auch quantitative Daten erhoben. Anwendungsdomäne / Application domain: Die meisten Evaluationsmethoden und – techniken zur Überprüfung der Usability sind so allgemein gehalten, dass sie für verschiedene Anwendungsdomänen gleichermaßen und somit universell einsetzbar sind. Die Evaluationsmethoden müssen ggf. noch an dem jeweiligen Kontext der Untersuchung angepasst werden, bleiben aber vom prinzipiellen Aufbau unverändert. Im Gegensatz dazu gibt es Methoden, die speziell für eine bestimmte Domäne, wie zum Beispiel einer Web-Anwendung oder einem mobilen System, entwickelt worden sind und sich nicht einfach auf andere Anwendungsfelder übertragen lassen.

Klassifikationsschema für Usability-Evaluationsmethoden Usability-Evaluationsmethoden Example 1: Example 2: Example 3: Cognitive Thinking Heuristic Walkthrough Aloud Test Evaluation I Dimensional classification (no guarantee of completeness or accuracy) No January 5, February 17, April 4, 1990 1992 1982 No United States, United States, Denmark, Colorado New York Hovedstaden MA1

Facet

Characteristics

A. Release Date B. Development site

-

C. Developer or publisher

-

No

D. Purpose of investigation

D.1. Summative evaluation D.2. Formative evaluation E.1. Holistic E.2. Partial F.1. Concept F.2. Prototyp F.3. System G.1. Real G.2. Representational

Yes

H.1. User H.2. Expert I.1. Quantitative analysis I.2. Qualitative analysis J.1. Universal J.2. Special

E. Test criteria F. Object of investigation G. Presence of the object of investigation H. Evaluator I. Forms of analysis

J. Application domain

-

397

No

Clayton H. Peter G. Lewis Polson, Clayton Lewis, John Rieman and Cathleen Wharton II Categorical classification Formative Summative evaluation evaluation, Formative evaluation Partial Holistic

Multiple assignment

February 2, 1950 United States, Ohio

Jakob Nielsen and Rolf Molich

Paul M. Fitts, , Richard E. Jones and John L. Milton

Summative evaluation, Formative evaluation Holistic

Formative evaluation

Partial

Yes

Prototyp, System

Prototyp, System

Prototyp, System

Prototyp System

No

Real

Real

Real

Real

Yes

Expert

User

Expert

User

Yes

Qualitative analysis

Qualitative analysis

Qualitative analysis

Quantitative analysis

No

Universal

Universal

Universal

Special

Tabelle 1: Facettenklassifikation für Usability-Evaluationsmethoden (Beispiel 1 bis 4)

1

Example 4: Eye-Tracking Analysis

40 Usability-Evaluationsmethoden Example 5: Card Sorting

Facet

Characteristics

A. Release Date B. Development site

-

No

United States, New York

C. Developer or publisher

-

No

Cornelius Dubois

D. Purpose of investigation

D.1. Summative evaluation D.2. Formative evaluation E.1. Holistic E.2. Partial F.1. Concept F.2. Prototyp F.3. System G.1. Real G.2. Representational

Yes

H.1. User H.2. Expert I.1. Quantitative analysis I.2. Qualitative analysis J.1. Universal J.2. Special

E. Test criteria F. Object of investigation G. Presence of the object of investigation H. Evaluator I. Forms of analysis

J. Application domain

MA

Christoph Ohl, Gabriele Schade8 Example 6: GOMS

Example 7: Diary Study

I Dimensional classification (no guarantee of completeness or accuracy) No June 22, 1949 June 27, 1983 April 14, 1993 United States, New York

Stuart K. Card, Thomas P. Moran and Allen Newell II Categorical classification Formative Formative evaluation evaluation

Example 8: Focus Group

May 5, 1946

United States, Colorado

United States, New York

John Riemann

Robert K. Merton and Patricia L. Kendall

Summative evaluation

Formative evaluation

No

Partial

Partial

Holistic

Holistic

Yes

Concept Prototyp System Representational

System

System

Prototyp System

Representational

Representational

Representational

Yes

User

Expert

User

Yes

Quantitative analysis Qualitative analysis Universal

Quantitative analysis

Quantitative analysis Qualitative analysis Universal

User Expert Qualitative analysis

No

No

Universal

Universal

Tabelle 2: Facettenklassifikation für Usability-Evaluationsmethoden (Beispiel 5 bis 8)

4.3 Ergebnis Aus den bisherigen Überlegungen konnte ein Klassifikationsschema abgeleitet werden, deren zusammengetragenen Facetten sowie deren Ausprägungen, die möglichen Einfachklassen, in Tabelle 1 zu sehen sind. In einigen Fällen können die Methoden zu mehreren Ausprägungen einer Facette zugeordnet werden. Zur Hervorhebung solcher Fälle existiert in Tabelle 1 eine zusätzliche Spalte, die Auskunft über eine mögliche Mehrfachzuordnung innerhalb einer Facette gibt. Des Weiteren wurden acht Methoden und deren Zuordnung als Beispiel angegeben, um die praktische Umsetzung der Klassifikation zu demonstrieren (Siehe Tabelle 1 und 2).

Klassifikationsschema für Usability-Evaluationsmethoden Usability-Evaluationsmethoden

5

419

Diskussion und Ausblick

Es konnten Merkmale zur Klassifikation extrahiert und auf deren Grundlage ein Schema erstellt werden, dass der Ein- und Zuordnung von Usability-Evaluationsmethoden dient. Im Kontrast zu den bestehenden Klassifikationsansätzen bietet dieses Klassifikationsschema mehr Möglichkeiten zur genaueren Gegenüberstellung der Evaluationsverfahren. Entscheidend ist in diesen Zusammenhang die Klassifikationsstruktur, die in Form einer postkombinierten Klassifikation (Facettenklassifikation) vorliegt. Dadurch können die Elemente einer Struktur gleichzeitig aus verschiedenen Perspektiven betrachtet werden. Dennoch werden dabei verhältnismäßig weniger Klassen benötigt als bei einer Hierarchie, in der die gleiche Menge an Informationen strukturiert ist (Arndt 2006: 159 ff.). Die Anwender einer Facettenklassifikation werden somit niemals mit einer unübersichtlichen mehrdimensionalen Struktur konfrontiert. Die Erweiterung und Pflege von Facettenklassifikation gestaltet sich ebenfalls einfacher als Klassifikationen, die auf einer anderen Grundstruktur aufgebaut sind. Für die neu entstandene Klassifikation konnten insgesamt zehn Klassifikationsmerkmale gefunden und anhand von existierenden Methoden erfolgreich erprobt werden. Damit bietet sie einen höheren Informationsgehalt als bisherige Klassifikationen zu Usability-Evaluationsmethoden. Es bleibt zu prüfen, ob sich die einzelnen Klassen innerhalb der Facetten zur Einordnung von Usability-Evaluationsmethoden eignen. Bisher ist das Schema noch nicht evaluiert und zur Bewertung sollen Usability-Experten wie auch Nicht-Experten, dass oben aufgeführte Ordnungssystem an einer Vielzahl von Methoden anwenden. Die Ergebnisse können dann in einer Klassifikationstabelle bzw. Wahrheitsmatrix zusammengefasst werden. Anschließend wäre es, durch die Berechnung der relativen Häufigkeiten aus den vorliegenden Werten möglich, Kenngrößen zur Beurteilung der Klasse zu ermitteln. Ergänzend muss angemerkt werden, dass sich Facettenklassifikationen sehr gut als Grundlage für den Aufbau von strukturierten Wissenssammlungen eignen, aber keine Beziehungen und Hierarchien abbilden. Zur logischen Erschließung von Zusammenhängen sind für Neueinsteiger in das Themenfeld andere Klassifikationsansätze womöglich besser geeignet. Als Ausgangspunkt für die Entwicklung einer standardisierten Auswahlsystematik für UsabilityEvaluationsmethoden stellt die neue Klassifikation hingegen einen wichtigen Zwischenschritt dar. Ergänzend zur logischen Einteilung der Methoden werden nun im nächsten Schritt Beurteilungskriterien definiert, wie beispielsweise zeitlicher und materieller Aufwand der Evaluation oder notwendige Qualifikation der Evaluatoren (Sarodnick & Brau 2011: S.199 ff.). Genau an dieser Entwicklung einer standardisierten Auswahlsystematik arbeiten die Autoren, um bei der Usability-Bewertung in Software-Projekten ein gut nutzbares Instrument zur Auswahl der „richtigen“ Methode anzubieten. Literaturverzeichnis Arndt, H. (2006). Integrierte Informationsarchitektur: Die erfolgreiche Konzeption professioneller Websites. 1. Auflage, Berlin: Springer. Bortz, J., & Döring, N. (2006). Forschungsmethoden und Evaluation: für Human- und Sozialwissenschaftler. 4. Auflage. Berlin: Springer.

42 Usability-Evaluationsmethoden

Christoph Ohl, Gabriele Schade 10

Christos, F., Christos, K., Eleftherios, P., Nikolaos, T., & Nikolaos, A. (2007). Remote Usability Evaluation Methods and Tools: A Survey. Proceedings of the 11th Panhellenic Conference in Informatics (PCI 2007), 151 – 162. DIN EN ISO 9241-11 (1998). Ergonomische Anforderungen für Bürotätigkeiten mit Bildschirmgeräten - Teil 11: Anforderungen an die Gebrauchstauglichkeit. Beuth, Berlin. DIN EN ISO 9241-210 (2010). Ergonomie der Mensch-System-Interaktion - Teil 210: Prozess zur Gestaltung gebrauchstauglicher interaktiver Systeme. Beuth, Berlin. Freymann, M. (2008). Ein Tool zur Klassifikation und Auswahl von Evaluations-methoden im UserCentred Design Prozess. In K. Röse & H. Brau (Hrsg.): Mensch und Computer 2008. Usability Professionals 2007. Ivory, M. Y., & Hearst, M. (2001). The state of the art in automating usability evaluation of user interfaces. ACM Computing Surveys, 33(4), 470-516. Krannich, D. (2010). Mobile System Design: Herausforderungen, Anforderungen und Lösungsansätze für Design, Implementierung und Usability-Testing Mobiler Systeme. 1.Auflage. Norderstedt: Books on Demand. Law, E. L.-chong, Scapin, D., Cockton, G., Springett, M., Stary, C., & Winckler, M. (Hrsg.) (2009). Maturation of Usability Evaluation Methods : Retrospect and Prospect. Final Reports of COST294MAUSE Working Groups. IRIT Press, Toulouse. Ohl, C. (2014). Klassifikationsschemen für UEMs. http://de.slideshare.net/ChristophOhl/klassifikationsschemen-fur-uems. (Stand 18.06.2015)

URL:

Sarodnick, F., & Brau, H. (2011). Methoden der Usability Evaluation. E. Bamberg, G. Mohr, & M. Rummel (Hrsg.). 2.Auflage. Hans Huber, Bern. Seffah, A., & Metzker, E. (2009). Adoption-centric Usability Engineering: Systematic Deployment, Assessment and Improvement of Usability Methods in Software Engineering. Springer, London. Whitefield, A., Wilson, F., & Dowell, J. (1991). A framework for human factors evaluation. Behaviour & Information Technology, 10(1), 65-79. Woywode, M., Mädche, A.,Wallach, D. & Plach, M. (2012). Abschlussbericht des Forschungsprojekts: Gebrauchstauglichkeit von Anwendungssoftware als Wettbewerbsfaktor für kleine und mittlere Unternehmen (KMU). ifm - Institut für Mittelstandsforschung Universität Mannheim. Zhang, Z. (2007). Usability Evaluation. In P. Zaphiris & S. Kurniawan (Hrsg.): Human Computer Interaction Research in Web Design and Evaluation. Idea Group Publishing, London, S.209-288. Zimmermann, D., & Grötzbach, L. (2007). A requirement engineering approach to user centered design. Proceedings of the 12th international Conference on Human-computer interaction: Interaction Design and Usability, 4550(4), 360 - 369.

Kontaktinformationen Christoph Ohl ([email protected]) Gabriele Schade ([email protected])

S. Diefenbach, N. Henze & M. Pielot (Hrsg.): Mensch und Computer 2015 Tagungsband, Stuttgart: Oldenbourg Wissenschaftsverlag, 2015, S. 43-52.

Evaluation des iRequire-Ansatzes: Anforderungsermittlung in der Praxis Melanie Janina Christine Stade1,2, Hanna Jorinde Wittkugel1, Norbert Seyff2,3 Technische Universität Berlin, Deutschland1 Fachhochschule Nordwestschweiz, Schweiz2 Universität Zürich, Schweiz3 Zusammenfassung iRequire zeigt einen innovativen Ansatz der Anforderungsermittlung auf, um aufwandsarm viele zukünftige Systembenutzer früh in die Systementwicklung zu integrieren. In der vorgestellten Studie wurde evaluiert, ob Benutzer mit der iRequire-App Ideen dokumentieren können und wie nützlich diese in einem realen Softwareprojekt sind. Zehn Diabetiker berichteten in zwei Wochen 19 Ideen zur Verbesserung des Diabetes-Alltags. Diese Ideen wurden als verständlich und nachvollziehbar eingestuft und ermöglichten, Anforderungen für ein App-Konzept abzuleiten. Sowohl die iRequire-App als auch den Studienzeitraum empfanden über die Hälfte der Teilnehmenden als angemessen, doch konnten nicht alle Benutzer ihre Ideen unmittelbar dokumentieren (z.B. weil das zur Dokumentation verwendete Smartphone nicht griffbereit war). Allerdings kann für das vorgestellte Praxisbeispiel geschlussfolgert werden, dass Benutzer mittels iRequire-App Ideen im Alltag kommunizieren konnten.

1

Einleitung

Besonders in frühen Phasen der Softwareentwicklung sollten Benutzer verstärkt in ein Softwareprojekt integriert werden (vgl. benutzerzentrierte Gestaltung, DIN 2010). Dabei existieren verschiedene Ansätze, um Anforderungen, Ideen und Wünsche der Benutzer an das zu entwickelnde Softwaresystem zu ermitteln. Traditionelle Ansätze zur Anforderungsermittlung fokussieren oftmals auf die Unterstützung durch AnforderungsAnalysten und werden tendenziell in Situationen eingesetzt, in denen kein Bezug zum eigentlichen Systemkontext hergestellt werden kann. In der Literatur wird verstärkt diskutiert, Wünsche und Ideen (nachfolgend Ideen) von Benutzern in ihrem (Arbeits-)Alltag beziehungsweise im zukünftigen Systemkontext zu erfassen, wobei die aktive Rolle des Benutzers hinsichtlich Ermittlung und Dokumentation von Ideen im Arbeitsumfeld bislang unterrepräsentiert ist (Seyff et al. 2010). Diese Lücke der Selbstberichts-Ansätze scheint durch Methoden verwandter Disziplinen ausgefüllt zu werden (siehe Abbildung 1). Zu

44 Melanie J. C. Stade, Hanna Wittkugel, Norbert Seyff2 Evaluation des iRequire-Ansatzes: Anforderungsermittlung in der J. Praxis diesen Methoden gehören u.a. Cultural Probes, Tagebücher und Story-Telling. Zahlreiche digitale Werkzeuge wurden bereits entwickelt und mit ihnen u.a. erforscht, welche Medien (z.B. Bonsignore 2005; Carter & Mankoff 2005; Landry & Guzdial 2006) und Schritte (z.B. Wehrmaker et al. 2012) Personen dabei unterstützen können, Ideen, Feedback und Ereignisse festzuhalten. Bislang wurde für diese Werkzeuge jedoch nur eingeschränkt erprobt, ob diese auch im (Arbeits-)Alltag etablierbar sind und von Benutzern akzeptiert werden. So wurde beispielsweise „Pocket Bee“ (Gerken et al. 2010) nicht auf den persönlichen Endgeräten der Benutzer getestet und bei „Storyteller“ (Poppinga et al. 2013) die Situation zur Erlebnisdokumentation vorgegeben. Ferner scheinen die genannten Werkzeuge eine möglichst umfangreiche und mit vielen (verschiedenen) Medien angereicherte Dokumentation zu fokussieren. Sollen diese Ansätze für die Anforderungsermittlung genutzt werden, so scheint es zum einen ineffizient für den Analysten, heterogene Datensätze mit diversen Medien auszuwerten (z.B. Bonsignore, 2011). Zum anderen ist unklar, ob beispielsweise die mit Cultural Probes gewonnenen Artefakte für Anforderungs-Analysten verständlich und nachvollziehbar sind, und sich somit konkrete Anforderungen ableiten lassen. Offen bleibt auch, ob die oben genannten Selbstberichts-Ansätze verwandter Disziplinen zur Ermittlung und Dokumentation von Ideen durch die zukünftigen Benutzer aufwandsarm eingesetzt werden können und dazu anregen, dass Benutzer Einträge verfassen. iRequire stellt einen innovativen Ansatz zur Einbindung von zukünftigen Systembenutzern in die Systementwicklung dar (Seyff et al. 2010). Hierbei werden die von den Benutzern ermittelten und dokumentierten Ideen als initiale und informale Anforderungen an ein zu erstellendes System aufgefasst. Von einer ersten Studie (Seyff et al. 2010) abgesehen, gibt es bislang keine ausführliche Evaluierung von iRequire, welche den erfolgreichen Einsatz dieses Ansatzes belegen könnte. Im Rahmen der nun durchgeführten Forschungsarbeit wird eine Studie vorgestellt, die den Einsatz von iRequire im Rahmen einer Diabetes-AppEntwicklung beschreibt und evaluiert. Die Evaluierung von iRequire stellt somit den wissenschaftlichen Beitrag dieser Arbeit dar.

Abbildung 1: Kategorien von Ansätzen zur Anforderungsermittlung (übersetzt und modifiziert nach Seyff et al. 2010)

Evaluation Evaluation des des iRequire-Ansatzes: iRequire-Ansatzes: Anforderungsermittlung Anforderungsermittlung in in der der Praxis Praxis

2

453

Beschreibung des iRequire-Ansatzes

Im Mittelpunkt des werkzeugbasierten iRequire-Ansatzes stehen Benutzer, die in natürlicher Sprache immer und überall ihre Ideen an ein zu erstellendes Softwaresystem dokumentieren. Diese Ideen, die parallel von vielen Benutzern kommuniziert werden, dienen dann dem Analysten als Basis zur Formulierung von konkreten Anforderungen an das zu erstellende Softwaresystem. Zu betonen ist, dass Ideen dann von Benutzern dokumentiert werden, wenn sie aufkommen. Um Benutzer zu dieser in-situ Ermittlung und Dokumentation zu motivieren, sollte der Ansatz aufwandsarm und unaufdringlich praktizierbar sein. Hierbei erscheint das Smartphone als Bestandteil des täglichen Lebens als geeignetes Gerät zur (längerfristigen) Dokumentation. Die vorgegebene Struktur für die Erfassung und Dokumentation soll sowohl den Benutzer unterstützen als auch dem Analysten die Auswertung erleichtern. Zusätzlich können erfasste Kontextinformationen (z.B. ein Foto der Umgebung) dem Analysten helfen, den zukünftigen Systemkontext besser zu verstehen.

2.1 Aufbau der iRequire-App Für die Umsetzung des iRequire-Ansatzes in der Praxis wurde die sog. iRequire-App entwickelt (Seyff et al. 2010; Seyff et al. 2011). Die aktuelle, englischsprachige Version ist lauffähig auf iOS und Android Smartphones. In der App wird der Benutzer mit vorgegebenen Fragen durch die Dokumentation seiner Idee geführt (sog. Eintrag). Das Erstellen eines Eintrages ist dabei vergleichbar mit dem Anfertigen kurzer Notizen. Die Dokumentation der Idee erfolgt in vier Schritten. (1) Der Benutzer wird instruiert, optional ein Foto seiner Umgebung oder eines Gegenstandes einzufügen. (2) Der Benutzer beschreibt nun kurz seine Idee (freie Texteingabe; in allen Textfeldern ist die Zeichenangabe begrenzt) und (3) hält fest, bei welchen Handlungen und wo er unterstützt werden würde, wenn die Idee umgesetzt werden würde (freie Texteingabe). (4) Abschließend beschreibt der Benutzer, warum die Idee für ihn wichtig ist. Zusätzlich wird in der iRequire-App mit mehreren optionalen Fragen erfasst, was diese berichtete Idee ausgelöst hat. Diese Fragen ermöglichen, Hintergründe in Bezug auf die Entstehung der Idee besser zu verstehen. Der Benutzer beantwortet, (5) ob ihm die Idee gerade eingefallen ist (diverse Auswahloptionen), (6) wo er gerade ist und was er gerade tut (freie Texteingabe), (7) wo er war und was er tat, als er die Idee hatte (freie Texteingabe), (8) ob seine aktuelle Situation die Idee ausgelöst oder beeinflusst hat (diverse Auswahloptionen), (09) ob er gerade in einer Situation ist, die ähnlich ist zu der Situation, in der das gewünscht System eingesetzt werden soll (diverse Auswahloptionen), (10) wie er sich gerade fühlt (Schieberegler mit den Ankern „negativ“, „neutral“ und „positiv“). Vor dem Absenden der dokumentierten Idee erhält der Benutzer Teile seiner eingetragenen Daten (Bild, Kurzbeschreibung Idee, Wichtigkeit der Idee) in einer Übersicht dargestellt. Nach Abschicken des Eintrags erhält der Benutzer den Hinweis, dass die Daten gesendet wurden, und es öffnet sich erneut der Startbildschirm der iRequire-App.

46 Melanie J. C. Stade, Hanna Wittkugel, Norbert Seyff4 Evaluation des iRequire-Ansatzes: Anforderungsermittlung in der J. Praxis

2.2 Anwendung der iRequire-App Eine erste Studie zur Evaluation des iRequire-Ansatzes wurde mit einer prototypischen Applikation für Windows Mobile 6.0 durchgeführt (Seyff et al. 2010). Neun Benutzer dokumentierten auf einem ausgehändigten Smartphone ein bis drei Tage lang ihre Ideen zum Thema „Einkaufen“ bzw. „Berufsverkehr“. Diese Studie zeigte, dass die iRequire-App Benutzer bei der Dokumentation von Ideen unterstützt. Ein weiteres Ergebnis war, dass die von den Benutzern eingefügten Fotos beim Verstehen der dokumentierten Ideen von den Autoren als hilfreich eingeschätzt wurden. Dabei muss erwähnt werden, dass diese Anforderungen ohne das Ziel, ein konkretes Softwaresystem zu bauen, erhoben wurden. Um aktuelle Smartphone Betriebssysteme zu unterstützen, wurden überarbeitete Versionen der iRequire-App für iOS und Android entwickelt. Diese aktuellen Versionen bilden die Ausgangsbasis für die Evaluierung von iRequire in Softwareprojekten. In unserem Softwareprojekt sollte eine App für Diabetiker entwickelt werden, die diese im Alltag unterstützen soll. Das Ziel der vorliegenden Studie war es, die iRequire-App in einem realen Softwareprojekt zu evaluieren und dabei die folgenden methodischen Einschränkungen der ersten Evaluationsstudie zu überwinden: (1) Ermittlung und Dokumentation von Ideen über einen längeren Zeitraum (zwei Wochen statt ein bis drei Tage) und (2) Dokumentation von Ideen auf dem eigenen Smartphone der Benutzer. In der Evaluation wird wie bei der Ausgangsstudie fokussiert, (1) ob Benutzer in der Lage sind, Ideen mit der iRequire-App festzuhalten und (2) wie verständlich und hilfreich diese dokumentierten Ideen für die Softwareentwicklung sind. Da sich der iRequire-Ansatz in die alltagsnahe Datenerhebung einordnen lässt, wurden nach Fahrenberg und Kollegen (2002) zur Gütemessung der Datenerhebung zusätzlich Compliance (z.B. instruktionsgemäßes unmittelbares Festhalten von Ideen), methodenbedingte Reaktivität (z.B. verändertes Verhalten aufgrund der Studienteilnahme) und Akzeptanz (z.B. Bedienbarkeit der App, Länge des Studienzeitraums) erfasst.

3

Methode

3.1 Stichprobe und Durchführung Die Studienteilnehmer wurden über Foren, Facebook- und Selbsthilfe-Gruppen, Auslagen in Arztpraxen sowie über das Probandenportal der Technischen Universität Berlin rekrutiert. Zehn Diabetiker im Alter von 20 bis 47 Jahren (M=30,8, SD=9,6 Jahre) nahmen an der zweiwöchigen Studie teil. Die Diagnose Diabetes (in neun Fällen Typ 1, in einem Fall Typ 2) der acht Diabetikerinnen und zwei Diabetiker wurde vor einem halben Jahr bis zu 28 Jahren gestellt. Nach Anmeldung zur Studie wurden die Studienteilnehmer instruiert, mit der iRequire-App auf dem eigenen Smartphone solche Ideen festzuhalten, die einen erleichterten Alltag mit Diabetes ermöglichen könnten. Anzahl und Inhalte der Einträge wurden nicht vorgegeben. In

Evaluation Evaluation des des iRequire-Ansatzes: iRequire-Ansatzes: Anforderungsermittlung Anforderungsermittlung in in der der Praxis Praxis

475

der Instruktion wurde betont, dass es unwichtig sei, ob und wie eine Idee realisiert werden könnte. Ideen sollten spontan und unmittelbar dokumentiert werden. Mit einem beispielhaften Eintrag in der iRequire-App wurden die Schritte in der iRequire-App erläutert. Mit der eigenständigen Installation der iRequire-App auf dem Smartphone startete die Studie. Während der Studie standen die Autoren jeder Zeit für Rückfragen zur Verfügung. Die Studie endete nach zwei Wochen mit einer Online-Nachbefragung.

3.2 Messungen Eine Nachbefragung zu Compliance, methodenbedingter Reaktivität und Akzeptanz im Anschluss an eine alltagsnahe Datenerhebung ist zweckmäßig, um zum einen Informationen über Besonderheiten und Störungen der Datenerhebung zu erhalten, aber auch, um Hinweise zur Verbesserung der Datenerhebung zu gewinnen (Fahrenberg et al. 2002). Angelehnt an die Empfehlungen und Beispiele der Autoren wurden die Items zu Compliance, Methodenbedingte Reaktivität und Akzeptanz für die vorliegende Studie wie folgt formuliert. Compliance. (1) In-situ Ermittlung und Dokumentation: „In wie vielen Fällen haben Sie Ihre Ideen sofort mit der iRequire-App erfasst - Bitte schätzen Sie!“ („in mehr als 80% der Fälle“, „zwischen 60% und 80% der Fälle“, „zwischen 40% und 60% der Fälle“, „zwischen 20% und 40% der Fälle“, „in weniger als 20% der Fälle“), (2) Situationsbeschreibung für nicht unmittelbare Dokumentation: „Können Sie uns eine Situation (gerne auch mehrere) beschreiben, in der Sie Ihre Idee nicht sofort mit der iRequire-App festgehalten haben?“ (freies Antwortformat). Methodenbedingte Reaktivität. Diese wurde erhoben mit dem Item „Haben Sie sich während der Studie anders verhalten, um Ideen zu generieren?“ (Antwortkategorien „nie“, „selten“, „gelegentlich“, „oft“, „immer“) Akzeptanz. (1) Angemessenheit iRequire-App: „Halten Sie die iRequire-App für angemessen, um Ideen für die Verbesserung von Diabetes im Alltag festzuhalten?“ („Nein, es war zu kompliziert.“, „Nein, es hat nicht immer funktioniert.“, „Ja, es hat immer gut funktioniert.“, „Ja, es hat überhaupt keine Umstände gemacht.“), (2) Zeitraum der Studie: „Halten Sie den Zeitraum der Studie für angemessen, um Ideen für eine Verbesserung des Alltags mit Diabetes festzuhalten?“ („Nein, es war zu wenig Zeit, um Ideen zu dokumentieren.“, „Nein, es war zu lang, um Ideen zu dokumentieren.“, „Ja, genau richtig, um Ideen zu dokumentieren.“, „Ja, es hätten ruhig noch mehr Tage sein können, um Ideen zu dokumentieren.“), (3) Erneute Studienteilnahme: „Könnten Sie sich vorstellen, erneut an einer Studie mit der iRequire-App teilzunehmen, um im Rahmen einer anderen Fragestellung Ideen festzuhalten?“ (Antwortkategorien „ja“, „nein“) Das Gesamturteil über die iRequire-App wurde mit dem Item des meCUE-Fragebogens (Minge & Riedel 2013) erfasst. Auf einer einstufigen Skala von „-5 schlecht“ bis „+5 gut“ gaben die Studienteilnehmer an, wie sie „die iRequire-App insgesamt bewerten“. Zusätzlich wurden im offenen Antwortformat Verbesserungsvorschläge für die iRequire-App erfragt. Bei jeder Ideenbeschreibung macht der Benutzer in der iRequire-App Angaben, ob seine aktuelle Situation die Idee ausgelöst oder beeinflusst hat (siehe oben). Um ein globales,

48 Melanie J. C. Stade, Hanna Wittkugel, Norbert Seyff6 Evaluation des iRequire-Ansatzes: Anforderungsermittlung in der J. Praxis abschließendes Urteil der Studienteilnehmer zum Zusammenhang zwischen Anwesenheit im aktuellen Kontext und Auslösung der Idee zu erheben, wurden die Studienteilnehmer zum Ideenauslöser befragt: „Haben Sie das Gefühl, dass Ihre Anwesenheit in dem Kontext (d.h. in der Situation), auf den sich Ihre Ideen beziehen, die Ideen selbst ausgelöst hat?“ („Ja, ich denke, die meisten meiner Ideen wurden durch meine Anwesenheit in diesem Kontext ausgelöst.“, „Ja, ich denke, manche meiner Ideen wurden durch meine Anwesenheit in diesem Kontext ausgelöst.“, „Ich bin mir nicht sicher, ob zwischen meiner Anwesenheit in diesem Kontext und der Auslösung meiner Ideen ein Zusammenhang besteht.“, „Nein, ich denke nicht, dass meine Ideen durch meine Anwesenheit in diesem Kontext ausgelöst wurden.“, „Ich hätte genau dieselben Ideen auch ohne meine Anwesenheit in diesem Kontext erfasst.“)

3.3 Datenauswertung Angelehnt an Mayring (2010) wurden die Einträge in der iRequire-App inhaltlich strukturiert. Die Daten der Nachbefragung wurden aufgrund der geringen Stichprobenanzahl (neun Teilnehmer füllten den Fragebogen aus) deskriptiv ausgewertet. Die Strukturierung der Einträge und die Auswertung der Nachbefragung erfolgten durch die beiden Autorinnen in einem zwei-stündigen Workshop.

4

Ergebnisse

4.1 Einträge in der iRequire-App Die zehn Studienteilnehmenden ermittelten und dokumentierten insgesamt 19 Einträge. Jede Person hielt mindestens eine Idee fest (Max=5, M=2.2, SD=1.4). Jeder zweite Eintrag enthielt ein Foto. Abbildung 3 zeigt ausschnitthaft einen Eintrag in der iRequire-App. Take a picture of your surroundings and relevant objects.

Please express your need. "Merken"-Funktion ob man bereits Insulin gespritzt hat oder nicht.. Please describe the activity that will be supported by the requested need and where the activity takes place. entweder "merkt" es sich der Pen und zeigt es an, oder es wird von der App registriert Please describe why the need is important to you. Manchmal vergisst man, ob man schon gespritzt hatte. Spritzt man aus versehen 2mal, ist es gefährlich! gar nicht Spritzen auch, wenn man dachte man hatte schon Please describe where you had the idea and what activity you were performing. Nach dem Frühstück im Wohnzimmer

Abbildung 3: Ein Beispiel für eine ermittelte Idee (in kursiv Zitierung eines Studienteilnehmers).

Evaluation Evaluation des des iRequire-Ansatzes: iRequire-Ansatzes: Anforderungsermittlung Anforderungsermittlung in in der der Praxis Praxis

497

Die beiden Autorinnen mit Domänenwissen (Psychologin, Designerin; letztere verantwortlich für den Entwicklungsprozess) prüften zunächst, ob die Einträge verständlich und nachvollziehbar waren. Da dies gegeben war, wurden in Anlehnung an das Vorgehen der qualitativen Inhaltsanalyse nach Mayring (2010) nun aus den Einträgen induktiv die folgenden sechs Kategorien (kursiv) mit insgesamt 13 Unterkategorien gebildet (Nennungshäufigkeit in Klammern): • Medikamente/Medikamenteneinnahme: App zur Erinnerung und Verwaltung von Rezepten und Medikamenten-Vorräten (1), App zur Erinnerung an Einnahme von Medikamenten/ Insulin (1), schneller wirksames Insulin (1) • Nahrungsmittel-/Nährwertangaben: Nährwertangaben auch für ungewöhnlichere Nahrungsmittel (1), Scanner/ App für Nahrungsmittel zur Angabe von Nährwerten (2), Lebensmittel, für die kein Insulin gespritzt werden muss (3) • Zubehöraufbewahrung: Bessere Aufbewahrung und Ordnung des Diabetiker-Zubehörs (1) • Technische Hilfsmittel: Integration von Pumpe und Blutzuckerüberwachung (2), Blutzuckermessgerät für Android-Smartphones (1), Steuerung der Insulinpumpe über das Smartphone (1) • Dokumentation und Analyse: Digitale Tagebuchführung mit plattformunabhängiger Software (1) • Belohnung/Entspannung: Belohnung nach dem Sport (1), Ruhe und Entspannung (3)

4.2 Auswertung der Nachbefragung Compliance. (1) In-situ Ermittlung und Dokumentation: Vier Personen haben in weniger als 20% der Fälle und eine Person zwischen 20% und 40% der Fälle ihre Ideen sofort mit der iRequire-App erfasst. Eine Person gab „zwischen 60% und 80% der Fälle“ und drei Personen „in mehr als 80% der Fälle.“ an. (2) Situationsbeschreibung für nicht unmittelbare Dokumentation: Genannt wurde hier (Zitierung) „Handy nicht zur Hand. keine Fotomöglichkeit“, „Ich hatte einfach auf Arbeit zu tun und habe dann erst später, etwa zu hause daran gedacht“, „Im Restaurant während der Essensauswahl Beim Einkaufen im Supermarkt“. Methodenbedingte Reaktivität. Die meisten Studienteilnehmer (N=7) haben sich „nie“ während der Studie anders verhalten, um Ideen zu generieren. Jeweils eine Person hat sich „selten“ bzw. „gelegentlich“ anders verhalten. Nähere Angaben, inwiefern sich die Person in welcher Situation anders verhalten hat, wurden nicht erfragt. Akzeptanz. (1) Angemessenheit iRequire-App: Fünf Studienteilnehmer hielten die iRequireApp für angemessen, um Ideen für die Verbesserung von Diabetes im Alltag festzuhalten. Jeweils zwei Studienteilnehmer verneinten die Frage, denn „es war zu kompliziert“ bzw. „es hat nicht immer funktioniert“. (2) Zeitraum der Studie: Sieben Studienteilnehmer hielten den Zeitraum der Studie für „genau richtig, um Ideen zu dokumentieren“. Jeweils ein

50 Melanie J. C. Stade, Hanna Wittkugel, Norbert Seyff8 Evaluation des iRequire-Ansatzes: Anforderungsermittlung in der J. Praxis Studienteilnehmer gab an, dass es noch mehr Tage hätten sein können bzw. der Zeitraum nicht angemessen war, da es zu wenig Zeit war, um Ideen zu dokumentieren. (3) Erneute Studienteilnahme: Acht Studienteilnehmer könnten sich eine erneute Teilnahme an einer Studie mit der iRequire-App für das Dokumentieren von Ideen vorstellen. Eine Person würde nicht erneut teilnehmen. Gesamturteil iRequire-App. Die iRequire-App wurde insgesamt als eher gut bewertet (M=1.14, SD=2.54). Mehrfach gewünscht wurde die Funktion, ein Feedback über abgesendete Einträge zu erhalten (ob bei der Studienleitung angekommen und ob die Einträge „richtig“ sind). Auch soll die Sprache und Textgröße anpassbar sein. Ein ansprechenderes Design würde die iRequire-App ebenfalls verbessern, da es dann „mehr ‚Spaß‘ macht, Ideen festzuhalten“. Die Funktion des Einfügens eines Fotos wurde von einem Studienteilnehmer explizit als positiv bewertet: „Vor allem gefällt mir die Idee des Fotos machens!“ Als Verbesserung des iRequire-Ansatzes wurde genannt, die Beiträge Anderer lesen zu können: „Ich glaube, dass man, wenn man Ideen anderer Teilnehmer lesen könnte häufig diese weiterentwickeln könnte und so noch mehr gute Ideen haben könnte.“ sowie „Beiträge von anderen in anonymer Form einsehen können wäre toll...“. Ideenauslöser. Der Hauptteil der Studienteilnehmer denkt, dass die meisten bzw. manche (vier bzw. zwei Nennungen) ihrer Ideen durch die Anwesenheit in dem jeweiligen Kontext ausgelöst wurden. Zwei Studienteilnehmer waren sich nicht sicher über den Zusammenhang zwischen Anwesenheit in dem jeweiligen Kontext und der Auslösung der Idee. Nur eine Person glaubte nicht an diesen Zusammenhang.

5

Diskussion der Ergebnisse

In der beschriebenen Evaluationsstudie des iRequire-Ansatzes konnte gezeigt werden, dass der iRequire-Ansatz funktioniert und alle Studienteilnehmer Ideen ermitteln und dokumentieren konnten. Alle 19 Einträge in der iRequire-App waren verständlich, nachvollziehbar und verwertbar: Aus den Ideen konnten in unserem Softwareprojekt erfolgreich Anforderungen für ein App-Konzept zur Unterstützung von Diabetikern abgeleitet und in Form eines ersten Prototypens umgesetzt werden. Inwieweit andere Ansätze zur Ermittlung von Anforderungen wie beispielsweise Workshops zu ähnlichen Ergebnissen geführt hätten, wurde nicht untersucht. Der Großteil der Einträge spiegelt jedoch die Erkenntnisse aus der parallel vorgenommenen Literaturrecherche und Marktanalyse wider. Die im iRequire-Ansatz kommunizierten Ideen waren demnach ein relevanter Bestandteil der Anforderungsermittlung. Trotz der Verwertbarkeit aller Einträge in der iRequire-App hätten wir mehr Ideen erwartet. Mögliche Gründe für das Ausbleiben weiterer Ideen könnten, wie nachfolgend diskutiert, (1) fehlende Ideenauslöser und (2) Schwächen des Werkszeugs sein. Das mögliche Fehlen von Ideenauslösern könnte mit dem speziellen Anwendungskontext der Studie zusammenhängen. Die Diagnose Diabetes lag bei einigen Studienteilnehmern bereits Jahre zurück. Es ist anzunehmen, dass sich diese Personen mit ihrer Erkrankung im Alltag

Evaluation Evaluation des des iRequire-Ansatzes: iRequire-Ansatzes: Anforderungsermittlung Anforderungsermittlung in in der der Praxis Praxis

519

arrangiert haben und folglich schwer in-situ Ideen für einen verbesserten Alltag generieren konnten. Die Nachbefragung zeigte, dass die Studie hätte länger dauern können und sollen. Auch wurde als Verbesserung des iRequire-Ansatzes genannt, die Einträge anderer Studienteilnehmer als Anregung für eigene Ideen einsehen zu können. Ein Ausbleiben der Dokumentation von Ideen könnte in Schwächen des Werkzeugs begründet sein. Das Gesamturteil der iRequire-App im meCUE-Fragebogen lag zwar im positiven, jedoch niedrigen Wertebereich. Ferner hielten vier Studienteilnehmer die iRequire-App als nicht angemessen, um Ideen für die Verbesserung im Alltag festzuhalten. Die Studie wurde als Online-Studie ohne persönliches Briefing realisiert. Die Eingabe von persönlichen Daten und Bildern bezüglich Kontext, Umfeld und Tätigkeit in einer unbekannten App an unbekannte Adressaten hinter der App kann auf die Studienteilnehmer abschreckend gewirkt haben. In folgenden Studien sollte daher stärker betont werden, wofür die dokumentierten Ideen verwendet werden und wer Empfänger dieser Ideen ist. Grundsätzlich bleibt zu untersuchen, wie Benutzer über einen längeren Zeitraum motiviert werden können, aktiv und eigenständig im (Arbeits-)Alltag Ideen festzuhalten. Als eine von vielen Apps auf dem Smartphone des Benutzers ist die iRequire-App unaufdringlich und kann daher schnell in Vergessenheit beim Benutzer geraten. Zukünftige Studien sollten daher evaluieren, inwieweit eine Kombination mit Erinnerungssignalen und Zwischenfeedbacks der Studienleitung Einfluss auf die Motivation der Benutzer und die Anzahl und Qualität der Einträge mit der iRequire-App hat. Auch bleibt offen, ob das Einsehen und darüber hinaus Bewerten, Diskutieren und Priorisieren der Einträge von anderen Benutzern motivierend wirken und das Auslösen von Ideen unterstützen kann (vgl. Kommentar „Beiträge von anderen in anonymer Form einsehen können wäre toll...“). Zu klären ist, wie für Benutzer im beschriebenen iRequire-Ansatz der Nutzen einer (Studien-)Teilnahme hervorgehoben und die Wertschätzung für dokumentierte Ideen ausgedrückt werden kann. Trotz diskutierter Einschränkungen konnten Benutzer der iRequire-App in-situ Ideen für einen verbesserten Diabetes-Alltag generieren. Dies unterstützte die Anforderungsanalyse für eine Diabetes-App und führte zu einem besseren Verständnis der Zielgruppe. Literaturverzeichnis Bonsignore. E. (2011). Sharing stories "in the wild": a mobile storytelling case study. In CHI '11 Extended Abstracts on Human Factors in Computing Systems (pp. 917-922). ACM, New York, NY, USA. Carter, S., & Mankoff, J. (2005). When participants do the capturing: the role of media in diary studies. In Proceedings of the SIGCHI Conference on Human Factors in Computing Systems (pp. 899-908). New York, NY, USA: ACM. DIN Deutsches Institut für Normung e.V. (2006). Ergonomie der Mensch-System-Interaktion – Teil 210: Prozess zur Gestaltung gebrauchstauglicher interaktiver System. Berlin: Beuth Verlag. Fahrenberg, J., Leonhart, R. & Foerster, F. (2002). Alltagsnahe Psychologie. Datenerhebung im Feld mit hand-held PC und physiologischem Mess-System. Bern: Hans Huber.

52 Melanie J. C. Stade, Hanna Wittkugel, Norbert Seyff Evaluation des iRequire-Ansatzes: Anforderungsermittlung in der J. Praxis 10 Gerken, J., Dierdorf, S., Schmid, P., Sautner, A., & Reiterer, H. (2010). Pocket Bee: a multi-modal diary for field research. In Proceedings of the 6th Nordic Conference on Human-Computer Interaction: Extending Boundaries (pp. 651–654). New York, NY, USA: ACM. Landry, B. M. & Guzdial, M. (2006). iTell: supporting retrospective storytelling with digital photos. In Proceedings of the 6th conference on Designing Interactive systems (DIS '06) (pp. 160-168). ACM, New York, NY, USA. Mayring, P. (2010). Qualitative Inhaltsanalyse. In G. Mey & K. Mruck (Hrsg.): Handbuch Qualitative Forschung in der Psychologie. Wiesbaden: Springer Fachmedien, S. 601-613. Minge, M. & Riedel, L. (2013). meCUE – Ein modularer Fragebogen zur Erfassung des Nutzungserlebens. In: S. Boll, S. Maaß & R. Malaka (Hrsg.): Mensch und Computer 2013: Interaktive Vielfalt. München: Oldenbourg Verlag, S. 89-98. Poppinga, B., Oehmcke, S., Heuten, W. & Boll, S. (2013). Storyteller: in-situ reflection on study experiences. In Proceedings of the 15th international conference on Human-computer interaction with mobile devices and services (MobileHCI '13) (pp. 472-475). ACM, New York, NY, USA. Seyff, N., Graf, F., & Maiden, N. (2010). Using Mobile RE Tools to Give End-Users Their Own Voice. In 18th IEEE International Requirements Engineering Conference. S. 38-46. Seyff, N., Ollmann, G., & Bortenschlager, M. (2011). iRequire: Gathering end-user requirements for new apps. In Requirements Engineering Conference (RE), 2011 19th IEEE International. S. 347348. Wehrmaker, T., Gärtner, S., & Schneider, K. (2012). ConTexter feedback system. In Proceedings of the 2012 International Conference on Software Engineering (pp. 1459-1460). Piscataway, NJ, USA: IEEE Press

Kontaktinformationen [email protected]; [email protected]; [email protected]

S. Diefenbach, N. Henze & M. Pielot (Hrsg.): Mensch und Computer 2015 Tagungsband, Stuttgart: Oldenbourg Wissenschaftsverlag, 2015, S. 53-62.

„Das stand doch auf Facebook“: Museen in sozialen Netzwerken Verena Holtkötter1, Michael Prilla2 LWL-Landesjugendamt, Schulen, Koordinationsstelle Sucht, Landschaftsverband WestfalenLippe (LWL)1 Informations- und Technikmanagement, Ruhr-Universität Bochum2 Zusammenfassung Museen sind zunehmend in sozialen Medien präsent, um sich neue Zielgruppen zu erschließen und Nutzer aktiver in die Museumsarbeit zu integrieren. Gleichwohl haben die Gestalter solcher Auftritte oft kaum Kenntnisse über die Ansprüche ihrer Nutzer. In diesem Beitrag wird eine Studie mit 16 (potenziellen) Nutzern der Auftritte zweier Museen in Facebook beschrieben, anhand derer Nutzerbedarfe identifiziert werden. Der Beitrag benennt hierzu vier Dimensionen (Themen) dieser Ansprüche, leitet eine Nutzertypologie ab und beschreibt Gestaltungsempfehlungen auf Basis der Erkenntnisse aus der Studie.

1

Einleitung

Kultureinrichtungen wie Museen sind im Wandel: Einerseits besteht ein fortschreitender Zwang zur inhaltlichen und betriebswirtschaftlichen Rechtfertigung des Daseins von Kulturbetrieben (Hausmann & Frenzel 2014), andererseits verändern sich sowohl die Interpretation des Bildungsauftrags als auch die Erwartungen von Besuchern der Kultureinrichtungen hin zur Inklusion verschiedener Zielgruppen bzw. zu einer Erlebniskultur (Chung et al. 2014; Lehman & Roach 2011; Hausmann & Frenzel 2014). Für beide Stränge dieses Wandels müssen Museen neue Wege finden, mit denen sie auf Besucher eingehen, mit ihnen interagieren und sie an sich binden können. Vermehrt treten Kultureinrichtungen mit ihrem Programm daher auch in sozialen Medien auf. Die Nutzung sozialer Medien eröffnet für Kultureinrichtungen Potenziale der Kommunikation mit und Bindung von Interessenten, erzeugt gleichzeitig aber auch neue Herausforderungen. Negative Meinungen und Meldungen, positive Nachrichten und Ereignisse können in kürzester Zeit an viele Menschen kommuniziert werden. Kenntnisse über die Ansprüche von Nutzern sind daher auch für ein erfolgreiches Engagement von Kultureinrichtungen in sozialen Medien unerlässlich. Genau diese Notwendigkeit bereitet jedoch vielen Einrichtungen in

54 Verena Holtkötter, Michael Prilla2 „Das stand doch auf Facebook“: Museen in sozialen Netzwerken der Praxis Schwierigkeiten: Oft wissen diese nicht, welche Bedarfe und Gewohnheiten ihre Nutzer haben (Chung et al. 2014). Die Anzahl der Studien zu Ansprüchen an Unternehmen in sozialen Medien wächst beständig; im Kontext von Kultureinrichtungen sind diese jedoch weitgehend unerforscht. Es ist zudem fraglich, ob Nutzeransprüche an Kultureinrichtungen mit denen an Unternehmen einhergehen. Dieser Beitrag beschreibt daher eine Studie, in der die Auftritte zweier Museen in Facebook untersucht werden. Der Beitrag trägt zum Verständnis der Nutzung sozialer Medien für Kultureinrichtungen bei, indem er Nutzerbedarfe und -gewohnheiten identifiziert und daraus resultierende Gestaltungsmöglichkeiten für den Auftritt von Museen und anderen Kultureinrichtungen in sozialen Medien aufzeigt.

2

Verwandte Arbeiten

2.1 Gestaltung und Marketing moderner Kultureinrichtungen Im Zuge des gesamtgesellschaftlichen Wertewandels und des steigenden Ökonomisierungsdrucks befinden sich Museen mehr denn je in einem Spannungsfeld zwischen ihren traditionellen, kulturpolitisch vorgegebenen Zielsetzungen und den zunehmend erlebnisorientierten Ansprüchen potenzieller Besucher (Gentischer 2011). Als offene Bildungseinrichtungen "Orte des Lernens" - können Museen die Bedürfnisse der Besucher nicht mehr befriedigen (Heinze 2008). Erlebnisversprechende Angebote (z. B. "Lange Nacht der Museen") sind heute zentraler Bestandteil der kulturellen Vermittlungsarbeit. In diesem Zusammenhang wird auch die Nutzung sozialer Medien für Kultureinrichtungen interessant (Chung et al. 2014; Hausmann & Frenzel 2014).

2.2 Organisationen in Facebook: Wirkung und Nutzerbedarfe Die Präsenz von Unternehmen in sozialen Netzwerken ist häufig durch ökonomische Nutzerabsichten motiviert (Chung et al. 2014; Heymann-Reder 2012; Weinberg 2012). Dabei stehen bspw. materielle oder konsumrelevante Aspekte wie der Erhalt von Rabatten, Vergünstigungen oder (Sonder-) Angeboten bei den Nutzeransprüchen im Vordergrund (Chung et al. 2014). Weitere Inhalte sind unternehmensbezogene Informationen, der Aufbau eines Markenbewusstseins, die Steigerung der Markensympathie und -verbundenheit, Kundenbindung oder Rekrutierung (Heymann-Reder 2012; Weinberg 2012).

2.3 Museen in sozialen Netzwerken In der Besucherforschung und für das Marketing bieten soziale Netzwerke wie Facebook bedeutsame Potenziale für Kultureinrichtungen. Viele Museen sind bereits in Facebook aktiv bzw. entwickeln Strategien für ihre künftige Beteiligung im sozialen Netzwerk (Chung et al. 2014; Lehman & Roach 2011; Scheurer & Spiller 2010; Hausmann & Frenzel 2014). Im Unterschied zu Organisationen aus der Wirtschaft liegt das Potenzial hierbei nicht vorrangig

„Das „Das stand stand doch doch auf auf Facebook“: Facebook“: Museen Museen in in sozialen sozialen Netzwerken Netzwerken

553

in materiellen Vorteilen (bspw. Vergünstigungen bei Produkten), sondern in nichtmateriellen Bereichen wie der Verbesserung der Beziehung zwischen Besuchern und dem Museum (Chung et al. 2014) oder der besseren Vermittlung von Kunst und Kultur (Hausmann & Frenzel 2014). Vorhandene Arbeiten beziehen sich häufig auf den Bildungsauftrag von Museen, also die Vermittlung des Verständnisses für Exponate bspw. durch Bereitstellung von Informationen (Chung et al. 2014). Schwieriger ist häufig die Bindung von Interessenten an und die Gewinnung von Besuchern für eine Einrichtung, da Marketing und Kulturvermittlung in vielen Einrichtungen getrennt sind (Hausmann & Frenzel 2014). Soziale Netzwerke können eine Möglichkeit des Marketings sein (Lehman & Roach 2011), die Aufmerksamkeit für die Einrichtung erhöhen (bspw. durch Informationen zu Ausstellungen) und Community-Bildung ermöglichen (Chung et al. 2014). Diese Potenziale entstammen jedoch meist der Befragung von Personen, die für den Auftritt von Kultureinrichtungen verantwortlich sind, und beziehen Nutzer nicht ein. Chung et al. (2014) berichten sogar von Unsicherheiten einiger Befragten über die Wirksamkeit ihres Vorgehens bei der Nutzung sozialer Medien. Die beschriebenen Arbeiten zeigen zwar die Ziele und Schwierigkeiten von Kultureinrichtungen in sozialen Netzwerken auf, untersuchen jedoch nicht die Bedarfe und Ziele von Nutzern, die Kontakt zu einer Kultureinrichtung haben. Dies führt dazu, dass statt gezielter, nutzerorientierter Strategien häufig Annahmen über die Zielgruppen die Social MediaAktivitäten leiten (Chung et al. 2014; Lehman & Roach 2011).

3

Studie: Nutzerbedarfe am Beispiel zweier Museen

Zur Identifikation von Nutzeransprüchen an den Auftritt von Kultureinrichtungen in sozialen Medien wird im Folgenden eine Studie beschrieben, in der diese Bedarfe und Wünsche untersucht werden. Sie betrachtet Facebook als Beispiel sozialer Netzwerke. In dem weltweit größten sozialen Netzwerk findet sich eine Vielzahl und Bandbreite von Nutzern. Facebook ist die priorisierte Social Media-Anwendung für die überwiegende Zahl von Kultureinrichtungen, die in sozialen Medien präsent sind.

3.1 Forschungsfrage Forschungsziel ist die Identifikation von Nutzererwartungen an Museen in sozialen Netzwerken, um daraus Gestaltungsempfehlungen für den Auftritt von Kultureinrichtungen in sozialen Medien zu gewinnen. Da bisher kaum bzw. keine Erkenntnisse zu diesen Erwartungen vorhanden sind, wird folgende zentrale Forschungsfrage leitend sein: Welche Ansprüche haben Nutzer an die Facebook-Seiten von Museen? Als Teil dieser Frage werden in der Analyse der Kontext der Nutzer, ihr Lese- und Interaktionsverhalten, Nutzungsintentionen sowie die Rahmenbedingungen der Facebook-Seiten thematisiert.

56 Verena Holtkötter, Michael Prilla4 „Das stand doch auf Facebook“: Museen in sozialen Netzwerken

3.2 Die Museen Gegenstand der Untersuchung sind die Facebook-Seiten des LWL-Museums für Kunst und Kultur in Münster1 und des LWL-Museums für Archäologie in Herne2. Beide Museen sind seit 2010 und mit gewissem Erfolg in Facebook vertreten, wie ihre Nutzerzahlen (jeweils über 1.500 „Gefällt mir“-Angaben) zeigen, wünschen sich jedoch mehr Resonanz für ihre Seiten und besseren Kontakt mit (möglichen oder vorhandenen) Besuchern. Es wurden bewusst Museen mit unterschiedlichen Themenbereichen und aus verschiedenen Regionen gewählt, um einen Einfluss beider Faktoren in der Untersuchung gering zu halten.

3.3 Untersuchungsdesign und Ablauf der Studie Die Ergebnisse vorhandener Studien zum Auftritt von Unternehmen in sozialen Medien können für Kulturbetriebe nicht ohne Weiteres übernommen werden. Zum einen weichen die Spezifika von Kulturbetrieben wie bspw. öffentlich-rechtliche Trägerschaft, qualitative Zielsetzungen und kultureller Bildungsauftrag von den Zielen eines Unternehmens ab, zum anderen verfolgen Kulturbetriebe in sozialen Medien eine nicht-materiell orientierte Strategie (Chung et al. 2014). Statt eines hypothesenprüfenden, quantitativen Verfahrens bedient sich die Studie daher eines qualitativen Ansatzes, in dem eine Stichprobe aus (potenziellen) Nutzern der Museen interviewt wurde (siehe Auswahl der Teilnehmer unten). In semistrukturierten Interviews wurden Fragestellungen zu Lese- und Interaktionsverhalten auf den Seiten, Nutzungsintentionen, inhaltlichen und formalen Gestaltungsaspekten thematisiert. Um die Ableitung eines Modells von Nutzerbedarfen aus dem Datenmaterial zu ermöglichen, erfolgte die Auswertung der Studie entlang der von Glaser & Strauss (1968) entwickelten Grounded Theory3. In der offenen Kodierung wurden Codes unmittelbar aus den transkribierten Interviews entwickelt und zu Kategorien zusammengeführt. Das daraus resultierende Kategorienschema wurde sukzessive anhand weiterer Fälle so lange modifiziert und weitergeführt, bis ein ausreichender Sättigungsgrad erreicht war (Kelle & Kluge 2010).

3.4 Die Teilnehmer Die Rekrutierung der Untersuchungspersonen erfolgte zunächst auf den zu untersuchenden Facebook-Seiten selbst. Unter Berücksichtigung der Facebook-Nutzungsbedingungen wurde mithilfe eines Gewinnspiels (Verlosung von Eintrittskarten) unter den Seiten-Nutzern zur Teilnahme aufgerufen und ein Link zu einer externen Anmeldeplattform bereitgestellt. 1

https://www.facebook.com/LWLMuseumKunstundKultur

2

https://www.facebook.com/LWLMuseumHerne

3

In vielen Kodierungsansätzen wird die Kodierung durch zwei oder mehr unabhängige Personen durchgeführt, um eine Objektivierung der Ergebnisse zu erreichen. Die Grounded Theory als Interpretationsmethode weicht von solchen Ansätzen ab und verwendet bspw. vorläufige Codes und Memos, die einer Übereinstimmungsprüfung zwischen Kodierern nicht wie bei anderen Methoden zugeführt werden können. Entsprechend wurde die Kodierung in der vorliegenden Studie durch eine Forscherin durchgeführt.

„Das „Das stand stand doch doch auf auf Facebook“: Facebook“: Museen Museen in in sozialen sozialen Netzwerken Netzwerken

575

Für die Auswahl der Stichprobe aus den wie oben rekrutierten Freiwilligen wurden aus verschiedenen möglichen Merkmalen aus der Literatur die Merkmale „Aktivitätsgrad“ und „fachspezifischer Interessengrad“ ausgewählt. Das Aktivitätskriterium erfasst die in sozialen Medien vorhandene Heterogenität passiv konsumierender und aktiv partizipierender Nutzer (Haas 2007), das individuelle Interesse am jeweiligen Fachgebiet eines Museums (hier: Archäologie bzw. Kunst) ist für die Rezeption von Angeboten durch (potenzielle) Besucher entscheidend (Heinze 2008). Durch die Kombination dieser Merkmale wurde in der Stichprobe eine Verknüpfung der Nutzer von Facebook-Seiten und Museumsbesuchern hergestellt. Die Merkmale erhielten hierfür eine vereinfachte Einteilung in zwei Ausprägungen (hoch / niedrig) mit festgelegten Definitionsbereichen. Die Stichprobe wurde zunächst auf Nutzer beschränkt, die bereits durch eine „Gefällt mir“-Angabe mit den Seiten verbunden sind. Die Kriterien der Fallauswahl ließen sich nur im Dialog mit den einzelnen Untersuchungspersonen identifizieren, um über den tatsächlichen Bedarf des Interviews zu entscheiden. Die auf Basis des Vorgesprächs getroffene Fallzuordnung wurde im Kontext des gesamten Interviewmaterials im Nachgang nochmals überprüft. Während der Stichprobenziehung wurde kontinuierlich auf eine ausgewogene Zusammensetzung hinsichtlich soziodemografischer Merkmale geachtet (Alter, Geschlecht, Bildung, Beruf, geografische Nähe zum Museum). So wurden entlang des beschriebenen Stichprobenplans 14 Teilnehmer für die Studie gewonnen. Ergänzend wurden zwei Teilnehmer in die Untersuchung aufgenommen, die Erfahrungen mit Facebook-Seiten von Museen haben, jedoch keine der beiden Seiten aus der Studie abonniert hatten. Durch ihren Einbezug ist das Untersuchungsfeld weiter erschlossen worden. Insgesamt setzt sich das Erhebungsmaterial aus den Aussagen von 16 Untersuchungspersonen zusammen.

4

Ergebnisse

Aus der Auswertung wurden vier Themen mit zehn Hauptkategorien und Unterkategorien gewonnen. Diese beschreiben die erforschten Nutzeransprüche an die Facebook-Seiten der Museen. Auf Basis des Stufenmodells der empirisch begründeten Typenbildung nach Kluge (1999) bildeten diese Kategorien die Grundlage der unten beschriebenen Nutzertypologie.

4.1 Nutzeransprüche: Kategorien Die Ansprüche von Nutzern lassen sich anhand der Themen Nutzerkontext, Nutzungsverhalten, Nutzungszweck und Nutzungsrahmen differenzieren. Im Folgenden werden diese beschrieben und mit Zitaten aus den Interviews illustriert. Der Nutzerkontext lässt sich in das Interesse am Fachgebiet und Bezugspunkte zum Museum differenzieren. Das Interesse kann gering („dass man halt ab und an mal ins Museum geht“) oder stark („Ich habe selber Archäologie studiert“) sein, Bezugspunkte sind lokale Nähe („das war immer schon in der Nähe irgendwie“); persönlicher Kontakt („Das ist natürlich noch mal was anderes, wenn man eine persönliche Verbindung hat zu den Leuten.“) und eigene Besuche („ich kenne das Museum schon sehr lange“).

58 Verena Holtkötter, Michael Prilla6 „Das stand doch auf Facebook“: Museen in sozialen Netzwerken Das Nutzungsverhalten lässt sich in Rezeptionsgewohnheiten, Rezeptionsbedarf, Inhaltliche Präferenzen, Interaktionsintensität, Interaktionsgewohnheiten und Interaktionsantreiber und -barrieren aufschlüsseln. Neben flüchtiger Wahrnehmung konnten Rezeptionsgewohnheiten wie umfassende („Also, ich gucke eigentlich täglich einmal rein und sobald ich dann zuhause bin und Zeit habe, dann beschäftige ich mich auch damit“) oder selektive Wahrnehmung („Also, ich gehe jetzt nicht gezielt auf die Seite. Aber wenn ich Beiträge sehe (...), dann gucke ich mir die eigentlich auch an.“) identifiziert werden; bei den Rezeptionsbedarfen hielten sich regelmäßige und unregelmäßige Nutzung die Waage. Die inhaltlichen Präferenzen der Nutzer gehen jedoch stark auseinander: Einige Nutzer sind an Neuigkeiten („ich würde gerne mehr erfahren über das aktuelle Programm“) oder Unterhaltung interessiert, während andere Impressionen aus dem Museum („ich kriege Einblicke auch hinter Kulissen“) oder weiterführende Inhalte („dass das Museum Informationen über sich präsentiert, aber auch über andere Themen aus der Archäologie“) bevorzugen. Gleichzeitig lehnen einige Nutzer Inhalte ab, wenn diese über die Exponate des Museums hinausgehen („das hat jetzt nichts direkt mit dem Museum zu tun.“). Hinsichtlich der Interaktionsintensität nutzt die Hälfte der Befragten die Seiten aktiv und intensiv (lesen und Beiträge schreiben), die andere Hälfte sporadisch oder passiv. Die Interaktionsgewohnheiten schließen Funktionen wie „Gefällt mir“ als Zustimmung und „Teilen“ ebenso ein wie Kommentare („Und ich schreibe auch gerne Kommentare oder stelle auch mal eine Frage“) und eigeninitiierte Aktionen („wenn ich selber etwas entdecke (...), dass man das dann einfach mal mit auf die Timeline ‚postet‘“). Als Interaktionsantreiber wurden Wertschätzung der Arbeit („man muss es ein bisschen auch wertschätzen“), soziale Kontakte zu anderen Nutzern („Man hat halt Leute mit Fachwissen und Interesse und kann die sofort erreichen“) und Aufmerksamkeit („dass man gesehen wird“) sowie persönlich relevante Inhalte und persönlicher Zugang („durch das Internet habe ich halt die Möglichkeit, wirklich Ansprechpartner zu bekommen“) genannt. Als Interaktionsbarrieren nannten die Nutzer Zweifel („ich hätte da das Gefühl, ich könnte gar nicht mitreden“), mangelnde Identifikation mit der Masse anderer Nutzer („wenn da einer stumpf drunter schreibt, ‚voll geil‘, oder so, dann ist das eben plump.“) und Datenschutz- Bedenken („nicht dass dann hinterher wirklich jeder alles über mich weiß.“). Für den Nutzungszweck lassen sich als Motive Informationsbeschaffung („was die gerade so machen und wo die gerade so dran sind“), Freizeitplanung („damit man es nicht verpasst und gleich daran erinnert wird“), Teilhabe an der Museumsarbeit („da kommt was Menschliches rüber“), Gemeinschaftserlebnis („mit Gleichgesinnten in Kontakt zu kommen“), Unterhaltung („Da war so ein Rätsel verknüpft mit der Homepage“) und Exklusivität der Informationen („dass man da Infos bekommen hat, die man halt nicht aus der Zeitung oder dem Radio bekommen hat. Wo ich dann gesagt habe, ‚ach Mensch, das stand doch auf Facebook’ (...)“) finden. Der Nutzungsrahmen beschreibt Voraussetzungen für die Nutzung wie aufbereitete Inhalte (Aktualität, Multimedia, etc.), eine benutzerfreundliche Bedienung (auch auf Mobilgeräten) und eine ansprechende Optik. In dieser Kategorie ist die Varianz gegenüber den anderen Kategorien deutlich geringer, sodass hier vermutet werden kann, dass es sich um allgemein (und auch für andere Anwendungen) gültige Hygienefaktoren handelt.

„Das „Das stand stand doch doch auf auf Facebook“: Facebook“: Museen Museen in in sozialen sozialen Netzwerken Netzwerken

597

Die Vielfalt der Ansprüche sowie ihrer Ausprägungen weist darauf hin, dass es nicht einen Typ von Nutzern der Facebook-Seiten von Museen gibt. Entsprechend bestimmen individuelle Faktoren, welche Inhalte der Facebook-Seite eines Museums für Nutzer interessant sind; der individuelle Mehrwert steht im Vordergrund. Es ist daher eine Differenzierung von Nutzertypen notwendig, um Nutzeransprüchen (gezielt) zu begegnen.

4.2 Typologie von Nutzern: Ein Vorschlag

Fachspezifischer Interessengrad

Die Gruppierung der Befragten anhand ihrer gemeinsamen Eigenschaften ermöglicht die Entwicklung einer Nutzertypologie. Unter Rückbezug auf die Kriterien der Fallauswahl als zentrale und indizierte Differenzierungsmerkmale (fachspezifischer Interessengrad, Aktivitätsgrad) können die teils konträren Themen und Kategorien in vier Nutzertypen zusammengeführt werden. Bei den beiden befragten potenziellen Seiten-Nutzern ließen sich keine nennenswerten Abweichungen in den Ansprüchen verzeichnen, sodass ihre Aussagen in die Nutzertypologie eingebunden werden konnten. In der Typologie wird jedem Nutzertyp in Tabelle 1 ein Name zugeordnet, der plakativ für den Nutzungszweck steht. Die Intensität von Interesse und Nutzung wächst von links unten nach rechts oben.

Hoch

Nachrichtenkonsument (5): Fachliche, weiterführende Informationen, passive Nutzung, Versorgung mit Inhalten

Mitgestalter (5): Intensive Nutzung, Kommentare und eigene Beiträge, Informationen und Interaktion zur Vernetzung

Niedrig

Freizeitplaner (3): Besucherinformationen, kaum Interaktion, beiläufige Nutzung von Inhalten, sporadische Informationen

Museumssympathisant (3): Bedarfsweise Rezeption, Interaktion als Wertschätzung, Informationen zur Teilhabe am Geschehen

Niedrig

Hoch Grad der Aktivität

Tabelle 1: Nutzertypologie – Die Nutzer der untersuchten Facebook-Seiten von Museen. In Klammern: Anzahl der Personen, die der Rolle in der Stichprobe zugeordnet wurden.

Der Typ Freizeitplaner beschreibt Nutzer, für die sporadisch Besucherinformationen interessant sind. Die Seiten sollen zu einem Museumsbesuch anregen. Freizeitplaner sind neugierig auf aktuelle Veranstaltungen, beteiligen sich aber (auch wegen Zweifeln an ihren Beiträgen) kaum aktiv auf den Facebook-Seiten der Museen. Der Typ Nachrichtenkonsument beschreibt Nutzer, die ein hohes fachliches Interesse am Museum haben, die Seite jedoch hauptsächlich rezipierend nutzen. Für sie ist die Seite ein Medium, um aktuelle Informationen des Museums und des Fachgebiets zu erhalten. Eine aktive Beteiligung scheitert an der mangelnden Identifikation mit der Masse anderer Nutzer. Der Typ Museumssympathisant beschreibt Nutzer, die ohne spezifisches Interesse auf den Facebook-Seiten agieren, den direkten Kontakt zum Museum suchen, aber wenig Interesse

60 Verena Holtkötter, Michael Prilla8 „Das stand doch auf Facebook“: Museen in sozialen Netzwerken an anderen Nutzern haben. Sie sehen in der Seite eine Möglichkeit zur (virtuellen) Teilhabe an der Museumswelt. Der persönliche Zugang zum Museum ist ihnen wichtig, Kommentare werden häufig zur Wertschätzung oder Zustimmung gegenüber dem Museum erstellt. Der Typ Mitgestalter beschreibt Nutzer, die aus einem fachlichen Interesse heraus regelmäßig Inhalte konsumieren und zudem auch erstellen. Für sie stehen das Gemeinschaftserlebnis und die Vernetzung untereinander im Vordergrund. Durch ihr aktives Mitwirken tragen sie engagiert zur Gestaltung der Seite bei. Den Autoren ist bewusst, dass diese Typologie angesichts der Vielfalt der oben beschriebenen Merkmale eine Vereinfachung der Betrachtung von Nutzern der untersuchten FacebookSeiten darstellt. Sie kann dennoch dazu dienen, die Komplexität der Bedarfe darstellbar zu machen und für die Unterschiede bei diesen Bedarfen zu sensibilisieren. Sie kann daher sowohl in der praktischen Gestaltung der Auftritte von Museen und anderen Kulturbetrieben als auch für weitere Forschungen als Grundlage dienen.

5

Diskussion

5.1 Die Ergebnisse im Kontext vorhandener Untersuchungen Die Studie kann Erkenntnisse aus verwandten Studien zu Unternehmen in Teilen bestätigen, erweitert sie jedoch um bedeutsame Komponenten. Übereinstimmende Ergebnisse finden sich in dem Anspruch, in sozialen Netzwerken Informationen über die jeweilige Organisation erhalten zu wollen, sowie in den Verbundenheits- und Sympathie-Aspekten. Neue Erkenntnisse für den Gegenstandsbereich von Museen finden sich in der Breite des Informationsanspruchs von Nutzern. So weckt ihre Position im Freizeitsektor Bedarfe nach Informationen zur Freizeitplanung (bspw. Veranstaltungstermine); Nutzer mit (gemeinsamem) fachspezifischem Interesse erwarten Informationen über das jeweilige Fachgebiet des Museums. Facebook-Seiten von Museen werden auf diese Weise zu einer Austausch- und Informationsplattform und zu einem Treffpunkt für Gleichgesinnte. In verwandten Studien zu Unternehmen ist die interaktive Beteiligung auf materielle Aspekte und den Kontakt zum Unternehmen konzentriert. Derartige ökonomische Nutzeransprüche finden sich in der vorliegenden Studie nicht. Insgesamt zeigen die Nutzeransprüche an Museen innerhalb sozialer Netzwerke einen eher inhaltlichen Charakter. Immaterielle Interessen wie Freizeitplanung, Austausch oder Gemeinschaft stehen im Vordergrund.

5.2 Gestaltung von Facebook-Seiten für Museen: Vorschläge Aus der Studie lassen sich zur inhaltlichen Gestaltung und der Interaktionsgestaltung Empfehlungen ableiten. Hinsichtlich der inhaltlichen Gestaltung wird deutlich, dass die Heterogenität der Nutzergruppen verschiedene Inhalte notwendig macht, wenn ein Museum alle Gruppen ansprechen möchte. So sind sowohl allgemeine Inhalte wie Informationen über den laufenden Betrieb, Besucherinformationen wie Hinweise aus dem aktuellen Ausstellungs-

„Das „Das stand stand doch doch auf auf Facebook“: Facebook“: Museen Museen in in sozialen sozialen Netzwerken Netzwerken

619

programm als auch Museumsimpressionen wie Einblicke in den Museumsbetrieb nachgefragt. Ein Teil der Nutzer interessiert sich zudem für spezielle und weiterführende Informationen (bspw. fachspezifische Informationen), die jedoch von anderen Nutzern eher abgelehnt werden. Dies kann bei der inhaltlichen Gestaltung berücksichtigt werden, in dem bspw. weiterführende Inhalte lediglich verlinkt werden, oder indem eine Gruppe für Interessierte an weiterführenden Inhalten erstellt wird. Für die Interaktionsgestaltung sind neben relevanten und diskussionsfähigen Inhalten auch die persönlich wahrgenommene Atmosphäre und Unterstützung bei der aktiven Nutzung von Facebook-Seiten entscheidend. Nutzer, die sich bisher nicht äußern, weil sie an der Qualität ihrer Äußerungen zweifeln oder sich mit der Masse anderer Benutzer nicht identifizieren können, sollten aktiv unterstützt werden, wenn das Museum ihre Mitgestaltung wünscht – hier liegen Potenziale, insbesondere in der Aktivierung von Nachrichtenkonsumenten, die zwar Interesse zeigen, aber (noch) nicht aktiv mitgestalten. Gelegenheiten zur Äußerung wie bspw. offenes Feedback nach einem Besuch können hier eine kommunikationsoffene Atmosphäre schaffen. Die in der Studie gewonnenen Erkenntnisse können bei der Auswahl solcher Möglichkeiten unterstützen. Auffällig ist weiterhin, dass Mechanismen zur (anschlussfähigen) Kommunikation hauptsächlich für den Typ des Mitgestalters relevant sind; Sympathisanten nutzen diese lediglich für einfaches Feedback. Gleichwohl erzeugen diese Mechanismen den Eindruck einer aktuellen, häufig genutzten Seite, und dies wird von Nachrichtenkonsumenten und Freizeitplanern wahrgenommen. Bei der Gestaltung und Pflege von Seiten für Kultureinrichtungen kann sich daher die Förderung der Beteiligung von Mitgestaltern auch auf die Zahl der Vertreter anderer Typen auswirken.

5.3 Integration von Nutzern in Museumsarbeit Die Studie zeigt Potenziale auf, mit denen Nutzer enger in die Museumarbeit integriert werden können. So sind für Nachrichtenkonsumenten, Mitgestalter und Museumssympathisanten Museumsimpressionen und der persönliche Zugang zu Inhalten und Ansprechpartnern eine wichtige Motivation zur Nutzung der Facebook-Seiten. Eine solche Transparenz und Sichtbarkeit der Arbeits- und Gestaltungsprozesse eines Museums kann diese Gruppen an die Facebook-Seiten binden. Zudem kann die Verbindung der Nutzertypen mit Möglichkeiten der aktiven Beteiligung Nutzer in die Gestaltung des Museums einbinden: Während Mitgestalter bereits Inhalte einbringen, könnten Sympathisanten durch Abstimmungen bzw. Feedback und Nachrichtenkonsumenten durch die oben beschriebenen Gruppen an die aktive Mitgestaltung herangeführt werden.

6

Zusammenfassung und Ausblick

Der Beitrag zeigt in einer Studie mit 16 Facebook-Nutzern auf, dass Kultureinrichtungen vielfältige Nutzeransprüche bewältigen müssen, die über die aus Studien mit Seiten von Unternehmen in sozialen Netzwerken bekannten Ansprüche hinausgehen. Er zeigt zudem, dass die Kenntnis dieser Ansprüche großes Potenzial für die Bindung von Interessenten und

62 Verena Holtkötter, Michael Prilla „Das stand doch auf Facebook“: Museen in sozialen Netzwerken 10 deren Mitgestaltung birgt. Mit Blick auf die zentrale Forschungsfrage nach Nutzeransprüchen an Museumspräsenzen in sozialen Netzwerken zeigt sich, dass verschiedene Nutzertypen und ihr persönlicher Nutzungszweck betrachtet werden müssen. Als zentrale Beiträge wurden hierzu Kategorien von Nutzeransprüchen, eine Typologie von Nutzern sowie daraus resultierende Gestaltungsmöglichkeiten beschrieben. Grenzen der Untersuchung bestehen in der Vernachlässigung anderer Medien (Twitter, Youtube), anderer Anspruchsgruppen (Sponsoren, Künstler, Presse, Kommunen) und weiterer Museumstypen (Naturkunde, Technik). Zudem betrachtet die Studie vorhandene Nutzer der Facebook-Seiten der Museen bzw. Nutzer mit Erfahrungen auf ähnlichen Seiten und kann daher lediglich erste Aufschlüsse zur Gewinnung neuer Nutzer geben. Sie weist jedoch auf Inhalte hin, die für verschiedene Nutzer interessant sind, und kann durch anknüpfende Forschungen um die aufgezeigten Bereiche erweitert werden. Die vorliegenden Ergebnisse und die Vorgehensweise der Studie können dabei unterstützend wirken. Literaturverzeichnis Chung, T.-L., Marcketti, S. & Fiore, A.M. (2014). Use of social networking services for marketing art museums. Museum Management and Curatorship. 29(2), 188–205. Gentischer, M. (2011). Museumsmarketing: Fallstudie am Beispiel des Stuttgarter Stadtmuseums. Springer-Verlag. Glaser, B.G. & Strauss, A.L. (1968). The discovery of grounded theory. Aldine Chicago. Haas, S. (2007). Web 2.0: Nutzung und Nutzertypen. Eine Analyse auf der Basis quantitativer und qualitativer Untersuchung. Media-Perspektiven.(4), 215–222. Hausmann, A. & Frenzel, L. (eds.) (2014). Kunstvermittlung 2.0: Neue Medien und ihre Potenziale. Springer Fachmedien Wiesbaden. Heinze, T. (2008). Kultursponsoring. Kultursponsoring, Museumsmarketing, Kulturtourismus., 75–87. VS Verlag für Sozialwissenschaften. Heymann-Reder, D. (2012). Social Media Marketing. Addison-Wesley Verlag. Kelle, U. & Kluge, S. (2010). Vom Einzelfall zum Typus: Fallvergleich und Fallkontrastierung in der qualitativen Sozialforschung. VS Verlag. Kluge, S. (1999). Empirisch begründete Typenbildung—Zur Konstruktion von Typen und Typologien in der qualitativen Sozialforschung [Building types empirically based—Towards the construction of types and typologies in the qualitative social sciences]. Opladen: Leske+ Budrich. Lehman, K. & Roach, G. (2011). The strategic role of electronic marketing in the Australian museum sector. Museum Management and Curatorship. 26(3), 291–306. Scheurer, H. & Spiller, R. (2010). Kultur 2.0. Neue Web-Strategien für das Kulturmanagement im Zeitalter von Social Media. Weinberg, T. (2012). Social Media Marketing: Strategien Fur Facebook, Twitter & Co. O’Reilly Germany.

S. Diefenbach, N. Henze & M. Pielot (Hrsg.): Mensch und Computer 2015 Tagungsband, Stuttgart: Oldenbourg Wissenschaftsverlag, 2015, S. 63-72.

Gendergerechtes Forschungsdesign an der Schnittstelle Mensch - Technik Dorothea Erharter ZIMD – Zentrum für Interaktion, Medien & soziale Diversität Zusammenfassung Als gender-relevant gelten Forschungen prinzipiell an der Schnittstelle zum Menschen. Forschung im HCI- Bereich ist damit das Kernthema genderrelevanter technologischer Forschung. Im Gegensatz zu Projekten im biomedizinischen Bereich spielen biologische Unterschiede zwischen den Geschlechtern für Mensch-Maschine-Schnittstellen nur eine marginale Rolle. Geschlechtsspezifische Unterschiede müssen daher sehr kritisch betrachtet werden. Statt auf Unterschiede ist der Fokus auf vielfältige Faktoren zu legen, die unterschiedliche Lebensrealitäten und Sozialisationsprozesse berücksichtigen. Anhand von eigenen Forschungsprojekten im Bereich Gender & Technik zeigt die Autorin auf, wie gendergerechtes Forschungsdesign an der Schnittstelle Mensch zu Technologie konzipiert werden kann. Dieser Artikel versucht aus der Breite an Vorschlägen für gendergerechtes Forschungsdesign die für HCI relevanten und in eigenen Projekten erprobten Methoden herauszufiltern und nachvollziehbar zu machen.

1

Einleitung

In Materialien zur Berücksichtigung von Gender-Aspekten in Forschungsprojekten ist ein Schlüsselbegriff die Gender-Relevanz. Als gender-relevant gelten alle FTE-Projekte an der Schnittstelle zum Menschen. Human Computer Interaction, oder besser noch Human Technology Interaction ist damit das Kerngebiet genderrelevanter Projekte im IKT-Sektor und in allen technologischen Bereichen. Im biomedizinischen Sektor steht die Physis des Menschen im Zentrum steht und damit können biologische Unterschiede eine wichtige Rolle spielen. Im Bereich des Biomedical Engineering geht es zusätzlich auch um Mensch-Maschine-Schnittstellen, also Fragen der Technologie-Nutzung. In beiden Bereichen wird damit die Kategorie Sex (Geschlecht) ein relevantes Feld für die Forschung und auch überlagernde Effekte von Sex (biologisches Geschlecht) und Gender (soziokulturelles Geschlecht) müssen berücksichtigt werden. Soferne es jedoch ausschließlich um Mensch-Maschine-Schnittstellen geht – also im „Non-Biomedical-Sektor“ -, spielen biologische Unterschiede eine vernachlässigbare Rolle.

64 Gendergerechtes Forschungsdesign an der Schnittstelle Mensch - Technik Dorothea Erharter2 Ein auf geschlechtsspezifische Unterschiede fokussierendes Forschungsdesign birgt daher die Gefahr in sich, Geschlechterstereotypen zu verstärken. Um das zu vermeiden ist der Fokus auf Gender, also beispielsweise auf Unterschiede in den Lebensrealitäten und Sozialisationsprozessen zu legen. Mit diesem Artikel sollen auf Basis des Forschungsstands und der Erfahrungen der Autorin in technologischen Forschungsprojekten die wichtigsten Elemente gendergerechten Forschungs-designs in HCI/HTI zusammengefasst und mit Beispielen belegt werden.

2

Forschungsstand

2.1 Innovationspotential und Gender-Relevanz Dass die Berücksichtigung von Gender-Aspekten ein technologisches Innovationspotenzial mit sich bringt, ist mittlerweile gut belegt. Gemäß Bührer & Schraudner (2006) können dadurch neue Zielgruppen und Nutzungszusammenhänge für technologische Produkte erschlossen werden. Laut Schiebinger können Gender-Aspekte die Entwicklung neuer Produkte und Dienstleistungen bewirken, die den Anforderungen komplexer NutzerInnen-gruppen gerecht werden und damit das menschliche Wohlbefinden einschließlich der Gleichstellung der Geschlechter fördern. Damit werde insgesamt die globale Wettbewerbsfähigkeit und Nachhaltigkeit gefördert. (Schiebinger & Klinge 2013,116) Der Begriff der Gender-Relevanz wurde 2006 von Bührer & Schraudner eingeführt. Als gender-relevant gelten Forschungen und Produktentwicklungen prinzipiell an der Schnittstelle zum Menschen, wobei hier sowohl körperliche als auch soziokulturelle und Nutzungszusammenhänge berücksichtigt werden sollen. (Bührer & Schraudner 2006).

2.2 Materialien zu Gender im technologischen Forschungsdesign Im Projekt Discover Gender, dessen Federführung beim Fraunhofer Institut für Innovationsforschung lag, wurde ein Leitfaden zur Berücksichtigung von Gender-Aspekten in Forschungs- und Entwicklungsvorhaben entwickelt. Der Leitfaden wurde anhand einer Reihe von Fallbeispielen aus sehr unterschiedlichen technologischen Richtungen überprüft und für NaturwissenschaftlerInnen und TechnikerInnen verständlich dargestellt. (ebenda 2006). Abweichend vom aktuellen Stand der Gender-Forschung wurde in den Beispielen des Leitfadens das Gender-Konzept allerdings auf eine „strikt binäre Logik verengt“. (Bath 2007:2). Er läuft dadurch Gefahr „Geschlechterstereotype zu verstärken und die Vielfalt der sozialen Welt nur ungenügend zu adressieren.“ (Maaß et al. 2014:68) Die Gender-Studies setzen im Gegensatz dazu eine intersektionale Überlagerung verschiedener Faktoren voraus und fordern beispielsweise eine Berücksichtigung der Lebensrealitäten entlang physischer und soziokultureller Unterscheidungsmerkmale ein. Das von Londa Schiebinger geleitete, an der University of Stanford initiierte, internationale Projekt Gendered Innovations ist das Leuchtturmprojekt zum Thema. Mehr als 60 ExpertInnen aus ganz Europa, den Vereinigten Staaten und Kanada erarbeiteten von 2009 bis 2012 Materialien zur Integration von Gender-Aspekten in verschiedene naturwissenschaftliche und

Gendergerechtes Gendergerechtes Forschungsdesign Forschungsdesign an an der der Schnittstelle Schnittstelle Mensch Mensch -- Technik Technik

653

technische Disziplinen. Auf der Plattform http:// http://genderedinnovations.stanford.edu werden die in diesem Projekt erarbeiteten Methoden und inhaltlichen Ergebnisse präsentiert und laufend ergänzt. Sie bauen in grundlegenden Konzepten teilweise auf den Ergebnissen von Discover Gender auf und stehen im Web zur freien Nutzung zur Verfügung (Schiebinger & Klinge 2013). Seitens der Gender-Studies wird die verwendete Unterscheidung zwischen „biologischem“ und „sozialem“ Geschlecht kritisiert. (Maaß et al. 2014) Die große Qualität der beiden Projekte Gendered Innovations und Discover Gender liegt in einer Sammlung von Leitfragen zur Reflexion der Forschungskultur, von Standards und Prämissen der jeweiligen Disziplin, zum Forschungsdesign und zur sprachlichen und visuellen Repräsentation. (Bührer & Schraudner 2006; Schiebinger & Klinge 2013) Maaß et al. stellten mit GERD (Gender Extended Research and Development) ein Vorgehensmodell vor, mit dem Gender- und Diversity-Forschung für die Informatik nutzbar gemacht werden kann. Sie unterscheiden zwischen Kernprozessen, die an ein Wasserfallmodell angelehnt sind, und Reflexionsaspekten, die als Kontext in diese Kernprozesse einfließen. Diese Reflexionsaspekte sind relativ allgemein formuliert und erfordern für die Anwendung zunächst Know-How-Transfer. (Maaß et al. 2014)

3

Theoretischer Hintergrund

3.1 Besonderheiten von HCI/HTI-Projekten Nur sehr wenige biologische Unterschiede wirken sich auf Human-Technology-Schnittstellen aus. Diese sind biologisch meist nur mit-beeinflusst und häufig stärker durch Diversity-Faktoren wie das Alter geprägt. Diversity-Faktoren können in HCI-Projekten eine große innovationstreibende Kraft entwickeln (Erharter & Xharo 2014). Im Gegensatz zu biomedizinischer Forschung spielen biologische Unterschiede in der IKT und in den Bereichen, in denen es um Mensch-Technologie-Schnittstellen (HTI) geht, fast ausschließlich hinsichtlich Beeinträchtigungen und Behinderungen eine Rolle, wie sie in der Accessibility ( Inclusive Design, Design for All) adressiert werden. Im Projekt G-U-T konnte vom Team der Autorin festgestellt werden, dass biologische Unterschiede zwischen Frauen und Männern für die Gestaltung von Websites und Apps keine nennenswerte Rolle spielen. Im Projekt MOBISENIORA wurde darüber hinaus bestätigt, dass selbst die Unterscheidung zwischen jung und alt in biologischer Hinsicht auf einige wenige mögliche Beeinträchtigungen hinausläuft, die – zumindest in diesem Projekt – eine weitaus geringere Rolle spielten als vom Team zuvor angenommen. (Erharter et al. 2014) In den genannten Projekten hat sich gezeigt, dass mit wenigen Ausnahmen, in denen ergonomische Aspekte eine Rolle spielen, in der HCI/HTI-Forschung und -Entwicklung über den Bereich der Accessibility hinausgehende biologische Unterschiede vernachlässigt werden können. Der Umfang der Fragestellungen in Materialien zur Berücksichtigung von Genderund Diversity-Aspekten könnte für diesen Bereich daher deutlich verringert werden.

66 Gendergerechtes Forschungsdesign an der Schnittstelle Mensch - Technik Dorothea Erharter4

3.2 Geschlechtsspezifische Unterschiede Geschlechtsspezifische Unterschiede wurden jahrtausendelang missbraucht um Frauen von gesellschaftspolitischer Beteiligung und Bildung abzuschneiden, und Reste davon existieren heute nach wie vor. Kein Wunder also, dass sich Menschen, die sich thematisch mit dieser Ausgrenzung befassen oder sie sogar am eigenen Leib zu spüren bekommen (haben), die Haare sträuben, wenn mit biologischen Unterschieden argumentiert wird. Eine kritische Auseinandersetzung damit ist daher wesentlich. (vgl. z. B. Hammerl 2009). Im Gegensatz zu genderspezifischen Unterschieden (soziokulturelle Unterschiede) sind geschlechtsspezifische Unterschiede biologischer Natur. Sie sind meist viel geringer als gemeinhin angenommen. Männer und Frauen liegen in der Ausprägung der meisten Merkmale sehr nahe beisammen. Die Unterschiede innerhalb eines Geschlechts sind (beispielsweise bei der räumlichen Wahrnehmung) viel größer als die Unterschiede zwischen den Geschlechtern. Dennoch wird die Verteilung der Geschlechterunterschiede meist so wahrgenommen, als gäbe es riesige Unterschiede zwischen den Geschlechtern. (Neyer & Asendorp 2012)

3.3 Genderspezifische Unterschiede In der Geschlechterforschung gibt es den Begriff des Doing Gender. vgl. z. B. Bidwell-Steiner & Krammer 2010). Damit ist gemeint, dass das soziale Geschlecht im Wesentlichen erst durch das Tun zustande kommt. Verhalte ich mich als Frau, werde ich als Frau wahrgenommen, verhalte ich mich als Mann, werde ich als Mann wahrgenommen. Dies inkludiert Kleidung, Aufmachung, aber Körperhaltung, und auch die Handlungen, Arbeitsteilung etc. Die Lebensrealitäten der Menschen sind mehr oder weniger stark durch das Doing Gender geprägt, also durch den Vollzug dessen, was das jeweilige Umfeld von Männern bzw. Frauen erwartet. Die Lebensrealitäten können sich in vielfältiger Weise unterscheiden, hier spielen auch andere Diversity-Faktoren eine Rolle. Wichtig ist, sich bewusst zu machen, dass Unterschiede zwischen Männern und Frauen viel mehr als durch biologische Unterschiede durch das Doing Gender zustande kommen. (ebenda) Beispielsweise wirkt es sich massiv auf Nutzungsszenarien aus, ob jemand Betreuungspflichten hat, da diese Personen im Laufe eines Tages deutlich mehr Wege zurück legen, stärker abgelenkt sind, etc. Dass sie dadurch andere Anforderungen, zum Beispiel an Navigationssysteme, haben können, ist nicht an das biologische Geschlecht gekoppelt, es ist eine GenderThematik. (vgl. Scambor & Zimmer, 2012). In der HCI/HTI-Forschung ist daher nicht nur von Männern und Frauen auszugehen, sondern von Menschen mit vielen verschiedenen Merkmalen und in vielen verschiedenen Nutzungskontexten, da sonst die Gefahr der Stereotypisierung besteht. Davon profitieren auch Männer, wie Raewyn Connell gezeigt hat (2006), die von verschiedenen "Männlichkeiten" spricht.

Gendergerechtes Gendergerechtes Forschungsdesign Forschungsdesign an an der der Schnittstelle Schnittstelle Mensch Mensch -- Technik Technik

4

675

Gendergerechtes Forschungsdesign

4.4 Projekte Die Autorin hat in den letzten Jahren im ZIMD einige technologische Forschungsprojekte mit Gender-Fokus im Kontext von Mensch-IKT-Schnittstellen durchgeführt, die als Basis für diesen Artikel dienen. In all diesen Projekten befindet sich gendergerechtes Forschungsdesign immer im Spannungsfeld von geschlechtsspezifischen Unterschieden und der Kritik daran bzw. dem Versuch gender(!)spezifische Unterschiede zu berücksichtigen. Dies hat damit zu tun, dass es beim Versuch Gender zu berücksichtigen, ja vordergründig um Unterschiede zwischen Männern und Frauen geht. Und da Männlichkeit und Weiblichkeit auf den ersten Blick biologisch bedingt scheinen1, wird zunächst fast immer auf biologische Unterschiede fokussiert. Im Projekt G-U-T (http://g-u-t.zimd.at) haben wir durch vergleichende Analyse überprüft, welche Gender-Aspekte und Diversity-Dimensionen in der Praxis für das Design und Development von Apps und Websites relevant sind, und eine Guideline zu deren Berücksichtigung entwickelt. (Erharter 2014-2). Im Projekt MOBISENIORA (www.mobiseniora.at) wurde die Nutzung von Smartphones und Tablets durch Seniorinnen und Senioren unter Berücksichtigung von Gender-Aspekten untersucht. Derzeit werden Leitfäden für App-Entwicklung, Bildungsangebote sowie Verkaufsberatung und Support durch Telekom-Anbieter entwickelt. (Amann et al. 2015). Im Projekt GEMPLAY (www.gemplay.at) werden gendergerechte Spielkonzepte zur Bewegungsförderung entwickelt. Bislang wurde eine Online-Studie abgeschlossen, derzeit werden Usability-Tests mit Prototypen durchgeführt. Im Projekt GENSISYS wird ein Methodenset zur Evaluation von Gender und Diversity Dimensionen für Ergonomie und Usability an Arbeitsplätzen in sicherheitskritischen Systemen erarbeitet. (Erharter 2014-1). Ein Teil der Projektergebnisse ist bereits publiziert und wurde – auch methodisch – im Rahmen internationaler Konferenzen diskutiert. Im Folgenden fasse ich die methodischen Erkenntnisse zu gendergerechtem Forschungsdesign aus diesen Forschungsprojekten zusammen und belege sie mit Beispielen.

4.1 Literaturbetrachtung Ein wichtiger Ausgangspunkt jeglicher Forschungsprojekte ist die vorhandene Literatur. Eine Fülle von Studien scheinen geschlechtsspezifische Unterschiede zwischen Frauen und Männern zu belegen. Auf den ersten Blick erscheinen jedoch häufig Unterschiede als biologisch, die in Wirklichkeit vor allem auf Lernerfahrungen, also auf soziokulturellen Unterschieden beruhen. Solche scheinbar biologischen Unterschiede kommen häufig durch ein unsauberes Forschungsdesign zustande, und bilden dann eher die Zuschreibungen und Vorannahmen der Forschenden ab, als real existierende Unterschiede. (vgl. Precht 2010). Es kann davon ausgegangen werden, dass es sich bei den meisten dokumentierten geschlechtsspezifischen Unterschieden vor allem im Bereich der Evolutionsbiologie entweder um erlernte oder um solch 1

Zum „Schein“ des biologischen Geschlechts siehe zum Beispiel Engel 2002.

68 Gendergerechtes Forschungsdesign an der Schnittstelle Mensch - Technik Dorothea Erharter6 scheinbare Unterschiede handelt. Darüber hinaus hat sich gezeigt, dass Studien, die Unterschiede zwischen Frauen und Männern belegen, sehr viel häufiger zitiert werden, als Studien, die belegen, dass es keine Unterschiede gibt (vgl. Fine, 2012). Eine günstige Vorgangsweise um geschlechtsspezifische Unterschiede in der Literatur einer kritischen Betrachtung zu unterziehen, besteht zum einen in der Schärfung eines kritischen Blicks: Wie wurden solche Studien gemacht? Sind sie prinzipiell in sich sauber gemacht? Mit welcher Brille wurde das Forschungsdesign gemacht? Welche Sprache wird verwendet? Welche Vorannahmen spiegeln sich in den Ergebnissen? Zum anderen in der Recherche kritischer Perception: Wie werden die Quellen in der Literatur diskutiert? Was wird kritisiert und von wem? Was wird zitiert, und von wem? Ein wichtiger Aspekt betrifft auch die Wiedergabe von Forschungsergebnissen. In einem Vortrag auf der Gender-UseIT hat die Autorin den Begriff „Forschungs-Stille-Post“ geprägt und meint damit den Vorgang der Reduktion differenzierter Ergebnisse auf Verallgemeinerungen, wie „Frauen haben Schulterbeschwerden“. (Erharter 2014-1). Im Projekt GENSISYS wurden zahlreiche für HCI-Design relevante Studien gesichtet, die geschlechtsspezifische Unterschiede reflektieren. Die meisten Unterschiede waren entweder recht dünn belegt oder durch soziokulturelle Faktoren zu erklären. Bewährt hat sich in diesem Projekt, aus den in der Literatur gefundenen Unterschieden Bereiche zu identifizieren, in denen es prinzipiell größere Unterschiede geben kann, als bisher vielleicht berücksichtigt, unabhängig davon, welche Dimensionen (Alter, Geschlecht, Kultureller Hintergrund etc.) zu diesen Unterschieden führen.

4.2 Hypothesen bzw. Forschungsfragen Fokussiert das Forschungsdesign auf geschlechtsspezifische Unterschiede, wird auf diese ein Vergrößerungsglas gerichtet: Sie erscheinen größer als sie tatsächlich sind. Damit reproduzieren sie Ungleichheiten, die zusammengenommen zu gesellschaftlichen Ungleichwertigkeiten führen können. Für HCI-Forschung relevante Unterschiede können darüber hinaus sehr vielfältige Ursachen haben. Für die Formulierung von Hypothesen in der anwendungsorientierten technologischen Forschung bedeutet das, den Fokus auf den Bereich der festgestellten Unterschiede zu richten und die Frage, wodurch diese Unterschiede verursacht sind, erst in zweiter oder dritter Linie zu stellen. Im Projekt GENSISYS beispielsweise wurden Hypothesen, die in der Einreichphase geschlechtsspezifisch formuliert waren (A), vom uns folgendermaßen zu Forschungsfragen umformuliert (B): A. Räumliche Wahrnehmung: Durch größere Bildschirme kann die räumliche Wahrnehmung zugunsten der Frau im Vergleich zum Mann verbessert werden. B. Es gibt Studien, die zeigen, dass die räumliche Wahrnehmung von Frauen durch größere Bildschirme verbessert mehr werden kann als von Männern. Wie wirken sich größere Bildschirme in der konkreten Situation aus?

Gendergerechtes Gendergerechtes Forschungsdesign Forschungsdesign an an der der Schnittstelle Schnittstelle Mensch Mensch -- Technik Technik

697

Größere Bildschirme können für verschiedene Personen Vor- und/oder Nachteile haben, aufgrund verschiedener Faktoren, von denen einer das Geschlecht sein kann. Wichtig ist, die Inhalte vom biologischen Geschlecht zu lösen. Die Fragestellung wird dadurch auch offener für weitere Faktoren. An diesem Beispiel zeichnet sich darüber hinaus ein weiteres Merkmal gendergerechter Forschung ab: die Formulierung qualitativer Fragestellungen. Mit quantitativen Fragestellungen kann überwiegend auf vordefinierte Kategorien und Merkmale eingegangen werden, die per se dazu angetan sind, Vorannahmen zu bestätigen. Qualitative Fragestellungen sind zwar aufwändiger auszuwerten, aber ergebnisoffener und daher prinzipiell besser geeignet für ein gendergerechtes Forschungsdesign (siehe Kap. 4.5).

4.3 Quantitative Studien: Clustern, aber wie? Ein wesentliches Merkmal quantitativer Studien sind Cluster, die gebildet werden, um Aussagen über bestimmte Gruppen treffen zu können. Angesichts der Gefahr der Verstärkung von Stereotypen empfiehlt es sich, nicht entlang vorgegebener Merkmale wie (Geschlecht/Alter/…) zu clustern, sondern ergebnisoffen entlang von Faktoren, die sich aus der Studie selbst oder aus zuvor gemachten qualitativen Methoden ergeben. Damit kann die Fortschreibung stereotyper Zuschreibungen vermieden werden. Innerhalb dieser Cluster soll dann die Geschlechterverteilung betrachtet werden. Dies ist zentral, da ohne diesen Schritt die Kategorie „Gender“ aus dem Blick geraten würde. Vorhandene Ungleichheiten würden dadurch unsichtbar gemacht. Wolffram & Winker (2005) haben beispielsweise in einer Studie über technische StudienanfängerInnen zunächst nach Technikhaltungen geclustert, und erst danach die Geschlechterverteilungen innerhalb der fünf Gruppen betrachtet. Mit einer solchen Vorgangsweise fällt es viel leichter, der Falle vorschneller Zuschreibungen zu entgehen. Ist dies nicht möglich, und müssen Cluster auf Basis vorher festgelegter Merkmale gebildet werden, so empfiehlt es sich Merkmale zu wählen, die weniger durch Stereotypien geprägt sind. Die inneren Persönlichkeitsmerkmale: Geschlecht, Alter, soziale Herkunft, Ethnie, geistige/körperliche Fähigkeiten/Einschränkungen, sexuelle Orientierung (Gardenswartz & Rowe 2002) und zusätzlich auch Religion/Weltanschauung sind häufiger mit Vorannahmen verknüpft und damit sind stereotype Zuschreibungen (die es immer gibt) schwerer erkennbar. Im Projekt GEMPLAY wird beispielsweise nach „Spielertypen“ geclustert, innerhalb derer dann die Geschlechter- und Altersverteilung betrachtet wird. Im Projekt MOBISENIORA konnten Gruppen nach Nutzungsverhalten gebildet werden, weitere Faktoren waren Regionalität und jahreszeitliche Einflüsse. Eine gute Möglichkeit besteht darin, bereits in das Design einer quantitativen Befragung mögliche Auswirkungen von Lebensrealitäten einfließen zu lassen. So wird im Projekt GEMPLAY beispielsweise nach Zeitverwendung und Freizeitverhalten gefragt. Dies kann allerdings qualitative Befragungen nicht ersetzen.

70 Gendergerechtes Forschungsdesign an der Schnittstelle Mensch - Technik Dorothea Erharter8

4.4 Qualitative Studien: Die Frage nach den Lebensrealitäten Wie gezeigt wurde, betreffen für HCI/HTI-Projekte relevante Gender-Aspekte vor allem die unterschiedlichen Lebensrealitäten und Einstellungen von Männern und Frauen. Hier sind insbesondere die folgenden Bereiche relevant: • Raum-zeitliche Rahmenbedingungen und Wege, die wesentlich von den Lebensumständen und eventuellen Betreuungspflichten geprägt sind (vgl. Scambor & Zimmer 2012) • Werthaltungen und Einstellungen gegenüber Technik, die wesentlich durch Sozialisationsprozesse geprägt sind (vgl. Amann-Hechenberger 2015, Kap. 5) • Technikerfahrung und Technikwissen, die wesentlich durch die berufliche Biographie geprägt sind. (vgl. Erharter 2008) Um diese Einflussgrößen strukturiert zu erfassen, muss offen gefragt und die Nähe zu den NutzerInnen gesucht werden. Partizipative Methoden sind dafür unerlässlich. Egal, welche Methoden aus dem vielfältigen Vokabular des Partizipatory Design gewählt werden: Die Fragestellungen sollten die oben genannten Bereiche abdecken bzw. dafür offen gehalten und in der Auswertung auf diesbezügliche Unterschiede geachtet werden. Im Projekt MOBISENIORA wurden beispielsweise mittels semistrukturierter Interviews die Technikhaltungen und das Nutzungsverhalten von SeniorInnen und ihre Erwartungen an Smartphones/Tablets im Kontext ihrer Sozialisationsprozesse betrachtet. Dabei konnten sehr vielfältige Aspekte einfließen. In der Auswertung konnten einige gender(!)spezifische Unterschiede sichtbar gemacht werden. Im Projekt GEMPLAY fließen die unterschiedlichen Lebensläufe, die bei Frauen oft deutlich vielfältigere Aktivitäten beinhalten, ein, indem Participatory Design Workshops gesondert mit rein weiblichen und rein männlichen Gruppen gehalten werden. Im Projekt GENSISYS kamen die aufschlussreichsten und spannendsten Ergebnisse durch qualitative Methoden wie Kontextanalyse, Arbeitsplatzbeschreibung und Tagebuch zustande, auch wenn sich darin kaum genderspezifische Unterschiede spiegelten.

4.5 Auswahl der Testpersonen Zentral für die Berücksichtigung von Gender-Aspekten in partizipativen Methoden ist die Auswahl der Testpersonen. Mindestens ebenso wichtig wie eine ausgewogene Zusammensetzung nach biologischem Geschlecht ist die Berücksichtigung der drei oben genannten Merkmale raumzeitliche Rahmenbedingungen, Technikhaltungen sowie Technikaffinität und –erfahrung als Auswahlkriterien für Testpersonen bzw. als Auswertungskriterien (z. B. viel/mittel/wenig Technikerfahrung). Darüber hinaus kommt hier wieder die Diversity ins Spiel, und es muss betrachtet werden, ob insbesondere bei den inneren Persönlichkeitsmerkmalen (vgl. Kap. 4.3) für das Projekt relevante Kriterien existieren. Im Projekt MOBISENIORA beispielsweise wurden die Testpersonen entlang einer Matrix ausgewählt, in der neben Geschlecht auch Alter, Regionalität und Nutzungserfahrung berücksichtigt war. Im begleitenden Fragebogen zu den Usability-Tests wurden die Testpersonen dann nach der wöchentlichen Gerätenutzung in Stunden gefragt. In der Auswertung wurde der

Gendergerechtes Gendergerechtes Forschungsdesign Forschungsdesign an an der der Schnittstelle Schnittstelle Mensch Mensch -- Technik Technik

719

Median der jeweiligen Gerätenutzung gebildet und daraus dann die Gruppen gebildet (viel/wenig/keine Gerätenutzung), für die nach Korrelationen zu anderen Ergebnissen gesucht wurde.

5

Fazit

Die Vorschläge der AutorInnen für ein gendergerechtes Forschungsdesign im HCI/HTI-Bereich betreffen • eine kritische Betrachtung von Literatur die zu geschlechtsspezifischen Ergebnissen kommt; • eine genaue Sprache bei der Wiedergabe geschlechtsspezifischer Forschungsergebnisse; • eine qualitative Formulierung von Forschungsfragen; • für quantitative Studien eine Vorgehensweise zu Clusterung und Auswertung; • für qualitative Studien die Ausschöpfung des Potenzials partizipativer Forschungs- und Designmethoden • die Blickrichtung auf raum-zeitliche Rahmenbedingungen und Lebensrealitäten (z.B. Betreuungspflichten); auf Werthaltungen, Technikhaltungen und Sozialisationsprozesse; und auf Technikerfahrung und –wissen; • die Auswahl von Testpersonen; • das explizite Beschreiben von nicht-vorhandenen Unterschieden, wenn keine gefunden wurden. Wichtig ist, diese Vorschläge zu gendergerechtem Forschungsdesign in HTI-Projekten nicht als Einzelmaßnahmen, sondern als Paket zu betrachten und anzuwenden. Natürlich kann schon die Anwendung einer einzelnen Maßnahme wichtig uns sinnvoll sein, doch erst im Paket können die Vorschläge ihre volle Innovationskraft entfalten. Literaturverzeichnis Amann-Hechenberger, B., Buchegger, B., Erharter, D., Felmer, V., Fitz, B., Jungwirth, B., Kettinger, M., Schwarz, S., Knoll, B., Schwaninger, T. & Xharo, E. (2015). Tablet & Smartphone: Seniorinnen und Senioren in der mobilen digitalen Welt. Forschungsbericht zum Projekt „mobi.senior.A“. Wien. Adamo-Villani, N., Wilbur, R. & Wasburn, M. (2008). Gender Differences in Usability and Enjoyment of VR Educational Games. In: Visualisation, 2008 International Conference. S. 114–119. Connell, R. (1999). Der gemachte Mann: Konstruktion und Krise von Männlichkeiten. Berlin: Springer. Bath, C. (2007). Discover Gender in Forschung und Technologieentwicklung. Soziale Technik 4/2007. www.sts.aau.at/ias/content/download/1656/7774. Zuletzt abgerufen 5.10.2014. Bidwell-Steiner, M. & Krammer, S. (2010). (Un)Doing Gender als gelebtes Unterrichtsprinzip: Sprache - Politik – Performanz. Wien. Bührer, S., & Schraudner, M. (Eds.) (2006). Wie können Gender-Aspekte in Forschungsvorhaben erkannt und bewertet werden? Karlsruhe: Fraunhofer Verlag. Engel, A. (2002). Wider die Eindeutigkeit. Sexualität und Geschlecht im Fokus queerer Politik der Repräsentation, Frankfurt/M.: Campus.

72 Gendergerechtes Forschungsdesign an der Schnittstelle Mensch - Technik Dorothea Erharter 10 Erharter, D. (2008). Bildschirmbasierte Applikationen für ältere User. In: Edith Maier & Pascale Roux (Hrsg.): UDay VI. Seniorengerechte Schnittstellen zur Technik. Zusammenfassung der Beiträge zum Usability Day VI. Erharter, D. & Xharo, E. (2014). Gendability. Gender & Diversity bewirken innovative Produkte. In: Marsden, N. & Kempf, U. (Hrsg.): Gender-UseIT 2014 (#GUI2014). HCI, Web-Usability und UX unter Gendergesichtspunkten. S. 127–141. Erharter, D. (2014-1). GenSiSys - Gendergerechte Gestaltung von Arbeitsplätzen im Bereich sicherheitskritischer Systeme. Vortrag im Rahmen der Konferenz Gender Use IT, 3.-4. April 2014. Berlin. Erharter, D. (2014-2). Gender- und Diversity-Faktoren in interaktiven Medien. In: Markus Seidl & Grischa Schmiedl (Hrsg.): Forum Medientechnik - Next Generation, New Ideas. Glückstadt. Erharter, D., Jungwirth, B., Knoll, B., Schwarz, S., Posch, P. & Xharo, E. (2014). Smartphones, Tablets, App für Seniorinnen und Senioren. In: Kemper, Guido (Hrsg.): Assistenztechnik für betreutes Wohnen. AAL Testregion Westösterreich. Tagungsband zum uDay XII. S. 221-235 Fine, Cordelia (2012). Die Geschlechterlüge. Stuttgart: Klett-Cotta Verlag. Gardenswartz, L. & Rowe, A. (2002). Diverse Teams at Work. Society for Human Resource Management. 2002. Gaver, B., Dunne, T. &; Pacenti, E. (1999). Cultural Probes. Magazine Interactions vol. 6. S. 21-29. Hammerl, E. (2009). Was ist Gender? Geschlechtsspezifische Rollenzuweisungen und ihre alltäglichen Auswirkungen. In: Hochleithner, M. (Hg): Gender Medicine. Ringvorlesung an der Medizinischen Universität Innsbruck. Band 2. Wien. S. 9-17. Joost, G. & Buchmüller, S. (2009). Women’s Phone - a Case Study on Knowledge Management in a Participatory Design Process. IASDR 09 Conference. Seoul/ Korea, 18th to 22th October 2009 Maaß, S., Draude, C. & Wajda, K. (2014). Das GERD-Modell. In. Marsden, N. & Kempf, U. (Hrsg.): Gender-UseIT - HCI, Web-Usability und User Experience unter Gendergesichtspunkten. Oldenbourg. S. 127-141 Neyer, F. J. & Asendorpf, J. B. (2012). Geschlechtsunterschiede. Grafik abgerufen von http://link.springer.com/chapter/10.1007/978-3-642-30264-0_7#page-1 am 26.02.2014. Precht, R. D. (2010). Liebe. Ein unordentliches Gefühl. München. Scambor, E. & Zimmer, F. (2012). Die intersektionelle Stadt. Bielefeld: transcript. Schiebinger, L. & Klinge, I. (2013). Gendered Innovations. How Gender Analysis Contributes to Research. Report oft he Expert Group „Innovation through Gender“. European Commission. Wolffram, A. & Winker, G. (205). Technikhaltungen von Studienanfängerinnen und -anfängern in technischen Studiengängen. Auswertungsbericht der Erstsemesterbefragung an der TUHH im WS 03/04. Xharo, E. & Erharter, D. (2014). SeniorInnen und Usability bei Smartphones und Tablets. In: Seidl, M. & Schmiedl, G. (Hg.). Forum Medientechnik - Next Generation, New Ideas. Glückstadt. S. 255–268.

Kontaktinformationen Dorothea Erharter, ZIMD, 1180 Wien, Währinger Straße 81/12. [email protected]. +43-699-1136 9902.

S. Diefenbach, N. Henze & M. Pielot (Hrsg.): Mensch und Computer 2015 Tagungsband, Stuttgart: Oldenbourg Wissenschaftsverlag, 2015, S. 73-82.

Übersichtlichkeit als Mediator zwischen Ästhetik und Usability? Martin Schrepp, Kerstin Eva Müller SAP AG Zusammenfassung Ein gut untersuchtes Phänomen ist der Zusammenhang zwischen wahrgenommener Ästhetik und Usability einer Nutzungsschnittstelle. Mehrere Untersuchungen zeigten einen positiven Einfluss der Ästhetik auf die Usability. Aber auch für einen umgekehrten Zusammenhang gibt es empirische Belege. Als Erklärung wurden bisher ein Einfluss der Stimmung des Nutzers oder das aus der Sozialpsychologie bekannten Attraktivitätsstereotyp vorgeschlagen. Wir untersuchen eine weitere Erklärungsmöglichkeit, die auf der Beobachtung basiert, dass manche Items in UX Fragebögen klassischen Usability Dimensionen zugeordnet sind, während dieselben oder sehr ähnliche Items in anderen Fragebögen als Indikator für Ästhetik verwendet werden. Eine inhaltliche Analyse dieser Items deutet auf ein Konzept der wahrgenommenen Übersichtlichkeit hin, dass die subjektive Wahrnehmung von Usability und Ästhetik gleichermaßen beeinflusst. Daten aus einer größeren Online-Studie scheinen diese Annahme zu stützen.

1

Einleitung

Erfolgreiche Produkte müssen sowohl einfach zu bedienen sein, als auch ein attraktives Design aufweisen. Die Forschung im Bereich Mensch-Maschine-Interaktion hat sich ursprünglich sehr stark auf die Qualität der Bedienung fokussiert. Hier standen klassische Usability Dimensionen (z.B. Effizienz, Erlernbarkeit oder Fehlertoleranz) klar im Mittelpunkt des Interesses. In den letzten Jahren hat sich hier ein Wechsel zu einer holistischen Sicht der User Experience ergeben, die auch hedonische Qualitäten eines Produkts (Hassenzahl 2001, 2004) berücksichtigt, wie z.B. Ästhetik, Spass bei der Nutzung oder Stimulation. Eine natürliche Fragestellung in diesem Rahmen ist, in welcher Beziehung hedonische und pragmatische Qualitäten einer Nutzungsschnittstelle stehen. Mehrere Untersuchungen, z.B. Kurosu & Kashimura (1995), Tractinsky (1997) und Tractinsky et al. (2000), zeigten einen positiven Einfluss der wahrgenommenen Ästhetik auf die wahrgenommene Usability, was oft kurz und prägnant als What is beautiful is usable formuliert wird.

74 Martin Schrepp, Kerstin Eva Müller2 Übersichtlichkeit als Mediator zwischen Ästhetik und Usability? Wodurch kann dieser Einfluss der wahrgenommenen Ästhetik auf die wahrgenommene Usability erklärt werden? Hierfür wurden bisher im Wesentlichen zwei Erklärungen vorgeschlagen und auch empirisch untersucht. Ein erster Erklärungsansatz basiert auf dem vermittelnden Einfluss der Stimmung des Nutzers auf wahrgenommene Usability und Ästhetik. Ergebnisse von Isen (2000) zeigen, dass ein positiver emotionaler Zustand einer Person deren Kreativität und Flexibilität beim Problemlösen erhöht. Ein negativer emotionaler Zustand begünstigt dagegen eher einen systematisch-analytischen Umgang mit Problemen (Schwarz 2002). Bei der Interaktion mit einer Benutzungsschnittstelle sollte ein Nutzer in guter Stimmung auftretende Schwierigkeiten eher durch geeignete Heuristiken umgehen und daher als weniger schwerwiegend empfinden. Ein Nutzer in schlechter Stimmung wird sich dagegen eher auf problematische Details fokussieren. Daher sollte ein Nutzer in schlechter Stimmung die Usability einer Benutzungsschnittstelle eigentlich schlechter einschätzen als ein Nutzer in guter Stimmung. Norman (2003) zieht diesen Effekt als Erklärung für den Zusammenhang zwischen wahrgenommener Usability und wahrgenommener Ästhetik heran. Er argumentiert, dass eine ästhetisch ansprechende Gestaltung den emotionalen Zustand des Nutzers verbessert. Diese verbesserte Stimmung sollte dann über den oben beschriebenen Mechanismus zu einer besseren Bewertung der Usability führen. Die Stimmung des Nutzers fungiert in diesem Erklärungsansatz als Mediator zwischen Ästhetik und Usability. Eine andere häufig herangezogene Erklärungsmöglichkeit beruht auf dem aus der Sozialpsychologie gut bekannten Attraktivitäts-Stereotyp (Was schön ist, ist auch gut), dem sogenannten Halo-Effekt. Untersuchungen (siehe z.B. Dion et al. 1972 oder Dick et al. 1990) in diesem Bereich haben gezeigt, dass menschliche Schönheit mit Eigenschaften wie sozialer Kompetenz oder hoher Intelligenz in Zusammenhang gebracht wird. Aus der Marktforschung ist das Phänomen der evaluativen Konsistenz bekannt. Es geht hierbei um die Verhaltensweise, dass fehlende Produktinformationen aus der allgemeinen Bewertung einer Marke abgeleitet werden. Zum Beispiel wird oft aus einem hohen Preis auf eine hohe Qualität eines Produkts geschlossen (Ford & Smith 1987). Überträgt man dies auf die Bewertung von Nutzungsschnittstellen, so sollten fehlende Informationen zur Usability aus leicht sichtbaren und daher bekannten Informationen zur wahrgenommenen Ästhetik hergeleitet werden. In einer Studie (Ilmberger et al. 2009) wurde untersucht, welcher dieser Erklärungsversuche geeigneter ist. Die Ergebnisse deuteten eher in Richtung der Annahme von Norman (2003), waren aber nicht eindeutig. Eine Schwäche beider Erklärungsansätze ist, dass sie keine gute Begründung für den in mehreren Studien ebenfalls nachgewiesenen Einfluss von wahrgenommener Usability auf wahrgenommene Ästhetik liefern, kurz formuliert als What is usable is beautiful (siehe z.B. Ilmberger et al. 2009 oder Tuch et al. 2012). Wir wollen im Folgenden eine weitere Erklärungsmöglichkeit für den Zusammenhang zwischen wahrgenommener Usability und Ästhetik untersuchen. Diese beruht auf der

Übersichtlichkeit Übersichtlichkeit als als Mediator Mediator zwischen zwischen ästhetik Ästhetikund undUsability? Usability?

753

Annahme, dass eine gemeinsame Komponente existiert, die sowohl die Wahrnehmung der Ästhetik, als auch die Wahrnehmung der Usability beeinflusst. Dies würde den Zusammenhang in beiden Richtungen erklären. Im nächsten Abschnitt werden wir diese Erklärung genauer begründen.

2

Übersichtlichkeit als Mediator

Lavie und Tractinsky (2004) unterscheiden zwei Komponenten der wahrgenommenen Ästhetik von Web-Seiten, die sie als klassische und expressive Ästhetik bezeichnen. Klassische Ästhetik fokussiert auf Aspekte eines geordneten und klaren Designs. Expressive Ästhetik dagegen auf Kreativität und Originalität. Klassische Ästhetik wird in der oben zitierten Arbeit mit Begriffen wie klar (clear), organisiert (organized), übersichtlich (clean) oder symmetrisch (symmetrical) operationalisiert. Auch im VISAWI Fragebogen (Moshagen & Thielsch 2010) zur Messung der visuellen Ästhetik von Web-Seiten taucht dieses Konstrukt in einer der vier Dimensionen (Einfachheit) auf. Entsprechende Items sind hier Das Layout wirkt zu gedrängt, Das Layout ist gut zu erfassen und Das Layout scheint angenehm gegliedert. Deng & Poole (2012) konnten bei einer Untersuchung von E-Commerce Webseiten nachweisen, dass die zwei Faktoren Komplexität und Ordnung (im Sinne klassischer Ästhetik) einen wesentlichen Einfluss auf die wahrgenommene Ästhetik haben und die Präferenz für Webseiten beeinflussen. Dieses Ergebnis passt auch zu einer Theorie von Birkhoff (1933), die das Verhältnis von Ordnung und Komplexität als Maß für die ästhetische Qualität eines Objekts vorschlägt. Nach Ngo et al. (2003) sind für eine Messung der Ästhetik Faktoren wie Balance, Symmetrie und Einfachheit zentral, d.h. Faktoren, die man dem Bereich der klassischen Ästhetik im Sinne von Lavie & Tractinsky (2004) zuordnen kann. Ein weiterer bekannter Effekt bei der Wahrnehmung von Ästhetik ist der Fluency-Effekt (Reber et al. 2004). Die Autoren zeigen, dass Objekte umso ästhetischer wahrgenommen werden, je leichter sie zu verarbeiten sind. Dies erklärt warum Objekteigenschaften wie Symmetrie und Übersichtlichkeit die wahrgenommene Ästhetik erhöhen. Dieser Aspekt der Ästhetik zielt also auf ein klar gegliedertes, einfaches und damit gut zu erfassendes Layout. Wir bezeichnen diesen Aspekt im Folgenden als Übersichtlichkeit. Items, die diesen Aspekt der Produktwahrnehmung beschreiben, finden sich in anderen Fragebögen allerdings auch als Indikatoren für klassische Usability Dimensionen. Der UEQ (Laugwitz et al. 2006, 2008) enthält ein Item aufgeräumt/überladen, dass dort der Dimension Effizienz zugeordnet ist und ein Item übersichtlich/verwirrend mit einer Zuordnung zur Dimension Durchschaubarkeit (Erlernbarkeit). Im AttraktDiff2 (Hassenzahl et. al 2003) findet sich in der Skala Pragmatische Qualität ein Item verwirrend / übersichtlich (ein weiteres ähnliches Item dieser Skala ist einfach / kompliziert).

76 Martin Schrepp, Kerstin Eva Müller4 Übersichtlichkeit als Mediator zwischen Ästhetik und Usability? Also laden Items der Bedeutungsdimension übersichtlich/unübersichtlich offenbar auch auf klassischen Dimensionen der Usability. Betrachtet man dies näher, so ist eigentlich relativ klar, dass ein übersichtliches klar strukturiertes Layout die Effizienz des Nutzers bei der Orientierung auf der Benutzungsoberfläche erhöht. Zusätzlich impliziert ein solches Layout auch Einfachheit und erweckt zumindest den Eindruck, die entsprechende Nutzungsoberfläche schnell verstehen und erlernen zu können. Es ist also plausibel, hier eine Ursache für den Zusammenhang zwischen wahrgenommener Usability und Ästhetik zu sehen. Ist eine Benutzerschnittstelle im Sinne der klassischen Ästhetik gut gestaltet, d.h. macht sie einen übersichtlichen, gut strukturierten Eindruck, sollte dies die wahrgenommene Ästhetik, aber auch die Einschätzung der Usability, positiv beeinflussen. Dies würde auch gut erklären, warum es für beide Richtungen (What is beautiful is usable und What is usable is beautiful) empirische Belege gibt. Wir nehmen also an, dass die Übersichtlichkeit einer Benutzerschnittstelle als Mediator den Zusammenhang zwischen Usability und Ästhetik erklären kann.

3

Online-Studie

Die im Folgenden beschriebene Online-Studie bestand aus drei unabhängig voneinander durchgeführten Teilstudien. Diese waren im Ablauf völlig identisch und unterschieden sich nur in den verwendeten Stimuli. Diese waren Startseiten des Web-Auftritts von Städten (Studie 1), Web-Shops (Studie 2) und Design-Agenturen (Studie 3). Pro Kategorie wurden 10 Web-Seiten ausgewählt.

3.1 Teilnehmer Die Teilnehmer wurden über Gruppen in sozialen Netzwerken und über Online-Foren angeworben. Für die Teilnahme gab es keine Entlohnung. Insgesamt konnten die Daten von 423 Teilnehmern ausgewertet werden. Die Abbruchquote (Prozentsatz der Teilnehmer, die das Online-Experiment zwar gestartet, aber nicht beendet hatten) betrug über alle drei Teilstudien hinweg 40,3%. Für die einzelnen Teilstudien ergaben sich folgende Teilnehmerzahlen und demographische Daten: •

Städte: 169 Teilnehmer, 44% männlich, 43% weiblich, 13% ohne Angabe, mittleres Alter 31,75 Jahre



Web-Shops: 101 Teilnehmer, 42% männlich, 41% weiblich, 17% ohne Angabe, mittleres Alter 32,4 Jahre



Agenturen: 153 Teilnehmer, 42% männlich, 31% weiblich, 27% ohne Angabe, mittleres Alter 28,6 Jahre

Übersichtlichkeit Übersichtlichkeit als als Mediator Mediator zwischen zwischen ästhetik Ästhetikund undUsability? Usability?

775

3.2 Materialien Durch die 30 verwendeten Web-Seiten und die Auswahl aus drei unterschiedlichen Kategorien sollte ein möglichst breites Spektrum unterschiedlicher Seiten abgedeckt werden. Von den ausgewählten Seiten wurden Screen-Shots in der Auflösung 1024 x 768 gezogen, die dann in der Studie präsentiert wurden. Abbildung 1 zeigt aus jeder der drei verwendeten Kategorien jeweils zwei Screen-Shots.

Abbildung 1: Beispiele verwendeter Screen-Shots aus der Studie.

3.3 Ablauf Nachdem der Teilnehmer die Online-Studie aufgerufen hatte, wurde zunächst eine Seite mit allgemeinen Instruktionen zur Studie angezeigt. Danach wurde zufällig eine der 10 Einstiegsseiten als Screenshot dargeboten. Der Teilnehmer konnte diese so lange betrachten,

78 Martin Schrepp, Kerstin Eva Müller6 Übersichtlichkeit als Mediator zwischen Ästhetik und Usability? wie er bzw. sie mochte. Unter dem Screenshot befand sich ein Online-Formular mit den Fragen: •

Die Seite ist schön.



Ich denke, ich würde mit der Seite gut zurechtkommen.



Die Seite ist übersichtlich.



Zusätzlich wurden noch die vier Fragen aus der Kurzform des VISAWI (Thielsch & Moshagen 2011) vorgegeben.

Anhand dieser Fragen konnte der Teilnehmer die Seite bewerten (7-stufige Likert-Skala pro Frage). Nach Ausfüllen dieses Formulars wurde die nächste zufällig gewählte Seite angeboten. Die Frage Ich denke, ich würde mit der Seite gut zurechtkommen wurde dabei als Indikator für die wahrgenommene Usability der Seite aufgefasst. Jeder Teilnehmer beurteilte in dieser Weise drei zufällig ausgewählte Seiten (aus dem Vorrat der 10 ausgewählten Web-Auftritte pro Teilstudie). Ziel dieser Vorgehensweise war es, die Bearbeitungszeit für den Teilnehmer zu senken und dadurch die Abbruchquote gering zu halten. Allerdings waren dadurch nicht alle Seiten von der gleichen Zahl von Teilnehmern beurteilt (die Zahl der Urteile pro Seite variierte zwischen 22 und 59).

4

Ergebnisse

Die Studie sollte untersuchen, ob die wahrgenommene Übersichtlichkeit einer Web-Seite sowohl die wahrgenommene Usability als auch die wahrgenommene Ästhetik beeinflusst und auch als Erklärung des Zusammenhangs zwischen diesen beiden Komponenten dienen kann. Die Einschätzung der Schönheit korrelierte extrem hoch mit dem Ergebnis der Kurzversion des VISAWI (r = 0,80). Die hochsignifikanten Korrelationen zwischen den untersuchten Variablen Usability, Ästhetik und Übersichtlichkeit betrugen: •

Usability, Ästhetik: r = 0,44 ( t(1072) = 16,24, p < 0,001 )



Übersichtlichkeit, Usability: r = 0,71 ( t(1072) = 33,39, p < 0,001 )



Übersichtlichkeit, Ästhetik: r = 0,51 ( t(1072) = 19,18, p < 0,001 )

Betrachtet man die partielle Korrelation zwischen Usability und Ästhetik unter Kontrolle der Übersichtlichkeit, so ergibt sich nur ein Wert von 0,138 (signifikant, t(1072) = 4,57, p < 0,001). Berücksichtigt man also den Einfluss der Übersichtlichkeit auf die beiden anderen Variablen, so reduziert sich deren Zusammenhang deutlich. Dies ist ein erster Hinweis auf das Vorliegen eines vermittelnden Einflusses der Übersichtlichkeit auf Usability und Ästhetik. Für eine genauere Untersuchung des Zusammenhangs führen wir zwei MediatorAnalysen durch.

Übersichtlichkeit Übersichtlichkeit als als Mediator Mediator zwischen zwischen ästhetik Ästhetikund undUsability? Usability?

797

Die Semi-Partiellen Korrelationen unter Kontrolle der Übersichtlichkeit betragen: •

Usability und Ästhetik: 0,09 ( t(1072) = 3,18, p < 0,001 )



Ästhetik und Usability: 0,12 ( t(1072) = 3,93, p < 0,001 )

Betrachten wir zunächst den Einfluss von Ästhetik auf Usability. Die Ergebnisse der Mediator-Analyse sind in der oberen Hälfte von Abbildung 2 veranschaulicht. Die Werte ohne Klammern entsprechen den Regressionskoeffizienten der einfachen Regression von Ästhetik auf Usability, Übersichtlichkeit auf Usability und Ästhetik auf Usability. Die Werte in Klammern stellen die Regressionskoeffizienten der gemeinsamen Regression von Ästhetik und Übersichtlichkeit auf Usability dar (alle Zusammenhänge sind signifikant mit p < 0,01). Wie leicht zu sehen ist, verringert sich der Einfluss von Ästhetik auf Usability massiv, wenn man die Mediator-Variable Übersichtlichkeit berücksichtigt. Der Sobel-Test (Sobel 1982) zeigt ebenfalls einen signifikanten Mediator-Effekt an (Sobel z = 17,05, p < 0,01). Betrachten wir nun den Einfluss von Usability auf Ästhetik. Die entsprechenden Ergebnisse der Mediator-Analyse sind im unteren Teil von Abbildung 2 dargestellt. Hier ergibt sich ebenfalls ein signifikanter Mediator-Effekt (Sobel z = 16,78, p < 0,01).

5

Diskussion

Für den Zusammenhang zwischen wahrgenommener Usability und Ästhetik einer Benutzerschnittstelle wurden bisher verschiedene Erklärungsmuster vorgeschlagen, z.B. der vermittelnde Einfluss der Stimmung des Nutzers oder das Attraktivitäts-Stereotyp. In diesem Beitrag wird versucht, diesen Zusammenhang über die wahrgenommene Übersichtlichkeit zu erklären. Dieser Erklärungsansatz ist deutlich einfacher als die oben genannten Ansätze und auch in der Lage den Zusammenhang in beiden Richtungen zu erklären (What is beautiful is usable und What is usable is beautiful). Aktuelle Theorien zur ästhetischen Wahrnehmung von Web-Seiten und die Analyse von existierenden Fragebögen zur Messung von User Experience lassen eine solche Erklärung auch theoretisch plausibel erscheinen. In einer größeren Online Studie konnte ein deutlicher Mediator-Effekt der Übersichtlichkeit in beiden Richtungen der Beziehung zwischen Ästhetik und Usability nachgewiesen werden. Dieser erklärt den Zusammenhang allerdings nicht vollständig, d.h. es liegt eine partielle, aber keine vollständige Mediation vor. Eine spannende noch offene Frage ist, wie ein Konzept wie die wahrgenommene Übersichtlichkeit mit den bisher vorgeschlagenen Mediator-Variablen zusammenspielt.

80 Martin Schrepp, Kerstin Eva Müller8 Übersichtlichkeit als Mediator zwischen Ästhetik und Usability?

Abbildung 2: Zusammenhang zwischen Usability und Ästhetik mit Übersichtlichkeit als Mediator.

Unsere Studie liefert zumindest einen deutlichen ersten Hinweis, dass eine gemeinsame Komponente existiert, die die Wahrnehmung der Usability und Ästhetik einer Web-Seite gleichermaßen beeinflusst und was diese gemeinsame Komponente sein könnte. Es gibt natürlich eine Reihe von möglichen Störvariablen, die die Schlussfolgerungen unserer Studie möglicherweise beeinflusst haben und auf die wir jetzt noch eingehen wollen. Eine mögliche Schwäche unserer Studie ist, dass die Teilnehmer Übersichtlichkeit, Ästhetik und Usability einer Web-Seite nur anhand von Screenshots beurteilten, d.h. nicht vorher mit der Web-Seite interagieren konnten. Besonders was die Einschätzung der Usability angeht, wurde in der vorliegenden Studie wegen der fehlenden Interaktion eher die Erwartung der Usability als die tatsächliche Usability gemessen. Dies hat möglicherweise einen Einfluss auf die Ergebnisse. In einer Studie von Ilmberger et al. (2009) zeigten sich z.B. deutliche Abweichung in der Einschätzung einiger User Experience Dimensionen vor und nach der Interaktion mit einem Web-Shop. Auch die vergleichsweise geringe Auflösung der Screenshots von 1024 x 768 könnte hier eine Auswirkung haben. Insofern wäre es wichtig, die Ergebnisse der Studie in Situationen zu replizieren, in denen die Teilnehmer wirklich für eine gewisse Zeit mit den beurteilten Web-Seiten gearbeitet haben. Eine weitere Einschränkung, deren potentieller Einfluss auf die Ergebnisse in weiteren Studien noch genauer untersucht werden sollte, liegt in der Operationalisierung der

Übersichtlichkeit Übersichtlichkeit als als Mediator Mediator zwischen zwischen ästhetik Ästhetikund undUsability? Usability?

819

wahrgenommenen Usability. Diese wurde nur durch eine Frage Ich denke ich würde mit der Seite gut zurechtkommen erhoben. Im Rahmen unserer Studie wurde auf weitere Fragen verzichtet, um die Zahl der Fragen pro Seite klein zu halten (da die Teilnehmer mehrere Web-Seiten beurteilen sollten, wäre ansonsten mit einer zu hohen Abbruchrate zu rechnen). Allerdings ist es wünschenswert in einer Folgestudie (in der Teilnehmer dann evtl. nur eine Web-Seite beurteilen) einen etablierten Usability Fragebogen zu verwenden und dessen Ergebnisse dann mit den erhobenen Werten für Übersichtlichkeit und Ästhetik in Beziehung zu setzen. Für Ästhetik ist dieses Problem nicht so ausgeprägt, da zusätzlich zur Frage Die Seite ist schön noch die Kurzform des VISAWI vorgegeben wurde und die hohe Korrelation zwischen beiden Werten nahelegt, dass diese eine Frage das ästhetische Empfinden bereits gut abgebildet hat. Visuelle Komplexität ist aus Sicht des Designers deutlich einfacher zu gestalten als Ästhetik oder Usability. Eine geringe wahrgenommene Komplexität lässt sich im Wesentlichen durch eine möglichst geringe Zahl von Elementen auf der Benutzerschnittstelle und gutes Alignment dieser Elemente erreichen (siehe z.B. Müller & Schrepp 2013). Unsere Ergebnisse zeigen, wie wichtig diese einfachen Gestaltungskriterien für die wahrgenommene Usability und Ästhetik sind. Literaturverzeichnis Birkhoff G. D. (1933). Aesthetic Measure, Harvard University Press, Cambridge, MA. Deng, L., & Poole, M. S. (2012). Aesthetic design of e-commerce web pages – Webpage Complexity, Order and preference. Electronic Commerce Research and Applications 11(4), 420-440. Dick, A., Dipankar C. & Gabriel, B. (1990). Memory-Based Inference During Consumer Choice. Journal of Consumer Research, 17, S. 82–93. Dion, K. K., Berscheid, E. & Walster, E. (1972). What is beautiful is good. Journal of Personality and Social Psychology 24, S. 285–290. Ford, G.T. & Smith, R.A. (1987): Inferential Beliefs in Consumer Evaluations: An Assessment of Alternative Processing Strategies. Journal of Consumer Research 14, S. 363-371. Hassenzahl, M. (2001). The effect of perceived hedonic quality on product appealingness. International Journal of Human-Computer Interaction 13(4), S. 481–499. Hassenzahl, M. (2004). The Interplay of Beauty, Goodness and Usability in Interactive Products. Human-Computer Interaction 19, S. 319-349. Hassenzahl, M.; Burmester, M.; Koller, F. (2003): AttrakDiff: Ein Fragebogen zur Messung wahrgenommener hedonischer und pragmatischer Qualität. In: J.Ziegler; G. Szwillus (Hrsg.): Mensch & Computer 2003. Stuttgart: Teubner. S. 187-196. Ilmberger, W.; Schrepp, M.; Held, T. (2009). Was verursacht den Zusammenhang zwischen Ästhetik und Usability. In: H. Wandke; S. Kain & D. Struve (Eds.): Mensch & Computer 2009. Oldenbourg Verlag, S. 383-392. Isen, A. M. (2000). Positive affect and decision making. In Lewis, M., Haviland, J.M. (Hrsg.): Handbook of emotions (2nd edtion), New York: Guilford Press, S. 417–435.

82 Martin Schrepp, Kerstin Eva Müller Übersichtlichkeit als Mediator zwischen Ästhetik und Usability? 10 Kurosu, M., & Kashimura, K. (1995). Apparent usability vs. inherent usability: experimental analysis of the determinants of the apparent usability. Denver, Colorado: Conference Companion of human factors in computing systems, S. 292–293. Laugwitz, B., Held, T. & Schrepp, M. (2008). Construction and Evaluation of a User Experience Questionnaire. In Holzinger, A. (Hrsg.): HCI and Usability for Education and Work, LNCS 5298, Berlin, Heidelberg: Springer, S. 63–76. Lavie, T. & Tractinsky, N. (2004). Assessing dimensions of perceived visual aesthetics of web sites. International Journal of Human-Computer-Studies 60, S. 269-298. Moshagen, M. & Thielsch, M. T. (2010). Facets of visual aesthetics. International Journal of HumanComputer Studies 68, S. 689-709. Müller, K. & Schrepp, M. (2013). Visuelle Komplexität, Ästhetik und Usability von Benutzerschnittstellen. In: Boll, S.; Maaß, S. & Malaka, R. (Eds.), Mensch & Computer 2013, S 211 – 220, München: Oldenbourg Verlag. Ngo, D. C., Teo, L. S., & Byrne, J. G. (2000). Formalising guidelines for the design of screen layouts. Displays 21(1), 3-15. Norman, D. (2003). Emotional Design: Why We Love (Or Hate) Everyday Things. Boulder Colorado: Basic Books. Reber, R., Schwarz, N., & Winkielman, P. (2004). Processing Fluency and Aesthetic Pleasure: Is Beauty in the Perceiver's Processing Experience? Personality and Social Psychology Review 8(4), 364-382. Schwarz, N. (2002). Situated cognition and the wisdom of feelings. In Feldman-Barrett, L., Salovey, P. (Hrsg.): The wisdom of feeling: Psychological processes in emotional intelligence, New York: Guilford Press, S. 144–166. Sobel, M. (1982). Asymptotic confidence intervals for indirect effects in structural equation modelling. Sociological Methodology 13, S. 290 – 312. Thielsch, M. T. & Moshagen, M. (2011). Erfassung visueller Ästhetik mit dem VisAWI. In H. Brau, A. Lehmann, K. Petrovic & M. C. Schroeder (Hrsg.), Usability Professionals 2011, S. 260-265. Stuttgart: German UPA e.V. Tractinsky, N. (1997). Aesthetics and Apparent Usability: Empirical Assessing Cultural and Methodological Issues. CHI’97 (http://www.acm.org/sigchi/chi97/proceedings/paper/nt.htm). Tractinsky, N., Katz, A.S., Ikar, D. (2000). What is beautiful is usable. Interacting with Computers 13, S. 127–145. Tuch, A.; Roth, S.; Hornbaek, K.; Opwis, K. & Bargas-Avila, J. (2012). Is beautiful really usable? Toward understanding the relation between usability, aesthetics, and affect in HCI. Computers in Human Behavior 28(5), S. 1596–1607.

Kontaktinformationen Martin Schrepp: [email protected], Kerstin Eva Müller: [email protected]

S. Diefenbach, N. Henze & M. Pielot (Hrsg.): Mensch und Computer 2015 Tagungsband, Stuttgart: Oldenbourg Wissenschaftsverlag, 2015, S. 83-92.

Fürsorge, Gemeinsamkeiten, Pläne – Technik für Fernbeziehungen gestalten Wei-Chi Chien, Marc Hassenzahl, Eva Lenz Erlebnis und Interaktion, Folkwang Universität der Künste Zusammenfassung Technikvermittelte Kommunikation kann heute so mit emotionalen Aspekten angereichert werden, dass besonders auch für Paare in Fernbeziehungen ein Gefühl von Nähe und Verbundenheit entsteht. Das Verstärken der Gewahrwerdung des Anderen im Alltag, das Schaffen von Möglichkeiten eine "Umarmung" auf die Ferne zu erleben oder das Betonen des emotionalen Ausdrucks sind typische Beispiele dafür. Allerdings scheint es für Paare in Fernbeziehungen oft mehr um das Etablieren neuer beziehungsförderlicher Praktiken zu gehen, als um die Frage, ob man bestehende Kommunikation als emotional empfindet. Auf der Basis psychologischer Literatur und im Rahmen eines autobiographischen Gestaltungsansatzes haben wir drei neue Ansätze für die Gestaltung von Technik zur Unterstützung von Fernbeziehung identifiziert – Fürsorge ermöglichen, Gemeinsamkeiten schaffen, Treffen planen –, erste Konzepte umgesetzt und kritisch erprobt.

1

Einleitung

Moderne Technik erlaubt es, einfach und kostengünstig mit räumlich weit entfernten Menschen zu kommunizieren. Am 12. März 2015, um 8:58 Uhr zählte die Statistik von http://www.internetlivestats.com 54.663.760 Skype-Anrufe seit Datumswechsel um Mitternacht und bereits 85.092.180 um 13:59 Uhr. Es überrascht nicht, dass in der MenschTechnik-Interaktion Zwischenmenschliches schon lange ein wichtiges Thema ist. Man diskutiert Möglichkeiten der persönlichen Präsenz trotz Entfernung ("Telepresence", Lee 2004) oder versucht, die nonverbale Ebene von Kommunikation in technisch vermittelbare "Signale" zu übersetzen (z.B. Gallace & Spence 2010). Ein Review von mehr als 140 Konzepten zur Vermittlung von Verbundenheitsgefühlen (Hassenzahl et al. 2012, siehe auch http://uxrelatedness.blogspot.de/) zeigt sechs Strategien auf, die von Gestaltern angewendet werden: Gewahrwerdung (z.B. den Puls des Partners zu fühlen), emotionaler Ausdruck (z.B. Geheimsprachen), Körperlichkeit (z.B. Umarmungen über die Ferne), Geschenke (z.B. kleine Botschaften), gemeinsame Aktivitäten (z.B. Kochen) und gemeinsame Erinnerungen (z.B. das Blättern in Fotoalben). Allerdings zielen die meis-

84 Wei-Chi Chien, Marc Hassenzahl, Eva Lenz2 Fürsorge, Gemeinsamkeiten, Pläne –Technik für Fernbeziehungen gestalten ten Konzepte darauf ab, einzelne Aspekte typischer nonverbaler Kommunikation zu vermitteln, wie z.B. die Körperlichkeit oder die Gewahrwerdung. Dazu kommt, dass sich die Konzepte eher durch die Art der verwendeten Technik unterscheiden, als durch ihren konzeptionellen Ansatz. So ist der zugrunde liegende Mechanismus vom Cubble (Kowalski et al. 2013) beispielsweise kaum anders als das 17 Jahre ältere Konzept Shaker (Strong et al. 1996) – nur in der Verpackung einer neueren Technologie (Abbildung 1).

Abbildung 1: Shaker (links) übersetzt eine Bewegung in Vibration. Cubble (recht) übersetzt unterschiedliche Handbewegungen in sich verändernde farbige Lichtmuster.

Die vorliegende Arbeit geht nicht primär von Kommunikation aus, sondern von der notwendigen "Beziehungsarbeit" zur Aufrechterhaltung einer Fernbeziehung. Es geht also nicht darum, Kommunikation durch das Anreichern von Medien "emotionaler" zu gestalten, sondern um das Schaffen technischer Konfigurationen, die es dem Paar ermöglichen, aktiv über die Ferne an ihrer Beziehung zu arbeiten – auf freud- und bedeutungsvolle Weise. Ziel ist es, das psychologische Wohlbefinden in einer Beziehung zu erhöhen (siehe auch Bao & Lyubomirsky 2013). Hintergrund herfür ist ein wohlbefindens- und erlebnisorientiertes Interaktionsdesign ("Experience Design", Hassenzahl et al. 2013), das sich zunächst mit dem psychologischen Wohlbefinden und dem Identifizieren bedeutungsvoller Erlebnisse und Alltagspraktiken beschäftigt, bevor es sich die Frage stellt, welche Technik in welcher Konfiguration sinnvollerweise zum Einsatz kommen könnte, um diese Erlebnisse zu ermöglichen. Im Folgenden gehen wir zunächst kurz auf Fernbeziehungen ein und entwickeln aus dem bestehenden, überwiegend psychologischen Wissen, drei neue Ansatzpunkte für technikvermittelte Beziehungspflege über die Distanz: Fürsorge ermöglichen, Gemeinsamkeiten schaffen und Treffen planen. Zu jedem dieser Ansätze stellen wir dann ein eigenes Konzept vor. Jedes Konzept wurde als Prototyp realisiert und längsschnittlich vom Erstautor (Wei-Chi) und seiner Partnerin (Claire) im Sinne eines autobiographischen Gestaltungsprozess (Neustaedter &Sengers 2012), gestaltet, erprobt und kritisch diskutiert. Wei-Chi und Claire leben seit vier Jahren in einer Fernbeziehung mit ca. 8550 km Distanz und einem Zeitunterschied von sechs bis sieben Stunden. Der autobiographische Ansatz bedeutet, dass Gestalter im Gestaltungsprozess zunächst selbst Nutzer ihrer eigenen Konzepte sind und sie so über die Zeit kritisch entwickeln. Diesen Ansatz haben wir gewählt, weil so schon von der ersten Minute an im Kontext gestaltet wird. Auch grobe Konzeptideen können schnell skizzenhaft umgesetzt und ihr Einfluss auf das Beziehungsleben direkt erprobt werden, bevor sie überhaupt in einem Stadium sind, das es erlau-

Fürsorge, Technik für für Fernbeziehungen Fernbeziehungen gestalten gestalten Fürsorge, Gemeinsamkeiten, Gemeinsamkeiten, Pläne Pläne ––Technik

853

ben würde, externe Teilnehmern einzubinden. Gerade die Erprobung noch unausgereifter Prototypen über einen längeren Zeitraum ist hier wichtig, da aktuelle Ansätze des erlebnisorientierten Gestaltens oder des "persuasiven" Designs eigentlich immer davon ausgehen, dass sich Wirkungen erst über einen längere Zeitraum in der Lebenswelt der Nutzer einstellen. Das permanente Erleben des eigenen Entwurfs im Alltag fördert außerdem die Weiterentwicklung gewählter Gestaltungsansätze in bedürfnisorientierter Richtung (und nicht nur in technischer). So wird das Gestalten zum kontinuierlichen, lebensweltlich-informierten Verbesserungsprozess und zwar vom ersten Tag an. Natürlich können die Ergebnisse dieses Vorgehens nicht uneingeschränkt verallgemeinert werden. Führt man sich aber vor Augen, dass sein Kern die frühzeitige, längerfristige, genuine Nutzung von neuen, technischen Konfiguration in der Lebenswelt realer Menschen darstellt, wird doch schnell klar, dass dies kaum ein anderer Ansatz für sich reklamieren kann. Zumindest im Sinne der guten Praxis eines reflektierten Gestaltens scheint das Leben mit und das Aushalten des eigenen Entwurfs ein wichtiger erster Schritt. Das Ziel des Beitrags ist zweigeteilt. Zum einen geht es darum, neue Ansatzpunkte für zukünftige Formen der technikvermittelten "Nähe auf Distanz" auf der Basis psychologischer Forschung zu romantischen Fernbeziehungen, also eher theoriegeleitet, zu identifizieren. Zum anderen haben wir damit begonnen, Konzepte zu entwickeln, umzusetzen und lebensweltlich zu erproben, die sowohl als Beispiele, als auch als Test dieser Ansatzpunkte dienen.

2

Romantische Fernbeziehungen und neue Ansätze für das Gestalten unterstützender Technik

Paare in Fernbeziehungen leben an zwei entfernten Wohnsitzen in eigenen Haushalten. Häufig ergibt sich eine solche Situation aus einer Berufstätigkeit oder dem Studium. Auch durch die deutlich effizientere Mobilität sind die Entfernungen in Fernbeziehungen größer geworden. Je nach Entfernung kann sich das Paar in kürzeren zeitlichen Abständen (z.B. einmal im Monat) oder selten (z.B. einmal im Jahr) treffen. "Echte" Präsenz ist beschränkt und ein für Fernbeziehungen typisches Lebens- und Kommunikationsmuster entsteht. Eine Fernbeziehung wird meist als Übergang verstanden. Paare in Fernbeziehung streben danach, später schließlich zusammen zu leben. Paare in Fernbeziehungen machen besondere Erfahrungen, wie z.B. intensive und lange Stunden der Konversation am Telefon, ein als besonders wertvoll empfundenes Zusammensein, emotionale Schwankungen beim Treffen und Abschied, sowie das Vermissen während des Alleinseins (Guldner 2006; Wendl 2013). Zufriedenheit ist – wie in allen Beziehungen – auch bei romantischen Fernbeziehungen der Schlüssel zum Wohlbefinden und entsteht durch Beziehungspflege ("relationship maintenance behavior"). Wissenschaftler schlagen unterschiedliche Strategien im alltäglichen Miteinander vor, z.B. Positivität, Offenheit, Versicherung der gegenseitigen Wertschätzung, soziale Vernetzung und Aufgabenteilung (Canary 1991). Dies wird ergänzt durch Bewältigungsstrategien für entstehende negative Emotionen (Holt & Stone 1988), besonders erzeugt durch wiederholt erlebte Einsamkeit. Aus einer langfristigen Perspektive ist eine gemeinsame Zu-

86 Wei-Chi Chien, Marc Hassenzahl, Eva Lenz4 Fürsorge, Gemeinsamkeiten, Pläne –Technik für Fernbeziehungen gestalten kunft – Pläne, ein gemeinsamer Lebensentwurf – ein wichtiges Element, um die Beziehung aufrechtzuerhalten (Sahlstein 2006). Im Alltagsleben verbindet zwei auf Distanz Verliebte das Gefühl der Zusammengehörigkeit in ihrem jedoch selbstständigen Leben. Diese Verbundenheit muss durch Beziehungsarbeit allerdings immer wieder bestätigt werden (Le et al. 2010). Gemeinsame Pläne, das Teilen des Alltags, und die häufige Bestätigung der gegenseitigen Zuneigung über die Distanz sind also die zentralen Herausforderungen einer romantischen Fernbeziehung. Zwei Verliebte in einer Fernbeziehung leben zwangsläufig in zwei unabhängigen, u.U. auch zeitlich asynchronen Lebenswelten. Das erschwert den alltäglichen, ritualisierten beiläufigen Austausch von Gefühlen und Gedanken (Stafford 2011; Wendl 2013). Ein gegenseitiges Füreinander-Dasein ist aber eine wichtige Voraussetzung für eine erfolgreiche Beziehung (Prager 1995, S. 257). Harvey und Omarzu (1999) konnten belegen, dass die Zufriedenheit von Paaren höher ist, je mehr die Partner bereit sind, sich um einander zu kümmern. Branham und Harrison (2013) bemängeln bei existierenden technikvermittelten Konzepten gerade die fehlenden Möglichkeiten der bewussten, reflektierten, fürsorglichen Interaktion. Die meisten Konzepte setzen auf das Gegenteil: beiläufige Gewahrwerdung. Konzepte für den Austausch von Nachrichten verstehen sich vorrangig als Medium und beschränken das Füreinander-Dasein auf die verbale Ebene. Im Alltag etwas für den Anderen zu tun, ist aber gerade eine Herausforderung für Fernbeziehungen. Aus diesen Überlegungen leitet sich der erste Ansatz für zukünftige Technik zur Unterstützung von Fernbeziehungen ab: das Ermöglichen von Fürsorge über die Distanz. In einer Fernbeziehung spielen Gemeinsamkeiten eine wichtige Rolle. Sie sind zentral für stimulierenden Austausch (Canary 1991) und erzeugen Interdependenz (Le et al. 2010), auf die eine enge Beziehung gründet. Eine Fernbeziehung erfordert darüber hinaus allerdings gleichzeitig, selbständig zu sein und den eigenen Alltag zu organisieren (Wendl 2013). Dies unterstützt das Selbstwertgefühl und schützt auch vor Einsamkeit (Guldner 2006). Gemeinsamkeit und Selbstständigkeit führen unweigerlich zu Widersprüchen, wenn keine entsprechenden Praktiken aufgebaut werden. Ein zweiter Ansatz ist also, eine Gemeinsamkeit zu schaffen, die Interdependenz ermöglich, ohne die eigene Selbstständigkeit allzu stark einzuschränken. Das gemeinsame Kümmern um ein Haustier, eine Pflanze oder ähnliches ist eine typische Praktik, die eine solche, auch emotional fordernde Gemeinsamkeit erzeugt, ohne dass essentielle Aspekte der eigenen Selbstständigkeit aufgegeben werden müssen. Fürsorgliches Handeln und eine Gemeinsamkeit überbrücken das Getrenntsein. Allerdings gibt es in jeder Fernbeziehung natürlich auch Phasen des physischen Zusammenseins, der "echten" Präsenz. Obwohl diese Phasen ein wahres Glückserlebnis für das Paar sein sollten, zeigen Studien, dass Paare sich besonders gestresst fühlen, wenn sie ihre gemeinsame Zeit nicht "besonders" intensiv oder "sinnvoll" verbringen (Westefeld & Liddell 1982). Hier hilft ein wenig Planung (Gulden 2006), was allerdings nur selten vorher realisiert wird. Dabei könnte die Zeit der Trennung auch genutzt werden, um Bedürfnisse und Ansprüche an das nächste Zusammensein zu formulieren und notwendige Mittel vorher zu organisieren. Dies erzeugt nicht nur zukunftsorientierte Kommunikation (Pläne), sondern sowohl gemeinsame Aktivitäten/Aufgabeteilung, als auch Vorfreude und Stressreduktion. Gerade der empfangende Partner kann so seine oft ungute "Gastgeberrolle", die deutliche Verantwortlichkeiten mit

Fürsorge, Technik für für Fernbeziehungen Fernbeziehungen gestalten gestalten Fürsorge, Gemeinsamkeiten, Gemeinsamkeiten, Pläne Pläne ––Technik

875

sich bringt ("Hast Du eingekauft?", "Was kochen wir?", "Wo gehen wir heute Abend hin?"), ablegen. Als dritten Ansatz identifizieren wir also das Planen gemeinsamer Treffen. Auf der Basis psychologischer Erkenntnisse über Fernbeziehungen haben wir drei Ansätze zur Gestaltung zukünftiger Technik zur Unterstützung von Fernbeziehungen identifiziert. Der erste Ansatz sucht nach Wegen, über die Distanz fürsorgliches Handeln zu ermöglichen. Der zweite schafft eine Gemeinsamkeit, trotz fehlender physischer Kopräsenz. Der dritte bereitet eine Phase des realen Zusammenseins vor.

3

Beispielhafte Konzepte und ihre Erprobung

Zu jedem Ansatz stellen wir nun ein beispielhaftes Konzept, sowie seine Erprobungen vor. Alle Konzepte sind funktionstüchtig. Allerdings sehen wir von einer detaillierte Darstellung der technischen Umsetzung ab, da diese für den vorliegenden Beitrag keine entscheidende Rolle spielt. In der kurzen Darstellung der Erprobung konzentrieren wir uns hauptsächlich auf Claire, da ihre Erlebnisse weniger beeinflusst durch Wissen über das Konzept scheinen, als die des Erstautors Wei-Chi. Fürsorgliches Handeln im Alltag ist es beispielsweise, für den Anderen zu kochen oder aufzuräumen. Beides erscheint gleichzeitig als kaum mit vertretbarem Aufwand über die Distanz umsetzbar. Glücklicherweise wirken im Alltagsleben aber auch schon kleine, intime, eher symbolische Handlungen. Ein Beispiel ist es, das Licht für den Partner anzulassen, wenn dieser spät nach Hause kommt. Solche Gesten sind weniger komplex und durchaus mit Hilfe gängiger Technik auch über die Distanz zu ermöglichen. Wir haben dies zum Ausgangspunkt des Konzeptes Been There gemacht.

Abbildung 2: Been There

Been There besteht aus einer Nachttischlampe, die über das Internet geschaltet werden kann, und einer Kamera. Man kann die Wohnung des (abwesenden) Partners "besuchen" und für ihn dessen Nachttischlampe anschalten. Dies ist dann im Kamerabild zu sehen (Abbildung 2). Wenn der Partner später nach Hause kommt, weist das Licht darauf hin, dass der andere Sehnsucht hatte, "da" war, leider nicht bleiben konnte, aber als Geste der Fürsorge das Licht angemacht hat und so die Wohnung für den Anderen "vorbereitet". Dies Konzept ist sym-

88 Wei-Chi Chien, Marc Hassenzahl, Eva Lenz6 Fürsorge, Gemeinsamkeiten, Pläne –Technik für Fernbeziehungen gestalten metrisch umgesetzt. Kamera und Lampe können ausgeschaltet werden, um die Privatsphäre zu schützen. Das Konzept wurde in der in Abbildung 2 gezeigten Form von Claire und Wei-Chi für 84 Tage in ihrem Alltag genutzt. Für Wei-Chi wurde es zur Routine, Claires Wohnung nachmittags zu "besuchen", um die Zeit herum, wenn sie von der Arbeit nach Hause kommt. Claire besuchte Wei-Chi morgens, kurz bevor er aufstehen muss. Der "Besuch" und das Handeln in der anderen Wohnung erzeugte ein deutliches Gefühl von aktivem, fürsorglichem Handeln: "Dass ich auf dem Bildschirm sehe, wie ich die Lampe anschalte, erzeugt das Gefühl, dass ich es für den anderen mache" (Claire, 6. Tag). Gleichzeitig wird das angeschaltete Licht auch als fürsorglich erlebt: "Das Licht erzeugt ein warmes Gefühl, wenn ich spät nach Hause komme" (Claire, 29. Tag). Zusätzlich stellt sich eine symbolisch-informative Wirkung ein: "Ich komme nach Hause, sehe er hat mich vermisst, und ich spreche dann mit ihm via Skype" (Claire, 34. Tag) oder "ich weiß, dass sie heute Nachtschicht hat, weil sie mich vormittags [als ich noch geschlafen habe] besucht hat" (Wei-Chi, 16. Tag). Insgesamt wurde das Anschalten eines Lichtes als fürsorgliche, positiv und bedeutungsvoll erlebt. Been There wurde gut in den Alltag integriert und verlor auch über die Zeit nicht an Bedeutung. Allerdings spielte der "Besuch", also das Gefühl, sich in der Wohnung des Anderen aufzuhalten (d.h. die Kamera), eine wichtige Rolle. Konzepte sollten also zum einen eine Handlung ermöglichen (z.B. das Schalten einer Nachtischlampe), zum anderen aber auch eine Möglichkeit schaffen, relevante Zustände am andere Ort (also z.B. die Helligkeit) erlebbar zu machen. Probleme bezüglich der Privatsphäre sind selten aufgetreten. Ein Beispiel war: "Als ich sie [Claire] abends besuchte, war sie noch nicht ins Bett gegangen. Es war sehr spät in der Nacht und es war ihr unangenehm" (Wei-Chi, 20. Tag). Als Beispiel der Förderung von Gemeinsamkeit über die Distanz haben wir uns am Bild des gemeinsamen Haustiers orientiert und das Konzept Furfur entwickelt. Furfur wohnt in einer Kiste, wobei eine "Verbindung" zwischen den Kisten es Furfur erlaubt, zwischen den Wohnorten der Partner ohne Zeitverzögerung zu wechseln (Abbildung 3). (Natürlich existiert je ein Furfur pro Kiste, aber immer nur eines darf aus der Kiste herausfahren.) Furfur reagiert auf Gesten der Zuneigung, auf Bewegungen und Klänge, indem es tanzt und die Stimme des jeweiligen Partners imitiert. Es speichert die erlernten Imitationen und reproduziert sie auch beim anderen Partner. Je mehr man mit Furfur interagiert, desto größer wird sein Repertoire. Das Verhalten Furfurs ist ein oft überraschendes Produkt der jeweiligen Interaktion beider Partner mit Furfur. Ähnlich wie bei einem gemeinsamen Haustier oder gar einem gemeinsamen Kind spiegeln sich die Eigenarten des anderen Partners wider und vermischen sich auf interessante Weise mit den eigenen Manierismen. So schafft Fufur eine Gemeinsamkeit, die Aspekte des Sich-Kümmerns, der emotionale Kommunikation, der Überraschung, aber auch der Sehnsucht miteinander verbindet.

Fürsorge, Technik für für Fernbeziehungen Fernbeziehungen gestalten gestalten Fürsorge, Gemeinsamkeiten, Gemeinsamkeiten, Pläne Pläne ––Technik

897

Abbildung 3: Auf die Kiste klopfen, um Furfur herbeizurufen (links); Furfur zeigt, was es sich abgeschaut hat (mitte); Furfur interagiert (rechts)

Die Konzeptidee von Furfur existiert in mehreren Versionen. Die erste Version wurde 84 Tage eingesetzt. Ein Gefühl der Verbundenheit entstand besonders dann, wenn Furfur beim Anderen war: "Ich sah, dass Furfur morgens nicht da war. Sie [Claire] hat ihn jetzt. Ich freue mich sehr, dass sie Furfur auch mag" (Wei-Chi, 10. Tag). Allerdings konnte Furfur in dieser Version noch keine Töne erzeugen. Das Imitieren des Anderen geschah durch Bewegung, was aber "nicht sehr deutlich" war (Claire, 12. Tag). Daraufhin entstand eine zweite Version, die bis heute verwendet wird (seit 67 Tagen), aber im Laufe der Zeit verbessert wurde. Furfur wird jetzt selbst aktiver und imitiert frech die Stimmen seiner Benutzer. "Es ist ein wunderschönes Erlebnis, Furfur zusammen mit Wei-Chi zu erziehen! Es ist wie ein elektronisches Haustier. Ähnlich wie mein Hund" (Claire, 28. Tag). Über Skype zeigen sich die Partner, wie sich Furfur beim Anderen benimmt, was ein Gefühl von Gemeinsamkeit erzeugt: "Ich freue mich in Skype zu sehen und zu hören, was Furfur dort macht" (Wei-Chi, 1. Tag) und Claire sagt: "Furfur verhält sich dort gut [bei Wei-Chi], mein Hund hier gut. Heute ist alles reibungslos" (Claire 13. Tag). Furfur hilft auch bei der Bewältigung von Einsamkeit: "Ich passe mich an die Anwesenheit von Furfur an. Ich habe einen neuen Mitbewohner" (Claire, 2. Tag). Manchmal bewirkt Furfur aber auch gerade das Gegenteil: "Furfur ist nicht hier. Wei-Chi auch nicht. Mein Hund auch nicht. Ich habe nur Edward Tulane in meinem Buch" (Claire, 32. Tag). Obwohl dies ein eher trauriger Moment zu sein scheint, zeigt er doch die emotionale Verbindung zwischen Furfur, Wei-Chi und Claire. Die Erprobung von Furfur zeigt, wie komplex entstehende Praktiken selbst bei einem künstlichen Haustier sein können. Furfur spielt nicht nur am eigenen Ort eine Rolle, sondern wirkt ganz besonders, wenn er gerade nicht da ist. Allerdings kann diese Wirkung emotional ambivalent sein: sie wirkt zwar immer verbindend, kann aber die Sehnsucht nach dem Anderen und damit auch Einsamkeitsgefühle steigern. Wichtig ist, dass das elektronische Haustier sowohl expressiv ist, also tatsächlich deutlich Manierismen und Eigenarten annehmen kann, als auch frech ist, also Gründe bietet, über es zu kommunizieren, um es gemeinsam "zu erziehen". Um Treffen zu planen, haben wir als erstes Konzept eine Dating Box entwickelt. Jeder Partner schickt Ideen für gemeinsame Aktivitäten an die Box (das Gerät). Wenn das Pärchen sich später trifft, kann die Box geöffnet werden, um so aus den Anregungen zu schöpfen. Man kann allerdings zu jeder Zeit, also auch vorher, die Box öffnen und Ideen lesen, um z.B. einen Plan zu machen. Man kann auch Fragen, wie "Wo wollen wir einen schönen Kaffee trinken?", in die Box schicken, um den anderen zur Ideensuche zu motivieren, wobei eine der Fragen nach

90 Wei-Chi Chien, Marc Hassenzahl, Eva Lenz8 Fürsorge, Gemeinsamkeiten, Pläne –Technik für Fernbeziehungen gestalten dem Zufallsprinzip auf dem Deckel angezeigt wird. So regt die Box dazu an, sich schon während der Trennung mit dem zukünftigen Zusammensein freudvoll auseinanderzusetzen, Möglichkeiten zu sammeln, Pläne zu schmieden und nimmt den Druck, sich zu einem bestimmten Moment etwas einfallen lassen zu müssen.

Abbildung 4: Die erste, analoge Version der Dating-Box (links) mit den gesammelten Ideen auf den Karten (rechts)

Die Dating-Box wurde in einer ersten analogen Form (also mit eingeschränkter "Funktionalität") von Wei-Chi und Claire zur Vorbereitung eines Treffens verwendet. Es gab einen Vorlauf von 90 Tagen. Das eigentliche Treffen dauerte 44 Tage. Insgesamt wurden im Vorfeld acht Karten (vier von jeder Person) erstellt, jeweils mit mehreren möglichen Aktivitäten. Acht Aktivitäten waren potentiell realisierbar und sieben wurden dann auch wirklich während des Treffens umgesetzt. Beispielsweise wurde die Idee, "gemeinsam baden zu gehen" durch eine Reise zu einer Thermalquelle umgesetzt. Es wurden auch unliebsame Alltagsaufgaben als Aktivität genannt, wie beispielsweise Claires Gefrierfach zu enteisen. Es war dann "ein besonders positives Erlebnis, als wir diese Aufgabe erfüllt hatten" (Wei-Chi). Trotz der acht Aktivitäten hatten Wei-Chi und Claire aber immer noch das Gefühl, nicht genug Ideen für stimulierende Aktivitäten zu haben. Drei Karten wurden geschrieben als die Box initiiert wurde, die anderen Karten wurden in der Woche vor dem Treffen in die Kiste eingeworfen. Zukünftige Versionen der Box werden versuchen, die Anzahl der Vorschläge zu erhöhen und eine kontinuierlichere Auseinandersetzung mit möglichen Aktivitäten zu fördern.

4

Schluss

Wir haben drei neue Ansätze für die Gestaltung von Technik zur Unterstützung romantischer Fernbeziehungen aus entsprechender psychologischer Literatur abgeleitet und beschrieben: Fürsorge ermöglichen, Gemeinsamkeiten schaffen, Treffen planen. Anders als viele andere (siehe Hassenzahl et al., 2012 für einen Überblick) setzen wir dabei bei der aktiven Beziehungsarbeit des Paares an und vermeiden es so, nicht nur bei der bloßen emotionalen Anreicherung von Kommunikation oder der Gewahrwerdung des Anderen zu verbleiben. Diese drei Ansätze sind natürlich weder erschöpfend, noch ausschließlich gemeint, sondern sollen zunächst als Anregung für andere Gestalter/Forscher dienen, das Thema der technischen Unter-

Fürsorge, Technik für für Fernbeziehungen Fernbeziehungen gestalten gestalten Fürsorge, Gemeinsamkeiten, Gemeinsamkeiten, Pläne Pläne ––Technik

919

stützung von Fernbeziehung auch aus diesen Perspektiven zu betrachten. Unsere eigenen Konzeptexplorationen, wie Furfur oder Been There, sollten als Beispiele dafür verstanden werden. Die autobiographische Exploration der Konzepte zeigt Möglichkeiten und Schwierigkeiten. Fürsorge erfordert es, vor Ort, also im Lebensalltag des Anderen, etwas für diesen zu tun. Dies ist keine triviale Anforderung über die Distanz. Im Beispiel der Been There Lampe wird eine symbolische Handlung (das Licht für den anderen einzuschalten) zusammen mit einem "nach dem Rechten schauen" angeboten. Diese neue Möglichkeit wurde von Claire und WeiChi gut und nachhaltig in den Alltag integriert. Wichtig scheint gerade die Kombination von einem Blick in die Wohnung des Anderen und der Möglichkeit etwas zu tun. Probleme der Privatsphäre spielen bei einem romantischen Paar nur eine untergeordnete Rolle. Allerdings ist der Aktionsspielraum auf die Lampe beschränkt. Zukünftige Arbeiten sollten einen allgemeineren Ansatz finden, der es einem Paar erlaubt, aus einer breiteren Anzahl möglicher Aktionen zu wählen. Furfur als Beispiel für Gemeinsamkeiten wurde ebenso schnell als gemeinsam zu erziehendes "Haustierchen" angenommen. Zunächst war der stärkste Moment der Verbundenheit, wenn man wahrnimmt, dass Furfur gerade beim Partner ist. Erst nach einigem Ausprobieren konnte eine Interaktion erarbeitet werden, die es ermöglicht, dass sich beide Partner in Furfur wiedererkennen. Eine zukünftige Herausforderung ist es, das Verhalten von Furfur so weiterzuentwickeln, dass es noch stärker als Produkt gemeinsamer Beeinflussung erlebt wird. Treffen planen scheint ein wichtiges Themenfeld, allerdings waren die ersten Versuche mit der Dating Box eher enttäuschend. Es entstanden weder genug Vorschläge, noch regte sie in ihrer momentanen Form dazu an, sich zwischen den Treffen schon frühzeitig über mögliche Aktivitäten auszutauschen. Hier werden in Zukunft motivierende Elemente eine Rolle spielen, ganz besonders solche, die die Kommunikation über Aktivitäten im Vorfeld fördern. Verfügbare Technologien erlauben es mittlerweile, schnell und verhältnismäßig einfach, funktionale Prototypen herzustellen. Umso wichtiger ist es, sich zukünftig auf die Qualität der zugrundeliegenden Konzepte zu konzentrieren. "Nähe auf Distanz" ist ein interessantes und vielversprechendes Anwendungsgebiet für Technik, und romantische Fernbeziehungen sind lediglich ein Teil davon. Allerdings sind gerade Fernbeziehungen sensible Konstrukte. Fragen, wo man konzeptionell ansetzt, wie Konzepte im Detail ausgestaltet werden müssen, wie sie sich dann im Alltag "benehmen" und integrieren lassen, und ob sie überhaupt Nähe und Wohlbefinden steigern, sind dabei zentral. Hiermit möchten wir einen Beitrag zu ihrer Beantwortung leisten. Danksagung Diese Arbeit wurde durch das Bundesministerium für Bildung und Forschung unterstützt (Projekt "Nähe auf Distanz", Förderkennzeichen 16SV7093K). Literaturverzeichnis Bao, K. J., & Lyubomirsky, S. (2013). Making it last: Combating hedonic adaptation in romantic relationships. The Journal of Positive Psychology, 8, 196–206.

92 Wei-Chi Chien, Marc Hassenzahl, Eva Lenz Fürsorge, Gemeinsamkeiten, Pläne –Technik für Fernbeziehungen gestalten 10 Branham, S., & Harrison, S. (2013). Designing for collocated couples. In C. Neustaedter, S. Harrison, & A. Sellen (Eds.), Connecting Families. Springer. Canary, D. J., Hause, K. S., Stafford, L., & Wallace, L. A. (1991). An inductive analysis of relational maintenance strategies. Communication Research Reports, 10, 5–14. Gallace, A., & Spence, C. (2010). The science of interpersonal touch: an overview. Neuroscience and Biobehavioral Reviews, 34, 246–59. Guldner, G. (2006). Long distance relationships: The complete guide. 4. Auflage. JF Milne. Harvey, A. J. H., & Omarzu, J. (1999). Minding the close relationship: A theory of relationships enhancement. Cambridge University Press. Hassenzahl, M., Heidecker, S., Eckoldt, K., Diefenbach, S., & Hillmann, U. (2012). All you need is love: Current strategies of mediating intimate relationships through technology. ACM Transactions on Computer-Human Interaction, 19, 1–19. Hassenzahl, M., Eckoldt, K., Diefenbach, S., Laschke, M., Lenz, E., & Kim, J. (2013). Designing moments of meaning and pleasure. International Journal of Design, 7(3), 21–31. Holt, P. A., & Stone, G. L. (1988). Needs, coping strategies, and coping outcomes associated with long-distance relationships. Journal of College Student Development, 29, 136–141. Kowalski, R., Loehmann, S., & Hausen, D. (2013). cubble : A multi-device hybrid approach supporting communication in long-distance relationships. In Proceedings of TEI ’13, 10-13. Le, B., Korn, M. S., Crockett, E. E., & Loving, T. J. (2010). Missing you maintains us. Journal of Social and Personal Relationships, 28, 653–667. Lee, K. M. (2004). Presence, Explicated. Communication Theory, 14, 27–50. Neustaedter, C., & Sengers, P. (2012). Autobiographical design: what you can learn from designing for yourself. Interactions, 19, 28–33. Prager, K. J. (1995). The psychology of intimacy. Guilford Press. Sahlstein, E. M. (2006). Making plans: Praxis strategies for negotiating uncertainty–certainty in longdistance relationships. Western Journal of Communication, 70, 147–165. Stafford, L. (2011). Maintaining long-distance and cross-residential relationships. Routledge. Strong, R., & Gaver, B. (1996). Feather, scent and shaker: supporting simple intimacy. In Proceedings of CSCW’96, 16-20. Wendl, P. (2013). Gelingende Fern-Beziehung - entfernt zusammen wachsen, 6. Auflage. Herder. Westefeld, J. S., & Liddell, D. (1982). Coping with long-distance relationships. Journal of College Student Personnel, 23, 550–551.

Kontaktinformationen Dipl.-Des. Wei-Chi Chien, Prof. Dr. Marc Hassenzahl, Dipl.-Des. Eva Lenz Erlebnis und Interaktion, Fachbereich Gestaltung Folkwang Universität der Künste, Essen. www.marc-hassenzahl.de

S. Diefenbach, N. Henze & M. Pielot (Hrsg.): Mensch und Computer 2015 Tagungsband, Stuttgart: Oldenbourg Wissenschaftsverlag, 2015, S. 93-102.

User Experience bei Softwareanbietern Magdalena Laib1, Michael Burmester1, Chiara Ficano2, Nora Fronemann3, Bianca Kolb2, Anne Krüger4, Marie-Luise Quesseleit5, Katharina Schippert1, Marina Shinkarenko6 Information Experience and Design Research Group (IXD), Hochschule der Medien1 Medien- und Filmgesellschaft Baden-Württemberg (MFG) und baden württemberg: connected (bwcon)2 Fraunhofer Institut für Arbeitswirtschaft und Organisation (IAO)3 Institut für Arbeitswissenschaft und Technologiemanagement (IAT), Universität Stuttgart4 SIC! Software GmbH5 points Internet Agentur6 Zusammenfassung Das Ziel der Studie war es, herauszufinden, was Softwareanbieter unter User Experience (UX) verstehen und welche Einstellung sie dazu haben. Hierzu wurde innerhalb des BMWi geförderten Projektes Design4Xperience eine große Umfrage durchgeführt. Es wurde analysiert, wie Anbieter UX und auch Usability definieren, welche Einstellung sie zu UX haben und welche Anforderungen sie an die Methodenentwicklung stellen. Es zeigte sich unter anderem, dass die Teilnehmer UX recht oberflächlich und heterogen definierten, wobei sie sich nicht an etablierten Definitionen orientierten. Die Teilnehmer waren UX gegenüber sehr positiv eingestellt und interessiert. Die Ergebnisse legen nahe, vor allem an Methoden zu forschen, die die Konzeption von Software unterstützen, da hier ein großer Bedarf festgestellt wurde.

1

Einleitung

Der Artikel basiert auf einer Befragung, die im Rahmen des BMWi geförderten Projektes Design4Xperience (D4X) – Erlebniszentrierter Gestaltungsprozess für kleine und mittlere Softwareunternehmen (KMUs) durchgeführt wurde. Das Ziel bestand darin, herauszufinden, was Softwareanbieter unter UX verstehen und welche Einstellung sie dazu haben. Im Projekt D4X sollen UX-Methoden für KMUs adaptiert und entwickelt werden. Dazu war es wichtig, in einem ersten Schritt herauszufinden, wie Softwareanbieter UX, auch in Abgrenzung zu Usability, definieren. UX bzw. das Benutzererlebnis wird laut Norm definiert als „Wahr-

94 User Experience bei Softwareanbietern

Magdalena Laib et al.2

nehmungen und Reaktionen einer Person, die aus der tatsächlichen und/oder der erwarteten Benutzung eines Produkts, eines Systems oder einer Dienstleistung resultieren“ (DIN EN ISO 9241-210 2011, S.7). Hassenzahl (2008) definiert UX als momentanes, vor allem wertendes Gefühl (positiv – negativ) während der Nutzung eines Produktes oder Services. Nach seiner Definition entsteht eine positive UX als Konsequenz aus der Erfüllung psychologischer Bedürfnisse. Bisher existieren vor allem Metaanalysen (z.B. Bargas-Avila & Hornbæk 2011; Bargas-Avila & Hornbæk 2012), die sich mit der Konzeption bzw. der Definition von UX auseinandersetzen (z.B. Clemmensen, Hertzum, Yang & Chen 2013; Law, Roto, Hassenzahl, Vermeeren & Kort 2009). Teilweise wurden hier bereits Experten aus der Industrie integriert, aber die Arbeit von UX-Praktikern und deren Anforderungen an die Methodenentwicklung wurden bisher vernachlässigt. Diese Lücke sollte mit der vorliegenden Befragung geschlossen werden. Obwohl sich gezeigt hat, dass UX-Forscher UX als multidimensional verstehen (Beispieldimensionen: Affekt, Ästhetik, Motivation, zeitlicher Verlauf des Erlebens), wird meist nur eine Dimension erfasst (Bargas-Avila & Hornbæk 2012). Daher sollte untersucht werden, wie Softwareanbieter UX und in Abgrenzung dazu Usability definieren. Law, Roto, Hassenzahl, Vermeeren und Kort (2009) legten ihren Teilnehmern Aussagen zu UX vor, die diese hinsichtlich ihrer Zustimmung bewerten sollten. Darüberhinaus präsentierten sie UX-Definitionen, die die Teilnehmer analysieren sollten. Bei dieser Vorgehensweise bleibt jedoch das Problem bestehen, dass nur Reaktionen auf vorgegebenes Material erfasst werden, weshalb in der vorliegenden Studie mit von Softwareanbietern verfassten Definitionen gearbeitet wurde. Ein weiteres Ziel von D4X ist es, KMUs mit UX vertraut zu machen. Um dieses Ziel umsetzen zu können müssen Erwartungen und Vorstellungen der Firmen zu UX erfasst werden. Dies dient gleichzeitig dazu, zu überprüfen, welche Erfolgsaussichten sich für die Akzeptanz der in D4X zu entwickelnden Methoden erwarten lassen. Bargas-Avila und Hornbæk (2011) kritisieren, dass in der UX-Forschung meist qualitative Methoden eingesetzt werden im Vergleich zur klassischen HCI-Forschung, wobei Fragebögen trotzdem am häufigsten verwendet werden. Obwohl validierte Fragebögen existierten, wie z.B. der AttrakDiff (Hassenzahl, Burmester & Koller 2003) oder der VisAWI (Thielsch & Moshagen 2010), handelte es sich nach Bargas-Avila und Hornbæk bei vielen Studien jedoch um selbst entwickelte Fragebögen, wobei die Items dem Leser häufig nicht zugänglich gemacht wurden. Es kann mit einer Akzeptanz neuer Methoden nur gerechnet werden, wenn sie sich in den derzeitigen Entwicklungsprozess integrieren lassen. Daher wurde dieser in der Befragung genauer beleuchtet, um herauszufinden, wo die Unternehmen Schwerpunkte legen und wo sie Bedarf für Unterstützung sehen. Um Informationen und Methoden an die KMUs herantragen zu können, müssen optimale Wege der Kontaktaufnahme gefunden werden, weshalb in der vorliegenden Studie abschließend untersucht wurde, wie Unternehmen grundsätzlich mit der Einführung neuer Methoden und Weiterbildung umgehen.

User User Experience Experience bei bei Softwareanbietern Softwareanbietern

2

953

Methodik

2.1 Stichprobe Die Datenerhebung ergab 195 vollständig ausgefüllte Datensätze, darunter waren 172 Vertreter von Anbieterfirmen von Software und 23 Personen von Anwenderfirmen. Die Anwender wurden aufgrund der geringen Stichprobenanzahl aus der Analyse ausgeschlossen, die vorliegenden Ergebnisse beziehen sich daher nur auf die Anbieter. 73% der Teilnehmer waren männlich. Das Alter verteilte sich relativ gleichmäßig auf die Alterspannen ‚Unter 36 Jahre’ (32%), ‚36-45 Jahre’ (30%) und ‚Über 46 Jahre’ (38%). Die meisten Teilnehmer waren bereits länger im Beruf, 65% der Teilnehmer verfügten über mehr als 10 Jahre Berufserfahrung. Teilnehmer mit leitenden Positionen waren in der Umfrage häufig vertreten (42% Geschäftsführung, 21% Abteilungsleitung, 30% Projektleitung). 55% der Teilnehmer waren Informatiker, 17% Designer, 16% gaben einen betriebswirtschaftlichen und 14% einen technischen Hintergrund an. Der Rest bestand aus anderen Berufsgruppen (dies war eine offene Frage und Mehrfachnennungen waren möglich). Die Firmengröße verteilte sich recht gleichmäßig auf Firmen unter 10 Mitarbeitern bis zu Firmen über 250 Mitarbeitern. 75% der Firmen boten ein eigenes Produkt an, 56% erstellten kundenindividuelle Software, 49% bauten Apps und 42% Websites.

2.2 Durchführung Die Befragung fand im April und Mai 2014 statt. Sie konnte als paper-pencil oder online ausgefüllt werden. Im ersten Teil wurden die Stammdaten erfasst. Anschließend wurden die Teilnehmer zu ihrem Wissen bzgl. UX und Usability befragt. Sie wurden dafür gebeten, ihre eigenen Definitionen zu formulieren. Danach wurde ihnen die Definition gezeigt, mit der in D4X gearbeitet wird und ihre Zustimmung abgefragt. Basierend auf der D4X-Definition wurde die Einstellung zu UX erhoben, sowie der aktuelle Entwicklungsprozess analysiert. Abschließend wurden Fragen zum Unternehmen gestellt, die auch den Umgang mit neuen Methoden und die Beschaffung von Informationen adressierten.

2.3 Auswertung Der Fragebogen setzte sich aus unterschiedlichen Fragearten zusammen. Auswahlfragen (teilweise war Mehrfachnennung möglich) und Likert-Skalen wurden deskriptiv ausgewertet. Definitionen wurden qualitativ ausgewertet. Hierfür wurden Kategorien gebildet und die einzelnen Definitionen wurden von drei erfahrenen Ratern hinsichtlich ihrer Passung eingeschätzt. Anschließend wurde die Interraterreliabilität (Krippendorff’s alpha) berechnet.

96 User Experience bei Softwareanbietern

3

Magdalena Laib et al.4

Ergebnisse

3.1 Wissen über Usability und User Experience Es wurden 167 Definitionen zu Usability verfasst. Ca. 87% der Teilnehmer gaben an, zu wissen, was Usability ist (ca. 1% wusste es nicht, ca. 13% hatten schon davon gehört, kannten den Begriff aber „nicht wirklich“). Diejenigen, denen der Begriff bekannt war, wurden gebeten, eine Definition davon aufzuschreiben. Diese Definitionen wurde von 3 Experten dahingehend bewertet, wie sehr sie der folgenden Normdefinition (DIN EN ISO 9241-11 1999) entsprechen: „Das Ausmaß, in dem ein Produkt durch bestimmte Benutzer in einem bestimmten Nutzungskontext genutzt werden kann, um bestimmte Ziele effektiv, effizient und zufriedenstellend zu erreichen.“. Die Rater kodierten, ob folgende 5 Kriterien aus der Norm und den Anmerkungen genannt wurden: (i) Effektivität, (ii) Effizienz, (iii) Zufriedenstellung, (iv) Gebrauchstauglichkeit/Nutzerfreundlichkeit, (v) Nutzungskontext. Für die Übereinstimmung der Rater in den einzelnen Kriterien wurde Krippendorff’s alpha berechnet, dieses betrug zwischen 0,66 und 0,91. Abbildung 1 gibt einen Überblick darüber, welches Kriterium wie häufig genannt wurde (berechnet aus dem Durchschnitt der 3 Rater).

Angaben in %

100 80 60 40 20 0

77 15

24

13

8

Abbildung 1. Anzahl der Nennungen der Kriterien der Usability-Definition (DIN EN ISO 9241-11, 1999), berechnet aus dem Mittelwert der drei Rater.

Es wurden 135 Definitionen zu UX verfasst. Ca. 72% der Teilnehmer gaben an, zu wissen, was UX ist (ca. 5% wussten es nicht, ca. 24% hatten schon davon gehört, kannten den Begriff aber „nicht wirklich“). Auch hinsichtlich UX wurden diejenigen, denen der Begriff bekannt war, gebeten, eine Definition davon aufzuschreiben. Diese wurde von den 3 Experten hinsichtlich ihrer Passung zu 2 Definitionen bewertet. Zum einen wurde die Definition der Norm und deren Anmerkungen (DIN EN ISO 9241-210 2011) herangezogen: „Wahrnehmungen und Reaktionen einer Person, die aus der tatsächlichen und/oder der erwarteten Benutzung eines Produkts, eines Systems oder einer Dienstleistung resultieren“, Anmerkungen: „Emotionen, Vorstellungen, Vorlieben, Wahrnehmungen, physiologische und psychologische Reaktionen, Verhaltensweisen und Leistungen, die sich vor, während und nach der Nutzung ergeben“. Die Rater kodierten dann, ob folgende Kriterien genannt wurden: (i) Erwartungen, (ii) Benutzung von etwas, (iii) Emotionen, Vorstellungen, Vorlieben, Wahrnehmungen, (iv) Physiologische und psychologische Reaktionen, (v) Verhaltensweisen und

User User Experience Experience bei bei Softwareanbietern Softwareanbietern

975

Leistungen, (vi) die sich vor, während und nach der Nutzung ergeben, (vii) Synonym. Krippendorff’s alpha lag zwischen 0,62 und 0,94. Abbildung 2 gibt einen Überblick darüber, welches Kriterium wie häufig genannt wurde (berechnet aus dem Durchschnitt der 3 Rater). Typische Synonyme zu UX waren „Benutzererlebnis“ oder „Nutzererfahrung“.

100

Angaben in %

80 60 40 20 0

8

46

69 23

3

2

9

Abbildung 2: Anzahl der Nennungen der Kriterien der UX-Definition (DIN EN ISO 9241-210, 2011), berechnet aus dem Mittelwert der drei Rater.

Darüber hinaus wurde die Definition von Hassenzahl (2008) herangezogen. Demnach ist positive UX die Konsequenz aus der Erfüllung psychologischer Bedürfnisse. Die Rater kodierten die Definitionen der Teilnehmer anhand der folgenden Kriterien (Krippendorff’s alpha = 0,5 bis 0,59): (i) Erleben wird mit Emotionen gleichgesetzt (12%), (ii) Erleben während Interaktion/mit dem Produkt (38%), (iii) Positive UX = Erfüllung von Bedürfnissen (0,5%). Abschließend wurde den Teilnehmern die D4X-Definition von UX präsentiert: Bei der Entwicklung von Software liegt das Augenmerk darauf, dem Nutzer ein möglichst einfaches Erreichen seiner Ziele zu ermöglichen. Man möchte also die Nutzung interaktiver Produkte verbessern und erleichtern, hierdurch wird das Kriterium der Usability (Benutzerfreundlichkeit) adressiert. Daneben existiert ein weiteres Qualitätskriterium, die User Experience (Benutzererlebnis). Sie zielt darauf ab, dem Nutzer ein positives, emotionales Erlebnis während der Nutzung zu ermöglichen. Es geht also nicht nur darum, Produkte möglichst einfach bedienbar zu machen, sondern für den Nutzer ein positives emotionales Erlebnis zu schaffen, indem er das Produkt verwendet.

67% der Teilnehmer gaben daraufhin an, dass sie UX auch so definiert hätten.

3.2 Einstellung zu User Experience Etwa die Hälfte der Firmen verfügt über eine Abteilung, die sich UX-Abteilung (20%) nennt oder einen Mitarbeiter, der als UX-Experte (27%) ausgewiesen wird. Je größer die Firma, desto eher verfügt sie generell über UX-Spezialisten und über eine UX-Abteilung im Spezifischen. Die folgenden Fragen wurden über eine 5-stufige Likert-Skala abgefragt (mit einer

98 User Experience bei Softwareanbietern

Magdalena Laib et al.6

zusätzlichen „Weiß nicht“-Option): Für 84% der Teilnehmer ist UX (ziemlich bis außerordentlich) interessant für ihr Unternehmen. 78% der Teilnehmer halten UX für (ziemlich bis außerordentlich) wichtig für ihr Unternehmen. 86% der Teilnehmer glauben, dass UX zukünftig (ziemlich bis außerordentlich) wichtig für ihr Unternehmen wird und bei 74% der Teilnehmer wird UX im Unternehmen bzw. für ihre Produkte (ziemlich bis außerordentlich) angestrebt. Derzeit sind 35% der Anbieter (ziemlich bis außerordentlich) davon überzeugt, dass UX schon heute ein Verkaufsargument gegenüber ihren Kunden ist. Beinahe doppelt so viele (69%) sind darüberhinaus (ziemlich bis außerordentlich) der Meinung, dass UX zukünftig ein Verkaufsargument gegenüber ihren Kunden sein wird.

3.3 User Experience in den Firmen: Wie wird entwickelt? Die Teilnehmer wurden gebeten, anzugeben, in welche Phase sie die meiste Zeit und das meiste Budget investieren. Hierfür sollten sie die vorgegebenen Phasen in eine Rangreihe bringen (1 = „das meiste Budget/die meiste Zeit“ bis 7 = „das geringste Budget/die geringste Zeit“). Zur besseren Übersicht wurden die Werte umgepolt, so dass eine höhere Zahl ein höheres Ausmaß repräsentiert. Aus der Anzahl der Antworten und des umgepolten Rankings wurde ein Bewertungsindex generiert, der verdeutlicht, in welche Bereiche der meiste Aufwand fließt (Abbildung 3).

0 = wenig, 1000 = viel Zeit/Budget

1000

800 600 400 200

Zeit

Budget

0

Abbildung 3: Verteilung von Zeit und Budget auf die verschiedenen Entwicklungsphasen.

Bisher werden von den Firmen vor allem Usability-Verfahren eingesetzt, 51% verwenden beispielsweise die Experten Evaluation und 49% arbeiten mit Paper Prototyping. Typische UX-Methoden werden jedoch von weniger Firmen eingesetzt, wie UX Concept Exploration (Fronemann & Peissner 2014) von 10% oder Valenzmethode (Burmester 2013) von 2%. Die Teilnehmer wurden gebeten anzugeben, in welcher Phase des Entwicklungsprozesses sie sich ganz besonders zusätzliche Arbeitshilfen wünschen würden. Hierfür wurde wie in Abbildung 3 mit einer Rangreihe und deren anschließender Umpolung gearbeitet und aus der Anzahl der Antworten und des umgepolten Rankings ein Bewertungsindex generiert, der verdeutlicht, wo am meisten Bedarf liegt (Abbildung 4).

User User Experience Experience bei bei Softwareanbietern Softwareanbietern

997

0 = kein, 800 = hoher Bedarf

800 600 400 200 0

Abbildung 4: Bedarf an Arbeitshilfen in der jeweiligen Entwicklungsphase.

21% der Teilnehmer sind bereit, Zeit in den Einsatz von UX-Methoden zu investieren, aber keine zusätzlichen finanziellen Mittel. 1% ist bereit, finanzielle Mittel, aber keine zusätzliche Zeit zu investieren. 30% würden sowohl Zeit als auch Budget investieren und 23% sind davon überzeugt, dass sie durch den Einsatz von UX-Methoden nicht mit Mehrkosten rechnen müssen, weil später weniger Entwicklungsanpassungen durch höhere Akzeptanz auf sie zukommen bzw. sie dann zufriedenere und treuere Kunden haben werden. Abbildung 5 gibt einen Überblick darüber, welche Konsequenzen sich aus Sicht der Anbieter bei der Anwendung von UX-Methoden ergeben sollten (Mehrfachauswahl war möglich).

Angaben in %

100 80 60 40 20

68

57

33

29

27

0

19

7

Abbildung 5: Konsequenzen, die sich aus Sicht der Anbieter bei der Anwendung von UX-Methoden ergeben sollten.

3.4 Was passiert derzeit in den Unternehmen? 77% der Befragten gaben an, dass in ihren Unternehmen neue Vorgehensweisen auf Initiative des Managements eingeführt werden, bei 64% geschieht es auf Initiative der Mitarbeiter und bei 33% durch Einbezug externer Berater. Abbildung 6 gibt einen Überblick darüber woher die Teilnehmer Informationen bzw. neues Wissen beziehen (Mehrfachauswahl war möglich).

100 User Experience bei Softwareanbietern 100

Angaben in %

80 60

74

74

40 20 0

67

59

Magdalena Laib et al.8

51

50

43

42

35

30

24

Abbildung 6: Quellen, aus denen die Firmen der Softwareanbieter neue Informationen bzw. neues Wissen beziehen.

4

Diskussion

Die Stichprobe der Befragung bietet eine gute Grundlage für Schlussfolgerungen und Maßnahmenentwicklungen: (i) Die Befragten verfügen über viel Berufserfahrung und (ii) sind meist Entscheider. Bei der Definition von Usability wurde hauptsächlich das Kriterium der Gebrauchstauglichkeit/Nutzerfreundlichkeit genannt, wobei es sich im Prinzip um alternative Begrifflichkeiten zu Usability handelt. UX wurde ebenfalls meist mit einem Synonym beschrieben. Insgesamt waren die Definitionen recht heterogen und entsprachen nie im Ganzen einer der zugrunde gelegten Definitionen. Es zeigte sich, dass es durchaus einen Unterschied macht, ob die Befragten selbst eine Definition abgeben sollen oder ob sie vorgegebene Aussagen hinsichtlich ihrer Passung bewerten sollen (Law et al. 2009). Während bei Law et al. (2009) beispielsweise Aussagen zur zeitlichen Dynamik von UX durchaus zugestimmt wurden, nannten in der vorliegenden Studie nur 9% das Kriterium „die sich vor, während und nach der Nutzung ergeben“. Die höchste Zustimmung erreichte bei Law et al. (2009, S. 722) die Aussage „Fleeting and more stable aspects of a person's internal state (e.g. needs. motivations) affect a person's experience of something“, das Kriterium „Positive UX = Erfüllung von Bedürfnissen“ wurde in der vorliegenden Studie jedoch nicht einmal von 1% der Teilnehmer genannt. Vergleichsweise ähnlich in beiden Studien ist die Zustimmung zu affektiven Zuständen und physiologischem Arousal, da „Emotionen, Vorstellungen, Vorlieben“ in der vorliegenden Studie von 23% genannt wurde (physiologische und psychologische Reaktionen jedoch nur von 3%). Die Übereinstimmung der Rater bei der Definition von Usability betrug im Durchschnitt alpha = .78 und erreicht damit in etwa die empfohlene Schwelle von alpha ≥ .80 (Krippendorff 2004). Die Übereinstimmung für die UX-Definition der Norm ist nach Krippendorff (2004) ebenfalls akzeptabel (alpha = 0.71), wohingegen sie für die Definition von Hassenzahl (2008) deutlich abfällt (alpha = 0.55). Dies legt den Schluss nahe, dass die Aussagen der Teilnehmer hier nicht so einfach zugeordnet werden konnten. Die Fragen zur Einstellung zu UX, wie sie in D4X definiert wurde, zeigen deutlich, welches Potential Softwareanbieter UX zumessen und dass mit großem Interesse für dieses Thema gerechnet werden kann. Dieses Ergebnis spiegelt auch die bisherige Erfahrung in D4X wieder, bei der sich die Zusammenarbeit mit Unternehmen vor allem aufgrund deren großer Aufgeschlossenheit und Kooperationsbereitschaft äußerst fruchtbar gestaltet.

User User Experience Experience bei bei Softwareanbietern Softwareanbietern

1019

Die Analyse des Entwicklungsprozesses der Unternehmen lieferte interessante Ergebnisse: Investitionen (Zeit und Budget) gehen an zweiter Stelle in die Konzeptphase (Abbildung 3). Gleichzeitig wünschen sich die Teilnehmer vor allem in Konzept- und Designphase Unterstützung in Form von Arbeitshilfen (Abbildung 4). Die Ergebnisse veranschaulichen den deutlichen Bedarf an konzeptuellen Methoden. Wie sich auch in anderen Studien zeigte (z.B. Bargas-Avila & Hornbæk 2011) werden bisher nur wenige UX spezifische Methoden eingesetzt. Es werden bisher vor allem Usability-Verfahren verwendet. Dies liegt vermutlich daran, dass bisher nur wenige UX-Methoden existieren, die sich in den Entwicklungsprozess der KMU integrieren lassen. Um die Nutzungswahrscheinlichkeit zu erhöhen, muss also weiter daran gearbeitet werden, existierende UX-Methoden an den Bedarf der Praktiker zu adaptieren bzw. neue und leichtgewichtige Methoden zu entwickeln. Das durch eine gute UX angestrebte Ziel zeichnet sich durch Funktionalität aus, vor allem Kundenbindung (siehe auch Mugge 2008) und höherer Umsatz werden angestrebt. Den Nutzern etwas Gutes zu tun wird immerhin noch von 33% der Teilnehmer genannt. Demnach ist das von Hassenzahl und Tractinsky (2006) formulierte Ziel von UX, für Freude zu gestalten, zwar im Blick der Anbieter, jedoch nicht im Fokus. Um die Methoden in die Firmen einzubringen, kann der Weg sowohl über die Geschäftsführung als auch über Mitarbeiter gehen, es macht daher Sinn, beide Zielgruppen anzusprechen. Dies kann über verschiedene Wege geschehen (vgl. Abbildung 6). Zielführend ist sicher, neue Methoden und Ergebnisse in Fachliteratur und online zu publizieren, aber auch Veranstaltungen anzubieten, welche zur Weiterbildung genutzt werden können. Bisherige Forschung zu UX konzentriert sich vor allem auf konsumorientierte und freizeitlich orientierte Produkte, der Arbeitskontext wird bisher eher vernachlässigt (Bargas-Avila & Hornbæk 2012). Die vorliegende Befragung macht jedoch deutlich, auf welch fruchtbaren Boden UX-Forschung auch im Bereich professioneller Software fällt, weshalb es sich das Projekt D4X zum Ziel gesetzt hat, UX auch in professionellen Produkten zu implementieren und die Auswirkungen zu erforschen (Burmester, Laib & Schippert 2014).

5

Schlussteil

Von einer einheitlichen Definition von UX kann bisher nicht ausgegangen werden. Es wurde deutlich, dass auch bei Anbietern professioneller Software ein großes Interesse an UX besteht und adäquate Methoden entwickelt werden müssen (vor allem für die Phase der Konzeption), damit diese in den Entwicklungsprozess aufgenommen werden können. Danksagung Die Befragung wurde im Rahmen des BMWi-Projektes Design4Xperience durchgeführt (Förderinitiative „Einfach intuitiv – Usability für den Mittelstand“ im Rahmen des Förderschwerpunkts „Mittelstand-Digital IKT-Anwendungen in der Wirtschaft“ gefördert vom Bundesministerium für Wirtschaft und Energie (BMWi)).

102 User Experience bei Softwareanbietern

Magdalena Laib et al. 10

Literaturverzeichnis Bargas-Avila, J. A., & Hornbæk, K. (2011). Old Wine in New Bottles or Novel Challenges ? A Critical Analysis of Empirical Studies of User Experience. In CHI’11 May 7–12, 2011 • Vancouver, BC, Canada (pp. 2689–2698). New York: ACM. Bargas-Avila, J., & Hornbæk, K. (2012). Foci and blind spots in user experience research. Interactions, 19(6), 24. Burmester, M. (2013). Valenzmethode – Formative Evaluation der User Experience. In K. Scherfer & H. Volpers (Eds.), Methoden der Webwissenschaft – Ein Handbuch. Bd. I Anwendungsbezogene Methoden (Vol. 11, pp. 141–160). Münster: LIT Verlag. Burmester, M., Laib, M., & Schippert, K. (2014). Interaktion als positives Erlebnis – Technologiegestaltung neu denken. Wissenschaft Trifft Praxis, 1(3), 5–16. Clemmensen, T., Hertzum, M., Yang, J., & Chen, Y. (2013). Do Usability Professionals Think about User Experience in the Same Way as Users and Developers Do ? In P. Kotzé, G. Marsden, G. Lindgaard, J. Wesson, & M. Winckler (Eds.), INTERAC T 2013: Proceedings of the IFIP TC 13 International Conference on Human- Computer Interaction (pp. 461–478). Berlin: Springer. DIN EN ISO 9241-11. (1999). Ergonomische Anforderungen für Bürotätigkeiten Bildschirmgeräten - Teil 11: Anforderungen an die Gebrauchstauglichkeit; Leitsätze.

mit

DIN EN ISO 9241-210. (2011). Ergonomie der Mensch-System-Interaktion – Teil 210: Prozess zur Gestaltung gebrauchstauglicher interaktiver Systeme (ISO 9241-210:2010). Fronemann, N., & Peissner, M. (2014). User Experience Concept Exploration – User Needs as a Source for Innovation. In Proc. of NordiCHI ’14, October 26 - 30 2014, Helsinki, Finland (pp. 727–736). New York: ACM. Hassenzahl, M. (2008). User experience (UX): towards an experiential perspective on product quality. In Proceedings of the 20th International Conference of the Association Francophone d’Interaction Homme-Machine (pp. 11–15). ACM. Hassenzahl, M., Burmester, M., & Koller, F. (2003). AttrakDiff: Ein Fragebogen zur Messung wahrgenommener hedonischer und pragmatischer Qualität. Mensch & Computer 2003, 187–196. Hassenzahl, M., & Tractinsky, N. (2006). User Experience – a research agenda. Behavior & Information Technology, 25(2), 91–97. Krippendorff, K. (2004). Content analysis: An introduction to its methodology (Second edi.). Thousand Oaks: Sage. Law, E. L. C., Roto, V., Hassenzahl, M., Vermeeren, A. P. O. S., & Kort, J. (2009). Understanding, Scoping and Defining User eXperience: A Survey Approach. In Proceedings of the 27th international conference on Human factors in computing systems (pp. 719–728). ACM. Mugge, R. (2008). Emotional bonding with products. Investigating product attachment from a design perspective. VDM Verlag Dr. Müller. Thielsch, M. T., & Moshagen, M. (2010). Erfassung visueller Ästhetik mit dem VisAWI, 260–265.

Kontaktinformationen Magdalena Laib, Hochschule der Medien Nobelstraße 10, 70569 Stuttgart, 0711/8923-3503, [email protected]

S. Diefenbach, N. Henze & M. Pielot (Hrsg.): Mensch und Computer 2015 Tagungsband, Stuttgart: Oldenbourg Wissenschaftsverlag, 2015, S. 103-112.

Praktiken der Nutzerintegration im Entwicklungsprozess von KMU Oliver Stickel1, Corinna Ogonowski1, Timo Jakobi1, Gunnar Stevens2, Volkmar Pipek1, Volker Wulf1 Institut für Wirtschaftsinformatik, Universität Siegen1 Betriebswirtschaft, insb. Wirtschaftsinformatik, Hochschule Bonn-Rhein-Sieg2 Zusammenfassung Die Vorteile, Nutzer aktiv, früh und langfristig in Entwicklungsprozesse zu integrieren, um Fehlentwicklungen zu vermeiden und Nutzerbedürfnisse zu adressieren, sind nicht nur in der akademischen Forschung bekannt. Prozesse und Strukturen in Unternehmen der IKT-Branche sind bereits häufig agil implementiert. Dennoch schaffen es kleine und mittlere Unternehmen (KMU) oftmals nicht, die Potentiale einer Nutzerintegration konsequent auszuschöpfen. In Fallstudien wurden drei unterschiedliche KMU analysiert, wie sie die Stimme des Nutzers im Entwicklungsprozess berücksichtigen. Unterschiedliche Strategien der Nutzerintegration, die sich in Rollen und Werkzeugen, in Anforderungen und Problemen an das Nutzersample, Methoden und Datenaufbereitung widerspiegeln, werden beleuchtet. Unser Beitrag soll helfen, Herausforderungen und Probleme von KMU auf der Suche nach angemessenen und passgenauen Wegen der Nutzerintegration zu verstehen und Lösungen zu gestalten.

1

Einleitung

Software ist zu einem unverzichtbaren Bestandteil privaten wie unternehmerischen Handelns geworden. Führ ihren erfolgreichen Vertrieb kommt der Gebrauchstauglichkeit und dem positiven Nutzererlebnis (Usability und User Experience, kurz UUX) eine immer höhere Bedeutung zu. Insbesondere im Sektor der kleinen und mittleren Unternehmen (KMU) herrschen hinsichtlich der Berücksichtigung dieser Qualitätsmerkmale und ihrer methodischen Absicherung jedoch noch deutliche Defizite (Hering et al., 2013). Oft mangelt es aus finanziellen, methodischen, logistischen oder historischen Gründen am Einbezug von Anwendern, dem gezielten und systematischen Einholen von Nutzerfeedback und/oder dessen Einbindung in den Entwicklungsprozess. Dabei gilt eine solche Integration über alle Phasen eines Softwareprojektes als einer der wichtigsten Faktoren für gute UUX (Hansson et al., 2006). Jedoch zeigt sich, dass die ISO-Norm sowie andere Prozessmodelle (z.B. User Centered Design) Lücken in der Umsetzung und der Einbettung in KMU-Prozesse aufweisen. Der

104 O. Stickel, C. Ogonowski, T. Jakobi, G. Stevens, V. Pipek, V. Wulf2 Praktiken der Nutzerintegration im Entwicklungsprozess von KMU vorliegende Beitrag soll dazu beisteuern, Wege aufzuzeigen, diese Lücken zu schließen. Aufbauend auf einem Verständnis der Mensch-Computer Interaktion und der computerunterstützten Gruppenarbeit als sozio-technische und stark an Praktiken von Menschen orientierte Disziplinen (Wulf et al., 2011), wählten wir Fallstudien in drei möglichst kontrastiven IKTentwickelnden Unternehmen, um ein breites Verständnis über existente Praktiken der Nutzerintegration in Entwicklungsprozessen und deren Herausforderungen zu eruieren: Alpha, eines der größten deutschen KMU-Entwicklungshäuser; Gamma, ein ebenfalls großes KMU, dessen UUX-fokussierte Prozesse noch wenig ausdifferenziert sind; und Delta, ein kleines, designgetriebenes Softwareunternehmen, das vor allem im Auftrag arbeitet. Darauf basierend diskutieren wir beteiligte Rollen, Kanäle und Werkzeuge sowie die Herausforderungen in der Auswertung und Analyse von Kundenfeedback – drei Kategorien, die die Nutzerintegration in die Entwicklung maßgeblich moderieren und nicht zuletzt auch von ihr moderiert werden.

2

Stand der Forschung

Die grundsätzlich hohe Relevanz der Integration von Nutzern in die Entwicklung von Softwareprodukten wird in einer Vielzahl wissenschaftlicher und praktischer Diskurse betont. Participatory Design (Ehn & Kyng, 1987) gilt hierfür als erste systematische Strömung, wenn auch mit einem politisch-gewerkschaftlichen als UUX-fokussierten Hintergrund. Auf Basis dieser Philosophie wurde jedoch schnell auch außerhalb der akademischen Welt, im Rahmen kommerzieller Entwicklungen mit der kontinuierlicher Nutzerintegration experimentiert (Floyd et al., 1989). Weitere Überführungen in systematische, prozessorientierte Modelle fanden beispielsweise mit der integrierten Organisations- und Technikentwicklung (Wulf & Rohde, 1995) statt. Auch diese Ansätze betonen die enge Kollaboration zwischen Nutzern und Entwicklern, die in der Praxis, insbesondere für KMU, aus verschiedenen Gründen (z.B. Logistik, Kosten, Aufwand, etc.) kaum umsetzbar ist (Hansson et al., 2006). Im aktuell häufig verwendeten Modell des User Centered Design (UCD, Mao et al., 2005), wird der Nutzer stärker als Ressource betrachtet, die prozessorientiert nach Bedarf eingebunden wird. Diese Herangehensweise kann eher als geeignet für KMU-Besonderheiten, wie z.B. stärker limitierte Ressourcen, betrachtet werden und wurde im Rahmen der DIN EN ISO 9241 auch im Sinne eines Standards kodifiziert. Durch die relativ offene Spezifizierung von UCD und ISO 9241 bleibt deren jeweilige konkrete Umsetzung jedoch vage. Gemeinsam mit Einschränkungen wie limitierten Ressourcen oder auch Traditionen sorgt dies dafür, dass KMU nutzerzentrierte Methoden oft nur in geringen Ausmaß anwenden (Hering et al., 2013). Softwareentwickelnde Unternehmen - auch KMU -, strukturieren ihre Entwicklungsprozesse zunehmend anhand von Prinzipien der agilen Softwareentwicklung (Beck et al., 2001), die klar von klassischen Entwicklungsphilosophien wie z.B. dem Wasserfallmodell abweichen. Agile Methoden wie Scrum (Schwaber, 1995) oder Kanban (Anderson & Reinertsen, 2010) betonen Flexibilität, die Reaktionsfähigkeit auf unvorhersehbare Entwicklungen, lauffähige Prototypen, geringen Overhead, wie z.B. tiefe Dokumentationen, und auch die Zusammenarbeit mit dem Kunden. Zwar besteht zwischen UCD-Ansätzen und agilen Entwicklungsmodellen keine Deckungsgleichheit, jedoch wird durch die vielen geteilten Charakteristika wie z.B. iterative Entwicklung und die hohe Relevanz des Anwenders zumindest eine Artver-

Praktiken Praktiken der der Nutzerintegration Nutzerintegration im im Entwicklungsprozess Entwicklungsprozess von von KMU KMU

1053

wandtschaft deutlich (Chamberlain et al., 2006). Daher gilt die agile Strukturierung von Softwareentwicklung als relevanter Ansatzpunkt zur prozesshaften Nutzbarmachung von aktiver Einbindung von Anwendern auch für KMU. In diesem Bereich existieren bereits Vorarbeiten wie z.B. Versuche, explizite Design-Zyklen in agile Prozesse (Silva et al., 2012) oder UUX-Experten in agile Teams zu integrieren (Beyer, 2010). Es wurden auch bestimmte Rollen in der agilen Entwicklung beleuchtet: Beispielsweise wurde der Product Owner (PO in Scrum-Doktrin: zentrale, für die Produktvision verantwortliche Rolle), als die für UUX maßgebliche Rolle diskutiert. Singh (2008) argumentiert auch dafür, mehrere PO einzusetzen, wobei einer explizit auf UUX geschult werden sollte. Insgesamt ist jedoch festzustellen, dass trotz thematischer Nähe und entsprechender Vorarbeiten noch große Lücken in der tatsächlichen praktischen Integration von nutzerzentrierter UUX-Evaluation und agiler Entwicklung bestehen, die nicht zuletzt auch auf mangelndes Verständnis tatsächlicher Entwicklungs- und Arbeitspraxis bei Software-Unternehmen zurückgehen (Draxler et al., 2014; Ferreira et al., 2007).

3

Fallstudien und methodisches Vorgehen

Alpha ist ein großer Mittelständler mit ca. 500 Mitarbeitern, der seit längerer Zeit einen verstärkten Fokus auf die Einbindung von Nutzern legt. Der Produktschwerpunkt liegt auf Softwareentwicklung für Endkunden, insbesondere im Bereich der Finanzverwaltung. Unsere Arbeit mit Alpha konzentrierte sich auf ein Finanzverwaltungsprodukt für Endnutzer, das agil entwickelt und plattformübergreifend, auch mobil, vertrieben wird. Es wurden 60minütige Interviews mit dem verantwortlichen PO, dem Social Media Management (SMM), dem Leiter des Support-Teams, einem Support-Mitarbeiter, einem Entwickler sowie zwei Mitarbeitern des Usability-Labors geführt. Zudem fanden teilnehmende Beobachtungen bei Nutzertests in diesem Labor (3h) und bei einem Scrum-Planungsmeeting (4h) statt. Gamma ist ein Unternehmen mit ca. 200 Mitarbeitern und ebenfalls am oberen Ende der KMU-Klassifikation einzuordnen. Durch die strategische Entscheidung, eine eigene Smart Home Produktlinie zu positionieren, rückten für das Unternehmen gegenüber dem klassischen Portfolio Fragen der Interface-Gestaltung stärker in den Vordergrund. Das bisherige Kerngeschäft bildet die Technologieentwicklung für Heim-Netzwerke. Unsere Forschung konzentrierte sich bei Gamma auf die für das neue Produkt geschaffenen Entwicklungsprozesse und das hausinterne Testsample zur Evaluation von Prototypen. Hierfür wurden 90- bis 120-minütige Interviews mit den Leitern der Entwicklungsabteilung, der Abteilung Design, Verification & Testing (DVT), dem Produkt Marketing sowie dem verantwortlichen PO geführt. Delta ist ein wachsendes KMU mit 11 Mitarbeitern, dass Entwicklungs- und Beratungsleistungen sowie Design von innovativer Software, Apps und digitalen Produkten im Bereich Internet of Things, Energie und Elektromobilität anbietet. Um die Unternehmensstruktur, Führungsstrategie und die agilen Entwicklungsprozesse besser zu verstehen, wurden 60- bis 90-minütige Interviews mit zwei der drei Gesellschafter, die gleichzeitig als Srum Mas-

106 O. Stickel, C. Ogonowski, T. Jakobi, G. Stevens, V. Pipek, V. Wulf4 Praktiken der Nutzerintegration im Entwicklungsprozess von KMU ter/Head of Project Management (PM) und Creative Director (CD) agieren, dem Senior Art Director UI/UX (AD) sowie einem Mobile Developer geführt. Unser methodisches Vorgehen orientiert sich an den durch Wulf et al. (2011) etablierten Design Case Studies. Die dafür notwendigen Interviews wurden anhand eines semistrukturierten Gesprächsleitfadens geführt, Audio-Aufzeichnungen angefertigt und transkribiert. Weiterhin wurden Feldnotizen angelegt und Artefakte (z.B. interne Berichte von Nutzertests) gesammelt. Alle Daten gingen in die Analyse ein, die in Anlehnung an die Thematische Analyse (Braun & Clarke, 2006) vorgenommen wurde. Die thematische Analyse ist eine der Grounded Theory artverwandte, jedoch weniger auf extensive Theoriebildung fokussierte Art der qualitativen Analyse. Ähnlich einer Herangehensweise mittels Grounded Theory legten wir den Fokus auf feldgetriebene und unmittelbare Weiterentwicklung des Analyse- und Forschungsprozesses. Dies wurde durch induktive, kontinuierliche und iterative Codierung ab dem ersten Interview, das Schreiben von Memos sowie Diskussion und Kategorienbildung gemeinsam mit Forschern, die nicht in die Feldstudien involviert waren, (im Sinne der Inter-Coder-Reliablität) sichergestellt. Auch die Auswahl der Interviewpartner fand feldgetrieben statt. Die im Folgenden berichteten Kategorien entwickelten sich durch diesen Analyseprozess als zentrale Aspekte der Nutzerintegration in Softwareentwicklung durch KMU.

4

Praktiken und Herausforderungen

4.1 Rollen Bei Alpha zeigte sich, dass eine Vielzahl von Rollen bewusst im Kontakt mit Anwendern steht. Vor allem das hauseigene Support-Team wird täglich mit unterschiedlichsten Nutzungsproblemen konfrontiert, jedoch auch explizit auf das Aufnehmen von gewünschten Features geschult ist. Das Customer Lab führt auf Anfrage des Entwicklungsteams Nutzertests (hauptsächlich per Lautem Denken) mit einem kontinuierlich erweiterten Stamm an Teilnehmern durch. Weiterhin ist das Social Media Management in ständigem Kontakt mit Nutzern über soziale Medien, pflegt dort Informationen ein, überwacht und moderiert aktiv die Konversationen von Anwender-Communities und bemüht sich, ein Gefühl für die „Stimmung“ auf der jeweiligen Plattform zu bekommen. Auch der PO hat direkten Nutzerkontakt, konsolidiert jedoch auch das Feedback der anderen beteiligten Rollen und kanalisiert diese in User Stories. Bemerkenswert ist, dass für das Finanzverwaltungsprodukt ein Team aus zwei PO eingesetzt wird, wobei einer sich auf die Gesamtvision fokussiert und einer für tägliche Details, insbesondere User Stories, verantwortlich ist. Für Letzteres werden explizit auch alle anderen Rollen nach Bedarf mit einbezogen wenn Unklarheiten bestehen. Entwickler haben bei Alpha keinen direkten Nutzerkontakt. Gammas Ablauforganisation ist produktorientiert in Business Units aufgeteilt. Innerhalb der von uns untersuchten Einheit ist der direkte Kontakt mit Nutzern des Testsamples stark kanalisiert. Obwohl intern getestet wird, wurde mit Bugzilla ein Feedbacktool eingerichtet, das bei der Abteilung DVT aufgehängt ist. Diese ist im Wesentlichen dafür zuständig neue Soft-

Praktiken Praktiken der der Nutzerintegration Nutzerintegration im im Entwicklungsprozess Entwicklungsprozess von von KMU KMU

1075

ware-Builds auf ihre Vollständigkeit und Korrektheit zu überprüfen. Darüber hinaus informiert sie die Entwicklung über Fehlerberichte aus dem Feedbacktool. Die Entwicklungsabteilung hat, anders als bei den sonstigen Units, eine stärker koordinierende und konzeptionelle Aufgabe. Viele Entwicklungstätigkeiten wurden aufgrund des für Gamma neuen Aufgabenfeldes an externe Partner vergeben. Diese werden von der Entwicklungsabteilung instruiert. Für Feedback und Berichte zu UUX ist der PO verantwortlich, der grundsätzlich die alleinige Handlungs- und Entscheidungskompetenz innehat, sich jedoch auch von externen Agenturen beraten lässt. Weiterer direkter Nutzerkontakt mit dem PO oder der Entwicklung entsteht bei konkreten Rückfragen zu einzelnen Problemen. Für die Zeit nach dem Produktlaunch ist ein enger Support und weiterführende Beratung durch Online-Chats und Webinare geplant, um das Produkt durch schnelle Updates weiter ausreifen zu lassen. Im Marketing findet ähnlich wie bei Alpha ebenfalls Austausch über Social Media Kanäle statt. Delta setzt auf eine flache Hierarchie, die sich in eine Design- und Entwicklungs-Unit sowie Social Media Marketing und die beiden Funktionen der CEOs aufteilen lassen. Vor allem die Rollen des Head of PM, des Creative und des Art Director stehen in engem Kontakt mit den Kunden, die in diesem Fall keine Endnutzer sind. User Centered Design wird bei Delta stärker auf den Kunden, aber auch peripher auf die tatsächlichen Endnutzer übertragen. Man denkt visionär und versucht immer wieder einen Schritt zurück zu treten, um die Konzepte und Lösungen durch eine Nutzerbrille zu betrachten. Für die interne Qualitätskontrolle der Konzepte und Softwarelösungen ist der PM und für UUX Aspekte der CD und AD zuständig. Die technische Güte wird durch klassisches Bug-Tracking, Perfomance- und Beta-Tests gesichert. Oft werden Mitarbeiter, die nicht in das Projekt involviert sind, mit internen BetaTests betraut. Zudem finden Feedbackschleifen dynamisch zwischen den Units und Rollen statt, die beim PM zusammenfließen. Am Ende jedes Sprints wird auch der Kunde um Feedback gebeten. Umfangreichere Nutzertests werden abhängig vom Projekt entweder an Dritte ausgelagert oder der Kunde führt diese selbst mit Hilfe eines eigenen Testsamples durch, das oftmals aus einem ausgewählten Anwenderkreis besteht. Die Entwicklung hat wie auch bei Alpha keinen direkten Kontakt zu Nutzern.

4.2 Kanäle und Werkzeuge Im Falle von Alpha wird Microsofts TFS als internes Projektverwaltungswerkzeug eingesetzt, in das Artefakte wie z.B. User Stories, Bugs, etc. eingepflegt werden und das insbesondere für den PO das zentrale Werkzeug darstellt. Das Suportteam unterhält Kanäle per EMail, Telefon, Brief, Fax, Chat sowie in Form produktspezifischer Foren (letztere allerdings eher mit Fokus auf Kunden-helfen-Kunden). Feedback wird aus einem eigenen SupportTicketsystem in TFS überführt. Zentrale Kanäle für das Social Media Management stellen Facebook und Twitter sowie produktspezifische Blogs dar. Featurewünsche oder Änderungsvorschläge werden kontextualisiert und durch Kundenstimmen untermauert an den PO weitergegeben, Routine-Probleme teilweise auch unmittelbar an das Entwicklungsteam weitergeleitet. Bemerkenswert ist, dass das SMM nicht geordnet am TFS partizipiert, sondern Feedback per Mail oder im persönlichen Gespräch an den PO gibt. Das Customer Lab unterhält als zentralen Kanal ein physikalisches Labor in dem, meist in Form des Lauten Denkens und entsprechender Video-Aufzeichnungen Nutzertests durchgeführt werden. Ergänzt wird

108 O. Stickel, C. Ogonowski, T. Jakobi, G. Stevens, V. Pipek, V. Wulf6 Praktiken der Nutzerintegration im Entwicklungsprozess von KMU dies durch heuristische Evaluationen und Cognitive Walkthroughs, in jüngerer Zeit auch durch eigene Studien bei Teilnehmern Zuhause. Von den Testbatterien, die meist je 5-20 Teilnehmer umfassen, werden umfangreiche Berichte gestellt und ins TFS überführt. Der PO steht durch produktspezifische Feedback-Mailadressen (die ungleich der Support-Adressen sind) sowie durch aktives Beobachten der Rezensionen in mobilen App-Stores in Kundenkontakt – bemerkenswerterweise in manchen Fällen auch per Telefon – langjährige „Lead User“ rufen den PO teilweise direkt an. Unternehmensintern betonten weiterhin alle Interviewpartner die Wichtigkeit des direkten persönlichen Kontaktes und Austausches, vor allem informell, z.B. in Kaffee-Ecken – „Flurfunk“ sowie eine räumliche Nähe. Bis zum internen Nutzertest hat Gamma ein hauseigenes Produktmanagement-Datenbanksystem verwendet, in dem alle Anforderungen und Eigenschaften des Systems vorgehalten und gepflegt werden. Im Falle der neuen Produktlinie werden dort auch Wireframes hinterlegt, die im Wesentlichen zum Abgleich von ausgelagerten Entwicklungsaufträgen herangezogen werden. Zum Zeitpunkt der Fertigstellung aller geplanten Features hat Gamma ein lokales Testbett errichtet, das nur sehr rudimentär UUX beforscht. Im Zentrum steht nicht mehr die Suche nach innovativen Features, sondern die Gestaltung der UI-Komponenten und der Interaktionsfluss. Das Sample umfasst ca. 30 Haushalte, die das Produkt vor Marktstart über mehrere Monate Zuhause testen. Test und Aneignung finden dabei ohne Anleitung statt. Die einzigen Richtlinien sind, sich zu einer aktiven und umfassenden Nutzung zu verpflichten und bei Updates gefixte Probleme zu testen. Als Feedbackkanäle dienen Bugzilla, um nutzerseitig Tickets zu erstellen, und der informelle Austausch zwischen „Tür und Angel“. Zudem werden sämtliche Logfiles eines Systems erfasst, um eine Reproduzierbarkeit des Problems möglichst sicherzustellen. Sobald das Produkt am Markt ist, berichtet der Support und das Marketing an den PO. Delta arbeitet mit der Managementsoftware Jira und Confluence, um die Agilität im Entwicklungsprozess zu gewähren. Die Software dient zum einen dem PM zur internen Koordination und zum anderen als Schnittstelle für größtmögliche Transparenz gegenüber den Kunden. User Stories und Bugs werden maßgeblich vom PM eingepflegt. Intern wird Feedback beim Daily Stand-Up und auf kurzem Weg zwischen PM und Mitarbeitern des Designs und der Entwicklung ausgetauscht (Flurfunk). Überdies hinaus und je nach Konzeption der Projekte, kann der Kunde selbst Tickets mit Feedback erstellen. Beta-Tests werden im Bereich mobiler Anwendungen durch die Software Testflight realisiert. Zudem wird Software zum Tracking von Nutzerverhalten eingesetzt, um Interaktionskonzepte und UI zu evaluieren. Für aktives Nutzerfeedback stehen verschiedene Möglichkeiten zu Verfügung: Entweder der Kunde sammelt das Feedback seiner Nutzer, selektiert es und stellt es Delta zur Verfügung; Nutzerfeedback aus Beta-Tests wird ungefiltert in Jira eingepflegt; oder es wird eine E-Mail-Adresse bereitgestellt, über die Nutzerfeedback mitgeteilt werden kann. Bei den letzten beiden Optionen ist Delta für die Organisation, Pflege und Bewertung des Feedbacks verantwortlich. Ein weiterer genutzter Feedbackkanal sind wie bei Alpha die App-Stores mit ihren Kundenrezensionen. Oft werden diese vom Kunden selbst betreut und je nach Bedarf an den PM weitergeleitet. Qualitatives Nutzerfeedback zum UI wird bislang nicht oder unsystematisch, z.B. bei Treffen mit dem Kunden und Beta-Testern, gesammelt.

Praktiken Praktiken der der Nutzerintegration Nutzerintegration im im Entwicklungsprozess Entwicklungsprozess von von KMU KMU

1097

4.3 Herausforderungen von Auswertung und Analyse Alle drei KMU stellten heraus, dass sie die Wichtigkeit von Nutzerintegration in die Entwicklung sehr schätzen, sich jedoch immer wieder mit Schwierigkeiten in der Auswertung und Analyse konfrontiert sehen, beispielsweise hinsichtlich Fragestellungen wie was der Kunde sagt, ist nicht notwendigerweise was er auch meint, der Repräsentativität von Kundenwünschen oder dem Abgleich von Feedback mit Kriterien der Umsetzbarkeit oder technischen Spezifika. Im Laufe der Firmengeschichte von Alpha wurde mit verschiedensten Ansätzen experimentiert. Mittlerweile verwendet man eine Triangulation aus qualitativen und quantitativen Aspekten aus einer Vielzahl von Kanälen und Perspektiven: Zentral ist der PO, der endgültige Entscheidungen in Abwägung mit der langfristigen und strategischen Produktvision trifft und weshalb letztlich auch zwei PO eingesetzt werden, die sich gegenseitig ergänzen. Die Entscheidungen werden jedoch systematisch durch die beteiligten Rollen und Kanäle ergänzt – das Social Media Management nimmt hierbei eine qualitative Rolle ein und versucht Stimmungen und möglichst viel Kontext sowie eigene interpretative Leistung in den Entscheidungsprozess einzubringen. Das Customer Lab interpretiert und filtert nicht vor, sondern aggregiert methodisch sauber abgesichertes qualitatives und quantitatives Nutzerfeedback in geordneter Berichtsform. Der Support hingegen reicht Feedback und Nutzerwünsche nicht nur durch, sondern diskutiert dieses innerhalb der für das jeweilige Produkt zuständigen Gruppe und entscheidet weitgehend selbständig auf Basis von Erfahrung, Schulung und Unternehmenskultur, welches Feedback über das TFS weitergereicht wird. Weiterhin sammelt der Support eine große Datenbasis, die explizit auch quantifiziert wird, was dem Triangulationsprozess unterstützend zugeführt wird. Als essentieller Faktor für die erfolgreiche Analyse von Nutzerfeedback wird eine Unternehmenskultur der Ermächtigung gewertet, die Einzelrollen ohne Gefahr persönlicher Konsequenzen teilweise hitzige Diskussionen mit dem PO führen lässt, welche letztlich dem Produkt zugutekommen. Ähnlich wie bei Alpha nimmt auch bei Gamma der PO eine Schlüsselfunktion ein. Er bewertet und klassifiziert aufkommende Hinweise und Informationen verschiedener Rollen und Kanäle und entscheidet eigenständig und in Abwägung mit dem avisierten Produktziel, welche Aspekte zu behandeln sind. Grundsätzlich orientiert man sich an der Faustregel, dass wenn mindesten zwei bis dreimal das gleiche Feedback zu einem bestimmten Aspekt eingeht, wird dieser als relevant gewertet. Das Filtern und Klassifizieren der über Bugzilla eingehenden Meldungen wird vom DVT verantwortet, die die Vorfälle entweder zur Entwicklung oder zur Entscheidung beim PO durchreichen. Eine wichtige Möglichkeit, konkrete Rücksprachen zu halten, um Feedback besser bewerten zu können und Lösungsvorschläge abzuholen, ist sowohl für Entwickler als auch für den PO in UUX-Fragen das direkte Gespräch mit Testern über den Flurfunk. Eine Kombination aus qualitativen und quantitativen Daten findet somit auch bei Gamma Anwendung, wenn auch nicht ganz so klar strukturiert wie bei Alpha, da die Arbeit mit dem Testsample keiner Abteilung klar zugewiesen ist. Schwierigkeiten bestehen hier zum einen, bei der Betreuung der Testhaushalte und zum anderen bei der „Betriebsblindheit“ der Nutzer, die als kritisch bewertet wird. Hierfür müsste aus Sicht des PO das involvierte Sample ständig erweitert oder partiell ersetzt werden, um die Güte des Feedbacks zu sichern.

110 O. Stickel, C. Ogonowski, T. Jakobi, G. Stevens, V. Pipek, V. Wulf8 Praktiken der Nutzerintegration im Entwicklungsprozess von KMU Im Gegensatz zu den beiden KMU befindet sich Delta in einer etwas anderen Situation der Bewertung von Feedback und dem Treffen von Entscheidungen. Durch die Position als Dienstleister stehen sie zum einen in Abhängigkeit zu und in ständiger Absprache mit ihren Kunden und zum anderen müssen Ergebnisse und Feedback intern diskutiert werden. Die flache Hierarchie und die Unternehmensgröße sind förderlich für eine schnelle interne Bewertung, die beim PM zusammenläuft und an den Kunden kommuniziert wird, der letztendlich finale Entscheidungen trifft. Gängige Praxis ist es bislang quantitatives Feedback durch Tracking der Nutzung mit qualitativem Feedback per Email zu triangulieren. Dieses Vorgehen lässt sich personell und zeitlich sehr gut integrieren. Entscheidungshilfen hinsichtlich der Priorisierung des Feedback werden ähnlich wie bei Gamma anhand der Häufigkeit der Meldung gehandhabt, obwohl ein verbaler Austausch mit Nutzern, vor allem im Hinblick auf UUX-Aspekte, als wertvoller bewertet wird. Die nur sehr eingeschränkt vorhandenen personellen Ressourcen für Nutzungsstudien lassen dies aber nur schwer realisieren und bringen weitere Herausforderungen mit sich. Feedback was vom Kunden selbst oder durch Dritte erhoben und selektiert wird, bietet nur begrenzt Möglichkeiten Nachfragen zu stellen oder fehlende Kontextinformationen im Nachgang zu erheben. Vertrauen in die Validität der Daten stellt hierbei eine nötige Voraussetzung dar.

5

Diskussion und Zusammenfassung

Anhand der kontrastiven Fallstudien lässt sich zeigen, dass insbesondere die Größe des vorgehaltenen Samples an Test-Nutzern sowie die Ausdifferenzierung von Kanälen (intern wie extern) zur Nutzerintegration mit der Größe des Unternehmens skalieren können. Problematisch ist vor allem, dass kleinere Unternehmen eine große Notwendigkeit sehen, eine bessere Nutzerintegration vorzunehmen. Man behilft sich hier mittels interner Tests mit Kollegen aus anderen Projekten oder einem mentalen Fokus auf den Nutzerblick, ist sich jedoch der Unzulänglichkeit solcher Methoden steigend bewusst. Insbesondere für Unternehmen, die nicht direkt für Endkunden, sondern im Auftrag entwickeln, kommt die Problematik hinzu, nicht nur interne Stakeholder, sondern auch zahlende Kunden von Investitionen in die Nutzerintegration zu überzeugen. Ein möglicherweise probates Mittel wäre die Externalisierung bestimmter Aspekte der Zusammenarbeit mit Nutzern, beispielsweise durch Crowd-Testing oder realweltliche Tests as a service (z.B. in Living Labs (Ley et al., 2015)) – einerseits mit Bezug auf rationalisierungsökonomische Faktoren, andererseits auch im Sinne von Überzeugungsarbeit am Kunden, die solche fokussierten Dienstleister für Nutzerintegration im Idealfalle durch umfangreiche Portfolios und harte Zahlen (ROI) leisten können. Eine ähnliche Situation zeigt sich in den beteiligten Rollen, die mit der Unternehmensgröße skalieren können. Die Ausdifferenzierung verschiedener Rollen, die aktiv und aus unterschiedlichen Blickwinkeln an der Nutzerintegration arbeiten und in strukturierte Prozesse eingebunden sind, scheint ein zentraler Erfolgsfaktor zu sein, wobei die agile Strukturierung dieser Prozesse ein gutes Rahmenkonstrukt bieten kann. Wichtig scheint weiterhin, dass die Rollen eine gewisse Ermächtigung erfahren und bei Entscheidungen auch tatsächlich berücksichtigt werden. Die PO-Rolle ist hierbei zentral und ausgesprochen mächtig, was durch die Ermächtigung anderer Rollen sowie UUX-fokussierter Schulung von PO moderiert werden kann.

Praktiken Praktiken der der Nutzerintegration Nutzerintegration im im Entwicklungsprozess Entwicklungsprozess von von KMU KMU

1119

Außerdem sollte eine genuine Unternehmenskultur geschaffen werden, die auf den Nutzer fokussiert und einen schnellen, informellen Austausch im Unternehmen fördert. Gerade dieser Aspekt ist für kleinere KMU gut umsetzbar. Die hier aufgeführten Aspekte sollen beim Umgang mit und der Analyse von Nutzerfeedback helfen, denn auch wenn in einem Unternehmen aktiv Nutzer in die Entwicklung integriert werden, bleiben Unsicherheiten im Umgang und der Analyse komplexer Herausforderungen. Die Ausdifferenzierung von Rollen, Werkzeugen und entsprechender Unternehmenskultur, gerahmt von agiler Strukturierung der Entwicklung hilft, wobei qualitative und quantitative Daten vom und Blickwinkel auf den Nutzer von zentraler Bedeutung sind. Erfolgreiche Nutzerintegration scheint sich so unter dem Schlagwort „Multi-Channel Feedback“ (Draxler et al., 2014) subsumieren zu lassen, welche mit der Unternehmensgröße skaliert und in weiteren Forschungsarbeiten Thema sein wird. Danksagung Diese Arbeit wurde gefördert vom Bundesministerium für Wirtschaft und Energie (FKZ: 01MU14001A und 01MU12026A). Literaturverzeichnis Anderson, D. J., & Reinertsen, D. G. (2010). Kanban: Successful Evolutionary Change for Your Technology Business. Sequim, Washington: Blue Hole Press. Beck, K., Beedle, M., Van Bennekum, A., Cockburn, A., Cunningham, W., Fowler, M., … Thomas, D. (2001). Agile Manifesto. Retrieved from http://agilemanifesto.org/ Beyer, H. (2010). User-Centered Agile Methods. Lectures on Human-Centered Informatics. Braun, V., & Clarke, V. (2006). Using thematic analysis in psychology. Qualitative Research in Psychology, 3, 77–101. Chamberlain, S., Sharp, H., & Maiden, N. (2006). Towards a Framework for Integrating Agile Development and User-Centred Design. In Extreme Programming and Agile Processes in Software Engineering (Vol. 4044, pp. 143–153). Draxler, S., Stickel, O., Winter, D., & Stevens, G. (2014). Nutzerintegration in Softwareprojekte durch Multi-Channel Feedback. In Proc. MuC (pp. 175–184). Ehn, P., & Kyng, M. (1987). The collective resource approach to system design. In Computers and democracy: A Scandinavian challenge (pp. 17–57). Avebury. Ferreira, J., Noble, J., & Biddle, R. (2007). Agile Development Iterations and UI Design. In Proc. AGILE 2007 (pp. 50 - 58). Floyd, C., Mehl, W.-M., Reisin, F.-M., Schmidt, G., & Wolf, G. (1989). Out of Scandinavia: Alternative Approaches to Software Design and System Development. Human-Computer Interaction, 4(4), 253–350. Hansson, C., Dittrich, Y., & Randall, D. (2006). How to Include Users in the Development of Off-theShelf Software: A Case for Complementing Participatory Design with Agile Development. In Proc. HICSS .

112 O. Stickel, C. Ogonowski, T. Jakobi, G. Stevens, V. Pipek, V. Wulf Praktiken der Nutzerintegration im Entwicklungsprozess von KMU 10 Hering, D., Kraft, X., Schwartz, T., & Wulf, V. (2013). Usability-Hindernisse bei Software entwickelnden KMU. In Proc. MuC (pp. 9–18). Ley, B., Ogonowski, C., Mu, M., Hess, J., Race, N., Randall, D., Rouncefield, M., & Wulf, V. (2015). At Home with Users: A Comparative View of Living Labs. In Interacting with Computers. 27, 1, 21–35. Mao, J.-Y., Vredenburg, K., Smith, P. W., & Carey, T. (2005). The State of User-centered Design Practice. CACM, 48(3), 105–109. Schwaber, K. (1995). SCRUM Development Process. In Proc.OOPSLA (pp. 117–134). Silva, T., Silveira, M. S., Maurer, F., Hellmann, T., Paulo, U. D. S., Carlos, C. D. S., Universidade, P. (2012). User Experience Design and Agile Development : From Theory to Practice. JSEA, 2012(October), 743–751. Singh, M. (2008). U-SCRUM: An Agile Methodology for Promoting Usability. In Proc. AGILE (pp. 555 - 560). Wulf, V., & Rohde, M. (1995). Towards an Integrated Organization and Technology Development. In Symposium on Designing Interactive Systems ’95 (pp. 55–64). Wulf, V., Rohde, M., Pipek, V., & Stevens, G. (2011). Engaging with Practices: Design Case Studies as a Research Framework in CSCW. In Proc. CSCW (pp. 505–512).

Kontaktinformationen Oliver Stickel Universität Siegen, Institut für Wirtschaftsinformatik Kohlbettstr. 15, 57068 Siegen Mail: [email protected]

S. Diefenbach, N. Henze & M. Pielot (Hrsg.): Mensch und Computer 2015 Tagungsband, Stuttgart: Oldenbourg Wissenschaftsverlag, 2015, S. 113-122.

Geschlechterstereotype in PersonaBeschreibungen Nicola Marsden1, Jasmin Link2, Elisabeth Büllesfeld2 Fakultät IT, Hochschule Heilbronn1 Fraunhofer-Institut für Arbeitswirtschaft und Organisation IAO, Stuttgart2 Abstract Im nutzungszentrierten Design werden Personas als zentraler Teil des Gestaltungsprozesses genutzt. Um zu untersuchen, welche Rolle Personas beim Fortschreiben bestehender Geschlechterstereotype spielen, wurden in einer empirischen Analyse 170 Persona-Beschreibungen hinsichtlich des dargestellten sozialen Umfelds, der Freizeitbeschäftigungen und der Technikkompetenz untersucht. Die Ergebnisse zeigen geschlechterstereotype Darstellungen auf der Dimension Wärme/Gemeinschaft. Diese werden diskutiert und es werden Empfehlungen für die Gestaltung mit Personas gegeben.

1

Personas zur Repräsentation von Nutzenden

Gendergerechtigkeit spielt in der Forschung zu Human-Computer Interaction eine immer wichtigere Rolle (Breslin & Wadhwa, 2015; Grudin & Williams, 2013). Dabei ist die Berücksichtigung von Nutzerinnen und Nutzern mit ihren diversen Lebenslagen zentral (Marsden & Kempf, 2014). Die Persona-Methode ist eine Herangehensweise, die hier häufig als Werkzeug eingesetzt wird (Grudin, 2006; Nielsen, 2013; Pruitt & Adlin, 2006). In der Persona-Methode werden fiktive Repräsentanten von Nutzerinnen und Nutzern geschaffen. Personas werden im Rahmen des Gestaltungsprozesses als prototypische Stakeholder genutzt, um eine aktive Auseinandersetzung mit den Nutzerinnen und Nutzern, die Kommunikation zwischen Gestaltungs- und Entwicklungsteam sowie zwischen Auftraggebenden und nehmenden zu unterstützen. Personas können im gesamten menschzentrierten Gestaltungsprozess eingesetzt werden und sowohl als formatives als auch als evaluatives Werkzeug eingesetzt werden (Nielsen, 2013). Der Einsatz von Personas birgt die Gefahr, dass unreflektiert Stereotype zum Einsatz kommen – wobei in einem gewissem Maße Stereotype in der Arbeit mit Personas unumgänglich sind (Turner & Turner, 2011). Die Gründe für die Anwendung von Stereotypen auf Personas sind vielfältig. In erster Linie handelt es sich hier um den Einsatz der I-Methodology (Bath, 2014a, 2014b; Oudshoorn, Rommes, & Stienstra, 2004) bzw. des fundamentalen Gestal-

114 Nicola Marsden, Jasmin Link, Elisabeth Büllesfeld2 Geschlechterstereotype in Persona-Beschreibungen tungsfehlers (Ritter, Baxter, & Churchill, 2014): Die Entwickelnden gehen von sich selbst aus und attribuieren die eigenen Vorstellungen, Herangehensweisen, Ziele etc. auf die Personas und konzipieren diese dann entweder als ihnen ähnlicher oder – entsprechend dem psychologischen Kontrasteffekt – als unähnlicher, als sie de facto sind. Auch andere Faktoren wie Zeitmangel oder Gruppenzugehörigkeiten fördern einen Rückgriff auf Stereotype bei Gestaltung und Einsatz von Personas (Marsden, Link, & Büllesfeld, 2014), ebenso eine wenig detaillierte Beschreibung von Personas (Nielsen, 2013). Als Lösung zur Vermeidung bzw. Reduzierung von sterotypen Beschreibungen im menschzentrierten Gestaltungsprozess gilt es in erster Linie, mit echten Nutzerinnen und Nutzern zu arbeiten (Buchmüller, Joost, Bessing, & Stein, 2011; Holtzblatt & Beyer, 2015; Ritter et al., 2014). Darüber hinaus gibt es eine Reihe von Herangehensweisen, um problematische Vergeschlechtlichungen in der Human-Computer Interaction zu entdecken, zu thematisieren oder zu vermeiden werden, z.B. das „Gender Extended Research and Development“ (GERD)-Modell (Draude, Maaß, & Wajda, 2014) Mind Scripting (Allhutter, 2012), geschlechter- und intersektionalitätskritische Softwaregestaltung (Paulitz & Prietl, 2014), Diffractive Design (Bath, 2014a; Ernst, 2014), das intersektionale „Sanduhr-Modell“ (Lucht, 2014), die verschiedenen Möglichkeiten feministischer Interventionen in den Gestaltungsprozess (Rommes, 2014), die Reflective/Reflexive Methods (Bardzell & Churchill, 2011) etc. Einige Ansätze der Vermeidung von Geschlechterstereotypen fokussieren spezifisch auf den Einsatz von Personas (Marsden et al., 2014), nutzen Personas, um eine Reflexion von Geschlechterstereotypen zu unterstützen (Källhammer & Nilsson, 2012) oder gezielt dafür, die Anliegen beider Geschlechter im Gestaltungprozess von Software zu berücksichtigen (Burnett et al., 2014). Um ein weitergehendes Verständnis davon zu bekommen, welche Rolle Geschlechterstereotype in der Arbeit mit Personas spielen, wurde eine Untersuchung von im Einsatz befindlichen Personas durchgeführt. Im Folgenden wird zunächst der theoretische Hintergrund von Geschlechterstereotypen skizziert, dann wird die Untersuchung beschrieben, die Ergebnisse werden vorgestellt und diskutiert und Implikationen für den Gestaltungsprozess abgeleitet.

2

Geschlechterstereotype

Geschlechterstereotype beinhalten Wissen darüber, welche Eigenschaften und Verhaltensweisen für Männer und Frauen ein einer Gesellschaft bezeichnend sind und bei ihnen vermeintlich zu beobachten sind (Kite, Deaux, & Haines, 2008). Als soziokognitive Strukturen haben Stereotype eine duale Struktur dahingehend, dass es sich einerseits um individuelles Wissen der jeweiligen Person handelt, andererseits um sozial geteiltes Wissen, das durch Kultur und zwischenmenschlichen Konsens hergestellt und verfestigt wird (Eckes, 2008). Die kognitive Komponente (der Stereotyp im engeren Sinne) geht einher mit einer emotionalen Komponente und einer Verhaltenskomponente. Der Dreiklang von geschlechtsbezogenen Stereotypen, Affekten und Verhaltensweisen, die in einen ungleichen sozialen Status von Männern und Frauen resultieren, wird als Sexismus bezeichnet (Swim & Campbell, 2003). Geschlechterstereotype sind häufig nicht bewusst und werden automatisch und ohne aktives

Geschlechterstereotype Geschlechterstereotype in in Persona-Beschreibungen Persona-Beschreibungen

1153

Zutun angewendet (Banaji & Hardin, 1996), d.h. sie entfalten ihre Wirksamkeit oft in Form von impliziten Assoziationen (Greenwald, McGhee, & Schwartz, 1998). Durch die duale Struktur von Geschlechterstereotypen ist es so, dass durch jeden Akt der Stereotypisierung der Stereotyp erneut konsensuell validiert, d.h. das vermeintliche Wissen über für Männer oder Frauen typische Eigenschaften und Verhaltensweisen wiederum fortgeschrieben wird. Hinsichtlich der Inhalte von Geschlechterstereotypen zeichnet die Forschung ein klares Bild: Frauen werden Eigenschaften zugesprochen, die eher auf der Dimension Wärme, Soziales oder Gemeinschaftsorientierung angeordnet sind. Merkmale, die häufiger Männern zugeordnet werden, sind auf der Dimension der aufgabenbezogenen Kompetenz, Instrumentalität oder Selbstbehauptung zu verorten (Fiske, Cuddy, & Glick, 2007), ein Ergebnis, welches interkulturell und auch für Deutschland bestätigt wird (Ebert, Steffens, & Kroth, 2014; Eckes, 2002). Neben diesen Globalstereotypen von Männern und Frauen gibt es Substereotype, d.h. Globalstereotype sind strukturell heterogen und setzen sich aus einer Reihe in sich homogener Kategorien zusammen. So werden zum Beispiel arbeitende Mütter und arbeitende Väter sehr unterschiedlich wahrgenommen: Arbeitende Mütter werden als kompetenter eingestuft, verlieren aber auf der Dimension Wärme, die mit Mütter und Hausfrauen verbunden ist. Arbeitende Väter hingegen werden als eine erfolgreiche Kombination in den Dimensionen Wärme und Kompetenz wahrgenommen (Cuddy, Fiske, & Glick, 2004). Für die Globalstereotype, mit denen Frauen eher Eigenschaften der Dimension Wärme/Gemeinschaftsorientierung und Männer eher Kompetenz/Instrumentalität zugeschrieben wird, hat sich gezeigt, dass sie über die Zeit sehr stabil sind. Allerdings hat sich in den letzten Dekaden die von Frauen über sich selbst berichtete Instrumentalität kontinuierlich erhöht – die selbstberichtete Expressivität von Männern bleibt dabei gleichzeitig unverändert (Twenge, 1997, 2009). Für die Globalstereotype gibt es zwei Erklärungsansätze: Die Theorie der sozialen Rollen (Eagly, Wood, & Diekman, 2000) zeigt auf, dass Menschen davon ausgehen, dass Frauen und Männer diejenigen Merkmale aufweisen, die für ihre jeweiligen sozialen Rollen, insbesondere für ihre Familien- und Berufsrollen, typisch sind. Menschen verallgemeinern dann vom beobachteten Rollenverhalten unmittelbar auf Eigenschaften der Rolleninhabenden und vernachlässigen dabei den Einfluss der verhaltenswirksamen Rollenanforderungen. Ergänzend werden die Globalstereotype durch das Stereotypinhaltsmodell erklärt (Fiske, Cuddy, Glick, & Xu, 2002). Es besagt unter anderem, dass der Status einer Gruppe die Einordnung auf der Kompetenzdimension bestimmt, und zwar dahingehend, dass Gruppen mit hohem Status als kompetent eingeschätzt werden. Die Einordnung einer Gruppe auf der Wärmedimension dagegen wird durch die Art der Interdependenz bestimmt, und zwar so, dass kooperative Gruppen als warm bzw. als unbedrohlich für die eigenen Gruppenziele und kompetitive Gruppen als kalt bzw. als bedrohlich eingeschätzt werden. Es gibt eine Vielzahl von Methoden zur Messung von Stereotypen (Eckes, 2008; Kite et al., 2008). Um medial vermittelte stereotype Darstellungen der Geschlechter zu untersuchen, werden meist inhaltsanalytische Verfahren angewendet (Collins, 2011; Rudy, Popova, & Linz, 2011), sie zeigen, dass Frauen in der medialen Vermittlung eher unterrepräsentiert sind, untergeordnet, in stereotyp femininen Rollen oder negativ dargestellt werden (Collins, 2011). Bisher wurden Persona-Beschreibungen noch nicht als mögliche Kristallisationspunkte von Geschlechterstereotypen in den Blick genommen. Diese Forschungslücke sollte mit

116 Nicola Marsden, Jasmin Link, Elisabeth Büllesfeld4 Geschlechterstereotype in Persona-Beschreibungen der vorliegenden Untersuchung geschlossen werden, vor allem vor dem Hintergrund dass eine geschlechterstereotype Darstellung an dieser Stelle den gesamten Gestaltungsprozess beeinflussen kann. Eine Forschungsfrage lautet entsprechend, welche Hinweise existierende Persona-Beschreibungen auf Geschlechterstereotype geben – die hier berichteten Ergebnisse fokussieren sich dabei auf das soziale Umfeld, die Freizeitbeschäftigungen und die Technikkompetenz der Personas.

3

Methode

Als Stichprobe wurden insgesamt 170 Persona-Beschreibungen analysiert, dabei handelte es sich um 73 Beschreibungen weiblicher, und 83 Beschreibungen männlicher Personas, 5 Beschreibungen von Paaren, sowie 9 Beschreibungen, die mit „weiblich, ggf. männlich“ oder „Familie XY“ keine Zuordnung zulassen. Um eine möglichst breite Stichprobe zur Auswertung existierender Personas zu erhalten, wurde eine Recherche öffentlich zugänglicher Personas (z.B. über Projekthomepages) durchgeführt, darüber hinaus gab es im November 2014 einen Aufruf, im Einsatz befindliche Personas zur Verfügung zu stellen. Bei dem Aufruf wurde nicht erwähnt, dass es um eine Auswertung zum Thema Gender ging, um Effekte der sozialen Erwünschtheit dahingehend zu vermeiden. Dass Wirtschaftsunternehmen hier mit entsprechenden Informationen deutlich restriktiver sind als öffentliche Auftraggebende schlägt sich auch in der Stichprobe nieder: Von den 21 Persona-Sets stammen sieben aus Quellen von öffentlicher Hand oder Non-Profit-Organisationen (50 Persona-Beschreibungen, kurz PB), sechs aus EU-Projekten (73 PB), drei von Universitäten (13 PB) und fünf von Unternehmen aus der Wirtschaft (34 PB). Die 21 Persona-Sets hatten zwischen 2 und 30, meist zwischen 5 und 10, und durchschnittlich 8 Personas pro Set. Neun der Sets liegen in deutscher Sprache vor (51 PB), eines in Niederländisch (3 PB), und elf in Englisch (116). Die beschriebenen Personas leben in Deutschland (60), Österreich (10), den USA (30), Großbritannien (12), Schweden (6) Australien (5) und anderen europäischen Ländern. Anwendungsdomäne der Persona-Sets waren IT-Systeme in öffentlich nutzbaren Einrichtungen wie Bibliotheken, Universitäten und Museen (sechs Mal), IT-Systeme im Wohn- und Lebensumfeld (fünf Mal), zudem ging es um Assistenz-Technologien, Systeme aus dem Verkehrsbereich und um konkrete Produkte oder Dienstleistungen. Das Vorgehen sah folgendermaßen aus: Die Persona-Beschreibungen wurden nach theoriegeleitet festgelegten Attributen inhaltsanalytisch ausgewertet (Früh, 2011). Als Untersuchungseinheit wurden die einzelnen Personas gewählt. Basis der hier dargestellten Auswertung waren folgende theoriegeleitete Attribute: soziales Umfeld, Freizeitbeschäftigungen und Technikaffinität. Die Analyse erfolge in zwei Phasen. In der ersten Phase wurde das Kategoriensystem operationalisiert und die in den PersonaBeschreibungen identifizierten Hinweise auf die Attribute wurden in einer ersten Durchsicht aller Persona-Beschreibungen als Ausprägung (z.B. für Kinder: „nicht erwähnt“, „kinderlos“, „eine Tochter“ etc.) oder als Skala operationalisiert. Die entwickelte Skala ordnet den Dimensionen einen Wert zwischen null und fünf für die Wichtigkeit der Dimension innerhalb einer Persona-Beschreibung zu. Um diese Einschätzung möglichst objektiv und nachvoll-

Geschlechterstereotype Geschlechterstereotype in in Persona-Beschreibungen Persona-Beschreibungen

1175

ziehbar zu machen, wurden die Zwischenwerte beschrieben, und die Kriterien für Werte festgelegt. Teilweise wurden auch Paare, Familien oder Geschwister als PersonaBeschreibungen im selben Format wie Einzelpersonen beschrieben. In diesem Fall wurden die dargestellten Personen als Entität erfasst, in der Codierung wurde dann zum Beispiel bei einem Paar der Mittelwert als Alter angegeben, als Geschlecht wurde „Paar“ codiert. In der zweiten Analysephase wurden die auf dieser Basis entwickelten Ausprägungen der Kategorien und Skalen frequenzorientiert ausgewertet und entsprechend der Forschungsfrage wurden die Attribute soziales Umfeld, Freizeitbeschäftigungen und Technikaffinität jeweils im Hinblick auf das Geschlecht der Persona betrachtet.

4

Ergebnisse

Insgesamt zeigte sich, dass sich die Persona-Beschreibungen in Umfang und Inhalten erheblich unterschieden: Neben tabellarischen Auflistungen in der Art eines Persona-Posters waren narrative Beschreibungen zu finden, die sich zwischen wenigen Zeilen Text plus Bild und dreiseitigen Texten bewegten, in denen Ziele, Motivationen und weitere Hintergründe aus dem Leben der Personas dargestellt wurden. Im folgenden werden die Ergebnisse der zweiten Analysephase für die Bereiche soziales Umfeld, Freizeitbeschäftigungen und Technikaffinität dargestellt. Wie oben dargestellt wurde frequenzorientiert für die Untersuchungseinheit „Persona“ ausgewertet.

4.1 Soziales Umfeld Die Analyse der Persona-Beschreibungen hinsichtlich der Erwähnung von Kindern zeigte, dass für die Hälfte der weiblichen, jedoch nur einem Drittel der männlichen Personas Kinder erwähnt wurden. Das Geschlecht der Kinder war in den meisten Fällen nicht spezifiziert, in den Fällen, in denen hier eine Angabe vorhanden war hielt sich die Anzahl der Töchter und Söhne insgesamt die Waage. Enkelkinder gab es bei männlichen und weiblichen Personas zu gleichen Anteilen. Die explizite Erwähnung von Kinderlosigkeit war bei weiblichen Personas tendenziell häufiger. Insgesamt gab es so bei 63 % der männlichen und 41 % der weiblichen Personas keine Erwähnung von Kindern oder Enkelkindern. Kinder

gesamt

nicht erwähnt kinderlos Kinder (Enkel nicht erwähnt) Kinder und Enkel

Persona weiblich

Persona männlich

55 %

41 %

63 %

7%

8%

5%

27 %

40 %

22 %

11 %

11 %

11 %

Tabelle 1: Bezug auf Kinder den Persona-Beschreibungen (N=170)

118 Nicola Marsden, Jasmin Link, Elisabeth Büllesfeld6 Geschlechterstereotype in Persona-Beschreibungen Neben Integration von Kindern und Enkelkindern in die Persona-Beschreibung wurde auch analysiert, in welchem Ausmaß weitere Personen aus dem sozialen Umfeld der Persona (Partner_in, Vorgesetzte, Freunde, Geschwister, Eltern etc.) explizit erwähnt wurden. Die Persona-Beschreibungen unterschieden sich deutlich in der Nennung bzw. Nicht-Nennung solcher Nebenpersonas: Beinahe ein Drittel der männlichen Persona-Beschreibungen enthielten keine weiteren Verweise auf andere Personen, bei den weiblichen waren es knapp ein Sechstel, d.h. bei männlichen Persona-Beschreibungen wurde doppelt so häufig keine Aussage zum sozialen Umfeld gemacht wie bei weiblichen.

4.2 Freizeitbeschäftigungen Von den 170 Persona-Beschreibungen enthielten 49 Informationen über Hobbies und Freizeitbeschäftigungen: Bei 29 % der weiblichen und 34 % der männlichen Personas wurden solche Aktivitäten erwähnt, bei den männlichen Personas wurden zudem tendenziell mehr Freizeitaktivitäten aufgeführt. Wie in Tabelle 1 dargestellt finden sich Aktivitäten häufig sowohl in den Beschreibungen männlicher als auch weiblicher Personas, jedoch gibt es auch eine Reihe von Aktivitäten, die ausschließlich bei den Persona-Beschreibungen eines Geschlechts zu finden sind. Dabei handelt es sich bei den Aktivitäten, die nur bei weiblichen Personas beschrieben sind, nur um Einzelnennungen, bei den männlichen PersonaBeschreibung gibt es mehrere Beschäftigungen, die bei weiblichen Persona-Beschreibungen gar nicht vorkommen, allen voran die Beschäftigung mit Technik mit sieben Nennungen. Nur in Beschreibungen männlicher Personas genannt:

-

In Beschreibungen beider Geschlechter genannt, aber häufiger bei männlichen Personas:

-

In Beschreibungen weiblicher und männlicher Personas gleich häufig genannt: In Beschreibungen beider Geschlechter genannt, aber häufiger bei weiblichen Personas:

-

Nur in Beschreibungen weiblicher Personas genannt:

-

Technik (7 mal genannt) Fußball, Freunde treffen (jeweils 2 mal genannt) Angeln, Jagen, Poker, Schiffsmodelle bauen, Wein, Lokalgeschichte, Ahnenforschung, MMORPG, Computerspiele, Medien, Katze, Segeln, Golf, Kegeln, Ausflüge, Radfahren (jeweils 1 mal genannt) Filme/Kino Garten Kochen Wandern Lesen Reisen (jeweils 4 mal) Ehrenamt, Parties/Feiern (jeweils 1 mal) Musik Fotos Sport (unspezifisch, keine Sportart genannt) Kultur (Kunst, Ballett, Museen, Galerien) Stricken, Fernsehen, Jazz, Klavierspielen, Gitarre, Tetris, MySpace, Schwimmen, Aerobic, Spieleabend (jeweils 1 mal genannt)

Tabelle 2: In den Persona-Beschreibungen genannte Freizeitbeschäftigungen

Geschlechterstereotype Geschlechterstereotype in in Persona-Beschreibungen Persona-Beschreibungen

1197

4.3 Technikkompetenz Die frequenzbasierte Auswertung der Persona-Beschreibungen zeigte keine Unterschiede in der Technikkompetenz: Die durch die Rater vorgenommene Einschätzung entlang der Skala Technikkompetenz ergibt für die Durchschnittswerte männlicher und weiblicher Personas keine Unterschiede. Auch wurde diese Dimension bei beiden Geschlechtern ähnlich oft nicht erwähnt. Die Daten deuten jedoch darauf hin, dass in den Personabeschreibungen sowohl eine große Begeisterung für Technik, als auch deren entschiedene Ablehnung eher bei männlichen Personas beschrieben wird.

5

Diskussion

Die frequenzanalytische Auswertung von 170 Persona-Beschreibungen hinsichtlich sozialem Umfeld, Freizeitbeschäftigungen und Technikkompetenz gibt Hinweise auf das Vorhandensein stereotyper Geschlechterdarstellungen in den untersuchten Personas. Die in der Forschung zu Inhalten von Geschlechterstereotypen (Eckes, 2008) zentrale Verquickung von Frau-Sein mit der Dimension des Sozialen ist in den Daten deutlich erkennbar: Bei weiblichen Personas werden Kinder deutlich häufiger erwähnt als bei männlichen Personas. Die Erwähnung weiterer Personen im sozialen Umfeld der Persona ist bei männlichen Personas ebenfalls seltener. Auch die Ergebnisse zu den für die Personas dargestellten Freizeitbeschäftigungen zeigen geschlechterstereotype Züge: In den Beschreibungen der weiblichen Personas gab es außerhalb der für beide Geschlechter vorkommenden Freizeitbeschäftigungen Hobbys wie Stricken, Fernsehen oder Aerobic für weibliche Personas, bei den männlichen Personas waren es Technik, Fußball oder Schiffsmodelle. In der dargestellten Untersuchung unterscheiden sich männliche und weibliche Personas nicht in ihrer Technikkompetenz. Dies mag zum einen daran liegen, dass in dieser frequenzanalytischen Auswertung qualitative Unterschiede in der dargestellten Technikkompetenz nicht berücksichtigt werden. Es kann natürlich auch an dem aktiven Versuch liegen, die dargestellten Personas bewusst nicht defizitorientiert zu beschreiben bzw. beide Geschlechter als kompetent darzustellen. Diese Interpretation ist naheliegend, da es sich hier zu einem großen Teil um Personas aus öffentlich geförderten Projekten handelt, in denen die Gleichstellung der Geschlechter eine explizite Anforderung darstellt. Von den beiden zentralen Dimensionen der Globalgeschlechterstereotype sind Unterschiede in der Dimension Wärme/Gemeinschaft also stärker zu beobachten ist als in der Dimension Kompetenz/Instrumentalität. Bei der Annahme, dass bei den Personas versucht wurde, im Sinne der wahrgenommenen sozialen Erwünschtheit „gute“ und damit eben möglichst keine geschlechterstereotypen Persona-Beschreibungen zu verfassen, kann dies folgendermaßen interpretiert werden: Während das Weniger-Vorhandensein von Wärme/Gemeinschaft bei Männern als eher unproblematisch gilt (und deshalb keine Notwendigkeit gesehen wird, hier in der Beschreibung von Personas korrigierend einzugreifen), stellt das Fehlen hinsichtlich der Dimension Kompetenz/Instrumentalität bei Frauen ein spürbares Defizit dar, welches im

120 Nicola Marsden, Jasmin Link, Elisabeth Büllesfeld8 Geschlechterstereotype in Persona-Beschreibungen Zuge der Beschreibung von Personas einer Korrektur bedarf. Diese Interpretation ist konform mit Erkenntnissen zur gesamtgesellschaftlichen Veränderungen, wonach sich die von Frauen über sich selbst berichtete Instrumentalität kontinuierlich erhöht, die selbstberichtete Expressivität von Männern gleichzeitig jedoch unverändert bleibt (Twenge, 1997, 2009). Insgesamt deuten die Daten somit darauf hin, dass die Personas daran orientiert sind, den gesellschaftlichen Status Quo abzubilden. Hier zeigt sich in westlichen Kulturen mehr und mehr die Tendenz, Eigenschaften und Verhalten aus dem Bereich Kompetenz/Instrumentalität weiter aufzuwerten und aus dem Bereich Wärme/Gemeinschaft abzuwerten. Twenge (2009) weist auf das darin liegende Paradox hin, dass darin besteht, dass der Status von Frauen sich erhöht hat während die ihnen traditionell zugeschriebenen Eigenschaften von Wärme/Gemeinschaft an Wert verloren haben. Sie empfiehlt auf dieser Basis, dass ein Empowerment von Mädchen und Frauen weniger Kompetenz/Instrumentalität bei Frauen betonen sollte als dass beiden Geschlechtern der Wert der Eigenschaften auf der Dimension Wärme/Gemeinschaft verdeutlicht wird.

6

Implikationen für den Gestaltungsprozess

Die für die untersuchten Persona-Beschreibungen gefundenen Hinweise auf Geschlechterstereotype zeigen, dass sich hier der gesellschaftliche Status Quo abbildet und das in der Gestaltung von HCI liegenden Potenzial zur aktiven Gestaltung des Wechselspiels von gesellschaftlicher und technischer Entwicklung nicht ausgeschöpft wird. Dies ist umso instruktiver, als dass sich Personas als geeignetes Mittel gezeigt haben, um bestehende Geschlechterstereotype zu hinterfragen. Um dieses Potenzial im Gestaltungprozess zu nutzen, sollten Personas als Möglichkeit begriffen werden, um Genderaspekte in den menschzentrierten Gestaltungsprozess zu integrieren bzw. das Fortschreiben bestehender Geschlechterstereotype zu reflektieren. Da Stereotype den Default unserer Personenwahrnehmung darstellen, muss hier aktiv gegengesteuert werden, um das Potenzial der Persona-Methode in diese Richtung zu nutzen (Marsden et al., 2014), zum Beispiel indem Persona-Sets in persönlicher Ansprache formuliert werden oder eine zufällige Verteilung des Geschlechts vorgenommen wird. Literaturverzeichnis Allhutter, Doris (2012). Mind Scripting: A Method for Deconstructive Design. Science, Technology & Human Values, 37(6), 684-707. Banaji, Mahzarin & Hardin, Curtis D. (1996). Automatic stereotyping. Psychological Science, 7(3), 136-141. Bardzell, Shaowen & Churchill, Elizabeth F. (2011). IwC Special Issue “Feminism and HCI: New Perspectives”. Special Issue Editors’ Introduction. Interacting with Computers, 23(5), iii-xi. Bath, Corinna (2014a). Diffractive Design. In N. Marsden & U. Kempf (Eds.), Gender-UseIT - HCI, Usability und UX unter Gendergesichtspunkten (pp. 27-36). München: De Gruyter Oldenbourg.

Geschlechterstereotype Geschlechterstereotype in in Persona-Beschreibungen Persona-Beschreibungen

1219

Bath, Corinna (2014b). Searching for Methodology. Feminist Technology Design in Computer Science. In Waltraud Ernst & Ilona Horwath (Eds.), Gender in Science and Technology (pp. 57-78). Bielefeld: transcript. Breslin, Samantha & Wadhwa, Bimlesh (2015). Towards a Gender HCI Curriculum. Paper presented at the Proceedings of the 33rd Annual ACM Conference Extended Abstracts on Human Factors in Computing Systems, Seoul, Republic of Korea. Buchmüller, Sandra, Joost, Gesche, Bessing, Nina & Stein, Stephanie (2011). Bridging the gender and generation gap by ICT applying a participatory design process. Personal and Ubiquitous Computing, 15(7), 743-758. Burnett, Margaret, Stumpf, Simone, MacBeth, James, Beckwith, Laura, Makri, Stephann, Kwan, Irwin & Peters, Anicia (2014). Using the GenderMaP Method to Find Usability Issues through a Gender Lens. Retrieved Jan. 18th, 2015, from EUSES Consortium http://eusesconsortium.org/gender Collins, Rebecca L. (2011). Content Analysis of Gender Roles in Media: Where Are We Now and Where Should We Go? Sex Roles, 64(3-4), 290-298. Cuddy, Amy JC, Fiske, Susan T. & Glick, Peter (2004). When professionals become mothers, warmth doesn't cut the ice. Journal of Social Issues, 60(4), 701-718. Draude, Claude, Maaß, Susanne & Wajda, Kamila (2014). GERD: ein Vorgehensmodell zur Integration von Gender/Diversity in die Informatik. In Anja Zeising, Claude Draude, Heidi Schelhowe & Susanne Maaß (Eds.), Vielfalt der Informatik - Ein Beitrag zu Selbstverständnis und Außenwirkung (pp. 197-283). Bremen: Staats- und Universitätsbibliothek Bremen. Eagly, Alice H, Wood, Wendy & Diekman, Amanda B. (2000). Social role theory of sex differences and similarities: A current appraisal. The developmental social psychology of gender, 123-174. Ebert, Irena, Steffens, Melanie & Kroth, Alexandra (2014). Warm, but Maybe Not So Competent?— Contemporary Implicit Stereotypes of Women and Men in Germany. Sex Roles, 70(9-10), 359-375. Eckes, Thomas (2002). Paternalistic and envious gender stereotypes: Testing predictions from the stereotype content model. Sex Roles, 47(3-4), 99-114. Eckes, Thomas (2008). Geschlechterstereotype: Von Rollen, Identitäten und Vorurteilen. In R. Becker & B. Kortendiek (Eds.), Handbuch Frauen- und Geschlechterforschung (pp. 171-182): VS Verlag. Ernst, Waltraud. (2014). Diffraction Patterns? Shifting Gender Norms in Biology and Technology. In Waltraud Ernst & Ilona Horwath (Eds.), Gender in Science and Technology (pp. 147-163). Bielefeld: transcript Verlag. Fiske, Susan T, Cuddy, Amy JC & Glick, Peter (2007). Universal dimensions of social cognition: Warmth and competence. Trends in cognitive sciences, 11(2), 77-83. Fiske, Susan T, Cuddy, Amy JC, Glick, Peter & Xu, Jun (2002). A model of (often mixed) stereotype content: competence and warmth respectively follow from perceived status and competition. Journal of personality and social psychology, 82(6), 878-902. Früh, Werner (2011). Inhaltsanalyse: Theorie und Praxis (Vol. 2501). UTB. Greenwald, Anthony G, McGhee, Debbie E. & Schwartz, Jordan LK. (1998). Measuring individual differences in implicit cognition: the implicit association test. Journal of personality and social psychology, 74(6), 1464-1480.

122 Nicola Marsden, Jasmin Link, Elisabeth Büllesfeld Geschlechterstereotype in Persona-Beschreibungen 10 Grudin, Jonathan (2006). Why personas work: The psychological evidence. In J. Pruitt & T. Adlin (Eds.), The Persona Lifecycle (pp. 642–663). Amsterdam: Elsevier. Grudin, Jonathan & Williams, Gayna (2013). Two women who pioneered user-centered design. interactions, 20(6), 15-20. Holtzblatt, Karen & Beyer, Hugh (2015). Contextual Design Evolved. Morgan & Claypool. Källhammer, Eva & Nilsson, Åsa Wikberg (2012). Gendered Innovative Design - Critical Reflections stimulated by Personas. In S. Andersson, K. Berglund, E. Gunnarsson & E. Sundin (Eds.), Promoting Innovation - Policies, practices and procedures (pp. 328-350). Sweden: VINNOVA. Kite, Mary E, Deaux, Kay & Haines, Elizabeth L. (2008). Gender stereotypes. Psychology of women: A handbook of issues and theories, 2, 205-236. Marsden, Nicola & Kempf, Ute (2014). Gender-UseIT - HCI, Usability und UX unter Gendergesichtspunkten. München: De Gruyter Oldenbourg. Marsden, Nicola, Link, Jasmin & Büllesfeld, Elisabeth (2014). Personas und stereotype Geschlechterrollen. In N. Marsden & U. Kempf (Eds.), Gender-UseIT - HCI, Usability und UX unter Gendergesichtspunkten (pp. 91-104). München: De Gruyter Oldenbourg. Nielsen, Lene (2013). Personas - User Focused Design. Springer. Oudshoorn, Nelly, Rommes, Els & Stienstra, Marcelle (2004). Configuring the User as Everybody. Science, Technology & Human Values, 29(1), 30-63. Paulitz, Tanja & Prietl, Bianca (2014). Geschlechter- und intersektionalitätskritische Perspektiven auf Konzepte der Softwaregestaltung. In Nicola Marsden & Ute Kempf (Eds.), Gender-UseIT - HCI, Usability und UX unter Gendergesichtspunkten (pp. 79-89). München: De Gruyter Oldenbourg. Pruitt, John & Adlin, Tamara (2006). The Persona Lifecycle: Keeping People in Mind throughout Product Design. San Francisco: Morgan Kaufmann Publishers. Ritter, Frank E., Baxter, Gordon D. & Churchill, Elizabeth F. (2014). Foundations for Designing UserCentered Systems. Springer London. Rommes, Els (2014). Feminist Interventions in the Design Process. In Waltraud Ernst & Ilona Horwath (Eds.), Gender in Science and Technology (pp. 41-55). Bielefeld: transcript Verlag. Rudy, Rena, Popova, Lucy & Linz, Daniel (2011). Contributions to the Content Analysis of Gender Roles: An Introduction to a Special Issue. Sex Roles, 64(3-4), 151-159. Swim, Janet K. & Campbell, Bernadette. (2003). Sexism: Attitudes, beliefs, and behaviors. Blackwell handbook of social psychology: Intergroup processes, 218-237. Turner, Phil & Turner, Susan (2011). Is stereotyping inevitable when designing with personas? Design Studies, 32(1), 30-44. Twenge, Jean M. (1997). Changes in masculine and feminine traits over time: A meta-analysis. Sex roles, 36(5-6), 305-325. Twenge, Jean M. (2009). Status and gender: The paradox of progress in an age of narcissism. Sex Roles, 61(5-6), 338-340.

S. Diefenbach, N. Henze & M. Pielot (Hrsg.): Mensch und Computer 2015 Tagungsband, Stuttgart: Oldenbourg Wissenschaftsverlag, 2015, S. 123-132.

3D-Visualisierung zur Eingabe von Präferenzen in Empfehlungssystemen Johannes Kunkel, Benedikt Loepp, Jürgen Ziegler Universität Duisburg-Essen Zusammenfassung In diesem Beitrag stellen wir ein interaktives Empfehlungssystem vor, bei dem Nutzer ihre Präferenzen in einer dreidimensionalen Visualisierung des Produktraums eingeben können. Die Darstellung in Form einer Landschaft spiegelt dabei das Profil des aktuellen Nutzers wider, und ermöglicht diesem sowohl in Kaltstartsituationen als auch bei der späteren Anpassung eines existierenden Profils interaktiv seine Präferenzen anzugeben. Die Methode basiert auf den von allen Nutzern abgegebenen Bewertungen und benötigt kein inhaltliches Wissen über die Produkte. Die durchgeführte Nutzerstudie zeigt, dass die Visualisierung nachvollziehbar und hilfreich erscheint. Bezüglich der Eingabe von Präferenzen durch Modellierung der Landschaft ergaben sich ebenfalls vielversprechende Ergebnisse, u. a. auch im Hinblick auf User Experience und Empfehlungsqualität.

1

Einleitung

Empfehlungssysteme (Recommender Systems) sollen durch proaktive Generierung von Vorschlägen Nutzer dabei unterstützen, aus sehr großen, meist unüberschaubaren Mengen von Items wie z. B. Filmen, Nachrichteninhalten oder Konsumgütern, diejenigen zu selektieren, die am besten zu ihren Interessen oder Präferenzen passen (Ricci et al. 2010). Erreichen die Systeme dabei eine gute Passung mit den Vorlieben des Nutzers, können sie den Interaktionsaufwand und die kognitive Belastung minimieren (Pu et al. 2011). Gängige Systeme nutzen dazu typischerweise Informationen über den Nutzer, die entweder implizit, z. B. durch Analyse des Browsing-Verhaltens, oder explizit, z. B. durch die Vergabe von Bewertungen, erhoben wurden (Ricci et al. 2010). Dabei mangelt es jedoch zumeist an Transparenz hinsichtlich der Ursachen für die gezeigten Empfehlungen (Tintarev & Mastoff 2010). Außerdem haben Nutzer in der Regel keine oder nur begrenzte Möglichkeiten, die Empfehlungsgenerierung zu beeinflussen und Kontrolle auszuüben, obwohl sich gezeigt hat, dass Nutzer eine aktivere Rolle im Empfehlungsprozess wünschen (Xiao & Bensabat 2007), und dafür sogar weniger präzise Empfehlungen sowie zusätzlichen Aufwand in Kauf nehmen (Konstan & Riedl 2012). Zugleich existiert das Problem, Nutzer zu motivieren dem System ihre Präferenzen mitzuteilen,

124 Johannes Kunkel, Benedikt Loepp, Jürgen Ziegler2 3D-Visualisierung zur Eingabe von Präferenzen in Empfehlungssystemen damit insbesondere neuen Nutzern in sogenannten Kaltstartsituationen möglichst schnell adäquate Vorschläge gemacht werden können. Auch können Nutzer aus Datenschutzgründen Bedenken haben, ihr Interessenprofil einem externen Anbieter preiszugeben. Es besteht deshalb Bedarf an Verfahren, die Nutzern eine intuitive, wenig aufwändige und transparente Angabe von Präferenzen ermöglichen. Dieser Beitrag stellt ein interaktives Empfehlungssystem vor, bei dem Nutzer ihre Präferenzen in einer dreidimensionalen Visualisierung des Produktraums eingeben können. Zu diesem Zweck wird aus der Gesamtmenge vorhandener Nutzerbewertungen eine Anordnung der Items auf einer Ebene berechnet, bei der ohne Hinzunahme inhaltlichen Wissens die bewertungsbasierte Ähnlichkeit zwischen Items in räumliche Nähe abgebildet wird. Ist bereits ein Profil des aktuellen Nutzers vorhanden, werden dessen individuelle Präferenzen in Form von Bergen und Tälern in der dritten Dimension dargestellt. In einer Kaltstartsituation ist die Landschaft hingegen zunächst planar. In beiden Fällen kann die Landschaft dann mit Hilfe verschiedener Interaktionsmöglichkeiten verändert werden, um dem System die eigenen Präferenzen zu vermitteln. Nach solchen Änderungen am Präferenzprofil werden die Empfehlungen unmittelbar neu berechnet und angezeigt. Neben der Möglichkeit zur Einflussaufnahme auf den Empfehlungsprozess, hilft die Darstellung als Landschaft das Verständnis für das Zustandekommen der Vorschläge sowie die Nachvollziehbarkeit des im System hinterlegten Nutzerprofils zu verbessern.

2

Visualisierungen in Empfehlungssystemen

Lange Zeit war die Forschung zu Empfehlungssystemen auf die Verbesserung der Empfehlungsalgorithmen konzentriert. Weitere Optimierungen in dieser Hinsicht versprechen jedoch nur noch marginale Steigerungen der vom Nutzer wahrgenommenen Empfehlungsgüte (Pu et al. 2011). Zuletzt rückten deshalb nutzerzentrierte Fragestellungen stärker in den Fokus, z. B. hinsichtlich der Präsentation von Empfehlungen und der Interaktion mit den Systemen (Knijnenburg et al. 2012; Konstan & Riedl 2012). Viele Empfehlungssysteme beschränken sich zur Eingabe von Präferenzen allerdings darauf, den Nutzer Items bewerten zu lassen – z. B. mit Hilfe einer 5-stufigen, durch Sterne dargestellten Skala (Ricci et al. 2010). Diese Vergabe von Bewertungen erfolgt häufig losgelöst vom Empfehlungsprozess, so dass der Nutzer kein unmittelbares Feedback über die Auswirkungen seiner Aktionen erhält. Auch lassen sich meist nur einzelne Items bewerten, und damit nur diesen gegenüber die persönlichen Vorlieben ausdrücken. Tag-basierte Ansätze wie MovieTuner (Vig et al. 2011) gestatten dem Nutzer zwar auch in größerem Umfang Präferenzen anzugeben − gezielt Items aus einem ganzen Bereich des Produktraums auf- oder abzuwerten ist jedoch nicht möglich. Das interaktive Empfehlungssystem MyMovieMixer (Loepp et al. 2015) erlaubt dem Nutzer eine feingranulare Definition seiner Präferenzen gemäß unterschiedlicher Kriterien, benötigt hierfür aber ebenfalls inhaltliche Zusatzinformationen über die Items. Die resultierenden Empfehlungen werden unmittelbar angezeigt und verschiedene einfache Visualisierungen helfen zu verstehen, wie sich die Interaktion auswirkt und welche Kriterien in der Ergebnismenge erfüllt werden konnten.

3D-Visualisierung 3D-Visualisierung zur zur Eingabe Eingabe von von Präferenzen Präferenzen in in Empfehlungssystemen Empfehlungssystemen

1253

Im Bereich der Informationsvisualisierung (Heer et al. 2010), aber auch speziell im Information Retrieval (Hearst 2009), existieren verschiedenste Ansätze um große Datenmengen anschaulich aufzubereiten – etwa um das Browsing in Dokumentenkollektionen zu erleichtern. In Empfehlungssystemen ist die Unterstützung durch geeignete Visualisierungen hingegen bisher wenig ausgeprägt und beschränkt sich meist auf spezielle Zwecke, etwa um in Form mengenbasierter Diagramme die Herkunft generierter Empfehlungen in hybriden Systemen zu verdeutlichen (Verbert et al. 2014). Komplexere Visualisierungen erlauben mitunter auch die Exploration des gesamten Datensatzes, etwa durch Verwendung von Landkarten-Metaphern (Gansner et al. 2009). Solche kartenbasierten Darstellungen lassen sich mit verschiedenen Techniken erzeugen (Kagie et al. 2010), wobei Multidimensional Scaling besonders hervorzuheben ist. Bei diesem Verfahren werden Ähnlichkeiten zwischen Items derart in einen niedrigdimensionalen Raum abgebildet, dass die Entfernungen in der erzeugten Darstellung die Ähnlichkeiten der Items so genau wie möglich widerspiegeln. Auch Gansner et al. (2009) nennen diese Technik und stellen mit TV-Land ein Empfehlungssystem vor, das einen gesamten Produktraum von Fernsehsendungen visualisiert. Thematisch zusammenhängende Sendungen werden in der Karte durch Regionen, und die Bereiche, in denen die empfohlenen Items liegen, durch farbliche Markierungen hervorgehoben. Durch den Einsatz von Collaborative Filtering zur Empfehlungsgenerierung sind dazu ausschließlich Nutzerbewertungen und keine zusätzlichen Metadaten erforderlich. Gansner et al. verwenden hierzu die weit verbreitete Matrix Factorization (Koren et al. 2009). Während somit ein exploratives Vorgehen unterstützt wird, fehlt die Möglichkeit, das im System hinterlegte Profil des Nutzers anzuzeigen, so dass dieser es im Verhältnis zur gesamten Datenbasis oder den gezeigten Empfehlungen besser nachvollziehen könnte. Moin (2014) stellt Personalized Item Maps vor, welche sowohl die Position des Nutzers als auch die umliegenden Items im Produktraum visualisieren. Der Nutzer erlangt somit Einblick in sein Profil, allerdings ist dazu eine Anpassung der gängigen Matrix-FactorizationAlgorithmen notwendig und eine Evaluation z. B. durch Nutzerstudien fehlt bislang. Ein wesentlicher Nachteil existierender Visualisierungen ist, dass sie zumeist nur Ausgaben darstellen und dem Nutzer keine oder nur eingeschränkte Interaktionsmöglichkeiten bieten, um etwa direkten Einfluss auf die Empfehlungsgenerierung zu nehmen. SmallWorlds (Gretarsson et al. 2010) ist ein Beispiel dafür, wie sich komplexe Visualisierungen verwenden lassen, um dem Nutzer nicht nur zu helfen, Beziehungen zwischen Items und dem eigenen Nutzerprofil zu verstehen, sondern diese auch zu manipulieren. Allerdings bietet der Ansatz keinen Überblick über die gesamte Datenbasis und ist auf bestimmte Daten (Graphen aus sozialen Netzen) angewiesen. Den vorgestellten Ansätzen ist zudem gemein, dass sie sich auf zweidimensionale Darstellungen beschränken. Des Weiteren können systemgenerierte Erklärungen der angezeigten Empfehlungen hilfreich sein, um deren Zustandekommen zu erläutern und die Transparenz der Systeme im Allgemeinen zu verbessern. Meist beschränkt sich ihr Einsatz jedoch auf textbasierte Varianten (Tintarev & Masthoff 2010). Zusammenfassend lässt sich somit festhalten, dass die Generierung einer dreidimensionalen Visualisierung, die einerseits die Exploration der Datenbasis ermöglicht und zugleich das aktuelle Nutzerprofil verständlich darstellt, andererseits eine interaktive Eingabe der persönlichen Präferenzen über die Bewertung einzelner Items hinausgehend gestattet, ein vielversprechendes Ziel zu sein scheint.

126 Johannes Kunkel, Benedikt Loepp, Jürgen Ziegler4 3D-Visualisierung zur Eingabe von Präferenzen in Empfehlungssystemen

3

3D-Visualisierung zur Eingabe von Präferenzen

Um das im Folgenden beschriebene Konzept einer visuell-unterstützten Erstellung und Anpassung von Präferenzprofilen umzusetzen, wurde eine prototypische Web-Anwendung implementiert, die es Nutzern zum einen erlaubt das im Empfehlungssystem hinterlegte Nutzerprofil in visueller Form zu betrachten, zum anderen aber auch, es interaktiv anzupassen. Als Grundlage diente der MovieLens-10M-Datensatz1, der über 10 Mio. Bewertungen für etwa 10 000 Filme abgegeben von ca. 72 000 Nutzern enthält. Weder für die Positionierung der Items noch für die Darstellung des Nutzerprofils wurden weitere inhaltliche Daten hinzugezogen. Lediglich zur Anzeige zusätzlicher Informationen in der grafischen Oberfläche (z. B. Filmplakat, Erscheinungsjahr und Regisseur) wurden weitere Metadaten verwendet.

3.1 Positionierung und Auswahl repräsentativer Items Um die Items der Datenbasis auf einer zweidimensionalen Karte abzubilden, werden drei Schritte durchlaufen (Abbildung 1, oben). Zunächst werden anhand der Bewertungen aller Nutzer Ähnlichkeiten zwischen den Items berechnet. Für diese Berechnung können prinzipiell verschiedene Verfahren genutzt werden. Wir verwenden Matrix Factorization (Koren et al. 2009), ein weit verbreitetes Collaborative-Filtering-Verfahren, welches demnach keine inhaltlichen Daten benötigt und zudem eine hohe Präzision aufweist: Aus sämtlichen Item-Bewertungen von allen im Datensatz vorhandenen Nutzern werden dabei automatisiert latente Faktoren abgeleitet, welche Nutzer bzw. Items gemäß mehr oder weniger offensichtlicher Eigenschaften charakterisieren. Die Ausprägung dieser Faktoren für jeden Nutzer und jedes Item liegt dann als Vektor vor. Die Vorhersage �̂�� , die ausdrückt, wie Nutzer � das Item � bewerten würde, wird über das Skalarprodukt des Nutzervektors ��� und des Item-Vektors ��� gebildet. Äquivalent dazu lassen sich auch die Vorhersagen �̂� des Nutzers � für sämtliche Items ermitteln (Multiplikation mit den Vektoren aller Items �; Gleichung 1). (1) �̂� = � ∙ ��� Um nun eine zweidimensionale, nutzerübergreifende Anordnung der Items zu generieren, wird deren Ähnlichkeit gemäß der latenten Faktoren bestimmt. Hierzu wird die euklidische Distanz zwischen den Item-Vektoren ��� berechnet. Die Ähnlichkeiten werden dann herangezogen, um mittels des bereits erwähnten Multidimensional Scaling (Kagie et al. 2010) Koordinaten für die Items zu erhalten. So wird sichergestellt, dass die Ähnlichkeiten zwischen den Items durch deren Entfernung in der resultierenden Darstellung möglichst akkurat abgebildet werden. Prinzipiell könnte nun unmittelbar die Darstellung der Items in der Karte erfolgen, was jedoch aufgrund ihrer Anzahl (nach Bereinigung um wenig bewertete Items noch mehr als 3 000) zu einer unübersichtlichen Darstellung führen würde. Als zusätzlicher Schritt zur Datenreduktion wird der Item-Raum daher mittels k-means-Clustering aufgeteilt. Aus jedem Cluster wird dann

1

http://grouplens.org/datasets/movielens/

3D-Visualisierung 3D-Visualisierung zur zur Eingabe Eingabe von von Präferenzen Präferenzen in in Empfehlungssystemen Empfehlungssystemen Item × Item Ähnlichkeiten

Items mit (x,y)-Koordinaten

Nutzer × Item Bewertungen Systemkontrolle

1275

Karte mit 3D-Höhendarstellung Vorhersagen

Höhenwerte

Nutzerkontrolle

Abbildung 1: Schematische Darstellung des Datenflusses angelehnt an das Referenzmodell der Informationsvisualisierung (Card et al. 1999): Zum einen werden allgemeine Item-Ähnlichkeiten auf einer Karte dargestellt (oben), zum anderen die Präferenzen des aktuellen Nutzers in ein Höhenprofil transformiert (unten).

eines der populärsten Items gewählt, das exemplarisch als Repräsentant für diesen Bereich in der Karte angezeigt wird. Versuche mit Testpersonen zeigten, dass die Menge angezeigter Items so ca. um den Faktor 100 reduziert werden konnte, ohne ihre Aussagekraft zu reduzieren.

3.2 Visualisierung von Nutzerprofil und Empfehlungen Die generierte zweidimensionale Karte, d. h., die Positionierung der Items, ist unabhängig vom betrachteten Nutzerprofil sondern spiegelt allgemeine Beziehungen zwischen den Items wider. Das Profil des aktuellen Nutzers, also seine Präferenzen, wirkt sich hingegen auf das Höhenprofil der Landschaft aus. Als Ausgangspunkt für die Berechnung dieses Höhenprofils dienen erneut ausschließlich Bewertungsdaten (Abbildung 1, unten): Wie in herkömmlichen Empfehlungssystemen werden anhand der vorhandenen Bewertungen des aktuellen Nutzers Vorhersagen für die noch nicht bewerteten Items approximiert, indem sein Nutzervektor ‫݌‬Ԧ௨ mit den Vektoren aller Items ܳ multipliziert wird (vgl. Gleichung 1). Diese Bewertungsvorhersagen werden im Anschluss in Höhenwerte überführt, welche zusammen mit den Positionen aller Items zur Darstellung der Berge und Täler in der Landschaft genutzt werden. Somit wird eine Landschaft generiert, bei der die Positionierung der Items ihrer generellen Ähnlichkeit, das Höhenprofil jedoch den individuellen Präferenzen des aktuellen Nutzers entspricht. Zusätzlich zu den somit durch die Berge dargestellten allgemeinen Vorlieben des Nutzers (Bereiche, in denen für die Items hohe Bewertungen vorhergesagt wurden), werden auch die konkreten Topn-Empfehlungen in der Karte farbig umrandet und in einer Liste am unteren Bildschirmrand angezeigt (Abbildung 2).

3.3 Interaktive Exploration und Präferenzmodellierung Um die generierte Landschaft interaktiv zu explorieren, bietet die Anwendung verschiedene Explorationswerkzeuge (Abbildung 2, oben links): Die Landschaft kann im virtuellen Raum rotiert, bewegt und hinein- bzw. hinausgezoomt werden. Sollten die repräsentativ dargestellten Items für eine Orientierung nicht ausreichen oder dem Nutzer unbekannt sein, ist es darüber hinaus möglich per Mausklick auf eine freie Fläche weitere, in dem jeweiligen Bereich positionierte Items anzuzeigen. Zugunsten der Übersicht können Items auch jederzeit wieder von der Karte entfernt werden. Inspiriert wurde dieses Verhalten von Stappers et al. (2000).

128 Johannes Kunkel, Benedikt Loepp, Jürgen Ziegler6 3D-Visualisierung zur Eingabe von Präferenzen in Empfehlungssystemen

Abbildung 2: Für den Druck optimierter Screenshot, der das Profil eines Nutzers zeigt, das von den Höhen der Landschaft repräsentiert wird: Oben links kann u. a. das Modellierungswerkzeug selektiert werden, so dass sich per Maus (Schaufel) Berge und Täler formen lassen, um Präferenzen auszudrücken. Generierte Empfehlungen werden blau umrandet sowie in einer Liste (unten) dargestellt; rechts werden zudem Details eines gewählten Films gezeigt.

Neben diesen die Exploration von Datenbasis, Nutzerprofil und Empfehlungsmenge unterstützenden Möglichkeiten lässt sich außerdem mit einem Modellierungswerkzeug die Landschaft anpassen, um Einfluss auf das persönliche Präferenzprofil und damit unmittelbar auf die Empfehlung von potenziell interessanten Items nehmen zu können. Alternativ zu der Option ein existierendes Profil als Grundlage für weitere Anpassungen zu verwenden, kann in einer Kaltstartsituation mit einer flachen Landschaft begonnen werden (alle Höhenwerte initial auf neutralem Niveau). In beiden Fällen lässt sich nach Auswahl des Werkzeugs das Höhenprofil mit Hilfe der Maus modellieren. Indem der Nutzer Berge und Täler formt, kann er dem System mitteilen, welche Bereiche von Items er innerhalb des Produktraums bevorzugt oder eher weniger mag. Unabhängig davon, welche Items momentan auf der Karte dargestellt werden, wirkt sich diese Präferenzmodellierung dabei für den aktuellen Nutzer auf die gesamte Datenbasis aus: Durch die Modellierung verändert der Nutzer die zuvor für die Höhen verantwortlichen Vorhersagewerte �̂� für sämtliche Items, was in neuen Präferenzwerten �� resultiert. Dies führt zu einer Anpassung seines in den Empfehlungsprozess eingehenden Nutzervektors ��� . Algorithmisch wird hierzu Gleichung 1 mittels Singulärwertzerlegung nach ��� aufgelöst, um dann die gemäß des angepassten Höhenprofils veränderten Werte �� zur Neuberechnung des Nutzervektors heranzuziehen (Gleichung 2). (2) ��� = � � ∙ �� Somit wird ein neuer Nutzervektor approximiert, der wiederum für die Empfehlungsgenerierung gemäß Gleichung 1 verwendet werden kann. Dies geschieht entweder explizit auf Wunsch des Nutzers („Apply“-Button) oder bei aktiviertem „Auto-Modus“ kontinuierlich (vgl. Abbildung 2). Da sich durch die Empfehlungsgenerierung sämtliche Vorhersagewerte verändern, werden in Folge auch das Höhenprofil gemäß des in Abschnitt 3.2 gezeigten Vorgehens sowie die dargestellte Empfehlungsmenge aktualisiert. Die resultierende Anpassung der Landschaft ermöglicht dem Nutzer unmittelbar nachzuvollziehen, wie sich sein Profil durch seine getätigten Aktionen im System verändert.

3D-Visualisierung 3D-Visualisierung zur zur Eingabe Eingabe von von Präferenzen Präferenzen in in Empfehlungssystemen Empfehlungssystemen

4

1297

Evaluation

In einer Nutzerstudie wurde das System hinsichtlich seiner Eignung zur Steuerung der Empfehlungsgenerierung untersucht. Dabei standen die Fragen im Vordergrund, ob die generierte Landschaft verständlich und hilfreich ist, und ob deren Modellierung ein geeignetes Interaktionsmittel für den Nutzer darstellt, um seine Präferenzen anzugeben. Des Weiteren sollten die Faktoren User Experience und Empfehlungsqualität empirisch evaluiert werden.

4.1 Studienaufbau und Datenerhebung Wir baten 32 Probanden (10 davon weiblich) mit einem Durchschnittsalter von 24.22 Jahren (σ=3.61), die in einem gängigen Webbrowser laufende Anwendung im Rahmen einer Laborstudie zu nutzen und dabei folgende Aufgaben zu erledigen: 1. Exploration: Die Nutzer wurden gebeten mit Hilfe der Explorationswerkzeuge in maximal jeweils drei Minuten drei Filme in der Landschaft zu finden, die bestimmte Kriterien erfüllten: 1.1) populäre Filme (mehr als 30 000 Bewertungen), 1.2) kinderfreundliche Filme, 1.3) Filme des Regisseurs Quentin Tarantino. Empfehlungen wurden nicht gezeigt. 2. Präferenzerhebung in Kaltstartsituationen: Die Probanden wurden gebeten, mit dem Modellierungswerkzeug eine flache Landschaft gemäß ihrer Präferenzen zu verformen, woraufhin vom System ein neues, diesen Eingaben entsprechendes Nutzerprofil generiert, und als neue Landschaft mit passenden Empfehlungen visualisiert wurde. 3. Anpassung bestehender Nutzerprofile: Den Probanden wurde jeweils eines von drei exemplarisch von uns ausgewählten, bestehenden Profilen aus dem Datensatz gezeigt, welches sie daraufhin in kontinuierlicher Interaktion so verändern sollten, dass die Empfehlungen eher dem eigenen Geschmack entsprachen. Die Probanden wurden außerdem gebeten, einen Fragebogen auszufüllen: Vorab sollten Angaben zu Demografie, Domänenkenntnis und Nutzungsgewohnheiten hinsichtlich 3D-Anwendungen gemacht werden. Nach Aufgabe 2 und 3 sollten die Empfehlungsqualität, die Effizienz des Systems und die Transparenz der Empfehlungsgenerierung eingeschätzt werden (mit Hilfe von Items von Knijnenburg et al. (2012) und Pu et al. (2011)). Zusätzlich wurden selbstgenerierte Items zu den Möglichkeiten Kontrolle auszuüben, der Nutzungsabsicht und insbesondere zu den systemspezifischen Funktionalitäten (u. a. in Bezug auf Verständlichkeit der Landschaft und Nützlichkeit des Modellierungswerkzeugs) verwendet. Abschließend setzten wir den System Usability Scale (SUS; Brooke 1996) und den User Experience Questionnaire (UEQ; Laugwitz et al. 2008) ein. Um den generellen Nutzen des Systems, Motivation und Spaß bei dessen Verwendung sowie das Interesse der Nutzer zu evaluieren, verwendeten wir darüber hinaus Subskalen des Intrinsic Motivation Inventory (IMI; Ryan 1982). Bis auf bei UEQ (7-stufige bipolare Skala) und IMI (7-stufige Likert-Skala) wurden sämtliche Items auf einer positiven 5-stufigen Likert-Skala (1−5) erhoben. Mit Hilfe von Logdateien erfassten wir zudem das Interaktionsverhalten und die jeweilige Aufgabendauer.

130 Johannes Kunkel, Benedikt Loepp, Jürgen Ziegler8 3D-Visualisierung zur Eingabe von Präferenzen in Empfehlungssystemen

4.2 Ergebnisse Die Versuchsteilnehmer gaben an, Filme zu mögen (M=3.91, σ=0.78) und kannten sich durchschnittlich gut mit Filmen aus (M=3.00, σ=0.95). 3D-Anwendungen wurden nur mäßig (Spiele: M=2.25, σ=1.41) bis kaum (professionelle Werkzeuge: M=1.41, σ=0.61) genutzt. Bei der Explorationsaufgabe (Aufgabe 1) zeigte sich, dass das System wie erwartet besonders gut geeignet zu sein scheint, um Filme gemäß „weicher“ Kriterien zu finden. So konnte die Aufgabe, in drei Minuten drei Filme des Regisseurs Quentin Tarantino zu finden, nur von 56 % der Probanden erfolgreich absolviert werden. 88 % der Probanden gelang es hingegen, besonders populäre Filme zu finden. Die Aufgabe, drei kinderfreundliche Filme zu finden, wurde von sämtlichen Probanden im Mittel in 1.12 Minuten (σ=0.57) erfolgreich gelöst. Tabelle 1 zeigt die nach Aufgabe 2 und 3 im weiteren Verlauf der Studie mit Hilfe von Fragebogen-Items ermittelten subjektiven Einschätzungen der Probanden. Aufgabe 2 Empfehlungsqualität

M 3.57

Aufgabe 3 σ 0.89

M 3.89

σ 0.60

Empfundener Aufwand

3.75

0.76

3.21

0.93

Kontrolle

3.94

1.05

3.75

1.11

Transparenz der Empfehlungen

3.91

1.09

3.63

1.07

Verständlichkeit der Landschaft

3.94

0.91

3.41

1.04

Tabelle 1: Subjektive Beurteilung der Empfehlungen und des Systems nach Aufgabe 2 und 3.

Unterschiede zwischen Aufgabe 2 und 3 zeigten sich bei Signifikanztests nur hinsichtlich des empfundenen Aufwandes (t(31)=3.76, p