Imagination und Animation: Die Herstellung mentaler Räume durch animierte Rede 9783110237801, 9783110237795

Imagination in conversations: This book explores a mental phenomenon from a conversation analytic perspective. It analys

166 68 14MB

German Pages 483 [488] Year 2011

Report DMCA / Copyright

DOWNLOAD PDF FILE

Table of contents :
Danksagung
Inhalt
1 Einleitung
1.1 Gegenstand und Fragestellungen
1.2 Daten
1.3 Auffassungen zur gesprochenen Sprache
2 Imagination als konversationelle Herstellung mentaler Räume
2.1 Imagination und mentale Versetzung
2.1.1 Wahrnehmungssituation, Phantasieszene und Origoverschiebung
2.1.2 Bewusstseinsmodi
2.1.3 Wirklichkeitsbereiche und Interaktionsmodalität
2.1.4 Wahrnehmung und Performance
2.1.5 Zusammenfassung: Imagination und mentale Versetzung
2.2 Mentale Räume: Ansatz zu einem semantisch-kognitiven Modell der Imagination
2.2.1 Einleitung: Kognitive Linguistik und Kognitive Semantik
2.2.2 Die Theorie mentaler Räume
2.2.3 Mentale Räume und Kognitive Grammatik
2.2.4 Zusammenfassung: Mentale Räume
2.3 Mentale Räume in der Interaktion
2.3.1 Autonome und gemeinsame Kognition
2.3.2 Mentale Räume und Diskurs
2.3.3 Verbindung von kognitiver Linguistik und Konversationsanalyse
2.3.4 Zwischenbilanz: kein prä-existenter Text
2.3.5 Typen mentaler Räume im Gespräch
3 Animierte Rede
3.1 Einleitung: Von der Redewiedergabe zur animierten Rede
3.2 Theoretische Modellierung animierter Rede
3.2.1 Einbettung einer Figur
3.2.2 Übernahme einer Perspektive
3.2.3 Demonstrieren einer Handlung
3.2.4 Arbeitsdefinition animierte Rede
3.3 Kontextualisierung animierter Rede und körperliche Repräsentation mentaler Räume
3.3.1 Verbale und prosodische Mittel der Kontextualisierung animierter Rede
3.3.2 Körperliche Konstitution mentaler Räume
3.3.3 Grade der Expressivität in Figurenanimationen
3.4 Wechsel vom Symbolisieren ins Demonstrieren in lokalen Wiederholungen
3.4.1 Ausgedehnte Wiederholungen und allmähliche Wechsel
3.4.2 Minimale Wiederholungen und direkte Wechsel
3.4.3 Ergebnisse
4 Entwerfen und Fiktionalisieren
4.1 Einleitung: Begriffliche Abgrenzung von Entwerfen und Fiktionalisieren
4.2 Entwerfen von Handlungen
4.2.1 Beispielanalysen
4.2.2 Ergebnisse
4.3 Fiktionalisieren
4.3.1 Theoretische Vorbemerkungen
4.3.2 Aufbau fiktionaler Räume
4.3.3 Gestaltung fiktionaler Räume durch Blending
4.3.4 Der Einsatz multimodaler Mittel in Fiktionalisierungen
4.4 Ergebnisse
5 Evozieren mentaler Räume
5.1 Einleitung
5.2 Animation in grammatischen Konstruktionen
5.2.1 Vorbemerkung: Konstruktionsgrammatik
5.2.2 Beispielanalysen
5.2.3 Ergebnisse
5.3 Imagination von Identitäten und Positionierung
5.3.1 Vorbemerkung: Das Konzept der Positionierung
5.3.2 Positionierung durch animierte Äußerungen
5.3.3 Positionierung durch negierte animierte Äußerungen
5.3.4 Verwendung animierter Rede in Positionierungskonstruktionen
5.3.5 Ergebnisse
6 Zusammenfassung
7 Literaturverzeichnis
8 Anhang
8.1 Transkriptionskonventionen
8.2 Internetrecherche: das Gefühl + Animierte Rede
8.3 Kontexte von cosa de im Korpus
8.4 Internetrecherche: es ist nicht so, dass ich sage + Animierte Rede
8.5 Sequenz 44: juntando plata (›Geld sparen‹)
8.6 Sequenzübersicht
Recommend Papers

Imagination und Animation: Die Herstellung mentaler Räume durch animierte Rede
 9783110237801, 9783110237795

  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

Oliver Ehmer Imagination und Animation linguae & litterae

7

linguae & litterae Publications of the School of Language & Literature Freiburg Institute for Advanced Studies

Edited by

Peter Auer · Gesa von Essen · Werner Frick Editorial Board Michel Espagne (Paris) · Marino Freschi (Rom) Erika Greber (Erlangen) · Ekkehard König (Berlin) Per Linell (Linköping) · Angelika Linke (Zürich) Christine Maillard (Strasbourg) · Pieter Muysken (Nijmegen) Wolfgang Raible (Freiburg) Editorial Assistant Aniela Knoblich

7

De Gruyter

Oliver Ehmer

Imagination und Animation Die Herstellung mentaler Räume durch animierte Rede

De Gruyter

Die vorliegende Untersuchung wurde 2010 mit dem Forschungspreis der FRIAS School of Language & Literature ausgezeichnet.

ISBN 978-3-11-023779-5 e-ISBN 978-3-11-023780-1 ISSN 1869-7054 Library of Congress Cataloging-in-Publication Data Ehmer, Oliver, 1976Imagination und Animation : Die Herstellung mentaler Räume durch animierte Rede / by Oliver Ehmer. p. cm. - (Linguae & litterae ; 7) Includes bibliographical references. ISBN 978-3-11-023779-5 (alk. paper) 1. Conversation analysis. 2. Imagination. I. Title. P95.45.E36 2011 302.3146-dc22 2010050356

Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. 쑔 2011 Walter de Gruyter GmbH & Co. KG, Berlin/New York Druck: Hubert & Co. GmbH & Co. KG, Göttingen ⬁ Gedruckt auf säurefreiem Papier Printed in Germany www.degruyter.com

Danksagung Für die Erstellung dieser Arbeit habe ich im Lauf der Zeit von vielerlei Seite Unterstützung erfahren. Mein besonderer Dank geht an meine Lehrer Stefan Pfänder und Peter Auer, die mich über die Jahre hinweg begleitet haben. Stets konnte ich mich auf ihren fachlichen Rat, die kritische und anregende Auseinandersetzung mit meinen Analysen und Gedanken, ihre Bestätigung und persönliche Unterstützung verlassen. Mit zu den fruchtbarsten und fröhlichsten Gesprächen zählen für mich die Datensitzungen und Diskussionen mit Karin Birkner, Anja Stukenbrock und Anne-Maria Stresing. Ich danke Euch! Die Erhebung des spanischsprachigen Teilkorpus in Argentinien war nur durch die Hilfe von Graciela Wamba und ihrem Lehrstuhlteam, vor allem Diana Krakovic, Valeria Fernandez und Facundo Saxe möglich, denen mein herzlicher Dank gebührt. Für die Hilfe bei der Transkription und ethnographische Auskünfte bedanke ich mich bei Guadalupe Acosta, Milagros Malak und Facundo Saxe. Dass meine beiden Feldforschungsaufenthalte in Argentinien so wunderbar waren, verdanke ich vor allem Hugo Moreno und Pablo Gallego in Buenos Aires. Ebenso bedanke ich mich sehr bei allen, die für mich Gesprächsaufnahmen gemacht haben und die an dieser Stelle nicht namentlich erwähnt werden können. Ihr wisst, wer ihr seid. Für linguistische Hinweise bedanke ich mich besonders bei Ines Bose, Daniel Jacob, Helga Kotthoff, Lorenza Mondada und Wolfgang Raible. Ich danke auch Heiner Apel, Philipp Dankel, Marco García García, Alexandra Groß, Karin Madlener, Manuel Majocchi, Josefine Méndez, Michaela Volz, Soledad Pereyra, Malte Rosemeyer, Fine Scherf, Bernd Schlipphak, Marie Skrovec und Dirk Vetter. Für die in jeder Hinsicht großzügige Promotionsförderung bedanke ich mich bei der Studienstiftung des Deutschen Volkes, die die Durchführung dieser Arbeit erst ermöglicht hat. Ebenso danke ich der Wissenschaftlichen Gesellschaft der Universität Freiburg für die finanzielle Unterstützung bei der Korpuserstellung und beim Verein für Gesprächsforschung, dem Verband der Freunde der Universität Freiburg sowie dem Freiburg Institute for Advanced Studies für die mir über ihre Preise zuteil gewordene Unterstützung. Für ihr Vertrauen in mich und ihre liebende Unterstützung danke ich von Herzen meiner Frau Angela Soler, die immer für mich da war, und meiner Familie Helga, Wolfgang und Melanie Ehmer. Freiburg im Breisgau, September 2010

Oliver Ehmer

Inhalt

VII

Inhalt

1

Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . .

1

1.1 1.2 1.3

Gegenstand und Fragestellungen . . . . . . . . . . . . . . . . . . . Daten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Auffassungen zur gesprochenen Sprache . . . . . . . . . . . . . . .

1 2 5

2

Imagination als konversationelle Herstellung mentaler Räume . . . . . . . . . . . . . . . . . . . . . . . .

13

2.1 Imagination und mentale Versetzung . . . . . . . . . . . . . 2.1.1 Wahrnehmungssituation, Phantasieszene und Origoverschiebung . . . . . . . . . . . . . . . . . . . . 2.1.2 Bewusstseinsmodi . . . . . . . . . . . . . . . . . . . . 2.1.3 Wirklichkeitsbereiche und Interaktionsmodalität . . . . 2.1.4 Wahrnehmung und Performance . . . . . . . . . . . . . 2.1.5 Zusammenfassung: Imagination und mentale Versetzung 2.2 Mentale Räume: Ansatz zu einem semantisch-kognitiven Modell der Imagination . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Einleitung: Kognitive Linguistik und Kognitive Semantik 2.2.2 Die Theorie mentaler Räume . . . . . . . . . . . . . . . 2.2.3 Mentale Räume und Kognitive Grammatik . . . . . . . 2.2.4 Zusammenfassung: Mentale Räume . . . . . . . . . . . 2.3 Mentale Räume in der Interaktion . . . . . . . . . . . . . . 2.3.1 Autonome und gemeinsame Kognition . . . . . . . . . 2.3.2 Mentale Räume und Diskurs . . . . . . . . . . . . . . . 2.3.3 Verbindung von kognitiver Linguistik und Konversationsanalyse . . . . . . . . . . . . . . . . . . . 2.3.4 Zwischenbilanz: kein prä-existenter Text . . . . . . . . . 2.3.5 Typen mentaler Räume im Gespräch . . . . . . . . . . .

. . .

15

. . . . .

. . . . .

. . . . .

15 18 22 26 29

. . . . . . . .

. . . . . . . .

. . . . . . . .

29 30 32 39 45 46 47 48

. . . . . . . . .

51 55 56

3

Animierte Rede . . . . . . . . . . . . . . . . . . . . . . . .

60

3.1 3.2 3.2.1 3.2.2

Einleitung: Von der Redewiedergabe zur animierten Rede Theoretische Modellierung animierter Rede . . . . . . . Einbettung einer Figur . . . . . . . . . . . . . . Übernahme einer Perspektive . . . . . . . . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

60 63 64 67

Inhalt

VIII

3.2.3 Demonstrieren einer Handlung . . . . . . . . . . . . . . . . 71 3.2.4 Arbeitsdefinition animierte Rede . . . . . . . . . . . . . . . . 77 3.3 Kontextualisierung animierter Rede und körperliche Repräsentation mentaler Räume . . . . . . . . . . . . . . . . . . . . . . . . . . 78 3.3.1 Verbale und prosodische Mittel der Kontextualisierung animierter Rede . . . . . . . . . . . . . . . . . . . . . . . . . 78 3.3.2 Körperliche Konstitution mentaler Räume . . . . . . . . . . 84 3.3.3 Grade der Expressivität in Figurenanimationen . . . . . . . . 98 3.4 Wechsel vom Symbolisieren ins Demonstrieren in lokalen Wiederholungen 99 3.4.1 Ausgedehnte Wiederholungen und allmähliche Wechsel . . . . 101 3.4.2 Minimale Wiederholungen und direkte Wechsel . . . . . . . . 115 3.4.3 Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

4

Entwerfen und Fiktionalisieren . . . . . . . . . . . . . . . 124

4.1 4.2 4.2.1 4.2.2 4.3 4.3.1 4.3.2 4.3.3 4.3.4 4.4

Einleitung: Begriffliche Abgrenzung von Entwerfen und Fiktionalisieren . Entwerfen von Handlungen . . . . . . . . . . . . . . . . . . . . Beispielanalysen . . . . . . . . . . . . . . . . . . . . . . . . Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . Fiktionalisieren . . . . . . . . . . . . . . . . . . . . . . . . . . Theoretische Vorbemerkungen . . . . . . . . . . . . . . . . Aufbau fiktionaler Räume . . . . . . . . . . . . . . . . . . . Gestaltung fiktionaler Räume durch Blending . . . . . . . . . Der Einsatz multimodaler Mittel in Fiktionalisierungen . . . . Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5

Evozieren mentaler Räume . . . . . . . . . . . . . . . . . 322

5.1 5.2 5.2.1 5.2.2 5.2.3 5.3 5.3.1 5.3.2 5.3.3 5.3.4

Einleitung . . . . . . . . . . . . . . . . . . . . . . . Animation in grammatischen Konstruktionen . . . . . . . Vorbemerkung: Konstruktionsgrammatik . . . . . . Beispielanalysen . . . . . . . . . . . . . . . . . . . Ergebnisse . . . . . . . . . . . . . . . . . . . . . . Imagination von Identitäten und Positionierung . . . . . . Vorbemerkung: Das Konzept der Positionierung . . Positionierung durch animierte Äußerungen . . . . . Positionierung durch negierte animierte Äußerungen Verwendung animierter Rede in Positionierungskonstruktionen . . . . . . . . . . . . . . . . . . . . 5.3.5 Ergebnisse . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

124 126 126 158 161 162 179 221 285 319

322 324 324 328 350 353 354 360 373

. . . . . 409 . . . . . 427

Inhalt

IX

6

Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . 429

7

Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . 439

8

Anhang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 463

8.1 8.2 8.3 8.4

Transkriptionskonventionen . . . . . . . . . . . . Internetrecherche: das Gefühl + Animierte Rede Kontexte von cosa de im Korpus . . . . . . . . . . Internetrecherche: es ist nicht so, dass ich sage + Animierte Rede . . . . . . . . . . . . . . . Sequenz 44: juntando plata (›Geld sparen‹) . . . . Sequenzübersicht . . . . . . . . . . . . . . . . .

8.5 8.6

. . . . . . . . 463 . . . . . . . . 464 . . . . . . . . 466 . . . . . . . . 467 . . . . . . . . 468 . . . . . . . . 474

X

Inhalt

Gegenstand und Fragestellungen

1

Einleitung

1.1

Gegenstand und Fragestellungen

1

Die vorliegende Arbeit beschäftigt sich mit Imagination in Gesprächen. Imagination wird als der von den Gesprächsteilnehmern gemeinsam vollzogene Prozess des Aufbaus mentaler Räume verstanden. Die Arbeit fokussiert dabei insbesondere auf solche Formen der kommunikativen Herstellung mentaler Räume, in denen die Sprecher das imaginierte Geschehen im aktuellen Gespräch aufführen. Die empirische Grundlage der Arbeit bilden Gesprächssequenzen, in denen ein oder mehrere Sprecher in Form von animierter Rede die Sprechhandlung einer Figur demonstrieren. Es wurden ausschließlich solche Sequenzen gewählt, in denen die Sprecher mit der animierten Rede keine konkrete vergangene Äußerung rekonstruieren. Es handelt sich bei den analysierten Beispielen also nicht um typische Beispiele einer Rede›wiedergabe‹. Die Sprecher in den hier vorgestellten Beispielen rekonstruieren nicht einmal gehörte Äußerungen, sondern führen nicht-vergangene, potentielle Sprechsituationen auf. Diese potentiellen Sprechsituationen können generisch, zukünftig, fiktiv, hypothetisch oder negiert sein. Gemeinsam ist diesen, dass eine Figur animiert wird. Mit dieser Animation führt der Sprecher nicht nur eine Handlung im Rahmen eines als ob aus, sondern er übernimmt gleichzeitig auch die Perspektive der animierten Figur und versetzt sich mental in die imaginierte Szene. Die vorliegende Arbeit unternimmt den Versuch, den Ansatz der Interaktionalen Linguistik mit einem kognitiv-semantischen Ansatz zu verbinden. Die Aufführung von Ereignissen als ›kleine Show‹ im Sinne von Erving Goffman (1986 [1974]: 506) wird nicht lediglich als konversationelle Aktivität, sondern als Aufbau einer szenischen Vorstellung im Gespräch verstanden. Zentral ist hierbei, dass die Herstellung von Vorstellungen nicht als individuelles Phänomen gesehen wird, sondern vielmehr als gemeinsame Kognition der Gesprächspartner. Methodisch wird die Animation einer Figur als Indikator für den mentalen Aufbau einer imaginierten Szene genommen. In der Arbeit werden die folgenden übergeordneten Fragestellungen verfolgt: – Welche Formen aufgeführter mentaler Räume sind in Gesprächen zu finden?

2

Einleitung

– Auf welche Weise werden Aufführungen hergestellt? – Wie kann methodisch der Aufbau gemeinsamer Vorstellungen im Gespräch nachgewiesen werden? – Welche Funktionen erfüllt die animierte Rede im Besonderen? Bearbeitet werden diese Fragen anhand deutsch- und spanischsprachiger Daten. Eine sprachvergleichende Perspektive wird jedoch explizit nicht verfolgt. Vielmehr wird die Diversität der Daten genutzt, um den Gegenstand in verschiedenen Kontexten zu betrachten und Parallelen in den Sprachen zu finden. In den folgenden Abschnitten der Einleitung wird die Datengrundlage der vorliegenden Arbeit vorgestellt und die Grundlagen der Interaktionalen Linguistik eingeführt. In den beiden anschließenden Theoriekapiteln wird zunächst dargestellt, wie Imagination als der Aufbau mentaler Räume im Gespräch gefasst werden kann (2). Daraufhin wird auf die sprecherischen Möglichkeiten zur Gestaltung mentaler Räume eingegangen, wobei die animierte Rede und körperliche Mittel der Konstitution mentaler Räume im Vordergrund stehen (3). Im Anschluss daran werden in zwei Kapiteln empirische Analysen vorgenommen. In Kapitel 4 werden Gesprächssequenzen untersucht, in denen die Sprecher zukünftige Handlungen imaginieren (4.2) oder fiktionale Szenen aufführen (4.3). In diesen Sequenzen animieren meist mehrere Sprecher über lange Strecken des Gesprächs hinweg Figuren. Demgegenüber werden im darauf folgenden Kapitel 5 solche Beispiele untersucht, in denen vor allem ein Sprecher, oft nur sehr kurz, in Form einer einzelnen animierten Äußerung einen mentalen Raum evoziert.

1.2

Daten

Die Datengrundlage der Arbeit bilden Aufnahmen deutscher und spanischsprachiger Interaktionen. Den zentralen Bestandteil jedes Teilkorpus bilden Alltags-, insbesondere Tischgespräche. Ergänzt werden diese durch einzelne Aufnahmen aus anderen situativen Kontexten wie Interviews und medial vermittelte Interaktionen. Die beiden Teilkorpora setzen sich wie folgt zusammen. Das deutsche Teilkorpus besteht zum Großteil aus Tischgesprächen, die vom Autor oder dessen Bekannten aufgenommen wurden sowie dem Schall-Korpus (Ehmer/Pfänder). Enthalten sind Gespräche in Familien und Freundeskreisen (z. B. Gespräche in Wohngemeinschaften, gemeinsame

3

Daten Tabelle 1: Zusammensetzung der Korpora Deutsches Teilkorpus

Aufnahmejahr

Anzahl Aufnahmen

Dauer in Stunden

Ehmer

2000–2004

Audio

29

29

Sprachcorpus

2000–2002

Audio

4

2

Realitysendung Big Brother

2000

Video

25

14

Comedysendung Genial daneben

2005

Video

3

2,5

61

47,5

92 2,5

SCHALL

Summe Argentinisches Teilkorpus Sprachcorpus cespla

2006–2008

Audio Video

105 5

Interview

2008

Video

1

1

Öffentliche Rede

2006

Video

1

1

Summe

111

96,5

Urlaubsausflüge, Gespräche in einem Sportverein u. a.). Bei diesen Aufnahmen handelt es sich ausschließlich um Audioaufnahmen. Sie sind gekennzeichnet durch einen hohen Grad an Spontaneität der Teilnehmer und eine geringe Beeinflussung durch die Aufnahmesituation. Ergänzt werden diese Daten um Videoaufnahmen aus der ersten Staffel der Reality-Fernsehsendung Big Brother, wobei Sendungen aus dem letzen Drittel der Staffel ausgewählt wurden.1 Diese Daten unterscheiden sich von den zuvor genannten vor allem in der Medialität der Aufnahmesituation. Die Beteiligten sind sich darüber bewusst, dass sie aufgenommen und ihre Handlungen vom Fernsehpublikum wahrgenommen und bewertet werden, welches über ihren Erfolg in der Sendung entscheidet. Dies führt in den Interaktionen oft zu Selbststilisierungen und einem höheren Grad an Performance. Im Vergleich zu späteren Staffeln der Sendung ist dies jedoch noch vergleichsweise gering, da die Teilnehmer nicht wissen, welche Teile der Interaktionen tatsächlich gesendet 1

Das Korpus liegt an den Lehrstühlen Prof. Dr. Peter Auer (Freiburg) und Prof. Dr. Karin Birkner (Bayreuth) vor.

4

Einleitung

werden und welche die Bewertungskriterien der Zuschauer sind. Darüber hinaus sind Selbststilisierungen und -positionierungen besonders in Interaktionssequenzen deutlich, die institutionell explizit als medial relevant gekennzeichnet sind, wie z. B. Ansprachen an das Publikum oder Arbeitsaufgaben. Für die Analysen wurden deshalb solche Sequenzen gewählt, in denen dies nicht der Fall ist und die Interaktanten alltägliche Aktivitäten ausführen, die lokal und emergent von den Gesprächsteilnehmern konversationell organisiert sind.2 Zentral ist, dass es sich bei den Sprechern nicht um professionelle Schauspieler handelt. Vielmehr greifen die Sprecher auf ihr Alltagsrepertoire an Gesprächspraktiken und sprachlichen Mustern zurück, weshalb die Interaktionen – mit den genannten Einschränkungen – als Alltagsgespräche betrachtet werden. Hinzugenommen wurden drei Aufnahmen aus der Comedy-Sendung Genial daneben. In dieser Sendung entwickeln die Sprecher oft fiktionale mentale Räume und greifen dabei in einer professionalisierten Form auf eine alltägliche Gesprächsaktivität zurück. Auf die Spezifika der Professionalisierung wird an der entsprechenden Stelle in der Analyse eingegangen. Das spanischsprachige Teilkorpus besteht aus in Argentinien aufgezeichneten Interaktionen. Die Aufzeichnungen fanden im Großraum des Río de La Plata und hier hauptsächlich in Buenos Aires und La Plata statt. Sie wurden anlässlich der vorliegenden Arbeit erstellt und sind im cespla – Corpus de Conversaciones ESPontáneas Platenses (Ehmer) zusammengefasst. Die Daten wurden von Muttersprachlern in alltäglichen Situationen mit engen Bekannten erhoben.3 Es handelt sich vor allem um Tischgespräche in Freundeskreisen und Familien, wobei einige Aufnahmen in stärker institutionalisierten Kontexten (Vorbereitung einer Präsentation, Arbeitspause, Unterrichtspause, …) erstellt wurden. Von den insgesamt 105 Stunden des Korpus sind zirka 31,5 Stunden durchgängig transkribiert, was einem Umfang von ca.

2

3

Es ist auch davon auszugehen, dass bei den Interaktanten nicht über die gesamte Sendedauer von 90 Tagen und den gesamten Tag dieselbe Bewusstheit über die Aufnahmesituation vorliegt. Deshalb wurden Sendetage aus dem letzen Drittel der Staffel gewählt und die Interaktionssequenzen dahingehend kritisch betrachtet. Ein Großteil (ca. 80 %) des cespla wurde im Rahmen zweier Einführungsseminare in die Gesprächsanalyse erhoben. Die Lehrveranstaltungen wurden von mir geleitet und fanden am Lehrstuhl von Prof. Dr. Graciela Wamba (Universidad Nacional de La Plata) statt. Die Daten wurden von Teilnehmern des Seminars in ihrem alltäglichen Umfeld aufgenommen. Daneben enthält das cespla Aufnahmen, die ich von Bekannten erhalten habe. Die Aufnahmeausrüstung stammt vom Lehrstuhl Prof. Dr. Stefan Pfänder (Freiburg).

Auffassungen zur gesprochenen Sprache

5

415 000 Wörtern entspricht.4 Da das cespla nur wenige Videoaufnahmen umfasst, wurden zwei Videoaufnahmen eines Interviews und einer öffentlichen Rede hinzugenommen. Diese Daten werden verwendet, um körperliche Aspekte von interaktionalen Verfahren und grammatischen Konstruktionen zu analysieren, die auf der Grundlage der Audiodaten herausgearbeitet wurden. Die Hinzunahme dieser Daten bietet außerdem die Möglichkeit aufzuzeigen, dass die herausgearbeiteten Verfahren auch in eher monologischen und weniger spontanen Kontexten Verwendung finden. Auf die situativen Besonderheiten wird jeweils eingegangen. Zur Auswertung wurden innerhalb der beiden Teilkorpora Stellen mit nicht-rekonstruktiver animierter Rede identifiziert und gemäß den Konventionen des Gesprächsanalytischen Transkriptionssystems (GAT) (Selting/ Auer et al. 1998) transkribiert.5 Der Wortlaut der argentinischen Transkriptionen wurde von Muttersprachlern verifiziert.

1.3

Auffassungen zur gesprochenen Sprache

Die vorliegende Arbeit beschäftigt sich mit Phänomenen der gesprochenen Sprache. In gegenstandstheoretischer und methodischer Hinsicht wird hierfür auf die Konversationsanalyse und die Interaktionale Linguistik zurückgegriffen. Im Folgenden werden die Prämissen und Grundlagen der Ansätze dargestellt.6 Die Konversationsanalyse wurde in den 1960er Jahren hauptsächlich von Harvey Sacks und Emmanuel Schegloff auf Basis der Ethnomethodologie Harold Garfinkels (1967, 1973; Garfinkel/Sacks 1970) entwickelt und erfuhr darüber hinaus Einflüsse aus der Ethnographie des Sprechens von Dell Hymes (1968, 1974, 1979a).7 Die grundlegende Prämisse der Konversations4

5

6

7

Die Transkription erfolgte durch geschulte Muttersprachler in Argentinien. Dies wurde durch die finanzielle Unterstützung der Wissenschaftlichen Gesellschaft der Universität Freiburg und des Vereins Gesprächsforschung e.V. ermöglicht. Die Transkription erfolgte mit Praat (http://www.praat.org), die Verwaltung der Aufnahmen und die Erstellung der Transkripte mit The Transformer (http://www.oliverehmer.de/transformer). Die Transkriptionskonventionen finden sich in Anhang 8.1. Überblicksdarstellungen zu den Eigenschaften gesprochener Sprache sowie gesprächsanalytischen und interaktionalen Ansätzen geben beispielsweise Reinhard Fiehler et al. (2003), Arnulf Deppermann (2000, 2001, 2007a) und Peter Auer (1999). Der theoretische Hintergrund und das Forschungsprogramm der Konversationsanalyse wurden von verschiedenen Autoren einführend oder ausführlich beschrie-

6

Einleitung

analyse ist, dass Menschen die Wirklichkeit ihres Alltags nicht einfach vorfinden, sondern mit ihrem Handeln in der Interaktion in geordneter Weise selbst herstellen.8 Hierbei greifen sie routinehaft auf Methoden zurück, die für eine bestimmte Gemeinschaft spezifisch sind. ›Methodisch‹ meint hier, dass der Vorgang, wie Sinn hergestellt wird, strukturell geordnet ist und sich formal beschreiben lässt. Soziale Ordnung wird durch den Einsatz von Methoden also nicht nur produziert, sondern auch re-produziert. Den Handelnden selbst ist dabei meist nicht bewusst, dass sie auf diese Methoden zurückgreifen. Das Ziel der Konversationsanalyse ist, die Methoden zu rekonstruieren, nach denen die Wirklichkeit im Vollzug aufgebaut wird. Sie versucht »die formalen Mechanismen« (Bergmann 1994b: 8) zu beschreiben, die hinter dem aktuellen Vollzug stehen und welche konversationellen Funktionen mit der Methode erfüllt werden können.9 Eine weitere Prämisse der Konversationsanalyse ist die Indexikalität des Handelns. Indexikal heißt, dass alle Äußerungen fortwährend auf die Situation und den Kontext, in dem sie produziert werden, verweisen und dass die Rezipienten selbst kontinuierlich das Umfeld des Geschehens in Betracht ziehen müssen, um Gehalt und Sinn einer Äußerung zu verstehen. (Bergmann 2001: 921)

Gleichzeitig besteht für die Interaktanten die Anforderung, Handlungen nicht nur zu vollziehen, sondern diese für ihre Interaktionspartner verstehbar zu machen. Interaktanten müssen mit der Ausführung einer (sprachlichen) Handlung gleichzeitig den Kontext herstellen, innerhalb dessen sie von anderen verstanden werden kann. Diese dynamische Auffassung von interaktionalem Kontext wurde vor allem im Rahmen der Kontextualisie-

8

9

ben bzw. diskutiert. Überblicksdarstellungen zur Konversationsanalyse geben beispielsweise Jörg Bergmann (1981, 1988, 1994b, 2001) und Werner Kallmeyer (1988; Kallmeyer/Schütze 1976) mit besonderem Fokus auf das Deutsche; für das Englische Ian Hutchby und Robin Wooffitt (2005) sowie Charles Goodwin und John Heritage (1990); für das Französische Elisabeth Gülich und Lorenza Mondada (2008). Kritische Anmerkungen finden sich bei Jürgen Streeck (1983) sowie Dieter Flader und Thilo von Trotha (1991). Die Herstellung von sozialem Sinn in der Interaktion wird auch als lokale Herstellung bezeichnet. »›Lokal‹ bedeutet dabei, dass die Teilnehmer die soziale Ordnung hier und jetzt, in der jeweiligen Situation mit ihren Mitteln der Konstitution von sozialer Realität hervorbringen« (Kallmeyer 1988: 1095). Diesen Aspekt reflektiert auch der Begriff der Vollzugswirklichkeit. Interagierende konstituieren soziale Wirklichkeit, indem sie Handlungen vollziehen. Hier wird auch der Einfluss der phänomenologischen Arbeiten von Alfred Schütz (1945, 1971b; Schütz/Luckmann 2003) deutlich. Arnulf Deppermann (2001: 81) betont, dass ein Phänomen durchaus der Erfüllung mehrerer Funktionen dienen kann.

Auffassungen zur gesprochenen Sprache

7

rungsforschung weiterentwickelt.10 Diese geht davon aus, dass die reflexive Erzeugung von Kontext geleistet wird, indem die Interaktanten in ihre Handlungen Kontextualisierungshinweise (contextualization cues) integrieren, mit denen auf ein Element des gemeinsamen Wissensbestandes verwiesen wird.11 In der Kontextualisierungsforschung wird davon ausgegangen, dass das Hintergrundwissen in Form von Schemata, Skripts oder Frames strukturiert ist, die sich auf verschiedene Ebenen des Kontextes beziehen können.12 Als Kontextualisierungshinweise können verbale, nonverbale und paraverbale Mittel genutzt werden. Aufgeführt werden unter anderem die folgenden: Kinetik und Proxemik, Prosodie […], Blickverhalten, zeitliche Platzierung […], Varietäten/Sprachwahl, lexikalische Variation sowie sprachliche Formulierungen. Kontextualisierungshinweise können selbst eine zeitliche Ausdehnung haben. Sie weisen dann eine Binnenstruktur auf, in der selbst wieder initiale oder finale Komponenten die Grenzen kontextualisieren. (Auer 1986: 26)

Einem einzelnen Kontextualisierungshinweis kann keine festgelegte Funktion zugeschrieben werden. Je nach Kombination mit anderen kann ein Kontextualisierungshinweis auf unterschiedliche Schemata verweisen. Dabei funktioniert Kontextualisierung in vielen Fällen über das Prinzip des Kontrastes. Findet eine Veränderung im Sprechen statt, spricht dies für eine Veränderung im Kontext. Dies gilt insbesondere für die Prosodie (vgl. Selting 1992: 255). Aus den Bedingungen eines sich ständig verändernden Kontextes leitet die Konversationsanalyse das Prinzip ab, die stetigen Veränderungen in der Analyse nachzuvollziehen. Hierfür muss der Gesprächsverlauf sequentiell analysiert werden (vgl. u. a. Ford/Fox et al. 2002; Schegloff 2007). In der sequentiellen Entwicklung eines Gesprächs signalisieren sich die Sprecher gegenseitig, in welcher Weise sie den aktuellen Kontext des Gesprächs interpretieren (Schegloff 2007).

10

11

12

Der Begriff Kontextualisierung (contextualization) wurde von Jenny Cook-Gumperz und John Gumperz (1978 [1976]) eingeführt und im Rahmen der interaktionalen Soziolinguistik entwickelt. Eine übersichtliche Darstellung gibt Auer (1986). Einen Einblick in verschiedene Forschungsfragen geben Auer/DiLuzio (1992). Mit welchen Hinweisen auf ein Schema verwiesen werden kann, ist über kulturspezifische Kontextualsierungskonventionen (contextualization conventions) festgelegt. Zu den Begriffen Frame und Skript vgl. auch Kapitel 2.2. Vorschläge zur Systematisierung der Kontext-Schemata finden sich unter anderen bei Auer (1986: 27ff; 1992: 36ff).

8

Einleitung

Im Fokus der Konversationsanalyse steht die Frage, wie soziale Ordnung in der Interaktion hergestellt wird und welche sozialen Handlungen die Interaktanten ausführen. Die Sprache selbst spielt hierbei jedoch eine sekundäre Rolle, wie Ian Hutchby und Robin Wooffitt formulieren: »CA is only marginally interested in language as such; its actual object of study is the interactional organization of social activities« (2005: 14). Die Interaktionale Linguistik hingegen – die aus der Konversationsanalyse hervorgegangen ist – stellt die Sprache in den Mittelpunkt des Interesses. Das Forschungsprogramm der Interaktionalen Linguistik wird unter anderem von Margret Selting und Elizabeth Couper-Kuhlen (2000, 2001a, 2001b) formuliert. Die Autorinnen bestimmen als Ziel die Beschreibung linguistischer Strukturen als Ressourcen der Organisation natürlicher Interaktion. Ziel der Interaktionalen Linguistik ist zu zeigen, dass und auf welche Weise sprachliche Strukturen auf die Erfüllung ihrer Funktionen bei der Organisation der sozialen Interaktion zugeschnitten sind. (Selting/Couper-Kuhlen 2000: 78)

Bei der Betrachtung des Wechselverhältnisses von sozialer Interaktion und sprachlichen Strukturen wird vor allem in neueren Arbeiten unter anderem auf die Konstruktionsgrammatik zurückgegriffen. Die Konstruktionsgrammatik ist ein Grammatikansatz, der innerhalb der kognitiven Linguistik entwickelt wurde. Er entstand ausgehend von der Beschäftigung mit festen Wendungen, Phraseologismen und Idiomen (vgl. Croft/Cruse 2007). In Absetzung von strukturalistischen und generativen Grammatiktheorien geht die Konstruktionsgrammatik davon aus, dass sich die Bedeutung eines sprachlichen Ausdrucks nicht lediglich additiv aus der Bedeutung von Einzelelementen ergibt, sondern in der Terminologie der Gestaltpsychologie eine übersummative Qualität aufweist. Konstruktionen werden als Form-Funktions-Einheiten verstanden. Auf der Formseite können Konstruktionen durch eine Kombination von syntaktischen, morphologischen, prosodischen und teilweise auch körperlich-gestischen Merkmalen konstituiert sein. Die Inhaltsseite einer Konstruktion wird relativ weit gefasst und kann eine lexikalisch-semantische, pragmatische oder interaktional-diskursive Bedeutung umfassen. Bei Konstruktionen handelt es sich damit um komplexe, nicht modular-kompositional strukturierte Einheiten. Vielmehr sind Konstruktionen auf kognitiver Ebene holistisch-gestalthaft repräsentiert und werden auch in dieser Weise wahrgenommen und verarbeitet (vgl. u. a. Goldberg 1995, 2006). Form und Funktion sind in Konstruktionen untrennbar miteinander verbunden; damit macht eine grammatische Beschreibung den Einbezug aller sprachlichen Ebenen relevant. So formuliert Charles Fillmore den Anspruch:

Auffassungen zur gesprochenen Sprache

9

Any aspect of the study of usage which requires mention of particular linguistic form – as opposed to merely mentioning of meaning – belongs properly to the study of grammar. (Fillmore 1997: 32)

Die Grammatik einer Sprache besteht aus einem Repertoire symbolischer Strukturen, die von den Sprachnutzern im Gebrauch erworben werden. In diachroner Perspektive entstehen Konstruktionen im Gespräch durch Herausbildung, Sedimentierung und Transformation sprachlicher Form-Funktionsgefüge (vgl. u. a. Günthner/Imo 2006b). Aus diesem Grund können Konstruktionen mehr oder weniger stark konventionalisiert bzw. im Repertoire eines einzelnen Sprechers oder einer kommunikativen Gemeinschaft sedimentiert sein. Susanne Günthner pointiert dies, indem sie von »(teil)verfestigten Konstruktionen« (2006a: 98) spricht. In konstruktionsgrammatischen Ansätzen werden alle Einheiten einer Sprache als Konstruktionen aufgefasst, die damit in Form und Funktion unterschiedlich komplex bzw. abstrakt sein können. Sie können sowohl lexikalisch spezifiziert sein als auch Leerstellen enthalten, die in der konkreten Verwendung lexikalisch gefüllt werden. Mithin können die einzelnen sprachlichen Ebenen für die Beschreibung einer Konstruktion unterschiedlich wichtig sein. Die Konstruktionsgrammatik stellt keine uniforme Theorie dar. Vielmehr können verschiedene Strömungen unterschieden werden (vgl. Birkner 2008; Deppermann 2006; Fried/Östman 2004).13 Während zunächst vor allem mit konstruierten Beispielsätzen gearbeitet wurde, übertragen insbesondere jüngere Arbeiten den Ansatz auf Gespräche und betrachten Konstruktionen als Ressource in der Interaktion (Auer 2006a; Birkner 2008; Deppermann 2007a; Fischer 2006; Günthner/Imo 2006a; Imo 2007). Zentrale Prämissen dieser Arbeiten sind die Orientierung auf den Gebrauch von Sprache im Kontext, die empirische Analyse von Sprachdaten sowie der Einbezug verschiedener Ausdrucksressourcen in die Analyse (vgl. Birkner 2008; Fried/ Östman 2005). Die Verbindung von konversationsanalytischen und konstruktionsgrammatischen Ansätzen kann mit Elizabeth Couper-Kuhlen und Sandra A. Thompson so gefasst werden, dass es darum geht, »grammatische 13

Die Berkeley-Schule mit den Hauptvertretern Charles Fillmore und Paul Kay setzt an der head driven phrase structure grammar an. Sie untersucht vor allem einzelsprachliche Konstruktionen und beinhaltet stärker generative Aspekte als andere Varianten (Fillmore/Kay et al. 1988; Kay 1997; Kay/Fillmore 1999). Die radical construction grammar nach William Croft (2002) geht demgegenüber vor allem sprachvergleichend und typologisch vor, mit starken Rückgriffen auf die Cognitive Grammar nach Ronald Langacker (1986, 1987, 1991, 1993). Adele Goldberg (1995, 2006) fokussiert vor allem auf die Vernetzung von Konstruktionen, in Anlehnung an die Kategoriennetzwerke von George Lakoff (1987).

10

Einleitung

Formate als interaktionale Praktiken – d. h. als sedimentierte Verfahren zur Lösung rekurrenter kommunikativer Probleme zu erfassen« (2006: 25). Die bislang vorliegenden Arbeiten zeigen, dass grammatische Konstruktionen in vielfältiger Weise für die Organisation sozialer Praxis eingesetzt werden und sich die Interaktanten sowohl in der Sprachproduktion als auch der Sprachrezeption an ihrem Wissen über grammatische Konstruktionen orientieren. Beispielsweise zeigt Günthner (2006a, 2006b), wie die von ihr so bezeichneten dichten Konstruktionen spezifische Funktionen zur Organisation einer kommunikativen Gattung wie Alltagserzählungen (vgl. Luckmann 1986) erfüllen können. Karin Birkner (2006) arbeitet heraus, wie Sprecher Konstruktionen einsetzen, um lokales Identitätsmanagement im Gespräch zu betreiben. Arnulf Deppermann (2007a) zeigt anhand der deontischen Infinitivkonstruktion, welchen Beitrag Konstruktionen zur Koordination zukünftigen Handelns leisten können. Günthner (2006a) konstatiert jedoch, dass bislang nur sehr wenige Untersuchungen vorliegen, in welchen der sequentielle Kontext in die Analyse einbezogen und der tatsächliche Umgang der Sprecher mit einer Konstruktion »im Prozess ihrer Aktualisierung« (2006a: 99) untersucht wird. Günthner hebt hervor, dass es sich bei Konstruktionen im Gespräch immer um emergente Produkte handelt, die im Moment der Verwendung entstehen. Sie sieht sprachliche Konstruktionen damit als Schaltstelle zwischen Wissensstrukturen und der lokalen Sprachproduktion im Gespräch: »Konstruktionen sind somit als Bindeglieder zwischen sedimentierten Strukturen und emergenten Produkten in der konkreten Interaktionssituation zu betrachten« (Günthner 2007b: 127). Mit dem Begriff der Emergenz greift Günthner auf den Ansatz der emergent grammar nach Paul Hopper zurück. Hopper (1987, 1998, 2004) argumentiert, dass sprachliche Strukturen und Regularitäten im Diskurs selbst entstehen, ohne die Notwendigkeit einer präexistenten Grammatik. Nach Auffassung Hoppers ist Grammatik weniger als ein kohärentes, in sich abgeschlossenes System zu sehen, sondern weist einen fragmentarischen Charakter auf. In ähnlicher Weise argumentiert auch Wolfgang Imo (2006), dass Konstruktionen in der Verwendung im Gespräch keineswegs immer eine feste Gestalt haben. Konstruktionelle Schemata liefern jeweils immer nur Vorlagen, die je nach sequentieller Platzierung und interaktionalem Bedarf unterschiedlich realisiert, umgebaut, ausgebaut oder abgebrochen werden können. (Imo 2006: 286)

Für die vorliegende Arbeit ist zentral, dass Sprecher mit Konstruktionen in flexibler Weise umgehen können, um lokal im Gespräch Sinn herzustellen. Insbesondere in Kapitel 5 wird analysiert, wie Sprecher Leerstellen in Kon-

Auffassungen zur gesprochenen Sprache

11

struktionen mit animierter Rede oder einer ausgedehnten Entwicklung eines mentalen Raumes füllen, an denen in einer normativ orientierten Sichtweise ein einzelnes Lexem oder abgegrenztes Syntagma erwartbar wäre. Eine theoretische Brücke zwischen der kognitiven Ebene sprachlicher Strukturmuster und der Interaktion stellt Peter Auer (2000, 2005b, 2007) her. Er argumentiert, dass Grammatik und Interaktion fundamentale Eigenschaften teilen und grammatisches Wissen eng mit interaktionalem Wissen verbunden ist. Dies basiert er auf dem aus der Interaktionsforschung stammenden Begriff der Projektion (vgl. u. a. Drew 1995; Schegloff 1996; Streeck 1995). By projection I mean the fact that an individual action or part of it foreshadows another. In order to understand what is projected, interactants need some kind of knowledge about how actions (or action components) are typically (i.e., qua types) sequenced, i.e., how they follow each other in time. (Auer 2005b: 8)

Auer zeigt auf, wie das Prinzip der Projektion nicht nur die Grundlage der Organisation sozialer Aktivitäten und Handlungen ist, sondern auch in der Syntax Anwendung findet. Während des Verstehensprozesses bauen Sprecher Erwartungen über den weiteren Verlauf eines syntaktischen Projektes auf. Diese Projektionen basieren auf dem Wissen der Gesprächsteilnehmer über syntaktische Muster bzw. syntaktische Gestalten. Mit der Öffnung einer Projektion erfolgt, sobald die Gestalt erkannt ist, ein Gestaltschluss.14 Das Prinzip der fortlaufenden Projektion und Einlösung syntaktischer Gestalten fasst Auer (2000) unter dem Begriff der On line-Syntax. Grundlage der Projektion ist für Sprecher und Hörer ein detailliertes oberflächennahes Wissen über ebensolche Gestalten, wie sie von der Konstruktionsgrammatik angenommen werden. An zweiteiligen Konstruktionen mit so weist Auer (2006a) nach, wie durch den ersten Teil einer Konstruktion eine sowohl syntaktische als auch semantisch-pragmatische Projektion aufgebaut wird, die im zweiten Teil der Konstruktion eingelöst wird.15 Damit sind grammatische Konstruktionen ein Verbindungsglied zwischen der sequentiellen Entwicklung der sprachlichen Interaktion und der Linearität der Syntax. 14

15

Auer (2005b) hebt jedoch hervor, dass mit der Projektion die Fortsetzung eines syntaktischen Projektes nicht festgelegt, sondern nur mehr oder weniger wahrscheinlich wird, da meist nicht nur eine, sondern konkurrierende Fortsetzungen projiziert werden. Darüber hinaus können vor der direkten Einlösung der Projektion andere Ereignisse eintreten. Weitere zweiteilige Konstruktionen mit einem projektiven Verhältnis zwischen einem ersten und einem zweiten Konstruktionsteil untersuchen beispielsweise Birkner (Mensch-Konstruktion, 2006), Couper-Kuhlen und Thompson (Extraposition, 2006) sowie Günthner (Projektorkonstruktionen, 2008).

12

Einleitung

Projektionen stellen eine interaktionale Ressource im Gespräch dar. Sprecher können Projekte entwickeln, indem sie beispielsweise die Äußerungen anderer Sprecher fortsetzen oder zuvor vom Gegenüber verwendete syntaktische Elemente in eigene Projekte einbauen. Syntaktische Strukturen weisen nach einmaliger Verwendung im Gespräch eine kognitive Präsenz auf, die lokal begrenzt über mehrere Äußerungen hinweg erhalten bleiben kann. Dies bezeichnet Auer (2006b, 2007) als Strukturlatenz: »strukturelle Teile der Vorgängeräußerung bleiben für die Interpretation der neuen Äußerung gültig« (2006b: 287). Auch Latenzen unterliegen der Zeitlichkeit des Gesprächs und werden mit dem Fortschreiten des Gesprächs schwächer. Um eine Struktur bzw. Konstruktion präsent zu halten, können Sprecher bestimmte Strategien wie Wiederholungen, Parallelismen und Tempusanbindung (vgl. Günthner 2006a: 104) nutzen. Eine zentrale Rolle spielt hierbei das Prinzip der Retraktion: In a retraction, a paradigmatic slot in an emergent syntactic unit is used twice, i.e. in formulating a next verbal component, the speaker re-uses a syntactic position which has already been filled by some other element before, and puts another element in this position. (Auer/Pfänder 2007: 60)

Mit Retraktionen setzen Sprecher bei der Formulierung ihrer aktuellen Äußerung an einem (syntaktischen) Ankerpunkt in einer vorangegangenen Äußerung an, sei es die eines anderen Sprechers oder einer eigenen. Hierdurch wird die zuvor realisierte Struktur zumindest teilweise wiederholt und so kognitiv präsent gehalten. Auf der semantischen Ebene können mit der paradigmatisch variierten Füllung einer Leerstelle in einer Konstruktion sowohl Reparaturen als auch Erweiterungen und Präzisierungen vorgenommen werden.

Auffassungen zur gesprochenen Sprache

2

13

Imagination als konversationelle Herstellung mentaler Räume

Imagination kann allgemein als der Vorgang verstanden werden, eine situative bzw. szenische Vorstellung aufzubauen. In der vorliegenden Arbeit wird dieses Phänomen in der Domäne des Gesprächs betrachtet. Der Ausgangspunkt der Betrachtung ist, dass eine szenisch strukturierte Vorstellung sowohl von mehreren Sprechern über einen langen Zeitraum hinweg gemeinsam entwickelt als auch nur von einem einzelnen Sprecher innerhalb eines Redezuges evoziert werden kann. Imagination im Gespräch ist hier nicht lediglich eine Erscheinung eines einzelnen menschlichen Bewusstseins. Vielmehr handelt es sich um ein interaktionales Phänomen, das von den Gesprächsteilnehmern organisiert wird. Imagination wird in der vorliegenden Arbeit damit als der Prozess verstanden, im Gespräch eine szenische Vorstellung aufzubauen. Imagination wird in der Arbeit insbesondere unter dem Gesichtspunkt untersucht, dass sich sowohl die Sprecher als auch die Hörer in die aufgebaute Vorstellung hineinversetzen und diese (virtuell) erleben. Auf der sprecherischen Ebene reflektiert sich dies darin, dass die szenischen Vorstellungen als ›etwas Erlebbares‹ präsentiert werden. Als zentrales Gestaltungsmittel dient hierzu die animierte Rede, mit der die Sprecher die imaginierte Handlung einer Figur demonstrieren können (vgl. Kapitel 3). Im Folgenden werden zunächst einige ausgewählte philosophische und linguistische Ansätze zur Imagination dargestellt. Bereits in Karl Bühlers Konzept zur Deixis an verschiedenen Zeigräumen – dem aktuellen Wahrnehmungsraum und dem Phantasma – finden sich zentrale Aspekte einer gemeinsamen Versetzung von Sprecher und Hörer vom Hier-und-Jetzt in eine Vorstellung mit wahrnehmungsähnlichem Charakter (2.1.1). Hierauf aufbauend bestimmt Wallace Chafe zwei unterschiedliche Bewusstseinsmodi, die sich erstens auf die Wahrnehmung der Realität und zweitens auf die Wahrnehmung einer imaginierten Szene richten, wobei jedoch Übergänge zwischen beiden Modi bestehen (2.1.2). Alfred Schütz geht in phänomenologischer Perspektive davon aus, dass neben der Welt des Alltags weitere Welten wie Spiel, Traum oder Phantasie bestehen, die vom Menschen als real erlebt werden können. Während Schütz seine Überlegungen nicht direkt auf das Gespräch bezieht, wird mit den Konzepten des Keyings und der Interaktionsmodalität erfasst, dass Sprecher mit interaktionalen Mitteln die Bedeutsamkeit des aktuellen Geschehens verändern können. Hierunter fällt

14

Imagination als konversationelle Herstellung mentaler Räume

auch, dass eine aktuell im Gespräch entwickelte oder aufgerufene Vorstellung kurzzeitig anstelle der Realität wahrgenommen werden kann (2.1.3). Entsprechende Ansätze finden sich unter dem Begriff der Performance auch in der anthropologischen Linguistik und der Theaterwissenschaft (2.1.4). In der folgenden Darstellung der Ansätze wird insbesondere darauf eingegangen, dass es in der Imagination zu einer Veränderung der Wahrnehmung bzw. des Erlebens kommt. Die verschiedenen Ansätze sind dabei nicht als alternativ, sondern vielmehr als komplementär zu sehen. In einem nächsten Schritt wird ein Ansatz zu einem semantisch-kognitiven Modell der Imagination entwickelt. Imagination wird hier als Aufbau einer szenischen Vorstellung im Sinne einer semantischen Struktur gefasst (2.2). Dabei wird vor allem auf Konzepte aus der kognitiven Linguistik zurückgegriffen (2.2.1). Mit Bezug auf Gilles Fauconnier wird Imagination als konversationelle Herstellung eines mentalen Raumes verstanden (2.2.2). Mentale Räume können beliebige Szenarien enthalten, die in verschiedenen Bezügen zur Realität des aktuellen Gesprächs stehen können. Sie sind gleichermaßen geeignet für die Erfassung der Storyworld einer Erzählung, einer antizipierten bzw. geplanten Interaktion, generalisierenden und konditionalen Zusammenhängen sowie fiktionaler Szenen. Die Leistung der Theorie der mentalen Räume für die vorlegende Arbeit besteht insbesondere darin, ein theoretisches Framework für die Erfassung von im Gespräch sprachlich konstituierten Vorstellungen bereitzustellen. Die Theorie mentaler Räume wird um theoretische Grundannahmen aus der Kognitiven Grammatik nach Ronald Langacker erweitert, der in seinem Diskursmodell insbesondere die zeitliche Entwicklung semantischer Strukturen im Verlauf des Gesprächs und stärker als Fauconnier die Perspektivität des Sprechens einbezieht (2.2.3). Eine empirische Anwendung der genannten Ansätze aus der kognitiven Linguistik fand bislang vor allem in Bezug auf schriftliche, monologische Texte statt. Die Probleme der Übertragung auf Gespräche und die Kombination mit der Interaktionalen Linguistik und der Konversationsanalyse werden in Kapitel 2.3 diskutiert. Insbesondere wird argumentiert, dass das methodische Werkzeug der Sequenzanalyse geeignet ist, um Prozesse der Herstellung einer gemeinsamen Kognition (shared cognition, 2.3.1) im Gespräch zu untersuchen.

Imagination und mentale Versetzung

15

2.1

Imagination und mentale Versetzung

2.1.1

Wahrnehmungssituation, Phantasieszene und Origoverschiebung

In seinen Arbeiten zur Deixis unterscheidet Karl Bühler (1982 [1934]) verschiedene Zeigräume. Nach Bühler befindet sich jeder Mensch im Wachzustand in einer primären Wahrnehmungssituation, die er als gegeben und gegenwärtig erlebt (1982: 102, 126ff).1 Hiervon unterscheidet Bühler das Phantasma, das sich auf den Bereich der »ausgewachsenen Erinnerungen und der konstruktiven Phantasie« (1982: 123) bezieht. Im Phantasma, das Bühler auch als optische Phantasieszene (1982: 137) bezeichnet, können abwesende Situationen vergegenwärtigt werden: Genau genommen müsste man vorher noch angeben, daß nicht alle sogenannten Erinnerungs- und Phantasievorstellungen hierher [in das Phantasma, O.E.] gehören, die unser Selbstsprechen und Sprachverstehen stützen, begleiten und zum Teil erfüllen. Vielmehr gibt es ›Bilder‹ und ›Bildchen‹ (wie man sagen könnte), die in ihrer ganzen Beschaffenheit nach abgetrennt werden müssen von den geschlossenen Situationsvergegenwärtigungen (so wollen wir die zweite Gruppe nennen). Im zweiten Falle treten Erinnerungs- und Phantasiesituationen von wahrnehmungsähnlichem Charakter auf und ersetzten die primäre Gegebenheit von Wahrnehmungssituationen. (Bühler 1982: 133)

Das Phantasma ist damit als szenische Vorstellung bestimmt, die insofern in sich geschlossen ist, als hier komplette Szenen repräsentiert sind. Darüber hinaus hebt Bühler hervor, dass die Wahrnehmung des Phantasmas kurzzeitig die Wahrnehmung der Realität bzw. der primären Wahrnehmungssituation ersetzen kann. Für die Versetzung in die Vorstellung bzw. in das Phantasma ist das Konzept der Origo zentral. Die Origo bestimmt Bühler als den Nullpunkt eines »Koordinatensystem[s] der ›subjektiven Orientierung‹« (1982: 102), von dem ausgehend der Sprecher eine Situation wahrnimmt. Wer immer im Wachzustand ›bei sich‹ ist, befindet sich orientiert in seiner gegebenen Wahrnehmungssituation und das heißt zunächst einmal, daß alle Sinnesdaten, die ihm zufließen, eingetragen sind in eine Ordnung, ein Koordinatensystem, dessen Origo (Koordinationsausgangspunkt) das ist, worauf die Zeigwörter hier, jetzt, ich hindeuten. Diese drei Wörter müssen zusammen an den Fixpunkt der Ordnung, die wir beschreiben wollen, gesetzt werden. (Bühler 1982: 126)

1

Bühler verwendet die Begriffe Wahrnehmungsfeld (101, 124), -bereich (86f), -situation (88, 126f, 132ff) und -raum (121, 125f) gleichbedeutend. Im Folgenden wird der Begriff Wahrnehmungssituation verwendet, da Bühler diesen am häufigsten nutzt.

16

Imagination als konversationelle Herstellung mentaler Räume

Die Origo ist das perspektivische Zentrum des wahrnehmenden Subjektes. Diese Perspektive überträgt der Sprecher in seine Äußerungen (vgl. Diewald 1991: 28). Die sprachlichen Mittel, mit denen ein Sprecher seine Perspektive auf die Situation ausdrückt, werden Deiktika bzw. deiktische Ausdrücke genannt. Dabei wird allgemein in Personal-, Lokal-, Temporal- und Objektdeixis unterschieden.2 Die Origo ist dabei keineswegs fixiert, sondern veränderlich, je nachdem welche subjektive Position der Sprecher einnimmt. Zentral für die vorliegende Arbeit ist, dass die Origo nicht nur innerhalb der Wahrnehmungssituation verschoben werden kann, sondern auch in das Phantasma. Durch die sprachliche Analyse der Deiktika einer Äußerung kann bestimmt werden, welche Perspektive der Sprecher einnimmt bzw. in welchem Zeigraum er deiktisch verankert ist. Bühler unterscheidet hier das Zeigen an der Wahrnehmungssituation (demostratio ad oculos) und das Zeigen am Phantasma.3 Beim Zeigen an der Wahrnehmungssituation besteht eine Ordnung, »in welcher alles beisammen ist: Zeigobjekte, Sender und Empfänger der Zeiganweisungen, und worin sich die beiden Kontaktpartner harmonisch-sinnvoll benehmen« (1982: 125). Beim Zeigen am Phantasma jedoch fallen Wahrnehmungsraum und Referenzraum (das Phantasma) auseinander. Bühler unterscheidet nun drei Hauptfälle der Deixis am Phantasma, von denen insbesondere der zweite Hauptfall für die vorliegende Arbeit von Relevanz ist, der metaphorisch als Hingehen bezeichnet wird. Bei diesem Fall der Deixis versetzen sich die Beteiligten in einen vorgestellten Raum und orientieren sich in diesem: Man ist »hinversetzt in der Vorstellung an den geographischen Ort des Vorgestellten, man hat das Vorgestellte vor dem geistigen Auge von einem bestimmten Aufnahmestandpunkt aus, den man angeben kann und an dem man selbst sich befindet in der Vorstellung« (1982: 135). Es findet also eine Origoverschiebung ins Phantasma statt. Der Sprecher übernimmt als Orientierungspunkt eine Perspektive in einer vorgestellten Szene.4 2

3

4

Der Begriff Deixis stammt aus dem Griechischen und bedeutet zeigen. Bühler orientiert sich in seiner Feldtheorie und der Unterscheidung von Zeigfeld, Symbolfeld, Malfeld an der Zeichenklassifikation von Charles Sanders Peirce, der Index, Symbol und Ikon unterscheidet. Neben der demostratio ad oculos und dem Zeigen am Phantasma bestimmt Bühler drittens den Modus des anaphorischen Zeigens, bei dem ein Sprecher in Form der »situationsfernen Rede« (1982: 80) am Text zeigt. Vgl. hierzu auch die Unterscheidung verschiedener Felder bzw. Zeigräume bei Konrad Ehlich (1991). Den ersten Hauptfall bezeichnet Bühler als Hierbleiben. Dabei stellen sich Menschen ein aktuell nicht gegenwärtiges Objekt im Hier-und-Jetzt vor und projizieren die-

Imagination und mentale Versetzung

17

Dabei stellt Bühler heraus, dass die sprachliche Vermittlung von Vorstellungen auf der Fähigkeit der Versetzung beruht: »Der Mensch vermag nur deshalb mit sprachlichen Mitteln Abwesendes einem anderen im Phantasma zu präsentieren, weil es Versetzungen gibt« (1982: 139). Dabei muss sich nicht nur der Sprecher in die Vorstellung versetzen, sondern auch der Hörer. Dieser kann die vom Sprecher verwendeten Deiktika nur verstehen, »wenn er selbst in ähnlicher Weise ›versetzt‹ ist, d. h. wenn sein eigenes Körpertastbild mit einer korrespondierenden optischen Szene verknüpft ist« (1982: 137). Damit ist für die Kommunizierung einer Vorstellung eine gemeinsame Versetzung von Sprecher und Hörer in diese hinein notwendig.5 Das von Bühler entwickelte Konzept der Origo als Zentrum der subjektiven Orientierung wurde in vielen Bereichen der Sprachwissenschaft, so auch in der kognitiven Linguistik, aufgegriffen und weiterentwickelt. Insbesondere in der Kognitiven Grammatik nach Ronald Langacker wird die Perspektivität als grundlegende Bedingung der Sprache begriffen, wie Dirk Geeraerts formuliert: »Langacker starts off with the very idea of a perspectival grammar – although he uses a slightly different terminology: he talks about grammar as conceptualization and imagery« (Geeraerts 2006: 7). Dies wird in Kapitel 2.2.3 genauer besprochen. Zuvor jedoch werden weitere Ansätze dargestellt, die sich mit der Veränderung der Wahrnehmung bzw. des Bewusstseins und ihrer sprachlichen Manifestation beschäftigen.

5

ses in den Wahrnehmungsraum. Die Orientierung der Person bleibt also im Wahrnehmungsraum und es findet keine Origoverschiebung statt. Beim dritten Hauptfall handelt es sich nach Bühler um einen »Zwischenfall zwischen Hierbleiben und Hingehen« (1982: 135). Der Sprecher bleibt im Wahrnehmungsraum des Hierund-Jetzt orientiert und stellt sich von dieser Origo aus ein entferntes Objekt vor: »Dieser dritte Hauptfall ist meist ein labiles und unbeständiges Eingangserlebnis. Sein Erkennungszeichen liegt darin, daß der Erlebende imstande ist, die Richtung, in welcher das Abwesende vom geistigen Auge gesehen wird, mit dem Finger anzugeben« (1982: 137). Der Sprecher dehnt den Wahrnehmungsraum in seiner Vorstellung so weit aus, dass ein reales, distantes Objekt eingeschlossen wird. Auch hier findet also keine Origoverschiebung statt. Die Verwendung deiktischer Elemente bewirkt »eine Fokussierung der Aufmerksamkeit des Hörers auf einzelne Aspekte eines für den Sprecher und Hörer gemeinsamen Bezugsraums, den Verweisraum« (Ehlich 2000: 138). Deiktika können damit als Kontextualisierungsmittel dienen; beispielsweise können durch lokale Deixis Objekte der physischen Umgebung in den Kontext einbezogen werden, indem Aufmerksamkeit auf diese gelenkt wird (Auer 1992: 27). Dies ist gleichsam der Fall beim Zeigen am Wahrnehmungsraum und dem Zeigen am Phantasma.

18

Imagination als konversationelle Herstellung mentaler Räume

2.1.2

Bewusstseinsmodi

Wallace Chafe (2001) beschäftigt sich mit grundlegenden Eigenschaften des menschlichen Bewusstseins, die er zunächst introspektiv formuliert und dann empirisch linguistisch belegt. Chafe geht davon aus, dass jeder Mensch über ein Modell der Realität verfügt. Der Autor fasst dieses Realitätsmodell als Wissensstruktur, die zu einem gegebenen Zeitpunkt jedoch immer nur teilweise aktiviert sein kann. Diesen Prozess der partiellen Aktivierung von Wissen über die Realität bestimmt Chafe als Bewusstsein. At any given moment the mind can focus on no more than a small segment of everything it ›knows.‹ I will be using the word consciousness here to refer to this limited activation process. (Chafe 2001: 28)

Hiervon ausgehend erläutert Chafe (2001: 29ff) konstante und variable Eigenschaften des Bewusstseins. Zu den konstanten Eigenschaften des Bewusstseins zählt, dass dem erfahrenden Individuum nur ein Teil der es umgebenden Welt bewusst ist. Dieser Fokus ist umgeben von einem peripheren Bewusstsein, das – in Form semiaktiver Information – den Kontext für den Fokus bietet. Dabei wandert der Fokus fortwährend; Bewusstsein ist dynamisch. Das Bewusstsein ist bei Chafe ein individuelles Konzept, bei dem das erfahrende Individuum im Mittelpunkt steht, für welches die Notwendigkeit besteht, sich zu orientieren. Somit ist Bewusstsein immer durch einen Standpunkt (point of view) bzw. eine Perspektive gekennzeichnet. Neben diesen konstanten Eigenschaften bedingen mehrere variable Eigenschaften des Bewusstseins, dass bewusste Erfahrungen unterschiedliche Qualitäten aufweisen können. Erfahrungen können sowohl aus der Perzeption als auch aus Absichten, Wünschen und Vorstellungen entstehen. Zentral für die vorliegende Arbeit ist die von Chafe getroffene Unterscheidung, dass bewusste Erfahrungen unmittelbar oder versetzt sein können. Das unmittelbare Bewusstsein (immediate consciousness) ist auf die Realität, das Hier-und-Jetzt gerichtet. Es besteht zu einem Großteil aus direkten Sinneserfahrungen, ist aber gleichzeitig mit evaluativem Hintergrundwissen verbunden. Bereits hier wird der Übergang zum versetzten Bewusstsein (displaced consciousness) deutlich, welches sich sowohl auf das Erinnern als auch die Imagination richtet. Dieses beruht nach Chafe in jedem Fall auf vorangegangenen Erfahrungen.6 Innerhalb des Modus der Versetzung unterscheidet Chafe grundsätzlich zwei Typen. Dies ist erstens die spatio-temporale Versetzung in Situationen, 6

Chafe unterscheidet terminologisch zwischen dem Erinnern von Vergangenem und der Imagination.

Imagination und mentale Versetzung

19

die an einem anderen Ort und/oder einer anderen Zeit stattfinden. Als Beispiel hierfür nennt Chafe antizipierte Erfahrungen in einer vorgestellten Zukunft. Der zweite Typ des versetzten Bewusstseins besteht in der Versetzung des ›Selbst‹: »[…] the ability to be conscious of events and states that originated in the consciousness of someone else« (Chafe 2001: 200). Diese Fähigkeit zur Perspektivübernahme bezeichnet Chafe auch als Empathie (2001: 195). Nach Chafe kann das Bewusstsein mit großer Leichtigkeit zwischen dem unmittelbaren und dem versetzen Modus alternieren. Dabei findet jedoch meist kein kompletter Wechsel des Modus statt. These shifts, however, are perhaps never complete. […] When consciousness is focused on something remembered or imagined, for example, experience of the immediate environment is usually, perhaps always, present to some degree. (Chafe 2001: 201)

Damit wird im Modus der Versetzung – zumindest beim Sprechen – der unmittelbare Modus aufrechterhalten. Auch in einer zweiten Weise sind die beiden Modi nicht strikt zu trennen. Nach Chafe haben Sprecher die Möglichkeit, den Modus der Versetzung sprecherisch so zu gestalten, dass diesem eine ähnliche Wirkung wie dem unmittelbaren Modus zukommt. Um eine Unmittelbarkeit des Imaginierten herzustellen, stehen Sprechern verschiedene sprachliche Mittel zur Verfügung, von denen Chafe mit Bezug auf Otto Jespersen (1923 [1922]) als das historische Präsens und die direkte (animierte) Rede hervorhebt.7 Als weitere Mittel benennt Chafe die generische Verwendung von Aspekt und Personalformen (unpersönliche Apostrophe in der 2. Person Singular, you/›du‹). Insbesondere bei der direkten (animierten) Rede findet ein Übergang zwischen den Modi statt, da hier im versetzten Modus ein unmittelbares Bewusstsein repräsentiert wird. Dies bezeichnet Chafe als represented consciousness.8 Als weitere variable Eigenschaft des Be7

8

Zu gleichen Ergebnissen kommt auch Günthner (2000), die – jedoch lediglich in Bezug auf Alltagserzählungen – für das Deutsche außerdem die Verberststellung benennt. Parallel zur Unterscheidung von immediate und displaced consciousness verwendet Chafe die Begriffe extroverted und introverted consciousness. Das extrovertierte Bewusstsein nimmt die direkte Umgebung wahr und ist für das Handeln verantwortlich. Das introvertierte Bewusstsein hingegen ist vor allem auf die versetzte Erfahrung und ihre sprachliche Repräsentation gerichtet. Dies ist insofern relevant, als die Entwicklung eines Standpunktes bzw. einer Perspektive immer mit einem extrovertierten Bewusstsein verbunden ist: »[…] it is always the extroverted (perceiving, acting, evaluating) consciousness rather than the introverted (remembering, imagining) consciousness that provides the locus for a point of view« (Chafe 2001:

20

Imagination als konversationelle Herstellung mentaler Räume

wusstseins unterscheidet Chafe zwischen Fakt und Fiktion, was er nicht an wahrheitskonditionalen Bedingungen, sondern am individuellen Urteil des Erfahrenden festmacht.9 Für die vorliegende Arbeit ist der Ansatz von Chafe vor allem deshalb relevant, da er unmittelbares und versetztes Bewusstsein nicht lediglich als zwei getrennte Modi konzeptionalisiert. Vielmehr bestehen zwischen diesen Modi Übergänge. Diese Übergänge sind möglich, da bewusste Erfahrung immer durch Wissen vermittelt wird, das in der Sedimentierung vergangener unmittelbarer Erfahrungen besteht. Damit ist das versetzte Bewusstsein ebenfalls durch, wenn auch vergangene, unmittelbare Erfahrungen bedingt. Darüber hinaus kann nach Chafe der versetzte Modus dem unmittelbaren Modus ›ähnlich‹ werden, was über sprachliche Mittel hergestellt werden kann: [Historical present, O.E.] together with the use of direct speech […] as well as the use of generic remembering discussed above, are all options exploited by conversationalists to make the displaced mode more closely resemble the immediate mode in some way. (Chafe 2001: 210)

Zwar hebt Chafe hervor, dass es um die Sprachverwendung in der Interaktion geht. Jedoch hat Chafe vor allem das individuelle Bewusstsein im Blick und fokussiert darauf, mit welchen Mitteln ein Sprecher seine Erfahrungen sprachlich repräsentiert. Die interaktionale Herstellung eines ›gemeinsamen Bewusstseins‹ wird nicht behandelt. Eine ähnliche Unterscheidung eines situated und eines displaced mode trifft bereits Peter Auer (1988). Anders als Chafe jedoch bestimmt Auer diese nicht als Bewusstseinsmodi, sondern als pragmatische Modi. Ausgangspunkt der Untersuchung ist die Bestimmung einer der zentralen Eigenschaften der menschlichen Sprache: »it is able to free itself from the ›bonds‹ of the immediate spatio-temporal surroundings of its production« (Auer 1988: 263). Der situated mode ist ein Sprechen mit starker Bindung an die aktuelle Gesprächssituation, sowohl in Bezug auf die physischen Gegebenheiten als auch die aktuell anwesenden Sprecher. Der displaced mode hingegen ist durch eine Lösung hiervon gekennzeichnet und weist somit eine geringere Umfeldabhängigkeit im Bühlerschen Sinne auf. Auer benennt die folgenden Charakteristika des situated mode. Situiertes Sprechen ist empraktisch und fin-

9

207). Mit der animierten Rede wird damit ein versetztes Bewusstsein in Form eines extrovertierten Bewusstseins repräsentiert. Als variable Eigenschaften des Bewusstseins benennt Chafe weiterhin, dass bewusste Erfahrungen mehr oder weniger interessant sein können und diese sowohl sprachlich (inner speech) als auch nicht-sprachlich (nonverbal) stattfinden können.

Imagination und mentale Versetzung

21

det oft lediglich begleitend zur Ausführung von Aktivitäten statt. Es handelt sich insbesondere auch um Aktivitäten »that try to exert a direct control on coparticipants’ next activities by allocating the turn to them, and by imposing on them a next activity type« (Auer 1988: 276). Dabei findet ein häufigeres Turntaking als im displaced mode statt. Auch besteht ein direkterer Bezug auf die real anwesenden Personen, der sich in einer adressatenspezifischen Gestaltung der Äußerung niederschlägt. Darüber hinaus werden mehr Deiktika verwendet. Der displaced mode ist demgegenüber stärker von den Gegebenheiten der Sprechsituation entbunden. Als mit diesem Modus verbundene Sprechaktivitäten benennt Auer »generic statements […] but also reports, narratives, descriptions, recipes, fantasies, etc.« (1988: 277) sowie Beschreibungen und Diskussionen. Dabei handelt es sich nicht um einander ausschließende Modi, sondern um eine graduelle Erscheinung: »Displacement as a property of conversational talk is therefore a matter of degree« (1988: 269). Zwar können die Übergänge zwischen den Modi abrupt stattfinden, etwa wenn das Sprechen im displaced mode durch ein Ereignis unterbrochen und die Aufmerksamkeit auf die Gesprächssituation gelenkt wird. Beim Wechsel vom situierten in den versetzten Modus findet jedoch oft ein weicher Wechsel statt, bei dem meist ein Element des aktuellen Gesprächs aufgenommen wird. Smoother transitions take up an element of the on-going talk and use it for an intermediate utterance that contains situated and displaced elements. Often, a certain detail of the situation is generalized to a more abstract statement that can be used for the generation of a fully displaced narrative, descriptive, or argumentative passage. (Auer 1988: 284)

Auffällig an den von Chafe und Auer postulierten Modi immediate/displaced und situated/displaced ist nicht nur die begriffliche Parallelität, sondern auch der Bezug auf ähnliche Aktivitätstypen wie Erzählungen. Während Chafe für die Bestimmung der beiden Modi von der Ebene des Bewusstseins ausgeht und nachfolgend unterschiedliche sprachliche Realisierungen betrachtet, setzt Auer die interaktionale Ebene primär. Auer trifft jedoch keine Aussage über unterschiedliche Qualitäten des Erlebens in den beiden Modi und eine mentale Versetzung in szenische Vorstellungen, die im displaced mode entwickelt werden können. In interaktionaler Perspektive wird auch mit dem Konzept der Interaktionsmodalität versucht, bestimmte Veränderungen im Erleben der Interaktanten bzw. ihrem Realitätsbezug zu modellieren.

22

Imagination als konversationelle Herstellung mentaler Räume

2.1.3

Wirklichkeitsbereiche und Interaktionsmodalität

Die Konzepte der Interaktionsmodalität (Kallmeyer 1979) und des Keyings (Goffman 1986 [1974]) richten sich darauf zu erfassen, dass Sprecher einem interaktionalen Geschehen eine besondere Bedeutsamkeit zusprechen und dabei den Realitätsbezug ihrer Äußerungen verändern können. Da die jeweiligen Autoren stark auf die Arbeiten von Alfred Schütz Bezug nehmen, werden zunächst einige zentrale Punkte seines phänomenologischen Ansatzes referiert und anschließend auf die Interaktionsmodalität und das Keying eingegangen. Nach Alfred Schütz (1945, 1971b; Schütz/Luckmann 2003) ist die Lebenswelt als eine Vielzahl nebeneinander bestehender Welten strukturiert. Zu diesen gehören die Welten des Alltags, des Traums, der Wissenschaft, des Spiels, der Phantasie und andere. Anstatt von Welten spricht Schütz auch von Sinnprovinzen oder Sinngebieten. Jedes Sinngebiet ist durch einen spezifischen Erlebnisstil charakterisiert. Damit ist die Art und Weise gemeint, wie das Erleben einer Welt strukturiert ist. Vereinfacht gesagt: Welten werden dadurch unterschieden, wie sie erlebt werden. Nach Schütz sind die einzelnen Sinngebiete in sich abgeschlossen. Innerhalb eines Erlebnisstils sind die Erfahrungen einer Welt in sich stimmig und miteinander verträglich. Die einzelnen Welten können durch Zuwendung den Charakter der Wirklichkeit erhalten bzw. als Wirklichkeit erfahren werden. Während man ihr zugewandt ist, ist jede dieser Welten in ihrer eigenen Weise real; aber sowie man ihr die Aufmerksamkeit entzieht, verschwindet sie als Wirklichkeit. (Schütz/Luckmann 2003: 54)

Ein Wechsel des Realitätsakzentes von einer Welt in eine andere, wie etwa beim Aufwachen, stellt nach Schütz einen Sprung dar, der subjektiv als Schock erfahren wird. Darüber hinaus bedeutet die Abgeschlossenheit einer Welt, »daß es an Transformationsregeln fehlt, mit denen man die verschiedenen Sinnbereiche in wechselseitigen Bezug setzen könnte« (Schütz 1971b: 267). Unter der Vielzahl von Welten ist die »Wirklichkeit des Alltagslebens als unsere vornehmliche Realität anzusehen« (Schütz/Luckmann 2003: 32). Die Alltagswelt ist durch das pragmatische Eingreifen des Individuums gekennzeichnet. Durch sein Handeln wirkt der Mensch auf die Lebenswelt ein und modifiziert diese. Den Kern der Alltagswelt bildet die Welt in aktueller Reichweite, welche als zeitliche und räumliche Gegenwart erfahren wird. Von dieser unterscheidet Schütz die potentielle Reichweite. Hierzu gehört erstens die wiederherstellbare Reichweite, die Schütz dem Erinnern zuordnet, und zweitens die erlangbare Reichweite.

Imagination und mentale Versetzung

23

Welt, die nie in meiner Reichweite war, die aber in sie gebracht werden kann, soll Welt in erlangbarer Reichweite genannt werden. (Schütz/Luckmann 2003: 73)

Über die Welt in Reichweite hinaus geht die Vorstellung bzw. die Phantasie. Schütz unterscheidet zwei Arten des Phantasierens: das bloße Phantasieren und das Entwerfen. Die beiden Arten unterscheiden sich in ihrem Bezug auf die Wirklichkeit des Alltagslebens. Das Entwerfen ist das »Vorstellen eines zukünftigen Zustands innerhalb gewisser, nicht überschreitbarer Grenzen« (Schütz/Luckmann 2003: 480). Diese Grenzen bestehen im subjektiven Wissensvorrat des Einzelnen über das, was in der Lebenswelt möglich ist. Das Entwerfen erfolgt also in der natürlichen Einstellung und kann sich beispielsweise auf das Planen von Handlungen beziehen. Demgegenüber ist das bloße Phantasieren nicht an die Grenzen der Realität gebunden.10 Das Konzept des Erlebnisstils wurde zunächst in der Ethnomethodologie und später auch in der Interaktionsforschung auf Gespräche übertragen. Die Grundidee der Übertragung ist, dass Sprecher den Erlebnisstil in der Interaktion modifizieren können.11 Von Relevanz sind dabei auch die Arbeiten Gregory Batesons (1955), der herausstellt, dass auch Primaten unterscheiden können, ob ein Kampf echt oder gespielt ist. Hierauf basiert Erving Goffman sein Konzept des Keyings: »A keying, then, when there is one, performs a crucial role in determining what it is we think is really going on« (1986 [1974]: 45). Der key stellt den ›symbolischen Schlüssel‹ zum Verständnis eines interaktionalen Geschehens dar. I refer here [mit dem Begriff key, O.E.] to the set of conventions by which a given activity, one already meaningful in terms of some primary framework, is transformed into something patterned on this activity but seen by the participants to be something quite else. The process of transcription can be called keying. A rough musical analogy is intended. (Goddman 1986 [1974]: 44f)

Eine ähnliche Definition findet sich auch bei Dell Hymes (1968, 1974, 1979b: 57), welcher Key als »tone, manner or spirit in which an act is done« (1974: 57) bestimmt und eine Korrespondenz zur grammatischen Modalität herstellt.12 Das Konzept des Keyings wurde von Werner Kallmeyer – mit be10

11

12

Vgl. hierzu auch Kapitel 4.1, in dem genauer zwischen Entwerfen und Fiktionalisieren unterschieden wird. Da es lediglich um interaktional hergestellte Erlebnisstile geht, fallen etwa die Erlebnisstile des Schlafes und des Träumens nicht den Gegenstandsbereich. Harold Garfinkel bezeichnet dies als Modifikationen (1973: 189), mit besonders deutlichem Bezug auf die Arbeiten von Alfred Schütz.

24

Imagination als konversationelle Herstellung mentaler Räume

sonders starkem gedanklichem Bezug auf Alfred Schütz – unter dem Begriff der Interaktionsmodalität aufgenommen:13 Mit Interaktionsmodalität sind hier allgemein die Verfahren gemeint, die einer Darstellung, Handlung oder Situation eine spezielle symbolische Bedeutsamkeit verleihen, und zwar mit Bezug z. B. auf eine besondere Seinswelt wie Spiel oder Traum, auf Wissen und Intention der Beteiligten oder auf eine institutionelle Situation. (Kallmeyer 1979: 556)

Mit der Etablierung einer Interaktionsmodalität können Gesprächsteilnehmer ihren Äußerungen einen »markierten Realitätsbezug verleihen« (Kotthoff 1998: 166).14 Als eine Interaktionsmodalität beschreibt Werner Kallmeyer (1979) die Exaltation, bei der sich die Sprecher – in alltagssprachlicher Formulierung – für etwas begeistern oder in etwas hineinsteigern. Die Äußerungen der Sprecher »beinhalten häufig Bewertungen, und zwar rückhaltslose, nicht relativierte Bewertungen« (Kallmeyer 1979: 549). Weiterhin ist die Exaltation durch eine hohe emotionale Expressivität gekennzeichnet, die in unterschiedlichem Grad sowohl prosodisch, in den Formulierungen als auch über Interjektionen markiert wird. Exaltation kann entweder harmonisch oder auch kontrovers sein, wobei in letzterem Fall Beschimpfungen Dritter oder der Interaktionspartner untereinander erfolgen. Eine Interaktionsmodalität kann sich auf sprecherische Einheiten verschiedener Größe beziehen. Sie kann nur einzelne Äußerungen, aber auch ganze Aktivitätskomplexe umfassen und wird in diesem Fall meist zu Beginn einer Aktivität etabliert. Der Wechsel in eine andere Interaktionsmodalität muss von den Gesprächsteilnehmern angezeigt bzw. kontextualisiert werden und ist damit ein gemeinschaftlicher Vorgang: […] auch wenn Modalitäten kurzfristig wechseln […] werden diese Modalitätswechsel nicht nur vom Sprecher markiert, sondern auch vom Partner behandelt, d. h. entweder abgelehnt oder mitvollzogen (z. B. manifestiert durch Lachen, eine korrespondierende Äußerung usw. bis hin zur Auslösung von Expansion im Rahmen einer neuen Modalität). (Kallmeyer 1979: 557)

13

14

Eine weitgehend identische Definition legen Werner Kallmeyer und Fritz Schütze bereits (1977) vor, sprechen jedoch noch nicht von Interaktionsmodalität, sondern lediglich von Modalität. Jürgen Streeck formuliert, dass Sprecher über die Etablierung einer Interaktionsmodalität den »logischen Weltbezug von Sprache« (1994: 579) verändern, was jedoch insofern keine glückliche Formulierung ist, da es nicht um logische Bezüge im Sinne einer Prädikatenlogik der formalen Semantik geht.

Imagination und mentale Versetzung

25

Ausgehend von den Arbeiten Kallmeyers wurden in der Literatur verschiedene Interaktionsmodalitäten beschrieben.15 Die Benennung von Interaktionsmodalitäten basiert zumeist – implizit oder explizit – auf der Absetzung von einer ernsten Interaktionsmodalität (z. B. Kallmeyer/Keim 1994; Kotthoff 1998; Müller 1983, 1984). Für die vorliegende Arbeit ist vor allem die Etablierung einer humorvollen Interaktionsmodalität relevant.16 Nach Kotthoff (1989a) können unter anderem folgende Verfahren verwendet werden, um eine humorvolle Interaktionsmodalität zu kontextualisieren: Lachen oder lachendes Sprechen, Veränderungen in den Höflichkeitsstandards, lexikalische Übertreibungen und syntaktische Verkürzungen, prosodische Mittel und Verwendung lautmalerischer Ausdrücke, verschiedene Verfahren der Spannungserzeugung sowie betont ernste Formulierungen provokanter oder zweifelhafter Positionen, wobei dann die Inkongruenz von Form und Inhalt auf Komik hindeutet. Nach Kotthoff stehen die humorvolle und die spielerische Interaktionsmodalität in engem Bezug zueinander, sind jedoch nicht deckungsgleich. Charakteristisch für humorvolle Aktivitäten ist oft, dass ein Spielrahmen etabliert wird. Dabei kann auch ein »Theaterrahmen« (Kotthoff 1998, 2008: 170ff) erzeugt werden, in welchen – in der Begrifflichkeit der vorliegenden Arbeit – Äußerungen animiert werden. Spielerische Interaktionen können jedoch auch vollzogen werden, ohne humorvoll zu sein.17 Die Konzepte der Interaktionsmodalität und des Keyings fassen den Umstand, dass Sprecher in der Interaktion den Realitätsbezug der Äußerungen verändern und beispielsweise in spielerische Interaktion wechseln können. 15

16

17

Es gilt jedoch noch das von Schwitalla (2003: 169) aufgezeigte Desiderat einer diese Einzelarbeiten zusammenführenden und ggf. transzendierenden Typologie von Interaktionsmodalitäten. Neben den hier genannten Interaktionsmodalitäten werden in der Literatur unter anderem die folgenden angeführt: Forcieren (Kallmeyer/Schmitt 1996: 24), Pathos (Kotthoff 1996, 2000: 65), Kunstorientiertheit (Streeck 1994: 579), Groteske (Schwitalla 1995: 422), Empörung (Schwitalla 1995: 421), Entrüstung (Schwitalla 1995: 473), Betroffenheit (Schwitalla 1995: 422), spielerischer Angriff (Schwitalla 1994: 481), harmlose Berichtsmodalität bzw. Darstellungsmodalität (Kallmeyer/Schütze 1977), fraglose Sicherheit (Kallmeyer/Schmitt 1996: 205), Modus des Tatsächlichen, Modus einer zukünftigen Eventualität (Günthner 1997b: 113f). Die Bezeichnungen der humorvollen Interaktionsmodalität variieren zwischen Modalität ›Spaß‹ (Müller 1983: 289), scherzhafte oder spaßhafte Modalität (Schwitalla 1995: 370 und 473), spaßige Interaktionsmodalität (Günthner 1996: 100; Kotthoff 1998: 15), nichternste und komische Interaktionsmodalität (Kotthoff 1998: 106 und 167). Zur spielerischen Interaktionsmodalität vgl. auch Günthner (1996: 84), Keim (1995: 52) und Kotthoff (2008: 187).

26

Imagination als konversationelle Herstellung mentaler Räume

Anders als bei Schütz findet ein Übergang im Erlebnisstil nicht als Bruch statt, der als Schock erfahren wird, sondern wird vielmehr von den Interaktanten oft schrittweise hergestellt.18 Richtet man den Blick von der Bedeutsamkeit der Äußerungen wieder stärker auf das Erleben der Interaktanten, so kann mit Rückbezug auf Alfred Schütz formuliert werden, dass die Sprecher interaktionale Passagen, die durch eine veränderte Interaktionsmodalität gekennzeichnet sind, ebenfalls kurzzeitig als real wahrnehmen können. In Bezug auf die in der vorliegenden Arbeit untersuchten Aufführungen mentaler Räume bedeutet dies, dass die Interagierenden die konversationell hergestellte Vorstellung kurzzeitig erfahren können, als sei sie real. 2.1.4

Wahrnehmung und Performance

Eine Veränderung des individuellen und auch gemeinsamen Erlebens einer Situation wird in der anthropologischen Linguistik und der Theaterwissenschaft in Verbindung mit dem Begriff der Performance diskutiert. Ausgangspunkt bildet der Begriff performativ, der von John Longshaw Austin (1962) im Rahmen seiner Vorlesungen zur Sprechakttheorie eingeführt wurde. Dieser Begriff bezeichnet den Umstand, dass sprachliche Äußerungen »keineswegs nur dem Zweck dienen, einen Sachverhalt zu beschreiben oder eine Tatsache zu behaupten, sondern daß mit ihnen stets Handlungen vollzogen werden« (Fischer-Lichte 2002: 290). Indem ein Sprecher einen performativen Sprechakt tätigt und dabei die Gelingensbedingungen eines Sprechaktes erfüllt sind, verändert er soziale Realität. Performative Äußerungen haben damit eine wirklichkeitskonstitutive Funktion. Gleichzeitig sind performative Äußerungen selbstreferentiell. Anstatt auf Außersprachliches verweisen performative Äußerungen in ihrem Vollzug auf sich selbst: Sie referieren auf die Realität, die durch ihren Vollzug erst hergestellt wird. Von Austins Betrachtungen zur Performativität sprachlicher Handlungen wurden in verschieden Disziplinen Konzepte von Performance bzw. Performanz entwickelt, die jeweils unterschiedliche Aspekte in den Vordergrund stellen.19 So bestimmt Erika Fischer-Lichte drei generelle Verwendungsweisen: 18

19

So formuliert Schütze in Bezug auf die Modifikationen, dass »Garfinkel stärker als Schütz speziell am Vorgang der Abwandlung der natürlichen Einstellung interessiert ist« (Schütze in Garfinkel 1971: 231). Zur Abgrenzung der Begriffe Performance und Performativität vgl. u. a. Joannes Snoek (2003). Einen Überblick über verschiedene Konzepte von Performance geben unter anderen Uwe Wirth (2004), Richard Schechner (2002), Sybille Krämer und Marco Stahlhut (2001) und für die Theaterwissenschaft Erika Fischer-Lichte (2005a; Fischer-Lichte/Roselt 2001; Fischer-Lichte/Wulf 2001).

Imagination und mentale Versetzung

27

Der Begriff des Performativen – ebenso wie der der Performanz – bezieht sich auf (1) das wirksame Ausführen von Sprechakten, (2) das materiale Verkörpern von Bedeutungen und (3) das inszenierende Aufführen von theatralen, rituellen und anderen Handlungen. (Fischer-Lichte 2005b: 234)

Mit der rituellen Ausführung performativer Handlungen beschäftigt sich unter anderem die anthropologische Linguistik (Bauman 1986, 2001 [1977], 2005; Hymes 1981; Zumthor 1990). Nach Bauman ist eine Performance durch die Etablierung eines Rahmens im Sinne Goffmans gekennzeichnet, durch welchen festgelegt ist, in welcher Art und Weise Handlungen innerhalb des Rahmens zu interpretieren sind. Hier gilt es verschiedene konstitutive Elemente zu beachten. Der zentrale Aspekt einer Performance ist die Vorführung einer Handlung vor einem Publikum.20 Mit der Vorführung zeigt der Performer seine kommunikative Kompetenz, die Handlung kulturellen und/oder gruppenspezifischen Konventionen entsprechend durchzuführen (display of communicative competence), womit er dem Publikum gegenüber soziale Verantwortung übernimmt (responsibility to an audience). Die Vorführung ist damit gleichzeitig Gegenstand einer Bewertung durch das Publikum (subject to evaluation). Im Vordergrund steht dabei nicht der referentielle Inhalt der Handlung, sondern die Art und Weise ihrer Durchführung. Bauman spricht von »accountability to an audience for the way in which communication is carried out, above and beyond its referential content« (2001 [1977]: 169). Hier ist sowohl der Rückbezug auf die normgerechte Ausführung einer Handlung bei Austin, als auch eine konzeptionelle Erweiterung zu sehen: Ein zentrales Moment ist die Erlebnishaftigkeit einer Performance und ihre sinnliche Wahrnehmung durch das Publikum. Der Zuschauer wird nicht als vom Geschehen getrennt, sondern als in das Geschehen integriert betrachtet. Aus der Teilnahme an der Performance ergibt sich eine direkte Wirkung auf den Zuschauer, was Bauman als enhancement of experience bezeichnet. Additionally it [die Performance, O.E.] is marked for the enhancement of experience, through the present enjoyment of the intrinsic qualities of the act of expression itself. Performance thus calls forth special attention to and heightened awareness of the act of expression, and gives license to the audience to regard the act of expression and the performer with special intensity. (Bauman 2001 [1977]: 169)

20

Diese Auffassung vertritt u. a. auch die Theaterwissenschaftlerin und Performancetheoretikerin Erika Fischer-Lichte, die Performance als einen von vier Aspekten der Theatralität als »Darstellung durch Körper und Stimme vor körperlich anwesenden Zuschauern« (2000: 20) bestimmt (vgl. auch Fischer-Lichte 2002).

28

Imagination als konversationelle Herstellung mentaler Räume

Hierin wird der zweite, eingangs von Erika Fischer-Lichte benannte Aspekt des materialen Verkörperns von Bedeutungen in der Performance deutlich. So geht es in einer Performance insbesondere um die sinnliche Wahrnehmung der präsentierten Elemente in ihrer intrinsischen Qualität durch die Beteiligten. Der performative Effekt der Wahrnehmung ist dabei nicht als von der Semiose getrennt zu betrachten, sondern kann diese mit bedingen: Dabei ist festzuhalten, dass die Wahrnehmung derartiger sinnlicher Qualitäten oder die Auslösung physiologischer, affektiver, energetischer oder motorischer Veränderungen durchaus nicht von Prozessen der Bedeutungserzeugung abgekoppelt sein müssen. Sie können vielmehr in derartige Prozesse übergehen oder auch von ihnen ausgelöst werden: So, wenn ein bestimmter Laut, ein Lichtwechsel, ein Zittern in der Stimme oder die Eigenart einer Bewegung eine Assoziation oder Erinnerung hervorrufen, die einen bestimmten Affekt verursacht. (FischerLichte 2005b: 240)

Die Rolle des Zuschauers ist nicht lediglich auf die passive Wahrnehmung beschränkt. Vielmehr kann und muss er meist eine aktive Rolle für das Zustandekommen der Performance übernehmen. Nach Paul Zumthor (1990: 204) kann die Trennung von Agierenden/Darstellenden und Zuschauern/ Wahrnehmenden sogar aufgehoben sein, indem die Darsteller ihr eigenes Publikum bilden. Die Rollen von Produktion und Rezeption gehen somit ineinander über (vgl. auch Fischer-Lichte/Roselt 2001: 243). In der anthropologischen Linguistik werden unter anderem mündliche Erzählungen als Performance untersucht. Dies ist von besonderer Relevanz für die vorliegende Arbeit, da auch in solchen Interaktionen ein vergangenes – eventuell auch mystisches Ereignis – in einer solchen Weise präsentiert wird, dass die Beteiligten in die Performance eintauchen und diese miterleben. Damit wird ein vergangenes Ereignis – insbesondere durch die sprecherische Gestaltung – als etwas präsentiert, das die Wahrnehmung der aktuellen Gesprächssituation ›ersetzt‹. In der Gesprächforschung werden neben Alltagserzählungen auch Fiktionalisierungen als Performance untersucht (vgl. Kapitel 4.3.1). Für die vorliegende Arbeit ergibt sich insbesondere über die animierte Rede ein Anknüpfungspunkt zur Performance-Theorie: Indem Sprecher Äußerungen animieren, demonstrieren sie Handlungen, die einer Figur zugeschrieben werden können. In der Demonstration von Figurenhandlungen können den Anwesenden Vorgänge gegenwärtig und sinnlich wahrnehmbar gemacht werden. Durch die Möglichkeit der direkten Wahrnehmung kann dabei die Grenze zwischen Vorführung und Realität verschwimmen.

Ansatz zu einem semantisch-kognitiven Modell der Imagination

2.1.5

29

Zusammenfassung: Imagination und mentale Versetzung

In den bislang dargestellten Ansätzen wurde Imagination vor allem auf die Veränderung der Wahrnehmung und die mentale Versetzung in eine Vorstellung bezogen. In der Zusammenschau der sich ergänzenden Ansätze wurde deutlich, dass zwei Aspekte konstant, wenn auch teilweise mit verschiedenen Begrifflichkeiten, immer wieder auftauchen. Erstens wird Imagination nicht lediglich als individueller Prozess modelliert. Vielmehr handelt es sich um ein Phänomen, das sich in der direkten mündlichen Kommunikation widerspiegelt und interaktional hergestellt werden kann. Zweitens heben die jeweiligen Autoren hervor, dass die Wahrnehmung der Realität und die Imagination zwar getrennte Modi, Bewusstseinseinstellungen oder Erlebnisstile darstellen, zwischen diesen jedoch Übergänge bestehen. Solche Übergänge bzw. Veränderungen in der Wahrnehmung können eben auch durch sprecherische Mittel in der Interaktion hergestellt werden. Während damit vor allem auf das subjektive Erleben einer imaginierten Vorstellung eingegangen wurde, wird im folgenden Abschnitt behandelt, wie szenische Vorstellungen als semantische Struktur gefasst werden können.

2.2

Mentale Räume: Ansatz zu einem semantischkognitiven Modell der Imagination

Im Folgenden wird ein semantisch-kognitives Modell entwickelt, um den gemeinsamen Aufbau von Vorstellungen im Gespräch theoretisch zu fundieren. Zunächst werden kurz allgemeine theoretische Prämissen der kognitiven Linguistik erläutert (2.2.1). Hiervon ausgehend wird die Theorie der mentalen Räume (mental space theory) nach Gilles Fauconnier vorgestellt (2.2.2). Mentale Räume können bestimmt werden als lokal im Diskurs hergestellte mentale Repräsentationen szenisch strukturierter Zusammenhänge. In einem nächsten Schritt (2.2.3) wird die Theorie mentaler Räume durch das Diskursmodell von Ronald Langacker erweitert, das dieser im Rahmen der von ihm begründeten Kognitiven Grammatik entwickelt. Mit diesem Modell formuliert Langacker einen allgemeinen Rahmen für den Aufbau kognitiver Strukturen im Verlauf eines Gesprächs. Diese Strukturen können als Netz mentaler Räume im Sinne Fauconniers verstanden werden. Gleichzeitig geht das Diskursmodell Langackers über die Theorie mentaler Räume hinaus, indem die Zeitlichkeit des Gesprächs explizit einbezogen wird. Darüber hinaus hebt Langacker die zentrale Rolle der sprachlichen Perspektivität hervor und damit die grundsätzliche Möglichkeit, einen men-

30

Imagination als konversationelle Herstellung mentaler Räume

talen Raum über verschiedene sprachliche Mittel aufbauen zu können. Hieran setzt Kapitel 3 an, in welchem das symbolisierende Sprechen (der beschreibende Aufbau eines mentalen Raumes) und das demonstrierende Sprechen (die Animation einer Figur) als Formen der sprecherischen Gestaltung mentaler Räume unterschieden werden. 2.2.1

Einleitung: Kognitive Linguistik und Kognitive Semantik

Die Theorie mentaler Räume ist ein semantischer Ansatz aus dem Bereich der kognitiven Linguistik. Die kognitive Linguistik selbst ist ein relativ junges Forschungsfeld, das in den 1970er Jahren entstand und seitdem kontinuierlich weiterentwickelt wird. Bislang jedoch bietet die kognitive Linguistik keine einheitliche Theorie. Vielmehr handelt es sich um ein Forschungsfeld, dessen zentrale Ansätze und Konzepte ihre Eigenständigkeit bewahren. So schreibt Dirk Geeraerts, die kognitive Linguistik »constitutes a cluster of many partially overlapping approaches rather than a single well-defined theory that identifies in an all-or-none fashion whether something belongs to Cognitive Linguistics or not« (2006: 3). Die verschiedenen Ansätze teilen jedoch drei grundlegende Hypothesen: – language is not an autonomous cognitive faculty – grammar is conceptualization – knowledge of language emerges from language use (Croft/Cruse 2007: 1)

Die meisten Ansätze der kognitiven Linguistik sind dadurch gekennzeichnet, dass Grammatik und Semantik nicht strikt voneinander getrennt werden. In der kognitiven Semantik etwa wird Bedeutung als Aufbau temporärer kognitiver Strukturen im Verlauf eines Diskurses verstanden. Dies wird unter dem Begriff der Konzeptionalisierung gefasst, der damit nicht nur Begriffe wie Sinngebung und Semiose ersetzt. Vielmehr wird auch die Grammatik selbst mit Konzeptionalisierung gleichgesetzt. Anders als in der Interaktionalen Linguistik, in welcher Grammatik lediglich eine Ressource des Diskurses darstellt (vgl. Kapitel 1.3), ist Konzeptionalisierung – und damit auch Imagination – untrennbar mit der Grammatik verbunden. In Bezug auf die Kognitive Semantik formuliert Langacker die Gleichsetzung von Bedeutung und Konzeptionalisierung wie folgt: Meaning is equated with conceptualization. Linguistic semantics must therefore attempt the structural analysis and explicit description of abstract entities like thoughts and concepts. The term conceptualization is interpreted quite broadly: it encompasses novel conceptions as well as fixed concepts; sensory, kinesthetic, and emotive experience; recognition of the immediate context (social, physical,

Ansatz zu einem semantisch-kognitiven Modell der Imagination

31

and linguistic); and so on. Because conceptualization resides in cognitive processing, our ultimate objective must be to characterize the types of cognitive events whose occurrence constitutes a given mental experience. (Langacker 1986: 3)

In diesem Zitat wird deutlich, dass die kognitive Semantik nicht mehr lediglich die Semantik isolierter Begriffe bzw. Äußerungen betrachtet, sondern darauf zielt, mentale Erfahrungen (mental experience) zu erfassen. Gegenstand der Semantik sind damit nicht nur Wissensbestände im Langzeitgedächtnis, sondern es gilt vielmehr insbesondere die kognitiven Prozesse zu untersuchen, die während der Konzeptionalisierung ablaufen. Für diesen Gegenstand argumentieren Tsuyoshi Ono und Sandra A. Thompson: »We believe we can most easily observe actual cognitive processing of conceptualization in online discourse« (Ono/Thompson 1996: 394f). In der kognitiven Linguistik besteht Einigkeit darüber, den Prozess der Konzeptionalisierung so zu modellieren, dass durch die Rezeption von sprachlichen Ausdrücken Wissensbestände aktiviert werden. Sprachliche Elemente dienen als Anweisungen bzw. Anregungen, ad hoc kognitive Strukturen aufzubauen. Expressions do not mean; they are prompts for us to construct meanings by working with processes we already know. […] the words themselves say nothing independent of the richly detailed knowledge and powerful cognitive processes we bring to bear. (Turner 1991: 206)

Sprachliche Ausdrücke dienen lediglich als Ausgangspunkt für kognitive Prozesse der Bedeutungsherstellung und sind damit prinzipiell semantisch unterdeterminiert. Bedeutung entsteht erst durch den Prozess der Konzeptionalisierung auf kognitiver Ebene. […] sentences work as ›partial instructions‹ for the construction of complex but temporary conceptual domains, assembled as a result of ongoing discourse. (Evans/Green 2006: 363)

Damit geht einher, dass die Semantik linguistischer Ausdrücke im Diskurs nicht eindeutig bestimmt werden kann. Werden linguistische Ausdrücke lediglich als Anweisungen zur Konzeptualisierung betrachtet, so kann die Konzeptualisierung individuell unterschiedlich verlaufen.21 Die im Verlauf des Diskurses aufgebauten temporären kognitiven Strukturen können mit Gilles Fauconnier als mentale Räume gefasst werden.

21

Hieraus ergibt sich für die Untersuchung von Gesprächen das Problem, dass interindividuell unterschiedliche temporary conceptual domains aufgebaut werden, die der Analyse nicht direkt zugänglich sind. Zur Diskussion dieses methodischen Problems vgl. Kapitel 2.3.

32

Imagination als konversationelle Herstellung mentaler Räume

2.2.2

Die Theorie mentaler Räume

Mentale Räume sind szenische Vorstellungen, die Hörer ad hoc im Gespräch aufbauen. Dies geschieht, indem sie ausgehend von sprachlichen ›Prompts‹ Wissensbestände aus ihrem Hintergrundwissen aktivieren. Mit Rückgriff auf den Ansatz der Frame-Semantik, wie er von Charles Fillmore (1975, 1977, 1985, 2006 [1982]) entwickelt wurde, wird angenommen, dass situatives Wissen vornehmlich in Form von Frames gespeichert ist.22 [Frames, O.E.] are schematic representations of situations involving various participants, props, and other conceptual roles, each of which is a frame element (FE). (Fillmore/Johnson 2000: 56, im Original mit Hervorhebungen)

Frames sind Wissensbestände im individuellen Langzeitgedächtnis, die aufgrund von Erfahrungen mit der Alltagswelt gebildet werden. Sie enthalten situatives Handlungswissen auf unterschiedlichen Abstraktionsebenen und organisieren Elemente und Einheiten zu einer Szene (Fillmore 2006 [1982]: 377). Diese Szene bildet den semantischen Hintergrund für die Bedeutung einzelner lexikalischer Elemente. So ergibt sich beispielsweise die Bedeutung des Verbs kaufen innerhalb des Frames einer kommerziellen Transaktion. Dieser involviert als Handelnde einen Käufer und einen Verkäufer sowie eine Ware, für die bezahlt wird. Das Verb kaufen erhält seine Bedeutung vor dem Hintergrund des gesamten Frames, welcher durch die Verwendung des Verbs evoziert wird. Damit ist in vielen Fällen eine Perspektivität verbunden. Die Verben kaufen und verkaufen bezeichnen den Akt einer kommerziellen Transaktion jeweils vom Standpunkt des Käufers beziehungsweise des Verkäufers. Damit kann ein Frame durch verschiedene lexikalische Einheiten evoziert werden, die jeweils andere Aspekte des Frames hervorheben oder profilieren. Neben der linguistisch motivierten Entwicklung der Frame-Semantik wurden auch in anderen Disziplinen ähnliche Konzepte entwickelt. In der Künstlichen-Intelligenz-Forschung entwickelte Marvin Minsky (1975) das Konzept des Frames als Datenstruktur, um stereotype Situationen zu erfassen. Er versteht Frames als eine Slot-Filler-Struktur, welche die allgemeinen Eigenschaften eines Ereignisses erfasst. Zentrale Aspekte des Ereignisses werden dabei als Leerstellen konzeptionalisiert. Für den Frame einer Geburtstagsfeier sind dies beispielsweise Gäste, Essen und Geschenke. Bei der konkreten Realisierung eines Ereignisses werden die Leerstellen dann spezifisch gefüllt, die Leerstelle Essen beispielsweise durch Kuchen oder Eis. Die Aktivierung eines Frames schafft bei den an der Handlung beteilig22

Für eine Diskussion und Überblicksdarstellungen vgl. z. B. Deborah Tannen (1979) und Miriam Petruck (1996).

Ansatz zu einem semantisch-kognitiven Modell der Imagination

33

ten Personen entsprechende Erwartungen. Zentral für Minskys Ansatz ist, dass Leerstellen über Standardwerte verfügen. Ist in einer konkreten Situation keine Information über die tatsächliche Realisierung einer Leerstelle vorhanden, so werden die Standardwerte angenommen. In der kognitiven Psychologie entwickelten Roger Schank und Robert Abelson (1977) das Konzept der Skripts. Sie heben damit hervor, dass Wissen über soziale Situationen einen dynamischen Aspekt beinhaltet und modellieren Skripte als typisierte Abfolgen möglicher Handlungen in einer Situation. A script is a structure that describes appropriate sequences of events in a particular context. A script is made up of slots and requirements about what can fill those slots. The structure is an interconnected whole, and what is in one slot affects what can be in another. Scripts handle stylized everyday situations. They are not subject to much change nor do they provide apparatus for handling totally novel situations. Thus, a script is a predetermined, stereotyped sequence of actions that defines a well-known situation. (Schank/Abelson 1977: 41)

Skripte beinhalten Wissen darüber, wie Handlungen typischerweise zeitlich aufeinander folgen. Innerhalb eines Skriptes macht das Auftreten einer Handlung wahrscheinlich, dass eine bestimmte andere Handlung nachfolgt. Bei der konkreten Realisierung eines Skriptes können diese Standard-Handlungen realisiert oder von diesen abgewichen werden. Mit Bezug auf Fillmore (2006 [1982]) wird im Folgenden der Begriff Frame als Überbegriff für die genannten Konzepte verwendet.23 Frames bilden die statische Ressource für den ad hoc Aufbau temporärer mentaler Räume im Diskurs: Mentale Räume sind durch Frames ›organisiert‹. Nach Fauconnier (1997) werden mentale Räume als Kreise und Frames als Rechtecke dargestellt. Konkrete Elemente in einem mentalen Raum werden durch Linien mit den abstrakten Rollen innerhalb des Frames verbunden.

Abbildung 1: Mentaler Raum und Frame nach Fauconnier (1997: 12)

23

Als alternative Begriffe zu script benennt Fillmore (2006 [1982]) schema, scenario, ideational scaffolding, (idealized) cognitive model und folk theory. Eine ausführliche Diskussion gibt Deborah Tannen (1979).

34

Imagination als konversationelle Herstellung mentaler Räume

Die Beziehungen der Elemente innerhalb eines mentalen Raumes werden meist nicht nur durch ein einzelnes, sondern durch mehrere Frames organisiert. Diese können semantisch zueinander in Beziehung stehen, komplementär oder auch partiell inkompatibel sein. Der mentale Raum jedoch ist eine integrierte Einheit: A mental space consists of elements and relations activated simultaneously as a single integrated unit. (Fauconnier/Turner 2003: 104) In der Theorie mentaler Räume wird ein Element damit immer innerhalb eines szenischen Kontextes repräsentiert. Die Theorie mentaler Räume entstand Mitte der 1980er Jahre als Gegenreaktion auf die wahrheitskonditionale Semantik, in der die Wahrheit von linguistischen Ausdrücken innerhalb möglicher Welten betrachtet wird, die jedoch nicht in Beziehung zu einer realen Welt stehen (vgl. Lakoff 1996).24 Nach Auffassung der Theorie mentaler Räume jedoch existiert eine Realität. Diese wird ebenfalls als mentaler Raum verstanden und umfasst die »mutually known world of the interlocutors« (Croft/Cruse 2007: 33). Es handelt sich jedoch nicht um eine objektive Realität, die als Bezugspunkt formalsemantischer/wahrheitskonditionaler Kriterien dienen könnte, da die Realität als mentaler Raum ebenfalls Gegenstand der Konzeptionalisierung ist: It is important to notice that this space need not be true or real or actual in any way outside the cognizer’s (or cognizers’) understanding. Only as an interpreter’s understanding of something is it claimed to be very real. (Hougaard/Oakley 2008: 3)

Dabei werden in der Literatur unter anderem die folgenden Begriffe für den mentalen Raum der Realität verwendet: Real Space (Coulson 2000; Liddell 1995, 1996; Liddell/Metzger 1998; Sweetser 2000), Reality Space (Fauconnier 1994 [1985], 1997; Fujii 2008; Lakoff 1996; Pascual 2002a, 2008; Sweetser 1996), current discourse space (Langacker 2001), here and now space (Hougaard/ Oakley 2008), semiotic space (Brandt 2008; Oakley/Kaufer 2008) und grounding (Oakley/Coulson 2008; Pascual 2008). In den Begriffsbestimmungen werden unterschiedliche Schwerpunkte gesetzt.25 Beispielsweise tendiert Gilles Fauconnier mit seiner Definition von Realität – »the speaker’s mental representation of reality« (1994 [1985]: 15) – dazu, Realität als individuelle Reprä24

25

Nach George Lakoff entstand die Theorie mentaler Räume vor allem in Nachfolge der aus der Mode gekommenen formal-semantischen Counterpart-Theory von David Lewis: »[…] mental spaces replace possible worlds, Fauconnier’s ›connectors‹ replace Lewis’s counterpart relations, the reality space replaces the real world, and hypothetical spaces replace hypothetical worlds« (Lakoff 1996: 93). Für eine Diskussion vgl. u. a. Seana Coulson und Todd Oakley (2005) sowie Esther Pascual (2002b).

Ansatz zu einem semantisch-kognitiven Modell der Imagination

35

sentation zu fassen. Croft und Cruse (2007: 33 Zitat siehe oben) hingegen betrachten den Reality Space stärker als Ergebnis eines gemeinsamen kognitiven Prozesses.26 Unter Reality Space wird im folgenden die von den Sprechern geteilte mentale Repräsentation der aktuellen Kommunikationssituation verstanden, die sowohl deren räumlich-physischen Aspekte, soziale Rollen als auch interaktionale Aspekte der Handlungsorganisation wie beispielsweise Aktivitätstypen, konversationelle Gattungen und Ethnomethoden umfasst. In Bezug auf verbale Interaktionssituationen wird in der Kognitiven Semantik ein grundlegender Frame der Face-To-Face-Interaktion angenommen:27 […] two people talking in the same place at the same time evoke the cultural frame of a conversation, […] This frame […] is reflected by the syntax and vocabulary […]. (Fauconnier/Turner 1998a: 145)

Die Theorie mentaler Räume geht davon aus, dass im Verlauf des Diskurses verschiedene mentale Räume geöffnet werden können. Dabei entsteht ein Netz mentaler Räume (lattice of spaces), welches eine hierarchische Struktur aufweist. Mentale Räume sind auf verschiedene Weise verbunden, sodass Sprecher im Verlauf des Diskurses immer wieder auf zuvor aufgebaute mentale Räume zurückgreifen können. Dabei gilt ein mentaler Raum als Base Space. Dies ist der mentale Raum, der als Ausgangspunkt dient und von dem aus andere mentale Räume entwickelt werden: »the point from which discourse extends« (Hougaard/Oakley 2008: 19). In der ›klassischen‹ Theorie mentaler Räume kann ein beliebiger mentaler Raum als Base Space dienen. In neueren – insbesondere konversational ausgerichteten – Arbeiten dient der Reality Space als grundlegender Ausgangspunkt. The base space is thus a here-and-now space with respect to the unfolding discourse, not with respect to any real or possible world situation. (Hougaard/Oakley 2008: 3)

Ausgehend vom Reality Space können mentale Räume geöffnet und modifiziert werden. Nach Gilles Fauconnier werden mentale Räume durch sogenannte space builder etabliert, die er charakterisiert als »overt mechanisms which speakers can use to induce the hearer to set up a new mental space« (Sweetser/Fauconnier 1996: 10). Dabei bietet die Theorie mentaler Räume Lösungen für eine Reihe semantischer und logischer Phänomene, insbeson-

26 27

Zum Verhältnis von autonom-individueller und gemeinsamer Kognition vgl. Kapitel 2.3.1. Vgl. hierzu auch Line Brandt (2008: 115) und Gilles Fauconnier (1997: 158).

36

Imagination als konversationelle Herstellung mentaler Räume

dere bezüglich der Referenz sprachlicher Ausdrücke, was durch das folgende Beispiel erläutert werden soll:28 (a) The girl with the blue eyes has green eyes. (b) In Len’s painting, the girl with blue eyes has green eyes.

Während der isolierte Satz (a) einen logischen Widerspruch enthält, ist dies für Satz (b) nicht der Fall. Das Argument der Theorie mentaler Räume ist, dass durch den Ausdruck In Len’s painting ein mentaler Raum geöffnet wird, der vom Raum der Realität unterschieden werden kann. Für beide Räume wird angenommen, dass in diesem ein girl als Referent vorhanden ist.29

Abbildung 2: Identitätskonnektor

Zwar handelt es sich bei den beiden girls in den zwei Räumen nicht um dieselben Referenten, sie sind jedoch über einen Identitätskonnektor verbunden. Die Attribute green eyes und blue eyes beziehen sich damit auf Elemente in unterschiedlichen Räumen, weshalb Satz (b) nicht widersprüchlich ist. Die Verbindung von einander entsprechenden Elementen basiert auf dem grundlegenden kognitiven Prozess der Metonymie und wird in der Theorie mentaler Räume auch als mapping bezeichnet. Der Ansatz miteinander verbundener mentaler Räume kann auf ein breites Spektrum von Phänomenen übertragen werden (vgl. Fauconnier 1997). Während die Spacebuilder in Bezug auf die Funktion, einen mentalen Raum zu öffnen, eine homogene Gruppe sind, können in semantischer Hinsicht eine Vielzahl kognitiver Phänomene erfasst werden.

28

29

Das Beispiel ist in dieser Form Fauconnier (1994 [1985]: 12ff) entnommen und stammt ursprünglich von Ray Jackendoff (1975). Für beide Räume kann ein organisierender Frame Körper angenommen werden.

Ansatz zu einem semantisch-kognitiven Modell der Imagination

37

Spaces represent such diverse things as hypothetical scenarios, beliefs, quantified domains, thematically defined domains, fictional scenarios, and situations located in time and space. (Coulson 2001: 22)

Der Inhalt eines mentalen Raumes »can be anything at all« (Langacker 2001: 145). Damit entziehen sich mentale Räume einer klaren Klassifizierung. Häufig benannt werden die folgenden Domänen:30 – – – – – – –

zeitlich außerhalb des Hier-und-Jetzt verankerte Szenen allgemeingültige und generalisierte Zusammenhänge mediale Repräsentationen eines Handlungszusammenhangs kontrafaktische und negierte Zusammenhänge hypothetische und konditionale Szenen fiktionale Zusammenhänge, Spiele und make-believe Vorstellungen und Überzeugungen von Personen

Im Gespräch können mentale Räume damit mit verschiedenen Aktivitäten in Bezug gesetzt werden. So kann die Storyworld einer Erzählung als temporal in der Vergangenheit verankerter Raum verstanden werden. Beim Planen zukünftiger Handlungen entwerfen die Sprecher in der Zukunft verankerte Räume, die oft konditionalen Charakter haben. Im Bezug auf konditionale Räume kann dieser Status als epistemische Distanz, die Wahrscheinlichkeit eines Ereignisses oder Zustandes in Bezug auf die Realität, bezeichnet werden: »Epistemic distance is the ›reality‹ status of one space with respect to another« (Fauconnier 1997: 72).31 Aber auch die in gemeinsamen Fiktionalisierungen aufgebauten szenischen Vorstellungen können als mentaler Raum gefasst werden. Nach Auffassung der Theorie mentaler Räume werden für alle diese im Diskurs hergestellten Vorstellungen ähnliche kognitive Repräsentationen aufgebaut. Der Wirklichkeitsstatus, der einem mentalen Raum in Bezug auf den Reality Space zukommt, wird ihm im Diskurs von den Sprechern zugeschrieben. Dies ist eine Funktion der Spacebuilder, die sich hinsichtlich ihres grammatischen Status stark unterscheiden:

30

31

Die Liste ist eine Synopse aus Fauconnier (1994 [1985]) und Sweetser/Fauconnier (1996). An anderer Stelle spricht Fauconnier auch von einer Unvereinbarkeit verschiedener Räume und der Notwendigkeit, verschiedene Typen zu unterscheiden: »[…] note the importance of assessing and marking various types of mental space incompatibilities and the status of structure in one space with respect to another (›real,‹ ›hypothetical,‹ ›counterfactual,‹ shared presuppositions, shared belief and so on.)« (Fauconnier 1994 [1985]: xli).

38

Imagination als konversationelle Herstellung mentaler Räume […] space-builders may be prepositional phrases (in the picture, in John’s mind, in 1929, at the factory, from her point of view), adverbs (really, probably, possibly, theoretically), connectives (if A then, either __ or __ ), underlying subject-verb combinations (Max believes___, Mary hopes___, Gertrude claims___). (Fauconnier 1994 [1985]: 17)

Mentale Räume können jedoch nicht nur durch explizite Spacebuilder geöffnet werden. Vielmehr ist davon auszugehen, dass Sprecher im Diskurs mentale Räume implizit öffnen: The need for new spaces can be prompted either explicitly by space builders or implicitly by the knowledge of the current importance of an alternative domain of reference. (Coulson 2001: 22; Hervorhebung im Original)

Oft sind zwar semantische oder grammatische Hinweise vorhanden, in vielen Fällen jedoch ist der Prozess der Etablierung eines mentalen Raumes auf der sprachlichen Seite unterdeterminiert und kann von den Beteiligten lediglich aufgrund ihres gemeinsamen Hintergrundwissens erschlossen werden. Während Spacebuilder dazu dienen, mentale Räume zu öffnen und (teilweise) deren Bezug auf die Realität festzulegen, geben sie jedoch relativ wenig Information über den Inhalt des mentalen Raumes. Dieser stammt aus dem Hintergrundwissen und den aktivierten Frames. Im Verlauf des Diskurses können geöffnete mentale Räume modifiziert werden. So können neue Elemente eingeführt oder durch die Etablierung neuer Frames die Beziehung zwischen den Elementen verändert werden. Dabei können mentale Räume im Diskurs mehr oder weniger stark ausgebaut sein. Die Szene kann sehr detailliert sein oder auch nur einzelne szenische Aspekte beinhalten. Konzeptualisierung ist somit ein dynamischer Prozess, in dem Sprecher auf ihr Frame-Wissen zurückgreifen. In the absence of an explicit context, speakers will create one for themselves based on their knowledge of typical situations and their default values. (Coulson 2001: 25)

Ausgehend von lediglich wenig sprachlichem ›Material‹ können Interagierende im Gespräch komplexe mentale Räume aufbauen, indem Wissen aus Frames aktiviert wird. Für sprachlich ›nicht gegebene‹ Aspekte werden Information aus dem Frame ergänzt. Durch den Rückgriff auf Frame-Wissen und in diesen angelegten Standardwerte sind mentale Räume kohärent: Mentale Räume beinhalten Vorstellungen kompletter Szenen. In analytischer Perspektive bedeutet dies, dass Äußerungen lediglich »the tip of the iceberg of cognitive construction« (Fauconnier 1994 [1985]: xxii) sind. Auf der sprachlichen Oberfläche manifestiert sich nur ein Teil der während der Konzeptualisierung beim den Interagierenden ablaufenden backstage cognition (Fauconnier 1994 [1985], 1997).

Ansatz zu einem semantisch-kognitiven Modell der Imagination

39

Mit der Theorie mentaler Räume können szenische Vorstellungen, die sich in ihrem Bezug auf die Realität stark unterscheiden – also ob es sich um mögliche zukünftige, vergangene, generische, fiktionale, negierte oder andere Vorstellungen handelt – innerhalb eines theoretischen Rahmens betrachtet werden. Da die Theorie mentaler Räume ursprünglich vor allem auf die Lösung semantischer Referenzprobleme zielte, ist der Bereich der sequentiellen Entwicklung von mentalen Räumen im Diskurs – obwohl Fauconnier dies postuliert – kaum modelliert. Hierfür wird in der vorliegenden Arbeit auf den Ansatz der Kognitiven Grammatik zurückgegriffen. 2.2.3

Mentale Räume und Kognitive Grammatik

Die Kognitive Grammatik (Cognitive Grammar) ist ein zentraler Forschungsansatz der kognitiven Linguistik.32 Die Grundlage bilden die Arbeiten von Ronald Langacker seit den 1970er Jahren.33 In einem traditionellen bzw. deskriptiven Verständnis umfasst der Begriff Grammatik die linguistischen Ebenen Syntax und Morphologie. Die Kognitive Grammatik hingegen – wie auch andere kognitive Sprachansätze – versteht unter Grammatik eine generelle Theorie von Sprache (vgl. Broccias 2006). Während innerhalb der Kognitiven Grammatik eine Vielzahl von Gegenständen bearbeitet wurde, sind für die vorliegende Arbeit vor allem die grundlegenden theoretischen Prämissen des Ansatzes relevant. Nach Langacker (2001: 185) ist das zentrale Anliegen der Kognitiven Grammatik die Beschreibung des Verhältnisses von kognitiven Strukturen und Interaktion. Er formuliert hierzu ein Modell zur Erfassung der zeitlichen Entwicklung konzeptuellen Inhalts im Verlauf des Diskurses. Die Verbindung zur Theorie mentaler Räume besteht darin, dass der konzeptuelle Inhalt im Sinne Langackers als mentaler Raum beziehungsweise als Netz sich im Diskurs entwickelnder mentaler Räume verstanden werden kann (Langacker 2001: 185, 2002b: 30). In der folgenden Darstellung des Diskursmodells der Kognitiven Grammatik werden vor allem solche Aspekte behandelt, die für eine Übertragung der Theorie mentaler Räume auf Gespräche relevant sind: Zeitlichkeit und Perspektivität.

32

33

Die Schreibung von Kognitiver Grammatik mit Majuskeln dient zum Verweis auf den spezifischen Theorieansatz Langackers in Abhebung von anderen kognitiven Ansätzen, die ebenfalls Grammatik modellieren. Vgl. u. a. Langacker (1982, 1986, 1987, 1990, 1991, 1993, 1996, 1999a, 2001, 2002a, 2002b, 2006, 2007, 2008).

40

Imagination als konversationelle Herstellung mentaler Räume

Grundlegende Rahmenbedingung des Diskurses ist die Zeitlichkeit des Sprechens. Während des Sprechens verändert sich die Sprechsituation kontinuierlich. Die Kognitive Grammatik modelliert diesen kontinuierlichen Wandel als Abfolge von Sprechereignissen (usage events).34 Ein Sprechereignis findet vor dem gemeinsamen Hintergrundwissen der Beteiligten statt und ist in den Kontext des Gesprächs eingebettet: A usage event takes place in an immediate context of speech, interpreted broadly as including the physical, mental, social, and cultural circumstances. The ground is at the center of the context of speech, and one element of this context is the very fact that the speaker and hearer are engaged in a coordinated viewing of some facet of the world. (Langacker 2001: 145)

Der gegenwärtige Diskursraum (current discourse space) umfasst direkt vorangegangene Sprechereignisse sowie Erwartungen über den möglichen weiteren Verlauf des Gesprächs, d. h. antizipierte bzw. projizierte Sprechereignisse. Die folgende Abbildung veranschaulicht dieses Modell.

Abbildung 3: Diskursmodell aus Langacker (2001: 145)

Langacker bestimmt den gegenwärtigen Diskursraum auch als mentalen Raum, den die Sprecher zu einem bestimmten Moment des Diskurses teilen. 34

Der Begriff usage event wird hier als ›Sprechereignis‹ ins Deutsche übersetzt, da Langacker von einem mündliches Kommunikationsereignis zwischen Sprecher und Hörer ausgeht: »A usage event is an action carried out by the speaker and hearer« (Langacker 2001: 144). Dies schließt jedoch nicht aus, dass mit usage event auch ein schriftliches Kommunikationsereignis gemeint sein kann, zumal Langacker selbst meist konstruierte schriftliche Beispiele analysiert.

Ansatz zu einem semantisch-kognitiven Modell der Imagination

41

The CDS [current discourse space, O.E.] is defined as the mental space comprising those elements and relations construed as being shared by the speaker and hearer as a basis for communication at a given moment in the flow of discourse. (Langacker 2001: 144)

Im Sinne einer Verbindung der Kognitiven Grammatik mit der Theorie mentaler Räume ist es jedoch sinnvoll, den gegenwärtigen Diskursraum nicht als einen mentalen Raum, sondern vielmehr als Netz von miteinander in Beziehung stehenden mentalen Räumen zu verstehen. Dieses Netz mentaler Räume bzw. dieser konzeptuelle Inhalt wird in der Abfolge von Sprechereignissen kontinuierlich verändert. Einzelne Äußerungen werden als Anweisungen gesehen, neuen konzeptuellen Inhalt hinzuzufügen bzw. bestehenden Inhalt zu verändern (Langacker 2001: 143).35 Neuer Inhalt wird meist so hinzugefügt, dass er in die bereits vorhandene Struktur eingefügt werden kann (Langacker 2001: 171f). Dies ist jedoch nicht zwingend der Fall, da auch neue Strukturen begonnen bzw. zuvor begonnene Strukturen fortgesetzt werden können. Structures can be assembled and developed in distinct channels, worlds, or mental spaces, either successively or by shifting back and forth between them. They may or may not be linked together, even when their presentation in the discourse is interspersed […]. Moreover, at any point in a discourse we can stop working on one structure and start building another. (Langacker 2001: 177)

Der Gegenstand des konzeptuellen Inhaltes ist dabei völlig frei: »the content of their coordinated conception – can be anything at all. We are able to conceive and talk about situations in world (real or imagined), at any time, in any place« (Langacker 2001: 145). Dass der aktuelle Gesprächskontext (in Langackers Terminologie der ground) zum Gegenstand des Gesprächs wird, die Sprecher also in das situative Sprechen bzw. den situated mode oder den immediate mode nach Auer und Chafe wechseln,36 bezeichnet Langacker als einen speziellen, wenn auch privilegierten Fall dieser generellen Möglichkeit. Dabei besteht eine Beschränkung, wie viel konzeptuellen Inhalt ein Gesprächsteilnehmer zu einem gegebenen Moment präsent haben kann bzw. wie viel konzeptueller Inhalt »on stage« (Langacker 2001: 146) sein kann. Als eine Konsequenz der Zeitlichkeit des Gesprächs rückt mit einem neuen Sprechereignis der jeweils mit der Äußerung neu hinzugefügte konzeptionelle Inhalt in den Fokus der Aufmerksamkeit der Interaktionsteilnehmer; bereits vorhandener konzeptueller Inhalt rückt in den Hintergrund. Ana35

36

Der viewing frame auf der konzeptionellen Seite des Diskursmodells wird auf der Formseite in Rückbezug auf Chafe (2001) mit Intonationsphrasen gleichgesetzt. Vgl. Kapitel 2.1.1.

42

Imagination als konversationelle Herstellung mentaler Räume

log zum Begriff des Fokus und der Begrenzung des Bewusstseins bei Chafe (2001) formuliert Langacker: […] we have a limited ›conceptual field‹, delimiting how much we can conceptualize or hold in mind at any given instant. Metaphorically, it is as if we are ›looking at‹ the world through a window, or viewing frame. (Langacker 2001: 144f)

Das window of attention bzw. der viewing frame – Langacker verwendet die Begriffe synonym – stellt demnach einen Ausschnitt aus dem gesamten konzeptuellen Inhalt des gegenwärtigen Diskursraumes zu einem bestimmten Zeitpunkt dar. Im zeitlichen Fluss des Diskurses wandert dieses Fenster. Die visuelle Metapher des Fensters steht damit zum einen für die Begrenzung des Umfangs an aktuell präsentem konzeptuellen Inhalt: Sprecher fokussieren zu einem gegebenen Zeitpunkt auf bestimmte Aspekte einer konzeptuellen Struktur. Zum anderen spiegelt sich in dieser Metapher eine weitere Grundannahme der Kognitiven Grammatik wider: die Perspektivität der Sprache. Perspektivität ist in der Auffassung der Kognitiven Grammatik die menschliche Fähigkeit, eine Situation auf unterschiedliche Weisen zu konzeptualisieren: [Cognitive Grammar is, O.E.] founded on a view of meaning that acknowledges its conceptual basis and fully accommodated our capacity for construing a situation in alternate ways (e.g. as seen from different perspectives). (Langacker 2002a: 1)

Die Metapher des viewing frame erfasst die sprachliche Perspektivität insofern, als durch ein Fenster nicht nur der zu sehende Ausschnitt beschränkt ist, sondern mit einem Fenster gleichzeitig eine bestimmte (visuelle) Perspektive festgelegt wird. Perspektivität ist in dieser Formulierung eine grundsätzliche Bedingung der Sprachverwendung. In sprachlichen Äußerungen sind notwendigerweise eine oder ggf. mehrere Perspektiven integriert. Der konzeptionelle Inhalt des current discourse space ist nach Langacker nur durch den viewing frame zugänglich. Durch ein Sprechereignis wird dem current discourse space also nicht lediglich neuer konzeptueller Inhalt hinzugefügt bzw. bestehender Inhalt verändert. Vielmehr wird dieser Inhalt aus einer bestimmten Perspektive hinzugefügt oder eine bestimmte Perspektive im Gespräch etabliert.37 Das Modell basiert damit auf der Unterscheidung eines ›objektiven Inhalts‹ (conceived situation, given scene) auf kognitiver Ebene und dessen notwen37

In den Metaphern Fenster, Perspektive und sichtbare Szene wird Langackers visuelle Modellierung des Denkens deutlich. Sprachliche Ausdrücke werden szenisch und vor allem szenisch visuell verstanden.

Ansatz zu einem semantisch-kognitiven Modell der Imagination

43

digerweise perspektivischen sprachlichen Formulierung. Diese grundsätzliche sprachliche Fähigkeit bezeichnet Langacker als imagery, was in etwa mit ›Bildhaftigkeit‹ übersetzt werden kann. I use the term imagery for our ability to construe and portray a conceived situation in alternate ways. (Langacker 1991: 275f)

Ein und dieselbe Szene bzw. ein und derselbe mentale Raum kann damit durch unterschiedliche Bilder (images) strukturiert werden. Eine grundlegende Fähigkeit der Menschen ist es, mit großer Leichtigkeit zwischen alternativen Modi des imagery zu wechseln. Hierfür stellt jede Einzelsprache eine Reihe von Bildern bzw. bildhafter Mittel zur Verfügung, die sowohl in abstrakten grammatischen Strukturen als auch in einzelnen symbolischen Elementen angelegt sein können. Langacker (2002) benennt allgemein fünf Dimensionen des imagery: Grad an Spezifität und Details, Maßstab, Hintergrundannahmen, Prominenz und Perspektive.38 Lediglich auf die beiden letzteren soll hier eingegangen werden, da diese für die vorliegende Arbeit von unmittelbarer Relevanz sind. Zur Prominenz zählt Langacker als erstes die Profilierung. Hierunter ist zu verstehen, dass ein sprachlicher Ausdruck immer ein umfassendes Konzept evoziert, vor dessen Hintergrund ein singulärer Aspekt desselben (eine Substruktur) hervorgehoben wird. […] within its scope (the array of conceptual content it evokes), every expression singles out a particular substructure as a kind of focal point; this substructure – the profile – can be characterized as the entity which the expression designates. (Langacker 2002a: 4)

Beispielsweise kann der Begriff Hypotenuse nur vor dem Hintergrund des Konzeptes eines rechtwinkligen Dreiecks verstanden werden. Gleichzeitig profiliert der Begriff Hypotenuse einen bestimmen Aspekt des übergeordneten Konzeptes rechtwinkliges Dreieck. Dasselbe gilt etwa für den Begriff Onkel, der nur vor dem Hintergrund des Schemas Verwandtschaftsbeziehungen verstanden werden kann. Der zweite Aspekt der Prominenz umfasst die Wahl eines Referenzpunktes in einer Relation. Consider the semantic contrast between X is near Y and Y is near X, which evoke the same conceptual content and profile the same relationship. What, then, is the nature of their difference? In X is near Y, the concern is with locating X – which is thus the figure within the profiled relationship – and Y is invoked as a reference 38

Langacker integriert hierbei Ansätze aus verschiedenen Bereichen der Semantik. Hierunter ist vieles, was unter dem Thema Deixis, insbesondere in Charles Fillmores (1971, 1977, 1985, 1997, 2006 [1982]) Studien zur Verbsemantik behandelt wurde.

44

Imagination als konversationelle Herstellung mentaler Räume point for this purpose. The reverse is true in Y is near X. Adopting the term trajector (tr) for the relational figure, and landmark (lm) for an additional salient participant, we can say that the two expressions impose alternate trajector/landmark alignments on the scene they invoke. Their subtle semantic contrast does not reside in conceptual content (or truth conditions), but is rather a matter of construal (choice of relational figure). (Langacker 2002a: 5)

Mit den Ausdrücken X ist neben Y und Y ist neben X wird demnach ein und dieselbe lokale Relation zwischen zwei Objekten auf unterschiedliche Weise ausgedrückt, je nachdem welches als Referenzpunkt (landmark) gewählt wird und welches als Element, das zu diesem in Beziehung gesetzt wird (trajector).39 Als weitere Form des imagery bestimmt Langacker die Wahl einer Perspektive. The final aspect of construal, perspective, includes such factors as vantage point and orientation. Their linguistic relevance is apparent from an expression such as Jack is to the left of Jill, whose interpretation depends on whether, for purposes of determining left vs. right, the speaker adopts his own vantage point or Jill’s, and also on which way they are facing. (Langacker 2002a: 6)

Bei der Perspektivität wird dabei die Origo des Sprechers als Referenzpunkt und das Körpertastbild einbezogen. Zwar wird anhand der von Langacker gegebenen Beispiele nicht explizit deutlich, wie Perspektive und Wahl eines Referenzpunktes unterschieden werden können. Jedoch bietet die Kognitive Grammatik einen geeigneten Ausgangspunkt, um die in der vorliegenden Arbeit vorgenommene Unterscheidung der beiden semiotischen Modi des Symbolisierens und des Demonstrierens von Vorgängen in mentalen Räumen als unterschiedliche Formen des imagery/der Bildhaftigkeit zu fassen (vgl. Kapitel 3). Zusammengefasst ist das Diskursmodell Ronald Langackers für die in der vorliegenden Arbeit untersuchte Entwicklung mentaler Räume im Gespräch relevant, da es insbesondere in zwei Punkten über die Theorie mentaler Räume bei Fauconnier hinausgeht: – Erstens hebt Langacker die Zeitlichkeit hervor und fokussiert damit auf die Veränderung eines mentalen Raumes im Gesprächsverlauf. Er modelliert dies – ganz ähnlich wie Chafe – in der Weise, dass zu einem bestimmten Zeitpunkt immer nur ein Teil einer Vorstellung on stage bzw. innerhalb des viewing frame ist. Auch wenn im Verlauf des Gesprächs zuvor aufgebauter konzeptueller Inhalt in den Hintergrund rückt, so kann zu 39

Der dritte Aspekt der Prominenz besteht darin, dass explizit benannte Elemente salienter sind als solche, auf die indirekt etwa durch ein Pronomen referiert wird.

Ansatz zu einem semantisch-kognitiven Modell der Imagination

45

einem späteren Zeitpunkt immer wieder auf diesen zurückgegriffen werden, wodurch auch der Zugriff auf in Netzwerken verbundene Strukturen des Hintergrundwissens erleichtert wird. – Zweitens geht Langacker von der Bildhaftigkeit und der Perspektivität des Sprechens aus. Damit bestimmt er gleichzeitig die szenischen Vorstellung als Grundbedingung der Sprache, was er an anderer Stelle auch als Virtualität bzw. virtual reality bezeichnet (1999b). Langacker hebt hervor, dass ein im Diskurs aufgebauter mentaler Raum, der objektiv dieselbe Szene repräsentiert, durch verschiedene sprachliche Mittel bzw. verschiedene Formen des imagery konstruiert werden kann, wodurch sich teilweise subtile semantische Unterschiede ergeben. Der symbolisierende Modus und der demonstrierende Modus (die animierte Rede) stellten solche alternative Formen des imagery dar. 2.2.4

Zusammenfassung: Mentale Räume

Imagination wird in der vorliegenden Arbeit als die Herstellung mentaler Räume im Gespräch verstanden. Mentale Räume sind ad hoc im Verlauf eines Diskurses aufgebaute kognitive Repräsentationen von Szenen. Sprachliche Elemente und andere Kontextualisierungshinweise dienen Sprechern als Anweisungen, situatives Wissen – das in Form von Frames bzw. kognitiven Modellen im Langzeitgedächtnis gespeichert ist – zu aktivieren und entsprechende Vorstellungen aufzubauen. Ausgehend von der aktuellen Kommunikationssituation – die als Reality Space verstanden wird – können Spacebuilder weitere mentale Räume öffnen. Mentale Räume sind keine statischen Strukturen, sondern können im Verlauf des Gesprächs von den Sprechern verändert werden. Zu einem gegebenen Zeitpunkt im Gespräch ist lediglich ein bestimmter Teil eines mentalen Raumes im Vordergrund bzw. on stage. Jedoch können Sprecher immer wieder auf zuvor aufgebaute mentale Räume oder mit diesen verbundenem Hintergrundwissen zurückgreifen, was eine Ressource für Kreativität darstellt.40 Mentale Räume sind prinzipiell in gleicher Weise (szenisch) strukturiert, unterscheiden sich jedoch erstens darin, welcher Wirklichkeits-Status ihnen von den Sprechern in Bezug auf den Reality Space zugesprochen wird (rekonstruktiv, möglich, kontrafaktisch, fiktional, …). Zweitens können mentale Räume mehr oder weniger ausgestaltet sein, etwa in Bezug auf ihre deiktische Verankerung und die Akteure oder Figuren innerhalb der Räume. Da mentale Räume jedoch durch Hintergrundwissen – als sedimentierte und 40

Vgl. hierzu insbesondere Kapitel 4.3.3.

46

Imagination als konversationelle Herstellung mentaler Räume

abstrahierte Erfahrungen mit der Welt – strukturiert sind, sind sie nie unvollständig. Die Theorie mentaler Räume ist damit geeignet, die Entwicklung solcher szenischer Vorstellungen im Gespräch gemeinsam zu betrachten, die auf interaktionaler Ebene eher heterogen sind. Dies gilt sowohl für die Länge der interaktionalen Entwicklung – mentale Räume können von den Interaktanten sowohl über lange Strecken des Gesprächs gemeinsam ausgestaltet werden oder auch nur von einem Sprecher evoziert werden – als auch für den Status, welcher der Vorstellung in Bezug auf die Realität zugeschrieben wird.

2.3

Mentale Räume in der Interaktion

In methodischer Hinsicht stellt sich für die vorliegende Arbeit das Problem der qualitativ empirischen Beschäftigung mit einem mental-kognitiven Phänomen: Wie kann der gemeinsame Aufbau einer szenischen Vorstellung bzw. eines mentalen Raumes im Gespräch nachgewiesen werden? Bislang fand eine Übertragung der Theorie mentaler Räume auf Gespräche lediglich in Ansätzen statt, wie etwa in einigen der Beiträge in dem 2008 erschienen Sammelband von Todd Oakley und Anders Hougaard.41 Aber auch hier finden sich kaum mikroanalytische Untersuchungen, welche die Zeitlichkeit der Entstehung mentaler Räume im sequentiellen Verlauf des Gesprächs und die interaktionale Herstellung des mentalen Raumes als gemeinsames Produkt der Beteiligten ernst nehmen. In der vorliegenden Arbeit wird hierfür als Methode auf die Interaktionale Linguistik in Verbindung mit der Konversationsanalyse zurückgegriffen (vgl. Kapitel 1.3). Für Verbindung dieser gesprächsanalytischen Ansätze mit der Theorie mentaler Räume werden im Folgenden drei grundsätzliche Aspekte diskutiert: – Während Kognition oft als individuell-autonomer Prozess betrachtet wird, geht es in der vorliegenden Arbeit um den Aufbau gemeinsamer Vorstellungen und damit um shared cognition. – Hiervon ausgehend muss die Theorie mentaler Räume reflektiert werden, die jeglichen mentalen Raum per se als von den Interaktanten geteilten mentalen Raum auffasst. Insbesondere gilt es hier, das Verhältnis eines mentalen Raumes als kognitiver Struktur und dessen sprachlicher Manifestation im Diskurs genauer zu betrachten. 41

Ansätze finden sich auch schon bei Anders Hougaard (2005a, 2005b) und Ester Pascual (2002a, 2002b, 2006a, 2006b).

Mentale Räume in der Interaktion

47

– Mit der Konversationsanalyse und der Interaktionalen Linguistik wird auf Ansätze zurückgegriffen, die ursprünglich nicht zur Analyse mentaler, sondern interaktionaler und sozialer Prozesse entwickelt wurden. Für eine Verbindung mit der kognitiven Linguistik müssen die Prämissen der Ansätze, aber auch ihre möglichen Leistungen und Grenzen betrachtet werden. 2.3.1

Autonome und gemeinsame Kognition

Ausgangspunkt der meisten kognitiven Ansätze ist, mentale Prozesse im Bewusstsein bzw. – je nach theoretischer Ausrichtung – im Gehirn eines einzelnen Menschen zu verorten. Beispielsweise postuliert George Lakoff als prominenter Vertreter der kognitiven Linguistik in seiner neural theory of language, dass sich Gehirnstrukturen direkt auf die Sprache auswirken: »linguistic structure reflects brain structure« (Dodge/Lakoff 2005: 86). Gegen eine solche Auffassung von autonomous minds wurde verschiedentlich Kritik geäußert (vgl. u. a. Edwards 1997; Linell 1998; Rohrer 2006). So formuliert Tim Rohrer in Bezug auf die körperliche Repräsentation der Kognition: »even brain structures are not isolated, static entities, but are embedded within a nervous system and body that interacts with both physical and sociocultural space« (2006: 121). Damit wird die soziale und interaktionale Bedingtheit der Kognition, vermittelt über Gehirnstrukturen, hervorgehoben. Auch Tuija Virtanen (2004) konstatiert in jüngster Zeit eine stärkere Zuwendung zu sozialen und kulturellen Faktoren der Kognition und die Verteilung des Wissenshaushaltes einer Gesellschaft auf ihre Mitglieder, womit von distributed oder social cognition gesprochen werden könne. Hiermit geht gleichzeitig eine stärkere Beachtung der Interaktion und des tatsächlichen Sprachgebrauchs einher. Als einer der prominentesten Vertreter dieses Richtung formuliert Derek Edwards: »cognition is […] clearly a cultural and discursive matter« (1997: 28). Dabei werden nach Virtanen (2004) in der Diskurslinguistik textueller, situativer und soziokultureller Kontext unterschieden. Diese drei Ebenen des Kontextes können in der kognitiven Linguistik als zwar unterschiedliche, aber gleichzeitig aktivierte mentale Repräsentationen verstanden werden, womit die Kognition eine integrative Ebene darstellt. Das entscheidende Verbindungsglied zwischen den Ebenen ist die in der Interaktion entstehende Intersubjektivität im koordinierten Handeln: The focus on distributed cognition highlights the kind of intersubjectivity that emerges through interaction both locally in a particular situational context and on a macro-level in a particular culture and across cultures. (Virtanen 2004: 5)

48

Imagination als konversationelle Herstellung mentaler Räume

Dementsprechend wird in der vorliegenden Arbeit unter gemeinsamer Kognition (shared cognition) nicht lediglich der den Mitgliedern einer sozialen oder kulturellen Gruppe gemeinsame Wissensbestand (shared knowledge), sondern vielmehr die situativ gemeinsame Aktualisierung dieses Wissens und der lokale Aufbau einer gemeinsamen semantischen Struktur verstanden. Während die Ergebnisse der frühen kognitiven Linguistik vor allem durch Introspektion gewonnen wurden, hat in jüngster Zeit eine empirische Neuausrichtung stattgefunden (vgl. die Beiträge in Gonzalez-Marquez/Mittelberg et al. 2007). Dabei werden vor allem experimentelle Methoden und statistisch-quantitative Korpusanalysen eingesetzt. Die Methoden zielen damit entweder auf Untersuchung individueller Verarbeitungsprozesse oder abstrahieren vom konkreten Verwendungskontext. Die interaktionale Herstellung von shared cognition in realen Gesprächsituationen und ihre Gründung im Handeln der Beteiligten wird dabei kaum betrachtet. Im Folgenden wird diskutiert, inwiefern die Theorie mentaler Räume in methodischer Hinsicht mit einer Auffassung von Kognition als im Gespräch verorteten Prozess gemeinsamer Bedeutungskonstitution kompatibel ist. 2.3.2

Mentale Räume und Diskurs

In den Arbeiten zur Theorie mentaler Räume und auch in der Kognitiven Grammatik wurden bislang vor allem konstruierte schriftliche Beispiele in Form von Einzelsätzen oder kurzen Textabschnitten untersucht. Ausgehend von einem ›gegebenen‹ Text wird ein mentaler Raum oder ein Netz mentaler Räume als Analyseergebnis rekonstruiert. Die Analyse zielt dabei auf den mentalen Raum als Produkt und nicht auf den (interaktionalen) Prozess der Herstellung. Hieraus ergeben sich weitreichende Konsequenzen für eine mögliche Übertragung des Ansatzes auf Gespräche. Mit der Wahl schriftlicher Texte wird lediglich ein Teil des semiotischen Prozesses in den Blick genommen: die Rezeption. Die Entstehung bzw. die Produktion des Textes wird hingegen nicht betrachtet, sondern dieser vielmehr als gegeben angenommen. Dabei werden vor allem solche Texte gewählt, für deren Verständnis kein gruppenspezifisches Hintergrundwissen notwendig ist. Es handelt sich meist um monologische Texte, die einem einzigen Autor zugeschrieben werden und nicht um dialogische (etwa dramatische) Texte, in denen mehrere Sprecher, Autoren oder Quellen vorhanden sind. In der Verwendung konzeptionell und medial schriftlicher Texte ist die Zeitlichkeit, als zentrale Produktions- und Rezeptionsbedingung der direkten mündlichen Interaktion, irrelevant.

Mentale Räume in der Interaktion

49

In seinem Kommunikationsmodell bestimmt Ronald Langacker den current discourse space als den in einem bestimmten Moment von den Interaktanten geteilten mentalen Raum. The CDS is defined as the mental space comprising those elements and relations construed as being shared by the speaker and hearer as a basis for communication at a given moment in the flow of discourse. (Langacker 2001: 144)

Damit ist das Diskursmodell zwar prinzipiell an den Interaktanten ausgerichtet. Jedoch werden sprachliche Strukturen (Texte oder Äußerungen) als Anweisungen an die Sprachnutzer verstanden, mentale Räume aufzubauen oder diese zu verändern. Dabei scheint die kognitive Linguistik von einer idealen Sprechsituation auszugehen, in der die Rezipienten Anweisungen direkt und in derselben Weise in den Aufbau mentaler Räume umsetzen. Da diese Prozesse prinzipiell gleich ablaufen, sind die individuell konstruierten Räume identisch und damit per se ›gemeinsame‹ mentale Räume. Pointiert formuliert besteht in den bisherigen Analysen zu mentalen Räumen Intersubjektivität darin, bei der Rezeption eines Textes interindividuell gleich ablaufende kognitive Prozesse zu postulieren. In der Interaktion jedoch ist dies aus verschiedenen Gründen nicht gewährleistet. Rein akustisch hören Interaktanten nicht immer dasselbe bzw. nehmen visuell körperliche Aspekte nicht in gleicher Weise wahr, unter anderem bedingt durch die räumlichen Gegebenheiten. Weitere Einflussfaktoren sind unterschiedliche Aufmerksamkeitsfoki der Gesprächsteilnehmer, die durch Nebensequenzen und mehrere fokussierte Interaktionen beeinflusst sein können. Darüber hinaus haben die Arbeiten der Kontextualisierungsforschung gezeigt, dass Sprechen als indexikalisch zu sehen ist.42 Sprecher kommunizieren nicht lediglich mittels symbolischer Elemente, sondern integrieren vielfach potentiell bedeutsame Hinweise in ihre Äußerungen, die von den anderen Interaktanten vor ihrem Hintergrundwissen interpretiert werden müssen. Auf die zentrale Rolle des (vermittelnden) Hintergrundwissen wurde insbesondere in psychologischen und kognitionswissenschaftlichen Ansätzen hingewiesen (vgl. u. a. Kintsch 1988, 2003; Weaver 1995). Dabei können individuell große Unterschiede, insbesondere in Bezug auf das episodische Wissen bestehen. Durch die Untersuchung schriftlicher Texte und eine produktorientierte Perspektive wurde bisher aber vor allem die Zeitlichkeit von Gesprächen und damit die sequentielle Entwicklung von mentalen Räumen vernachlässigt. Zu beachten ist, dass die Entwicklung eines ›Textes‹ im Gespräch durch 42

Vgl. Kapitel 1.3.

50

Imagination als konversationelle Herstellung mentaler Räume

mehrere Sprecher über das Turntaking-System reglementiert ist. Mithin können Sprecher individuell Vorstellungen aufbauen, die sie erst später im Gespräch verbalisieren. Darüber hinaus ist im Gespräch vielfach davon auszugehen, dass verschiedene Sprecher konkurrierende ›Anweisungen‹ zur Strukturierung eines mentalen Raumes geben können. Für die Bestimmung des mentalen Raumes, der zu einem gegebenen Zeitpunkt von den Anwesenden geteilt wird, ist weiterhin die grundsätzlich unterschiedliche Rezeptionsweise von schriftlichen und mündlichen Texten zu beachten. Anders als bei schriftlichen Texten ist im Gespräch nicht die Möglichkeit gegeben, einen Text mehrfach zu rezipieren bzw. innerhalb des Textes zurückzuspringen, um sich rückzuversichern. Jedoch ist auch davon auszugehen, dass Interaktanten erst im Nachhinein einen vorangegangenen Turn eines anderen Sprechers verstehen. Zur Temporalität der Produktion und Rezeption im Gespräch kommt als weitere zeitliche Dimension, dass Sprecher im Verlauf des Gesprächs den mentalen Raum selbst verändern können. So kann ein mentaler Raum eine zeitliche Ausdehnung erhalten, etwa wenn Sprecher eine Handlung planen, die sich über mehrere Zeitpunkte erstreckt, und damit Ereignisabfolgen oder Handlungsketten entwickeln. Darüber hinaus können die Sprecher den (Wirklichkeits-)Status verändern, den sie einer Szene zusprechen. Beispielsweise kann eine ernst gemeinte Alltagserzählung humorvoll zu einer Fiktion weiterentwickelt oder ein als unwahrscheinlich gekennzeichnetes zukünftiges Ereignis durch die Formulierung entsprechender Bedingungen zu einem wahrscheinlichen Ereignis werden. In Anbetracht der in diesem Kapitel geschilderten Rezeptions- und Produktionsbedingungen des Gesprächs ist zusammenfassend davon auszugehen, dass sich aufgebaute mentale Räume lediglich teilweise in den Gesprächsbeiträgen der Beteiligten manifestieren (Produktion). Darüber hinaus können die Gesprächsteilnehmer ausgehend von den Gesprächsbeiträgen der anderen Sprecher interindividuell unterschiedliche mentale Räume aufbauen (Rezeption). In der Perspektive der Gesprächsteilnehmer bedeutet dies, dass ein gegenseitiges Verständnis – im Sinne einer shared cognition – nicht lediglich durch die sprachlichen Ausdrücke gegeben ist, sondern vielmehr in der Interaktion hergestellt werden muss. Während die kognitive Linguistik über die interaktionale Konstitution gemeinsamer mentaler Räume keine Aussage trifft, steht diese im Zentrum der vorliegenden Arbeit. Hierfür wird auf die Methode der Konversationsanalyse zurückgegriffen. Diese geht davon aus, dass Sprecher sich im Verlauf des Gesprächs fortlaufend signalisieren, wie sie vorangegangene Gesprächsbeiträge der anderen Beteiligten verstanden haben. Mit aufeinander bezogenen Ge-

Mentale Räume in der Interaktion

51

sprächsbeiträgen können sich Sprecher signalisieren, dass sie gemeinsame Vorstellungen aufbauen. Das methodische Werkzeug der Sequenzanalyse ermöglicht es, diesen fortwährenden Abgleichsprozess nachzuvollziehen. 2.3.3

Verbindung von kognitiver Linguistik und Konversationsanalyse

Während in der kognitiven Linguistik Diskurs als kognitiver Prozess verstanden wird, begreift die Konversationsanalyse Diskurs als soziales Phänomen. Hiermit gehen zwei unterschiedliche Begriffe von Sinn bzw. Bedeutung in den beiden Disziplinen einher. In der kognitiven Linguistik wird Bedeutung als lokaler Aufbau kognitiver bzw. mentaler Strukturen gesehen, wie unter anderen Langacker formuliert: »Meaning is equated with conceptualization« (1986: 3). In der Konversationsanalyse hingegen – und hier vor allem in stark ethnomethodologisch orientierten Arbeiten – wird Sinn als die »Erzeugung von gesellschaftlicher Wirklichkeit und sozialer Ordnung« (Bergmann 2001: 921) und damit als sozialer Sinn verstanden. Sinn wird dabei auf der Ebene des Handelns im empraktischen Vollzug von Ethnomethoden verortet. Erklärungspotential wird hier aus beobachtbarem Verhalten und nicht aus Vermutungen über dahinter liegende mentale Vorgänge gezogen. Die Konversationsanalyse wendet sich insbesondere gegen die Gleichsetzung von interaktionalen mit kognitiven Prozessen bzw. gegen die Auffassung, die Interaktion sei durch die Kognition determiniert.43 Damit ist die Methode primär auf einen anderen Gegenstandbereich ausgerichtet und erscheint auf den ersten Blick nicht für die Analyse kognitiver Prozesse geeignet (vgl. Hougaard 2005a: 1657). Im Folgenden wird argumentiert, dass die Konversationsanalyse durch die konsequente Verortung gemeinsam hergestellter Bedeutung im sowohl für die Beteiligten als auch für den Analysierenden beobachtbaren Handeln auch für die Analyse mentaler Räume geeignet ist. Ausgangspunkt ist die theoretische Prämisse der Konversationsanalyse, dass Sprecher sich einander fortwährend ihr aktuelles Verständnis der Interaktion und des vorangegangenen Gesprächsverlaufs signalisieren. Gefasst wird dies unter dem Begriff des display: 43

So hebt unter anderen Paul Drew hervor: »instead of regarding cognition as determining action, we can view interaction as a source of cognition« (2005: 181). Exemplarisch zeigt er auf, dass der mentale Zustand Verwirrung durch ein interaktionales Geschehen hergestellt werden kann. Charles Goodwin (1987) zeigt, dass ein Zur-Schau-Stellen (display) von Vergesslichkeit als Aufforderung an die anderen Gesprächsbeteiligten fungieren kann, Inhalte kollaborativ zu produzieren und damit eine interaktionale Ressource darstellt.

52

Imagination als konversationelle Herstellung mentaler Räume […] a turn’s talk will display its speaker’s understanding of a prior turn’s talk, and whatever other talk it marks itself as directed to […]. (Sacks/Schegloff et al. 1974: 728)

Dieses allgemeine Prinzip fasst Emmanuel Schegloff (1991) in seinem Aufsatz »Conversation Analysis and Socially Shared Cognition« explizit als Technik zur Herstellung von Intersubjektivität bzw. gemeinsamer Kognition. Dies erläutert er an konversationellen Reparaturen. Durch eine Handlung macht ein Sprecher eine Einladung zu einer bestimmten Aktivität. Durch ihre Reaktionen zeigen die anderen Beteiligten an, auf welche Weise sie die vorangegangene Handlung verstanden haben (display). Intersubjektivität ist dann hergestellt, wenn ein korrektes Verständnis signalisiert wurde. Jedoch kann die Reaktion des zweiten Sprechers »also reveal understandings that the speakers of that prior talk take to be problematic – in other words, what they take to be misunderstandings« (Schegloff 1992: 1300). In diesem Fall kann der erste Sprecher mit dem nun dritten Turn eine Reparatur des Missverständnisses einleiten (repair after next turn). Der dritte Turn ist der konversationelle Ort, an dem eine Reparatur eines Missverständnisses initiiert werden kann, weshalb Schegloff diesen Typ von Reparaturen als the last structurally provided defense of intersubjectivity in conversation bezeichnet. Für den Fall, dass nach einem nächsten Turn keine Reparatur erfolgt, bedeutet dies gleichzeitig, dass von einem gemeinsamen Verständnis ausgegangen werden kann. Während das display in der Perspektive der Teilnehmer der Sicherung des gegenseitigen Verständnisses dient, nutzt es die Konversationsanalyse als methodisches Prinzip. Der Analysierende kann seine Interpretation einer Sprechhandlung dadurch belegen, dass er die unmittelbaren Reaktionen der Interagierenden als Beleg für seine Interpretation heranzieht (next turn proof procedure). Der Analysierende kann davon ausgehen, dass die Interpretation einer Handlung korrekt ist, wenn er aufzeigen kann, dass die Interaktanten diese Interpretation in einem nächsten Turn ebenfalls annehmen. Die konversationelle Herstellung von Intersubjektivität ist damit sequentiell in der Abfolge von Sprechereignissen bzw. display-Handlungen analytisch nachvollziehbar. Ein weiterer zentraler Begriff der Konversationsanalyse ist die konditionelle Relevanz:44 By conditional relevance of one item on another we mean: given the first, the second is expectable; upon its occurrence it can be seen to be a second item to the first; upon its nonoccurrence it can be seen to be officially absent – all this provided by the occurrence of the first item. (Schegloff 1968: 1083) 44

Vgl. auch Drew (1995) sowie die Arbeiten von Sacks und Schegloff (Sacks 1992; Sacks/Schegloff et al. 1974; Schegloff 1979; Schegloff/Sacks 1973).

Mentale Räume in der Interaktion

53

Während der Begriff der konditionellen Relevanz vor allem in Bezug auf Paarsequenzen (adjacency pairs), wie Gruß-Gegengruß, Frage-Antwort etc. verwendet wird, beziehen sich neuere Arbeiten auf den Begriff der Projektion (Auer 2005b, 2007; Auer/Pfänder 2007; Drew 1995; Streeck 1995)45. Hierunter wird allgemein gefasst, dass durch die Realisierung bestimmter Sprechhandlungen eine strukturelle Fortsetzung bzw. Vervollständigung erwartbar wird. Projektion wird zum einen auf die grammatisch-syntaktische Ebene bezogen und ist hier unter anderem relevant für kollaborative Produktionen wie Turn-Continuations und chorisches Sprechen (Auer 1996; Lerner 2002, 2004; Schwitalla 1992; Szczepek 2000a, 2000b; Vorreiter 2003). Zweitens können in Gesprächen auch größere konversationelle Verläufe projiziert werden, die gestalt- bzw. musterhafte Qualitäten aufweisen, was unter Aktivitätstypen (Levinson 1992) und kommunikativen Gattungen (Birkner 2001; Günthner 2006b; Luckmann 1986) gefasst wurde. Nach Robert S. Wyer und Roger C. Schank (1995: 117) ist der innerhalb der psychologischen SkriptTheorie entwickelte Ansatz zur Analyse der Gattung Alltagserzählung mit dem der Konversationsanalyse vergleichbar (vgl. u. a. Labov 1972, 2001; Polanyi 1985), da in beiden Ansätzen jeweils Realisierungsphasen formuliert werden, an denen sich die Interagierenden orientieren. Insbesondere in jüngeren Arbeiten zur Konstruktionsgrammatik wird dabei die enge Verbindung bestimmter grammatischer Strukturen und mündlicher Gattungen hervorgehoben, da durch die Verwendung bestimmter Konstruktionen die Realisierung einer bestimmten Gattung kontextualisiert werden kann. So fasst Susanne Günthner (2006b) zusammen, dass sich die Gesprächspartner an konversationellem Wissen auf unterschiedlichen Ebenen orientieren: Arbeiten der Gattungsanalyse sowie Studien zur gesprochenen Sprache verdeutlichen, dass Interagierende über Wissen unterschiedlich komplexer Schemata (von Konstruktionen bis zu ausgereiften Gattungen) verfügen, das sowohl bei der Produktion als auch der Rezeption von Äußerungen Anwendung findet. Im Gesprächsverlauf orientieren sich Interagierende an diesen verfestigten Schemata, die wiederum aufgrund ihrer gestalthaften Qualität Projektionen über den weiteren Interaktionsverlauf erlauben. (Günthner 2006b: ohne Paginierung)

Geht man einen Schritt weiter, so ist im Vollzug von Gesprächen nicht lediglich eine Orientierung der Interaktanten an ihrem Wissen über konversationelle Abläufe zu sehen. Vielmehr gestalten die Beteiligten ihre Handlungen gemäß dieser sedimentierten Muster. Im gemeinsamen Vollzug von Handlungen und der gegenseitigen Signalisierung einer gemeinsamen Auffassung 45

Vgl. Kapitel 1.3.

54

Imagination als konversationelle Herstellung mentaler Räume

der Interaktionssituation wird damit gemeinsame Kognition hergestellt. Gemeinsame Kognition kann jedoch nicht nur als das gemeinsame Vollziehen von Handlungsmustern gefasst werden. Ebenfalls in Bezug auf Alltagserzählungen, jedoch nicht hinsichtlich ihres Ablaufs, sondern ihres Inhalts, formulieren Elinor Ochs et al. (1992), dass diese als Vorgang der Theoriebildung (theory building activity) über die alltägliche Ereignisse gesehen werden können. Unter anderen Gene Lerner (1992) untersucht, wie das gemeinsame Wissen über ein erlebtes Ereignis die konversationelle Realisierung einer Erzählung beeinflusst und zu einer kollaborativen Aktivität führt. In der vorliegenden Arbeit wird Imagination als Prozess der gemeinsamen Kognition verstanden: als konversationeller Aufbau gemeinsamer mentaler Räume. Zentral ist dabei, dass gemeinsame Kognition direkt auf die Handlungen der Gesprächspartner beziehbar ist. Mit ihren Äußerungen signalisieren die Gesprächsteilnehmer ihr gegenseitiges Verständnis nicht nur in Bezug auf die Koordination gemeinsamen Handelns, sondern durchaus auch in einem semantischen Sinn. Sprecher signalisieren einander, welche szenische Vorstellung bzw. welchen mentalen Raum sie aufgebaut haben. In methodischer Hinsicht kann durch die sequentielle Analyse des Gesprächsverlaufs aufgezeigt werden, dass Sprecher gemeinsame mentale Räume aufbauen und sich in Verlauf der Interaktion an diesen orientieren. Damit ist die Methode in ihrer Reichweite gleichzeitig beschränkt. In den Analysen kann lediglich der mentale Raum rekonstruiert werden, für den im Gesprächsverlauf belegt werden kann, dass sich die Sprecher an diesem orientieren.46 Über prinzipiell mögliche Unterschiede in den von den Sprechern aufgebauten mentalen Räumen kann keine Aussage getroffen werden. Jedoch gibt die Methode starke empirische Evidenz dafür, dass ein gemeinsamer mentaler Raum aufgebaut wird. Die in den empirischen Analysen der folgenden Kapitel rekonstruierten gemeinsamen mentalen Räume sind damit als analytische Konstrukte zu sehen, für die im interaktionalen Verlauf und den Reaktionen der Beteiligten mehr oder weniger starke Evidenz gefunden werden kann. Die gegenseitige Rückversicherung über den Inhalt der Vorstellung/den mentalen Raum ist besonders deutlich, wenn mehrere Sprecher einen mentalen Räum kohärent 46

Interindividuelle Unterschiede in den im Gespräch aufgebauten mentalen Räumen nachzuweisen, liegt nicht im Interesse der vorliegenden Arbeit. Dies ist darüber hinaus schwierig, da die Gesprächsteilnehmer meist tatsächlich kohärente Räume aufbauen und es selten zu Missverständnissen kommt (vgl. hierzu aber die Sequenz esqueleto, Kapitel 4.2). Insbesondere die in gemeinsamen Fiktionalisierungen entwickelten mentalen Räume sind durch Vagheit gekennzeichnet, sodass potentiell ›abweichende‹ Gesprächsbeiträge integriert werden können (vgl. Kapitel 4.3).

Mentale Räume in der Interaktion

55

gestalten, etwa indem sie Dialoge zwischen Figuren konstruieren oder alternative Äußerungen für ein und dieselbe Figur animieren (Kapitel 4). In Weiterentwicklungen signalisieren Sprecher den anderen Beteiligten, in welcher Weise sie den bisherigen Gesprächsverlauf verstanden haben und von welcher Vorstellung sie ausgehen. Daneben werden in der Arbeit aber auch solche Sequenzen untersucht, in denen die mentalen Räume weniger kollaborativ entwickelt werden, sondern vielmehr nur ein Sprecher, meist durch die Animation nur weniger Äußerungen, einen mentalen Raum evoziert (Kapitel 5). Auch für diese Sequenzen kann sowohl im interaktionalen Verlauf als auch in der Zusammenschau aller Sequenzen gezeigt werden, dass die Sprecher einen gemeinsamen mentalen Raum aufbauen und sich an diesem orientieren. 2.3.4

Zwischenbilanz: kein prä-existenter Text

Bislang wurden innerhalb der Theorie mentaler Räume vor allem konstruierte schriftliche Textbeispiele analysiert. Dabei wird angenommen, dass die Sprecher ausgehend von diesen Texten per se denselben mentalen Raum aufbauen. In Gesprächen jedoch liegt kein prä-existenter Text vor, von dem ausgehend die Gesprächsteilnehmer einen mentalen Raum aufbauen können. Vielmehr wird dieser Text im Verlauf der Interaktion erst hergestellt: Produktion und Rezeption greifen ineinander. In methodischer Hinsicht kann genau dies genutzt werden, da Sprecher sich in der Interaktion gegenseitig signalisieren, in welcher Weise sie vorangegangene Gesprächsbeiträge verstanden haben bzw. von welchem gemeinsamen mentalen Raum sie ausgehen. Der sequentielle Verlauf eines Gesprächs kann daher Evidenz für den Aufbau gemeinsamer mentaler Räume geben. Mittels des Werkzeugs der Sequenzanalyse können damit kognitiv-semantische Prozesse im Verlauf einer Interaktion beschrieben werden. In der vorliegenden Arbeit wird die Auffassung vertreten, dass die Bearbeitung von mentalen Räumen im Gespräch nicht lediglich als Produktion (Verbalisierung einer Vorstellung) und Rezeption eines Textes (Verstehen einer Anweisung zum Aufbau eines mentalen Raumes) zu sehen ist. Vielmehr werden Vorstellungen im Gespräch gemeinsam aufgebaut und sowohl der Text als auch die mentale Repräsentation gemeinsam hergestellt. Mentale Räume werden damit nicht nur als kognitive, sondern vor allem als interaktionale Größe betrachtet, an denen sich die Interaktanten im Gespräch orientieren und auf die sie sich beziehen. Der Ort gemeinsamer Kognition liegt damit nicht nur im individuellen Bewusstsein der Sprecher, sondern in der Interaktion.

56

Imagination als konversationelle Herstellung mentaler Räume

Von analytischem Interesse ist bei der Betrachtung von Gesprächen – anders als bei der Betrachtung monologischer Texte – weniger die Rekonstruktion eines mentalen Raumes als Endprodukt, sondern vielmehr der Prozess des Aufbaus und die hierfür von den Sprechern eingesetzten sprachlichen Mittel. In Kapitel 3 wird auf die animierte Rede eingegangen, die in der vorliegenden Arbeit eine zentrale Rolle als sprecherisches Mittel zur Gestaltung mentaler Räume einnimmt. 2.3.5

Typen mentaler Räume im Gespräch

Im Gespräch geöffnete mentale Räume können in vielfältigen Bezügen zum Reality Space stehen. Dies wurde in Abschnitt 2.2.2 bereits benannt. Fauconnier und Sweetser geben unter anderem die folgende Liste, welcher Status einem mentalen Raum zukommen kann: As already pointed out, language is remarkable in allowing us to talk not just about what is, but also about what might have been, what will be, what is believed, hoped for, hypothesized, what is visually represented, make-believe, fiction, what happened, what should have happened, and much more. Objectively, none of these are the same. We are referring to very different kinds of things: time periods, possible and impossible worlds, intentional states and propositional attitudes, epistemic and deontic modalities, pictures (i.e., blobs of paint on paper or cloth), and so on. And yet it turns out that there is a level at which similar cognitive constructions are set up for all of them. (Sweetser/Fauconnier 1996: 8f)

In den Untersuchungen zu mentalen Räumen wird dabei meist auf einen Typ – etwa konditionale mentale Räume und counterfactuals – und die entsprechenden sprachlichen Realisierungen fokussiert. Eine umfassende und überlappungsfreie Klassifikation mentaler Räume wurde bislang nicht gegeben. Dies liegt auch nicht im Interesse der Theorie mentaler Räume, die auf einem entsprechend hohen Abstraktionsgrad angelegt ist, um ein möglichst breites Spektrum logischer und grammatischer Phänomene abzudecken. Für die vorliegende Arbeit ist jedoch eine grobe Systematik mentaler Räume notwendig. Dabei sind vor allem die zeitliche und die modale Dimension relevant. Mit zeitlicher Dimension ist gemeint, dass Sprecher mentale Räume in Bezug auf die aktuelle Realität in der Zukunft oder in der Vergangenheit verankern können, gegebenenfalls auch in einem alternativ möglichen Hier-undJetzt. So wird mit einer Alltagserzählung ein in der Vergangenheit verankerter mentaler Raum entwickelt, beim Planen einer Handlung ein in der Zukunft liegender Raum. Parallel zur temporalen Dimension liegt die des modalen Status. Hierunter wird in der Arbeit verstanden, als wie wahrscheinlich, möglich oder unmög-

Mentale Räume in der Interaktion

57

lich, real oder fiktional die Sprecher die in einem mentalen Raum repräsentierte Szene in Bezug auf die Realität markieren. Unter modalem Status soll in der vorliegenden Arbeit verstanden werden, welche Möglichkeit oder Wahrscheinlichkeit die Sprecher einem mentalen Raum in Bezug auf den Reality Space zuschreiben. Damit ist sowohl gemeint, ob (1) das in einem mentalen Raum repräsentierte Ereignis eintreten kann, soll oder darf (2) es nicht eintreten kann soll oder darf (3) mit dem Raum ein generischer bzw. gnomischer Zusammenhang repräsentiert wird (4) ein Zusammenhang repräsentiert wird, der nicht der Fall ist. Für die empirischen Analysen werden die folgenden Typen mentaler Räume angenommen, auf die im Folgenden kurz eingegangen wird: – generische, gnomische bzw. typisierte Räume – negierte Räume – potentielle, hypothetische bzw. konditionale Räume – entworfene (geplante und antizipierte) Räume – fiktionale Räume Generische, gnomische bzw. typisierte Räume In generischen, gnomischen und typisierten Räumen repräsentieren Sprecher Abstraktionen und Verallgemeinerungen. Die Sprecher schreiben der im mentalen Raum repräsentierten Szene bzw. der mit dem Raum aufgeführten Handlung einen Geltungsbereich zu, der über einen konkreten Einzelfall hinaus geht. Beispielsweise können mit solchen Räumen Typisierungen von Personen vorgenommen bzw. Personenkategorien als solche repräsentiert werden (vgl. Kapitel 5.3). Dabei haben Aufführungen generischer oder typisierter Räume oft den Charakter eines Exempels bzw. einer Probe im Sinne von Nelson Goodman (1968, 1984, 1988). Negierte Räume In negierten mentalen Räumen repräsentierten Sprecher Zusammenhänge, die in Bezug auf den übergeordneten mentalen Raum – meist den Reality Space – nicht der Fall sind. Die Sprecher nehmen gegenüber der Szene die Haltung ein, dass sie dem gegenwärtigen Reality Space nicht entspricht, in einer vergangenen Situation nicht der Fall war oder in der Zukunft nicht realisierbar ist. Damit können negierte Räume – wie auch konditionale Räume –

58

Imagination als konversationelle Herstellung mentaler Räume

temporal in der Vergangenheit, der Gegenwart oder der Zukunft verankert sein. Aber auch zeitlich unverankerte negierte Räume sind möglich, denen dann eine generische Qualität zukommt. Hypothetische bzw. konditionale Räume In konditionalen mentalen Räumen werden Szenen repräsentiert, in denen bestimmte, im Gespräch spezifizierte Bedingungen erfüllt sind. Diese Bedingungen werden innerhalb einer konditionalen Struktur in der Protasis formuliert, die hieraus resultierende Konsequenz in der Apodosis. Dabei können die Sprecher unterschiedliche Haltungen einnehmen, wie wahrscheinlich oder möglich das Eintreffen der im mentalen Raum repräsentieren Szene ist.47 Konditionale Räume können nach dem Grad der Möglichkeit der in der Protasis ausgedrückten Bedingung in reale, potentiale und irreale Räume unterschieden werden.48 Für die verschiedenen Konditionale ergeben sich Affinitäten zu temporal verankerten Räumen: Irreale sind häufig in der Vergangenheit verankert, Reale und Potentiale in der Zukunft. Es ist aber auch möglich, konditionale Räume nicht temporal zu verankern. Hier werden in der Protasis lediglich allgemeine Bedingungen spezifiziert und in der Apodosis die Konsequenzen formuliert, womit der mentale Raum generische Qualitäten erhält. Darüber hinaus stehen Irreale in enger Verbindung zu negierten mentalen Räumen, da einem irrealen mentalen Raum in Bezug auf die Realität ein kontrafaktischer Status zukommt. Auch zu fiktionalen Räumen bestehen hier Übergänge.

47

48

Dies bezeichnet Eve Sweetser (1996) als epistemische Haltung (epistemic stance) des Sprechers, die sie in Anlehnung an Charles Fillmore (1971) bestimmt als: »the speaker’s mental association with or dissociation from the world of the protasis« (Sweetser 1996: 318). Vgl. auch Kapitel 4.3.2. Bei irrealen Konditionalstrukturen ist die Protasis in Bezug auf die Realität als nicht erfüllbar gekennzeichnet. Die ist u. a. bei in der Vergangenheit verankerten konditionalen Szenen der Fall, die unter der in der Protasis angegebenen Bedingung hätten geschehen können, jedoch nicht in dieser Weise geschehen sind (für die Theorie mentaler Räume vgl. z. B. Dancygier/Sweetser 1996; Fauconnier 1996; für das Spanische vgl. z. B. Haverkate 2002; Sweetser 1996). Demgegenüber sind Reale dadurch gekennzeichnet, dass die in der Protasis angegebene Bedingung gegenwärtig oder zukünftig erfüllt werden kann. Im Falle des Potentialis markiert der Sprecher die Erfüllung der Bedingung jedoch als weniger wahrscheinlich als im Falle des Realis.

Mentale Räume in der Interaktion

59

Entworfene (geplante und antizipierte) Räume Mit Räumen, die im Planen entwickelt werden, verbinden die Sprecher den Anspruch, diese Handlung tatsächlich auszuführen. In enger Beziehung zum Planen stehen mentale Räume, die eine antizipierte Situation beinhalten. Diese sind – in Bezug auf den Raum von dem ausgehend sie entwickelt werden – ebenfalls in der Zukunft verankert. Jedoch muss mit antizipierten Handlungszusammenhängen nicht der Anspruch verbunden sein, eine entsprechende Handlung tatsächlich auszuführen. Vielmehr werden in antizipierten mentalen Räumen oft solche Szenen dargestellt, die sich ohne Einfluss des Sprechers auf die Situation ergeben oder gerade in solchen Szenen bestehen, die vom Sprecher nicht erwünscht sind. Fiktionale Räume In fiktionalen Räumen werden Szenen repräsentiert, die vom gemeinsamen Verständnis der Gesprächsteilnehmer von der Realität abweichen. In der Gestaltung fiktionaler Räume verstoßen die Sprecher gegen die Realität konstituierende Prinzipien, welche den Beteiligten als sozialer Gruppe gemeinsam sind. Anders als bei negierten mentalen Räumen markieren die Sprecher das ›Unmögliche‹ der Fiktion jedoch spielerisch als möglich oder normal.49 Die hier genannten modalen Status, die mentalen Räumen zugeschrieben werden können, sind weniger als feste Kategorien, sondern vielmehr als Prototypen zu betrachten. Mentale Räume werden von Sprechern im Gespräch aufgerufen, ausgebaut und modifiziert. Hierbei kann auch der modale Status eines mentalen Raumes geändert werden. In den Gesprächen finden sich oft fließende Übergänge zwischen den genannten Typen. Eine typische Bewegung ist beispielsweise die von der Negation in Richtung der Fiktionalisierung (vgl. Kapitel 4.3.2.4). Solche Veränderungen – wie etwa durch eine Konditionalstruktur – werden in der Theorie mentaler Räume klassischerweise so modelliert, dass durch die Verwendung eines Spacebuilders ein weiterer mentaler Raum geöffnet wird. Während dies für viele der analysierten Sequenzen plausibel ist, ist jedoch oft davon auszugehen, dass ein und derselbe mentale Raum weiterentwickelt und lediglich dessen modaler Status verändert wird.

49

Eine genauere Abgrenzung des Fiktionalisierens vom Entwerfen wird in Kapitel 4.1 vorgenommen.

60

Animierte Rede

3

Animierte Rede

3.1

Einleitung: Von der Redewiedergabe zur animierten Rede

Imagination wird in der vorliegenden Arbeit als der Aufbau gemeinsamer szenischer Vorstellungen im Gespräch verstanden (vgl. Kapitel 1). Im vorangegangenen Kapitel 2 wurde behandelt, dass diese szenischen Vorstellungen in semantischer Hinsicht als mentale Räume gefasst werden. Zur Gestaltung eines mentalen Raumes stehen den Sprechern grundsätzlich zwei Möglichkeiten zur Verfügung. Sie können erstens über die Vorgänge innerhalb des mentalen Raumes sprechen und diese beschreiben. Zweitens ist es den Sprechern möglich, Handlungen von Figuren, die sich in diesem mentalen Raum befinden, vorzuführen und deren Rolle zu übernehmen. Auf der verbalen Ebene können die Sprecher als die Figuren sprechen und deren Äußerungen ›animieren‹. In solchen Animationen verändern die Sprecher meist auch die phonetischen Eigenschaften ihres Sprechens und vollziehen entsprechende körperliche Bewegungen in der Rolle der Figur. Diese beiden grundsätzlichen Möglichkeiten wurden bereits von Platon als zwei Arten der dichterischen Rede unterschieden: Diegesis und Mimesis. Diegesis bezeichnet die erzählende Darstellung. Hier beschreibt ein Erzähler die Handlung und gibt sich selbst als Sprecher zu erkennen. Demgegenüber bezeichnet Mimesis die nachahmende Darstellung eines Geschehens, bei welcher der Erzähler die Rolle von Figuren übernimmt und deren Handlungen imitiert. Dabei werden in erster Linie die Äußerungen von an der Handlung beteiligten Figuren wiedergegeben. Während in der Erzählung die Diegesis und im Drama die Mimesis vorherrscht, werden im Epos beide Formen gemischt. In der neueren Erzähltheorie wird parallel zu diesem Begriffspaar auch die Unterscheidung von Showing (Mimesis) und Telling (Diegesis) verwendet, die auf den Schriftsteller Henry James zurückgeht. Das Showing dient einer Dramatisierung des Geschehens und der Erzeugung einer möglichst intensiven Illusion von Wirklichkeit. Von der Gesprächsforschung wurde eine ›mimetische‹ Entwicklung vor allem in Alltagserzählungen unter dem Begriff der Inszenierung untersucht (vgl. u. a. Günthner 2000; 2009). Die Animation von Figuren wurde hier primär als Redewiedergabe behandelt. Alltagserzählungen gehören nach Jörg Bergmann und Thomas Luckmann (1995) zu den rekonstruktiven kommunikativen Genres, in denen die Gesprächsteilnehmer gemeinsam ein reales

Einleitung: Von der Redewiedergabe zur animierten Rede

61

vergangenes Ereignis oder Erlebnis rekonstruieren (vgl. u. a. Günthner 2005b; Quasthoff 1987, 2001). Bei der Analyse von Alltagserzählungen werden meist zwei ›Welten‹ unterschieden: die Erzählwelt und die erzählte Welt. Die Erzählwelt ist die Welt, in der erzählt wird, also die aktuelle Gesprächssituation. Die erzählte Welt ist die Welt, über die gesprochen wird, d. h. die Welt des rekonstruierten Ereignisses. Über die Redewiedergabe kann eine vergangene Äußerung im aktuellen Kontext des Gesprächs rekonstruiert bzw. rekontextualisiert werden. Stellvertretend sei hier Susanne Günthner zitiert: In diesen Rede(re)konstruktionen treffen zwei Diskurs›welten‹ aufeinander: Die ›Figurenwelt‹ und damit der Interaktionskontext, dem die zitierte Äußerung entstammt, und die ›Erzählwelt‹, die momentane Interaktionssituation, in der die betreffende Äußerung (re)konstruiert, (re)kontextualisiert und funktionalisiert wird. Beide Welten unterscheiden sich hinsichtlich ihrer Teilnehmenden, ihrer räumlich-zeitlichen und soziokulturellen Kontexte, ihrer sprachlichen Konventionen und ihrer interaktiven Ziele. Diese Spannungen zwischen den beiden Welten und ihre möglichen Verankerungen in der einen oder anderen Welt prägen die Redewiedergabe. (Günthner 1997a: 227)

Während die Unterscheidung zweier Diskurswelten mit der Auffassung der in der vorliegenden Arbeit vertretenen Unterscheidung verschiedener mentaler Räume kompatibel ist, ist die vorgenommene Konzeptualisierung von Redewiedergabe für die vorliegende Arbeit zu eng. In gesprächsanalytischen Arbeiten zur Redewiedergabe in Alltagserzählungen sowie in allgemeinen Bestimmungen der Redewiedergabe wird meist von einem rekonstruktiven Modell ausgegangen. Dieses basiert auf der Vorstellung, dass der Redewiedergabe eine konkrete Äußerung in der Vergangenheit zugrunde liegt, die in der aktuellen Gesprächssituation wiedergegeben wird (vgl. Gather 1994). Bereits Otto Behagel definiert direkte Rede in diesem Sinne: Unter direkter Rede verstehe ich die Erscheinung, daß die Rede, der Gedanke eines Menschen genau in der Form und in dem Sinn wiedergegeben wird, wie er sie selbst ausspricht oder denkt; unter indirekter Rede die Wiedergabe, die von der direkten Rede abweicht (eine positive Bestimmung der indirekten Rede erscheint nicht möglich). (Behagel 1928: 695, Hervorhebungen i.O.)

Gegen eine solche enge Auffassung von direkter Rede als möglichst verbatimer Wiedergabe einer vergangenen Äußerung, und damit einer textoriertierten Perspektive, wurde verschiedentlich Kritik geäußert.1 Dabei wird hervor1

Als einer der ersten Autoren kritisierte Valentin N. Volosinov (1971) die Annahme, dass es sich bei Redewiedergabe um eine originalgetreue Wiedergabe handelt. Für die Erzählforschung sind insbesondere die Arbeiten von Gisela Brünner (1991), Susanne Günthner (1997a, 1997b) und Deborah Tannen (1996 [1989]) zu nennen. Eine kompakte Darstellung geben auch Rebecca Clift und Elizabeth Holt

62

Animierte Rede

gehoben, dass vergangene Äußerungen nicht nur wiedergegeben, sondern gleichzeitig für das aktuelle Gespräch für die kommunikativen Absichten der Beteiligten funktionalisiert werden. Die Wiedergebenden setzen Veränderungen oft intentional ein, um das Wiedergegebene in ihrem Sinne zu perspektivieren und zu bewerten. Gerade in der Möglichkeit der Bewertung vergangener Handlungen wird eine Hauptfunktion der Redewiedergabe gesehen.2 Über die ›intentionale‹ Perspektivierung bzw. Stilisierung von wiedergegebenen Äußerungen hinaus konnten empirisch zahlreiche Fälle nachgewiesen werden, in denen zwar die formalen Eigenschaften direkter Rede vorliegen, jedoch keine konkreten Originaläußerungen zugrunde liegen, die reproduziert werden könnten. Solche Formen ›direkter‹ Rede werden unter anderem als fiktive oder hypothetische Redewiedergabe oder auch als Pseudoquotations bezeichnet.3 Deborah Tannen kommt so zu dem Schluss: »In other words, it is not reported speech but constructed dialogue« (1996 [1989]: 110). Da in der vorliegenden Arbeit ausschließlich solche nicht-konstruktiven Fälle konstruierter Dialoge untersucht werden, wird nicht von ›direkter‹, sondern von animierter Rede gesprochen. Im Folgenden wird aufbauend auf bereits bestehenden Konzepten zur Redewiedergabe eine Arbeitsdefinition von animierter Rede entwickelt, die mit der in der vorliegenden Arbeit vertretenen Auffassung von Imagination als Herstellung eines mentalen Raumes kompatibel ist (3.2). Animierte Rede wird bestimmt als das Demonstrieren der (Sprech-)Handlung einer Figur in

2

3

(2007). Ausführliche Diskussionen rekonstruktiver Modelle zur Redewiedergabe finden sich bei Andreas Gather (1994), Thierry Gallèpe (2002), Matthias Marschall (2002) und Manfred von Roncador (1988). Allgemein geben Wolfram Bublitz und Monika Bednarek (2006) die Evaluation als Hauptfunktion der Redewiedergabe an, wobei sowohl die wiedergegebene Quelle bzw. der wiedergegebene Sprecher selbst, dessen Art und Weise sich zu äußern, als auch die wiedergegebene Proposition bewertet werden kann. Die Funktion der Bewertung stellt in gesprächsanalytischer Perspektive Günthner (1997a, 1997b, 1999b, 2002a, 2002b) heraus, wobei die Autorin insbesondere herausarbeitet, dass Sprecher durch eine Stilisierung bzw. Karikierung der wiedergegebenen Äußerung eine negative Bewertung vornehmen können (vgl. auch Kotthoff 2002, 2005). Zur Funktion der Bewertung durch Redewiedergabe merkt Elizabeth Couper-Kuhlen an, dass es dabei die zu einem Übergang zwischen erzählter Welt und dem Hier-und-Jetzt kommen kann: »This merging of the two worlds is facilitated by the fact that non-narrative quoted material is often prosodically and paralinguistically expressive and fades off syntactically into following hic-et-nunc talk. Recipients can be observed to orient to the quoted material in next turn as if it were an assessment or account in the present« (2007: 119). Vgl. u. a. Brünner (1991), Günthner (1997b), Myers (1999), Sams (2007) und Tannen (1996 [1989]).

Theoretische Modellierung animierter Rede

63

einem mentalen Raum, mit der gleichzeitig die Übernahme der Perspektive dieser Figur verbunden ist. Das Demonstrieren wird dabei vom Symbolisieren unterschieden und als grundsätzlicher semiotischer Modus bzw. als Möglichkeit bestimmt, konzeptuelle Struktur für einen mentalen Raum zu entwickeln. Im Anschluss hieran werden ausgewählte verbale, prosodische und körperliche Aspekte besprochen, die für die empirischen Analysen der Gestaltung mentaler Räume relevant sind (3.3). In Kapitel 3.4 wird in empirischen Analysen von lokalen Wiederholungen aufgezeigt, wie Sprecher im Gesprächsverlauf vom symbolisierenden in den demonstrierenden Modus wechseln.

3.2

Theoretische Modellierung animierter Rede

Im folgenden Abschnitt wird ein Konzept von animierter Rede entwickelt, das erstens nicht auf der Idee der Wiedergabe einer originalen Äußerung beruht und zweitens mit der im vorangegangenen Kapitel 2 entwickelten Auffassung von Imagination als konversationeller Herstellung eines mentalen Raumes verbunden werden kann. Dabei werden drei konstitutive Aspekte animierter Rede behandelt, was jeweils über die Darstellung eines theoretischen Ansatzes geschieht. Diese Ansätze sind wie folgt: – Nach Erving Goffman kann Rede›wiedergabe‹ als Einbettung einer Figur in die eigene Äußerung verstanden werden. Der Sprecher animiert eine ›fremde‹ Äußerung (3.2.1). – Mit einer solchen Einbettung einer Figur in die eigenen Äußerungen geht eine Übernahme der Perspektive der Figur einher. Mit der Animation einer Figur versetzt sich ein Sprecher mental in die Szene, in der sich die Figur befindet. Dieser Aspekt wurde vor allem in deiktisch orientierten Ansätzen zur Redewiedergabe hervorgehoben (3.2.2). – Mit der Animation einer Figur demonstriert ein Sprecher die Handlung dieser Figur. Innerhalb des Rahmens eines als ob vollzieht er eine (Sprech-) Handlung, die er nicht sich selbst, sondern einer Figur zuschreibt und macht diese damit für die anderen Gesprächsteilnehmer wahrnehmbar. Diesen Aspekt heben insbesondere Herbert H. Clark und Richard R. Gerrig mit ihrem Ansatz von quotations as demonstrations hervor. Vor allem dieser Ansatz bietet die Möglichkeit, animierte Rede nicht lediglich als auf bestimmte Aktivitätstypen begrenzten Sonderfall der Sprachverwendung zu betrachten (wie etwa Redewiedergabe in Erzählungen), sondern als grundsätzlichen Modus des Sprechens (3.2.3).

64

Animierte Rede

3.2.1

Einbettung einer Figur

Erving Goffman schlägt in seinem Artikel »Footing« (1981 [1979]) ein Konzept verschiedener Beteiligungsrollen im Gespräch vor. Er geht von der Äußerung aus und betrachtet, in welchem Verhältnis sie zu Sprecher und Hörer(n) stehen kann. Er definiert Footing als »the alignment we take up to ourselves and the others present as expressed in the way we manage the production or reception of an utterance« (1981: 128). Dabei erweisen sich die herkömmlichen Verwendungsweisen der Begriffe Sprecher und Hörer als zu undifferenziert. Goffman unterscheidet deshalb sowohl auf der Produzenten- als auch auf der Rezipientenseite mehrere Rollen. Die Rollen auf der Rezipientenseite bezeichnet er als participation framework, die Rollen auf der Produzentenseite als production format. Für die Zwecke der vorliegenden Arbeit ist insbesondere das Produktionsformat bedeutend, welches Goffman in drei Rollen differenziert.4 Die Rolle des Animators (animator) bezeichnet die physische bzw. physikalische Produktion einer Äußerung. Goffman spricht hier auch von einer sounding box oder einer »talking machine, a body engaged in acoustic activity, or, if you will, an individual active in the role of utterance production« (1981: 144). Die Rolle des Autors (author) betrifft die inhaltliche und formale Gestaltung der Äußerung. In der Rolle des Prinzipals (principal) trägt der Sprecher die soziale Verantwortung für die Äußerung.5 Der Normalfall im Gespräch ist, dass eine Person alle drei Rollen gleichzeitig übernimmt, was Goffman auch als Überlagerung von Rollen (overlaying of roles 1981: 145) bezeichnet. When one uses the term ›speaker‹ one often implies that the individual who animates is formulating his own text and staking out his own position through it: animator, author and principal are one. What could be more natural? So natural indeed, that I cannot avoid continuing to use the term ›speaker‹ in this sense […]. (1981: 145).

Von diesem Normalfall kann jedoch abgewichen und das Produktionsformat verändert werden. Redewiedergabe kann als eine solche Veränderung beschrieben werden: Ein Sprecher animiert eine eingebettete Figur (embedded 4

5

Für das participation framework unterscheidet Goffman grundsätzlich ratifizierte und nicht-ratifizierte Teilnehmer an einer fokussierten Interaktion. Die ratifizierten Teilnehmer unterscheidet er in adressierte und nicht-adressierte Hörer. Die nicht-ratifizierten Teilnehmer (bystanders) wiederum unterscheidet er in overhearers und eavesdroppers. Auer (1999: 162) übersetzt principal als ›Auftraggeber‹. Allgemein kann principal als ›Vorsteher‹, ›Haupttäter‹ oder ›Hauptverantwortlicher‹ übersetzt werden. Ich verwende daher den stärker am englischen Original orientierten Begriff ›Prinzipal‹.

Theoretische Modellierung animierter Rede

65

figure).6 Goffmans Konzept der Redewiedergabe basiert damit auf der Vorstellung zweier Sprecher, die sich in voneinander unterscheidbaren Welten befinden. Dies ist erstens der aktuelle Sprecher, der sich in der Welt befindet, in der gesprochen wird (»the current speaker«, »the addressing self«, »the world in which the speaking occurs«, 1981: 147). Der zweite Sprecher ist eine Figur in der Welt über die gesprochen wird (»a figure«, »the world that is spoken about«, »described scene«, 1981: 147). Wer diese Figur sein kann, ist dabei nicht festgelegt. Es kann sich z. B. um den aktuellen Sprecher selbst, eine andere Person oder auch eine lediglich vorgestellte Figur handeln: »we can tell of something someone else said, someone present or absent, someone human or mythical« (1981: 149). Aus einer solchen Einbettung ergibt sich ein verändertes Produktionsformat. Der aktuelle Sprecher übernimmt die Rollen des Produktionsformates nicht alleine. Vielmehr geht die Rolle des Autors und/oder des Prinzipals vom aktuellen Sprecher auf die eingebettete Figur über. D. h. der aktuelle Sprecher fungiert als Animator für Worte und Inhalte, die er nicht sich selbst, sondern der Figur zuschreibt. In der Literatur gehen die Ansichten auseinander, in welcher Weise das Produktionsformat im Falle der Redewiedergabe verändert wird. Einerseits kann angenommen werden, dass die Rollen von Autor und Prinzipal klar von der Rolle des Animators getrennt werden und vollständig auf die eingebettete Figur übergehen. In diesem Sinne kann Elizabeth Couper-Kuhlen verstanden werden: What happens with reported speech is that the unity within a single speaker of the three production roles which Goffman identifies – animator, author and principal – dissolves, leaving the role of animator separate from, and independent of, those of author and/or principal. (Couper-Kuhlen 1999: 11)

Jedoch muss nicht immer ein vollständiger Übergang der Rollen von Autor und Prinzipal auf die animierte Figur vorliegen. In diesem Sinne können die Arbeiten Susanne Günthners (1997b, 1999b, 2002b, 2005a) zur Polyphonie in der Redewiedergabe verstanden werden. Das Konzept der Polyphonie, oder auch Mehrstimmigkeit, geht auf die Theorie des dialogischen Textes der frühen russischen Kultursemiotik von Michail Bakhtin (1990; Bakhtin/ Holquist 1981) und Valentin N. Volosinov (1971, 1993) zurück und bezeichnet das Phänomen, dass in einem Text (in einer Äußerung) nicht nur eine Stimme ›zu hören‹ ist, sondern mehrere Stimmen überlagert werden. Im 6

Vgl. hierzu die Begriffsbestimmung von Redewiedergabe von Elisabeth Gülich, die ebenfalls auf den Gedanken der Einbettung zurückgreift: »Unter ›Redewiedergabe‹ werden im folgenden also eingebettete Kommunikationsakte bzw. Kommunikationsakte auf einer zweiten, ggf. weiteren Ebenen verstanden« (1978: 53).

66

Animierte Rede

Falle der polyphonen Redewiedergabe ist nach Günthner neben der ›Stimme‹ des Wiedergegebenen auch die ›Stimme‹ des aktuellen Sprechers zu hören, der zum Inhalt der Redewiedergabe Stellung bezieht. Dies geschieht in Form von Stilisierung bzw. Karikierung der wiedergegebenen Äußerung, wobei prosodische Mittel eine zentrale Rolle spielen. Prinzipal der Äußerung sind in diesem Falle sowohl der aktuelle Sprecher als auch die eingebettete Figur. In ähnlicher Weise fasst Helga Kotthoff (2002) verschiedene Formen polyphonen Sprechens unter dem Oberbegriff staged intertextuality. Die Autorin unterscheidet vier prototypische Formen (non-stylized quotation, parody, pseudoquotation, irony), die alle dadurch gekennzeichnet sind, dass der Sprecher eine mehr oder weniger große Distanz zwischen sich und den von ihm geäußerten Worten herstellt: »The distancing from the words uttered can be stronger or weaker« (Kotthoff 2002: 225).7 In der polyphonen Redewiedergabe ist damit sowohl der aktuelle Sprecher als auch die animierte Figur präsent. Das Konzept des Footings nach Goffman ist verschiedentlich diskutiert und erweitert worden. Dabei wurden einerseits die verschiedenen Sprecher und Hörerrollen weiter ausdifferenziert (Levinson 1988). Andererseits wurde die kategorische Trennung von Sprecher- und Hörerrollen kritisiert und betont, dass Partizipation als interaktiver Prozess von Sprechern und Hörern betrachtet werden muss. Insbesondere an kollaborativen Produktionen wurde gezeigt, dass oft keine klare Trennung von Sprecher und Hörer vorgenommen werden kann. Beispielsweise stellt Gene Lerner (2002) fest, dass insbesondere Formen animierter Rede dazu beitragen können, den Anspruch eines Sprechers auf einen Turn herabzusetzen und auf diese Weise kollaborative Produktionen wie chorisches Sprechen bevorzugt werden können.8 Charles Goodwin (2007) hebt hervor, dass die Untersuchung des Partizipationsformates nicht auf die verbale Ebene beschränkt sein darf, sondern dass die körperliche Ebene ebenfalls einbezogen werden muss.

7

8

Vgl. hierzu auch die Arbeiten von Kotthoff (2005) zu konversationellen Karikaturen. In Bezug auf das Anrecht eines Sprechers auf einen Turn schreibt Gene Lerner: »One form of talk (seen in some of the earlier excerpts) that can relax a speaker’s entitlement to a turn – that is, that seems consequential for that entitlement-occurs when speakers are voicing a TCU or TCU-component that is not attributable to them as author/owner (in the current turn). Two forms this can take are the voicing of an idiomatic expression and the voicing of an utterance that is attributable to someone other than the speaker (including a categorical other)« (2002: 233).

Theoretische Modellierung animierter Rede

67

Zusammengefasst ist Redewiedergabe nach Goffman dadurch gekennzeichnet, dass der aktuelle Sprecher (der sich in der Welt befindet, in der gesprochen wird) in seine Äußerung einen zweiten Sprecher (eine Figur in der Welt, über die gesprochen wird) einbettet. Dabei wird vom Normalfall des Footings auf der Produzentenseite abgewichen. Die Rolle des Autors und/ oder des Prinzipals gehen von der sprechenden Person teilweise auf die eingebettete Figur über. Animierte Rede kann damit vorläufig und in Bezug auf die Theorie mentaler Räume so gefasst werden, dass der aktuelle Sprecher eine Figur animiert, die sich in einem mentalen Raum befindet. 3.2.2

Übernahme einer Perspektive

Ausgangspunkt vieler Begriffsbestimmungen von Redewiedergabe ist das Vorhandensein zweier Bezugsrahmen, die je nach theoretischer Ausrichtung bezeichnet werden als zwei Kommunikationen (Brünner 1991), Sprechakte (Plank 1986), ›Diskurs‹Welten oder Texte (Günthner 1997a). Als Hauptformen der Redewiedergabe werden meist direkte und indirekte Rede unterschieden. Wie unter anderen Frans Plank (1986) herausstellt, sind direkte und indirekte Rede keinesfalls als exklusive Kategorien, sondern als Pole eines Kontinuums zu verstehen. Die ›Direktheit‹ einer Redewiedergabe lässt sich nach Plank auf dem Kontinuum der deiktischen Verankerung in den beiden Bezugsrahmen abbilden.9 Die Redewiedergabe kann auf den verschiedenen deiktischen Dimensionen (personal, lokal, temporal, …) mehr oder weniger stark in einem der beiden Bezugsrahmen verankert sein. Günthner bestimmt dies als textuelle Verankerung: Je nach dem Grad der textuellen Verankerung (in der Figuren- oder Erzählwelt) haben wir es mit einem unterschiedlichen Grad an Direktheit oder Indirektheit zu tun. Maximale Direktheit liegt dann vor, wenn sowohl für die deiktische als auch für die prosodisch-stimmliche Verortung der Redewiedergabe die Figurenwelt den Bezugsrahmen stellt. Maximale Indirektheit bilden syntaktisch einbettete [sic! muss heißen eingebettete, O.E.] ›daß‹-Konstruktionen, deren deiktische und prosodisch stimmliche Verankerung in der Erzählwelt liegen (und die Konjunktivform aufweisen). (Günthner 1997b: 245)

Eine Äußerung in direkter Rede ist (prototypischerweise) deiktisch im Figurentext verankert. Indirekte Rede ist deiktisch vor allem im Erzähltext verankert, den Bezugsrahmen bildet die Erzählwelt. An dieser Stelle soll nicht weiter auf die syntaktischen Einflussgrößen, sondern vor allem auf die mit den Deiktika verbundene Übernahme einer Perspektive eingegangenen wer9

Vgl. u. a. auch Gerhard Kaufmann (1976) und Manfred Roncador (1988).

68

Animierte Rede

den.10 So formuliert beispielsweise Gisela Brünner für die direkte Rede: »Der aktuelle Sprecher übernimmt die Perspektive des wiedergegebenen Sprechers und macht die wiedergegebene Kommunikationssituation zum deiktischen Bezugsrahmen seines Handelns« (1991: 2, Hervorhebung O.E.). Anders als die Formulierung von Brünner nahelegt, ist es für die Modellierung einer solchen Perspektivübernahme nicht notwendig, von einem ›wiedergegebenen‹ Sprecher auszugehen. Mit Bezug auf Bühler kann die Perspektivübernahme als Verschiebung der Origo in ein Phantasma gefasst werden. Animierte Rede ist damit eine Äußerung, die deiktisch vornehmlich an einer in einem Phantasma liegenden Origo verankert ist. Dieser Ansatz kann mit Bezug auf die Theorie mentaler Räume wie folgt reformuliert werden. Im Diskurs wird ein komplexes Netz mentaler Räume aufgebaut, durch das sich die Sprecher mental bewegen. Als zentrale Eigenschaft dieses Netzes wurde bereits benannt, dass ein Raum als Basis dient, von dem ausgehend das Netz entwickelt wird und zu dem im Verlauf des Diskurses immer wieder zurückgekehrt werden kann.11 Für das Gespräch ist dies der Reality Space. Ein weiteres Charakteristikum des Netzes sind Focus und Viewpoint, die im Verlauf des Diskurses wandern können. Als Focus wird der Raum bezeichnet, der momentan im Diskurs entwickelt wird. Es ist der momentan ›aktivste‹ Raum innerhalb des Netzes, dem Struktur hinzugefügt wird. Dies kann einerseits der Reality Space sein, was dem immediate mode bei Wallace Chafe (2001) bzw. dem situated mode bei Peter Auer (1988) entspricht.12 Häufiger liegt jedoch ein anderer Raum im Fokus (entsprechend dem displaced mode). Darüber hinaus muss der Raum unterschieden werden, von dem ausgehend dem Focus Struktur hinzugefügt wird. Dieser Raum wird als Viewpoint bezeichnet: At any point in construction one space is distinguished as Viewpoint, the space from which others are accessed and structured or set up. (Fauconnier 1997: 49)

Damit ist der Viewpoint ein zentrales Charakteristikum des Netzes mentaler Räume und eine grundlegende Eigenschaft der Konzeptionalisierung. Jedoch wird im Rahmen der Theorie mentaler Räume keine genaue Definition des Viewpoint gegeben. Am ausführlichsten setzt sich in diesem Zusammenhang Michelle Cutrer (1994) mit dem Konzept auseinander und bringt es mit verschiedenen Ansätzen in Verbindung. Allgemein kann Viewpoint mit Bezug auf Gérard Genette (1972) als Fokalisierung bzw. mit Karl Bühler als Origo 10

11 12

Für den Einfluss syntaktischer Parameter auf die Interpretation von Deiktika vgl. u. a. Frans Plank (1986) und Kapitel 3.3. Vgl. Kapitel 2.2.2. Vgl. Kapitel 2.1.1.

Theoretische Modellierung animierter Rede

69

gefasst werden. Cutrer unterscheidet verschieden starke Varianten, je nachdem anhand wie vieler deiktischer Dimensionen der Viewpoint bestimmt wird. In der stärksten Variante bezeichnet der Viewpoint das Zentrum eines bewussten Selbst, dem der Prozess der Konzeptualisierung oder eine Äußerung zugeschrieben wird. Dieses wird anhand verschiedener deiktischer Dimensionen – die mehr oder weniger linguistisch manifest sein können – verortet.13 In der schwächsten Variante wird Viewpoint lediglich an einer deiktischen Dimension – räumlich oder temporal – festgemacht, wie etwa im Tempussystem von Hans Reichenbach (1947). Der Standardfall einer Konfiguration mentaler Räume besteht darin, dass der Viewpoint im Reality Space liegt. Der Focus Space – sei dies der Reality Space oder ein anderer mentaler Raum – wird damit aus der Perspektive des aktuellen Sprechers entwickelt. Es ist jedoch auch möglich, den Viewpoint in einen anderen mentalen Raum zu verschieben. Dies ist bei animierter Rede der Fall, in welcher der Viewpoint einer Figur übernommen wird. Animierter Rede und situativem Sprechen kommt damit innerhalb der Theorie der mentalen Räume ein ähnlicher kognitiver Status zu: Der Viewpoint liegt jeweils innerhalb des Raumes im Fokus. Mit situativem Sprechen und animierter Rede wird dem jeweiligen Raum auf ähnliche Weise Struktur hinzugefügt. Anders gewendet kann mit Laura Ann Buszard (2003: 127) formuliert werden, dass der mentale Raum, in dem sich die animierte Figur befindet, für diese den Reality Space darstellt. In Bezug auf den Aufbau eines Kontextes für einen mentalen Raum wird mit einer ›realen‹ Äußerung in situativem Sprechen dem Reality Space in gleicher Weise Struktur hinzugefügt wie mit einer animierten Äußerung dem Raum, in dem sich die Figur befindet. Dies basiert auf einem Prozess, den Gilles Fauconnier wie folgt formuliert: When a sentence is examined in isolation, and its interpretations are studied, it is necessary to construct implicitly a discourse in which to interpret it. (Fauconnier 1997: 55)

Äußerungen selbst tragen keine Bedeutung, sondern werden erst im Prozess der Konzeptionalisierung bedeutsam, wodurch nach Auffassung der Theorie mentaler Räume ein szenischer Kontext aufgebaut wird. Dies gilt gleichsam für ›reale‹ Äußerungen im Reality Space und animierte Äußerungen in einem anderen mentalen Raum. Anders formuliert stellen Sprecher mit Äußerungen Kontexte her, unabhängig davon, welchem ›Raum‹ sie zugeschrie13

Michelle Cutrer (1994) benennt folgende Dimensionen: a temporal dimension; a spatial dimension; a realis/irrealis dimension; a dimension of emotional distance or empathy; a social dimension; a psychological or cognitive dimension.

70

Animierte Rede

ben werden.14 An den beiden folgenden Äußerungen aus dem Korpus der Arbeit soll dies illustriert werden.15 01 hey, weißt du nicht wo? 02 queda por acá atLANtis? ist Atlantis hier in der Nähe?

Mit der Anredepartikel chE (01) spricht ein Sprecher ein Gegenüber direkt an und leitet damit eine fokussierte Interaktion ein. Allgemeiner wird dabei der kulturelle Frame der verbalen Interaktion aktiviert bzw. ein mentaler Raum relevant gesetzt, in dem mindestens zwei Akteure vorhanden sind. Mit dem folgenden no uBIcas (01) richtet der Sprecher eine Frage an den Angesprochenen. Es handelt sich dabei um den ersten Teil der Paarsequenz Frage-Antwort, mit dem ein spezifischer konversationeller Verlauf projiziert wird, welcher auf der konversationellen Erwartung der Einlösung der konversationellen Relevanz besteht. Bei der Frage handelt es sich darüber hinaus um eine Kollokation, mit welcher der Frame Nach-dem-Weg-Fragen etabliert und die entsprechende Aktivität eingeleitet wird. Mit der Frage wird also ein spezifischer interaktionaler Kontext etabliert und entsprechendes Hintergrundwissen aktiviert: Der Fragende kennt sich nicht aus, eventuell hat er sich verlaufen, etc. Mit den Äußerungen wird ein spezifischer interaktionaler, genauer gesagt dialogischer Kontext verbunden. Dieser geht über den rein konversationsorganisatorischen Kontext hinaus. Beispielsweise wird über die erhöhte Lautstärke (notiert mit ) darüber hinaus deutlich, dass sich der Angesprochene in einiger Entfernung zum Sprecher befindet. Aus der prosodischen Gestaltung der Äußerung kann damit ein bestimmtes räumliches Verhältnis der Sprecher zueinander erschlossen werden. Aber auch ein soziales Verhältnis der Interaktionspartner wird etabliert. Durch die Anrede mit che und der folgenden Verbalform in der 2. Person Singular wird ein Näheverhältnis zwischen den Interagierenden kontextualisiert. Diese und weitere kontextuelle Informationen sind allein aufgrund der Gestaltung der Äußerungen zu erschließen, unabhängig davon, ob diese Äußerung einem realen Sprecher, der im Reality Space nach dem Weg fragt, oder einer Figur innerhalb eines mentalen Raumes zugeschrieben wird. Tatsächlich handelt es sich bei diesen Äußerungen um animierte Rede, die im Gespräch we14

15

Diese Auffassung deckt sich mit dem Ansatz der Kontextualisierungsforschung, wonach jede Äußerung indexikalische Hinweise auf den Kontext enthält, in dem sie geäußert wird (vgl. Kapitel 1.3). Die Sequenz atlantis, aus der die Äußerungen stammen, wird in Kapitel 4.3.3 ausführlich analysiert.

Theoretische Modellierung animierter Rede

71

der durch ein Verbum dicendi, noch durch andere vorangestellte lexikalische Elemente als solche eingeleitet wird, obwohl es sich in der Sequenz um die erste animierte Äußerung einer Figur handelt. Die Äußerungen sind lediglich durch die Kontextualisierung eines spezifischen Interaktionskontextes, der signifikant vom Interaktionskontext des Reality Space abweicht, als animierte Rede gekennzeichnet. Animierte Äußerungen sind damit in ganz ähnlicher Weise Sprechhandlungen von Figuren, wie es die Äußerungen realer Personen sind. Anders formuliert können animierte Äußerungen – und dies ist der im Folgenden dargestellte Ansatz von Clark und Gerrig – als Demonstrationen der Sprechhandlung einer Figur gesehen werden. 3.2.3

Demonstrieren einer Handlung

Herbert H. Clark und Richard R. Gerrig (1990) entwickeln ein semiotisches Konzept von Zitaten (quotations). Die Autoren argumentieren, dass Zitate als prototypischer Fall des Sprechens im demonstrierenden Modus gesehen werden können. Semiotisch ist dieses Konzept insofern, als die Autoren dieses auf der Zeichenklassifikation von Charles Sanders Peirce basieren und das Demonstrieren von dessen Bestimmung des Ikons ableiten.16 Im Folgenden werden die Grundzüge des Ikons nach Peirce dargestellt und hierauf aufbauend das Konzept der quotations as demonstrations erläutert. Nach Peirce besteht der Prozess der Semiose aus der triadischen Relation zwischen einem Repräsentamen (Zeichen), dem Objekt, auf das es sich bezieht, und dem Interpretanten, der diese Beziehung herstellt. Peirce unterscheidet die folgenden drei Klassen von Zeichen: Index, Symbol und Ikon. Bei Indices besteht nach Peirce eine direkte physische Verbindung zwischen dem Repräsentamen und dem Objekt, auf das es referiert.17 Seine denotative Kraft erhält der Index durch eine Aufmerksamkeitsfokussierung des Interpretierenden auf das Objekt. Bei Symbolen hingegen besteht keine reale, sondern eine habituelle bzw. konventionelle Verbindung zwischen dem Repräsentamen und dem Objekt, auf das es verweist. Ein Symbol wird von Interpretanten aufgrund von »dispositions or factitious habits« (Peirce EP: Vol. 2: 480) verstanden, indem ein entsprechendes mentales Konzept aufge16

17

In einem allgemeinen Rahmen behandelt Clark dies in seiner Monografie Using language (1996). Von einer physischen Verbindung spricht Peirce u. a. an dieser Stelle: »The index is physically connected with its object; they make an organic pair, but the interpreting mind has nothing to do with this connection, except remarking it, after it is established« (EP: Vol. 2: 9).

72

Animierte Rede

rufen wird (Peirce W: Vol. 1: 257f). Zwischen dem Repräsentamen und dem Objekt besteht keine weitere Verbindung. Demgegenüber ist das Ikon nach Peirce ein Repräsentamen, das die Qualität des Objektes besitzt, auf das es verweist. An icon is a sign fit to be used as such because it possesses the quality signified. (Peirce EP: Vol. 2: 307)

In der Rezeption des Begriffes Ikon wurde oft hervorgehoben, dass ein Ikon eine (bildhafte oder akustische) Ähnlichkeit mit dem Objekt aufweist, auf das es referiert, wobei die Ähnlichkeit durch Merkmale gegeben ist, die das Objekt und das Ikon gemeinsam haben.18 Mit einer solchen Betonung der Merkmalhaftigkeit werden jedoch in strukturalistischer Weise andere Schwerpunkte gesetzt als von Peirce selbst. Zwar bestimmt auch er als zentrales Charakteristikum des Ikons die Ähnlichkeit zwischen Repräsentamen und Objekt, fokussiert jedoch nicht auf die Merkmalhaftigkeit des Objektes und damit den Aspekt, dass ein Ikon von seinem Referenzobjekt abweichen kann, wie etwa Morris (1971) mit seinem Begriff der Ikonizität. Peirce betont vielmehr, dass Ikon und Referenzobjekt dieselbe Qualität aufweisen. Das Ikon hat am Charakter des Objektes Teil (»partaking in the characters of the object«, Peirce CP: Vol. 4 § 531). Hierdurch rückt die Wahrnehmung dieses Charakters durch den Interpretanten in den Vordergrund. Ikone weisen nach Peirce die Qualität der Erstheit (Firstness) auf. Unter Erstheit versteht Peirce einen Modus des Seins (mode of being), in dem keine Referenz vorliegt. Bei der Erstheit handelt es sich also um einen Wahrnehmungsmodus, in dem die Objekte dem Wahrnehmenden unmittelbar bewusst werden. Peirce charakterisiert die Erstheit auch als »a Quality of Feeling« (CP: Vol. 5 § 66), die der unmittelbaren Gegenwart zukommt: »[…] the quality of what we are immediately conscious of, which is no fiction, is Firstness« (CP: Vol. 1 § 343). Damit ist die Referenzfunktion des Ikons grundle18

Zu nennen ist hier unter anderen Charles William Morris (1971), der hervorhebt, dass die Ähnlichkeit von Ikon und Objekt auch lediglich aufgrund einzelner Merkmale gegeben sein kann, womit Grade von Ikonizität möglich sind (vgl. Glück 2000: 286f; Lewandowski 1994: 423; Sokol 2001: 21). Auch Hadumod Bußmann hebt die Ähnlichkeitsbeziehung aufgrund von Merkmalen hervor, indem sie Ikone bestimmt als »[…] Klasse von visuellen oder akustischen Zeichen, die in unmittelbar wahrnehmbarer Beziehung zur bezeichneten Sache stehen, indem sie Aspekte des realen Objekts abbildhaft imitieren und dadurch eine Ähnlichkeit oder Gemeinsamkeit von Merkmalen aufweisen […]« (2002: 292). Bußmann schränkt die Klasse der Ikone also explizit auf Fälle ein, bei denen das Referenzobjekt ein reales Objekt ist und rückt Ikone gleichzeitig in die Nähe des Konzeptes der Mimesis.

Theoretische Modellierung animierter Rede

73

gend anders als die des Symbols. Ikone referieren nicht von sich aus, sondern werden in erster Linie aufgrund ihrer eigenen, inneren Qualität wahrgenommen. An icon is a representamen of what it represents and for the mind that interprets it as such, by virtue of its being an immediate image, that is to say by virtue of characters which belong to it in itself as a sensible object, and which it would possess just the same were there no object in nature that it resembled, and though it never were interpreted as a sign. (Peirce CP: Vol. 4 § 447)

Mit dieser Bestimmung setzt Peirce die bewusste Wahrnehmung der Qualität der Ikone in den Vordergrund. Zu Zeichen werden Ikone durch ihre Ähnlichkeit zu Objekten, welche die gleiche Qualität aufweisen. Das Ikon weist damit die für seine Interpretation notwendigen Eigenschaften selbst auf, es besitzt die notwendige Qualität. Dies gilt auch für den (rein hypothetischen) Fall, dass kein Referenzobjekt vorhanden ist und das Ikon damit auch nicht zum Repräsentamen für dieses Objekt werden könnte (vgl. auch CP: Vol. 2 § 304). Zusammengefasst ist ein Ikon durch seine Erstheit ein Objekt der Wahrnehmung. Gänzlich anders als bei Symbolen ist damit die Wahrnehmung der Qualitäten des Repräsentamens entscheidend für seine Interpretation. Ikone werden lediglich durch die Ähnlichkeit zu anderen Objekten zu Zeichen. Damit ist bei Ikonen die Referenzfunktion der unmittelbaren Wahrnehmung ihrer Qualität nachgelagert.19 Im Moment der Wahrnehmung stehen Ikone nicht für etwas anderes, sondern für sich selbst. Als Zeichen fungieren Ikone durch ihre Ähnlichkeit in der Qualität zu Objekten, die außerhalb von ihnen liegen. Da Ikone die Qualität jedoch selbst auch aufweisen, verweisen sie gleichzeitig auf sich selbst. Ikone müssen also nicht als Zeichen interpretiert werden, sondern können selbst als Objekt wahrgenommen werden. Damit können Ikone als selbstreferentielle Zeichen gesehen werden und weisen im Sinne der Performancetheorie performative Eigenschaften auf.20 In der Entwicklung ihres Konzeptes von quotations as demonstrations gehen Clark und Gerrig (1990) in Anlehnung an Peirce davon aus, dass Menschen grundsätzlich drei Modi des Kommunizierens zur Verfügung stehen: Zeigen, Beschreiben und Demonstrieren. Clark (1996) ordnet diese Modi des Signalisierens den Zeichentypen nach Peirce wie folgt zu: 19

20

Deutlich wird dies insbesondere in der Formulierung von Peirce, dass Ikone die relevanten Eigenschaften selbst dann aufweisen, selbst wenn kein Referenzobjekt existieren würde: »An icon is a sign which would possess the character which renders it significant, even though its object had no existence« (Peirce CP: Vol. 2 § 304). Vgl. Kapitel 2.1.4.

74

Animierte Rede

Method of signalling demonstrating a thing indicating a thing describing as a type of thing

Sign created icon index symbol

(nach Clark 1996: 160)

Diese Modi kommen in der Face-to-Face Kommunikation selten in reiner Form vor, sondern werden kombiniert. Nach Clark (1996) sind viele Signale gemischt (mixed) bzw. zusammengesetzt (compound) und weisen gleichzeitig ikonische, indexikalische und symbolische Eigenschaften auf. Beim Demonstrieren, Zeigen und Beschreiben handelt es sich also nicht um Zeichenklassen, sondern um Modi bzw. Methoden des Signalisierens. Die Autoren vertreten die Auffassung, dass dem Demonstrieren eine ebenso zentrale Rolle zukommt wie dem Beschreiben, welches in den meisten Sprachbetrachtungen in den Vordergrund gestellt wird. Als einen prototypischen Fall des Demonstrierens arbeiten sie Zitate (quotations) heraus und stellen diese vor allem dem Beschreiben gegenüber.21 Die Autoren verdeutlichen dies an dem Beispiel, dass eine Sprecherin jemandem die Art und Weise vermitteln will, wie ein Tennisspieler einen Aufschlag vollzieht. Die Sprecherin kann dies einerseits beschreiben und verschiedene Details des Vorgangs benennen. Andererseits kann sie den Aufschlag demonstrieren und ihn (pantomimisch) ausführen. Allgemein sind Demonstrationen (demonstrations) gegenüber Beschreibungen (descriptions) und Hinweisen (indications) durch zwei Aspekte gekennzeichnet. Demonstrations differ from descriptions and indications in two main ways. They are nonserious actions. And they depict their referents, though only selectively. (Clark/Gerrig 1990: 802)

Mit dem ersten Aspekt, der Charakterisierung von Demonstrationen als nicht-ernste Aktionen, greifen die Autoren auf das Konzept der Rahmung nach Erving Goffman (1986 [1974]) zurück.22 Ausschlaggebend ist jedoch der zweite von den Autoren benannte Aspekt: Demonstrationen sind eine Darstellung von etwas (depiction). Gegenstand einer Demonstration kann alles sein, was Sprecher in irgendeiner Weise abbilden können und das vom Adressaten erkannt wird. Mit Demonstrationen können Ereignisse, Zustände, Prozesse oder Objekte abgebildet werden. Dabei sind Demonstrationen durch Selektivität gekennzeichnet. In jeder Demonstration werden – den kommunikati21

22

Als Hauptfunktion des Zeigens bestimmen die Autoren die Lokalisierung von Objekten, stellen aber vor allem das Beschreiben und das Demonstrieren einander gegenüber. Vgl. Kapitel 2.1.3.

Theoretische Modellierung animierter Rede

75

ven Zielen entsprechend – bestimmte Merkmale besonders hervorgehoben, andere hingegen weggelassen. Die Autoren argumentieren, dass Zitate als Demonstrationen betrachtet werden können, mit denen bestimmte Eigenschaften eines Sprechereignisses demonstriert werden: […] quotations are demonstrations that are component parts of language use. The prototypical quotation is a demonstration of what a person did in saying something. So when Alice quotes George, she may depict the sentence he uttered. She can also depict his emotional state (excitement, fear, shyness), his accent (Brooklyn, Irish, Scots), his voice (raspy, nasal, whiny), and even the nonlinguistic actions that accompanied his speech (gestures, frown, head angle). Furthermore, she can depict nonlinguistic events by themselves. (Clark/Gerrig 1990: 768)

Damit ist der Prototyp eines Zitates die Demonstration eines konkreten Sprechereignisses: »the prototypical quotation is a report of a speech event« (Clark/Gerrig 1990: 775). Jedoch können Sprecher nicht nur konkrete, sondern auch generische Ereignisse, Objekte etc. demonstrieren. Somit muss beim Demonstrieren kein singulärer Referent vorliegen. Auch Zitaten – als Demonstrationen eines Sprechereignisses – muss kein ursprüngliches, konkretes Sprechereignis zugrunde liegen. Nach Clark und Gerrig ist damit die Hypothese einer (verbatimen) Reproduktion von Äußerungen nicht notwendig. Für Demonstrationen gilt weiterhin, dass mit ihnen die Übernahme eines Standpunktes verbunden ist. Wird eine Handlung einer Person demonstriert, so übernimmt der Demonstrierende für gewöhnlich die Rolle dieser Person (Clark/Gerrig 1990: 767). In Bezug auf die Interpretationsweise bzw. den semiotischen Modus unterscheidet sich das Demonstrieren vom Symbolisieren darin, dass eine Demonstration von den Adressaten direkt sinnlich wahrgenommen wird. When we hear an event described, we interpret the speaker’s words and imagine the event described. But when we hear an event quoted, it is as if we directly experience the depicted aspects of the original event. We perceive the depictive aspects partly as we would the aspects they are intended to depict. (Clark/Gerrig 1990: 793)

In Bezug auf die Wahrnehmung besteht damit kein Unterschied zwischen einem demonstrierten und einem ›tatsächlich‹ stattfindenden Ereignis; d. h. einem Ereignis, das nicht in einem sekundären Rahmen präsentiert wird. Die Demonstration wird anstelle eines Referenzobjektes wahrgenommen. Mit der Begrifflichkeit von Peirce handelt es sich bei einer Demonstration um ein First. In der Demonstration eines Vorgangs wird dieser in seiner Qualität erfahrbar gemacht. Eine zentrale Funktion des Demonstrierens besteht nach Clark und Gerrig in der Kommunikation von Unbeschreiblichem. Über die Demonstration

76

Animierte Rede

können Dinge kommuniziert werden, die schwer in Worte zu fassen sind. Beispielsweise sind körperliche Bewegungen einfacher zu demonstrieren als zu beschreiben. Hier lässt sich eine Verbindung zur theaterwissenschaftlichen Performance-Theorie herstellen, in der formuliert wird, praktisches Wissen sei performativ, da es nur über eine Realisierung im Handeln vermittelt werden kann:23 Praktisches Wissen ist performativ; es ist körperlich, ludisch, rituell und zugleich historisch, kulturell; performatives Wissen bildet sich in Face-to-Face Situationen und ist semantisch nicht eindeutig; es ist ästhetisch und entsteht in mimetischen Prozessen; performatives Wissen hat imaginäre Komponenten, enthält einen Bedeutungsüberschuss und lässt sich nicht auf Intentionalität reduzieren; es artikuliert sich in Inszenierungen und Aufführungen des alltäglichen Lebens, der Literatur und der Kunst. (Wulf/Göhlich et al. 2001: 13)

Weiterhin benennen Clark und Gerrig, dass Gefühle und Gefühlszustände leichter demonstriert als symbolisierend formuliert werden können. Darüber hinaus benennen die Autoren mit Bezug auf Deborah Tannen (1996 [1989]), dass Demonstrationen bei der Vermittlung eines Ereignisses zur Verlebendigung beitragen und zu einer höheren Involvierung der Beteiligten führen. Zusammengefasst bestimmen Clark und Gerrig das Demonstrieren als grundlegenden semiotischen Modus bzw. Methode des Signalisierens, den sie vor allem dem Beschreiben gegenüberstellen. Terminologisch wird in der vorliegenden Arbeit nicht von Beschreiben, sondern von Symbolisieren gesprochen. Als semiotische Modi werden damit Symbolisieren und Demonstrieren unterschieden. Das Demonstrieren charakterisieren die Autoren als nicht-ernste Handlung, mit der bestimmte Aspekte eines Objektes, einer Handlung oder eines Ereignisses abgebildet werden. Demonstrationen weisen ikonische Eigenschaften auf und können als Erstheit gelten: als ein Objekt, dass die notwendigen Qualitäten zu seinem Verständnis selbst aufweist. Im Gegensatz zu einer Beschreibung werden Ereignisse, Objekte und Hand23

Vgl. hierzu auch die Unterscheidung von semantischem und performativem Wissen von Klaus Foppa: »Up to now, I have spoken about knowledge as if it were only ›knowing that‹ (semantic knowledge) with which we are doing. In fact, a large part of our knowledge refers to performative knowledge, i.e. the knowledge how to perform various actions. Here, the question is not: Can I produce that I know correctly what I pretend to know? but: Am I able to perform the act that I pretend to know how to perform?« (2002: 17). Auch Erika Fischer-Lichte spricht von performativem Wissen und hebt hervor, dass dieses »nicht sprachlich übermittelt, sondern nur am eigenen Leibe erfahren werden kann« (1999: 10). Vgl. auch die Unterscheidung von semantischem und prozeduralem Wissen in der Psychologie (Anderson 2007: 286; Engelkamp/Zimmer 2006: 459).

Theoretische Modellierung animierter Rede

77

lungen im Demonstrieren direkt wahrnehmbar präsentiert. Sprecher können prinzipiell jedes Ereignis – sei es ein reales vergangenes, ein in der Zukunft antizipiertes oder ein generisches – demonstrieren und dadurch Aspekte des Ereignisses vorführen. Typischerweise handelt es sich um Ereignisse/Objekte, die nicht im Hier-und-Jetzt stattfinden bzw. vorhanden sind. Mit Bezug auf die kognitive Linguistik sind diese Ereignisse und Objekte einem mentalen Raum zuzuordnen. Mit Demonstrationen können damit beliebige mentale ›Gegenstände‹ wahrnehmbar gemacht werden. Für die vorliegende Arbeit sind vor allem solche Demonstrationen relevant, in denen ein sprachliches Ereignis demonstriert wird, die Demonstration also in Form einer animierten Rede stattfindet. Nach Clark und Gerrig können eben auch Zitate bzw. animierte Äußerungen als selektive Demonstrationen eines Ereignisses gesehen werden. 3.2.4

Arbeitsdefinition animierte Rede

In Anlehnung an Herbert H. Clark und Richard R. Gerrig (1990) wird animierte Rede als das Demonstrieren oder Vorführen eines Ereignisses bestimmt. Genauer formuliert handelt es sich bei animierter Rede um die Demonstration eines Sprechereignisses bzw. einer Sprechhandlung. Animierte Rede wird als prototypischer Fall des Demonstrierens vor allem dem symbolisierenden Sprechen gegenübergestellt und damit die Relevanz der sinnlichen Wahrnehmung der Demonstration und der Etablierung des Rahmens eines als ob betont. Der Ansatz von Clark und Gerrig wird in der vorliegenden Arbeit dahingehend erweitert, dass explizit eine kognitive Dimension einbezogen wird. Animierte Rede wird als das Demonstrieren der Handlung einer Figur in einem mentalen Raum verstanden. Im Sinne Ervin Goffmans (1981 [1979]) bettet ein Sprecher diese Figur in seine Äußerungen ein und animiert diese. Clark und Gerrig beziehen die Imagination zwar in ihr Konzept ein, die Modellierung reicht jedoch nicht explizit bis zum Aufbau einer imaginierten Figur in einer Szene. Für die vorliegende Arbeit ist eben dieser Aspekt zentral, da er die Möglichkeit der kognitiven Versetzung impliziert. Animierte Rede bedingt die Versetzung in die Perspektive einer Figur. Die Sprecher ›schauen‹ nicht von außen auf das Geschehen innerhalb des mentalen Raumes, sondern nehmen einen Standpunkt innerhalb des imaginierten Geschehens ein. Im Rückgriff auf Karl Bühler (1982 [1934]) wird der Weg stärker gebahnt zu einem der Hauptfälle des sprachlichen Zeigens: der Deixis im Phantasma. Gleichzeitig ermöglicht die Auffassung der Animation einer Figur die Anbindung an sozial interaktionale Arbeiten und das Konzept des Footings nach Erving Goffman.

78

Animierte Rede

3.3

Kontextualisierung animierter Rede und körperliche Repräsentation mentaler Räume

Nach der Darstellung zentraler Aspekte zur theoretischen Modellierung animierter Rede im vorangegangenen Teilkapitel werden im folgenden Kapitel ausgewählte verbale, prosodische und körperliche Aspekte besprochen, die für die empirischen Analysen der Gestaltung relevant sind. Im ersten Abschnitt wird auf verbale und prosodische Mittel eingegangen, mittels derer animierte Rede als konversationelles Phänomen hergestellt werden kann (3.3.1). Im zweiten Abschnitt wird auf körperliche Aspekte der Animation von Figuren und der Gestaltung mentaler Räume eingegangen (3.3.2). 3.3.1

Verbale und prosodische Mittel der Kontextualisierung animierter Rede

Bei der Kontextualisierung animierter Rede sind mehrere Aspekte zu unterscheiden. So muss grundsätzlich kontextualisiert werden, dass es sich bei einer Äußerung bzw. einem Teil einer Äußerung um animierte Rede handelt. Wenn innerhalb des mentalen Raumes potentiell mehrere Figuren vorhanden sind, muss kontextualisiert werden, welche Figur spricht, was auch als referent tracking bezeichnet wird (Klewitz/Couper-Kuhlen 1999). Darüber hinaus kann unterschieden werden, ob die Mittel zur Markierung innerhalb oder außerhalb der animierten Äußerung verwendet werden. Im Folgenden werden einige zentrale Aspekte der Kontextualisierung behandelt. Hervorzuheben ist nochmals die indexikalische Natur von Kontextualisierungshinweisen. Zur Kontextualisierung eines Phänomens – in diesem Fall animierte Rede – werden mehrere Hinweise kombiniert. Hieraus folgt, dass animierte Rede mehr oder weniger deutlich kontextualisiert werden kann, je nach dem wie ›stark‹ die Kombination der Hinweise ist. Zur Markierung animierter Rede können lexiko-syntaktische Strukturen verwendet werden, die unter anderem als Redeeinleitung (Birkner 2008: 224; Günthner 1997a, 2009; Schwitalla 1991) oder Redeanführung (Plank 1986) bezeichnet werden. Diese Bezeichnungen sind jedoch insofern missverständlich, als die Strukturen zwar oft der animierten Rede vorangestellt werden und diese damit tatsächlich einleiten, sie dieser aber auch teilweise nachgestellt oder in diese integriert sein können (vgl. u. a. Raible 1992: 42).24 In 24

Darüber hinaus verwendet Kotthoff (1996: 163) den Begriff Redeeinleitung für bestimmte lexikalische Elemente wie ja und also, die zu Beginn einer animierten Äußerung verwendet werden.

Kontextualisierung animierter Rede

79

englischen Publikationen werden daher meist die Bezeichnungen quotative (construction) oder reporting frame verwendet.25 Quotative haben oft die Form einer Sprecherangabe in Verbindung mit einem Verbum dicendi, z. B. da sagt er X oder X hab ich gesagt (vgl. Bolden 2004). Anstelle expliziter Sprechaktverben können auch Verba sentiendi und sciendi verwendet werden. Jedoch ist das Vorhandensein eines Verbs im Quotativ nicht zwingend notwendig (vgl. u. a. Behr 2002). Für das Deutsche wird beispielsweise ein Quotativ der Form und ich so X (Auer 2006a; Golato 2000) und für das Spanische Nominalphrasen der Form y yo X (›und ich X‹, Cameron 1998) beschrieben, die auch im deutschen Teilkorpus der Arbeit zu finden sind. Im argentinischen Teilkorpus finden sich darüber hinaus Quotative der Form tipo X und ponele X, die weder Verb noch Sprecherangabe enthalten.26 Quotative, die ein Verb enthalten, werden in der vorliegenden Arbeit als Matrixstrukturen bezeichnet, da diese nicht lediglich auf der semantisch-pragmatischen Ebene eine animierte Rede einleiten. Vielmehr ist die animierte Rede auch syntaktisch von der Matrixstruktur abhängig. Die in Quotativen häufig verwendeten Verba dicendi und sentiendi sind dadurch gekennzeichnet, dass sie eine obligatorische Objektergänzung fordern, die durch die animierte Rede eingelöst wird.27 Je nach syntaktischer Realisierung als Hauptoder Nebensatz ergibt sich – in klassischer Terminologie – eine mehr oder weniger starke Direktheit der animierten Rede (Plank 1986) bzw. eine mehr oder weniger starke Expressivität.28 In diachroner Perspektive besteht für 25

26

27

28

Unter anderem werden die folgenden Bezeichnungen verwendet: quotative (Blyth/ Recktenwald et al. 1990; Golato 2000), quotative construction (Couper-Kuhlen 1999: 15), reportative introduction (Couper-Kuhlen 1999: 25), reportative phrase (Klewitz/CouperKuhlen 1999), reporting frame (Bolden 2004) und framing clause (Hickman 1993: 64). Eine Typologie der Quotative, die unter anderem eine Differenzierung nach syntaktischer Form, die Beschränkung des Quotativs auf der Voran-/Nachstellung sowie die Bindung an bestimmte Gattungen (und auch an bestimmte Phasen der Gattung, etwa am Höhepunkt einer Erzählung) berücksichtigen müsste, steht sowohl für das Deutsche als auch für das Spanische noch aus. Ansätze finden sich unter anderen bei Elisabeth Gülich (1978). Wolfgang Raible beurteilt Redewiedergabe deshalb generell als »Sonderfall des allgemeineren Falls der sogenannten Objektsätze« (1992: 105). Dem kann in der vorliegenden Arbeit jedoch nicht gefolgt werden, da animierte Rede nicht in jedem Fall syntaktisch eingeleitet wird mithin nicht immer syntaktisch abhängige Sätze vorliegen. Vereinfachend können die beiden folgenden Realisierung des Objektkomplements unterschieden werden: Matrixstruktur Objektkomplement Ich sage: er kommt heute nicht. Parataxe (direkte Rede) Ich sage, dass er heute nicht kommt. Hypotaxe (indirekte Rede)

80

Animierte Rede

solche Matrixstrukturen eine Tendenz zur Grammatikalisierung (Auer 1998; Auer/Günthner 2005). Indem diese sowohl formal als auch semantisch immer weiter reduziert werden, können die Abhängigkeitsverhältnisse zwischen regierendem und abhängigem Syntagma umgekehrt werden. Durch die Verwendung einer Matrixstruktur kann (in der Voranstellung) eine nachfolgende animierte Rede projiziert werden. Die Projektion wird dabei insbesondere durch das Verb geleistet. In der Arbeit werden aber auch solche Sequenzen analysiert, in denen die Projektion nicht durch ein Verb, sondern durch andere syntaktische Elemente geleistet wird.29 Zur Kontextualisierung animierter Rede können neben Quotativen auch lexikalische Elemente innerhalb der animierten Rede beitragen. So werden insbesondere als erstes Element einer animierten Äußerung Partikel mit einer interaktionalen Funktion verwendet.30 Hierzu zählen Partikel, mit denen Affekt ausgedrückt wird (oh, ah, ay), Anredeformen (hey, che) und Eigennamen der angesprochen Person. Darüber hinaus werden oft solche Elemente verwendet, mit denen eine Reaktion auf einen vorangegangenen Gesprächsbeitrag markiert wird (z. B. durch Antwortpartikeln wie sí, no, ja, nein) oder auch inhaltliche Fortsetzungen eines vorangegangenen Gesprächsbeitrages entwickelt werden (z. B. mit also, entonces). Teilweise werden diese Elemente auch dann verwendet, wenn zuvor keine Äußerung animiert wurde. Durch den impliziten Verweis auf einen im mentalen Raum vorangegangenen Gesprächsbeitrag wird so Kontext hergestellt. Eine besondere Form der Veränderung des Produktionsformates und der Einbettung eines fremden Autors in die eigene Äußerung ist die Verwendung von Phraseologismen oder formelhaften Wendungen. Johannes Schwitalla arbeitet heraus, dass die von ihm untersuchten Jugendlichen solche Quasizitate verwenden, »um für einen Augenblick in die Rolle eines Arbeiterjugendlichen zu schlüpfen oder einen solchen zu evozieren« (1994: 493). Durch die Evokation eines sozialen Typus können sich die Sprecher eine Gegenwelt vergegenwärtigen, von der sie sich abgrenzen.31 Solche Evoka-

29

30 31

Hat das Objektkomplement die Form eines Hauptsatzes, so ist dieser als ›abhängiger Hauptsatz‹ zu beurteilen. Unter anderen Auer (1998) hebt jedoch hervor, dass die parataktische und hypotaktische Realisierung als Pole eines Kontinuums zu beurteilen sind. So wird in Kapitel 5.2 die Konstruktion X de Y untersucht, in der durch die Präposition de eine Projektion etabliert wird, die durch eine animierte Rede eingelöst werden kann. Kotthoff (2005: 346) bezeichnet solche Partikeln als typische Redeeinleitungen. Vgl. hierzu auch Schwitalla (1991) und Lüger (1998). Zur Evokation sozialer Stereotype durch animierte Rede vgl. Kapitel 5.3.

Kontextualisierung animierter Rede

81

tionen sind damit nicht auf die personale Dimension beschränkt, sondern können sich auch auf Kontextschemata mit größerer Reichweite beziehen. Mittels verschiedener sprecherischer Phänomene bzw. sprachlicher Strukturen können Sprecher auf zeitlich zurückliegenden oder allgemein ›fremden‹ Kontext konkret oder stereotyp verweisen und diesen damit aktuell setzen. Die Gesprächsteilnehmer können auf diese Weise neue Kontextschemata in das aktuelle Gespräch einbringen, mit bereits etablierten überlagern und so Vielschichtigkeit erzeugen. Mit Bezug auf Michail M. Bakhtin (1990; Bakhtin/ Holquist 1981) und Valentin N. Volosinov (1971, 1993) kann dies als Polyphonie bezeichnet werden. Im Sinne einer dialogischen Bezugnahme schwingen bei jeder Verwendung eines ›Wortes‹ oder Ausdrucks frühere Verwendungsweisen desselben mit. Die Evokation von früheren Verwendungskontexten ist nicht nur auf der lexiko-syntaktischen, sondern insbesondere auch auf der phonetischen Ebene durch stilisierte Sprechweisen bzw. die Verwendung bestimmter Sprechausdrucksmuster möglich (siehe unten). Neben lexikosyntaktischen Strukturen spielen Deiktika eine zentrale Rolle für die Kontextualisierung animierter Rede: »If deictic expressions are anchored partly or wholly to the reported situation, this alone will cue the discourse as reported, in the absence of a reportative phrase« (Klewitz/ Couper-Kuhlen 1999: 460). Dabei kann auch die Prosodie als deiktischer Hinweis dienen, was Couper-Kuhlen (1999) auch als vocal deixis bezeichnet. Gesprächsteilnehmer gehen von prosodischen Normalwerten einer sprechenden Person aus. In the default case, loudness, pitch and tempo ranges together with voice quality are anchored to the prosodic/paralinguistic habitus of the speaker. That is, speakers are accustomed to deploy, and their interlocutors are accustomed to expect, certain prosodic and paralinguistic ›reference values‹. A noticeable shift of these values – using a pitch, loudness or tempo range or a voice quality which departs from the speaker’s habitus – will be heard as shifted deixis and can evoke the presence of a second deictic centre. (Couper-Kuhlen 1999: 14)

Weicht ein Sprecher signifikant von erwarteten prosodischen Normalwerten ab, so kann dies als Hinweis auf ein zweites deiktisches Zentrum gesehen werden, womit von einem »vocal deictic shift« (Couper-Kuhlen 1999: 16) gesprochen werden kann.32 Darüber hinaus können phonetische Mittel so 32

Zur Kontextualisierung animierter Rede werden vor allem die folgenden Parameter verändert: Grundfrequenz, Sprechregister, Lautheit, Sprechgeschwindigkeit und Stimmqualität. Hinzu kommen Rhythmuswechsel und rhythmische Pausen (Klewitz/Couper-Kuhlen 1999). Interessant in Bezug auf Grundfrequenzveränderungen ist vor allem der Artikel von Couper-Kuhlen (1996). Die Autorin unterscheidet, ob ein Sprecher bei der Wiedergabe einer realen Äußerung versucht, die

82

Animierte Rede

genutzt werden, dass einzelnen Figuren ein spezifisches prosodisches Format zugeschrieben wird (Klewitz/Couper-Kuhlen 1999). Dieses Mittel arbeitet auch Ines Bose (2003) in Bezug auf kindliche Rollenspiele heraus, in denen ein Kind mehrere fiktive Spielrollen übernehmen kann. Den Wechsel zwischen verschiedenen Spielidentitäten kontextualisieren die Kinder oft durch Kontraste im Sprechausdruck. Sprechausdruck bestimmt die Autorin in Anlehnung an Eva-Maria Krech und Günther Richter (1991) als »[a]n sprachliche Formulierungen gebundene bzw. sie komplettierende sprecherische Ausdrucksformen, die zwar individuell ausgeführt, aber situations- und stimmungsadäquat konventionalisiert gestaltet werden« (Bose 2003: 28).33 Unterschieden wird zum einen der physiognomische Sprechausdruck, womit »angeborene und gewohnheitsmäßige Gestaltungsweisen« (Bose 2003: 37) eines individuellen Sprechers bezeichnet werden. Dem gegenüber steht der pathognomische Sprechausdruck, der sich auf die »konkrete Sprechweise in einer konkreten Situation« (Bose 2003: 37) bezieht. Der Sprechausdruck ist durch den Einsatz und die Variation segmentaler und suprasegmentaler phonetischer Parameter bedingt, wobei ein bestimmter Sprechausdruck jedoch immer holistisch wahrgenommen wird.34 Aufgrund der Musterhaftigkeit des Sprechausdrucks kann dieser als Kontextualisierungshinweis verwendet werden.35 Durch den Sprechausdruck kann Kontext auf verschiedenen Ebenen hergestellt werden. So können Emotionen (z. B. Verärgerung), physische Zustände (z. B. Erschöpfung), soziale Rollen (z. B. Mutterrolle, motherese) oder Textsorten und mediale Muster (z. B. Nachrichtensendung,

33

34

35

Grundfrequenz des ursprünglichen Sprechers genau zu treffen (absolute register matching) oder ob nur ein relativer Kontrast zur Grundfrequenz der eigenen Stimme erzielt werden soll (relative register matching). Absolutes register matching tritt auf, wenn auf der verbalen Ebene ein hoher Grad an Übereinstimmung mit der Originaläußerung besteht und diese gleichzeitig kritisch kommentiert wird. Vgl. hierzu die Unterscheidung von Sprechausdrucksmuster und Sprechausdrucksweise bei Gutenberg (2001). Für die Beschreibung des Sprechausdrucks hat Bose (2003) einen ausführlichen Merkmalskatalog aufgestellt, auf den in der vorliegenden Arbeit zurückgegriffen wird. Die Autorin diskutiert ebenfalls den Bezug des Sprechausdrucks zu den Konzepten des Malfeldes (Bühler 1982 [1934]; Ehlich 1991, 1994; Redder 1994) und der Stilisierung (Auer 1989; Günthner 1997b, 2002b; Kotthoff 2005; Selting/ Hinnenkamp 1989). In der vorliegenden Arbeit wird damit weniger davon ausgegangen, dass der Sprechausdruck »durch die Bedingungen und Erfordernisse der Situation ausgelöst« (Stock 1987: 57) ist, sondern vielmehr als ein Mittel eingesetzt wird, um Kontext für die Äußerung herzustellen. Die Beurteilung des pathognomischen Sprechausdrucks in der Interaktion erfolgt aufgrund der Kenntnis des individuumspezifischen, physiognomischen Sprechausdrucks.

Kontextualisierung animierter Rede

83

Werbespot) kontextualisiert werden.36 Zur Aktivierung entsprechender Kontexte genügen nach Anke Schäfer »bereits Äußerungen knappen Umfangs, deren Sprechausdrucksgestaltung jedoch elaboriert ist« (2003: 82). Dabei können in einer Äußerung verschiedene Sprechausdrucksmuster (z. B. Verwunderung und Ärger) überlagert und so komplexe Kontexte etabliert werden.37 Wie auf der lexiko-syntaktischen und der deiktischen Dimension ergeben sich auf der phonetischen Ebene Übergänge in Bezug auf die Zuschreibung einer Äußerung zur animierten Figur oder dem aktuellen Sprecher. So kann unter anderem ein mehr oder weniger deutlich vom symbolisierenden Sprechen abgesetztes Sprechausdrucksmuster gewählt werden. Darüber hinaus kann ein gewähltes prosodisches Muster im zeitlichen Verlauf der Äußerungen mehr oder weniger genau mit der animierten Äußerung verbunden sein. So belegen Klewitz/Couper-Kuhlen (1999) Fälle, in denen der Wechsel in das prosodische Muster einer Figur bereits vor dem verbal animierten Teil der Äußerung erfolgt, was die Autorinnen als fore-shadowing bzw. pre-voicing bezeichnen. Galina Bolden (2004) arbeitet heraus, dass ebenfalls am Ende einer animierten Äußerung ein gleitender Übergang erfolgen kann, was sie als fading out bezeichnet. ›Fading out‹ occurs in the unit of talk following a quote, if the current speaker fails to mark it as either being part of the quote (by employing some quote extending practices) or separate it from it (by using the unquote practices). As a result, the boundary between the report and the current speaker’s own words become equivocal. (Bolden 2004: 1106)

Sowohl Bolden als auch Couper-Kuhlen (2007) argumentieren, dass es sich bei solchen prosodischen Übergängen von der Stimme einer Figur in die Stimme des aktuellen Sprechers nicht um ›ungewollte‹ bzw. missverständliche Kontextualisierungen handelt. Vielmehr wird dieses Mittel funktional eingesetzt, um eine in der Animation vorgenommene Bewertungen für das Hier-und-Jetzt relevant zu machen. Der Sprecher kann so implizit signalisie36

37

Norbert Gutenberg unterscheidet die folgenden Dimensionen, auf denen Sprechausdruck kommunikativ wirken kann: »1. linguistisch: hierher gehören Strukturen des Sprechdenkens, Kadenzen und das phonetische und phonologische System; 2. psychisch: Affekte, Emotionen, Stimmungen, auch Pathologien; 3. psychosozial: situative, formative, rollenspezifische Muster (z. B. Dozententon); 4. sozial: schicht- und gruppenspezifische Muster; 5. physiologisch: okkasionelle, habituelle und konstitutionelle, auch sprechpathologische Muster; 5. physikalisch: medienbedingte Muster« (2001: 126). Interaktionale Studien zum Sprechausdruck liegen bislang jedoch nur in geringem Umfang vor (u. a. Bose 1999; 2003; Bose/Ehmer 2007; Schäfer 2003).

84

Animierte Rede

ren, dass er sich mit der durch eine Figur ausgedrückten Position identifiziert, womit ein Übergang der Rolle des Prinzipals von der Figur auf den aktuellen Sprecher hergestellt wird. 3.3.2

Körperliche Konstitution mentaler Räume

Sprecher können neben verbalen auch körperliche Mittel einsetzen, um einen mentalen Raum zu konstituieren. Durch Bewegungen ihres eigenen Körpers können sie körperliche Handlungen von Figuren ausführen und diese für die anderen Interaktanten sichtbar demonstrieren. Beispielsweise können Sprecher in der Rolle einer Figur ›pantomimisch‹ mit imaginierten Gegenständen agieren oder sich während der animierten Rede körperlich anderen imaginierten Figuren zuwenden und diese damit lokalisieren. Die körperliche Ebene stellt damit eine Ressource für die Kontextualisierung der Animation einer Figur dar. Allgemeiner formuliert kann über den Einsatz körperlicher Mittel eine physische Repräsentation des aktuell aufgebauten mentalen Raumes geschaffen werden. Auf diese Weise können Aspekte des mentalen Raumes visuell erfahrbar gemacht und der mentale Raum gleichzeitig gestaltet werden. Im Folgenden werden einige zentrale Konzepte der Gestenforschung und multimodaler Ansätze erläutert. Zunächst wird auf das grundsätzliche Verhältnis von verbaler und körperlicher Ebene eingegangen. Während Ansätze aus der Gestenforschung vor allem auf den individuellen Ausdruck von Semantik auf unterschiedlichen Ebenen fokussieren, zielen gesprächsanalytische Ansätze vor allem auf den Beitrag körperlicher Ressourcen zur Gesprächsorganisation. In einem zweiten Schritt werden unterschiedliche Klassen bzw. semiotische Dimensionen von Gesten vorgestellt. Hiervon ausgehend wird ein in der Untersuchung von Gebärdensprachen entwickeltes Modell vorgestellt, mit welchem die körperliche Repräsentation mentaler Räume erfasst werden kann. In diesem Zusammenhang wird insbesondere auf ikonisch-pantomimische Gesten und Zeigegesten eingegangen. Verhältnis von verbaler und körperlicher Ebene Zur körperlichen Ebene werden die Gestik mit Gliedmaßen, Mimik, Körpertonus, Körperhaltung und -bewegung sowie Blickbewegungen gezählt. Bereits William S. Condon und William D. Ogston (1966, 1967) weisen eine Simultaneität von verbaler Produktion und Körperbewegungen beim Sprechen nach. In der Folge wurde diese Simultaneität – im Sinne einer zeitlichen

Kontextualisierung animierter Rede

85

Ko-Okkurrenz – als Ko-Expressivität von verbaler und körperlicher Ebene betrachtet. So vertritt Adam Kendon (1980: 208) die These, dass verbale Elemente und Körperbewegungen Ausdruck ein und desselben Äußerungsprozesses sind. Eine durch den Begriff non-verbal nahegelegte Nachordnung der körperlichen Dimension hinter die verbale Ebene wird damit zurückgewiesen und beiden Ebenen dieselbe Relevanz zugesprochen.38 So fasst David McNeill das Verhältnis von Gesten und verbalen Ereignissen wie folgt zusammen: Two core features of gesture are that they carry meaning, and that they and the synchronous speech are co-expressive. Co-expressive, but not redundant: gesture and speech express the same underlying idea unit but express it in their own ways – their own aspects of it, and when they express overlapping aspects do so in distinctive ways. They are also synchronous at the exact point where they are also coexpressive. Co-expressive symbols, spoken and gestured, are presented by the speaker at the same time – a single underlying idea in speech and gesture simultaneously. (McNeill 2007: 23 Hervorhebungen im Original)

Für das Konzept der Ko-Expressivität ist zentral, dass Gesten nicht nur Bedeutung tragen und zeitgleich zur verbalen Ebene auftreten. Vielmehr drücken Gesten und verbale Äußerung meist unterschiedliche Aspekte einer zugrunde liegenden ›Idee‹ aus. Selbst wenn keine unterschiedlichen Aspekte ausgedrückt werden, sondern ein und derselbe Aspekt, so geschieht dies dennoch auf verschiedene Weisen. Damit sind die Informationen auf beiden Ebenen nicht redundant, sondern nach McNeill zwei Pole, die in einem dialektischen Verhältnis zueinander stehen. Hiervon ausgehend entwickelt McNeill (2007) das kognitiv-psychologische Konzept des growth point. Der Kern des Konzeptes ist, dass es sich bei Sprache (language) und Bildhaftigkeit (imagery) um zwei separate semiotische Modi handelt. Der growth point ist der kognitiv-semantische Ausgangspunkt einer Äußerung, in dem eine Einheit zwischen den beiden Modi besteht. Zwischen beiden Modi besteht gleichzeitig aber auch eine dialektische Spannung, die während des Äußerungsaktes in verbalsprachliche Äußerungen und Gesten entpackt bzw. umgesetzt wird. Ausgehend von diesem Konzept ist Bildhaftigkeit in jeder Kommunikation vorhanden, auch wenn deren Umsetzung in Gesten variiert.

38

Alternativ zu non-verbal werden sowohl in der deutschsprachigen als auch in der englischen Literatur Begriffe verwendet, die auf den Körper als Ausdrucksmittel oder dessen visuelle Rezeption zurückgreifen wie beispielsweise visible/bodily conduct (Heath/Luff 2007), embodied displays (Goodwin 2000), körperlicher Ausdruck (Schmitt 2005: 21), sichtbare bzw. körperliche Kommunikation (Bohle 2007: 13). Eine Zusammenstellung gibt Stukenbrock (2008: 3).

86

Animierte Rede

Mit dem Konzept des growth point entwickelt McNeill ein kognitiv orientiertes Produktionsmodell des Sprechens eines einzelnen Sprechers, in dem Semantik als individuell kognitive Realität verstanden wird, die dem Äußerungsakt in gewisser Weise vorausgeht. Auch wenn McNeill versucht, interaktive Aspekte in sein Konzept einzubeziehen, wird Semantik dennoch nicht als gemeinsam in der Kommunikation hergestellte Bedeutung verstanden.39 Es handelt sich um den Ausdruck semantischer Grundkategorien auf der verbalen und der körperlichen Ebene. Vor diesem theoretischen Hintergrund sind Gesten und verbale Produktion per se synchron und »es gibt keine relevante zeitliche Abweichung einer Geste von dem Redesegment, auf das sie sich bezieht« (Fricke 2007: 146). Zwar können in der Ausführung von Gesten verschiedene Phasen unterschieden werden: Das Zentrum der Geste ist der Schlag (stroke) bzw. der Apex, von dem Kendon (1980) die Phasen der Vorbereitung (preparation) und Rücknahme (retraction) unterscheidet.40 Nach McNeill (2007: 31) – der noch weitere Phasen unterscheidet – jedoch dienen diese Phasen v. a. dazu, die Synchronizität und Ko-Expressivität der verbalen Ebene mit dem körperlichen Schlag zu gewährleisten. Von interaktional ausgerichteten Arbeiten wird die Frage nach dem zeitlichen Verhältnis der Ausdrucksebenen etwas anders beantwortet. Zwar werden die Ebenen auch hier als von Sprechern ko-expressiv eingesetzte Mittel betrachtet. Jedoch wird weniger auf den semantischen Produktionsprozess beim Einzelnen, sondern auf den Prozess der gemeinsamen Bedeutungskonstitution von Interaktanten fokussiert. Damit rückt auch der Aspekt der Sequentialität ins Blickfeld. In verschiedenen Arbeiten wird gerade die sequentielle Abfolge unterschiedlicher Ausdrucksmittel thematisiert und in welcher Weise Ablaufschemata zur Herstellung von gemeinsamem Sinn beitragen.41 In jüngster Zeit wird mit dem Konzept der Koordination versucht, einen Rahmen um multimodale Phänomene zu spannen, in dem sowohl individuelle als auch interaktionale Aspekte in ihrer Interdependenz erfasst werden sollen.42 Multimodalität wird dabei als konstitutiv für die Interaktion betrachtet. Deppermann/Schmitt (2007) heben nicht nur die Wichtigkeit des 39

40

41

42

Zwar postuliert McNeill »a growth point is always connected to the discourse context, including also social interactional aspects« (2007: 82). Was damit gemeint ist, bleibt jedoch vage und der interaktive Aspekt wird nicht systematisch in das Konzept des growth point einbezogen. Sotaro Kita (1990) fügt diesen Phasen optionale Haltephasen vor und nach dem Schlag hinzu. Vgl. u. a. Deppermann/Schmitt (2007), Goodwin (2003), Schmitt (2005), Streek (1993) und Stukenbrock (2008). Vgl. u. a. die Beiträge im Sammelband Schmitt (2007).

Kontextualisierung animierter Rede

87

Sichtbaren für die Organisation der Interaktion hervor, sondern betrachten unterschiedliche Ausdrucksebenen prinzipiell als gleichberechtigt. Zu den Ausdrucksmodi bzw. Ressourcen zählen neben der verbalen Ebene die Phonetik (Stimme, Lautstruktur) und die Körperlichkeit (Gestikulation, Mimik, Blick, Körperhaltung, Körperorientierung, Position im Raum und Bewegungsarten). Die Autoren gehen insofern über frühere Konzepte zur Körperlichkeit hinaus, als sie eine konsequent interaktionale Perspektive verfolgen. Interaktionen werden nicht als aufeinander bezogene Einzelhandlungen, sondern als von allen Beteiligten hervorgebrachtes »praxeologisch gerahmtes Ereignis« (Deppermann/Schmitt 2007: 22) verstanden. In der Analyse muss daher eine dezidiert vollzugsrekonstruktive Perspektive eingenommen werden. Dies bedingt eine Lösung von den bisherigen Basiskategorien SprecherHörer, die zu sehr auf die verbale Ebene fokussieren. Analysiert werden die Aktionen von Interaktanten in einem Interaktionsensemble. Dabei heben die Autoren erstens die Simultaneität des Ressourceneinsatzes auf verschiedenen Ebenen hervor: Die Ausdrucksressourcen werden meist als Bündel eingesetzt und besitzen indexikalischen Charakter. Als zweiten konstruktiven Mechanismus der Interaktion betrachten die Autoren – in der Tradition konversationsanalytischer Arbeiten – die Sequentialität von Ereignissen auf den verschiedenen Ausdrucksebenen. Ausgehend vom beobachtbaren, multimodalen Äußerungsakt gehen die Betrachtungen in zwei Richtungen. Der Begriff der interpersonalen Koordination fokussiert auf die Organisation sozialen Handelns und die gemeinsame Bedeutungsherstellung. Dabei sprechen die Autoren nicht mehr von Rückmeldeverhalten (im Sinne einer einzelner Reaktionen), sondern gehen von einem kontinuierlichen Vorgang von Displayprozessen aus. Unter intrapersonale Koordination wird gefasst, wie ein Interaktionsteilnehmer »die unterschiedlichen Ausdrucksmodalitäten seines eigenen Verhaltens aufeinander abstimmt« (Deppermann/Schmitt 2007). Der Aspekt der intrapersonalen Koordination umfasst damit den individuellen Ausdruck des Individuums, auf den McNeill mit dem Konzept des growth point fokussiert. Anders als McNeill nehmen die Autoren jedoch keine kognitive, sondern eine dezidiert sozial-interaktionale Perspektive ein: Die intrapersonale Koordination erfolgt immer im Hinblick auf die interpersonale Koordination. Es besteht somit eine Interdependenz von inter- und intrapersonaler Koordination. Der Abgleich beider Dimensionen ist eine permanente Grundanforderung an die Teilnehmer einer Interaktion. Für die vorliegende Arbeit ist in erster Linie relevant, wie körperliche Mittel zur Animation von Figuren und der Konstitution mentaler Räume ein-

88

Animierte Rede

gesetzt werden. Mit der Animation einer Figur ist verbunden, dass Sprecher deren Perspektive übernehmen und als diese agieren. Jedoch müssen Sprecher diese Rollenübernahme nicht auf allen Ausdrucksebenen (körperlich, phonetisch, verbal) gleich stark markieren. In kognitiver Hinsicht kann mit McNeill die Übernahme einer Figurenrolle als spezifischer growth point gefasst werden, der in den verbalen, phonetischen und körperlichen Mitteln unterschiedlich stark reflektiert wird. In interaktionaler Hinsicht setzen Sprecher die multimodalen Ausdrucksressourcen ko-expressiv ein, um ihren Interaktionspartnern die Animation von Figuren zu signalisieren, die Aktivität der Aufführung zu koordinieren und gleichzeitig ›individuelle‹ mentale Räume zu gemeinsamen zu machen. Dimensionen von Gesten Eine der grundlegenden Arbeiten der Gestenforschung ist die von David Efron (1972 [1941]) vorgelegte systematische Beschreibung von Gesten. Hierauf aufbauend entwickelt beispielsweise Kendon (1988) eine Klassifikation, bei der Gesten auf einem Kontinuum angeordnet werden. Dabei werden als prototypische Punkte redebegleitende Gesten, mit dem Sprechen verbundene Gesten, Pantomime und Embleme unterschieden. Den Extrempunkt der Skala bilden Zeichensprachen. In dieser Reihenfolge nimmt (a) das obligatorische Vorhandensein verbaler Sprache ab. Die Gesten selbst weisen (b) stärker sprachähnliche Eigenschaften auf, womit syntaktische Verwendungsbeschränkungen bestehen und (c) die Gesten sind stärker konventionalisiert.43 Als redebegleitende Gesten (gesticulation) werden spontane Körperbewegungen während des Sprechens bezeichnet. Diese Gesten tragen eine Bedeutung, die nur in Bezug auf die Semantik der zeitgleichen verbalen Produktion erschließbar ist (Fricke 2007: 143; Kendon 1980: 207; McNeill 2007: 5). Redebegleitende Gesten sind also weder konventionalisiert, noch weisen sie sprachähnliche Eigenschaften auf. In enger Verbindung hierzu stehen mit dem Sprechen verbundene Gesten (speech-linked gestures), mit welchen eine syntaktische Leerstelle innerhalb einer Äußerung gefüllt und dadurch ein verbales 43

Entlang dieser drei Dimensionen differenziert McNeill (1992, 2007) das von Kendon vorgeschlagene Kontinuum in mehrere Kontinua aus, in denen sich die Abfolge der prototypischen Gesten unterscheidet. Gleichzeitig fügt McNeill eine vierte Dimension hinzu, den Charakter der Semiose. Darunter versteht er, ob die Bedeutung einer Geste ausgehend von der Gesamtbedeutung einer Äußerung erschlossen werden kann/muss oder ob eine einzelne Geste die Hauptbedeutung einer Äußerung trägt und mitbestimmt.

Kontextualisierung animierter Rede

89

Element paradigmatisch – also nicht sequentiell – ersetzt wird (McNeill 2007: 5). Syntaktisch verhalten sich diese Gesten wie lexikalische Elemente, sind jedoch nicht konventionalisiert. Embleme hingegen sind Gesten, die Eigenschaften eines Symbols im Sinne de Saussures aufweisen. Durch Konventionalisierung ist mit einer körperlich-visuell bestimmten Formseite ein konventionalisierter Inhalt verbunden (McNeill 2007: 5). Unter Pantomime fasst McNeill Gesten mit narrativen Eigenschaften, die nicht von verbalen Äußerungen begleitet werden: »›Pantomime‹ is dumb show, a gesture or sequence of gestures conveying a narrative line, with a story to tell, produced without speech« (2007: 5). Pantomime ist nicht konventionalisiert und durch eine obligatorische Abwesenheit von Sprache gekennzeichnet. McNeill problematisiert diese Begriffsbestimmung selbst und konstatiert, dass keine allgemeingültige Definition von Pantomime gegeben werden kann. Den Extrempunkt des Kontinuums bilden Zeichensprachen, in denen jeder Geste eine konventionalisierte Bedeutung zukommt, starke syntaktische Verwendungsbeschränkungen bestehen und die Gesten ohne jegliche Koordination mit verbalen Äußerungen verwendet werden. Die redebegleitenden Gesten werden von McNeill weiter unterteilt. Bei den beats handelt es sich um schlagähnliche Gesten. Mit ikonischen Gesten werden konkrete Gegenstände oder Ereignisse abgebildet: Such gestures present images of concrete entities and/or actions. They are gestures in which the form of the gesture and/or its manner of execution embodies picturable aspects of semantic content (aspects of which are also present in speech). (McNeill 2007: 39)

Die Abbildungsfunktion ikonischer Gesten beruht auf einer möglichen Analogiebildung zwischen der körperlichen Ebene und der abgebildeten Größe. Dies ist auch bei metaphorischen Gesten der Fall, mit denen jedoch Abstraktes verkörpert wird. Zu den redebegleitenden Gesten werden auch deiktische oder Zeigegesten gezählt, mit denen Sprecher auf ein Referenzobjekt hinweisen. Innerhalb der redebegleitenden Gesten nehmen die Zeigegesten eine Sonderstellung ein, da sich für das Zeigen kulturspezifische Praktiken herausgebildet haben. Aufgrund dieser Konventionalisierung kann der Zeigeakt ohne begleitende verbale Äußerungen vollzogen werden. Damit wird die Zuordnung der Zeigegesten zu den redebegleitenden Gesten fraglich, da hierdurch dem verbalen Anteil beim Zeigen eine zu hohe Relevanz zugesprochen wird (s. u.). Für die Analyse von Gesten in der Interaktion sind diese Kategorien zu Beschreibungszwecken nützlich. Eine strikte Klassifikation von Gesten jedoch erscheint wenig sinnvoll (vgl. McNeill 2007) und ist in vielen Fällen

90

Animierte Rede

nicht möglich, da in einer einzelnen Geste verschiedene Aspekte kombiniert sein können. So kann beispielsweise eine Zeigegeste mit einer ikonischen Geste verbunden sein oder innerhalb einer Pantomime vorkommen. Auch eine strikte Unterscheidung von Pantomime und ikonischen Gesten – mit denen jeweils ein Ereignis oder ein Gegenstand verkörpert wird – ist fragwürdig. Anstatt von einer Klassifikation ist daher von gestischen Dimensionen auszugehen. Relevant für die folgende Arbeit ist insbesondere die ikonische bzw. pantomimische Dimension. Mit solchen Gesten kann ein Sprecher Handlungen einer Figur oder Vorgänge innerhalb eines mentalen Raumes demonstrieren. Damit stehen animierte Rede auf der verbalen und Pantomime auf der körperlichen Ebene in direkter Verbindung. Aber auch Zeigegesten kommt eine besondere Relevanz zu, wenn Sprecher im Zeigen am Phantasma auf imaginierte Objekte innerhalb eines mentalen Raumes referieren. Zur Verbindung der körperlichen Ebene mit der Theorie mentaler Räume wird im Folgenden auf ein Konzept aus der Gebärdensprachforschung zurückgegriffen. Im Anschluss daran wird genauer auf die ikonisch-pantomimische Dimension und die Zeigegesten eingegangen. Grounded mental spaces – körperlich repräsentierte mentale Räume Das Konzept der grounded mental spaces wurde von Scott K. Liddell (1980, 1995, 1996; Liddell/Metzger 1998) entwickelt, um unterschiedliche Arten der körperlichen Repräsentation mentaler Räume zu untersuchen. Zwar zielt der Ansatz darauf zu erfassen, wie Gebärdensprachler körperliche Verweisräume etablieren, um an diesen zu zeigen. Das Konzept ist jedoch auf Vokalsprachen übertragbar (Liddell/Metzger 1998: 663f). Liddell differenziert verschiedene Verweisräume und fasst diese als mentale Räume im Sinne von Fauconnier. Dem Bühler’schen Wahrnehmungsraum entspricht bei Liddell der Real Space. I use the term Real Space to refer to the grounded mental space that is an individual’s conception of what is physically real in their current, directly perceivable physical environment. (Liddell 1995: 23; Hervorhebung im Original)

Demnach bauen Sprecher einen mentalen Raum auf, der dem Wahrnehmungsraum entspricht. Liddell und Metzger (1998) verdeutlichen dies an dem Beispiel eines Stiftes, der vor einer Person liegt. Wenn nun das Licht ausgeschaltet wird, so ist die Person auch im Dunkeln in der Lage den Stift zu greifen, da sie über eine kognitive Repräsentation des Wahrnehmungsraumes verfügt. Anders gewendet verfügt der mentale Real Space per se über eine

Kontextualisierung animierter Rede

91

physische Repräsentation.44 Aber auch anderen mentalen Räumen können Sprecher eine ›physische Realität‹ geben, indem sie diese gestisch verkörpern. Ist dies der Fall, spricht Liddell von einem grounded mental space. I describe such a mental space, where, for the purposes of everyday interaction with the world, concepts are given a physical reality, including a physical location, as a grounded mental space. (Liddell 1995: 22)

Damit können grounded und non-grounded mental spaces unterschieden werden. Non-grounded mental spaces are recognizable as thoughts, concepts, ideas, recollections, etc., that are not tied to current space and time. Thus my memory of a fishing trip is a non-grounded mental space. It is remote in both space and time. (Liddell 1996: 157)

Mentale Räume sind als kognitive Konstrukte nicht der direkten Wahrnehmung zugänglich. Durch das grounding jedoch werden Elemente oder Vorgänge in mentalen Räumen mit Körperteilen oder Körperbewegungen assoziiert (Liddell 1995: 23). Hiermit wird ihnen eine physische Repräsentation zugeschrieben und sie werden sinnlich wahrnehmbar. So ist es z. B. möglich durch körperliche Zeigegesten auf Elemente zu referieren, die sich in einem mentalen Raum befinden. Aber auch durch ikonisch-pantomimische Gesten können Aspekte von Vorgängen in einem mentalen Raum und die Handlungen von Figuren verkörpert werden (s. u.). Liddell unterscheidet für Gebärdensprachler zwei Weisen, in denen ein mentaler Raum auf den physischen Raum projiziert werden kann, die sich vor allem durch die Größenverhältnisse unterscheiden. Im Falle des Token Space nimmt der mentale Raum lediglich den physischen Raum vor dem Sprecher ein. Kognitive Elemente werden in ihrer Größe an die Ausdehnung des Raumes vor dem Sprecher angepasst und vor allem durch die Hände repräsentiert. Der Oberkörper des Sprechers bleibt dabei physisch außerhalb des Raumes. Den zweiten Typ bezeichnet Liddell als Surrogate

44

Anzumerken ist, dass bei Liddell der Real Space lediglich die physischen bzw. wahrnehmbaren Gegebenheiten umfasst. In der vorliegenden Arbeit hingegen wird die kognitive Repräsentation der aktuellen Interaktionssituation als Reality Space bezeichnet, welcher auch soziale und handlungsbezogene Aspekte umfasst. Zu kritisieren ist an Liddells Ansatz weiterhin, dass er den Real Space als gegeben betrachtet. »[…] Real Space does not need to be built up because it exists independently and apart from discourse. The existence of Real Space is primarily dependent on perception rather than on the details of linguistic events« (Liddell 1995: 23). Interaktionale Studien zum Zeigen als situierter Praxis weisen jedoch nach, dass Sprecher auch physische ›Gegebenheiten‹ gemeinsam konstituieren (s. u.).

92

Animierte Rede

Space.45 Hier etabliert der Sprecher eine physische Repräsentation, in der alle Elemente des mentalen Raumes Lebensgröße haben. Der Sprecher selbst nimmt dabei eine physische Position innerhalb des Raumes ein. Das Resultat ist, dass »signers will sign as if someone or something not present were actually present« (Liddell 1995: 27). Nach Liddell tritt die Projektion als Surrogate Space sehr häufig in Verbindung mit Erzählungen und Rollenübernahme auf. Zentral ist für Liddell, dass in der Wahrnehmung gegründeten mentalen Räumen ein wirklichkeitsähnlicher Charakter zukommt: The pragmatic linkage between a token or surrogate and a person is equivalent to the pragmatic linkage between a photograph and a person. What the photograph has in common with a token or surrogate is its physical immediacy. (Liddell 1995: 39)

Der wirklichkeitsähnliche Charakter eines grounded mental space resultiert nach Liddell daraus, dass die körperlichen Repräsentationen mentaler Objekte oder Vorgänge direkt visuell wahrnehmbar sind. In ihrem Artikel gehen Liddell und Metzger (1998) so weit, Token Space und Surrogate Space als Blends zu fassen.46 Im Blend verschmelzen der Real Space und der Vorstellungsraum zu einem Raum und die Trennung zwischen beiden wird aufgehoben. Die Wahrnehmung eines ›anderen‹ mentalen Raumes tritt an die Stelle der Wahrnehmung des Real Space. Für die vorliegende Untersuchung ist das Konzept der grounded mental spaces insofern relevant, als Vorstellungen bzw. mentalen Räumen eine physische Repräsentation zugewiesen werden kann. Mittels Gesten können Interaktanten vorgestellte Vorgänge und Objekte aus einem mentalen Raum im Hier-und-Jetzt verkörpern. Über den Einsatz körperlicher Mittel haben die Sprecher die Möglichkeit, mentale Räume in der Wahrnehmung zu verankern und diese für die Interaktanten visuell wahrnehmbar zu machen. Gerade durch die Möglichkeit der unmittelbaren visuellen Wahrnehmung können körperliche Mittel im Sinne einer shared cognition dazu beitragen, mentale Räume zu geteilten mentalen Räumen zu machen.

45

46

Die Schreibung der Begriffe Real Space, Token Space und Surrogate Space mit Majuskeln wird von Liddell (1995) übernommen. Zur Blending Theory vgl. Kapitel 4, wo sie jedoch im Zusammenhang von Frameüberlagerungen und Kreativität angewendet wird.

Kontextualisierung animierter Rede

93

Ikonizität, Pantomime und constructed action Prototypisch für eine solche Verkörperung imaginierter Vorgänge und der Animation von Figuren sind pantomimische Gesten. Jedoch spielen auch ikonische Gesten eine zentrale Rolle.47 Nach gängiger Auffassung werden mit ikonischen Gesten redebegleitend konkrete Gegenstände oder Ereignisse abgebildet. Demgegenüber ist Pantomime nach McNeill (2007) durch die obligatorische Abwesenheit des Sprechens gekennzeichnet. Dieses Abgrenzungskriterium ist in empirischen Analysen jedoch oft nicht klar einzuhalten. In einer früheren Publikation ist McNeill selbst auch weit weniger restriktiv: In pantomime the hands depict objects or actions, but speech is not obligatory. […] Moreover, successive pantomimes can create sequence-like demonstrations, and this is different from gesticulation where successive gestures do not combine. (McNeill 1992: 37)

Sowohl mit Pantomime als auch mit ikonischen Gesten werden Ereignisse oder Gegenstände körperlich abgebildet. Beide ›Klassen‹ oder Dimensionen von Gesten basieren damit auf demselben Prinzip der Abbildung, der Analogiebildung oder – in Anlehnung an Clark (1996; Clark/Gerrig 1990) – der Demonstration. Im Sinne von Peirce sind pantomimische Gesten ebenfalls ikonisch. Damit verliert das Unterscheidungskriterium, dass eine Pantomime mit dem ganzen Körper, eine ikonische Geste hingegen v. a. mit den Gliedmaßen ausgeführt wird, an Bedeutung. Da von einem Kontinuum auszugehen ist, können die verschiedenen Körperpartien mehr oder weniger stark einbezogen werden, demonstrierende Aspekte stärker oder schwächer ausgebildet und die Gesten mehr oder weniger expressiv, reduziert oder stilisiert sein. Mithin verliert auch das Unterscheidungskriterium der Kombinierbarkeit – nach McNeill können pantomimische Gesten aneinander gereiht werden, ikonische nicht – an Bedeutung. Mit dem Konzept der körperlich konstruierten Aktion (constructed action) entwickeln Liddell und Metzger (1998) einen Ansatz, der diesen Übergängen gerecht wird. Die Autoren untersuchen körperliche Wiedergaben von Figurenhandlungen in den Erzählungen von Gebärdensprachlern. In Anlehnung an die Arbeiten von Deborah Tannen (1986, 1996 [1989]) zur Redewiedergabe betrachten die Autoren die wiedergegebenen Figurenhandlungen »not as a direct copy of a character’s actions. It is the narrator’s construction of 47

Nach McNeill (2007: 42) werden ikonische Geste in Erzählungen v. a. dazu verwendet, Handlungen zu entwickeln. Metaphorische Gesten hingegen kommen v. a. zur Beschreibung des Settings, zur Einführung von Figuren und in der Zusammenfassung vor.

94

Animierte Rede

another’s actions« (Liddell/Metzger 1998: 660). Mit konstruierten Aktionen geben Gebärdensprachler visuelle Beispiele (visual examples) von Handlungen einer Person. Jedoch erfassen sie damit nicht nur pantomimische Gesten, was besonders an einer von den Autoren untersuchten Nacherzählung eines Garfield-Comics deutlich wird. Innerhalb des mentalen Raumes Comic benutzt Garfield seinen Besitzer als menschliche Fernbedienung, um den Fernsehkanal zu ändern und dabei selbst nicht aufstehen zu müssen. Im Wahrnehmungsraum (Real Space) bildet der Sprecher dies ab, indem er die Arme ausbreitet. Er demonstriert die Handlung aus dem mentalen Raum Comic, indem er sie verkörpert. Von den wahrnehmbaren Körperbewegungen des Zeigenden kann durch Analogiebildung auf die Bewegung von Figuren geschlossen werden (vgl. Abbildung 4).48

Abbildung 4: nach Liddell/Metzger (1998: 666)

Mit dem Konzept der constructed action erfassen die Autoren also nicht nur pantomimisch abgebildete Handlungen von Figuren, sondern auch solche Gesten, die in klassischer Sichtweise als ikonisch oder metaphorisch zu klassifizieren sind. So kann ein Sprecher einerseits die Handlungen mehrerer Figuren ›pantomimisch‹ vollziehen und mit dem ganzen Körper deren Rollen übernehmen. Andererseits kann der Sprecher aber auch lediglich bestimmte Aspekte eines Vorgangs mit nur einzelnen Körperteilen ›ikonisch‹ abbilden oder demonstrieren. Dazwischen sind kontinuierliche Übergänge möglich. 48

Diese auf visueller Analogiebildung beruhende Abbildung einer Aktion fassen die Autoren als Blend. Der Real Space und der Comic Space werden überblendet und ein grounded blend entsteht. Dabei werden wird der Körper des Menschen im Comic mit dem Körper der gestikulierenden Person überblendet.

Kontextualisierung animierter Rede

95

Dabei können in der Verkörperung Details der Art und Weise der Ausführung einer Handlung gegeben werden, die in der verbalen Beschreibung nicht vorhanden sind. Für die vorliegende Arbeit ist der von Liddell und Metzger vertretene Ansatz dahingehend relevant, dass ein breites Spektrum von Gesten als körperliche Demonstration eines Vorgangs innerhalb eines mentalen Raumes gesehen werden kann und dies nicht nur auf ›rein pantomimische‹ Gesten beschränkt ist. Als constructed action können Elemente, Vorgänge und Figurenhandlungen aus einem mentalen Raum körperlich abgebildet und dadurch direkt wahrnehmbar gemacht werden, wobei der Grad der Abstraktheit, Expressivität und Stilisierung variieren kann. Zeigen am Vorstellungsraum Zeigegesten und Deiktika spielen für Interaktanten in der Kommunikation eine zentrale Rolle im Prozess, eine individuelle Wahrnehmung zu einer geteilten zu machen (vgl. Hausendorf 2003). In der multimodalen und interaktionalen Forschung erfuhr der Akt des Zeigens mithin besondere Aufmerksamkeit. Die meisten Analysen richten sich dabei hauptsächlich auf das Zeigen am Wahrnehmungsraum. Interaktanten bringen über Zeigegesten konkrete Aspekte des Wahrnehmungsraumes in den Fokus der gemeinsamen Aufmerksamkeit. Jedoch auch die Deixis am Phantasma dient der Herstellung von Gemeinsamkeit. Hier zeigen Sprecher auf Objekte in einem mentalen Raum, die visuell nicht wahrgenommen werden können. Damit dienen solche Zeigegesten dem interaktiven Aufbau eines gemeinsamen mentalen Raumes, indem Interaktanten eine physisch räumliche Repräsentation des mentalen Raumes etablieren oder auch neue Elemente in einen mentalen Raum einführen. Das Zeigen am Vorstellungsraum ist eines der prototypischen Mittel, um einen mentalen Raum zu einem grounded mental space zu machen. Ellen Fricke gibt die folgende Definition von Lokaldeixis, mit der sie sowohl das Zeigen am Wahrnehmungs- als auch am Vorstellungsraum erfasst: Lokaldeixis ist die origorelative Lokalisierung von Gegebenheiten durch den Sprecher in einer Kommunikationssituation, die neben ihm selbst in der Sprecherrolle zumindest einen Adressaten umfasst. Die Lokaldeixis erfolgt mittels deiktischer Ausdrücke und/oder Zeigegesten. Ihre Funktion ist es, die Aufmerksamkeit des Adressaten in Abhängigkeit von der jeweiligen Origo auf die zu lokalisierenden Gegebenheiten zu lenken und damit das Bewusstsein des Adressaten dahingehend zu modifizieren, dass er eine ähnliche mentale Repräsentation wie der Sprecher aufbaut und in ähnlicher Weise darin orientiert ist. (Fricke 2007: 86)

96

Animierte Rede

Fricke hebt hervor, dass Lokaldeixis den Interaktanten dazu dient, eine gemeinsame mentale Repräsentation des zu lokalisierenden Objektes aufzubauen. Dabei wird Lokaldeixis als origorelativer Akt aufgefasst. Die Origo kann dabei sowohl im Wahrnehmungsraum – dem Reality Space – oder einem Vorstellungsraum liegen. Zu kritisieren ist an dieser Definition die Sichtweise eines agierenden Sprechers und lediglich reagierenden Hörers.49 Für die vorliegende Arbeit ist ein stärker interaktional ausgerichteter Ansatz relevant. Nach Charles Goodwin (2003) und Anja Stukenbrock (2008) muss der Zeigeakt als situierte Praktik aufgefasst werden, als Akt, der von den Interaktanten gemeinsam als eine Form koordinierter Handlung realisiert wird. Goodwin arbeitet heraus, dass eine Zeigegeste nicht lediglich vom Zeigenden realisiert wird. Vielmehr handelt es sich um einen interaktiven Prozess, in dem Interaktanten die Räume, in denen auf Objekte gezeigt wird – die domain of scrutiny – erst herstellen müssen. Diesen Ansatz entwickelt Stukenbrock weiter und unterscheidet terminologisch den Verweisraum (aus der Perspektive des Zeigenden) vom Suchraum (aus der Perspektive des Wahrnehmenden). Dabei sind die Begriffe Verweis- und Suchraum auf der perzeptiven Ebene angelegt und beziehen sich auf die physischen Gegebenheiten der Interaktionssituation. Die vorliegende Arbeit folgt McNeil darin, dass »[a]lthough the prototypical deictic gesture is the hand with an extended index finger, almost any extensible body part or held object can be used for pointing« (McNeill 2007: 39). Unter Zeigegesten werden alle Körperbewegungen – also auch Blick-, Kopf- und Rumpfbewegungen – verstanden, mit denen interaktiv eine domain of scrutiny hergestellt wird. Aus der Perspektive des Zeigenden bedeutet dies, einen Verweisraum und aus der Perspektive des Wahrnehmenden einen Suchraum zu konstituieren. Beim Zeigen am Wahrnehmungsraum ist eine direkte Verbindung zwischen dem visuell perzeptiven Zeigeziel und dem Referenzobjekt gegeben: Das im Hier-und-Jetzt wahrnehmbare Objekt ist das intendierte Referenzobjekt. Im Falle der Deixis am Phantasma, dem Zeigen am Vorstellungsraum, fallen Demonstratum und Referenzobjekt jedoch auseinander. So schreibt Ellen Fricke, dass hier »der Sprecher nur mittelbar mittels deiktischer Ausdrücke und/oder Zeigegesten auf das von ihm intendierte Referenzobjekt [referiert, O.E.]. Das Demonstratum ist in diesem Fall ungleich dem intendierten Referenzobjekt« (2007: 87). Hier wird im Verweisraum auf ein Ziel 49

Darüber hinaus scheint die Definition lediglich auf von einem Sprecher intentional ausgeführte Zeigegesten zu fokussieren und zu vernachlässigen, dass auch nichtintentionale Körperbewegungen eines Sprechers als Zeigegeste interpretiert werden können.

Kontextualisierung animierter Rede

97

gezeigt, in dem kein wahrnehmbares Objekt vorhanden ist. Zwischen der Identifizierung des perzeptorischen Zeigeziels und der Referenzherstellung innerhalb eines mentalen Raumes liegt damit ein interpretativer Prozess, bei dem der perzeptive Verweisraum auf einen mentalen Referenzraum projiziert werden muss. Die Anforderung an den Zeigenden besteht mithin darin, den intrapersonalen Mitteleinsatz so zu koordinieren, dass der Wahrnehmende erstens in der Lage ist, zu erkennen, dass am Vorstellungsraum gezeigt wird und zweitens den mentalen Referenten identifizieren kann. Zusammenfasst ist für die vorliegende Arbeit relevant, dass die körpergebundenen Verfahren des Zeigeaktes in der Interaktion genutzt werden, um die gemeinsame Herstellung eines mentalen Raumes zu organisieren. Durch Zeigegesten auf einen mentalen Referenten wird dieser in der Wahrnehmung gegründet.50 Methodische Aspekte der Körperlichkeit In Bezug auf die körperliche Ebene sind insbesondere zwei Perspektiven relevant. Sprecher können körperliche Ressourcen zur gemeinsamen Sinnkonstitution nutzen. Körperliche Ereignisse stellen potentiell bedeutsame Hinweise dar, um den Wechsel in die Animation oder den Wechsel zwischen verschiedenen animierten Figuren zu kontextualisieren. In Bezug auf den Prozess der Imagination und die Vergegenwärtigung eines mentalen Raumes ist relevant, dass Körperbewegungen direkt sinnlich wahrnehmbar sind. Über Körperbewegungen können Handlungen von Figuren und andere Aspekte eines mentalen Raumes im Hier-und-Jetzt wahrnehmbar gemacht und damit als gegenwärtig etabliert werden. Neben dieser, auf die Herstellung von gemeinsamem Sinn gerichteten Perspektive muss jedoch auch ein Ansatz verfolgt werden, der sich auf die kognitiv-semantischen Vorgänge beim Einzelnen und deren somatische Gebundenheit richtet. Mit der Animation einer Figur übernehmen die Sprecher deren Perspektive und verschieben ihre Origo in einen mentalen Raum. Aus dieser Rollenübernahme resultiert ein Handeln des Sprechers als Figur in Äußerungen und/oder Gesten. In dieser Blickrichtung werden körperliche Ereignisse weniger als potentiell bedeutsame Signale betrachtet. Vielmehr reflektieren Sprachverwendung und Körperlichkeit einen kognitiv-semanti50

Mit Rückgriff auf Liddell kann damit auch das körperliche Zeigen am Phantasma (insbesondere der zweite Hauptfall der Deixis am Phantasma) als Form der Deixis ad oculos verstanden werden: Der Sprecher zeigt körperlich sichtbar an einem auf den Wahrnehmungsraum projizierten mentalen Raum.

98

Animierte Rede

schen Prozess beim Einzelnen. Primär gesetzt wird in dieser Sichtweise der individuelle, kognitiv-semantische Vorgang des Aufbaus eines mentalen Raumes und die Übernahme der Perspektive einer Figur. Anzumerken ist, dass diese Versetzung und Perspektivübernahme sich nicht auf allen Ebenen gleichzeitig manifestieren muss. So kann ein Sprecher beispielsweise symbolisierend über eine Vorstellung sprechen, gleichzeitig aber körperliche Handlungen einer in dieser Vorstellung vorhandenen Figur ausführen. Anstatt also eine Figur verbal zu animieren, wird lediglich eine ihrer Handlungen ›nonverbal‹ verkörpert. Die beiden Perspektiven schließen einander nicht aus, sondern sind vielmehr als komplementär zu verstehen. In einer vollzugsorientierten, ethnomethodologischen Herangehensweise steht der Aspekt der gemeinsamen Herstellung eines sozialen Ereignisses und geteilter Bedeutung im Vordergrund, in der kognitiven Blickweise hingegen die Verkörperung bzw. Körpergebundenheit semantischer Prozesse. In den Analysen werden beiden Aspekte deshalb nicht getrennt, sondern gleichzeitig bearbeitet. 3.3.3

Grade der Expressivität in Figurenanimationen

Bereits in den klassischen Ansätzen zur Rede›wiedergabe‹ werden unterschiedliche Formen der Direktheit angenommen. Das Kontinuum von direkter und indirekter Wiedergabe wurde beispielsweise von Frans Plank (1986) auf die beiden Skalen syntaktischer (Des-)Integration von Quotativ und Rede›wiedergabe‹ und der verbal-deiktischen Verankerung an den Origines von aktuellem Sprecher und eingebetteter Figur abgebildet. Hinzugenommen werden müssen für Gespräche darüber hinaus die phonetische und die körperliche Ebene. Damit kann animierte Rede – in der Terminologie der vorliegenden Arbeit – unterschiedliche Grade der Expressivität aufweisen. Den höchsten Grad der Expressivität weisen solche animierte Äußerungen auf, die auf allen Ebenen deutlich vom sie umgebenden ›situativen‹ bzw. symbolisierenden Sprechen abgesetzt sind: – Personal- und temporaldeiktisch ist die Äußerung an der Origo einer Figur verankert, die sich außerhalb des Reality Space befindet. – Phonetisch kontrastieren die Äußerungen mit dem symbolisierenden/situativen Sprechen. Hierzu zählt die Wahl eines Sprechausdrucksmusters, das von einem dem aktuellen Gesprächskontext angemessenen Sprechausdrucksmuster des aktuellen Sprechers deutlich abweicht. Hinzu kommt eine Absetzung durch intonatorische Sprünge und Pausen etc. – Syntaktisch besteht eine deutliche Desintegration bzw. Aggregation von vorangehenden oder folgenden Syntagmen im situativen Sprechen.

Wechsel vom Symbolisieren ins Demonstrieren in lokalen Wiederholungen

99

– Auf der körperlichen Ebene wechselt der Sprecher ›pantomimisch‹ in die Rolle der animierten Figur und repräsentiert andere Figuren und Objekte innerhalb eines Surrogate Space in Lebensgröße. Ebenfalls für eine hohe Expressivität der Animation spricht eine Karikierung der animierten Figur. Hier besteht eine evaluative Distanz zwischen aktuellem Sprecher und Figur.

3.4

Wechsel vom Symbolisieren ins Demonstrieren in lokalen Wiederholungen

Im folgenden Abschnitt geht es nicht in erster Linie um Grade der Expressivität in animierter Rede. Vielmehr wird in empirischen Analysen dargestellt, wie Sprecher im sequentiellen Verlauf des Gesprächs vom symbolisierenden Sprechen in die Animation einer Figur wechseln. Dies wird vor allem als Wechsel vom symbolisierenden in den demonstrierenden Modus behandelt. Als Grundlage werden hierfür Sequenzen gewählt, in denen dieser Wechsel innerhalb von Wiederholungen stattfindet. Der Wechsel des Modus kann in solchen Wiederholungen besonders deutlich aufgezeigt werden, da die Sprecher die zu vermittelnde Semantik mehrfach formulieren: Eine zuerst symbolisierend formulierte Semantik wird in der letzten Wiederholung demonstriert (vgl. Abbildung 5 auf der folgenden Seite). Der Übergang vom Symbolisieren ins Demonstrieren findet in diesen Sequenzen oft allmählich statt. Die Sprecher übernehmen im Verlauf der Sequenz immer stärker die Perspektive einer Figur innerhalb des aktuell aufgebauten mentalen Raumes. Damit ist meist eine schrittweise Zunahme der Expressivität verbunden. Im symbolisierenden Sprechen können semantische Frames aktiviert und damit ein mentaler Raum aufgebaut werden. Dabei bestehen graduelle Unterschiede, wie stark der mentale Raum im symbolisierenden Sprechen ausgestaltet wird. Der mentale Raum kann deiktisch in Raum und Zeit verankert und die Rollen der Akteure mit realen Personen besetzt sein. Es ist aber auch möglich, dass Frames lediglich unspezifisch aktiviert werden. Unabhängig von der Spezifizierung und der deiktischen Verankerung des Raumes ist für die folgenden Analysen zentral, dass im symbolisierenden Sprechen ein ›semantischer Rahmen‹ aufgespannt wird. Mit dem Wechsel ins demonstrierende Sprechen wird eine Figur animiert, die eine in diesem Rahmen ›passende‹ Handlung ausführt: Der Sprecher demonstriert eine zuvor symbolisierte Semantik.

100

Animierte Rede

Abbildung 5

Verwenden Sprecher eine syntaktische Struktur, so kann diese im Gespräch über mehrere Äußerungen hinweg kognitiv präsent bleiben, was Auer (2006b, 2007) als Strukturlatenz bezeichnet.51 Diese Latenz ermöglicht den Sprechern, im Verlauf des Gesprächs eine begrenzte Zeit auf diese Struktur zurückzugreifen. Als Wiederholung wird im Folgenden bezeichnet, wenn Sprecher eine sprachliche Struktur in einem Gespräch in zeitlicher Nähe in ähnlicher Weise mindestens zwei Mal realisieren.52 Der Begriff Wiederholung wird insofern relativ frei gefasst, als kein komplettes Syntagma wiederholt werden muss. Vielmehr wird auch dann von Wiederholung gesprochen, wenn nur ein Teil einer vorangegangenen Struktur iteriert wird. Solche teilweisen syntaktischen Wiederholungen treten oft in der Form von Retraktionen auf, bei denen ein Sprecher mit seiner Äußerung an einem syntaktischen Ankerpunkt in einer vorangegangenen Äußerung ansetzt.53 Im folgenden Beispiel etwa retrahiert der Sprecher bis zur Präposition para in einer vorangegangenen Äußerung: 01 es un hÁbito para tratAr de reaseguRARte; es ist eine Angewohnheit um zu versuchen dich/sich rückzuversichern 02

pAra hacErte sentir meJOR, um zu machen, dass du dich besser fühlst

Die syntaktische Struktur der Äußerung 01 basiert auf der Kopulakonstruktion X es Y. Die Stelle X ist hier nicht sprachlich realisiert, sondern durch den vorangegangenen Gesprächsverlauf gegeben. Der nominale Kern der Stelle Y besteht im Nomen un hábito (›eine Gewohnheit‹), das durch die prä-

51 52

53

Vgl. Kapitel 1.3. Im Folgenden werden nur solche Wiederholungen untersucht, die in direkt aufeinanderfolgenden Äußerungen realisiert werden. Daher wird hier nicht weiter diskutiert, was unter ›zeitlicher Nähe‹ zu verstehen ist. Zum Begriff der Retraktion vgl. Auer (2005a), Auer/Pfänder (2007) sowie Kapitel 1.3.

Wechsel vom Symbolisieren ins Demonstrieren in lokalen Wiederholungen

101

positionale Infinitivkonstruktion para tratar de reasegurarte erweitert wird. Mit der Äußerung 02 retrahiert der Sprecher syntaktisch bis zur Präposition para der vorangegangenen präpositionalen Konstruktion. Auf der sprachlichen Oberfläche wird also nur die präpositionale Infinitivgruppe wiederholt. Diese kann jedoch nicht alleine stehen, sondern ist nur in der Zusammenschau mit der vorangegangenen syntaktischen Struktur wohlgeformt. Mit einer Retraktion wird damit nicht nur der auf der sprachlichen Oberfläche realisierte Teil einer syntaktischen Konstruktion wiederholt, sondern vielmehr die zuvor verwendete Struktur als ganze reaktiviert und damit kognitiv präsent gehalten. In der Wiederholung kann dabei die Füllung einer Stelle in der Struktur variiert und ein sprachliches Element paradigmatisch durch ein anderes ausgetauscht werden, was hier mit der Variation innerhalb der Infinitivgruppe geschieht: tratAr de reaseguRARte (01) wird durch hacErte sentir meJOR (02) ersetzt. Neben der Möglichkeit zur nur teilweisen Wiederholung wird der Begriff der Wiederholung auch dahingehend frei gefasst, als nicht exakt dieselbe Struktur wiederholt werden muss. Vielmehr wird im Sinne der Konstruktionsgrammatik davon ausgegangen, dass mit der Realisierung einer Konstruktion gleichzeitig familienähnliche Konstruktionen aktiviert werden, auf die ein Sprecher leicht zurückgreifen kann. In den folgenden Analysen wird jeweils eine mikroanalytische Perspektive eingenommen und das semantische Verhältnis in den Wiederholungen im Detail untersucht. In den Sequenzen des Abschnitts 3.4.1 wiederholen Sprecher mehrfach Teile einer eigenen Äußerung und variieren dabei ein semantisches Element. Während in den ersten Wiederholungen der Struktur eine syntaktische Stelle symbolisierend realisiert wird, wird in der letzten Wiederholung vor demselben semantischen Hintergrund eine Figur animiert. In diesen Wiederholungen ist der Wechsel des Modus besonders gut nachvollziehbar, da einzelne symbolische Elemente durch eine animierte Rede ›ersetzt‹ werden. In den Sequenzen des Abschnitts 3.4.2 hingegen findet nur eine Wiederholung statt, dafür aber die einer langen sprachlichen Struktur. 3.4.1

Ausgedehnte Wiederholungen und allmähliche Wechsel

Sequenz 1: arrepentimiento (›Bereuen‹) Graciela (G) und Marina (M) sind gute Freundinnen, die sich seit langer Zeit nicht mehr gesehen und daher viel zu besprechen haben. G hat sich für den Abend allerdings lose mit einer anderen Bekannten verabredet, die sie erst vor kurzem kennengelernt hat. Als die Bekannte anruft, sagt G ihr ab, da sie

102

Animierte Rede

sich weiter mit M unterhalten möchte. Kurz darauf fühlt sie sich schlecht, da sie nicht weiß, wie die Bekannte die Absage auffasst. Es folgt eine ausgedehnte Bearbeitung des Themas, in der sich G als reflektierte Person positioniert. In vielen Selbstreparaturen signalisiert G, ihre Gefühle nicht exakt formulieren zu können und stellt gegenüber M den Prozess ihrer Selbstreflexion zur Schau. Das Transkript setzt ein, als M formuliert, wie sie Gs Gefühle versteht. 01 M: pero tiEne que ver CON. aber es hat zu tun mit 02

CONmit

03

es COmo- = es ist wie

04

= es como con un dejo de arrepentimiEnto como deCIR; es ist wie mit einem Rest von Bereuen, wie zu sagen

· 05

podría haberlo hecho de Otra maNEra; ich hätte es auf eine andere Weise machen können

· 06

no lo HIce; ich habe es nicht gemacht

· 07

YA; zu spät

08

es Esa la sensación NO, das ist das, das Gefühl, nicht?

Mit den mehrfachen Neuansätzen bzw. syntaktischen Retraktionen (01–04) übernimmt M den Formulierungsstil, mit dem G zuvor signalisiert hatte, ein schwer beschreibbares Gefühl zu formulieren. M bezeichnet das Gefühl Gs symbolisierend als ein Rest von Bereuen: un dejo de arrepentimiEnto (04). Mit dieser Äußerung gibt M eine mögliche Interpretation für Gs Gefühl. Nun animiert M Äußerungen, in denen sie die Perspektive ihrer Freundin im Hier-und-Jetzt übernimmt. In den animierten Äußerungen blickt die Figur in die Vergangenheit und denkt darüber nach, dass sie anders hätte handeln können: podría haberlo hecho de Otra maNEra (05). Da sie aber nicht anders gehandelt hat (no lo HIce, 06) ist es nun zu spät: YA (07). Mit diesen animierten Äußerungen demonstriert M das zuvor in 04 symbolisierend benannte Gefühl, dass ein Rest von Bereuen zurückbleibt, auch wenn die Situation rational betrachtet nicht mehr zu ändern ist. In der folgenden Abbildung wird deutlich, dass die Sprecherin für die Bestimmung des Gefühls auf die Kopulakonstruktion X es (como) Y zurückgreift und diese wiederholt.54 54

Zur Verwendung der Kopulakonstruktion vgl. Kapitel 5.2.3.

Wechsel vom Symbolisieren ins Demonstrieren in lokalen Wiederholungen

103

Abbildung 6

Über die Retraktion zum Komparationsadverb como (›wie‹) – welches gleichzeitig als Unschärfemarker fungiert – stellt die Sprecherin sowohl die syntaktische Kohäsion der Sequenz als auch die paradigmatische Beziehung vom symbolisierenden un dejo de arrepentimiEnto (04) zur animierten Rede her. In der Kopulakonstruktion X es como Y ist die Stelle Y damit einmal symbolisierend und einmal demonstrierend mit einer animierten Rede gefüllt, wobei semantische Invarianten vorliegen. Die Stelle X der Konstruktion ist syntaktisch nicht gefüllt, wird am Ende der Sequenz aber semantisch über es Esa la sensación (08) als Gefühl bestimmt.55 An der Schaltstelle zwischen symbolischer und demonstrierender Realisierung steht das Verbum dicendi decir mit como deCIR (04). Auf die Funktion von semantisch leeren bzw. metapragmatischen Verben wird weiter unten genauer eingegangen. In dieser Sequenz findet ein direkter Übergang vom symbolisierenden in den demonstrierenden Modus statt. Zwar wird eine syntaktische Struktur mehrfach wiederholt, die Sprecherin wechselt innerhalb dieses ›Rahmens‹ jedoch direkt in die Animation einer Äußerung. In den im Folgenden analysierten Sequenzen hingegen findet dieser Übergang allmählich statt. Auch hier wiederholen die Sprecher eine sprachliche Struktur mehrfach, indem sie immer wieder in die Struktur retrahieren. Mit zunehmender Anzahl von Wiederholungen aber wählen die Sprecher Ankerpunkte, die in der ursprünglich realisierten Struktur zeitlich später liegen. Gleichzeitig expandieren sie die Struktur in der Wiederholung ›nach rechts‹.56 Dabei wechseln die Sprecher schrittweise ins Demonstrieren und erst in den jeweils letzten Wiederholungen werden expressiv Äußerungen animiert.

55 56

Vgl. hierzu Kapitel 5.2. In Sinne der Konversationsanalyse handelt es sich um mehrfache selbstinitiierte Selbstreparaturen.

104

Animierte Rede

Sequenz 2: la mejor manera (›die beste Art und Weise‹) In der folgenden Sequenz sprechen Nora (N) und Graciela (G) über ihren Umgang mit komplizierten Lebenssituationen. N hat gerade darüber gesprochen, dass sie ihr Ziel, in den Urlaub zu fahren, nicht angestrengt, sondern entspannt verfolgen möchte. G pflichtet ihr bei und erläutert ihre Auffassung, die beste Art und Weise, mit Dingen umzugehen bzw. etwas zu erreichen, bestehe darin, sich nicht unter Druck zu setzen, sondern lediglich zu wünschen und loszulassen. In den Wiederholungen verwendet die Sprecherin dieselben Verben sowohl vor als auch in der animierten Rede. Vereinfacht kann dies so dargestellt werden:

Abbildung 7

Während das sprachliche Material in der Wiederholung weitgehend gleich bleibt, wechselt die Sprecherin vom symbolisierenden in den demonstrierenden Modus. Die Analyse setzt ein, als G ihrer Freundin beipflichtet. 01 G: es que para MÍ, es ist so, dass für mich 02

te DIgo; ich sage dir

03

yO (.) estoy descuBRIENdo; = ich entdecke

04

= = wie wir es vor Kurzem geredet haben

05

que la mejOr maNEra (--) es solTANdo. dass die beste Art und Weise ist loszulassen (loslassend)

06 N: SÍ::; ja 07 08 G: 09 N:

y [después te viene una re coPAda;] = und danach kommt eine sehr gute [la (.) la mejOr mane (--) es ] [solTAN]do. die die beste Weise ist loszulassen (loslassend) = [VISte.] weißt du

Wechsel vom Symbolisieren ins Demonstrieren in lokalen Wiederholungen

105

10 G: = ist zu sagen · 11

= na gut

· 12

y no SÉ. und ich weiß nicht

13

me dA, es gibt mir

14

de(von)

15

soltando pero nO sólo solTANdo. loslassend, aber nicht nur loslassend

16

deSEANdo, wünschend

17

y solTANdo. und loslassend

· 18 19 · 20

yo desEo ESto. ich wünsche das ((chasquea con los dedos)) ((schnalzt mit den Fingern)) lo SUELto. ich lasse es los

21 N: ((risas)) ((lacht)) · 22 23

gut, dein Verhalten hat mir nicht gefallen

14

está bUEno ESo. das ist gut

G formuliert zunächst symbolisierend, dass es in solchen Situationen nicht notwendig ist, den anderen (verbal) zu verprügeln: no es necesArio cargarse a trompadas (01). Dennoch sollte man dem anderen eine Grenze setzen: lo que sÍ=es (.) es necesario es ponerle un límite al OTro (02). Mit der folgenden Äußerung entonces Es (05) verwendet G eine Kopulakonstruktion, mit der sie markiert, dass das nun Folgende der genaueren Bestimmung des soeben Geäußerten dient. Die folgende Partikel BUEno (06)

Wechsel vom Symbolisieren ins Demonstrieren in lokalen Wiederholungen

117

kann als Marker zur Gliederung des Diskurses sowohl G als auch einer animierten Figur zugeschrieben werden. Auch auf prosodischer Ebene liegen keine Hinweise zur Disambiguierung vor. Eindeutig zur animierten Rede zu rechnen ist die Partikel está bIEn (07) mit der eine Reaktion auf eine vorangegangene Äußerung signalisiert wird: G animiert eine Figur in einer Auseinandersetzung, die dem Gegenüber teilweise zustimmt. In den nun folgenden animierten Äußerungen (07–13) wiederholt die Sprecherin ihre vorangegangenen Äußerungen (01–03). Dabei behält sie sowohl die syntaktische Struktur als auch prosodische Gliederung weitgehend bei. Variiert wird vor allem auf der lexikalischen und der personaldeiktischen Ebene. Dabei ist in der Wiederholung der Struktur auf der prosodischen Ebene eine deutliche Zunahme in der Expressivität zu bemerken. Während die Wiederholung/die animierte Rede zu Beginn prosodisch relativ wenig von den vorangegangenen Äußerungen abgesetzt ist, erhöht die Sprecherin im Verlauf der Wiederholung die Sprechspannung, akzentuiert deutlicher und spricht schneller, was vor allem in den letzen animierten Äußerungsteilen deutlich wird (12f). Der Übersichtlichkeit halber wird die Wiederholung in drei Abschnitten besprochen.59

Abbildung 13

Mit Äußerung 12 wiederholt G die Äußerung 01 unter Beibehaltung der semantischen Struktur. Dabei ersetzt sie ser necesario (›notwendig sein‹, 01) durch die semantisch verwandte Konstruktion tener que (›müssen‹, 07). Mit dem Wechsel der Konstruktion ist ein Wechsel der Person von der 3. in die 1. Person Singular verbunden. Der pragmatische Unterschied der beiden Formen liegt darin, dass ser necesario nur unpersönlich in der 3. Person, tener que hingegen in jeder Person verwendet werden kann. Das bedeutet, dass die Sprecherin in der Wiederholung eine Konstruktion wählt, welche die Einblendung des Agens möglich bzw. hier sogar notwendig macht. Auch im Wechsel der Reflexivpronomen von se (›sich‹) zu te (›dich‹) wird der Wechsel der Personalform realisiert. Zwar wird auch mit se die Reziprozität der Hand59

Darüber hinaus werden die Sprechersiglen (die Sprecherin ist jeweils G) und einige Transkriptionskonventionen weggelassen.

118

Animierte Rede

lung des Verprügelns (cargarse a trompadas) ausgedrückt, die Handelnden sind dabei jedoch ausgeblendet. Mit dem Personalpronomen te in Äußerung 07 hingegen referiert die animierte Figur direkt auf das Gegenüber als Patiens der Handlung des Verprügelns. Mit der Variation der Personalform geht also eine Einblendung von Agens und Patiens einher. Diese Veränderung in der Personalform findet auch in der Wiederholung des zweiten Syntagmas statt.

Abbildung 14

Zunächst wiederholt G die Konjunktion pero (08) prosodisch getrennt vom nachfolgenden Syntagma (09). Nicht wiederholt wird die in der ersten Äußerung zur Verstärkung eingebettete Konstruktion lo que sí es X es Y (›das was wirklich X ist, ist Y‹). Wie in der Wiederholung 01 07 wird auch in der Wiederholung 02 09 die Konstruktion ser necesario (›notwendig sein‹) ersetzt, hier durch das Verb poder (›können‹). In Äußerung 02 ist das Patiens der Handlung eine Grenze zu ziehen (›poner un límite‹) als generischer Anderer al OTro realisiert. In der Wiederholung hingegen bezieht sich die animierte Figur mit dem Pronomen te in der 2. Person Singular direkt auf ein Gegenüber. Auch in dieser Wiederholung ist damit tendenziell eine Konkretisierung von Agens und Patiens erkennbar. Der dritte und letzte Teil des ursprünglichen Syntagmas wird jedoch nicht wiederholt.

Abbildung 15

Mit der Äußerung 03 formuliert die Sprecherin G die Umstände, unter denen es notwendig ist, dem Anderen eine Grenze zu ziehen, nämlich dann, wenn dieser über die Stränge schlägt: cuando el Otro se se va de MAMbo (03). Mit Äußerung CUANdo (12) setzt die Sprecherin dazu an, diesen Teil der Struktur ebenfalls zu wiederholen, bricht das Projekt jedoch ab. Anstatt die Äußerung direkt zu übersetzen – beispielsweise mit cuando te vas de mambo – formuliert G für die Figur eine an das Gegenüber gerichtete Begründung: ›dein

Wechsel vom Symbolisieren ins Demonstrieren in lokalen Wiederholungen

119

Verhalten hat mir nicht gefallen‹ (tu actitud no me gustó, 12). Die in der aufgeführten Situation verankerte Figur bleibt also dabei, eine Aussage über sich selbst zu treffen. Gleichzeitig findet mit dem Beginn der Äußerung 13 ein prosodischer Wechsel statt. Die Sprecherin erhöht ihre Sprechspannung, spricht schneller und höher. Stimmlich realisiert sie so einen deutlich höheren Grad an Emotionalität, welcher der Auseinandersetzung innerhalb des mentalen Raumes angemessen ist, jedoch nicht bis hin zu einer Beschimpfung/einem Streit geht. Damit nimmt im Verlauf der Sequenz die Expressivität deutlich zu und die Animation ist gegen Ende der Wiederholung am deutlichsten. Mit dem evaluativen está bUEno ESo (14) markiert die Sprecherin das Ende der Animation und wechselt auch prosodisch zurück in die Normallage und spricht wie in den vorangegangenen symbolisierenden Äußerungen (01–05). Zusammengefasst wird in dieser Sequenz mit mehreren Syntagmen die allgemeine Handlungsmöglichkeit dem Gegenüber eine Grenze zu setzen zuerst symbolisiert (06–08) und in der Wiederholung mit den animierten Äußerungen einer Figur demonstriert (13–16). Die Sprecherin verwendet dabei vor dem Hintergrund einer semantischen Invariante sowohl eine ähnliche Syntax als auch weitgehend dieselbe Lexik. In der Wiederholung wird die Personalform der Verben geändert (3. Person Plural ⇒ 1. Person Plural). Damit geht mit dem Wechsel in die animierte Rede ein Wechsel vom Unpersönlichen zum Persönlichen einher. Zudem werden dabei Agens und Patiens eingeblendet und – mit Bezug auf die Theorie der mentalen Räume – die Akteure kognitiv profiliert. Im Verlauf der Wiederholung wird die animierte Rede deutlich expressiver und die Sprecherin übernimmt die Rolle der Figur innerhalb des generischen mentalen Raumes. Sequenz 5: el cuerpo que tiene ella (›der Körper, den sie hat‹) Abschließend wird eine kurze Sequenz besprochen, in welcher der Wechsel vom Symbolisieren ins Demonstrieren ebenfalls in Form einer Wiederholung stattfindet. Jedoch wird hier keine syntaktische Struktur im engeren Sinne wiederholt. Vielmehr formuliert die Sprecherin zuerst symbolisierend einen Perspektivenkontrast und animiert dann Äußerungen für zwei Figuren aus den einander entgegengesetzten Perspektiven. María (M) hat Graciela (G) gerade erzählt, wie sie ihre nicht anwesende Freundin F kennengelernt hat. Zunächst konnte M F nicht leiden, da sie sehr gut aussieht und einen arroganten Eindruck auf sie machte. Als sie sich aber näher kennenlernten, erkannte M, dass F aufgrund ihrer Schönheit auch Probleme hat. M formuliert, sie habe aus dieser Begegnung gelernt, andere nicht vorschnell aufgrund bestimmter Eigenschaften zu verurteilen. Es han-

120

Animierte Rede

delt sich also um eine Abstraktion von der vorangegangenen Erzählung. M formuliert ihre generelle Erkenntnis zunächst im symbolisierenden Modus und animiert dann ›generische‹ Äußerungen zweier Figuren. 01

M: me entenDÉS, verstehst du mich

02

y como ver que también en Eso hay como una cuestión deund wie zu sehen, dass es auch darin so eine Sache gibt von

03

que para mÍ (.) puede ser lo más maravilloso del MUNdo- = dass es für mich das Schönste auf der Welt sein kann

04

= y para el Otro quizás tamPOco eso es. und für den anderen vielleicht ist es das nicht

05 · 06

G: SÍ– ja M: yo digo no sé qué- = ich sage ay wenn ich diesen Körper hätte, den sie hat, was weiß ich

· 07

= y ella te dice para mí nO, = und sie sagt, für mich nicht

08

= tampOco o=sea(gar) nicht, das heißt

· 09

no soy feLIZ = ich bin nicht glücklich

· 10

= ] für mich (gar) nicht

11

G:

[esa cOsa] que a veces nos (-) nos aGArra no- = diese Sache, die uns manchmal ergreift, nicht? = de ver en los Otros COmo:in den anderen zu sehen wie

Die Sequenz beginnt mit der Frage Gs, ob M sie verstanden habe (me entenDÉS, 01) und leitet eine Erklärung bzw. eine Ergänzung ein: y como ver que también en Eso hay como una cuestión de (02). Gleichzeitig markiert die Sprecherin, dass sie eine Generalisierung vornimmt (hay como una cuestión de, 02). Aus der Ich-Perspektive (para mÍ, ›für mich‹, 03) bewertet die

Sprecherin eine nicht benannte Eigenschaft positiv: puede ser lo más del MUNdo (10). Mit der folgenden Äußerung formuliert die Sprecherin, dass dies für den Anderen nicht der Fall sein muss: y para el Otro quizás tamPOco eso es (04). Die Generalisierung wird hier nochmals deutlich, indem die Sprecherin mit el otro über einen generalisierten Anderen spricht. Da G nur minimal Verständnis signalisiert, demonstriert die Sprecherin M nun die soeben symbolisierend formulierte Perspektiven- bzw. Bewertungsmaravilloso

Wechsel vom Symbolisieren ins Demonstrieren in lokalen Wiederholungen

121

divergenz und animiert entsprechende Äußerungen. Mit yo digo (06) leitet sie die folgende Äußerung als animierte Rede eines generalisierten Ichs ein. Sie animiert dann den Wunsch, den Körper einer anderen Frau zu haben: Ay si yo tuviese el CUERpo que tiene ella (06). Die Äußerung ist prosodisch über die Rhythmisierung und durch die Partikel Ay sehr expressiv gestaltet. Mit diesem animierten Wunsch demonstriert die Sprecherin die zuvor im Modus der Symbolisierung explizit vorgenommene positive Bewertung (lo más maravilloso del MUNdo, 03). Durch das angefügte no sé qué (03) kennzeichnet die Sprecherin den Bezug auf den Körper der anderen als exemplarisch. Nachfolgend leitet die Sprecherin mit dem Verbum dicendi decir in der 3. Person Singular eine animierte Äußerung der generalisierten Anderen ein: y ella te dice (07). Die zuvor unpersönliche Referenz auf den generalisierten Anderen (el otro) wird mit dem Pronomen ella (3. Person Singular feminin) durch einen Verweis auf einen singulären weiblichen Referenten ersetzt. Mit der animierten Äußerung wechselt die Sprecherin in die Perspektive der Anderen: para mí nO | no soy feLIZ | a mí tampOco (08ff ). Sie demonstriert damit die zuvor in 04 symbolisierte negative Bewertung. Hierauf beginnt die Hörerin G eine Reformulierung, mit der sie signalisiert, M verstanden zu haben (11f). In der folgenden Abbildung wird nochmals deutlich, dass die Sprecherin den Perspektivenkontrast zunächst im symbolisierenden Sprechen formuliert und dann diejenigen Elemente, die bewertende Aspekte enthalten, durch eine animierte Rede ersetzt.

Abbildung 16

Die Sprecherin wiederholt hier eine komplette kontrastive Struktur. In den ersten Äußerungen realisiert sie den Kontrast sprachlich mit para mi X y para el otro Y (›für mich X und für den anderen Y‹). Im symbolisierenden Modus

122

Animierte Rede

werden einem Ego und einem Alter an den Stellen X und Y einander entgegengesetzte Bewertungen ein und desselben Umstandes zugeschrieben. In der Wiederholung wird die zunächst symbolisch realisierte Bewertung durch animierte Äußerungen ersetzt. Der Kontrast zwischen X und Y wird über yo digo X y ella te dice Y (›ich sage X und sie sagt dir Y‹) realisiert. Mit dem Wechsel in den demonstrierenden Modus übernimmt die Sprecherin die beiden zuvor im symbolisierenden Sprechen etablierten divergenten Perspektiven. Der Wechsel in den demonstrierenden Modus dient dazu, den perspektivischen Gehalt des Sprechens – welcher sich hier in einer Bewertung niederschlägt – auszuarbeiten und zu verdeutlichen. 3.4.3

Ergebnisse

In diesem Kapitel wurde die Animation einer Äußerung als Wechsel des semiotischen Modus vom Symbolisieren ins Demonstrieren dargestellt. An mehreren Sequenzen wurde im Detail gezeigt, wie im Gespräch ein semantischer Aspekt zuerst symbolisiert und dann demonstriert wird. In den Analysen wurde aufgezeigt, dass Wiederholungen eine zentrale Rolle spielen können, um den Wechsel vom Symbolisieren ins Demonstrieren zu organisieren. Typisch erscheint dabei der Verlauf, dass Sprecher eine einmal realisierte sprachliche Struktur ein- bis mehrmals wiederholen und dabei die symbolisch-semantischen Elemente variieren. In der letzten aus einer Reihe von Wiederholungen wird dabei das variierte Element durch eine animierte Rede ersetzt. Oft werden in der animierten Rede dieselben Lexeme verwendet wie zuvor in der symbolisierenden Formulierung. Der Wechsel des Modus vom Symbolisieren zum Demonstrieren wird mithin besonders darin deutlich, dass das symbolische sprachliche Element und die animierte Rede einen ähnlichen syntaktischen und semantischen Status haben. In mehrfachen Wiederholungen kann dabei ein schrittweiser Wechsel des Modus vollzogen werden. Darüber hinaus belegen die gewählten Sequenzen die kognitive Präsenz von Konstruktionen im Gespräch. Eine einmal im Gespräch verwendete Struktur wird beibehalten und immer wieder als Beginn eines neuen oder als Fortsetzung eines bestehenden syntaktischen Projektes genommen. Während in der Wiederholung die syntaktische Form weitgehend gleich bleibt, kann es auf einer anderen sprachlichen Ebene – etwa der Semantik – Veränderungen geben. Die etablierte syntaktische Struktur dient den Sprechern als Rahmen, innerhalb dessen variiert, gespielt und improvisiert werden kann. Innerhalb dieses Rahmens kommt der Variation insofern eine zentrale Rolle zu, als in den Wiederholungen auf das variierte Element fokussiert wird. In den hier untersuchten Sequenzen wird der variierte Teil entweder komplett

Wechsel vom Symbolisieren ins Demonstrieren in lokalen Wiederholungen

123

durch eine animierte Rede ersetzt (Sequenzen 1, 3, 5). Ist dies nicht der Fall, so liegen in den durch die Variation fokussierten Teilen die deutlichsten (deiktischen) Markierungen dafür, dass es sich bei der Wiederholung insgesamt um animierte Rede handelt (Sequenzen 2, 4). In Bezug auf die Konstruktionsgrammatik sind diese Beobachtungen insofern relevant, als in manchen Konstruktionen bestimmte Leerstellen sowohl symbolisch als auch demonstrierend gefüllt werden können (vgl. Kapitel 5). In gesprächsfunktionaler Hinsicht geschieht dies vor allem dann, wenn der Sicherung der Verständigung eine erhöhte Relevanz zukommt und wenn die Beteiligten über Gefühle sprechen. In vielen der hier untersuchten Sequenzen kommt den Verba dicendi und sentiendi eine zentrale Funktion zu, was besonders in Wiederholungen deutlich wird. Wird in der Wiederholung ein bedeutungstragendes Verb durch ein Verbum dicendi ersetzt, so bedeutet dies eine semantische Entleerung an der entsprechenden syntaktischen Position. Zwar wird mit den Verba dicendi und sentiendi auf die Wahrnehmung bzw. ein Äußerungsakt referiert, die entsprechende Qualität wird jedoch nicht ausgedrückt. Diese Qualität bzw. Semantik wird in das projizierte Objektkomplement verschoben: die animierte Rede. Aufgrund dieses semantischen und syntaktischen Status werden die Verba dicendi oft an der Schaltstelle zwischen symbolisierendem und demonstrierendem Modus verwendet: In der wiederholten Struktur kann die ursprüngliche, den Gesprächsbeitrag strukturierende Syntax beibehalten werden; das Syntagma wird lediglich durch ein aggregiertes Objektkomplement erweitert. Gleichzeitig erhält der Sprecher die Möglichkeit, im Objektsatz eine beliebige Syntax zu wählen, da keine Notwendigkeit besteht, eine Integration in die wiederholte Struktur herzustellen. Verba dicendi bieten dem Sprecher damit die Möglichkeit, sich innerhalb des etablierten syntaktischen Rahmens zu bewegen und diesen gleichzeitig zu erweitern. Hierdurch gewinnen die Sprecher die Freiheit, Semantik in einer beliebigen (syntaktischen) Form auszudrücken und auch den semiotischen Modus zu wechseln. Mit dem Wechsel des semiotischen Modus ins Demonstrieren findet eine Verschiebung der Origo aus dem Hier-und-Jetzt an eine andere, imaginierte Origo statt. Retrospektiv betrachtet wird im symbolischen Sprechen vor der animierten Rede der semantische Rahmen für die animierte Rede aufgespannt. In Bezug auf die Theorie mentaler Räume werden im symbolisierenden Modus Frames aktiviert und damit ein mentaler Raum aufgebaut. Mit dem Wechsel in den demonstrierenden Modus führt der Sprecher – in der Animation der Figur – eine in den zuvor symbolisierten Handlungszusammenhang passende (Sprech-)Handlung aus: Zuvor symbolisierte Semantik wird demonstriert.

124

Entwerfen und Fiktionalisieren

4

Entwerfen und Fiktionalisieren

4.1

Einleitung: Begriffliche Abgrenzung von Entwerfen und Fiktionalisieren

Das folgende Kapitel geht von der von Alfred Schütz (1945, 1951, 1971a, 1971b; Schütz/Luckmann 2003) getroffenen Unterscheidung zweier Arten des Phantasierens aus: dem Entwerfen und dem bloßen Phantasieren. Gemeinsam ist den beiden Formen des Phantasierens, dass die Phantasien aus »typischen Elementen des subjektiven Wissensvorrates zusammengesetzt« (Schütz/Luckmann 2003: 478) sind. Entwerfen und bloßes Phantasieren unterscheiden sich in ihrem Bezug auf die Alltagswelt. Das Entwerfen ist ein »motiviertes Phantasieren« (Schütz 1971a: 84), in dem der Mensch Möglichkeiten entwickelt, die er als Handlung in der Alltagswelt bzw. der Welt in erlangbarer Reichweite realisieren möchte. Ein Handlungsentwurf ist dadurch gekennzeichnet, »daß ich zum Zeitpunkt des Entwerfens annehme, daß sich der Entwurf wird verwirklichen lassen« (Schütz/Luckmann 2003: 476). Das Entwerfen erfolgt damit in der natürlichen Einstellung und der Mensch orientiert sich an dem, was er aufgrund seines subjektiven Wissensvorrats in der Alltagwelt als möglich annimmt. Dem Entwerfen stellt Schütz das »bloße Phantasieren« (u. a. Schütz/Luckmann 2003: 74) gegenüber. Zu den Phantasiewelten zählt Schütz den Tagtraum, Spiel, Witz und Scherz, Märchen, Dichtung und andere. Diese haben als wesentliche Elemente gemeinsam, dass der Mensch von der Dringlichkeit des pragmatischen Motivs befreit ist, in der Welt zu handeln und diese zu verändern. Mit den im bloßen Phantasieren entwickelten Vorstellungen wird also nicht der Anspruch verbunden, sie in der Welt in Reichweite in dieser Weise zu realisieren bzw. als aktuell/früher realisiert anzunehmen. Damit sind der Spontaneität keine Grenzen gesetzt und Menschen können sich in jede erdenkliche Rolle versetzen. Während sich das Entwerfen, bei Schütz insbesondere der Handlungsentwurf, auf die Welt in erlangbarer Reichweite richtet, können mit dem bloßen Phantasieren Welten entwickelt werden, die außerhalb der Reichweite und nicht unbedingt in der Zukunft liegen. Während Schütz grundsätzlich von der menschlichen Fähigkeit des Phantasierens bzw. der Imagination ausgeht, wird im vorliegenden Kapitel untersucht, wie Sprecher im Gespräch Phantasien entwickeln und einander kommunizieren. Entwerfen und bloßes Phantasieren (Fiktionalisieren) werden damit als

Einleitung: Begriffliche Abgrenzung von Entwerfen und Fiktionalisieren

125

Gesprächsaktivität aufgefasst. Die in der Aktivität aufgebauten Vorstellungen werden als mentale Räume verstanden. Wie in Kapitel 2 dargestellt, sind mentale Räume konzeptionelle Repräsentationen imaginierter Szenen. Mentale Räume sind durch Frames organisiert und beinhalten Handlungszusammenhänge, an denen Akteure beteiligt sind. Innerhalb der Theorie mentaler Räume wird auch die aktuelle Kommunikationssituation, die Welt in aktueller Reichweite bei Schütz, als mentaler Raum aufgefasst.1 Dieser Reality Space dient als Base Space, zu dem die Interaktanten immer wieder zurückkehren und den sie zum Gegenstand des Gesprächs machen können. Darüber hinaus dient der Reality Space als Bezugsgröße für alle weiteren im Gespräch geöffneten mentalen Räume. Für das Entwerfen kann nach der Begriffsbestimmung von Alfred Schütz davon ausgegangen werden, dass die in einem entworfenen Raum repräsentierte Szene im Einklang mit dem Wissen der Beteiligten über die Regeln und Gesetzmäßigkeiten der Alltagswelt ist. In entworfenen Räumen können Sprecher erstens solche Szenen repräsentieren, die sie im Rahmen des eigenen Handelns in der Zukunft realisieren wollen bzw. an denen sie selbst aktiv beteiligt sind. Zweitens können die Sprecher Szenen entwerfen, die sie nicht planen, sondern lediglich antizipieren, d. h. denen sie zusprechen, dass sie ohne eigenes Zutun eintreten werden. Planen und Antizipieren sind jedoch nicht strikt voneinander zu trennen. Im Entwerfen entwickeln Sprecher einen mentalen Raum, dem sie zusprechen, dass die in ihm repräsentierte Szene in der Zukunft möglich oder wahrscheinlich ist. Das bloße Phantasieren bei Schütz wird in der vorliegenden Arbeit als Fiktionalisieren gefasst und damit der Gegenstand gleichzeitig eingeengt. Nicht in den Fokus der Arbeit fallen ›Welten‹, die eine konventionalisierte Geschichte enthalten, wie etwa Märchen oder Dichtungen. Vielmehr werden solche Fiktionen betrachtet, die Sprecher ad hoc im Gespräch entwickeln. Fiktionalisieren wird darüber hinaus in einem zweiten Sinne enger gefasst als das bloße Phantasieren. Während bei Schütz die Sprecher im bloßen Phantasieren lediglich nicht an die Bedingungen und Grenzen der Realität gebunden sind, ist für das Fiktionalisieren charakteristisch, dass die Sprecher diese Grenzen überschreiten und gegen die Regeln der Alltagwelt verstoßen. Eine genauere Begriffsbestimmung wird, aufbauend auf einem Forschungsüberblick zu gesprächsanalytischen Arbeiten zur Fiktionalisierung, in Kapitel 4.3.1 gegeben. 1

Zu betonen ist an dieser Stelle nochmals, dass es sich bei Realität nicht um ein objektives Konzept handelt. Vielmehr ist mit Realität die von den Interaktanten gemeinsam hergestellte Auffassung von Realität gemeint.

126

Entwerfen und Fiktionalisieren

Im folgenden Teilkapitel werden zunächst einige Sequenzen untersucht, in denen die Sprecher im Entwerfen zukünftige Szenen imaginieren und hierbei Figuren animieren (4.2). Im darauffolgenden Teilkapitel wird ausführlich untersucht, wie Sprecher in der Interaktion fiktionale Räume entwickeln (4.3). Ausgehend von einem Forschungsüberblick zum Fiktionalisieren in Gesprächen (4.3.1) wird in empirischen Analysen der Aufbau fiktionaler mentaler Räume untersucht und dabei insbesondere die Animation von Figuren betrachtet (4.3.2). Hierauf aufbauend wird analysiert, wie Sprecher fiktionale mentale Räume gestalten, indem sie semantische Frames überlagern bzw. überblenden (4.3.3). Hier wird dargestellt, dass der Effekt der Fiktionalisierung aus der Überlagerung des aktuell entwickelten mentalen Raumes mit einem partiell inkompatiblen Frame entstehen kann. Während in diesen beiden Abschnitten der Fokus auf der Untersuchung der verbalen und der phonetischen Ebene liegt, wird abschließend der Beitrag körperlicher Mittel zur Konstitution mentaler Räume und der Animation von Figuren untersucht (4.3.4). Die Ergebnisse werden in Kapitel 4.4 zusammengefasst.

4.2

Entwerfen von Handlungen

Im folgenden Teilkapitel wird anhand von drei Gesprächssequenzen untersucht, wie Sprecher zukünftige Handlungen und Szenen imaginieren. In der ersten Beispielanalyse (Sequenz esqueleto) bereiten die beteiligten Sprecher eine Arbeitspräsentation vor und vermitteln einander ihre Vorstellungen über einen möglichen Verlauf dieser Präsentation, indem sie diese aufführen. In der zweiten Analyse (Sequenz adorno) bittet eine Sprecherin ihren Freund um die Korrektur einer Seminararbeit. Im Austausch über eine mögliche Korrektur demonstriert der Freund eine zwar mögliche Handlung, die er jedoch nicht ausführen wird. Während in diesen Sequenzen lediglich die verbale und die phonetische Ebene betrachtet werden, beziehen die darauffolgenden Analysen die körperliche Ebene ein. In der Sequenz boliche entwirft eine Sprecherin, wie sich ein in sie verliebter Junge bei ihrem nächsten Treffen verhalten wird. 4.2.1

Beispielanalysen

Sequenz 6: esqueleto (›Skelett‹) Die vier am Gespräch beteiligten Frauen absolvieren eine Ausbildung für Körpertherapie. Sie haben die Aufgabe erhalten, sich in kreativer Weise mit

Entwerfen von Handlungen

127

dem Knochenbau des Menschen zu beschäftigen. Das Ergebnis soll in der nächsten Unterrichtsstunde vor der gesamten Klasse vorgestellt werden. Die Aufgabenstellung besteht damit aus zwei Teilen: die Reflexion über den eigenen Körper und die Präsentation des Ergebnisses. Zentral ist dabei, dass in der Präsentation der Reflexionsprozess vermittelt werden soll. In den nun analysierten Gesprächssequenzen bereiten die Sprecherinnen die Präsentation vor und koordinieren ihr zukünftiges gemeinsames Handeln. Vereinfacht kann dabei von zwei mentalen Räumen ausgegangen werden. Der erste Raum ist der Reality Space, die aktuelle Gesprächssituation, in der die Sprecherinnen die Präsentation vorbereiten. Der zweite Raum ist der in der Zukunft liegende Raum der Präsentation vor der Klasse. Vereinfacht ist die Trennung in zwei Räume insofern, als in diesen jeweils Handlungen ablaufen. Die Räume weisen also eine zeitliche Ausdehnung auf und könnten damit in noch mehr Räume unterteilt werden. Darüber hinaus gehen die beiden Räume zeitlich direkt ineinander über: Die Präsentation findet zwei Stunden nach dem aktuellen Gespräch statt und die Sprecherinnen fahren gemeinsam in das Institut, wo die Präsentation stattfindet. Bereits vor dem aktuellen Gespräch haben die Sprecherinnen sich darauf geeinigt, mit alltäglichen Gegenständen (wie Servietten, Stöcken, Luftballons und Ähnlichem) zu arbeiten und haben diese mitgebracht. Einzelnen Knochen des menschlichen Skelettes soll jeweils ein Gegenstand zugeordnet werden. Darüber hinaus besteht die Möglichkeit, aus den Gegenständen ein komplettes Skelett aufzubauen. Unbestimmt ist, wie die Präsentation verlaufen soll. Die Sprecherinnen entwickeln zwei grundsätzliche Varianten: – Variante Produkt: In der Vorbereitung wird ein Skelett zusammengebaut und als fertiges Produkt präsentiert. – Variante Prozess: Die Sprecherinnen nehmen die Gegenstände einzeln in die Präsentation mit. Dort kann dann ein Skelett aufgebaut werden. Der Vorteil der Variante Produkt ist, dass während der Präsentation Zeit gespart wird. Der Vorteil der Variante Prozess liegt darin, dass die Zuschauer den Aufbau des Skelettes verfolgen und die Sprecherinnen währenddessen ihre Reflexionen aus der Vorbereitungsphase vermitteln können. Diese Varianten werden in verschiedenen Anläufen immer wieder als Vorschläge eingebracht. Dabei versuchen sich die Sprecherinnen gegenseitig zu vermitteln, wie die Präsentation ablaufen könnte. Gleichzeitig argumentieren die Sprecherinnen für die von ihnen bevorzugte Variante.

128

Entwerfen und Fiktionalisieren

Teilsequenz 6a: esqueleto Kurz vor dem Beginn der nun folgenden Sequenz hat Graciela (G) vorgeschlagen, ein Skelett aufzubauen. Nun argumentiert Claudia (C) dafür, die Präsentation stärker als Prozess zu gestalten. Die Sequenz wird in kurzen Abschnitten präsentiert, wobei die Animation von Äußerungen erst am Ende stattfindet. 01

C: [pero la idEA NO es=eso;] = aber die Idee ist nicht das

02

= la idEA era (.) hacERdie Idee war zu machen

03

= con los objEtos que queríamos traER, mit den Gegenständen, die wir mitbringen wollten

04

hacEr lo que a nosotras nos represEnten que son los HUEsos. = das zu machen, was für uns bedeuten, was die Knochen sind

05

nO imagiNAte- = nein, stell dir vor

06

= [yo tengo (.) tAl colec ich habe diese Sammlu

]

07

?:

08

C: mirá esta servillEta que tengo YO, schau mal diese Serviette, die ich habe

09

?:

ja

10

C: y yo (-) flashEo que para mí esund ich stelle mir vor, dass für mich

· 11

[y después (no) miRARlos.] und sie danach (nicht) anschauen

das ist ein Schulterblatt

12

?: Hm. hm

13

C: entOnces (.) desPUÉS, dann danach

14

[cuando terminAmos] = wenn wir fertig sind

C widerspricht ihrer Vorrednerin (01) und formuliert nochmals die Idee, welche sie bereits zuvor entwickelt hatten (02ff). Mit imagiNAte (05) fordert sie die Anwesenden auf, sich etwas vorzustellen und entwickelt die Vorstellung mit den folgenden Äußerungen. Sie verweist zunächst auf die Ansammlung von Gegenständen, die sie mitgebracht hat (06) und lenkt dann die Aufmerksamkeit der anderen auf eine Serviette (08). Sie formuliert, sich diese

129

Entwerfen von Handlungen

als Schulterblatt vorzustellen: y yo (-) flashEo que para mí es | Esto es un oMÓplato (10f). Das Verb flashear fungiert hier als Verbum pensandi zur Einleitung der Wiedergabe eines Gedankens. Über die Konjunktion que werden die nachfolgenden Äußerungssegmente para mí es zwar syntaktisch subordiniert und damit als ›indirekte‹ Gedankenwiedergabe eingeleitet. Die Sprecherin unterbricht sich jedoch selbst und setzt nach einer kurzen Pause zu einer Neuformulierung an: Esto es un oMÓplato (11). Dabei spricht sie lauter als zuvor und wählt einen sehr bestimmten Sprechausdruck. Damit ist die Äußerung deutlich expressiver als zuvor. Vage ist die raumzeitliche Verankerung des Gedankens. Im vorliegenden Kontext scheint es, als formuliere die Sprecherin einen Gedanken im Hier-und-Jetzt des Gesprächs: Die aktuell vor ihr liegende Serviette ist ein Schulterblatt. Durch das vorangegangene imagiNAte (05) sind die Äußerungen jedoch bereits als Beschreibung einer Vorstellung gerahmt, was darauf hindeutet, dass die Sprecherin den mentalen Raum der Präsentation entwickelt. Auch der folgende Gesprächsverlauf legt nahe, dass die Sprecherin hier wiedergibt, was sie während der Präsentation denkt. Mit entOnces (.) desPUÉS | cuando terminAmos (13) verweist die Sprecherin auf einen Zeitpunkt, der nach dem zuvor animierten Gedanken liegt, und entwirft damit eine Abfolge von Handlungen. Darüber hinaus kontextualisiert die Sprecherin hier über die Verbform terminAmos in der 1. Person Plural, dass sie nicht ihre individuelle Handlung, sondern eine Handlungsabfolge für alle Anwesenden beschreibt. Nun unterbricht sie L und kollaboriert in ihrem Entwurf: 15

L: [

16

C: = paRÁ. warte mal

17

L: = [y lo poné:s en] un lugAr donde puede llegar a estar el oMÓplato. und legst es an einem Ort, wo das Schulterblatt hinkommen könnte

18

C:

[escuCHAm. hör mir z

]

19

?:

[((ruido)) ((Lärm))

]

20

L: [(...) ] (...)

21

C: [nO NO.] = nein nein

22

y lo ponÉs en] = und du legst es an

= pero parÁ que quiero termiNAR mi idea; aber warte mal, weil ich meine Idee zu Ende bringen will

130

Entwerfen und Fiktionalisieren

L ergänzt die Äußerungen Cs und formuliert im Indikativ, dass C die Serviette an einen Ort legt oder an einer Stelle befestigt, wo das Schulterblatt sein könnte: y lo poné:s en un lugAr donde puede llegar a estar el oMÓplato (17). L geht damit in der von C entworfenen Handlungssequenz davon aus, dass sie einen räumlichen Aufbau des menschlichen Skelettes vornimmt. C jedoch widerspricht mehrfach und fordert L auf, sie ihre eigene Idee zu Ende formulieren zu lassen (16, 18, 21f). Sie fährt nun mit der Erläuterung ihrer Idee fort: 23

C: después de que tOdas termiNAmos- (0.6) nachdem wir alle fertig sind

24

como lo quE (-) fla!SHEA!mos- (0.7) mit dem, wie wir »nachdenken«

· 25

decimos Ay mi!RÁ!- = sagen wir ah schau mal

· 26

= qué LO:co; wie verrückt

· 27

= qué te paSÓ; was ist dir passiert?

· 28

y NO:; = und nein

· 29

= yo vi esto como: el oMÓ:::plato; ich habe das als Schulterblatt gesehen

30

NO, nicht?

31

ni siquiera tiene que ser un cUErpo arMAdo; es muss nicht einmal ein zusammengesetzter Körper sein

32

[sinO lo que] = sondern das, was

33

G: [CLAro. klar

]

34

C: = los hUEsos que se te vayan ocurriendo (.) y ponerle Arte (-) a ESo; die Knochen, die dir einfallen, und daraus Kunst zu machen

Mit después de que tOdas termiNAmos (23) wiederholt C ihre vor der Unterbrechung formulierte Äußerung (13f). Sie verweist damit nochmals auf den Zeitpunkt innerhalb des mentalen Raumes, nachdem die Anwesenden ihre Überlegungen beendet haben. In der Äußerung como lo quE (-) fla!SHEA:!mos (24) verändert die Sprecherin auf dem Verb flasheamos den Sprechausdruck in der Weise, dass sie Artikulationsbasis der Zunge nach hinten verlagert, überdeutlich artikuliert und stark melodisiert spricht. Sie markiert damit, dass die Anwesenden in der Präsentationssituation ›nicht

Entwerfen von Handlungen

131

wirklich‹ überlegen, welcher Gegenstand welchem Knochen entspricht, sondern nur vorgeben, dies zu tun. In der Logik der Präsentation haben die Sprecherinnen sich dies bereits zuvor überlegt.2 Nun leitet die Sprecherin mit dem Verbum dicendi decimos in der 1. Person Plural einen animierten Dialog zwischen den Anwesenden im mentalen Raum ein. Eine Figur spricht emphatisch eine andere an und fordert sie auf, zu ihr zu schauen: Ay mi!RÁ! | qué LO:co (25f). Die Überraschung bzw. Begeisterung kontextualisiert die Sprecherin in der animierten Rede sowohl lexikalisch durch die Partikel AY und den Ausdruck qué LO:co, als auch prosodisch durch die starke Akzentuierung und den emphatischen Sprechausdruck (starke Melodisierung, klarer Stimmklang, hoher Anteil des Kopfregisters, leicht erhöhte Lautstärke). In der folgenden animierten Äußerung fragt nun eine andere Figur zurück, was passiert sei: qué te paSÓ (27). Nun animiert die Sprecherin wiederum die erste Figur, wobei der Junktor y (28) zur Kontextualisierung des Figurenwechsels beiträgt. Die Figur äußert, ein Objekt3 als das Schulterblatt gesehen zu haben: NO: | yo vi esto como: el oMÓ:::plato (28f). Innerhalb der animierten Äußerung verweist die Figur – kontextualisiert mit dem Tempus Indefinido in vi – auf den zuvor animierten Gedanken als ein in der Vergangenheit liegendes Ereignis. Die Sprecherin entwickelt damit in der Animation eine zeitliche Struktur. Den Entwurf schließt C mit der Frage NO (30) an die Anwesenden ab. Sie formuliert nun verbal, dass es ihrer Ansicht nach nicht notwendig sei, ein Skelett aufzubauen: ni siquiera tiene que ser un cUErpo arMAdo (31). Vielmehr sei eine ›kunstvolle‹ Präsentation der einzelnen Knochen ausreichend bzw. angemessener (32, 34). In dieser Sequenz entwirft eine Sprecherin den mentalen Raum, den Prozess der Auseinandersetzung mit dem menschlichen Körper in der Präsentation nachzustellen. Hierfür animiert sie exemplarische Äußerungen für sich selbst und die anderen Anwesenden, die diesen Prozess ›nach‹spielen. Auf diese Weise soll den Mitstudentinnen vermittelt werden, in welcher Weise sie sich mit dem menschlichen Körper auseinandergesetzt haben. Bemerkenswert ist an dieser Sequenz der fließende Übergang vom Sprechen im Hier-und-Jetzt und dem Demonstrieren der entworfenen Handlung. Die Sprecherin verweist zunächst auf einen sichtbar vorhandenen Gegenstand (Serviette) und agiert später in der imaginierten Szene mit diesem. Auch in Bezug auf die Animation von Äußerungen findet ein gleitender Übergang 2

3

Evidenz hierfür findet sich auch in der Teilsequenz 6b, in der eine Sprecherin formuliert, sie sollten in der Präsentation eben nur so tun, als würden sie überlegen. Die Figur benennt das Objekt nicht, sondern verwendet das Lokaldeiktikum esto zur Referenzherstellung. Vermutlich handelt es sich um die zuvor benannte Serviette.

132

Entwerfen und Fiktionalisieren

statt, indem die Sprecherin zunächst Gedanken formuliert, die nicht eindeutig als animiert gekennzeichnet sind. In der soeben analysierten Teilsequenz hat v. a. die Sprecherin C ihre Vorstellung entwickelt. Als L versucht, kollaborativ ihre Vorstellung einzubringen, wird dies von C zurückgewiesen. Kurze Zeit später gelingt es L, ihren Vorschlag zu entwickeln, was in der folgenden Sequenz analysiert wird. Teilsequenz 6b: esqueleto Soeben hat G vorgeschlagen, bereits in der Vorbereitung ein vollständiges Skelett aufzubauen und dabei auf einem Plakat Gedanken zu notieren. In der Präsentation sollten dann Skelett und Plakat ausgestellt und währenddessen die notierten Gedanken vorgelesen und erläutert werden. L beginnt nun, ihren Gegenvorschlag zu formulieren. Die Sequenz wird wieder in mehreren Abschnitten besprochen. 01

C: y cada una puede: explicar (.) de(sde) su (.) [experIEncia:: que le paSÓ.] und jede kann aus ihrer Erfahrung heraus erklären, was ihr passiert ist

02

L: [a mí me: me parece (.) que] podemos llevar este::mir mir scheint, dass wir hinbringen können ähm

03

?: CLAro; klar

04

L: [a mÍ se me habÍa pare mir hat (...)

] m: m m

05

?: [estuvo BUEno (igual); es war (trotzdem) gut

]

06

L: había pensado (-) en ahOra ver los elementos que teNEmos; ich habe gedacht, jetzt die Elemente anzuschauen, die wir haben

07

y: bueno das ist das (ist) das=ist=das

11

hacErlo aCÁ, = es hier zu machen

12

= como arrIba de en el SUElo. = so wie über dem auf dem Boden

Entwerfen von Handlungen 13

= diGAmos. = sagen wir

14

= en un espAcio (como ir) armando el cuerpo huMAno in einem Raum (so) den menschlichen Körper zusammenbauend

133

Zu Beginn der Sequenz ergänzt C den Vorschlag Gs, die auf dem Plakat notierten Gedanken zu erläutern: y cada una puede: explicar (.) de(sde) su (.) experIEncia:: que le paSÓ (01). Mit mehrfachen Ansätzen (02, 04, 06) erwirbt nun L das Rederecht. Sie beginnt zu formulieren, dass sie sich vorgestellt hatte, im Hier-und-Jetzt die Materialen anzuschauen: había pensado (-) en ahOra ver los elementos que teNEmos (06). Mit der Verwendung des Plusquamperfekts había pensado verweist die Sprecherin auf ihren Gedanken als in der Vergangenheit liegend. Sie ist damit deiktisch im Hier-und-Jetzt verankert, auf das sie mit dem temporaldeiktischen ahora verweist. Syntaktisch ergänzt sie das Verb ver (›sehen‹) im symbolisierenden Modus mit dem direkten Objekt los elementos que teNEmos (06). Mit der folgenden Äußerung y: bueno VER (07) schließt sie unter Verwendung des koordinierenden Junktors y (›und‹) und der Modalpartikel bueno (›gut‹) nochmals das Verb ver an und nutzt die Latenz der vorangegangenen Struktur. Die nun folgende Ergänzung des Verbs formuliert sie nicht mehr im symbolisierenden, sondern im demonstrierenden Modus, womit das Verb ver die Funktion eines Verbum dicendi übernimmt. Deutlich wird dies in der folgenden Abbildung.

Abbildung 17

Mit den animierten Äußerungen demonstriert die Sprecherin den inneren Prozess der Reflexion, der während der zuvor symbolisierend formulierten Betrachtung der Gegenstände (ver los elementos que teNEmos, 06) abläuft. Sie animiert hierfür mehrere syntaktisch parallel strukturierte Äußerungen in Form einer Liste: esto es un oMÓplato | Esto es una claVÍcula | Esto=es esto=s esto=es=ESto (08ff). In Form von Kopu-

134

Entwerfen und Fiktionalisieren

lakonstruktionen referiert die Sprecherin mit dem Demonstrativpronomen jeweils auf einen der mitgebrachten Gegenstände und weist diesem einen Knochen zu. In den animierten Äußerungen werden die Knochen am Anfang noch konkret benannt (Schlüsselbein, Schulterblatt). In den letzten animierten Äußerungen jedoch fehlen die konkreten Bezeichnungen, wodurch die Sprecherin markiert, dass die Zuweisungen exemplarisch sind. Die Sprecherin animiert hier nicht nur sich selbst, sondern einen Vorgang, den alle Anwesenden potentiell vollziehen. Bei den animierten Äußerungen handelt es sich weniger um die Animation verbaler Äußerungen, sondern vielmehr um die Demonstration des kognitiven Prozesses der Analogiebildung, welcher in der Vorbereitung der Präsentation von allen einzeln vollzogen wird. Dass der Prozess in der Vorbereitung der Präsentation – also in unmittelbarer Reichweite im Sinne von Schütz – stattfinden soll, macht die Sprecherin nach der Animation über den Verweis auf das Hier mit hacErlo aCÁ (11) nochmals deutlich. Auch in der Vorbereitung sollten die Gegenstände bereits auf dem Boden (en el SUElo, 12) in Gestalt des menschlichen Körpers zusammengesetzt werden: en un espAcio (como ir) armando el cuerpo huMAno (14). Nach dem Entwerfen der in unmittelbarer Reichweite liegenden Vorbereitung der Präsentation, entwirft L nun die Präsentation selbst. 15 16

L: = y Eso MISmo; = und genau das = llevAndo los materiales todos sepaRAdos y- = hinbringend die Materialen alle einzeln und

· 17

= Uy miRÁ, = oh schau mal

· 18

= acÁ tengo una clavícula a VER, = hier habe ich ein Schlüsselbein, mal sehn

· 19

= = und ich weiß nicht was

20

= y la ponÉs por aCÁ, und du machst es hier hin

· 21

y acÁ está la no SÉ; = und hier ist die, ich weiß nicht

· 22

= el fÉmur y BUEno; = der Oberschenkelknochen und gut

23

y lO y como que lo poNÉS. = und ihn und wie/so, dass du ihn hinmachst

24

entenDÉS, verstehst du

25

G: CLAr[oklar

]

Entwerfen von Handlungen

135

Nach der Reflexion darüber, welches Objekt welchem Knochen entspricht, sollten die Objekte einzeln an den Ort der Präsentation gebracht werden: y Eso MISmo | llevAndo los materiales todos sepaRAdos y (15f). Der Übergang vom mentalen Raum Vorbereitung zum Entwerfen des Raumes Präsentation wird hier nicht über temporale Deiktika geleistet, sondern semantisch über das Verb llevar (›bringen/mitnehmen‹), welches für die Sprecherinnen die räumliche Bewegung vom aktuellen Aufenthaltsort in das Institut markiert. Die Einleitung der animierten Rede erfolgt auf lexikalischer Ebene nicht durch ein Verbum dicendi, sondern durch den Junktor y, der hier eine nachfolgende Handlung einleitet. Die Sprecherin animiert – wie in der zuvor analysierten Sequenz die Sprecherin L – eine Äußerung, mit der eine Figur Überraschung ausdrückt und eine Figur auffordert, ihr Beachtung zu schenken: Uy miRÁ (17). Auch prosodisch wird die Überraschung, bzw. in den nachfolgenden animierten Äußerungen leichte Begeisterung signalisiert. In den folgenden animierten Äußerungen acÁ tengo una clavícula a VER (18) referiert die Figur mit dem Lokaldeiktikum acÁ auf ein Objekt als Schlüsselbein und signalisiert mit a VER nachzudenken. Die Äußerung y no sé QUÉ (19) ist ein in animierter Rede sehr häufiges Fragment, mit dem die Typizität der Animation markiert wird. Wie auch in dieser Sequenz wird das Fragment meist im prosodischen Muster der animierten Figur gesprochen und gehört damit noch zur Animation. Gleichzeitig markiert es das Ende der animierten Rede. Nun formuliert L wieder im symbolisierenden Modus, wie die Figur das Objekt – in der Logik des mentalen Raumes – an die entsprechende Stelle des Skelettes platziert: y la ponÉs por aCÁ (19). Dabei referiert die Sprecherin mit acá erneut lokaldeiktisch auf einen Ort innerhalb des imaginierten mentalen Raumes. Personaldeiktisch markiert die Sprecherin durch die unpersönliche Apostrophe in der 2. Person Singular mit ponés, dass sie eine Handlung entwirft, die nicht nur sie selbst, sondern jede der Anwesenden ausführen kann. Die soeben entworfene Handlung des gespielten Identifizierens eines Alltagsgegenstandes und dessen Platzierung formuliert die Sprecherin mit den nachfolgenden Äußerungen in paralleler Strukturierung nochmals: y acÁ está la no SÉ | el fÉmur y BUEno | y lO y como que lo ponÉS

(20ff). Auch hier sind die ersten Äußerungen wieder als animierte Rede zu interpretieren, ohne dass diese jedoch lexikalisch eingeleitet oder durch eine prosodische Markierung besonders hervorgehoben werden. Durch die parallele Strukturierung ist die Äußerung jedoch als animierte Rede zu erkennen. Nun richtet sich L direkt an G, die zuvor die Variante präferiert hatte, ein fertig aufgebautes Skelett zu präsentieren, und fragt, ob sie sie verstehe: entenDÉS (24). Mit CLAro (25) signalisiert G nur sehr zurückhaltend Verständnis, woraufhin L fortfährt, ihre Vorstellung zu erläutern.

136 26

Entwerfen und Fiktionalisieren L:

27

[y::: ] Mmund hm y hAblar de lo de la estruc[TU:::ra;]= und über den über die Struktur sprechen

28

G:

[HM. hm

29

L: = y quÉ sé YO- = und was weiß ich

30

= pEro com = aber wi(e)

31

= pero y despUÉs hablar deaber und danach sprechen über

32

como que Ir agaRRANdo cosas. = so wie laufend Sachen zu nehmen

· 33 34

= Uy mirÁ [esto podría SER no ] [sé qué. ] = oh schau mal, das könnte ich weiß nicht was sein C:

[en vez de hacErlo aCÁ,] = anstatt es hier zu machen

35 [(] (...) 36 37 · 38 29

]

= [armArlo aLLÁ] es dort aufbauen

L: = [sabiendo ] yA (-) que eso va ser ESo. = schon wissend, dass dieses jenes sein wird = pero ahÍ como diCIENdo- = aber dort so sagend = uy mirÁ esto podría ser una la columna verteBRAL; oh schau mal, das könnte eine die Wirbelsäule sein

und du machst sie hin

· 41

Uy mirá esto podría ser no sé el om el oMÓplato. = oh schau mal, das könnte, was weiß ich, das Schul das Schulterblatt sein

· 42

= la claVÍcula. das Schlüsselbein

43

y lo vAs poniendo en el SUElo, und legst es auf den Boden

44

y ahí en el sUElo vamos arMANdo. und dort auf dem Boden setzen wir es zusammen

45

me entenDÉSverstehst du

46

G: CLAroklar

47

sÍ entiendo tu iDEA; ja, ich verstehe deine Idee

48

= ich verstehe, was du sagst

137

Entwerfen von Handlungen

L erläutert, dass die Studentinnen während des Platzierens von Gegenständen ihre Gedanken über die Struktur und den Aufbau des Skeletts vermitteln könnten (26–31). Daraufhin formuliert sie, unter Verwendung des Vergleichsmarkers como que, nochmals den für sie zentralen Punkt des Vorgangs: como que Ir agaRRANdo cosas (32). Im symbolisierenden Modus hebt L hier hervor, dass es sich um einen iterativen Vorgang handelt, was in diesem Kontext durch die Periphrase ir + Gerundium ausgedrückt wird. Nach der symbolisierenden Formulierung des fortlaufenden Ergreifens von Dingen animiert die Sprecherin nochmals eine entsprechende Äußerung, wie eine Figur einen Alltagsgegenstand als einen Knochen erkennt: Uy mirÁ esto podría SER no sé qué (33). In der Animation reflektiert sich der iterative Charakter des Prozesses darin, dass die Sprecherin anders als zuvor keinen Knochen mehr nennt, sondern mit no sé qué einen Platzhalter verwendet. Nun drückt K aus, L zu verstehen und reformuliert, was Ls Vorschlag von Gs Vorschlag unterscheidet, nämlich das Skelett erst während der Präsentation aufzubauen: en vez de hacErlo aCÁ | armArlo aLLÁ (34f). In überlappendem Sprechen formuliert L den zweiten zentralen Aspekt ihrer Idee neben dem iterativen Charakter des Vorgangs: Der Reflexionsprozess soll in der Präsentation lediglich nachgespielt werden. Während der Präsentation sollten die Anwesenden bereits wissen, welcher Gegenstand welcher Knochen sein könnte: sabiendo ya yA (-) que eso va ser ESo (36). Nach dieser Erläuterung wiederholt die Sprecherin noch zweimal das bereits etablierte Muster einer animierten Rede, mit der eine Figur einen Knochen erkennt (a) und diesen danach und an die entsprechende Stelle legt (b). pero ahÍ como diCIENdo (37) (a) uy mirÁ esto podría ser (b) y la poNÉS (39) (a) Uy mirá esto podría ser (a) claVÍcula (41f) (b) y lo vAs poniendo en el

una la columna verteBRAL (38) no sé el om el oMÓplato | la SUElo

(43)

Abschließend betont die Sprecherin nochmals im symbolisierenden Modus, dass das Skelett am Boden liegend aufgebaut wird: y ahí en el sUElo vamos arMANdo (44). Nach der erneuten Nachfrage, ob G sie verstehe (me entenDÉS, 45) reagiert diese nun ausführlicher: CLAro | sÍ entiendo tu idea | enTIENdo lo que decís (46ff). Sie stimmt L jedoch nicht zu, sondern formuliert erneut ihre Vorstellung (nicht im Transkript).

138

Entwerfen und Fiktionalisieren

Für die beiden untersuchten Teilsequenzen kann zusammengefasst werden, dass die Sprecherinnen im Entwerfen einer zukünftigen Interaktionssituation diese nicht nur im symbolisierenden Modus beschreiben, sondern über die Verwendung von animierter Rede einander zentrale Handlungen demonstrieren. Die Sprecherinnen kommunizieren ihre – teilweise gegensätzlichen – Vorstellungen, indem sie die Ereignisse und Handlungen in der Demonstration direkt erfahrbar machen. Dabei versetzen sich die Sprecherinnen in die entworfene Situation, was im symbolisierenden Sprechen durch die Verwendung des Präsens und vor allem durch das Hineinversetzen in die Figuren markiert wird. Die Sprecherinnen handeln zur Probe im Hier-und-Jetzt, um mit den anderen die spätere Handlung zu koordinieren. Die Sprecherinnen entwickeln ihre Entwürfe monologisch und bestehen teilweise darauf, dies alleine zu tun. So animiert eine Sprecherin teilweise mehrere Figuren, ohne dass andere Sprecher in die Aufführung einsteigen können. Es handelt sich somit um ein geschlossenes Beteiligungsformat. Die Koordination des zukünftigen Handelns bzw. der Aufbau gemeinsamer mentaler Räume findet hier also nicht statt, indem die Sprecherinnen bereits im Hier-und-Jetzt in einem Spielrahmen koordiniert handeln. Dennoch wird in diesen Sequenzen der Aufbau gemeinsamer mentaler Räume deutlich: Verschiedene Sprecherinnen animieren nacheinander Äußerungen in der imaginierten Präsentationssituation und übernehmen dabei zentrale Aspekte aus den Entwürfen ihrer Vorrednerinnen. In den Entwürfen wechseln die Sprecherinnen oft zwischen dem symbolisierenden und dem demonstrierenden Modus. Symbolisiert werden vor allem temporale Wechsel innerhalb des mentalen Raumes. Dies kann geschehen durch die Verwendung temporaldeiktischer Marker oder durch die Formulierung von Ereignissen, die eine zeitliche und/oder räumliche Veränderung ausdrücken. So können innerhalb der Entwürfe zeitliche Strukturen entwickelt werden, und es ist den Sprecherinnen möglich, innerhalb der animierten Äußerungen auf zurückliegende Ereignisse zu referieren. Neben der Entwicklung der Zeitstruktur werden auch einfache körperliche Handlungen (das Positionieren von Dingen) im symbolisierenden Modus formuliert. Im demonstrierenden Modus formulieren die Sprecherinnen vor allem innere Handlungen in Form animierter Gedanken (hier der Reflexionsprozess). Die spezifische Leistung der animierten Rede besteht darin, die Art und Weise bzw. die Qualität auszudrücken, in der diese Handlung bzw. das Ereignis erfolgt (z. B. freudige Entdeckung, Verwunderungen, Interesse, …). In den animierten Äußerungen können Aspekte vermittelt werden, die im symbolisierenden Sprechen schwieriger zu formulieren wären. Dies wird durch lexi-

Entwerfen von Handlungen

139

kalische Partikel und vor allem durch die prosodische Gestaltung realisiert. Darüber hinaus nutzen die Sprecher die animierte Rede, um dialogische Momente zu entwerfen, wie Figuren miteinander interagieren. Auch hier spielt die Demonstration affektiver und emotionaler Aspekte eine zentrale Rolle. Interessant an den hier analysierten Sequenzen ist, dass die Sprecherinnen nicht lediglich Äußerungen für eine konkrete Person animierten. Vielmehr haben die animierten Äußerungen einen generischen Charakter und die Sprecherinnen animieren typisierte und potentielle Äußerungen für jede der Anwesenden. Mit Formulierungen in der 1. Person Plural und der 2. Person Singular werden alle Anwesenden einbezogen. Die Generizität der animierten Äußerungen zeigt sich auch in der Verwendung unspezifischer Ausdrücke wie dem Fragment no sé qué. Auffällig ist, dass die Sprecherinnen in der animierten Rede viele lokaldeiktische Elemente verwenden. Ein relevanter Aspekt ist hier, dass die Sprecherinnen auf die sichtbar vorhandenen Objekte zeigen, mit diesen hantieren und eine explizite symbolisierende Bezeichnung nicht notwendig ist. Ein zweiter Aspekt ist darüber hinaus, dass die Sprecherinnen durch die Verwendung der Deiktika Objekte relativ zur Figurenorigo lokalisieren und diese damit stabilisieren. In der soeben analysierten Sequenz ist den Sprecherinnen bereits zu Beginn des Gesprächs bewusst, dass sie gemeinsam an den entworfenen Handlungen beteiligt sein werden. Die Analyse der folgenden Sequenz hingegen setzt an dem Punkt ein, als eine Sprecherin zum ersten Mal eine gemeinsame zukünftige Interaktion thematisiert. Dabei wird erst im Verlauf der Sequenz etabliert, welche Rollen die aktuell anwesenden Personen übernehmen sollen. Ein zweiter Unterschied zur soeben analysierten Sequenz besteht darin, dass die Sprecher nicht animieren, wie sie sich verhalten werden. Vielmehr demonstriert ein Sprecher, in welcher Weise er nicht handeln wird. Die Koordination des gemeinsamen Handelns besteht darin, dass eine mögliche Handlungsalternative ausgeschlossen wird. Sequenz 7: adorno (›Adorno‹) Cecilia (C) und Gonzalo (G) essen gemeinsam zu Abend. Die beiden sind ein Paar und studieren dasselbe Studienfach. C schreibt gerade an einer Hausarbeit über Adorno, die noch abschließend korrigiert werden muss. Zum Hintergrundwissen der beiden gehört, dass Cs Schwester María bereits einen Teil der Hausarbeit gelesen hat. Nun verhandelt C mit G, ob er den Rest der Arbeit korrigieren kann. Die Sequenz wird in Abschnitten besprochen.

140 01 02 03

Entwerfen und Fiktionalisieren C: lo que necesIto (.) es que maría me la corRIja, was ich brauche ist, dass María sie mir korrigiert NO? nicht wahr? G: hm=HM? hm=HM?

C formuliert die Notwendigkeit, dass ihre Schwester María ihre Hausarbeit korrigiert. Mit lo que necesIto (01) drückt C nicht lediglich ein gegenwärtiges Bedürfnis für das Hier-und-Jetzt aus, sondern etabliert gleichzeitig einen in der Zukunft liegenden mentalen Raum. Das Modalverb necesitar (›brauchen‹) fungiert in Kombination mit dem Vollverb corregir im Subjuntivo als Spacebuilder. Strukturiert ist der mentale Raum durch das Frame Korrektur einer schriftlichen Arbeit. Die Leerstellen Autor, Korrektor und Text des Frames sind bereits gefüllt durch C, ihre Schwester M und die Hausarbeit. Mit der Frage NO (02) fordert C die Zustimmung von G ein, dass die Korrektur der Arbeit notwendig ist. G stimmt ihr mit hm=HM (03) zu, markiert durch die steigende Intonation aber gleichzeitig, dass C weitersprechen soll. C fährt fort zu sprechen. 04

05

C: me dijo que te (.) me lo corrijas VOS; = sie hat mir gesagt, dass ich dich, du es mir korrigieren sollst = lo que pAsa=e(s)=que::: nur ist es halt so, dass

06

G:

07

C: que vOs no tenés poder CRItico. dass du keine Kritikfähigkeit hast

08 · 09

sobre MÍ. mir gegenüber todo me decís está BIEN; bei allem sagst du mir, es ist gut

C gibt in ›indirekter Rede‹ wieder, dass ihre Schwester abgelehnt hat, die Hausarbeit zu korrigieren. Stattdessen hat sie vorgeschlagen, G solle die Hausarbeit korrigieren: me dijo que te (.) me lo corrijas VOS (04). Mit dieser Äußerung wird nun G die Rolle des Korrektors im mentalen Raum zugeschrieben. Diese Zuschreibung nimmt C indirekt vor, indem sie über die Redewiedergabe ihrer Schwester M den Vorschlag zuschreibt, die damit als Prinzipal des Vorschlags fungiert. In dieser Äußerung findet – markiert durch die Mikropause – eine für den Gesprächsverlauf relevante Reparatur statt. Durch me dijo que te (04) projiziert die Sprecherin eine Verbalphase, die nicht eingelöst wird. Die Fortsetzung kann aus

Entwerfen von Handlungen

141

dem Kontext jedoch erschlossen werden als preguntara a vos. C solle ihren Freund G darum bitten, die Hausarbeit zu korrigieren. Über die nicht eingelöste Projektion etabliert C für die aktuelle Gesprächssituation den Frame einer Bitte.4 Mit lo que pAsa=e(s)=que::: (05) setzt C zu einem Einwand an, weshalb G die Arbeit nicht korrigieren könne, den sie jedoch zunächst nicht zu Ende formuliert. Erst nach Gs Nachfrage (06) formuliert sie, G sei nicht in der Lage, sie zu korrigieren, da er ihr gegenüber keine Kritikfähigkeit habe: que vOs no tenés poder CRItico | sobre MÍ (07f). Mit diesem Einwand gegen den Vorschlag der Schwester frotzelt C ihren Freund.5 Dies wird auch in der prosodischen Gestaltung der Äußerungen deutlich. Mit der Äußerung que vOs no tenés poder CRItico (07) spricht C ihrem Freund zunächst jegliche Kritikfähigkeit ab und schränkt erst mit dem inkrementell angehängten sobre MÍ (08) ihre Behauptung dahingehend ein, G habe keine Kritikfähigkeit ihr gegenüber. Durch die frotzelnde Bemerkung eröffnet C einen spielerischen Kontext und fordert G gleichzeitig heraus, face-Arbeit zu betreiben und ihr zu widersprechen. Es handelt sich also um einen ›rhetorischen‹ Trick, mit dem C versucht, G dazu zu bringen, dafür zu argumentieren, dass er die Arbeit korrigieren kann. Da im aktuellen Gespräch der Kontext der Bitte etabliert ist, würde der Widerspruch Gs, die Arbeit doch korrigieren zu können, implizieren, dass er dies auch tatsächlich tun muss. Mit todo me decís está BIEN (09) animiert C eine Äußerung für G, mit dem sie die zuvor im symbolisierenden Modus formulierte Kritiklosigkeit Gs demonstriert. Durch das Verbum dicendi decir in der 2. Person Singular me decís ist die animierte Äußerung está BIEN (09) klar G zugeschrieben. Durch das Personaldeiktikum me kontextualisiert C, dass G mit ihr spricht. Allerdings ist die Äußerung damit nur personal- und nicht temporaldeiktisch verankert. Das Präsens fungiert hier als unmarkiertes Tempus, durch das keine temporale Verankerung der Äußerung stattfindet. Damit ist erstens möglich, dass C mit Bezug auf die Äußerungen 05 und 07 eine generelle Handlungsdisposition Gs demonstriert: G sagt immer zu ihr, dass alles gut sei. Zweitens ist aber auch möglich, dass die Sprecherin G animiert, wie er im geöffneten mentalen Raum Korrektur der Hausarbeit über Adorno zu ihr spricht bzw. sprechen könnte. Damit bleibt an dieser Stelle vage, ob C ihren Freund G in generischer Form oder innerhalb des mentalen Raumes der Korrektur animiert. Der Äußerung kommt daher eine Scharnierfunktion zwischen der 4

5

Evidenz dafür, dass G die Aktivität tatsächlich als Bitte auffasst, findet sich auch später in Äußerung 22. Zur Aktivität des Frotzelns vgl. u. a. Günthner (1996, 1999a).

142

Entwerfen und Fiktionalisieren

vorangegangenen allgemeingültigen symbolisierenden Äußerung (no tenés poder CRItico | sobre MÍ, 07f) und der später folgenden Aufführung zu. Diese Scharnierfunktion besteht auch an der sprachlichen Realisierung der G zugeschrieben Äußerung. Zwischen den beiden G zugeschrieben Äußerungsteilen todo und está BIEN ist das die animierte Rede kontextualisierende Element me decís eingefügt. Eine solche Insertion eines lexikosyntaktischen Markers in die animierte Äußerung ist für eine stark animierte Rede untypisch.6 Hinzu kommt, dass die Äußerung prosodisch nicht von den vorangegangenen Äußerungen abgesetzt oder in einem besonderen Sprechausdrucksmuster gestaltet ist. Mit der Äußerung todo me decís está BIEN (09) findet also bereits eine Veränderung im Produktionsformat statt, auch wenn die Äußerung nicht sehr expressiv animiert ist. Nun widerspricht G. 10

G: no no es que no tengo poder CRÍtico sobre vos. nein, es ist nicht so, dass ich keine Kritikfähigkeit dir gegenüber habe

11

que con::[cienzudaMENte. ] (nur ist es so,) dass ich Adorno nie tiefgehend gelesen habe

12

C: tamPOco leyó adOrno.] hat Adorno auch nicht gelesen

13 14 15

[mi hermAna meine Schwester

aber sie versteht das Problem perfekt> G:

[(entenDIÓ)? ] (hat sie verstanden?) claro entIEndo el problema que me planteÁS. = klar verstehe ich das Problem, das du mir beschreibst

· 16

= pero nO te voy a decir no miRÁ cecilia. aber ich werde dir nicht sagen, nein schau mal Cecilia

· 17

me parece que (-) acá estás maliterpreTANdo. mir scheint, hier interpretierst du falsch

· 18

[porque adOrno weil Adorno

19 20

6

]

C: [