Deixis in der face-to-face-Interaktion 9783110307436, 9783110307252

This study develops an empirically founded theory of deixis (words only understandable in context) in the German languag

290 73 17MB

German Pages 525 [528] Year 2015

Table of contents :
Inhalt
1 Einleitung
1.1 Phänomenbereich: Was ist Deixis?
1.1.1 Die Zweifelderlehre und die Organisation des Zeigfelds
1.1.2 Origo, Egozentrizität und die Dimensionen des Zeigfelds
1.1.3 Modi des Zeigens
1.1.4 Relevanz der Zeigegeste
1.2 Gegenstandskonstitution
2 Begriffliche Grundlagen
2.1 Zum Gestenbegriff
2.2 Zur Anatomie von Gesten
2.3 Temporalität – Kotemporalität – Simultaneität – Sequenzialität
2.4 Sprache und Gestik in der deiktischen Zeigehandlung
3 Korpus und Methode
4 Parameter der Zeigehandlung: Ein Modell zur Untersuchung deiktischer Zeigehandlungen in der face-to-face-Interaktion
4.1 Fokussierte Interaktion
4.2 Verweisraum
4.3 Verweisender Körper
4.4 Deiktischer Ausdruck
4.5 Zeigegeste
4.6 Suchraum
4.7 Zeigeziel
4.8 Referent
4.9 Wahrnehmung und Wahrnehmungswahrnehmung
4.10 Verstehen und Verstehensdokumentation
5 Typologie des gestischen Zeigens
5.1 Zeigen mit dem Zeigefinger
5.1.1 Zeigefinger mit Handfläche nach unten (ZfHu)
5.1.2 Zeigefinger mit Handfläche vertikal (ZfHv)
5.2 Zeigen mit dem Daumen
5.3 Zeigen mit dem kleinen Finger
5.4 Zeigen mit geöffneter Hand
5.4.1 offene Hand Handfläche nach oben (oHHo)
5.4.2 offene Hand Handfläche vertikal (oHHv)
5.4.3 offene Hand Handfläche nach unten (oHHu)
5.5 Zeigen mit anderen Körperteilen
5.5.1 Zeigen mit dem Kopf
5.5.2 Zeigen mit dem Blick
5.5.3 Grenzfälle
5.6 Zeigen mit Objekten
5.7 Zeigen an Objekten
6 Empirische Untersuchungen zu den Parametern der Zeigehandlung
6.1 Fokussierte Interaktion
6.2 Verweisraum
6.3 Verweisender Körper
6.4 Zeigegeste
6.5 Suchraum
6.6 Zeigeziel: Das Vektor-Ziel-Problem
6.7 Referent: Das Problem der Referenzherstellung
6.8 Wahrnehmung und Wahrnehmungswahrnehmung
6.8.1 Der Kontrollblick zur Wahrnehmungswahrnehmung
6.8.2 Automatisiertes Fremdmonitoring
6.9 Verstehen und Verstehensdokumentation
6.10 Zur Flexibilität und Adaptivität der Parameter im interaktiven Vollzug
7 Spezielle Fälle
7.1 Personendeixis
7.1.1 Zeigen auf die dritte Person
7.1.2 Zeigen auf die erste Person
7.1.3 Zeigen auf die zweite Person
7.2 Zeigen am eigenen Körper
7.3 Modaldeixis
7.3.1 so sieht/sehen X aus + Geste
7.3.2 so X (X = Adjektiv) + Geste
7.3.3 so X (X = Verb) + Geste
7.3.4 so Ø + Geste/Performanz/Inszenierung
7.4 Deixis am Phantasma
7.4.1 Von der demonstratio ad oculos zum nicht sichtbaren Zeigeziel: Analysen zum dritten Hauptfall
7.4.2 Vergegenwärtigung von Abwesendem im Wahrnehmungsraum: Analysen zum ersten Hauptfall
7.4.3 Versetzung in den Vorstellungsraum: Analysen zum zweiten Hauptfall
8 Schlussdiskussion
9 Bibliographie
10 Index

Recommend Papers

Deixis in der face-to-face-Interaktion 9783110307436, 9783110307252

This study develops an empirically founded theory of deixis (words only understandable in context) in the German languag

141 87 11MB Read more

Deixis in Narrative: A Cognitive Science Perspective [1 ed.] 0805814620, 9780805814620

This volume describes the theoretical and empirical results of a seven year collaborative effort of cognitive scientists

121 11 14MB Read more

Deixis and Frames of Reference in Hellenistic Dedicatory Epigrams 9783110681673, 9783110681598

The book presents an analysis of communicative structures and deictic elements in Hellenistic dedicatory epigrams. Movin

161 50 18MB Read more

Grounding: The Epistemic Footing of Deixis and Reference [Reprint 2012 ed.] 9783110899801, 9783110173697

This compilation of invited contributions, gathering an international collection of cognitive and functional linguists,

144 38 12MB Read more

Hier und jetzt: Studien zur lokalen und temporalen Deixis im Deutschen [Reprint 2010 ed.] 9783111353937, 9783484302839

Die Buchreihe Linguistische Arbeiten hat mit über 500 Bänden zur linguistischen Theoriebildung der letzten Jahrzehnte in

147 99 53MB Read more

Der Bürgerkrieg in der Ritterschaft

470 92 36MB Read more

Der Arbeiter in der Sowjetunion

101 8 34MB Read more

Förderung der Mundgesundheit in der Pflege: Expertenstandard in der der Praxis anwenden 9783748606963

Wie ist es um die Mundgesundheit Ihrer Senior:innen bestellt? Als Pflegefachkraft tragen Sie die Verantwortung für den g

97 9 2MB Read more

Der Sachwalter in der Eigenverwaltung 9783814558165

Das Werk untersucht das Verfahren der Eigenverwaltung mit Blick auf die Rolle des Sachwalters. Die Aufgabenverteilung zw

100 100 1MB Read more

Der Wortakzent in der Serbokroatischen schriftsprache 3533020916

102 94 9MB Read more

Deixis in der face-to-face-Interaktion
9783110307436, 9783110307252

Author / Uploaded
Anja Stukenbrock

0 0 0
Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up

File loading please wait...

Citation preview

Anja Stukenbrock Deixis in der face-to-face-Interaktion

linguae & litterae

Publications of the School of Language & Literature Freiburg Institute for Advanced Studies Edited by Peter Auer, Gesa von Essen, Werner Frick Editorial Board Michel Espagne (Paris), Marino Freschi (Rom), Ekkehard König (Berlin), Michael Lackner (Erlangen-Nürnberg), Per Linell (Linköping), Angelika Linke (Zürich), Christine Maillard (Strasbourg), Lorenza Mondada (Basel), Pieter Muysken (Nijmegen), Wolfgang Raible (Freiburg), Monika Schmitz-Emans (Bochum)

Volume 47

Anja Stukenbrock

Deixis in der face-to-face-Interaktion

ISBN 978-3-11-030725-2 e-ISBN (PDF) 978-3-11-030743-6 e-ISBN (EPUB) 978-3-11-037825-2 ISSN 1869-7054 Library of Congress Cataloging-in-Publication Data A CIP catalog record for this book has been applied for at the Library of Congress. Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.dnb.de abrufbar. © 2015 Walter de Gruyter GmbH, Berlin/München/Boston Satz: epline, Kirchheim unter Teck Druck und Bindung: Hubert & Co. GmbH & Co. KG, Göttingen ♾ Gedruckt auf säurefreiem Papier Printed in Germany www.degruyter.com

Danksagung Diese Untersuchung ist eine leicht überarbeitete Fassung meiner Habilitationsschrift, mit der ich 2012 an der Albert-Ludwigs-Universität Freiburg habilitiert wurde. Peter Auer verdanke ich nicht nur die Anregung zu dem Thema, sondern bin ihm auch für seine konstruktive Kritik und die persönliche Unterstützung in der Entstehungszeit der Arbeit sehr verbunden. Besonders danke ich Jürgen Streeck für seinen freundschaftlichen wie fachlichen Rat und die wissenschaft liche Inspiration, die ich von ihm in den Jahren erfahren habe. Mein Dank gilt ferner Christian Mair, Helga Kotthoff, Lorenza Mondada, Charles und Marjorie Goodwin, Elisabeth Gülich, Johannes Schwitalla sowie Karin Birkner, Anne-Maria Stresing und Oliver Ehmer. In meiner Arbeit haben mich nicht nur Kolleginnen und Kollegen, sondern auch viele Hilfskräfte tatkräftig unterstützt. Besonders bedanke ich mich dafür bei Anh Nhi Dao, Ina Hörmeyer, Jana Brenning, Stefanie Öttl und Annette Schöneck. Für die Möglichkeit, in einem disziplinär und interdisziplinär gleichermaßen anregenden Umfeld arbeiten zu dürfen, danke ich dem Freiburg Institute for Advanced Studies (FRIAS), das meiner Forschung auf vielfältige Weise förderlich war, den Fellows und Gästen, den Mitarbeiterinnen und Mitarbeitern und nicht zuletzt Werner Frick als Direktor und spiritus rector in diesen für das Institut prägenden und für mich wissenschaftlich wegweisenden Jahren. Jena, im Januar 2015

Anja Stukenbrock

Inhalt 1 1.1 1.1.1 1.1.2 1.1.3 1.1.4 1.2 2 2.1 2.2 2.3

Einleitung  1 Phänomenbereich: Was ist Deixis?  2 Die Zweifelderlehre und die Organisation des Zeigfelds  3 Origo, Egozentrizität und die Dimensionen des Zeigfelds  4 Modi des Zeigens  7 Relevanz der Zeigegeste  9 Gegenstandskonstitution  13

2.4

Begriffliche Grundlagen  19 Zum Gestenbegriff  19 Zur Anatomie von Gesten  22 Temporalität – Kotemporalität – Simultaneität – Sequenzialität  28 Sprache und Gestik in der deiktischen Zeigehandlung  35

3

Korpus und Methode  45

4 Parameter der Zeigehandlung: Ein Modell zur Untersuchung deiktischer Zeigehandlungen in der face-to-face-Interaktion  49 4.1 Fokussierte Interaktion  51 4.2 Verweisraum  56 4.3 Verweisender Körper  59 4.4 Deiktischer Ausdruck  65 4.5 Zeigegeste  67 4.6 Suchraum  71 Zeigeziel  72 4.7 Referent  78 4.8 Wahrnehmung und Wahrnehmungswahrnehmung  85 4.9 Verstehen und Verstehensdokumentation  90 4.10 5 Typologie des gestischen Zeigens  97 5.1 Zeigen mit dem Zeigefinger  101 Zeigefinger mit Handfläche nach unten (ZfHu)  102 5.1.1 5.1.2 Zeigefinger mit Handfläche vertikal (ZfHv)  114 Zeigen mit dem Daumen  123 5.2 Zeigen mit dem kleinen Finger  135 5.3 5.4 Zeigen mit geöffneter Hand  140

VIII 5.4.1 5.4.2 5.4.3 5.5 5.5.1 5.5.2 5.5.3 5.6 5.7

Inhalt

offene Hand Handfläche nach oben (oHHo)  141 offene Hand Handfläche vertikal (oHHv)  149 offene Hand Handfläche nach unten (oHHu)  159 Zeigen mit anderen Körperteilen  168 Zeigen mit dem Kopf  169 Zeigen mit dem Blick  177 Grenzfälle  192 Zeigen mit Objekten  196 Zeigen an Objekten  214

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung  231 6.1 Fokussierte Interaktion  232 6.2 Verweisraum  241 6.3 Verweisender Körper  252 6.4 Zeigegeste  265 6.5 Suchraum  272 6.6 Zeigeziel: Das Vektor-Ziel-Problem  282 6.7 Referent: Das Problem der Referenzherstellung  296 6.8 Wahrnehmung und Wahrnehmungswahrnehmung  313 6.8.1 Der Kontrollblick zur Wahrnehmungswahrnehmung  314 6.8.2 Automatisiertes Fremdmonitoring  322 6.9 Verstehen und Verstehensdokumentation  330 6.10 Zur Flexibilität und Adaptivität der Parameter im interaktiven Vollzug  343 7 Spezielle Fälle  351 7.1 Personendeixis  352 7.1.1 Zeigen auf die dritte Person  354 7.1.2 Zeigen auf die erste Person  366 7.1.3 Zeigen auf die zweite Person  381 7.2 Zeigen am eigenen Körper  394 7.3 Modaldeixis  416 7.3.1 so sieht/sehen X aus + Geste  419 7.3.2 so X (X = Adjektiv) + Geste  424 7.3.3 so X (X = Verb) + Geste  427 7.3.4 so Ø + Geste/Performanz/Inszenierung  432 7.4 Deixis am Phantasma  440

Inhalt

7.4.1 Von der demonstratio ad oculos zum nicht sichtbaren Zeigeziel: Analysen zum dritten Hauptfall  444 7.4.2 Vergegenwärtigung von Abwesendem im Wahrnehmungsraum: Analysen zum ersten Hauptfall  453 7.4.3 Versetzung in den Vorstellungsraum: Analysen zum zweiten Hauptfall  466 8

Schlussdiskussion  492

9

Bibliographie  499

10 Index  513

IX

1 Einleitung „Titelträume sind in den Sand geschriebene Prä-Texte“1. Titel können als Deklaration und Versprechen verstanden werden, dass die durch sie ausgelösten Projektionen auch eingelöst werden. In der zerdehnten, situationsentbundenen Kommunikation werden solche Projektionen von der Autorin durch das Schreiben des Texts und von den Leserinnen und Lesern durch die Textlektüre eingelöst und dadurch jener unmittelbaren interaktiven Bearbeitung entzogen, die das Wesen der face-to-face-Kommunikation ausmacht. Mein Text trägt den Titel „Deixis in der face-to-face-Interaktion“. Im Gegensatz zur medialen Gestalt meiner Untersuchung sind die kommunikativen Bedingungen, unter denen ich das Phänomen der Deixis betrachte, die des Sprechens von Angesicht zu Angesicht. Das Ziel der Untersuchung besteht darin, aus praxeologischer Perspektive einen Beitrag zur wissenschaftlichen Wiedereinbettung der Deixis in ihren ureigenen Entstehungs- und Vollzugsort zu leisten. Die Arbeit gründet in den fundamentalen Einsichten, die Karl Bühler 1965 [1934] in der Sprachtheorie formuliert hat. In der Bühler-Nachfolge sind ausgesprochen komplexe Theoriegebäude entwickelt worden, die jedoch selten empirisch fundiert sind und ausgerechnet jene Aspekte ausklammern, die für Bühler zentral waren. So gibt es in der deutschsprachigen Tradition kaum Untersuchungen, die die interaktions-, wahrnehmungs-, körper- und raumbezogenen Aspekte seiner Theorie in situ an jenem Schauplatz empirisch studieren, den Bühler selbst zum Ausgangspunkt genommen hat: die face-to-face-Interaktion. Sie ist nicht nur der primäre Ort menschlicher Kommunikation und Sozialität2, sondern auch der Deixis. Die face-to-face-Interaktion zeichnet sich durch ihre Leibgebundenheit, die Kopräsenz der Beteiligten, die Reziprozität visueller und akustischer (unter Umständen auch taktiler und olfaktorischer) Wahrnehmung, Unmittelbarkeit, Flüchtigkeit, Simultaneität, Multimodalität und durch ihren Vollzugscharakter aus (vgl. Clark 1996; Goffman 1963; Tomasello 2008). Diese Aspekte gilt es als konstitutive Faktoren in die theoretische und empirische Betrachtung der Deixis einzubeziehen. Die genannten Forschungsdefizite betreffen sowohl die fast vollständige Vernachlässigung der Gestik als auch eine mangelnde Untersuchung der gesprochenen Sprache. So sind theoretische Verallgemeinerungen zur Deixis vorgenommen worden, die empirischen Untersuchungen zur gesprochenen Sprache

1 Gerigk (2002: 15). 2 Goffman (1963); Goodwin (2000b); Levinson (2006); Tomasello (2008).

2

1 Einleitung

und noch weit weniger Videoanalysen zur multimodalen Einbettung der Deixis in die face-to-face-Kommunikation standhalten. Die genannten Defizite sind zum einen auf eine Forschungstradition zurückzuführen, die wenig Interesse an empirischen, die kommunikative Praxis berücksichtigenden Untersuchungen hatte und zum Teil noch immer mit konstruierten, durch Introspektion erlangten Beispielen arbeitet. Dazu gehören insbesondere Ansätze aus der Logik, der Sprachphilosophie und der formalen Semantik, die versucht haben, deiktische Ausdrücke in kontextunabhängige Propositionen aufzulösen (vgl. die Kritik z. B. von Bar-Hillel 1970: 282; Cheang 1990: 58 u. 63; Fricke 2007: 14; Levinson 2000). Zum anderen gehen die Defizite darauf zurück, dass auch in der Deixisforschung ein written language bias (Linell 1982, 2005; Hopper 1992, 1997; Couper-Kuhlen und Selting 1996) herrscht. Da sich die meisten deskriptiven Untersuchungen zur Deixis auf schriftliche Textkorpora stützen, sind Analysen zur Deixis in der face-to-face-Kommunikation auch für die Theoriebildung ein zentrales Desiderat geblieben. Die vorliegende Arbeit versteht sich als theoretischer und empirischer Vorstoß, dieses Forschungsdefizit zu einem Zeitpunkt zu bearbeiten, zu dem die technischen und technologischen Voraussetzungen für multimodale, auf Video daten basierende Analysen bereits seit einigen Jahrzehnten gegeben sind. Die Untersuchung rückt eine bestimmte Gebrauchsweise – den gestischen Gebrauch deiktischer Ausdrücke – in den Vordergrund. Dies geschieht in der Überzeugung, dass erst die Einbettung der sprachlichen Deixis in das interaktive, körperliche, räumliche und perzeptorische Orientierungssystem – das interaktive Feld der Beteiligten (interactive field, Goodwin 2007a) – der Deixis in ihrer prototypischen Form gerecht wird.

1.1 Phänomenbereich: Was ist Deixis? In der Forschung herrscht bis heute Uneinigkeit darüber, was dem Phänomenbereich der Deixis zugerechnet werden soll. Verallgemeinernd stehen sich eine enge Auffassung, die den Origo-Begriff und die drei Dimensionen Person, Raum und Zeit zugrunde legt, und eine weite Auffassung, in der zusätzliche deiktische Dimensionen postuliert oder Deixis und Indexikalität gleichgesetzt werden, gegenüber. Während sich die enge Auffassung vor allem in der Nachfolge Karl Bühlers in Europa entwickelt hat, finden sich die Vertreter einer weiten Auffassung vor allem in der anglo-amerikanischen Forschungstradition. Dort hat die Rezeption Bühlers erst mit der 1990 erschienenen englischen Übersetzung der Sprachtheorie eingesetzt und erfolgt bis heute recht zögerlich. Dies ist umso unverständlicher, als die darin entwickelte Deixistheorie nicht nur den Beginn der modernen

1.1 Phänomenbereich: Was ist Deixis?

3

Deixisforschung markiert, sondern bis heute die konziseste Theorie darstellt, in der die Ergebnisse empirischer, mit audiovisuellen Daten arbeitender Untersuchungen zur face-to-face-Kommunikation antizipiert wurden. Die besondere, bis heute weitgehend verkannte Modernität und Aktualität der Bühlerschen Theorie liegt in seiner tief greifenden Einsicht in die Dialogizität, den Handlungscharakter und die Multimodalität3 der Deixis. Für die vorliegende Untersuchung stellt die 1934 erschienene Sprachtheorie Bühlers daher den theoretischen Ausgangspunkt dar. Die Kernkomponenten der darin formulierten Deixistheorie bilden erstens die Zweifelderlehre der Sprache, zweitens die Darlegung der Organisationsprinzipien des Zeigfelds, drittens der Begriff der Origo, viertens das Postulat der Egozentrizität, fünftens die Bestimmung der Dimensionen des Zeigfelds, sechstens die Ausarbeitung der Modi des Zeigens sowie schließlich siebtens die Anerkennung des zentralen Stellenwerts gestischen Zeigens.

1.1.1 Die Zweifelderlehre und die Organisation des Zeigfelds An den Anfang seiner Überlegungen zur Deixis stellt Bühler die Frage, „ob es unter den lautsprachlichen Zeichen solche gibt, welche wie Wegweiser fungieren“ (Bühler 1965 [1934]: 79). Vom Bild des „an Wegverzweigungen oder irgendwo im weglosen Gelände“ (Bühler 1965 [1934]) aufgestellten Wegweisers, den er als Nachbildung der menschlichen Arm- und Fingergeste begreift, gelangt Bühler zum Begriff des Zeigfelds: „Er [der Wegweiser] tut dem Wanderer gute Dienste, wenn alles klappt, wozu vorweg nötig ist, daß er in seinem Zeigfeld richtig steht“ (Bühler 1965 [1934]: 79, Hervorhebung i. O.). So wie der Wegweiser „eine bestimmte Position im Gelände“ (ebd.) hat, nehmen deiktische Sprachzeichen wie hier und dort eine bestimmte Position im Zeigfeld der Sprache ein. Auf der Grundlage dieser Vorüberlegungen entwickelt Bühler eine phänomenologisch basierte Zweifelderlehre der Sprache, der zufolge sprachliche Zeichen sich grundsätzlich auf zwei verschiedene Felder verteilen, die es voneinander zu unterscheiden gilt: das Symbolfeld und das Zeigfeld der Sprache. Beide gehören zum Sprachsystem und bilden zwei verschiedene „Umfelder der Sprachzeichen“

3 Bühler selbst verwendet weder den Begriff Multimodalität noch verwandte Begriffe, doch die Schlüsselrolle, die er der Zeigegeste, der visuellen, aber auch der akustischen und der taktilen Wahrnehmung, dem menschlichen Körper und dem Raum zuerkennt, macht seine Theorie zu einem zentralen Bezugspunkt für multimodale Untersuchungen zur Deixis, deren methodisches und technisches Instrumentarium (audiovisuelle Aufzeichnungs-, Speicher- und Bearbeitungstechnologien) Bühler nicht zur Verfügung stand.

4

1 Einleitung

(Bühler 1965 [1934]: XXII). Das Symbolfeld der Sprache wird durch die „syntaktischen und lexikalischen Momente der Sprache gebildet“ (Bühler 1965 [1934]: 151). Ihm sind die sog. Nennwörter der Sprache zugeordnet, die als Symbole fungieren und „ihre spezifische Bedeutungserfüllung und -präzision im synsemantischen Umfeld [erfahren]“ (Bühler 1965 [1934]: 81). Sie stellen ein „für den intersubjektiven Austausch brauchbares ‚Begriffszeichen‘“ dar und werden unabhängig vom einzelnen Gebrauchsfall „im Munde jedes und aller als Symbol für denselben Gegenstand verwendet“ (Bühler 1965 [1934]: 103, Hervorhebung i. O.). Demgegenüber figurieren im Zeigfeld die sog. Zeigwörter der Sprache, die in der Grammatiktheorie als deiktische Sprachzeichen bezeichnet werden und abhängig vom jedesmaligen Gebrauchsfall sind. Für sie gilt die „Zuordnungskonstanz von Sprachsymbolen und Gegenständen“ (Bühler 1965 [1934]: 104), die die Nennwörter definieren, nicht. Stattdessen erfahren sie ihre „Bedeutungserfüllung und Bedeutungspräzision von Fall zu Fall“ (Bühler 1965 [1934]: 80) im Zeigfeld der Sprache. Die im Zeigfeld der Sprache situierten Zeigwörter entbehren nicht vollständig einer symbolischen Bedeutungskomponente (Bühler 1965 [1934]: 90). Doch anders als die Symbolwörter sind sie zur Desambiguierung auf eine jedesmalige Verankerung in den situativen Dimensionen des Zeigfelds angewiesen. Bühler nennt noch ein drittes, aus lautmalerischen Elementen konstituiertes Feld, das Malfeld der Sprache (Bühler 1965 [1934]: 153), verwirft es jedoch mit dem Argument, dass es strukturell unzureichend ausgebildet sei und keine kohärente Ordnung konstituiere.4

1.1.2 Origo, Egozentrizität und die Dimensionen des Zeigfelds Die Dimensionen, nach denen die Elemente im Zeigfeld der Sprache organisiert sind, lauten Raum, Zeit und Person. Diese bilden ein Koordinatensystem, das „hierjetzt-ich-System der subjektiven Orientierung“ (Bühler 1965 [1934]: 149), dessen Ausgangs- oder Nullpunkt Bühler als Origo konzeptualisiert. Das als Origo bezeichnete deiktische Zentrum liegt im unmarkierten Fall erstens beim Sprecher, zweitens in der Äußerungszeit als temporalem Bezugspunkt und drittens

4 Bühler (1965 [1934]: 153): „Ich selbst habe lange in meinen Vorlesungen zur Sprachtheorie beides [Symboldfeld und Malfeld, A. S.] zwar schon getrennt, sprach aber immer noch von einem primären Darstellungsfeld, das als Malfeld charakterisiert wurde. Heute aber sehe ich, dass die Malfleckchen, welche faktisch vorkommen, isoliert bleiben und nicht einer kohärenten Ordnung angehören, die wirklich den Namen Malfeld verdienen würde. Es gibt also nicht drei Felder in der Sprache, nämlich Malfeld, Zeigfeld und Symboldfeld, sondern nur zwei, nämlich Zeigfeld und Symbolfeld.“ [Hervorhebung i. O.]

1.1 Phänomenbereich: Was ist Deixis?

5

im Aufenthaltsort des Sprechers zur Äußerungszeit als räumlichem Bezugspunkt. Für Bühler stellt die egozentrische Strukturiertheit des Zeigfelds die unhintergehbare Prämisse seiner Theorie dar: „In unserem Fall ist es einfach hinzunehmen, das Koordinatensystem der ,subjektiven Orientierung‘, in welcher alle Verkehrs partner befangen sind und befangen bleiben. Jeder benimmt sich wohlorientiert in dem seinigen und versteht das Verhalten des anderen“ (Bühler 1965 [1934]: 102 f.). Zu den drei traditionellen Dimensionen der Personen-, Raum- und Zeitdeixis, über die abgesehen von Bezeichnungsunterschieden5 weitgehend Einigkeit herrscht, sind in der Folge weitere deiktische Dimensionen hinzugefügt worden. Im Wesentlichen betrifft dies die Einführung einer Rede-, Diskurs- und Textdeixis (Blühdorn 1995; Braunmüller 1977; Diewald 1991; Diessel 1999; Ehlich 1979, 1982; Ehrich 1992; Fillmore 1972, 1997; Harweg 1990; Herbermann 1988; Lyons 1977; Maaß 2006; Rauh 1978; Schmauks 1991; Sennholz 1985; Tschauder 1990; Zifonun et al. 1997), einer Sozialdeixis (Fillmore 1972, 1997; Rauh 1984: 60 f.), einer Objektdeixis (Diewald 1991: 33, 227 ff.) und einer Modaldeixis (Ehlich 1987: 287; Diewald 1991: 33, 238 ff.; Harweg 1990: 287; Herbermann 1988a: 72; Rauh 1984; Stukenbrock 2010; Thurmair 2001; Zifonun et al. 1997), wobei die Auffassungen dessen, was unter dem Begriff modal zu verstehen ist, widersprüchlich sind. So begreift Diewald darunter den Faktizitätsgrad (faktisch versus nicht-faktisch), den ein Sprecher einem dargestellten Sachverhalt zuschreibt (Diewald 1991: 255; vgl. auch Rauh 1984: 52 f.). Herbermann (1988a: 72 f.) hingegen versteht unter Modaldeixis das Verweisen auf bestimmte Qualitäten eines Gegenstands, Vorgangs oder Ablaufs und stellt treffend fest, dass die mit dem Modaldeiktikon gekoppelte Geste einem anderen Gestentyp angehört, nämlich dem Typus der ikonischen oder darstellenden Geste (vgl. zur Modaldeixis ausführlich Kapitel 7.3). Von den genannten Kategorisierungsbemühungen unterscheidet sich Hanks, der insgesamt sieben deiktische Dimensionen6 annimmt, methodisch durch seinen practice approach (Hanks 1990: 9) und theoretisch durch das Postulat einer Soziozentrizität des deiktischen Felds (1992: 53): „Given that acts of reference are interactively accomplished, a sociocentric approach is certain to be more pro-

5 So tauchen auch die Begriffe Personal-, Temporal- und Lokaldeixis oder attributive Ausdrücke wie personale, temporale und lokale Deixis auf. Analog dazu werden zusätzliche deiktische Dimensionen dann als objektale, soziale, modale, empathische etc. Deixis bezeichnet. 6 Die sieben Dimensionen, die Hanks (1990: 67 f.) unterscheidet und jeweils noch weiter unterteilt, sind: Participant, Perception, Spatial, Temporal, Attention focus, Discourse, Background knowledge.

6

1 Einleitung

ductive than an egocentric one, even when the speaker is the primary ground of reference.“ Sein Postulat der Soziozentrizität begründet Hanks (1990: 7) zum einen mit dem allgemeinen Argument, dass das Ego des Sprechers eine soziale Konstruktion sei, und zum anderen damit, dass die deiktische Referenz unweigerlich immer eine Beziehung zwischen Sprecher, Adressat und einer Entität im umgebenden Raum herstelle.7 Die entscheidende Frage lautet jedoch, welches die stillschweigend vorausgesetzte Standard- bzw. Vororientierung ist, aufgrund derer Beziehungen zwischen Sprecher, Adressat und Phänomenen im Wahrnehmungsraum hergestellt und perspektiviert werden. Im Unterschied zu soziozentrischen (Hanks 1990, 1992) oder dyadischen Konzeptionen (Liu 1992; Weinrich 1988; vgl. zur Kritik daran auch Redder 2000) folge ich in meinem multimodalen Deixismodell der Theorie Bühlers, in der die egozentrische Orientierung den Standardfall bildet, von dem aus die topomnestische Orientierung8 und unterschiedliche Typen der Deixis am Phantasma konzeptualisiert werden. Die egozentrische Orientierung muss wie jede andere Origo-Setzung zwar auch interaktiv hergestellt und ratifiziert werden, doch widerspricht dies nicht der Annahme, dass Interaktanten im default-Fall die Origo beim jeweiligen Sprecher ansiedeln und dass mit dem Sprecherwechsel auch die Origo für die Perspektivierung des gemeinsamen Sprechereignisses wandert. Bühlers Postulat einer „leichten Übersetzbarkeit aller Feldwerte des räumlichen Orientierungs- und sprachlichen Zeigsystems aus einer in eine andere Orientierungstafel“ (Bühler 1965 [1934]: 131) und seine Feststellung, dass „ein ungemein feines und von uns Erwachsenen kaum noch bemerktes Spiel von Versetzungen im Gange“ ist (Bühler 1965 [1934]: 138), belegen, dass seine Theorie keineswegs einer egozentristischen Verengung unterliegt. Dem widerspricht auch, dass der Adressat bzw. Interaktionspartner, den Bühler als „Hörer“ bezeichnet, als feste Bezugsgröße in seine Theorie einbezogen wird. Wie Bühler betrachte ich die Leiblichkeit des Individuums als primäre, unhintergehbare Wirklichkeit und Orientierungsgröße, von der aus das Selbst,

7 Vgl. auch Hanks (1990: 7): „In place of egocentricity, therefore, this book will return con tinually to the sociocentricity of deictic reference. Not only is the speaking of ‘ego’ a social con struction, but the act of deictic reference is in important ways grounded on the relation between interlocutors. When speakers say ‘Here it is’, he or she unavoidably conveys something like ‘Hey, you and I stand in a certain relation to each other and to this object and this place, right now’.“ 8 Unter topomnestischer Orientierung versteht Bühler (1965 [1934]: 133 f.) die räumliche Orientierung aus der Perspektive eines intrinsisch ausgerichteten Objekts oder im Rekurs auf absolute Bezugsgrößen (z. B. die Himmelsrichtungen). Die topomnestische Orientierung wird von ihm jedoch nicht weiter ausgeführt.

1.1 Phänomenbereich: Was ist Deixis?

7

das Gegenüber und die Dinge in der Welt sinnlich erfahren werden. Im unmarkierten Fall bildet sie und damit die „ich-jetzt-hier“-Egozentrizität den subjektiven Ankerpunkt der im Wahrnehmungsraum unternommenen deiktischen Orientierungshandlungen. Für die Unhintergehbarkeit einer primären Egozentrizität spricht auch der empirische Befund, dass Kinder im Spracherwerb zunächst Probleme mit nicht-sprecherzentrierten Referenzrahmen haben (Weissenborn 1988).

1.1.3 Modi des Zeigens Bühler unterscheidet drei verschiedene Modi des Zeigens: erstens die demon stratio ad oculos et ad aures, d. h. das Zeigen an und auf sinnlich zugängliche Phänomene im umgebenden Wahrnehmungsraum, zweitens die Anaphorik, d. h. das Verweisen auf Elemente im Redekontext, und drittens die Deixis am Phantasma, d. h. das Zeigen auf Phänomene, die der sinnlichen Wahrnehmung nicht zugänglich sind und die daher vorgestellt werden müssen. Innerhalb der Deixis am Phantasma unterscheidet er drei Hauptfälle. Die ersten beiden Hauptfälle unterscheiden sich im Hinblick auf die Versetzungsrichtung und auf das versetzte Phänomen. Während ein Sprecher sich beim ersten Hauptfall etwas Abwesendes als in den unmittelbaren Wahrnehmungsraum hineinversetzt vorstellt und dieses Vorgestellte in der gegebenen Wahrnehmungsordnung lokalisiert, versetzt er sich beim zweiten Hauptfall umgekehrt selbst an einen vorgestellten Ort und zeigt vom neuen Standort seiner in den Vorstellungsraum verschobenen Origo auf etwas Vorgestelltes. Beim dritten Hauptfall wird der unmittelbar gegebene Wahrnehmungsraum durch die Vorstellung dergestalt erweitert, dass etwas nicht in Wahrnehmungsreichweite Befindliches an die Grenze zwischen Anwesendem und Abwesendem geholt wird (vgl. zur Deixis am Phantasma ausführlich Kapitel 7.4). Von den drei Bühlerschen Modi des Zeigens hat die Deixis am Phantasma sowohl theoretisch als auch empirisch bislang am wenigsten Aufmerksamkeit erfahren. Abgesehen von Untersuchungen zu schriftsprachlichen Texten (Ehlich 1979, 1982, 2007; Sitta 1991) liegen bislang kaum Studien zur Deixis am Phantasma in der face-to-face-Kommunikation vor (Stukenbrock 2012b, 2014b). Die erstmals von Fricke vorgelegten Arbeiten (2002, 2007) beziehen sich auf ein semi-experimentell erhobenes Datenkorpus von Wegbeschreibungen und tragen damit den Konstitutionsbedingungen natürlicher face-to-face-Interaktion nur begrenzt Rechnung. In einigen anderen Untersuchungen werden Phänomene des Zeigens am Abwesenden am Rande thematisiert (Ehmer 2011; Hanks 1990; Haviland 2000; Liddell 2000; Murphy 2005; Schmitt und Deppermann 2010).

8

1 Einleitung

Wesentlich intensiver wird hingegen die Frage diskutiert, ob die Anaphorik zum Gegenstandsbereich der Deixis gehört oder nicht. Während Bühler (1965 [1934]: 88 f.) und nach ihm Blühdorn (1993: 45; 1995: 125), Braunmüller (1977: 119–125), Ehrich (1992: 7, 9, 155 ff.), Fillmore (1972: 157) und Herbermann (1988: 75 ff.) die Anaphorik als speziellen Modus des Zeigens unter die Deixis subsumieren, unterscheiden Ehlich (1979, 1983), Lyons (1977: 636 ff.), Sennholz (1985: 236), Tschauder (1990: 733), Diewald (1991: 118 f.) und Sitta (1991: 61 f.) zwischen Deixis und (Ana-)Phorik. Dabei überschneiden sich die theoretischen Probleme zu den Modi des Zeigens mit Fragen, die im Zusammenhang mit der Einführung einer Text- und/oder Diskursdeixis als zusätzliche deiktische Dimensionen behandelt werden (vgl. zu den theoretischen Problemen ausführlich Consten 2004). Wird die Anaphorik aus der Deixis ausgeklammert und zugleich die Text- bzw. Diskursdeixis als neue Dimension eingeführt, ergibt sich die Notwendigkeit, die Textdeixis sowohl auf der Ebene der Dimensionen als auch auf der der Modi eindeutig gegen die (Text-)Phorik abzugrenzen. Ehlich (1985: 251) beispielsweise differenziert den deiktischen Verweisraum in vier verschiedene Räume aus: Sprechzeitraum, Rederaum, Textraum und Vorstellungsraum. Diese liegen theoretisch nicht auf der Ebene der deiktischen Dimensionen, sondern sind den Bühlerschen Zeigmodi vergleichbar. Zugleich trennt Ehlich strikt zwischen deiktischer Prozedur, die eine Neufokussierung auf einen noch nicht eingeführten Gegenstand bewirkt, und anaphorischer Prozedur, die zur Aufrechterhaltung einer bereits etablierten Fokussierung einlädt (Ehlich 1982: 328 f., 1983: 96). Damit gewinnt er ein Kriterium zur funktionalen Unterscheidung zwischen deiktischen und anaphorischen Prozessen in Text- wie in Rederäumen. Während sich Ehlichs Konzeptualisierung auf das deiktische Gesamtsystem bezieht, betreffen Diessels typologische Überlegungen ausschließlich das System der Demonstrativa. Diessel (1999: 95 f.) trifft im Rekurs auf Himmelmann (1996) eine klare Unterscheidung zwischen Anaphorik, Textdeixis und Diskursdeixis. Während ein anaphorisch gebrauchtes Demonstrativum koreferenziell mit einer vorhergehenden Nominalphrase ist (vgl. auch Lyons 1977: 660), beziehen sich diskursdeiktische Demonstrativa auf Propositionen bzw. inhaltliche Aspekte einer vorausgehenden Äußerung, deren Länge variabel ist. Textdeixis bezieht Diessel demgegenüber ausschließlich auf die materielle Seite der Sprache und subsumiert sie anders als die Anaphorik und die Diskursdeixis unter den exophorischen Gebrauch (Diessel 1999: 101). Auch Lyons (1977, 1983: 284) unterscheidet zwischen Deixis und Anaphorik, doch im Unterschied zu den meisten AutorInnen geht er von der Möglichkeit einer Überlagerung von deiktischem und anaphorischem Gebrauch aus. Dies illustriert er durch den konstruierten Beispielsatz: „I was born in London and I have lived

1.1 Phänomenbereich: Was ist Deixis?

9

here/there all my life.“ Darin beziehen sich die Lokaldeiktika „here“ und „there“ zum einen auf das Antezedenz „London“, zum anderen signalisieren sie kontrastiv, ob der Sprecher sich zum Äußerungszeitpunkt gleichfalls in London befindet oder nicht.

1.1.4 Relevanz der Zeigegeste Entscheidend für die Bühlersche Deixistheorie ist der zentrale Stellenwert, den er der Geste zuerkennt. Bühler analogisiert das Operieren deiktischer Ausdrücke im Zeigfeld der Sprache mit dem ausgestreckten Arm als Weg- oder Richtungszeichen und betont mehrfach, dass das Verständnis deiktischer Ausrücke notwendigerweise an „sinnliche Zeighilfen“ gebunden ist (Bühler 1965 [1934]: 93): Ich sage es noch einmal: es gibt kein lautliches Zeigzeichen, das der Geste oder eines der Geste äquivalenten sinnlichen Leitfadens oder schließlich einer an deren Stelle tretenden Orientierungskonvention entbehren könnte.

Bühler insistiert darauf, dass das Postulat der Notwendigkeit einer „sinnlichen Zeigehilfe“ von umfassender theoretischer Bedeutung und nicht etwa auf die demonstratio ad oculos beschränkt ist, auch wenn sie dort am ehesten einleuchtet (Bühler 1965 [1934]: 80 f.): Phänomenologisch aber gilt der Satz, daß der Zeigefinger, das natürliche Werkzeug der demonstratio ad oculos zwar ersetzt wird durch andere Zeighilfen; ersetzt schon in der Rede von präsenten Dingen. Doch kann die Hilfe, die er und seine Äquivalente leisten, niemals schlechterdings wegfallen und entbehrt werden; auch nicht in der Anaphora, dem merkwürdigsten und spezifisch sprachlichen Modus des Zeigens. Diese Einsicht ist der Angelpunkt unserer Lehre vom Zeigfeld der Sprache.

Die Schlüsselrolle, die die Zeigegeste in Bühlers Deixistheorie spielt, ist in der Forschung mit Ausnahme von Fricke (2007) übersehen oder in ihrer Bedeutung heruntergestuft worden.9 Zwar ist in der deutschsprachigen Deixis-Forschung der Bühler-Nachfolge in diesem Zusammenhang von der „Zeigegestenpflicht“ (Sennholz 1985: 230) bzw. der „Zeigegestennotwendigkeit“, „Zeigegestenfakulta-

9 Dazu stellt Fricke (2007: 24) treffend fest: „Spätere deixistheoretische Ansätze, auch wenn sie sich selbst als direkt in der Nachfolge Bühlers stehend betrachten, rücken die Gesten aus der zentralen Stellung, die Bühler ihnen einräumt, in die Peripherie. Dies hat weitreichende theoretische und empirische Konsequenzen.“ Wie die vorliegende Studie verfolgt Fricke das Ziel (2007: 24), „diese Marginalisierung rückgängig zu machen und den Gesten die ihnen zustehende zentrale Position innerhalb einer Deixistheorie zuzuweisen.“

10

1 Einleitung

tivität“ und „Zeigegestenunmöglichkeit“ (Harweg 1990: 295 ff.) die Rede. Als problematisch erweist sich dabei jedoch die mangelnde empirische Fundierung der Postulate. Das führt zu Behauptungen, die nicht nur der empirischen Grundlage entbehren, sondern – infolge dieser Empirievergessenheit – schlichtweg falsch sind. Um nur einige wenige Beispiele zu nennen, betrifft dies Blühdorns Behauptung (2002: 262), im Unterschied zum distalen Lokaladverb dort, das nur mittels einer Zeigegeste exophorisch, d. h. situationsdeiktisch verwendet werden könne, bedürfe das proximale Lokaladverb hier in der Situationsdeixis keiner Zeigegeste, da der Sprecher der Bezugspunkt sei. Demgegenüber belegen die vorliegenden Analysen die Vielfalt an Fällen, in denen hier zusammen mit einer Zeigegeste verwendet wird. Ein weiteres Beispiel ist Sennholz’ Annahme, die „Zeigegestenpflicht“ bestehe nur bei bestimmten Lokaldeiktika, obligatorisch sei sie bei lokalen Heterodeiktika, fakultativ hingegen bei lokalen Autodeiktika (Sennholz 1985: 66), während sie bei der Deixis am Phantasma keine Rolle spiele (Sennholz 1985: 230; vgl. zur Kritik daran auch Fricke 2007: 29 f., 249 ff.). Bereits McNeill et al. (1993) haben nachgewiesen, dass die von ihnen als abstract deixis bezeichnete Deixis am Phantasma mit dem Gebrauch von (Zeige-)Gesten einher geht. Diese Erkenntnis wird wiederum von Diessel (1999: 95) als starke Evidenz für seine Hypothese vom exophorischen Gebrauch von Demonstrativa am Phantasma verwendet: „The use of deictic gestures provides strong evidence for the hypothesis that the use of demonstratives ‚am Phantasma‘ is a subtype of the exophoric usage.“ Diese Position wird auch in der vorliegenden Untersuchung vertreten, die sich in Kapitel 7.4. ausführlich mit multimodalen Formaten zur Realisierung der Deixis am Phantasma beschäftigt. In der angelsächsischen Forschungstradition hat Fillmore das Konzept der „gestural use of deictical elements“ (Fillmore 1997; Levinson 2000) eingeführt, das für die vorliegende Untersuchung zentral ist und daher kurz erläutert werden soll. Fillmore unterscheidet zwischen gestischem, symbolischem und anaphorischem Gebrauch deiktischer Ausdrücke (Fillmore 1997: 62 f.): By the gestural use of a deictic expression I mean that use by which it can be properly interpreted only by somebody who is monitoring some physical aspect of the communication situation; by the symbolic use of a deictic expression I mean that use whose interpretation involves merely knowing certain aspects of the speech communication situation, whether this knowledge comes by current perception or not; and by anaphoric use of an expression I mean that use which can be correctly interpreted by knowing what other portion of the same discourse the expression is coreferential with.

Anaphorisch gebrauchte Deiktika beziehen sich auf bereits erwähnte Referenten und sind koreferenziell mit einem vorerwähnten sprachlichen Ausdruck wie in

1.1 Phänomenbereich: Was ist Deixis?

11

der Äußerung: „Die Frau stolperte über den Hund, der ihr in den Weg lief.“ Das von Fillmore angeführte Beispiel („I drove the car to the parking lot and left it there“) ist insofern problematisch, als „there“ sowohl anaphorisch als auch deiktisch zu verstehen ist, wie Lyons (1977) anhand eines ähnlichen Beispiels deutlich gemacht hat. Der Ausdruck „there“ ist zwar koreferenziell mit dem Ausdruck „parking lot“, auf den er sich anaphorisch rückbezieht, doch zugleich indiziert er deiktisch, dass sich der Sprecher zum Äußerungszeitpunkt nicht (mehr) auf dem Parkplatz befindet. Symbolisch gebrauchte Deiktika beziehen sich auf situative Aspekte des Sprechereignisses, die den Beteiligten qua Teilhabe an der Situation zugänglich sind, aber nicht perzeptorisch eigens hergestellt werden müssen. So reicht eine Kenntnis der allgemeinen raum-zeitlichen Koordinaten (Lokal- und Temporaldeixis) und der Teilnehmerrollen (Personaldeixis) zum Verständnis folgender Äußerung aus, wenn Sprecher und Adressat gerade eine Kirche besichtigen: „Diese Kirche gefällt mir besser als die, die wir gestern besucht haben“. Das von Fillmore angeführte Beispiel eines Telefonanrufers, der fragt: „Is Johnny there?“, ist insofern problematisch, als der Ausdruck „there“ anstelle der raumdeiktischen Interpretation ,in the place where you are‘ auch im Sinne von Ehrichs „Anwesenheits-da“ verstanden werden kann, das sie vom „Lokalisierungs-da“ unterscheidet (Ehrlich 1983: 215). Fillmores Begriff des Symbolischen in der oben zitierten Definition führt leicht zu Missverständnissen, da sie von dem gängigen zeichentheoretischen Verständnis abweicht, wonach Symbole solche Zeichen sind, die ihre Bedeutung anders als ikonische und indexikalische Zeichen qua Konvention erhalten. Gemäß dem Standardverständnis von Symbol würde der Begriff symbolic use of a deictic expression paradoxerweise gerade den nicht-deiktischen Gebrauch eines deiktischen Ausdrucks bedeuten – in den Worten Bühlers also das Operieren im Symbolfeld der Sprache. Doch genau dies meint Fillmore nicht: Unter symbolic use versteht er den äußerungssituationsabhängigen Gebrauch deiktischer Ausdrücke, bei dem die Beteiligten jedoch nicht permanent das emergierende (nicht-sprachliche) Geschehen beobachten müssen. Die für die vorliegende Untersuchung zentrale Kategorie ist die des gestischen Gebrauchs. Der gestische Gebrauch deiktischer Ausdrücke verlangt notwendigerweise den Einsatz körperlich-visueller Zeigegesten (Fillmore 1982: 45), einen gemeinsamen Wahrnehmungsraum, eine wechselseitige Wahrnehmung der Interaktionspartner sowie eine perzeptorische online-Analyse des Sprech ereignisses. Als Beispiel führt Fillmore folgenden Gebrauch des Ausdrucks „there“ an: „I want to put it there“. Um diese Äußerung zu verstehen, ist der Adressat auf eine Zeigegeste angewiesen, die seine visuelle Aufmerksamkeit auf den Raumausschnitt lenkt, den der Sprecher deiktisch herstellt.

12

1 Einleitung

Auch wenn in der Forschung immer wieder die Relevanz von Zeigegesten konzediert wird, sind linguistische Untersuchungen, die systematisch das Interagieren verbaler Deiktika und körperlicher Zeigehandlungen analysieren, bis heute ein Forschungsdesiderat. Die wenigen Ausnahmen, die in jüngster Zeit videobasierte, empirische Untersuchungen zur Deixis unternommen haben, bestätigen Bühlers Postulat und belegen den zentralen Stellenwert, der dem (redebegleitenden) Gebrauch körperlich-visueller Ressourcen zukommt (McNeill et al. 1993; Clark 2003; Eriksson 2009; Fricke 2002, 2007; Goodwin 2000a, 2003a; Haviland 2003; Hindmarsh und Heath 2000; Kendon und Versante 2003; Mondada 2002, 2012; Kita 2003a; Streeck 2002, 2009a; Stukenbrock 2008, 2009a, 2010, 2012a, 2014a, b). Anstöße zu einem Paradigmenwechsel (in der Deixisforschung) kommen in jüngerer Zeit insbesondere aus konversations- und interaktionsanalytischen Ansätzen, deren Interesse den Besonderheiten des Zusammenspiels verbaler und körperlicher Ausdrucksressourcen in der face-to-face-Kommunikation gilt. So geben neuere, konversations- und interaktionanalytische Untersuchungen durch die Berücksichtigung multimodaler Aspekte (Gestik, Blickorganisation etc.) der Deixisforschung entscheidende Impulse (Enfield 2001, 2003; Eriksson 2009; Goodwin 2000a, 2003a; Hausendorf 1995, 2003; Hindmarsh und Heath 2000; Mondada 2002, 2012; Streeck 2002, 2009a; Stukenbrock 2008, 2009a, 2010, 2012a, b). Die vorliegende Studie versteht sich als Beitrag zu einer durch das Forschungsparadigma der Multimodalität eröffneten theoretischen und empirischen Neuperspektivierung der Deixis in der face-to-face-Interaktion.10 Sie wählt einen praxeologischen Ansatz (Ericksson 2009; Hanks 1990, 1992; Streeck 2009a), der nicht nach invarianten Eigenschaften deiktischer Ausdrücke in Isolation fragt, sondern diese zusammen mit körperlich-visuellen Ausdrucksmitteln wie

10 In der Forschung (Helfrich und Wallbott 1980: 267; Müller 1998; Kühn 2002, 2005; Fricke 2007; Bohle 2007) wird verschiedentlich darauf hingewiesen, dass durch die Verwendung des Begriffs nonverbal die nicht der gesprochenen Sprache zuzurechnenden sichtbaren (und hörbaren) körperlichen Ausdrucksformen ausschließlich ex negativo bestimmt und dem Verbalen nachgeordnet würden. Daher setzen sich sowohl in der englisch-, als auch in der deutschsprachigen Literatur immer stärker Begriffe und Begriffskombinationen durch wie „gesture and other forms of bodily conduct“ (Heath 2002: 597; Heath und Luff 2007: 215), „visible conduct“ bzw. „bodily conduct“ bzw. „visible bodily actions“ (Heath und Luff 2007: 216); „embodied displays“ (Goodwin 2000a: 72); „bodily activities“ (Psathas 1990: 205); „embodied interaction“ und „visual features“ (Streeck und Knapp 1992: 20) sowie analog dazu im Deutschen „körperliche Kommunikation“ (Kühn 2002; 2005: 93); „multimodale Kommunikation“ (Schmitt 2005: 18); „interaktionsrelevante[] Formen körperlichen Ausdrucks“ (Schmitt 2005: 21); „visuell-körperliche Kommunikation“ (Kühn 2005: 93); „‚sichtbare‘ bzw. ‚körperliche Kommunikation‘“ (Bohle 2007: 13).

1.2 Gegenstandskonstitution

13

Gesten, Blick, Körperpositur, Orientierung und Bewegung im Raum als Ressourcen betrachtet, die InteraktionsteilnehmerInnen zur Verfügung stehen, um auf Gegenstände, Sachverhalte etc. zu referieren und diese in den Aufmerksamkeitsfokus der Beteiligten zu rücken (Streeck 2009a: 5): Practice-based (or praxeological) approaches to language, gesture, and social action […] locate meaning in the empirical, embodied practice of human actors within socioculturally constituted, social and material settings. Gestural understanding in this view is not the result of a shared grammar or lexicon, but of the coordinated embodied actions of people and their perspectives upon the material, real-world setting within which they act.

1.2 Gegenstandskonstitution Der praxeologische Ansatz und die theoretische, methodische und empirisch-deskriptive Fokussierung auf deiktische Phänomene, die in der face-to-face-Interaktion vorkommen und multimodal eingebettet sind, bedingen eine Gegenstandskonstitution, die sich radikal von bisherigen Bemühungen um systemlinguistische Kategorisierungen, grammatische und semantische Beschreibungen unterscheidet. Daher gilt es zu klären, welche deiktischen Phänomene in der vorliegenden Studie untersucht werden und was diese Arbeit nicht unternimmt. Ihr Ziel ist nicht, einen weiteren Beitrag zu den Systembedeutungen deiktischer Ausdrücke im Deutschen zu liefern. Dazu gibt es eine Vielzahl von Untersuchungen11, deren Ergebnisse allerdings aufgrund der traditionellen Empirieferne vieler Deixisstudien oft spekulativ bleiben. Im Folgenden werden die theoretischen Vorunterscheidungen getroffen, die erforderlich sind, um den Gegenstandsbereich einzugrenzen. Zunächst ist zwischen Deixis als Teil der Grammatik bzw. des Sprachsystems einerseits und dem deiktischen Gebrauch sprachlicher Ausdrücke andererseits zu unterscheiden. Grammatisch kann Deixis definiert werden als ein begrenztes Set an gebundenen und ungebundenen sprachlichen Ausdrucksformen, die zum Zeigfeld der Sprache gehören und daher nur im Rekurs auf die Origo (des Sprechers) Referenzherstellung ermöglichen. Unter Referenzherstellung wird die Identifizierung und/oder Lokalisierung von Entitäten (Objekten, Personen, Vorgängen/Ereignissen) und Räumen verstanden.

11 Vgl. die Sammlungen von Jarvella und Klein (1982); Rauh (1983); Weissenborn und Klein (1982); ferner Auer (1988); Blühdorn (1993, 2002); Diewald (1991); Ehlich (1979, 1982, 1983, 2007); Ehrich (1982, 1985, 1992); Ehrich und Vater (1988); Fricke (2007); Fuchs (1988); Harweg (1990); Klein (1978, 1990); Rauh (1978); Schmauks (1991); Sitta (1991).

14

1 Einleitung

Jakobson (1971 [1957]) hat in der Nachfolge Jespersens (1965 [1924]: 219) für diesen Teilbereich der Grammatik den Begriff shifter geprägt (vgl. auch das Konzept der referential indexicals bei Silverstein 1976). Laut Jakobson kann die Bedeutung eines shifters nicht ohne Bezug auf das Sprechereignis ermittelt werden (Jakobson 1971 [1957]: 131): „The general meaning of a shifter cannot be defined without a reference to the message“. Der Begriff des shifters ist allerdings insofern problematisch, als unklar bleibt, ob damit das weiter gefasste Konzept der Gebrauchsabhängigkeit oder das engere Konzept der Origorelativität gemeint ist.12 Situations- bzw. Gebrauchsabhängigkeit – bzw. in Bühlers Terminologie Abhängigkeit vom Umfeld (Bühler 1965 [1934]: 154) – ist nicht dasselbe wie Deixis, sondern umfasst weit mehr, wie das von Bühler angeführte Beispiel eines Kaffeehausgasts belegt, der zum Kellner „einen Braunen“ sagt und durch diese empraktische Nennung ausreichend Information für ein wechselseitiges Verstehen liefert (Bühler 1965 [1934]: 155). Situationsabhängigkeit gehört nicht zur Grammatik, sondern ist Teil der Pragmatik und damit eine strukturelle Eigenschaft von Sprache-in-Interaktion, die eine Fülle anderer Sprachelemente über die Deixis hinaus betrifft (Auer 1988: 268): „Situated language is defined much wider than deixis. It is a structural property of language-as-interaction, whereas deixis constitutes a structural field of language-as-a-system.” Das Gegenstück zur Situationsabhängigkeit stellt die Situationsentbundenheit bzw. das Displacement im Sinne Hocketts dar (Auer 1988; Hockett 1960). Mit der theoretischen Vorunterscheidung zwischen systematischen Komponenten und Gebrauchskomponenten (vgl. auch Hanks 1990; Lyons 1977; Fillmore 1997) folge ich dem Ansatz Diessels (1999), der in seiner typologischen Untersuchung zu den Demonstrativa klar trennt zwischen semantischen, morphologischen, syntaktischen und pragmatischen Merkmalen als formal enkodierten linguistischen Systemaspekten und dem konkreten Gebrauch der Demonstrativa (Diessel 1999: 52): Let me emphasize that these features are meant to characterize the information that is directly encoded in the morphological form of a demonstrative. A demonstrative may be used, for example, as an anaphoric pronoun referring to a human being, but if this is not reflected in its form it will not have the features ‘anaphoric’, ‘pronoun’, and ‘human’. Each feature is either expressed by a demonstrative root or by one of the morphemes with which it combines.

12 Vgl. dazu auch Blühdorn (1995: 113).

1.2 Gegenstandskonstitution

15

Die Systematisierung der pragmatischen Gebrauchsweisen, die Diessel in Anlehnung an Halliday und Hasan (1976) sowie Himmelmann (1996, 1997) für die Demonstrativa vornimmt, liefert Differenzierungskriterien, die auf die Deixis übertragbar sind: pragmatic uses

exophoric

endophoric

anaphoric

discourse deictic

recognitional

Diessel 1999: 6

Während exophorisch gebrauchte Demonstrativa die Aufmerksamkeit des Adressaten auf nicht-linguistische Phänomene (Objekte, Personen, Ereignisse, Räume) in der Äußerungssituation lenken, sind endophorisch gebrauchte Demonstrativa entweder koreferenziell mit einem sprachlichen Antezedens (anaphoric use), oder sie beziehen sich auf den Bedeutungsgehalt einer vorhergehenden Äußerung, oder sie werden als Mittel der Ersterwähnung eines als bekannt vorausgesetzten, aber zuvor nicht thematisierten Referenten verwendet (recognitional use). Diese letzte Gruppe wird von Himmelmann (1996: 61) in Anlehnung an Bühler als anamnestisch bezeichnet und korrespondiert mit der von Auer (1981b) beschriebenen indexikalitätsmarkierenden Funktion des Demonstrativartikels im Deutschen. Für die vorliegende Untersuchung zur Deixis in der face-to-face-Interaktion lässt sich festhalten, dass sie sich ausschließlich mit dem exophorischen Gebrauch deiktischer Ausdrücke beschäftigt.13 Innerhalb des exophorischen Gebrauchs unterscheide ich im Rekurs auf Fillmore (1997) zwischen symbolischem und gesti-

13 Der theoretische Stellenwert und die empirische Relevanz einer solchen Untersuchung kann sich auch auf ein Argument Diessels gründen, das dieser gegen Himmelmann (1996, 1997), aber in Übereinstimmung mit Bühler (1965 [1934]) und Lyons (1977) formuliert hat. Es besagt, dass der exophorische Gebrauch der Demonstrativa primär ist und einen Sonderstatus gegenüber den anderen drei Gebrauchstypen besitzt. Diessel gründet sein Postulat auf drei Nachweise: erstens, dass exophorische Demonstrativa im Spracherwerb primär auftreten; zweitens, dass sie morphologisch und distributionell unmarkiert sind; und drittens, dass sie im Grammatikalisierungsprozess niemals unmittelbar als grammatische Marker reanalysiert werden (Diessel 1999: 110), sondern als Zwischenstufe eine der drei endophorischen Gebrauchsformen durchlaufen (ebd.: 112).

16

1 Einleitung

schem Gebrauch deiktischer Ausdrücke (s. o. Abschnitt 1.1.4), so dass das Schema von Diessel wie folgt variiert und erweitert werden kann: pragmatische Funktionen

exophorisch

gestisch (Fillmore 1997)

symbolisch

endophorisch

anaphorisch

diskursdeiktisch

indexikalisch (Auer 1981b)

Gegenüber typologischen Klassifikationen, die um die Ausschließlichkeit ihrer Kategorien bemüht sind, gilt es in Erinnerung zu rufen, dass auch anaphorische Ausdrücke gestisch verwendet werden können und dass sich anaphorische und deiktische Funktionen gelegentlich überlagern (vgl. Levinson 2000; Lyons 1977; sowie die vorliegende Untersuchung). Daher werden die im Schema abstrakt definierten Kategorien nicht als ausschließlich aufgefasst. Stattdessen liefert das Schema einen theoretisch wohl fundierten Ausgangspunkt zur heuristischen Eingrenzung des Gegenstandsbereichs. Die vorliegende Studie richtet ihren Fokus auf denjenigen Teilbereich der Deixis, den Fillmore (1997: 62 f.) als gestischen Gebrauch vom symbolischen und vom anaphorischen Gebrauch deiktischer Ausdrücke unterscheidet. Untersuchungsgegenstand sind die deiktischen Praktiken, derer sich Interaktionsbeteiligte in der face-to-face-Kommunikation bedienen, um auf Phänomene zu referieren und diese in den gemeinsamen Aufmerksamkeitsfokus zu rücken. Diese sind im unmittelbaren Wahrnehmungsraum sinnlich zugänglich (demonstratio ad oculos), oder sie werden in einem deiktisch konstruierten Vorstellungsraum imaginiert (Deixis am Phantasma). Damit sind die beiden Modi des Zeigens genannt, die in dieser Untersuchung behandelt werden. Entgegen der gelegentlich in der Forschung vertretenen Annahme, dass Zeigegesten ausschließlich bei der demonstratio ad oculos erforderlich seien, weist die Arbeit nach, dass auch bei der Deixis am Phantasma Zeigegesten und andere körperlich-visuelle Ressourcen nicht nur regelmäßig gebraucht werden, sondern unter Umständen für das Verständnis zwingend erforderlich sein können (vgl. auch Fricke 2007). Entscheidend für die von mir vertretene Auffassung ist, dass Deiktika und Zeigegesten nicht koextensiv sind, sondern zwei verschiedene Bereiche konstituieren, die jeweils auch unabhängig voneinander operieren. So kann mit dem proximalen Lokaldeiktikon hier, dem Demonstrativpronomen dieses oder dem

1.2 Gegenstandskonstitution

17

Personaldeiktikon du je nach situativen Gebrauchsbedingungen auch ohne Zeigegeste Referenz hergestellt werden. Dies entspricht Fillmores (1997) symbolischem Gebrauch. Umgekehrt können Zeigegesten auch ohne einen begleitenden deiktischen Ausdruck Phänomene in den perzeptorischen Aufmerksamkeitsfokus rücken, lokalisieren und identifizieren. Allerdings stellen die Deiktika in der Sprache und die Zeigegesten im körperlich-visuellen Ausdrucksrepertoire des Menschen privilegierte Partner dar, deren Überlappungsbereich hier untersucht werden soll. Im Gegensatz zu Fricke, für die das Verbaldeiktikon „aufgrund einer elliptischen Auslassung auch nur implizit gegeben sein [kann]“ (Fricke 2007: 4) und die daher zu dem problematischen Konzept der Hybriddeixis gelangt (vgl. zur Kritik daran Maaß 2008), weise ich Zeigegesten nicht den Status von Deiktika zu. Die von mir verwendete Kategorie der Deiktika ist eine grammatische Kategorie. Folglich fallen Zeigegesten, die nicht im Verbund mit einem deiktischen Ausdruck auftreten, aus dem Gegenstandsbereich meiner Untersuchung heraus. Theoretischen und empirischen Ausgangspunkt bildet die demonstratio ad oculos. Die untersuchten deiktischen Ausdrücke werden systematisch mit (Zeige-) Gesten verbunden und haben die Funktion, einen gemeinsamen perzeptorischen Aufmerksamkeitsfokus auf ein Phänomen im Wahrnehmungsraum (demonstratio ad oculos) herzustellen. Sie überführen Wahrnehmung in gemeinsame und als gemeinsam gewusste Wahrnehmung (vgl. Hausendorf 2003; Stukenbrock 2009a). An erster Stelle betrifft dies die Demonstrativa (Himmelmann 1996, 1997; Diessel 1999, 2006), zu denen Diessel die Demonstrativpronomina, die De monstrativartikel und die Demonstrativadverbien (von mir als Lokaldeiktika bezeichnet) zählt. Demonstrativa zeichnen sich funktional dadurch aus, dass sie joint attention (Diessel 2006) herstellen, was einer der Gründe für ihren sprachtypologischen Sonderstatus ist. Die Demonstrativpronomina und Demonstrativ artikel dieser/diese/dieses und der/die/das können sowohl in adnominalen als auch in pronominalen Syntagmen in Verbindung mit lokaldeiktischen Adverbien hier und da auftreten (z. B.: der x hier; das y da sowie das hier, das da). Das in der gesprochenen Sprache selten belegte Pronomen jener/jene/jenes tritt hingegen völlig in den Hintergrund, da es für einen gestischen Gebrauch in meinem Datenkorpus keinen Beleg gibt. Zweitens sind die Lokaldeiktika zu nennen. Die Lokaldeixis umfasst naturgemäß mehr als die von Diessel (1999) unter die Kategorie der Demonstrativadverbien subsumierten Ausdrücke hier, da und dort. Diese werden in der vorliegenden Untersuchung als Lokaladverbien bezeichnet und zusammen mit anderen einfachen und zusammengesetzten Ausdrücken wie Adverbien, Pronominaladverbien und bestimmte Präpositionen (dahinten, dahin, da unten, drüben, hier hinten, hierher, hinter, etc.) als Lokaldeiktika aufgefasst.

18

1 Einleitung

Gesonderte Bereiche bilden drittens die Personal- und viertens die Modaldeixis. Zu den personaldeiktisch gebrauchten Pronomina, den Personal- und Possessivpronomina, ist anzumerken, dass die Pronomina der ersten und zweiten Person, da sie Teilnehmerrollen enkodieren, einen anderen Status haben als Pronomina der dritten Person, die nicht auf Teilnehmerrollen referieren (Benveniste 1974) und im Normalfall anaphorisch gebraucht werden (Auer 1988; Ehlich 1982; Diessel 1999). Wie zu sehen sein wird, weisen multimodale deiktische Zeigehandlungen, deren Referenzobjekte kopräsente Personen sind, formatspezifische Besonderheiten auf, in denen sich die von Benveniste (1974) konstatierte Binnendifferenzierung zwischen erster, zweiter und dritter Person manifestiert. Die Modaldeixis spielt in Bühlers Theorie keine Rolle. Formal wird die Modaldeixis im Deutschen durch den Ausdruck so repräsentiert. Als deiktisch- gestisch gebrauchtes Modaldeiktikon wird es durch einen Akzent markiert und von anderen so-Formen bzw. Konstruktionen (Auer 2006) unterschieden. Aus multimodaler Perspektive weist die Modaldeixis gegenüber den anderen Dimensionen der Deixis die Besonderheit auf, dass sie gestentypologisch nicht mit einer Zeigegeste, sondern mit einer ikonischen bzw. darstellenden Geste, mit körper lichen Demonstrationen und umfassenden körperlichen Performances einhergeht (Stukenbrock 2010). Die Temporaldeixis ist, wie der ganze Bereich der Tempus- und der Flexionsmorphologie, nicht systematisch mit Gesten verbunden und wird deshalb hier nicht untersucht. Die Fälle, in denen Temporaladverbien wie insbesondere jetzt mit einer Zeigegeste vorkommen, stellen seltene Spezialfälle dar und sind nicht berücksichtigt worden. Dasselbe gilt für die Sozialdeixis, deren Relevanz für das Deutsche umstritten ist (vgl. Abschnitt 1.1.2), und die Diskursdeixis, die unter den endophorischen Gebrauch fällt und damit ohnehin ausscheidet.

2 Begriffliche Grundlagen Im Folgenden werden die begrifflichen Grundlagen für die in der vorliegenden Studie untersuchte Zeigehandlung gelegt. Dazu werde ich zunächst die Anatomie bzw. den inneren Strukturaufbau von Gesten betrachten, wie er in der bisherigen Forschung konzeptualisiert wird. Die verallgemeinernde schematische Übersicht über den Gestenaufbau wird an einem Beispiel konkretisiert, in dem die gestentypologisch abstrakten Feststellungen auf den Typus der Zeigegeste zugeschnitten sind. An dem Beispiel werden zugleich zwei weitere Problemkomplexe sichtbar, die zum einen Aspekte multimodaler Analyse- und Darstellungsverfahren und zum anderen Fragen der Temporalität betreffen, die sich unter multimodalen Gesichtspunkten neu und anders stellen. Abschließend werden die diskutierten Aspekte im Hinblick auf die Konzeptualisierung von verbalen und kinesischen Ressourcen in der deiktischen Zeigehandlung zusammengeführt.

2.1 Zum Gestenbegriff Historische Überblicke (Kendon 2004: 17 ff.; McNeill 2005: 13 ff.; Müller 1998: 25 ff.) verdeutlichen, dass sich die Begriffe Geste, Gestik und gelegentlich auch Gestikulation auf ausgesprochen heterogene und vielfältige Phänomene beziehen, die in der Geschichte der Gestenforschung zur Konstituierung ganz unterschiedlicher Gegenstandsbereiche geführt haben. Die Beschäftigung mit Gesten reicht in die Antike bis zu Quintilian (100 n. Chr.) zurück. Seitdem haben sich Phasen gesteigerten Interesses an Gesten mit Phasen der Gestenvergessenheit abgewechselt (vgl. die detaillierten Ausführungen bei Kendon 2004). Der Beginn einer nach heutigem Verständnis wissenschaftlichen Erforschung von Gesten wird in den Studien Efrons (1941) und der in Efrons Nachfolge entstandenen Gestentypologie von Ekman und Friesen (1969) gesehen. Ihre Unterscheidung zwischen fünf Typen nonverbalen Verhaltens – namentlich illustrators, adaptors, emblems, affect displays und regulators – liegt den meisten späteren Typologien zugrunde. Unter diesen stellt die von Kendon (1980) aufgestellte, von NcNeill als Kendon’s continuum bezeichnete, z. T. erweiterte Klassifikation (McNeill 1992, 2000, 2005; Kendon 2004) die bis heute maßgebliche Gestentypologie dar. Im Allgemeinen werden Gesten als kommunikative Bewegungen verstanden, die mit den Armen und Händen – zusammengefasst also mit den Vordergliedmaßen – ausgeführt werden. Müller (1998: 30) verwendet den Ausdruck Geste „zur Bezeichnung der kommunikativen Bewegungen der Arme und Hände“. Ganz ähnlich definiert Goldin-Meadow (2003: 4) gesture als „the

20

2 Begriffliche Grundlagen

hand movements that co-occur with speech“. Auch Streeck konzentriert sich auf kommunikative Bewegungen der Hände, die er als „partly culture-specific, partly universal practices of using the hands to produce situated understand ings“ begreift (Streeck 2009a: 5). Kendon verwendet den Ausdruck gesture als „label for actions that have the features of manifest deliberate expressiveness“ (Kendon 2004: 15). Auch wenn er sich in seiner Studie wie die meisten Autor Innen ausschließlich mit „forelimb gesturing“ (Kendon 2004: 111) beschäftigt, verzichtet Kendon in seiner Definition von Gesten als „visible bodily action“ (Kendon 2004: 7) darauf, den Begriff auf manuelle Bewegungen einzuschränken. McNeill, der den Begriff gesticulation verwendet und damit die redebegleitenden Gesten kategorial von Emblemen, Pantomime und Gebärdensprache trennt, weist in seiner Definition darauf hin, dass Hände und Arme die entscheidenden, aber nicht die einzigen Artikulatoren sind (McNeill 2005: 5). Haviland (2004: 206) nennt neben Fingern, Händen und Armen eine ganze Reihe weiterer Körperteile und -regionen (Gesicht, Lippen, Kinn, Blick, Kopf, Körperpositur, Torso- und Schulterbewegungen, Beine), die als gestische Ausdrucksressourcen fungieren können. Bezüglich der für die vorliegende Studie relevanten Gruppe von gestischen Aktivitäten, den Zeigehandlungen, liegen entsprechende Untersuchungen vor, die den Gebrauch anderer Körperteile zum Zeigen belegen (Enfield 2001; de Jorio 2000; Sherzer 1973). Ich schließe mich dem von Kendon und Anderen vertretenen Gestenbegriff und der darauf gründenden Gestentypologie an (Kendon 2004; McNeill 1992, 2000, 2005). In dieser Klassifikation ordnen sich kinesische Kommunikationsformen gemäß ihrer jeweiligen Beziehung zur verbalen Kommunikation auf einem Kontinuum an, das von der obligatorischen Anwesenheit des Verbalen, als Gestikulation bezeichneten Formen über die optionale Anwesenheit des Verbalen bei Emblemen bis hin zur obligatorischen Abwesenheit des Verbalen bei der Pantomime und der Gebärdensprache reicht. Abbildung 1 veranschaulicht dieses Kontinuum (vgl. McNeill 1992, 2000, 2005): Abbildung 1 Typ

Gestikulation

Embleme

Beziehung zur Sprache

obligatorisch anwesend

optional

Pantomime

Gebärdensprache

obligatorisch abwesend

Dieses ursprünglich eindimensionale Kontinuum wurde von McNeill (2000) um weitere Kontinua ergänzt. Demnach gilt es zweitens zu unterscheiden, in welchem Maß die verschiedenen kinesischen Ausdrucksformen linguistische

2.1 Zum Gestenbegriff

21

Eigenschaften besitzen (Abb. 2), und drittens den Grad ihrer Konventionalisiertheit zu bestimmen (Abb. 3): Abbildung 2 Typ linguistische Eigenschaften

Gestikulation

Pantomine

abwesend

Embleme

Gebärdensprache

einige anwesend

vollständig anwesend

Abbildung 3 Typ Konventionalisiertheit

Gestikulation

Pantomine

nicht konventionalisiert

Embleme

Gebärdensprache

z.T. konventionalisiert

vollständig konventionalisiert

Zeigegesten fallen unter den als Gestikulation bezeichneten Gestentyp und bilden neben den ikonischen oder darstellenden Gesten, den metaphorischen Gesten, den pragmatischen Gesten und den Taktstockgesten (beats/batons) eine der vier Subtypen redebegleitender Gesten: Abbildung 4

Gestikulation deiktische / Zeigegesten

ikonische / darstellende Gesten

metaphorische Gesten

TaktstockGesten

Deiktische Gesten bzw. Zeigegesten zeichnen sich dadurch aus, dass eine Gliedmaße – prototypischerweise der Zeigefinger (Kendon 2004; Kita 2003a, 2003b; McNeill 1992, 2000), aber auch andere Körperglieder und körperexterne Gegenstände – ausgestreckt und als vektorbildendes Instrument zur visuellen Aufmerksamkeitsteuerung auf sichtbare oder vorgestellte Räume und Entitäten verwendet wird. Ikonische Gesten verbildlichen Form-, Gestalt- bzw. Bewegungsaspekte konkreter Objekte, Handlungen oder Ereignisse (vgl. zu weiteren Subklassifikationen Müller 1998; Streeck 2008, 2009a). Metaphorische Gesten teilen mit den

22

2 Begriffliche Grundlagen

ikonischen Gesten die verbildlichenden Qualitäten. Allerdings werden nicht konkrete Objekte, sondern abstrakte Konzepte repräsentiert, indem auf eine bildliche Metapher wie z. B. die Form eines Gefäßes oder Containers zur Visualisierung von etwas Abstraktem (z. B. einem gedanklichen Entwurf) zurückgegriffen wird. Beats (Levy/McNeill 1992; McNeill 1992) oder batons (Efron 1941) sind rhythmische Auf-und-Ab-Bewegungen, die wie ein Taktstock (daher im Deutschen auch Taktstockgesten, vgl. Müller 1998: 103) die Rede strukturieren und prosodisch mit den Akzentsilben korrelieren (Loehr 2007). Entscheidend ist, dass die gestentypologisch voneinander unterschiedenen Gestentypen keine diskreten, sich wechselseitig ausschließenden Kategorien bilden, sondern unscharfe Grenzen haben, ineinander übergehen und sich überlagern können. Darauf weist Kendon nachdrücklich hin (2004: 104): „the difficulties (and dangers) inherent in a typological approach perhaps can be overcome by an approach which does not try to set up gesture types as mutually exclusive categories but which recognizes, instead, a series of dimensions in terms of which gestures can be compared.“ Als Arbeitsgrundlage kann der breite Konsens über die unterschiedlichen Arten des Gestengebrauchs dienen, wobei der Versuch einer diskreten ausschließlichen Kategorienbildung wenig sinnvoll scheint (Kendon 2004: 107): Given the nature of gesture as a form of human expression, we cannot establish permanent categories that represent essentially different forms of expressive behaviour. That is, we have to think of the different gesture typologies that have been proposed as provisional working instruments which may be useful within a certain research perspective or interest but are not at all to be supposed universal or general schemes that show, in a fashion that is independent of any particular observer, or independent of any particular circumstance of interaction or occasion of us, how the activities of gesture are organized.

2.2 Zur Anatomie von Gesten GESTENEINHEIT Eine gestische Einheit oder Gesteneinheit (gesture unit nach Kendon 2004: 111) wird durch die Zeitspanne zwischen dem Verlassen der Ruheposition (position of rest or relaxation bei Kendon 2004: 111; home position bei Sacks/Schegloff 2002; rest position bei McNeill 1992: 83) und der Wiederkehr in die Ruheposition durch das ausführende Körperglied konstituiert. Sie beginnt in dem Augenblick, in dem das Körperglied bzw. der kinesische Artikulator die Ruheposition verlässt und endet, wenn die Ruheposition wieder erreicht wird. Dabei müssen die ursprüngliche und die nachher eingenommene Ruheposition nicht identisch sein.

2.2 Zur Anatomie von Gesten

23

GESTENPHRASE Gestenphrasen (gesture phrases nach Kendon 2004: 108) treten innerhalb einer Gesteneinheit auf. Eine Gesteneinheit kann also eine oder mehrere Gestenphrasen enthalten. Im Unterschied zur Gesteneinheit, die den Gesamtbewegungsablauf von einer Ruheposition zur nächsten umfasst, stellen Gestenphrasen kinesische Abläufe innerhalb dieser Einheit dar. In einer Gestenphrase erreicht das ausführende Körperglied (der kinesische Artikulator) den Punkt der größten Entfernung von der Ruheposition. In der Bewegung auf diesen Gipfel-, Höhe- oder Umkehrpunkt (apex) und bei dessen Durchführung (stroke) besitzen die Formkomponenten des ausführenden Körperglieds – meist der Hand – die größte Deutlichkeit. So nimmt z. B. die gestikulierende Hand einer Sprecherin in diesem Moment eine Formkonfiguration an, deren gestalthafte Merkmale dem Adressaten die Zuschreibung kinesischer Aktivitäten wie Zeigen, Modellieren, einen Baton ausführen etc. gestatten.

BEWEGUNGS-/GESTENPHASEN Eine Gestenphrase (gesture phrase, Kendon 2004: 111 f.; McNeill 1992: 83) besteht ihrerseits aus mehreren gestischen Bewegungsphasen, die jedoch nicht alle stets realisiert werden müssen. Während Kendon lediglich drei Phasen (preparation – stroke – retraction) innerhalb einer Phrase unterscheidet, greift McNeill auf zwei weitere, von Kita (1993) eingeführte Phasen zurück. Demnach ergeben sich als mögliche Gestenphasen die Preparations- oder Vorbereitungsphase (preparation), die Durchführungs- oder Schlagphase (stroke), dem ein Vorhalt (pre-stroke hold) vorauslaufen und/oder ein Nachhalt (post-stroke hold) folgen kann (McNeill 2005: 31), sowie die Rückzugs- oder Retraktionsphase (retraction). Die Durchführungsphase (stroke) und der fakultative Nachhalt (post-stroke hold) werden von Kendon als Nukleus (nucleus) der Gestenphrase zusammengefasst. Der Nukleus weist die größte gestalthafte Präzision auf und konstituiert funktional die Bedeutung der Gestenphrase. Der Nukleus wird durch die vorausgehende, aus der Ruheposition herausführende Vorbereitungs- bzw. Preparationsphase und die anschließende Rückzugs- bzw. Retraktionsphase, in der das Körperglied in die Ruheposition zurückkehrt, gerahmt. Konstitutiv für eine Gestenphrase sind die Vorbereitungs(preparation) und die Durchführungsphase (stroke). Nach der Durchführung, d. h. mit Beendigung der Gestenphrase, kehrt das Körperglied nicht notwendigerweise in die Ruheposition zurück, sondern kann in eine weitere Gestenphrase mit einem neuen Nukleus übergehen. Mit der Rückkehr in die Ruheposition kommt die gesamte Gesteneinheit, bestehend aus einer oder mehreren Gestenphrasen, zum Abschluss. Schematisch lässt sich der Aufbau der Gesteneinheit nach Kendon, McNeill u. a. wie folgt zusammenfassen:

24

2 Begriffliche Grundlagen

Gesteneinheit Phrase 1 Vorbereitung (preparation)

Vorhalt (pre-stroke hold)

Durchführung (stroke)

Phrase 2 Nachhalt (poststroke hold)

Phrase n

Rückzug (retraction)

Nukleus (nucleus)

Die Terminologie zu den gestischen Einheiten und Bewegungsphasen wird im Folgenden anhand eines Beispiels illustriert, das dem Datenkorpus der vorliegenden Studie entnommen ist und den Gestentypus der Zeigegeste repräsentiert. Der ausgewählte Ausschnitt stammt aus der Videoaufzeichnung einer Stadtführung. Der Stadtführer (SF) steht mit seiner Gruppe an einer Straßenecke auf dem Bürgersteig und macht die Gruppenmitglieder im weiteren Verlauf auf Besonderheiten der gegenüberliegenden Bauwerke aufmerksam. Der im Transkript fettgedruckte und unterstrichene Teil, der durch zwei eckige Klammern begrenzt wird, markiert die gesamte Gesteneinheit vom Verlassen der Ruheposition bis zur Rückkehr in eine neue Ruheposition: Ausschnitt 1a: „Gestaltungsvorstellungen“ (StFLing2_00:18:00)

1 2 3

SF:

kommen wir nochmal kUrz eben zu diesen (-) geSTALtungsvorstellun[gen, wir stEhen HIER, der Eon; vor] einem (.)

Zunächst fällt auf, dass die Alignierung von Toneinheiten und Gesteneinheiten nach gängigen Transkriptionskonventionen, in denen Intonationsphrasen oder Turnkonstruktionseinheiten für Einheiten bildende Zeilenumbrüche zugrunde gelegt werden, problematisch ist. Der Onset der Geste, also der Moment, in dem die Hand die Ruheposition verlässt und die Vorbereitungsphase einleitet, fällt zeitlich mit der letzten Silbe der ersten Turnkonstruktionseinheit zusammen (Z. 1: -gen). Die Geste erstreckt sich über die zweite Turnkonstruktionseinheit (Z. 2). Für das Ende der Retraktionsphase lässt sich beobachten, dass sie zeitlich mit der ersten Silbe der dritten Turnkonstruktionseinheit (Z. 3: vor) koinzidiert. Das Ende der ersten und der Beginn der letzten Äußerungseinheit müssen also mit in die alignierte Darstellung von Sprache und Gestik aufgenommen werden. Die Visualisierung der Kotemporalität von Sprache und Gestik verlangt folglich eine

2.2 Zur Anatomie von Gesten

25

andere Zeilengestaltung als dies für Verbaltranskripte üblich ist (vgl. dazu ausführlich Stukenbrock 2009b). Im nachfolgenden Transkript (Ausschnitt 1b) sind die üblichen Zeilenumbrüche nach Intonationsphrasen aufgehoben, um die Alignierung der für die Gestenphasen gewählten Transkriptionssymbole mit der Transkription der emergierenden Verbaläußerung zu ermöglichen. Das an die Sprechersigle (SF) angefügte „v“ bezeichnet die Transkriptzeile für die Verbaläußerung. Demgegenüber markiert das hinzugefügte „g“ die Transkriptzeile, auf der eine symbolische Darstellung des gestischen Verhaltens unternommen wird. Dabei wird die Tilde ~~~ für die Vorbereitungsphase (preparation) verwendet, der Stern *** für die Durchführungsphase (stroke) und das Semikolon ;;; für die Rückzugsphase (retraction): Ausschnitt 1b: Gestaltungsvorstellungen (StFLing2_00:18:00)

SF-v:geSTALtungsvorstellungen, wir stEhen HIER, vor einem SF-g:

|~~~~~~******;;;;;;;;;| | | [

Prep.

| Durchf. | Retraktion

Gestenphrase Gesteneinheit

|

| ]

Wie im Transkriptausschnitt 1b zu sehen ist, ermöglicht die symbolische Transkription eine interlineare Abbildung unterschiedlicher Modalitäten – hier von Verbaläußerung und Gestenverlauf – in ihrer zeitlichen Relation zueinander. Vorbereitungsphase, Durchführung (Gipfelpunkt) und Retraktionsphase bilden zusammen die Gestenphrase, die im vorliegenden Fall, da keine weiteren Gestenphrasen folgen, zugleich die gesamte Gesteneinheit konstituiert. Eine weitere Möglichkeit, das im Videodatum beobachtbare körperliche Verhalten im Transkript abzubilden, stellen Standbilder dar. Diese können entweder dem konventionellen Verbaltranskript hinzugefügt oder zusätzlich mit der symbolischen Transkription verbunden werden. Transkriptausschnitt 1c veranschaulicht die Kombination einer interlinearen symbolischen Transkription mit punktuell hinzugefügten Standbildern (vgl. zu den Kriterien zur Erstellung von Standbildern für multimodale Analysen Stukenbrock 2009b, 2013). Zur Anonymisierung der aufgenommenen Personen werden die aus den Videoaufnahmen extrahierten Standbilder in einigen Transkripten durch Zeichnungen ersetzt.14

14 Für die aufwändige Transformation von Standbildern in originalgetreue Zeichnungen danke ich Ina Hörmeyer sehr.

G:

V:

Abb. 2

Abb. 3

Abb. 4

|~~~~~~~~******;;;;;;;;;|

geSTALtungsvorstellun[gen, wir stEhen HIER, vor] einem

Abb. 1

Ausschnitt 1c: Gestaltungsvorstellungen (StFLing2_00:18:00) Abb. 5

Abb. 6

26 2 Begriffliche Grundlagen

2.2 Zur Anatomie von Gesten

27

In der Ruheposition (Abb. 1) befinden sich die Hände des Sprechers ineinander gefaltet auf dessen Bauchhöhe. Die erste, aus der Ruheposition herausführende Phase ist die Vorbereitungsphase (Abb. 2). Sie beginnt mit der letzten Silbe des Nomens geSTALtungsvorstellungen, erstreckt sich über den Beginn (wir) der nächsten Turnkonstruktionseinheit (Abb. 3) und wird gefolgt von der Durchführungsphase (stroke) (Abb. 4), die mit der Artikulation des Verbs (stEhen) zusammenfällt. An die Durchführung des Gestengipfelpunkts schließen sich optional der Nachhalt (post-stroke hold, Kendon 2004: 112; Kita 1993) und die Retraktionsphase an. In der ausgewählten Sequenz liegt kein Nachhalt vor. Stattdessen bewegt sich die Hand nach dem Gestengipfelpunkt wieder zurück, durchläuft die Retraktionsphase (Abb. 5) und endet wieder in der Ruheposition vor dem Körper des Sprechers (Abb. 6). Dabei nehmen die Hände in der neuen Ruheposition eine andere Konfiguration ein als in der Ausgangsposition (vgl. Abb. 1 gegenüber Abb. 6). Anhand der Standbildsequenz ist zu erkennen, dass die Durchführungsphase (Abb. 4) diejenige Phase darstellt, in der die Bewegung den Gipfelpunkt erreicht und Handform und Handposition am klarsten definiert sind. Im vorliegenden Fall handelt es sich bei der von der Hand eingenommenen Gestalt um die sog. open hand palm vertical-Form (Kendon 2004), d. h. das Zeigen mit offener, vertikal orientierter Handfläche (vgl. dazu ausführlich Kapitel 5). Diese Form wird verwendet, wenn Zeigende ihre Adressaten zu einer eingehenderen Betrachtung des indizierten Referenzobjekts einladen. Durch die räumliche Orientierung während des Gestengipfelpunkts bildet die vertikal nach oben gerichtete Handfläche einen Vektor in Richtung des Zeigeziels. An dem Beispiel werden entscheidende Aspekte des temporalen Zusammenspiels zwischen Geste und sprachlicher Äußerung deutlich, auf die kurz hingewiesen werden soll, bevor im nächsten Abschnitt einige allgemeine Bemerkungen zu den Temporalitätsstrukturen deiktischer Zeigehandlungen folgen. In der Beispielsequenz fällt auf, dass der Gestengipfelpunkt der Zeigegeste bereits kurz vor der Artikulation der zugehörigen Verbalkomponente, des akzentuierten Lokaldeiktikons HIER, ausgeführt wird. In dem Augenblick, in dem der Sprecher das Deiktikon artikuliert, befindet sich die Geste bereits in der Retraktionsphase. Für deiktische Zeigehandlungen gilt, dass der Gipfelpunkt der Geste nicht immer exakt mit der Artikulation des korrespondierenden deiktischen Ausdrucks bzw. mit dessen Akzentsilbe zusammenfällt. Diese Feststellung trifft auch auf die Temporalitätsstrukturen sprachlicher Äußerungen und Gestenphasen bei der Modaldeixis zu. Die durch das Modaldeiktikon so relevant gesetzte kinesische Aktivität erfolgt nicht zwangsläufig simultan zur Artikulation des Deiktikons, sondern kann auch deutlich später oder unter Umständen vorher vollzogen werden. Je nach der Aufmerksamkeitsorientierung des Adressaten, der in Gang

28

2 Begriffliche Grundlagen

befindlichen Aktivität und einer Reihe weiterer, situativ bedingter Faktoren herrschen unterschiedliche Projektionsverhältnisse zwischen verbalen und körperlich-visuellen Ressourcen. Gesten besitzen nicht nur eine interne Struktur, die im vorliegenden Abschnitt unter dem Stichwort der Anatomie behandelt wurde, sondern sie manifestieren sich auch in der Zeit. Sie besitzen eine eigene zeitliche Struktur und treten zueinander und zu anderen Ausdrucksressourcen in funktional bedeutsame temporale Beziehungen. Zu den begrifflichen Grundlagen gehört folglich auch eine Auseinandersetzung mit Temporalitätsaspekten aus multimodaler Perspektive.

2.3 T emporalität – Kotemporalität – Simultaneität – Sequenzialität Neben dem Begriff der Temporalität tauchen in der Linguistik, in kognitionswissenschaftlichen Studien, in der Gestenforschung sowie in konversationsanalytisch und interaktionslinguistisch orientierten Untersuchungen zur Multimodalität eine Reihe von Begriffen auf, die sich auf unterschiedliche Aspekte von Zeitlichkeit in der Kommunikation beziehen (vgl. z. B. die Vielfalt der Beiträge in Hausendorf 2007). Unreflektiert bleibt dabei jedoch häufig die erforderliche theoretische Unterscheidung zwischen zufällig zustande kommenden, kontingenten zeitlichen Verhältnissen und zeitlich konstituierten Relationen, die nicht zufällig sind und denen eine Funktion zugeschrieben werden kann. Eine Ursache für die terminologisch unklare Fülle unterschiedlicher Begriffe ist die Tatsache, dass die Bezeichnungen und ihre Ableitungen teils aus dem Lateinischen, teils aus dem Griechischen stammen und daher häufig (teil-) synonym zu den entsprechenden deutschen Begriffen, aber auch in unscharfer Abgrenzung zueinander verwendet werden. Dies gilt beispielsweise für synchron (griech.), simultan (lat.) und gleichzeitig (dt.). Nichtsdestotrotz haben sich Konventionen eingebürgert, die zwar nicht Resultat konzeptueller und terminologischer Klärungsprozesse sind, die jedoch einen Ausgangspunkt für heuristische Unterscheidungen bilden. Theoretisch sind als einfache zeitliche Relationen 1. Vorzeitigkeit, 2. Gleichzeitigkeit und 3. Nachzeitigkeit zwischen zwei oder mehreren (kommunikativen) Ereignissen t1und t2 möglich:

2.3 Temporalität – Kotemporalität – Simultaneität – Sequenzialität

1.

[

t1

]

2.

[

t1

]

[

t2

]

[

t2

]

3.

[

t2

]

[

t1

]

29

Allerdings löst sich eine klare Trennung zwischen solchen linearisierenden Zeitbegriffen auf, sobald mehrere Ausdrucksebenen in ihrer Wechselbezüglichkeit analysiert und im Hinblick auf die Hervorbringung multimodaler Gesamtgestalten betrachtet werden, in denen verbale und körperlich-visuelle Ausdrucks ressourcen gemeinsam komplexe, holistische Einheiten bilden. Diese besitzen nicht nur ihre eigene Dauer in Relation zu einem Vorher, einem Nachher und einem zeitgleich ablaufenden Geschehen, sondern auch ihre eigene temporale Binnenstruktur. Neben den genannten drei Relationen der Vor-, Gleich- und Nachzeitigkeit werden also Konzepte erforderlich, die komplexere Zeitlichkeitsbeziehungen wie partielle Gleichzeitigkeiten bzw. Teilsimultanitäten erfassen können (vgl. zu Multimodalität und Zeitlichkeit auch Stukenbrock 2009b). Komplexe Zeitlichkeitsbeziehungen zeichnen sich dadurch aus, dass die drei einfachen Relationen der Vor-, Gleich- und Nachzeitigkeit je nach Analyse ebenen, nach Anzahl und Art der einbezogenen Ressourcen, nach der Betrachtungsperspektive (reduktionistisch versus holistisch) und nach den Segmentierungskriterien variieren bzw. ineinander fließen. Streeck (2007) unterscheidet drei verschiedene Aspekte der Zeitlichkeit in der verbalen Interaktion: Er nennt erstens die innere Dauer zur Bezeichnung der materialen Zeitlichkeit kommunikativer Formen, die „als Folge ihrer materialen Formeigenschaften“ auftritt und bei Gesten beispielsweise durch die Dauer der Muskelbewegungen definiert wird15; zweitens die interaktive Zeitlichkeit kommunikativer Formen, die sich in

15 Dabei differenziert Streeck (2007) im Rückgriff auf Phillips (1986) zusätzlich zwischen ballistischen, in ihrem Ablauf nicht modifizierbaren, und modifizierbaren Bewegungen.

30

2 Begriffliche Grundlagen

der „sozialen Gegenwart“ anderer Interaktionsteilnehmer entfalten, von diesen beeinflusst und dementsprechend online gestaltet bzw. umgestaltet werden; drittens „die zeitlichen Koordinationen zwischen verschiedenen Modalitäten“ (Streeck 2007: 158). Das bedeutet, dass z. B. die Ausführung einer Geste mit der Blickorientierung des Adressaten koordiniert, auf eine emergierende Verbaläußerung abgestimmt und/oder mit weiteren körperlich-visuellen Kommunikationsformen aligniert wird. Dabei ist entscheidend, dass eine zeitliche Abstimmung zwischen verschiedenen Modalitäten immer zugleich intra- und interpersonell stattfindet und von den Interaktionsbeteiligten in jedem Augenblick des emergierenden Interak tionsgeschehens koordiniert werden muss. Neben die „Selbstsynchronisierung“ (Streeck 2007: 161) multimodaler Ausdrucksressourcen wie das exakte Timing von prosodischem Akzent und gestischem Gipfelpunkt oder von Fokussierungsaufforderung und Blick zum Adressaten tritt also die zeitliche Koordinierung der multimodalen Selbstorganisation mit der multimodalen Selbstorganisation der Interaktionspartner. Ohne speziell auf die Temporalitätsproblematik einzugehen, unterscheiden Deppermann und Schmitt (2007) daher zwischen intrapersoneller und interpersoneller Koordination. Während intrapersonelle Koordination als Kategorie für selbstbezogene, als Bestandteil der Selbstorganisation vollzogene Formen koordinativer Aktivitäten dient, wird interpersonelle Koordination als Kategorie für interaktionsbezogene, am Verhalten Anderer ausgerichtete koordinative Aktivitäten verwendet. Der Unterscheidung zwischen intra- und interpersoneller Koordination sind die beiden theoretischen Begriffe der Projektivität und der Adaptivität zur Konzeptualisierung der unterschiedlichen strukturellen Anforderungen an selbst- und partnerbezogene Koordinierung zugeordnet (Deppermann und Schmitt 2007: 33 f.). Demnach erfasst der Begriff der Projektivität die strukturelle Beziehung, die zwischen den selbststeuernden Einzelhandlungen eines Beteiligten besteht. Mit dem Begriff der Adaptivität werden demgegenüber die flexibleren und weniger präzise vorhersagbaren koordinationsstrukturellen Anforderungen konzeptualisiert, die durch die interaktive Orientierung an den lokalen Verhaltensweisen anderer Beteiligter zustande kommen. In der vorliegenden Studie verwende ich zum einen den Begriff der inneren Dauer, um auf die Zeitlichkeitsstruktur einer oder mehrerer zu einer Ausdrucksgestalt verbundener kommunikativer Formen zu verweisen, wobei multimodale Ausdrucksgestalten aus Formen mit jeweils unterschiedlicher innerer Dauer bestehen können (vgl. McNeills growth point-Theorie zur Synchronie von Sprache und Gestik) und dann eine interne temporale Mikrostruktur aufweisen. Zum anderen greife ich auf die Unterscheidung zwischen intra- und interpersoneller Koordinierung zurück. Die interpersonelle Koordinierung besitzt eine große Nähe zu Streecks Konzept der interaktiven Zeitlichkeit, auch wenn der Fokus des

2.3 Temporalität – Kotemporalität – Simultaneität – Sequenzialität

31

Koordinationskonzepts weniger auf Temporalitätsaspekten als vielmehr auf – zeitlich bedingten – interaktionsstrukturellen Manifestationen von Zeitlichkeit (Adaptivität und Projektivität) liegt. Das Interesse gilt hier der Konstituierung von interaktiver Ordnung, wobei Koordination als „interaktionskonstitutive Anforderung“ neben dem Aspekt der Zeitlichkeit auch die Aspekte der Räumlichkeit, der Multimodalität und der Mehrpersonenorientierung umfasst (Deppermann und Schmitt 2007: 23 f.). Über die genannten Konzepte hinaus benutze ich im Folgenden Temporalität zur Bezeichnung von Zeitlichkeit, die über die rein messbare Zeit im Sinne von Chronos hinausgeht und in irgendeiner Weise Relevanzstrukturen hervorbringt bzw. das Potenzial zur Hervorbringung von Relevanzstrukturen besitzt. Potenziell bedeutungsvolle oder funktional relevante Temporalitätsbeziehungen können als simultane, teilsimultane oder sequenzielle Zeitlichkeitsverhältnisse zwischen Elementen zutage treten. Aufgrund kanalbedingter Einschränkungen gestattet jedoch nicht jede Modalitätsebene die gleichzeitige Instantiierung von Elementen derselben Modalität. Kotemporalität verstehe ich als Mit-Zeitlichkeit im Sinne des Zugegenseins oder Vollzugs eines Phänomens X in derselben zeitlichen Dimension, in der sich ein Phänomen Y manifestiert, ohne dass X und Y im strengen Sinn gleichzeitig sind. Kotemporalität ist insofern ein umfassenderer Begriff als Simultaneität, als er verschiedene Über- und Unterordnungsverhältnisse, temporale Hierarchien und Einbettungsbeziehungen denken lässt. Das Kompositum Temporalitätsstruktur kann sich auf die Dauer einer einzigen Gestenphase, auf temporale Relationen zwischen Phasen einer einzigen Modalität, auf temporale Beziehungen zwischen verschiedenen Modalitäten und auf modalitätsübergreifende temporale Relationen beziehen. Temporales Ablaufformat meint ein auf eine spezifische Interaktionsaufgabe – im vorliegenden Fall die deiktische Zeigehandlung – zugeschnittenes temporales und sequenzielles Format. Gegenüber dem weiteren Begriff der Kotemporalität soll der Simultaneitätsbegriff der Gleichzeitigkeit im engen, mikroperspektivischen Sinn vorbehalten bleiben.16 Er wird ausschließlich zur Bezeichnung multimodaler Koordinierungsprozesse verwendet, die sich intra- und interpersonell im selben Augenblick ereignen. Auf mikroanalytischer Betrachtungsebene werden mit dem Begriff der Teilsimultaneität dementsprechend Momente erfasst, in denen sich bestimmte Ausdrucksformen für einen gewissen Zeitraum in ihrer Emergenz überschneiden und in bedeutungsvoller, funktional relevanter Weise miteinander einher gehen,

16 Die Wahl des Ausdrucks Simultaneität bietet sich an, da dieser Ausdruck zur Bezeichnung der Zeitlichkeit von eng zueinander in Beziehung stehenden, unter Umständen sogar gemeinsam vollzogenen Ereignissen, Prozessen etc. gebräuchlich ist.

32

2 Begriffliche Grundlagen

sich dabei jedoch hinsichtlich Anfangs- und/oder Endpunkt und Dauer voneinander unterscheiden. Konzepte wie Simultaneität und Teilsimultaneität sind wichtig, um das Entstehen multimodaler Verdichtungsräume (vgl. Stukenbrock 2008) zu beschreiben. Multimodale Verdichtungsräume entstehen dadurch, dass unterschiedliche, für den kommunikativen Akt konstitutive Ausdrucksressourcen in einer Phase der Simultaneität zusammenlaufen, in verdichteter Weise gleichzeitig präsent sind, bevor sie wieder in unterschiedlichen, weniger eng aufeinander bezogenen funktionalen und temporalen Strukturen auseinander laufen. Die folgende Abbildung zeigt einen multimodalen Verdichtungsraum, der im Vollzug einer deiktischen Zeigehandlung zustande kommt. Der Sprecher, ein Patient mit chronischen Schmerzen, schildert den anwesenden Ärzten seine Probleme und verweist dabei mit dem Demonstrativpronomen des (süddt. für das/dies) auf eines seiner Beine. Bevor er seinen Redezug beginnt, blickt er zu einem der Ärzte und reorientiert unmittelbar vor dem Beginn der Verbaläußerung seinen Blick nach unten auf den Beinbereich. In der Abbildung repräsentiert der dunkle Smiley mit dem waagerechten Pfeil den auf den Arzt orientierten Blick, der rot markierte Smiley mit dem schräg nach unten gerichteten Pfeil repräsentiert demgegenüber den Blick auf das eigene Knie. Die symbolische Annotationszeile darunter indiziert die Dauer der jeweiligen Blickorientierungen:

Blick

Gestik

|~~~~~~~~ * * ;;;;|

Sprache

(-) weil=ja DES bein (.) geht ja nimma multimodaler Verdichtungsraum

Nachdem der Patient den Blick auf sein Knie gerichtet hat, setzt im nächsten Schritt die Gestik ein. Die verwendeten Symbole sind im vorherigen Abschnitt (2.2) erläutert worden. Die kinesische Vorbereitungsphase beginnt nach der Reorientierung des Blicks und vor dem Einsatz der Sprache. Erst im dritten

2.3 Temporalität – Kotemporalität – Simultaneität – Sequenzialität

33

Schritt setzt die Sprache ein. In dem Augenblick, indem der Patient das deiktisch gebrauchte, akzentuierte Demonstrativum DES artikuliert, also simultan zur prosodischen Akzentuierung, führt er mit beiden Händen ein doppeltes Klopfen auf sein linkes Knie aus. An dieser Stelle verdichten sich die in der Emergenz immer stärker konvergierenden, auf dem Gipfelpunkt zusammentreffenden Ressourcen. Multimodale Verdichtungsräume treten nicht nur bei Zeigehandlungen, sondern ebenso bei der Alignierung von ikonischen, metaphorischen und anderen Gestentypen mit Sprache (Blick, Körperpositur etc.) auf. Im Hinblick auf Temporalitätsstrukturen und multimodale Verdichtungsräume bei Zeigehandlungen ist allerdings festzuhalten, dass unterschiedliche Ausdrucksressourcen wie z. B. ein deiktischer Ausdruck und eine dazugehörige Zeigegeste in einer emergierenden Zeigehandlung nicht notwendigerweise zeitlich exakt zusammenfallen müssen. Im Gegenteil kann es für das Gelingen der Zeigehandlung sogar erforderlich sein, dass die Artikulation des deiktischen Ausdrucks der Realisierung der Geste deutlich vorausläuft. Dies ist beispielsweise dann der Fall, wenn der Sprecher die visuelle Aufmerksamkeit seines Adressaten erst auf sich orientieren muss, damit und bevor er sie auf etwas Drittes lenken kann. Eine weitere, empirisch zu beobachtende Variante besteht darin, dass der Sprecher seine Zeigegeste so lange einfriert, bis sich der Adressat auf ihn bzw. das gestisch indizierte Objekt orientiert hat. Die begleitende Verbaläußerung bzw. der funktional zu der Geste gehörende deiktische Ausdruck können bis dahin längst verklungen sein. Gegenüber den Begriffen der (Ko)Temporalität und der Simultaneität spielt der aus dem Griechischen stammende Begriff der Synchronizität in der Bedeutung, die er durch die enge Verknüpfung mit dem Strukturalismus und den Konzepten Ferdinand de Saussures erhalten hat, für die Untersuchung multimodaler Zeitlichkeitsbeziehungen keine Rolle. Jenseits des strukturalistischen Paradigmas kann der Begriff jedoch dazu dienen, in Abgrenzung zu Simultaneität und Kotemporalität das Zusammentreffen nicht zusammenhängender Ereignisse zur selben Zeit17 zu erfassen. Dementsprechend geschehen synchrone Ereignisse gleichzeitig, sie laufen zeitgleich in einer rein chronologisch verstandenen Zeit ab. Die Ereignisse können räumlich auseinander liegen oder in derselben räumlichen Dimension geschehen. Räumliche Kontiguität stellt allerdings bereits einen möglichen Faktor für die Hervorbringung von Relevanzsstrukturen dar, womit

17 Diese Begriffsbestimmung liegt durch die Rückführbarkeit der Wortbildung auf das griechische Wort chronos nahe, das sich nach heutigem Verständnis auf die messbare, linear ablaufende Zeit bezieht. Das Präfix syn- verweist dementsprechend darauf, dass es sich um gleichlaufende Ereignisse handelt.

34

2 Begriffliche Grundlagen

die Dimension reiner Synchronizität verlassen und Kotemporalitätsbeziehungen in Kraft treten würden. Sequenzialität schließlich ist nicht nur eines der fundamentalen Konzepte und Themen der Konversationsanalyse, sondern auch ihr zentrales methodisches Analyseinstrument (Ford und Fox 2002; Schegloff 2007a). Sequenzialität stellt ein Ordnungsprinzip dar, das mehr umfasst als das schiere, chronologische Nacheinander von zwei kommunikativen Ereignissen auf einer linearen Zeitlichkeitsachse. Es bezieht die kontextuelle Einbettung solcher Ereignisse und ihre strukturelle Zusammenbindung zu Ablaufformaten wie Paarsequenzen mit ein. Das sequenzanalytische Grundverfahren zum Nachvollzug der von den Beteiligten z. B. in Form von Paarsequenzen interaktiv hervorgebrachten Bedeutungsstrukturen bildet die next turn proof procedure („Sinn-Kontrolle an der Folgeäußerung“ nach Auer 2013: 144). An den Folgehandlungen eines Beteiligten wird für die anderen Beteiligten, aber auch für die Interaktionsanalytikerin erkennbar, wie ein Beteiligter die vorangegangene Handlung eines anderen Beteiligten verstanden hat. Ablaufformate wie Gruß – Gegengruß konstituieren Paarsequenzen, in denen der erste Paarteil den zweiten erwartbar macht bzw. konditionell relevant setzt. Konditionelle Relevanzen sind ebenso wie Projektionen strukturelle Manifestationen der Zeitlichkeit der gesprochenen Sprache und zentrale Gegenstände der Interaktionalen Linguistik. Diese ursprünglich ausschließlich anhand von Audiodaten und folglich allein auf die verbale Ebene bezogenen Beobachtungen treffen in ähnlicher, wenn auch nicht immer in derselben Weise auf multimodale Kommunikationsformen zu (vgl. dazu Stukenbrock 2013, 2014a). Ein einfacher Fall liegt vor, wenn eine Person A durch einen verbalen Gruß als zweiten Paarteil einen Gegengruß konditionell relevant setzt, der von Person B nonverbal durch ein Winken oder Kopfnicken erwidert wird. Etwas komplexer gestaltet sich der Fall, bei dem Person A eine mit einem deiktischen Ausdruck gekoppelte Fokussierungsaufforderung „guck mal da“ äußert, die von einer Zeigegeste auf das zu betrach tende Phänomen begleitet wird. Die konditionellen Relevanzen, die dadurch für Person B aufgebaut werden, bestehen zumindest darin, dass Person B der Fokussierungsaufforderung nachkommt und der deiktischen Orientierungshandlung auf etwas Drittes folgt, indem sie ihre visuelle Aufmerksamkeit entsprechend ausrichtet. Es wird deutlich, dass die durch eine Zeigehandlung hervorgebrachten multimodalen Strukturen (ihre intra- und interpersonellen Relevanzen) temporal vielschichtiger sind als die von der Interaktionalen Linguistik bislang untersuchten grammatischen (syntaktischen) Strukturen (Selting und Couper-Kuhlen 2001a). Zugleich stellt die deiktische Zeigehandlung aufgrund ihrer klar definierten Funktion, einen gemeinsamen perzeptorischen und kognitiven Aufmerksamkeitsfokus

2.4 Sprache und Gestik in der deiktischen Zeigehandlung

35

zwischen Sprecher und Adressatin (auf etwas Drittes) herzustellen, den Paradefall für weitergehende Untersuchungen zu Projektionen in Grammatik und Interaktion dar, wie sie von der Konversationsanalyse und einer bislang auf Syntax und Prosodie konzentrierten Interaktionalen Linguistik unternommen wurden. Die deiktische Zeigehandlung erfordert ein hohes Maß an intra- und interpersoneller Koordinierung (Adaptivität, Projektivität) und etabliert klar definierte, modalitätsübergreifende konditionelle Relevanzen. Um dies zu verdeutlichen, ist im Folgenden eine Zusammenführung der bisherigen allgemeinen Erläuterungen zur Anatomie von Gesten, zur multimodalen Erweiterung der Gestenforschung und zu Temporalitätsstrukturen im Hinblick auf den Spezialfall der Zeigehandlung erforderlich.

2.4 Sprache und Gestik in der deiktischen Zeigehandlung Die in den vorherigen Abschnitten erarbeiteten Konzepte bilden die Grundlage des theoretischen Modells, das in Kapitel 4 vorgestellt wird, sowie der empirischen Untersuchungen zu den Parametern der Zeigehandlung, die auf das theoretische Kapitel folgen. Die oben skizzierte Terminologie zu gestischen Einheiten und Verlaufsphasen (Kendon 2004; McNeill 1992, 2005) bezieht sich auf Gesten allgemein und spezifiziert nicht hinsichtlich der in gängigen Typologien üblichen Subklassifikation in Zeigegesten, Taktstockgesten, ikonische und metaphorische Gesten. Da die vorliegende Studie zur Deixis die intra- und interpersonelle Koordinierung verbaler und körperlich-visueller Ausdrucksressourcen beim Zeigen zum Gegenstand hat, sollen die bisherigen Überlegungen im Hinblick auf den Typus der Zeigegeste und das Konzept der (deiktischen) Zeigehandlung zusammengeführt werden. Im Abschnitt zur Gestenanatomie wurde zwischen Gesteneinheit, Gestenphrase und Gestenphase unterschieden, wobei die einzelnen Gestenphasen je nach ihrer Position in der Gestenphrase benannt werden (Vorbereitungs-, Durchführungs-, Rückzugsphase etc.). Der dort abstrakt als Gesteneinheit bezeichneten Größe entspricht in der spezifischen Begrifflichkeit der Zeigeakt, der wiederum aus einer oder mehreren Zeigegesten bestehen kann, die folglich den Status einer Gestenphrase besitzt. Eingebettet ist der Zeigeakt in die umfassende Einheit der (deiktischen) Zeigehandlung, die Gegenstand der theoretischen Modellierung und empirischen Ausarbeitung der vorliegenden Studie ist. Zu den Begriffserläuterungen im Einzelnen:

36

2 Begriffliche Grundlagen

DEIKTISCHE ZEIGEHANDLUNG Das Konzept der deiktischen Zeigehandlung konstituiert ein eigenständiges Modell (vgl. Kapitel 4) zur Deixis in der face-to-face-Interaktion, das in dieser Form weder in linguistischen Untersuchungen zur Deixis noch in der Gestenforschung ein Äquivalent besitzt. Es geht über reine Gestenmodelle hinaus, da es erstens das Zusammenspiel von Sprache (deiktischen Ausdrücken) und Gestik behandelt, da es zweitens die perzeptorischen, kognitiven und interaktiven Funktionen weiterer Ressourcen wie insbesondere des Blicks in die theoretische und empirische Betrachtung einbezieht und da es drittens der Interaktivität Rechnung trägt. Die deiktische Zeigehandlung wird durch die im theoretischen Modell ausführlich zu entwickelnden Parameter konstituiert, die schematisch wie folgt zusammengefasst werden können: Deiktische Zeigehandlung 1

2

3

4

5

6

7

8

9

10

Eine Ausdetaillierung der im Schema lediglich durch Ziffern vertretenen Parameter wird in Kapitel 4 vorgenommen. An dieser Stelle genügt der Hinweis, dass die als Zeigegeste (ZG) bezeichnete Größe im vorliegenden Schema durch den Parameter 5 vertreten wird: Deiktische Zeigehandlung 1

2

3

4

ZG

6

7

8

9

10

Im Hinblick auf das multimodale Realisierungsformat und die Temporalitätsstrukturen der Zeigehandlung ist darüber hinaus festzuhalten, dass das multimodale Ablaufformat flexibel ist. Die durch die Parameter definierten Aufgaben bzw. Funktionen werden nicht immer in derselben sequenziellen Reihenfolge abgearbeitet, auch wenn bestimmte Parameter in einem logischen und temporalen Bedingungsverhältnis stehen. Zudem werden die Parameter nicht notwendigerweise stets von denselben Ressourcen instantiiert. Sowohl die Arbeitsteilung zwischen den Ressourcen als auch die Temporalitätsstrukturen sind flexibel und kontextadaptiv.

2.4 Sprache und Gestik in der deiktischen Zeigehandlung

37

ZEIGEAKT Der Begriff Zeigeakt bezieht sich ausschließlich auf die im Rahmen der Gesamtzeigehandlung durchgeführte motorische Handlung mit dem Körperteil, das als Zeiginstrument fungiert. Der Begriff ist erforderlich, um eine deskriptive Kategorie zu haben, die es gestattet, den gestischen Teilakt isoliert zu erfassen.

ZEIGEGESTE Zentral für den Zeigeakt ist die Zeigegeste, die als Bewegung eines Körperteils, im Standardfall der Vordergliedmaßen (Arm, Hand, Finger), sowie bestimmter gegenständlicher Zeiginstrumente, die in der Hand gehalten werden, begriffen wird. Unter bestimmten Umständen können Bewegungen des Kopfs oder Blicks an die Stelle manueller Zeigegesten treten. Ein Zeigeakt kann aus mehreren Zeigegesten bestehen. Die Zeigegeste wiederum setzt sich aus den Phasen zusammen, die für Gesten ganz allgemein beobachtet wurden (Kendon 1972, 1980, 2004; Kita 1993; McNeill 1992, 2005). Damit entspricht das Konzept des Zeigeakts in der vorliegenden Untersuchung dem Konzept der Gesteneinheit (gesture unit) bei Kendon, McNeill und Anderen. Zeigegeste bezeichnet demgegenüber die darin einbegriffene und zugleich phasenübergreifende Einheit, die im klassischen Phasenmodell als Gestenphrase (gesture phrase) bezeichnet wird. Zusammengefasst gestalten sich die Einbettungsbeziehungen zwischen Zeigehandlung, Zeigeakt und Zeigegeste wie folgt: Deiktische Zeigehandlung Zeigeakt (Gesteneinheit) Zeigegeste (Gestenphrase) Phasen 1

2

Zeigegeste

3

Zwei zentrale Aspekte sind hervorzuheben, die in bisherigen Untersuchungen entweder nicht gesehen oder unzureichend behandelt wurden. Der erste Aspekt bezieht sich auf die Unterscheidung zwischen Suchraum und Zeigeziel, die als zwei eigenständige Parameter im theoretischen Modell der Zeigehandlung konzeptualisiert werden. Der Unterscheidung liegt die empirische Beobachtung zugrunde, dass die lineare Verlängerung des durch die Zeigegeste proji-

38

2 Begriffliche Grundlagen

zierten Vektors nicht automatisch zum Zeigeziel führt, sondern zunächst einen Suchraum konstituiert, innerhalb dessen das Zeigeziel erst aufgefunden werden muss (vgl. auch Goodwin 2000a, 2003a). Dieses Phänomen wird in der vorliegenden Untersuchung als Vektor-Ziel-Problem bezeichnet. Laut Modell betrifft dies die Parameter sechs (Suchraum: SR) und sieben (Zeigeziel: ZZ): Deiktische Zeigehandlung 1

2

3

4

5

SR

ZZ

8

9

10

Der zweite Aspekt betrifft die Notwendigkeit einer theoretischen Unterscheidung zwischen Zeigeziel und Referent, die in der vorliegenden Untersuchung als Problem der Referenzherstellung konzeptualisiert wird. Laut Modell handelt es sich um die Parameter sieben (Zeigeziel: ZZ) und acht (Referent: RR): Deiktische Zeigehandlung 1

2

3

4

5

6

ZZ

RR

9

10

Das erste Problem wird übersehen, wenn die Annahme besteht, dass die Zeigegeste einen linearen Vektor projiziert, der punktgenau zum Zeigeziel führt. Die Annahme hat zur Folge, dass der Suchraum als eigenständige Größe gar nicht in den Blick gerät. Das zweite Problem wird übersehen, wenn von der Annahme ausgegangen wird, dass Zeigeziel und Referent identisch sind bzw. dass das Zeigeziel den Referenten darstellt. In dieser Konzeption fällt entweder das Zeigeziel oder der Referent weg. Obwohl bereits Quine (1960: 100 f.) auf die Ambiguitäten zwischen gezeigtem Objekt und Referenten hingewiesen hat, werden Zeigeziel und Referent in den meisten Darstellungen undifferenziert behandelt. Zu den wenigen Ausnahmen gehören Clark et al. (1983), die eine begriffliche Differenzierung in demonstratum und referent vornehmen, die von Schmauks (1991) wieder aufgegriffen und ausgebaut wird. Sie geht zunächst von einer Identitäts beziehung zwischen Demonstratum und Referent aus und führt als weitere Beziehungen die der Konkomitanz, der Nachbarschaft und der (kategorialen, generischen und typhaften) Vertretung ein. Das Modell, das in der vorliegenden Studie entwickelt wird, schließt aus theoretischen Gründen eine Identitätsbeziehung zwischen Zeigeziel und Referent aus.

2.4 Sprache und Gestik in der deiktischen Zeigehandlung

39

SPRACHE UND GESTIK IN DER DEIKTISCHEN ZEIGEHANDLUNG Die Besonderheit der deiktischen Zeigehandlung besteht darin, dass sie als multimodales Phänomen aufgefasst wird. Ein deiktisches Sprachzeichen, ein Ausdruck aus dem Zeigfeld der Sprache (Bühler 1965 [1934]), tritt in Verbindung mit einer körperlich-visuellen Zeigehilfe auf und wird in einer spezifischen Weise multimodal in den interaktiven Kontext eingebettet. Der Kontext ist jedoch nicht einfach „da“, sondern wird er durch die Zeigehandlung zugleich mit hervorgebracht. Für die Theorie der Deixis bedeutet eine dynamische, reflexive Auffassung von Kontext (Garfinkel 1967; Goodwin und Duranti 1992; Hanks 1990, 1992), dass das Verhältnis zwischen Figur (figure) und indexikalischem Grund (indexical ground) nicht als einseitiges Abhängigkeitsverhältnis zwischen einer vom indexikalischen Grund aus zu konstituierenden Figur, sondern als dynamisch und reflexiv aufzufassen ist. Einen Vorschlag, die dynamische, reflexive Konstituiertheit von Figur und Grund in der emergierenden Interaktion deixistheoretisch zu fassen, hat Hanks vorgelegt. Hanks greift in seiner Deixistheorie auf die Figur/Grund-Unterscheidung zurück und wendet sie auf die interne semantische Struktur grammatischer Formen an (Hanks 1992: 62): „The basic proposal of this paper is different in that I am applying the Figure-Ground dichotomy to the internal semantic structure of individual grammatical forms. A term such as ‘this’ incorporates both figure (denotatum) and ground (indexical origo).“ Demnach instantiiert der Gebrauch eines deiktischen Ausdrucks wie z. B. eines Demonstrativpronomens zugleich den indexikalischen Grund bzw. die (indexikalische) Origo sowie die in Relation dazu herzustellende Figur. Schematisch lässt sich dies wie folgt veranschaulichen:

deiktischer Ausdruck INSTANTIIERT

Origo

Figur

40

2 Begriffliche Grundlagen

Hanks (1990, 1992) unternimmt in seiner Deixistheorie eine Kategorisierung der Bedeutungsmerkmale, die in deiktischen Ausdrücken enkodiert sind. Aus diesem umfangreichen Kategoriensystem, das anhand von empirischen Untersuchungen zum Yucatec Maya entwickelt wurde, dessen verbaldeiktisches System weitaus differenzierter ist als das des Deutschen, werden im Folgenden drei Merkmalskategorien herausgegriffen, die für die hier vorgestellte Deixistheorie relevant sind. Diese unterscheidet sich dadurch von Hanks, der wie viele andere Untersuchungen ausschließlich das Verbale betrachtet, dass sie die körperlich-visuellen Ressourcen systematisch in die Modellierung der deiktischen Zeigehandlung einbezieht. Wie zu sehen sein wird, spielt dies eine entscheidende Rolle für die Frage danach, ob und inwieweit bestimmte Bedeutungsmerkmale bestimmten Ausdrucksressourcen zugeschrieben werden können. Zu den relevanten Merkmalen gehören indexikalische, relationale und charakterisierende Merkmale. Indexikalische Merkmale liefern Informationen über den indexikalischen Grund, z. B. ob dieser den Sprecher und/oder den Adressaten einschließt oder nicht, ob er verschoben ist oder nicht. Relationale Merkmale bestimmen das Verhältnis zwischen indexikalischem Grund und der Figur, z. B. ob diese sich proximal oder distal zueinander verhalten, ob die Figur vom indexikalischen Grund aus perzeptorisch zugänglich (sichtbar, hörbar, greifbar etc.) oder unzugänglich ist, ob sie im gemeinsamen Hintergrundwissen (common ground, Clark 1996; Clark et al. 1983) vorausgesetzt wird, als fragwürdig oder unbekannt gilt. Charakterisierende Merkmale schließlich liefern Informationen über die Figur, z. B. ob sie als Ein- oder Mehrzahl vorliegt, statisch oder dynamisch, belebt oder unbelebt, punktuell oder ausgedehnt ist. Aus multimodaler Perspektive ist nun entscheidend, dass diese Merkmale nicht nur in den deiktischen Ausdrücken enkodiert sind, sondern auch durch Aspekte der Geste vermittelt werden, namentlich durch die gewählte Handform, -konfiguration, Bewegung, Streckungsgrad etc. Wie die ausführliche Darstellung der gestischen Mittel des Zeigens in Kapitel 5 nachweist, kommt der Wahl einer bestimmten Zeigform eine funktionale Bedeutung zu. Beispielhaft sei der kleine Finger im Gegensatz zum vollständig ausgestreckten Arm genannt. Die Wahl des kleinen Fingers als Zeiginstrument enkodiert hinsichtlich der relationalen Merkmale Proximalität und hinsichtlich des die Figur umgebenden Suchraums Komplexität und Detailfülle; die Wahl der geöffneten Hand als Zeiginstrument wiederum charakterisiert die aufzufindende Figur als betrachtungswürdiges Anschauungsobjekt. Bezieht man indexikalische, relationale und charakterisierende Merkmale in die Darstellung mit ein und trägt darüber hinaus dem zentralen Stellenwert der Zeigegeste Rechnung, ergibt sich folgende Erweiterung des oben abgebildeten Schemas:

2.4 Sprache und Gestik in der deiktischen Zeigehandlung

41

deikt. Ausdruck + (Zeige-)Geste INSTANTIIEREN

Origo

Figur relationale Merkmale

indexikalische Merkmale

charakterisierende Merkmale

Bisher ist das Argument entwickelt worden, dass der deiktische Ausdruck zusammen mit der Zeigegeste die Origo und die in Relation dazu herzustellende Figur instantiiert. In diesem Zusammenhang ist auf zwei in der Forschung unzureichend behandelte Problemkomplexe zurückzukommen, die ich oben als Vektor-Ziel-Problem und als Problem der Referenzherstellung bezeichnet habe. Eine angemessene Bearbeitung dieser Problemkomplexe verlangt zum einen die Unterscheidung zwischen Suchraum und Zeigeziel und zum anderen die Unterscheidung zwischen Zeigeziel und Referent. Im vorliegenden Schema betreffen diese Unterscheidungen die bislang monolithisch als Figur konzeptualisierte Größe. Gemäß der Unterscheidung zwischen Suchraum, Zeigeziel und Referent ist die durch die Figur besetzte Seite des Schemas dergestalt auszudifferenzieren, dass erstens der Suchraum als die durch die deiktisch-gestische Orientierung hervorgebrachte Größe, zweitens das darin (möglicherweise in Konkurrenz zu Alternativen) aufzufindende Zeigeziel und drittens der Referent dargestellt werden (siehe nächste Seite). Es stellt sich zum einen die Frage, wie innerhalb des Suchraums das Zeigeziel aufgefunden wird, und zum anderen die Frage, wie die Beziehung zwischen Zeigeziel und Referent vorzustellen ist. Beide Fragen werden ausführlich im theoretischen Modell diskutiert, das in Kapitel 4 dargelegt wird. An dieser Stelle genügt der Hinweis, dass beide Probleme im unmarkierten Fall als gemeinsames Projekt gelöst werden und dass Reparaturen sich sowohl auf ein im Suchraum nicht auf-

42

2 Begriffliche Grundlagen

deikt. Ausdruck + (Zeige-)Geste INSTANTIIEREN

Suchraum

Origo

Zeigeziel relationale Merkmale

indexikalische Merkmale

Referent

charakterisierende Merkmale

zufindendes Zeigeziel (das „wo“-Problem) als auch auf einen anhand des Zeigeziels nicht herstellbaren Referenten (das „was“-Problem) beziehen können. Clark et al. (1983: 246) fassen die Beziehung zwischen dem von ihnen als Demonstratum bezeichneten Zeigeziel und dem Referenten als demonstrative Beziehung F auf, die ein Mapping des Zeigeziels auf den Referenten ermöglicht: „In our proposal, a demonstrative reference has three parts: a demon stratum d, a demonstrative relation F, and a referent r. […] The relation F maps the demonstratum d into the referent r.“ Im Unterschied zu dieser Auffassung, bei der die Zielrichtung der Beziehung F vom Demonstratum zum Referenten läuft, betrachte ich die Beziehung zwischen Zeigeziel und Referent als wechselseitig informativ. Demnach wird die perzeptorische Herstellung des Zeigeziels in einem komplex strukturierten Suchraum mit alternativen Zeigezielen nicht allein von perzeptorischer Salienz, sondern auch von kognitiver Salienz, d. h. von gemeinsamem und als gemeinsam gewusstem Wissen und damit von Annahmen über probate Referenten gesteuert. In der schematischen Darstellung wird diese bidirektionale, unter Umständen in mehreren Schleifen durchlaufene Beziehung durch die zwei entgegengesetzten Pfeile zwischen Zeigeziel und Referent veranschaulicht:

2.4 Sprache und Gestik in der deiktischen Zeigehandlung

43

deikt. Ausdruck + (Zeige-)Geste INSTANTIIEREN

Suchraum

Origo

Zeigeziel relationale Merkmale

Referent

indexikalische Merkmale

charakterisierende Merkmale

Abschließend ist auf die zu Beginn dieses Abschnitts dargestellte Gesamtzeigehandlung zurückzukommen und der Ort zu bestimmen, den die hier schrittweise entwickelten Komponenten im Gesamtmodell einnehmen. Es handelt sich um die Kernkomponenten der deiktischen Zeigehandlung, die im Gesamtmodell durch die Parameter vier bis acht definiert werden: Deiktische Zeigehandlung 1

2

3

DA

ZG

SR

ZZ

RR

9

10

Der deiktische Ausdruck (DA) instantiiert zusammen mit der Zeigegeste (ZG) die Origo und in Relation dazu den Referenten (RR). Dieser kann allerdings nur vermittelt über das perzeptorische Auffinden des Zeigeziels (ZZ) in einem durch die Zeigegeste (ZG) vektoriell indizierten Suchraum (SR) identifiziert werden. Die bislang lediglich durch Ziffern repräsentierten Parameter 1–3 und 9–10 werden im theoretischen Modell zusammen mit einer Diskussion der im Vorherigen benannten Parameter 4–8 ausführlich dargelegt. Damit bettet sich das Schema wie folgt in das Gesamtmodell ein:

1

2

Deiktische Zeigehandlung

3

indexikal. Merkmale

Origo

+

ZG

relat. Merkmale

INSTANTIIEREN

DA

charakter. Merkmale

RR

ZZ

SR

9

10

44 2 Begriffliche Grundlagen

3 Korpus und Methode Das der Untersuchung zugrunde gelegte Videokorpus besteht aus unterschied lichen Subkorpora, die im Folgenden aufgeführt werden. Die in Klammern hinzu gefügten Buchstabenkürzel bezeichnen das jeweilige Subkorpus und tauchen in den Analyse-Kapiteln zur Kennzeichnung der jeweiligen Transkriptausschnitte wieder auf. Während die ersten drei Subkorpora aus selbst erhobenen Video daten bestehen, stellen die letzten beiden Subkorpora medial aufgezeichnete Daten dar: I) Stadtführungen (StF)18 II) Schmerzkonferenzen (SK)19 III) Selbstverteidigungskurse (MM)20 IV) Kochsendungen unterschiedlicher Formate (PK; KS; KK)21 V) Reality-TV Show (bb)22.

18 Die Daten zu unterschiedlichen Stadtführungen in Bayreuth und Nürnberg verdanke ich Bernd Müller-Jacquier, dem ich sehr herzlich für das großzügige Überlassen dieser Daten danke. 19 Bei diesem Subkorpus handelt es sich um Videoaufzeichnungen von sechs sog. Schmerzkonferenzen, in denen Patientinnen und Patienten mit chronischen Schmerzen vor einem interdisziplinären Ärzte- und Therapeutengremium in 20- bis 30-minütigen Sitzungen ihre Beschwerden vorstellen. Die Schmerzkonferenzen wurden von Anne-Maria Stresing aufgezeichnet, der ich sehr herzlich für ihre Mühe und ihr Engagement danke. Die Schmerzkonferenzen finden in einem eigens dafür eingerichteten Schmerzzentrum innerhalb des Neurozentrums des Freiburger Uniklinikums statt und dienen dazu, durch die medizinische Kooperation zwischen Ärzten unterschiedlicher Fachgebiete und gemeinsam mit den Betroffenen therapeutische Maßnahmen zur Schmerzlinderung zu erarbeiten. Anders als in der im Praxisbetrieb üblichen dyadischen Arzt-Patienten-Interaktion handelt es sich um ein multi party setting, dessen Ablauf vornehmlich durch die Fragen des Chefarztes an den Patienten strukturiert ist, wobei die anderen Ärztinnen und Ärzte ebenfalls Fragen stellen, Bemerkungen einfließen lassen und mit dem Chefarzt sowie in begrenztem Maß auch untereinander interagieren können. 20 Bei der Erhebung der Videodaten des „Mutige Mädchen“-Projekts waren Stefanie Öttl, die den Zugang zum Feld hergestellt und die Organisation übernommen hat, sowie Anh Nhi Dao behilflich, denen ebenfalls mein großer Dank gilt. Ferner danke ich den Initiatoren und Trainern des „Mutige Mädchen“-Projekts, Lynn und Peter Kalinowski, für ihre Kooperationsbereitschaft bei der Datenerhebung. 21 Für ihre Unterstützung bei der Erstellung und Verwaltung des Kochkorpus danke ich Anh Nhi Dao. 22 Den Zugang zu diesem Videokorpus verdanke ich Peter Auer und Karin Birkner, an deren Lehrstühlen (Prof. Dr. Peter Auer, Universität Freiburg) und (Prof. Dr. Karin Birkner, Universität Bayreuth) die Daten vorliegen und verwaltet werden.

46

3 Korpus und Methode

Das aus den genannten Subkorpora bestehende Gesamtkorpus wurde mit dem Ziel konstituiert, eine möglichst breite Streuung über eine Vielfalt an Kommunikationssituationen zu gewährleisten. Die Daten variieren hinsichtlich des Formalitätsgrades, der Anzahl der InteraktionsteilnehmerInnen (dyadische Konstellationen – multi party-Konstellationen) und der Aktivitätstypen. Sie decken ein breites Spektrum an kommunikativen Gattungen ab, in denen Alltagsgenres (Alltagserzählungen, Streitgespräche, Tischgespräche, Diskussionen etc.) ebenso vertreten sind wie institutionelle Kommunikation (Arzt-Patient-Kommunikation, Lehr-Lern-Interaktion, Stadtführung) und massenmedial vermittelte Kommunikation. Die Aufnahmen umfassen sowohl stationäre als auch mobile Settings, symmetrische und asymmetrische Beziehungsverhältnisse, und sie gestatten neben der Analyse von Situationen, in denen das Gespräch das main involvement (Goffman 1963) darstellt, auch die Analyse von Situationen, in denen eine körperliche Aktivität das main involvement der Beteiligten bildet23, die verbale Kommunikation hingegen nebenbei bzw. zur Koordinierung der körperlichen Aktivitäten stattfindet. Alle Daten erfüllen als Grundvoraussetzung der vorliegenden Arbeit, deren Gegenstand die Deixis in der face-to-face-Interaktion ist, dass sich die Interaktionsbeteiligten physisch im selben Wahrnehmungsraum befinden und damit potenziell denselben audio-visuellen Zugang zu den Gegebenheiten im Raum und zueinander haben. In Fällen dieser Art spreche ich in Anlehnung an Bühler (1965 [1934]) von einem sympraktischen Interaktionsrahmen. Er schafft die Interaktionsvoraussetzungen dafür, dass an die Stelle elaborierter verbaler Beschreibungen andere Verfahrensweisen treten können, die unter Umständen situa tionsangemessener und ökonomischer sind: der Einsatz verbaler Deiktika und körperlicher Zeigemittel als interaktive Ressourcen.

23 Der Begriff des involvement wird von Goffman (1963: 43) wie folgt definiert: „INVOLVEMENT refers to the capacity of an individual to give, or to withhold from giving, his concerted attention to some activity at hand – a solitary task, a conversation, a collaborative work effort. It implies a certain admitted closeness between the individual and the object of involvement, a certain overt engrossment on the part of the one who is involved. Involvement in an activity is taken to express the purpose or aim of the actor.“ Goffman unterscheidet weiter zwischen main involvement und side involvement (Goffman 1963: 43): Während das main involvement die Hauptbeschäftigung eines Individuums konstituiert und dadurch definiert ist, dass es dessen Aufmerksamkeit und Interesse absorbiert und seine Handlungen determiniert, bestimmt sich das side involvement dadurch, dass es nebenbei – mit einem geringen körperlichen, perzeptorischen und kognitiven Aufwand – erledigt werden kann, ohne die gleichzeitige Aufrechterhaltung und Fortführung des main involvement zu gefährden.

3 Korpus und Methode

47

Methodisch und theoretisch ist die Untersuchung an der Schnittstelle zwischen Konversationsanalyse (Bergmann 1994, 2001; Goodwin und Heritage 1990; Hutchby und Wooffitt 2005; Sacks 1992; Sacks et al. 1974; Schegloff 2007a; Sidnell und Stivers 2012; Streeck 1983), Kontextualisierungstheorie (Auer 1986; Auer und de Luzio 1992; Gumperz 1992a, 1992b), Interaktionaler Linguistik (Auer 2005a, 2005b; Selting und Couper-Kuhlen 2000), Gestenforschung (Kendon 1990, 2004; McNeill 1992, 2000, 2005; Müller 1998; Streeck 1988, 1993, 1995, 2002, 2009a, 2009b) und Multimodalitätsforschung (Deppermann und Schmitt 2007; C. Goodwin 2000a, 2000b, 2000c, 2003a, 2003b, 2007a, 2007b; M. Goodwin 1980a, b, 2006; Goodwin und Goodwin 1986; Heath 1986; Mondada 2007; Müller et al. 2013; Schmitt 2007; Schmitt und Deppermann 2007; Stivers und Sidnell 2005; Streeck 1988, 1993, 1994, 2002; Stukenbrock 2009a, 2009b, 2009c, 2010) angesiedelt. Während sich die Konversationsanalyse zunächst vornehmlich mit Audiodaten beschäftigt und als Untersuchungsgegenstand vor allem auf Telefongespräche zurückgegriffen hat, entwickelte sich die Gestenforschung unabhängig von der Konversationsanalyse. Mit der Weiterentwicklung videotechnischer Aufzeichnungsmittel haben körperlich-visuelle Ausdruckressourcen zunehmend Eingang in die Konversationsanalyse gefunden, wobei nicht nur die Gestik, sondern auch der Blickeinsatz systematisch in die Analyse der interaktiven Ordnung einbezogen wird (Goodwin 1980a, 1986; Goodwin und Goodwin 1986; Heath 1986; Rossano 2012; Schegloff 1984; Streeck 1993, 2002; Streeck und Hartge 1992; Streeck und Knapp 1992). Gegenüber der im anglo-amerikanischen Forschungskontext entstandenen Konversationsanalyse hat sich die Interaktionale Linguistik vornehmlich in Europa als theoretische und methodische Erweiterung der Konversationsanalyse entwickelt. Das Forschungsprogramm der Interaktionalen Linguistik (Selting und Couper-Kuhlen 2000, 2001a, 2001b, 2001c) besteht darin, (gesprochen sprachliche) linguistische Strukturen als systematisch aus den Funktionen natürlicher Interaktion hervorgegangene und auf diese zugeschnittene Ressourcen zu analysieren. Zugleich hat die Interaktionale Linguistik die Analyseperspektive auf multimodale Phänomene erweitert, allerdings spielt die Prosodie dabei bislang gegenüber körperlich-visuellen Ressourcen eine dominante Rolle. Mit der Rezeption der Gestenforschung und der über manuale Gesten hinausgehenden Betrachtung weiterer körperlich-visueller Ressourcen wie Blick (Goodwin 1980; Kendon 1990; Rossano 2012; Stivers und Rossano 2010; Streeck 2002), Körperpositur, Bewegung im Raum (Hausendorf et al. 2012) konstituiert die Multimodalitätsforschung ein die genannten Forschungsrichtungen überspannendes und aus ihnen schöpfendes innovatives Paradigma, das sich hinsichtlich methodischer Stringenz, methodologischer und theoretischer Reflexion in einem kontinuierlichen Entwicklungsprozess befindet. Den Konvergenzzonen

48

3 Korpus und Methode

zwischen den skizzierten Forschungsansätzen verdankt die vorliegende Studie ihre methodisch-methodologische Grundlegung. Bei der Aufbereitung der Daten wurden zwei verschiedene Transkriptionsverfahren verwendet. Die Audiotranskription der Daten folgt den Konventionen des Gesprächsanalytischen Transkriptionssystems GAT (Selting et al. 1998), das inzwischen in einer neubearbeiteten Fassung erschienen ist: GAT II (Selting et al. 2009). Während zu den aus den Videos extrahierten Audiodateien vollständige Verbaltranskripte angefertigt wurden, wurde das Videomaterial nach relevanten deiktischen Phänomenen durchgearbeitet und selektiv transkribiert. Zur Transkription der Videodaten wurde das vom MPI in Nijmegen entwickelte multimodale Annotations-Tool Elan verwendet, das unter folgender Internetadresse frei zugänglich ist24: https://tla.mpi.nl/tools/tla-tools/elan/ Die Transkriptionen wurden in einem mehrschrittigen multimodalen Analyseverfahren ausgewertet. Im ersten Schritt wurden mikroperspektivisch präzise qualitative Einzelfallanalysen zur Erarbeitung der strukturellen Details kontextuell situierter deiktischer Zeigehandlungen durchgeführt. Dabei wurde eine vollzugsrekonstruktive Analyseperspektive gewählt. Im zweiten Schritt wurden Kollektionen vergleichbarer Fälle erstellt und anhand dieser Kollektionen zeigehandlungsspezifische Regularitäten in Datenaggregationen ermittelt. Der dritte Schritt bestand darin, anhand detaillierter Beschreibungen der lokalen Vorkommensweisen deiktischer Zeigehandlungen und der fallübergreifenden Gemeinsamkeiten in einem fortschreitenden Abstraktionsprozess zu den transsituativen Organisationsprinzipien zu gelangen, denen Interaktionsbeteiligte bei deik tischen Zeigehandlungen in der face-to-face-Kommunikation folgen.

24 Unabhängig davon, welche Notationskonventionen zur Transkription benutzt werden, stehen zur Anfertigung multimodaler Transkripte unterschiedliche Annotations-Tools zur Verfügung: Anvil, EXMARaLDA (Extensible Markup Language for Discourse), TASX (Time Aligned Signal data eXchange), MacVisTA (Macintosh Visualization for Situated Temporal Analysis) und Elan. Elan stellt eines der häufig verwendeten und ständig weiter entwickelten Systeme dar. Vgl. zu allgemeinen Evaluationskriterien zur Beurteilung der Vor- und Nachteile unterschiedlicher Systeme ausführlich Rohlfing/Loehr/Duncan et al. (2006) sowie Schütte (2007).

4 P arameter der Zeigehandlung: Ein Modell zur Untersuchung deiktischer Zeigehandlungen in der face-to-face-Interaktion In den nachfolgenden Abschnitten wird schrittweise ein phänomenologisches Modell zur systematischen Beschreibung deiktischer Zeigehandlungen in der face-to-face-Interaktion dargelegt. Die theoretischen Überlegungen werden anhand eines Beispiels aus dem Datenkorpus illustriert.25 Das Modell ist das Produkt der empirischen Forschung zu der vorliegenden Studie und wird aus Gründen der Übersichtlichkeit den empirischen Einzelanalysen vorausgestellt. Die erfolgreiche Zeigehandlung ist an eine ganze Reihe unterschiedlicher Gelingensbedingungen geknüpft, die im Folgenden theoretisch dargelegt, an einem exemplarischen Fall demonstriert und in Kapitel 6 („Empirische Untersuchungen zu den Parametern der Zeigehandlung“) systematisch am Datenmaterial nachgewiesen werden. Die körperlichen, perzeptorischen, kognitiven und interaktiven Komponenten, die das Zeigen in der face-to-face-Kommunikation, d. h. unter den Bedingungen körperlicher Kopräsenz der Beteiligten, konstituieren, werden als Parameter der Zeigehandlung bezeichnet. Ihre Konzeptualisierung geschieht in systematischer Absicht: Die Parameter der Zeigehandlung sollen einzelfallübergreifend die Zeigehandlung hinsichtlich ihrer Phänomenologie, ihres (deixis)theoretischen Status und ihrer funktionalen Bedeutung bestimmen. Aus dem theoretischen Anspruch erklärt sich auch der Begriff Parameter, der auf den Modellcharakter und damit auf eine Abstraktionsebene verweist, auf der die sequenziell, zeitlich, interaktiv und multimodal variablen Instantiierungen der ermittelten Einzelkomponenten grundsätzlich, nicht jedoch in allen Variationsmöglichkeiten erfasst werden können. Die multimodalen Gestalten (packages, vgl. Goodwin 2003a: 238; Heath 1986), die Zeigehandlungen ausmachen, können aus unterschiedlichen Komponenten zusammengesetzt und hinsichtlich ihrer intra- und interpersonellen Koordination (Deppermann und Schmitt 2007) unterschiedlich strukturiert sein. Das Modell versteht sich daher zugleich als heuristisches Instrument zur Exploration potenziell unendlicher Variationsmöglichkeiten. Bei aller Variabilität gibt es eine sequenzielle Logik, nach der die Aufgaben abgearbeitet werden müssen, damit das Zeigen glückt. Sie ist kontextsensitiv

25 Der ausführliche empirische Nachweis zu den Einzelkomponenten des Modells erfolgt in Kapitel 6.

50

4 Ein Modell zur Untersuchung deiktischer Zeigehandlungen

und baut sich schrittweise auf, indem die interaktiv erfolgreiche Bewältigung bestimmter Schritte die Voraussetzung für die Einleitung und Durchführung eines nächsten Schrittes bildet: Zunächst einmal müssen die Beteiligten als kommunikative Grundvoraussetzung in fokussierte Interaktion (Abschnitt 4.1) miteinander treten. Dabei erfordert die Zeigehandlung, dass die Beteiligten visuellen Zugang zueinander und zum umgebenden Raum haben. Wird das Zeigeziel perzeptorisch nicht aufgefunden, kann der kognitive Prozess der Referenzherstellung nicht ablaufen, der wiederum die Voraussetzung für den Prozess der Hypothesenbildung über die interaktive Relevanz der Zeigehandlung darstellt. Der Variabilität der situativen Anforderungsprofile muss eine routinehafte und zugleich flexible Abstimmung der Ressourcen aufeinander und auf das Verhalten des Interaktionspartners – das System der intra- und interpersonellen Koordination – entsprechen. Die Flexibilität betrifft zum einen temporale Qualitäten wie die innere Dauer einer Geste (Streeck 2007: 158), eines Blicks oder einer Körperposition (z. B. Einfrieren einer Haltung, Reorientierungen des Blicks, längeres/kürzeres Monitoring) und zum anderen Aspekte der sequenziellen Organisation. Die Erarbeitung der Einzelkomponenten der Zeigehandlung ist wie folgt gegliedert: Zunächst wird als vorgängige Grundvoraussetzung der face-to-face- Kommunikation die Herstellung fokussierter Interaktion beschrieben (Abschnitt 4.1). Es folgt eine theoretische Ausdifferenzierung des von Goodwin als domain of scrutiny bezeichneten Konzepts (Goodwin 2003a: 221) in zwei perspektivisch zu unterscheidende Konzepte: das des Verweisraums (Abschnitt 4.2) und das des Suchraums. Aufgrund seiner Position im sequenziellen Ablaufformat wird das Konzept des Suchraums erst an späterer Stelle (Abschnitt 4.6) diskutiert. Im Anschluss an den Verweisraum (Abschnitt 4.2) werden die Rolle des verweisenden Körpers (Abschnitt 4.3) sowie die speziellen Funktionen des deiktischen Ausdrucks (Abschnitt 4.4) und der Zeigegeste (Abschnitt 4.5) dargestellt. Dann wird der konzeptionell vom Verweisraum unterschiedene Suchraum (Abschnitt 4.6) erläutert. Daran schließen sich die Diskussion des Vektor-Ziel-Problems bei der Lokalisierung des Zeigeziels (Abschnitt 4.7) und komplementär dazu die Auseinandersetzung mit dem Problem der Referenzherstellung (Abschnitt 4.8) an. Als perzeptorische Aufgabe ist die Lokalisierung des Zeigeziels (Abschnitt 4.7) anhand von perzeptorischen Salienzfaktoren theoretisch von der kognitiven Aufgabe der Identifizierung des Referenten (Abschnitt 4.8) anhand von konzeptuellen Salienzfaktoren zu unterscheiden. Damit einher geht die Ausdifferenzierung des common ground-Begriffs, der in der vorliegenden Untersuchung als Oberbegriff für die Begriffe des gemeinsamen Wahrnehmungsgrunds (common perceptual ground) einerseits und komplementär dazu des gemeinsamen konzeptuellen Grunds (common conceptual ground) andererseits fungiert.

4.1 Fokussierte Interaktion

51

Einen systematischen Stellenwert nehmen im hier vorgestellten, am Standardfall der demonstratio ad oculos (Bühler 1965 [1934]: 80, 105) entwickelten Modell nicht nur die linguistischen und gestischen Ressourcen des Zeigens, sondern auch die unterschiedlichen Wahrnehmungsebenen ein. Sie werden analytisch als Wahrnehmungen erster, zweiter und dritter Ordnung voneinander unterschieden und als perzeptorische Intersubjektivierungsmechanismen bzw. interaktive Kontrollverfahren (proof procedures) zur Herstellung gemeinsamer und als gemeinsam gewusster Wahrnehmung bestimmt (Abschnitt 4.9). Doch erst mit der Etablierung eines gemeinsamen interpretativen Rahmens für einen Wahrnehmungsgegenstand wird dieser vom gemeinsam fokussierten Perzeptionsphänomen (Zeigeziel) zu einem geteilten Kognitionsgegenstand (Referenten). Als kognitives Korrelat und Komplementärkomponente zur Intersubjektivierung der Wahrnehmung wird daher als letzter Parameter die Intersubjektivierung des Verstehens behandelt (Abschnitt 4.10). Die Darstellung schließt mit einer Zusammenschau der erarbeiteten perzeptorischen, kognitiven und interaktiven Parameter und einer Rekapitulation theoretischer Schlüsselkonzepte, die ergänzend aus der Modellierung der deiktischen Zeigehandlung in der face-to-face-Kommunikation resultieren.

4.1 Fokussierte Interaktion Die erste Voraussetzung für das Gelingen einer Zeigehandlung ist der Zustand fokussierter Interaktion zwischen den Interaktionsbeteiligten. Der von Goffman (1963: 24) geprägte Begriff der fokussierten Interaktion (focused interaction) stellt ein zentrales interaktionsanalytisches Konzept zur Unterscheidung zwischen der reinen Kopräsenz von Menschen in einer sozialen Situation und ihrer absichtsvollen wechselseitigen Orientierung aufeinander dar. Diese beiden Zustände werden von Goffman als zwei verschiedene Stufen menschlichen Kommunikationsverhaltens konzeptualisiert (1963: 24): The communicative behavior of those immediately present to one another can be considered in two steps. The first deals with unfocused interaction, that is, the kind of communication that occurs when one gleans information about another person present by glancing at him, if only momentarily, as he passes into and then out of one’s view. Unfocused interaction has to do largely with the management of sheer and mere copresence. The second step deals with focused interaction, the kind of interaction that occurs when persons gather close together and openly cooperate to sustain a single focus of attention, typically by taking turns at talking.

52

4 Ein Modell zur Untersuchung deiktischer Zeigehandlungen

Der Begriff der fokussierten Interaktion überschneidet sich mit den von Goffman an anderer Stelle (1964: 88 f., 135) entwickelten Begriffen der Begegnung (encounter) und des face engagement. Wie die folgende Definition verdeutlicht, weisen die drei Begriffe eine so große Nähe zueinander auf, dass eine trennscharfe Differenzierung nicht möglich ist. Stattdessen tragen die Konzepte, wie dies für Goffmans oftmals mäandernde Begrifflichkeiten typisch ist (Drew und Wootton 1988: 2; Williams 1988: 71), zur wechselseitigen Erhellung bei. Demnach kommt eine Begegnung zustande, wenn zwei oder mehr Personen in einer sozialen Situation die unfokussierte Interaktion verlassen, um miteinander in ein face engagement einzutreten. Das bedeutet, dass sie sich wechselseitig als ratifizierte Teilnehmer zur Aufrechterhaltung eines gemeinsamen visuellen und kognitiven Aufmerksamkeitsfokus anerkennen (Goffman 1963: 88 f.): They can proceed from there to engage one another in focused interaction, the unit of which I shall refer to as a face engagement or an encounter. Face engagements comprise all those instances of two or more participants in a situation joining each other openly in maintaining a single focus of cognitive and visual attention – what is sensed as a single mutual activity, entailing preferential communication rights.26

Wie in anderen Zusammenhängen auch stellt die fokussierte Interaktion die Grundvoraussetzung für koordinierte gemeinsame Aktivitäten dar. Während bei kommunikativen Handlungen, die nicht auf eine visuelle Orientierung der Beteiligten aufeinander angewiesen sind, eine fokussierte Interaktion allein durch akustisch-auditive Mittel hergestellt werden kann27 (z. B. summons und answer bei der Eröffnung eines Telefongesprächs), verlangen face engagements (Goffman 1963: 83 ff.) in der Regel die Herstellung einer gemeinsamen visuellen Aufmerksamkeitsorientierung, die im Kontext der jeweiligen Aktivitäten interpersonell koordiniert wird und eine systematisch beschreibbare Organisation des Blickverhaltens zeitigt (vgl. dazu Goodwin 1980; Kendon 1990; Heath 1986; Streeck 1993, 2002). Zwingend wird die visuelle Wahrnehmung bei deiktischen Zeigehandlungen, mittels derer ein Sprecher die Aufmerksamkeit seines Adressaten auf ein sichtbares Phänomen im umgebenden Raum lenken möchte, d. h. bei den von Bühler als demonstratio ad oculos (Bühler 1965 [1934]: 80) bezeichneten Fällen, die den Gegenstand des hier entwickelten Modells bilden.

26 Vgl. auch Goffman (1964: 135): „two or more persons in a social situation jointly ratify one another as authorized co-sustainers of a single, albeit moving, focus of visual and cognitive attention. These ventures in joint orientation might be called encounters or face engagements.“ [Hervorhebung i. O.] 27 Diese Situationen schließt Goffman (1963) explizit aus seinem Gegenstandsbereich aus.

4.1 Fokussierte Interaktion

53

Die fokussierte Interaktion ist folglich kein die demonstratio ad oculos et ad aures auszeichnendes Merkmal, wohl aber stellt sie in der spezifischen Form der reziproken visuellen Orientierung der Beteiligten aufeinander die Bedingung der Möglichkeit einer visuellen Zeigehandlung dar. Sofern sie nicht bereits etabliert ist, kann die Herstellung fokussierter Interaktion mit der Herstellung des verweisenden Körpers des Sprechers zusammenfallen. Dies geschieht insbesondere dann, wenn der Sprecher zur Herstellung fokussierter Interaktion eine Fokussierungsaufforderung (summons) verwendet, die eine visuelle Aufmerksamkeits orientierung des Adressaten auf den Körper des Sprechers konditionell relevant macht. In diesem Fall können die körperliche Reorientierung und die visuelle Aufmerksamkeitsausrichtung des Adressaten auf den Sprecher als nonverbale Fokussierungsbestätigung dienen oder redebegleitende visuelle Komponente einer verbalen Fokussierungsbestätigung sein. Das folgende Beispiel illustriert, wie die nonverbale Fokussierungsbestätigung des Adressaten zur Herstellung fokussierter Interaktion mit seiner Wahrnehmung des verweisenden Körpers der Zeigenden zusammenfällt. Das Beispiel stammt aus der ersten „Big Brother“-Staffel. Die Container-Bewohner haben einen Hüpfball bekommen und Sabrina und Jürgen probieren ihn aus. Dabei geraten sie in einen infantilisierenden Neckmodus, in dem Sabrina die Rolle des kleinen Kindes und Jürgen die des Erwachsenen spielt. Als Jürgen die fokussierte Interaktion verlässt, macht Sabrina ihn mit einer deiktischen Zeigehandlung auf ein sichtbares Phänomen im umgebenden Raum aufmerksam. Die Analyse beginnt mit dem Moment, in dem die Beteiligten die fokussierte Interaktion verlassen haben und körperlich voneinander abgewandt sind. Die Auflösung der fokussierten Interaktion kommt dadurch zustande, dass Jürgen, statt einer vorangegangenen Aufforderung Sabrinas nachzukommen, sich umdreht, auf diese Weise die F-formation (Kendon 1990: 211) auflöst und weggeht. Sabrina ist weiterhin mit dem Hüpfball beschäftigt, während Jürgen den Interaktionsraum verlässt und Sabrina im Fortgehen den Rücken zuwendet. Die Körperausrichtung der Beteiligten formt damit keinen o-space (Kendon 1990: 211) mehr.28 Ihre transactional segments (Kendon 190: 211) überschneiden sich nicht, sondern weisen in entgegengesetzte Richtungen und eröffnen unterschiedliche,

28 Unter o-space versteht Kendon den gemeinsamen Transaktionsraum, der zwischen Inter agierenden besteht, die sich zu einem gemeinsamen Interaktionsprojekt zusammengefunden haben (Kendon 1990: 211): „When two or more persons come to do something together, they are liable to arrange themselves in such a way that their individual transactional segments overlap to create a joint transactional space. This joint transactional space, which is the space between the interactants over which they agree to maintain joint jurisdiction and control, will be called o-space.“ [Hervorhebungen i. O.]

54

4 Ein Modell zur Untersuchung deiktischer Zeigehandlungen

unabhängige Aktivitätsräume (Abb. 1). In den folgenden Abbildungen werden gestrichelte Linien für die Blickorientierung der Beteiligten und durchgezogene Linien zur Angabe von Zeigegesten verwendet: Abbildung 1

Anschließend versucht Sabrina mit Jürgen erneut in fokussierte Interaktion zu treten, indem sie ihn mit einer Fokussierungsaufforderung (Z. 1: HEY doofer onkel;), einem Imperativ (Z. 2: guck_ma HIER,) und einem spielerischen Vorwurf (Z. 3: was_du geMACHT hast;) anruft. Während sie die Anrede onkel artikuliert, wendet sie ihm kurz ihren Blick zu und kann während dieser Monitoring-Aktivität (Goodwin 1980; Schmitt und Deppermann 2007: 121) wahrnehmen, dass Jürgen sie seinerseits nicht wahrnimmt (Abb. 2). Um Sabrinas Fokussierungsaufforderung und ihrer anschließenden Aufforderung zur visuellen Wahrnehmung nachzukommen, müsste Jürgen sein eigenes Vorhaben – in entgegengesetzter Richtung vom früheren Interaktionsschauplatz wegzugehen – aufgeben oder zumindest suspendieren und sich entweder vollständig umwenden oder Kopf und Blick in Richtung der Lautquelle und damit auf den Körper seiner Interaktionspartnerin orientieren. Doch er reagiert weder nach der initialen vokativischen Fokussierungsaufforderung (Z. 1), noch in unmittelbarem Anschluss an den Imperativ (Z. 2). Erst nachdem Sabrina ihren Turn beendet hat (Z. 3), beginnt Jürgen in der 2-sekündigen Pause (Z. 4) seinen Kopf umzuwenden und in Richtung Sabrina zu blicken. Seine Reaktion erfolgt also mit deutlicher Verzögerung (Abb. 3–4):

4.1 Fokussierte Interaktion

55

Abbildung 2

1 2 3 4 5 6 7 8

Sbr:

Sbr:

(2.0) A:lles macht der BAH, (0.45) das_s !BAH!? (0.7)

Indem er sich umdreht (Abb. 4), bestätigt Jürgen Sabrinas Fokussierungsaufforderung, die eine verbale Fokussierungsbestätigung bzw. als nonverbale Fokussierungsbestätigung eine Reorientierung seiner visuellen Aufmerksamkeit auf den Körper der Sprecherin konditionell relevant gemacht hat. Damit ist die fokussierte Interaktion zwischen den Beteiligten hergestellt: Abbildung 3

Abbildung 4

56

4 Ein Modell zur Untersuchung deiktischer Zeigehandlungen

4.2 Verweisraum Bevor Zeigende einen bestimmten Raum oder eine in diesem Raum visuell wahrnehmbare Entität für ihre Adressaten relevant setzen, müssen sie sich zunächst selbst im umgebenden Raum orientieren. Laut Ehlich (1982: 127) unternehmen Zeigende damit eine vorgängige „Fokussierung“, aus der das „Handlungsproblem“ entsteht, „den Hörer zu einer identischen oder doch ähnlichen Fokussierung von dessen Aufmerksamkeit zu bewegen“. Gemäß dem hier vorgestellten Modell geht es also um die Frage, wie der Raum, in dem sich das Zeigeziel befindet, zunächst aus der Perspektive des Zeigenden und im folgenden Schritt interaktiv – d. h. dem beteiligungsspezifischen Anforderungsformat gemäß vom Zeigenden und vom Adressaten – hervorgebracht wird. Um die mit den beteiligungsspezifischen Anforderungen zusammenhängenden Unterschiede zwischen Zeigendem und Adressaten empirisch beschreibbar und theoretisch modellierbar zu machen, ist eine analytische Ausdifferenzierung des von Goodwin (2003a: 221) entwickelten domain of scrutiny-Konzepts in zwei perspektivisch komplementäre Konzepte, das des Verweisraums (Zeigender) und das des Suchraums (Adressat), erforderlich. Auch wenn deiktische Zeigehandlungen grundsätzlich als gemeinsame Herstellungshandlungen, als joint action im Sinne Clarks (1996), zu begreifen sind, bleibt für einen Ansatz, der in gleichem Maße den perzeptorischen, kognitiven und interaktiven Aspekten Rechnung tragen will, die theoretische Notwendigkeit bestehen, zwischen den individuellen Anforderungs- und Partizipationsprofilen der Beteiligten zu unterscheiden. Gemeinsames Handeln (joint action) wird demnach durch interpersonell koordinierte, individuelle Partizipationshandlungen (participatory actions, nach Clark 1996: 19) konstituiert. Im Rahmen des hier vorgestellten Modells dient der Terminus Verweisraum daher als Konzept für den Raum, der das Zeigeziel enthält und auf den Zeigende sich selbstorganisatorisch mittels Blick- und Körperausrichtung perzeptorisch, räumlich und kognitiv orientieren, wenn bzw. bevor sie eine deiktische Orientierungshandlung am Interaktionspartner vollbringen wollen. Demgegenüber fungiert der Terminus Suchraum (vgl. Abschnitt 4.6) als Konzept für den Raum, auf den Zeigende ihre Adressaten mittels verbaler und visueller Ausdrucksressourcen als relevanten Raum zum Auffinden des Zeigeziels orientieren und den Adressaten aufgrund und unter Zuhilfenahme der verbalen und visuellen Orientierungshilfen des Zeigenden herstellen. An dem aus dem vorherigen Abschnitt bereits bekannten Beispiel wird empirisch nachweisbar, dass Zeigende eine Reihe körperlicher Aktivitäten systematisch einsetzen, um zunächst für sich selbst den Raum für ihre deiktisch-gestische Referenzierungshandlung herzustellen. Diese intrapersonellen Koordinierungsaktivi-

4.2 Verweisraum

57

täten können unter Umständen außerhalb des visuellen Wahrnehmungsfelds des Adressaten bzw. unabhängig von seiner visuellen Aufmerksamkeitsorientierung vollzogen werden. Das ist nicht immer der Fall und hängt im vorliegenden Beispiel mit der Tatsache zusammen, dass der Adressat auf die verbale Fokussierungsaufforderung nicht sofort reagiert, sondern sich weiter vom gemeinsamen Interaktionsschauplatz fortbewegt. Durch diese räumliche, perzeptorische und interaktive Aufmerksamkeitsdivergenz zwischen den Beteiligten wird ein für die Modellierung der Zeigehandlung wichtiges Detail sichtbar, das sich in Fällen, in denen die Interaktionspartner bereits wechselseitig aufeinander orientiert sind, der Beobachtung entzieht: die Differenz zwischen Verweis- und Suchraum.29 Wie in Abschnitt 4.1 zu sehen war, befinden sich Sabrina und Jürgen zu Beginn der Sequenz nicht in fokussierter Interaktion und sind körperlich auf unterschiedliche Räume orientiert. Während Jürgen sich abwendet und den Interaktionsraum verlässt, ist Sabrina weiter mit dem Hüpfball beschäftigt, der zuvor im Mittelpunkt der gemeinsamen Aufmerksamkeit stand. Ihr Blick ist auf eine Stelle am Boden gerichtet. Mit ihrem linken Arm weist sie in einer angedeuteten, aber nicht voll ausgeführten Geste in dieselbe Richtung. Sie hebt das rechte Bein an und platziert es neben dem linken. Dadurch bilden beide Beine mit dem späteren Zeigeziel ein Dreieck, dessen Basis die Linie zwischen dem linken und dem rechten Bein und dessen Spitze das Zeigeziel darstellt (Abb. 5: das Dreieck verdeutlicht die Positionierung der unteren Körperhälfte, d. h. des Beckens, der Beine und Füße in Relation zum künftigen Zeigeziel; der Kreis markiert den Ort, an dem sich das künftige Zeigeziel befindet):

29 Diese Unterscheidung ist bei Ehlich (1978: 85 f.) in dem Begriff Verweisraum bzw. dessen Unterbegriff Sprechzeitraum und dem Konzept der deiktischen Prozedur für die vom Sprecher beim Hörer bewirkte Orientierungshandlung bereits angelegt, aber weder empirisch noch theoretisch anhand von Videodaten, die erst den gemeinsamen Wahrnehmungsraum zweier kopräsenter Aktanten analytisch zugänglich machen, ausgearbeitet worden. Die wichtige Erkenntnis, wonach die „Verweisung […] a) Ausdruck (Exothese) einer Fokussierung [ist], die S auf Elemente des Verweisraumes selbst vorgenommen hat, b) Aufforderung an den Hörer H, diese Fokussierung seinerseits nachzuvollziehen und so für S und H eine gemeinsame Fokussierung innerhalb des Verweisraumes herzustellen“ (Ehlich 1978: 93), bedarf einer raum- und koordinationstheoretischen Fundierung.

58

4 Ein Modell zur Untersuchung deiktischer Zeigehandlungen

Abbildung 5

Es handelt sich um intrapersonelle Koordinierungsaktivitäten, die die „Selbst organisation“ (Deppermann und Schmitt 2007: 32) der Zeigenden, also der selbststeuernden Abstimmung ihrer unterschiedlichen Ressourcen aufeinander, dienen. Durch den koordinierten Einsatz von Blick, Armbewegung und einer entsprechenden Orientierung ihres Körpers im Raum (Kopf- und Brustkoordinaten, Positionierung der Füße) erzeugt Sabrina zunächst für sich selbst räumlich, perzeptorisch und kognitiv einen möglichen Verweisraum, den sie im weiteren sequenziellen Geschehen interaktiv relevant setzen und für den Interaktionspartner zum Suchraum machen kann oder auch nicht. Nachdem sie durch Blick und Körperorientierung einen möglichen Verweisraum hergestellt hat, blickt Sabrina kurz zum Adressaten (Abb. 6), um dessen Aufmerksamkeitsorientierung zu kontrollieren, und dann wieder zurück auf den Boden. Gleichzeitig beginnt sie mit dem rechten Arm eine Zeigegeste auszuführen (Abb. 7 – die Geste ist dort z. T. durch Jürgen verdeckt): Abbildung 6

Abbildung 7

Die Zeigegeste wird vollständig ausgeführt und in ihrem Gipfelpunkt eingefroren. Sabrinas Blick bleibt währenddessen auf den Verweisraum gerichtet. Nachdem die Zeigegeste den Gipfelpunkt erreicht hat, wendet Sabrina ihren Blick erneut

4.3 Verweisender Körper

59

dem Adressaten zu (Abb. 8). Diese Doppelausrichtung wird gehalten, bis der Adressat sich umgedreht hat (Abb. 9): Abbildung 8

Abbildung 9

An diesem Punkt in der emergierenden Interaktion ist der Adressat für einen kurzen Moment zunächst auf den Körper der Zeigenden orientiert, der sich durch die funktional eingesetzte multimodale Doppelausrichtung als verweisender Körper konstituiert. Die Weiterweisung auf den Raum, in dem das Zeigeziel aufzufinden ist und den der Adressat daher als Suchraum herzustellen hat, geschieht durch die eingefrorene Zeigegeste (vgl. Abschnitt 4.5). Zusammenfassend lässt sich festhalten, dass Zeigende inner- oder außerhalb des Sichtfelds ihres Adressaten für sich selbst einen Verweisraum identifizieren, der erst dadurch, dass er für den Adressaten relevant gemacht und von ihm selbst als relevant anerkannt wird, den Status des Suchraums erhält. Die Herstellung des Verweisraums gehört zur räumlichen, perzeptorischen und kognitiven Selbst organisation des Zeigenden. Koordinationstheoretisch formuliert handelt es sich bei den zur Verweisraumetablierung eingesetzten multimodalen Herstellungs aktivitäten primär um intrapersonelle Koordinierungshandlungen.

4.3 Verweisender Körper Unabhängig davon, ob eine fokussierte Interaktion bereits in Gang ist oder nicht, muss bei einer Zeigehandlung der Körper des Zeigenden als Realisierungsschauplatz der Zeigegeste in Erscheinung treten. D. h. der Zeigende muss seinen Körper als perzeptorisch relevante, semiotische Ressource in den visuellen Aufmerksamkeitsfokus des Adressaten rücken. Dies erfordert vom Zeigenden entsprechende körperliche Displays, die genau mit dem Aufmerksamkeitsverhalten des Adressaten koordiniert werden müssen. Der Zeigende muss interaktiv sicherstellen, dass der Adressat ihn erstens sehen kann, dass er zweitens seine Zeigegeste wahrnimmt und dass er diese drittens in ihrer semiotischen Qualität als intentional

60

4 Ein Modell zur Untersuchung deiktischer Zeigehandlungen

gebrauchtes Verweisinstrument auf ein Referenzobjekt und nicht als zufällige körperliche Verhaltensweisen begreift. Während die Punkte eins und zwei perzeptorische Parameter benennen, die die visuelle Aufmerksamkeitsorientierung der Beteiligten aufeinander und auf ein sichtbares Phänomen im umgebenden Raum betreffen, erfasst der dritte Punkt als sozio-kognitive Voraussetzung die Erkennbarkeit einer kommunikativen Absicht (communicative intention, Grice 1957). Sie spielt auch in der phy logenetischen Sprachentwicklung eine Schlüsselrolle für die Herausbildung von cooperative reasoning (Tomasello 2008: 205) und markiert einen entscheidenden Entwicklungssprung im Hinblick auf die interpersonelle Koordinierung (Levinson 1995: 411): „There is an extraordinary shift in our thinking when we start to act intending that our actions should be coordinated with – then we have to design our actions so that they are self-evidently perspicuous“. Laut Tomasello (2008) stellen sowohl die joint attention als auch die Kenntlichmachung und Erkennbarkeit der kommunikativen Absicht gattungsspezifische Unika des Menschen dar. Diese perzeptorischen und kognitiven Parameter, die sich als evolutionäre Schlüsselmechanismen erwiesen haben, strukturieren auch heute in systematischer Weise deiktische Orientierungshandlungen, die in der face-to-face-Interaktion im Rekurs auf die linguistischen und gestisch-visuellen Ressourcen voll ausdifferenzierter Kommunikationssysteme vollzogen werden. Gelingt es dem Zeigenden nicht, seine körperlichen Displays als „self-evidently perspicuous“ (Levinson 1995: 411) und kommunikativ intentional einzurichten, sondern erscheinen sie dem Adressaten als zufällige Idiosynkrasien, misslingt der Zeigeakt. Aufgrund ihres relativ hohen Grades an formaler Konventionalisierung sind Zeigegesten allerdings weniger der Gefahr ausgesetzt, in ihrer kommunikativen Funktion vom Adressaten verkannt zu werden als ad hoc gebildete Gesten wie beispielsweise ikonische bzw. darstellende Gesten. Für den Adressaten besteht die interaktive Anforderung darin, den Körper des Zeigenden als perzeptorisch relevant und darüber hinaus als semiotisch-perzeptorische Zwischenstation zu erkennen. Dazu muss er den Körper des Zeigenden als Mittel zum Zweck und nicht als das eigentliche Ziel seiner Aufmerksamkeitsausrichtung erkennen: So wie ein Zeigender seinen Körper als semiotische Ausdrucksressource einsetzt, um die Aufmerksamkeit des Adressaten in einer bestimmten Weise räumlich zu steuern, nutzt der Adressat den Körper des Zeigenden als semiotisch strukturierten physischen Ausdrucksraum, um eine Entität in einem anderen semiotischen Raum zu finden. Die relevanten Operationen des Adressaten lassen sich am funktionalen Unterschied zwischen der Ich- und der Hier-Deixis (Bühler 1965 [1934]: 109) verdeutlichen: Während bei der Ich-Deixis der Körper des Zeigenden das stimmlich durch die Herkunftsqualität der Ich sagenden Lautquelle indizierte Zeigeziel ist

4.3 Verweisender Körper

61

und seine Person den Referenten darstellt, dient bei der Hier-Deixis der Körper des Zeigenden als weiterweisendes Zeichen auf den ihn umgebenden Raum bzw. auf eine sich im umgebenden Raum befindliche Entität.30 Die Weiterweisung kann durch eine Zeigegeste oder einen zeigenden Blick verkörpert werden. Im Fall der Ich-Deixis hat der suchende Blick des Adressaten also sein Ziel erreicht, sobald er den Körper des Zeigenden visuell aufgefunden und damit die perzeptorische (nicht notwendigerweise die referenzielle) Aufgabe bearbeitet hat. Demgegenüber verlangt die Hier-Deixis, dass der Adressat in einem weiteren Schritt über das Hier-sagende Ich hinaus einen anderen Raum bzw. ein darin befindliches Zeigeziel auffindet, indem er den Hier-Sagenden nicht als Ziel, sondern als semiotisch-perzeptorisches Zwischenziel seiner Aufmerksamkeitsorientierung begreift.31 Die Besonderheit, dass der Körper des Zeigenden nicht das Ziel der Aufmerksamkeitsorientierung darstellt, sondern diesem als Etappenziel zwischengeschaltet ist, erfasse ich durch den Begriff perzeptorisch-intermediär. An

30 Bühler (1965 [1934]: 109 f.) beschreibt die Orientierungsprozesse des Adressaten bei der Hier-Deixis im Unterschied zur Ich-Deixis wie folgt: „Für den sehenden Signalempfänger ist nichts natürlicher, als daß er sich der Schallquelle zuwendet. Die ist bei sprachlichen Verkehrszeichen der Sprecher und steht am Ort des Sprechers. Das hier und ich verlangen diese Reaktion gemeinsam oder legen sie zumindest nahe. Soweit geht das Identische in der Funktion als Zeigwörter. Dann aber spaltet sich die Intention (das Interesse), das sie empfehlen, um das eine Mal die Position und Milieuumstände des Senders und das andere Mal den Sender selbst mit physiognomischem oder pathognomischem Blick zu erfassen. Ein hier enthält die Aufforderung, an der Wegscheide die erste, und ein ich enthält die Aufforderung, an der Wegscheide die zweite Interessenrichtung zu verfolgen. Das ist die voraussetzungsärmste und allgemeinste Analyse, die man zu bieten vermag.“ 31 Relevant im Hinblick auf die Frage nach den multimodalen Realisierungsformaten der Ichgegenüber der Hier-Deixis sind die Beobachtungen von Pizzuto und Capobianco (2008) zu distinktiven Blickorganisationsmustern. Pizzuto und Capobianco (2008) unterscheiden zwischen zwei verschiedenen Zeigeformaten, erstens dem ostensive pointing, bei dem die visuelle Aufmerksamkeit des Adressaten auf Objekte, Personen oder Ereignisse in der außersprachlichen, physischen Welt gelenkt wird, und zweitens dem pointing to self and one’s own addressee, bei dem deiktische Personenreferenz auf die am Kommunikationsereignis unmittelbar Beteiligten stattfindet. Pizzuto und Capobianco beschränken sich auf die Feststellung, dass beim ostensive pointing eine entsprechende Blickorientierung des Adressaten in Richtung der Zeigegeste erfolgt, während beim pointing to self and addressee die Blicke von Sprecher und Adressat reziprok auf die Gesichter ausgerichtet bleiben, ohne dass der Adressat der Zeigegeste perzeptorisch folgt. Diese Beobachtungen erweitern die bereits von Bühler getroffene theoretische Unterscheidung zwischen der Ich- und der Hier-Deixis um die Kategorie der Du-Deixis, deren multimodales Realisierungsformat gemäß Pizzuto und Capobianco (2008) dem der Ich-Deixis entspricht. Zugleich bestätigen sie auf der Grundlage multimodal ausgerichteter empirischer Forschung die von Benveniste postulierte, bei ihm rein auf die Grammatik bezogene, deixistheoretische Grundunterscheidung zwischen erster/zweiter Person einerseits und dritter Person andererseits.

62

4 Ein Modell zur Untersuchung deiktischer Zeigehandlungen

dieser Schaltstelle im sequenziellen Geschehen der Zeigehandlung ist der Körper des Zeigenden als Mittel zum Zweck der Aufmerksamkeitsfokussierung auf ein Anderes und übt daher eine instrumentelle Funktion aus. Anhand des in den vorherigen Abschnitten zitierten Beispiels lassen sich die Herstellungshandlungen, mittels derer Zeigende ihren Körper in der Interaktion situations- und adressatenspezifisch als perzeptorisch relevante semiotische Ressource konstituieren, exemplarisch darstellen. Wie bereits festgestellt wurde, reagiert Jürgen verzögert auf Sabrinas Fokussierungs- und Betrachtungsaufforderung. Das bedeutet, dass alles, was sie bis zum Zeitpunkt seiner visuellen Reorientierung durch ihre körperlichen Ausdrucksressourcen (Zeigegeste, Blick, Kopfund Körperorientierung) leistet, aufgrund der face-to-back-Orientierung der beiden für ihn nicht sichtbar abläuft. Doch muss derjenige, der eine Zeigehandlung vollbringt, sicherstellen, dass dies sichtbar für den anderen geschieht. Bevor also ein ausgewählter Raum oder Gegenstand durch eine Zeigegeste als gemeinsamer Aufmerksamkeitsfokus hergestellt werden kann, muss nicht nur dieser Raum perzeptorisch relevant gesetzt werden, sondern der Zeigende, der dies tut, muss sich zuallererst selbst bzw. seinen Körper als semiotische Ressource relevant setzen. Die Relevantsetzung des eigenen Körpers der Zeigenden kann in Fällen mangelnder fokussierter Interaktion oder divergierender perzeptorischer Aufmerksamkeitsfoci nur verbal bzw. akustisch erfolgen, wie dies im Datenbeispiel der Fall ist. Das alternative multimodale Realisierungsformat besteht darin, dass ein Zeigender, der bereits von einem Monitoring seiner körperlichen Aktivitäten durch den Adressaten ausgehen kann, seinen Blick als sequenziell leicht vorauslaufendes Kontextualisierungsmittel für die Geste einsetzt. Auf diese Variante wird in den empirischen Analysen (vgl. Kapitel 6) zurückzukommen sein. In der Beispielsequenz setzt die Sprecherin simultan zu den körperlich-visuellen Ressourcen verbale Mittel ein (die Fokussierungsaufforderung HEY in Z. 1, ein Wahrnehmungsverb im Imperativ guck_ma und das proximale Lokaldeiktikon HIER in Z. 2), deren Funktion darin besteht, den Adressaten zu einer körperlich-räumlichen Reorientierung zu bewegen und seine visuelle Wahrnehmung ein- und anzuleiten. Den von der Sprecherin in der zweiten Turnkonstruktionseinheit (Z. 2) eingesetzten sprachlichen Mitteln – dem Imperativ guck mal und dem proximalen Lokaldeiktikon HIER – ist gemeinsam, dass sie erstens den Körper der Zeigenden perzeptorisch in den Fokus rücken und damit zweitens eine Reihe körperlicher Handlungen des Adressaten konditionell relevant setzen (vgl. zu den besonderen Funktionen des Deiktikons den nächsten Abschnitt). Dabei kann der Imperativ „als eine Übertragung vom deiktischen ins expeditive Feld (Lenkfeld)“ (Zifonun et al. 1997: 321) betrachtet werden, durch den die durch das Deiktikon unternommene Aufmerksamkeitssteuerung des Adressaten zusätzlich intensiviert wird. Diese Intensivierung erklärt sich aus der Tatsache, dass die

4.3 Verweisender Körper

63

konditionell erwartbaren Adressatenreaktionen (die durch die Fokussierungsaufforderung konditionell relevant gesetzte Fokussierungsbestätigung zur Wiederherstellung fokussierter Interaktion; die durch die Aufforderung zu gucken konditionell relevant gesetzte Körper- und Blickzuwendung) zunächst ausbleiben. Die Operationen bewirken auf je unterschiedliche Weise, dass Sabrinas Körper als visuell wahrzunehmende semiotische Ressource etabliert wird. Während das proximale Lokaldeiktikon HIER die unmittelbare Umgebung der Lautquelle bzw. der den Laut produzierenden Interaktantin als relevanten Raum etabliert und damit eine räumlich-perzeptorische Nähe zwischen dem Körper der Zeigenden und dem relevanten Raumausschnitt32 postuliert, setzt der verbale Imperativ als erster Teil einer multimodalen Paarsequenz als zweiten Teil körperliche Aktivitäten des Adressaten relevant, die zur Realisierung der durch die Semantik des Verbs definierten Handlung erforderlich sind. Um der Aufforderung nachzukommen und zu „gucken“, müsste Jürgen sich visuell in Richtung der Lautquelle und damit auf den Körper seiner Interaktionspartnerin orientieren. Doch erst nachdem Sabrina ihren Redezug mit einem spielerischen Vorwurf an ihn beendet hat (Z. 3: was du geMACHT hast;), dreht er sich zu ihr um (Abb. 10–11):

1 2 3

Sbr:

Abbildung 10

4

Abbildung 11

(2.0)

32 Der hier noch vortheoretisch als „relevanter Raumausschnitt“ bezeichnete Raum wird im vorliegenden Modell in Verweisraum (Abschnitt 4.2) und Suchraum (Abschnitt 4.6) ausdifferenziert.

64

4 Ein Modell zur Untersuchung deiktischer Zeigehandlungen

Aufgrund der zeitlichen Platzierung seiner Reaktion nach ihrer Turnbeendigung erfüllt er damit obendrein zweitens ihre Aufforderung zur visuellen Wahrnehmung ihrer körperlichen Displays, die explizit in dem Imperativ (guck_ma) formuliert und implizit in der von dem proximalen Lokaldeiktikon (HIER) verlangten Orientierungshandlung ausgedrückt ist. Das bedeutet, dass Jürgens nonverbale Fokussierungsbestätigung auf Sabrinas Bemühen um die Herstellung der fokussierten Interaktion (vgl. Abschnitt 4.1) mit seiner visuellen Herstellung des verweisenden Körpers der Sprecherin als Reaktion auf ihren Imperativ und die an ihm vollzogene deiktische Orientierungshandlung zusammenfallen. Er arbeitet damit diese Aufgaben alle zugleich ab. Es gibt Fälle, in denen Sprecher die Aufmerksamkeit ihrer Adressaten auf ihren eigenen Körper lenken und diesen selbst bzw. eine bestimmte Körperregion zum Zeigeziel machen. Dies ist insbesondere beim Zeigen von Verletzungen und anderen kontingent am Körper auftretenden Merkmalen, aber auch bei der Lokalisierung von nicht sichtbaren, inneren Vorgängen, Schmerzen etc. der Fall und gehört zu den Standardaktivitäten z. B. in der Arzt-Patienten-Interaktion. Beim Zeigen am eigenen Körper ist der Körper des Zeigenden identisch mit dem Körper, auf den gezeigt wird, so dass der Körper des Zeigenden zum semiotischen Doppelraum wird. Er ist sowohl zeigender Körper bzw. Zeigesubjekt als auch gezeigter Körper bzw. Zeigobjekt. Das bedeutet, dass der Körper, der die Zeigegesten ausführt, zugleich den Verweisraum seiner eigenen Zeigegesten darstellt (vgl. dazu ausführlich Stukenbrock 2008 sowie Kapitel 7.2). Das Problem begründet zum einen die theoretische Notwendigkeit der Unterscheidung zwischen dem Körper des Zeigenden als semiotischem Gesamtausdrucksraum und der Zeigegeste als spezifischem, davon (als Figur) perzeptorisch und funktional abzuhebendem vektoriellen Verweisinstrument (vgl. Abschnitt 4.5). Zum anderen verdeutlicht es, dass eine weitere konzeptuelle Unterscheidung getroffen werden muss: Die Unterscheidung zwischen verweisendem Körper als Konzept für den als perzeptorisch intermediär zu begreifenden körperlichen Ausdrucksraum des Zeigenden und Verweisraum als Konzept für den Raum, der das Zeigeziel enthält und auf den Zeigende sich selbst perzeptorisch, räumlich und kognitiv orientieren, wenn sie eine Zeigehandlung ausführen. Diese Unterscheidung ist erforderlich, um Fälle, in denen sich (wie beim Zeigen am eigenen Körper) beide Räume überlagern und die daher eine andere Ressourcenorganisation erfordern, präzise von solchen unterscheiden zu können, in denen dies nicht der Fall ist.

4.4 Deiktischer Ausdruck

65

4.4 Deiktischer Ausdruck Konstitutiv für die deiktische Zeigehandlung, so wie sie in der hier vorgestellten Theorie modelliert wird, ist der Gebrauch eines deiktischen Ausdrucks in Verbindung mit einer (Zeige-)Geste. Der deiktische Ausdruck bildet zusammen mit der Zeigegeste, die im nächsten Abschnitt behandelt wird, und weiteren körperlich-visuellen Ressourcen wie Blick, Körperpositur und Orientierung im Raum eine multimodale Ausdrucksform, die vom Zeigenden in interpersoneller Koordinierung mit dem Adressaten vollzogen wird. Die multimodalen Einzelkomponenten der Zeigehandlung werden im interaktiven Vollzug von den Beteiligten online hervorgebracht. Daraus folgt, das die Frage nach der Bedeutung und Funktion deiktischer Ausdrücke nicht unabhängig von der Untersuchung des multimodalen Gesamtgeschehens der deiktischen Zeigehandlung beantwortet werden kann, an dem Zeigende und Adressaten gleichermaßen beteiligt sind. Die interpersonelle Koordinierung bestimmt die Wahl eines deiktischen Ausdrucks ebenso wie der gewählte deiktische Ausdruck die interpersonelle Koordinierung perzeptorisch, kognitiv und interaktiv organisiert. Temporalität ist ein weiterer wichtiger Faktor, der die Wahl eines deiktischen Ausdrucks und dessen Beziehung (Projektion, Retraktion, Koexpressivität etc.) zu weiteren Ausdrucksressourcen im Geschehensprozess beeinflusst (vgl. dazu Kapitel 2). Einerseits trägt die zeitliche Platzierung eines deiktischen Ausdrucks in Relation zur Geste und zur Aufmerksamkeitsorientierung des Adressaten zur lokalen Funktion dieses Ausdrucks bei. Andererseits ist die zeitliche Platzierung des deiktischen Ausdrucks davon abhängig, welche Funktion er in der emergierenden Äußerung erfüllen soll. Es sind also nicht allein räumliche Faktoren wie Proximalität, Größe, Sichtbarkeit etc., die die Wahl eines deiktischen Ausdrucks bestimmen, sondern ebenso dessen zeitliche Platzierung in Relation zum Realisierungsformat der gewählten Geste, zur Aufmerksamkeitsorientierung der Adressaten und zu den Aktivitäten, in die die Beteiligten involviert sind. Deiktika können als Fokussierungsaufforderungen fungieren, die dem gestischen Zeigeakt vorauslaufen, diesen projizieren und dadurch die visuelle Aufmerksamkeitsorientierung des Adressaten auf den Körper des Zeigenden einfordern, ohne etwas über die räumliche Nähe oder Distanz des Zeigeziels auszusagen. Dieses wird unter Umständen erst im nächsten Schritt durch körperlich-visuelle Ressourcen hergestellt. So ist die Wahl zwischen unterschiedlichen Deiktika (wie z. B. hier und da) nicht notwendigerweise von räumlichen Relationen zwischen Zeigendem und Zeigeziel (Origoinklusivität versus Origoexklusivität) beeinflusst, sondern von dem wahrnehmungsorganisatorischen Aufwand, den der Zeigende als Resultat seiner online-Analyse der Situation dem Adressaten zuzumuten glaubt.

66

4 Ein Modell zur Untersuchung deiktischer Zeigehandlungen

Rückbezogen auf unser Beispiel lässt sich feststellen, dass die perzeptorischen und kognitiven Aufmerksamkeitsfoci der Beteiligten zunächst divergieren und auch interaktionsräumlich auseinanderfallen. Beide müssen einen hohen Aufwand betreiben, um wieder in fokussierte Interaktion miteinander zu treten. Die Sprecherin initiiert die Wiederherstellung fokussierter Interaktion, indem sie eine Fokussierungsaufforderung (Z. 1: HEY), einen Imperativ (Z. 2: guck_ma) zur visuellen Wahrnehmungssteuerung ihres Adressaten und das akzentuierte Lokaldeiktikon HIER (Z. 2) produziert. Der deiktische Ausdruck teilt mit der Fokussierungsaufforderung und dem im Imperativ gebrauchten Wahrnehmungsverb die Anweisung an den Adressaten, sich zur Sprecherin umzuwenden. Da sich Adressaten in deiktischen Zeigehandlungen, die die Wahrnehmung eines gestischen Zeigeakts verlangen, immer zunächst auf den Körper des Sprechenden orientieren müssen, würde auch der deiktische Ausdruck für sich genommen diese Orientierungsanweisung übernehmen können. Allerdings leistet das Lokaldeiktikon noch mehr, denn anders als die Fokussierungsaufforderung und der Imperativ enkodiert es darüber hinaus relationale Merkmale, die das räumliche Verhältnis zwischen indexikalischem Grund und Figur bzw. zwischen Origo und Zeigeziel spezifizieren. Indem es eine relative Nähe zwischen dem Körper der Sprecherin und dem relevanten Raumausschnitt postuliert, signalisiert es dem Adressaten, dass er sich, nachdem er sich auf die Zeigende orientiert hat, perzeptorisch bereits in der Nähe des Zeigeziels befinden wird. Dadurch signalisiert es ihm zugleich, dass er, um Referenz herstellen zu können, körperlich eine vollständige Kehrtwende vollziehen und sich seiner Interaktionspartnerin wieder zuwenden muss. Doch ist die Orientierungshandlung damit noch nicht abgeschlossen, denn im nächsten Schritt folgen wichtige aufmerksamkeitssteuernde Weiterweisungen: In dem Augenblick, in dem er sich umwendet und die Zeigende wahrnimmt, wird er feststellen, dass ihre Zeigegeste mit vollständig ausgestrecktem Arm und damit in einem Format ausgeführt wird, das gerade nicht für Proximalität typisch ist. Auch bewegt sie sich nicht auf das Zeigeziel zu, sondern friert ihre Position an der Stelle im Raum ein, von der aus sie zeigt und die einige Schritte vom Zeigeziel entfernt liegt. Das Deiktikon hier enkodiert im vorliegenden Fall folglich nicht einfach Proximalität zwischen Zeigender und Zeigeziel, sondern es vollzieht im Verbund mit der Zeigegeste und dem temporalen Ablaufformat, in welchem die Ressourcen zusammenwirken, eine komplex orchestrierte, mehrschrittige Orientierungshandlung, die den Adressaten von der vollständigen Abwendung über die körperlich-visuelle Zuwendung, die Wahrnehmung der Zeigenden bis hin zur Herstellung von Suchraum und Zeigeziel (vgl. dazu die Abschnitte 4.6 und 4.7) anleitet. Entscheidend ist, dass indexikalische Merkmale, die die Origo näher bestimmen, relationale Merkmale, die die Beziehung zwischen Origo und Suchraum

4.5 Zeigegeste

67

bzw. Zeigeziel definieren, und charakterisierende Merkmale (vgl. zu den genannten Merkmalen Abschnitt 2.4), die Hinweise auf die Eigenschaften von Zeigeziel bzw. Referent liefern, nicht (allein) im deiktischen Ausdruck, sondern auch in der Zeigegeste (und unter Umständen weiteren visuellen Ressourcen) enthalten sind. Deren spezifisches Zusammenspiel und deren Interaktion mit weiteren Parametern ist konstitutiv für die deiktische Zeigehandlung. Für die deutschen Demonstrativpronomina (dies-, der/die/das) beispielsweise gilt, dass charakterisierende Merkmale wie Geschlecht und Anzahl im sprachlichen Ausdruck enkodiert sind, während die relationalen Merkmale Nähe/Distanz sprachlich weniger eindeutig erfasst werden. Diessel (1999: 38, 2006: 473) und Himmelmann (1997) zufolge unterscheiden sich die Demonstrativpronomina im Deutschen dadurch typologisch von denen in anderen Sprachen, dass sie keine Distanzmarkierungen enkodieren und daher frei kombinierbar mit den – als demonstrative adverbs bezeichneten – Lokaladverbien hier, da und dort sind. Unabhängig davon, ob die empirisch zu überprüfende Hypothese von der freien Kombinierbarkeit uneingeschränkt gültig ist, erweist sich die Neutralität hinsichtlich der Distanzmarkierung in der face-to-face-Kommunikation als vollkommen unproblematisch, da Zeigegesten Formaspekte aufweisen, in denen relationale Merkmale wie Nähe und Distanz, Sichtbarkeit, Bewegung/Bewegungsrichtung sehr wohl enkodiert sind (vgl. dazu Kap. 5). Als Ganzes besitzt die Kombination eines bestimmten Deiktikons mit einer spezifischen gestischen Formvariante ein Merkmalsbündel, das weder die verbale noch die gestische Form allein aufzubieten hat. Für künftige empirische Untersuchungen ergibt sich die Aufgabe, unter Berücksichtigung der Komponenten, die für die deiktische Zeigehandlung in der face-to-face-Interaktion konstitutiv sind, die multimodalen Gestalten zu erarbeiten, in denen sich die deiktischen Praktiken sedimentiert haben.

4.5 Zeigegeste Im Gesamtrepertoire multimodaler Ausdrucksressourcen stellt die Zeigegeste die für die deiktische Zeigehandlung funktional spezialisierte Ressource dar. Sie fungiert als Zeiginstrument, von dem aus ein linearer Vektor extrapoliert wird, der laut gängiger Theorien unmittelbar zum Zeigeziel führt. Nach Auffassung des hier vorgestellten Modells wird durch die Zeigegeste jedoch zunächst einmal ein Suchraum hergestellt, in dem das Zeigeziel aufgefunden werden muss (vgl. dazu Kapitel 4.7). Die für die Zeigehandlung konstitutiven körperlichen Displays des Zeigenden müssen so kontextualisiert sein, dass der Adressat z. B. den ausgestreck-

68

4 Ein Modell zur Untersuchung deiktischer Zeigehandlungen

ten Arm oder Finger seines Interaktionspartners nicht als Ziel seiner visuellen Wahrnehmung und Betrachtungsphänomen sui generis ansieht, sondern als instrumentell, perzeptorisch-intermediär und deiktisch erkennt: Wie in Kapitel 4.3 bereits erläutert wurde, erfasst der Begriff perzeptorisch-intermediär die Tatsache, dass der Körper des Zeigenden und analog dazu die funktionsspezifischen Einzeldisplays der Zeigegeste nicht das Ziel der Aufmerksamkeitsorientierung darstellen, sondern diesem perzeptorisch als Etappenziel zwischengeschaltet sind. Instrumentell bedeutet dementsprechend, dass die Zeigegeste Mittel zum Zweck der Aufmerksamkeitsfokussierung des Adressaten auf etwas anderes (den Raum, in dem sich das Zeigeziel befindet) darstellt. Deiktisch fungiert der ausgestreckte Arm eines Zeigenden insofern, als er nicht den konkreten Referenten des zum Symbolfeld gehörenden Konzepts ‚Arm‘ darstellt, sondern im Zeigfeld operierend auf etwas anderes verweist. Dies sind die drei Merkmale, die das Konzept des Zeiginstruments als räumlich-perzeptorischen Parameter der Zeigehandlung konstituieren. Sie gelten rekursiv für alle vom Zeigenden als Zeiginstrumente eingesetzten körperlichen Ressourcen wie manuelle Gesten (der ausgestreckte Zeigefinger in einer deiktischen Zeigegeste im Unterschied zu einer Mahngeste), Zeigen mit dem Kopf oder Blick, Zeigen mit Objekten usw. (vgl. dazu ausführlich die Kapitel 5.5 bis 5.7). Während also die Begriffe perzeptorisch-intermediär und instrumentell die Merkmale erfassen, die das Konzept des verweisenden Körpers charakterisieren, tritt beim Zeiginstrument als drittes Merkmal die Deiktizität hinzu. Im Folgenden soll am bekannten Datenausschnitt illustriert werden, wie die Zeigende ihre körperlichen Displays so einrichtet, dass sie die visuelle Wahrnehmung ihres Interaktionspartners auf ihre Zeigegeste fokussiert, und zwar dergestalt, dass die Zeigegeste in ihrer Intentionalitätsstruktur, als instrumentell, perzeptorisch-intermediär und deiktisch erkannt wird. Aufgrund der zeitlichen Verzögerung, mit der Jürgen auf Sabrinas Fokussierungs- und Wahrnehmungsaufforderungen reagiert, steht sie vor der Aufgabe, ihre körperlichen Displays so zu gestalten und temporal mit dem Adressatenverhalten zu koordinieren, dass sie im richtigen Moment – wenn er sich umdreht – wahrgenommen und in ihrer semiotischen Funktion erkannt werden können. Das betrifft insbesondere die Dauer ihrer Zeigegeste. Ausdruck der interpersonellen Koordinierungsbemühungen der Zeigenden ist erstens ihre zwischen Zeigeziel und Adressaten hin und her wechselnde Blickorientierung. Durch den Blick auf ihren Interaktionspartner erlangt Sabrina visuell Informationen darüber, ob er sie wahrnimmt oder nicht, und kann dementsprechend ihre Folgehandlungen planen. Zweitens wird die Zeigegeste eingefroren, nachdem sie ihren Gipfelpunkt erreicht hat (Abb. 12):

4.5 Zeigegeste

Abbildung 12

69

Abbildung 13

Dieses Einfrieren stellt aufgrund seiner Temporalitätsstruktur mehr dar als den typischerweise zu beobachtenden Nachhalt (post-stroke hold, Kendon 2004: 112; Kita 1993). Die Dauer des Gestengipfelpunkts ist adaptiv auf das Adressatenverhalten ausgerichtet und korreliert mit der Zeit, die der Adressat braucht bzw. für sich in Anspruch nimmt, bis er sich der Zeigenden zuwendet. Der Adressatenzuschnitt (recipient-design, Sacks 1992) der Zeigehandlung betrifft folglich nicht nur die sprachliche Gestaltung, sondern auch körperlich-visuelle Aspekte wie die Körperposition des Adressaten, seine Aufmerksamkeitsorientierung, die wechselseitige visuelle Zugänglichkeit der Beteiligten zueinander, die Sichtbarkeit von Suchraum und Zeigeziel etc.33 Die adaptiven, der interpersonellen Koordinierung geschuldeten Aspekte im lokalen Realisierungsformat der Zeigehandlung zeigen, wie das Adressatenverhalten die sich entfaltende Zeigehandlung hinsichtlich der temporalen und sequenziellen Organisation der eingesetzten verbalen und visuellen Ressourcen mitgestaltet. Die emergierenden körperlichen Verhaltensweisen beider Beteiligten sind für die jeweilige Realisierungsweise des multimodalen Zeigeformats, die Art und Weise, in der die Ressourcen kombiniert und temporal organisiert werden, konstitutiv. Nachdem die Zeigegeste ihren Gipfelpunkt erreicht hat, wendet Sabrina ihren Blick erneut dem Adressaten zu (Abb. 13) und stellt auf diese Weise eine körperliche Doppelorientierung her, bei der der Blick auf den Adressaten, die Zeigegeste hingegen auf das Zeigeziel am Boden gerichtet ist (Abb. 14 und 15):

33 Zu derselben Feststellung gelangen Hindmarsh und Heath (2000: 1866): „The referential action is shaped not only with regard to where the participants are within the developing course of the current talk and activity, and the interests and competencies of the particular recipient, but also with respect to their bodily orientation and the shape and appearance of the object to be shown. The design of the referential action not only interweaves talk and gesture, pinpointing the object at the sequentially relevant moment, but configures an object within the local milieu to make it accessible in a particular way to the co-participant.“

70

4 Ein Modell zur Untersuchung deiktischer Zeigehandlungen

Abbildung 14

Abbildung 15

Sabrina behält ihre räumliche Doppelausrichtung auf das Zeigeziel einerseits und den Adressaten andererseits so lange bei, bis dessen Blick den erforderlichen Richtungswechsel vornimmt. Die kurzzeitige multimodal verkörperte Doppelorientierung auf den Adressaten einerseits und das Zeigeziel andererseits habe ich in einer früheren Untersuchung als Ressourcen-Spagat bezeichnet (Stukenbrock 2009a). Bereits Bühler (1965 [1934]: 98) weist darauf hin, dass „man häufig einen Wettstreit zwischen der Hinwendung des Senders auf den Empfänger und auf den zu zeigenden Gegenstand beobachten [kann]“. Seine Erklärung dafür ist eine koordinationstheoretische: Denn der Sender ist zwiefach beansprucht, wenn er beides zeigen soll, und löst die Aufgabe entweder sukzessiv oder indem er sich gleichsam teilt. Sukzessiv, indem er mit Finger oder Augen zuerst den Empfänger attackiert und dann dessen Blick mitreißend auf den Gegenstand deutet. Sich teilend z. B. so, daß er seine Augen auf den Partner und seinen Arm mit ausgestrecktem Zeigefinger dem Gegenstand widmet, eine Gesamthaltung, die jedem Maler wohl vertraut ist.

An Bühler anknüpfend tritt die Doppelorientierung dann ein, wenn ein Zeigender die sich teilende gegenüber der sukzessiven Problemlösung wählt. Im Rahmen der vorliegenden Theorie bezeichnet der Begriff Ressourcen-Spagat die sich in den körperlichen Displays eines Zeigenden manifestierende Doppelausrichtung, die dadurch zustande kommt, dass dieser die doppelte Beanspruchung durch zwei unterschiedliche Interaktionsaufgaben simultan löst, indem er sie auf unterschiedliche Ressourcen (z. B. Armgeste und Blick) verteilt. In Abhängigkeit von den jeweiligen räumlichen Relationen zwischen Zeigendem, Adressaten und Wahrnehmungsgegenstand vollziehen Zeigende einen solchen Ressourcen-Spagat mit einer charakteristischen internen Körperdrehung, bei der das obere Körpersegment (Kopf- und Brustkoordinaten) gegen das untere Körpersegment (Becken und Beine) gedreht ist (vgl. zum body torque Schegloff 1998a).

4.6 Suchraum

71

Im vorliegenden Fall ist bei dem Ressourcen-Spagat die Körperorientierung der Zeigenden systematisch so ausgerichtet, dass das untere Körpersegment (Position der Beine und Füße) zusammen mit der Zeigegeste den Verweisraum etabliert bzw. „festhält“, während das obere Körpersegment (Oberkörper, Schultern, Kopf- und Blickausrichtung) als beweglicher Teil eine flexible Adressatenorientierung vornimmt.34 Dieser Ressourcen-Spagat, mit dem die Zeigende den „Wettstreit“ (Bühler 1965 [1934]: 98) zwischen der Adressaten- und der Zeigezielorientierung verkörpert, erweist sich somit als ein aus den interpersonellen Koordinationsanforderungen resultierendes Adaptivitätsverfahren. Dazu gehört auch Sabrinas an dieser Stelle länger andauerndes Monitoring des Adressatenverhaltens, das intra- und interpersonell mit ihrem verbalen Bemühen korreliert, Jürgens Aufmerksamkeit auf ihren Körper, ihre Zeigegeste und letztlich auf das von ihm wahrzunehmende Zeigeziel zu fokussieren.

4.6 Suchraum Der von einem Zeigenden etablierte Verweisraum wird in dem Augenblick zum Suchraum des Adressaten, in dem dieser die körperlichen Herstellungsaktivitäten des Zeigenden wahrnimmt und seinen Blick vom Körper der Zeigenden anhand der Zeigegeste in die angegebene Richtung wendet. Koordinationstheoretisch gefasst geschieht dies also in dem Moment, in welchem die intrapersonellen Koordinationsaktivitäten adressatenorientiert modelliert, d. h. interpersonell koordiniert bzw. adaptiv gestaltet und als solche vom Adressaten wahrgenommen und genutzt werden. Erst wenn sich der Adressat vom Körper der Zeigenden auf deren Zeigegeste und anhand dieser auf den Raum orientiert, in den diese verweist, ist der Suchraum als adressatenperspektivisches Wahrnehmungsphänomen etabliert (vgl. Abb. 16 auf der nächsten Seite: die gestrichelten Pfeile stellen den sukzessiven Prozess der Suchraumherstellung anhand der körperlichen Displays der Zeigenden dar; der gestrichelte Kreis veranschaulicht den vektoriell errechneten Suchraum). Aus dem Beispiel geht hervor, dass die Herstellung des Verweisraums und die Herstellung des Suchraums perspektivisch zwei verschiedene Vorgänge sind, die unter Umständen auch sequenziell auseinander fallen können. Während der Verweisraum eine die koordinative Selbstwahrnehmung betreffende sowie die Aufmerksamkeitsorientierung des Adressaten kalkulierende Angelegenheit des

34 Diese von Kendon (1990: 212) als „facing out of his transactional segment“ bezeichnete Orientierung wird in der Regel nicht lange aufrechterhalten.

72

4 Ein Modell zur Untersuchung deiktischer Zeigehandlungen

Abbildung 16

Zeigenden darstellt, ist der Suchraum eine perzeptorische Angelegenheit des Adressaten. Im analysierten Beispiel liegt die sequenzielle Besonderheit darin, dass die Herstellung des Verweisraums und die Herstellung des Suchraums, die interaktiv zusammenfallen und quasi-simultan erfolgen können, zeitlich zerdehnt sind. Die zeitliche Zerdehnung, die dadurch zustande kam, dass Sabrina die fokussierte Interaktion in einem erneuten Anlauf erst wieder herstellen und Jürgen sich körperlich neu auf Sabrina ausrichten musste, macht die theoretische Unterscheidung zwischen Verweis- und Suchraum empirisch nachweisbar.

4.7 Zeigeziel Nachdem der Suchraum hergestellt ist, steht der Adressat vor der Aufgabe, innerhalb des Suchraums das Zeigeziel zu ermitteln und aus dem Zeigeziel den gemeinten Referenten zu „generieren“. Beide Aspekte sind eng miteinander verknüpft, stellen aber unterschiedliche Teilprobleme dar und werden daher aus theoretischen Gründen getrennt betrachtet. Der erste Aspekt betrifft das Vektor-Ziel-Problem, der zweite Aspekt das Problem der Referenzherstellung, das im folgenden Abschnitt (4.8) behandelt wird. Die Unterscheidung zwischen Zeigeziel und Referent geht mit einer weiteren Unterscheidung einher: So wird mit dem Begriffspaar Figur (figure) und Wahrnehmungsgrund (perceptual ground) ausschließlich die Organisation der visuellen Wahrnehmung in einer Zeigehandlung konzeptualisiert (vgl. auch Hanks 1992: 61), während das Begriffspaar Referent (referent)35 und konzeptueller Grund (conceptual ground) analog dazu die kognitive Organisationsstruktur erfasst.

35 Clark et al. (1983) benutzen das Begriffspaar demonstratum und referent; Hanks (1992), der

4.7. Zeigeziel

73

Mit dem Begriff Vektor-Ziel-Problem bezeichne ich das interaktiv zu bewältigende Wahrnehmungsproblem, das beim Zeigen auf ein entferntes Zeigeziel darin besteht, dass die Zeigegeste nicht, wie naiverweise oft angenommen wird, einfach einen Vektor herstellt, dessen imaginäre Verlängerung automatisch zur Lokalisierung des Zeigeziels führt. In der Standardauffassung eines linear zu verlängernden Vektors bleibt die Frage danach, wann und wie der Adressat das Zeigeziel erkennt, unbeantwortet (vgl. auch Goodwin 2000a: 73). Die theoretisch und empirisch unzureichende Auffassung von einer punktgenauen Vektor-Ziel-Relation zwischen Zeigegeste und Zeigeziel taucht in einer Reihe unterschiedlicher Arbeiten u. a. zur Deixis (Fillmore 1982: 45; Fricke 2007: 57), zur Gestik (Kendon 2004: 200; Kita 2003b: 1) sowie zur ontogenetischen und phylogenetischen Sprachentwicklung (Butterworth 2003; Tomasello 2008) immer wieder auf. So konstatiert Kendon (2004: 200): Pointing gestures are regarded as indicating an object, a location, or a direction, which is discovered by projecting a straight line from the furthest point of the body part that has been extended outward, into the space that extends beyond the speaker.

Diese simplifizierende Auffassung vom Zeigen begreift die perzeptorische Koordinierungsanforderung als vektoriell zu lösende Geometrieaufgabe, während sich die bei der Referenzherstellung zu leistende kognitive Intersubjektivierung gleichsam automatisch aus der semantisch-pragmatischen Spezifizierung des die Geste begleitenden Verbaldeiktikons ergibt (Fillmore 1982: 46): We can refer to this basic function of an Indexing Act as that of Indicating by which I have in mind the performing of an act which allows the Hearer to trace, by symbolic extrapolation, a path from the gesture to the thing. Important subtypes of indexing acts, slightly different from what I have arbitrarily named ‘indicating’, are aspects of Touching and Presenting. Pounding on a table and saying this table or holding a wine bottle in someone’s view and saying this bottle are examples of what I have in mind.

Solange es sich um deiktische Demonstrativa plus Nomen wie in den von Fillmore konstruierten Beispielen handelt, hängt das Problem der Referenzherstellung nicht zwangsläufig vom visuellen Wahrnehmungsakt ab. Dabei gilt es jedoch festzuhalten, dass in dieser Auffassung wesentliche Aspekte vereinfacht bzw. übersehen werden: So wird im Hinblick auf die Figur/Grund-Relation ein perzeptorisch klar strukturierter Suchraum unterstellt, in dem nur ein einziges

nicht zwischen Zeigeziel und Referenten unterscheidet, bezeichnet das durch eine deiktische Orientierungshandlung herzustellende Objekt als denotatum.

74

4 Ein Modell zur Untersuchung deiktischer Zeigehandlungen

Objekt (in Fillmores Beispiel eine einzige Weinflasche) als Zeigeziel und damit als perzeptorischer Anker für die Referenzherstellung in Frage kommt, was nicht immer der Fall ist. In semiotisch komplexen Räumen mit einer dichten Anordnung potenzieller Zeigezielkandidaten kann das Auffinden und Identifizieren des intendierten Zeigeziels unabhängig davon, ob es sich um Gegenstände derselben durch die Nominalphrase bezeichneten Kategorie oder um kategorial unterschiedliche Gegenstände handelt, durchaus ein adressatenseitiges Wahrnehmungsproblem darstellen. Durch die standardtheoretischen Vereinfachungen wird also zum einen das Vektor-Ziel-Problem übersehen; zum anderen werden Zeigeziel (demonstratum bei Clark et al. 1983) und Referent fälschlicherweise gleichgesetzt, wie die undifferenzierten Begriffsgebräuche (object, thing etc.) verdeutlichen. Weitaus komplizierter als in Fillmores Beispiel gestaltet sich die vom Adressaten zu leistende Aufgabe, „to trace […] a path from the gesture to the thing“ (Fillmore 1982: 46), wenn der Referent nicht, wie bei der verbalen Verpackung der Zeigehandlung in eine Nominalphrase (Demonstrativartikel + Nomen), kategorial benannt oder individuiert wird. Fillmores Konzeptualisierung dieser Aufgabe als „symbolic extrapolation“ (Fillmore 1982: 46) ist sowohl hinsichtlich der räumlich-perzeptorischen als auch hinsichtlich der kognitiven Interaktionsanforderungen unzureichend. Der Unterschied zwischen diesen beiden intra- und interpersonell zu bewerkstelligenden Anforderungen, der perzeptorischen und der mentalen, wird durch den Begriff der „symbolic extrapolation“ verwischt, denn er suggeriert, dass vom Zeiginstrument direkt und punktgenau eine vorgängig symbolisch aufgeladene vektorielle Linie zum Zeigeziel gezogen werden kann (z. B. auch Fricke 2007: 57), was erstens empirisch falsch ist und zweitens theoretisch zunächst strikt zu trennende Operationen amalgamiert. So haben Butterworth (2003) sowie Butterworth und Itakura (1998) in Experimenten zur vector extrapolation hypothesis mit Babys und Erwachsenen herausgefunden, dass beide Gruppen – unabhängig von entwicklungsbedingten Unterschieden bei der Zielpeilung durch Zeigen mittels Blick- und Kopfbewegung – dieselben Präzisionsschwierigkeiten beim differentialen Auffinden von durch Gesten angegebenen Zeigezielen haben, die 15 Grad oder weniger auseinander liegen. Butterworth (2003: 25) kommt zusammenfassend zu dem Ergebnis: Thus, following pointing is not completely precise. The mechanism does not operate by extrapolation of linear vectors, and accuracy in a cluttered environment requires supplementary attention to worthy cues from the object of joint attention to help single it out as the referent. Hence, ecological and geometric mechanisms interact even in adults.

Die Auffassung, wonach die prototypische Zeigegeste von einem Körperteil aus einen Vektor projiziert, der gleichsam mit mathematischer Gesetzmäßigkeit zum

4.7. Zeigeziel

75

Zeigeziel und damit automatisch auch zum Referenten führt, ist daher unzureichend. Ebenso ist Blühdorns auf der Vorstellung einer semiotischen Arbeitsteilung beruhende Annahme (Blühdorn 2002: 271), „dass Zeiggesten in der Situationsdeixis immer den Bezugspunkt weisen und nicht den Referenten, während sprachliche Ausdrücke den Referenten beschreiben und nicht den Bezugspunkt“, aus multimodaler Perspektive zu revidieren. So besitzt bereits die Wahl bestimmter gestischer Formparameter (Zeigefinger, kleiner Finger, Daumen, geöffnete Hand, vertikal etc.) deskriptive Komponenten hinsichtlich des Referenten (vgl. Kapitel 5.2 sowie Kendon 2004; Kendon und Versante 2003; Streeck 2008, 2009a). In seinen Untersuchungen zu Zeigeaktivitäten von Archäologen an einer Ausgrabungsstätte und zum Zeigen in der Interaktion mit einem aphasischen Patienten verdeutlicht Goodwin, dass das durch die Zeigegeste angezeigte Zeigeziel nicht einfach ein Ort oder Raum(punkt) ist, sondern ein komplexes semiotisches Objekt darstellt, das durch das Interagieren multipler Bedeutungssysteme kon stituiert wird. Entsprechend komplex ist auch der Zeigeakt selbst zu modellieren (Goodwin 2003a: 218): Pointing is not a simple act, a way of picking out things in the world that avoids the complexities of formulating a scene through language or other semiotic systems, but is instead an action that can only be successfully performed by tying the act of pointing to the construals of entities and events provided by other meaning making resources as participants work to carry out courses of collaborative action with each other.

Zeigen kann also nur funktionieren, wenn der physische Zeigeakt eingebettet ist in interaktive Prozesse der Bedeutungskonstitution, in denen weitere Ressourcen die erforderlichen zusätzlichen Kontextualisierungshinweise zum perzeptorischen Auffinden des Zeigeziels, zur Referenzherstellung und zum Verständnis der interaktiven Relevanz des Zeigeakts liefern. Während das zuletzt genannte Problem allgemeinerer Natur ist und jede Kommunikation betrifft, sind die beiden ersten Probleme auf die spezifischen Bedingungen deiktisch-gestischen Sprachgebrauchs zurückzuführen. Bei ihnen handelt es sich um zwei miteinander verbundene, interaktiv zu bewerkstelligende Teilakte: einen räumlich-perzeptorischen und einen kognitiv-semantischen. Während beim ersten Teilakt ein gemeinsamer Wahrnehmungsraum und ein darin befindliches Wahrnehmungsobjekt etabliert werden müssen, handelt es sich beim zweiten Teilakt um die Intersubjektivierung intrasubjektiv konstituierter mentaler Repräsentationen. Dass diese beiden Teilprobleme theoretisch und analytisch zu trennen sind, auch wenn ihre Lösung im unmarkierten Fall integrativ und quasi simultan erfolgt, zeigen Fälle, in denen Reparaturen erforderlich sind. Das Reparandum kann zum einen der physische Lokalisierungsakt sein. Hypothetisch auf das

76

4 Ein Modell zur Untersuchung deiktischer Zeigehandlungen

Datenbeispiel bezogen wäre die von Jürgen zu initiierende Reparatur also die Frage „wo?“. Das Zeigeziel wird nicht sofort aufgefunden, so dass die Beteiligten mit der Bearbeitung des Wahrnehmungsproblems konfrontiert werden. Solange dies nicht gelöst ist, kann auch die Referenzherstellung nicht gelingen.36 Doch sie stellt nicht das Reparandum dar, insofern die verhinderte Referenz hier lediglich ein Epiphänomen der misslungenen Zeigezielpeilung ist. Erst wenn das Zeigeziel aufgefunden ist, kann auch die Referenzherstellung geleistet werden. Zum anderen kann es geschehen, dass zwar das Zeigeziel vom Adressaten aufgefunden wird – z. B. ein Buch in einem Regal –, die Referenzherstellung hingegen unklar bleibt und somit der Referent selbst zum Reparandum wird – ist das Buch als physisches Objekt gemeint, seine wertvolle bibliophile Aufmachung, das durch den Titel angesprochene Thema oder die Person des Autors?37 Die von Jürgen im „Big Brother“-Beispiel zu formulierende Reparaturinitiierung wäre dann die Frage „was?“. Entscheidend ist, dass die Lokalisierung des Zeigeziels (Lösung des perzeptorischen Vektor-Ziel-Problems) und die Identifizierung des Referenten (Lösung des kognitiv-semantischen Problems der Referenzherstellung) in unmittelbar gelingenden Zeigehandlungen nicht sequenziell als zwei unterschiedliche Aufgaben abgearbeitet werden, sondern integrativ erfolgen (Abb. 17 und 18): Abbildung 17

Abbildung 18

36 In meinem Datenkorpus gibt es allerdings auch Belege für Fälle, in denen der Referent (z. B. in einer Aufforderung) durch einen Symbolausdruck benannt wird, der Adressat das konkrete Objekt jedoch nicht lokalisieren oder es aus mangelnder Kenntnis prototypischer Vertreter der entsprechenden Kategorie in einem durch konkurrierende Objekte komplex strukturierten Suchraum nicht identifizieren kann. 37 Vgl. dazu Quines berühmtes Gavagai-Beispiel (1960: 29 ff.) sowie seine Ausführungen zur Ambiguität demonstrativer Referenz (1960: 100 f.).

4.7. Zeigeziel

77

Gelingt die Zeigezielpeilung jedoch nicht, kann eine körperliche Reorientierung der Beteiligten, also deren perspektivische Abstimmung aufeinander in Relation zum Zeigeziel, nötig sein (z. B. physisches Zusammenrücken, Parallelausrichtung von Blick-/Körperposition zur Angleichung der Perspektive auf die gestisch angegebene Richtung etwa beim Zeigen in den Himmel, auf einen See u. Ä.). Das heißt die Zeigegeste stellt zwar einen Vektor her, doch im dreidimensionalen Raum führt die imaginäre Verlängerung der Richtung des Zeiginstruments (Arm, Hand, Finger) nicht automatisch zum Zeigeziel (vgl. auch Goodwin 2000a: 73). Wie ein Scheinwerferkegel zeigt die Zeigegeste lediglich die Richtung an, die der Adressat perzeptorisch einschlagen muss, um innerhalb des Suchraums das Zeigeziel zu lokalisieren, d. h. unter verschiedenen potenziellen Kandidaten mittels Inferenzen das intendierte Zeigeziel zu finden. So einfach und selbstverständlich sich dies in der alltäglichen Praxis vollzieht, liegt die theoretische Komplexität dieses Prozesses darin, dass mit dem perzeptorischen Wahrnehmungsraum ein mentaler Raum kurzgeschlossen wird, der als auflösungserleichternder Kontext fungiert. Butterworth (2003: 22) verweist in seinen Studien zur gemeinsamen Aufmerksamkeitsfokussierung von Erwachsenen und Babys auf einen ökologischen Mechanismus gemeinsamer visueller Aufmerksamkeitsausrichtung (ecological mechanism for joint visual attention). Danach zeigen die Blick- und Kopforientierung des Erwachsenen dem Kind räumlich die Suchrichtung an, während die letztendliche Zielpeilung zur gemeinsamen Aufmerksamkeitsfokussierung durch das Objekt selbst zustande kommt. Der Mechanismus basiert nach Butterworth auf einer differenzierten Strukturiertheit der Umgebung und den intrinsischen Eigenschaften des Wahrnehmungsobjekts. Sie stellen die Voraussetzungen dafür dar, dass das Kind, nachdem es die veränderte Aufmerksamkeitsausrichtung des Erwachsenen wahrgenommen und selbst eine entsprechende Reorientierung vorgenommen hat, dasselbe Objekt relevant setzt wie der Erwachsene. Auf diese Weise kommt laut Butterworth (2003: 22) ein „‚meeting of minds‘ in the self same objects“ zustande, das offenbar als eine Art perzeptorisch-kognitive ‚Horizontverschmelzung‘ funktioniert. In der Auffassung vom ökologischen Mechanismus werden zwei Aspekte miteinander vermischt, die theoretisch zu trennen sind: die perzeptorische Salienzstruktur des Raums und die Relevanzstruktur des (potenziellen) Referenzobjekts. Anders als in den experimentellen Settings der Untersuchungen Butterworths geht es in natürlichen Interaktionen nie um eine gleichgerichtete Aufmerksamkeitsorientierung allein, sondern mit der Zeigehandlung ist zugleich immer auch eine soziale Handlung verbunden. Das bedeutet, dass der ökologische Mechanismus („ecological mechanism“) in natürlichen Interaktionen nicht automatisch ein „‚meeting of minds‘ in the self same objects“ herstellt, sondern zunächst

78

4 Ein Modell zur Untersuchung deiktischer Zeigehandlungen

lediglich Hypothesenbildungen über das aus der Menge potenzieller Zeigeziele am ehesten in Frage kommende Zeigeziel ermöglicht. Verschiedene Faktoren tragen dazu bei, dass ein Zeigeziel durch einen deiktischen Lokalisierungsakt leichter oder schwerer aufgefunden werden kann: die Anzahl potenzieller Zeigezielkandidaten, die perzeptorische Salienzstruktur und Komplexität des Suchraums, das sich daraus ergebende Verhältnis zwischen Figur und Wahrnehmungsgrund, die physisch-materielle, perzeptorische und aktivitätsbedingte Vorstrukturiertheit des Suchraums, die (Normalitäts-)Erwartungen, das Hintergrundwissen (common ground), m. a. W. das Vorhandensein weiterer sprachlicher und visueller Kontextualisierungsmittel (vgl. dazu Abschnitt 4.8).

4.8 Referent Entscheidend für die theoretische Trennung von Zeigezielherstellung und Identifizierung des Referenten ist die Feststellung, dass das Problem referenzieller Ambiguität bestehen bleiben kann, selbst wenn der Wahrnehmungsprozess abgeschlossen und das Zeigeziel ermittelt ist: „The general problem is that the referent of a pointing gesture can be ambiguous in many ways.“ (Kita 2003b: 3). Während die Ambiguität des Zeigeziels als perzeptorisches Problem in Erscheinung tritt, stellt die Ambiguität des Referenten ein kognitiv-semantisches Problem dar. Entsprechend unterschiedlich gestalten sich die interaktiven Desambiguierungsanforderungen an die Beteiligten: Die perzeptorische Desambiguierung des Zeigeziels erfordert die Konstituierung eines gemeinsamen Wahrnehmungsraums, die mit verbalen und körperlich-visuellen Herstellungs-, Koordinierungs- und Monitoringaktivitäten der Beteiligten einhergeht. Demgegenüber verlangt die kognitiv-semantische Desambiguierung des Referenten einen intersubjektiven Abgleich intrasubjektiv konstituierter mentaler Repräsentationen und wechselseitige Inferenzakte über das global vorgängige und das lokal aktivierte Kontextwissen des Interaktionspartners. Grundlage des in der vorliegenden Untersuchung verwendeten common-ground-Begriffs, der in unterschiedlichen Ansätzen terminologisch nicht immer klar von anderen Konzepten abgegrenzt ist38, bildet daher die Ausdiffe-

38 Vgl. beispielsweise Tomasellos unzutreffende Gleichsetzung verwandter, gleichwohl theoretisch klar zu trennender Begriffe (Tomasello 2008: 272): „[…] the key is that the communicator uses me and you in the here and now – that is, the current joint attentional frame, common ground, Bühler’s (1934/1990) deictic center – to ground his acts of reference in what they both perceive or know together.“ Vgl. zum common ground-Begriff auch Clark (1996); Clark et al. (1983).

4.8 Referent

79

renzierung in zwei verschiedene, wenn auch zusammenhängende Begriffe, den des gemeinsamen Wahrnehmungsgrunds (common perceptual ground, vgl. dazu Abschnitt 4.7) und den des gemeinsamen konzeptuellen Grunds (common conceptual ground). Wie Clark et al. (1983) experimentell nachgewiesen haben, gehören zu den Komponenten des gemeinsamen Hintergrundwissens (common ground), die dem Adressaten den Abgleich (mapping) zwischen Demonstratum bzw. Zeigeziel und Referenten ermöglichen, erstens die perzeptorische Salienz, zweitens die Ziele des Sprechers, drittens seine Behauptungen (assertions) und viertens seine Präsuppositionen. In der Forschung werden die interaktiv zu bewältigenden Anforderungen hinsichtlich der visuellen Perzeptionsleistungen und der mentalen Konstruktionsleistungen der Beteiligten häufig nicht deutlich genug gesehen. So wird der Referent laut Green (1995b: 22) durch das salienteste Objekt („the most salient object“) konstituiert. In dieser Formulierung manifestiert sich die theoretisch und empirisch unzutreffende Amalgamierung von Zeigeziel und Referenten im Begriff des Objekts. Darüber hinaus bleibt die Frage danach, aufgrund welcher Kriterien und mittels welcher Ressourcen der Adressat die Salienz des salientesten Objekts ermittelt, unbeantwortet (vgl. dazu jedoch die experimentellen Untersuchungen von Clark et al. 1983). Laut Clark et al. (1983) geht es um ein mapping des bei ihnen als demonstratum bezeichneten Zeigeziels auf den Referenten durch eine demonstrative Beziehung (demonstrative relation) F. Gemäß der in der vorliegenden Arbeit getroffenen Unterscheidung zwischen Zeigeziel und Referent ist das salienteste Objekt zunächst das Zeigeziel. Was den Referenten konstituiert, ist damit keineswegs automatisch mitvollzogen (Clark et al. 1983; Goodwin 2003a; Hindmarsh und Heath 2000). Aus der These, dass die perzeptorische Lokalisierung des Zeigeziels und die kognitive Identifizierung des Referenzobjekts zwei verschiedene, theoretisch zu trennende Seiten derselben Medaille darstellen, die im konkreten Handlungsvollzug in spezifischer Weise interagieren, folgt des Weiteren die Unterscheidung zwischen perzeptorischer und kognitiver Salienz. Die entscheidende Frage lautet dann, wie es dem Adressaten gelingt, von einem aufgrund seiner perzeptorischen Salienz erkannten Zeigeziel, das nicht notwendigerweise identisch mit dem Referenten sein muss, auf den Referenten zu schließen.39 Den Ausgangspunkt zur Beantwortung dieser Frage bildet die Feststellung, dass perzeptorische und kognitive Salienz im Normalfall kongruieren und ein-

39 Für Clark et al. (1983), die die wesentliche Rolle erkannt haben, die der common ground bei der Referenzherstellung mittels Demonstrativa und Zeigegeste spielen, lautet die Frage ganz analog (1983: 246): „[…] how do listeners infer the mapping from the demonstratum to the referent?“

80

4 Ein Modell zur Untersuchung deiktischer Zeigehandlungen

ander im adressatenseitigen Prozess der Hypothesenbildung über Zeigeziel und Referenten verstärken. Diese Feststellung basiert auf dem Prinzip der optimalen Gestaltung (principle of optimal design; Clark et al. 1983: 246), nach dem Zeigende ihre Zeigehandlung einrichten und auf das Adressaten im perzeptorisch-kognitiven Konstruktionsprozess in der Annahme einer hinreichenden Lesbarkeit der vom Zeigenden verwendeten Ressourcen rekurrieren.40 In Ethnomethodologie, Konversationsanalyse und anderen pragmatischen Ansätzen wird dieses Prinzip als Adressatenzuschnitt (recipient design) konzeptualisiert (Garfinkel 1967; Clark 1996; Sacks et al. 1974; Sperber 1994). Ungeachtet der Feststellung, dass perzeptorische und kognitive Salienz im Normalfall kongruieren, besteht jedoch auch die Möglichkeit, dass sie einander widersprechen, so dass sich die Frage nach dem ausschlaggebenden Kriterium für die vom Adressaten präferierte Hypothese stellt. Den Experimenten von Clark et al. (1983) zufolge überschreibt in solchen Fällen die kognitive Salienz die perzeptorische Salienz. Das bedeutet, dass dasjenige Element, das angesichts des gemeinsamen Hintergrundwissens (common ground) den intersubjektiv vielversprechendsten Kandidaten für das referenzielle Gelingen darstellt, gegenüber einem perzeptorisch herausstechenden, hinsichtlich der Relevanzstrukturen des Hintergrundwissens jedoch nachgeordneten Kandidaten bevorzugt wird. Das gemeinsame Hintergrundwissen (common ground) wird aus unterschiedlichen – perzeptorischen, sprachlichen, mikro- und makrointeraktionsgeschichtlichen und sozio-kulturellen – Informationsquellen gespeist und unterliegt einer fortwährenden Veränderung. Dies erfordert von den Beteiligten eine kontinuierliche online-Analyse des sich im Interaktionsgeschehen ständig wandelnden common ground. Entscheidend dabei ist, dass die verschiedenen Informationsquellen ein unterschiedliches Maß an Variabilität und damit an lokalem Veränderungspotential bezüglich des gemeinsamen Hintergrundwissens aufweisen. Während die perzeptorischen, sprachlichen und mikrointeraktionalen Vollzugskomponenten eine unmittelbare Veränderung des common ground in der online-Emergenz der Interaktion bewirken, befinden sich makrointeraktionsgeschichtliche und generelle soziokulturelle Wissenskomponenten am anderen Ende des Spektrums der Veränderbarkeit. Das bedeutet nicht, dass sie statisch

40 Das principle of optimal design operiert laut Clark et al. zwischen den für deiktische Demonstrationshandlungen zugrunde gelegten drei Komponenten des Demonstratums (d), des Referenten (r) und der zwischen beiden bestehenden Beziehung (F) (1983: 246): „The method listeners use in packaging d, F, and r, according to our proposal, changes with the information provided. With a precise demonstration and a vague descriptor, they should choose one method; with a vague demonstration and a precise descriptor, they should use another (see Pechmann & Deutsch, 1982). Ultimately, they should appeal to a general principle they believe to be part of the speaker’s and addressees’ common ground, the principle of optimal design […].“

4.8 Referent

81

sind, doch benötigen sie, um verändert, in Frage gestellt oder außer Kraft gesetzt zu werden und damit verändernd zu wirken, einen Mehraufwand an interaktiver Bearbeitung. Für die unmittelbar auf die Interaktion einwirkenden und diese online gestaltenden Komponenten hingegen ist festzuhalten, dass ihr Vollzug selbst den common ground zwangsläufig verändert. Dies gilt nicht nur für konzeptuelle, sondern ebenso für perzeptorische Komponenten des common ground. Im Kapitel über die Wahrnehmungswahrnehmung (4.9) wird darauf zurück zu kommen sein. Perzeption und Kognition bilden einen Januskopf, der in zwei Richtungen blickt und dessen eine Hälfte ohne die andere nichts aufzufassen vermag. So ist bereits der perzeptorische Raum angereichert mit Bedeutungen, die während des Suchprozesses aktiviert werden und Inferenzen über potenzielle, wahrscheinliche und intendierte Zeigeziele in Gang setzen. Durch diese Inferenzen erlangen bestimmte Zeigezielkandidaten gegenüber anderen einen herausgehobenen Status als referenziell besonders vielversprechend. Perzeptorisch gestützte Annahmen über mögliche Zeigeziele und Inferenzen über plausible Referenten werden miteinander kurzgeschlossen. Es läuft ein perzeptorisch-hermeneutischer Verrechnungsprozess ab, der sich in mehreren Schlaufen vollziehen kann. Dabei werden Hypothesen über mögliche Zeigeziele mit Hypothesen über intendierte Referenten verrechnet und in ein Hierarchisierungsverhältnis gebracht. Während die Hypothesenbildung über Zeigeziele primär anhand physisch-perzeptorischer Parameter verläuft, erfolgt die Hypothesenbildung über den Referenten anhand kognitiver Parameter. Es finden Evaluationsprozesse statt, die durch den Einbezug weiterer Kontextualisierungshinweise und den Rekurs auf den stillschweigend vorausgesetzten, sich ständig wandelnden common ground unterstützt werden. Die Kontextualisierungshinweise tragen dazu bei, dass mit dem Lokalisierungsakt schließlich auch ein Identifizierungsakt vollzogen werden kann. Dabei spielt die situative Einbettung der Zeigehandlung, das Mehr oder Weniger an kontextuellem Gegebensein (givenness) eine wichtige Rolle. Je stärker die Zeigehandlung im gemeinsamen Interaktionsrahmen verankert ist, desto weniger zusätzliche, die Zeigehandlung begleitende Kontextualisierungshinweise benötigt der Adressat zur Hypothesenbildung. Damit manifestiert sich in der Zeigehandlung eine komplementäre Beziehung zwischen den mobilisierten Ressourcen und dem common ground, die als Grundprinzip menschlicher Kommunikation gelten kann. Tomasello bringt diesen Gedanken, der u. a. auch in Grices Konversationsmaximen (Grice 1975: 45) eine Rolle spielt, wie folgt zum Ausdruck (Tomasello 2008: 79): Importantly, for all types of human communication including language, the relationship between the overt communicative act and common ground – of whatever type – is complementary. That is, as more can be assumed to be shared between communicator and recipient, less needs to be overtly expressed. Indeed, if enough is shared in common ground, the

82

4 Ein Modell zur Untersuchung deiktischer Zeigehandlungen

overt expression of either motive or referent may be totally eliminated without diminishing the message at all.

Hanks (1992: 69) weist darauf hin, dass ein besonders hohes Maß an geteiltem indexikalischem Grund und mithin an epistemischer Symmetrie mit einer größeren Bandbreite an deiktischen Oppositionen und differenzierteren Möglichkeiten der Referenzherstellung einher geht. Im Rückgriff auf Clark und Wilkes-Gibbs (1986) leitet er daraus für die Deixistheorie das Prinzip der relativen Symmetrie (principle of relative symmetry) ab (Hanks 1992: 69): „The more symmetrical the indexical origo (the more fully constituted the ground), the greater the range of deictic oppositions available for making reference (the more differenciated the possibilites for denoting figures).“ Im unmarkierten Fall erfolgen Lokalisierung und Identifizierung reibungslos, d. h. ohne zusätzlichen Reparaturaufwand: Der Zeigende zeigt, der Adressat sieht (Zeigeziel), versteht (Referenz) und reagiert (Aktion). Seine Reaktion fungiert zugleich als Verstehensdokumentation gegenüber dem Zeigenden. Werden Reparaturen erforderlich, verläuft dieser Gesamtprozess kleinschrittiger und auf mehrere Redezüge verteilt. Dabei zeigt sich, dass bei Reparaturen (vgl. die empirischen Analysen in Kapitel 6) in der Hierarchie der Hypothesen rückwärts vorgegangen und die im Prozess der Hypothesenbildung am weitesten oben stehenden Optionen zuerst durchgespielt werden – mit Hilfe zusätzlicher (verbaler und/oder visueller) Kontextualisierungshinweise, die der Zeigende selbst- oder fremdinitiiert nachliefert. In solchen Reparaturen erfolgt eine gemeinsame Bearbeitung des Referenzproblems. Das, was in Reparaturen interaktiv nach außen gelegt wird und sich aufgabenspezifisch auf verschiedene Interaktionsteilnehmer verteilt, läuft normalerweise intrasubjektiv ab. Daher lässt sich die These aufstellen, dass durch die gemeinsame, von reziproken Verstehensdisplays begleitete Bearbeitung von Referenzherstellungsproblemen in Reparaturen eine Externalisierung und Intersubjektivierung von normalerweise intrasubjektiv ablaufenden kognitiven Prozessen stattfindet. Dadurch, dass in Reparaturen deiktische Referenzherstellungsprobleme interaktiv gelöst werden und die Beteiligten dabei auf explizite wechselseitige Wahrnehmungs- und Verstehensdisplays angewiesen sind, stellen Reparaturen auch für Interaktionsanalytiker ein Fenster zum Geist und damit zu Wahrnehmungs- und Kognitionsprozessen dar, die als intrasubjektive Phänomene im störungsfreien Normalablauf sonst nicht beobachtbar werden. Beispielhaft für eine mikroskopische Analyse solcher intersubjektivierten Verfahren sind die Untersuchungen Goodwins zur Interaktion zwischen einem Aphasiker, Chil, und seiner Familie. Darin beschreibt er als interaktive Desambiguierungsstrategie, die von den Beteiligten zur schrittweisen Referenzherstellung eingesetzt wird, ein komponenzielles Verfahren zur Erarbeitung von sequenziell fortentwickelten anchoring frames (Goodwin 2000a: 74):

4.8 Referent

83

One technique used repetitively by Chil to help others disambiguate a range of alternative possibilities consists in breaking the task up into smaller components. If one piece of the puzzle can be collaboratively established it can be used sequentially to provide a frame for the interpretation of subsequent action.

Auch wenn die Referenzherstellung in diesem Fall sehr kleinschrittig und kooperativ erfolgt, ist das von Goodwin beschriebene Verfahren der referenziellen Desambiguierung anhand von anchoring frames verallgemeinerbar – mit dem Unterschied, dass es im störungsfreien Normalablauf intrasubjektiv vollzogen wird und damit der empirischen Beobachtung entzogen ist. Während beim intrasubjektiv bleibenden Verfahren die Identifizierung des Referenten zustande kommt, wenn der Adressat einer deiktischen Referenzierungshandlung größtmögliche Kongruenz zwischen perzeptorischer und kognitiver Hypothesenbildung bzw. eine plausible Übereinstimmung (matching) zwischen Perzeption und Kognition erreicht hat, erfolgt in Reparaturen bzw. in der Interaktion zwischen dem Aphasiker und seinem Partner die Referenzherstellung explizit – und zwar erst dann, wenn der Zeigende in der Kette der vom Adressaten ausgedrückten Hypothesen diejenige ratifiziert, die den intendierten Referenten benennt. In unserem Datenbeispiel stellt die Referenzherstellung kein Problem dar. Die Zeigehandlung ist kontextuell hinreichend eingebettet, so dass Zeigeziel und Referent eindeutig hergestellt werden können. Folgende Faktoren tragen zu dieser Eindeutigkeit bei: Das proximale Deiktikon hier in Sabrinas Fokussierungsaufforderung (guck_ma HIER) lokalisiert Suchraum und Zeigeziel in relativer Nähe zum Körper der Zeigenden. Der Adressat kann daraus inferieren, dass seine Wahrnehmung der Zeigenden und seine Wahrnehmung des Zeigeziels relativ nahe beieinander liegen werden und seine Suchaktivitäten entsprechend einrichten. Auf semantisch-pragmatischer Ebene liefert die prosodische Doppelrahmung der aufmerksamkeitssteuernden Äußerung Sabrinas () einerseits als Vorwurf und andererseits als spielerisch-scherzhaft einen wichtigen Kontextualisierungshinweis für die Qualität und Bewertung des Demonstrandums. Die Äußerung attribuiert Jürgen aus einer inszeniert-kindlichen Perspektive „Doofsein“ im Zusammenhang mit einer von ihm ausgeführten Handlung, deren Resultat ein tadelnswertes sichtbares Phänomen (Inferenz: „Schweinerei“) ist, für das er als Handlungsurheber die Schuld trägt und daher die Verantwortung übernehmen muss. Die Handlung selbst, die Jürgen als weiterer Kontextualisierungshinweis für seine Hypothesenbildung über Zeigeziel und Referenten dienen kann, wird von Sabrina semantisch jedoch nicht näher spezifiziert, sondern als bekannt und hinreichend zugänglich im common ground vorausgesetzt. Die Aufladung des Raums mit Bedeutung, auf die Beteiligte sich verlassen und die sie interaktiv durch foregrounding zur Verständnisherstellung nutzen,

84

4 Ein Modell zur Untersuchung deiktischer Zeigehandlungen

ist mithin auch (mikro-)interaktionsgeschichtlich bedingt. Der Suchraum, den Sabrina körperlich durch ihre Zeigegeste herstellt und dessen perzeptorische Akzidenzien sie verbal mit Jürgen als Verursacher in Kausalzusammenhang bringt, ist semiotisch aufgeladen mit einem vorangegangenen Ereignis, das für beide Beteiligten ad hoc abrufbar sein muss, damit es in der Interaktion bedeutungsgenerierend fungieren kann. Im vorliegenden Fall folgt die Zeigehandlung auf die kindliche Hüpfball-Episode, der wiederum eine weitere Episode vorausgegangen ist: Jürgens Reinigungsaktion eines Staubsaugers an der von Sabrina gezeigten Stelle im Raum. Während Sabrinas infantilisierende Stimme den spielerischen Modus der unmittelbar vorangegangenen Hüpfball-Episode (re-)kontextualisiert, bindet ihr Vorwurf die Zeigesequenz zurück an die Reinigungs-Episode. Die Reinigungs-Episode, die Hüpfball-Episode und die Zeige-/Vorwurfs-Episode folgen sequenziell aufeinander, überlagern sich jedoch räumlich dadurch, dass sie alle drei denselben topographischen Bezugpunkt haben. Räume sind also semiotisch mehr oder weniger stark aufgeladen mit vorangegangenen Ereignissen. Dass ein solches Ereignis als Bedeutungsressource figuriert, heißt nicht automatisch, dass die konkrete Bedeutung für alle Beteiligten selbstverständlich ist. Welches dieser Ereignisse in den Vordergrund gerückt und damit von den Interagierenden in situ als Bedeutungsressource genutzt werden kann, ist abhängig von gemeinsamen lokalen und/oder globalen Interaktionsbiographien und dem darin gründenden, gemeinsamen und als gemeinsam gewussten bzw. unterstellten Wissen. Bezogen auf das vorliegende Beispiel besitzt der Dreck auf dem Fußboden perzeptorische Salienz. In der Sequenz trägt das von Sabrina halb spielerisch, halb ernst gebrauchte Vorwurfsformat (was_du geMACHT hast), das auf die Fokussierungs- (HEY doofer onkel) und Betrachtungsaufforderung (guck_ma HIER) folgt, zusätzlich zur Identifizierung des Zeigeziels innerhalb des Suchraums bei. Appellfunktional stellt der spielerische Vorwurf gegenüber der anfänglichen Fokussierungsaufforderung und der deiktischen Betrachtungsanweisung einen weiteren Intensivierungsgrad hinsichtlich der Aufmerksamkeitslenkung des Adressaten dar: Syntaktisch ist der Vorwurf als indirekter Fragesatz (Z. 5: was_du geMACHT hast) formuliert, der vom deiktischen Matrixsatz (Z. 4: guck_ma HIER) abhängig ist und dessen Bezugsobjekt nur visuell aufgefunden werden kann. Er etabliert als Zeigeziel einen Gegenstand, der erstens als etwas Sichtbares und zweitens als etwas Unerfreuliches bzw. Tadelnswertes charakterisiert wird, das drittens das Ergebnis einer vorausgegangenen Handlung darstellt, die viertens Jürgen zugeschrieben wird, für die dieser daher fünftens die Verantwortung zu tragen hat und die ihm sechstens die spielerische Attribuierung, er sei doof, einbringt. Das Auffinden des Zeigeziels gelingt nicht allein durch eine perzeptorische Fokussierung unter Anleitung des raumorganisatorischen proximalen Deiktikons

4.9 Wahrnehmung und Wahrnehmungswahrnehmung

85

hier und der Zeigegeste, sondern es wird darüber hinaus durch die Kontextualisierung gemeinsamen und als gemeinsam gewussten Wissens erleichtert und auf der Basis des ansonsten stillschweigend vorausgesetzten common ground vollzogen. Bei der Frage, wie der Umschlag vom Potenziellen ins Aktuelle gelingt, wie aus den möglichen Zeigezielkandidaten die wahrscheinlichsten „errechnet“ und schließlich das intendierte erkannt wird, spielen folglich nicht nur perzeptorisch vorstrukturierte physische, sondern auch vorstrukturierte mentale und interaktive Räume eine wichtige Rolle. Zeigen ist immer mehrfach eingebettet bzw. situiert (Goodwin 2003a). Dabei zeigt sich, dass die von Clark et al. (1983) experimentell in Einzelkomponenten zerlegten und getesteten Faktoren dessen, was den common ground konstituiert, in der realen Interaktion zusammenwirken und in der online-Emergenz von Interaktionen nicht einfach auseinander dividiert werden können. Der common ground ist nichts statisch Vorgegebenes, sondern er wird in gleicher Weise vom Kontext geformt, so wie er diesen umgekehrt selbst formt. Den Schlüssel dazu, ob die genutzten Ressourcen für die Zeigezielherstellung einerseits und für die Referenzherstellung andererseits erfolgreich waren, liefern zwei interaktive Kontrollverfahren (proof procedures), die in den nächsten beiden Abschnitten dargelegt werden: erstens die Reziprozität der Wahrnehmung (Abschnitt 4.9) und zweitens die Reziprozität des Verstehens (Abschnitt 4.10).

4.9 Wahrnehmung und Wahrnehmungswahrnehmung Zum Gelingen einer deiktischen Zeigehandlung gehört nicht nur, dass ein Zeigender mittels gestischer und verbaldeiktischer Mittel die Aufmerksamkeit seines Adressaten auf ein vom Zeigenden bereits fokussiertes, im gemeinsamen Wahrnehmungsraum befindliches Zeigeziel zu richten versucht und dadurch einen Referenten zugänglich macht, sondern auch, dass er sich der Lesbarkeit und Effizienz der von ihm eingesetzten Mittel vergewissert. Der Zeigende muss sicherstellen, dass der Adressat von seinem augenblicklichen Standort im Raum aus nicht nur den Zeigenden und seine Zeigegeste, sondern auch den Suchraum und das Zeigeziel sehen kann. Denn schließlich geht es dem Zeigenden zunächst einmal darum, etwas von ihm bereits Wahrgenommenes der Wahrnehmung des Anderen und damit der gemeinsamen Wahrnehmung – zu welchen weiteren Zwecken auch immer – zugänglich zu machen. Auf der perzeptorischen Ebene besteht die Funktion der deiktischen Zeigehandlung also darin, die individuelle Wahrnehmung eines im umgebenden Raum vorhandenen Phänomens in eine gemeinsame und als gemeinsam gewusste Wahrnehmungserfahrung zu verwandeln. Die Intersubjektivierung der Wahrnehmung vollzieht sich nicht nur durch

86

4 Ein Modell zur Untersuchung deiktischer Zeigehandlungen

eine gemeinsame visuelle Aufmerksamkeitsorientierung (joint attention; Tomasello 2008: 78), sondern darüber hinaus durch das entstehende Wissen um die gemeinsame Erfahrung dieser gleichgerichteten Aufmerksamkeitsorientierung (joint perceptual experience; Clark 1996: 112). Um diese Komponente als einen zentralen Intersubjektivierungsmechanismus deiktischer Zeigehandlungen theoretisch zu erfassen und analytisch zu operationalisieren, wird im Folgenden auf das Konzept der Wahrnehmungswahrnehmung rekurriert. Der Begriff der Wahrnehmung der Wahrnehmung geht auf Luhmann (1984: 560) zurück und besagt, dass „das Wahrnehmen wiederum zum Gegenstand von Wahrnehmungen“ werden bzw. gemacht werden kann: „Ego kann wahrnehmen, dass er von Alter wahrgenommen wird und an der laufenden Wahrnehmung von Wahrnehmungen sein Verhalten steuern.“ Die dadurch laut Luhmann ermöglichte „Interaktionssteuerung durch Wahrnehmung von Wahrnehmungen“ ist für den deiktischen Zeigeakt von entscheidender Bedeutung. Zeigeakte stiften, vermittelt über die Wahrnehmungswahrnehmung, den Übergang von individuellen Wahrnehmungsakten zu wechselseitig geteilter Wahrnehmung (Hausendorf 2003). Dies geschieht nicht einfach dadurch, dass ein Zeigender unabhängig von der Aufmerksamkeitsorientierung seines Adressaten sozusagen wahrnehmungs- und bedeutungsmonadisch einfach ein Hier oder Dort etabliert, ohne sich darum zu kümmern, ob der Adressat eine entsprechende perzeptorische Orientierung vornimmt, sondern er muss sich vergewissern, dass seine Bemühungen erfolgreich sind. Dies geschieht dadurch, dass er seine eigene Wahrnehmung daraufhin ausrichtet, ob der Adressat erstens ihn selbst als Zeigenden, zweitens seine Zeigegeste in ihrer Funktion als Verweismittel auf etwas Anderes und drittens dieses Andere wahrnimmt. Sowohl in der Phylogenese als auch in der Ontogenese stellen die Bewältigung der perzeptorischen Einzel operationen und die Ausbildung der erforderlichen kognitiven Voraussetzungsstrukturen zur Konstituierung dieser triadischen Relation zwischen Zeigendem, Adressaten und Zeigeziel einen zentralen Entwicklungsschritt menschlicher Kommunikationsfähigkeit dar (Tomasello 2008). Während der Adressat eines deiktischen Verweisaktes zur Zeigeziel- und Referenzherstellung ein genaues Monitoring der körperlichen Aktivitäten seines Interaktionspartners vornehmen muss, muss sich der Zeigende vergewissern, dass eben dieses Monitoring seiner Person auch stattfindet. Er wird also seine interpersonellen Koordinierungsaktivitäten so ausrichten, dass er Verweisraum und Zeigeziel für den Adressaten visuell herstellen kann und sich zugleich seinerseits durch ein Monitoring der Aufmerksamkeitsorientierung seines Adressaten perzeptorisch von dessen Wahrnehmung des Wahrzunehmenden überzeugen. Dieses Monitoring ist an den Blickorientierungen des Zeigenden empirisch nachvollziehbar. Den zu diesem Zweck kurz zwischen Zeigeziel und Adressaten

4.9 Wahrnehmung und Wahrnehmungswahrnehmung

87

hin- und herwechselnden Blick, mit dem Zeigende visuell Informationen über die Wahrnehmung ihres Adressaten erlangen, bezeichne ich als Kontrollblick zur Wahrnehmungswahrnehmung. Mit dem Begriff ist nicht die Wahrnehmungswahrnehmung selbst gemeint, die aus einer bestimmten Blickausrichtung lediglich theoretisch geschlossen werden kann, sondern der Einsatz einer speziellen Ressource, des Blicks, als visuelle Wahrnehmungsressource zur Herstellung der Wahrnehmungswahrnehmung. Letztere stellt folglich, wie die Begriffsprägung indiziert, die Funktion des Kontrollblicks zur Wahrnehmungswahrnehmung dar. Der Kontrollblick zur Wahrnehmungswahrnehmung gehört zum Typus interpersoneller Koordinierungsaktivitäten, die unter dem Begriff des Fremdmonitoring subsumiert werden können. Gegenüber anderen Formen des Fremdmonitoring liegt seine Besonderheit darin, dass er sich als visuelle Aktivität zugleich rekursiv auf die visuellen Aktivitäten des Interaktionspartners bezieht. Zur Illustration des Phänomens der Wahrnehmungswahrnehmung soll erneut das Datenbeispiel herangezogen werden. Wie in den vorherigen Abschnitten bereits erarbeitet wurde, muss Sabrina verbal und visuell sicherstellen, dass Jürgen sich zu ihr umdreht, dass er ihren Körper als verweisenden Körper begreift, ihre Zeigegeste wahrnimmt, den Suchraum herstellt und das Zeigeziel identifiziert. Im vorliegenden Beispiel bedeutet das, dass nicht nur Jürgen Sabrina wahrnimmt, sondern dass auch Sabrina wahrnimmt, das Jürgen sie wahrnimmt und ihrer Suchanweisung folgt: Die Doppelpfeile in Abbildung 19 für Sabrinas und Jürgens Blicke veranschaulichen diese Wahrnehmungswahrnehmung. Erst als sichergestellt ist, dass sich der Adressat visuell auf den Körper der Zeigenden als gestisch verweisenden Körper und den Suchraum orientiert hat, was die Vorbedingung dafür ist, dass er das Zeigeziel identifizieren und ihm diese Identifizierung von der Zeigenden auch unterstellt werden kann, senkt sie ihren Blick wieder (Abb. 20): Abbildung 19

Abbildung 20

88

4 Ein Modell zur Untersuchung deiktischer Zeigehandlungen

Im Vorangegangenen ist festgestellt worden, dass Sabrina durch ihren auf den Adressaten gerichteten Kontrollblick zur Wahrnehmungswahrnehmung die relevante Information erhält, dass er sie und – so ist zu inferieren – ihre Zeigegeste, den Suchraum und das Zeigeziel wahrnimmt. Darüber hinaus ist festzustellen, dass Jürgen Sabrina nicht nur in ihrer Eigenschaft als Zeigende wahrnimmt, sondern dass er sie in dem Augenblick wechselseitiger Wahrnehmung durch Blickkontakt auch in ihrer Eigenschaft als Wahrnehmende wahrnimmt: Durch den wechselseitigen Blickkontakt nimmt er sie zugleich als Wahrnehmende seiner Wahrnehmung von ihr wahr. Bei dieser Wahrnehmung handelt es sich folglich um eine Wahrnehmung dritter Ordnung. Dadurch werden ihre Wahrnehmung seiner Wahrnehmung und seine Wahrnehmung der Tatsache, dass sie seine Wahrnehmung wahrgenommen hat, zum Bestandteil des gemeinsamen und als gemeinsam gewussten Wissens. Der wechselseitige Blickkontakt besitzt daher eine herausgehobene Bedeutung: Er verändert jenen Teilbereich, der im Vorangegangenen als gemeinsamer Wahrnehmungshintergrund (common perceptual ground) bezeichnet wurde, in einer interaktionsrelevanten Weise. Aufgrund dieses Blickkontakts kann Jürgen in der Folge nicht so tun, als habe er Sabrina mitsamt ihren Herstellungsaktivitäten nicht wahrgenommen. Aufgrund des durch den Blickkontakt intersubjektivierten Wissens um die wechselseitige Wahrnehmung der jeweiligen Wahrnehmungen des Anderen würde ein solches Verhalten den Status intentionalen Ignorierens erhalten bzw. den markierten Fall einer rechtfertigungsbedürftigen Verweigerung der im Interaktionsverlauf entstandenen konditionellen Relevanzen konstituieren. Theoretisch ließe sich die Rekursivität reziproker Wahrnehmungswahrnehmung in Form eines regressum ad infinitum weiterspielen. Folgendes Argument spricht jedoch dafür, die Wahrnehmungswahrnehmung (Wahrnehmung zweiter Ordnung) sowie die Wahrnehmung der Wahrnehmungswahrnehmung (Wahrnehmung dritter Ordnung) neben der einfachen Wahrnehmung (Wahrnehmung erster Ordnung) als systematische Komponenten in das hier vorgelegte Modell der Parameter der Zeigehandlung aufzunehmen: Die Tatsache, dass die Wahrnehmungen erster, zweiter und dritte Ordnung im sequenziellen Handlungsvollzug der Beteiligten im Hinblick auf die interaktionale Ordnung und die entstehenden konditionellen Relevanzen einen systematischen Ort besitzen, rechtfertigt ihren Status als relevante Parameter der deiktischen Zeigehandlung. Dabei bildet die Wahrnehmung dritter Ordnung die letzte aus der vollzugsrekonstruktiven Beteiligtenperspektive nachvollziehbare Größe. Zusammenfassend stellen folgende Wahrnehmungshandlungen die für interaktive online-Veränderung des common ground relevanten Parameter dar: Zunächst sind die in den vorherigen Abschnitten bereits ausführlich diskutierten

4.9 Wahrnehmung und Wahrnehmungswahrnehmung

89

Wahrnehmungshandlungen erster Ordnung zu nennen. Sie betreffen seitens des Zeigenden (im Beispiel Sabrina) die visuelle Wahrnehmung des Verweisraums, des Zeigeziels sowie des körperlichen Standorts des Adressaten. Seitens des Adressaten (im Beispiel Jürgen) betreffen die Wahrnehmungshandlungen erster Ordnung den Körper der Zeigenden, ihre Zeigegeste, den Suchraum sowie das Zeigeziel. Auf der Metaebene der Wahrnehmungshandlungen zweiter Ordnung firmieren auf Seiten des Zeigenden die durch den Kontrollblick gewährleistete Wahrnehmungswahrnehmung des Adressaten zur Sicherstellung seiner visuellen Orientierung. Bei ihr handelt es sich um eine Wahrnehmungshandlung zweiter Ordnung, die metaperspektivisch auf die Wahrnehmungshandlung erster Ordnung bezogen ist. Auf Seiten des Adressaten konstituiert dessen Wahrnehmung des auf Verweisraum und Zeigeziel gerichteten Blicks der Zeigenden den Fall einer Wahrnehmungswahrnehmung, der je nachdem, wie die Zeigende ihre Ressourcen zum Zeitpunkt ihrer Wahrnehmung durch den Adressaten organisiert, eintreten kann oder auch nicht. Der Fall tritt ein, wenn die Zeigende zum Zeitpunkt ihrer Wahrnehmung durch den Adressaten in Richtung Zeigeziel blickt. Er tritt nicht oder gegebenenfalls zu einem anderen Zeitpunkt ein, wenn die Zeigende sich zum Zeitpunkt ihrer Wahrnehmung durch den Adressaten visuell nicht auf das Zeigeziel, sondern auf den Adressaten orientiert (vgl. dazu den Begriff des Ressourcen-Spagats in Abschnitt 4.5). Wahrnehmungshandlungen dritter Ordnung schließlich werden durch die Wahrnehmung der Wahrnehmungswahrnehmung konstituiert. Sie finden dann statt, wenn der Adressat durch Blickkontakt den auf ihn gerichteten Kontrollblick zur Wahrnehmungswahrnehmung der Zeigenden wahrnimmt. Der Kern dessen, was im Auftreten von Blickkontakt (mutual gaze) an diesem Punkt in der emergierenden deiktischen Zeigehandlung geschieht, liegt darin, dass er die visuelle Monitoringaktivität (den auf die visuelle Wahrnehmung des Adressaten gerichteten Kontrollblick) der Zeigenden zum Gegenstand hat und damit für beide Interaktionspartner den augen-blicklichen Stand des perzeptorischen Intersubjektivierungsprozesses maximal explizit macht. Durch das Intersubjektivierungspotential, das in der Rekursivität von Wahrnehmung(swahrnehmung) liegt, stellt die visuelle Wahrnehmung ein machtvolles Instrument zur interaktiven Herstellung, Verweigerung, Evaluierung, Verifizierung und Metathematisierung von common (perceptual) ground dar und unterscheidet sich in dieser Hinsicht fundamental von der auditiven Wahrnehmung.41

41 Ego kann sehen, dass Alter etwas sieht, und Alter kann sehen, dass Ego Alters visuelle Wahrnehmung sieht, so wie Ego sehen kann, dass Alter Egos Kontrollblick zur Wahrnehmung von

90

4 Ein Modell zur Untersuchung deiktischer Zeigehandlungen

Folgende Tabelle fasst die in den vorangegangenen Kapiteln modellhaft erarbeiteten perzeptorisch-visuellen Parameter der Zeigehandlung zusammen: Wahrnehmung

Zeigende nimmt wahr:

Adressat nimmt wahr:

I. Ordnung

1. den Verweisraum 2. das Zeigeziel 3. den Standort des Adressaten in Relation 3.1. zur Zeigenden 3.2. zum Verweisraum 3.3. zum Zeigeziel

1. den Körper der Zeigenden 2. die Zeigegeste 3. den Suchraum 4. das Zeigeziel

II. Ordnung

die Wahrnehmungen des Adressaten auf Parameter der I. Ordnung

die Wahrnehmungen der Zeigenden auf Parameter der I. Ordnung

III. Ordnung

die Wahrnehmungen der Zeigenden auf Parameter der II. Ordnung (d.h. die Wahrnehmung des Kontrollblicks der Zeigenden zur Wahrnehmungswahrnehmung des Adressaten)

4.10 Verstehen und Verstehensdokumentation Kognitives Korrelat zur Wahrnehmung des Zeigeziels als subjektivem Perzeptionsphänomen stellt die Identifizierung des Referenten bzw. das Verstehen des Gemeinten dar, das, um Bestandteil des common ground zu werden, ebenso wie die Wahrnehmung intersubjektiviert, d. h. als gemeinsames Verstehen hergestellt und gewusst werden muss. Über die perzeptorische Lokalisierung des Zeigeziels hinaus steht der Adressat also vor der Aufgabe, die Zeigehandlung zu verstehen. Sperber (1994: 185) zufolge enthält jeder Verstehensakt als Prämisse die in einer Äußerung von einem Sprecher übermittelte Information und als Ziel bzw. Schlussfolgerung die vom Sprecher intendierte Bedeutung.42 Dabei impliziert das

Alters Wahrnehmung sieht. Ego kann hingegen nicht hören, dass Alter etwas hört, sondern Ego kann nur inferieren bzw. unterstellen, dass Alter etwas hört (visuelle oder akustische Displays von Hörerlebnissen bleiben dabei unberücksichtigt, da sie eine andere Qualität darstellen). 42 Sperber (1994: 185): „In any instance of verbal understanding, there is an initial premise and a goal. The premise is the information that a certain person uttered in a certain sentence. The goal is to discover what that person meant in uttering that sentence.“

4.10 Verstehen und Verstehensdokumentation

91

vom Adressaten zu leistende Verstehen zumindest zweierlei: erstens die kognitiv-semantische Seite der Referenzherstellung und zweitens die pragmatische Seite der Ermittlung der illokutiven und perlokutiven Bedeutung der Zeigehandlung. Der Adressat muss folglich die der Zeigehandlung zugrunde liegende Intentionalitätsstruktur erkennen. Intentionen werden durch Inferenzen rekonstruiert. Dabei spielen Relevanzen (relevancies; Sperber 1994: 189; Sperber und Wilson 1986) and Zugänglichkeit (ease of access; Sperber 1994: 190) eine Schlüsselrolle. Entscheidend ist in diesem Zusammenhang die Feststellung, dass nicht die persönlichen, subjektiven Relevanzen des Einzelnen ausschlaggebend sind, sondern dass im Gegenteil die sozio-kognitive Fähigkeit zur Suspension der individuellen Relevanzen zugunsten einer situativen online-Analyse der von den Interaktionspartnern geteilten Relevanzen für das Gelingen gemeinsamer Wahrnehmungs- und Verstehensakte konstitutiv ist: „In direct competition, shared common ground trumps individual personal relevance every time“ (Tomasello 2008: 77). Die egozentrische Perspektive wird zugunsten einer sozio-zentrischen Wahrnehmungs- und Deutungsperspektive aufgegeben. Relevanzen (relevancies) und Zugänglichkeit (ease of access) als Schlüsselfaktoren beim wechselseitigen intention-reading (Tomasello 2008: 4) hängen proportional vom Grad des von den Beteiligten geteilten Wissens (common ground) ab. Je umfangreicher der common ground zwischen den Interaktionspartnern ausgestaltet ist, desto leichter lassen sich vom Adressaten Inferenzen über die Intention einer Sprecheräußerung ziehen. Die wechselseitig geteilten Wahrnehmungen, Wissens-, Verstehens- und Glaubenskomponenten bilden die Voraussetzungsstrukturen, auf deren Grundlage der Sprecher seine Äußerung gestaltet und auf die der Adressat seine – vom Sprecher intendierten – Inferenzen gründet.43 Konstitutiv für den common ground ist also nicht irgendein (Welt-)Wissen, sondern das gemeinsame und als gemeinsam gewusste Wissen der Beteiligten (Clark et al. 1983: 247; Clark 1996; Tomasello 2008).44

43 Clark et al. (1983: 247): „In our proposal, the speaker intends each addressee to base his infer ences not on just any knowledge or beliefs he may have, but only on their mutual knowledge or beliefs – their common ground.“ 44 Darin liegt der entscheidende Unterschied zwischen dem Gebrauch der Demonstrativa zum Verweis auf Wahrnehmungs- oder Wissenselemente, deren Zugänglichkeit (perzeptorisch im common visual ground bzw. kognitiv im shared common ground) unhinterfragt vorausgesetzt wird, und dem Gebrauch der Demonstrativa als Indexikalitätsmarker (vgl. Auer 1981b). Bei ihrer Verwendung in indexikalitätsmarkierender Funktion wird eben diese potenzielle Differenz zwischen dem allgemeinen Weltwissen bzw. dem Wissen des Sprechers und dem Wissen des Adressaten indiziert und als Verhandlungssache angeboten. Der indexikalitätsmarkierende Gebrauch

92

4 Ein Modell zur Untersuchung deiktischer Zeigehandlungen

Während, wie oben festgestellt wurde, das Verstehen das kognitive Korrelat zur Wahrnehmung darstellt und wie dieses ein intrasubjektives Phänomen darstellt, bildet das Verstehen des Verstehens oder besser die Verstehensdokumentation das sozio-kognitive Korrelat zur Wahrnehmungswahrnehmung als interaktivem Mechanismus zur Intersubjektivierung von Wahrnehmung. Die Verstehensdokumentation bringt eine deiktische Zeigehandlung dadurch interaktiv zum Abschluss, dass der Adressat dem Zeigenden durch seine verbalen und/ oder nonverbalen Folgeaktivitäten ein Display seines Verstehens liefert, das der Zeigende stillschweigend zur Kenntnis nehmen, explizit ratifizieren oder durch Reparaturinitiierungen einer erneuten interaktiven Bearbeitung unterwerfen kann. Solange der Adressat keine Anzeichen für sein Verstehen liefert, kann der Zeigende nicht wissen, ob seine Zeigehandlung erfolgreich war oder nicht.45 Konkret geschieht dies in unserem Beispiel dadurch, dass Jürgen, nachdem er Kopf- und Blickausrichtung für Sabrina sichtbar auf deren Körper orientiert und anschließend das Zeigeziel hergestellt hat, sich vollständig umdreht, zu dem angezeigten Ort zurückläuft und den Dreck wegkehrt. Durch sein Handeln signalisiert er nicht nur, dass er den Referenten identifiziert hat, sondern auch, dass er die Zuschreibung von Schuld bzw. Verantwortlichkeit in Sabrinas Vorwurf akzeptiert und zu der implizit geforderten Korrekturhandlung (remedial action) bereit ist. Dabei fallen Jürgens Dokumentation der gelungenen Perlokution von Sabrinas Äußerung, die nicht verbal als Entschuldigung, Rechtfertigung oder Versprechen (z. B. „mach ich gleich weg“), sondern als körperliche Handlung vollzogen wird, und seine faktische Ausführung der Korrekturhandlung zusammen. Aus Sabrinas Perspektive überlappen Jürgens Dokumentation der erfolgreichen Referenzherstellung und die Dokumentation der gelungenen Perlokution lediglich teilweise mit der Korrekturhandlung selbst, da deren Einzelschritte (Abbruch der Laufbewegung, Reorientierung von Kopf, Blick und Körper, Richtungswechsel mit neuer Laufbewegung zum Schauplatz hin, vorbereitendes Hantieren mit dem Kehrbesen, Wegkehren) situativ emergierend sind und – anders als eine verbale Reaktion – für Sabrina als schrittweise aufgebaute und eingelöste körperliche Mikro-Projektionen ihres Interaktionspartners lesbar werden. Das Ganze begleitet sie mit infantilisierenden Scherzkommentaren (A:lles macht der BAH (–) des_s !BAH!? (–-) des_s !BAH!? (–-) ((kichert)) des_s !BAH!? ((kichert))

des Demonstrativums dieser im Deutschen dient dazu, die Schnittmenge des common ground zu eruieren; er stellt ein interaktives Angebot zur Bearbeitung potenzieller Wissensdiskrepanzen dar, das genutzt werden kann, aber nicht muss. 45 Vgl. die Unterscheidung in presentation phase und acceptance phase bei Clark und Brennan (1991: 130).

Zusammenfassung

93

des_s !BAH!?), auf die Jürgen sequenzterminierend mit halt die KLAPp[e::]; (-) du GÖR; reagiert. Damit zeigt er an, dass er das von Sabrina für ihren Vorwurf gewählte Neckformat erkannt hat und das Asymmetrie-Spiel zwischen frechem Kind und bösem Onkel zu Ende spielt. Abschließend ist festzustellen, dass mit der perzeptorischen Identifizierung des Zeigeziels nicht nur die kognitive Referenzherstellung gelungen ist, sondern auch der illokutive und perlokutive Akt der Zeigehandlung erfolgreich sind.

Zusammenfassung: Perzeptorische, kognitive und interaktive Parameter der Zeigehandlung Ziel des vorliegenden Teils (Kapitel 4) war es, schrittweise ein phänomenologisches Modell zur systematischen Beschreibung deiktischer Zeigehandlungen in der face-to-face-Kommunikation darzulegen. Das Modell bildet die Grundlage für alle weiteren Theorien der Deixis, die sich mit Distanzkommunikation als ontogenetisch und phylogenetisch späteren Entwicklungsstufen verbalen und visuellen Zeigens beschäftigen. Der theoretische Anspruch begründet sich aus der Vorgängigkeit der face-to-face-Kommunikation und der sie konstituierenden Schlüsselmerkmale der auditiven und visuellen Zugänglichkeit der Beteiligten zueinander und zum sie umgebenden Raum. In der Auseinandersetzung mit Standardtheorien zur Deixis ging es darum, die bislang simplifizierend modellierte und empirisch unzureichend untersuchte deiktische Zeigehandlung als eine auf intra- und interpersoneller Koordination beruhende multimodale Hervorbringung der Beteiligten zu konzeptualisieren. Theoretischen Ausgangspunkt bildete die Kritik an der gängigen Auffassung, wonach die prototypische Zeigegeste vom Körper des Zeigenden aus einen Vektor projiziert, dessen imaginäre Verlängerung automatisch zum Zeigeziel führt, sowie die theoretische Auseinandersetzung mit der undifferenzierten Gleichsetzung von Zeigeziel und Referenten. Folgende Aspekte standen im Fokus der Betrachtung: Es handelte sich erstens um das Problem, wie Zeigende bei einem deiktischen Referenzierungsakt, der auf eine Zeigegeste angewiesen ist, ihren Körper als vom Adressaten instrumentell zu gebrauchende visuelle Ausdrucksressource und damit als perzeptorisch- intermediär relevanten Raum etablieren: perzeptorisch-intermediär deshalb, da der Körper des Zeigenden nicht wie bei der Ich-Deixis (vgl. Kapitel 7.1) oder beim Zeigen am eigenen Körper (vgl. Kapitel 7.2 sowie Stukenbrock 2008) das Ziel der Aufmerksamkeitsorientierung darstellt; und instrumentell deshalb, da der Körper des Zeigenden dementsprechend Mittel zum Zweck der Aufmerksamkeitsfokussierung des Adressaten auf einen anderen Raum (auf den Raum, in dem sich das

94

4 Ein Modell zur Untersuchung deiktischer Zeigehandlungen

Zeigeziel befindet) darstellt. Diese beiden perzeptorischen Räume, einerseits der Körper des Zeigenden und andererseits der Raum, den der Zeigende mittels körperlich-visueller Ausdrucksressourcen als für das Zeigeziel perzeptorisch und kognitiv relevanten Raum herstellt, sind durch die Begriffe verweisender Körper und Verweisraum terminologisch voneinander geschieden worden. Zweitens ging es um die Frage, wie der Raum, in dem sich das Zeigeziel befindet, interaktiv – d. h. dem beteiligungsspezifischen Anforderungsformat gemäß vom Zeigenden und vom Adressaten – hervorgebracht wird. Um die beteiligungsspezifischen Unterschiede zwischen Zeigendem und Adressaten empirisch beschreibbar und theoretisch modellierbar zu machen, hat sich die Ausdifferenzierung des domain of scrutiny-Konzepts (Goodwin 2003a) in zwei perspektivisch komplementäre Konzepte, das des Verweisraums (Zeigender) und das des Suchraums (Adressat), als im sequenziellen Ablauf des Interaktionsgeschehens begründet und analytisch sinnvoll erwiesen. Drittens stellte sich das Problem, wie der Adressat anhand der vom Zeigenden eingesetzten Verweismittel innerhalb des Suchraums perzeptorisch das konkrete Zeigeziel auffindet, wie er viertens anhand des Zeigeziels mittels zusätzlicher Kontextualisierungshinweise kognitiv Referenz herstellt und wie er schließlich fünftens die pragmatisch-interaktive Bedeutung des Zeigeakts versteht. Mit diesen Schritten jeweils verbunden war die Frage, ob und wie der Zeigende erkennt, dass seine Zeigehandlung perzeptorisch, kognitiv-semantisch und pragmatisch-interaktiv erfolgreich war. Aus der Analyse ergeben sich für das hier vorgestellte Modell zusammenfassend zehn Parameter der Zeigehandlung, deren Ermittlung weder den Anspruch erhebt, exhaustiv zu sein, noch eine Relevanz dieser Parameter ausschließlich für die Zeigehandlung behauptet. Das Ziel besteht vielmehr darin, zentrale Bausteine der Zeigehandlung, von denen einige (wie die fokussierte Interaktion) allgemeingültiger Natur, andere hingegen aktivitätsspezifisch sind, in ihrer sequenziellen und interaktiven Logik herauszuarbeiten. Sie lassen sich nach räumlichen (R), perzeptorischen (P), kognitiven (K) und interaktiven (I) Aspekten systematisieren. Dabei gibt es Überschneidungen zwischen den Kategorien: So kann die fokussierte Interaktion, die von Mondada (2007) primär räumlich bestimmt wird, mit gleichem Recht als interaktiver Parameter begriffen werden, der darüber hinaus perzeptorische Implikationen besitzt. Dasselbe gilt für die anderen Parameter. Sie bilden daher keine diskreten Kategorien, sondern idealtypische, heuristische Analysebegriffe, mittels derer die zwischen den verschiedenen Domänen stattfindenden Rückkoppelungsprozesse theoretisch und empirisch differenzierter beschrieben werden können (Asterixe hinter den Parametern indizieren die Überschneidung mit einer anderen, durch Großbuchstaben gekennzeichneten Kategorie).

Zusammenfassung

95

Die primär räumlich bestimmten Parameter (R) sind: 1. der verweisende Körper (*P), der als perzeptorisch-intermediär und instrumentell bestimmt wurde, 2. der Verweisraum und 3. der Suchraum. Perzeptorische Parameter (P) bilden: 4. die Zeigegeste und der von ihr projizierte Vektor, 5. das Zeigeziel (potenziell – aktuell) und 6. die Wahrnehmungen erster, zweiter (*I) und dritter Ordnung (*I). Die entscheidenden kognitiven Parameter (K) stellen 7. der deiktische Ausdruck und 8. der Referent, dessen Verankerung im common ground sowie der propositionale Gehalt des Zeigeakts dar. Als interaktive Parameter (I) lassen sich 1. die fokussierte Interaktion und 10. die Verstehensdokumentation (*K) einordnen, die sich sowohl auf die Referenzherstellung, als auch auf das Verstehen der pragmatischen Bedeutung des Zeigeakts, seine illokutive und perlokutive Bedeutung, bezieht. Die deiktische Zeigehandlung stellt sich als höchst komplexe interaktive Perzeptions- und Kognitionsleistung dar. Entscheidend ist, dass der simultane Einsatz multimodaler Ressourcen hinsichtlich der intra- und interpersonellen Koordination aufgabenverteilt funktioniert: Während Blick und Körperausrichtung zunächst der intrapersonellen Koordination bei der Verweisraumherstellung dienen, unterliegt der simultane Einsatz verbaler Ressourcen den interpersonellen Koordinationsanforderungen. Das bedeutet, dass im multimodalen Geschehen intra- und interpersonelle Koordinierungsaktivitäten simultan stattfinden können, ineinander greifen und auf diese Weise eine hoch systematische und zugleich kontextsensitiv orchestrierbare Gesamtgestalt bilden. Zeigende sind fortwährend auf die Aktivitäten ihres Adressaten orientiert und gestalten ihre Zeigehandlungen in minutiöser Abstimmung auf das sich entfaltende Interaktionsgeschehen. Der Adressatenzuschnitt (recipient-design, Sacks 1992) operiert nicht nur auf der verbalen Ebene, sondern er betrifft in gleicher Weise körperlich-visuelle Aspekte wie die Körperausrichtung des Adressaten, seine visuelle Aufmerksamkeitsorientierung sowie die visuelle Zugänglichkeit des verweisenden Körpers, der Zeigegeste, des Suchraums und des Zeigeziels.46 Die adaptiven, der interpersonellen Koordinierung geschuldeten Aspekte im lokalen Design der Zeigehandlung zeigen, dass das Adressatenverhalten die emergierende Zeigehandlung hinsichtlich der temporalen und sequenziellen

46 Zu derselben Feststellung gelangen Hindmarsh und Heath (2000: 1866): „The referential action is shaped not only with regard to where the participants are within the developing course of the current talk and activity, and the interests and competencies of the particular recipient, but also with respect to their bodily orientation and the shape and appearance of the object to be shown. The design of the referential action not only interweaves talk and gesture, pinpointing the object at the sequentially relevant moment, but configures an object within the local milieu to make it accessible in a particular way to the co-participant.“

96

4 Ein Modell zur Untersuchung deiktischer Zeigehandlungen

Organisation der vom Zeigenden eingesetzten verbalen und visuellen Ressourcen mitgestaltet. Die ständig im Fluss befindlichen körperlichen Verhaltensweisen beider Beteiligten sind für die konkrete Instantiierung des abstrakten multimodalen Zeigeformats, der Art und Weise, in der die verfügbaren multimodalen Ressourcen in der konkreten Zeigehandlung konfiguriert, temporal organisiert und sequenziell entfaltet werden, konstitutiv.

5 Typologie des gestischen Zeigens Ausgangspunkt der hier entwickelten interaktionslinguistischen Deixistheorie bildet die Annahme, dass deiktische Zeigehandlungen, die in der face-to-face-Kommunikation vollzogen werden, multimodale Phänomene darstellen, in denen über deiktische Sprachzeichen hinaus insbesondere Zeigegesten und Blickorganisation eine entscheidende Funktion bei der interaktiven Herstellung gemeinsamer Wahrnehmungs- und Kognitionsphänomene ausüben. Der analytische Fokus der folgenden Kapitel liegt auf den gestischen Zeigweisen und Zeiginstrumenten. Ziel ist es, unterschiedliche Zeigegesten zu identifizieren und hinsichtlich ihrer formalen und funktionalen Seite zu bestimmen. Wie zu sehen sein wird, verfügen wir über ein reichhaltiges Instrumentarium körperlicher Zeigmittel, die sich sowohl hinsichtlich ihrer Form als auch hinsichtlich ihrer Funktion im Grad ihrer Konventionalisierung unterscheiden. Nach einem kurzen Aufriss der bisherigen Forschung zu Zeigegesten werden die Verwendungskontexte der klassischen Zeigefingergeste untersucht. Sie kann insofern als prototypische Realisierungsvariante gestischen Zeigens gelten, als sie hinsichtlich ihrer Form und Funktion am stärksten konventionalisiert ist und (in vielen, wenngleich nicht in allen Kulturen) den unmarkierten Standardfall des identifizierenden, lokalisierenden Zeigens konstituiert. Es folgen Analysen zu weiteren Typen manuellen Zeigens, bei denen andere Finger als der Zeigefinger den auf Suchraum und Zeigeziel hin zu extrapolierenden Vektor darstellen. Von ihnen sind diejenigen Varianten zu unterscheiden, bei denen die geöffnete Hand das Zeiginstrument bildet. Über die Typen manuellen Zeigens hinaus umfasst das Variationsspektrum außerdem das in der untersuchten Sprachgemeinschaft weniger stark konventionalisierte und lediglich in markierten Verwendungskontexten auftretende Zeigen mit anderen Körperteilen wie dem Blick, Kopf, Kinn oder Fuß etc. Weitere wichtige Varianten stellen das Zeigen mit Objekten (Zeigestock, Stift, Löffel, Messer usw.) sowie das Zeigen mit oder am Referenzobjekt dar. Gerade am Zeigen mit und an Objekten offenbart sich die grundsätzliche Problematik von Gestentypologien (vgl. die Übersichten bei Kendon 2004: 84 ff.; McNeill 1992: 76; Müller 1998: 103), die darin besteht, dass unterschiedliche Klassifikationskriterien zu unterschiedlichen Kategorien führen und dass die Bildung trennscharfer, sich wechselseitig ausschließender Kategorien oft nicht möglich ist (so auch Goodwin 2003a: 228 f.; Kendon 2004: 104 u. 107; Streeck 2009a).47 Dieses Problem stellt sich auch im

47 Goodwin (2003a: 229 f.): „In most typologies of gesture […], iconic gestures and deictic

98

5 Typologie des gestischen Zeigens

Hinblick auf generelle zeichentheoretische Klassifikationen, die der klassischen Peirceschen Dreiteilung von Zeichen in Indices, Ikone und Symbole folgen (Clark 1996: 159). Gerade aus multimodaler Perspektive ist zu berücksichtigen, dass die aus verbalen und visuellen Ressourcen zu kommunikativen Gesamtgestalten verbundenen Äußerungseinheiten eine noch weit größere funktionale Vielschichtigkeit aufweisen als ein monomodales Zeichen und dass darüber hinaus interne Verweisrelationen zwischen den verschiedenen Ausdrucksmodalitäten bestehen können. Dies ist beispielsweise bei der kombinierten Einheit aus dem Modaldeiktikon so, Blick und ikonischer Geste der Fall (vgl. Streeck 2002; Stukenbrock 2010). Folglich erscheint es sinnvoller, anstelle des Versuchs, Gestentypologien mit diskreten Kategorien aufzustellen, von sozialen Praxen körperlichen Zeigens, Demonstrierens, Veranschaulichens, Darstellens etc. auszugehen, die in unterschiedlichem Maß konventionalisiert sind und ineinander übergehen bzw. sich miteinander verbinden können. Trotz der grundsätzlichen Abgrenzungsproblematik werden Zeigegesten in der Regel als distinktiver Gestentyp betrachtet (vgl. den Überblick bei Kendon 2004: 84 ff.) und in verschiedenen Typologien unter die objektbezogenen Gesten (objective gestures, Efron 1972 [1941]: 96), die Illustratoren (illustrators, Ekman und Friesen 1969: 62 f.), die deiktischen Gesten (deictics, McNeill 1992: 76) oder die referenziellen Gesten (Müller 1998: 110) subsumiert. Eine der Standarddefinitionen der Zeigegeste lautet wie folgt (Kita 2003b: 1): “The prototypical pointing gesture is a communicative body movement that projects a vector from a body part. This vector indicates a certain direction, location, or object.” Das Problem der meisten Definitionen liegt in ihrer Simplifizierung des Zeigeprozesses und der beim Zeigen involvierten perzeptorischen, kognitiven und interaktiven Faktoren. Dies manifestiert sich bereits in der Modellierung der direktionalen Komponente der Zeigegeste. Die theoretisch und empirisch unzureichende Auffassung von einer punktgenauen Vektor-Ziel-Relation zwischen Zeigegeste und Zeigeziel taucht in einer Reihe unterschiedlicher Arbeiten zur Deixis (Fillmore 1982: 46; Fricke 2007: 57), zum gestischen Zeigen (Kendon 2004), zur onto- und phylogenetischen Sprachentwicklung (Butterworth 2003; Tomasello 2008) etc. immer wieder auf. Demnach wird das Zeigeziel automatisch durch die

(pointing) gestures are treated as separate kinds of gesture. This does not seem to be correct. Pointing gestures can trace the shape of what is being pointed at, and thus superimpose an iconic display on a deictic point with the performance of a single gesture. Instead of using this distinction to separate gestures into distinct classes, it seems more fruitful to focus analysis on an indexical component and an iconic component of a gesture, either or both of which may contribute to the organization of a particular gesture.“

5 Typologie des gestischen Zeigens

99

Verlängerung einer vom Zeiginstrument projizierten geraden Linie aufgefunden (Kendon 2004: 200): „Pointing gestures are regarded as indicating an object, a location, or a direction, which is discovered by projecting a straight line from the furthest point of the body part that has been extended outward, into the space that extends beyond the speaker.“ Abweichend von dieser simplifizierenden Vorstellung gehe ich davon aus, dass die Zeigegeste zunächst einmal einen Suchraum (domain of scrutiny; Goodwin 2003a) konstituiert, innerhalb dessen durch das Zusammenwirken weiterer Kontextfaktoren das Zeigeziel als Figur (figure) vor einem Hintergrund (ground) hergestellt wird. Eine ausführliche Diskussion dieses als Vektor-Ziel-Problem bezeichneten und mit dem Problem der Referenzherstellung verknüpften Komplexes erfolgte im theoretischen Teil (Kapitel 4.7 und 4.8) und wird daher hier nicht weiter vertieft. Die folgende Darstellung beschränkt sich auf die formalen Gestaltunterschiede und die funktionalen Besonderheiten körperlich-gestischen Zeigens. Körperteile, die als Zeiginstrumente fungieren, sind typischerweise die Hände, die ebenso wie die Arme und Finger unterschiedliche Formengestalten und Positionen einnehmen können. Darüber hinaus kann durch Kopf- und/oder Augenbewegungen, in manchen Kulturen mit den Lippen oder mit dem Fuß bzw. Bein gezeigt werden (Kendon 2004: 199; de Jorio 2000: 70 ff.; vgl. zum lip pointing Enfield 2001; Sherzer 1973; Wilkins 2003; zum Zeigen durch Kopfbewegungen Calbris 1990). In ihrer Studie zum Neapolitanischen subsumieren Kendon und Versante (2003: 109) unter die Zeigegesten (pointing) ausschließlich solche Hand-Arm-Konfigurationen, die darauf spezialisiert sind, ein Objekt oder einen Ort zu indizieren. Sie konstatieren ein charakteristisches Bewegungsmuster, bei dem das Zeiginstrument einen bestimmten Weg zurücklegt, dessen finaler Wegabschnitt linear ist, und das eine klar definierte Zielrichtung besitzt. Dieses Bewegungsmuster bezeichnen sie im Rückgriff auf Eco (1976: 119) als „movement toward“ (vgl. auch Kendon 2004: 200). Häufig wird das Zeiginstrument auf dem Gipfelpunkt kurz gehalten. Ausgehend von verschiedenen Hand-Arm-Konfigurationen werden sechs verschiedene Typen manuellen Zeigens im Neapolitanischen unterschieden, die Kendon (2004) später um einen siebten Typ ergänzt.48 Seine These lautet, dass die verschiedenen Typen von Zeigegesten in systematischer Beziehung zu unterschiedlichen Referenzierungsweisen in der Sprecheräußerung stehen: „[…] differences in hand shape used in pointing are related to differences in the way

48 Kendon (2004: 205): „That is, there are seven different hand shape/forearm orientation combinations that are used in gestures judged to be specialized as pointing gestures.“

100

5 Typologie des gestischen Zeigens

the object being referred to by the pointing gesture is being used by the speaker in the speaker’s discourse“ (Kendon 2004: 199). Für das deixistheoretische Anliegen der vorliegenden Arbeit ist darüber hinaus Kendons Behauptung zu überprüfen, dass deiktische Ausdrücke in erster Linie in Verbindung mit Zeigefingergesten und weniger mit Gesten der geöffneten Hand gebraucht werden49. Die im Folgenden aufgestellte Systematik erfasst die auf unterschiedliche Weisen und mit unterschiedlichen Körperteilen bzw. Zeiginstrumenten ausgeführten Zeigegesten, die zusammen mit dem Gebrauch verbaler Deiktika auftreten. Dabei werden über die klassische Zeigefingergeste hinaus das Zeigen mit dem Daumen, mit dem kleinen Finger, drei Arten des Zeigens mit der ausgestreckten Hand, das Zeigen mit dem Kopf und mit dem Blick, einige Sonderfälle des Zeigens mit weiteren Körperteilen sowie schließlich das Zeigen mit Objekten und das Zeigen an Objekten diskutiert. Auswahlkriterium zur Erstellung der Datenkollektionen bildete die Ermittlung einer ausschließlich oder dominant deiktischen Funktion der Zeigegeste. Daraus folgt, dass auch Fälle ausgewertet wurden, in denen die deiktische Funktion von einer ikonischen Komponente überlagert wird, sowie Fälle, in denen Zeigehandlungen in andere Aktivitäten wie die Manipulation von Objekten übergehen oder in andere gestische Gestalten transformiert werden. Dazu ist abschließend zu bemerken, dass die Überlagerung von Zeigegesten mit weiteren Funktionen wie z. B. repräsentationalen (Kendon 2004: 202 f.) oder ikonischen (Goodwin 2003a: 228 ff.) sowie mit diskursstrukturierenden Komponenten (Kendon 2004: 204) ein bekanntes Phänomen darstellt. Es verdeutlicht das bereits erwähnte grundsätzliche Kategorisierungsproblem50, das sich aufgrund von Funktionsüberlagerungen auch bei der Analyse von deiktischen Gesten immer wieder stellt (Kendon 2004: 204): In general, gestures may be said to vary in the degree to which they show a deictic component. This component may be more or less strong dominating. Gestures that are said to be pointing gestures are dominated by the deictic component almost to the exclusion of everything else. We may say of such gestures that they are specialized as pointing gestures.

49 Kendon (2004: 208): „It is particularly interesting to note that whenever the index finger is used in pointing, the speaker also often employs a deictic word, whereas when the Open Hand is used, deictic words in the associated speech are less often observed.“ 50 Kendon (2004: 107): „Given the nature of gesture as a form of human expression, we cannot establish permanent categories that represent essentially different forms of expressive behav iour. That is, we have to think of the different gesture typologies that have been proposed as provisional working instruments which may be useful within a certain research perspective or interest, but are not at all to be supposed as universal or general schemes that show, in a fashion that is independent of any particular observer, or independent of any particular circumstance of interaction or occasion of use, how the activities of gesture are organized.“

5.1 Zeigen mit dem Zeigefinger

101

Das vorliegende Kapitel beschäftigt sich mit der Gruppe derjenigen Gesten, die auf die deiktische Funktion spezialisiert sind.

5.1 Zeigen mit dem Zeigefinger Als prototypische Zeigegeste wird das Zeigen mit dem Zeigefinger (index-finger pointing) aufgefasst. Die formalen Parameter der Zeigefingergeste bilden den Ausgangspunkt für die in unterschiedlichen Forschungszweigen geführte Diskussion um die menschliche Gattungsspezifik des Zeigens (Butterworth 2003; Kita 2003a, 2003b; Povinelli und Davis 1994; Tomasello 2008). Die Zeigefingergeste tritt in einer so großen Anzahl und Diversität von Kulturen und Gemeinschaften auf, dass sie aufgrund ihrer Verbreitung, ihres Stellenwerts in der Onto- und Phylogenese (Tomasello 2008) in der Regel als universale Geste betrachtet wird (Eibl-Eibesfeld 81978; McNeill 1987, 1992). Wilkins (2003) allerdings widerspricht der Auffassung, dass das Zeigen mit dem Zeigefinger eine universelle menschliche Verhaltensweise und eine natürliche, sozialisationsunabhängige Form der Referenzherstellung darstelle. Bei der kanonischen Zeigegeste wird der Zeigefinger ausgestreckt, die übrigen Finger sind nach innen gebogen, mit Ausnahme des Daumens, der auch abgespreizt sein kann. Die Handinnenfläche weist entweder nach unten (index finger palm down) oder befindet sich in vertikaler Lage (index finger palm vertical).51 Diese zwei Varianten werden nicht nur formal, sondern auch funktional als unterschiedliche Typen des Zeigens mit dem Zeigefinger (index finger pointing) klassifiziert (Kendon und Versante 2003: 115; Kendon 2004: 207 f.). Demnach findet bei der Zeigefingergeste mit nach unten orientierter Handfläche (index palm down pointing) in der Regel die Identifizierung eines Objekts (object individuation) statt, während bei der Zeigefingergeste mit vertikal orientierter Handfläche (index palm vertical pointing) nicht das Objekt selbst, sondern dessen Relation zu anderen Objekten, Prozessen oder Aktivitäten in den Aufmerksamkeitsfokus gerückt wird.

51 Ebenso Kendon und Versante (2003: 121), die auf der Grundlage der physisch-muskulären Besonderheiten die index palm down-Geste als aufwendigere und daher funktional der Objektindividuation gemäße betrachten: „Perhaps the index palm down position is used in object individuation because, to achieve this position, an additional action of the arm (forearm pronation) is often required. This may make it ‘marked’ or ‘distinct’ relative to the palm vertical position. The gesture used for pointing at an object when it is to be attended to for its own sake, as happens in object individuation, is thus more fully differenciated as an act of indication.“

102

5 Typologie des gestischen Zeigens

Abhängig von den vektoriellen Faktoren Richtung und Distanz des Zeigeziels in Relation zum Zeigenden und zum Adressaten können über die Hand hinaus der Unter- und Oberarm mit flexiblen Extensionsgraden in die Zeige(finger)geste mit einbezogen werden. In vielen Fällen findet darüber hinaus eine entsprechende Orientierung des Kopfs, des Oberkörpers und der Körperachse statt. Für alle Beteiligungsorgane (Finger, Hand, Unterarm, Oberarm sowie Kopf, Oberkörper und Körperachse) sind Variationen im Extensionsgrad der Gliedmaßen und im Muskeltonus möglich. Dasselbe gilt mutatis mutandis für Hand- und Armgesten, die entweder ohne Extension des Zeigefingers mit geöffneter Hand oder mit der Extension eines anderen Fingers (insbesondere des kleinen Fingers oder des Daumens) ausgeführt werden.

5.1.1 Zeigefinger mit Handfläche nach unten (ZfHu) Der Standardfall der Zeigefingergeste zeichnet sich dadurch aus, dass die Hand innenfläche der zeigenden Hand nach unten weist (index finger palm down). Die Hand ist dabei meist geschlossen, alle Finger sind eingerollt mit der Variationsmöglichkeit, dass der Daumen entweder Teil der geschlossenen Hand oder mehr oder minder stark abgespreizt sein kann. Nachfolgend werden exemplarisch verschiedene Beispiele der Zeigefingergeste mit Handfläche nach unten (ZfHu-Geste) diskutiert. Zunächst werden Fälle analysiert, in denen Sprecher lokaldeiktische Ausdrücke in Verbindung mit Zeigegesten verwenden, um einen speziellen Wahrnehmungsraum in den visuellen Aufmerksamkeitsfokus ihrer Adressaten zu rücken. Auf die Analyse dieser raumdeiktischen Zeigehandlungen, in denen die Lokalisierungsfunktion primär ist, folgt im nächsten Schritt die Betrachtung gegenstandsdeiktischer Zeigehandlungen und daran anschließend eine Darlegung personendeiktischer Zeigehandlungen (vgl. zur ausführlichen Betrachtung der Personendeixis außerdem Kapitel 7.1). Entscheidend ist, dass im Unterschied zu raumdeiktischen Zeigehandlungen im engeren Sinn sowohl in gegenstandsals auch in personendeiktischen Zeigehandlungen die Identifizierungs- gegenüber der Lokalisierungsfunktion primär ist. Allerdings kann sich die deiktische Identifizierung von Objekten und Personen phänomenologisch stets nur durch die gleichzeitige Realisierung einer Lokalisierungshandlung vollziehen. Sowohl bei der Lokalisierung von Phänomenen im Raum als auch zur Identifizierung von Objekten wird prototypischerweise die Zeigefingergeste im ZfHu-Format (Zeigefinger Handfläche nach unten) verwendet. Das erste Beispiel aus dem Kochkorpus „Kerners Köche“ illustriert die ZfHuGeste in ihrer klassischen Form. In dem Ausschnitt steht der Moderator Kerner

5.1 Zeigen mit dem Zeigefinger

103

(KE) in einem side-by-side-Arrangement (Kendon 1990: 213) neben einem der Fernsehköche hinter dessen Herd. Kerner hat sich von dem Koch das Rezept der zuzubereitenden Speise erklären lassen und stellt eine Nachfrage, die sich auf den Inhalt eines der aufgestellten Töpfe bezieht: Beispiel 1: „Pfeffer“ (KK1_00:04:32) Abbildung 1 ZfHu + Lokaldeiktikon dA

1

KE:

und warum hast du dA schon PFEFfer drin?

Kerners an den Koch gerichtete Nachfrage (Z. 1: und warum hast du dA schon PFEFfer drin?) enthält das gestisch gebrauchte Lokaldeiktikon dA. Simultan zu seiner Nachfrage führt er eine Zeigefingergeste im ZfHu-Format aus (Abb. 1). Da auf dem Kochtisch mehrere Töpfe und Gefäße stehen, ist die Lokalisierung und Referenzherstellung ohne eine Zeigegeste nicht möglich. Im nächsten Beispiel aus dem „Big Brother“-Korpus beklagen sich zwei Hausbewohner, Jürgen und Zlatko, darüber, dass einige ihrer Mitbewohner rücksichtslos mit dem gemeinsamen Wohnraum umgehen, ihre Dinge nicht wegräumen, Speise- und Getränkereste stehen lassen und sich auch am Putzen nicht beteiligen. Zlatko entrüstet sich über den verdreckten Zustand, in welchem er den Wohnraum am Morgen vorgefunden hat. Er wollte ursprünglich Staub saugen, da er normalerweise barfuß herumläuft und nun befürchten muss, in Getränkepfützen und Speisereste zu treten. Diese Befürchtung verdeutlicht er mit einer auf den Boden weisenden Zeigefingergeste, die begleitet wird von dem proximalen Lokaldeiktikon hier (Abb. 2):

104

5 Typologie des gestischen Zeigens

Beispiel 2: „barfuß“ (bb01_B_00:05:17)

1 2

Zlt:

ich wollt heut SAUgen(---) Abbildung 2 ZfHu + Lokaldeiktikon hier

3

weil ICH lauf noch hier

Das dritte Beispiel stammt aus dem Korpus „Stadtführungen“. Nachdem die Stadtführerin mit ihrer Gruppe einen neuen Anschauungsort erreicht und dort eine entsprechende räumliche Konfiguration eingenommen hat52, stellt sie durch eine weit ausgreifende, mit gestrecktem Arm und seitlich leicht vorgeneigtem Oberkörper ausgeführte Zeigegeste das nächste Anschauungsobjekt her (Abb. 3 auf der nächsten Seite). Suchraum und Zeigeziel der von der Stadtführerin ausgeführten Zeigehandlung befinden sich auf der gegenüberliegenden Straßenseite. Die den Oberkörper und den ausgestreckten Arm mit einbeziehende Zeigegeste entwirft einen großräumigen Bogen und kontextualisiert zusammen mit dem Lokdaldeiktikon dA (Z. 4) die verhältnismäßig große Distanz zwischen Betrachtungsstandort und Anschauungsobjekt. Neben der Kombination von Zeigefingergesten des ZfHu-Typs mit den Lokal deiktika hier und da, die einen statischen Ort indizieren, gibt es Varianten, in denen durch die Verwendung von Pronominaladverbien und komplexeren Lokalkonstruktionen Bewegungsabläufe, Richtungen etc. konzeptualisiert werden.

52 Vgl. zum gattungsspezifischen Wechsel zwischen mobilen und stationären Phasen und den jeweiligen phasen- und aktivitätsbezogenen multimodalen Herstellungshandlungen von StadtführerInnen und ihren Gruppen Stukenbrock und Birkner (2010).

5.1 Zeigen mit dem Zeigefinger

105

Beispiel 3: „Blick auf die Synagoge“ (StFB1_00:09:47)

1 2 3

SF:

(si_mer) alle DA? (3.0) also. (-) Abbildung 3 ZfHu + Lokaldeiktikon dA

4 5

dA ham_se nochma n_blick auf die (.) synaGOge,=

Dies hat Konsequenzen für die Realisierungsweise der redebegleitenden Zeigegesten, in die Form- und/oder Bewegungskomponenten integriert sind, die wie die korrelierenden Verbaldeiktika zusätzliche konzeptuelle Aspekte visualisieren. Im folgenden Beispiel stellt das Lokaldeiktikon da im Verbund mit dem Pronominaladverb drüber das verbale Korrelat (lexical affiliate, vgl. Schegloff 1984) der Zeigegeste dar. Zwei „Big Brother“-Bewohner, Jürgen und Sabrina, beschäftigen sich mit einem Hüpfball. Während Jürgen auf dem Hüpfball durch den Raum hüpft, kommentiert Sabrina seine sportliche Leistung. An einem Hindernis angekommen fragt Jürgen, ob sie da DRÜber hüpfen könne (Z. 2), doch sie versteht die Frage nicht richtig. Auf ihre Reparaturinitiierung (Z. 3: he?) produziert er eine Teilwiederholung seiner Frage. Bei dieser fremdinitiierten Selbstreparatur retrahiert er bis zum Beginn der Infinitivkonstruktion, die in der Reparatur hyperartikuliert (Z. 4: da DRÜber hüpfen;) und zusätzlich mit einer Zeigegeste versehen wird (Abb. 4 auf der nächsten Seite). Wie auf Abbildung 4 andeutungsweise zu erkennen ist, besitzt diese Geste einige von der kanonischen Zeigefingergeste abweichende Formmerkmale. So wird zum einen die Handform nicht so streng realisiert: Die anderen Finger sind

106

5 Typologie des gestischen Zeigens

Beispiel 4: „Hüpfball“ (bb02_3_00:02:07)

1 2

Sbr: Jrg:

a:::h du kAnnst_das aber [GU:T ey;] [schaffst]_da

3

Sbr:

he? Abbildung 4 ZfHu + Lokaldeiktikon da + Pronominaladverb DRÜber

4 5

Jrg: Sbr:

da

nicht eingerollt, sondern befinden sich in einer lockeren Position. Dies ermöglicht dem Zeigenden, eine rasche Rotationsbewegung mit der Hand vorzunehmen, wodurch ein kleiner Bogen skizziert wird, der die Bewegung einer Hindernisüberwindung andeutet. Dies soll der gebogene Doppelpfeil in der Abbildung veranschaulichen. In der Ausführung dieser Geste findet eine Überlagerung von deiktischer und ikonischer Funktion statt, wobei die deiktische, das Referenzobjekt identifizierende Funktion dominiert und von der ikonischen Funktion zusätzlich eingefärbt wird (vgl. zu ähnlichen Funktionsüberlagerungen Goodwin 2003a; Kendon 2004: 201 f.). Auch in Fällen, in denen die Form der Hand selbst nicht von der kanonischen Zeigegestengestalt abweicht, kann in die Bewegung eine weitere Funktion inkorporiert sein, wie das nächste Beispiel verdeutlicht. Es stammt aus dem Korpus der „Schmerzkonferenzen“. Der nach mehreren Operationen unter großen Hüftund Gehbeschwerden leidende Patient ist vom Chefarzt aufgefordert worden aufzustehen und zu Demonstrationszwecken im Raum auf und ab zu laufen. Dazu bekommt er vom Chefarzt folgende Richtungsanweisung:

5.1 Zeigen mit dem Zeigefinger

107

Beispiel 5: „rüber laufen“ (SK2710_00:12:46)

1

CA:

und bei jetzt laufen sie_ma von hIer nochmal ? Abbildung 5.1

Abbildung 5.2

ZfHu + Lokaldeiktikon hIer

ZfHu + Pronominaladverb RÜber

Die in temporalem und funktionalem Zusammenhang mit den Lokalangaben produzierte Zeigegeste besteht aus zwei Gestenphrasen53, deren erster Höhepunkt mit der Artikulation des proximalen Lokaldeiktikons hIer zusammenfällt (Abb. 5.1) und deren zweiter Höhepunkt simultan zum Pronominaladverb RÜber auftritt (Abb. 5.2). Während die erste Gestenphrase in kanonischer Weise ausgeführt wird, besitzt die zweite Gestenphrase keinen Halte- bzw. Umkehrpunkt, sondern läuft in einer fließenden Bewegung aus. Dabei ist außerdem festzustellen, dass die gebogene Form, die durch das Abwinkeln des Handgelenks zustande kommt, ikonisch den Wendepunkt und die Änderung der Laufrichtung abbildet, die der Patient auf dem vorgeschriebenen Weg körperlich umsetzen muss. Um diese Kurvenkomponente des entworfenen Laufwegs ikonisch in die Handgeste einbauen zu können, muss der Zeigende aus anatomischen Gründen von der ZfHu-Form zur ZfHv-Form (Zeigefingergeste mit Handfläche vertikal orientiert) wechseln. Neben der Herstellung von Wahrnehmungsräumen, der Lokalisierung statischer Phänomene und der Verankerung dynamischer Phänomene im Raum – verallgemeinernd gesagt der Lokalisierungsfunktion – besteht eine weitere zentrale Funktion der ZfHu-Geste darin, eine identifizierende Referenz auf Gegenstände oder Personen zu leisten. In solchen Fällen wird die Zeigegeste von Demonstrativpronomina oder demonstrativ gebrauchten Personalpronomina als verbalen

53 Vgl. zu den Begriffen Gesteneinheit, Gestenphrase und Gestenphase Kapitel 2 sowie Kendon (2004: 111 ff.).

108

5 Typologie des gestischen Zeigens

Korrelaten begleitet. Für diese auch als Gegenstandsdeixis zu bezeichnende, Objekte identifizierende deiktische Referenzherstellung gilt, dass die Identifizierungsfunktion stets mit der Lokalisierungsfunktion einhergeht. Fricke (2007) subsumiert daher die Gegenstandsdeixis unter die klassische Kategorie der Raumdeixis, die sie grundsätzlich für primär hält und zu einer umfassenden, übergeordneten Kategorie erhebt.54 Ein Beispiel aus dem „Big Brother“-Korpus, in dem sowohl ein Demonstrativpronomen zur Objektidentifizierung als auch Lokaldeiktika zur räumlichen Präzisierung des Zeigeziels gebraucht werden, soll den Zusammenhang zwischen Identifizierung und Lokalisierung illustrieren. Zwei „Big Brother“-Bewohner, Jürgen und Sabrina, stehen in einem side-by-side-Arrangement (Kendon 1990: 213) vor dem Metallkoffer einer Mitbewohnerin, der mit den Abschiedsgrüßen der restlichen Bewohner beschrieben ist, da die Mitbewohnerin möglicherweise das Haus verlassen wird (vgl. Beispiel 6 auf der nächsten Seite). Sabrina möchte Jürgen den Spruch zeigen, den sie selbst auf dem Koffer hinterlassen hat. Aufgrund der Vielzahl der Grüße und der semiotischen Dichte der Schriftzüge auf dem Koffer ist der gemeinte Text für Jürgen offenbar nicht so leicht zu finden. Sabrina braucht einen längeren Anlauf, um das Referenzobjekt – ihren Spruch – herzustellen, und repariert sowohl ihre Verbaläußerung als auch ihre Zeigegeste. Sabrina tritt von hinten an Jürgen heran, der bereits vor dem Koffer steht und die Sprüche betrachtet, stellt sich neben ihn und blickt ebenfalls auf den Kofferdeckel. Dadurch konstituiert sie eine gemeinsame visuelle Orientierung mit Jürgen. Bevor ihre Zeigegeste einsetzt, artikuliert sie das akzentuierte Lokaldeiktikon HIER (Z. 1), das in diesem Fall jedoch nicht der Lokalisierung eines proximalen Zeigeziels dient, sondern in der Funktion einer Fokussierungsaufforderung und zur Projektion der kommenden Zeigehandlung benutzt wird. Simultan zu ihrer abgebrochenen (Z. 2) und mehrfach reparierten Verbaläußerung produziert sie zwei mit ausgestrecktem Arm ausgeführte Zeigefingergesten (ZfHu). Die erste Zeigegeste setzt mit dem Ende der ersten Turnkonstruktionseinheit (Z. 1) ein, erreicht beim Lokaldaverb DA (Z. 2) einen ersten Gipfelpunkt (Abb. 6.1) und wird über den Äußerungsabbruch hinweg weiter forciert, indem Sabrina ihren Oberkörper vorbeugt. So erreicht die erste Geste simultan zum Demonstrativpronomen DAS (Z. 3) ihren eigentlichen Gipfel- und Umkehrpunkt (Abb. 6.2) und wird im Verlauf der lokaldeiktischen Reparatur (Z. 4: hier Oben;) vollständig retrahiert. In der anschließenden 0,4-sekündigen Pause (Z. 5) nimmt Sabrina durch einen Kontrollblick zur Wahrnehmungswahrnehmung ein Monitoring ihres Adressaten vor (Abb. 6.3), das keine eindeutige Schlussfolgerung

54 Vgl. zur Kritik an einer den Raum priorisierenden oder gar verabsolutierenden Deixistheorie Hanks 2005.

5.1 Zeigen mit dem Zeigefinger

Beispiel 6: „Kofferspruch“ (bb02_1_00:15:43)

1

Sbr:

HIER; Abbildung 6.1

Abbildung 6.2

ZfHu + Lokaldeiktikon DA + Abbruch

ZfHu + Demonstrativpron. DAS

2

DA vo'-=

3 4

=DAS_s von mir; hier Oben; Abbildung 6.3

Abbildung 6.4

Kontrollblick

ZfHu + Lokaldeiktikon DA

5 6

(0.4) ((lacht leise))

7

DA-

109

110

5 Typologie des gestischen Zeigens

darüber zulässt, ob er das Zeigeziel perzeptorisch aufgefunden und das Referenz objekt erfolgreich hergestellt hat. Es folgt eine zweite, verbaldeiktisch und gestisch realisierte Zeigehandlung. Dazu produziert Sabrina in Verbindung mit dem wieder aufgenommenen, akzentuierten Lokaldeiktikon DA (Z. 7) erneut eine mit ausgestrecktem Arm ausgeführte Zeigefingergeste unmittelbar über dem Kofferdeckel (Abb. 6.4). Die Identifizierung des Referenzobjekts und dessen Lokalisierung in einem semiotisch komplexen Raum bilden einen Problem, auf das die Zeigende, wie ihr gehäufter Gebrauch verschiedener Lokaldeiktika zusammen mit dem Demonstrativpronomen und der wiederholten Zeigegeste verdeutlichen, orientiert ist. Auch im nächsten Beispiel aus dem Kochkorpus („Tomatenpaste“) liegt ein Fall von Gegenstandsdeixis vor. Die Beteiligten sind damit beschäftigt, die in der Sendung gekochten Speisen anzurichten. Poletto (PL) bittet ihren Gast, Eva Habermann (EH), Tomatenpaste auf die bereitgestellten Crostini zu streichen (Z. 1). Habermann ist sich jedoch nicht ganz sicher, welche Crostini gemeint sind, und stellt eine Nachfrage (Z. 3: auf DIE?). Das Demonstrativpronomen wird von einer Zeigegeste (ZfHu) begleitet, die eine Auswahl an Crostini selegiert. Die Geste wird in der Pause von 0,9-Sekunden in ihrem Gipfelpunkt eingefroren und so lange gehalten (Abb. 7), bis die Adressatin zu antworten beginnt. In der Antwort spezifiziert Poletto die gemeinten Referenten: Beispiel 7: „Tomatenpaste“ (PK6_00:26:43)

5.1 Zeigen mit dem Zeigefinger

111

Das letzte Beispiel zur Gegenstandsdeixis stammt aus dem „Big Brother“-Korpus. An dem Beispiel sollen die formalen Besonderheiten diskutiert werden, die beim Zeigen in der vertikalen Dimension auftreten und darin bestehen, dass das Merkmal der nach unten gerichteten Handinnenfläche (das palm down-Merkmal) in die vertikale Dimension verlagert wird. Drei Bewohner, Jürgen, John und Sabrina, befinden sich im Aufenthaltsraum des „Big Brother“-Hauses. Jürgen und Sabrina sitzen einander am Tisch gegenüber und albern mit Scherzartikeln herum. Jürgen, der als Gag eine Brille trägt, setzt sich auf Sabrinas Vorschlag ein Stofftier auf den Kopf, das er anschließend durch eine deiktische Zeigehandlung in den Fokus rückt. Die Zeigefingergeste erreicht simultan zur Artikulation des akzentuierten Demonstrativpronomens DAS (Z. 1) ihren Gipfelpunkt (Abb. 8). Der Zeigefinger weist senkrecht nach oben, Arm und Hand bilden parallel zum Körper des Zeigenden eine gerade Linie, so dass die Handinnenfläche zum Körper weist. In die horizontale Dimension übertragen würde die Handinnenfläche, in typologischer Übereinstimmung mit der ZfHu-Geste, der sie folglich zuzurechnen ist, nach unten weisen, während die Handfläche parallel zum Boden orientiert wäre: Beispiel 8: „Scherzartikel“ (bb02_1_00:13:34) Abbildung 8 ZfHu + Demonstrativpronomen DAS

1 2 3

Jrg:

ja aber dann kommt DAS noch dazu; SO denken die nur;= le auf?

Nach der Analyse von ZfHu-Gesten, die im Verbund mit Lokaldeiktika zur Herstellung von Wahrnehmungsräumen und zur Lokalisierung darin befindlicher statischer oder dynamischer Phänomene dienen, und der Darlegung der die Lokalisierungsfunktion implizierenden Identifizierungsfunktion folgt nun die

112

5 Typologie des gestischen Zeigens

Darstellung der personendeiktischen Identifizierungsfunktion. Dabei gilt für die Personendeixis, was bereits im Hinblick auf die objektbezogene Identifizierungsfunktion verbaldeiktisch verankerter ZfHu-Gesten festgestellt wurde: Auch wenn die Primärfunktion solcher Handlungen in der Identifizierung von Personen besteht, geht diese Identifizierungsfunktion stets mit der Lokalisierungsfunktion einher (vgl. zur Personendeixis ausführlich Kapitel 7.1). In folgendem Beispiel aus dem „Big Brother“-Korpus wird durch eine Reihe von Zeigegesten, die in Kombination mit deiktisch verwendeten Personalpronomina auftreten, Personenreferenz hergestellt. Andrea erklärt ihren Mitbewohnern ein Gesellschaftsspiel, bei dem die Mitspieler sich gegenseitig die Namen berühmter Persönlichkeiten auf die Stirn kleben. Die Träger kennen ihr eigenes Namensetikett nicht und müssen durch gezielte, nur mit ja/nein zu beantwortende Fragen an ihre Mitspieler erraten, welche Persönlichkeit sie darstellen: Beispiel 9: „Personenraten“ (bb02_5_00:10:34)

01 02 03 04

Adr:

05 06

=dann gehn wir RECHTS rum? (---) ((schluckt)) ich denk ma hIer sitzt die BELla,=

-

darstellt; d-

07 08

Abbildung 9 ZfHu + Personalpronomen IHN

09 10 11 12 13 14

Jrg:

ICH mach IHN,= =ich geb IHM ein_n zettel auf_n kopf- (--) er IHM, du IHM, er IHR. ja (-) ((kichert))

5.1 Zeigen mit dem Zeigefinger

113

09 ICH mach IHN,= 10 =ich geb IHM ein_n zettel auf_n kopf- (--) Beispiel 9 (Fortsetzung) 11 er IHM, 12 du IHM, 13 er IHR. 14 Jrg: ja (-) ((kichert)) Während Andrea ihre Mitspieler instruiert, wer wem ein Namensetikett auf die Stirn kleben soll, führt sie entsprechende Zeigegesten aus, deren Gipfelpunkte jeweils mit den korrelierenden Personalpronomen zusammenfallen. Diese werden prosodisch akzentuiert und mit einem systematischen Wechsel von Tiefton auf dem das Agens bezeichnenden Pronomen und Hochton auf dem das Patiens bezeichnenden Pronomen produziert, so dass sowohl im vokalen als auch im visuellen Modus eine stark rhythmisierte Äußerung entsteht. Abbildung 9 hält den Gipfelpunkt der Zeigegeste fest, die mit dem deiktisch gebrauchten Personalpronomen55 IHN (Z. 9) zusammenfällt, mit dem Andrea denjenigen Mitspieler identifiziert, dem sie selbst einen Namenszettel zuteilen will. Im nächsten Beispiel aus „Polettos Kochschule“ zeigt Poletto, nachdem sie mit ihrem Studiogast in Zeitnot geraten ist, auf zwei Gäste im Publikum, die sie als potenzielle Küchengehilfen ausgeguckt hat, und identifiziert sie mit ihren Eigennamen als Hans (Z. 3) und Mehmet (Z. 7): Beispiel 10: „Hans und Mehmet“ (PK6_00:11:59)

1 2

PL:

ich WEISS schon,

-

Abbildung 10.1

Abbildung 10.2

ZfHu + Demonstrativpronomen DAS

Blick + Demonstrativpronomen DAS

55 Vgl. zum grundlegenden deixistheoretischen Unterschied zwischen erster und zweiter Person einerseits und dritter Person andererseits Benveniste (1974) sowie Kapitel 7.1 zur Personendeixis.

114

5 Typologie des gestischen Zeigens

Während Poletto den zuerst genannten Gast Hans mit einer Zeigefingergeste identifiziert und im Publikum lokalisiert (Abb. 10.1), wird der zweite Gast durch eine Kopfgeste mit zeigendem Blick (Abb. 10.2) lokalisiert (vgl. zum Zeigen mit dem Kopf bzw. Blick ausführlich die Kapitel 5.5.1 und 5.5.2). Dabei fällt der Gipfelpunkt der Zeigefingergeste mit der Artikulation des Demonstrativpronomen DAS (Z. 3) zusammen. Auf der verbalen Ebene wird die Referenz räumlich präzisiert durch die lokaldeiktische Ergänzung da vorne, die wiederum auf der gestischen Ebene begleitet wird von zwei kleinen rhythmischen Schlägen (batons). Dabei wird die ZfHu-Form der Zeigegeste beibehalten. Im Unterschied zur Handgeste erscheint der Gipfelpunkt der Kopfgeste erst kurz nach der Artikulation des Demonstrativpronomens. Eine räumliche Präzisierung wird nicht vorgenommen. Stattdessen ist Poletto durch die Redeüberlappung mit ihrem Gast (Z. 6) zu einer Reparatur des Demonstrativpronomens gezwungen (Z. 7). Die analysierten Beispiele belegen, dass die ZfHu-Geste zum einen in Verbindung mit Lokaldeiktika auftritt und mit diesen eine multimodale Gesamtgestalt bildet, die eine Lokalisierungsfunktion erfüllt. Zum anderen übt sie, in multimodalem Verbund mit Demonstrativpronomina und deiktisch verwendeten Personalpronomina, eine Identifizierungsfunktion aus, die allerdings nicht losgelöst von der Lokalisierung des gegenstands- oder personendeiktisch konstituierten Demonstratums vollzogen werden kann. Im Folgenden wird die zweite Formvariante der Zeigefingergeste in ihren interaktiven Verwendungskontexten betrachtet.

5.1.2 Zeigefinger mit Handfläche vertikal (ZfHv) Im Unterschied zu der im vorangegangenen Abschnitt diskutierten ZfHu-Geste, bei der die Handinnenfläche der zeigenden Hand nach unten weist, während die Hand parallel zum Boden ausgerichtet ist, befindet sich die Handfläche bei der ZFHv-Geste in einer vertikalen Orientierung. Die Handfläche und die übrigen Finger sind nicht auf gleicher Höhe zueinander, sondern liegen in vertikaler Linie vom kleinen Finger aufsteigend übereinander, wobei der Daumen entweder mit dem ausgestreckten Zeigefinger auf derselben Höhe oder darüber positioniert ist. Das erste Beispiel stammt aus dem Korpus „Polettos Kochschule“. In dem ausgewählten Ausschnitt beschreibt Poletto (PL) ihren nächsten Arbeitsschritt. Sie erhitzt Olivenöl in einer Pfanne, in der später Baguettescheiben für Crostini angeröstet werden, während ihr Gast, Tom Buhrow (TB), damit beschäftigt ist, rote Beete in Scheiben zu schneiden. Mit einer Nachfrage äußert er eine Vermutung über die Zubereitung der Crostini. Dabei blickt er zu Poletto und verwendet eine Zeigegeste in der ZfHv-Form (Abb. 1):

5.1 Zeigen mit dem Zeigefinger

115

Beispiel 1: „Crostini“ (PK5_00:09:18)

1 2 3 4 5 6

PL:

ich hab jetzt HIER

TB: PL:

[oKAY,

PL:

(1.0) [(...)

(-)

- (.)

meine:-

Abbildung 1 ZfHv + Pronominaladverb DAfür

7

TB:

[und DA

sind doch die crostini dann;

Auffällig ist zunächst, dass Poletto mit ihren Aktivitäten fortfährt, ohne sich visuell auf ihren Interaktionspartner zu orientieren. Ihr Blick ist auf die eigenen Hände gerichtet, während sie damit beschäftigt ist, ein Baguette klein zu schneiden. Folglich kann sie die Zeigegeste ihres Interaktionspartners nicht wahrnehmen. Im Unterschied zu den im vorherigen Kapitel untersuchten multimodalen Gestalten aus ZfHu-Gesten und gestisch gebrauchten Deiktika (Lokaladverbien und Demonstrativpronomina) enthält die Äußerung des Zeigenden im vorliegenden Beispiel keinen deiktischen Ausdruck, sondern lediglich das akzentuierte Pronominaladverb DAfür (Z. 7), das sich anaphorisch rückbezieht auf Polettos Beschreibung ihrer Kochaktivitäten. Dem entspricht die Beobachtung, dass die ZfHv-Geste und der Blick des Zeigenden ebenfalls auf den Raum gerichtet sind, in dem Poletto mit dem Baguetteschneiden beschäftigt ist. Funktional betrachtet dient die Zeigegeste nicht der Lokalisierung und Identifizierung eines Referenten, sondern der thematischen Relevantsetzung des in der Pfanne erhitzten Olivenöls und der Weiterverarbeitung des Baguettes zu Crostini durch jene manuellen Aktivitäten, in die Poletto gerade involviert ist. Auf diese Weise dokumentiert Buhrow nicht nur seine Ko-Orientierung, sondern er kooperiert mit Poletto auch bei ihren Erkläraktivitäten. Dies verdeutlicht nicht zuletzt die sequenzielle Platzierung seiner Äußerung nach einer abgebrochenen, von einer Pause gefolgten

116

5 Typologie des gestischen Zeigens

Turnkonstruktionseinheit (Z. 4), mit der Poletto eine Erläuterung projiziert, aber nicht ausgeführt hat. Da es sich um medial inszenierte Kommunikation handelt, die vor einem Studio- und Fernsehpublikum stattfindet, dient die Geste als visuelle Orientierungshilfe für die lateral mitadressierten Zuschauer. Das nächste Beispiel aus dem Korpus „Kerners Köche“ funktioniert ähnlich wie das „Crostini“-Beispiel. Nachdem Kerner (KE) mit spielerisch-leidender Ungeduld seinen Hunger zum Ausdruck gebracht hat (Z. 1 f.), verkündet Koch 1 (K1), dass er bereits fertig ist. Darauf richtet Kerner, der bis dahin mit Koch 2 (K2) in fokussierter Interaktion war, seine Aufmerksamkeit auf Koch 1, der mit der Anrichtung seines Gerichts beschäftigt ist, und äußert seine Verwunderung über die unorthodoxe Servierweise der Pasta (Z. 8). Die Äußerung wird begleitet von einer ZfHv-Geste (Abb. 2), deren Gipfelpunkt mit dem Verb mAchst (Z. 8) zusammenfällt und die unmittelbar darauf wieder retrahiert wird. Vektoriell ist die Zeigegeste auf die manuellen Aktivitäten des Kochs gerichtet, der mit der rechten Hand Nudeln aus einem Topf in ein Glas schöpft, das er in der linken Hand hält: Beispiel 2: „Glas“ (KK1_1_00:21:14)

1 2 3 4 5 6 7

KE: K1: KE: K2:

ich hab HUNger; MANno[manno (mannomann); [ist FE:Rtig; (0.5) ja, (0.6) du bist schon FERtig; (

)

Abbildung 2 ZfHv + Demonstrativpron. das K1

8

KE:

KE

K2

warum mAchst du das denn ins GLAS;

5.1 Zeigen mit dem Zeigefinger

117

Wie im vorherigen Beispiel fällt auf, dass der Adressat sich nicht auf seinen Interaktionspartner und dessen Zeigegeste reorientiert, sondern seine manuellen Aktivitäten fortsetzt und den Blick ununterbrochen auf die eigenen Hände gerichtet hält. Erneut handelt es sich um medial inszenierte Interaktion, so dass die Geste als Instrument der Aufmerksamkeitssteuerung des Publikums begriffen werden kann. Dabei stellt sich die Frage, auf welchen Teil der Verbaläußerung sich die Geste bezieht. Die Äußerung enthält ein Demonstrativpronomen (Z. 8: das), das allerdings unakzentuiert ist und nicht-gestisch verwendet wird. Sein Gebrauch beruht auf der Annahme, dass das Referenzobjekt – die Nudeln – aus dem Aktivitätskontext hinreichend bekannt und zugänglich ist und daher nicht eigens hergestellt werden muss. Auch die temporale Realisierung der Geste in Relation zur Verbaläußerung sowie die Tatsache, dass der prosodische und informationelle Fokus der Äußerung nicht auf dem Referenzobjekt, sondern auf der Tätigkeit (‚ins Glas machen‘) liegt, sprechen dagegen, dass die Geste eng mit dem Pronomen korreliert und zu dessen Desambiguierung verwendet wird. Wie im vorherigen Beispiel dient die ZfHv-Geste folglich nicht der Lokalisierung oder Identifizierung eines Referenzobjekts. Stattdessen rückt sie die Aktivität des adressierten Kochs, also das, was er simultan zum Äußerungszeitpunkt und zur Ausführung der Zeigehandlung mit dem Objekt tut, in den Aufmerksamkeitsfokus. Im dritten Beispiel aus einer Bayreuther Stadtführung produziert die Stadtführerin (SF) im Verlauf ihrer Ausführungen eine ZfHv-Geste auf den hinter ihr stehenden Brunnen, dessen Figuren und Ornamente Gegenstand gemeinsamer Entschlüsselungsanstrengungen der Gruppe darstellen. Die schrittweise Entschlüsselung der Figuren ist bereits seit einiger Zeit in Gang und wird von der Stadtführerin moderiert. Sie hat einen längeren Exkurs über die Markgräfin Wilhelmine eingeschoben und sucht die Gruppe nun auf Hauptaktivität der Brunnenentschlüsselung zu refokussieren. In den Händen hält sie eine Abbildung der Markgräfin Wilhelmine (Abb. 3.1), die sie zu Beginn ihres Exkurses hervorgeholt hat:

118

5 Typologie des gestischen Zeigens

Beispiel 3: „Flüsse“ (StFLIng1_00:10:57) Abbildung 3.1

1 2

SF:

DAvon ein bisschen ssen ja

Abbildung 3.2

:ter,

Die Stadtführerin beendet ihren Exkurs über die Markgräfin Wilhelmine, indem sie weitere Erläuterungen zu einem späteren Zeitpunkt verspricht (Z. 1) und als unmittelbar anstehende Aufgabe die gemeinsame Erarbeitung der dargestellten Flüsse ankündigt (Z. 2). Dabei dreht sie sich zu dem Brunnen um und führt mit der rechten Hand eine ZfHv-Geste (Abb. 3.2) in Richtung Brunnen aus. Wie in den vorherigen Beispielen enthält die Verbaläußerung auch hier kein gestisch verwendetes Deiktikon, das durch die Geste desambiguiert würde. Die Geste dient dazu, die gemeinsame Aktivität an das materielle Anschauungsobjekt rückzubinden. Das vierte Beispiel stammt aus einer Folge von „Polettos Kochschule“. Poletto (PL) und ihr Gast, Ingo Naujoks (IN), bereiten Teigklöße für Gnocchi zu. Während Poletto ausführliche Erläuterungen zu Knödeln abgibt, die sich vor allem an das Studio- und Fernsehpublikum richten, führt Naujoks begleitend dazu zwei ZfHv-Gesten (Abb. 4.1 und Abb. 4.3) auf den Gnocchikloß aus, den er soeben in einen vor ihm auf dem Herd stehenden Topf gegeben hat. Wie die Reorientierung seines Blicks und die Aufmerkgeste (Abb. 4.2) anzeigen, sind seine Gesten an das Publikum adressiert und konstituieren einen visuellen Begleitkommentar zu Polettos Äußerungen. Darin verbindet er Polettos Bemerkungen zu Klößen im Allgemeinen mit der konkreten Kochaktivität und deren sichtbaren materiellen Produkten:

5.1 Zeigen mit dem Zeigefinger

119

Beispiel 4: „alle Knödel“ (PK2_00:12:57)

01

PL:

02 03

die man sich VORstellen kann;= Abbildung 4.1

Abbildung 4.2

del ist;

ob das

04

Abbildung 4.3

05 06 07 08 09 10

Abbildung 4.4

wenn sie Oben an die IN: PL:

also er ja;

[alles KLAR;

]

Als Poletto ihre Ausführungen beendet hat, unternimmt Naujoks eine positive Bewertung (assessment) seines im Kochtopf schwimmenden Gnocchikloßes. Die Bewertung wird begleitet von einer weiteren ZfHv-Geste (Abb. 4.4), die dieselbe vektorielle Orientierung hat wie die beiden zuvor ausgeführten Gesten. Wie

120

5 Typologie des gestischen Zeigens

die beiden früheren ZfHv-Gesten dient auch diese Geste nicht der Desambiguierung eines gestisch verwendeten deiktischen Ausdrucks durch Lokalisierung oder Identifizierung, denn in der Verbaläußerung kommt lediglich das anaphorisch verwendete Pronomen er vor (Z. 9: also er HÄLT auf jeden fall?). Stattdessen bewirkt die Geste eine Refokussierung der Aufmerksamkeit auf die konkrete Kochaktivität und ihr materielles Produkt. Dieses wird jedoch nicht um seiner selbst willen in den Blick genommen, sondern an ihm wird eine bestimmte, im Kochprozess veränderbare und für den Kocherfolg relevante Qualität fokussiert. Im nächsten Beispiel aus einer weiteren Folge von „Polettos Kochschule“ möchte Poletto ihren Gast, Tom Buhrow, zu einer professionelleren Handhabung des Messers beim Kleinschneiden von Schnittlauch anleiten. Sie begründet ihre Instruktionen mit der Art und Weise, wie sich Aroma- und Bitterstoffe von Kräutern in Abhängigkeit von der Schneidetechnik entfalten. Dabei produziert sie eine ZfHv-Geste (Abb. 5), die wie ihr Blick auf die manuellen Aktivitäten ihres Adressaten gerichtet ist: Beispiel 5: „Schnittlauch“ (PK5_00:18:11) Abbildung 5

1 2 3 4 5

PL:

wenn sie jetzt_n SCHNITT wirklich_ der NICHT so FRISCH

(-

versuchen sie wIrklich mal so richtig so (.) zu WIEgen.

Die ZfHv-Geste erreicht ihren Gipfelpunkt simultan zur Artikulation des Anredepronomens sie (Z. 1), vektoriell jedoch weist sie nicht auf den Adressaten, sondern auf dessen manuelle Aktivitäten. Sie ist eingebettet in die Protasis (Z. 1) eines Konditionalsatzgefüges, dessen nach einer Teilretraktion (Z. 2) und einem Relativsatz (Z. 3) begonnene Apodosis (Z. 4) jedoch nicht zu Ende geführt wird. Die

5.1 Zeigen mit dem Zeigefinger

121

Sprecherin bricht ihr syntaktisches Projekt ab, reorientiert sich am emergierenden Geschehen und formuliert – mit Bezugnahme auf die Schneidetätigkeit ihres Adressaten – eine technische Instruktion (Z. 5). Erneut liegt der Fall vor, dass die Geste nicht zur Lokalisierung und Identifizierung eines durch einen deiktischen Ausdruck indizierten Objekts eingesetzt wird. Stattdessen bezieht sie sich auf die unmittelbar im Handlungsvollzug begriffene Gesamttätigkeit des Schnittlauchschneidens und dient dazu, den Kontrast zwischen der realen Situation und der im Konditionalsatzgefüge imaginierten kontrafaktischen Situation des Umgangs mit weniger frischem Schnittlauch zu beleuchten.

Zusammenfassung In den vorangegangenen Abschnitten wurden zwei wiederkehrende Formvarianten der Zeigefingergeste dargestellt und hinsichtlich ihrer funktionalen Unterschiede diskutiert. Die ZfHu-Geste tritt im Verbund mit gestisch gebrauchten deiktischen Ausdrücken – insbesondere mit den Lokaladverbien hier und da und entsprechenden Syntagmen aus Lokal- und Pronominaladverbien (hier rüber, da drüber, da drin) sowie mit Demonstrativpronomina – auf. Zudem sind deiktische Konstruktionen aus Demonstrativpronomina und Lokaldaverbien festzustellen (das da, das da vorne), die ebenfalls von ZfHu-Gesten begleitet werden. In diesen multimodalen Ausdruckseinheiten dient die ZfHu-Geste zum einen der Lokalisierung eines Phänomens im Wahrnehmungsraum und zum anderen der Objektbzw. Personenidentifizierung. Im Gegensatz zur ZfHu-Geste wird die ZfHv-Geste weder zur raumdeiktischen Lokalisierung noch zur individuierenden Referenz auf Personen oder Objekte eingesetzt. In der Regel wird sie nicht mit deiktischen Ausdrücken kombiniert. Stattdessen wählen Sprecher zur Desambiguierung eines gestisch gebrauchten Deiktikons die ZfHu-Geste oder – wie später in spezifischen Aktivitätskontexten zu sehen sein wird – Gesten der geöffneten Hand (vgl. Kapitel 5.4). Demgegenüber tritt die ZfHv-Geste in den analysierten Sequenzen nicht nur nicht in multimodalem Verbund mit deiktischen Ausdrücken auf, sondern sie besitzt auch kein eindeutiges verbales Korrelat. Sie fungiert als visuelles Kontextualisierungsmittel für die gesamte Aussage und hat folglich einen weiteren Skopus als die ZfHuGeste. Aus der funktionalen Besonderheit, dass die ZfHv-Geste nicht wie die ZfHuGeste für deiktisch-gestische Lokalisierung und Objekt- bzw. Personenidentifizierung gebraucht wird, erklären sich auch die Unterschiede im multimodalen Gesamtformat. Während bei der deiktisch-gestischen Referenzherstellung eine intrapersonelle, temporale Koordinierung von ZfHu-Geste und Deiktikon sowie die interpersonelle Koordinierung dieser Ausdrucksmittel mit der Aufmerksam-

122

5 Typologie des gestischen Zeigens

keitsorientierung des Adressaten den Kern der Wahrnehmungssteuerung des Adressaten bildet56, erfüllt die ZfHv-Geste eine globalere Funktion im Hinblick auf die sprachliche Äußerung. Sie fokussiert nicht ein einzelnes, räumlich exakt zu lokalisierendes Phänomen, sondern eine Aktivität, die in der zugehörigen Verbal äußerung des Zeigenden benannt und häufig vom Adressaten selbst ausgeführt wird. Dies hat Konsequenzen für die Blickorganisation als Mittel und Ausdruck interaktiver Wahrnehmungsstrukturierung. Während beim Gebrauch von verbaldeiktisch verankerten ZfHu-Gesten der Blick des Sprechers systematisch zwischen Zeigeziel und Adressatenorientierung alterniert und der Adressat seinen Blick umgekehrt auf den Sprecher, dessen Zeigegeste und das Zeigeziel richtet, erfolgen ZfHv-Gesten ohne eine entsprechende visuelle Aufmerksamkeitsorientierung des Adressaten. Dieser blickt in der Regel nicht in Richtung des Zeigenden und des gestisch angezeigten Raums, sondern er setzt seine Aktivität fort. Da es sich häufig um eine vom Adressaten unternommene oder gemeinsam mit dem Adressaten zu unternehmende Aktivität handelt, die der Zeigende zugleich auch verbal benennt, ist eine visuelle Wahrnehmung der Zeigegeste durch den Adressaten nicht erforderlich. Für Zuschauer allerdings oder lateral adressierte Dritte, die in medialen Formaten wie den Kochsendungen eine zentrale Rolle spielen, kann die Zeigegeste durchaus eine wahrnehmungsstrukturierende Funktion besitzen. Während bei der ZfHu-Geste das Verbaldeiktikon und die Zeigegeste durch eine sich wechselseitig kontextualisierende flag function (Streeck 2002) miteinander gekoppelt und zu einer multimodalen Gesamtgestalt verbunden sind, liegt für die ZfHv-Geste kein so enger Zusammenhang vor. Da die Wahrnehmung des Zeigenden, seiner Zeigegeste und des Zeigeziels durch den Adressaten keine notwendige Gelingensbedingung darstellt, spielt folglich auch die Wahrnehmungswahrnehmung zwischen Zeigendem und Adressaten keine Rolle. Dem formalen Kontrast zwischen der nach unten weisenden Handfläche bei der ZfHu-Geste gegenüber der vertikal ausgerichteten Handfläche bei der ZfHv-Geste entspricht folglich ein funktionaler Unterschied zwischen beiden Formaten: die deiktische Lokalisierung und Identifizierung bei der ZfHu-Geste gegenüber der Fokussierung einer – oftmals unmittelbar im Vollzug befindlichen – Aktivität bei der ZfHv-Geste.57

56 Wie in Kapitel 7.3 zu sehen sein wird, teilt die ZfHu-Geste diese temporalen Eigenschaften mit den (ikonischen) Gesten, die den gestischen Gebrauch des Modaldeiktikons so begleiten. 57 Die empirischen Beobachtungen zu den Unterschieden zwischen den beiden Gestentypen legen es nahe, die Unterschiede als gestisches Pendant zu der von Ehlich (1982, 1983) eingeführten linguistischen Unterscheidung zwischen deiktischer und anaphorischer Prozedur aufzufassen. Danach stellt die deiktische Prozedur eine Neufokussierung her, während die anaphorische Prozedur einen bereits etablierten Fokus aufrecht erhält.

5.2 Zeigen mit dem Daumen

123

5.2 Zeigen mit dem Daumen Der Daumen zeichnet sich bewegungsphysiologisch durch eine besondere Flexibilität hinsichtlich der Richtungswahl aus und wird daher insbesondere beim Zeigen über die eigene Schulter gebraucht (vgl. auch Kendon und Versante 2003; Kendon 2004). In meinem Datenkorpus tritt die Daumengeste zum einen bei der Referenz auf kopräsente Personen – bystander im Sinne Goffmans (1981) – und zum anderen zur globalen Richtungsangabe auf. Bei der seitlich oder nach hinten über die eigene Schulter weisenden Daumengeste fällt zunächst auf, dass das Zeigeziel außerhalb des unmittelbaren visuellen Wahrnehmungsraums des Zeigenden liegt. Dieser müsste, um zum Zeigeziel zu blicken, entweder den Kopf oder den ganzen Oberkörper drehen und sich dementsprechend vom Adressaten abwenden. Dies geschieht jedoch in aller Regel nicht, woraus sich mehrere Konsequenzen ergeben. Für den Zeigenden bedeutet der Verzicht auf ein perzeptorisches Selbstmonitoring erstens, dass er den Vektor seiner Zeigegeste nicht mit einer exakten visuellen Lokalisierung des Zeigeziels abgleicht. Die Zeigegeste bleibt im Hinblick auf das Vektor-Ziel-Problem (vgl. zum Vektor-Ziel-Problem ausführlich Kapitel 4.7) zwangsläufig unpräzise. Wie zu sehen sein wird, ist dieses Merkmal in die Daumengeste inkorporiert und zeichnet sie formal gegenüber den anderen Zeigegesten aus. Zweitens folgt daraus, dass der Zeigende auch auf eine perspektivische Einschätzung der visuellen Zugänglichkeit des Zeigeziels durch den Adressaten verzichtet. Auf eine Perspektivenkonvergenz kommt es bei der Daumengeste offenbar ebenso wenig an wie auf eine genaue Zeigezielpeilung. Aus der Adressatenperspektive bedeutet die vektorielle Ungenauigkeit der Daumengeste, dass der Adressat die deiktische Suchanweisung perzeptorisch nicht bis zum Ende befolgen muss, sondern, so die Implikation, allein durch das Anzeigen der Richtung genügend Informationen zur erfolgreichen Referenzherstellung erhält. Da sich der Erfolg der Zeigehandlung nicht der Präzision der Zeigegeste verdankt, sind die Gelingensbedingungen im default-Fall an bestimmte kontextuelle Faktoren geknüpft, die den Reduktionismus der Daumengeste kompensieren bzw. überhaupt erst ermöglichen. Die im Folgenden vertretene These dazu lautet, dass dieser direktionale und perzeptorische Reduktionismus der Daumengeste als Indikator für die Relevanzhochstufung des Kontexts fungiert und dem Adressaten die Anweisung erteilt, anstelle eines präzisen perzeptorischen Lokalisierungsakts das in der vorangegangenen Interaktion bereits etablierte gemeinsame Wissen (common ground) als Schlüssel zur Ermittlung des Referenten zu nutzen. Um die zentrale Rolle zu verdeutlichen, die ein dynamisch zu begreifender Kontext für den erfolgreichen Gebrauch der Daumengeste spielt, werden im Folgenden exemplarisch die kontextuellen Faktoren herausgearbeitet, die in einem

124

5 Typologie des gestischen Zeigens

reflexiven Verhältnis zur Wahl der Daumengeste stehen. Sie ermöglichen deren Gebrauch und werden zugleich umgekehrt durch den Gebrauch der Daumengeste indiziert. Hanks’ Konzept des indexical grounding gilt also nicht nur für verbale Äußerungen, sondern ebenso für visuelle Signale, bei denen daher nachzuweisen ist, „how utterances simultaneously make reference to and articulate with the context in which the reference is performed“ (Hanks 1996: 25 f.; Garfinkel 1967). Das erste Beispiel aus dem Korpus „Kerners Köche“ (vgl. nächste Seite) erscheint sehr einfach, da das verbale Korrelat der Daumengeste kein deiktischer Ausdruck, sondern ein Eigenname ist, der unter der Voraussetzung eines hinreichenden gemeinsamen Personenwissens zur Referenzherstellung grundsätzlich ausreicht. Damit könnte die Zeigegeste theoretisch den Status ‚nicht obligatorisch‘ erhalten, was allerdings die Frage aufwirft, warum sie trotzdem verwendet wird. In der Sequenz stehen die Fernsehköche eng beieinander im Halbkreis hinter dem Kochtisch und diskutieren die gesundheitlichen Risiken einer speziel len Zutat, der Tonkabohne. Der Moderator Kerner (KE) unterbricht die Diskussion, indem er, begleitet von einer Aufmerkgeste (Abb. 1.1), das Studiopublikum adressiert (Z. 1: ich MÖCHT’ ich MÖCHT ihnen mal was sagen;) und in indirekter Rede eine vorangegangene Bemerkung eines der Köche zur Suchtgefahr der Tonkabohne zitiert (Z. 2–4). Diese Bemerkung bezieht er dann zur Publikums erheiterung in frotzelnder Weise58 auf die Köche (Z. 5–6). Als Kerner den Eigennamen (Z. 2: JOhann) artikuliert, zeigt er mit dem Daumen über die eigene Schulter hinweg auf den schräg links hinter ihm stehenden Koch Johann Lafer (Abb. 1.2). Die Zeigegeste weist auf diejenige Person, die als Urheber des Zitats fokussiert wird, das Kerner, eingeleitet durch ein verbum dicendi (Z. 2: gesagt hat,), anschließend in der indirekten Rede wiedergibt (Z. 3: dass das (.) dass das SÜCHtig macht,). Dabei blickt der Zeigende weder vor noch während der Durchführung seiner Zeigegeste auf das Zeigeziel. Das ist zum einen darauf zurückzuführen, dass er das Studio- und Fernsehpublikum adressiert und wie alle Bühnenakteure der Kochshow auf das Studiopublikum und die Kameras orientiert ist. Zum anderen weiß er aufgrund seines side-by-side-Arrangements mit Lafer, wo dieser sich befindet, so dass eine perzeptorische Kontrolle der Vektor-Ziel-Relation überflüssig ist. Darüber hinaus erfüllt die doppelte Unschärfe der Daumengeste, die dadurch zustande kommt, dass der Zeigende kein Selbstmonitoring vornimmt und dass der Daumen ohnehin wenig vektorielle Präzision aufweist, interaktiv eine face-work-Funktion (Goffman 1967). Denn gerade beim Zeigen auf Personen ist die Unschärferelation zwischen Zeigegeste und Zeigeziel Teil des kulturellen

58 Vgl. zum Frotzeln Günthner 2006.

5.2 Zeigen mit dem Daumen

125

Beispiel 1: „Johann“ (KK1_00:12:42) Abbildung 1.1

1 2 3 4 5 6

KE:

Abbildung 1.2

ihnen mal was sagen; nachdem JOhann gesagt hat, und einen RAUSCH verursacht, wollen ALle mal probieren; ne?

-

Höflichkeitsgebots, das die Wahl des vektoriell besonders markanten Zeigefingers tabuisiert. Dieser scheidet hier nicht nur aus interaktionsräumlichen und anatomischen Gründen als Zeiginstrument aus, da das Zeigeziel hinter dem Zeigenden liegt, sondern erweist sich auch aus Höflichkeitsgründen als unge eignet. Auch wenn die Daumengeste also im Hinblick auf die Vektor-Ziel-Aufgabe unpräzise ist, stellt dies kein Problem dar, denn erstens ist die Konfiguration der Köche für alle sichtbar, und zweitens dürfte der Name des Kochs hinreichend bekannt sein. Eine Ausnahme bilden diejenigen Zuschauer, die mit der Sendung nicht vertraut genug sind, um aufgrund des Vornamens Personenreferenz herstellen zu können. Angesichts eines epistemisch heterogenen Publikums liefert die Daumengeste einen zusätzlichen visuellen Hinweis, wer von den anwesenden Köchen Johann heißt, Urheber des Zitats und damit verantwortlich für das zuvor diskursiv vergemeinschaftete Wissen über die Tonkabohne ist, das in Kerners Äußerung den Anker für einen humorvollen Seitenhieb auf die Köche bildet. Das zweite Beispiel zeigt, dass anstelle eines Eigennamens auch ein referenziell weniger eindeutiges, stark kontextabhängiges Personalpronomen ver-

126

5 Typologie des gestischen Zeigens

wendet werden kann. Damit wird auf der verbalen Ebene ein deiktischer Akt der Personenreferenz vollzogen, der eine Zeigegeste nahelegt bzw. unter Umständen zwingend erforderlich macht. Das Beispiel stammt aus der Sendung „Die Küchenschlacht“. Der Moderator Horst Lichter (HL) unterhält sich nacheinander mit den Kandidatinnen und Kandidaten, während diese an unterschiedlichen Kochplätzen nebeneinander um die Wette kochen. In der Sequenz wechselt der Moderator den Standort und geht von einer Kandidatin zum nächsten Kandidaten. Im Verlauf der neu begonnenen Interaktion zeigt er mit einer Daumengeste auf seine vorangegangene Interaktionspartnerin: Beispiel 2: „Schlagersängerin“ (KS1_00:11:35)

01 02 03 04 05

HL:

-

ro:lf,

-

ja? Abbildung 2

06 07 08 09 10

SIE, (1.2) ja?

uns;

Nachdem sich der Moderator zuvor mit der Kandidatin (K1) zu seiner Rechten unterhalten hat (Z. 1), wendet er sich mit einer Fokussierungsaufforderung (Z. 2: ro:lf,) dem Kandidaten (K2) zu seiner Linken zu. Wie der mitten im Wort vollzogene Abbruch seiner an K1gerichteten Äußerung verdeutlicht (Z. 1: SCHLAger’-), geschieht dies sehr abrupt. Bei dem Versuch, den unvermittelten Wechsel zwischen der fokussierten Interaktion mit K1 (Z. 1: ä:::h da du ja SCHLAger’-) und der

5.2 Zeigen mit dem Daumen

127

Adressierung von K2 (Z. 2: ro:lf,) so zu organisieren, dass zwischen den beiden Kandidaten thematisch eine Brücke entsteht, vollzieht der Moderator eine Zeigehandlung, durch die K1 verbal und visuell in den Fokus gerückt wird. Dabei befindet er sich bereits in fokussierter Interaktion mit K2 auf seiner linken Seite. Die beiden sind einander mit dem Oberkörper halb zugewandt, nehmen also eine L-Formation (Kendon 1990: 213) ein, während der Moderator der ersten Kandidatin den Rücken zugekehrt hat. Er schlägt Rolf vor, sich ein Lied zu wünschen, das K1 in ihrer Rolle als Schlagersängerin später singen solle (Z. 6/7: und äh (.) SIE, // SINGT das nachher für uns;). Simultan zur Artikulation des deiktisch gebrauchten Personalpronomens (Z. 7: SIE), das den Hauptaktzent trägt, führt der Moderator über seine Schulter hinweg die Daumengeste auf K1 aus (Abb. 2). Da in dieser Sendung drei der insgesamt fünf Gäste weiblich sind und die räumliche Konfiguration so gestaltet ist, dass eine von ihnen links neben K2 am letzten Kochtisch steht, während sich die anderen beiden rechts vom Moderator und K2 befinden, ist die Referenzherstellung allein aufgrund des Pronomens problematisch. Dies gilt sowohl für K2 als unmittelbaren Adressaten als auch für das Studio- und Fernsehpublikum. Obwohl der Moderator im zweiten Beispiel nicht mit dem Eigennamen auf die Person referiert, reicht auch hier, analog zum ersten Beispiel, die unspezifische Daumengeste zur Lokalisierung bzw. Identifizierung des Referenten aus. Beiden Fällen ist gemeinsam, dass auf eine kopräsente Person (bystander) gezeigt wird, die sich aufgrund der räumlichen Teilnehmerkonfiguration seitlich hinter dem Zeigenden befindet. In beiden Fällen spielt das side-by-side-Arrangement sowie die Orientierung der Beteiligten auf das Publikum eine Rolle bei der interaktionsräumlichen Organisation der Zeigehandlung und der Auswahl des Zeigeformats. Funktional geht es in beiden Fällen um die Fokussierung einer Person als Trägerin einer thematisierten Handlung: Im ersten Beispiel handelt es sich um Johann Lafer als Vermittler eines bestimmten Wissens über die Tonkabohne, das für einen ad hoc gebildeten Witz reaktiviert wird. Im zweiten Beispiel nimmt K1 als Schlagersängerin und potenzielle Performerin eines Liedes, das K2 sich wünschen soll, diese Rolle ein. Im dritten Beispiel aus „Polettos Kochschule“, das im Hinblick auf den Interaktionsraum und das Beteiligungsformat erneut die Konstitutionsbedingungen einer medialen Kochshow aufweist, zeigt der Gast, Heide Simonis (HS), mit dem Daumen auf Poletto (PL). Die Zeigegeste ereignet sich, nachdem Poletto ihren Gast gebeten hat, das auf dem Herd kochende Gericht umzurühren (Z. 1), und im Anschluss an eine positive Antwort (Z. 2) fortfährt, die nächsten Arbeitsschritte anzukündigen (Z. 4 f.):

128

5 Typologie des gestischen Zeigens

Beispiel 3: „getroffen“ (PK3_00:25:36)

1 2 3 4 5 6

PL: HS: PL:

MACH_ich. (0.5)

HS:

[ich hAb sie Abbildung 3

7 8

schon mal geTROFfen, vor_n paar JAHren,

Simonis unterbricht Poletto (Z. 6), indem sie das Publikum adressiert und mit humorvoller Ironie erzählt, dass Poletto ihr vor Jahren das Umrühren noch nicht gestattet habe (Z. 6–8). Dabei vollführt sie eine Daumengeste auf Poletto, die diese nicht nur zum Gegenstand der Erzählung, sondern perzeptorisch zum Wahrnehmungsobjekt und beteiligungstrukturell zum bystander ihrer Interaktion mit dem Publikum macht. Auch im vierten Beispiel aus dem „Big Brother“-Korpus ist die räumliche Konfiguration der Teilnehmer und das Beteiligungsformat ähnlich organisiert wie in den vorherigen Beispielen. Die Sequenz enthält eine ganze Serie von Daumengesten, die auf die räumliche Anordnung der Beteiligten, auf das mediale Format einer konzertierten Interaktion mit der Kamera sowie darauf zurückzuführen sind, das erneut auf kopräsente Personen gezeigt wird. Die Beteiligten sitzen eng neben- und hintereinander im Statement-Raum des „Big Brother“-Hauses und adressieren via Kamera ihre Zuschauer, um von dem Schauspiel (Shakespeares „Midsummer Night’s Dream“) zu erzählen, das sie aufführen müssen. Sie berichten, welche Figuren sie spielen und welche Beziehungen zwischen den Figuren bestehen. Als John (Jhn) an die Reihe kommt, stellt er sich in seiner Rolle vor (Z. 1) und erzählt, wen er in dem Stück heiraten soll und warum (Z. 6–7, 10). Im Verlauf

5.2 Zeigen mit dem Daumen

129

seiner Äußerungen produziert er zwei Daumengesten auf die dicht neben ihm sitzende Sabrina (Sbr), die in dem Stück offenbar die Rolle der ihm zugedachten Braut spielt: Beispiel 4: „Sommernachtstraum“ (bb02_7_00:20:58)

01 02 03 04 05

Jhn: Sbr: Jhn: Sbr:

=A:lso ICke (.) bIn (-) diMItrius, (0.6) ((kichert))

[u:n:d-]

Abbildung 4.1

06

Jhn:

ja SIE is_n juter SCHUSS,

Abbildung 4.2

07 08 09 10

Jrg: Sbr: Jhn:

Abbildung 4.3

sie soll (-) [ick soll sie HEIraten, [((lacht)) ja ((lacht)) weil det bringt ordentlich JELD in_ne familie,

130

5 Typologie des gestischen Zeigens

In der Sequenz wird die erste Daumengeste simultan zum akzentuierten Personalpronomen SIE (Z. 6) ausgeführt (Abb. 4.1), das im Rahmen einer Bewertungshandlung (Z. 6) auftritt und ohne visuelle Zeighilfe referenziell ambig bliebe, da insgesamt drei Frauen anwesend sind. Anschließend senkt John seine Hand (Abb. 4.2) und hebt sie erst im Verlauf seiner Reparatur wieder an, um eine zweite Daumengeste auf Sabrina zu richten (Abb. 4.3), die temporal mit dem in der Reparatur geäußerten Personalpronomen sie (Z. 7: ich soll sie HEIraten,) aligniert ist. Während in den vorherigen vier Beispielen der Gebrauch der Daumengeste beim Zeigen auf kopräsente Personen (bystander) analysiert wurde, werden im Folgenden Daumengesten betrachtet, die zum Zeigen auf Räume bzw. zur Richtungsangabe verwendet werden. Im nächsten Beispiel aus „Polettos Kochschule“ erläutert Poletto zwei verschiedene Möglichkeiten, einen Braten schmoren zu lassen. Als sie die zweite Möglichkeit erwähnt, führt sie nach hinten über die Schulter eine Daumengeste in die Richtung aus, in der sich der Ofen befindet. Im Unterschied zu Alltagsküchen ist er nicht in den Herd integriert, an dem Poletto und ihr Gast zum Äußerungszeitpunkt stehen, sondern seitlich an der Studiowand angebracht. Die Zeigegeste wird in der Mikropause ausgeführt und unmittelbar darauf retrahiert. Dabei ist der Blick der Zeigenden auf ihren Adressaten orientiert (Abb. 5): Beispiel 5: „im Ofen“ (PK3_00:14:56)

1 2

PL:

man kann Einmal langsam auf dem HERD schmoren lassen, Abbildung 5

3

man kann aber auch lAngsam (-) im Ofen schmoren lassen.

5.2 Zeigen mit dem Daumen

131

Weitere Beispiele, die die Verwendung der über die Schulter ausgeführten Daumengeste zur Richtungsangabe belegen, stammen aus dem „Mutige Mädchen“-Korpus. In den folgenden drei Sequenzen holt die Trainerin (T) nacheinander drei verschiedene Mädchen, die draußen vor der Tür warten mussten, herein und instruiert sie, sich in einer bestimmten Weise auf eine in der Mitte der Turnhalle aufgestellte Bank zu setzen: Beispiel 6: „Bank 1“ (MM_B1_00:03:43)

1 2 3

T:

KOMM, (1.3) in die mItte von der BANK sitzen, Abbildung 6

4

mit dem blIck in DIE richtung.

Die Geste ist notwendig, um den gestisch gebrauchten Demonstrativartikel DIE (Z. 4) zu desambiguieren. Allerdings spielt die vektorielle Präzision keine große Rolle. Eine globale Richtungsangabe ist insofern ausreichend, als der situative Kontext die restlichen Informationen liefert. So bietet die Aufforderung, sich auf eine vorab in der Mitte des Raumes aufgestellte Bank zu setzen, nur zwei Optionen. Daher genügt es, dass die Sprecherin durch die Daumengeste global die Richtung spezifiziert und zwischen den beiden Optionen auswählt. Der Gebrauch der Daumengeste ist dadurch motiviert, dass sich das Zeigeziel bzw. die Zeigerichtung hinter der Sprecherin befindet. Ein weiterer interaktiver Vorteil liegt darin, dass sie den Blickkontakt mit ihrer Adressatin während der Instruktion aufrecht erhalten und auf diese Weise die Aufmerksamkeit der Schülerin wahrnehmen kann. Dieselbe Situation wiederholt sich im nächsten Beispiel, als die Trainerin ein anderes Mädchen hereinholt. Das verbale Korrelat der Daumengeste stellt

132

5 Typologie des gestischen Zeigens

in diesem Fall ein akzentuiertes Possessivpronomen (Z. 2: DEIner gruppe;) dar59: Beispiel 7: „Bank 2“ (MM_B1_00:02:24)

1

T:

sEtz dich bitte (---) in die MITte von der bank, Abbildung 7

2

mit dem gesIcht zu: (-) DEIner gruppe;

Im letzten Beispiel aus dieser Gruppe fehlt ein verbales Korrelat, da die Trainerin zur Vervollständigung ihrer Äußerung anstelle einer verbalen Richtungsangabe an dem syntaktisch und interaktional projizierten Slot eine Daumengeste produziert. Die grammatische und interaktionale Verdichtung ist in diesem Fall darauf zurückzuführen, dass die Schülerin durch ihre Vorgängerinnen bereits eine gewisse Vorstellung davon hat, was sie tun soll. Dies demonstriert sie durch die Frage (Z. 1), die sie in dem Augenblick an die Trainerin richtet, als diese die Tür öffnet und sie hereinholt:

59 Aufgrund der Kameraführung ist die Trainerin leider nicht vollständig zu sehen. Die Adressatin befindet sich noch außerhalb der Turnhalle.

5.2 Zeigen mit dem Daumen

133

Beispiel 8: „Bank 3“ (MM_00:04:16)

1 2

S: T:

AUCH in die mitte? AUch in die mitte von der BANK, Abbildung 8

3

und mit dem BLICK auch-

Zusammenfassung Die Analyse der Daumengesten hat ergeben, dass diese einerseits zum Zeigen auf kopräsente Personen und andererseits zum Anzeigen von Richtungen verwendet werden. In allen Fällen liegt das Zeigeziel bzw. die Zeigerichtung hinter oder seitlich von den Zeigenden, während diese selbst intrinsisch nach vorne bzw. auf ihre Adressaten orientiert sind. Das multimodale Gesamtformat der Daumengeste zeichnet sich durch bestimmte, systematische „Leerstellen“ im Hinblick auf die Parameter der Zeigehandlung aus. Die Unterschiede zum Standardformat bestehen zusammengefasst darin, dass erstens kein Selbstmonitoring, keine Wahrnehmungskontrolle des Zeigenden bezüglich der vektoriellen Präzision seiner Zeigegeste in Relation zum Zeigeziel stattfindet, und dass zweitens keine Wahrnehmungswahrnehmung am Adressaten vollzogen wird. Dass diese „Leerstellen“ nicht nur möglich, sondern systematischer Bestandteil des multimodalen Gesamtformats der Daumengeste sind, führt zu der Schlussfolgerung, dass es sich um das Zeigen auf einen bereits etablierten bzw. leicht verfügbaren Kontextfaktor handelt, dessen visuelle Wahrnehmung bzw. dessen direktional präzise Lokalisierung zur Referenzherstellung nicht erforderlich ist.60 Zeigeziel und Referent können auch ohne

60 Zu einer ganz ähnlichen Schlussfolgerung gelangen auch Kendon und Versante (2003: 212) sowie Kendon (2004: 218).

134

5 Typologie des gestischen Zeigens

visuelle Lokalisierungs- und Identifizierungshandlung allein aus dem Anzeigen der Suchrichtung im Verbund mit anderen Kontextfaktoren hergestellt werden. Entscheidend dafür ist die augenblickliche Struktur des common ground, d. h. des gemeinsamen Kontextwissens61, das im Moment der mit der Daumengeste korrelierenden Äußerung so beschaffen sein muss, dass eine Richtungsangabe mit präzisen Vektor-Ziel-Relationen nicht erforderlich ist. Zum relevanten Kontextwissen gehören nicht nur kognitive, sondern auch perzeptorische Komponenten dergestalt, dass die Gesprächsteilnehmer wechselseitig voneinander wissen, dass sie vorher gemeinsam an einen bestimmten Ort geblickt haben bzw. dass der Adressat dorthin geblickt hat. Das wiederum bedeutet, dass auch der Parameter der Wahrnehmungswahrnehmung im emergierenden Kontext zu einem späteren gemeinsamen Wissensbestandteil werden kann. Damit besitzt das Modell rekursive Elemente, die online, in der Emergenz wirksam werden und dadurch kontinuierlich ihren Status ändern. Wahrnehmungswahrnehmung ist für die Dynamik der Interaktion und des Verstehensprozesses, also für die Integration neuer Wissenselemente in einen sich fortwährend verändernden common ground ebenso zentral wie verbale Äußerungsakte. Deixistheoretisch ist das multimodale Gesamtformat des Zeigens mit dem Daumen (Verzicht auf Selbstmonitoring, Präzisionsverzicht bei der Bearbeitung der Vektor-Ziel-Aufgabe, keine Wahrnehmungswahrnehmung) insofern interessant, als es die Relevanz des emergierenden und sich in der Emergenz beständig verändernden Kontexts verdeutlicht. Indem Zeigende bei der Daumengeste auf die genannten Parameter verzichten, signalisieren sie dem Adressaten zugleich, dass sein kontextuelles Wissen ausreichen sollte, um Referenz herstellen zu können. Die deiktische Primärfunktion der Daumengeste, die in diesem Fall eine verhältnismäßig unpräzise Richtungsdeixis vornimmt, wird überlagert von einer sekundären indexikalischen Funktion, die mithin darin besteht, genau diese Wissenssymmetrie zwischen Sprecher und Adressat zu indizieren, die die Referenzherstellung problemlos erscheinen lässt. Diese Faktoren erübrigen eine ressourcentechnisch allzu aufwendige Gestaltung der Zeigegeste. Bezogen auf das theoretische Modell der Zeigehandlung (vgl. Kapitel 4) ist dieses Verfahren so zu erklären, dass der Referent nicht über das perzeptorische Auffinden des Zeigeziels, sondern auf (vektoriell und perzeptorisch) verkürztem Wege allein durch die Evozierung des Suchraums bzw. des indexikalischen Grunds (ground) als vor diesem Hintergrund bereits etablierte Figur hergestellt wird, die es lediglich zu aktualisieren gilt. Diese Aktualisierung

61 Vgl. Tomasello (2008), der zwischen context und common ground unterscheidet und eine Typologie mit drei verschiedenen Arten von common ground aufstellt.

5.3 Zeigen mit dem kleinen Finger

135

geschieht durch das schlaglichtartige Anleuchten des Hintergrunds durch die Daumengeste, allerdings ohne dass notwendigerweise eine visuelle Fokussierung auf die Figur stattfinden muss.

5.3 Zeigen mit dem kleinen Finger Im Gegensatz zum Zeigen mit dem Daumen, bei dem eine präzise Lokalisierung des Zeigeziels weder vektoriell möglich noch funktional nötig ist, verbindet sich beim Zeigen mit dem kleinen Finger die Kleinräumigkeit des Suchraums mit der schweren Auffindbarkeit des Zeigeziels. Das Auffindbarkeitsproblem ist auf ein besonders filigranes, mikroskopisches Zeigeziel und/oder auf einen durch seine Detailfülle perzeptorisch komplex strukturierten Suchraum zurückzuführen, in welchem Figur und Grund in einem schwer zu unterscheidenden Verhältnis stehen. Beim Zeigen mit dem kleinen Finger wird der kleine Finger abgespreizt und als Zeiginstrument verwendet, während die restlichen Finger in der Regel eingerollt sind. Aufgrund der Anatomie der Hand erweist sich das Abspreizen des kleinen Fingers bei geschlossener Hand muskulär als relativ aufwendig. Wegen seiner geringen Länge bildet der kleine Finger ein Zeiginstrument, dessen vektorielle Projektionskraft für distale Zeigeziele ungeeignet ist. Er fungiert im Gegenteil als ein auf proximale Zeigeziele verweisendes und in einem sehr kleinen Suchraum operierendes Zeiginstrument. Je weiter der durch eine Zeigegeste entworfene Projektionsbogen reicht, desto geringer ist deren vektorielle Präzision. So wie beim Zeigen auf distale Zeigeziele durch den Gebrauch des weit ausgestreckten Arms (ggf. unter Einbezug des Oberkörpers) die Distanz zugleich kontextualisiert und durch die Länge des Zeiginstruments teilweise kompensiert wird, entspricht die mit dem kleinen Finger ausgeführte Zeigegeste den erhöhten Präzisionsanforderungen in kleinräumigen, semiotisch dichten Suchräumen und stellt diese zugleich mit her. Das Zeigen mit dem kleinen Finger wird häufig objekttaktil ausgeführt. Dies erhellt aus dem ersten Beispiel, in dem zwei „Big Brother“-Bewohner gemeinsam Photos betrachten. Bei der Betrachtung eines Photos fragt Jürgen (Jrg), ob der abgebildete Raum Verenas Wohnung sei, was Verena (Ver) lachend vereint. Daraufhin äußert Jürgen die Vermutung, dass es sich um einen Kellerraum handelt, und begründet seine Vermutung mit dem Hinweis auf kellertypische Raumspezifika (Z. 5: weil hier so KA:bel ä:h schächte-), die er mit einer objekttaktil am Photo ausgeführten Zeigegeste in den visuellen Aufmerksamkeitsfokus rückt:

136

5 Typologie des gestischen Zeigens

Beispiel 1: „Kabelschächte“ (bb63_00:18:09)

1 2 3 4

Jrg: Ver: Jrg: Ver:

ist DAS jetzt eu' eure wohnung; das_s doch irgendwo im !KEL!ler oder nicht; nee des ist so:_n so:_nAbbildung 1.1

5 6 7 8

Jrg: Ver:

Abbildung 1.2

weil hier so KA:bel oder was IST [das;] [ja] des war so_ne faBRIKhalle umgebaut; ne,>

Kurz nach der Artikulation des Lokaldeiktikons hier (Z. 5) berührt Jürgen mit dem kleinen Finger der rechten Hand das Photo an einer bestimmten Stelle (Abb. 1.1) und bewegt den Finger während der anschließenden Wortsuche (Z. 5: KA:bel ä:h schächte) auf einer durch das abgebildete Detail vorgegebenen Linie auf dem Photo entlang (Abb. 1.2). Die Tatsache, dass der Suchraum und das darin aufzufindende Zeigeziel sehr kleinräumig sind, hat Konsequenzen für die räumliche Konfiguration der Beteiligten. Die Mikroökologie der Phänomene, die eine Unterscheidung von Figur und Grund sowohl zeigtechnisch als auch perzeptorisch schwierig macht, spiegelt sich in der räumlichen Relation der Teilnehmer: Beim Zeigen mit dem kleinen Finger befinden sich auch die Beteiligten auf relativ engem Raum und daher in geringer körperlicher Distanz zueinander. Sie müssen einen praktisch auf Berührungskontakt reduzierten Interaktionsraum miteinander herstellen und für die Dauer der Zeigeaktivitäten aufrecht erhalten. Die interaktionsräumliche Enge und daraus resultierende körperliche Nähe der Beteiligten zueinander wird an folgender Sequenz aus dem „Big Brother“-Kor-

5.3 Zeigen mit dem kleinen Finger

137

pus deutlich. Erneut handelt es sich um die „Big Brother“-Bewohner Verena und Jürgen, die beim gemeinsamen Betrachten der Photos dicht nebeneinander auf einem Bett sitzen. Dabei berühren sich nicht nur ihre Knie und Unterschenkel. Die Zeigende beugt sich zudem vor und führt ihre Zeigegeste mit der linken Hand aus, während Jürgen die Photos in den aufgrund ihrer side-by-side-Konfiguration seitlich konstituierten Interaktionsraum hält: Beispiel 2: „Wasserskibahn“ (bb02_00:00:13) Abbildung 2.1

1 2 3

Ver: Jrg:

DA =s_es am RHEIN? o[der wo IST das;

Abbildung 2.2

(-)

Abbildung 2.3

4 5

Ver:

[nee das ist in hm (-) =so_ne WASserskibahn; h

berg-

138

5 Typologie des gestischen Zeigens

Beim Einatmen bewegt Verena ihren linken Arm aus der Ruhelage. Simultan zur Artikulation des akzentuierten Lokaldeiktikons DA (Z. 1) berührt sie mit dem kleinen Finger der linken Hand das Photo (Abb. 2.1). Der Finger verweilt auf dem Photo. Erst als Verena Jürgens Vermutung (Z. 2: =s_es am RHEIN?) negiert, zieht sie ihre Hand aus dem gemeinsamen Wahrnehmungsraum zurück (Abb. 2.2) und produziert simultan zum neu begonnenen Referenzierungsversuch (Z. 4: nee das ist in ä:hm (-) NÜRNberg) mit dem kleinen Finger eine weitere objekttaktile Zeige geste auf das Photo (Abb. 2.3). Dabei fällt der Gipfelpunkt nun mit der Artikulation des Demonstrativpronomens das (Z. 4) zusammen. Das Demonstrativpronomen besitzt zugleich eine anaphorische und eine deiktische Funktion: Zum einen bezieht es sich zurück auf die Ortsreferenz in Jürgens Frage. Zum anderen hat es auch eine neufokussierende bzw. fokusverschiebende Funktion, bei der die Zeigegeste eine wahrnehmungssteuernde Rolle spielt. Denn in ihrer topographischen Klarstellung führt Verena als neues Detail eine Wasserskibahn ein, die auf dem Photo zu sehen ist (Z. 4/5: nee das ist in ähm (-) NÜRNberg- =so_ne WASserskibahn;). Durch den schnellen Anschluss der zweiten Turnkonstruktionseinheit (Z. 5: =so_ ne WASserskibahn;) wird die Lokalaussage (Z. 4: nee das ist in ähm (-) NÜRNberg-) online in eine Präsentativkonstruktion (Z. 4/5: das ist […] so_ne WASserskibahn) transformiert, deren Präsentationsobjekt gestisch auf dem Photo indiziert wird. Im nächsten Beispiel aus „Polettos Kochschule“ zeigt Polettos Gast, Eva Habermann (EH), mit dem kleinen Finger auf ein Schälchen, das Poletto in der Hand hält. In diesem Fall sind die Finger der restlichen Hand nicht eingerollt, sondern weisen mit geöffneter Handfläche nach unten, während der kleine Finger seitlich abgespreizt wird: Beispiel 3: „fleur de sel“ (PK6_00:05:17) Abbildung 3.1

1 2

PL:

DAS hier ist hier das ganz FEIne, d[as (-) fleur ] de SEL, Abbildung 3.2

5.3 Zeigen mit dem kleinen Finger

139

1 PL: DAS hier ist hier das ganz FEIne, 2 d[as (-) fleur ] de SEL, Beispiel 3 (Fortsetzung) Abbildung 3.2

3 4

EH:

[fleur de SEL?] das LIE:be ich.

Bevor sie zu reden beginnt, greift Poletto mit dem linken Arm nach einem Salzschälchen und nimmt in dem Augenblick den Deckel ab (Abb. 3.1), in dem sie das Demonstrativpronomen DAS (Z. 1) artikuliert. Sie legt den Deckel zur Seite, hebt das Schälchen hoch und holt es auf Brusthöhe zu sich heran (Abb. 3.2). In diesem Moment formt ihr Gast eine Zeigegeste (Abb. 3.2) und artikuliert überlappend mit Poletto den französischen Namen für eine Salzsorte (Z. 3). Dabei überlappt auch ihr Zeigeakt, mit dem sie den Inhalt des Schälchens als spezielle Salzsorte identifiziert (Z. 3: fleur de SEL?), mit der noch nicht abgeschlossenen Präsentation eben dieses Salzes durch Poletto. Erneut handelt es sich um ein relativ kleinräumiges side-by-side-Arrangement zwischen den Beteiligten. Das hohe Maß an interaktionsräumlicher Koordinierung geht in diesem Fall einher mit einer in chorartiges Sprechen mündenden verbalen Ko-Konstruktion.

Zusammenfassung Zusammengefasst stellt die Kleinräumigkeit das Schlüsselmerkmal des Zeigens mit dem kleinen Finger dar. Das Merkmal der Kleinräumigkeit bezieht sich nicht nur auf einen mikroskopisch kleinen Suchraum und ein schwer aufzufindendes Zeigeziel, sondern auch auf die aus Gründen der maximalen Perspektivkonvergenz erforderliche körperliche Nähe zwischen Zeigendem und Adressaten. Sie müssen in einem nahezu auf Berührungskontakt eingeschmolzenen Interaktionsraum auf verschiedenen Ebenen miteinander kooperieren. Die potenziell schwierige Auffindbarkeit des Zeigeziels, die mit der Kleinräumigkeit und den

140

5 Typologie des gestischen Zeigens

komplex strukturierten Figur-Grund-Verhältnissen zusammenhängen, führen dazu, dass das Zeigen mit dem kleinen Finger oft objekttaktil vollzogen wird. Die vektorielle Präzisionsanforderung bedingt aber nicht nur eine objekttaktile Durchführung der Zeigehandlung, die auch beim Zeigen mit dem Zeigefinger vorkommt, sondern sie führt vor allem zur Wahl des kleinen Fingers als Zeiginstrument und steuert die Gestaltung des Interaktionsraums zu einer quasi soziotaktilen Konfiguration. Dabei legt die Notwendigkeit einer größtmöglichen Konvergenz der visuellen Perspektive von Zeigendem und Adressaten auf Suchraum und Zeigeziel das side-by-side-Arrangement als präferierte Realisierungsvariante der F-Formation besonders nahe. Insofern signalisiert die Wahl des kleinen Fingers nicht nur die Kleinräumigkeit des Suchraums sowie erhöhte Präzisionsanforderungen an das Zeigen und Wahrnehmen, sondern sie kontextualisiert auf der beteiligungsstrukturellen Ebene zudem, dass sich der Adressat zugleich auf einen kleinen Interaktionsraum einstellen und nicht nur perzeptorisch, sondern auch körperlich auf engem Raum mit dem Zeigenden kooperieren muss.

5.4 Zeigen mit geöffneter Hand Im Unterschied zu den bislang behandelten Zeigegesten, deren entscheidendes Formmerkmal in der Extension eines einzelnen Fingers wie des Zeigefingers, des Daumens oder des kleinen Fingers bestand, werden die im Folgenden betrachteten Gesten mit geöffneter Hand ausgeführt. Wie beim Zeigen mit dem Zeigefinger sind zunächst zwei verschiedene Orientierungen der Handfläche festzustellen: Die Hand kann entweder mit der Handinnenfläche nach oben weisen (open hand palm up-Geste, Kendon 2004) oder sich in vertikaler Position befinden (open hand palm vertical-Geste, Kendon 2004). Kendon konstatiert in seiner vergleichenden Untersuchung von Zeigegesten in italienischen und englischen face-to-face-Interaktionen darüber hinaus als dritte Formvariante die nach außen gerichtete, vom Zeigenden wegweisende Handinnenfläche (open hand palm away-Geste, Kendon 2004)62 sowie eine vierte Variante, bei der die Hand eine schräg nach oben gerichtete Position einnimmt (open hand oblique, Kendon 2004). Letztere kommt ausschließlich in den italienischen Daten vor und indiziert eine Person oder ein Objekt, auf das mit einer negativen oder kritischen Einstellung referiert wird. In Bezug auf Personen involviert der Gebrauch der open hand oblique-Geste ein Beteiligungsformat (participation framework, Goffman 1981) aus mindestens drei Teilnehmern, im Rahmen dessen die dritte, nicht direkt adressierte Person Gegenstand eines kritischen Kommentars ist (Kendon 2004: 216).

62 Vgl. zu den Bezeichnungen auch Kendon und Versante (2003).

5.4 Zeigen mit geöffneter Hand

141

Im Folgenden werden drei verschiedenen Handformen dargestellt, die im vorliegenden Datenkorpus in zeigender Funktion vorkommen: erstens das Zeigen mit geöffneter Hand Handfläche nach oben (open hand palm up), zweitens das Zeigen mit geöffneter Hand Handfläche vertikal orientiert (open hand palm vertical) und drittens das häufig objekttaktil ausgeführte Zeigen mit geöffneter Hand Handfläche nach unten (open hand palm down).

5.4.1 offene Hand Handfläche nach oben (oHHo) Bei der oHHo-Geste wird die geöffnete Hand in eine horizontale Position gebracht, so dass die Handinnenfläche nach oben weist. Die Geste gehört zu einer Familie von Gesten der geöffneten Hand, deren verbindendes Merkmal darin besteht (vgl. Kendon 2004: 264; Müller 2004; Streeck 2007, 2009a: 182 ff.), dass sie den Akt des Gebens und Nehmens, des Anbietens und des Bittens kontextualisieren. Laut Kendon werden die „Open Hand Supine (or ‘palm up’) family gestures“ in Kontexten gebraucht, „where the speaker is offering, giving or showing something or requesting the reception of something“ (Kendon 2004: 248). Im vorliegenden Korpus tritt die zeigend verwendete oHHo-Geste besonders häufig im Subkorpus der Stadtführungen auf, wo die Herstellung von Sehenswürdigkeiten und Anschauungsobjekten gattungstypologisch (vgl. dazu Stukenbrock und Birkner 2010) mit der Einladung an die Adressaten verbunden ist, diese eingehender zu betrachten. Im Unterschied zum Zeigen mit dem ausgestreckten Finger besitzt die mit der geöffneten Hand ausgeführte Zeigegeste nicht primär eine Lokalisierungs- und Identifizierungsfunktion, sondern vor allem eine an- oder darbietende bzw. eine Präsentativfunktion.63 Im ersten Beispiel aus einer Bayreuther Stadtführung weist die Stadtführerin, nachdem sie ihre Ausführungen über einen Brunnen beendet hat, mit einer oHHo-Geste auf ein gegenüberliegendes Gebäude. Der Zeigehandlung geht die Frage eines Teilnehmers über die Baudaten des Brunnens voraus, die die Stadtführerin beantwortet (Z. 1), um nach einer zweisekündigen Pause (Z. 2) den Namen des Baumeisters hinzuzufügen (Z. 3). Anschließend expandiert sie ihren Beitrag mit einem deiktisch-gestischen Verweis auf ein anderes, kulturhistorisch bedeutsames Gebäude, das gegenüberliegt und dessen Erbauer sie ebenfalls namentlich einführt (Z. 5):

63 Vgl. auch Kendon (2004: 210): „In using the Open Hand Supine (palm up) in pointing, more generally, the speaker is typically pointing to some object as if it were being ‘presented’ to the interlocutor as something that should be looked at or inspected.“

142

5 Typologie des gestischen Zeigens

Beispiel 1: „Baumeister“ (StFLing1_00:18:29)

01 02 03 04

SF:

sEchzehnhundert NEUNundneunzig bis sIebzehnhundert ZWEI. (2.0) (1.0) Abbildung 1

05 06 07 08 09 10 11

und (-) DIEser baumeister war saint piErre, (1.1) saint pIErre ein franZOse, dass m deutschland geholt hat, und (.) wilhelmI:ne vor ALlen dingenwO

Die oHHo-Geste (Abb. 1) erreicht ihren Gipfelpunkt simultan zur Artikulation des proximalen Demonstrativpronomens DIEser (Z. 5), das den Hauptakzent trägt, gestisch (Fillmore 1997) verwendet wird und den neu eingeführten Baumeister kontrastiv vom ersterwähnten Erbauer des Brunnens unterscheidet. Dabei zeigt die Stadtführerin nicht auf den verstorbenen Baumeister selbst, sondern auf dessen Werk, d. h. es handelt sich um eine metonymische Verschiebung in der Relation zwischen dem Referenten des Zeigeziels (Gebäude des 18. Jahrhunderts) und dem Referenten der Verbalaussage (ein namentlich identifizierter Baumeister des 18. Jahrhunderts). Wie das zweite Beispiel belegt, kann die oHHo-Geste auch ohne eine begleitende verbale Aufforderung ein Objekt zum Betrachtungsgegenstand machen

5.4 Zeigen mit geöffneter Hand

143

und dabei den nonverbalen ersten Paarteil einer multimodalen Paarsequenz64 bilden. Die Stadtführerin und ihre Gruppe sind damit beschäftigt, die Figuren des Markgrafenbrunnens in Bayreuth zu entschlüsseln. Nachdem die Figur des Löwen und die Figur des Indianers den Kontinenten Afrika und Amerika zugeordnet werden konnten, antizipiert die Stadtführerin als Nächstes die erfolgreiche Zuordnung der restlichen Figuren zu den verbleibenden Kontinenten (Z. 2). Dabei beginnt sie, weiter um den Brunnen herumzugehen. Anschließend löst sich auch die Gruppenkonfiguration auf und die Gruppenmitglieder folgen der Stadtführerin. Beim nächsten Anschauungsobjekt angekommen bleibt die Stadtführerin mit einer Vierteldrehung zur nachfolgenden Gruppe stehen, blickt zunächst in Richtung des Anschauungsobjekts (Abb. 2.1) und produziert dann eine das Objekt präsentierende oHHo-Geste (Abb. 2.2): Beispiel 2: „Kontinente“ (StFLing1_00:09:06)

1 2 3 4 5

SF:

SF:

na BITte; dann werden sie doch auch die ANderen (.) (2.0) (5.8) Abbildung 2.1

6 7 8 9

SF: GT: SF:

Abbildung 2.2

((Vierteldrehung zur Gruppe; oHHo-Geste)) (5.5) is_Asien; A:sien jaWOHL,

64 Vgl. zu multimodalen Paarsequenzen Gazin und De Stefani 2014; Stukenbrock 2014a.

144

5 Typologie des gestischen Zeigens

Im Kontext der gemeinsamen Entschlüsselungsaktivität und in sequenziellem Anschluss an die Ankündigung weiterer Benennungsversuche (Z. 2) bietet die Geste nicht nur das nächste Anschauungsobjekt zur Betrachtung an, sondern lädt die Adressaten auch zu neuen Benennungsversuchen ein. Die Geste verweist auf die nächste der auf dem Brunnen dargestellten Figuren und setzt erneut die Aufgabenstellung relevant, die Brunnenfiguren zu entschlüsseln. Nach einer längeren Pause (Z. 7) trifft einer der Gruppenteilnehmer (GT) eine aktivitätskonforme Feststellung (Z. 8: is_Asien;) und liefert damit den zweiten Paarteil einer multimodalen Paarsequenz, die aus der kinesischen Aufforderung bzw. Frage der Stadtführerin und der verbalen Antwort des Teilnehmers besteht. In der nächsten Sequenz aus derselben Stadtführung hat die Gruppe eine längere Wegstrecke auf ihrem Stadtparcours zurückgelegt und den Schauplatz gewechselt. Am neuen Standort kommen verspätete Gruppenmitglieder dazu, die von der Stadtführerin zunächst begrüßt werden (Z. 1), bevor sie mit einer oHHoGeste das nächste Anschauungsobjekt herstellt. Dies gestaltet sich jedoch nicht so einfach, da es der Stadtführerin anfangs nicht gelingt, die in Kleingruppen zusammenstehenden Gruppenmitglieder räumlich, perzeptorisch und interaktiv auf sich zu orientieren: Beispiel 3: „Büste der Wilhelmine 1“ (StFLing1_00:24:26)

1

SF: Abbildung 3.1

2 3 4 5

SF:

Abbildung 3.2

(3.0) der (-) wir stehen hIer vor der (wilhelMIne, (1.3) und ich hatte ihnen ja schon Einiges von

5.4 Zeigen mit geöffneter Hand

145

Nach der Begrüßung der verspäteten Teilnehmer sucht die Stadtführerin die neue Anschauungsphase einzuleiten. Dazu wendet sie in der dreisekündigen Pause (Z. 2) ihren Oberkörper mit einer halben Drehung von den Neuankömmlingen weg und blickt in Richtung des künftigen Verweisraums (Abb. 3.1). Im nächsten Schritt vollführt sie eine oHHo-Geste, die ihren Gipfelpunkt noch während der dreisekündigen Pause erreicht (Abb. 3.2) und sich bereits in der Retraktionsphase befindet, als die Äußerung (Z. 3) einsetzt. Darin thematisiert die Stadtführerin den neuen Standort (Z. 3: wir stehen hIEr) und nennt den Grund für seine Wahl (Z. 3: vor der (-) bÜste der (-) mArkgräfin(.) wilhelMIne,). Auffällig ist das temporale Format der Zeigehandlung. Die zur Betrachtung einladende Geste wird ohne vorauslaufende Fokussierungsaufforderung und zunächst ohne ein ersichtliches verbales Korrelat bereits in der Pause ausgeführt, die den Übergang zwischen der abgeschlossenen Begrüßung und dem Beginn einer neuen Aktivität markiert. Wie auf Abb. 3.2 zu sehen ist, schenken die meisten Gruppenmitglieder der Geste der Stadtführerin keine Aufmerksamkeit. An dieser speziellen sequenziellen Position stellt die Geste einen projektiv-einladenden Verweis auf ein erst noch zu konstituierendes Anschauungsobjekt dar, das in der anschließenden Verbaläußerung durch einen Symbolausdruck benannt wird. Die Funktion der Geste besteht weniger darin, ein konkretes Anschauungsobjekt zu lokalisieren und zu präsentieren, als vielmehr darin, die Gruppe auf die gemeinsame Aktivität der Betrachtung von Sehenswürdigkeiten zu (re)fokussieren und mit dieser Betrachtungseinladung zugleich den nächsten Anschauungsraum zu projizieren. Die anschließende Äußerung ist auch ohne visuelle Wahrnehmung der Geste verständlich, da das darin vorkommende Lokaldeiktikon hIer (Z. 3) symbolisch gebraucht und die relevante Sehenswürdigkeit durch einen Symbolausdruck (Z. 3: bÜste der (-) mArkgräfin (.) wilhelMIne,) benannt wird. Das vierte Beispiel stammt aus einer anderen Bayreuther Stadtführung und bietet sich als Vergleich zur vorherigen Sequenz an, da eine andere Stadtführerin am selben Schauplatz dasselbe Anschauungsobjekt, die Büste der Markgräfin Wilhelmine, herstellt (vgl. nächste Seite). Auch sie wählt für ihre Geste das oHHo-Format. Nachdem sich die Gruppenteilnehmer am neuen Standort versammelt haben, beginnt die Stadtführerin ihre Ausführungen mit einer Betrachtungsanweisung (Z. 1: hier SE:hen sie,) und präsentiert zunächst allein durch eine oHHo-Geste das neue Anschauungsobjekt (Abb. 4.1). Zu Beginn ihrer Äußerung vollzieht sie mit dem Oberkörper eine Drehung und streckt den rechten Arm mit nach oben gekehrter Handinnenfläche seitlich nach hinten aus. Ihr Blick weist in dieselbe Richtung wie der ausgestreckte Arm. Die Geste erreicht zu Ende der ersten Turnkonstruktionseinheit (Z. 1) den Gipfelpunkt und wird in der Mikropause (Z. 1) bereits wieder retrahiert. Erst dann erfolgt mittels eines Vergleichsatzes (Z. 2) eine

146

5 Typologie des gestischen Zeigens

Beispiel 4: „Büste der Wilhelmine 2“ (StFB1_00:16:24) Abbildung 4.1

1 2 3 4

SF:

Abbildung 4.2

hier SE:hen sie, (-) U:n wie die wilhelmine AUSsah, (--) sie ham die LEbensdaten noch daZU,

verbale Spezifizierung dessen, was im Matrixsatz als visuell Wahrzunehmendes angekündigt wurde. Dabei hat sich die Stadtführerin wieder auf ihre Adressaten orientiert (Abb. 4.2). Im Gegensatz zur ersten Führerin, die den Kunstcharakter des Dargestellten (büste) akzentuiert und die Benennung der dargestellten Persönlichkeit mit einem Hinweis auf die medialen und funktionalen Besonderheiten des Artefakts (Büste als plastische Darstellung eines menschlichen Kopfs oder einer Halbfigur zum Zweck öffentlichen Andenkens) verbindet, fasst die zweite Stadtführerin die plastische Halbfigurendarstellung als ungefähres Abbild des Aussehens der Dargestellten auf. Auch wenn die Stadtführerinnen verbal ganz unterschiedliche Strategien zur Etablierung ihres Anschauungsobjekts einsetzen, wählen sie beide dasselbe Gestenformat zur visuellen Aufmerksamkeitsorientierung ihrer Adressaten. Beide laden ihre Adressaten verbal und visuell mittels einer oHHo-Geste zur Betrachtung des Denkmals ein. Als kulturelles Anschauungsobjekt wird es jedoch verbal auf sehr unterschiedliche Weise konstruiert. Die oHHo-Geste tritt nicht nur bei der Präsentation von Anschauungsobjek ten, sondern auch bei der Präsentation von Personen auf, wie das letzte Beispiel aus dem Korpus „Polettos Kochschule“ (Beispiel 5: „tutto bella prinzessin“; vgl. nächste Seite) verdeutlicht. In der Sequenz beansprucht Poletto für ihre Sendung, die italienische Küche zu repräsentieren (Z. 1 u. 4), und formuliert dann

5.4 Zeigen mit geöffneter Hand

147

einen Konzessivsatz (Z. 7), in dem sie auf ihr unitalienisches Aussehen als Norddeutsche anspielt, um anschließend eine bekräftigende Selbstpositionierung als Liebhaberin der italienischen Küche vorzunehmen (Z. 8). Polettos Selbstpositionierungsaktivitäten werden vom Gast humorvoll begleitet, indem er ihrer Behauptung unitalienisch auszusehen widerspricht (Z. 9–10) und zur Validierung seiner Ansicht das Publikum als Augenzeugen auf- und anruft (Z. 12). Dabei produziert er mit der rechten Hand eine oHHo-Geste (Abb. 5.2), durch die Poletto dem Publikum präsentiert und zur Betrachtung dargeboten wird. Während der Gast seinen ersten Widerspruch (Z. 9–10) an Poletto adressiert und sie dabei direkt ansieht (Abb. 5.1), richtet er sich im zweiten Schritt an das Publikum. Dazu wendet er Oberkörper und Blick von Poletto ab und blickt über den Kochtisch hinweg in die Zuschauerreihen. Als er die oHHo-Geste auf Poletto produziert, ist sein Blick auf das mit leute (Z. 12) adressierte und mit dem ImpeBeispiel 5: „tutto bella prinzessin“ (PK2_00:15:46)

01 02 03 04

PL: IN: PL:

05 06

IN: PL:

07 08

IN:

polettos KOCHschule? (0.6) LECker. -) ja (. )[KLAR; ] [auch wenn] man es mir auf_n ersten blick nich ANsieht, aber ich LIEbe italienisch mediterrane [DOCH-] Abbildung 5.1

09 10 11 12

PL: IN: PL:

Abbildung 5.2

das sieht man dir AN; [JA?] [aber] GUCKT doch ma [leute oder? [((lacht)) Abbildung 5.3

Abbildung 5.4

148 5 Typologie des gestischen Zeigens 09 das sieht man dir AN; 10 PL: [JA?] 11 IN: [aber] GUCKT doch ma [leute oder? Beispiel 5 (Fortsetzung) 12 PL: [((lacht)) Abbildung 5.3

13 14 15

IN: PL: IN:

Abbildung 5.4

das sIeht man ihr doch [AN; oder?] [((klatscht))] [TUTto BELla prinZESsin;]

rativ GUCKT doch ma (Z. 12) zur evaluierenden Betrachtung aufgeforderte Publikum gerichtet. Die Geste erreicht ihren Gipfelpunkt simultan zum akzentuierten Wahrnehmungsverb (Abb. 5.2). Danach wird der Arm teilweise retrahiert und auf halbem Wege in eine Umarmung transformiert (Abb. 5.3), so dass Poletto und ihr Gast sich schließlich in einem dichten side-by-side-Arrangement gemeinsam dem klatschenden Publikum präsentieren (Abb. 5.4).

Zusammenfassung Als Zwischenbilanz lässt sich festhalten, dass das Zeigen mit geöffneter, nach oben orientierter Handfläche in Aktivitätszusammenhängen auftritt, in denen über die Lokalisierung und Identifizierung hinaus ein Anschauungsgegenstand vorgeführt und dem Adressaten zur visuellen Betrachtung angeboten wird. Abweichend von Kendons Beobachtungen (2004: 208) konnte festgestellt werden, dass in den begleitenden Verbaläußerungen sehr wohl deiktische Ausdrücke vorkommen, mittels derer die Sprecher eine Neufokussierung vornehmen. Allerdings sind die temporalen Relationen zwischen den entsprechenden deiktischen Ausdrücken und den oHHo-Gesten lockerer als bei den prototypischen Zeigefingergesten (ZfHu-Format). So kann die gestische Betrachtungsaufforderung der Verbaläußerung vorauslaufen (Beispiel 3) oder umgekehrt durch einen vorauslaufenden deiktischen Ausdruck projiziert werden (Beispiel 4). Die Aufforderung oder Einladung an die Adressaten, das präsentierte Objekt näher zu betrachten, ist in die oHHo-Gesten inkorporiert und konstituiert über die formale Verwandtschaft hinaus auch eine funktionale Nähe zur Biet-Geste

5.4 Zeigen mit geöffneter Hand

149

(Kendon 2004: 264 ff.; Streeck 2007). Richtet sich die Geste wie im letzten Beispiel auf einen kopräsenten Menschen, der vom Zeigenden nicht adressiert, sondern gegenüber anderen Teilnehmern als Anschauungsobjekt vorgeführt wird, verdichtet sich die Geste zur klassischen „ecce homo“-Geste.

5.4.2 offene Hand Handfläche vertikal (oHHv) Im Unterschied zu der im vorherigen Abschnitt behandelten oHHo-Geste wird die geöffnete Hand beim Zeigen mit der oHHv-Geste in eine vertikale Position gebracht. Die Fingerspitzen weisen in Richtung des Zeigeziels, wobei sich die Handinnenfläche und je nach Streckungsgrad auch der Unterarm in vertikaler Ausrichtung zum Zeigeziel befinden. oHHv-Gesten und oHHo-Gesten sind formal nicht immer klar voneinander zu unterscheiden, was auch auf funktionaler Ebene zu Unschärferelationen führt. Das erste Beispiel zur Illustration dieses Gestentyps stammt aus dem Korpus der Stadtführungen (vgl. nächste Seite). Die Stadtführerin hat sich zu Beginn ihrer Führung durch Bayreuth mit der Gruppe am ornamental gestalteten Markgrafenbrunnen versammelt. Gemeinsam mit der Gruppe werden Schritt für Schritt die auf dem Brunnen dargestellten Figuren identifiziert und ihr symbolischer Gehalt erarbeitet. Im Rahmen dieser Aktivität lenkt die Stadtführerin die visuelle Aufmerksamkeit der Gruppenmitglieder immer wieder auf bestimmte Details. So geht es im folgenden Ausschnitt um die Wahrnehmung und Entschlüsselung einer menschlichen Figur, auf die die Stadtführerin mit einer deiktischen Konstruktion referiert (Z. 1), die aus dem proximalen Lokaldeiktikon hier, dem horizontal perspektivierenden deiktischen Lokaladverb vOrne sowie dem proximalen Demons trativartikel dieser in Verbindung mit dem Nomen MENSCH besteht. Dazu führt sie eine oHHv-Geste in Richtung des Brunnens aus (Abb. 1.1) und schließt syntaktisch einen Relativsatz an, der als zusätzliche Information die Körperpositur der Figur aus der Betrachterperspektive spezifiziert (Z. 2: der drEht uns nun den RÜCken zu?) und dadurch das Auffinden und Identifizieren der Brunnenfigur erleichtert. Die Einbettung dieser Äußerung in den größeren Aktivitätszusammenhang der gemeinsamen Entschlüsselung der Brunnenfiguren und die lokal entstehende Pause (Z. 3), in der die Stadtführerin in die Runde blickt und auf Reaktionen wartet, kontextualisieren ihre Äußerung als Aufforderung an die Gruppe, Mutmaßungen über die Bedeutung der Figur anzustellen. Zur erfolgreichen Bewältigung dieses mit jedem neuen Referenten in die nächste Runde gehenden Entschlüsselungsspiels muss sie durch eine möglichst präzise Lokalisierungs- und Referenzierungshandlung zunächst sicherstellen, dass ihre Adressaten das Zeigeziel auffinden können. Der erhöhte Aufwand an deiktischen Orientierungshilfen ist aber

150

5 Typologie des gestischen Zeigens

Beispiel 1: „dieser Mensch“ (StFLing1_00:08:27) Abbildung 1.1

1 2 3

SF:

Abbildung 1.2

hier vOrne dieser MENSCHder drEht uns nun de (2.2)

nicht nur für das Gelingen der übergeordneten Aktivität erforderlich, sondern er ist auch auf die Unübersichtlichkeit des Suchraums zurückzuführen, den es durch zusätzliche Lokaldeiktika (Z. 1: hier vOrne) vorzustrukturieren gilt. Aufgrund der Detailfülle der barocken Brunnenornamente gestaltet sich die Figur-Grund-Relation sowohl perzeptorisch als auch kognitiv verhältnismäßig schwierig. Die vollzugsrekonstruktive Analyse der Zeigehandlung ergibt, dass die Stadtführerin im ersten Schritt eine Lokalisierungshandlung vollbringt, bei der der Gipfelpunkt der Geste mit der Artikulation des proximalen Lokaldeiktikons hier zusammenfällt (Abb. 1.1). Der Gipfelpunkt wird bis zum Beginn des Demonstrativpronomens dieser eingefroren, dann wird die Geste retrahiert und simultan zur Artikulation von Relativpronomen und Verb (Z. 2: der drEht) mit einer dynamischeren, zusätzlich um die eigene Achse rotierenden Bewegung der Hand wiederholt (Abb. 1.2). Im Unterschied zur ersten Zeigegeste, die der Lokalisierung und Objektidentifizierung dient und zur eingehenden Betrachtung des Brunnens einlädt, visualisiert die formal variierende zweite Geste darüber hinaus ikonisch die im Relativsatz getroffene Aussage über die Orientierung der Figur in Relation zum Betrachter (Z. 2: der drEht uns nun den RÜCken zu?). Dadurch erhalten die Adressaten zusätzliche Suchhilfen zum Auffinden der Figur im reich ornamentierten Brunnenrelief. Im nächsten Beispiel aus einer weiteren Bayreuther Stadtführung steht der Stadtführer mit seiner Gruppe am Fuß einer Gartenanlage und spricht über die bauliche Gestaltung der angrenzenden Umgebung (Z. 1). Dabei baut er einen Kon-

5.4 Zeigen mit geöffneter Hand

151

trast zwischen dem ersten Eindruck (Z. 2), den ein Betrachter bei oberflächlicher Wahrnehmung gewinnt, und den architektonischen Fakten auf (Z. 3), zu deren korrekter Einschätzung man erst bei genauerer Betrachtung gelangt. Zu einer solchen durch ihn angeleiteten Betrachtung fordert er die Gruppe explizit auf (Z. 4: wenn sie mal genauer HINschauen,): Beispiel 2: „genauer hinschauen“ (StFLing2_00:11:58)

01 02 03 04

SF:

wenn sie jetzt (0.5) die geSTALtung sehen, dann wIrkt das recht homoGEN, hhh IST es aber nicht-= =wenn sie mal genauer HINschauen, Abbildung 2.1

05

denn sie haben LINKS, (.) Abbildung 2.2

06

einen tYpischen (.)

07

(0.8)

Abbildung 2.3

bau,

152

5 Typologie des gestischen Zeigens

Beispiel 2 (Fortsetzung) Abbildung 2.4

08 09 10 11

frisch renoVIERT, also das ZEIGT ja auch, dass das prestIge nach wie vor hier WIRKsam ist, (0.6) Abbildung 2.5

12 13 14

Abbildung 2.6

und DIEse bauten RECHTS, (0.4)

Im Verlauf seiner Ausführungen produziert der Stadtführer mehrere oHHv-Gesten mit dem rechten und mit dem linken Arm, wodurch die Gruppenmitglieder auch kinesisch aufgefordert werden, sich die Umgebung genauer anzusehen. Unmittelbar nach der Betrachtungsaufforderung führt er mit dem linken Arm seitlich nach hinten eine Zeigegeste in Richtung eines Gebäudes auf der gegen-

5.4 Zeigen mit geöffneter Hand

153

überliegenden Straßenseite aus (Abb. 2.1), ohne dabei jedoch selbst in die entsprechende Richtung zu blicken. Stattdessen ist er visuell auf die Kamera orientiert. Nachdem er sich in der Folge einem Teil der um ihn herum stehenden Gruppe zugewandt hat (Abb. 2.2), produziert er eine zweite Zeigegeste in Richtung desselben Gebäudes. Dieses Mal wird die Geste jedoch mit dem rechten Arm ausgeführt und von einem Blick auf den Verweisraum begleitet (Abb. 2.3). Anschließend orientiert sich der Stadtführer wieder auf die Gruppe (Abb. 2.4). Als er in der Folge weitere Gebäude in den visuellen Aufmerksamkeitsfokus der Gruppe rückt, führt er mit dem linken Arm erneut eine oHHv-Geste aus, deren Besonderheit darin besteht, dass sie eine darstellende Komponente in Form einer langgestreckten Bewegung enthält. Die Armbewegung zeichnet in der Luft die horizontale Ausdehnung nach, die das Gebäude-Ensemble auf der gegenüberliegenden Straßenseite optisch einnimmt: In der Pause (Z. 11) beginnt der Stadtführer sich umzudrehen und den Arm aus der Ruhelage zu lösen. Mit der Artikulation des Demonstrativpronomens DIEse (Z. 12) erreicht die oHHv-Geste ihren Gipfelpunkt (Abb. 2.5) und fährt simultan zur emergierenden Äußerung im Gestenraum der Linie nach, die die Häuserfront konstituiert. Beim Lokaladverb RECHTS (Z. 12) wird der Endpunkt erreicht (Abb. 2.6) und der Arm anschließend retrahiert. Die beschriebenen Gesten des Stadtführers werden – unabhängig davon, ob sie mit dem rechten oder linken Arm ausgeführt werden – in der oHHv-Form realisiert. Im Unterschied zum objektidentifizierenden und -lokalisierenden Zeigen mit dem Zeigefinger kontextualisieren die mit geöffneter Hand ausgeführten Gesten die verbale Betrachtungsaufforderung (Z. 4: =wenn sie mal genauer HINschauen,), setzen diese Aufforderung immer wieder kinesisch relevant und halten den vom Stadtführer erhobenen Anspruch aufrecht, dass eine genauere Betrachtung zu einer angemesseneren Beurteilung des Gesehenen führt. Im Unterschied zu den im vorigen Abschnitt untersuchten oHHo-Gesten fungieren die vertikal ausgerichteten Gesten zudem als visuelle Richtungsanweisungen und leisten damit eine perzeptionssteuernde Strukturierung des Suchraums, die die verbalen Orientierungsangaben (Z. 5: denn haben sie LINKS, Z. 12: und DIEse bauten RECHTS,) auf visueller Ebene unterstützen. Das dritte Beispiel stammt aus der ersten Minute einer Folge von „Polettos Kochschule“. Poletto hat die Fernsehzuschauer und das Studiopublikum begrüßt und ihren Gast (IN) hereingebeten. Nachdem die beiden sich zur Begrüßung umarmt und auch der Gast das Studiopublikum begrüßt hat, fordert Poletto ihn mit einer höflichen Bitte auf, hinter den Kochtisch zu treten. Die Aufforderung wird von einer einladenden oHHv-Geste begleitet (Abb. 3):

154

5 Typologie des gestischen Zeigens

Beispiel 3: „rüber bitten“ (PK2_00:00:47) Abbildung 3

1 2

PL:

INgo?

Die oHHv-Geste, mit der Poletto ihren Gast einlädt hinter den Kochtisch zu treten, weist ihm zugleich die Richtung, in die er sich bewegen soll. Die Geste erreicht ihren Gipfelpunkt unmittelbar zu Beginn der Verbaläußerung und wird mit einem kurzen Nachhalt (post stroke hold) in dieser Position gehalten, während Poletto als Fokussierungsaufforderung ihren Gast mit seinem Vornamen anspricht (Z. 1: INgo?). Unmittelbar darauf wird die Geste retrahiert. Sie läuft damit dem lokaldeiktischen Pronominaladverb RÜber (Z. 2) deutlich voraus. Wie auf der Abbildung zu erkennen ist, hat sich der Adressat bereits vor Beginn der Fokussierungsaufforderung visuell auf seine Interaktionspartnerin und deren Armgeste orientiert. Zusammen mit der verbalen Bestätigung (Z. 3: ja;) kommt er der Aufforderung nach und bewegt sich hinter dem Kochtisch. Das vierte Beispiel aus dem „Big Brother“-Korpus spielt zu Ostern. Sabrina (Sbr) hat für ihre Mitbewohnerinnen und Mitbewohner Ostergeschenke versteckt. Nachdem Andrea (Adr) ihr Geschenk gefunden hat, ist Jürgen (Jrg) mit der Suche an der Reihe. Er entdeckt ein Geschenk, wird jedoch zu seiner Enttäuschung von Sabrina belehrt, dass dies für jemand anderen vorgesehen ist. Um das Spiel zu beenden schlägt er einen Tausch vor (Z. 1: dann soll_n ANdrer [meins nehm-), der ihm gestattet, das gefundene Geschenk zu behalten (Z. 3: ich nEhm DAS;). Die Äußerung wird von einer mit zwei Gipfelpunkten versehenen Zeigefingergeste auf das Fundstück begleitet. Doch Sabrina signalisiert ihm durch die Fortsetzung ihrer Orientierungsanweisung mit dem Ausdruck WÄRmer (Z. 2), dessen wiederholte, z. T. abgebrochene Produktion sie temporal genau mit Jürgens Schritten in eine neue Richtung koordiniert, dass er die Suche fortsetzen muss. Jürgen hingegen insistiert zunächst darauf, seine Entdeckung zu behalten und rückt sie mit

5.4 Zeigen mit geöffneter Hand

155

einer oHHv-Geste erneut in den Fokus (Abb. 4). Die Geste geht einher mit der keineswegs neuen, sondern trotzig-iterativen Feststellung da steht AU_was; (Z. 7), die in Überlappung mit Sabrinas Wiederholung, das Gefundene sei nicht für ihn bestimmt (Z. 6), einen polyphonen Kontrapunkt setzt: Beispiel 4: „Ostern“ (bb02_1_00:02:45)

01 02 03 04 05 06 07

Jrg: Sbr: JRg: Sbr:

dann soll_n ANdrer [meins nehm-= =ich nEhm DAS; '-

Jrg:

das ist [NICHT deins; [da steht AU_was; Abbildung 4

Die Funktion der Geste besteht in diesem Fall nicht darin, die Aufmerksamkeit auf einen neuen Gegenstand zu orientieren, sondern sie lenkt – zusammen mit dem abweichenden Gebrauch des Adverbs auch – die Aufmerksamkeit in insistierender Weise auf einen bereits etablierten Gegenstand. Die Verwendung des Adverbs auch erklärt sich aus dem spielerischen Konflikt um das von Jürgen zwar gefundene, aber nicht ihm zugedachte Geschenk. Durch die Äußerung (Z. 7: da steht AU_was;) fingiert Jürgen eine neuerliche Entdeckung des von Sabrina bereits als tabu erklärten Gegenstands. Dieser Gegenstand wird zur Reinspektion angeboten und seine erneute Präsentation mit der Aufforderung an die Adressatin verbunden, eine Neubewertung (reassessment) der Suchleistung des Zeigenden vorzunehmen und ihm den Gegenstand nun doch zuzusprechen. Die Sequenz wird zum Abschluss gebracht, indem Jürgen in der anschließenden Pause (Z. 8) seine Suche im Garten fortsetzt.

156

5 Typologie des gestischen Zeigens

Das letzte Beispiel stammt ebenfalls aus dem „Big Brother“-Korpus. Jürgen und Sabrina befinden sich in einer länger andauernden Frotzelaktivität, die mit spielerischen Drohungen, kleinen körperlichen Rangeleien und wechselseitigen Verfolgungen durch den Raum einhergeht. In der folgenden Szene streiten sich die beiden über einen Stapel Autogrammkarten, mit denen Sabrina bei einer Rangelei nach Jürgen geworfen hat und die nun auf dem Küchenboden verstreut sind. Um seine Unschuld an dem Chaos zu beteuern, gemahnt er Sabrina an die Wurf aktion und ihre eigene Verantwortung (Z. 1–2). Dazu produziert er zunächst eine mit weit ausgestrecktem Arm ausgeführte ZfHu-Geste (Abb. 5.1), bricht dann allerdings seine simultan dazu formulierte Verbaläußerung ab (Z. 1: °hhh ICH habe die doch gar nich-). Diese repariert er anschließend, wobei er die Reparatur mit einer neuen Geste, der oHHv-Geste, kombiniert (Abb. 5.2): Beispiel 5: „Postkarten“ (bb02_3_00:15:21) Abbildung 5.1

1

Jrg:

2 3 4 5 6

Sbr: Jrg: Sbr: Adr:

Abbildung 5.2

die doch gar nich-= =die_das wArst du doch SELber; du hast mich geSCHUBST, [((lacht))] [((lacht))] [((lacht))]

Der Gipfelpunkt der ersten Geste wird simultan zum Demonstrativum die (Z. 1) erreicht. Der Übergang von der Zeigefinger- (ZfHu) zur offenen Hand-Geste (oHHv) erfolgt ohne Retraktionsphase allein durch die Rotation des Arms und das Ausstrecken der Finger, während der Sprecher das Demonstrativum die (Z. 2) wiederholt und mit schnellem Anschluss durch das Demonstrativum das (Z. 2) ersetzt. Die Transformation der Zeigefingergeste in eine oHHv-Geste wird mit

5.4 Zeigen mit geöffneter Hand

157

der Artikulation des Verbs wArst vollendet (Z. 2). Dieser Abschlusspunkt bildet zugleich den Gipfelpunkt der oHHv-Geste (Abb. 5.2). Dieser wird über Sabrinas Replik – die spielerische und im Übrigen falsche Anschuldigung, Jürgen habe sie geSCHUBST (Z. 3) – hinweg eingefroren und auch danach noch fast 5 Sekunden gehalten, während die Beteiligten ausgiebig lachen. Mit dem Einfrieren des Gestengipfelpunkts (post-stroke hold, Kendon 2004) forciert Jürgen seinen Vorwurf an Sabrina, indem er das Resultat ihres Handelns und ihre Verantwortlichkeit dafür visuell präsent hält. Es handelt sich folglich nicht einfach um eine gestische Betrachtungsaufforderung, sondern die Aufforderung an Sabrina, sich den Kartenhaufen genau anzusehen und als Ergebnis ihre eigenen Tuns anzuerkennen, impliziert, dass sie eine Neubewertung der Situation vornehmen und das Chaos selbst beseitigen muss. Dem entspricht der syntaktisch-semantisch-pragmatische Fokuswechsel zwischen Reparandum und Reparatur: Während in der abgebrochenen, mit der Zeigefingergeste korrelierenden Turnkonstruktionseinheit eine negative Ich-Aussage formuliert und die Objekte selbst bzw. die (Nicht-)Beziehung zwischen dem Sprecher und den Objekten fokussiert wird, womit der Äußerung pragmatisch die Funktion einer Unschuldsbeteuerung zukommt, verschiebt sich in der Reparatur der Fokus auf Sabrinas Agentivität (du doch SELber) und das Resultat (das) ihres Tuns.65 Aus der Unschuldsbeteuerung wird eine Schuldzuweisung, wobei die Schuld zuweisende, anklagende Geste in diesem Fall nicht auf die Beschuldigte, sondern auf das sichtbare Ergebnis ihres Tuns gerichtet ist und dadurch zusätzlich eine deontische, ins Lenkfeld ausgreifende Qualität erhält.

Zusammenfassung Sowohl die oHHo-Gesten als auch die oHHv-Gesten unterscheiden sich von der klassischen Zeigefingergeste (ZfHu) dadurch, dass ihre Primärfunktion nicht in

65 Im Unterschied zum Beispiel „doofer Onkel“ (vgl. Kapitel 4), in dem Sabrina Jürgen durch eine deiktische Äußerung (guck_ma hier doofer onkel was du gemacht hast) in Korrelation mit einer Zeigefingergeste auf das Resultat seines Tuns aufmerksam macht, geht es im vorliegenden Beispiel nicht um ein unbekanntes, erst perzeptorisch zu lokalisierendes und referenziell zu identifizierendes Objekt, sondern um Gegenstände, die bereits zuvor im Aufmerksamkeitsfokus der beiden waren. Anstelle der Lokalisierungs- und Identifizierungsfunktion steht hier die Präsentation des Resultats zum Zwecke seiner Inspektion im Vordergrund. Der funktionale Unterschied manifestiert sich in der Wahl des Gestenformats: Zeigefingergeste im „doofer Onkel“-Beispiel versus oHHv-Geste im vorliegenden Beispiel. Pragmatisch betrachtet sind beide Beispiele jedoch insofern vergleichbar, als sie mit der Zeigehandlung die Übernahme der Verantwortung für das sichtbare Ergebnis einer vergangenen Handlung des Adressaten einfordern.

158

5 Typologie des gestischen Zeigens

der Lokalisierung, Identifizierung und Individuierung von Objekten, sondern im Präsentieren und Anbieten dieser Objekte liegt. Mit der Präsentationsfunktion verbunden ist die an die Adressaten ergehende Aufforderung, die vorgeführten Objekte anzusehen und genauer zu betrachten. Auch wenn sich funktional kein trennscharfer Unterschied zwischen oHHv-Gesten und oHHo-Gesten etablieren lässt, so ist doch festzustellen, dass bei der oHHv-Verwendung die Betrachtungsaufforderung zudem mit der Implikation verbunden ist, die Adressaten mögen eine Einschätzung ihrer Eindrücke oder gar eine Revision ihrer bisherigen Annahmen vornehmen und das Gesehene sowie unmittelbar damit zusammenhängende Sachverhalte auf der Grundlage genauerer Betrachtung (neu) bewerten. Es handelt sich also um eine Aufforderung zur Betrachtung im doppelten Sinn der visuellen Wahrnehmung einerseits und der kognitiven bzw. affektiven Bewertung andererseits. Kendon sieht einen weiteren Unterschied zwischen Zeigefingergesten und Gesten der geöffneten Hand darin, dass nur beim Gebrauch von Zeigefingergesten deiktische Ausdrücke auftreten, während Gesten der geöffneten Hand seltener mit verbaldeiktischen Elementen verbunden werden (Kendon 2004: 208): „It is particularly interesting to note that whenever the index finger is used in pointing, the speaker also often employs a deictic word, whereas when the Open Hand ist used, deictic words in the associated speech are less often observed.“ Abweichend von Kendons Behauptung, die sich auf ein italienisch- und englischsprachiges Videokorpus stützt, kommen die vorliegenden Analysen zu anderen Ergebnissen. So decken sich meine Ergebnisse zwar mit Kendons Feststellung, dass sich Zeigefingergesten und Gesten der geöffneten Hand funktional durch Objektindividuation bzw. Lokalisierung einerseits und Präsentation andererseits unterscheiden. Doch trifft Kendons Verallgemeinerung nur auf die Unterscheidung zwischen einem bestimmten Typ von Zeigefingergesten, nämlich auf die ZfHu-Variante, zu. Dasselbe gilt für Kendons Behauptungen zur Deixis: So tritt nur die ZfHu-Variante im multimodalen Verbund mit sprachlichen Ausdrücken auf, die im jeweiligen Äußerungskontext eine genuin deiktische Funktion ausüben und deiktisch-gestisch gebraucht werden. Für die ZfHv-Geste hingegen gilt, dass sie entweder mit anaphorisch gebrauchten Ausdrücken auftritt oder – was weit häufiger der Fall ist – kein eindeutig zuzuordnendes verbales Korrelat besitzt. Anders als die ZfHu-Geste, die zusammen mit gestisch gebrauchten Deiktika visuell wahrzunehmende Objekte lokalisiert und identifiziert, verweist die ZfHvGeste auf eine im Vollzug befindliche oder unmittelbar anstehende Aktivität. In der Regel weist ihr Gebrauch weder einen engen funktionalen und temporalen Bezug zu spezifischen sprachlichen Elementen noch eine systematische interpersonelle Koordinierung visueller Wahrnehmung auf, wie sie bei der klassischen ZfHu-Geste festzustellen ist.

5.4 Zeigen mit geöffneter Hand

159

5.4.3 offene Hand Handfläche nach unten (oHHu) Eine von Kendon 2004 und Kendon und Versante 2003 nicht in der Typologie der Zeigegesten untersuchte Form des Zeigens stellen Gesten mit offener Hand dar, bei denen die Handfläche wie bei der oHHo-Geste ebenfalls in eine horizontale Position gebracht wird, die Handinnenfläche dabei jedoch nach unten weist. Kendon betrachtet diese bei ihm als Open Hand Prone bezeichnete Gestenform als eine von zwei Gestenfamilien der geöffneten Hand, die typischerweise in Gebrauchskontexten auftreten, „where something is being denied, negated, interrupted or stopped, whether explicitly or by implication“ (Kendon 2004: 248). Komplementär dazu werden die „Open Hand Supine (or ‚palm up‘) family gestures“ im Zusammenhang mit den Aktivitäten des Präsentierens, Gebens, Anbietens oder Bittens (Kendon 2004: 248) gebraucht. Im Gegensatz zu den Open Hand Prone-Gesten diskutiert Kendon die Open Hand Supine-Gesten auch im Kapitel „On Pointing“. Dort werden sie funktional als showing, offering und giving beschrieben, womit Aktivitätstypen benannt sind, die als Zeigen im deiktischen Sinn begriffen werden können (vgl. dazu den vorherigen Abschnitt der vorliegenden Untersuchung). Dies gilt nicht für Kendons funktionale Beschreibung der Open Hand Prone-Gesten als Gesten der Negation, des Abbruchs oder der (Ver-)Weigerung. Im Unterschied zu Kendons Ergebnissen hat die Analyse des vorliegenden Datenkorpus einen deiktischen Gebrauch der Open Hand Prone- bzw. der Open Hand Palm Down-Gesten ergeben, allerdings mit folgender gattungsspezifischer Einschränkung: Während die in den vorigen Abschnitten diskutierten Gestenformen der oHHv-Gestalt (Open Hand Palm Vertical) und der oHHo-Gestalt (Open Hand Palm Up) in unterschiedlichen Kontexten, wenn auch gehäuft im Subkorpus der Stadtführungen auftreten, kommt die oHHu-Geste fast ausschließlich im Subkorpus der Kochsendungen vor. Diese gattungsspezifische Prävalenz hängt mit der gestalterischen Bandbreite der Geste und ihrer daraus resultierenden Polyfunktionalität zusammen: Auf der Ebene ihrer Form und ihrer bewegungsgestalterischen Ausführung inkorporiert die zeigende oHHu-Geste häufig zusätzliche ikonische bzw. deskriptive Elemente, die auf der funktionalen Ebene nicht nur eine Lokalisierung leisten, sondern sich zudem auf die Anordnung der gezeigten Elemente im Wahrnehmungsraum, auf die phänomenale und ökologische Struktur des Verweisraums oder auf Komponenten der projizierten Handlung beziehen können. Die Analysen beginnen mit einer Sequenz aus dem „Mutige Mädchen“-Korpus, in der die Trainerin (T) raumorganisatorische Fragen für die nächste Stunde erklärt. Die Halle, in der der Kurs stattfindet, kann durch mobile Trennwände in drei getrennte Hallenteile unterteilt werden. In der laufenden Stunde befindet sich die Gruppe in dem durch eine herabgelassene Trennwand von der mittle-

160

5 Typologie des gestischen Zeigens

ren Halle abgetrennten rechten Hallenbereich. In der Sequenz führt die Trainerin eine oHHu-Geste aus, um auf den Raum zu referieren, in dem sie sich mit ihrer Gruppe gerade befindet: Beispiel 1: „diesen Raum“ (MM_B2_00:26:06) Abbildung 1.1

1

T:

wahrschEInlich wird_s SO sein;

Abbildung 1.2

2

Abbildung 1.3

Abbildung 1.4

dass wir (-) DIEsen raum haben;

Die Trainerin steht in einer Ecke der Turnhalle, während die Mädchen auf dem Boden und auf den an den Wänden aufgestellten Bänken sitzen (Abb. 1.1). In der Mikropause (Z. 2) hebt die Trainerin beide Hände vor dem Oberkörper an, wobei die Hände parallel zueinander eine oHHu-Gestalt annehmen (Abb. 1.2). Simultan

5.4 Zeigen mit geöffneter Hand

161

zur Artikulation des akzentuierten, deiktisch verwendeten Demonstrativpronomens DIEsen (Z. 2) senkt sie die Hände auf Bauchhöhe ab und zeigt dadurch beidhändig mit den Handinnenflächen nach unten auf den Boden (Abb. 1.3). Als die Hände den Tiefpunkt erreicht haben, werden sie auf gleichbleibender Höhe leicht seitwärts nach rechts bewegt (Abb. 1.4), wodurch die Vorstellung des Flächenhaften visualisiert wird. Dies geschieht, als die Trainerin das Nomen raum (Z. 2) artikuliert. Im Unterschied zu einer einhändig ausgeführten Zeigefingergeste unterstreichen diese Formaspekte die Tatsache, dass sich die Zeigehandlung nicht auf ein punktuelles, sondern auf ein großflächiges Zeigeziel bezieht: den abgetrennten Turnhallenbereich, in dem sich die Gruppe zum Sprechzeitpunkt aufhält. Im zweiten Beispiel aus dem Kochkorpus wird die eingangs erwähnte visuelle Integration darstellender Elemente in die oHHu-Geste besonders deutlich. In dem Ausschnitt verwendet die Sprecherin die oHHu-Geste in Kontrast zu einer nachfolgenden ZfHu-Geste. In beiden Fällen stellt das proximale Lokaldeiktikon hier das verbale Korrelat der Geste dar. Dadurch wird der Kontrast zwischen den beiden Gestenformen besonders profiliert. Der Ausschnitt (Beispiel 2: „Zutaten“) setzt damit ein, dass Poletto anhand der auf dem Kochtisch in Schälchen bereit gestellten Zutaten das Rezept für Nudelteig erklärt. Dabei führt sie verschiedene Zeigegesten auf die genannten Zutaten aus. Neben den Zutaten befindet sich eine bereits verarbeitete Nudelteigmasse auf dem Kochtisch, deren Inhalt nicht den Mengenangaben der zu Demonstrationszwecken aufgebauten Zutaten entspricht, wie Poletto erläuternd ergänzt (Z. 1). Simultan zu ihrer Erläuterung weist sie mit einer Zeigefingergeste (ZfHu) auf die bereits verarbeitete Teigmasse (Abb. 2.1): Beispiel 2: „Zutaten“ (PK1_00:03:17) Abbildung 2.1

1 2

PL: BS:

HIER Abbildung 2.3

Abbildung 2.2

[ach dAs was HIE:R steht-

162

5 Typologie des gestischen Zeigens

1 PL: HIER Beispiel 2 BS: (Fortsetzung) 2

[ach dAs was HIE:R steht-

Abbildung 2.3

3 4 5

PL: BS:

ist HIER schon drin; geNAU; a::h

Überlappend mit Polettos Erläuterung äußert ihr Gast (BS) eine überraschte Nachfrage (Z. 2), die sich ebenfalls auf die auf dem Kochtisch angeordneten Lebensmittel bezieht und von zwei unterschiedlichen Zeigegesten begleitet wird. Während die erste Geste in der oHHu-Gestalt beidhändig direkt über den Schälchen mit den Zutaten ausgeführt wird (Abb. 2.2) und als Zeigeziel ein Ensemble mehrerer, räumlich nebeneinander lokalisierter und zu identifizierender Referenten hat, wird die zweite Geste in der ZfHu-Form ebenfalls beidhändig direkt über dem Teigkloß als singulärem Zeigeziel vollführt (Abb. 2.3). Die beiden Zeigegesten visualisieren in ihrer unterschiedlichen Formgestalt kontrastiv folgende Aspekte ihrer Referenten: erstens die Pluralität der Zutaten als Anschauungsobjekte, die auf dem didaktisch arrangierten Kochtisch ausgebreitet sind, gegenüber der Singularität des Teigkloßes, sowie zweitens das kochphasenspezifische Vorher und Nachher der Zutaten im getrennten Rohzustand einerseits und im zu einer Masse verarbeiteten Kompaktzustand andererseits. Dabei ist es die Sequenzialität der Gesten, die das simultane Nebeneinander des didaktischen Arrangements in ein Nacheinander transformiert und die Gegenstände auf dem Tisch als sequenzielle Varianten zwei verschiedener Verarbeitungsphasen veranschaulicht. Im nächsten Beispiel aus „Polettos Kochschule“ wird die für Kochshows typische Ökologie des vorab arrangierten Kochtischs vom Gast eigens thematisiert. Die Sendung hat gerade begonnen. Der Gast (BS) befindet sich zusammen mit Poletto hinter dem Kochtisch und kommentiert das Arrangement der Zutaten. Im Verlauf ihres Kommentars produziert der Gast eine oHHu-Geste, die beidhändig über dem Kochtisch ausgeführt wird:

5.4 Zeigen mit geöffneter Hand

Beispiel 3: „Wünsche“ (PK1_00:01:18)

1

BS:

_ Abbildung 3.1

dass jemand das SO: schon_mal-

2

Abbildung 3.2

3 4

PL:

Abbildung 3.3

dass DA::S [schon mal steht; [ja DAS ist super ne, Abbildung 3.4

163

164

5 Typologie des gestischen Zeigens

Nach einer rhetorischen Frage (Z. 1: weißt_du was Ich mir beim kochen WÜNsche?) beginnt BS eine Antwort (Z. 2: dass jemand das SO: schon_mal-), die das gestisch gebrauchte Modaldeiktikon SO: enthält, dann aber abgebrochen und anschließend repariert wird (Z. 3: dass DA::S schon mal steht;). In der Reparatur (Z. 3) wird anstelle des Modaldeiktikons das Demonstrativpronomen DA::S (Z. 3) verwendet. Sowohl das Modaldeiktikon als auch das Demonstrativpronomen tragen jeweils den Hauptakzent und werden von gestischen Zeigeaktivitäten begleitet, bei denen beide Hände eine oHHu-Form annehmen. Der verbalen Reparatur korrespondiert die erneute Ausführung einer oHHu-Geste, die im Vergleich zur ersten Geste hinsichtlich ihrer Dauer, ihres Verlaufs und ihres Bewegungsbogens variiert wird. Die erste oHHu-Geste wird simultan zum Modaldeiktikon SO: (Z. 2) realisiert (Abb. 3.1). Sie geht mit einem Blick auf den Verweisraum und einem anschließenden Kontrollblick zurück zur Adressatin einher. Beide Hände befinden sich auf Brusthöhe oberhalb des Kochtisches. Während die rechte Hand ausgestreckt ist und damit eine größere Fläche anzeigt, sind die Finger der rechten Hand wie bei einer angedeuteten Greifgeste leicht nach innen gebogen und visualisieren dadurch das punktuelle Zuhandensein der kleinen Schälchen auf der linken Hälfte des Kochtisches. Anschließend führt die Sprecherin ihre nun beiderseits ausgestreckten Hände über dem Kochtisch zusammen (Abb. 3.2). Dies geschieht mit dem Beginn der nächsten Turnkonstruktionseinheit, in der synchron zur verbalen Reparatur (Z. 3) eine gestische Retraktion und Wiederholung stattfindet. Das folgende Demonstrativpronomen wird mit einer langen Dehnung des Vokals (Z. 3: DA::S) gesprochen. Im Verlauf der artikulatorischen Vokaldehnung breitet die Sprecherin ihre Arme und Hände in diametral entgegengesetzter Richtung über dem Kochtisch auseinander (Abb. 3.3). Die Bewegung setzt sich über das Demonstrativpronomen hinweg bis zur Artikulation des Adverbs mal fort (Z. 3). An dieser Stelle erreichen Hände und Arme den Gipfel- und Endpunkt dieser Spreizbewegung in einer weit gestreckten v-förmigen Position über der Fläche des Koch tisches (Abb. 3.4). Während das Demonstrativpronomen die Referenten als collectivum tantum in den Fokus rückt, beschreibt die mit ausgestreckten Armen und nach unten weisenden Handflächen ausgeführte Gestenbewegung deren ökologische, wohl platzierte Anordnung auf der gesamten Ausdehnungsfläche des Kochtisches. Dabei geht es zum einen darum, einen relativ großen Raum und die darin befindliche Zusammenstellung von Gegenständen zu identifizieren, wofür eine Zeigefingergeste funktional ungeeignet wäre. Zum anderen geht es aber auch darum, die gleichermaßen praktische wie ästhetische Qualität einer so wohlverteilten Anordnung visuell hervorzuheben. Insofern verdeutlicht dieses Beispiel die eingangs getroffene Feststellung, dass deiktisch gebrauchte oHHu-Gesten keine rein zeigende Funktion haben, sondern über die Lokalisierungs- und Objektidentifizierungsfunktion

5.4 Zeigen mit geöffneter Hand

165

weitere Komponenten inkorporieren. Gerade die Tatsache, dass die Sprecherin zunächst ein Modaldeiktikon verwendet, das in der Regel mit einer ikonischen bzw. deskriptiven Geste einher geht (vgl. dazu Kapitel 7.3), und dann eine Reparatur formuliert, die statt der Art und Weise des Arrangements den Referenten selbst fokussiert, ist ein Indikator für die Funktionsüberlagerung von deiktischen und ikonisch-deskriptiven Komponenten. Dafür spricht auch, dass sie mit dem Demonstrativpronomen bezeichnenderweise eine Geste koppelt, die die modale Komponente der horizontalen Ausbreitung der Zutaten auf dem Tisch in deren Bewegungsverlauf integriert. Eine weitere Besonderheit deiktisch gebrauchter oHHu-Gesten liegt darin, dass sie häufig objekttaktil ausgeführt werden, wie die letzten beiden Beispiele illustrieren. In der folgenden Sequenz aus einer weiteren Folge der Sendereihe „Polettos Kochschule“ erläutert Poletto relevante Details bei der Zubereitung selbstgemachter Gnocchi und führt im Verlauf ihrer Erläuterung eine objekttaktile Zeigegeste an den seitlich auf einem Backblech liegenden Kartoffeln aus: Beispiel 4: „Kartoffel“ (PK2_00:02:40)

1

ren,

PL: Abbildung 4.1

2

Abbildung 4.2

und zwar hab ich HIER ne mEhlig kochende Abbildung 4.3

karTOFfel genommen?

Abbildung 4.4

166

5 Typologie des gestischen Zeigens

Nachdem Poletto ein Blech mit Kartoffeln aus dem Ofen genommen und auf den Kochtisch gestellt hat, kündigt sie eine Erklärung an (Z. 1: um gAnz kurz zu erKLÄren,), die sich auf die Kartoffeln bezieht und unmittelbar folgt. Als sie das proximale Lokaldeiktikon HIER (Z. 2) artikuliert, ist ihr Blick auf das Kartoffelblech gerichtet (Abb. 4.1). Während ihre rechte Hand eine Kartoffel umgreift, befindet sich ihre linke Hand in einer oHHu-Form über dem Kartoffelblech. Anschließend wendet sie sich mit dem Oberkörper ihrem Interaktionspartner zu (Abb. 4.2) und führt zwei objekttaktile Zeigegesten in der oHHu-Form auf die Kartoffeln aus. Sowohl die erste, simultan zum Adverb mEhlig (Z. 2) produzierte linkshändige Geste (Abb. 4.2), als auch die zweite, rechtshändig auf der Akzentsilbe des Nomens (Z. 2: karTOFfel) ausgeführte Geste verweilt einen Moment auf der Kartoffel (Abb. 4.4). Bevor Poletto die zweite Geste mit der rechten Hand ausführt (Abb. 4.4), hebt sie beide Hände über dem Kartoffelblech an (Abb. 4.3). Die linke Hand wird in der oHHu-Orientierung schwebend über dem Blech eingefroren, während die rechte Hand die objekttaktile Geste vollzieht (Abb. 4.4). Beide Gesten haben die Qualität von Taktstockgesten (batons). Sie werden in rhythmischer Koordination mit den Akzentsilben ausgeführt und heben die semantisch wichtigen Informationen der Äußerung hervor. Poletto zeigt also nicht allein auf die durch das proximale Deiktikon HIER (Z. 2) lokalisierten Referenzobjekte, sondern auch auf deren spezifische Eigenschaft: Sie stellen in ihrer Pluralität Exemplare einer bestimmten Kartoffelsorte dar. Während auf der verbalen Ebene im Singular das Konzept der Sorte formuliert wird, verankern die Zeigegesten auf zwei der auf dem Blech verteilten Kartoffeln das abstrakte Konzept ‚mehlig kochende Kartoffel‘ in der materiellen Wirklichkeit der real verwendeten und sinnlich wahrnehmbaren Objekte. Der Adressat ist nicht nur auf die Kartoffeln orientiert, sondern er kommentiert seinen visuellen Eindruck zuerst mimisch und dann verbal durch die scherzhafte Bemerkung (Z. 3): mEin gott die sehen ja FURCHTbar aus. Im weiteren Verlauf der Sendung erläutert Poletto zusätzliche Details bei der Zubereitung selbstgemachter Gnocchi. Gegenstand sind noch immer die Kartoffeln, die sie soeben vom Ofenblech in eine Schüssel getan hat, die ihr Gast (IN) in beiden Händen hält:

5.4 Zeigen mit geöffneter Hand

167

Beispiel 5: „abstellen“ (PK2_00:03:31)

1 2

PL:

3 4 5 6

IN: PL: IN: PL:

7

IN:

noch WARM sind. DAS merkt man; [ne? ja? [(das_s_n muss man) bIss[chen balanCIEren; [kannste HIER abst' (h) [ABst(h)ellen; [alsoAbbildung 5.1

Abbildung 5.2

Auf Polettos Bemerkung, dass die Kartoffeln für die Verarbeitung noch warm sein müssen (Z. 2), reagiert ihr Gast mit einem Blick auf die Schüssel in seinen Händen, einem entsprechenden Kommentar (Z. 3) und der körperlichen Inszenierung zu heiß werdender Hände, indem er die Schüssel zwischen beiden Händen hin und her balanciert. Darüber hinaus expandiert er in Überlappung mit Polettos Vergewisserungssignalen (Z. 4) seinen Redebeitrag mit einer verbalen Beschreibung seiner körperlichen Selbstinszenierung (Z. 5). Wiederum teilüberlappend mit seiner Beschreibung schlägt Poletto ihm vor, die Schüssel an einer bestimmten, mit dem proximalen Lokaldeiktikon HIER (Z. 6) bezeichneten Stelle abzustellen. Simultan zur Artikulation des Deiktikons berührt Poletto die Arbeitsplatte. Dazu bringt sie ihre rechte Hand zunächst in eine oHHu-Orientierung oberhalb der Tischplatte (Abb. 5.1), auf die sie zugleich ihren Blick richtet, und führt anschließend einen Tap auf der Arbeitsplatte aus (Abb. 5.2). Der Tap ist temporal exakt mit dem Onset des Verbpräfixes (Z. 6: ABst(h)ellen) koordiniert. Über die Lokalisierungsfunktion hinaus erfüllt auch diese oHHu-Geste eine ikonische Funktion, insofern sie durch die objekttaktile Realisierung – d. h. durch das Zusammentreffen zweier kompakter Gegenstände – die im Verb beschriebene Handlung des Abstellens an dem angegebenen Ort visualisiert und für den Adres-

168

5 Typologie des gestischen Zeigens

saten unter Umständen sogar hörbar macht, was aufgrund der Tonqualität für das vorliegende Beispiel allerdings nicht entschieden werden kann.

Zusammenfassung Die analysierten Sequenzen belegen, dass Gesten der geöffneten Hand, bei denen die Handinnenfläche nach unten weist (oHHu-Gesten), durchaus zum Zeigen verwendet werden und in diesem Verwendungszusammenhang auch im Verbund mit deiktischen Ausdrücken auftreten. Im Unterschied zu den beiden anderen Formvarianten der geöffneten Hand (oHHo-Geste und oHHv-Geste), deren funktionale Unterschiede im vorherigen Abschnitt diskutiert wurden, zeichnen sich oHHu-Gesten dadurch aus, dass sie über die zeigende Funktion hinaus zusätzliche Komponenten inkorporieren. Sie werden vor allem in Fällen verwendet, in denen ein Ensemble mehrerer Objekte das Zeigeziel und den Referenten konstituiert und eine Zeigefingergeste ungeeignet ist. Sie treten auch als beidhändig ausgeführte, bestimmte Bewegungsmuster realisierende Varianten auf und visualisieren Aspekte wie die Kollektivität oder Pluralität des Referenten, die Ökologie des durch die Objekte eingenommenen Raums, dessen Ausdehnung und Strukturierung. Die Integration ikonisch-deskriptiver Aspekte führt zu einer größeren formalen Variationsbreite nicht nur hinsichtlich der Hand- und Fingergestalt, sondern auch hinsichtlich der Bewegungsmuster. Dabei war zu sehen, dass neben ikonisch-deskriptiven auch pragmatisch-diskursstrukturierende Funktionen eine Rolle spielen können, die üblicherweise von Taktstockgesten (batons) ausgeübt werden. Solche Überschneidungen zwischen dem Typus der Zeigegeste und dem Typus der Taktstockgeste, die dadurch entstehen, dass zeigende Gesten zugleich mit stark rhythmisierenden, die prosodische Struktur der Verbaläußerung unterstreichenden Akzenten produziert werden, sind jedoch nicht auf die oHHu-Geste beschränkt, sondern treten auch bei Zeigefingergesten auf.

5.5 Zeigen mit anderen Körperteilen Arme, Hände und Finger eignen sich aufgrund ihrer Mobilität, Flexibilität und Distinktivität besonders gut für die zentrale Aufgabe der räumlichen Vektorbildung. Dennoch wird nicht ausschließlich mit den Vordergliedmaßen gezeigt. In Abhängigkeit von den Möglichkeiten und Beschränkungen der Situation, der räumlichen Umgebung, den laufenden Aktivitäten und den Beteiligungsstrukturen werden neben manuellen Zeigegesten eine Reihe anderer Körperteile zum Zeigen verwendet. Eine prominente Rolle nehmen dabei Kopf und Blick, gele-

5.5 Zeigen mit anderen Körperteilen

169

gentlich Bein und Fuß (de Jorio 2000 [1832]) sowie in indigenen Kulturen Austra liens und Amerikas das lip-pointing (Enfield 2001; Sherzer 1983; Wilkins 2003) ein. Diese Untersuchungen zu bislang wenig erforschten Praktiken des Zeigens setzen der Auffassung, dass das Zeigen mit dem Zeigefinger eine menschliche Universalie konstituiere, empirische Nachweise zu dessen Kulturspezifik (Wilkins 2003) entgegen. Die folgende Darstellung beschränkt sich auf die in meinem Korpus auftretenden Verfahrensweisen des Zeigens mit anderen Körperteilen, die als konventionalisiert gelten können. Dazu zählen das Zeigen mit dem Kopf und das Zeigen mit dem Blick. Die formale Unterscheidung zwischen einem mit einer richtungsweisenden Kopfbewegung ausgeführten Zeigen und einem mittels Blick- bzw. Augenausrichtung vollzogenen Zeigen ergibt sich erstens aus der unterschiedlichen Produktion und Prozessierung des direktionalen Vektors, zweitens aus der unterschiedlich gestalteten funktionalen Arbeitsaufteilung auf die Ressourcen und drittens aus der Verschiedenheit des multimodalen Realisierungsformats. Wie zu sehen sein wird, ist die Grenze zwischen beiden Zeigweisen empirisch jedoch nicht immer trennscharf zu ziehen, was unter anderem damit zusammenhängt, dass beide Realisierungsvarianten auch als Einheit auftreten können.

5.5.1 Zeigen mit dem Kopf Am klarsten als eigene Form des Zeigens zu erkennen und vom Zeigen mit dem Blick zu unterscheiden sind Kopfgesten, in denen die Richtung der Kopfbewegung einen Vektor projiziert, der den Suchraum für das Zeigeziel anzeigt, während der Blick nicht in dieselbe Richtung wie die Kopfbewegung weist, sondern auf den Adressaten orientiert bleibt. Im Unterschied zum Zeigen mit dem Blick, das in den meisten Fällen mit einer Reorientierung des Kopfs bzw. der Kopf-, Schulterund Oberkörperkoordinaten einhergeht und mit einer fließenden, rhythmisch unauffälligen Bewegung ausgeführt wird, erfolgt das Zeigen mit dem Kopf ruckartig. Es sticht aus der Bewegungsdynamik des restlichen Körpers nicht nur als vektoriell, sondern auch als rhythmisch markierte Bewegung heraus. Im ersten Beispiel aus dem „Big Brother“-Korpus befindet sich der Sprecher im Statement-Raum des „Big Brother“-Hauses und spricht in die Kamera, um den Fernsehzuschauern seine Eindrücke von dem Besuch einer Musikgruppe mitzuteilen:

170

5 Typologie des gestischen Zeigens

Beispiel 1: „Vorgarten“ (bb02_6_00:07:07)

01 02 03 04 05 06 07 08 09 10 11 12

Jhn:

ja:::; (-)

m_wa jEtzt zu juter LETZT, (-) ?= =also ick hab mich SEHR gefreut,> (-dels HIER warn, hhh (geSUNGen ham, (0.3) u::nd also: (.) war ne gAnz gAnz tolle EINlage jewesen, hhh ist zwar dann(0.6) schon wieder SO schnell vorbei; (-) dass et schon wieder IRgendwie UNwirklich ist dass:-

Abbildung 1.1

Abbildung 1.2

Abbildung 1.3

13

(0.6)

14 15

bei UNS im VORgarten ma (.) grade ebentdels vorjeSUNGen haben,

5.5 Zeigen mit anderen Körperteilen

171

Nachdem der Sprecher, John, seine Freude über den Auftritt der Musikband im „Big Brother“-Haus geäußert hat (Z. 1–8), rahmt er die Ereignisschilderung neu, indem er die Band-Aufführung als kurzen, nachgerade unwirklichen Spuk der Erinnerung darstellt (Z. 9–15). Dabei bekommt das Moment des Überraschenden eine neue Qualität, indem es nun in seiner sozialen und räumlichen Situierung reflektiert wird. Während John im ersten Teil von seiner freudigen Überraschung darüber spricht, dass die MÄdels HIER warn (Z. 5), und mit dem proximalen Lokaldeiktikon HIER auf das „Big Brother“-Haus referiert, präzisiert er in seiner Neurahmung im zweiten Teil nicht nur den Ort (Z. 14: VORgarten), an dem die Show-Einlage stattgefunden hat, sondern unternimmt auch eine sozialdeiktische Qualifizierung (Z. 14: bei UNS), mit der er sich und seine Mitbewohner als Gastgeber eines nicht selbst geplanten Ereignisses positioniert, dessen mediale Show-Dimensionen mit den (stereotypen) sozialen und räumlichen Dimensionen des Vorgartens kontrastiert werden. Das Syntagma bei UNS im VORgarten (Z. 14) wird durch die Voranstellung im dass-Satz zusätzlich fokussiert. Zwischen die durch die Subjunktion aufgebaute Projektion und die Projektionseinlösung tritt eine 0,6-sekündige Pause (Z. 13), in der John mit dem Kopf über die linke Schulter eine Zeigegeste nach hinten vollführt (Abb. 1.2) und über die rückwärtige Wand des Statement-Raums hinaus auf die Topographie des „Big-Brother“-Hauses verweist. Folgende Formspezifika sind dabei zu beobachten. Erstens wird die Bewegung mit der für Kopfgesten typischen, ruckartigen Bewegung ausgeführt. Dadurch wird das Zeiginstrument etabliert und die Zeigegeste als solche, in ihrer deiktischen Qualität erkennbar. Zweitens verleiht die beschleunigte Bewegung der Geste ihren Richtungsvektor. Drittens bleibt der Blick des Zeigenden während der gesamten Zeigehandlung, von der Vorbereitung über den Gestengipfelpunkt bis zur Retraktion und der Rückkehr des Kopfs in die Ruheposition, auf den Adressaten bzw. die Kamera gerichtet (Abb. 1.1.–1.3). Das multimodale Realisierungsformat ähnelt in diesem Fall dem Zeigen mit dem Daumen, bei dem der Zeigende seinen Blick auch auf den Adressaten gerichtet hält und nicht, wie beim Zeigen mit dem Zeigefinger, zunächst selbst einen Verweisraum herstellt, bevor er sich auf den Adressaten und dann zurück auf das Zeigeziel orientiert. Fälle, in denen nur durch eine Kopfbewegung gezeigt wird, während der Blick der Kopfbewegung nicht folgt, lassen sich eindeutig von Fällen zu unterscheiden, in denen umgekehrt nur durch den Blick gezeigt wird, während der Kopf keine entsprechende Orientierung vornimmt. Allerdings sind nicht alle Fälle kategorial so klar zu unterscheiden. Wie zu sehen sein wird, können als weitere Unterscheidungskriterien erstens die Frage nach der körperlichen Ressource, die am unverzichtbarsten für die Projektion eines räumlichen Vektors ist, und zweitens die Frage nach der Temporalität der multimodalen Ressourcenorganisation dienen.

172

5 Typologie des gestischen Zeigens

Das zweite Beispiel stammt ebenfalls aus dem „Big Brother“-Korpus und weist große Gemeinsamkeiten zum ersten Beispiel auf. Auch hier wird die Kopfgeste eingesetzt, um ein Ereignis zu situieren, das am Vortrag im Garten des „Big Brother“-Hauses stattgefunden hat. Dabei handelt es sich um eine Aktion der Gesprächspartnerin: Beispiel 2: „weltklasse“ (bb85_00:13:07)

01 02

Jrg:

ja: dann musste dir aber ne gute SHOW (.) gen; (0.6)

Abbildung 2.1

03

Abbildung 2.2

da_s geNAU soAbbildung 2.3

04 05

wie du_s gEstern drau =war WELtklasse.

geMACHT hast;=

Wie auf Abbildung 2.1 zu sehen ist, steht der Sprecher (Jrg) vor seiner Gesprächspartnerin in der Küche. Garten und Balkontür liegen in seinem Rücken. Seine

5.5 Zeigen mit anderen Körperteilen

173

Adressatin (Sbr) sitzt schräg am Küchentisch und ist ihm zugewandt. Die Kopfgeste des Sprechers setzt bei geNAU (Z. 3) als rasche, schräg zur rechten Schulter ausgeführte Bewegung ein. Gipfel- und Umkehrpunkt der Kopfgeste werden mit der Artikulation der Modalpartikel so erreicht (Abb. 2.2). Anschließend wird der Kopf wieder in die Ausgangslage zurückgebracht (Abb. 2.3). Die Frage, welcher Ausdruck als verbales Korrelat der Geste gelten kann, wirft die grundsätzliche Problematik der Annahme einer 1:1-Zuordnung von sprachlichem Ausdruck und Geste auf. Temporalitätsstrukturen spielen dabei eine wichtige, aber nicht die alleinige Rolle. So legt die Tatsache, dass die Kopfgeste einen räumlichen Vektor über die Schulter des Sprechers herstellt, ungeachtet dessen, dass die Kopfgeste zeitlich deutlich früher stattfindet, eine raumdeiktische Zuordnung der Zeigegeste zum Lokalausdruck draußen (Z. 4) nahe. Eine zweite Möglichkeit wäre die Zuordnung zum Temporaldeiktikon gEstern (Z. 4). Diese Zuordnung könnte sich auf die Annahme einer Metaphorisierung von Zeit als Raum und der Visualisierung zeitlicher Beziehungen auf einer räumlichen Achse gründen. Allerdings führt Jürgen die Kopfgeste nicht nach links, sondern nach rechts und damit in die Richtung aus, die auf einer egozentrisch verräumlichten Zeitachse nicht die Vergangenheit, sondern die Zukunft darstellt. Als drittes bietet sich die Deutung an, dass die Kopfgeste die Funktion hat, auf das gesamte Szenario und seine personal-, zeit-, lokal- und modaldeiktischen Qualitäten zu verweisen. Ihre enge temporale Alignierung mit der stark projizierenden Modalpartikel so (Z. 3) stützt diese Deutung. Wie im ersten Beispiel dient die Kopfgeste damit der Situierung eines als gemeinsam gewussten Ereignisses und verbindet eine anaphorische bzw. anamnestische mit einer raumdeiktischen Funktion. Ein präziser Raumvektor ist nicht erforderlich. Wie beim Zeigen mit dem Daumen reicht die vage Kopfbewegung über die Schulter als sinnliche Zeighilfe zur Lokalisierung des Ereignisses aus. Einen klaren Fall des Zeigens mit dem Kopf stellt auch das nächste Beispiel aus demselben Korpus dar. Jürgen (Jrg) und Andrea (Adr) befinden sich in der Küche des „Big Brother“-Hauses. Andrea wirft Jürgen vor, verdächtig oft im Zimmer der Mädchen zu sein (Z. 1), in das sich eine weitere Mitbewohnerin häufig zurückzieht. Jürgen rechtfertigt sich mit der Behauptung, sich um seine Mitmenschen zu kümmern (Z. 2–6), was Andrea durch einen weiteren Einwand zu entkräften sucht (Z. 7–8). Jürgen reagiert, indem er auf die Sondersituation verweist, in der sich die betreffende Person befindet (Z. 12). Die Personenreferenz wird durch ein Personalpronomen (Z. 12: IHR) hergestellt, das zum einen anaphorisch auf die im Diskurskontext bereits erwähnte Person verweist (Z. 7: das_s der Erste MITmensch;). Zum anderen übt es im Verbund mit der gleichzeitig ausgeführten Kopfgeste auch eine deiktische Funktion aus, die darin besteht, die gemeinte Person über die Lokalisierung im gemeinsam bewohnten Haus zu identifizieren:

174

5 Typologie des gestischen Zeigens

Beispiel 3: „Mitmensch“ (bb84_00:24:26)

01 02 03 04 05 06

Adr: Jrg:

fter da hinten im zimmer als ICH, ((kichert)) ja; mer mich um meine mitmenschenwenn_s denen schlecht geht; JA.

Abbildung 3.1

07 08 09 10 11

Adr: Jrg: Adr: Jrg:

das_s der ERste MITmensch; der auf(n) um den du dich SO ((lacht)) warn ja schon_n paar HIER.

wie IHR; (0.4)

5.5 Zeigen mit anderen Körperteilen

175

Während Andrea am Tisch sitzt und einen Joghurt isst (Abb. 3.1), läuft Jürgen hin und her und erledigt verschiedene Aufgaben in der Küche (Abb. 3.2). Kurz bevor er die Kopfgeste ausführt, tritt er an die Spüle und hantiert dort mit einem Topf. Dabei richtet er seine Aufmerksamkeit zunächst auf seine Hände (Abb. 3.3), orientiert sich dann auf die hinten am Küchentisch sitzende Adressatin (Abb. 3.4) und deutet simultan zum akzentuierten deiktischen Demonstrativpronomen IHR (Z. 12) mit einer Kopfgeste in Richtung Mädchenzimmer (Abb. 3.5). Die Geste wird als über die Schulter gerichtetes, ruckartiges seitliches Kopfnicken vollzogen. Anschließend richtet er seine Aufmerksamkeit wieder nach unten auf die Hände (vgl. Abb. 3.3). Wie in den vorherigen Beispielen wird das Problem, von einem runden Körperteil aus einen räumlichen Vektor zu extrapolieren, dadurch bearbeitet, dass dieser sich aus der Richtung der ruckartigen Bewegung errechnen lässt. Da sich die gemeinte Person nicht im unmittelbaren Wahrnehmungsraum der Interaktionsbeteiligten befindet, handelt es sich bei der Zeigehandlung um einen Fall von Deixis am Phantasma (vgl. zur Deixis am Phantasma ausführlich Kapitel 7.4). Ein weiterer Kontext, in dem die Kopfgeste verwendet wird, stellt die direkte Anrede bzw. Selektion von Adressaten in einem komplexen Beteiligungsformat (participation framework, Goffman 1981) dar, wie das folgende Beispiel aus „Polettos Kochschule“ belegt. Gerade in Fällen, in denen ein ganzes Adressatenkollektiv und nicht eine einzelne Adressatin ausgewählt werden soll, eignet sich eine Kopfgeste besonders gut, da die vektorielle Präzision nicht nur nicht erforderlich, sondern gar nicht erwünscht ist. Stattdessen reicht eine räumliche Richtungsangabe zur Referenzherstellung aus. Ist hingegen – wie bei der Auswahl eines einzelnen Adressaten aus einer Gruppe Anwesender – ein präziser Vektor erforderlich, stellt das Zeigen mit dem Blick die geeignetere Variante dar: Beispiel 4: „probieren“ (PK6_00:06:12) Abbildung 4.1

1

PL:

((atmet zischend ein)) (.) Abbildung 4.2

Abbildung 4.3

176

5 Typologie des gestischen Zeigens

1 ((atmet zischend ein)) (.) BeispielPL: 4 (Fortsetzung) Abbildung 4.2

2

sie

Abbildung 4.3

her Alle proBIEren;

Poletto und ihr Gast stehen in einem side-by-side-Arrangement hinter dem Herd und löschen eine Käsesauce mit Weißwein ab. Dies führt zu einer humorvollen Einlage, in der Poletto als Replik auf hörbare Reaktionen aus dem Studiopublikum zunächst durch ein zischendes Geräusch die bevorstehende gustatorische Erfahrung inszeniert (Z. 1), gefolgt von dem Versprechen an die Zuschauer, nachher ebenfalls probieren zu dürfen (Z. 2). Während Poletto zischend einatmet, befindet sich ihr Kopf noch in der Ausgangsposition (Abb. 4.1). Mit dem Beginn ihrer Rede bewegt sie den Kopf mit einer ruckartigen Bewegung schräg nach oben und orientiert gleichzeitig ihren zuvor geradeaus gerichteten Blick leicht nach rechts. Die Kopfgeste erreicht mit der Artikulation des deiktischen Anredepronomens sie (Z. 2) ihren Gipfelpunkt (Abb. 4.2). Anschließend kehrt der Kopf in die Ausgangsposition zurück, während der Blick von den Studiogästen ab- und via Kamera den Fernsehzuschauern zugewendet wird (Abb. 4.3). Anschließend setzt Poletto die Kochaktivitäten mit ihrem Gast fort und richtet ihre visuelle Aufmerksamkeit, während sie die Turnkonstruktionseinheit (Z. 2) beendet, auf das Kochgeschehen. Diese Orientierung hält sie auch während des Kommentars in der nächsten Turnkonstruktionseinheit (Z. 3) aufrecht. Durch die simultan zum kollektiven Anredepronomen sie (Z. 2) produzierte Kopfgeste wählt die Sprecherin aus dem komplexen Beteiligungsformat aus prominentem Gast, Studio- und Fernsehpublikum die kopräsenten Studiogäste als Adressaten ihres Versprechens aus. Wie in den zuvor analysierten Sequenzen

5.5 Zeigen mit anderen Körperteilen

177

zeichnet sich die Kopfgeste auch hier durch eine zur Schulter geneigte, seitliche Bewegung aus, durch die der Kopf ruckartig aus der vertikalen Körperachse in eine Schräglage gebracht und dann wieder mit der Körperachse aligniert wird. In den betrachteten Fällen ist eine vektorielle Präzision zur exakten räumlichen Lokalisierung nicht erforderlich. Wie zu sehen war, stellen Zeigende, wenn sie eine Kopfgeste ausführen, auch nicht vorab den Verweisraum her, um sich selbst zu orientieren, wie dies bei manuellen Zeigegesten der Fall ist. Einzige Ausnahme bildet das Zeigen mit dem Daumen, das hinsichtlich des multimodalen Ablaufformats und der Pragmatik einer nicht rein deiktischen, sondern zugleich anamnestischen Funktion dem Zeigen mit dem Kopf sehr verwandt ist.

5.5.2 Zeigen mit dem Blick Das Zeigen mit dem Blick tritt vor allem in Kontexten auf, in denen der Blick als alternatives Zeiginstrument zu den Händen gewählt wird, da diese entweder mit etwas anderem beschäftigt sind (etwas halten, tragen, einer manuellen Tätigkeit nachgehen etc.) oder da eine Zeige(finger)geste in der entsprechenden Situation als sozial unangemessen gelten könnte. Fälle, in denen die Hände nicht verfügbar sind, erfordern eine Neuverteilung der bei einer Zeigehandlung zu erfüllenden Funktionen auf die vorhandenen Ressourcen. Da die funktionale Umverteilung der Ressourcen aus der manuellen Beschäftigung der Hände resultiert, finden sich in den verwendeten Videokorpora die Belege dafür überwiegend im Subkorpus der Kochsendungen. Die Wahl des Blicks als Zeiginstrument anstelle der Hände bedeutet, dass der Blick als interaktive Ressource einen funktionalen Mehraufwand leisten muss. Zusätzlich zu den primär perzeptorischen Funktionen der Verweisraumherstellung, des Selbst- und Fremdmonitoring, der Wahrnehmung und der Wahrnehmungswahrnehmung übernimmt er auch noch die perzeptionssteuernden Funktionen der Suchraum- und der Zeigezielherstellung. Während die verschiedenen Funktionen beim manuellen Zeigen aufgrund der ressourcenspezifischen Arbeitsteilung simultan oder teilsimultan erfüllt werden können, macht das Zeigen mit dem Blick eine andere intra- und interpersonelle Koordinierung multimodaler Ressourcen und damit eine andere temporale Organisation der Parameter der Zeigehandlung erforderlich. Anders als beim manuellen Zeigen kann beim Zeigen mit dem Blick kein Selbstmonitoring des Zeiginstruments stattfinden. Anstelle eines Abgleichs zwischen der Raumposition des Zeigeziels und dem durch die Zeigegeste projizierten Richtungsvektor kann der Zeigende die Präzisionskontrolle ausschließlich im Akt des Zeigens selbst als simultanen Wahrnehmungsakt und damit als perzeptorischen Rückkoppelungsprozess vollziehen. Dabei sind theoretisch folgende zwei

178

5 Typologie des gestischen Zeigens

Möglichkeiten zu berücksichtigen, die bislang weder durch Videoanalysen noch durch Eyetracking-Studien empirisch unterschieden werden können: erstens die Möglichkeit, dass ein Zeigender im Akt des Zeigens mit dem Blick das Gezeigte zugleich wahrnimmt und folglich eine wahrnehmungsreiche Ostension mit dem Blick vollzieht; sowie zweitens die Möglichkeit, dass ein Zeigender das Gezeigte im Akt des Zeigens mit dem Blick nicht wahrnimmt bzw. perzeptorisch nicht fokussiert und folglich eine wahrnehmungsarme Ostension mit dem Blick vollzieht. Die Konzepte der wahrnehmungsreichen und der wahrnehmungsarmen Ostension mit dem Blick dienen als heuristische Instrumente, die eine fallweise Unterscheidung nicht nur zwischen zwei diskreten Aktivitäten des Wahrnehmens und Zeigens, sondern auch zwischen Aktivitäten ermöglichen, die auf einem Kontinuum zwischen Wahrnehmen, ostentativem Wahrnehmen und einem (mehr oder weniger mit Wahrnehmung verbundenen) Zeigen mit dem Blick angesiedelt sind. Die Unterscheidungen gründen in der Annahme, dass die Wahrnehmung um der Wahrnehmung willen, d. h. zur sensorischen Informationsgewinnung, und die ostentativ zur Fremdorientierung bzw. interpersonellen Koordinierung ausgeführte Wahrnehmung neuropsychologisch und neurophysiologisch unterschiedlich organisiert sind. Das erste Beispiel („Mandoline“, vgl. nächste Seite) aus einer Folge von „Polettos Kochschule“ steht an der Schnittstelle zwischen visueller Wahrnehmung und Zeigen mit dem Blick bzw. zwischen intrapersoneller und interpersoneller Koordinierung. Es konstituiert einen Fall, in dem en passant mit dem Blick gezeigt, dieser simultan aber auch zur Wahrnehmung eingesetzt wird. Poletto (PL) und ihr Gast, Tom Buhrow (TB), stehen in einem side-by-side-Arrangement hinter dem Kochtisch an einem Schneidebrett und bereiten Rote Bete vor. Mit einem change of activity-Marker (vgl. Stukenbrock 2010) beendet Poletto die Schneideaktivität (Z. 1: SO.) und projiziert den nächsten Handlungsschritt, indem sie mit der Kopulativkonjunktion und im Verbund mit dem akzentuierten proximalen Temporaldeiktikon JETZT (Z. 2) einen neuen Satz beginnt. Ihr Blick ist auf die eigenen Hände gerichtet (Abb. 1.1), die weiterhin mit der Roten Bete hantieren. Es folgt eine Pause, nach der Poletto neu ansetzt und mit der links herausgestellten Demonstrativkonstruktion dieses X da (Z. 3: °h dieses geRÄT da:;) ein Schneidegerät in den Fokus rückt, das ihr Gast in den Händen hält und dessen Fachbezeichnung zuvor bereits erwähnt wurde. Die Demonstrativkonstruktion hat an dieser Stelle sowohl eine indexikalitätsmarkierende als auch eine deiktische Funktion im engen Sinn. Zum einen signalisiert sie, dass ein zuvor bereits thematisierter Gegenstand erneut relevant gesetzt wird, und konstituiert damit den gemeinsamen Wissensgrund (shared common ground), auf den wenig später auch die Ausdrücke halt und tatsächlich (Z. 7) verweisen. Zum anderen fungiert sie als verbales Zeigmittel und verweist den Adressaten auf ein visuell wahr-

5.5 Zeigen mit anderen Körperteilen

179

Beispiel 1: „Mandoline“ (PK5_00:08:17)

1

PL:

SO. (-) Abbildung 1.1

2 3 4

TB:

und JETZT, (-) h [dieses ge [(

Abbildung 1.2

da:;] ) ]

Abbildung 1.3

5 6 7 8 9

PL: TB: PL: TB:

dieses

[ ] [dAs ist dann zum] (.) SCHAben; dAs nennt sich halt t hm_hm, achSO;

180

5 Typologie des gestischen Zeigens

nehmbares Zeigeziel im umgebenden Raum. Die Demonstrativkonstruktion wird in einer weiteren Linksherausstellung semantisch variiert (Z. 5: dieses MÖRdergerät,), wobei das Demonstrativum nun eine rein anaphorische Funktion hat, und dient als Bezugssubjekt der anschließenden Präsentativkonstruktion (Z. 7: dAs nennt sich halt tatsächlich mandoLIne,). Da Poletto während ihres gesamten Redezugs mit dem Schälen der Roten Bete beschäftigt ist, fallen die Hände als redebegleitendes Zeiginstrument weg. Doch auch für die Ressource Blick bedeutet die Notwendigkeit eines permanenten Selbstmonitoring der manuellen Aktivitäten eine Einschränkung des Zeitraums, in dem der Blick zum Zeigen eingesetzt werden kann. Folglich orientiert Poletto ihren Blick nur für einen kurzen Moment auf das Referenzobjekt, bevor sie ihre visuelle Aufmerksamkeit wieder auf ihre Hände richtet. Die kurzzeitige Orientierung des Blicks auf das Referenzobjekt (Abb. 1.2) erfolgt simultan zur Artikulation des Hauptakzents, der das referenzierende Lexem geRÄT (Z. 3) markiert. Ohne das für manuelle Zeigegesten typische Adressatenmonitoring zu vollziehen, für das im theoretischen Modell das Konzept des Kontrollblicks zur Wahrnehmungswahrnehmung eingeführt wurde (Kapitel 4.9), reorientiert Poletto sich sofort wieder auf die eigenen Hände (Abb. 1.3). In dieser Situation übt der Blick zwei Funktionen zugleich aus: Zum einen erfüllt er eine auf das Referenzobjekt bezogene Wahrnehmungs- bzw. Monitoringfunktion, die sich daraus erklärt, dass das Objekt nicht statisch im Raum platziert ist, sondern vom Interaktionspartner bewegt und manipuliert wird. Zum anderen übt der Blick eine auf das Referenzobjekt gerichtete Zeigefunktion aus, die den verbaldeiktischen Zeigeakt komplettiert. Die mit der Zeigefunktion zusammenhängende interpersonelle Koordinierung der Wahrnehmung manifestiert sich darin, dass auch der Adressat seinen Blick für einen kurzen Moment auf das Zeig objekt richtet (Abb. 1.3), bevor er sich wieder dem Geschehen auf dem Schneidebrett und seiner Interaktionspartnerin zuwendet. Da er das Gerät selbst in der Hand hält und dadurch einen privilegierten, objekttaktilen Zugang zum Zeigobjekt hat, erübrigt sich für ihn eigentlich die visuelle Selbstvergewisserung. Die Reorientierung seines Blicks ist daher als durch die Zeigehandlung der Sprecherin konditionell relevant gesetzte Folgehandlung und damit als Bestätigung der ostensiven Funktion ihres Blicks zu verstehen, der den Adressaten zur gemeinsamen Wahrnehmung einlädt. Das zweite Beispiel aus einer weiteren Folge von „Polettos Kochschule“ unterscheidet sich vom ersten vornehmlich dadurch, dass das Zeigen mit dem Blick durch eine begleitende Auf- und Abwärtsbewegung mit dem Kopf deutlich markiert wird. In der Sequenz „Zwiebeln und Schalotten“ stehen Poletto und ihr Gast gemeinsam hinter dem Kochtisch und sind damit beschäftigt, Zwiebeln und Schalotten zu hacken, die anschließend im Topf angedünstet werden

5.5 Zeigen mit anderen Körperteilen

181

sollen. Wie im vorherigen Beispiel markiert das side-by-side-Arrangement körperlich den Interaktions- und Wahrnehmungsraum, in dem sich die Zeigehandlung abspielt: Beispiel 2: Zwiebeln und Schalotten“ (PK6_00:04:46)

1 2 3

PL:

[SO; KNOblauch, schaLOTten, Abbildung 2.1

4

WUNderbar, Abbildung 2.3

5 6 7

EH: PL:

Abbildung 2.2

(-) Abbildung 2.4

h DIE kannst du auch [hier mit in den topf geben, [da REINwerfen? hm geNAU,

182

5 Typologie des gestischen Zeigens

Zu Beginn der Sequenz projiziert Poletto durch den change of activity-Marker SO (Z. 1), die Aufzählung (Z. 2–3) und die Bewertung (Z. 4: WUNderbar,) den Abschluss der Schneideaktivität und den Übergang zum nächsten Handlungsschritt. Dabei ist ihr Blick zunächst noch auf die eigenen Hände gerichtet (Abb. 2.1). In der anschließenden Mikropause reorientiert sie ihren Blick leicht zur Seite (Abb. 2.2) und stellt damit den Verweisraum und das künftige Zeigeziel her. Beim Einatmen und der anschließenden Artikulation des akzentuierten deiktischen Demonstrativpronomens DIE (Z. 5) bewegt sie ihren Kopf nach oben und richtet ihren Blick auf die zwischen ihr und ihrem Gast liegenden Zwiebelstücke. Der Gipfelpunkt der Kopfbewegung wird mit dem Onset des akzentuierten deiktischen Demonstrativpronomens DIE (Z. 5) erreicht (Abb. 2.3). Dann senkt Poletto den Kopf wieder und richtet ihren Blick erneut auf die eigenen Hände (Abb. 2.4). In dieser Sequenz übt neben dem Blick auch die Kopfbewegung eine wichtige Funktion aus. Durch die Kopfbewegung etabliert Poletto den Kopfbereich als relevante Ausdrucksressource. Das eigentliche Zeiginstrument, das den Vektor projiziert, stellt jedoch der Blick dar. Der direkt auf das Zeigeziel gerichtete Blick konstituiert einen Vektor, der die nötige Präzision zur Selektion des Zeigeziels aus dem komplex strukturierten Suchraum des Schneidebretts besitzt. Die überlappende Frage der Interaktionspartnerin dokumentiert, dass diese nicht nur erfolgreich das Zeigeziel und den Referenten herstellt, sondern auch den nächsten Arbeitsschritt in Form einer an sie ergehenden Arbeitsanweisung antizipiert (Z. 6: da REINWerfen?). In den überlappenden Äußerungen des nächsten Arbeitsschritts greifen die beiden Sprecherinnen auf unterschiedliche Lokaldeiktika zurück, um den Zielort der Handlung zu benennen. Zugleich verzichten beide auf eine gestische Zeigehilfe, da sie mit dem Einsammeln der Zwiebelschnitze beschäftigt sind, und richten ihre visuelle Aufmerksamkeit ganz auf die eigenen Hände. Während Poletto das proximale Lokaldeiktikon hier (Z. 5) verwendet, um den Topf zu lokalisieren, der etwas abseits auf der Herdplatte steht, benutzt Habermann in Bezug auf denselben Referenten das neutrale Lokaldeiktikon da (Z. 6), das der Tatsache Rechnung trägt, dass sich der Topf nicht in unmittelbarer Reichweite befindet. Allerdings setzt Poletto sich unmittelbar darauf in Bewegung und läuft mit den zerhackten Zwiebeln in der Hand an den indizierten Ort. Das proximale Deiktikon wird an dieser Stelle folglich nicht gebraucht, um faktische räumliche Nähe, Reichweite bzw. unmittelbare Zugänglichkeit zu reklamieren, sondern um diese zu antizipieren und damit die körperliche Bewegung zu projizieren, die beide unternehmen müssen, um die nächste Handlung auszuführen. In der nächsten Sequenz („Streifen“) wird der Blick in markanter Weise als Ressource eines forcierten Zeigens eingesetzt. In dem Ausschnitt aus einer weiteren Sendung hat Poletto den Kochbereich verlassen und ist ins Publikum gegangen,

5.5 Zeigen mit anderen Körperteilen

183

um dort ein Schneidebrett mit Zwiebeln abzuholen, die ein Studiogast in Streifen schneiden sollte. Das Resultat des Zwiebelschneidens veranlasst Poletto zu einer längeren Bearbeitungssequenz, in der die von dem Studiogast abgelieferten Zwiebelstücke einer eingehenden Betrachtung und Bewertung unterworfen werden. Poletto steht im Zuschauerraum unmittelbar vor der ersten Zuschauerreihe bei einem ihrer Gäste, der Zwiebeln für sie geschnitten hat. Als sie das Schneidebrett mit den Zwiebeln entgegennimmt, richtet sie den Blick zunächst auf den Studiogast (Abb. 3.1). Zu Beginn ihrer Äußerung blickt sie zurück auf das Schneidebrett (Abb. 3.2). Der Blick verweilt über den gesamten Zeitraum vom Beginn der Frage (Z. 1), über die erste Pause (Z. 2), die anschließende deiktische Zeigehandlung (Z. 3) und die zweite Pause (Z. 4) hinweg ununterbrochen auf den Zwiebeln. Hinzu kommt, dass Poletto simultan zur Artikulation des akzentuierten Demonstrativpronomens DAS (Z. 1) ihren Oberkörper weiter über das Brett beugt (Abb. 3.3) und damit ein gesteigertes Maß an visueller Aufmerksamkeitzuwendung dokumentiert. Dadurch inszeniert sie das in der Frage zum Ausdruck gebrachte und prosodisch markierte Erstaunen auch körperlich: Beispiel 3: „Streifen“ (PK4_00:18:06) Abbildung 3.1

Abbildung 3.2

1

PL:

Abbildung 3.3

was ist DAS denn; Abbildung 3.4

Abbildung 3.5

184

5 Typologie des gestischen Zeigens

1 was Beispiel 3 PL: (Fortsetzung)

ist DAS denn;

Abbildung 3.4

2 3 4 5

Abbildung 3.5

(1.7) also DAS: (.) HI:ER, (1.2) sind laut (.) definition dieses jungen mAnnes strEIfen.

Poletto zeigt, während sie das Schneidebrett in den Händen hält, mit dem Blick auf die Zwiebelstücke, die laut Arbeitsauftrag eigentlich Streifen hätten sein sollen. Doch wird der Blick hier nicht nur zum Zeigen auf ein Wahrnehmungsobjekt, sondern auch zum Anzeigen des durch die Wahrnehmung ausgelösten Kognitionsprozesses (körperlich-visuelles change of state token, vgl. zu verbalen change of state token Heritage 1984) und des dazugehörigen Erstaunens eingesetzt. Das Erstaunen wird dadurch inszeniert, dass der Blick länger auf dem Objekt verweilt als eine einfache Wahrnehmungs- und/oder Zeigehandlung erfordern würde. Er fungiert nicht nur als Index, sondern auch als Symptom. Zentral dafür, dass der Blick auch als Ausdruck ungläubigen Erstaunens verstanden wird, sind die Temporalitätsstrukturen: die weit über die zum Zeigen notwendige Zeit hinausgehende Verweildauer des Blicks auf dem zu betrachtenden Objekt. Ohne den Gast ein weiteres Mal anzuschauen, hält Poletto die visuelle Orientierung auf die Zwiebeln aufrecht, während sie das Schneidebrett wieder auf der Tischplatte abstellt (Abb. 3.4) und dann erneut hochnimmt, um es in den Aufmerksamkeitsfokus des Studiopublikums und der Fernsehkamera zu heben (Abb. 3.5). Parallel dazu beginnt sie mit dem Reformulierungsindikator (Gülich und Kotschi 1987) also (Z. 3) eine neue Turnkonstruktionseinheit und berührt, während sie das nachfolgende deiktische Demonstrativpronomen DAS: (Z. 3) artikuliert, mit der linken Hand einige Zwiebelstücke auf dem Schneidebrett (Abb. 3.5). Auf diese Weise wird das Zeigen mit dem Blick an sequenziell späterer Stelle durch eine objekttaktile Zeigegeste ergänzt.

5.5 Zeigen mit anderen Körperteilen

185

Im Gegensatz zum ersten Beispiel wird das Zeigen mit dem Blick hier nicht en passant vollzogen, sondern von der Sprecherin mit einer Dokumentation ihrer Überraschung verbunden, das die Abweichung des Resultats von der mit dem erteilten Arbeitsauftrag verbundenen Erwartung markiert und dadurch als implizite Negativbewertung (negative assessment) fungiert. Da ihre Dokumentation nicht allein an den Zwiebel schneidenden Studiogast adressiert ist, sondern für die Studio- und Fernsehzuschauer eigens inszeniert wird, unterscheidet sich diese Sequenz vom zweiten Beispiel, in welchem das Zeigen mit dem Blick zwar durch eine Kopfbewegung zusätzlich hervorgehoben wurde, funktional jedoch ausschließlich eine an die unmittelbare Interaktionspartnerin adressierte deiktische Orientierungshandlung darstellte. Das vierte Beispiel („Wagner“) stammt aus dem Subkorpus der Stadtführungen. Der Interaktionsraum wird durch die um die Stadtführerin herum stehenden Gruppenmitglieder hergestellt. In der Sequenz hält die Stadtführerin vor ihrem Oberkörper eine photographische Reproduktion des Opernhauses hoch und zeigt im Verlauf ihrer Ausführungen mit dem Blick auf das Bild. Wie in den Beispielen aus dem Kochkorpus sind ihre Hände mit einer anderen Tätigkeit, dem Hochhalten des Demonstrationsobjekts, beschäftigt. Mit dem Beginn einer neuen Turnkonstruktionseinheit etabliert die Stadtführerin den Komponisten Wagner als Thema (Z. 1). Dabei ist ihr Blick zunächst auf die Gruppe (Abb. 4.1) gerichtet. Im Verlauf der zweiten Turnkonstruktionseinheit (Z. 2), die das proximale Lokaldeiktikon hIer enthält, zeigt sie mit dem Blick auf das Bild (Abb. 4.2). Dabei läuft der zeigende Blick der Artikulation des Lokaldeiktikons deutlich voraus. Er wird simultan zum Modalverb wollte (Z. 2) auf das Bild Beispiel 4: „Wagner“ (StFLing1_00:32:15) Abbildung 4.1

1

SF:

WAGner ist gekommen, Abbildung 4.2

Abbildung 4.3

186

5 Typologie des gestischen Zeigens

1 WAGner ist gekommen, Beispiel 4 SF: (Fortsetzung) Abbildung 4.2

2

Abbildung 4.3

und wollte hIer machen,

(Abb. 4.2) und anschließend sofort wieder auf die Adressaten gerichtet (Abb. 4.3). Das Zeigen mit dem Blick löst in dieser Turnkonstruktionseinheit die potenzielle Ambiguität des Lokaldeiktikons hier auf, das sich unspezifisch auf die Stadt Bayreuth als Aufenthaltsort der Teilnehmer zum Äußerungszeitpunkt oder, wie der Blick auf das Bild indiziert, auf das abgebildete Opernhaus und damit auf einen Ort beziehen kann, an dem sich die Interaktionsteilnehmer zum Äußerungszeitpunkt nicht befinden. Eine weitere Gruppe, in denen mit dem Blick oder mit einer Kopfgeste gezeigt wird, stellen Fälle dar, in denen kopräsente Personen das Zeigeziel bilden. Dabei ist zwischen dem Zeigen auf Dritte und dem Zeigen auf den Adressaten zu unterscheiden (vgl. zur Personendeixis ausführlich Kapitel 7.1). In der Sequenz „Hans und Mehmet“ (vgl. nächste Seite) aus „Polettos Kochschule“ weist Poletto zuerst mit einer Zeigefingergeste auf einen im Publikum sitzenden Gast, den sie als Hans identifiziert, und zeigt anschließend mit dem Blick auf einen weiteren Gast, den sie als Mehmet identifiziert. An der Sequenz lassen sich kontrastiv einige Besonderheiten des Zeigens mit dem Blick gegenüber manuellen Zeigegesten verdeutlichen. Wie das Modell für die Parameter der Zeigehandlung voraussagt, konstituiert die Zeigende zunächst mit dem Blick für sich selbst perzeptorisch die Verweisräume, bevor sie die Zeigegesten produziert. Abbildung 5.1 hält den Moment fest, in welchem Poletto perzeptorisch den Verweisraum für die zweite Zeigegeste herstellt. Demgegenüber repräsentiert Abb. 5.2 den Moment, in dem sie sich auf den Verweisraum für die unmittelbar folgende erste Zeigegeste orientiert. Anschlie-

5.5 Zeigen mit anderen Körperteilen

187

Beispiel 5: „Hans und Mehmet“ (PK6_00:12:03) Abbildung 5.1

1

PL:

im ALler

ten notfall-

ich WEISS schon,

2

Abbildung 5.3

3 4

Abbildung 5.2

PU:

Abbildung 5.4

dass DAS da vorne HANS ist, ne? ((lacht))

ßend vollführt Poletto die Zeigefingergeste, die simultan zum akzentuierten deiktischen Demonstrativpronomen DAS (Z. 3) mit einem Baton versehen (Abb. 5.3) und dann eingefroren wird, während sie sich auf ihre Interaktionspartnerin orientiert (Abb. 5.4) und ein Adressatenmonitoring vornimmt. Der bei manuel-

188

5 Typologie des gestischen Zeigens

Beispiel 5 (Fortsetzung) Abbildung 5.5

5 6

PL: EH:

und DA[S', [und HANS kann das AU:CH? Abbildung 5.6

7

Pol:

Abbildung 5.7

DAS ist MEHmet,

len Zeigegesten systematisch an dieser Sequenzposition eingesetzte Blick stellt den Kontrollblick zur Wahrnehmungswahrnehmung dar (vgl. Kapitel 4.9). Zwar ist aus schnitttechnischen Gründen die Reaktion der Adressatin an dieser Stelle nicht zu sehen. Allerdings fungiert die Kamera gewissermaßen als Teilnehmerauge und stellt, indem sie den indizierten Gast in Großaufnahme repräsentiert, für das Fernsehpublikum das Zeigeziel her. Um im nächsten Schritt auf den zweiten Gast zu zeigen, setzt Poletto anstelle einer manuellen Zeigegeste den Blick als Zeiginstrument ein, da ihre Hände mitt-

5.5 Zeigen mit anderen Körperteilen

189

lerweile wieder mit Kochaktivitäten beschäftigt sind. Im Unterschied zur ersten Geste gestaltet sich das multimodale Ablaufformat dabei wie folgt: Nachdem Poletto ihren Blick zwischenzeitlich auf die eigenen Hände gerichtet hat und damit beschäftigt ist, Wurststückchen in eine Pfanne zu geben (Abb. 5.5), stellt sie, kurz nachdem sie das akzentuierte deiktische Demonstrativpronomen DAS (Z. 7) artikuliert hat, mit dem Blick das zweite Zeigeziel her (Abb. 5.6). Verbales und körperliches Zeigen fallen hier also temporal leicht auseinander. Durch die Notwendigkeit, die Aktivitäten der eigenen Hände visuell wahrzunehmen, kommt der Blick verzögert und dann auch nur sehr kurz als Zeiginstrument zum Einsatz. Er kehrt unmittelbar zu den manuellen Aktivitäten zurück (Abb. 5.7). Im Gegensatz zum manuellen Zeigen, bei dem Adressatenmonitoring teilsimultan zu einer eingefrorenen Zeigegeste vollzogen werden kann, fällt der Kontrollblick zur Wahrnehmungswahrnehmung beim Zeigen mit dem Blick weg. Die Simultaneität von Zeigen und Wahrnehmungswahrnehmung ist beim Zeigen mit dem Blick – ausgenommen beim Zeigen auf den Adressaten – unmöglich. Im Gegensatz zu den vorherigen Beispielen, in denen das Zeigen mit dem Blick glückt, führt das letzte Beispiel („Schaumkelle“, vgl. Folgeseiten) abschließend die kommunikativen Risiken vor, die die funktionale Redistribution der Ressourcen beim Zeigen mit dem Blick birgt. Die Sequenz stammt aus einer Folge von „Polettos Kochstudio“. Poletto und ihr Gast, Ingo Naujoks (IN), bereiten Gnocchi zu. Während ein Teil davon bereits in einem Topf mit Wasser kocht, formt Naujoks weitere Gnocchi, und Poletto kratzt Kartoffeln für den Gnocchiteig aus. Beide sind folglich in unterschiedliche manuelle Tätigkeiten involviert. Im weiteren Verlauf gibt Poletto ihrem Gast einen Arbeitsauftrag, der mit zwei deiktischen Lokalisierungshandlungen verbunden ist, die sie aufgrund ihrer manuellen Beschäftigung mit dem Blick ausführt. Sie bittet ihren Gast, eine Schaumkelle aus dem hinteren Bereich der Küche zu holen (Z. 3) und auf den Kochtisch zu legen (Z. 5). Ihr Blick ist zunächst auf die eigenen Hände gerichtet (Abb. 6.1), mit denen sie gekochte Kartoffeln auskratzt. Um ihren Adressaten auf den Raum zu orientieren, in dem die Schaumkelle zu finden ist, setzt sie den Kopf bzw. Blick als deiktisches Zeiginstrument ein und dreht sich mit dem Kopf nahezu 180 Grad nach hinten um. Oberkörper und Hände halten weiterhin den Aktivitätsraum aufrecht, in dem sie mit Kartoffelauskratzen beschäftigt ist (Abb. 6.2). Als sie den lokaldeiktischen Ausdruck da hinten (Z. 3) artikuliert, kehrt ihr Blick bereits wieder zu den eigenen Händen zurück (Abb. 6.3). Inzwischen hat sich ihr Adressat umgedreht und ist dabei, den Suchraum und innerhalb des Suchraums das Zeigeziel herzustellen (Abb. 6.3). Wie in den vorherigen Beispielen bleibt der Kontrollblick zur Wahrnehmungswahrnehmung aus. Der beim Zeigen mit dem Blick systematisch zu beobachtende Verzicht auf ein Adressaten-

190

5 Typologie des gestischen Zeigens

Beispiel 6: „Schaumkelle“ (PK2_00:14:46)

01 02

IN: PL:

also die Erste gnocchi schwimmt [Oben, [ja SUper; Abbildung 6.1

Abbildung 6.2

dann [kannst du ma ne' (.) SCHAUMkelle da

03

Abbildung 6.3

04

IN:

hinten nehmen, [die hat den test beSTANden;

monitoring führt dazu, dass die Zeigende nicht bemerkt, dass ihr Adressat das Zeigeziel nicht herstellen kann. Sein Suchprozess dauert noch an, als Poletto zum zweiten Mal mit dem Blick zeigt (Abb. 6.4). Doch weder nimmt er ihren zweiten Zeigeakt wahr, noch nimmt sie wahr, dass er sie nicht wahrnimmt (vgl. die divergierenden Blickorientierungen der beiden in Abb. 6.4). Wie beim ersten Zeigeakt läuft der zeigende Blick dem Gebrauch des Verbaldeiktikons, in diesem Fall des proximalen Lokaladverbs

5.5 Zeigen mit anderen Körperteilen

191

Beispiel 6 (Fortsetzung) Abbildung 6.4

05 06 07 08 09 10 11 12 13

PL: IN: PL: IN: IN: PL:

Abbildung 6.5

und dann legst du die HIER auf das BRETT, und dann proBIEren wir mal ob [(...) [SCHRAUBkelle? ja, (0.8) hm_hm, (0.8) wo sOll [ich hier denn jetzt die FINden die schraubkelle;] [ma GUCK' ma GUCKen ]

HIER (Z. 5), erneut weit voraus. Bei beiden Zeigeakten ist die temporale Spannweite zwischen der verbaldeiktischen und der gestischen Zeigekomponente so groß, dass diese sich kaum noch wechselseitig relevant setzen und die Aufmerksamkeit des Adressaten koordiniert steuern können. Auch nach dem zweiten Zeigeakt verzichtet die Zeigende wieder auf ein Adressatenmonitoring. Anstelle des Kontrollblicks zur Wahrnehmungswahrnehmung richtet sie ihren Blick sofort wieder auf die eigenen Hände (Abb. 6.5). So entgeht ihr die körperliche Dokumentation der Ratlosigkeit, die ihr Interaktionspartner durch seine hilflos-inaktive Körperpositur und den schräg nach oben gerichteten Blick zum Ausdruck bringt (Abb. 6.5). Diese können als kinesische Reparaturinitiierung verstanden werden. Erst als Poletto einen weiteren Handlungsschritt ankündigt (Z. 6: und dann proBIEren wir mal ob), fremdinitiiert ihr Interaktionspartner eine Reparatur, indem er in Überlappung mit ihrem unabgeschlossenen Redezug eine Rückfrage

192

5 Typologie des gestischen Zeigens

stellt (Z. 7: SCHRAUBkelle?). Es folgt eine komplexe multimodale Reparatur sequenz, in der unterschiedliche Probleme sequenziell bearbeitet werden. Sie führt dazu, dass Poletto ihren ersten Zeigeakt mit einer manuellen Zeigegeste wiederholt und den zweiten Zeigeakt ganz aufgibt, da sie die Schaumkelle schließlich selbst holen muss.

5.5.3 Grenzfälle Zum Abschluss des Kapitels über das Zeigen mit anderen Körperteilen soll ein typologisch problematischer Fall betrachtet werden, der verdeutlicht, dass die Grenzen zwischen dem Zeigen mit dem Kopf und dem Zeigen mit dem Blick nicht immer trennscharf zu ziehen sind, da beide Zeigweisen auch als Ausdruckseinheit auftreten und unter Umständen weitere Komponenten enthalten können, die ebenfalls als Kandidaten für die Projektion eines räumlichen Vektors in Frage kommen. Im vorliegenden Fall betrifft dies das Kinn der Zeigenden. Das Beispiel stammt aus „Polettos Kochschule“. In der Sequenz schlägt Poletto ihrem Gast, Heide Simonis (HS), vor, das Zwiebelschneiden ans Publikum abzugeben, und weist dabei mit einer ruckartigen Kopfbewegung, bei der sich zugleich das Kinn hebt, auf die Zuschauerreihen. Zudem orientiert sie auch ihren Blick in die entsprechende Richtung: Beispiel 7: „die da“ (PK4_00:12:32)

1 2

HS:

jetzt erWARten sie von mirdass ich die ZWIEbel schneide; ne? Abbildung 7.1

3

PL:

Abbildung 7.2

=sollen_wir das ABgeben?= Abbildung 7.3

3

5.5 Zeigen mit anderen Körperteilen

PL:

193

=sollen_wir das ABgeben?=

Beispiel 7 (Fortsetzung)

Abbildung 7.3

4

=an: (.) an DIE [da?

Die Interaktionspartnerinnen stehen in einem side-by-side-Arrangement dicht nebeneinander hinter dem Herd. Während Simonis den rechten Arm auf den Arbeitstisch gestützt und den linken Arm auf halber Höhe vor dem Bauch angewinkelt hat, stützt Poletto sich mit beiden Armen rechts und links von ihrem Körper auf der Arbeitsplatte ab. Als Simonis die Annahme äußert, dass sie von Poletto nun den Arbeitsauftrag des Zwiebelschneidens erhalten wird (Z. 1–2), formuliert Poletto mit schnellem Anschluss den Vorschlag, diese unangenehme Aufgabe zu delegieren (Z. 3: sollen_wir das ABgeben?), ohne jedoch den durch ein Dativobjekt zu bezeichnenden Rezipienten zu nennen. Stattdessen produziert sie mit dem Kopf eine Zeigegeste in Richtung Studiopublikum. Verbal wird der Rezipient erst im rechtsversetzten Nachsatz (Z. 4: an: (.) an DIE da?) durch das deiktische Demonstrativpronomen DIE in Kombination mit dem Lokaldeiktikon da angegeben. Zu diesem Zeitpunkt ist die Kopfgeste bereits ausgeführt worden. Die körperliche Zeigehandlung läuft dem verbalen Zeigeakt weit voraus und ist nicht nur temporal, sondern auch semantisch-pragmatisch in die Frage (Z. 3) integriert, für die sie das Dativobjekt liefert. Der körperliche Zeigeakt vollzieht sich wie folgt: Zu Beginn der ersten Turnkonstruktionseinheit dreht Poletto ihren Kopf über die rechte Schulter in Richtung ihrer Interaktionspartnerin und blickt sie an (Abb. 7.1), während diese ihren Blick nach unten gerichtet hat. Simultan zur Artikulation des Hauptakzents, der das Vollverb (Z. 3: ABgeben) und damit die Handlung in den Fokus rückt, wendet Poletto ihren Kopf leicht von der Partnerin ab und orientiert sich schräg geradeaus in Richtung Publikum. Im Verbund mit dieser Drehbewegung vollzieht sie eine ruckartige Auf- und Abwärtsbewegung mit dem Kopf. Gleichzeitig richtet

194

5 Typologie des gestischen Zeigens

sie auch ihren Blick in Richtung Studiopublikum (Abb. 7.2). Während der Kopf zu Beginn der nächsten Turnkonstruktionseinheit wieder in Normalposition gebracht wird, bleibt der Blick auf das Publikum gerichtet (Abb. 7.3) und hält den Verweisraum für das Demonstratum aufrecht, das in der Rechtsversetzung verbaldeiktisch hergestellt wird (Z. 4: an: (.) an DIE da?). Die Zeigehandlung vollzieht eine personendeiktische Referenz auf die dritte Person Plural (vgl. zur Personendeixis Kapitel 7.1). Das Personalpronomen wird gestisch gebraucht und benötigt daher eine visuelle Zeighilfe. Diese ist im vorliegenden Fall syntaktisch in die vorherige Turnkonstruktionseinheit integriert und läuft damit dem verbaldeiktischen Zeigeakt zeitlich voraus. Die visuelle Zeighilfe besteht in einer vertikalen Kopfbewegung, bei der auch das Kinn ruckartig angehoben und gesenkt wird, so dass sich die Frage stellt, ob es sich nun um ein Zeigen mit dem Kopf, mit dem Blick oder mit dem Kinn handelt. Die vollzugsrekonstruktive Mikroanalyse ergibt folgendes Bild: Durch die ruckartige Bewegung wird für den Adressaten die perzeptorische Salienz des Kopfbereichs der Zeigenden erhöht und dieser Teil des Körpers als wahrzunehmende Ausdrucksressource relevant gesetzt. Das angehobene und leicht vorgeschobene Kinn liefert einen Richtungsvektor, der durch einen zweiten Richtungsvektor ergänzt wird. Dieser wird durch den Blick konstituiert, der nicht allein der perzeptorischen Selbst orientierung der Zeigenden, sondern auch der Fremdorientierung der Adressaten dient. Beide, Kinn und Blick, fungieren damit als komplementäre Zeiginstrumente. Doch während der erste, von der Kopf- und Kinnorientierung ausgehende Vektor lediglich zum Zeitpunkt der kurzen, ruckartigen Bewegung aktiv ist, wird allein der zweite, durch den Blick hergestellte Richtungsvektor im Verlauf des verbaldeiktischen Zeigeakts aufrechterhalten. Kopf und Kinn hingegen werden wieder in Normalposition gebracht.

Zusammenfassung In den vorherigen Abschnitten wurden Zeigweisen untersucht, in denen anstelle manueller Gesten andere Körperteile zum Zeigen benutzt werden. Als systematisch auftretende und daher als konventionalisiert zu betrachtende Zeigweisen wurde das Zeigen mit dem Kopf und das Zeigen mit dem Blick betrachtet. Wie die zum Schluss analysierte Sequenz (Beispiel 7: „die da“) belegt, gibt es Grenzfälle, in denen beide Zeigweisen in Kombination auftreten und unter Umständen weitere Kandidaten wie das Kinn als vektoriell projizierende Zeiginstrumente eine Rolle spielen. Auch wenn die beiden Zeigweisen nicht immer trennscharf voneinander zu unterscheiden sind, haben sich folgende formale und funktionale Parameter als wichtige Differenzierungskriterien ergeben: Erstens ist der direktionale Vektor,

5.5 Zeigen mit anderen Körperteilen

195

der durch eine richtungsweisende Kopfbewegung produziert wird, anders zu ex trapolieren als der aus einer ostensiven Blick- bzw. Augenausrichtung zu errechnende Vektor. Während im ersten Fall die Richtung der ruckartig ausgeführten Kopfbewegung den Vektor ergibt, den es auf Suchraum und Zeigeziel hin zu verlängern gilt, basiert die Suchraum- und Zeigezielherstellung im zweiten Fall auf dem Mechanismus des eye gaze following (Flom et al. 2007). Ein weiterer Unterschied besteht darin, dass beim Zeigen mit dem Kopf der Blick der Zeigenden häufig nicht der durch die Kopfgeste indizierten Richtung folgt, sondern auf den Adressaten gerichtet bleibt oder für einen kurzen Moment abschweift, ohne dabei jedoch auf das Zeigeziel gerichtet zu werden. Die von der Blickorientierung losgelöste Kopfbewegung und umgekehrt der von der Kopf orientierung losgelöste Blick stellen das trennschärfste Kriterium zur Unterscheidung zwischen dem Zeigen mit dem Kopf und dem Zeigen mit dem Blick dar. Werden Blick oder Kopf zum Zeigen auf kopräsente Personen verwendet, eignet sich die Kopfgeste funktional besser zur Auswahl eines Kollektivs. Demgegenüber erfordert die Auswahl einer einzelnen Person einen präzisen, punktuell ausgerichteten Vektor, weshalb in diesen Fällen mit dem Blick gezeigt wird. Für beide Formen des Zeigens gilt, dass sie sich als alternative Realisierungsformate eignen, wenn die Hände mit etwas anderem beschäftigt sind. Doch anders als die globale, räumlich weniger präzise Kopfgeste ermöglicht nur das Zeigen mit dem Blick ein punktuelles Lokalisieren und Identifizieren und ist daher eher als funktionales Äquivalent zur Zeigefingergeste zu betrachten als die räumlich wenig präzise Kopfgeste. Diese besitzt eine funktionale Nähe zur Daumengeste und wird wie diese insbesondere in Kontexten verwendet, in denen ein grundsätzlich bereits zugänglicher Referent durch eine räumliche Verankerung zusätzlich kontextualisiert wird. Das Zeigen mit dem Blick birgt kommunikative Risiken, die dadurch entstehen, dass eine Redistribution der in der Zeigehandlung interaktiv zu bewältigenden Aufgaben auf die zur Verfügung stehenden Ressourcen vorgenommen werden muss. So steht der Blick in dem Augenblick, in dem er zur Ausführung des Zeigeakts eingesetzt wird, für andere zentrale Aufgaben (Adressatenmonitoring, interpersonelle Koordinierung, Wahrnehmung, Wahrnehmungswahrnehmung) nicht zur Verfügung. Die umfangreichen Reparaturen, die im sechsten Beispiel („Schaumkelle“) beim Zeigen mit dem Blick erforderlich wurden, belegen diese Problematik. Sie sind zugleich ein Nachweis dafür, dass das multimodale Gesamtformat der Zeigehandlung flexibel und kontextsensitiv ist, aber auch systematische Präferenzbeziehungen zwischen Funktionen und Ressourcen besitzt, die im default-Fall realisiert werden.

196

5 Typologie des gestischen Zeigens

5.6 Zeigen mit Objekten Wie im vorherigen Kapitel zu sehen war, greifen Zeigende neben manuellen Zeigegesten in bestimmten Situationen alternativ auf das Zeigen mit dem Blick oder mit dem Kopf zurück. Dies geschieht insbesondere dann, wenn die Hände mit etwas anderem beschäftigt sind. In einer Reihe von Fällen ist darüber hinaus festzustellen, dass Zeigende auch mit der Hand zeigen, die bereits einen Gegenstand hält und dadurch keine der für das Zeigen konventionalisierten Handformen einnehmen kann. Aus der Beobachtung, dass Zeigende, wenn sie in manuelle Tätigkeiten involviert sind, einerseits auf das Zeigen mit dem Blick bzw. Kopf rekurrieren und andererseits mit einem in der Hand befindlichen Gegenstand zeigen, ergibt sich die Frage, wann Zeigende sich jeweils für die eine oder andere Variante entscheiden. Dabei ist zunächst systematisch zu differenzieren zwischen Zeigen mit Objekten, die wie der Zeigestock66 funktional auf das Zeigen spezialisiert sind, und Zeigen mit Objekten, die zu einem anderen Zweck konstruiert wurden und deren Normalgebrauch einer anderen Funktion dient. Hält der Zeigende einen auf das Zeigen spezialisierten Gegenstand in der Hand, stellt das Zeigen mit dem Blick oder mit dem Kopf keine Alternative dar. Ist er hingegen manuell mit einem anderen Objekt beschäftigt und folglich in eine Aktivität involviert, die mit dem Zeigen zunächst nichts zu tun hat, steht er vor der Wahl, das in der Interaktion entstehende Erfordernis gestischen Zeigens durch Beiseitelegen des Objekts, durch das Zeigen mit diesem Objekt oder durch das Zeigen mit dem Kopf bzw. Blick zu erfüllen. Um ad hoc zum Zeigen umfunktionalisiert werden zu können, muss die reguläre Funktion des entsprechenden Objekts für den Zeitraum der Zeigehandlung außer Kraft gesetzt werden. Beim Zeigen mit einem funktionsfremden Objekt entscheiden Größe, Gewicht und Mobilität, kurz, bestimmte physisch-materielle sowie situative Eignungsfaktoren des Gegenstands darüber, ob er zum Zeigen eingesetzt wird, ob der Zeigende alternativ auf das Zeigen mit dem Blick oder Kopf rekurriert oder ob er den Gegenstand beiseitelegt und seine manuelle Tätigkeit suspendiert, um eine Handgeste auszuführen.

66 Eine Definition des Zeigestocks in Wikipedia lautet: „Ein Zeigestock oder auch Zeigestab ist ein solider Holzstab mit einem sich zu einer Spitze verjüngenden Ende, der als eine Art Verlängerung des Zeigefingers zum manuellen Zeigen verwendet wird. Meistens wird er künstlich produziert. Herkömmliche Zeigestöcke sind einfache, lange, schlanke und oft auch biegsame Stöcke. Sie bestehen aus einem festen Material und sind dazu gedacht, beispielsweise Orte auf Karten oder Wörter auf Schultafeln durch Zeigen hervorzuheben, was immer noch gern in Klassenräumen getan wird.“

5.6 Zeigen mit Objekten

197

Im Folgenden werden Analysen zum Zeigen mit funktional spezifischen, körperfremden Zeiginstrumenten (Zeigestock), zum Zeigen mit Gegenständen, die funktional nicht auf das Zeigen spezialisiert sind, aber in funktionaler Beziehung zum Zeigobjekt und zu den darauf bezogenen Aktivitäten stehen, und zum Zeigen mit Gegenständen, die in einer kontingenten Beziehung zur Zeigehandlung stehen, durchgeführt. Die empirischen Analysen beginnen mit dem Fall, in dem mit einem funktional spezifischen, körperfremden Zeiginstrument gezeigt wird. Dessen Einsatz verdankt sich bestimmten Vorteilen, die der Gegenstand gegenüber einer manuellen Zeigegeste besitzt, insbesondere die größere vektorielle Präzision aufgrund des vielfach verlängerten Vektors. Im ersten Beispiel aus dem Korpus der Stadtführungen befindet sich die Stadtführerin mit ihrer Gruppe in einem Vorführraum und erklärt anhand eines dreidimensionalen historischen Modells der Stadt Bayreuth die zurückliegenden Stationen der Stadtführung. Da das Modell mehrere Meter groß und von einer Glasverkleidung seitlich umgrenzt ist, benutzt sie zur Verlängerung einen Zeigestock, durch den ihre Zeigegesten über die Glasverkleidung in den inneren Bereich des Modells hineinreichen: Beispiel 1: „Zeigestock“ (StFB2_00:24:40) Abbildung 1.1

Abbildung 1.2

Abbildung 1.3

198

5 Typologie des gestischen Zeigens

Beispiel 1 (Fortsetzung) Abbildung 1.4

02 03

Abbildung 1.5

dAs ist eben die (.) mAxstra MARKT, mit den drei BRUNnen,

oder der

Abbildung 1.6

Die Gruppe steht seitlich um das Modell herum, während die Stadtführerin sich an der Stirnseite postiert und einen Zeigestock in die Hand genommen hat (Abb. 1.1). Als sie die ankündigende Prä-Sequenz formuliert, bringt sie den Zeigestock über dem Modell in eine horizontale Position (Abb. 1.2) und projiziert damit eine bevorstehende Zeigehandlung am Modell. Am Ende der Turnkonstruktionseinheit senkt sie den Zeigestock ab, so dass die Spitze vertikal nach unten auf eine bestimmte, vom Modell repräsentierte Region gerichtet ist (Abb. 1.3). Simultan zur Artikulation des Demonstrativpronomens dAs (Z. 2), mit dem die nächste Turnkonstruktionseinheit beginnt, senkt sie den Zeigestock noch weiter ab und beginnt ihn in einer Linie über das Modell zu bewegen (Abb. 1.4–1.5). Die

5.6 Zeigen mit Objekten

199

Zeigegeste fährt der Strecke nach, die im Modell von der mAxstraße bzw. MARKT (Z. 2) bezeichneten Raumgegebenheit eingenommen wird. Zu der deiktischen Komponente tritt daher eine ikonische oder darstellende Komponente hinzu, die Streeck (2008) in Abgrenzung von verwandten gestischen Darstellungsformen als tracing bezeichnet. Die Stadtführerin beendet ihre Zeigehandlung, indem sie den Zeigestock über dem Modell wieder in eine waagerechte Position bringt, in beide Hände nimmt (Abb. 1.6) und schließlich auf ihre Seite hinter die Glasverkleidung zurückzieht. Als Nächstes werden Fälle analysiert, in denen der Gegenstand, mit dem ein Sprecher zeigt, in funktionaler Beziehung zum gezeigten Objekt steht bzw. Teil des Aktivitätsformats (activity framework) ist, innerhalb dessen die Zeigehandlung vollzogen wird. Dies gilt zum Beispiel für Stifte in einer Arbeitsbesprechung, Schraubenzieher im Zusammenhang mit Konstruktions- oder Reparaturarbeiten, Messer, Löffel, Gabeln etc. im Kontext von Kochaktivitäten. Da grundsätzlich mit allem gezeigt werden kann, was die räumliche Vektorbildung ermöglicht und die physisch-materiellen und situativen Eignungsbedingungen erfüllt, überschreitet die Fülle und Variationsbereite empirischer Möglichkeiten eine Klassifikation. Daher werden im Folgenden exemplarisch einige Fälle des Zeigens mit Gegenständen betrachtet, die in der unmittelbaren Aktivität, in die die Zeigehandlung eingebettet ist, zur Hand sind. In der Sequenz „ausdämpfen“ aus „Polettos Kochschule“ zeigt Poletto mit einer Schaumkelle auf einen Seiher, in den ihr Gast die in einem Topf kochenden Kartoffelstücke schöpfen soll. Durch die Zeigehandlung leitet Poletto nicht nur den nächsten Arbeitsschritt an, sondern führt ihrem Gast zugleich vor, wie und mit welchem Gerät er die Arbeitsanweisung umsetzen soll. Grund für das Zeigen mit der Schaumkelle ist in diesem Fall nicht, dass Poletto gerade selbst damit beschäftigt ist, sondern die Auswahl des Zeiginstruments verdankt sich der Tatsache, dass Poletto durch die Manipulation des künftigen Arbeitsinstruments nicht nur eine Zeigehandlung vollzieht, sondern zugleich den nächsten Arbeitsschritt initiiert: Beispiel 2: „ausdämpfen“ (PK3_00:06:58)

01 02 03 04 05 06 07 08

PL:

HIER schon mal eine SCHAUMkelle nehmen? (0.8) =also wIrklich kein geHEIMnis, (0.5) karTOFgesetzt- (.) MEHlig kochende kartoffeln; Abbildung 2.1

Abbildung 2.2

03 (0.8) 04 05 =also wIrklich kein geHEIMnis, 200 5 Typologie des gestischen Zeigens 06 (0.5) 07 karTOFgesetzt- (.) 08 MEHlig kochende kartoffeln; Beispiel 2 (Fortsetzung) Abbildung 2.1

09

(-)

in SALZwasserAbbildung 2.3

10

Abbildung 2.2

Abbildung 2.4

_wir HIER hineingeben, Abbildung 2.5

Abbildung 2.6

Poletto erteilt ihrem Gast, Ulrich Pleitgen (UP), in Gestalt eines Vorschlags (Z. 1: A:ber sie KÖNNten zum beispiel,) einen Arbeitsauftrag, der zunächst das Auffinden und Beibringen eines bestimmten Küchenutensils verlangt (Z. 2: HIER schon mal eine SCHAUMkelle nehmen?), das Poletto, während sie den ersten Teil des Vorschlags formuliert, selbst aus dem hinteren Bereich der Küche holt.

5.6 Zeigen mit Objekten

Beispiel 2 (Fortsetzung) 10

_wir HIER hineingeben,

Abbildung 2.5

Abbildung 2.6

n_bisschen AUS

11 12 13

201

UP:

kartoffelstampf machen.= =JA;

Die fortgesetzte Erläuterung des Arbeitsauftrags (Z. 4: und unsere VORgekochten kartoffelwürfel,) wird von mehrfach eingebetteten Parenthesen (Z. 5–9) unterbrochen, an deren Ende Poletto die Schaumkelle von der linken in die rechte Hand nimmt (Abb. 2.1) und damit die folgende Zeigehandlung kinesisch vorbereitet. In der Mikropause (Z. 9) setzt die mit der Schaumkelle vollzogene Zeigegeste ein (Abb. 2.2). Der Gestengipfelpunkt wird simultan zum Beginn der nächsten Turnkonstruktionseinheit erreicht (Abb. 2.3), in der zugleich die Erläuterungen zum Arbeitsauftrag wieder aufgenommen werden. Zu diesem Zeitpunkt befindet sich die Schaumkelle unmittelbar über einer Pfanne, wobei der Schöpfkelch bezeichnenderweise nicht in der Horizontalen, sondern in der Vertikalen positioniert ist (Abb. 2.3). Die Schaumkelle wird also zum Zeigen anders positioniert, als dies zur Ausübung ihrer eigentlichen Funktion erforderlich wäre. Auf diese Weise wird ihre ad hoc vollzogene Umfunktionalisierung zum Zeiginstrument auch visuell kontextualisiert. Simultan zur Artikulation des akzentuierten Lokaldeiktikons HIER (Z. 10) produziert Poletto eine zweite Zeigegeste mit der Schaumkelle, in diesem Fall auf den Topf mit den kochenden Kartoffelstücken (Abb. 2.4). Wie bei der ersten Zeigegeste befindet sich der Schöpfkelch dabei in der vertikalen Position. Der verbaldeiktisch bezeichnete und durch die Zeigegeste visuell angezeigte Ort

202

5 Typologie des gestischen Zeigens

stellt nun jedoch nicht den Zielort des vom Gast ausführenden Arbeitsauftrags, sondern den Ursprungsort der Kartoffelstücke dar. Nachdem Poletto den zweiten Zeigeakt vollzogen hat, legt sie die Schaumkelle in der Pfanne ab (Abb. 2.5). Damit setzt sie erneut den durch die erste Zeigegeste indizierten Zielort des vom Gast auszuführenden Arbeitsauftrags relevant. Im Unterschied zur vertikalen Positionierung bei der Handhabung der Kelle als Zeiginstrument befindet diese sich nun in der für ihre eigentliche Funktionsbestimmung zweckmäßigen horizontalen Position. Der Griff weist nach oben und bietet sich der Hand des Gasts zur Übernahme an, der danach greift (Abb. 2.6), ein bestätigendes Rückmeldesignal liefert (Z. 13: JA;) und den Arbeitsauftrag in der gewünschten Weise umzusetzen beginnt. Im nächsten Beispiel ist die Zeigehandlung eingebettet in einer Erkläraktivität, in der Poletto ihrem Adressaten, einem im Publikum (PU) sitzenden Studiogast (SG), nicht nur verbal, sondern unter Zuhilfenahme eines Messers gestisch die einzelnen Schritte des von ihm auszuführenden Arbeitsauftrags erklärt: Beispiel 3: „vorne weg“ (PK4_00:13:14)

01 02 03 04 05 06

PL:

SG: PU:

HIER;= =SIE sehen doch so aus, zwiebeln umgehen. (0.7)

((lacht)) Abbildung 3.1

07 08

PL: SG:

WURzel weg,

Abbildung 3.2

Abbildung 3.3

07 08

WURzel weg,

PL: SG:

5.6 Zeigen mit Objekten

203

Beispiel 3 (Fortsetzung)

Abbildung 3.2

09

Pol:

VORne weg, Abbildung 3.4

Abbildung 3.3

(-) Abbildung 3.5

10

halBIEren,

11

und Einfach in STREIfen schneiden.

Nachdem Poletto ins Studiopublikum gegangen ist, wählt sie einen Studiogast als Küchengehilfen zum Zwiebelschneiden aus (Z. 1–3), arrangiert die Utensilien vor ihm auf dem Tisch und beginnt, indem sie eine Zwiebel in Hand nimmt, mit ihren Erkläraktivitäten. Am Demonstrationsobjekt Zwiebel verdeutlicht sie, welche Teile der Zwiebel wie zu entfernen sind. Das Messer, das sie in der anderen Hand hält und das sie ihrem Adressaten wenig später für den Arbeitsauftrag übergeben wird, dient ihr dabei als Zeiginstrument. Simultan zu jeder einzelnen Instruktion zeigt sie mit dem Messer auf die entsprechende Stelle. Damit lokalisiert sie nicht nur die einzelnen Zwiebelstellen, sondern demonstriert durch die Positionierung des zeigenden Messers dessen professionelle Handhabung im Hinblick auf das zu schneidende Objekt.

204

5 Typologie des gestischen Zeigens

So zeigt sie, während sie die erste Instruktion WURzel weg (Z. 7) erteilt, mit dem Schneidemesser auf das eine Ende der Zwiebel (Abb. 3.1), und berührt, als sie das Lokaldeiktikon VORne (Z. 9) artikuliert, das aus der intrinsischen Orientierung der Zwiebel zu verstehen ist, mit Spitze und Schneidefläche des Zwiebelmessers das entsprechende Zwiebelende (Abb. 3.2). Anschließend dreht sie die Zwiebel in eine neue Position (Abb. 3.3), hält das Messer in einer zum Halbieren geeigneten Position über die Zwiebel (Abb. 3.4) und führt durch vertikale Auf- und Abwärtsbewegungen (Abb. 3.5) pantomimisch das streifenförmige Zerschneiden vor. Wie im Beispiel „ausdämpfen“ wird der für die manuelle Kochaktivität zu verwendende Gebrauchsgegenstand als Zeiginstrument in die Instruktion mit eingebaut.67 Das nächste Beispiel stammt aus dem Subkorpus „Kerners Köche“ (vgl. Folgeseiten). Kerner ist mit einem seiner Fernsehköche, Rainer Sass (RS), in fokussierter Interaktion. Die beiden stehen in einer L-Formation hinter dem Kochtisch. Der Koch nimmt ein Schälchen mit Chilisauce in die Hand und gibt eine Erläuterung zu Chilisaucen ab, in deren Verlauf er mit einem Löffel auf das Schälchen in seiner Hand zeigt. Nachdem der Koch mit einer Fokussierungsaufforderung die visuelle Aufmerksamkeit des Moderators erlangt hat (Abb. 4.1), der zuvor mit einem Fleck auf seinem Hemd beschäftigt war, beginnt der Koch mit seinen Erläuterungen zu Chilisaucen (Z. 6 ff.). Anlass dafür ist das Schälchen mit Chilisauce, das er in der Hand hält und durch eine deiktisch eingeleitete Präsentativkonstruktion (Z. 6: dAs ist GANZ normale chilisauce;) in den Aufmerksamkeitsfokus seines Adressaten rückt, der sich durch Rückfragen in die Erläuterungen (Z. 7–16) einmischt. Beispiel 4: „Chilisauce“ (KK_00:15:35)

01 02 03 04 05

RS:

KE:

pass AUF johann 5.6 Zeigen mit Objekten 03 04 jetzt geht=_s WIE[ter? 05 KE: [ja; Beispiel 4 (Fortsetzung)

205

Abbildung 4.1 KE

06 07 08 09 10 11 12 13 14 15 16

RS:

KE: RS:

KE:

RS

dAs ist GANZ normale chilisauce; die gI:bt es inzwischen in DREIhundert VIERhundert sorten; JE:der hat seine lieblingssor[te; [SCHARF?= [scharf (...)= =NEI::N, SCHARF- (-) rIch[tig SCHARF; [gut;= =ALles klar;

Schließlich kommt der Koch auf die konkrete Chilisauce zurück, die er selbst verwendungsfertig in der Hand hält, und thematisiert deren besondere Herkunft (Z. 17: und MEIne kommt aus BREmen;). Simultan zu dem akzentuierten Possessivpronomen MEIne (Z. 17) produziert er mit dem Löffel eine rhythmisierte Zeigegeste auf den Inhalt des Schälchens, wobei der Gipfelpunkt der Aufwärtsbewegung mit dem Hauptakzent (Abb. 4.2) und der Gipfelpunkt der Abwärtsbewegung mit der unbetonten Silbe (Abb. 4.3) synchronisiert ist (Abb. 4.2–4.3). Dabei richten der Sprecher und der Adressat ihre Blicke auf das Schälchen. Danach richtet der Sprecher seinen Blick auf den Adressaten (Abb. 4.4), der sich seinerseits kurz darauf auf den Sprecher orientiert und Blickkontakt mit ihm herstellt (Abb. 4.5), bevor er ein positives Rückmeldersignal gibt (Z. 18: JA:;).

206

5 Typologie des gestischen Zeigens

Beispiel 4 (Fortsetzung) Abbildung 4.2

17

RS:

und MEIne kommt aus BREmen; Abbildung 4.4

18

KE:

Abbildung 4.3

(-)

Abbildung 4.5

Löffel und Schälchen stehen hier in keiner willkürlichen Beziehung zueinander, sondern sind vom Koch ganz bewusst in Stellung gebracht worden. So taucht der Koch, nachdem er seine Ausführungen zu Chilisaucen im Allgemeinen und zu der von ihm präferierten Bremer Chilisauce beendet hat, den Löffel in das Schälchen und gibt einen Löffel Chilisauce zum Würzen in den Kochtopf. Der ad hoc zum Zeiginstrument umfunktionalisierte Gegenstand (Löffel) und das Demonstrationsobjekt (Schälchen) stehen in diesem Interaktionskontext in einer engen empraktischen Beziehung. Die zeigende Verwendung des Löffels macht dessen weitere Verwendung gemäß seiner eigentlichen Funktionsbestimmung im Umgang mit demselben Objekt in hohem Maß erwartbar.

5.6 Zeigen mit Objekten

207

Im Unterschied zu den beiden vorherigen Beispielen, in denen mit einem prospektiv benötigten Gegenstand an einem mit eben diesem Gegenstand zu bearbeitenden Demonstrationsobjekt gezeigt wurde, wird im nächsten Beispiel mit einem Gegenstand gezeigt, der in der vorausgehenden Handlung gebraucht wurde und anschließend zum Zeigen eingesetzt wird. In der zu analysierenden Sequenz bereiten Poletto und ihr Gast, Ulrich Pleitgen, einen Schmorbraten zu, der bereits in der Pfanne vor sich hin köchelt. Nachdem Poletto das Fleischstück mit einer Zange in der Pfanne gewendet hat, benutzt sie die Zange als Zeiginstrument, um die schwarze Fleischkruste in den Aufmerksamkeitsfokus zu rücken. Sie erläutert, was mit dem Braten weiter geschehen soll, und wendet parallel dazu das Stück Fleisch mit einer Zange in der Pfanne (Abb. 5.1). Nachdem sie den Braten gewendet (Abb. 5.2) und in der Pfanne zurechtgerückt hat (Abb. 5.3), zeigt sie mit der Zange auf die Oberseite des Bratens. Simultan zur Artikulation des Lokaldeiktikons hIer (Z. 5) markiert die Zange den oberen Teil der Bratenkruste (Abb. 5.4) und wird mit einer raschen Bewegung daran entlanggeführt (Abb. 5.5), bis simultan zum Temporaldeiktikon jetzt der untere Teil der Bratenkruste erreicht ist (Abb. 5.6). Nachdem Poletto mit der Zange noch einige rasche Auf- und Abwärtsbewegungen entlang der Bratenkruste gemacht hat, legt sie die Zange weg und wischt sich an einem Tuch die Hände ab. Damit ist die Sequenz beendet. Beispiel 5: „richtig schwarz geworden“ (PK3_00:15:58)

01 02

PL:

und jetzt lassen wir das EINfach, schmurgeln, (-) Abbildung 5.1

03

Abbildung 5.2

WENden noch einmal unser Abbildung 5.3

Abbildung 5.4

FLEISCH?

208

5 Typologie des gestischen Zeigens

03 WENden Beispiel 5 (Fortsetzung)

noch einmal unser

Abbildung 5.3

04 05

FLEISCH?

Abbildung 5.4

(0.9) und dAs ist hIer jetzt richtig SCHWARZ geworden; Abbildung 5.5

Abbildung 5.6

Im Gegensatz zu den bislang betrachteten Fällen, in denen mit Gegenständen gezeigt wurde, die in unmittelbarem praktischem Zusammenhang mit den gezeigten Objekten standen, ist der Zusammenhang zwischen den im Folgenden verwendeten Gegenständen und den Zeigobjekten vollkommen willkürlich. Für das Zeigen mit Gegenständen, die in keinem empraktischen Zusammenhang zum Zeigobjekt stehen, gibt es eine Reihe von Belegen, aus denen drei exemplarisch herausgegriffen und analysiert werden. Das folgende Beispiel ist dem Ende einer Folge von „Polettos Kochschule“ entnommen. Das Ziel, zwei verschiedene Sorten Gnocchi in der vorgegebenen Sendezeit zu kochen, ist kaum noch zu schaffen. Zur Verstärkung hat Poletto aus dem Studiopublikum eine Zuschauerin hinter den Kochtisch gebeten. Während diese dabei ist, sich auf die Kochaktivitäten vorzubereiten, zeigt Poletto mit einem Löffel auf eine der beiden Gnocchisorten und kommentiert deren fragwürdige Qualität:

5.6 Zeigen mit Objekten

209

Beispiel 6: „Hilfe“ (PK2_00:27:07)

01 02 03 04 05

IN:

PL:

waRUM du bei_mi_sieht das alles perFEKT aus, (1.2) [MEINST_du? Abbildung 6.1

06 07

IN: PL:

[aber Abbildung 6.2

08

(.) [ich nehm GERN hilfe an. ] [also die sind auf JEden-] Abbildung 6.3

ich glaub die sind zu WEICH;

6.4 zusammen mit der Zuschauerin Abbildunghinter 6.5 Poletto und ihrAbbildung Gast stehen dem Kochtisch. Nachdem die Zuschauerin begrüßt wurde und sich zum Händewaschen an die Spüle begeben hat, formuliert ihr Gast (IN) sein Unverständnis darüber, dass Poletto ihm zur Fertigstellung der zweiten Gnocchisorte zusätzliche Hilfe organisiert hat (Z. 1–3). Zugleich signalisiert er aber auch seine Bereitschaft die Hilfe anzunehmen (Z. 6).

210

5 Typologie des gestischen Zeigens

08 ich Beispiel 6 (Fortsetzung)

glaub die sind zu WEICH;

Abbildung 6.4

09 10 11 12

Abbildung 6.5

(0.5) also wEnn (.) ich wErd ja nicht geFRAGT; aber(-)

Poletto, die während der gesamten Sendung mit Naujoks’ selbstinszenierter, humorvoller Uneinsichtigkeit umgehen musste und ihrer Profirolle daher wenig Autorität und Geltung verschaffen konnte, wendet sich mit ihrer Bewertung der in Frage stehenden Gnocchi an die Zuschauerin. Mit dem Reformulierungsindikator also setzt sie überlappend mit Naujoks’ good will-Display (Z. 6) zunächst zu einem dezidierten Urteil an (Z. 7: also die sind auf JEden-), bricht dann jedoch ab, als sie wahrnimmt, dass die Zuschauerin sich noch nicht vollständig umgedreht hat (Abb. 6.1), und beginnt von Neuem, als diese sich auf sie orientiert hat (Abb. 6.2). Dabei stuft sie ihr zweites Urteil epistemisch deutlich zurück (Z. 8: ich glaub die sind zu WEICH;). Sowohl die erste, abgebrochene als auch die zweite Bewertung werden von einer Zeigegeste begleitet, bei der ein Löffel als Zeiginstrument fungiert. Nur die zweite Zeigegeste wird vollständig ausgeführt. Sie erreicht ihren Gipfelpunkt (Abb. 6.3) simultan zur Artikulation des Demonstrativpronomens die (Z. 8) und wird retrahiert, als Poletto gemeinsam mit der Zuschauerin an den Kochtisch tritt (Abb. 6.4). Als Poletto sich anschließend in humorvoll inszenierter Vertraulichkeit erneut an die Zuschauerin wendet und sich spielerisch über Naujoks’ Missachtung ihrer Urteilsgabe beschwert, fährt sie parallel dazu mit ihrer Kochaktivität fort. Der Löffel, der zuvor als Zeiginstrument zur Identifizierung der problematischen Gnocchi benutzt wurde, wird nun zum Umrühren einer in der Pfanne köchelnden Sauce und damit zur Erfüllung seiner eigentlichen Funktion verwendet (Abb. 6.5), deretwegen Poletto ihn zuvor geholt hatte.

5.6 Zeigen mit Objekten

211

Das nächste Beispiel stammt aus derselben Folge von „Polettos Kochschule“. Ganz am Ende der Sendung, als die gelungenen Gnocchi auf einem Teller angerichtet und von den Beteiligten probiert worden sind, richtet Poletto ihre Schlussworte an das Fernsehpublikum. Dazu adressiert sie mit dem Blick die Kamera (Abb. 7.1) und nutzt die Schlussworte, um noch einmal auf die problematischen Gnocchi zu verweisen. Dabei führt sie mit der Gabel eine Zeigegeste auf die misslungenen Gnocchi aus: Beispiel 7: „auch die können funktionieren“ (PK2_00:28:43) Abbildung 7.1

1

Abbildung 7.2

BEI!de gnocchi gibts

PL:

2 3

wieder im INternetzum NACHlesen,

4

und zum NACHkochen,= Abbildung 7.3

5

=auch !DIE! !

Abbildung 7.4

!nen funktionieren,

212

5 Typologie des gestischen Zeigens

Im Anschluss an den in jeder Sendung standardmäßig erfolgenden Hinweis auf die Verfügbarkeit der Rezepte im Internet (Z. 1–3), die auch zum Nachkochen gedacht sind (Z. 4), beteuert Poletto – nicht zuletzt zur Bekräftigung ihrer Glaubwürdigkeit und als Ermutigung an die Zuschauer, beide Gnocchisorten nachzukochen –, dass auch die nicht fertig gewordenen Gnocchi gelingen können (Z. 5). Diese werden durch das besonders stark akzentuierte, deiktische Demonstrativ pronomen !DIE! (Z. 5) noch einmal in den Fokus gerückt. Das Demonstrativpronomen wird begleitet von einer mit mehreren rhythmischen Schlägen (batons) zusätzlich markierten Zeigegeste, die Poletto mit einer Gabel ausführt, die sie zuvor zum Probieren der Gnocchi benutzt hat. Zuerst stellt sie den Verweisraum her, indem sie ihren Blick von der Kamera weg auf den Kochtisch mit den unterschiedlichen Gnocchisorten richtet (Abb. 7.2). Dann zeigt sie mit der Gabel auf das Demonstratum (Abb. 7.3). Dabei wird die Gabel mit den Zacken nach unten und damit in einer Position gehalten, die vom Normalgebrauch in ihrer Funktion als Esswerkzeug abweicht. Anschließend richtet Poletto ihren Blick wieder auf die Kamera (Abb. 7.4). Diese Reorientierung des Blicks entspricht dem Adressatenmonitoring bzw. dem Kontrollblick zur Wahrnehmungswahrnehmung in der face-to-face-Interaktion. Auch im vorliegenden Fall handelt es sich um eine mit einem fremden Gegenstand ausgeführte Zeigegeste, der zwar in den Aktivitätsrahmen des Kochens gehört, mit dem Demonstrationsobjekt jedoch in keinem unmittelbaren Handlungszusammenhang steht. Im letzten Beispiel aus dem „Big Brother“-Korpus („Gitarre“) zeigt eine der Bewohnerinnen, Andrea, mit einem Stück Alufolie auf ein nicht sichtbares Zeigeziel. Das Zeiginstrument steht in keinerlei Beziehung zum Demonstratum. Die Situation gestaltet sich wie folgt: Alex sitzt im Garten des „Big Brother“-Hauses am gedeckten Tisch. Aus dem Lautsprecher wird Musik eingespielt. Als Andrea in den Garten kommt, um Lebensmittel auf dem Tisch abzustellen, fragt Alex sie nach dem Namen des Musikers (Z. 1). Andrea stellt eine Rückfrage, die sich auf die Identifizierung des Demonstratums bezieht, indem sie mit steigender Intonation ein akzentuiertes Personalpronomen (Z. 3: ER?) und eine Zeigegeste in die Richtung produziert, aus der die eingespielte Musik kommt. Die Zeigegeste wird mit einem länglichen Stück Alufolie ausgeführt (Abb. 8.1), das Andrea soeben vom gedeckten Gartentisch eingesammelt hat. Da das Zeigeziel nicht sichtbar, sondern nur hörbar ist, blickt die Zeigende, während sie die Zeigegeste ausführt, nicht in Richtung des Zeigeziels, sondern zu ihrem Adressaten (Abb. 8.1). Nach einer Pause äußert sie eine Namensvermutung (Z. 6). Alex, der überlappend mit der Nennung des Sängernamens dessen Gruppenzugehörigkeit identifiziert, wiederholt den Namen und bestätigt Andreas Annahme als neu gewonnene Erkennt-

5.6 Zeigen mit Objekten

213

Beispiel 8: „Gitarre“ (bb02_5:08:45)

01 02

Alx:

(0.4)

;

Abbildung 8

03 04 05 06 07

Adr:

ER? (1.5)

Alx:

ist das nicht eric [CLAPton gewesen? [n_BEAtle;] eric clapton geNAU;

nis. Damit ist die namentliche Identifizierung des Referenten geleistet und die Sequenz zum Abschluss gebracht.

Zusammenfassung Es gibt unterschiedliche Gründe, warum Zeigende mit Objekten zeigen. Einfache Fälle, die sich nicht grundsätzlich vom Zeigen mit dem Zeigefinger unterscheiden, stellen Zeigehandlungen mit funktional auf das Zeigen spezialisierten, körperfremden Gegenständen dar. Diese Gegenstände müssen für die Zeigehandlung nicht erst rekontextualisiert werden, sondern tragen im Gegenteil selbst zur Kontextualisierung und Projektion einer Zeigehandlung bei. Wie das erste Beispiel gezeigt hat, ist der Gebrauch von Zeigestöcken und ähnlichen Hilfsmitteln eine probate Lösung, die vektorielle Linie auf Suchraum und Zeigeziel über die Reichweite des eigenen Körpers hinaus zu verlängern und dadurch eine höhere Präzision bei der Zeigezielpeilung zu erreichen. Denselben Vorteil bieten unter Umständen auch Gegenstände, die funktional nicht auf das Zeigen spezialisiert sind, sondern im Normalgebrauch

214

5 Typologie des gestischen Zeigens

anderen Zwecken wie dem Schneiden, Schöpfen, Essen, Schreiben etc. dienen. Ihr Einsatz als Zeiginstrument verdankt sich der Tatsache, dass sie just in dem Moment, in dem eine Zeigehandlung interaktiv relevant wird, zur Hand sind. Dabei spielen materielle und situative Eignungsfaktoren eine Rolle, ob ein Gegenstand ad hoc zum Zeigen benutzt wird oder nicht. Wird das Objekt kurzfristig zum Zeigen verwendet, muss seine reguläre Funktion für die Dauer der Zeigehandlung außer Kraft gesetzt werden. Diese Suspendierung der regulären Funktion wird durch explizite Displays wie die vom Normalgebrauch abweichende Orientierung des Gegenstands, ein andersartiges Bewegungsmuster und die sequenzielle Aus- und Wiedereingliederung in die Gesamtaktivität im Vollzug selbst sichtbar gemacht. Das Erfordernis der Rekontextualisierung und Umfunktionalisierung betrifft sowohl Gegenstände, die in funktionaler Beziehung zum Demonstrationsobjekt stehen und Teil der unmittelbar ablaufenden Aktivitäten sind, als auch Gegenstände, die zwar ebenfalls aufgrund ihres Zuhandenseins zum Zeigen ausgewählt werden, aber keine intrinsische Beziehung zum Demonstrationsobjekt besitzen. Der Unterschied zwischen beiden Fällen liegt in Folgendem: Wie an den Beispielen 2 bis 5 zu sehen war, manifestiert sich beim Zeigen mit Arbeitsgeräten, die instrumenteller Bestandteil einer unmittelbar relevanten Tätigkeit sind und eine funktionale Beziehung zum Demonstratum besitzen, neben der Zeigefunktion auch eine Projektionsfunktion. Diese bezieht sich auf die durch das Zeigen suspendierte praktische Tätigkeit und betrifft die Rekonstituierung des Gegenstands als Arbeitsinstrument sowie dessen (Wieder-)Einbettung in den Arbeitsprozess. Demgegenüber konnte bei Gegenständen, die wie in den Beispielen 6 bis 8 keinen unmittelbaren empraktischen Bezug zum Demonstratum haben, keine solche Funktionsüberlagerung festgestellt werden.

5.7 Zeigen an Objekten Das Zeigen an Objekten zeichnet sich dadurch aus, dass das Zeigeziel nicht innerhalb eines Suchraums aufgefunden werden muss, der durch einen vom Zeig instrument zu extrapolierenden Vektor hergestellt wird, sondern dass es vom Zeigenden durch unmittelbare manuelle Berührung und Manipulation in den visuellen Aufmerksamkeitsfokus des Adressaten gerückt wird. Im Gegensatz zum Zeigen mit Objekten (Kapitel 5.6) werden nicht irgendwelche fremden Gegenstände als instrumentelle, perzeptorisch intermediäre und deiktische Zeiginstrumente verwendet, sondern das manipulierte Objekt selbst konstituiert Ziel und Zweck der Aufmerksamkeitsorientierung. Während beim Zeigen mit Objekten die gegenständlichen Zeighilfen in dem Augenblick irrelevant werden, in denen sie

5.7 Zeigen an Objekten

215

ihre zeigende Funktion erfüllt und die Aufmerksamkeit des Adressaten auf das Zeigeziel gelenkt haben, dient das Zeigen an Objekten dazu, die visuelle Wahrnehmung des Adressaten voll und ganz auf das gezeigte Objekt zu lenken. Die nachfolgend betrachteten Fälle des Zeigens an Objekten reichen von Präsentativgesten, in denen das präsentierte Objekt durch den Zeigenden lediglich hochgehalten oder angehoben wird, bis hin zu gestischen Präsentationen, in denen das Objekt ausführlich manipuliert wird. Das erste Beispiel stammt aus der Sendung „Kerners Köche“. Es handelt sich um einen einfachen Fall, bei dem der Zeigende das Zeigobjekt kurz anhebt und dann wieder abstellt, um ein gestisch verwendetes Demonstrativpronomen referenziell zu desambiguieren: Beispiel 1: „Reihenfolge“ (KK1.1_00:10:38) Abbildung 1.1

1

KE:

in welcher reihenfolge pasSIERT das jetzt? Abbildung 1.3

2 3

SW:

Abbildung 1.2

Abbildung 1.4

erstmal wird DAS angebacken_n bisschen? Erstmal mach ich ?

216

5 Typologie des gestischen Zeigens

Kerner (KE) steht bei Sarah Wiener (SW) am Kochtisch (Abb. 1.1), die die Zutaten für ihre Nachspeise aufzählt. Als sie die Auflistung beendet hat, fragt Kerner nach der Reihenfolge der Arbeitsschritte (Z. 1: in welcher reihenfolge pasSIERT das jetzt?) und äußert direkt im Anschluss eine Mutmaßung über den weiteren Verlauf (Z. 2: erstmal wird DAS angebacken_n bisschen?). Um das deiktisch verwendete Demonstrativpronomen DAS (Z. 2) zu desambiguieren, greift Kerner nach einem der mit Teig ausgeschlagenen Förmchen, hebt es kurz an und stellt es gleich wieder ab (Abb. 1.2–1.4). Die temporale Ablaufstruktur gestaltet sich so, dass er bereits im Verlauf der ersten Turnkonstruktionseinheit nach dem Schälchen greift und es simultan zur Artikulation des Adverbs jetzt (Z. 1) mit Daumen und Mittelfinger (Abb. 1.2) umfasst. Mit dem Beginn der zweiten Turnkonstruktionseinheit hebt er das Förmchen hoch (Abb. 1.3) und stellt es bei der Äußerung des akzentuierten Demonstrativpronomens DAS (Z. 2) schon wieder ab (Abb. 1.4). In ihrer Antwort bestätigt die Köchin Kerners Annahme (Z. 3: Erstmal mach ich die TÖRTchen?) und fährt mit ihren Erläuterungen fort. Während das objekttaktile bzw. präsentierende Zeigen im ersten Beispiel ausschließlich der Identifizierung des Referenzobjekts dient, sind die Präsentativhandlungen in den folgenden Beispielen mit einer ausführlicheren Betrachtungseinladung an den Adressaten verbunden. Die visuelle Wahrnehmung besteht hier nicht primär darin, das Objekt zu identifizieren oder zu lokalisieren, sondern durch die Betrachtung bestimmte Informationen über dessen Qualitäten zu erlangen. Die nächste Sequenz („Stange“) stammt aus dem Korpus „Kerners Köche“. Kerner (KE) und der Fernsehkoch Kolja Kleeberg (KK) stehen nebeneinander hinter dem Kochtisch und unterhalten sich über Kleebergs Rezept, was Kerner zu einer Frage veranlasst (Z. 1: was ist SAUerteigbag(h)uette;). In seiner Antwort holt Kleeberg weiter aus und erläutert die Unterschiede zwischen dem ursprünglichen und dem heute bekannten französischen Baguette (Z. 2–8). Nach einer Pause (Z. 3), die von der Verzögerungspartikel ä::hm (Z. 4) gefolgt wird, greift Kleeberg mit dem rechten Arm nach einem Stück Baguette (Abb. 2.1), hebt es hoch, ohne dass sein Adressat jedoch auf ihn orientiert ist (Abb. 2.2), und nimmt es anschließend von der rechten in die linke Hand (Abb. 3.3). Dieser Handwechsel geschieht simultan zur Artikulation des akzentuierten, die visuelle Aufmerksamkeit fordernden Lokaldeiktikons HIER (Z. 5). Nun orientiert sich auch der Adressat visuell auf den Sprecher (Abb. 2.3). Das Baguettestück wird in eine senkrechte Position gebracht und auf Augenhöhe für beide Interaktionspartner sowie für die Kamera gut sichtbar so

5.7 Zeigen an Objekten

217

Beispiel 2: „Stange“ (KK1_00:08:10)

01 02 03

KE: KK:

was ist SAUerteigbag(h)uette; (--) form des brots(0.5) Abbildung 2.1

JK

Abbildung 2.2

KK

war eigentlich gar keine STANge?

04 Abbildung 2.3

05

wovon man HIER so den

Abbildung 2.4

(-) REST sieht,

Abbildung 2.5

06

sOndern ein (.) eine KUgel;

218

5 Typologie des gestischen Zeigens

lange in die Höhe gehalten (Abb. 2.4), bis Kleeberg die entsprechende Turnkonstruktionseinheit beendet hat (Z. 5). Zu Beginn der neuen Turnkonstruktionseinheit senkt er die linke Hand mit dem Baguette und bringt die rechte Hand in eine horizontale, nach unten orientierte Position (Abb. 2.5), von der eine sich anschließende ikonische Geste zur Visualisierung der Kugelform ihren Ausgangspunkt nimmt. Auffällig ist zum einen die Temporalitätsstruktur, das lange Hochalten des Baguettestücks, und zum anderen der ostentative Blick, den der Zeigende auf das Demonstrationsobjekt richtet. Die Ostentativität des Blicks verstärkt die Betrachtungsaufforderung, die von dem gestisch verwendeten, akzentuierten Lokaldeiktikon HIER (Z. 5) in Verbund mit dem Modaldeiktikon so (Z. 5) und der sowohl temporal als auch positionell markierten Präsentativgeste ausgeht. Es entsteht der Eindruck, dass das Demonstrationsobjekt von zwei Seiten fokussiert wird, indem Blick und Gestik in spezifischer Weise als Zeiginstrumente kombiniert werden. Im Vergleich zur klassischen Zeigegeste enthält das präsentative Zeigen eine über die Objektlokalisierung und Objektidentifizierung hinausgehende Betrachtungsaufforderung an den Adressaten. Das präsentierte Objekt wird dem Adressaten zur Anschauung dargeboten, damit er visuelle Evidenz im Hinblick auf bestimmte, wahrnehmbare Eigenschaften erlangen kann. Ein ganz ähnliches Muster ist in folgendem Beispiel aus dem „Big Brother“-Korpus festzustellen. In der Sequenz „Autogrammkarte“ nimmt eine Bewohnerin ein Photo vom Tisch hoch und hält es in senkrechter Position ihrer Adressatin zur Betrachtung hin. Die Demonstrationshandlung ist wie folgt in den Interaktionskontext eingebettet: Drei Bewohner, Jürgen, Sabrina und Andrea, befinden sich in der Küche des „Big Brother“-Hauses. Während Andrea am Küchentisch sitzt und sich weitgehend in der Beobachterrolle befindet, laufen Jürgen und Sabrina im Raum herum (Abb. 3.1) und frotzeln miteinander. Sabrina beschwert sich bei Andrea über Jürgens Behauptung, auf ihren Autogrammkarten sehe sie aus wie die Schlagersängerin Nicole (Z. 1–4). Jürgen bekräftigt seine Ansicht (Z. 5), und Sabrina verleiht ihrer Empörung Nachdruck, indem sie Jürgens Phrase wie niCOle erneut zitiert (Z. 6) und ironisierend den Hit der SchlagersänBeispiel 3: „Autogrammkarte“ (bb02_3_00:16:36)

01 02 03 04

Sbr: Jrg: Sbr:

[(...)] sagt_ER, (-) sieht Aus wie ni[COle; (.) [((lacht)) die BILder;

Abbildung 3.1 Sbr

Jrg

Abbildung 3.2

01

[(...)] sagt_ER, (-) 5.7 Zeigen an Objekten 02 sieht Aus wie ni[COle; (.) 03 Jrg: [((lacht)) Beispiel 3 Sbr: (Fortsetzung) 04 die BILder; Sbr:

Abbildung 3.1

Abbildung 3.2

Jrg

Sbr

Adr

Sbr 05 06 07

Jrg: Sbr:

j(h)a SIEHST du auch; wie niCOle; (.)

Abbildung 3.3

08

219

HIER GUCK; Abbildung 3.5

Abbildung 3.4

09 Abbildung 3.6

(1.5)

220

5 Typologie des gestischen Zeigens

gerin intoniert (Z. 7), mit dem diese berühmt geworden ist. Dazu deutet sie mit beiden Armen pantomimisch Gitarrenspiel an (Abb. 3.2). Währenddessen bewegt sie sich auf den Küchentisch zu, an dem ihre Adressatin Andrea sitzt. Am Küchentisch angekommen greift Sabrina mit der rechten Hand nach einem Photo (Abb. 3.3) und äußert dabei die deiktisch verstärkte, visuelle Betrachtungsaufforderung HIER GUCK (Z. 8). Erst nach Abschluss ihres Redezugs nimmt sie das Photo auf und hält es in senkrechter Position, mit der Ansichtsseite der Adressatin zugewandt, zur Betrachtung hoch (Abb. 3.4). Ihr Blick ist dabei auf das Photo gerichtet. Da sie jedoch die Vorderseite des Photos selbst gar nicht sehen kann, übt der Blick hier keine Wahrnehmungsfunktion, sondern eine die Präsentativgeste verstärkende ostensive Funktion aus. Die Blickausrichtung auf das Bild wird eine Weile eingefroren, bis Sabrina zuletzt einen Kontrollblick zur Wahrnehmungswahrnehmung auf ihre Adressatin richtet (Abb. 3.5). Anschließend senkt sie den Blick wieder und legt das Photo zurück (Abb.3.6). Gegenüber klassischen Zeigegesten, die durch den gestischen Vektor lediglich einen Suchraum und innerhalb des Suchraums das Zeigeziel herstellen, besitzen derartige Präsentativgesten dadurch eine zusätzliche visuelle Evidenzialisierungsfunktion, dass sie das Anschauungsobjekt ausdrücklich und hand-greiflich in den Aufmerksamkeitsfokus des Adressaten rücken. Das Anschauungsobjekt bildet keine statische Figur vor einem festen Wahrnehmungsgrund, sondern es wird durch einen gestischen Akt von seinem alten Grund abgelöst, wegbewegt und als Figur vor einem neuen Wahrnehmungsgrund etabliert. Zudem können Zeigende durch die Gestaltung der inneren Dauer des präsentativen Moments und die temporale Koordination der eingesetzten Ressourcen ihre Erwartung über den veranschlagten zeitlichen, perzeptorischen und kognitiven Betrachtungsaufwand des Adressaten projizieren. Im nächsten Beispiel aus einer Folge von „Polettos Kochschule“ wird ein Gegenstand präsentiert, bei dem es sich um ein spezielles Küchenutensil handelt. Da es Laien nicht unbedingt bekannt ist, wird es zudem in seiner Funktionsweise vorgeführt: Beispiel 4: „Plattierer“ (PK5_00:04:36)

01 02 03 04 05 06 07

PL:

TB: PL: TB:

und wir brauchen (.) uns gAr nicht so sehr drauf zu konzenTRIEren, weil wir ((0.5) !PLAT!TIE!ren; hm_hm, oKAY; Abbildung 4.1

Abbildung 4.2

drauf zu konzenTRIEren, 02 03 weil wir ( 04 5.7 Zeigen an Objekten (0.5) 05 TB: !PLAT!TIE!ren; 06 PL: hm_hm, Beispiel 4 TB: (Fortsetzung) 07 oKAY;

09

PL:

Abbildung 4.1

Abbildung 4.2

Abbildung 4.3

Abbildung 4.4

DIES hier ist ein richtiger (1.0) platTIErer? Abbildung 4.5

10 11

TB:

hm_hm, (0.6)

Abbildung 4.6

221

222

5 Typologie des gestischen Zeigens

Poletto und ihr Gast, Tom Buhrow, stehen nebeneinander hinter dem Kochtisch und haben vor, Rindfleischcarpaccio zuzubereiten. Nachdem Poletto erläutert hat, dass es weder nötig, noch geschmacklich ratsam ist, das Rindfleisch vorher einzufrieren, führt sie als Alternativverfahren zum dünnen Schneiden die Technik des Plattierens ein (Z. 1–3). Kurz darauf präsentiert sie das erforderliche Profi gerät, das in doppelter Ausführung bereits auf dem Kochtisch bereitsteht, indem sie die zwei Plattierer kurz mit beiden Händen anfasst (Abb. 4.1) und dann mit der rechten Hand einen hochhebt (Abb. 4.2). Währenddessen projiziert ihr Gast eine Lehr-Lern-Sequenz (Z. 8), die sich auf die Technik des Plattierens bezieht. Ohne diese Erwartung explizit zu ratifizieren, produziert Poletto, eingeleitet durch das akzentuierte proximale Demonstrativpronomen DIES, eine Präsentativkonstruktion (Z. 9: DIES hier ist ein richtiger (1.0) platTIErer?). Parallel dazu präsentiert sie das Objekt in einer Weise, die dessen Qualitäten in der Präsentativgeste selbst bereits zur Anschauung bringen: So schlägt sie just in dem Moment, in dem sie das Demonstrativpronomen DIES artikuliert, den Plattierer mit seinem glatten Boden gegen die Handinnenfläche ihrer anderen Hand (Abb. 4.3). Das klatschende Geräusch des Aufpralls ertönt simultan zum akzentuierten Demonstra tivum. In der turnkonstruktionsinternen Pause (Z. 9) schlägt Poletto, bevor sie den Fachterminus zur Bezeichnung des Demonstrationsobjekts nennt, den Plattierer zwei weitere Male auf das Schneidebrett, so dass ein lautes Klopfen entsteht. Während sie den ersten Schlag ausführt, greift Buhrow über ihren Arm hinweg nach dem zweiten Plattierer und nimmt ihn hoch (Abb. 4.4). Nach Beendigung ihres Redezugs schlägt Poletto ein drittes Mal mit dem Plattierer auf die Schneideplatte (Abb. 4.5), unmittelbar gefolgt von einem Schlag, den Buhrow nun mit seinem Plattierer direkt daneben ausführt (Abb. 4.6). Diese probehalber vollzogene Handhabung des Objekts veranlasst ihn zu einer Bewertung, die sich auf eine erst durch die Objektmanipulation körperlich erfahrbar werdende materielle Qualität des Plattierers bezieht (Z. 12: is SCHWER,). Präsentationshandlung und Objektmanipulation gehen durch die Vorführung der Funktionsweise ineinander über. Wie im vorliegenden Beispiel können sich in bestimmten, insbesondere in empraktischen Kontexten die Grenzen zwischen Zeige- bzw. Präsentativhandlung und Objektmanipulation als fließend erweisen. Im nächsten Beispiel ist die Präsentativgeste eingebunden in die übergeordnete Aktivität einer Transaktion, bei der der präsentierte Gegenstand der Adressatin überreicht wird. Das Beispiel stammt aus dem Korpus „Die Küchenschlacht“:

5.7 Zeigen an Objekten

223

Beispiel 5: „Schürzchen“ (KS1_00:41:32) Abbildung 5.1 HL

1 2 3

HL: Cl: HL:

C1

LIEbe claudia; ich dAnke dir TROTZdem

Abbildung 5.3

Abbildung 5.4

HIER

4 5

Abbildung 5.2

Cl:

DANke,

Die Sequenz entstammt den letzten Minuten der Sendung. Die Entscheidung, welche Kandidaten eine Runde weiter kommen und wer ausscheiden muss, ist soeben gefallen. Das Studiopublikum beklatscht die nebeneinander hinter dem Kochtisch stehenden Kandidaten, die zum Teil mitklatschen. Die beiden männlichen Gäste stehen am linken und rechten Ende des Kochtischs und rahmen die Gruppe der weiblichen Gäste ein, die zusammen mit der Verliererin in der Mitte stehen. Dem Sendeformat entsprechend übergibt der Moderator, Horst Lichter (HL), am Ende der Sendung der Verliererin als Trostpreis eine Schürze. Um die Schürze

224

5 Typologie des gestischen Zeigens

zu überreichen, tritt Lichter an die Gruppe der Frauen heran, durchschreitet sie und geht auf die Verliererin zu (Abb. 5.1). Dabei hält er die Schürze zunächst der Länge nach hoch, faltet sie dann über seinem rechten Arm zusammen und legt den linken Arm um die Verliererin (Abb. 5.2), nachdem er sie namentlich adressiert hat (Z. 1: LIEbe claudia;). Die Kandidatin bedankt sich bei Lichter (Z. 2), woraufhin dieser sich wiederum für die Danksagung bedankt (Z. 3), die Umarmung löst, seinen Oberkörper in einem rechten Winkel zu ihr positioniert und den Arm mit der darüber gelegten Schürze in ihr Sichtfeld rückt (Abb. 5.3). Dabei beugt er den Oberkörper leicht über den eigenen Arm und blickt auf die Schürze (Abb. 5.3). Simultan dazu formuliert er, eingeleitet durch das akzentuierte Lokaldeiktikon HIER, die Präsentativkonstruktion HIER ist das SCHÜRZchen (Z. 4), mit der die Schürze fokussiert wird.68 Während die Kandidatin sich bedankt und ihren linken Arm unter die dargebotene Schürze schiebt (Abb. 5.4), dreht Lichter sich bereits aus der gemeinsamen körperlichen Konfiguration heraus und projiziert damit, dass die er die dyadische Interaktion verlässt. Da es sich bei der Aktivität, in die die Zeigehandlung eingebunden ist, um die Überreichung eines Geschenks handelt, ist die Adressatin über die perzeptorische Identifizierung des Demonstrationsobjekts hinaus zu einem Akt würdigender Aufmerksamkeit (Abb. 5.3) aufgefordert. Dies wird durch die Präsentativgeste und die körperlich-visuelle Orientierung, mit der sich der Zeigende selbst dem Objekt zuwendet, kontextualisiert. Die Präsentativhandlungen, die in den letzten beiden Beispielen im Rahmen von Objekttransaktionen stattfinden, werden als zweiter Paarteil auf Anfragen, Bitten oder Lokalisierungsfragen eines Beteiligten produziert. Im Gegensatz zu dem zuvor analysierten Fall einer Geschenkübergabe sind Präsentativhandlungen, die eine Objekttransaktion einleiten, nicht mit einer Betrachtungsaufforderung an den Adressaten verbunden. Insofern unterscheiden sie sich auch von

68 Die Präsentativkonstruktion wird mit dem proximalen Lokaldeiktikon hier und nicht etwa mit dem Demonstrativpronomen das eingeleitet. Der Unterschied zwischen der Konstruktion hier ist/sind X und der Konstruktion das ist/sind x liegt darin, dass die hier-Konstruktion wie im vorliegenden Beispiel mit dem definiten Artikel gebraucht wird und dementsprechend einen Gegenstand konstituiert und individuiert, der als bekannt vorausgesetzt wird. Daraus erklärt sich der Gebrauch des proximalen Lokaldeiktikons anstelle eines Demonstrativpronomens: Das Lokaldeiktikon fokussiert den Handlungsaspekt, das Präsentieren, Übergeben, Überreichen und damit die (Dynamik der) Transaktion selbst, nicht den Gegenstand. Umgekehrt wird die das ist/ sind X-Konstruktion mit dem unbestimmten Artikel verwendet und fokussiert den Gegenstand selbst in seiner phänomenalen Qualität. Der präsentierte Gegenstand fungiert dabei zumeist als (prototypischer) Vertreter seiner Kategorie, über deren Eigenschaften der Adressat durch Betrachtung des konkreten Einzelexemplars visuelle Qualitätsmerkmale erkennen kann.

5.7 Zeigen an Objekten

225

den Präsentativhandlungen, deren interaktive Funktion in der Vermittlung visueller Evidenz liegt (Beispiele 2–4). In der Sequenz „Gabel“ aus „Kerners Köche“ präsentiert und übergibt der Moderator Johannes B. Kerner einem der Fernsehköche auf Anfrage eine Gabel: Beispiel 6: „Gabel“ (KK1_00:22:27) Abbildung 6.1 KE

1 2

RZ: KE:

Abbildung 6.2 RZ

hat jemand noch ne GAbel; ja HIER;

Die Fernsehköche sind dabei, eines der Gerichte zu kosten, und stehen in einem engen Halbkreis beieinander (Abb. 6.1). Auf die Frage eines Kochs (RZ) nach einer Gabel gibt Kerner eine positive Antwort und hebt, als er das akzentuierte Lokaldeiktikon HIER artikuliert (Z. 2), die rechte Hand hoch (Abb. 6.2), in der er weitere Probiergabeln hält. Sein Blick ist auf die Hand mit der Gabel gerichtet (Abb. 6.2). Anstelle einer verbalen Antwort greift der Koch nach der Gabel und nimmt sie an sich. Damit ist die Sequenz beendet. Eine ähnliche Transaktion vollzieht sich im letzten Beispiel aus „Polettos Kochschule“. In der Sequenz präsentiert und übergibt Poletto ihrem Gast ein Messer. Zuvor hat sie ihrem Gast, Eva Habermann (EH), den Arbeitsauftrag gegeben, Tomatenpaste auf Crostinischeiben zu streichen. Daraufhin fragt diese sie nach einem Messer (Z. 1–2), gefolgt von einem Account, dass sie sich in der Küche nicht auskenne (Z. 5). Poletto, die gerade dabei ist, von der einen Seite des Kochtischs hinter Habermann vorbei auf die andere Seite zu laufen, sucht mit dem Blick den seitlichen Kochbereich ab (Abb. 7.1) und signalisiert mit der gedehnten Verzögerungspartikel ä:hm (Z. 3) ihren Suchprozess. Schließlich streckt sie ihren Arm in Richtung Schneidebrett aus (Abb. 7.2), ergreift ein Messer und produziert

226

5 Typologie des gestischen Zeigens

Beispiel 7: „Messer“ (PK6_00:26:44)

1 2

EH:

wo gibts_n MESser? zum STREIchen? Abbildung 7.1

3 4 5

PL: EH:

(0.7) ich KENN mich [so nicht AUS hier in derAbbildung 7.2

6

[nimmst du einfach DIEses HIER?

PL: Abbildung 7.4

7 8

EH:

Abbildung 7.3

(0.5)

Abbildung 7.5

Zusammenfassung: Wie und womit gezeigt wird

227

in Überlappung mit Habermanns noch nicht abgeschlossenem Account (Z. 5) eine Antwort auf deren Anfrage: nimmst du einfach DIEses HIER? (Z. 6). Dabei berührt ihre Hand genau in dem Moment das Messer (Abb. 7.3), in dem sie das akzentuierte proximale Demonstrativpronomen DIEses artikuliert. Bemerkenswert ist, dass sie sich, als sie ihrer Interaktionspartnerin das Messer präsentiert, perzeptorisch weder auf die eigene Hand noch auf ihre Adressatin orientiert, sondern den Arm mit dem Messer seitlich nach hinten streckt und sich mit Kopf und Oberkörper bereits auf einen neuen Raum orientiert (Abb. 7.4). Habermann greift nach dem Messer (Abb. 7.5) und begleitet den Akt interpersoneller, manueller Koordinierung mit einem Rückmeldesignal (Z. 8: oKAY,).

Zusammenfassung Das Zeigen an Objekten erfordert im Unterschied zu anderen Formen gestischen Zeigens keine Extrapolation eines linearen Vektors vom Zeiginstrument in Richtung Suchraum und Zeigeziel. Stattdessen wird das Demonstrationsobjekt durch manuelle Berührung, Präsentation oder Manipulation konstituiert und unmittelbar in den visuellen Aufmerksamkeitsfokus gerückt. Dabei stellen Handlungen wie Anheben, Aufnehmen und Hochhalten eine besonders starke Form der Aufmerksamkeitsfokussierung auf das präsentierte Objekt dar, da das Objekt in solchen Fällen von seinem Grund räumlich und perzeptorisch losgelöst und vor einem anderen Wahrnehmungsgrund als Figur eigens hergestellt wird. Beim Zeigen an Objekten steht nicht die Identifizierungs- und Lokalisierungsfunktion im Vordergrund, sondern die Objekte werden dem Adressaten entweder zu einer ausführlicheren Betrachtung oder zur Ausübung einer weiteren Aktivität dargeboten. Wird der Adressat zu einer Betrachtung des präsentierten Objekts eingeladen, so ist damit die Aufforderung impliziert, durch die Betrachtung Informationen über bestimmte wahrnehmbare Qualitäten oder Eigenschaften des präsentierten Objekts zu erhalten (Beispiel 4), zu einem auf eigener Anschauung gründenden Urteil zu gelangen bzw. die Urteilsbildung durch visuelle Evidenz zu erleichtern (Beispiele 2 und 3) oder Objekttransaktionen im Rahmen von Schenk aktivitäten (Beispiel 6), praktischen Tätigkeiten etc. (Beispiel 6, 7) durchzuführen.

Zusammenfassung: Wie und womit gezeigt wird In den vorangegangenen Kapiteln wurde dargelegt, welche Ressourcen zur Ausführung des gestischen Teilakts in der deiktischen Zeigehandlung verwendet

228

5 Typologie des gestischen Zeigens

werden. Das Ziel der Analysen bestand darin, die im Datenmaterial aufgefundenen rekurrenten Praktiken körperlich-visuellen Zeigens formal und funktional zu bestimmen. Die daraus entwickelte Typologie gestischer Zeigweisen unterscheidet auf der ersten Gliederungsebene, welche Körperteile und welche körperfremden Mittel zum Zeigen verwendet werden. Auf der zweiten Ebene wird nach Formvarianten differenziert, die sich durch die Positionierung und Ausrichtung des entsprechenden Körperteils voneinander unterscheiden. So ergeben sich für das Zeigen mit dem Zeigefinger zwei Varianten und für das Zeigen mit der geöffneten Hand drei Varianten, die formal durch die nach oben orientierte, vertikal ausgerichtete oder nach unten weisende Handfläche geschieden werden. Neben unterschiedlichen Varianten manuellen Zeigens greifen Sprecherinnen und Sprecher alternativ auf weitere Ressourcen wie das Zeigen mit dem Kopf oder Blick zurück, wobei die Grenzen zwischen beiden nicht immer trennscharf zu ziehen sind. Beim Zeigen mit körperfremden Objekten wurde zwischen Objekten, die funktional auf das Zeigen spezialisiert sind, und Objekten, deren Normalgebrauch einer anderen Funktion dient, unterschieden. Während erstere kraft ihrer default-Funktion als Zeiginstrument zur Kontextualisierung und Projektion einer Zeigehandlung beitragen, müssen letztere für die Zeigehandlung rekontextualisiert werden. Ihre spontane Verwendung als Zeiginstrument verdankt sich der Tatsache, dass sie zufälligerweise zur Hand sind. Bei ihnen handelt es sich um Gebrauchsgegenstände bzw. Arbeitsgeräte, die für die unmittelbar im Gang befindliche Aktivität benötigt werden. Damit sie ad hoc zum Zeigen gebraucht werden können, muss ihre eigentliche Funktion außer Kraft gesetzt werden. Dies geschieht sichtbar, d. h. durch explizite Displays wie die vom Normalgebrauch abweichende Orientierung des Gegenstands, andersartige Bewegungsmuster in der Handhabung, die dessen Standardfunktion suspendieren, und sequenzielle Rahmenwechsel-Markierungen. Gegenstände, die aufgrund ihrer unmittelbaren praktischen Einbindung in die emergierende Aktivität ohnehin zur Hand sind und kurzfristig zum Zeigen eingesetzt werden, bilden häufig eine Brücke zwischen zeigenden und objektmanipulativen Aktivitäten, indem ihre Verwendung als Zeiginstrument und ihre Verwendung als Arbeitsinstrument ineinander übergehen. Gegenüber dem Zeigen mit Objekten zeichnet sich das Zeigen an Objekten dadurch aus, dass diese nicht als perzeptorisch intermediäres Zeiginstrument benutzt werden, sondern selbst das Ziel der durch die deiktische Zeigehandlung bewirkten Aufmerksamkeitsfokussierung darstellen. Sie werden objekttaktil, durch manuelle Berührung, Manipulation, Präsentation oder Dislokation (Verrücken, Anheben, Hochhalten etc.) in den visuellen Aufmerksamkeitsfokus des

Zusammenfassung: Wie und womit gezeigt wird

229

Adressaten gerückt und ihm zur Anschauung oder zur Verwendung im Rahmen einer bestimmten Aktivität dargeboten. Die Wahl des jeweiligen Zeiginstruments hängt von unterschiedlichen Faktoren ab. Zu den funktionalen Unterschieden zwischen eng verwandten Formen wie den (Zeige-)Fingergesten oder den Gesten der geöffneten Hand treten weitere Faktoren hinzu wie die vektoriellen Präzisionsanforderungen, die (perzeptorische, kognitive und interaktionale) Beschaffenheit von Suchraum und Zeigeziel, die physisch-materiellen und situativen Eignungsfaktoren des Zeiginstruments sowie die intra- und interpersonelle Koordinierung der Wahrnehmung und der Aktivitäten, in die die Beteiligten involviert sind. So werden Blick- oder Kopfgesten als Alternative gewählt, wenn die Hände bereits mit Aktivitäten beschäftigt sind, deren Suspension einen zu hohen Aufwand darstellt. Da Blick- und Kopfgesten die gleichzeitige Fortsetzung manueller Aktivitäten ermöglichen, können sie en passant eingesetzt werden. Ob mit dem Blick gezeigt wird, hängt aber nicht allein davon ab, ob die Hände frei sind oder nicht, sondern auch davon, ob beispielsweise ein im emergierenden Aktivitätskontext ohnehin zuhandenes Objekt nicht ebenso gut oder besser zum Zeigen geeignet ist. Als Bestandteil einer deiktischen Zeigehandlung dienen körperliche Zeigweisen nicht nur der räumlichen Vektorbildung, sondern sind häufig mit zusätzlichen formalen und funktionalen Merkmalen angereichert, die die Bedeutung der Zeigehandlung in der Interaktion mitbestimmen. Relationale, indexikalische und charakterisierende Merkmale, die in der Deixisliteratur ausschließlich den deiktischen Ausdrücken zugeschrieben werden, sind in unterschiedlichem Ausmaß in die körperlich-visuellen Zeigweisen inkorporiert. So indiziert die Daumengeste über die Richtung des Referenzobjekts hinaus dessen Bekanntheit, eine einfache Figur-Grund-Struktur und daraus resultierend die problemlose Auffindbarkeit des Zeigeziels oder die Irrelevanz seiner exakten Lokalisierung. Zugleich postuliert und konstituiert die Daumengeste eine epistemisch symmetrische Situationsstrukturierung. Ein bevorzugter Verwendungskontext stellt der Gebrauch zur Personenreferenz, insbesondere der Verweis auf kopräsente, in Hörweite befindliche Dritte (bystander, Goffman 1981) dar, die lateral mitadressiert werden. Wie zu sehen war, weisen die Merkmale, die das Zeigen mit dem kleinen Finger auszeichnen, auf Kleinräumigkeit und perzeptorische Komplexität des Suchraums, die Notwendigkeit mikroskopischer Wahrnehmung zum Auffinden des Zeigeziels sowie unter Umständen auf einen engen, nahezu auf Körperkontakt reduzierten Interaktionsraum hin. Die genannten Merkmale manifestieren sich in systematischen Funktionsunterschieden zwischen den verschiedenen Gestenformen (vgl. dazu die Zusammenfassungen der Einzelkapitel). Die empirische Untersuchung der kinesischen Ressourcen, die in einer deiktischen Zeigehandlung zum Einsatz kommen, hat nachgewiesen, dass der kör-

230

5 Typologie des gestischen Zeigens

perliche Teilakt ein semiotisch komplexes Phänomen darstellt und sich formal keineswegs in der klassischen Zeigefingergeste erschöpft. Stattdessen gibt es eine Vielzahl voneinander zu unterscheidender Zeigweisen, in deren Formgestalten sich unterschiedliche Funktionen sedimentiert haben, die zugleich situationsübergreifend und kontextsensitiv funktionieren.

6 E mpirische Untersuchungen zu den Parametern der Zeigehandlung Im Folgenden wird das im theoretischen Teil (Kapitel 4) entwickelte Modell durch ausführliche empirische Analysen von Videosequenzen aus verschiedenen Teilkorpora systematisch am Datenmaterial erprobt. Die Auswahl der Beispiele erfolgt mit dem Ziel, durch eine ausgewogene Repräsentation unterschiedlicher Situationskontexte die aktivitäts-, gattungs- und korpusübergreifende Relevanz der Parameter empirisch nachzuweisen. Entscheidend ist, dass die Parameter der Zeigehandlung nicht in jedem Fall immer vollständig zutage treten müssen. Dadurch, dass manche der Aufgaben im unmarkierten Fall integrativ vollzogen werden, entziehen sie sich einer sequenzanalytischen Betrachtungsweise. Zugänglich werden sie allerdings zum einen durch den Vergleich unterschiedlicher sequenzieller Ablaufformate, in denen sich die kontextspezifische Variabilität und Adaptivität der jeweiligen Einzelparameter manifestiert, und zum anderen durch die Analyse von Reparaturen. Reparaturen machen die Methoden interaktiver Sinnproduktion bei einer Zeigehandlung dadurch sichtbar, dass die Beteiligten erst in einem späteren Anlauf Intersubjektivität herstellen. Reparaturen sind einerseits sequenzieller Bestandteil der entsprechenden Zeigehandlung und andererseits metakommunikativ, indem sie sich auf konstitutive Elemente der Einzelhandlung beziehen und diese als Reparanda eigens in den Fokus rücken. Durch die gemeinsame, fortlaufend von reziproken Verstehensdisplays begleitete Bearbeitung von Problemquellen werden die perzeptorischen, kognitiven und interaktiven Einzelkomponenten der Zeigehandlung (auch aus der Beteiligtenperspektive) zugänglich, die im störungsfreien Normalablauf oft nicht beobachtbar sind. Kapitel 6.1 behandelt die fokussierte Interaktion, die die Grundbedingung für koordinierte gemeinsame Aktivitäten bildet und dadurch, dass sie keinen für die Zeigehandlung spezifischen Parameter konstituiert, einen gesonderten Status einnimmt. In Kapitel 6.2 folgt die Analyse der Herstellung des Verweisraums durch den Zeigenden. Dessen Selbstorientierung stellt die Voraussetzung für die Fremdorientierung dar. Um eine Fremdorientierung zu vollziehen, muss der Zeigende, wie Kapitel 6.3 ausführlich darstellt, zunächst den eigenen Körper als verweisenden Körper in den visuellen Aufmerksamkeitsfokus seines Adressaten rücken. Kapitel 6.4 behandelt die Zeigegeste als die für den Zeigeakt instrumentell spezifizierte Ausdrucksressource. Kapitel 6.5 belegt, dass der Adressat durch die Zeigegeste zunächst auf den Suchraum verwiesen wird, der als eigen-

232

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

ständiger Parameter vom Zeigeziel zu unterscheiden ist. Das Zeigeziel ist Gegenstand von Kapitel 6.6. Dass Zeigeziel und Referent ebenfalls zwei theoretisch zu trennende, wenn auch eng zusammenhängende Parameter sind, wird durch das anschließende Kapitel 6.7 zur Referenzherstellung dargelegt. In Kapitel 6.8 erfolgt eine ausführliche Analyse der Wahrnehmungswahrnehmung, die einen zentralen Intersubjektivierungsmechanismus konstituiert und eine systematische Position in der deiktischen Zeigehandlung einnimmt. Den Abschluss bilden in Kapitel 6.9 Analysen zu Intersubjektivierungsverfahren, mit denen die Interaktionspartner sich die Reziprozität ihres Verstehensprozesses anzeigen bzw. ihr Verstehen interaktiv dokumentieren.

6.1 Fokussierte Interaktion Wie im theoretischen Kapitel dargelegt wurde, besteht das erste Erfordernis darin, dass Interaktionsbeteiligte einen audio-visuellen Zugang zueinander und zum umgebenden Raum haben und aus der schieren Kopräsenz in fokussierte Interaktion miteinander treten. Die Herstellung fokussierter Interaktion bildet die Grundvoraussetzung für koordinierte gemeinsame Aktivitäten. Sie stellt daher kein die demonstratio ad oculos gegenüber anderen Aktivitäten der face-to-face-Kommunikation auszeichnendes Merkmal dar. Allerdings spielt sie insofern eine besondere Rolle für Zeigehandlungen unter den Bedingungen körperlicher Kopräsenz der Beteiligten, als sie in der spezifischen Form der reziproken visuellen Orientierung der Beteiligten aufeinander die Bedingung der Möglichkeit einer Zeigehandlung darstellt. Da Zeigen eine Dreierrelation zwischen Zeigendem, Adressaten und Zeigeziel konstituiert, liegt die Besonderheit der Herstellung fokussierter Interaktion zum Zweck einer Zeigehandlung darin, dass die Beteiligten die räumliche Konfiguration zueinander zugleich so gestalten müssen, dass der körperlich-visuelle Bezug auf ein Drittes, das Zeigeziel, ermöglicht wird. Insofern die Herstellung fokussierter Interaktion als Parameter in das theore tische Modell der Zeigehandlung integriert ist, geht es in der Analyse nicht um die Art und Weise, wie fokussierte Interaktion im Allgemeinen etabliert wird. Für die empirische Validierung des Modells ist ausschließlich die Betrachtung solcher Fälle relevant, in denen die Herstellung fokussierter Interaktion unmittelbar zum Zweck der Ausführung einer Zeigehandlung erfolgt. In diesen Fällen unterliegt die Gestaltung des für die fokussierte Interaktion von den Beteiligten gemeinsam herzustellenden Interaktionsraums spezifischen, mit der Zeige-

6.1 Fokussierte Interaktion

233

handlung zusammenhängenden Beschränkungen, die sich aus der räumlichen Positionierung der Beteiligten zueinander, ihren Aktivitäten, der Situierung des prospektiven Zeigeziels in räumlicher Relation zum Zeigenden und zum Adressaten sowie aus weiteren kontingenten Gegebenheiten im Raum ergeben. Die Gestaltungsmöglichkeiten und -zwänge, denen der für die Zeigehandlung einzurichtende Interaktionsraum unterliegt und die daher bereits bei der Herstellung fokussierter Interaktion zum Tragen kommen, sollen im Folgenden exemplarisch beleuchtet werden. Die Analyse beginnt mit Beispielen aus dem Subkorpus der Stadtführungen. Sie verbindet als gattungskonstitutive Merkmale die gemeinsame Bewegung der Beteiligten im Raum und die situierte Betrachtung unterschiedlicher Anschauungsobjekte. Bei Stadtführungen ist die Herstellung fokussierter Interaktion zum Zweck des Zeigens eingebettet in die übergeordnete Interaktionsstruktur der kommunikativen Gattung (vgl. Stukenbrock und Birkner 2010). Stadtführungen sind durch den regelhaften Wechsel zwischen mobilen und stationären Phasen gekennzeichnet. Da in ihnen die touristische Vermittlung eines neuen Anschauungsobjekts in den stationären Phasen erfolgt, erfordert die Herstellung fokussierter Interaktion zugleich eine erfolgreiche Bewältigung des Übergangs von der mobilen zur stationären Phase. Dazu gehört nicht nur das gemeinsame Anhalten an einem verkehrs- und wahrnehmungstechnisch günsti gen Standort, sondern auch eine entsprechende räumliche Konfiguration der Gruppenteilnehmer in Relation zueinander, zur Stadtführerin und zum potenziellen Anschauungsraum, in dem das nächste Objekt zu finden ist. Der Übergang von der mobilen zur stationären Phase wird in der Regel dadurch initiiert, dass die Stadtführer an einem bestimmten Standort anhalten, durch ihre Posi tionierung und Orientierung im Raum den künftigen Anschauungsraum projizieren und den Gruppenmitgliedern implizit oder explizit signalisieren, wie sie sich räumlich konfigurieren sollen. Wie anhand des ersten Beispiels zu sehen ist, läuft die Stadtführerin als diejenige, die den Parcours festlegt, in den mobilen Phasen an der Spitze der Gruppe (Abb. 1.1). Als sie einen neuen Standort erreicht hat, bleibt sie stehen, dreht sich zur Gruppe um und wartet in einer face-to-face-Orientierung auf die eintreffenden Gruppenmitglieder (Abb. 1.2). Ihr Blick ist dabei jedoch nicht auf die Gruppe, sondern auf ihre Tasche gerichtet, mit der sie sich auch manuell beschäftigt. Dadurch signalisiert sie, dass sie noch nicht für die fokussierte Interaktion verfügbar ist. Währenddessen bleiben die Gruppenmitglieder in einem Abstand von wenigen Schritten vor ihr stehen und stellen sich dort im Halbkreis auf:

234

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

Beispiel 1: „alle da“ (StFB1_00:09:28)

1

((Bewegung zu neuem Standort 1,5 Minuten)) Abbildung 1.1

Abbildung 1.2

Abbildung 1.3

2

SF:

(si_mer) alle DA?

Durch die Frage (si_mer) alle DA? (Z. 1) bringt die Stadtführerin den Übergang zwischen der mobilen und der stationären Phase zum Abschluss und stellt, indem sie sich der Anwesenheit der Gruppenmitglieder vergewissert und deren Aufmerksamkeit auf sich orientiert, fokussierte Interaktion her. Ihren Blick richtet sie dabei auf die Gruppenmitglieder, die ihrerseits zur Stadtführerin blicken (Abb. 1.3). Mit der wechselseitigen Orientierung der Interaktionspartner aufeinander ist die fokussierte Interaktion hergestellt. Wie in Kapitel 6.2 zum Verweisraum zu sehen sein wird, orientiert sich die Stadtführerin in der anschließenden Pause zunächst selbst im umgebenden Raum, bevor sie ihren Vortrag beginnt und die Teilnehmer visuell auf das neue Anschauungsobjekt orientiert. Im zweiten Beispiel aus einer anderen Stadtführung gestalten sich der Übergang von der mobilen zur stationären Phase und die Herstellung fokussierter

6.1 Fokussierte Interaktion

235

Interaktion etwas komplizierter, da der Stadtführer zunächst damit beschäftigt ist, eine geeignete Gruppenformation herzustellen. Er steht mit seiner Gruppe vor der Aufgabe, sich auf einem durch Treppen, unterschiedliche Ebenen und Gartenanlagen komplex strukturierten Gelände zu rekonfigurieren. Die spezifischen Raumgegebenheiten erschweren die Positionierung der Gruppe in Relation zum Stadtführer und zum prospektiven Anschauungsraum: Beispiel 2: „mal hier gruppieren“ (StFLing2_00:05:52)

1 2 3 4 5 6 7

SF:

SF: SF:

SO. wenn sie sich mal HIER gruppIEren, (4.5) hIEr ist ja noch PLATZ? (8.5) GUT;

Der Stadtführer kommt als erster in der stationären Phase an und positioniert sich auf dem Treppenabsatz einer Gartenanlage. Sein Blick ist auf die eintreffenden Gruppenmitglieder gerichtet (Abb. 2.1). Im Folgenden greift er aktiv in deren Standortauswahl ein, indem er einige Schritte auf die Gruppe zumacht und sie mit einer Winkgeste auffordert, näher heranzutreten. Die Winkgeste erfolgt mit beidseitig erhobenen Armen und zwei raschen Handbewegungen auf den eigenen Körper zu (Abb. 2.2–2.3): Abbildung 2.1

Abbildung 2.2

Abbildung 2.3

Im weiteren Verlauf strukturiert der Stadtführer durch verbale Instruktionen und Zeigegesten die räumliche Positionierung und Konfigurierung der Gruppe. Dazu produziert er zunächst das Rahmenwechsel-Signal SO (Z. 1) und fordert die herannahenden Gruppenmitglieder auf (Z. 2), sich in seiner unmittelbaren Nähe zu

236

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

gruppieren. Die Aufforderung wird von einer lateral mit beiden Armen ausgeführten Zeigegeste begleitet (Abb. 2.4), die als zusätzliche ikonische Komponente zwei auf seinen Körper zulaufende Bögen skizziert und damit eine halbkreisförmige Konfiguration der Gruppe um ihn herum suggeriert (Abb. 2.5): Abbildung 2.4

2

SF:

Abbildung 2.5

wenn sie sich mal HIER gruppIEren,

In der nächsten Turnkonstruktionseinheit (Z. 3) spezifiziert er darüber hinaus die Richtung, in die die Gruppenmitglieder sich für die kommenden Erläuterungen visuell orientieren sollen. Dazu produziert er die lokaldeiktische Konstruktion da RÜber (Z. 3) im Verbund mit einer beidhändig ausgeführten Zeigegeste (Abb. 2.6) mit abgewandten Handflächen (Open Hand Palm Away, vgl. Kendon 2004): Abbildung 2.6

3 4 5 6 7

SF: SF:

dann (4.5) hIer ist ja noch PLATZ? (8.5) GUT;

Abbildung 2.7

6.1 Fokussierte Interaktion

237

In der anschließenden Pause von 4,5 Sekunden (Z. 4) verlässt der Stadtführer seine Position und macht ein paar Schritte nach vorne in die Gruppe hinein, woraufhin einige Gruppenmitglieder sich seitlich an ihm vorbei bewegen und beginnen, sich an der indizierten Stelle halbkreisförmig aufzustellen. Der Stadtführer, der nun seitlich zur Treppe in Lotsenposition zur Laufrichtung der Gruppe steht, begleitet das Hinzutreten weiterer Gruppenmitglieder mit Winkbewegungen der rechten Hand und der Bemerkung: hIer ist ja noch PLATZ? (Z. 5). Nach einer weiteren Pause von 8,5 Sekunden (Z. 6) steht die Gruppe im Halbkreis formiert an der erhöhten Stelle, an der der Stadtführer die stationäre Phase initiiert hat, während er selbst nun unterhalb der Gruppe einige Treppenstufen tiefer steht (Abb. 2.7). Von dort leitet er seine Ausführungen mit einem weiteren Rahmenwechselsignal (Z. 7: GUT;) ein. Sein Blick ist auf die Gruppe gerichtet und die für seinen Vortrag erforderliche fokussierte Interaktion hergestellt. Der im Vergleich zum ersten Beispiel weitaus höhere verbale und gestische Aufwand, den der Stadtführer in dieser mehrgliedrigen Sequenz aufbieten muss, ist zum einen dem topographisch komplex strukturierten und aufgrund der Treppenlage für eine Gruppenformation schwierig zu meisternden Raum geschuldet. Zum anderen ist der interaktionsräumliche Organisationsaufwand darauf zurückzuführen, dass der Stadtführer zu Beginn der stationären Phase nicht seine endgültige Position eingenommen, sondern sich zunächst als „Platzhalter“ für die Gruppe auf dem erhöhten Treppenabsatz postiert hat, um die Gruppe dort um sich zu versammeln und sich dann selbst in diametral entgegengesetzter Richtung unterhalb der Gruppe aufzustellen. Man könnte nun argumentieren, dass die fokussierte Interaktion bereits mit der Artikulation des Rahmenwechselsignal SO (Z. 1) hergestellt ist und alle nachfolgenden Handlungen als Zeigehandlungen im Rahmen der bereits etablierten fokussierten Interaktion aufzufassen sind. Allerdings geht es für den Stadtführer darum, mit der gesamten Gruppe und nicht lediglich mit einzelnen Mitgliedern in fokussierte Interaktion zu treten. Insofern stellt diese Sequenz einen sehr komplexen Fall dar, in dem zunächst der erforderliche Interaktionsraum hergestellt und so strukturiert werden muss, dass die fokussierte Interaktion zwischen dem Stadtführer und der Gesamtgruppe möglich wird. Das dritte Beispiel stammt aus dem „Mutige Mädchen“-Korpus. Im Rahmen einer besonderen Übung hat die Trainerin ein Mädchen aus der Turnhalle geschickt. In der Sequenz holt sie das Mädchen wieder herein und erteilt ihr eine Instruktion, die von einer Zeigegeste begleitet wird. Dazu verlässt die Trainerin die Mitte der Turnhalle und läuft zur Tür (Abb. 3.1), während die übrigen Mädchen sich in verschiedenen Gruppen am Rand der Turnhalle aufhalten. Sie öffnet die Tür, wirft dem draußen wartenden Mädchen einen auffordernden Blick zu (Abb. 3.2) und fordert es mit dem deiktischen Verb KOMM (Z. 1) auf, die Turnhalle wieder zu betreten. Indem das Mädchen der Aufforderung nachkommt und durch

238

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

die Tür tritt (Abb. 3.3), ist die fokussierte Interaktion für die folgende Zeigehandlung hergestellt, die die Trainerin im Rahmen ihrer Instruktion (Z. 3–4) ausführt: Beispiel 3: „Bank1“ (MM_B1_00:03:43) Abbildung 3.1

Abbildung 3.2

1 2 3 4

T:

Abbildung 3.3

KOMM, (1.3) in die mItte von der BANK sitzen, mit dem blIck in DIE richtung.

Wie in den vorherigen Beispielen zu sehen war, ist Mobilität ein wichtiger Faktor bei der Auflösung und (Wieder-)Herstellung von fokussierter Interaktion. Das vierte Beispiel aus dem „Big Brother“-Korpus zeigt, dass Mobilität nicht nur in ambulatorischen Settings wie Stadtführungen oder in Sportaktivitäten eine Rolle spielt, sondern zu den Grundbedingungen der face-to-face-Interaktion gehört. Die „Big Brother“-Bewohner haben Besuch von einem Starfriseur und seiner Assistentin bekommen und werden reihum frisiert. Nachdem der Friseur Sabrina die Haare gemacht hat, führt er sie nach draußen auf die Terrasse, um Jürgen, der dort mit den anderen Bewohnern sitzt, nach seinem Urteil zu fragen. Dazu muss er mit Jürgen in fokussierte Interaktion treten:

6.1 Fokussierte Interaktion

Beispiel 4: „zu Jürgen“ (bb71_00:24:52) Abbildung 4.1

01

Fri:

jetzt (schau)_ma Abbildung 4.3

02 03 04 05

Sbr: Fri:

oh cheRIE::;>

239

240

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

Um den übrigen Bewohnern sein Werk vorzuführen, muss der Friseur die fokussierte Interaktion mit Sabrina suspendieren und sowohl räumlich als auch partizipationsstrukturell einen neuen Interaktionsrahmen herstellen. Nach der verbalen Ankündigung, Jürgen als privilegierten Adressaten in die Bewertung (assessment)69 der neuen Frisur einzubeziehen (Z. 1), verlässt er die face-to-back-Orientierung mit Sabrina, in der er sich aktivitätsspezifisch beim Frisieren ihrer Haare befunden hat (Abb. 4.1), dreht sich um und geht weg (Abb. 4.2). Sabrina dreht sich ebenfalls um und folgt ihm (Abb. 4.3). Während die beiden in Richtung Terrassentür laufen (Abb. 4.4), produziert der Friseur mit erhöhter Lautstärke eine Fokussierungsaufforderung an Jürgen (Z. 3) und lädt ihn zur visuellen Betrachtung ein (Z. 4). Als der Friseur mit Sabrina an der Hand in einem leicht versetzten side-byside-Arrangement die Terrassentür erreicht hat (Abb. 4.5), wiederholt er die an Jürgen adressierte Fokussierungs- (Z. 5) und Betrachtungsaufforderung (Z. 7). Die Wiederholung wird aufgrund der mittlerweile verminderten räumlichen Distanz mit geringerer Lautstärke produziert und ist durch eine 0,4-sekündige Pause (Z. 6) zwischen Fokussierung- und Betrachtungsaufforderung gekennzeichnet, die Sabrinas Durchschreiten der Terrassentür als effektvollen Bühneauftritt markiert (Abb. 4.5). Die Bewohner reagieren gemeinsam mit einem in steigend-fallender Intonation produzierten assessment-Marker (Z. 8: a:::h), während Jürgen als Fokussierungsbestätigung aufsteht, auf Sabrina und den Friseur zuläuft (Abb. 4.6) und die Betrachtungs- und Bewertungsaufforderung mit einer ironisch stilisierten Bekundung erotischer Bewunderung beantwortet (Z. 9–10). Wie in der im Theorieteil (4.1) behandelten Sequenz löst der Adressat auch hier verschiedene Aufgaben zugleich: Die Fokussierungs-, Betrachtungs- und Bewertungsaufforderungen, die vom Friseur als konditionelle Relevanzen sequenziell aufgebaut wurden und als Adressatenhandlungen Fokussierungsbestätigung, körperliche Reorientierung, visuelle Wahrnehmung und Bewertung des Wahrgenommenen projizieren, werden gemeinsam abgearbeitet. Zusammenfassend lässt sich festhalten, dass die fokussierte Interaktion die Voraussetzung und den übergeordneten, wahrnehmungs- und aufmerksamkeitsstrukturellen Rahmen bildet, innerhalb dessen ein Sprecher eine deiktische Orientierungshandlung vornehmen kann. In dieser Funktion ist die fokussierte Interaktion logisch allen anderen Parametern vorgeschaltet. Was jedoch die temporalen Aspekte ihrer Herstellung in Relation zu anderen Parametern angeht,

69 Vgl. zu assessments Auer und Uhmann (1982); Goodwin und Goodwin (1987, 1992); Mondada (2009); Oswaldsson (2004); Pomerantz (1984); Postholm (2006).

6.2 Verweisraum

241

hat die empirische Analyse unterschiedliche sequenzielle Realisierungsformate ermittelt, in denen sich lokale, situations-, gattungs- und aktivitätsspezifische, räumliche und teilnehmerstrukturelle Interaktionsbedingungen manifestieren. Die erste Gruppe bilden Fälle, in denen die Herstellung fokussierter Interaktion einen klar von den anderen Herstellungsaktivitäten getrennten Schritt darstellt und dadurch als Parameter mit einer eigenständigen sequenziellen Position etabliert und analytisch zugänglich wird. Besonders deutlich wurde dies an Beispielen aus den beiden Subkorpora „Stadtführungen“ und „Mutige Mädchen“, in denen der Wechsel zwischen mobilen und stationären Phasen und den sich ständig ändernden Interaktionsräumen ein spezifisches Anforderungsprofil für die Organisation fokussierter Interaktion darstellt. Gegenüber der ersten Gruppe zeichnet sich die zweite Gruppe durch eine funktionale Verdichtung im sequenziellen Ablaufformat aus. So ist festzustellen, dass der adressatenseitige Paarteil zur Herstellung fokussierter Interaktion – nämlich auf die Fokussierungsaufforderung eine verbale und/oder kinesische Fokussierungsbestätigung zu produzieren – häufig zugleich mit der Bearbeitung weiterer Parameter realisiert wird. In denjenigen Fällen, in denen Fokussierungsund Betrachtungsaufforderung vom Sprecher als Paket formuliert und unmittelbar an den emergierenden gestischen Zeigeakt geknüpft werden, bilden auch die konditionell relevant gesetzten Reaktionen des Adressaten ein Aktionspaket. Projektionsaufbauende, sprecherseitige Handlung und projektionsabarbeitende adressatenseitige Handlung entsprechen sich in dieser funktionalen Verdichtung.

6.2 Verweisraum Um die beteiligungsspezifischen Unterschiede zwischen Zeigendem und Adressaten in einer Zeigehandlung zu erfassen, wurde im theoretischen Teil das von Goodwin (2003a: 221) entwickelte domain of scrutiny-Konzept in zwei perspektivisch komplementäre Konzepte, das des Verweisraums (Zeigender) und das des Suchraums (Adressat) ausdifferenziert. Grundlage dieser theoretischen Unterscheidung bildete die Feststellung, das Zeigende sich, wenn sie ihre Adressaten auf eine sichtbare Entität hinweisen wollen, zunächst selbst im Raum orientieren und eine vorgängige Fokussierung vornehmen müssen. Die Selbstorientierung ist funktionaler Bestandteil des sequenziellen Ablaufformats von Zeigehandlungen und stellt eine intrapersonelle Koordinationshandlung (Deppermann und Schmitt 2007) dar. Im Rahmen des in Kapitel 4 vorgestellten Modells wurde daher der Terminus Verweisraum als Konzept für den Raum eingeführt, der das Zeigeziel enthält und auf den Zeigende sich perzeptorisch, räumlich und kogni-

242

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

tiv orientieren, wenn sie die Aufmerksamkeit eines Interaktionspartners durch eine deiktische Zeigehandlung entsprechend steuern wollen. Gegenüber dem aus der Perspektive des Zeigenden konzeptualisierten Verweisraum wurde komplementär dazu mit dem Konzept des Suchraums die Perspektive des Adressaten auf den Raum modelliert, in dem er das Zeigeziel aufzufinden hat. Verweisräume als Räume, auf die Zeigende sich orientieren, wenn sie eine Zeigehandlung durchführen wollen, erhalten erst dadurch, dass sie für den Adressaten durch eine deiktische Orientierungshandlung relevant gesetzt und perzeptorisch in deren Aufmerksamkeitsfokus gerückt werden, den Status des Suchraums (vgl. dazu die empirischen Analysen in Kapitel 6.5). Die folgenden Analysen führen unterschiedliche sequenzielle Formate vor, in denen die Herstellung des Verweisraums durch die visuelle Orientierung des Zeigenden empirisch nachweisbar wird. Die erste Sequenz bildet die Fortsetzung des bereits aus dem vorigen Kapitel (6.1) bekannten Beispiels „alle da“ aus dem Korpus der Stadtführungen. Die Beteiligten befinden sich in der stationären Phase und stehen in einer Halbkreisformation der Stadtführerin gegenüber. Nachdem die Stadtführerin durch die Frage (si_mer) alle DA? (Z. 1) die fokussierte Interaktion hergestellt hat (vgl. Kapitel 6.1), steht sie vor der Aufgabe, die Aufmerksamkeit der Gruppe auf das nächste Anschauungsobjekt zu lenken. Dazu orientiert sie sich in der anschließenden Pause (Z. 2) zunächst selbst im umgebenden Raum. Mit jeweils einer halben Drehung ihres Oberkörpers (vgl. zum body torque Schegloff 1998a) blickt sie zuerst nach links (Abb. 1.1) und dann nach rechts (Abb. 1.2): Beispiel 1: „alle da“ (StFB1_00:09:42)

01

TF:

(si_mer) alle DA? Abbildung 1.1

02 03

(3.0) also.

Abbildung 1.2

6.2 Verweisraum

243

Die von der Stadtführerin mit einer großräumigen und schnellen Oberkörper drehung vollzogene Selbstorientierung stellt eine intrapersonelle Koordinationshandlung dar. Allerdings kann eine solche Selbstorientierung zugleich als Dokumentation gegenüber den Adressaten fungieren, welche nicht nur eine nächste Handlung projiziert, sondern auch bereits Hinweise auf den wahrzunehmenden Raum enthält. Der interpersonelle Koordinierungseffekt eines solchen selbstorganisatorischen Wahrnehmungsakts, der darin besteht, dass die Selbstorganisation von Anderen wahrgenommen und nachvollzogen werden kann, wird hier an der zeitversetzten Reorientierung der jungen Frau im Vordergrund (Abb. 1.2) deutlich. Im zweiten Beispiel wird das sequenzielle Ablaufformat zwischen fokussierter Interaktion und der Herstellung des Verweisraumes variiert. Während die Stadtführerin im vorangegangenen Beispiel mit der Vergewisserungsfrage si_mer alle DA? die fokussierte Interaktion wiederhergestellt hat, bevor sie sich selbst auf den nächsten Verweisraum orientierte, nimmt die Stadtführerin im nächsten Beispiel zuerst den künftigen Verweisraum in den Blick, bevor sie die fokussierte Interaktion wiederherstellt. Die Gruppe hat einen neuen Standort erreicht. Während die Stadtführerin darauf wartet, dass sich die Gruppenmitglieder räumlich rekonfigurieren, wendet sie sich von der Gruppe ab und blickt in die entgegengesetzte Richtung über eine Mauer hinweg an einen entfernten Ort. Abbildung 2.1 zeigt die Körperorientierung und den „wissenden Blick“ der Stadtführerin, mit dem sie den Verweisraum für das nächste Anschauungsobjekt herstellt. Es handelt sich um einen selbstorganisatorischen Blick, der die Funktion intrapersoneller Koordinierung erfüllt und der Stadtführerin dazu dient, das entsprechende Anschauungsobjekt zu lokalisieren, bevor sie es der Gruppe zeigen kann: Beispiel 2: „diese drei Häuser“ (StFLing1_00:29:02)

Abbildung 2.1

Abbildung 2.2

244

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

Beispiel 2 (Fortsetzung) Abbildung 2.3

Abbildung 2.4

Abbildung 2.5

1

SF:

hhh w ANschauen,

Anschließend dreht sie sich um und wendet sich wieder der Gruppe zu (Abb. 2.2). Nun kann sie wahrnehmen, dass sich die ihr gegenüberstehenden Gruppenmitglieder ebenfalls in die entsprechende Richtung orientieren. Dabei folgen die Blicke der Gruppenmitglieder vage der Blickrichtung der Stadtführerin, ohne dass sie jedoch bereits genau wüssten, was es im Einzelnen zu sehen gibt (Abb. 2.3). Insofern die Gruppenmitglieder die selbstorganisatorische Blickorientierung der Stadtführerin wahrgenommen haben, können sie diese als räumlichen Vektor auf den Suchraum eines künftigen Anschauungsobjekts nutzen. Im nächsten Schritt schaut die Stadtführerin ein weiteres Mal in dieselbe Richtung und stellt damit erneut den Verweisraum her. Dieses Mal nimmt sie jedoch keine vollständige körperliche Reorientierung vor, sondern dreht lediglich

6.2 Verweisraum

245

den Kopf und wirft einen Blick über die Schulter (Abb. 2.4). Die Selbstorientierung der Stadtführerin gewinnt erst dann interaktive Relevanz, wenn sie von den Gruppenmitgliedern als Anzeichen einer prospektiven visuellen Ko-Orientierung aufgefasst wird, die als gemeinsam herzustellende eine ganz bestimmte räumliche Positionierung der Gruppe projiziert. Als alle Gruppenmitglieder angekommen sind und eine halbkreisförmige Konfiguration gebildet haben, stellt die Stadtführerin die fokussierte Interaktion her, indem sie hörbar einatmet (Z. 1), simultan dazu eine Zeigegeste über die eigene Schulter nach hinten vollführt (Abb. 2.5) und dann mit ihren Ausführungen beginnt. Da sich die Stadtführerin bereits in der durch das Warten zeitlich zerdehnten Phase der Verweisraumherstellung vergewissert hat, dass die Adressaten sie wahrnehmen, kann sie auf eine verbale Fokussierungsaufforderung oder ein Rahmenwechselsignal verzichten. Stattdessen fällt hier die Herstellung fokussierter Interaktion mit der Herstellung des verweisenden Körpers (vgl. Kapitel 6.3) und dem Einsatz der Zeigegeste (vgl. Kapitel 6.4) sequenziell zusammen. Das dritte Beispiel aus dem Korpus der Stadtführungen unterscheidet sich von den beiden vorangegangenen Sequenzen dadurch, dass hier die Herstellung des Verweisraums für eine Zeigehandlung nicht zu Beginn, sondern am Ende einer stationären Phase stattfindet. Die Beteiligten sind seit geraumer Zeit in fokussierter Interaktion miteinander. Diese wird in der Folge dadurch aufgelöst, dass der Stadtführer nach einer 0,6-sekündigen Pause (Z. 1), die den Abschluss des Themas markiert, den künftigen Wegabschnitt verbal und gestisch skizziert und sich anschließend in Bewegung setzt: Beispiel 3: „hier weiter“ (StFLIng2_00:04:11) Abbildung 3.1

1

(0.6)

Abbildung 3.2

246

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

Beispiel 3 (Fortsetzung)

Abbildung 3.3

2 3 4

SF:

wir gehen jetzt (-die trEppe herRUNter? zum (.) kanale GRANde.

Mit der Beendigung seiner Ausführungen (Abb. 3.1) dreht der Stadtführer in der 0,6-sekündigen Pause Oberkörper und Kopf nach rechts, macht mit dem linken Fuß einen Schritt zurück und blickt über die Mauer in Richtung eines entfernten Ortes (Abb. 3.2). Auf diese Weise orientiert er sich zunächst selbst im umgebenden Raum und konstituiert einen künftigen Verweisraum, bevor er sich wieder der Gruppe zuwendet. Die Körperdrehung setzt sich über den Beginn des neuen Redezugs (Z. 2) fort. Dabei wird der rechte Fuß einen Schritt nach hinten platziert, so dass der ganze Körper eine geeignetere Position im Hinblick auf den neuen Raum einnimmt (Abb. 3.3). Als seine Selbstorientierung abgeschlossen ist, führt der Stadtführer aus der Drehbewegung heraus mit dem rechten Arm eine Zeigegeste aus. Das nächste Beispiel aus dem „Big Brother“-Korpus zeigt eine alltägliche Situation am Frühstückstisch. Die beiden Gesprächspartner befinden sich in fokussierter Interaktion. Sie unterhalten sich über die Rücksichtslosigkeit einiger Mitbewohner, die ihren Müll liegenlassen und sich nicht am Putzen beteiligen. Zlatko (Zlt) beschwert sich über den verdreckten Zustand des Wohnraums, den er saugen wollte, da er normalerweise barfuß herumläuft. Dass er vor allem den Fußboden meint, verdeutlicht er mit einer auf den Boden weisenden Zeigefingergeste, die zusammen mit dem proximalen Lokaldeiktikon hier realisiert wird. Entscheidend für die analytische Isolierung der Verweisraumherstellung ist die Feststellung, dass der Sprecher bereits zu Beginn seiner zweiten Äußerungseinheit den Blick vom Adressaten abwendet und auf den Boden richtet:

6.2 Verweisraum

247

Beispiel 4: „barfuß“ (bb01_B_00:05:16)

1

Zlt:

ich wollt heut SAUgenAbbildung 1.1

2

(---) Abbildung 1.1

3

Abbildung 1.2

weil ICH lauf noch hier

In der Pause (Z. 2) ist der Blick des Sprechers auf seinen Adressaten gerichtet (Abb. 4.1). Simultan zur Artikulation des selbstreferenziellen Personalpronomens (Z. 3: ICH) reorientiert er seinen Blick auf den Verweisraum (Abb. 4.2), auf den er im weiteren Verlauf auch zeigen wird. Die Herstellung des Verweisraums geschieht also, bevor der zeigende Arm die Ruheposition verlässt (vgl. zur Analyse der Zeigegeste Kapitel 6.4). Anders als in den Beispielen aus dem Stadtführungskorpus, in denen die Herstellung des Verweisraums häufig so ostentativ geschah, dass ihr eine der interpersonellen Koordinierung dienende Display-Qualität zukam, stellt der Sprecher im vorliegenden Fall den Verweisraum en passant her. Auch in der nächsten Sequenz geschieht die Herstellung des Verweisraums en passant. Das Beispiel stammt aus dem Kochshow-Korpus. Poletto erläutert die

248

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

Schritte, die für die Zubereitung von Lasagne nötig sind. Sie steht mit ihrem Gast in einem side-by-side-Arrangement hinter dem Kochtisch. Zwischen ihnen steht eine Nudelmaschine auf dem Tisch. Im nächsten Schritt soll der Nudelteig ausgerollt und mit einer Nudelmaschine weiter verarbeitet werden – eine Aufgabe, die Poletto ihrem Gast zugedacht hat, der mit einem humorvollen Kommentar über die Nudelmaschine reagiert: Beispiel 5: „an dieser Maschine“ (PK1_00:01:32)

1 2 3

PL: BS:

den rOllen [wir hier gleich AUS, [ja KLAR; (.) da kann man sich am BESten zum idioten Abbildung 5.1

Abbildung 5.2

machen; (-) Abbildung 5.3

4

Abbildung 5.4

an DIEser maschine;

Nachdem Poletto den nächsten Handlungsschritt angekündigt hat (Z. 1), äußert ihr Gast humorvoll die Befürchtung, sich bei der zugedachten Tätigkeit zu bla-

6.2 Verweisraum

249

mieren (Z. 2–3). Zur Präzisierung expandiert sie ihren Redebeitrag um eine von einer Zeigegeste begleiteten Präpositionalphrase (Z. 4: an DIEser maschine;), die die Nudelmaschine visuell und thematisch in den Fokus rückt. Während sie dabei ist, die Äußerungseinheit (Z. 3: da kann man sich am BESten zum idioten machen;) abzuschließen, stellt sie mit dem Blick bereits den Verweisraum her (Abb. 5.1). Erst danach bewegt sie ihren Arm aus der Ruhelage (Abb. 5.2) und führt im Verbund mit dem akzentuierten, proximalen Demonstra tivpronomen DIEser (Z. 4) die Zeigegeste aus (Abb. 5.3). Anschließend zieht sie ihren Arm zurück und richtet den Blick vom Demonstratum auf die Adressatin, die ihrerseits ihre visuelle Aufmerksamkeit auf die Nudelmaschine reorientiert (Abb. 5.4). Auch das letzte Beispiel aus dem Kochkorpus belegt, dass Sprecher in einer emergierenden Äußerung mit dem Blick bereits den Verweisraum herstellen, bevor sie den deiktisch-gestischen Zeigeakt vollziehen. Poletto hat angekündigt, dass sie zusammen mit ihrem Gast, Ingo Naujoks, eine Gorgonzolasauce machen wird. Naujoks reagiert zunächst mit einem Verstehensdisplay, das sich auf die dazu verwendete Käsesorte bezieht, und entdeckt dann den entsprechenden Käse auf der Arbeitsplatte. Die Entdeckung des Käses wird von einer Zeigegeste begleitet und dadurch in den Fokus gerückt: Beispiel 6: „Gorgonzola“ (PK2_00:21:12) Abbildung 6.1

1 2

IN:

Abbildung 6.2

gorgonzO der sEhr sEhr-= Abbildung 6.3

Abbildung 6.4

250 6 Empirische Untersuchungen zu den Parametern der Zeigehandlung 1 IN: gorgonzO

2 der sEhr sEhr-= Beispiel 6 (Fortsetzung) Abbildung 6.3

3 4 5 6

Pol: Na: Pol:

Abbildung 6.4

[=ah DA; (.) [ja:, [DA is_er.] [es gIbt ver]SCHIEdene; ne? (.)

Nachdem Poletto angekündigt hat Gorgonzolasauce zuzubereiten, dokumentiert Naujoks sein Verstehen, indem er eine generische Erklärung der Käsesorte beginnt (Z. 1: gorgonzOla ist dieser (.) KÄse;). Das Demonstrativpronomen fungiert in dieser Äußerung nicht als deiktisches Verweismittel, sondern als Indexikalitätsmarker (Auer 1981b, 1984)70, der die Unsicherheit des Sprechers daraufhin enkodiert, ob der fragliche Ausdruck zur Referenzherstellung ausreicht. Dabei blicken Sprecher und Adressatin einander an (Abb. 6.1). Der Erklärversuch wird mitten im Relativsatz abgebrochen (Z. 2: der sEhr sEhr-) und durch eine ostensive Definition auf das entsprechende Exemplar auf dem Kochtisch ersetzt. Das vollzieht sich wie folgt: Während er den Relativsatz formuliert, beginnt der Sprecher seinen Blick auf den Kochtisch zu reorientieren. Noch vor der Produktion des syntaktisch projizierten Adjektivs unterbricht er seine Erkläraktivität. Der Abbruch markiert den Moment, in dem er den Gorgonzola auf dem Kochtisch entdeckt und damit den Verweisraum für den unmittelbar folgenden Zeigeakt hergestellt hat (Abb. 6.2).

70 Vgl. auch Halliday und Hasan (1976: 57–76), die den Terminus recognitional use verwenden; sowie Himmelmann (1996: 206; 1997: 61), der in solchen Fällen von anamnestischem Gebrauch spricht.

6.2 Verweisraum

251

Der Zeigeakt wird eingeleitet, indem der Sprecher ein change of state token (Heritage 1984) artikuliert (Z. 3: ah), das mit dem Beginn der Zeigegeste zusammenfällt (Abb. 6.3) und seine durch die visuelle Wahrnehmung veränderten Voraussetzungsstrukturen dokumentiert. Es wird gefolgt von dem akzentuierten, gestisch verwendeten Lokaladverb DA (Z. 3), das zusammen mit der Zeigegeste die visuelle Aufmerksamkeit der Adressatin (sowie der lateral adressierten Fernsehkameras, Studio- und Fernsehzuschauer) relevant setzt und auf einen bestimmten Suchraum lenkt (Abb. 6.4). An diesem Beispiel werden erneut die methodischen Vorteile einer interaktionslinguistisch fundierten Sequenzanalyse für die Untersuchung der Deixis deutlich, denn sie ermöglicht Erkenntnisse über online-Prozesse, die anderen Ansätzen verwehrt bleiben. So ermöglicht die vollzugsrekonstruktive Analyseperspektive, den Abbruch (Z. 2) zunächst als Ausdruck der intrapersonellen Koordinierungs- und Planungsaktivitäten des Sprechers im Vollzug und das anschließende change of state token (Z. 3: ah) als interaktives Mittel zur Dokumentation der plötzlich veränderten Voraussetzungsstrukturen zu begreifen, welches ebenso wie das folgende Lokaldeiktikon (Z. 3: ah DA;) und die Zeigegeste der neu zu gestaltenden interpersonellen Koordinierung dient. Zusammenfassend lässt sich festhalten, dass die selbstorientierende Herstellung des Verweisraums die Bedingung für die vom Zeigenden durch den deiktischen Zeigeakt zu leistende Fremdorientierung darstellt. Dies gilt unabhängig davon, ob die Selbstorientierung auf den Verweisraum in andere körperliche Handlungsabläufe eingebettet ist und en passant geschieht wie in den Beispielen 4 bis 6 oder ob sie mit einem so hohen körperlichen Aufwand bewerkstelligt wird, dass sie eine räumliche Projektionskraft für die Interaktionspartner gewinnt, wie dies in den Beispielen 1 bis 3 der Fall war. Wie am zweiten Beispiel zu sehen war, kann die Verweisraumherstellung unter Umständen sogar noch vor der Herstellung fokussierter Interaktion vollzogen werden, so dass es zu lokal bedingten sequenziellen Variationen im multimodalen Ablaufformat der Zeigehandlung kommt. Bei der Unterscheidung zwischen der Herstellung des Verweisraums durch Blickbewegungen, die der Zeigende für sich selbst, d. h. zur intrapersonellen Koordinierung, vollzieht, und Blickausrichtungen, die zum Zeigen, Identifizieren, Lokalisieren für Andere und damit explizit zur Interaktionssteuerung eingesetzt werden, sind die Grenzen nicht immer eindeutig zu ziehen. So lässt sich bei der Verweisraumherstellung durch den Zeigenden ein Kontinuum vom en passant-Vollzug bis hin zum ostentativen Blickeinsatz feststellen. An dieser Stelle werden die Übergänge zum Zeigen mit dem Blick fließend. Entscheidend ist der funktionale Unterschied, der darin besteht, dass die räumlich-vektorielle Projektionskraft, die bei der intrapersonellen Verweisraumherstellung das Nebenpro-

252

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

dukt einer öffentlich, für Andere sichtbar vollzogenen Selbstorientierung darstellt, beim Zeigen mit dem Blick interpersonell koordiniert und modelliert wird (vgl. dazu ausführlich Kapitel 5.5.2).

6.3 Verweisender Körper Wie im theoretischen Teil (Kapitel 4.3) dargelegt wurde, müssen Sprecher, die einen Adressaten durch eine Zeigehandlung auf ein Drittes orientieren wollen, ihren Körper als semiotisch relevante Ausdrucksressource in den visuellen Aufmerksamkeitsfokus des Adressaten rücken. Für den Adressaten besteht die Anforderung darin, anhand der körperlichen Displays des Zeigenden dessen Körper als semiotisch-perzeptorisches Zwischenglied, d. h. als Mittel zum Zweck und nicht als das eigentliche Ziel seiner Aufmerksamkeitsausrichtung zu erkennen. Darin liegt der funktionale Unterschied zwischen der Ich- und der Hier-Deixis. Im Folgenden werden ausschließlich Fälle betrachtet, in denen auf Objekte bzw. Räume gezeigt wird. Die Analyse des Zeigens auf das Selbst erfolgt in Kapitel 7.1 zur Personendeixis, während die zusätzlichen Anforderungen beim Zeigen am eigenen Körper in Kapitel 7.2 analysiert werden. Das erste Beispiel (vgl. nächste Seite) stammt aus dem Korpus der Stadtführungen. Der Stadtführer hat soeben ein Thema beendet und wendet sich einem neuen Gegenstand zu. Er dreht sich um, fasst einen neuen Verweisraum ins Auge und stellt mit einem Zeigeakt das neue Referenzobjekt her. Das gestaltet sich folgendermaßen. Nachdem er seine Ausführungen beendet hat, steht der Stadtführer in einer face-to-face-Orientierung zu seiner Gruppe (Abb. 1.1). In der Pause von 1,6 Sekunden (Z. 1) vollzieht er mit dem Körper eine Drehung um 180 Grad, bis er mit dem Rücken zur Gruppe steht. Bereits im Verlauf seiner Drehung (bei ca. 90 Grad) richtet er seinen Blick auf den Verweisraum (Abb. 1.2). und hält diese Blickorientierung aufrecht, bis er seine neue Position im Raum eingenommen hat (Abb. 1.3). Wie auf Abbildung 1.2 zu sehen ist, richtet die rechts vorn im Bild zu sehende Teilnehmerin ihren Blick in dem Moment auf den Stadtführer, als dieser seine Körperdrehung auszuführen beginnt. In der neu eingenommenen back-to-face-Orientierung bewegt der Stadtführer seinen linken Arm nach oben. Dabei ist sein Blick weiterhin auf den Verweisraum gerichtet (Abb. 1.4). Zu diesem Zeitpunkt hat er seinen Körper bereits als relevante, von den Adressaten wahrzunehmende Ausdrucksressource hergestellt. Ausschlaggebend dafür ist die Tatsache, dass eine aus der fokussierten Interaktion heraus vollzogene Körperdrehung in die face-to-back-Konfiguration ein markantes Mittel darstellt, die Aufmerksamkeit der Adressaten auf den

6.3 Verweisender Körper

253

Beispiel 1: „zu diesem Bau“ (StFLing2_00:21:41) Abbildung 1.1

1

(1.6-----------------------------------------------------------------------------) Abbildung 1.3

2

Abbildung 1.2

SF:

Abbildung 1.4

zu DIEsem bau noch,

eigenen Körper zu lenken und eine künftige Handlung zu projizieren. Dafür, dass der Körper des Zeigenden nicht als Ziel der Aufmerksamkeit, sondern als perzeptorisch-intermediär und instrumentell wahrgenommen wird, ist die Temporalität seiner Aktivitäten entscheidend. Die Simultaneität von Drehung und Blickausrichtung macht deutlich, dass die Drehung der visuellen Wahrnehmung untergeordnet ist und zu ihrem Zweck erfolgt. All dies vollzieht sich in der Pause von 1,6 Sekunden. Im Kontext des von den Teilnehmern geteilten Wissens über gattungsspezifische Aktivitäten und Partizipationsstrukturen einer Stadtführung werden die körperlichen Displays des Stadtführers als Kontextualisierungshinweise auf eine

254

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

im nächsten Schritt zu erwartende Zeigehandlung lesbar. Wie in Kapitel 6.3 dargelegt wurde, können selbstorientierende Handlungen des Zeigenden, sofern sie öffentlich sichtbar bzw. ostentativ vollzogen werden, von den Adressaten als eine den künftigen Wahrnehmungsraum projizierende Ressource genutzt werden. Anhand der unterschiedlichen Orientierungen der Teilnehmerinnen (Abb. 1.4.) lassen sich auch adressatenseitig unterschiedliche Stadien im Ablaufformat der Zeigehandlung nachvollziehen. Während die vorne im Bild befindliche Teilnehmerin zum Stadtführer blickt und dessen körperliche Aktivitäten wahrnehmen kann, richtet die ihr gegenüberstehende Teilnehmerin hinten im Bild ihren Blick auf den aus der Orientierung des Stadtführers extrapolierten künftigen Anschauungsraum. In der Simultaneität ihrer unterschiedlichen Orientierungen – auf den Stadtführer einerseits und auf den gestisch noch nicht konstituierten, aber durch die Verweisraumherstellung des Stadtführers extrapolierten Wahrnehmungsraum – verkörpern die beiden Teilnehmerinnen nicht nur das logische Ablaufformat der Zeigehandlung, sondern auch die Tatsache, dass sich die analytisch unterschiedenen Phasen im realen Handlungsvollzug überlagern. Seitens des Zeigenden fallen in diesem Beispiel die selbstorganisatorische Herstellung des Verweisraums und die interaktive Relevantsetzung des eigenen Körpers als semiotische Ausdrucksressource zusammen. Die Teilnehmerinnen reagieren auf beides. An diesem Beispiel wird erneut sichtbar, dass die im theoretischen Modell analytisch herausgearbeiteten Parameter im realen Interaktionsvollzug nicht immer isoliert in Erscheinung treten, sondern sich temporal überlagern und funktional ineinander greifen können. So wie in Fällen, in denen die fokussierte Interaktion noch nicht etabliert ist, die Herstellung fokussierter Interaktion mit der Herstellung des verweisenden Körpers des Zeigenden zusammenfallen kann, können in Fällen, in denen aus der fokussierten Interaktion heraus eine Zeigehandlung initiiert wird, die Herstellung des Verweisraums und die Herstellung des verweisenden Körpers des Zeigenden zusammenfallen. Auch im nächsten Beispiel dient eine ostentative Körperdrehung des Stadtführers dazu, die Aufmerksamkeit der Interaktionspartner auf seinen Körper zu lenken. Die Gruppe befindet sich in einer erhöhten Gartenanlage, die durch eine Mauer gegen den tiefer liegenden Stadtteil abgegrenzt ist. Der Stadtführer erläutert, wie die Gartenanlage durch die Entscheidung der Stadt entstanden ist, einen ehemaligen Parkplatz zu entfernen, und weist die Gruppenmitglieder auf einen unterhalb der Gartenanlage befindlichen Kanal hin. Diesen können die Teilnehmer zum Sprechzeitpunkt zwar nicht sehen, aber akustisch durch das Rauschen des Wassers wahrnehmen:

6.3 Verweisender Körper

255

Beispiel 2: „rauschen hören“ (StFLing2_00:02:29)

01

SF:

die entSCHEIdung also-

Abbildung 2.1

02 03 04 05 06

Abbildung 2.2

Abbildung 2.3

das heilige BLECH(la) HIER(-) zu entFERnen, und stattDESsen, relativ AUFwendig, und

hh

Abbildung 2.4

07

diese ANlage-

Während der Erläuterungen steht die Gruppe in einer lockeren, kreisförmigen Konfiguration um den Stadtführer herum, der sich mit dem Rücken zur Mauer und dem tiefer liegenden Areal positioniert hat (Abb. 2.1). Der Stadtführer erzählt

256

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

Beispiel 2 (Fortsetzung) Abbildung 2.5

08

Abbildung 2.6

DESsen, Abbildung 2.7

09 10

was sie hIer U WITtelsbacher brunnen,

von der Entscheidung der Stadt, einen Parkplatz mit Autos – ironisierend als heiliges BLECH(la) (Z. 2) bezeichnet – durch die Gartenanlage zu ersetzen, in der die Gruppe sich gerade befindet. In Zeile 7 kommt er auf die Gartenanlage zurück und stellt im Folgenden eine räumliche Beziehung zwischen der Gartenanlage und den zum Sprechzeitpunkt nicht sichtbaren Wasseranlagen im tiefer gelegenen Stadtteil (Z. 8–10) her. So ist die Gartenanlage zum einen an der Stelle eines früheren Parkplatzes entstanden. Dies verdeutlicht er mit einer Zeigegeste, die er mit einer seitlichen oHHv-Bewegung ausführt (Abb. 2.1–2.3) und die indiziert, dass sich das korrelierende proxi-

6.3 Verweisender Körper

257

male Lokaldeiktikon HIER (Z. 2) auf den augenblicklichen Standort der Gruppe bezieht. Zum anderen bildet die Gartenanlage auch eine Verbindung zu einer anderen Anlage: der anlage mit dem WITtelsbacher brunnen (Z. 10). Diese ist nicht weit vom gegenwärtigen Standort der Gruppe entfernt, wie der Stadtführer im weiteren Verlauf erläutert. Dazu verwendet er das Demonstrativum DESsen (Z. 8), das eine kataphorische Funktion im Hinblick auf den nachfolgenden Relativsatz hat, der wiederum die lokaldeiktische Konstruktion hIer Unten (Z. 9) und einen Hinweis auf die akustische Wahrnehmbarkeit (Z. 9: RAUschen hören) des Wassers enthält. Zusammen mit der Zeigegeste, die bereits gemeinsam mit dem kataphorischen Demonstrativum DESsen (Z. 8) realisiert wird, stellt die lokaldeiktische Konstruktion als nicht sichtbares, aber hörbares Zeigeziel das Wasser der Wittelsbacher Brunnenanlage her. Um seinen Körper als visuell wahrzunehmende, semiotische Ressource in den Aufmerksamkeitsfokus seiner Adressaten zu rücken, markiert der Stadtführer sowohl vokal als auch visuell einen deutlichen Einschnitt am Ende der Nominalphrase diese ANlage- (Z. 7). Die gleich bleibende Intonation projiziert zunächst eine Fortsetzung, die allerdings durch die Mikropause und das anschließende Einatmen verzögert wird. Die nächste Turnkonstruktionseinheit I:n FORTsetzung DESsen (Z. 8) setzt mit deutlich erhöhter Lautstärke ein. Zudem erhält die Präposi tion I:n einen Nebenakzent und eine Dehnung. Simultan zur Artikulation der auffällig akzentuierten und gedehnten Präposition beugt der Stadtführer die Knie (Abb. 2.5). Akzentuierung und Vokaldehnung markieren und begleiten die körperliche Bewegung, vokale und visuelle Emphase kontextualisieren und verstärken sich gegenseitig mit dem Effekt, dass nun weitere Teilnehmer zum Stadtführer schauen (die zwei Teilnehmer rechts in Abb. 2.5 in Kontrast zu Abb. 2.4). Wie an der Blickorientierung des Stadtführers in Richtung der beiden zuvor anders orientierten Teilnehmer zu erkennen ist, nimmt er deren Wahrnehmung seiner Person wahr. Im nächsten Schritt vollführt der Stadtführer aus der Kniebeuge-Position heraus eine ostentative Drehung des Oberkörpers nach links. Dabei schaut er nicht mehr zu den Gruppenmitgliedern, sondern blickt, nachdem er sich zuvor ihrer visuellen Aufmerksamkeit vergewissert hat, in Richtung des Verweisraums (Abb. 2.6). Wie im vorherigen Beispiel mündet die Drehbewegung in eine Zeigegeste (Abb. 2.7), die als vektoriell spezifiziertes Verweisinstrument ausführlich in Kapitel 6.4 diskutiert wird. In diesem Fall ist das multimodale Ablaufformat so gestaltet, dass die Herstellung des verweisenden Körpers des Zeigenden der Herstellung des Verweisraumes sequenziell vorausläuft. Hier wird erneut erkennbar, dass eine vom Zeigenden sichtbar vollzogene Selbstorientierung auf den Verweisraum von den Adressaten wahrgenommen und nicht nur als Kontextualisierungshinweis auf die nächste Handlung, sondern auch als direktionales Verweismittel genutzt werden kann.

258

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

Im dritten Beispiel aus einer anderen Bayreuther Stadtführung steht die Stadtführerin zusammen mit ihrer Gruppe auf den Stufen der Schlosskirche und erzählt von der Zerstörung und dem Wiederaufbau des Gebäudes, das in seiner gegenwärtigen Gestalt nicht unmittelbar als Gotteshaus zu erkennen ist. Einziger Indikator dafür ist das Kreuz über der Tür, auf das die Stadtführerin ihre Gruppe mit einer Zeigegeste hinweist: Beispiel 3: „das Kreuz hier“ (StFB1_00:25:53)

01 02

SF:

und (-) e:h- (.) wenn man (1.0) die schlOsskirche so von -) Abbildung 3.1

03 04

erkennt man nIcht (-) GLEICH,

Abbildung 3.2

05 06

wenn das krEuz - (.)

Abbildung 3.3

6.3 Verweisender Körper

259

Die Stadtführerin steht mit dem Rücken zur Schlosskirche und ist auf die im Halbkreis um sie herum stehende Gruppe orientiert (Abb. 3.1). Im weiteren Verlauf macht sie die Gruppe auf ein Kreuz aufmerksam, das oberhalb der Kirchentür als einziges, von außen sichtbares Zeichen einen Hinweis auf den sakralen Charakter des Gebäudes liefert. Um ihren Zeigeakt erfolgreich ausführen zu können, muss sie ihren Körper als visuell wahrzunehmende Ausdrucksressource etablieren. Dies geschieht, indem sie zu Beginn der neuen Turnkonstruktionseinheit (Z. 5) zunächst ihren Oberkörper von der Gruppe abwendet und sich visuell auf die rückwärtig gelegene Schlosskirche orientiert (Abb. 3.2). Erst dann produziert sie mit dem linken Arm eine Zeigegeste in Richtung des Suchraums (Abb. 3.3). Wie in den zuvor analysierten Beispielen stellen auch hier der sequenziell an der Schaltstelle eingesetzte body torque (Schegloff 1998a) zusammen mit der Reorientierung in Richtung Verweisraum die entscheidenden Kontextualisierungshinweise auf die Relevanz des eigenen Körpers als perzeptorisch-intermediäre, semiotische Ausdrucksressource dar. Die bislang untersuchten Fälle stammen aus dem Korpus der Stadtführungen. Ihnen ist gemeinsam, dass sich die Beteiligten bereits in fokussierter Interaktion befinden und gattungsbedingte, beteiligungsspezifische Rollen und Aktivitäten ausüben. Im folgenden Beispiel aus dem Korpus „Polettos Kochschule“ befinden sich die Beteiligten ganz am Anfang der medial inszenierten Kochaktivität. Die gattungs- und formatspezifischen Partizipations- und Aktivitätsstrukturen müssen erst hergestellt werden. In Analogie zur Sonderrolle der Stadtführerin kommt der gastgebenden Profiköchin über die Wissensvermittlung hinaus die Aufgabe zu, den Interaktionsraum, die Aktivitätsphasen und die Partizipationsformate zu gestalten. Die Köchin hat soeben ihren Gast, Ingo Naujoks, willkommen geheißen. Die beiden stehen in einem side-by-side-Arrangement vor dem Kochtisch, und Naujoks begrüßt das applaudierende Studiopublikum (Abb. 4.1). Poletto beendet die Begrüßungssequenz, indem sie ihren Gast mit einer richtungsweisenden Geste einlädt, hinter den Kochtisch zu treten. Dazu muss sie zunächst ihren Körper als relevante Ausrucksressource in den Aufmerksamkeitsfokus ihres Adressaten rücken:

260

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

Beispiel 4: „rüber bitten“ (PK2_00:00:45) Abbildung 4.1

Abbildung 4.2

Während Naujoks weiterhin ins Publikum schaut, löst Poletto die side-by-side- Formation auf und begibt sich in eine L-Formation zu ihrem Gast (Abb. 4.2). Als sie einen weiteren Schritt an Naujoks herantritt, beginnt dieser sich ihr körperlich zuzuwenden (Abb. 4.3). In dem Moment, in dem er seinen Blick auf ihr Gesicht richtet, orientiert sie sich mit einer Kopfdrehung nach links und stellt den Verweisraum her (Abb. 4.4): Abbildung 4.3

Abbildung 4.4

Im nächsten Schritt löst sie ihren linken Arm aus der Ruhelage, woraufhin ihr Adressat seinen Blick von ihrem Gesicht abwendet und ihn zunächst auf ihren Körper (Abb. 4.5) und dann auf ihren Arm richtet (Abb. 4.6):

6.3 Verweisender Körper

Abbildung 4.5

261

Abbildung 4.6

Zu den Aktivitäten, mit denen Poletto die Aufmerksamkeit ihres Interaktionspartners vom Publikum auf sich und ihre körperlichen Ausdrucksressourcen orientiert, gehören die Rekonfiguration des Interaktionsraums von einer gemeinsamen side-by-side-Ausrichtung auf das Publikum über die L-Formation hin zu einer kleinräumigen face-to-face-Orientierung, die zeitlich exakte Alignierung ihres body torque (Schegloff 1998a) mit der körperlichen Reorientierung ihres Interaktionspartners in ihre Richtung und die zeitlich exakte Alignierung des Beginns ihrer Armbewegung mit der Aufmerksamkeitsausrichtung des Adressaten auf ihren Körper. Damit hat sie ihren Körper nicht nur in dessen Aufmerksamkeitsfokus gerückt, sondern auch als perzeptorisch-intermediäre, instrumentelle Ausdrucksressource etabliert, deren weitere Displays es wahrzunehmen gilt. Wie in den Kapiteln 6.4 und 6.5 zu sehen sein wird, richtet der Adressat im weiteren Verlauf seinen Blick vom Arm seiner Interaktionspartnerin zunächst auf deren voll entfaltete Handgeste (Kapitel 6.4) und dann auf den Raum, in den diese verweist. Das letzte Beispiel stammt aus dem „Big Brother“-Korpus. Die Bewohner befinden sich im Garten und sind damit beschäftigt, einen Turm zusammenzubauen. Ein Großteil des Turms ist bereits fertig, doch es sind noch einige Turmteile übrig, die verstreut auf dem Boden liegen. Um den Turm fertigzustellen, unternehmen die Bewohner eine Bestandsaufnahme der verbliebenen Einzelteile. Dabei treten eine ganze Reihe von Zeigehandlungen auf. Die folgende Analyse konzentriert sich auf die Zeigehandlung einer Teilnehmerin (vgl. zur Analyse weiterer Zeigehandlungen dieser Sequenz Kapitel 5.7):

262

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

Beispiel 5: „Turmteile“ (bb02_2 00:15:52) Abbildung 5.1

01 02 03 04 05 06 07 08 09 10

Alx: Adr: Sbr: Adr: Alx: Adr: Jrg: Sbr:

das_is ALles was noch [dA is?] [ALles;] [ja:,] (0.9) s_ist NICHTS mehr drin; (-) DA[S ] und DAS; [echt?] [ja] [da ] ham_mer gUt verBAUT; wa? [( )] Abbildung 5.3

11

Abbildung 5.2

und DAS da;

Abbildung 5.4

6.3 Verweisender Körper

263

Beispiel 5 (Fortsetzung) Abbildung 5.5

12 13

Abbildung 5.6

(0.7)

Zu Beginn des Ausschnitts sind die Bewohner um den Turm gruppiert. Jürgen, Sabrina und Alex stehen dicht gedrängt zusammen, während Andrea vor ihnen auf dem Boden sitzt. Auf Alex’ Verwunderung darüber, dass nur noch wenige Teile übrig sind (Z. 1), folgt eine Bearbeitungssequenz, in der die Bewohner sich eine Übersicht über die verbliebenen Teile verschaffen (Z. 2–9). Sabrina verlässt die Gruppenformation, indem sie sich umdreht und ein paar Schritte in die entgegengesetzte Richtung macht (Abb. 5.2). Dabei ist ihr Blick nach links auf den Boden gerichtet. Kurz darauf ergänzt sie die Bestandsaufnahme, indem sie die anderen auf ein weiteres Teil aufmerksam macht. Dazu äußert sie das akzentuierte deiktische Demonstrativpronomen DAS in Verbindung mit dem Lokaldeiktikon da (Z. 11: und DAS da;) und vollführt simultan dazu mit ausgestrecktem Arm eine Zeigefingergeste (Abb. 5.3), die auf dem Gipfelpunkt eingefroren wird. Aufschlussreich für die Verfahren, mit denen die Zeigende ihren Körper als semiotisch relevante Ausdrucksressource interaktiv herstellt, ist zunächst die Analyse ihrer Blickorganisation: Bei der Artikulation des Demonstrativpronomens DAS ist ihr Blick auf das Zeigeziel gerichtet (Abb. 5.3). Unmittelbar darauf reorientiert sie ihren Blick auf die Adressaten (Abb. 5.4) und begibt sich dadurch in einen Ressourcen-Spagat: Die eingefrorene Geste ist auf das Zeigeziel, ihr Blick hingegen auf die Adressaten gerichtet. Dabei kann sie wahrnehmen, dass diese sie umgekehrt nicht wahrnehmen und ihrer deiktischen Fokussierungsaufforderung nicht nachkommen. Sie wenden ihr weiterhin den Rücken zu. In der Folge

264

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

wiederholt sie ihre Fokussierungsaufforderung, indem sie eine raumdeiktische Präzision (Z. 12: in der ecke_DAS da;) vornimmt. Während sie also die Geste auf dem Gipfelpunkt eingefroren hat, produziert sie verbal eine selbstinitiierte Selbstreparatur. Diese dient dazu, in einem zweiten Anlauf die Aufmerksamkeit der Adressaten auf ihren Körper und die Zeigegeste und schließlich auf das Zeigeziel zu lenken. Als sie das deiktische Demonstrativpronomen zum zweiten Mal äußert (Z. 12), richtet sie ihren Blick wieder auf das Zeigeziel. Gleichzeitig beginnen zwei ihrer Adressaten sich zu reorientieren. Sowohl Jürgen als auch Andrea drehen ihren Oberkörper nach links in Richtung Sabrina (Abb. 5.5) und stellen dadurch perzeptorisch den verweisenden Körper der Zeigenden her. Um jedoch das Zeigeziel aufzufinden, bedarf es eines weiteren Schritts. Andrea vollzieht diesen Schritt, indem sie ihren body torque (Schegloff 1998a) noch weiter nach links fortsetzt. Jürgen hingegen dreht sich, um vom verweisenden Körper der Zeigenden zum Zeigeziel zu gelangen, nun in die entgegengesetzte Richtung. Gegenüber der Drehung nach links zur Wahrnehmung der Zeigenden vollführt er nun eine Rotation nach rechts, um das Zeigeziel sehen zu können (Abb. 5.6). Die Beispielanalysen haben zwei unterschiedliche sequenzielle Formate ergeben, denen Zeigende folgen, wenn sie ihren Körper als semiotisch relevante Ausdrucksressource in den visuellen Aufmerksamkeitsfokus ihrer Adressaten rücken. Das erste Format zeichnet sich dadurch aus, dass Zeigende sich die interpersonelle Koordinierungsfunktion und Projektionskraft ihrer Selbstorientierung bei der Verweisraumherstellung zunutze machen und diese, indem sie sie durch eine auffällige Körperdrehung ostentativ ausführen, zugleich als Mittel zur Elizitierung der Adressatenaufmerksamkeit einsetzen. In diesem Format fallen die Herstellung des Verweisraums und die Relevantsetzung des eigenen Körpers zeitlich zusammen. Erst dann wird die Zeigegeste als das eigentliche Verweisinstrument eingesetzt. Anders gestaltet sich das zweite Format. Hier wird die Aufgabe, die Aufmerksamkeit der Adressaten auf den eigenen Körper zu lenken, dadurch gelöst, dass der Zeigende seine Zeigegeste so einrichtet, dass er im Moment der Aufmerksamkeitszuwendung durch den Adressaten unmittelbar als Zeigender in Erscheinung tritt: Er begibt sich in einen Ressourcen-Spagat, durch den er seine Doppelorientierung auf den Adressaten einerseits und auf ein Drittes andererseits signalisieren kann. Damit positioniert er sich im Augenblick der Adressatenwahrnehmung als semiotisches Scharnier zwischen Wahrnehmendem und Wahrzunehmendem und eröffnet obendrein die Möglichkeit zur Wahrnehmungswahrnehmung (vgl. dazu Kapitel 6.8).

6.4 Zeigegeste

265

6.4 Zeigegeste Unabhängig davon, welche Formgestalt die Geste annimmt, ob sie mit einer Extremität, dem Kopf, dem Blick oder einem Gegenstand ausgeführt wird (vgl. dazu ausführlich Kapitel 5), stellt die Zeigegeste die für die deiktische Zeigehandlung funktional spezialisierte Ressource dar. Sie fungiert als Zeiginstrument, von dem aus ein linearer Vektor extrapoliert wird, der laut gängiger Theorien unmittelbar zum Zeigeziel führt. Wie jedoch im theoretischen Kapitel (4.5) dargelegt wurde, ist die Vorstellung einer punktgenauen Vektor-Ziel-Relation unzureichend. Stattdessen wird durch die Zeigegeste zunächst einmal ein Suchraum hergestellt, in dem das Zeigeziel erst aufgefunden werden muss. Die für die Zeigehandlung konstitutiven Einzeldisplays müssen so gestaltet und temporal mit dem Adressatenverhalten koordiniert werden, dass sie im richtigen Augenblick wahrgenommen und in ihrer semiotischen Funktion erkannt werden können. Der Zeigende muss also sicherstellen, dass der Adressat einen ausgestreckten Arm oder Finger bzw. einen zum Zeigen eingesetzten und daher zweckentfremdeten Gebrauchsgegenstand (Stift, Löffel, Messer etc.) nicht als Ziel seiner visuellen Wahrnehmung und als Betrachtungsphänomen sui generis ansieht, sondern als instrumentell, perzeptorisch intermediär und deiktisch erkennt. Dies sind die drei Merkmale, mit denen im theoretischen Kapitel das Konzept des Zeiginstruments als räumlich-perzeptorischer Parameter der Zeigehandlung definiert wurde. Die lokale Umsetzung erfordert eine temporale Flexibilität des Zeigegestengebrauchs, wie im Folgenden empirisch dargelegt wird. Das erste Beispiel aus einer Bayreuther Stadtführung ist bereits aus den Kapiteln 6.1 und 6.2 bekannt, in denen analysiert wurde, wie die Stadtführerin zunächst fokussierte Interaktion herstellt und sich dann im Raum orientiert, um den Verweisraum zu konstituieren. Wie in den in Kapitel 6.3. analysierten Beispielen dient der Zeigenden auch im vorliegenden Fall die Körperdrehung zusammen mit der Selbstorientierung auf den Verweisraum als Mittel, den eigenen Körper als relevante Ausdrucksressource in den Fokus der Adressaten zu rücken. Im nächsten Schritt führt sie eine Zeigegeste in die Richtung aus, in die sich die Gruppenmitglieder visuell orientieren sollen:

266

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

Beispiel 1: „alle da“ (StFB1_00:09:42) Abbildung 1.1

1 2 3 4

SF:

(si_mer) alle DA? (3.0) also. dA ham_se nochma n_blick auf die: synaGOge,= Abbildung 1.2

5

=in

Abbildung 1.3

zgasse REIN?

Die Zeigehandlung setzt damit ein, dass die Stadtführerin eine neue Turnkonstruktionseinheit mit dem Lokaldeiktikon dA (Z. 4) beginnt, das durch eine Zeigegeste desambiguiert werden muss. Dabei läuft das Deiktikon der Zeigegeste deutlich voraus. Die mit ausgestrecktem Arm ausgeführte Zeigegeste erreicht ihren Gipfelpunkt simultan zur Artikulation des bestimmten Artikels (Abb. 1.1), mit dem das Anschauungsobjekt eingeführt wird (Z. 4: die synaGOge), das durch die Zeigegeste lokalisiert wird. Anschließend elaboriert die Stadtführerin mit einer weiteren, komplexen Zeigegeste (Abb. 1.2–1.3) die in der Präpositionalphrase (Z. 5)

6.4 Zeigegeste

267

formulierten Raumaspekte, die für eine präzisere Konstituierung des Suchraums relevant sind (vgl. Kapitel 6.5) Während die erste Zeigegeste im ZfHu-Format (vgl. dazu Kap. 5.1.1) realisiert wird und das Anschauungsobjekt lokalisiert, besitzt die zweite Geste eine mehrphasige Struktur. Zunächst skizziert die Sprecherin mit einer horizontalen Bewegung ihres Unterarms den Pfad und markiert dann mit der vertikal abgespreizten Hand (oHHv) den Endpunkt, an dem sich das Anschauungsobjekt befindet. Im Gegensatz zur ersten Geste überlagern sich in dieser komplexen zweiten Geste deiktische und ikonische bzw. darstellende Elemente. Das nächste Beispiel bildet die sequenzielle Fortsetzung eines in Kapitel 6.3 analysierten Ausschnitts (StFLIng2_00:21:41). Nachdem der Stadtführer durch eine 180-Grad-Drehung seinen Körper als von den Adressaten wahrzunehmende Ausdrucksressource hergestellt hat, produziert er mit dem linken Arm eine Zeigegeste. Kurz bevor die Geste ihren Gipfelpunkt erreicht, beginnt er wieder zu sprechen (Z. 2): Beispiel 2: „zu diesem Bau“ (StFLing2_00:21:41)

01

(1.6) Abbildung 2.1

02 03 04 05

SF:

zu DIEsem bau noch, der hat ne etwas kuriOse geSCHICHte(0.4) der (.) sieht jEtzt so eher POSTmodern aus,

Mit der Präpositionalphrase zu DIEsem bau noch (Z. 2) etabliert der Stadtführer nach einer Pause einen neuen Gegenstand, auf den er die Gruppe mit dem akzentuierten, proximalen Demonstrativpronomen DIEsem und einer simultan dazu ausgeführten Zeigegeste auch visuell orientiert (Abb. 2.1).

268

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

In ihrer spezifischen oHHv-Form (vgl. dazu Kap. 5.4.2) dient die Zeigegeste nicht nur der Objektlokalisierung, sondern inkorporiert zugleich die Aufforderung zu einer ausführlicheren Betrachtung. Damit korrespondiert die in der kinesischen Modalität durch die Gestenform von den Adressaten geforderte Betrachtung der verbalen Projektion in der Präpositionalphrase (Z. 2), die funktional als Ankündigung einer längeren Ausführung des Stadtführers zu dem Gebäude zu verstehen ist. Auf diese Weise greifen die Projektion dessen, was der Sprecher tun wird, und die Projektion dessen, was von den Adressaten als korrespondierende Komplementäraktivitäten erwartet wird, ineinander. Auf die beiden Modalitäten verteilt können sie simultan kommuniziert werden. Das dritte Beispiel stammt aus dem „Big Brother“-Korpus. Zwei Bewohnerinnen haben einen kleinen Tisch mit Frühstück ans Bett gebracht bekommen. Während Andrea im Begriff ist aufzustehen, sitzt Sabrina bereits am Tisch und frühstückt. Um die Aufmerksamkeit ihrer Zimmergenossin auf ein Objekt des Frühstücksarrangements zu lenken, äußert sie zunächst eine Fokussierungsaufforderung in Verbindung mit einem Lokaldeiktikon (Z. 2: guck mal DA,) und produziert dann eine Zeigegeste (Abb. 3.1). Der Beginn der Zeigegeste fällt mit der Artikulation des Deiktikons zusammen, der Gipfelpunkt wird in der anschließenden Pause eingefroren. Die Geste wird mit dem Mittelfinger ausgeführt, da Daumen und Zeigefinger ein Stück Brot halten: Beispiel 3: „guck mal da“ (bb85_00:05:57)

01 02

Adr: Sbr:

Abbildung 3.1

03 04 05

Adr: Sbr:

(2.0) ((lacht)) ((lacht))

6.4 Zeigegeste

269

Die auffällige Temporalitätsstruktur gibt Aufschluss über die lokale Funktion der eingesetzten Ressourcen. Während die Fokussierungsaufforderung zusammen mit dem gestisch gebrauchten Lokaldeiktikon DA die Funktion hat, die visuelle Aufmerksamkeit der Adressatin zu erlangen, dient die sequenziell erst nach Beendigung des Redebeitrags ausgeführte Zeigegeste dazu, das Objekt zu lokalisieren und zu identifizieren. Das vierte Beispiel aus dem Korpus „Polettos Kochschule“ ist im vorangegangenen Kapitel im Hinblick auf die kinesischen Mittel analysiert worden, mit denen Poletto zu Beginn ihren Körper als perzeptorisch-intermediäre, instrumentelle Ausdrucksressource in den Aufmerksamkeitsfokus ihres Adressaten rückt. Dazu musste sie die gemeinsame side-by-side-Orientierung auflösen und einen neuen Interaktionsraum mit ihrem Adressaten herstellen. Die Analyse endete damit, dass der Adressat seinen Blick vom Gesicht auf den Körper und Arm seiner Partnerin richtete (Abb. 4.1): Beispiel 4: „rüber bitten“ (PK2_00:00:45) Abbildung 4.1

Abbildung 4.2

Im weiteren Verlauf führt Poletto eine Zeigegeste in Richtung des Arbeitsplatzes hinter dem Kochtisch aus (Abb. 4.2). Dabei folgt der Blick des Adressaten ihrer Armbewegung und ist in dem Moment, in dem die Geste ihren Gipfelpunkt erreicht, auf die voll entfaltete Handgeste der Zeigenden gerichtet (Abb. 4.2). Diese verweist nicht nur deiktisch auf den Raum, sondern stellt in der spezifischen oHHv-Form zugleich eine höfliche Geste des Einladens dar. Damit ist auch die Zeigegeste als perzeptorisch-intermediär, instrumentell und deiktisch etabliert. Erst dann beginnt Poletto zu sprechen und lädt ihren Gast auch verbal ein, hinter den Kochtisch zu treten. Wie die Folgeaktivitäten zeigen, orientiert der Adressat seinen Blick in der nächsten Phase auf den Suchraum. Zum Abschluss soll ein Beispiel aus dem „Mutige Mädchen“-Korpus illustrieren, wie Zeigende ihre Zeigegeste als instrumentelles, perzeptorisch intermediäres, deiktisches Verweisinstrument herstellen und sich intersubjektiv durch die Wahrnehmung ihres Adressaten vergewissern, dass dieser die Zeigegeste auch

270

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

wahrnimmt. Der Ausschnitt ist Teil einer längeren Sequenz, in der die Trainerin nacheinander einzelne Mädchen in die Turnhalle bittet, die sie vorher rausgeschickt hat, um eine spezielle Übung mit ihnen durchführen zu können. In der folgenden Situation holt sie das erste dieser Mädchen wieder herein und erteilt ihm die Instruktion, sich auf eine in der Turnhalle aufgestellte Bank zu setzen. Dabei gebraucht sie eine Zeigefingergeste, um dem Mädchen anzuzeigen, in welche Richtung es sich orientieren soll: Beispiel 5: „die Richtung“ (MM_B1_00:03:08)

01

T:

oKAY; Abbildung 5.1

02 03 04 05

Abbildung 5.2

setz dich bitte in die MITte zur bank, (0.5) bank, (1.2) Abbildung 5.3

06 07

und(0.8) Abbildung 5.4

Abbildung 5.5

Abbildung 5.6

6.4 Zeigegeste

271

06 undBeispiel 5 (Fortsetzung) 07 (0.8) Abbildung 5.4

08 09 10

Abbildung 5.5

Abbildung 5.6

in DIE richtung schauen. (0.3) (0.3)

Die Trainerin öffnet die Hallentür und holt das Mädchen wieder in die Turnhalle (Abb. 5.1). Während sie ihre Instruktion formuliert, läuft das Mädchen bereits in die Turnhalle hinein und kehrt der Trainerin den Rücken zu (Abb. 5.2). Diese repariert ihre Instruktion (Z. 4), folgt dem Mädchen in Richtung Bank und setzt ihre Instruktion fort (Abb. 5.3), indem sie mit der Konjunktion und (Z. 6) einen gleichgeordneten zweiten Teil projiziert. Das Mädchen dreht sich jedoch nicht zur Trainerin um (Abb. 5.3–5.4), so dass diese schließlich nach einer 0,8-sekündigen Pause den durch die Konjunktion projizierten zweiten Teil formuliert: in DIE richtung schauen (Z. 8). Der zweite Instruktionsteil enthält eine wichtige Information zur räumlichen Orientierung. Das gestisch gebrauchte Demonstrativpronomen DIE (Z. 8) setzt eine visuelle Orientierung des Mädchens auf die Trainerin relevant, da das Deiktikon nur durch eine Zeigegeste desambiguiert werden kann. Die Trainerin führt im Laufen die dazugehörige Zeigegeste aus (Abb. 5.4). Die Geste erreicht mit dem Deiktikon ihren Gipfelpunkt und wird von der Trainerin so lange in einem Nachhalt (post stroke hold, Kendon 2004; McNeill 1992, 2000) eingefroren, bis das Mädchen sich weitere 0,3 Sekunden, nachdem die Trainerin ihren Redezug beendet hat, schließlich umdreht (Abb. 5.5). Erst als es die Geste wahrnimmt und sich daraufhin um die eigene Achse in die entgegen gesetzte Richtung dreht, retrahiert die Trainerin ihre Zeigegeste (Abb. 5.6). Der Ressourcen-Spagat zwischen nach hinten orientierter Zeigegeste und nach vorn orientiertem Blick, den die Trainerin für die gesamte Dauer ihrer Geste und noch darüber hinaus einnimmt, dient dazu sicherzustellen, dass die Schülerin die Zei-

272

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

gegeste wahrnimmt und sich entsprechend verhält. Das Moment der Wahrnehmungswahrnehmung (vgl. dazu Kapitel 4.9 sowie die ausführlichen Analysen in Kapitel 6.8) bezieht sich hier also nicht nur auf die Wahrnehmung des Zeigeziels, sondern auch auf die vorgeschalteten Schritte der Wahrnehmung der Zeigenden und ihrer Zeigegeste durch die Adressatin. In diesem Kapitel wurde empirisch nachvollzogen, wie sich die Zeigegeste als funktional spezifizierte Ressource in das multimodale Ablaufformat der Zeigehandlung einfügt (vgl. zu den Formvarianten ausführlich Kapitel 5). Die Zeigegeste tritt in enger Korrelation mit dem dazugehörigen deiktischen Ausdruck auf. Dieser stellt nicht nur das verbale Korrelat (lexical affiliate, McNeill 2005; Schegloff 1984) der Zeigegeste dar, sondern bildet mit ihr zusammen eine multimodale Einheit. Die Einzelkomponenten dieser Einheit müssen jedoch nicht notwendigerweise immer simultan instantiiert werden. Stattdessen werden sie temporal an die lokalen Interaktionsbedingungen adaptiert und mit der lokalen Aufmerksamkeitsorientierung der Adressaten koordiniert. Dabei ist festzustellen, dass Zeigende, um sich zunächst die visuelle Aufmerksamkeit ihrer Adressaten zu sichern, das verbale Deiktikon der Zeigegeste deutlich vorausschicken können.

6.5 Suchraum Wie im theoretischen Teil (Kapitel 4.6) dargelegt wurde, wird der vom Zeigenden hergestellte Verweisraum erst dann zum Suchraum des Adressaten, wenn der Zeigende eine Zeigegeste ausführt, der Adressat diese in ihrer deiktischen Funktion wahrnimmt und zur Orientierung auf den entsprechenden Raum nutzt. In den vorausgehenden Kapiteln wurde an einer Reihe von Beispielen die theoretische Unterscheidung zwischen den Parametern des Verweisraums (6.2), des verweisenden Körpers (6.3) und der Zeigegeste (6.4) sequenzanalytisch nachgewiesen. Im vorliegenden Kapitel erfolgt nun der empirische Nachweis für den Parameter des Suchraums. Die These lautet, dass der Suchraum als adressatenperspektivisches Wahrnehmungsphänomen dadurch etabliert wird, dass sich der Adressat perzeptorisch auf den Raum orientiert, in den der Zeigende zeigt. Entscheidend ist, dass die Zeigegeste nicht unmittelbar das Zeigeziel, sondern zunächst einen Suchraum hergestellt, in dem das Zeigeziel (Kapitel 6.6) erst aufgefunden werden muss. Im ersten Beispiel („alle da“) muss die Stadtführerin, nachdem sie sich zunächst selbst im umgebenden Raum orientiert hat (vgl. dazu die Analyse in Kapitel 6.2), im nächsten Schritt ihre Adressaten auf den Suchraum und das darin aufzufindende Zeigeziel orientieren:

6.5 Suchraum

273

Beispiel 1: „alle da“ (StFB1_00:09:42) Abbildung 1.1

01 02 03 04

SF:

(si_mer) alle DA? (3.0) also. dA ham_se nochma n_blick auf die: synaGOge,= Abbildung 1.2

Abbildung 1.3

Die interaktive Herstellung des Suchraums vollzieht sich durch folgende Aktivitäten der Beteiligten: Die Stadtführerin formuliert eine deiktische Betrachtungsaufforderung (Z. 4: dA ham_se nochma n_blick auf di:e synaGOge,) und produziert, wie dies für distale Zeigräume typisch ist, eine mit vollständig ausgestecktem Arm und verstärkter Oberkörperspannung ausgeführte Zeigegeste (Abb. 1.1). Anschließend elaboriert sie mit einer weiteren, komplexen Zeigegeste (Abb. 1.2– 1.3) die in der Präpositionalphrase (Z. 5) formulierten Raumaspekte, welche den Suchraum präzisieren. Während die erste Zeigegeste im ZfHu-Format realisiert

274

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

wird (Abb. 1.1) und das Anschauungsobjekt lokalisiert, besitzt die zweite Geste eine mehrphasige Struktur. Zunächst skizziert die Stadtführerin mit einer horizontalen Bewegung des Unterarms (Abb. 1.2) den Pfad, bevor sie mit der vertikal abgespreizten Hand im oHHv-Format (Abb. 1.3) den Endpunkt markiert, an dem sich das Anschauungsobjekt befindet. Im Gegensatz zur ersten Geste überlagern sich in der zweiten Geste deiktische und ikonische Elemente, die den Adressaten bei der perzeptorischen Konstituierung des Suchraums helfen. Die sequenzielle Analyse der adressatenseitigen Blickorientierungen zeigt, dass viele Gruppenmitglieder bei der deutlich nach dem Lokaldeiktikon (Z. 4: dA) ausgeführten ersten Zeigegeste noch nicht in die angewiesene Richtung, sondern weiterhin zur Stadtführerin blicken (Abb. 1.1). Erst als die Stadtführerin mit der Präpositionalphrase eine verbale und gestische Präzisierung ihrer Lokalisierungshandlung vornimmt, orientieren sie sich auf den Suchraum und vollführen dabei z. T. ihrerseits Körperdrehungen (vgl. zum body torque Schegloff 1998a), die sich spiegelbildlich zur Körperdrehung der Stadtführerin verhalten (vgl. Abb. 1.2 und 1.3). Aufgrund der räumlichen Distanz und dem dadurch bedingten vektoriellen Präzisionsmangel der Zeigegeste gestaltet sich sowohl für die Zeigende als auch für ihre Adressaten die interaktive Herstellung des Suchraums verhältnismäßig aufwendig. Im folgenden Beispiel geht es um die Herstellung eines Suchraums, in welchem das Referenzobjekt nicht mehr gefunden werden kann, da es sich um ein historisches Barockpalais handelt, an dessen Standort sich nun eine Stadtsparkasse befindet. Diese bildet den perzeptorischen Ankerpunkt für die imaginäre Lokalisierung des Barockpalais: Beispiel 2: „Barockpalais“ (StFLing2_00:11:34)

1

SF:

es gAb schon nen ANsatz, Abbildung 2.1

2

es_gAb ein baROCKpalais, Abbildung 2.2

6.5 Suchraum Beispiel 2 (Fortsetzung) 2 es_gAb

275

ein baROCKpalais,

Abbildung 2.2

3

da sehen- (-)

STADTsparkasse Abbildung 2.3

Der Stadtführer vollführt zunächst eine Zeigegeste im oHHv-Format (vgl. Kapitel 5.4.2), auf die die Gruppenmitglieder jedoch nicht reagieren (Abb. 2.1). Die in der Präteritumsform des Verbs (Z. 2: es_gAb) enkodierte temporaldeiktische Information signalisiert, dass das Referenzobjekt nicht mehr existiert. Erst als der Stadtführer seine Zeigegeste moduliert und mit dem Lokaladverb da (Z. 3) eine neue Turnkonstruktionseinheit beginnt, reorientieren sich die Gruppenmitglieder und blicken nacheinander (Abb. 2.2 und 2.3) in die angezeigte Richtung. Zusammen mit der eingefrorenen Blickausrichtung auf den Verweisraum und den simultanen Modulationen der Zeigegeste projiziert das Lokaladverb da eine räumliche Differenzierungs- und Orientierungshandlung, die die visuelle Wahrnehmung der Adressaten relevant setzt. Der mit dem Relativadverb (Eisenberg 2006: 277) wo angeschlossene Relativsatz konstituiert verbal jenen Raum als Suchraum, der zuvor allein durch die Zeigegeste angegeben wurde. Dieser Suchraum wird durch das Lokaldeiktikon drüben (Z. 3) strukturiert, das nicht nur Distalität enkodiert, sondern auch Angaben zum Pfad enthält. Demnach befinden sich Suchraum und Zeigeziel vom Standort der Gruppe aus betrachtet auf der anderen Straßenseite.

276

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

Die beiden folgenden Ausschnitte stammen aus einer Folge von „Polettos Kochschule“. Ihnen ist gemeinsam, dass die Zeigehandlungen im Kontext parallel ausgeführter manueller Tätigkeiten der Beteiligten und damit unter den Bedingungen divergierender bzw. potenziell konfligierender Aufmerksamkeitspräferenzen stattfinden. Im dritten Beispiel („das Fett hier“) arbeiten Poletto und ihr Gast, Heide Simonis, nebeneinander an zwei verschiedenen Stücken Kaninchenfleisch und richten ihre Aufmerksamkeit jeweils auf die eigenen Hände (Abb. 3.1). Poletto ist gleichzeitig damit beschäftigt, die einzelnen Arbeitsschritte zu erklären (Z. 1–4), wird dabei jedoch von Heide Simonis mit einer Rückfrage unterbrochen, die sich auf ihre eigene Tätigkeit des Fettauslösens bezieht (Z. 5). Wie auf Abbildung 3.2 zu erkennen ist, entsteht nicht nur Redeüberlappung, sondern auch ein visueller Aufmerksamkeitskonflikt: Während Poletto im Rahmen ihrer Erkläraktivität eine Demonstrationshandlung projiziert, indem sie ihren Oberkörper seitlich zu Simonis neigt und ihre Hände mit dem Demonstrationsobjekt in deren potenziellen Wahrnehmungsraum hebt, produziert Simonis gleichzeitig ein akzentuiertes Demonstrativpronomen (Z. 5: DAS FETT), dass umgekehrt die visuelle Wahrnehmung Polettos relevant setzt. Poletto unterbricht ihre Aktivität und reorientiert ihren Blick in dem Augenblick auf den Suchraum, d. h. auf die Hände von Simonis, als diese das proximale Lokaldeiktikon hier artikuliert (Abb. 3.3): Beispiel 3: „das Fett hier“ (PK4_00:03:04) Abbildung 3.1

1 2 3

Pol:

' nEhmen jetzt Einfach nur sie hier diese (.) kleinen NIERchenHAUT, Abbildung 3.2

Abbildung 3.3

6.5 Suchraum

277

' nEhmen jetzt Einfach nur 1 sie BeispielPol: 3 (Fortsetzung) hier diese (.) kleinen NIERchen2 3 HAUT, Abbildung 3.2

[die kann man (-) AUF(

4 5 6 7

Abbildung 3.3

HS: Pol: HS:

)

[und DAS FETT hier oKAY;

Im vierten Beispiel aus derselben Folge erteilt Poletto ihrem Gast einen kleinen Arbeitsauftrag (Z. 1–3), während sie selbst manuell mit etwas Anderem beschäftigt ist. Den Arbeitsauftrag verbindet sie mit einem account (Z. 4–5), den sie jedoch nicht zum Abschluss bringen kann, da sie von Simonis unterbrochen wird (Z. 6). Für Simonis stellt sich die Ausführung des Arbeitsauftrags (die Temperatur höher zu stellen) nicht so selbstverständlich dar, wie Poletto vorausgesetzt hat, da sie sich mit dem Herd nicht auskennt: Beispiel 4: „hier draufdrücken“ (PK4_00:09:53)

01 02 03

Pol:

-= Abbildung 4.1

278 6 Empirische Untersuchungen zu den Parametern der Zeigehandlung 01 Pol: 02 -= 03 Beispiel 4 (Fortsetzung) Abbildung 4.1

04 05 06

HS:

ge Abbildung 4.2

07 08 09

Pol: HS:

_n paar Abbildung 4.3

HIER cken;=ne? ge[NAU, [in die MITte;

Die von Simonis durch einen suchenden Blick und ziellose Handbewegungen verkörperten Schwierigkeiten werden von Poletto nicht wahrgenommen (Abb. 4.1). Nach einem abgebrochenen Versuch, die Diskrepanz zwischen dem implizit vorausgesetzten und dem real vorhandenen Wissen zu formulieren (Z. 6: das SA:gen sie (.) für die-), fordert sie Poletto schließlich zu einer online-Bewertung ihres praktischen Versuchs auf: HIER draufdrücken;=ne? (Z. 7). Dabei fun-

6.5 Suchraum

279

giert das akzentuierte, proximale Lokaldeiktikon HIER als erfolgreiches Mittel, die visuelle Aufmerksamkeit Polettos auf ihre manuelle Aktivität zu lenken. Als Simonis das Lokaldeiktikon HIER artikuliert, ist Polettos Blick noch auf die eigenen Hände gerichtet (Abb. 4.2). Doch dann reorientiert sie ihren Blick und stellt den Suchraum her (Abb. 4.3), der sich, wie das Lokaldeiktikon indiziert, in unmittelbarer Nähe zur Sprecherin befindet. Im fünften Beispiel aus dem „Big Brother“-Korpus sind die Bewohner damit beschäftigt einen Turm zusammenzubauen. Sie haben das Turmfragment in den Garten gebracht und machen eine Inventur der verbliebenen Bauteile. Während Andrea auf dem Boden sitzt und mit Jürgen und Alex, die halbkreisförmig neben ihr stehen, einen Interaktionsraum bildet, befindet Sabrina sich abseits hinter der Dreiergruppe. Nachdem Andrea den beiden Männern zwei neben ihr auf dem Boden liegende Teile gezeigt hat (Z. 2), lenkt Sabrina die Aufmerksamkeit der Dreiergruppe auf ein weiteres Teil, das sich vor ihr, aber außerhalb des Sichtfelds der anderen befindet (Z. 7–8): Beispiel 5: „Turmteile“ (bb02_2 00:15:52)

01 02 03 04 05 06

Adr: Alx: Adr: Jrg: Sbr:

s_ist NICHTS mehr drin; (-) DA[S ] und DAS; [echt?] [ja] [da ] ham_mer gUt verBAUT; wa? [( )] Abbildung 5.1

07

Abbildung 5.2

und DAS da; Abbildung 5.3

Abbildung 5.4

280

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

Beispiel 5 (Fortsetzung) 07 und

DAS da;

Abbildung 5.3

08

Abbildung 5.4

Abbildung 5.5

09

(0.7)

Um die Aufmerksamkeit ihrer Mitbewohner auf ein anderes Turmteil zu lenken, benutzt Sabrina ein akzentuiertes Demonstrativpronomen (Z. 7: und DAS da;) und greift damit zugleich das Format von Andreas Vorgängeräußerung wieder auf. Allerdings ergänzt sie ihre deiktische Orientierungshandlung um das neutrale Lokaldeiktikon da. Dieses enthält die zusätzliche Information, dass sich das Zeigeziel räumlich nicht in unmittelbarer Nähe befindet und dass der von den

6.5 Suchraum

281

Adressaten herzustellende Suchraum nicht in derselben Weise zugänglich ist wie im Fall der vorausgegangenen Zeigehandlung Andreas. Simultan zu ihrer Äußerung führt Sabrina mit ausgestrecktem Arm eine Zeigegeste aus (Abb. 5.1), die auf dem Gipfelpunkt eingefroren wird (vgl. dazu die Analyse in Kapitel 6.3). Ihr Blick, der zunächst auf das Zeigeziel gerichtet ist (Abb. 5.1), wird unmittelbar darauf den Adressaten zugewandt (Abb. 5.2), um deren Aufmerksamkeitsorientierung zu prüfen. Zur Spezifizierung des Suchraums expandiert sie ihre Äußerung mit einer schnell angeschlossenen Präpositionalphrase, die einen topographischen Orientierungspunkt (ecke) benennt und die Demonstrativkonstruktion (DAS da) wiederholt (Z 8: in der ecke DAS da). Ihr Blick, der zunächst noch auf die Adressaten gerichtet bleibt (Abb. 5.3), wechselt in dem Augenblick, in dem ihre Adressaten sich auf sie zu orientieren beginnen, wieder zurück zum Zeigeziel (Abb. 5.4). Die Zeigegeste wird so lange aufrecht erhalten, bis sich die Adressaten zu ihr umdrehen, ihren Körper und ihre Zeigegeste wahrnehmen können (Abb. 5.4). Erst im nächsten Schritt stellen die Adressaten, Andrea und Jürgen, den Suchraum her (Abb. 5.5). Zu diesem Zeitpunkt hat Sabrina ihre Zeigegeste bereits zurückgezogen. An Jürgens körperlichen Displays (Abb. 5.5) wird die Tatsache deutlich, dass die Wahrnehmung des verweisenden Körpers der Zeigenden (vgl. dazu Kapitel 6.3 und 6.4) und die Herstellung des Suchraums unterschiedliche Vorgänge sind: Jürgen muss, um einerseits Sabrina (den Körper der Zeigenden und ihre Zeigegeste) und andererseits den Suchraum wahrnehmen zu können, zwei unterschiedliche Oberkörperdrehungen vollführen. Zuerst dreht er sich nach links zu Sabrina (Abb. 5.4), um die Zeigende wahrzunehmen, und orientiert sich dann in die entgegengesetzte Richtung nach rechts, um den Suchraum herzustellen (Abb. 5.5). Bei Andrea manifestieren sich diese Vorgänge, wenn auch subtiler, in ihren unterschiedlichen Kopforientierungen: Sie blickt zunächst nach oben in Richtung der Zeigenden (Abb. 5.4) und dann nach unten in Richtung des Suchraums (Abb. 5.5). Durch Analyse der Beispiele konnte nachgewiesen werden, dass der Suchraum im sequenziellen Ablaufformat der Zeigehandlung eine eigenständige Größe darstellt. So wurde anhand der Aufmerksamkeitsorientierung der Adressaten zum einen gezeigt, wann und wie diese sich auf den Suchraum orientieren. Zum anderen wurde anhand der aufmerksamkeitssteuernden Aktivitäten der Zeigenden analytisch nachvollzogen, dass diese die Suchraumherstellung ihrer Adressaten als Teil des interaktiven Gelingens ihrer Zeigehandlung begreifen und den Suchraum sowohl verbal als auch gestisch für die Wahrnehmung ihrer Adressaten (vor)strukturieren.

282

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

6.6 Zeigeziel: Das Vektor-Ziel-Problem Nachdem der Suchraum hergestellt ist, steht der Adressat vor der Aufgabe, innerhalb des Suchraums das Zeigeziel zu finden und aus dem Zeigeziel den gemeinten Referenten zu „generieren“. Beide Aspekte sind eng miteinander verknüpft, stellen aber unterschiedliche Teilprobleme dar, weshalb sie im theoretischen Teil als Vektor-Ziel-Problem und als Problem der Referenzherstellung voneinander getrennt wurden. Mit Vektor-Ziel-Problem wurde das interaktiv zu bewältigende Wahrnehmungsproblem bezeichnet, demzufolge die Zeigegeste nicht, wie in der Forschung häufig angenommen wird, einen punktgenauen Vektor bildet, dessen imaginäre lineare Verlängerung automatisch zum Zeigeziel führt.71 Dieser Vorstellung wird in der vorliegenden Studie die Auffassung entgegengesetzt, dass die Zeigegeste wie ein Scheinwerferkegel lediglich die Richtung weist und damit einen Suchraum angibt, innerhalb dessen das Zeigeziel erst aufgefunden werden muss (vgl. auch Goodwin 2000a: 73). Um empirisch nachzuweisen, dass mit der theoretischen Unterscheidung zwischen Suchraum und Zeigeziel zwei valide Parameter der Zeigehandlung ermittelt wurden, werden im Folgenden Sequenzen betrachtet, in denen aufgrund der Tatsache, dass das Zeigeziel nicht sofort aufgefunden werden kann, Reparaturen erfolgen.72 Das, was sich im reibungslosen Normalablauf als intrasubjektiv vollzogene Herstellungshandlung sowohl der Wahrnehmung durch den Interaktionspartner als auch dem Blick des Analytikers verbirgt, wird in Reparaturen durch einen kleinschrittigen, interaktiven Ko-Konstruktionsprozess sequenziell entfaltet. Im ersten Beispiel aus einer Stadtführung wird das Zeigeziel von den Adressaten nicht sofort aufgefunden, da innerhalb des Suchraums mehrere potenzielle Zeigezielkandidaten zur Verfügung stehen. In der emergierenden Interaktion orientiert sich der Stadtführer an dem möglichen Problem seiner Adressaten und präzisiert das Zeigeziel in Relation zu anderen Wahrnehmungsgegenständen innerhalb des Suchraums. Aufgrund der Reparatur werden die Herstellung des Suchraums und die Lokalisierung des Zeigeziels, die im Normalfall integrativ

71 In Arbeiten zur Deixis bei Fillmore (1982: 45); Fricke (2007: 57); zur Gestik bei Kendon (2004: 200); Kita (2003b: 1); zur ontogenetischen Sprachentwicklung bei Butterworth (2003) und phylogenetischen Sprachentwicklung Tomasello (2008). 72 Eine andere Möglichkeit, einen empirisch trennscharfen Nachweis des Unterschieds zwischen der perzeptorischen Herstellung des Suchraums einerseits und des Zeigeziels andererseits zu erbringen, stellen exakte Untersuchungen mit Eyetracking-Verfahren dar, durch die die Blickbewegungen des Adressaten punktgenau aufgezeichnet werden. Entsprechende Untersuchungen der Verfasserin sind in Bearbeitung.

6.6 Zeigeziel: Das Vektor-Ziel-Problem

283

erfolgen, in zwei verschiedene Teilakte zerlegt. Sie erfolgen sequenziell nach einander: Beispiel 1: „ein kleines Detail“ (StFLing2_00:02:56)

01 02

SF:

(0.6)

-) ein KLEInes detail noch,

Abbildung 1.1

03

sie seh

04 05

-)

Abbildung 1.3

06

Abbildung 1.2

(0.3)

fenstern-

284

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

Zunächst stellt der Stadtführer mit einer Zeigegeste, einer gleichgerichteten Blickorientierung (Abb. 1.1) und dem distalen Lokaldeiktikon DORT (Z. 3) den Raum her, den die Gruppe visuell wahrnehmen soll. Wie die nächste Turnkonstruktionseinheit verdeutlicht, ist das Zeigeziel ein neobarockes Gebäude. Das Demonstrativpronomen dieser fungiert hier jedoch nicht als gestisch gebrauchtes Deiktikon, sondern – wie durch die gedehnten Verzögerungssignale (äh), die Pause und ein leichtes Schwanken des Oberkörpers zusätzlich indiziert wird – als Indexikalitätsmarker (Auer 1981b), der die Orientierung des Stadtführers an dem epistemisch potenziell problematischen Konzept neobarock anzeigt. Als er die Zeigegeste zusammen mit der schwankenden Bewegung und dem dritten ähm: (Z. 4) wiederholt, sind alle Gruppenmitglieder auf den Suchraum orientiert (Abb. 1.2). Im nächsten Schritt spezifiziert der Stadtführer das Zeigeziel, indem er die Beschreibung mit den HÖheren fenstern (Z. 5) anschließt. Dabei implizieren die Komparativform des Adjektivs und der kontrastiv gesetzte Hauptakzent das Vorhandensein weiterer Wahrnehmungsobjekte, die innerhalb des Suchraums mit dem Zeigeziel konfligieren können. Und nicht nur richtet der Stadtführer die sprachliche Äußerung an seinen Annahmen über die Wissensvoraussetzungen der Gruppe aus, sondern in der anschließenden Pause (Z. 6) überprüft er auch visuell deren Aufmerksamkeitsorientierung (Abb. 1.3). Das Ergebnis seines Adressatenmonitorings veranlasst ihn zu einer ausführlichen Reparatursequenz, deren Gegenstand die erneute Lokalisierung des Zeigeziels innerhalb des Suchraums ist:

07

das is' Abbildung 1.4

08

also auf der LINken SEIte; Abbildung 1.5

Abbildung 1.6

Abbildung 1.7

Abbildung 1.8

6.6 Zeigeziel: Das Vektor-Ziel-Problem

285

Beispiel 1 (Fortsetzung) 08 also auf der LINken SEIte; Abbildung 1.5

09 10 11 12

Abbildung 1.6

Abbildung 1.7

nicht das am ENde der stra sondern LINKS, (0.3) das war ein geWERbebau,

Abbildung 1.8

-

Nachdem er das Adressatenmonitoring beendet hat, richtet der Stadtführer seinen Blick erneut auf Suchraum und Zeigeziel (Abb. 1.4). Er beginnt eine neue Turnkonstruktionseinheit (Z. 7), bricht jedoch ab und leitet mit dem Reformulierungsindikator (Gülich und Kotschi 1987) also eine raumdeiktische Präpositionalphrase ein, die von einer neuerlichen Zeigegeste begleitet wird (Abb. 1.4) und innerhalb des komplexen Suchraums den Ort präzisiert, an dem sich das Zeigeziel befindet (Z. 8: also auf der LINken SEIte;). Es folgt eine weitere Expansion, in der mittels der koordinierenden Konjunktionalkonstruktion nicht x, sondern y nun explizit ein nicht intendierter Zeigezielkandidat ausgeschlossen und das intendierte Zeigeziel kontrastiv fokussiert wird (Z. 9–10: nicht das am ENde der straße- sondern LINKS,). Simultan dazu moduliert der Stadtführer die Form seiner Geste, indem seine Hand zunächst negierend nach außen weist (Abb. 1.5), dann in der oHHv-Form den Pfad (Abb. 1.6.) und unmittelbar darauf in der oHHu-Form den Endpunkt (Abb. 1.7) visualisiert, um schließlich in einer nach außen gerichteten oHHv-Form (Abb. 1.8) die in der Präpositionalphrase formulierte direktionale Angabe (Z. 10: LINKS) zu projizieren. Durch den sukzessiven und kontrastiven Ausschluss weiterer im Suchraum befindlicher Zeigezielkandidaten wird schrittweise dasjenige Zeigeziel erarbeitet, für welches die anschließende Prädikation (Z. 12: das war ein geWERbebau) gilt. Im nächsten Beispiel aus derselben Stadtführung liegt die Komplikation nicht darin, dass perzeptorisch unterschiedliche Zeigezielkandidaten zur Verfügung stehen, sondern sie ergibt sich aus der Tatsache, dass das Zeigeziel nicht sichtbar ist. Da der Stadtführer dies jedoch erst im Verlauf seiner Zeigehandlung bemerkt, ist er zu einer Reparatur gezwungen, die die begonnene demonstratio ad oculos in eine Deixis am Phantasma (vgl. dazu ausführlich Kapitel 7.4) trans-

286

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

formiert. Gegenstand seiner Ausführungen sind die wirtschaftlichen Interessen unterschiedlicher Akteure an der Nutzung bestimmter Gebäude im städtischen Raum, die dadurch fortlaufenden Funktionswandelprozessen unterliegen. Dem Ausschnitt sind ausführliche Erläuterungen über jenes Gebäude, das auch in der vorliegenden Sequenz eine Rolle spielt, sowie ein kurzer Exkurs über allgemeine städtische Entwicklungstendenzen vorausgegangen. Beispiel 2: „absurd versteckt“ (StFLing2_00:20:26)

01 02 03 04

SF:

!A:!ber; (--) jetzt gibt es !SPE!zialisten; (.) KLEIne gruppen setzen,

Abbildung 2.1

05

um (.) HOCHwertige Abbildung 2.4

06 07 08 09 10 11 12

Abbildung 2.2

Abbildung 2.5

Abbildung 2.3

Abbildung 2.6

in: (0.5) hIer DRIN,= =es ist lEider absUrd verSTECKT, hinsollten, zu verKAUfen.

6.6 Zeigeziel: Das Vektor-Ziel-Problem

06 in: 07 (0.5) 08 hIer DRIN,= Beispiel 2 (Fortsetzung) 09 =es ist lEider absUrd verSTECKT, 10 11 hinsollten, 12 zu verKAUfen.

287

Nach einer allgemeinen Bemerkung über die Motivation einer bestimmten In teressensgruppe (Z. 1–3) sucht der Stadtführer seine Erläuterungen wieder an den unmittelbaren Wahrnehmungsraum rückzubinden, indem er mit dem proximalen Demonstrativpronomen und einer auf den Boden gerichteten Zeigegeste einen räumlichen Anker im Hier-und-Jetzt setzt (Z. 4: DIE nützen jetzte dIEse prestIgeSTANDort,). Dieser bildet den Ausgangspunkt für die nachfolgende Zeigehandlung, in der die zu analysierende Reparatur stattfindet. Die Zeigehandlung wird eingeleitet, indem sich der Stadtführer zu Beginn der nächsten Turnkonstruktionseinheit, einer Finalsatzkonstruktion (Z. 5: um (.) HOCHwertige möbel-), umdreht (Abb. 2.1) und den Verweisraum herstellt (vgl. dazu Kapitel 6.2). Anschließend führt er eine Zeigefingergeste aus, deren Auf- und Abwärtsbewegung Anfangs- und Endpunkt und damit die vertikalen Dimensionen des Suchraums markiert (Abb. 2.2 und 2.3). Neben ihrer Deiktizität enthält die Geste im Hinblick auf das nicht genannte Zeigeziel zugleich eine ikonische Komponente. Die Zeigefingergeste läuft der raumdeiktischen Bestimmung, die sich im Formulierungsprozess selbst als problematisch erweist (Z. 6–7), weit voraus. Das von der Geste angegebene Zeigeziel kann weder perzeptorisch aufgefunden, noch verbal benannt werden, so dass der Stadtführer, während er die Präpositionalphrase beginnt und abbricht (Z. 6: in: ä::h-), seine Zeigefingergeste zunächst in eine oHHu-Geste mit gespreizten Fingern transformiert (Abb. 2.4). Diese Geste wird im Zuge seines Reformulierungsversuchs (Z. 8: hIer DRIN,) in eine pragmatische Vagheitsgeste verwandelt (schnelle, seitliche Rotationsbewegungen: Abb. 2.5), die ihrerseits in eine präsentative oHHo-Geste (Abb. 2.6) mündet und damit gleichsam die Nichtsichtbarkeit des Versteckten zur Betrachtung anbietet. Deixistheoretisch handelt es sich hier um eine Reparatur des Deixistyps: Eine als demonstratio ad oculos begonnene Zeigehandlung wird in den von Bühler (1965 [1934]: 135) als „Zwischenfall“ bezeichneten dritten Typ der Deixis am Phantasma transformiert (vgl. zu den unterschiedlichen Phantasma-Typen Kapitel 7.4). Beim dritten Beispiel aus „Polettos Kochschule“ handelt es sich um eine selbstinitiierte Selbstreparatur der Sprecherin. Poletto und ihr Gast stehen in einem Abstand von ca. 1,5 Metern nebeneinander hinter dem Kochtisch. Poletto ist damit beschäftigt Fleisch zu schneiden und richtet ihre Aufmerksamkeit auf die eigenen Hände. Um die nächsten Handlungsschritte zu planen und zu koordi-

288

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

nieren, fordert sie ihren Gast auf, die Temperatur für die benötigte Pfanne hochzustellen: Beispiel 3: „die Pfanne hier“ (PK4_00:09:44) Abbildung 3.1

01

PL:

Abbildung 3.2

02 03

HIER,

a:ber sie Abbildung 3.3

hh (.) die HIER schon AUFstehtstellen,

In ihrer Äußerung benennt Poletto durch das Lexem pfAnne (Z. 1) zwar den Referenten, da sich jedoch zwei Pfannen innerhalb des Suchraums befinden, muss

6.6 Zeigeziel: Das Vektor-Ziel-Problem

289

die Adressatin zwischen den beiden Alternativen das Zeigeziel der deiktischen Zeigehandlung die pfAnne HIER (Z. 1) identifizieren. Die unmarkierte Interpretation ist, dass das proximale Lokaldeiktikon Nähe zur Sprecherin indiziert. Doch folgende Faktoren verkomplizieren die Identifizierung von Zeigeziel und Referenten: Während die eine Pfanne leer ist, liegen in der anderen bereits ein paar Fleischstücke. Eine plausible Interpretation wäre also, dass die in Gebrauch befindliche Pfanne, die allerdings weiter von der Sprecherin entfernt ist, höher gestellt werden soll. Da die leere Pfanne näher bei Poletto, die andere hingegen näher beim Gast steht, erweist sich das proximale Lokaldeiktikon HIER (Z. 1) ohne eine entsprechende Zeigegeste als ambig. Wie auf Abbildung 3.1 zu sehen ist, bleibt Poletto in ihre eigenen Aktivitäten involviert und produziert weder manuell, noch mit dem Blick eine desambiguierende Zeigegeste. Die Adressatin orientiert sich zwar auf den Suchraum, kann jedoch aufgrund der Unvollständigkeit der Zeigehandlung das Zeigeziel nicht herstellen. In der nächsten Turnkonstruktionseinheit produziert Poletto eine selbstinitiierte Selbstreparatur, die auf der verbalen Ebene als Relativsatzkonstruktion (Z. 2: °hh die HIER schon AUFsteht-) syntaktisch angeschlossen und mit einem multimodal vollständigen Zeigeakt durchgeführt wird. Zum multimodal vollständigen Format der Zeigehandlung gehört die Herstellung des Verweisraums (Abb. 3.2) und die zwischen den beiden potenziellen Zeigezielen selegierende Zeigegeste auf das intendierte Zeigeziel (Abb. 3.3), die der Adressatin den nötigen Orientierungshinweis gibt. Das vierte und letzte Beispiel stammt aus einer weiteren Folge von „Polettos Kochschule“. Es handelt sich um eine relativ aufwendige Reparatursequenz (Schegloff 1992), deren Komplexität sich aus mehreren Problemquellen speist und sukzessiv zu einer Kette von sich addierenden Missverständnissen führt. Poletto und ihr Gast, Ingo Naujoks, sind in ihre jeweiligen Kochaktivitäten involviert und daher buchstäblich gehandicapt, da ihre Hände mit etwas anderem beschäftigt sind. Der Blick spielt folglich eine besondere Rolle in der deiktischen Zeigehandlung (vgl. zum Zeigen mit dem Blick ausführlich Kapitel 5.5.2). Er dient nicht nur der Wahrnehmung von Räumen und Objekten sowie dem Selbst- und Fremdmonitoring, sondern er wird anstelle einer manuellen Geste als deiktisches Zeiginstrument eingesetzt. Daraus ergeben sich spezifische Probleme, die erst spät intersubjektiviert werden und einen entscheidenden Faktor für die Aufwendigkeit der Reparatursequenz bilden. Aufgrund der Komplexität des multimodalen Geschehens fällt die vollzugsrekonstruktive Analyse dieser Sequenz viel ausführlicher aus als bei vorangegangenen Beispielen:

290

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

Beispiel 4: „Schaumkelle“ (PK2_00:14:46)

01 02

Nau: Pol:

also die Erste gnocchi schwimmt [Oben, [ja SUper; Abbildung 4.1

dann [kannst du ma ne' (.) SCHAUMkelle da hinten nehmen,

03

Abbildung 4.3

04

N au:

Pol:

Abbildung 4.4

[die hat den test beSTANden; Abbildung 4.5

05

Abbildung 4.2

Abbildung 4.6

und dann legst du die HIER auf das BRETT,

6.6 Zeigeziel: Das Vektor-Ziel-Problem

291

Beispiel 4 (Forsetzung)

06 07 08 09 10 11 12 13

Nau: Pol: Nau: Nau: Pol:

14

und dann proBIEren wir mal ob [(...) [SCHRAUBkelle? ja, (0.8) hm_hm, (0.8) wo sOll [ich hier denn jetzt die FINden die schraubkelle; [ma GUCK' ma GUCKen (1.4) Abbildung 4.7

15 16 17

Pol: Pub:

guck ma DA, GANZ kalt; (0.7) Abbildung 4.9

18 19 20

Pol:

21 22 23

Na: Pol: Na:

Abbildung 4.8

Abbildung 4.10

ja:: ja_ja_j' (.) JAhast du' ach du ka'[ach du bIst ja so_ geHANdicappt; [muss_ich nomma mein (

) benutzen;

292

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

Nachdem die Beteiligten festgestellt haben, dass die erste Gnocchi fertig ist (Z. 1–2), bittet Poletto ihren Gast, ein spezielles Küchenutensil vom hinteren Teil des Kochbereichs nach vorne zu holen (Z. 3: dann [kannst du ma ne’ (.) SCHAUMkelle da hinten nehmen,) und neben ihr auf den Kochtisch zu legen (Z. 5: °hh und dann legst du die HIER auf das BRETT,). Da ihre Hände anderweitig beschäftigt sind (Abb. 4.1), setzt sie ihren Blick als Zeiginstrument ein, um ihren Adressaten auf den Raum zu verweisen, in dem die Schaumkelle zu finden ist (Abb. 4.2). Als der Adressat sich auf den Suchraum orientiert hat (Abb. 4.3), richtet Poletto ihren Blick für einen kurzen Moment wieder auf die eigenen Hände (Abb. 4.4). Allerdings gibt es ein Problem. Obwohl der Adressat ihrem Blick folgt und seine Aufmerksamkeit auf den Suchraum richtet (Abb. 4.3–4.5), kann er das Zeigeziel nicht finden. Da Poletto seine Aufmerksamkeitsorientierung jedoch nicht kontrolliert, sondern ihren Blick stattdessen wieder auf die eigenen Hände richtet (Abb. 4.4), kann sie nicht wahrnehmen, dass er das Zeigeziel nicht wahrnimmt bzw. den Suchraum erfolglos mit dem Blick absucht. Anstatt also an dieser Stelle zu reparieren und weitere Orientierungshilfen zu geben, fährt Poletto mit einem zweiten Zeigeakt fort, der ebenfalls mit dem Blick ausgeführt wird (Abb. 4.5). Dieser wird jedoch vom Adressaten gar nicht erst wahrgenommen, denn er ist perzeptorisch und kognitiv noch immer mit der Aufgabe beschäftigt, das erste Zeigeziel zu lokalisieren und das Referenzobjekt zu identifizieren. Bereits zu Beginn der nächsten Turnkonstruktionseinheit, die mit dem zweiten Teil der Arbeitsanweisung auch die zweite Zeigehandlung enthält (Z. 5: °hh und dann legst du die HIER auf das BRETT,), zeigt Poletto mit den Blick auf den Ort, an dem der Adressat die Schaumkelle ablegen soll (Abb. 4.5). Dabei entgeht ihr, dass ihr Adressat zwar den Suchraum hergestellt hat, das Zeigeziel jedoch nicht auffinden kann. Dies signalisiert er, für Poletto jedoch nicht wahrnehmbar, zum einen durch seinen länger andauernden, suchenden Blick (Abb. 4.4–4.5) und zum anderen dadurch, dass er ihrer zweiten deiktischen Orientierungsanweisung nicht folgt, sondern in seiner Ratlosigkeit angesichts der ungelösten ersten Aufgabe schräg nach oben blickt (Abb. 4.6). Zu diesem Zeitpunkt in der emergierenden Interaktion haben sich bereits mehrere Probleme akkumuliert, die zwischen den Beteiligten nicht intersubjektiviert wurden und daher auch nicht unmittelbar repariert werden konnten. Sie betreffen sowohl den ersten als auch den zweiten Zeigeakt. Nicht erkannte Reparanda hinsichtlich des ersten Zeigeakts stellen Naujoks’ fehlende Herstellung des Zeigeziels, die Nicht-Identifizierbarkeit des Referenten und die daraus resultierende Unmöglichkeit der Ausführung der Arbeitsanweisung dar. Der Problemkern, aus dem sich die weiteren Probleme ergeben, ist dabei die interaktiv erfolglose Zeigezielherstellung.

6.6 Zeigeziel: Das Vektor-Ziel-Problem

293

Die Tatsache, dass Naujoks weiterhin mit der Unlösbarkeit der ersten Teil aufgabe beschäftigt ist, während Poletto bereits einen zweiten Zeigeakt vollbringt, ohne die Probleme ihres Interaktionspartners zu bemerken, verzögert das Inkrafttreten entsprechender Reparaturen und suspendiert die Schlüsselfunktion, die das Reparatursystem für die Aufrechterhaltung einer gemeinsamen, gleichgerichteten Orientierung auf relevante Gegenstände und Aufgaben besitzt. Dies führt zu einem zunehmenden Verlust an Ko-Orientierung auch beim zweiten Zeigeakt. Der fortschreitende Verlust an interpersoneller Koordinierung zeitigt weitere, mit dem Reparaturdefizit des ersten Zeigeakts (temporal und kausal) verknüpfte Reparanda, die sich deutlich früher im multimodalen Ablaufformat der Zeigehandlung manifestieren. Sie betreffen erstens die Tatsache, dass Naujoks noch auf den Suchraum des ersten Zeigeakts orientiert ist, während Poletto bereits mit dem Blick einen zweiten Suchraum mit einem neuen Zeigeziel herstellt. Zur interpersonellen Asynchronizität kommt zweitens die temporale Auffälligkeit, dass Polettos den zeigenden Blick (Abb. 4.5) weit vor der Artikulation des gestisch gebrauchten Lokaldeiktikons HIER einsetzt und zu dem Zeitpunkt, zu dem sie die räumlich relevante Information formuliert (Z. 5: HIER auf das BRETT,), bereits wieder auf ihre eigenen Hände blickt (Abb. 4.6). Der asynchrone Einsatz von körperlichem und verbalem Zeigmittel bedeutet, dass Naujoks, der sich in diesem Augenblick zwar umdreht (Abb. 4.6), keine visuelle Zeigehilfe von Poletto erhält. Doch wie bereits festgestellt wurde, orientiert er sich gar nicht erst auf Poletto, sondern blickt als Ausdruck seiner Ratlosigkeit schräg nach oben. Auch dies wird von Poletto nicht wahrgenommen, weshalb sie mit ihrer Agenda weiter fortfährt. Die konstatierten intra- und interpersonellen Asynchronizitäten, die die interaktive Bewältigung einer Zeigehandlung ganz grundsätzlich gefährden können, erweisen sich hier als Resultat der bereits zu Beginn des zweiten Zeigeakts vollständig auseinander laufenden Aktivitäten der Beteiligten. Während Poletto beim ersten Zeigeakt zumindest wahrnimmt, dass der Adressat sich auf den Suchraum orientiert, dabei jedoch nicht abwartet, ob er das Zeigeziel auch auffindet, sondern anstelle eines Adressatenmonitoring ihren Blick wieder auf die eigenen Hände und dann auf den nächsten Verweisraum richtet, verzichtet sie beim zweiten Zeigeakt vollständig auf eine Wahrnehmung ihres Adressaten. Auf diese Weise entgeht ihr nicht nur, dass ihr Adressat schon das erste Zeigeziel nicht auffinden kann, sondern auch, dass er ihren zweiten Zeigeakt überhaupt nicht wahrnimmt. Als Poletto im Anschluss an ihren zweiten Zeigeakt noch einen weiteren Handlungsschritt projiziert (Z. 6: und dann proBIEren wir mal ob), wird von Naujoks eine Reparatur fremdinitiiert (Z. 7: SCHRAUBkelle?). Die Reparaturinitiierung bezieht sich jedoch zunächst nicht auf das Problem der Zeigezielherstellung,

294

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

sondern verdeutlicht, dass eine weitere Problemquelle vorliegt, die das perzeptorische Problem mitbedingt. Sie beruht auf dem akustischen Missverständnis zwischen Schaumkelle versus Schraubkelle, das im Rahmen der medial konstruierten Bühnen- bzw. Fernsehinteraktion durchaus inszeniert sein kann und in diesem Fall mit stereotypen, genderspezifischen Frames weiblicher gegenüber männlicher Tätigkeitsdomänen spielt. Unabhängig davon, ob die Schwierigkeiten real oder inszeniert sind, wird auf diese Weise das perzeptorische Problem der Zeigezielherstellung auf epistemisch unterschiedliche Voraussetzungsstrukturen und damit auf das kognitive Problem der Referenzherstellung zurückgeführt. Bezogen auf das hier vorgestellte theoretische Modell erweist sich darin die enge Verbindung von Zeigeziel und Referent. Wie der weitere Verlauf zeigt, wird das Verständnisproblem keineswegs beseitigt, sondern im Gegenteil dadurch aufrecht erhalten, dass Poletto die Rückfrage bestätigt und das falsche Wort ratifiziert. Erst dann formuliert Naujoks explizit das eingangs diskutierte Problem der Zeigezielherstellung, das den Kern der gesamten Reparatursequenz ausmacht (Z. 12: wo sOll [ich hier denn jetzt die FINden die schraubkelle;). Zugleich rückt er den missverstandenen Ausdruck durch eine Rechtsversetzung erneut in den Fokus. Der Ausdruck wird von Poletto jedoch abermals nicht repariert. Überlappend mit seiner Äußerung wendet sie sich konspirativ ans Publikum und unterwirft ihren Gast einer gemeinsamen Bewertung (Z. 13: [ma GUCK’ ma GUCKen ). Dieser nimmt, zunächst sich selbst überlassen und auf seine eigenen Ressourcen angewiesen, seine Suchaktivitäten wieder auf. Schließlich greift Poletto ein und produziert mit ausgestrecktem Arm und einer entsprechenden Körperdrehung eine Zeigefingergeste (Abb. 4.7). Im Gegensatz zu den beiden vorherigen Zeigeakten hält sie nun sowohl ihre Zeigegeste als auch ihre visuelle Orientierung auf den Adressaten so lange aufrecht, bis dieser sich zu ihr umdreht und ihre Zeigegeste wahrnimmt (Abb. 4.8). Auch im Anschluss fährt Poletto mit dem Monitoring ihres Adressaten fort und beobachtet ihn bei den abzuarbeitenden Aufgaben der Suchraum- und der Zeigezielherstellung (Abb. 4.9). Als Naujoks sich wieder auf den Suchraum orientiert und beide Arme in Richtung des Zeigeziels ausstreckt, begleitet Poletto seine Bewegungen mit einem erfolgsprojizierenden ja:: ja_ja_j’ (.) JA- (Z. 18). Auf diese Weise wird das Zeigeziel als gemeinsames Ergebnis interaktiv hergestellt (Abb. 4.9–4.10). Allerdings entsteht eine weitere Komplikation, als Naujoks nun seine teigverschmierten Hände zur Schau stellt und sich dadurch als ungeeignet für die Ausführung der Aufgabe inszeniert. Dies führt schließlich dazu, dass Poletto ihre eigene Aktivität komplett aufgeben, ihre Hände abwischen und die Schaumkelle selbst holen muss.

6.6 Zeigeziel: Das Vektor-Ziel-Problem

295

Die Komplexität des zuletzt betrachteten Beispiels ergibt sich aus einer Reihe ineinander spielender Faktoren. Dadurch dass die Hände der Zeigenden mit Kochtätigkeiten beschäftigt sind und als Zeiginstrument wegfallen, tritt der Blick an die Stelle manueller Zeigegesten und übernimmt deren Aufgaben. Diese funktionale Umverteilung bedeutet, dass der Blick nun für andere Aufgaben und Funktionen, insbesondere für die zentralen perzeptorischen Aufgaben des Adressatenmonitoring und der Wahrnehmungswahrnehmung, nicht mehr verfügbar ist. Dies wiederum hat Folgen für die interpersonelle Ko-Orientierung und Koordinierung. Wenn die Zeigende, wie im vorliegenden Beispiel, mit dem Blick durch eine Serie von Blickorientierungswechseln (gaze shifts) auf unterschiedliche Zeigeziele zeigt, bedeutet das, dass sie die Aufmerksamkeitsorientierung ihres Adressaten nicht kontrollieren und daher auch die möglichen Problemquellen nicht sofort identifizieren und reparieren kann. Erschwerend kommt hinzu, dass die Wahrnehmung der Zeigenden selbst in den Augenblicken, in denen sie den Blick nicht zum Zeigen eingesetzt hat, von ihren eigenen manuellen Tätigkeiten absorbiert war. Dieses kontinuierliche Selbstmonitoring, das lediglich zum Zeigen mit dem Blick suspendiert wurde, hatte zur Folge, dass die Zeigende keinerlei visuelle Informationen über ihren Adressaten gesammelt hat, was zu einer verspäteten Wahrnehmung des Problems und einer entsprechend extensiven Reparatur-Sequenz geführt hat. Der Einsatz des Blicks als Zeigeressource verlangt eine funktional anders artige Organisation der Aufgaben, die sequenziell und interaktiv abgearbeitet werden müssen, wenn wir die Aufmerksamkeit eines Adressaten auf einen Raum bzw. ein Objekt lenken wollen. Er verlangt eine Redistribution der verschiedenen Aufgaben und Funktionen auf die zur Verfügung stehenden Ressourcen, die bei der Zeigehandlung insgesamt involviert sind. Eine Reorganisation der Ressourcen infolge funktionaler Verschiebungen geht häufig mit einem Mehraufwand einher und führt unter Umständen zu Problemen, die auf unterschiedlichen Ebenen angesiedelt sein und zentrale Parameter der Zeigehandlung betreffen können. Sofern solche Probleme die Parameter der Zeigehandlung betreffen, bestätigt die Tatsache, dass sie repariert werden, deren zentrale Relevanz. Darüber hinaus gibt die sequenzielle Analyse dessen, wann und warum solche Probleme entstehen und wie sie repariert werden, Aufschluss über den default-Fall der Ressourcenorganisation bei der deiktischen Zeigehandlung. Da in unproblematischen Fällen die Herstellung des Suchraums und die Herstellung des Zeigeziels ohne Eyetracking-Studien empirisch nicht trennscharf untersucht werden können, wurden in diesem Kapitel Reparatursequenzen betrachtet, deren Reparandum die Identifizierung des Zeigeziels in einem komplex strukturierten Suchraum darstellt. Dadurch, dass die Beteiligten mit der interaktiven Bearbeitung des Vektor-Ziel-Problems beschäftigt waren und diese

296

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

Bearbeitung sequenziell erfolgte, wurde die analytische Isolierung des Zeigeziels als vom Suchraum zu unterscheidender eigenständiger Parameter möglich.

6.7 Referent: Das Problem der Referenzherstellung Im Unterschied zu bisherigen Theorien und Untersuchungen zur Deixis differenziert das hier vorgestellte Modell (Kapitel 4) sowohl zwischen Suchraum (Kapitel 4.6) und Zeigeziel (Kapitel 4.7) als auch zwischen Zeigeziel (Kapitel 4.7) und Referent (Kapitel 4.8). Im vorangegangenen Kapitel (6.6) wurde der empirische Nachweis erbracht, dass das Zeigeziel ein vom Adressaten innerhalb des Suchraums zu isolierendes Wahrnehmungsphänomen darstellt. In diesem Kapitel soll der empirische Nachweis erfolgen, dass die Lokalisierung des Zeigeziels (Lösung des perzeptorischen Vektor-Ziel-Problems) und die Identifizierung des Referenten (Lösung des kognitiv-semantischen Problems der Referenzherstellung) zwei analytisch zu trennende Teilprobleme konstituieren, die im unmarkierten Normalfall integrativ und quasi simultan gelöst werden. Anhand von Fällen allerdings, in denen Reparaturen erforderlich werden, lässt sich zeigen, dass die perzeptorisch-kognitive Doppelaufgabe der Zeigezielund Referenzherstellung auch aus der Teilnehmerperspektive in zwei verschiedene Aufgaben auseinanderfallen kann, die von den Beteiligten sequenziell abgearbeitet werden. Wie im vorangegangenen Kapitel ausführlich dargestellt wurde, kann es zum einen geschehen, dass das Zeigeziel nicht sofort aufgefunden wird. Die Beteiligten sind folglich zur interaktiven Bearbeitung des VektorZiel-Problems herausgefordert. Das Reparandum ist in diesem Fall das wahrzunehmende Zeigeziel (vgl. Kapitel 6.6). Zudem gibt es Fälle, in denen sich die Interaktionsteilnehmer mit matching-Problemen konfrontiert sehen. Diese bestehen darin, dass der Referent zwar in einem symbolischen Ausdruck (z. B. einer definiten Nominalphrase „die Pfanne hier“) semantisch enkodiert ist, das konkrete Zeigeziel (demonstratum; Clark et al. 1983)73 jedoch nicht problemlos aufgefunden werden kann. Der Grund dafür kann sein, dass mehrere Kandidaten zur Auswahl stehen oder dass der Adressat keine hinreichende mentale Repräsentation der Kategorie besitzt, um in einem komplexen Suchraum das Zeigeziel von ähnlichen Objekten unterscheiden zu können. Zum anderen kann es geschehen, dass zwar das Zeigeziel vom Adressaten aufgefunden wird – z. B. eine Platte mit Speisen –, die Referenzherstellung hingegen unklar bleibt und somit der Referent zum Reparandum wird.

73 Während Clark et al. (1983) das Begriffpaar demonstratum und referent benutzen, bezeich-

6.7 Referent: Das Problem der Referenzherstellung

297

Der Unterscheidung zwischen Zeigeziel und Referenten korrespondieren folgende Begriffsdifferenzierungen, die im theoretischen Kapitel (4.7) vorgenommen wurden: So wird mit dem Begriffspaar Figur (figure) und Wahrnehmungsgrund (perceptual ground) ausschließlich die Organisation der visuellen Wahrnehmung in einer Zeigehandlung konzeptualisiert (vgl. auch Hanks 1992: 61), während das Begriffspaar Referent (referent) und konzeptueller Grund (conceptual ground) analog dazu die kognitive Organisationsstruktur erfasst. Das erste Beispiel aus dem „Big Brother“-Korpus illustriert anhand mehrerer Zeigegesten das von Quine formulierte und an dem berühmten Gavagai-Beispiel illustrierte Problem (Quine 1960: 28 ff.), dass die (kategoriale) Identifizierung eines Zeigeziels nicht notwendigerweise mit der Identifizierung des gemeinten Referenten identisch sein muss. Jürgen befindet sich im Statement-Raum des „Big Brother“-Hauses und kommuniziert via Kamera mit den Fernsehzuschauern. Er beklagt sich über die Wochenaufgabe, bei der die Bewohner gemeinsam die Shakespeare-Komödie „Ein Sommernachtstraum“ aufführen und dazu den Rollentext auswendig lernen müssen. Wie seiner Mitbewohner hat auch er Probleme mit der zu lernenden Textmenge. Dies vermittelt er den Fernsehzuschauern, indem er anhand des Manuskripts den Umfang an Text demonstriert, den er einfach nicht behalten kann: Beispiel 1: „beschissene Wochenaufgabe“ (bb86_00:28:47) Abbildung 1.1

01

Jrg:

jaAbbildung 1.2

Abbildung 1.3

net Hanks (1992) das durch eine deiktische Zeigehandlung herzustellende Objekt als denotatum, ohne zwischen Zeigeziel und Referenten zu unterscheiden.

298

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

01 jaBeispielJrg: 1 (Fortsetzung) Abbildung 1.2

02

zu DIEse:rAbbildung 1.4

03 04

Abbildung 1.3

Abbildung 1.5

(0.6) beSCH(h)ISSenen wochenaufgabe,

Zu Beginn seines mit ja eingeleiteten Redezugs (Z. 1) blickt Jürgen zunächst seitlich nach unten auf seine linke Hand (Abb. 1.1), in der sich ein in Folie verpackter Text befindet. Während er den akzentuierten, deiktisch gebrauchten Demonstrativartikel DIEse:r (Z. 2) artikuliert, führt er die linke Hand zusammen mit dem Text vor seinen Oberkörper (Abb. 1.2) und hält dann das Textmanuskript mit beiden Händen vor seinem Gesicht in die Kamera (Abb. 1.3). Dabei ist sein gesamtes Gesicht inklusive der Augen für einen kurzen Moment von den Textseiten verdeckt, so dass seine Blickorientierung für die Adressaten nicht mehr sichtbar ist. Dies hat den Effekt, dass die Zuschauer spiegelbildlich zu Jürgen die Perspektive eines Lesers einnehmen bzw. buchstäblich nichts als

6.7 Referent: Das Problem der Referenzherstellung

299

den Text vor Augen haben. In der anschließenden Pause senkt Jürgen das Manuskript so weit, dass seine Augen wieder sichtbar werden. Der Blick ist dabei in die Kamera, d. h. auf die imaginären Adressaten, gerichtet (Abb. 1.4). Als Zeigeziel dieser beidhändigen Präsentationsgeste sind damit die in seiner Hand befindlichen Textseiten etabliert. Erst dann löst Jürgen die durch die begonnene Präpositionalphrase und den Demonstrativartikel aufgebaute, syntaktische Projektion ein, indem er eine entsprechende Nominalphrase (Z. 4: beSCH(H)ISSenen wochenaufgabe;) formuliert. Dabei hebt er das Manuskript an und verdeckt damit erneut seinen Blick (Abb. 1.5). Dadurch, dass er das Manuskript diesmal jedoch zusätzlich an sein Gesicht drückt, stellt er nicht nur einen visuellen Bezug zwischen dem zuvor als Zeigeziel etablierten Text und dem semantischen Gehalt der Nominalphrase her, sondern er inszeniert auch die in dem Extremausdruck beschissen formulierte Negativbewertung der Wochenaufgabe in ihrer Auswirkung auf ihn: Sie ist erdrückend und insofern gesichtsbedrohend, als Scheitern mit Schamgefühlen besetzt ist und außerdem die Leistung der ganzen Gruppe gefährdet. So versteckt Jürgen sich quasi hinter seiner Aufgabe bzw. deren materieller Manifestation in Form bedruckter DIN A4 Seiten. Dem durch das Demonstrativpronomen und die Präsentativgeste hergestellten Zeigeziel korrespondiert als Referent also nicht ein Stück Papier, eine Textseite, eine bestimmte Szene oder Figur im Theaterstück, sondern die ganze Wochenaufgabe. Eine wichtige Bemerkung zur Funktion von Demonstrativpronomen ist hinzuzufügen. In der Forschungsliteratur wird üblicherweise zwischen exophorischem und endophorischem (Halliday und Hasan 1976; Diessel 1999, 2006) bzw. zwischen situativem und nicht-situativem Gebrauch der Demonstrativa (Himmelmann 1996, 1997) unterschieden, wobei die Kategorie des endophorischen bzw. nicht-situativen Gebrauchs eine Subkategorisierung in anaphorischen, diskursdeiktischen und anamnestischen Gebrauch (recognitional use bei Hasan und Halliday 1976 sowie bei Diessel 1999) erfährt. Entgegen der Annahme kategorial scharf voneinander zu trennender Funktionen belegt das vorliegende Beispiel, dass sich die genannten Funktionen im realen Sprachgebrauch auch überlagern bzw. in einer emergierenden Äußerung funktionale Transformationen oder Anreicherungen erfahren können. So erscheint das Demonstrativum DIEser (Z. 2) in der online-Emergenz der Äußerung zunächst als deiktisch und gestisch. Es ist akzentuiert und lenkt deshalb die Aufmerksamkeit auf eine simultan ausgeführte Zeigegeste. Doch als der Sprecher die Nominalphrase formuliert und deutlich wird, das als Referent des sichtbaren Zeigobjekts eine abstrakte Entität (Wochenaufgabe) fungiert, wird das Demonstrativum retrospektiv auch als anamnestisch gebrauchtes, nicht-situatives Verweismittel (bzw. als recognitional, Hasan und

300

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

Halliday 1976) lesbar. In dieser Funktion setzt es den gemeinsamen Wissensgrund (common ground) zwischen Jürgen, der sich wie seine Mitbewohner seit Tagen mit Textlernen quält, und den regelmäßig daran Anteil nehmenden Zuschauern relevant. Neben die gemeinsame Wahrnehmung (shared perception) des präsentierten Zeigobjekts tritt das gemeinsame Hintergrundwissen, welches im vorliegenden Fall für die Referenzherstellung viel entscheidender ist als das sichtbare Objekt. In der Folge erläutert Jürgen sein Problem genauer und führt zwei weitere, miteinander verbundene Zeigehandlungen aus. Dabei erweist sich erneut die Gültigkeit der Feststellung, dass die Wahrnehmung des Zeigeziels für die Identifizierung des Referenten allein nicht ausreicht: Beispiel 1 (Fortsetzung) Abbildung 1.6

05

h DAS was hier rau'Abbildung 1.8

06 07 08

Abbildung 1.7

Abbildung 1.9

(.) wa DAS was hier DRAUF steht; REIN; (0.5)

Abbildung 1.10

6.7 Referent: Das Problem der Referenzherstellung

06 07 08

(.) wa DAS was hier DRAUF steht; REIN; (0.5)

09 10 11

SIEHT man ja auch;= =ne? PASST nich.

301

Beispiel 1 (Fortsetzung)

Abbildung 1.10

In dem zweiten Ausschnitt produziert Jürgen, unterbrochen von einer selbst initiierten Selbstreparatur, die sich gleichermaßen auf das Pronominaladverb wie auf die körperliche Demonstration bezieht, eine zweite, gestisch komplex strukturierte Zeigehandlung auf die Papierblätter. Simultan zum akzentuierten Demonstrativpronomen DAS (Z. 5) macht er mit dem beidhändig in die Höhe gehaltenen Papier eine schlagartige Bewegung nach vorne (Abb. 1.6) und wendet anschließend das Papier um (Abb. 1.7), so dass nun die andere Seite sichtbar wird. Dabei zeigt sich, dass das Papier beidseitig mit Text beschrieben ist. Während Jürgen das umgedrehte Papier präsentiert (Abb. 1.8), wiederholt er den Relativsatz und ersetzt die abgebrochene Partikel rau’ (Z. 5) durch das Pronominaladverb DRAUF (Z. 6), das zusammen mit dem proximalen Lokaladverb hier eine gestisch gebrauchte deiktische Konstruktion bildet. Diese erfordert einen körperlichen Zeigeakt, der durch die Präsentativgeste mit dem Papier vollzogen wird. Referent dieses zweiphasigen Zeigeakts ist der in dem Manuskript enthaltene, zu memorierende Rollentext. Mit der Fortsetzung des durch den Relativsatz unterbrochenen Hauptsatzes vollzieht Jürgen eine unmittelbar anschließende dritte Zeigehandlung. Dabei bringt er das Papier in eine horizontale Position und führt es, als er das zweite proximale Lokaldeiktikon hier und das Lokaldadverb REIN artikuliert (Z. 7), mit der oberen Kante an seine Stirn (Abb. 1.9). Indem er so tut, als wolle er das materielle Objekt durch einen mechanischen Vorgang in seinen Kopf schieben, indem er also einen mentalen Vorgang, das Memorieren, als materiellen Vorgang inszeniert, spielt er mit der wörtlichen und der metaphorischen Bedeutung des deiktischen Bewegungsverbs „reingehen“, das den kognitiven Aufnahmeprozess verbildlicht, sowie mit der Diskrepanz zwischen den Zeigezielen und ihren jewei-

302

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

ligen Referenten. Die beiden Zeigeziele sind zum einen das Blatt Papier mit den darauf gedruckten Buchstaben, Wörtern und Sätzen und zum anderen die Stirn des Sprechers. Die zugehörigen Referenten stellen hingegen der zu memorierende Rollentext und das Gedächtnis des Sprechers da. Das Spiel mit der visualisierten wörtlichen und der metaphorischen Bedeutung des Verbs „reingehen“ ist zugleich ein Spiel mit dessen gestisch inszenierter deiktischer und dessen referenzieller Bedeutung. Dieses Spiel setzt Jürgen noch weiter fort, indem er das Papier in forcierter Weise mehrmals gegen seine Stirn drückt (Abb. 1.10) und als Kommentar dazu die visuelle Evidenz seines gestischen Tuns explizit in den Fokus rückt (Z. 9: SIEHT man ja auch;). Dadurch macht er die Zuschauer zu Augenzeugen eines als unmöglich dargestellten Unterfangens, dessen physisch sichtbare Unmöglichkeit, das Blatt Papier vertikal durch seine – offenbar mit Schlitz vorzustellende – Stirn in seinen – offenbar wie ein Faxgerät vorzustellenden – Kopf zu schieben. Dieses Spiel funktioniert nur auf der Grundlage dessen, das Zeigeziel und Referent zwei unterschiedliche Größen darstellen. Das zweite Beispiel aus dem Kochkorpus belegt die Notwendigkeit einer systematisch zu treffenden Unterscheidung zwischen Zeigeziel und Referenten anhand einer speziellen syntaktischen Konstruktion. Es handelt sich um ein syntaktisch-demonstratives Format zur systematischen Trennung von Zeigezielherstellung und Einführung bzw. Beschreibung des Referenten in Gestalt einer Kopulakonstruktion: Deixis + COP + präd. NP. Die deiktische Komponente wird durch ein Demonstrativpronomen (das, dies) repräsentiert und erfordert eine Zeige- bzw. Präsentativgeste. Dieses Format lässt sich als multimodale Präsentativkonstruktion auffassen und wird anhand des folgenden Beispiels illustriert. In dem Ausschnitt befindet sich Poletto im Zuschauerbereich und spricht mit einem Gast. Sie hat eine besondere Sorte Oliven in einem Schälchen auf dem Tisch ihres Gasts abgestellt. Sie greift eine Olive heraus und präsentiert sie der Kamera: Beispiel 2: „bella de cerigniola“ (PK4_00:07:27) Abbildung 2.1

1

Abbildung 2.2

HIER, (--)

Pol: Abbildung 2.3

Abbildung 2.4

6.7 Referent: Das Problem der Referenzherstellung

HIER, (--)

1 BeispielPol: 2 (Fortsetzung) Abbildung 2.3

Abbildung 2.4

2

=

3

=das sind

4

303

-

Poletto befindet sich in fokussierter Interaktion mit einem Studiogast. Vor ihm auf dem Tisch hat sie ein Schneidebrett und eine Schale mit Oliven platziert. Bevor sie ihm zeigt, wie er die Oliven schneiden soll, rückt sie die Besonderheit der Olivensorte in den Fokus. Dabei werden durch eine Linksversetzung (Z. 1: °hh (.) dIeter DAS HIER,), auf die zunächst eine Parenthese folgt (Z. 2: also das mUss man einfach noch mal SEHN,), die Herstellung des Zeigobjekts und die Identifizierung des Referenten in zwei Teilakte – einen Zeigeakt und einen Benennungsakt – sequenziert. Zunächst richtet Poletto eine Fokussierungsaufforderung an ihren Studiogast, indem sie ihn mit dem Vornamen adressiert, und führt dann eine deiktische Zeigehandlung aus (Z. 1: °hh (.) dIeter DAS HIER,). Während sie das deiktische Demonstrativpronomen DAS in Verbindung mit dem proximalen Lokaldeiktikon HIER produziert, greift sie mit der Hand in das Olivenschälchen (Abb. 2.1) und nimmt in der anschließenden Pause eine einzelne Olive heraus, die sie zwischen Daumen und Zeigefinger etwa auf Augenhöhe anhebt (Abb. 2.2). In dem Augenblick, indem ihre Präsentativgeste den Gipfelpunkt erreicht, wendet sie sich von ihrem Interaktionspartner ab und richtet ihren Blick in die Kamera (Abb. 2.3). Eingeleitet durch den Reformulierungsindikator also äußert sie in Form einer Parenthese eine explizite Betrachtungsaufforderung (Z. 2: ), wodurch das Zeigeziel, die einzelne Olive, noch stärker in den visuellen Aufmerksamkeitsfokus gerückt wird.

304

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

Wie an Polettos Adressierung der Kamera erkennbar wird (Abb. 2.3), sind nun die Fernsehzuschauer die primären Adressaten ihrer mehrfach adressierten Betrachtungsaufforderung. Es folgt ein account, der den geforderten hohen Grad an Aufmerksamkeit gegenüber dem Zeigobjekt begründet. Der account wird durch das Demonstra tivpronomen das eingeleitet (Z. 3), welches anaphorisch das linksversetzte deiktische Demonstrativpronomen (Z. 1) wiederaufgreift und als Präsentativkon struktion durchgeführt (Z. 3: =das sind die !SCHÖN!sten grünen oliven Überhaupt-). In dieser Konstruktion werden Zeigeziel und Referent systematisch voneinander getrennt. Dieser Effekt wird durch die vorausgegangene Linksversetzung (Z. 1: DAS HIER) noch verstärkt. Als Poletto die Präsentativkonstruktion formuliert (Z. 3), kehrt ihr Blick wieder zu ihrem Studiogast zurück (Abb. 2.4), der damit erneut als primärer Adressat ihrer Äußerung fungiert. Zugleich bewegt sie die präsentierende Hand mit der Olive in Richtung ihres Gasts. Im Verlauf ihrer Erklärung (Z. 3–4) vollführt Poletto eine Reihe von Taktstockgesten (batons), die das Gesagte unterstreichen. Simultan dazu bestätigt der Adressat durch rhythmisch genau eingepasstes Kopfnicken online seinen Verstehensprozess. Das erste kinesische Rückmeldesignal wird am Ende des Modal adverbs Überhaupt (Z. 3) und das zweite auf der letzten Silbe des italienischen Namens -la (Z. 4) produziert. Der Referent der Zeigehandlung ist nicht die einzeln präsentierte Olive (das Zeigeziel) in ihrer individuellen Schönheit, sondern eine bestimmte Sorte grüner Oliven. Wie die nachfolgende Turnkonstruktionseinheit durch Inversion zusätzlich fokussiert, ist der italienische Name Ausdruck der besonderen Schönheit dieser Olivensorte (Z. 4: BELla di cerigniola heißen die?). Das dritte Beispiel („Olivenöl“) stammt aus einer weiteren Folge von „Polettos Kochschule“. Poletto und ihr Gast, Tom Buhrow, bereiten Crostini zu. Als Gastgeberin und Profiköchin obliegt es Poletto, die Aktivitäten zu koordinieren. Dazu fordert sie ihren Gast im wir-Format auf, Olivenöl und Acetto Balsamico in ein Gefäß zu füllen (Z. 1–5), das sie mit einer deiktischen Zeigehandlung (Z. 3: hier rein) auf dem Kochtisch lokalisiert und identifiziert (Abb. 3.1). Dazu zeigt sie mit ausgestrecktem Arm und Zeigefinger (ZfHu-Format) in eine Stielkasserolle. Ohne auf ihre Zeigegeste zu blicken, signalisiert der Adressat zunächst durch zwei Rückmeldesignale (Z. 4: [hm_hm, und Z. 6: GUT,) sein Verstehen und die Bereitschaft, die ihm zugewiesene Aufgabe zu übernehmen. Doch dann initiiert er in Überlappung mit Polettos Turnfortsetzung eine Klärungssequenz, bei der er nun selbst eine Zeigehandlung auf das entsprechende Gefäß durchführt (Z. 8: [HIER in den’] DIESmal HIER in den (.) kessel;). Diese Zeigehandlung weist nicht nur einen höheren Grad an verbaler Explizitheit auf, indem das Zeigeziel durch

6.7 Referent: Das Problem der Referenzherstellung

305

Beispiel 3: „Olivenöl“ (PK5_00:23:35)

01 02

PL:

wir machen uns WIEder, (1.5) Abbildung 3.1

03 04 05

TB: PL:

06 07

TB: PL:

rein; [ja? [hm_hm, balSAmic[o? [GUT, Abbildung 3.2

08

TB:

09 10 11 12

PL: TB: TB:

Abbildung 3.3

[HIER in den'] DIESmal hIer in den (.) kessel;= =hm_hm, oKAY, (1.1) oder (.) TOPF;

306

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

ein referenziell eindeutiges, nicht-deiktisches Lexem (Z. 8: kessel) benannt wird, sondern sie enthält darüber hinaus eine selbstinitiierte Selbstreparatur. In der Reparatur werden eine Zeigegeste (Abb. 3.3) und eine temporaldeiktische Angabe (DIESmal) hinzugefügt, die eine kontrastive Fokussierung vornimmt. Die genaue Analyse der interpersonellen Koordinierung zwischen den beiden Beteiligten fördert zutage, dass die erste Verwendung des proximalen Lokaldeiktikons HIER durch Buhrow (Z. 8: HIER in den’) zwar akzentuiert ist, aber ohne Zeigegeste erfolgt (Abb. 3.2). In diesem Fall erfüllt das Lokaldeiktikon zunächst die Funktion einer Fokussierungsaufforderung, indem es die visuelle Aufmerksamkeit der Adressatin für das Folgende einfordert. Das Deiktikon wird nicht von einer Zeigegeste begleitet und stellt erst den Orientierungsrahmen her, innerhalb dessen der eigentliche deiktische Zeigeakt erfolgreich vollzogen werden kann. Dazu wiederholt der Sprecher das Lokaldeiktikon hIer (Z. 8) und setzt simultan dazu eine Zeigegeste ein (Abb. 3.3). Tom Buhrow begnügt sich hier nicht mit einer Intersubjektivierung durch reziproke deiktisch-perzeptorische Herstellungs- und Verständnisakte, sondern er ist darum bemüht, zusätzlich Eindeutigkeit durch einen präzisen Benennungsakt des Referenten herzustellen. Er unternimmt eine weitere selbstinitiierte Selbstreparatur, die sich auf den referenziellen Benennungsakt bezieht. Darin ersetzt er das Lexem kessel (Z. 8) durch das zutreffendere Lexem (Z. 12: oder (.) TOPF;). Diese Sequenz scheint auf den ersten Blick analog zu dem in Kapitel 6.6 analysierten Beispiel 3 („die Pfanne hier“) zu funktionieren. Doch im Gegensatz dazu handelt es sich im vorliegenden Fall nicht um das Problem der Ambiguität potenziell miteinander konkurrierender Zeigeziele in einem komplex strukturierten Suchraum, sondern um eine Reparatur, die die eindeutige, verbal explizite Identifizierung des Referenten zum Gegenstand hat. Während also im Beispiel „die Pfanne hier“ (Kapitel 6.6.) das Zeigobjekt das Reparandum der deiktischen Zeigehandlung darstellte und entsprechende visuelle Reorientierungshandlungen erforderte, ist das Reparandum in der „Olivenöl“-Sequenz der Referent, wie das Bemühen des Sprechers um einen korrekten Benennungsakt belegt. Im vierten Beispiel aus „Polettos Kochschule“ wird die Tatsache, dass Zeigeziel und Referent unterschiedliche Größen sind, daran deutlich, dass das Zeigeziel von der Sprecherin zunächst durch einen deiktischen Ausdruck hergestellt, der Referent hingegen anschließend von der Adressatin durch einen Symbolausdruck benannt wird. Poletto und ihr Gast, Heide Simonis, bereiten Kaninchenteile zu und stehen dicht beieinander hinter einem Schneidebrett. Als Poletto einen Arbeitsauftrag erteilt (Z. 1–7), stellt Simonis eine Rückfrage (Z. 8), die von einer Zeigegeste begleitet wird:

6.7 Referent: Das Problem der Referenzherstellung

307

Beispiel 4: „Knochen“ (PK4_00:08:37) Abbildung 4.1

01 02

PL:

also wenn SIE jetzt diese- (-) kanInchenteile hier EINlegen frau simonis, Abbildung 4.2

03 04 05 06

ich hab ja schon_n pAar KLEINgeschnitten, HS:

[ja,

jo; Abbildung 4.3

07

PL:

hIer

]

308

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

Beispiel 4 (Fortsetzung) Abbildung 4.4

08

Abbildung 4.5

[ und dann

6.7 Referent: Das Problem der Referenzherstellung

309

Als Poletto den Arbeitsauftrag (Z. 1–2) an Simonis formuliert, steht sie links von ihr am Herd und gießt Olivenöl in eine Pfanne (Abb. 4.1). Der Demonstrativartikel diese (Z. 1) in ihrer Äußerung setzt voraus, dass das Bezugsnomen kanInchenteile (Z. 2) bekannt und im umgebenden Raum problemlos auffindbar ist. Demgegenüber bezieht sich das unmittelbar folgende proximale Lokaldeiktikon hIer (Z. 2) nicht auf den momentanen Fundort der Kaninchenteile, sondern auf den Zielort der als EINlegen beschriebenen Tätigkeit, die Poletto ihrem Gast aufträgt. Dieser Zielort ist durch die manuelle Aktivität, die Poletto simultan zu ihrer Äußerung ausführt, definiert: Sie gießt Öl in jene Pfanne, in die Simonis die Kaninchenteile einlegen soll. Anschließend läuft Poletto vom Herd hinter Simonis vorbei (Abb. 4.2) und stellt sich rechts von ihr an das Schneidebrett. Dort beginnt sie eine neue Aktivität, die sie auch verbal benennt (Z. 7: hIer schnEid_ich_noch mal schnell RÜber?). Das proximale Deiktikon in dieser Äußerung bezieht sich auf das Kaninchenteil, das sie währenddessen zur Bearbeitung in die Hand genommen hat (4.3). Ihr Blick ist auf die eigenen Hände gerichtet, die ein Messer und ein Kaninchenteil halten. Überlappend mit Polettos Äußerung (Z. 7) stellt Simonis eine Frage, um sich zu vergewissern, welche Kaninchenteile sie in den Topf legen soll und welche auszusondern sind (Z. 8: was machen wir HIERmit,). Simultan zu dem deiktisch verwendeten Pronominaladverb (Z. 8: HIERmit) produziert sie eine aus zwei objekttaktilen Taps bestehende Zeigegeste auf ein vor ihr liegendes Kaninchenteil (Abb. 4.4 und 4.5; die unter den Abbildungen 4.4 und 4.5 angefügte Standbild reihe repräsentiert die zwei Taps, die Simonis mit dem Zeigefinger der rechten Hand ausführt). Poletto allerdings ist weiterhin auf ihre eigenen Hände orientiert und liefert keinerlei Anzeichen, dass sie die Zeigegeste gesehen und Suchraum und Zeigeziel hergestellt hat. Im nächsten Schritt äußert Simonis eine eigene Annahme bezüglich der Objekte, die sie in ihrer vorangegangenen Frage problematisiert hat. Ihre Annahme (Z. 9: DAS lassen wir hier;) enthält erneut eine deiktische Orientierungshandlung, die ebenfalls eine Zeigegeste verlangt und die visuelle Aufmerksamkeit der Adressatin einfordert. Zudem setzt die von Simonis formulierte Annahme als zweiten Paarteil eine Ratifizierung oder Verwerfung konditionell relevant, die Poletto liefern kann, wenn sie das Zeigeziel wahrgenommen und den Referenten hergestellt hat. Die Geste, die Simonis im Verbund mit ihrer Vermutung ausführt, stellt im Vergleich zur ersten Geste, die ihre Frage begleitete, eine forcierte Form dar, denn nun hebt sie das entsprechende Objekt an (Abb. 4.6), womit es ein höheres Maß an perzeptorischer Salienz erhält als durch die zwei mit dem Zeigefinger vollzoge-

310

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

nen Taps. In der Tat orientiert Poletto sich an diesem Punkt visuell auf die Sprecherin und nimmt das Zeigobjekt wahr. In ihrer Antwort bestätigt Poletto nicht nur Simonis’ Vermutung, dass das Zeigobjekt nicht in den Topf gelegt werden soll, sondern sie liefert obendrein die Begründung dafür, indem sie den Referenten explizit durch einen Nominalausdruck benennt: °hh die KNOchen LASsen wir; (Z. 10). In ihrer Ratifikation verdeutlicht sie nicht zuletzt auch für die Studio- und Fernsehzuschauer, dass es sich nicht um anzubratendes Fleisch, sondern um minderwertige Restbestandteile handelt. Demgegenüber hat Simonis es bevorzugt, anstelle eines kategorial eindeutigen Symbolausdrucks auf eine deiktische Zeigehandlung zu rekurrieren, die eine größere referenzielle Offenheit bezüglich des wahrgenommenen Objekts besitzt. Um abschließend sowohl den Unterschied als auch die enge Zusammengehörigkeit der Identifizierung des Zeigeziels einerseits und der Identifizierung des Referenten andererseits zu verdeutlichen, wird im letzten Beispiel ein komplexer Fall analysiert. Hier ist der Referent zwar bereits benannt, aber nicht identifiziert, so dass die Adressatin das zugehörige Zeigeziel auffinden muss. Der von ihr ausgewählte Kandidat erweist sich jedoch als falsch, so dass eine Reparatur erfolgt, in der das gezeigte Objekt durch einen Benennungsakt reinterpretiert wird: Beispiel 5: „Pinienkerne“ (PK4_00:10:04)

01 02

PL:

die PInienkerne, liegen? Abbildung 5.1

03 04

HS:

(0.9) wenn PInienkerne Abbildung 5.3

Abbildung 5.2

sind; Abbildung 5.4

6.7 Referent: Das Problem der Referenzherstellung

03

(0.9)

Beispiel 5 HS: (Fortsetzung) 04 wenn

PInienkerne

Abbildung 5.3

sind; Abbildung 5.4

dann sind das DIEse hier.

05 06 07

311

PL: HS:

DAS sind pisTA:zien? AUCH falsch;

Poletto und ihr Gast stehen in einem Abstand von ca. einem Meter nebeneinander hinter dem Kochtisch. Poletto ist damit beschäftigt, Fleisch klein zu schneiden, und hat ihrem Gast den Auftrag erteilt, Pinienkerne in einer Pfanne zu rösten. Nachdem ihr Gast einige Rückfragen dazu gestellt hat, etabliert Poletto die Pinienkerne erneut als Diskursobjekt, indem sie sie durch eine Linksversetzung (Z. 1: die PInienkerne,) in den Fokus rückt und anschließend im umgebenen Raum lokalisiert (Z. 2: die müssten da Irgendwo an der SEITe liegen?). Allerdings bleibt die in der Adverbialphrase (Z. 2: Irgendwo an der SEIte) vorgenommene Lokalisierung unpräzise. Durch die Verwendung des Lokaladverbs irgendwo signalisiert Poletto, dass sie die Pinienkerne nicht exakt lokalisieren kann. Es entsteht eine Pause, in der sich die Adressatin reorientiert und einige Schritte zu der Seite des Kochtischs läuft, an der die Zutaten aufgestellt sind (Abb. 5.1). Dabei sucht sie den durch die vielen Zutaten komplex strukturierten Suchraum mit dem Blick ab. Da der Referent bereits durch einen Nominalausdruck benannt wurde, besteht die Aufgabe der Adressatin darin, das zugehörige Verweisobjekt zu identifizieren. Dazu muss sie ihr mentales Konzept von Pinienkernen mit den real vorhandenen Gegenständen im Suchraum abgleichen. Den vorläufigen Abschluss ihres Suchprozesses markiert sie, indem sie eine Hypothese formuliert und

312

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

gleichzeitig mit dem linken Arm nach einem Schälchen greift (Abb. 5.2–5.3). Für die Hypothese verwendet sie eine Konditionalsatzkonstruktion, deren Protasis die Bedingung nennt (Z. 4: wenn PInienkerne GRÜN sind;), unter der die Schlussfolgerung in der Apodosis zutrifft (Z. 5: dann sind das DIEse hier.). Bezeichnenderweise handelt es sich um eine visuell wahrnehmbare Eigenschaft – die Farbe grün –, die auf das gesuchte Objekt zutreffen muss, damit seine Identifizierung durch die Sprecherin als erfolgreich gelten kann. Die verbalen und körperlichen Aktivitäten der Sprecherin sind so koordiniert, dass sie ihren linken Arm nach dem Zeigeziel ausstreckt (Abb. 5.2), während sie die Protasis formuliert, und im Verlauf der Apodosis, simultan zur Artikulation des Demonstrativpronomens DIEse (Z. 5), das Zeigeziel mit den Fingern umfasst (Abb. 5.3). Wie auf Abbildung 5.3 außerdem zu sehen ist, hat Poletto ihren Blick von den eigenen Händen auf die Hand der Sprecherin und das Schälchen reorientiert. In der anschließenden Korrektur weist sie den Identifizierungsakt ihrer Interaktionspartnerin als falsch aus, indem sie das Zeigobjekt nicht als Pinienkerne, sondern als Pistazien identifiziert (Z. 6). Das bedeutet für die Adressatin zugleich auch, dass ihr mentales Konzept von Pinienkernen korrekturbedürftig ist. Diese sind im Unterschied zu Pistazien nicht grün. Deixistheoretisch bedeutsam ist das Ineinandergreifen der verschiedenen, online emergierenden Herstellungshandlungen. Im ersten Schritt ist der Referent im Fokus: Poletto benennt einen Referenten (Pinienkerne) und rückt ihn syntaktisch in eine prominente Position (Z. 1). Für den benannten, von der Adressatin noch nicht identifizierten Referenten gilt es das zugehörige Zeigobjekt zu finden, das vage im gemeinsamen Raum lokalisiert wird (Z. 2). Im zweiten Schritt gerät das Zeigeziel in den Fokus: Die Adressatin begibt sich auf die Suche und identifiziert einen visuell wahrnehmbaren Gegenstand als das zum Referenten gehörende Objekt. Dieses wird mit einem akzentuierten, gestisch verwendeten proximalen Demonstrativpronomen und einer Zeigegeste als neuer, visueller Aufmerksamkeitsfokus konstituiert (Z. 5). Im dritten Schritt wird wiederum ein Referent fokussiert: Poletto wählt für ihre Korrektur eine Präsentativkonstruktion74, in der das bereits hergestellte Zeigeziel als Anker für einen Benennungsakt fungiert, der einen neuen Referenten einführt (Z. 6: DAS sind pisTA:zien?). Das Demonstrativpronomen DAS (Z. 6) tritt darin sowohl in anaphorischer als auch als deiktischer Funktion auf. Da ihre

74 Vgl. zur Präsentativkonstruktion als syntaktisch-demonstrativem Format, bei dem Zeigeziel und Referent systematisch getrennt werden, die Analyse von Beispiel 2 („bella de cerigniola“) im vorliegenden Kapitel.

6.8 Wahrnehmung und Wahrnehmungswahrnehmung

313

Adressatin das Objekt anhebt (Abb. 5.4) und im gemeinsamen Aufmerksamkeitsfokus präsent hält, erübrigt es sich für Poletto, das Demonstrativpronomen DAS mit einer körperlichen Zeighilfe zu verbinden. Ihre verbale Äußerung baut inkrementell auf den kinesischen Komplementäraktivitäten ihrer Interaktionspartnerin auf. So verdeutlicht dieses Beispiel erneut, was bereits in vorangegangenen Sequenzen erkennbar wurde: Deiktische Zeigehandlungen stellen nicht nur multimodale, sondern auch kollaborativ verwirklichte Konstruktionen dar. Während im vorliegenden Fall das akzentuierte, gestisch verwendete Demonstrativpronomen DIEse in multimodalem Verbund mit einer Zeigegeste die Neufokussierung auf ein bislang noch nicht als gemeinsam konstituiertes Wahrnehmungsobjekt leistet, dient das Demonstrativpronomen DAS dazu, den Fokus auf ein bereits etabliertes Wahrnehmungsobjekt aufrecht bzw. für eine Prädikation verfügbar zu halten. Ausgangspunkt der in diesem Kapitel unternommenen Analysen zum Status des Referenten in der deiktischen Zeigehandlung bildete die Feststellung, dass Zeigeziel und Referent zwar eng zusammengehören, aus deixistheoretischen Gründen jedoch unterschieden werden müssen. Die theoretische Unterscheidung wird durch die Ergebnisse der empirischen Analysen belegt. Sie haben nachgewiesen, dass die perzeptorische Identifizierung des Zeigeziels und die kognitive Identifizierung des Referenten sequenziell auf zwei verschiedene Teilakte verteilt werden können. Dabei kann die Fokussierung entweder auf dem visuellen Wahrnehmungsanteil oder auf dem kognitiven Referenzherstellungsanteil liegen und geht mit unterschiedlichen multimodalen Konstruktionsformaten einher. Als syntaktisch-demonstratives Format, das auf die Trennung von Zeigeziel und Referent spezialisiert ist, hat sich die multimodale Präsentativkonstruktion erwiesen. Sie besteht aus einem deiktischen Ausdruck (Demonstrativpronomen) + Kopula + Nominalphrase und wird von einer Geste (Präsentativgeste) begleitet, die das entsprechende Objekt in den visuellen Aufmerksamkeitsfokus rückt. Neben der Präsentativkonstruktion, in der sich die Differenz zwischen Zeigeziel und Referenten syntaktisch entfaltet, zeigen Reparaturen, die sich zum einen auf die Identifizierung des Zeigeziels und zum anderen auf die Identifizierung des Referenten beziehen können, dass dieser Unterschied auch interaktiv über mehrere Redezüge hinweg bearbeitet werden kann.

6.8 Wahrnehmung und Wahrnehmungswahrnehmung Im theoretischen Teil wurde der auf Luhmann (1984: 560) zurückgehende Begriff der Wahrnehmung der Wahrnehmung eingeführt, um einen zentralen Kontrollund Intersubjektivierungsmechanismus der deiktischen Zeigehandlung zu kon-

314

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

zeptualisieren. Im Unterschied zur Wahrnehmung erster Ordnung, deren Gegenstand eine visuell zugängliche Entität ist, stellt die Wahrnehmungswahrnehmung eine Wahrnehmung zweiter Ordnung dar, deren Gegenstand das Wahrnehmen selbst, d. h. eine Wahrnehmung erster Ordnung, ist. Zusammen mit der Wahrnehmung erster Ordnung stellt die Wahrnehmung zweiter Ordnung, also Egos Wahrnehmung, dass er von Alter wahrgenommen wird, einen für die Modellierung der deiktischen Zeigehandlung unabdingbaren Parameter dar. Die empirische Untersuchung zeigt, dass deiktische Zeigehandlungen nicht nur aufgrund einer mangelnden Wahrnehmung erster Ordnung scheitern können, sondern auch dann misslingen bzw. reparaturbedürftig werden, wenn aufgrund einer mangelnden Wahrnehmung zweiter Ordnung die interpersonelle Koordinierung und Ko-Orientierung auseinander laufen. Im Hinblick auf die Intersubjektivierung(sleistung) der Wahrnehmung liegt der Kern deiktischer Zeigehandlungen darin, dass sie, vermittelt über die Wahrnehmungswahrnehmung, den Übergang von individuellen Wahrnehmungsakten zu wechselseitig geteilter Wahrnehmung stiften (vgl. Hausendorf 2003). Insofern ist die „Interaktionssteuerung durch Wahrnehmung von Wahrnehmungen“ (Luhmann 1984: 560) für die deiktische Zeigehandlung zentral. Für den Zeigenden liegt die interaktive Steuerungsfunktion der Wahrnehmungswahrnehmung darin, seine Handlungen so mit denen des Adressaten zu koordinieren, dass dieser erstens ihn in seiner Rolle als Zeigenden (verweisender Körper inklusive Zeigegeste), zweitens den Suchraum und drittens das Zeigeziel sehen kann. Umgekehrt kann der Adressat dafür sorgen, seine Wahrnehmungen bzw. Wahrnehmungsdisplays so zu organisieren, dass sie zum Gegenstand der Wahrnehmung seines Interaktionspartners werden können. Darüber hinaus besteht für ihn die Möglichkeit, die Wahrnehmungsausrichtung des Zeigenden (auf die eigenen Hände, den Adressaten, ein Objekt im Raum) als Ressource zu nutzen.

6.8.1 Der Kontrollblick zur Wahrnehmungswahrnehmung Während der Adressat einer deiktischen Zeigehandlung zur Zeigeziel- und Referenzherstellung ein genaues Monitoring der körperlichen Aktivitäten seines Interaktionspartners vornehmen muss, muss sich der Zeigende davon überzeugen, dass eben dieses Monitoring seiner Person auch stattfindet. Er wird seine interpersonellen Koordinierungsaktivitäten folglich so gestalten, dass er seinen Adressaten auf Suchraum und Zeigeziel orientieren und sich zugleich durch ein Monitoring der Aufmerksamkeitsorientierung seines Adressaten von dessen Wahrnehmung des Wahrzunehmenden überzeugen kann. Dieses Monitoring

6.8 Wahrnehmung und Wahrnehmungswahrnehmung

315

ist an den Blickorientierungen des Zeigenden empirisch nachvollziehbar. Die zu diesem Zweck zwischen Zeigeziel und Adressaten hin- und herwechselnde Blickausrichtung, mittels derer ein Zeigender visuell Informationen über die Wahrnehmung seines Adressaten erlangt, bezeichne ich als Kontrollblick zur Wahrnehmungswahrnehmung. Der Kontrollblick ist nicht die Wahrnehmungswahrnehmung selbst, sondern der Einsatz einer speziellen Ressource zur Herstellung der Wahrnehmungswahrnehmung. Die Wahrnehmungswahrnehmung stellt folglich die Funktion des Kontrollblicks dar. Die Unterscheidung zwischen dem empirisch beobachtbaren Phänomen (Blickorientierung) und dessen funktionaler Interpretation (Monitoring, Wahrnehmungswahrnehmung) ist erforderlich, da der Blick eine multifunktionale Ressource und seine Ausrichtung allein kein Indikator dafür ist, ob etwas und was genau wahrgenommen wird (vgl. zur Kritik an einer monofunktionalen Auffassung von Blick Gullberg und Kita 2009: 269 f.)75. Als weitere Indikatoren kommen die kontextuelle, aktivitätsspezifische und sequenzielle Einbettung hinzu. Die Behauptung, dass es sich bei den im Folgenden analysierten Fällen um den Kontrollblick zur Wahrnehmungswahrnehmung handelt, gründet zum einen in der Beobachtung eines rekurrenten Blickmusters und der Systematizität, mit der es im sequenziellen Ablaufformat der Zeigehandlung auftritt. Zum anderen stützt sich die Behauptung auf die Analyse von Fällen, in denen die Ko-Orientierung aufgrund eines unzureichenden wechselseitigen Monitoring zur Problemquelle wird, die eine Reparatur erforderlich macht. Der Kontrollblick gehört zum Typus von Koordinierungsaktivitäten, die unter dem Begriff des Fremdmonitoring subsumiert werden können. Das erste Beispiel stammt aus „Polettos Kochschule“. Während Poletto aus dem hinteren Bereich der Küche einen Teller holt, gibt sie ihrem Gast die Anwei-

75 Gullberg und Kita (2009: 269 f.) kritisieren auf der Grundlage ihrer eigenen Ergebnisse eine vermeintlich monofunktionale Auffassung von Blick in interaktionsanalytischen Studien, die allerdings nur zum Teil berechtigt ist: „An important implication of these findings for face-to-face communication is that addressees’ gaze is multifunctional and not necessarily a reliable index of attention locus, information uptake or comprehension. Addressees clearly look at different things for different reasons and one cannot assume that overt visual attention to something – like a gesture with a post-stroke hold – necessarily implies that the target is processed for information. This is primarily a caveat to studies on face-to-face interaction where a mono-functional view of gaze is often in evidence. In interaction addressees will typically maintain their gaze on the speaker’s face as a default. Addressees’ overt gaze shift may be an act of social alignment to show speakers that they are attending to their focus of attention (e. g., their gestures), rather than an act of information seeking which is often possible through peripheral vision.“

316

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

sung, aus dem Gnocchiteig eine Wurst zu formen. Der Gast stellt eine Rückfrage (Z. 1: ich mach DIEse jetzt wieder zu wurst;) und zeigt simultan zum akzentuierten deiktischen Demonstrativpronomen mit einer beidhändigen Zeigefingergeste auf die vor ihm stehende Teigschüssel. Die Zeigehandlung ist damit Bestandteil einer Paarsequenz, deren erster Paarteil (Frage) nicht nur eine Antwort als zweiten Paarteil konditionell relevant setzt, sondern zur Erfüllung der konditionellen Relevanz die Adressatin einer vorgängigen Obligation unterwirft: ihrer visuellen Aufmerksamkeitsorientierung auf den Sprecher. Um also zu verstehen, was ihr Interaktionspartner meint, und antworten zu können, muss sie sich umdrehen, sich visuell auf dessen Körper, die Zeigegeste, den Suchraum und das Zeigeziel orientieren. Wie zu sehen sein wird, nimmt der Zeigende ein genaues Monitoring seiner Adressatin vor, das sich auf deren Körperausrichtung und perzeptorische Orientierung bezieht: Beispiel 1: „Kürbiswurst“ (PK2_00:24:23) Abbildung 1.1

1

IN:

ich mach DIEse jetzt wieder zu wurst; Abbildung 1.2

Abbildung 1.3

Abbildung 1.4

6.8 Wahrnehmung und Wahrnehmungswahrnehmung

317

Beispiel 1 (Fortsetzung) Abbildung 1.3

2 3

PL:

Abbildung 1.4

(0.2) ja;

Nachdem die Zeigegeste des Sprechers ihren Gipfelpunkt erreicht hat (Abb. 1.1), wird sie solange eingefroren, bis er sicherstellen kann, dass die Adressatin ihn wahrnimmt. Dazu dreht er sich um und begibt sich in einen Ressourcen-Spagat (Abb. 1.2), bei dem er seinen Blick auf die Adressatin richtet, um deren Aufmerksamkeitsorientierung zu prüfen, während seine Hände weiterhin auf das Zeigeziel weisen. Dabei kann er wahrnehmen, dass sie sich zu ihm umdreht (Abb. 1.3), sich auf seinen Körper orientiert und seine Zeigegeste wahrnimmt (Abb. 1.4). Mit diesem über die Schulter hinweg ausgeführten Kontrollblick zur Wahrnehmungswahrnehmung nimmt er also wahr, dass sie wahrnimmt, was es wahrzunehmen gilt. Es folgt eine verbale Bestätigung, in der die Adressatin ihr Verstehen signalisiert und mit der positiven Antwort die Sequenz zum Abschluss bringt. Im nächsten Beispiel aus einer weiteren Folge von „Polettos Kochschule“ präsentiert Poletto ihrem Gast ein Fläschchen mit einer speziellen Sorte Balsamico-Essig. Dazu formuliert sie eine Präsentativkonstruktion (Z. 5: DIEses hier ist was GANZ besonderes-) und rückt das Fläschchen durch eine Präsentativgeste in den visuellen Aufmerksamkeitsfokus ihres Interaktionspartners (und der lateral adressierten Studio- und Fernsehzuschauer). Indem sie ihren Blick vom Fläschchen auf den Interaktionspartner richtet, kontrolliert sie dessen Aufmerksamkeitsorientierung:

318

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

Beispiel 2: „Balsamico“ (PK5_00:12:53)

01 02

PL:

machen-= sOrten von balSAmico-= Abbildung 2.1

03

WOLlte, Abbildung 2.2

Abbildung 2.3

04

(0.4)

05

DIEses hier ist was GANZ besonderes-

6.8 Wahrnehmung und Wahrnehmungswahrnehmung

319

Beispiel 2 (Fortsetzung)

Abbildung 2.4

06

Abbildung 2.5

das ist_n wirklich_n DREI balsamico-

Poletto und ihr Gast stehen nebeneinander hinter dem Kochtisch. Poletto führt das Thema Balsamico-Essig ein (Z. 1–3) und schneidet währenddessen mit einem Messer die Versiegelung einer kleinen Essigflasche auf. Beide Teilnehmer blicken auf die Flasche in Polettos Händen (Abb. 2.1). In der anschließenden Pause (Z. 4) legt Poletto das Messer weg, orientiert sich um (Abb. 2.2) und greift mit der rechten Hand nach einem zweiten Essigfläschchen, das am Rande des Kochtischs außerhalb des unmittelbaren Interaktionsraums steht (Abb. 2.3), während sie in der linken Hand noch immer das erste Essigfläschchen hält. Verbal steuert sie die Aufmerksamkeitsorientierung ihres Adressaten durch das gestisch gebrauchte Demonstrativpronomen DIEses in Kombination mit dem Lokaldeiktikon hier (Z. 5: DIEses hier ist was GANZ besonderes-). Im weiteren Verlauf hebt sie das zweite Fläschchen in einer Präsentativgeste auf Brusthöhe (Abb. 2.4) und in das Blickfeld des Adressaten. Die Präsentativgeste wird auf dem Gipfelpunkt eingefroren; zugleich richtet Poletto den Blick von der Flasche in ihrer Hand auf den Adressaten (Abb. 2.5). Dabei kann sie wahrnehmen, dass dieser die Flasche wahrnimmt und der Betrachtungsaufforderung, die in der Präsentativgeste enkodiert ist, durch einen länger andauernden Blick auf das präsentierte Objekt nachkommt (Abb. 2.5).

320

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

Die zentrale, interaktionssteuernde Funktion, die der Kontrollblick zur Wahrnehmungswahrnehmung hat, erweist sich nicht nur in Fällen, in denen die Interaktion reibungslos fortgesetzt wird, sondern kontrastiv auch in solchen Fällen, in denen Zeigende nicht mit ihrer Aktivität fortfahren, sondern eine Reparatur (selbst)initiieren. Die Tatsache, dass Reparaturen dieses Typs nicht verbal fremd initiiert werden, sondern sich sequenziell allein aus dem ergeben, was der Kontrollblick an Erkenntniszugewinn erbracht hat, belegt die interaktive Schlüsselfunktion der Wahrnehmungswahrnehmung bei deiktischen Zeigeakten. Eine solche Reparatur erfolgt im nächsten Beispiel aus dem „Big Brother“-Korpus. Jürgen und Sabrina stehen nebeneinander vor dem Metallkoffer einer Mitbewohnerin, der mit den Abschiedsgrüßen der restlichen Bewohner beschrieben ist. Sabrina zeigt Jürgen den Spruch, den sie selbst auf dem Koffer hinterlassen hat, merkt aber, als sie sich auf ihn reorientiert, dass er das Zeigeziel offenbar nicht herstellen kann. Daraufhin repariert sie ihre Zeigehandlung: Beispiel 3: „Kofferspruch“ (bb02_1_00:15:42)

1 2

Sbr:

HIER; DA vo'-= Abbildung 3.1

3 4 5 6

=DAS_s von mir; hier Oben; (0.4) ((lacht leise)) Abbildung 3.3

Abbildung 3.2

6.8 Wahrnehmung und Wahrnehmungswahrnehmung

321

3 =DAS_s von mir; 4 hier Oben; Beispiel 3 (Fortsetzung) 5 (0.4) 6 ((lacht leise)) Abbildung 3.3

7

DA-

hh

Von mehreren verbaldeiktischen Anläufen begleitet (Z. 1–4) produziert Sabrina mit ausgestrecktem Arm eine Zeigegeste auf eine bestimmte Region des Koffers (Abb. 3.1). Aufgrund der Dichte und Vielzahl weiterer Texte orientiert Jürgen sich jedoch nicht sofort auf das Zeigeziel. Für Sabrina wird dies erkennbar, als sie ihm einen Kontrollblick zur Wahrnehmungswahrnehmung zuwirft (Abb. 3.2) und wahrnimmt, dass seine Wahrnehmung offenbar nicht auf das Zeigeziel gerichtet ist. Dies veranlasst sie dazu, eine zweite Zeigegeste zu produzieren (Abb. 3.3), die sich sequenzanalytisch als Resultat ihres Adressatenmonitoring darstellt und als selbstinitiierte Selbstreparatur zu verstehen ist. Das vierte Beispiel aus dem Korpus der Stadtführungen ist analog zum vorherigen Beispiel aufgebaut. Auch hier vollzieht der Zeigende eine selbstinitiierte Selbstreparatur, nachdem er einen Kontrollblick auf seine Adressaten geworfen hat. Die Sequenz („ein kleines Detail“) stammt aus dem Korpus der Stadtführungen und ist bereits aus Kapitel 6.6 zum Zeigeziel bekannt:

322

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

Beispiel 4: „ein kleines Detail“ (StFLing2_00:02:56)

01 02

SF:

(0.6)

-) ein KLEInes detail noch,

Abbildung 4.1

03 04 05

sie seh

Abbildung 4.2

06 07 08

(-

Abbildung 4.3

(0.3) das is' also auf der LINken SEIte;

Der Stadtführer zeigt seiner Gruppe mit ausgestrecktem Arm (Abb. 4.1) und dem gestisch gebrauchten distalen Lokaldeiktikon DORT (Z. 3) ein neobarockes Gebäude, das nicht so leicht zu identifizieren ist. Wie im Beispiel „Kofferspruch“

6.8 Wahrnehmung und Wahrnehmungswahrnehmung

323

erfolgt auch hier eine selbstinitiierte Selbstreparatur, nachdem der Stadtführer einen Kontrollblick zur Wahrnehmungswahrnehmung auf seine Adressaten geworfen hat (Abb. 4.2) und – wie seine Reparatur belegt – daraus schließt, dass diese das Zeigeziel in dem entfernten, komplex strukturierten Suchraum nicht auffinden können. Seine Wahrnehmung ihrer offenbar erfolglosen Wahrnehmungsversuche veranlasst ihn zu einer Reparatur, in der er verbal (Z. 7–8) und gestisch (Abb. 4.3) die Eingrenzung des Suchraums und die Lokalisierung des Zeigeziels bearbeitet (vgl. zu den Reparaturhandlungen, die das Zeigeziel präzisieren, ausführlich Kapitel 6.6).

6.8.2 Automatisiertes Fremdmonitoring Indikatoren dafür, dass der Kontrollblick zur Wahrnehmungswahrnehmung automatisiert eingesetzt wird, stammen aus Videodaten, in denen die Kamera die Rolle des Adressaten übernimmt, wie dies bei der Gattung der Statements im „Big Brother“-Haus der Fall ist. Bei diesen Statements betreten die „Big Brother“-Bewohner einzeln – in selteneren Fällen auch als Gruppe – einen kleinen Raum, in dem sie ihre persönlichen Kommentare über Vorgänge im Haus abgeben und dabei auf einem dafür vorgesehenen Stuhl sitzend direkt in die Kamera sprechen. Auch wenn in diesen Sequenzen spezielle Abweichungen von natürlichen face-to-face-Interaktionen vorliegen, da anstelle eines persönlichen, physisch im selben Wahrnehmungsraum kopräsenten und damit der wechselseitigen Wahrnehmung zugänglichen Interaktionspartners die Kamera als Adressat fungiert, besitzen diese Daten im Hinblick auf Detailfragen methodische Vorteile, die für die analytische Validierung und Erweiterung bisheriger Ergebnisse eine wertvolle Basis darstellen. Die methodischen Vorteile auf der Analyseebene hängen eng mit den interaktiven Abweichungen auf der Vollzugsebene der Beteiligten zusammen und sollen daher kurz hinsichtlich ihres Stellenwerts für die Parameter der Zeigehandlung reflektiert werden. Der erste Vorteil ist rein technischer Art: Bei den „Big Brother“-Statements werden im gesendeten Material äußerst selten Kameraschnitte vorgenommen, so dass Blickorientierung und Gesten in voller Länge sichtbar sind und nicht durch Kameraschwenks oder perspektivische Schnitte auf andere Teilnehmer abgebrochen werden. Zweitens sitzen die Sprecher relativ statisch vor der Kamera. Die Einstellung Halbtotale ermöglicht eine besonders gute Sichtbarkeit von Blickbewegungen, Mimik und Gestik, die zentral ist für Fragen nach der intrapersonellen Ressourcenkoordination. Der dritte Vorteil liegt in der reduzierten Komplexität dieses Datentyps: Die Sprecher adressieren die Kamera und können von einer kontinuierlichen Kameraeinstellung auf sich ausgehen,

324

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

die sie von bestimmten Interaktionsanforderungen der face-to-face-Kommunikation entbindet: Dazu gehört das Monitoring des Adressaten bei der Herstellung, Aufrechterhaltung und Auflösung fokussierter Interaktion, die Organisation des Sprecherwechsels sowie der Umgang mit geäußerten oder ausbleibenden Rezipientensignalen. Zugleich müssen die Sprecher mit der dadurch entstehenden Reduktion von Interaktivität, insbesondere mit dem Mangel an verbalem und visuellem Feedback, umgehen und die alleinige Verantwortung für die Inszenierung von Reziprozität mit den imaginären Adressaten übernehmen. Durch die reduzierte Komplexität ist schließlich viertens eine „puristische“, experimentellen Settings vergleichbare Analyse der verbalen und visuellen Sprecher-Displays möglich. Da die Kamera die Rolle des Adressaten übernimmt, sind Wechsel zwischen Adressatenorientierung via Kamera und Orientierung auf Wahrnehmungsgegenstände im Statement-Raum unmittelbar zugänglich. Hinsichtlich des Gesteneinsatzes ist vorab festzuhalten, dass bestimmte Typen von Zeigegesten in den Interaktionen mit der Kamera vermehrt auftreten. Dies gilt nicht nur für die Äußerungen im Statement-Raum der „Big Brother“-Hauses, sondern auch für das Kochkorpus. Dabei handelt es sich um Präsentativgesten, durch die ein Gegenstand in den Fokus der visuellen Aufmerksamkeit der imaginären Adressaten gerückt und unter Umständen mittels weiterer Zeigegesten ein Detail daran besonders hervorgehoben wird. Für den Blick gilt, dass Blicke in die Kamera eine längere Verweildauer haben und statischer sind als Blicke des Sprechers zum Adressaten in face-to-face-Interaktionen. Wie in unterschiedlichen Untersuchungen festgestellt wurde (Goodwin 1980; Kendon 1990), liegt in face-to-face-Interaktionen die Verpflichtung für die Aufrechterhaltung des Blickkontakts, also für die Ermöglichung von Augenkontakt (mutual gaze), beim Adressaten, während der Sprecher seinen Blick schweifen lassen kann. Bei der Interaktion mit der Kamera allerdings fällt der Blickkontakt mit dem Adressaten weg. Analoges gilt für den Kontrollblick zur Wahrnehmungswahrnehmung sowie für alle anderen Formen des Adressatenmonitoring durch den Sprecher. Er selbst kann zwar davon ausgehen, Gegenstand der visuellen Wahrnehmung seiner Zuschauer zu sein. Diese Annahme funktioniert aber nur global, denn er kann sich nicht empirisch davon überzeugen, welche seiner Herstellungsaktivitäten tatsächlich wahrgenommen werden, wie sich die Aufmerksamkeitsorientierung, das Fremdverstehen und schließlich die Reaktionen seiner Adressaten auf ihn online entwickeln. Für die theoretische Modellierung der Deixis liegt der besondere Erkenntnisgewinn von Analysen in diesem Setting darin, dass deiktische Zeigehandlungen zwar den Übergang von individueller zu gemeinsamer Wahrnehmung herstellen, dies jedoch bei der Interaktion mit der Kamera nicht bzw. nur imaginär der Fall ist. Gerade weil hier anstelle eines kopräsenten und damit der wechselseitigen

6.8 Wahrnehmung und Wahrnehmungswahrnehmung

325

Wahrnehmungswahrnehmung zugänglichen Interaktionspartners die Kamera als Adressat fungiert, kann der Sprecher durch den Kontrollblick zum Adressaten keine Informationen über dessen momentane Aufmerksamkeitsorientierung gewinnen. Dementsprechend lautet die an das Datenmaterial zu stellende Frage, ob und wenn ja, warum Sprecher den Kontrollblick zur Wahrnehmungswahrnehmung auch dann einsetzen, wenn sie dadurch keine Informationen über die Wahrnehmung ihrer hinter der Kamera imaginierten Adressaten erhalten können. Ist bei deiktischen Zeigehandlungen, die die Sprecher im Statement-Raum vollziehen, dieser Kontrollblick unabhängig von seiner informativen Funktion der Wahrnehmungswahrnehmung zu beobachten, lässt sich die These aufstellen, dass er automatisiert ausgeführt wird. Daraus ergibt sich als Anschlussthese, dass der Parameter der Wahrnehmungswahrnehmung als systematischer, weitgehend kontextunabhängiger Bestandteil des Gesamtformats Zeigehandlung gelten kann. Im Folgenden wird anhand einer Sequenz aus dem Statement-Raum des „Big Brother“-Hauses der empirische Nachweis eines solchen Kontrollblicks erbracht und hinsichtlich der genannten Implikationen für das Parameter-Modell theoretisch reflektiert. Jürgen befindet sich im Statement-Raum, um von der Wochenaufgabe, der Aufführung von Shakespeares „Sommernachtstraum“ im „Big Brother“-Haus, zu berichten. Er hat die Manuskriptseiten des Texts mit in den Statement-Raum gebracht und mokiert sich über die Textmenge, die es auswendig zu lernen gilt. Zur Illustration der ungeheuren Textmenge führt er eine Zeigehandlung am Objekt (den Manuskriptseiten) durch, bei der er einen kurzen Kontrollblick in die Kamera ausführt: Beispiel 5: „diese ganzen Seiten“ (bb02_6_00:12:54) Abbildung 5.1

01 02 03 04 05 06 07 08

Jrg:

ja:: hallo lEute da DRAU (0.4) ich wIll euch ma WO und ZWAR- hh ::h(0.4) von wIlliam SHAKESpeare, (0.3)

326

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

01 Jrg: ja:: hallo lEute da DRAU Beispiel 5 (Fortsetzung) 02 (0.4) 03 ich wIll euch ma WO 04 und ZWAR- hh 05 ::h06 (0.4) 07 von wIlliam SHAKESpeare, 08 (0.3) 09 den SOMmernachtstraum AUSwendig lernen, 10 (0.6) h 11 und HIER(12 nenkulissen selber bauen, hh 13 u:: :h (-) 14 das_s eigentlich zIemlich EINfach, 15 (0.4) Abbildung 5.2

Abbildung 5.3

16

Abbildung 5.4

ich lEs euch glei' grAd mal n_ Abbildung 5.5

Abbildung 5.6

VOR, Abbildung 5.7

6.8 Wahrnehmung und Wahrnehmungswahrnehmung

16 ich lEs euch glei' grAd mal n_ Beispiel 5 (Fortsetzung) Abbildung 5.5

17

VOR, Abbildung 5.7

was wir (.) AUSwendig lernen Abbildung 5.8

18

Abbildung 5.6

Abbildung 5.9

327

senAbbildung 5.10

von dIesen (1.0) gAnzen SEIten?

Jürgen eröffnet die Interaktion mit den Fernsehzuschauern durch eine Begrüßung (Z. 1: ja:: hallo lEute da DRAUßen,), bei der er seinen Blick in die Kamera richtet (Abb. 5.1). Anschließend erklärt er, dass er den Zuschauern etwas über die Wochenaufgabe erzählen möchte (Z. 3). Indem er seine Zuschauer direkt adressiert und duzt (vgl. die Wahl des Personaldeiktikons Z. 3: euch), inszeniert er soziale Nähe und Interaktivität. Er fängt nicht einfach an zu erzählen, sondern kündigt eine Erzählung an und konstruiert dadurch für sich die Rolle eines Geschichtenerzählers, der nur für die Dauer seiner Erzählung das ausschließliche Rederecht beansprucht. Damit wird eine Atmosphäre scheinbarer Interaktivität geschaffen, innerhalb derer auch die anschließenden Zeigehandlungen ein hohes Maß an inszenierter Interaktivität aufweisen. Die Zeigehandlung, auf die es im Folgenden ankommt, wird im Zuge einer weiteren Handlungsankündigung vollzogen. Um den Zuschauern einen Eindruck

328

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

des Shakespeare-Texts zu vermitteln, kündigt Jürgen eine Leseprobe an (Z. 16: ich lEs euch glei’ grAd mal n_stück VOR,). Wie bei der Erzählankündigung (Z. 3) simuliert er auch hier eine der face-to-face-Interaktion entsprechende Kommunikationssituation. Mit dem Einlösen seiner Handlungsprojektion, d. h. mit dem Vorlesen einer Textpassage, illustriert Jürgen die Komplexität des auswendig zu lernenden Textes und markiert auf diese Weise nachträglich seine Bewertung der Wochenaufgabe (Z. 14: das_s eigentlich zIemlich EINfach,) als ironisch. Die Ironie ergibt sich aus dem Kontrast zwischen der Behauptung der Einfachheit des Texts und seiner durch das Vorlesen hörbar gemachten Komplexität. Diese Ironie wird zuvor bereits durch den Kontrast zwischen der vermeintlich leicht zu bewältigenden Memorieraufgabe und der Textlänge kontextualisiert, die Jürgen für die Zuschauer anhand der Menge an Manuskriptseiten sichtbar macht. Dieser Aspekt wird durch eine an den Manuskriptseiten ausgeführte Zeigegeste zusätzlich fokussiert. Sie erfolgt simultan zur rechtsversetzten Ergänzung (Z. 18: von dIesen (1.0) gAnzen SEIten?). Ihr gehen aufmerksamkeitssteuernde Handlungen voraus, die zunächst sequenziell analysiert werden, bevor die Zeigegeste und das sie begleitende Blickverhalten detailliert beschrieben und im Hinblick auf den Parameter der Wahrnehmungswahrnehmung reflektiert werden. Die Analyse beginnt in Zeile 15. In der Mikropause (Z. 15), die der Handlungsankündigung vorausgeht, richtet Jürgen den Blick auf das Textmanuskript auf seinem Schoß (Abb. 5.2). Die Blickorientierung behält er zur Beginn seiner Äußerung bei. In deren Verlauf führt er eine stark rhythmisierte Geste in Richtung des Manuskripts aus: Beim Anredepronomen euch (Z. 16) bewegt er die Hand zum Manuskript (Abb. 5.3), anschließend hebt er Unterarm und Hand an und führt eine Taktstockgeste (baton) im seitlichen Gestenraum aus (Abb. 5.4). Der Gestenschlag fällt mit dem akzentuierten Adverb grAd zusammen; zugleich markiert er den Moment, in dem der Sprecher seinen Blick wieder in die Kamera richtet (Abb. 5.4). Diese via Kamera hergestellte Adressatenorientierung behält der Sprecher über den Abschluss der Gestenbewegung und die Beendigung der Turnkonstruktionseinheit hinaus bei. Erst im Verlauf der nächsten Turnkonstruk tionseinheit (Z. 17: was wir (.) AUSwendig lernen müssen-) richtet er seinen Blick wieder zurück auf das Manuskript (Abb. 5.6). Im nächsten Schritt löst er beide Arme aus der Ruhelage und führt den rechten Arm vor den Körper. Zugleich hebt er das in der linken Hand befindliche Textmanuskript an und rückt es in den visuellen Aufmerksamkeitsfokus der Adressaten (vgl. Abb. 5.7). Simultan zur Artikulation des proximalen Demonstrativpronomens dIesen (Z. 18) vollzieht der Sprecher eine objekttaktile Zeigegeste, indem er mit Zeige-, Mittel- und Ringfinger der rechten Hand durch die oberen Kanten der Manuskriptseiten flippt (Abb. 5.8–5.10). Die Wahrnehmung der Geste

6.8 Wahrnehmung und Wahrnehmungswahrnehmung

329

und des durch sie fokussierten Anschauungsobjekts spielt eine zentrale Rolle für das Verständnis der verbalen Äußerung. Sie führt den Zuschauern anhand der durchgeblätterten Seiten die Quantität des auswendig zu lernenden Textes vor Augen, so wie die später vorgelesene Textpassage die schwer verständliche Qualität dieses Textes auditiv demonstriert. Koordinationstheoretisch bedeutsam ist nun Jürgens Blickorientierung im Verlauf der Zeigegeste. Vor Gestenbeginn ist sein Blick auf das Manuskript in der linken Hand gerichtet (Abb. 5.6) und bleibt bis auf einen kurzen Moment während der gesamten Zeigehandlung auf die eigenen Hände gerichtet. Dieser Moment, in dem der Sprecher für den Bruchteil einer Sekunde von seinen Händen weg und in die Kamera blickt (Abb. 5.9), ist entscheidend. Die Reorientierung des Blicks ist temporal exakt mit der manuellen Aktivität koordiniert. Anders als bei den vorangegangenen Blickalternationen zwischen Manuskript und Kamera, bei denen die Blicke in die Kamera eine längere Verweildauer hatten, erfolgt dieser Blick so unwillkürlich und ist von so kurzer Dauer (1/10 Sekunde), dass er als integraler, durch die mediale Kommunikation unbeeinflusster Bestandteil der Zeigehandlung gelten kann. Dabei nimmt der Blick in die Kamera nur einen Bruchteil der temporalen Ausdehnung der Zeigegeste ein. Er erfolgt automatisiert und reflexartig, ist in das multimodale Ablaufformat eingebettet und entspricht funktional dem Kontrollblick zur Wahrnehmungswahrnehmung. Die Analyse hat gezeigt, dass Sprecher den Kontrollblick zur Wahrnehmungswahrnehmung selbst dann einsetzen, wenn er dysfunktional ist, da anstelle eines sichtbaren Interaktionspartners mit einer Kamera interagiert wird und der Blick folglich nicht dazu dienen kann, Informationen über die Aufmerksamkeitsorientierung der Adressaten zu gewinnen. Damit bestätigt die Analyse die These, dass der Kontrollblick zur Wahrnehmungswahrnehmung automatisiert erfolgt und dergestalt in das multimodale Ablaufformat der Zeigehandlung integriert ist, dass Sprecher ihn unwillkürlich ausführen. Im vorliegenden Kapitel wurde zunächst analysiert, wie Zeigende ihre Wahrnehmung darauf ausrichten, die Wahrnehmung ihrer Adressaten wahrnehmen zu können. Der dazu eingesetzte Blick wurde als Kontrollblick zur Wahrnehmungswahrnehmung bezeichnet und konnte in Reparatursequenzen als interaktiver Schlüsselmechanismus der (Selbst-)Initiierung von Selbstreparaturen nachgewiesen werden, deren Reparandum ein perzeptorischer Parameter (Suchraum, Zeigeziel) war. Die Hypothese, dass der Kontrollblick zur Wahrnehmungswahrnehmung automatisiert eingesetzt wird, wurde exemplarisch anhand einer Sequenz bestätigt, in der er regulär im sequenziellen Ablaufformat der Zeigehandlung auftrat, ohne dem Zeigenden jedoch einen Informationszugewinn zu erbringen. Da es sich um eine medial inszenierte, Kamera vermittelte Interaktion handelte, konnte der Zeigende keine visuellen Informationen über die Aufmerk-

330

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

samkeitsorientierung seiner Adressaten erlangen. Dennoch setzte er im emergierenden Zeigeakt reflexartig einen Kontrollblick zur Kamera ein.

6.9 Verstehen und Verstehensdokumentation Die letzte Unterscheidung, die im theoretischen Teil getroffen wurde und die Differenzierung zwischen perzeptorischen und kognitiven Parametern (vgl. die Unterscheidung zwischen Zeigeziel und Referent) fortführt, ist die Unterscheidung zwischen Wahrnehmen und Verstehen auf der primären Vollzugsebene und zwischen Wahrnehmungswahrnehmung und Verstehensdokumentation auf der ersten Metaebene. Während sich der Begriff des Verstehens auf den intrasubjektiven Prozess der Bedeutungskonstitution durch den Adressaten bezieht, ist mit Verstehensdokumentation (vgl. zu dem Konzept ausführlich Deppermann und Schmitt 2008) die Intersubjektivierung des adressatenseitigen Verstehens durch entsprechende Signale gegenüber dem Zeigenden gemeint, die diesem anzeigen, dass bzw. ob seine Zeigehandlung erfolgreich war. Damit eröffnen sie ihm wiederum die Möglichkeit zur expliziten Ratifizierung, Verwerfung oder Reparatur. Ob und wie stark Verstehensprozesse interaktiv nach außen treten und intersubjektiviert werden, ist in hohem Maße variabel, kontextabhängig und aktivitätsspezifisch. Die Variabilität reicht von vollkommen implizit bleibenden Verstehensprozessen bis hin zur sequenziellen Aushandlung, Thematisierung und Metathematisierung von Verstehen. Während also in manchen Kontexten Verstehen als nicht eigens zu bearbeitender default-Fall vorausgesetzt, Nicht-Verstehen hingegen als reparaturbedürftiger, mehr Aufwand erfordernder Spezialfall behandelt wird, herrschen in anderen Kontexten situations-, gattungs- bzw. aktivitätsspezifische Bedingungen, die eine aktive, explizite Verstehensdokumentation erfordern. Im Subkorpus der Stadtführungen, zu deren gattungstypologischen Merkmalen die monologische Kommunikationssituation und spezifische Partizipationsstrukturen gehören, sind explizite Verstehensdisplays und Aushandlungsprozesse selten. Wie allerdings in einigen Analysen zu sehen war, können auch ohne adressatenseitige Verstehens- oder Nicht-Verstehensdokumentationen selbst initiierte Selbstreparaturen seitens des Stadtführers erfolgen. Diese gingen auf dessen Wahrnehmung der Wahrnehmung seiner Adressaten und einem daraus gezogenen Misserfolgsschluss zurück. Verstehensdokumentation kann als adressatenseitige Einlösung der konditionellen Relevanzen begriffen werden, die durch eine deiktische Äußerung vom Sprecher aufgebaut werden. Konstituiert eine solche Äußerung eine Betrachtungsaufforderung wie in Stadtführungen und setzt damit die visuelle Wahrnehmung eines im umgebenden Raum befindlichen Objekts relevant, besteht

6.9 Verstehen und Verstehensdokumentation

331

die Verstehensdokumentation des Adressaten darin, seinen Blick entsprechend auszurichten, seine Aufmerksamkeitsorientierung anzuzeigen und dadurch seine Wahrnehmung für den Zeigenden wahrnehmbar zu machen. Geschieht dies nicht bzw. gewinnt der Zeigende den Eindruck, dass dies nicht geschieht, und zieht daraus den Schluss, dass mit dem unzureichenden Wahrnehmungsakt seines Adressaten dessen Verstehensakt gefährdet ist, kann er durch eine (selbstinitiierte) Selbstreparatur an den Punkt seiner Zeigehandlung retrahieren, von dem aus er die Aufmerksamkeitsorientierung seines Adressaten erneut und besser steuern kann. Die Beispiele „Kofferspruch“ (bb02_1_00:15:42) und „ein kleines Detail“ (StFLing2_00:02:56), die in Kapitel 6.8 analysiert wurden, belegen solche Verfahren. Verstehensdokumentation kann sehr unterschiedlich gestaltet sein. Neben der Minimaldokumentation durch eine Reorientierung des Blicks, mit der ein Adressat einer Betrachtungsaufforderung nachkommt, kann sie körperlich-visuelle Affirmationsdisplays wie Kopfnicken, verbale Rückmeldesignale, ganze Äußerungen oder körperliche Handlungen umfassen. Im ersten Beispiel („Rote Beete“, vgl. nächste Seite) aus dem Kochkorpus dokumentiert der Adressat sein Verstehen multimodal durch ein Kopfnicken, das von einem verbalen Rückmeldesignal begleitet wird. Poletto und ihr Gast sind dabei, Rote Bete an einer speziellen Maschine, die als Mandoline bezeichnet wird, in Scheiben zu schneiden. Um die farblichen Auswirkungen der Tätigkeit zu demonstrieren, rückt Poletto ihre Handinnenfläche in den Aufmerksamkeitsfokus ihres Interaktionspartners. Während ihr Gast an der Maschine beschäftigt ist, erläutert Poletto zunächst, dass geübte Köche Rote Bete auch mit dem Messer dünn schneiden können (Z. 1–3). Anschließend lenkt sie die Aufmerksamkeit ihres Adressaten auf die sichtbaren Konsequenzen der Zubereitung von Roter Bete für die Hände. Das gestaltet sich wie folgt: Bereits vor Abschluss der vorherigen Turnkonstruktionseinheit (Z. 3) richtet Poletto den Blick auf ihre linke Hand, die sie anhebt und in der oHHo-Form in eine waagerechte Position bringt (Abb. 1.1). Zu Beginn der nächsten Turnkonstruktionseinheit atmet sie hörbar ein (Z. 4) und bewegt simultan dazu die Hand leicht auf und ab (Abb. 1.2). Die Bewegung endet mit einem Schlag (baton), der unmittelbar nach der Abwärtsphase temporal mit der Artikulation des Modaldeiktikons SO zusammenfällt, das prosodisch den Nukleusakzent trägt und die nächste Äußerungseinheit einleitet (Z. 4: °hh SO sehen dann natürlich die HÄNde aus.). Das Modaldeiktikon wird gestisch verwendet und verweist den Adressaten darauf, die von der Sprecherin vollzogene körperliche Handlung wahrzunehmen und aus der Wahrnehmung die relevanten Informationen über die Eigenschaft des betreffenden Objekts – in diesem Fall die Hände – zu gewinnen (vgl. zur Modaldeixis ausführlich Kapitel 7.3).

332

6 Empirische Untersuchungen zu den Parametern der Zeigehandlung

Beispiel 1: „Rote Bete“ (PK5_00:08:59)

1 2 3

PL:

-

-

Abbildung 1.1

Abbildung 1.2

mit_m MESser schneiden; hh

4

Abbildung 1.3

5

TB:

=JA_ja;

de aus.

6.9 Verstehen und Verstehensdokumentation

333

In der Folge richtet der Adressat seinen Blick von der eigenen Tätigkeit auf die Hand seiner Interaktionspartnerin und vollzieht, noch bevor diese ihre Äußerung abgeschlossen hat, ein einfaches Kopfnicken (Abb. 1.3), das unmittelbar darauf durch eine verbale Bestätigung bekräftigt wird (Z. 5: JA_ja;). In dem Augenblick, in dem der Adressat mit dem Kopf nickt, wendet seine Interaktionspartnerin ihren Blick von der eigenen Hand ab und dem Interaktionspartner zu (Abb. 1.3). Dabei kann sie nicht nur seine Wahrnehmung wahrnehmen, sondern in diesem Fall fällt der Moment der Wahrnehmungswahrnehmung mit der Wahrnehmung des Kopfnickens als expliziter Verstehensdokumentation ihres Adressaten zusammen. Während dieser mit schnellem Anschluss noch eine verbale Bestätigung liefert, beginnen beide Interaktionspartner sich bereits wieder ihren eigenen Beschäftigungen zuzuwenden. Damit signalisieren sie sich gegenseitig ihr Verstehen und ihre auf der Reziprozität des Verstehens gründende Übereinkunft, dass die Sequenz für sie erfolgreich abgeschlossen ist. Eine weitere Variante, das Verstehen eines deiktischen Zeigeakts zu dokumentieren, besteht darin, den Referenten mit einem Lexem zu benennen. In folgendem Beispiel aus „Polettos Kochschule“ stellt der Gast eine Nachfrage zur Ausführung eines Arbeitsauftrags und formuliert eine eigene Annahme dazu. Die Nachfrage ist auf ein Fleischteil bezogen, auf das mit einer deiktischen Zeigehandlung referiert wird (Z. 1). Poletto ratifiziert die Annahme ihres Gasts explizit, indem sie den Referenten benennt und dadurch zugleich ihr eigenes Verstehen der Zeigehandlung dokumentiert: Beispiel 2: „Knochen“ (PK4_00:08:45) Abbildung 2.1

1

HS:

Abbildung 2.2

[ ] [

Andrea, die das Zeigeziel und Anschuldigungsobjekt von Jürgens Fremdzuweisungsakt darstellt, weist die Anschuldigung zurück (Z. 6: ICH doch nicht;). Dabei vollzieht sie eine selbstreferenzielle Zeigegeste, die en passant mit dem Daumen der auf der Tischplatte liegenden Hand ausgeführt wird (Abb. 1.1). Pragmatisch handelt es sich um eine Selbstverteidigung. Das selbstreferenzielle Personalpronomen trägt den Hauptakzent und wird kontrastiv verwendet. Es impliziert, dass

368

7 Spezielle Fälle

eine andere Person verantwortlich für die von Sabrina gegenüber Jürgen erhobene und von diesem an Andrea delegierte Beschuldigung ist. Der Aushandlungsprozess zwischen den Beteiligten geht noch weiter. Dabei führt auch Jürgen eine selbstgerichtete Zeigehandlung aus, die als zweites Beispiel analysiert wird und sich wie folgt an das bisherige Geschehen anschließt. Auf Andreas Beschuldigung durch Jürgen folgt eine kurze Zwischensequenz, in der Jürgen als „Petze“ kategorisiert und damit moralisch an den Pranger gestellt wird. Konstitutiv für die kommunikative Praxis des „Petzens“ ist das Bloßstellen einer den Adressaten bis dato nicht bekannten, negativen Tat des „Verpetzten“ in dessen An- oder Abwesenheit. Sozio-pragmatisch interessant für die Gesamteinbettung der Zeigehandlung sind die Parallelen zwischen der kommunikativen Gattung des Petzens und der körperlichen Praxis des Zeigens auf Dritte. Wie der Verstoß gegen das Zeigeverbot birgt die sozial stigmatisierte Praxis des Petzens das Risiko, negativ auf den Handelnden selbst zurückzufallen, so dass der Akt der Fremddiskreditierung zu einem Akt der Selbstdiskreditierung wird. Da in diesem Fall das anschuldigende Zeigen auf eine anwesende Person integrativer Bestandteil des als verwerflich geächteten Akts des „Petzens“ ist, erweist sich Jürgens Aktion in doppelter Hinsicht als problematisch. Die Sanktionierung durch seine Interaktionspartner betrifft damit nicht nur die stigmatisierte Praxis des Petzens, sondern indirekt auch die Verletzung des Zeigetabus. Jürgen sieht sich daraufhin zur Selbstverteidigung herausgefordert und formuliert einen Gegenvorwurf, indem er sich als Opfer kollektiver Schuldzuschreibungen stilisiert. Dabei vollführt er eine Zeigegeste auf sich selbst: Beispiel 2: „immer ich“ (bb84_00:06:48)

01 02 03 04 05 06 07 08 09

Sbr: Jrg: Sbr: Jrg: Jhn: Jrg: Sbr:

10

Adr:

11 12 13 14

Sbr: Sbr:

((lacht laut los))

ja::::;(-) ja::::; ((lacht weiter))

((alle schmunzeln)) =

07 Sbr:

13 ((alle schmunzeln)) 14 Sbr: =

369

Abbildung 2

15 16 17 18 19 20 21

Jrg: Sbr: Jrg: Sbr:

= =DU kommst mal zu mir in_n KOCHkurs, ne?

[((lacht)) [((lacht))

79 An dem Beispiel wird deutlich, dass nur die Ich-Deixis die Möglichkeit einer vektoriell komplett arbiträren Geste eröffnet. Weder Abbildung 1.1 beim Zeigen auf ein Objekt oder einen Raumausschnitt, noch bei der Personendeixis der zweiten und dritten Person würde die von Habermann ausgeführte Armbewegung zur Lokalisierung des Zeigeziels führen, die bei gestisch verwendeten Deiktika die Bedingung einer erfolgreichen Identifizierung des Referenten darstellt. Bei der Geste handelt sich es letztlich auch nicht um eine Zeigegeste im engen Sinn, sondern um eine Meldegeste, die zusammen mit der Herkunfts- und Individuierungsqualität der menschlichen Stimme Zeigeziel- und Referenzherstellung ermöglicht.

382

7 Spezielle Fälle

01 PL: _was;>= 02 =DU kommst mal zu mir in_n KOCHkurs, ne? Beispiel 1 (Fortsetzung) 03 EH:

05 PL: [((lacht)) 06 PU: [((lacht)) 07 PL:

Abbildung 1.1

08 09

EH: PU:

ICH, ((lacht)) Abbildung 1.2

10 11 12

PL: PU: PL:

ach DU, ((klatscht)) du bIst doch schon mittenDRIN,

7.1 Personendeixis

383

Als Reaktion dreht Poletto sich um und führt zur Bestätigung eine adressatenbezogene Zeigehandlung aus (Z. 10: ach DU,). Dabei weist sie mit einer Zeigefingergeste im ZfHv-Format auf ihren Gast (Abb. 1.2). Wie an dem Beispiel erkennbar wird, richten Zeigende bei der Du-Deixis ihren Blick auf den Adressaten (Abb. 1.2), der zugleich das Zeigeziel ist. Da Zeigeziel und Adressat identisch sind, können Zeigende anders als beim Zeigen auf Gegenstände oder Dritte simultan zur perzeptorischen Zeigezielherstellung ein Adressatenmonitoring durchführen. Visuelle Wahrnehmung des Zeigeziels und Adressatenwahrnehmung fallen sequenziell und phänomenal zusammen. In komplexen Teilnehmerkonstellationen dient die Gleichgerichtetheit von Blick und Zeigegeste als zusätzliche Verweisressource für diejenigen Interak tionsteilnehmer, die mit der Du-Deixis nicht gemeint sind. In Abwandlung trifft dies auch auf die vorliegende Sequenz zu, die als Bühneninteraktion vor einem kopräsenten Studiopublikum und einem massenmedial konstituierten Fernsehpublikum stattfindet. Der Unterschied zu genuinen multi party-Konstellationen liegt darin, dass die Zeigegeste hier nicht den Ausschluss möglicher anderer Du-Kandidaten leistet, als vielmehr der publikumswirksamen Inszenierung der Interaktion zwischen Poletto und ihrem Gast dient. Besonders gut sichtbar werden die jeweiligen Besonderheiten der Ich- und der Du-Deixis in zwei unmittelbar aufeinander folgenden Zeigehandlungen, die im zweiten Beispiel in einem einzigen Redezug durchgeführt werden. Das Beispiel stammt aus dem Beginn einer weiteren Folge von „Polettos Kochschule“. Poletto hat soeben erklärt, welche Speise auf dem Programm steht und leitet mit der Aufforderung wollen_wir STARten (Z. 3) den Wechsel zwischen Erklär- und Kochaktivitäten ein. Ihr Gast antwortet, indem sie die fachliche Autorität und Verantwortung für das Gelingen Poletto zuschreibt und die eigenen Kochkompetenzen herunterspielt (Z. 5/6: aber ich meine sie verlAssen sich auf SICH, nicht auf MICH;). Simultan zur Artikulation der jeweils mit einem Kontrastakzent versehenen Pronomina SICH (Z. 5) und MICH (Z. 6) zeigt der Gast zunächst auf Poletto (Abb. 2.1) und dann auf sich selbst (Abb. 2.2): Beispiel 2: „sich nicht mich“ (PK4_00:01:37)

01 02 03 04

HS: PL: HS:

(-

[wollen_wir STARten? -) Abbildung 2.1

01 384 HS: 7 Spezielle Fälle 02 03 PL: [wollen_wir STARten? 04 HS: (-) Beispiel 2 (Fortsetzung) Abbildung 2.1

aber ich meine sie verlAssen sich auf SICH,

05

Abbildung 2.2

06 07

PL:

08

HS:

nIcht auf MICH; hh ich wOllte eigentlich mIt ihnen zuSAMmen (.) [kochen; [dAnn is GUT-

Bei beiden Zeigegesten ist der Blick der Sprecherin auf die Adressatin gerichtet und geht mit einem Adressatenmonitoring einher. Im Gegensatz zur Sprecherin verzichtet die Adressatin auf eine Reorientierung ihrer Aufmerksamkeit und blickt stattdessen weiterhin auf den Kochtisch. Allerdings dokumentiert sie durch den seitlich zur Sprecherin geneigten Kopf und Oberkörper ihre auditive Aufmerksamkeit und übernimmt unmittelbar nach Turnabschluss das Rederecht. Es

7.1 Personendeixis

385

wird erneut deutlich, dass der Gebrauch von Zeigegesten bei der Ich- und bei der Du-Deixis häufig in kontrastiver Funktion auftritt. Das dritte Beispiel stammt aus dem „Mutige Mädchen“-Korpus. Die Schülerinnen sitzen auf Matten um die Trainerin herum auf dem Turnhallenboden, nachdem sie zuvor in Partnerübungen Selbstverteidigungsstrategien erprobt haben. Auf die Übungsphase folgt nun eine Demonstrationsphase, in der die Trainerin wesentliche Merkmale der Selbstverteidigungsstrategie vorführt und fokussiert. Dazu wählt sie Schülerin aus, die zuvor signalisiert hat, dass sie die Rolle des Angreifers spielen möchte: Beispiel 3: „mal probieren“ (MM_C1_00:13:07) Abbildung 3

1 2 3 4

T: S: T:

DU wolltest mal probieren; ja; ICH woll[te mal] probieren. [ALso; ]

Um die Schülerin aus dem Kreis der Mädchen zu identifizieren, produziert die Trainerin im Verbund mit dem akzentuierten deiktischen Personalpronomen DU (Z. 1) eine Zeigegeste auf eines der Mädchen (Abb. 3). Die Geste wird im ZfHv-Format ausgeführt und erreicht ihren Gipfelpunkt unmittelbar vor der Artikulation des Anredepronomens. Die adressierte Schülerin bestätigt die Aufforderung (Z. 2–3) und beginnt aufzustehen, während die Trainerin in Überlappung mit der Äußerung der Schülerin durch das Rahmenwechselsignal ALso (Z. 4) eine neue Aktivitätsphase einleitet. Die folgenden Beispiele verdeutlichen, dass anstelle von manuellen Zeigegesten auch der Blick oder eine ostentative körperliche Reorientierung zum Zeigen auf den Adressaten eingesetzt werden kann. Im Beispiel „Zwiebeln“ aus „Polettos

386

7 Spezielle Fälle

Kochschule“ findet die Adressatenauswahl durch einen für längere Dauer auf die Person gerichteten Blick statt. Poletto durchquert den Bühnenraum ihres Studios und bewegt sich in Richtung der Zuschauerreihen (Abb. 4.1). In der rechten Hand hält sie ein Schneidemesser, in der linken Hand trägt sie ein Schneidebrett und eine Schüssel mit Zwiebeln, die von einem noch auszuwählenden Studiogast geschnitten werden sollen. Die Auswahl des Gasts erfolgt vor der verbalen Adressierung mittels eines ostentativ aufrecht erhaltenen, adressierenden Blicks und einer zielgerichteten körperlichen Bewegung auf ihn zu (Abb. 4.2). Erst dann adressiert sie den Gast auch verbal (Z. 1: hier SIE sehen so aus;) und hält währenddessen ihren Blick auf ihn gerichtet (Abb. 4.3): Beispiel 4: „Zwiebeln“ (PK4_00:13:04)

1 2

Pol:

Abbildung 4.1

Abbildung 4.2

Abbildung 4.3

Abbildung 4.4

hier SIE sehen doch so aus;= sie (.) !SU:!per (.) GUT mit zwiebeln umgehen.

7.1 Personendeixis

387

Poletto beginnt ihre Äußerung mit dem proximalen Lokaldeiktikon hier (Z. 1), das in dieser komplexen, durch Mehrfachadressierung gekennzeichneten Beteiligungsstruktur als deiktische Fokussierungsaufforderung an die Zuschauer fungiert, sich visuell auf Poletto zu orientieren. Ihr Blick ist dabei stetig auf den Kandidaten gerichtet, den sie zum Zwiebelschneiden auswählt (Abb. 4.2–4.3). Die Dauer dieser Blickzuwendung, die bereits in der mobilen Phase der Raumdurchquerung beginnt, desambiguiert den Gebrauch des deiktischen Anredepronomens SIE (Z. 2), mit dem Poletto die Person dann adressiert und diese Auswahl öffentlich macht. Ohne die Antwort ihres Adressaten abzuwarten, platziert sie anschließend die Zwiebelschüssel vor ihm auf dem Tisch (Abb. 4.4) und vollzieht damit eine Aufgabenzuweisung, die den Adressaten als Kochgehilfen zum Zwiebelschneiden etabliert. Im fünften Beispiel aus dem „Big Brother“-Korpus befinden sich drei Bewohner, Andrea, Jürgen und Sabrina, in der Küche und diskutieren über eine verletzende Bemerkung, die Jürgen am Vortag gegenüber Sabrina gemacht hat. Während Sabrina und Jürgen sich am Esstisch gegenübersitzen und in fokussierter Interaktion miteinander sind, steht Andrea mit dem Rücken zu den beiden an der Spüle (Abb. 5.1), schneidet Gemüse und mischt sich nur gelegentlich in den Aushandlungsprozess ein. Dabei muss sie deutlich machen, an wen ihre Äußerung adressiert ist. Sie wendet sich mit einer Mutmaßung dessen, was Jürgen zu Sabrina gesagt haben könnte, an Jürgen: Beispiel 5: „Kränkung“ (bb85_00:10:59) Abbildung 5.1 Adr

Jrg

01 02 03 04 05 06 07 08 09 10

Sbr:

also gibt es nur EINS,

Jrg:

ja; dann ham_wa ja g geHABT; ((lacht)) FREUNDschaft.

Sbr: Jrg: Sbr: Jrg:

geNAU;= =ja; (2.0)

Sbr

lach.

01 Sbr: also gibt es nur EINS, 02 lach. 388 7 Spezielle Fälle 03 Jrg: ja; 04 dann ham_wa ja g geHABT; Beispiel 5 (Fortsetzung) 05 Sbr: ((lacht)) 06 Jrg: FREUNDschaft. 07 Sbr: 08 geNAU;= 09 Jrg: =ja; 10 (2.0) 11 h 12 (-) du wIllst (.) nUr (.) mein BEStes; 13 oder IRgendso[was-] 14 Sbr: [genau;] 15 (0.8) 16 Jrg: ja; 17 (1.0) 18 Jrg: [(....) ] 19 Sbr: [jetz sin] nich wegen MIR? 20 [( )] Abbildung 5.2

21 22

Adr:

Abbildung 5.3

[

Um deutlich zu machen, an wen ihr Einwurf gerichtet ist, dreht Andrea sich mit einer 180 Grad-Drehung (Abb. 5.2–5.3) um und selegiert mit ihrem Blick Jürgen (Abb. 5.3) als Adressaten des deiktischen Anredepronomens DU in der Äußerung, die eine Redewiedergabe einleitet (Z. 21: da hast DU wahrscheinlich gesacht;). Anschließend animiert sie Jürgens mutmaßliche Äußerung gegenüber Sabrina (Z. 22: da !SCHEISS! ich drauf;). Währenddessen bleibt sie weiterhin auf Jürgen orientiert. In der Sequenz geht es um die Rekonstruktion und moralische Bewertung dessen, was die beiden am Tisch Sitzenden in einem früheren Streit zuein-

7.1 Personendeixis

389

ander gesagt haben. Durch die animierte, als hypothetisch gerahmte Äußerung nimmt Andrea dazu Stellung und verdeutlicht, wem sie die moralische Schuld an dem Konflikt zuschreibt. Bislang wurden ausschließlich Fälle betrachtet, in denen die Sprecher auf einen einzelnen Adressaten zeigen. Ergänzend dazu werden im Folgenden Fälle analysiert, in denen durch verbaldeiktische und gestische Mittel plurale Adressaten konstituiert werden. In Situationen mit einem komplexen Beteiligungsformat werden zur referenziellen Desambiguierung körperlich-visuelle Zeigmittel erforderlich. Die folgende Sequenz ist bereits aus dem vorherigen Abschnitt bekannt, wo die erste Teilsequenz zum Zeigen auf ein kollektives Wir analysiert wurde. In der zweiten Teilsequenz erfolgt kontrastiv eine auf einen kollektiven Adressaten gerichtete Zeigehandlung, die nun betrachtet werden soll. Die Interaktion findet ganz am Ende der Kochshow statt. Nachdem Poletto angekündigt hat, dass die Studiozuschauer zum Probieren nach vorne an den Kochtisch kommen können, fordert sie zuerst ihren Gast zum gemeinsamen Probieren auf und bittet die Studiogäste explizit, nach vorne zu kommen: Beispiel 6: „probieren“ (PK4_00:27:37)

01 02 03 04 05 06 07 08 09

- (.)

PL: zu uns EINladen, und die reZEPte, (-)

im Internet, (-) NACHzulesen,= WIR probieren jetzt hier mal, Abbildung 6.1

10 11

unsre (0.7) taJIne? (2.0) Abbildung 6.2

390

7 Spezielle Fälle

Beispiel 6 (Fortsetzung)

10 11

unsre (0.7) taJIne? (2.0) Abbildung 6.2

12 13

PL:

SIE zu Uns nach VORne kommen,

-)

Unmittelbar nach der Aufforderung ihres Gasts (Z. 9–10) beginnt Poletto, das Gericht von der Pfanne auf einen Teller zu füllen. Dabei richtet sie ihren Blick auf Pfanne und Teller (Abb. 6.1). Während ihre Hände mit dem Anrichten beschäftigt sind, lädt sie mit einer deiktischen Aufforderung das Publikum ein, zum Probieren nach vorne zu kommen (Z. 4–5: °h und SIE dürfen RU:hig, (-) zu Uns nach VORne kommen,). Das Pronomen trägt den Hauptakzent. Die Aufforderung wird von einem ostentativen, adressierenden Blick in die Zuschauerreihen begleitet (Abb. 6.2), das dadurch vom nicht präsenten Fernsehpublikum unterschieden wird. Komplexe Beteiligungsformate bestimmen auch die Interaktion im „Mutige Mädchen“-Korpus, so dass zur Desambiguierung deiktisch gebrauchter pluraler Pronomina der zweiten Person häufig visuelle Zeighilfen erforderlich sind. In der folgenden Situation (Beispiel 7: „ihr vier“) steht die Trainerin mit fünf Mädchen mitten in der Turnhalle, während sich die restlichen Mädchen in einer Reihe sitzend und stehend an der Wand aufhalten. Die Trainerin wählt vier der fünf Mädchen aus, um sie für eine Übung aus dem Raum zu schicken. Nachdem die Trainerin mit einigen Verzögerungen eine Instruktion projiziert hat (Z. 1), wählt sie vier der fünf bei ihr stehenden Mädchen aus, indem sie das akzentuierte Anredepronomen IHR (Z. 2) artikuliert und mit den Armen räumlich den Kreis der Adressatinnen eingrenzt. Dazu hebt sie beide Arme an, wobei die Handflächen vertikal ausgerichtet sind (Abb. 7.2). Durch die Numerale VIER (Z. 2) präzisiert die Trainerin die Anzahl der ausgewählten Mädchen. Während ihr

7.1 Personendeixis

391

Beispiel 7: „ihr vier“ (MM_B1_00:01:38) Abbildung 7.1

1

T:

und DANN:: (--) sag ich malAbbildung 7.2

2 3

Abbildung 7.3

IHR VIER? (0.4)

linker Arm die äußere Begrenzung der gesamten Fünfergruppe markiert, zieht ihr rechter Arm eine Trennlinie zwischen dem inkludierten vierten und dem exkludierten fünften Mädchen. Die durch die Grenzziehung getroffene Auswahl wird durch ihren von rechts nach links schweifenden Blick auf ihre Adressatinnen (Abb. 7.2–7.3) bekräftigt. In der Folge bewegt die Trainerin ihre Arme im Verbund mit einer Drehung des Oberkörpers nach links (Abb. 7.4). Im Verlauf dieser Drehbewegung werden die den Adressatenkreis containerartig umgrenzenden oHHv-Gesten zu Zeigeges-

392

7 Spezielle Fälle

Beispiel 7 (Fortsetzung)

Abbildung 7.4

4 5

Abbildung 7.5

geht mal kurz RAUS? (2.6)

ten im ZfHu-Format transformiert, die in die Richtung weisen (Abb. 7.5), die die Mädchen einschlagen sollen, und der Aufforderung (Z. 4: geht mal kurz RAUS?) visuell Nachdruck verleihen.

Zusammenfassung Die Analysen haben nachgewiesen, dass sich die deixistheoretischen Unterschiede zwischen der Deixis der ersten und zweiten Person einerseits und der dritten Person andererseits empirisch in systematisch voneinander zu unterscheidenden multimodalen Ablaufformaten manifestieren. Verallgemeinernd ist festzuhalten, dass die Verschiedenartigkeit der Zeigeziele systematisch in den unterschiedlichen Mustern der Blickorganisation enkodiert ist und die Selektion des jeweiligen Zeiginstruments (Zeigefinger, Daumen, Blick) mitbedingt. Das Zeigen auf Dritte besitzt die größte Ähnlichkeit zum Zeigen auf Gegenstände und Räume und damit zu dem im theoretischen Teil entwickelten Standardformat (Kapitel 4). Allerdings führt der tabu- bzw. höflichkeitsbedingte Sonderstatus des Zeigefingers beim Zeigen auf Dritte einerseits zu Alternativformaten wie dem Zeigen mit dem Blick oder mit dem Daumen. Andererseits ermöglicht dieser Sonderstatus den Gebrauch des Zeigefingers als besonders markante Form des beschuldigenden Zeigens auf anwesende Dritte und des anschuldigenden Zeigens auf Adressaten. Personendeiktische Zeigehandlungen, die sich auf die Beteiligtenrollen (Sprecher, Adressat) beziehen, weisen ein anderes Blickmuster auf als das Zeigen

7.1 Personendeixis

393

auf Dritte. Während beim Zeigen auf Dritte das theoretisch dargelegte (Kapitel 4) und empirisch nachgewiesene (Kapitel 6) Standardformat realisiert wird, wonach Zeigende ihren Blick zunächst auf den Verweisraum richten, ihre Adressaten dann mittels einer Zeigegeste auf Suchraum bzw. Zeigeziel orientieren und ihren Blick entsprechend reorientieren (Ressourcen-Spagat), besitzen Zeigehandlungen auf die erste und zweite Person ein systematisch davon abweichendes Format. Im Gegensatz zur Er/Hier-Deixis teilen die Ich- und die Du-Deixis das Merkmal, dass Zeigende ihren Blick unmittelbar auf den Adressaten gerichtet halten und keine sequenzielle Blickalternation zwischen Zeigeziel und Adressaten vornehmen. Folglich begeben sie sich auch nicht in den beim Zeigen auf Räume, Objekte und dritte Personen beobachtbaren Ressourcen-Spagat. Sowohl bei der Ich-, als auch bei der Du-Deixis können Zeigende ihren Blick unmittelbar zum Adressatenmonitoring einsetzen. Allerdings liegen der Gemeinsamkeit zwischen Ich- und Du-Deixis feine Unterschiede zugrunde. Zwar wird in beiden Fällen das spezifische Blickmuster durch die Besonderheit des Zeigeziels bedingt, doch während bei der Du-Deixis der auf den Adressaten gerichtete Blick funktional zugleich ein Blick zur Herstellung des Zeigeziels und ein Kontrollblick zur Wahrnehmungswahrnehmung (Adressatenmonitoring) ist, die in diesem Fall sequenziell zusammenfallen, fungiert der auf den Adressaten gerichtete Blick bei der Ich-Deixis ausschließlich als Kontrollblick zur Wahrnehmungswahrnehmung (Adressatenmonitoring). Während also das Zeigeziel bei der Du-Deixis mit dem Adressaten zusammenfällt und für den Zeigenden die Blickalternation zwischen Zeigeziel und Adressaten überflüssig macht, ist das Zeigeziel bei der Ich-Deixis per definitionem so beschaffen, dass es zwar gezeigt, vom Zeigenden selbst aber nicht wahrgenommen werden kann. In dieser Situation fällt die im Standardformat beobachtbare Blickalternation zwischen Zeigeziel und Adressaten weg, da die Person des Zeigenden selbst das Zeigeziel darstellt. Es sind also unterschiedliche Gründe dafür verantwortlich, dass der Zeigende seinen Blick sowohl bei der Ich-, als auch bei der Du-Deixis auf den Adressaten richtet und unmittelbar zum Adressatenmonitoring einsetzen kann. Wie zu sehen war, manifestiert sich das vom Standardformat abweichende Blickmuster eines Adressatenmonitoring ohne Blickalternation auch bei der (inklusiven) Wir-Deixis. Laut Benveniste stellt der Plural der ersten Person „nicht eine Multiplikation identischer Objekte, sondern eine Verbindung zwischen ‚ich‘ und ‚nicht-ich‘ [dar], welches Inhalts dieses ‚nicht-ich‘ sein mag“ (Benveniste 1974: 261). Da die Ich-Deixis auch ohne selbstgerichtete Zeigegeste allein durch die stimmliche Identifizierungsfunktion der Ich-sagenden Person desambiguiert wird und dieses Ich immer schon in dem Wir der Wir-sagenden Person gesetzt ist, verlangt die Wir-Deixis eine inhaltliche Desambiguierung der „nicht-ich“-Kom-

394

7 Spezielle Fälle

ponente. Dies erklärt die Gemeinsamkeiten im multimodalen Ablaufformat zwischen der (inklusiven) Wir-Deixis und der Deixis der zweiten Person. Die inklusive Wir-Deixis wird entweder als Ich-Deixis plus Du-Deixis (duale Wir-Deixis) oder als Ich-Deixis plus Ihr-Deixis realisiert. Im ersten Fall muss aus dem Kreis kopräsenter Personen lediglich eine weitere Person individuiert werden, was manuell oder mit dem Blick geschehen kann und dem Ablaufformat des Zeigens auf den Adressaten entspricht. Alternativ wählen Zeigende für den gestischen Teilakt ein sequenzielles Format, indem sie nacheinander auf das Du und auf das Ich zeigen. Im zweiten Fall muss aus dem Kreis kopräsenter Personen eine Anzahl von Personen selegiert werden, was nur in Ausnahmefällen – etwa bei räumlich klar getrennten Gruppen – mit dem Blick geleistet werden kann, in der Regel jedoch eine Geste verlangt, die zusätzlich einen Radius oder eine Trennlinie zu ziehen und daher ikonische Komponenten zu integrieren vermag. Dafür stellen Handbzw. Armgesten die am besten geeigneten Zeiginstrumente dar. Auf Seiten des Adressaten ist beim Zeigen auf Dritte dasselbe Blickverhalten wie beim Zeigen auf Objekte und Räume zu beobachten. Anders verhält es sich bei der Ich- und der Du-Deixis. So ist der Blick des Adressaten bei der Ich-Deixis des Zeigenden auf das Gesicht des Zeigenden gerichtet bzw. auf Augenkontakt eingestellt, ohne dass die Zeigegeste des Zeigenden bei der Ich-Deixis auf das eigene Gesicht zeigen würde. Dasselbe gilt umgekehrt für die Du-Deixis. Auch hier richtet der Adressat seinen Blick auf den Zeigenden und nicht etwa auf sich selbst. So wie der Zeigende bei einer selbstgerichteten Zeigehandlung nicht auf seine eigene Brust blickt, blickt der Adressat bei einer ihn adressierenden Zeigehandlung auch nicht auf seine eigene Brust. Diese Besonderheiten sind konstitutiv für die Unterscheidung zwischen der selbstreferenziellen Personen deixis, d. h. dem Zeigen auf das Sprecher-Selbst, und dem Zeigen am eigenen Körper, das im folgenden Kapitel diskutiert werden. Dasselbe gilt analog für das personendeiktische Zeigen auf den Adressaten und das Zeigen am Körper des Adressaten.

7.2 Zeigen am eigenen Körper Nachdem im vorherigen Kapitel die multimodalen Besonderheiten der Personendeixis behandelt und die formatspezifischen Unterschiede zwischen dem Zeigen auf die erste, zweite und dritte Person herausgearbeitet wurden, beschäftigt sich das vorliegende Kapitel mit dem Zeigen am eigenen Körper. Es ist entscheidend, das Zeigen am eigenen Körper vom Zeigen auf das Selbst (vgl. Kapitel 7.1. zur Personendeixis) abzugrenzen. Wie zu sehen sein wird, ergeben die Ana-

7.2 Zeigen am eigenen Körper

395

lysen formatspezifische Unterschiede, die die theoretische Unterscheidung zwischen dem Zeigen auf das Selbst bei der autoreferenziellen Personendeixis und dem Zeigen am eigenen Körper empirisch begründen. Beim Zeigen am eigenen Körper ist der Körper des Zeigenden identisch mit dem Körper, auf den gezeigt wird, so dass der Körper des Zeigenden zum semiotischen Doppelraum wird. Er ist sowohl zeigender Körper bzw. Zeigesubjekt als auch gezeigter Körper bzw. Zeigobjekt. Das bedeutet, dass der Körper des Zeigenden zugleich der Verweis- bzw. Suchraum der eigenen Zeigegesten ist. Die semiotische Doppelbesetzung des menschlichen Körpers hat unterschiedliche Konsequenzen, die im Folgenden näher betrachtet werden. Eines der Hauptprobleme entsteht dadurch, dass beim Zeigen am eigenen Körper der Verweis- bzw. Suchraum und das Zeigeziel außerhalb des visuellen Wahrnehmungsraums des Zeigenden und/oder des Adressaten liegen können. Dies kann eine Modifikation der Körperpositionen im Raum erforderlich machen. Die Herstellung der Sichtbarkeit des Zeigeziels gestaltet sich beim Zeigen am eigenen Körper anders als beim Zeigen auf ein vom Körper des Zeigenden unabhängiges Drittes, zu dem Zeigender und Adressat eine räumliche Position einnehmen können, die eine gemeinsame Wahrnehmung ermöglicht. Beim Zeigen am eigenen Körper bedingen Positionsveränderungen des Zeigenden, die dem Adressaten ein zuvor verdecktes Zeigeziel am Körper des Zeigenden zugänglich machen, weitere, unter Umständen dispräferierte interaktionsräumliche Veränderungen, so dass die Präferenz für Sichtbarkeit mit anderen Präferenzen in Konflikt geraten kann. Beim Zeigen am eigenen Körper funktioniert die für das Ablaufformat konstitutive Komponente der Verweisraumherstellung durch den Blick nur, solange der Zeigende in der Lage ist, die betroffenen Regionen seines Körpers zum Betrachtungsobjekt der eigenen Wahrnehmung zu machen. Zeigen ist in der Regel mit Selbstmonitoring80, einer handlungssteuernden Wahrnehmung und räumlichen Feinabstimmung der eigenen Zeigeaktivitäten im Hinblick auf das Zeigeziel verbunden. Dabei besitzt die Blickorientierung die Doppelfunktion, dem Zeigenden als feinkoordinatorisches Kontrollinstrument seiner eigenen Zeigebewegung und dem Adressaten als Kontextualisierungshinweis auf die Relevanz der Zeigegeste zu dienen. Eine weitere Besonderheit besteht darin, dass beim Zeigen am eigenen Körper das Zeigeziel in den meisten, wenn auch nicht in allen Fällen berührt werden kann.81 Möglichkeiten, den mangelnden visuellen Abgleich zwischen Zeigegeste

80 Vgl. zur selbstbezogenen Auffassung des Monitoring-Begriffs Levelt (1983). 81 Ausnahmen sind z. B. durch unerreichbare Körperregionen wie die Mitte des Rückens oder

396

7 Spezielle Fälle

und Zeigeziel zu kompensieren, liegen daher in propriozeptiven Wahrnehmungsakten zwischen zeigendem und gezeigtem Körperteil. Im Folgenden werden die genannten Besonderheiten anhand von vier Analysen exemplifiziert. Das erste Beispiel stammt aus dem „Big Brother“-Korpus. Jürgen, Sabrina und Andrea sitzen in der Küche am Esstisch (Abb. 1.1), während John an der Spüle steht und abwäscht. Die am Tisch Sitzenden reden über Körperpflege und Hygiene. Sabrina insistiert darauf, dass Jürgen seine Nasenhaare entfernen müsse, was Jürgen jedoch nicht einsieht. Er verteidigt sich, indem er seine Unabhängigkeit gegenüber fremden Urteilen bekräftigt. Dabei führt er zwei Zeigegesten am eigenen Körper aus: Beispiel 1: „Haare wegmachen“ (bb84_00:21:50) Abbildung 1.1 Jrg

Sbr

Adr

01 02 03 04 05 06 07 08 09

Jrg:

(1.0) MIR' weil MIR is_es eGA:Lun(d) (.) DU hast nix mir zu TUN,= =im GRUNde genommen; (0.7) misch interesSIERT es nisch; (4)

sen;

durch Einschränkungen bedingt, die aus mangelnder Beweglichkeit oder kulturell bedingten Tabuisierungen entstehen.

7.2 Zeigen am eigenen Körper

397

Beispiel 1 (Fortsetzung)

Abbildung 1.2

zlAddi wollt mir au immer HIER die haare wegmachen;

10

Abbildung 1.4

Abbildung 1.5

HIER [die haare wegmachen;

11

Abbildung 1.6

12

Abbildung 1.3

Sbr:

Abbildung 1.7

[nee DA DAS ja nich;

398

7 Spezielle Fälle

Zu Beginn der ersten Zeigehandlung (Z. 10) ist der Blick des Sprechers auf seine Adressatin orientiert (Abb. 1.2). Im Verlauf der Äußerung, simultan zum Personalpronomen mir (Z. 10: zlAddi wollt mir au immer HIER die haare wegmachen;), richtet Jürgen seinen Blick auf die eigene Brust (Abb. 1.3) und stellt dadurch den Verweisraum für den unmittelbar folgenden Zeigeakt her. Dazu hebt er den rechten Arm und berührt mit angewinkelter Hand seine Brust (Abb. 1.4). Die autotaktile Berührung erfolgt simultan zur Artikulation des proximalen Lokaldeiktikons HIER (Z. 10). Der Blick des Sprechers ist auf das Zeigeziel gerichtet, wobei Kopf und Oberkörper stark vorgebeugt sind. Anschließend blickt er wieder zu seiner Adressatin (Abb. 1.5). Diese Blickorientierung hält er während der gesamten zweiten Zeigehandlung (Z. 11) aufrecht. Er blickt also nicht zum zweiten Zeigeziel, der Achselhöhle. Stattdessen führt er, während er das zweite Lokaldeiktikon HIER (Z. 11) artikuliert, den rechten Arm unter die linke Achselhöhle und hebt dabei den linken Arm hoch, so dass Suchraum und Zeigeziel besonders exponiert werden (Abb. 1.6). Anschließend senkt er den Arm wieder und blickt bei Beendigung seines Redezugs von der Adressatin weg nach unten (Abb. 1.7). Als entscheidender Unterschied zur selbstreferenziellen Personendeixis, bei der Zeigende ihren Blick nicht auf den durch ihre Zeigegeste fokussierten Bereich des eigenen Körpers richten, ist festzuhalten, dass der Zeigende im vorliegenden Beispiel sehr wohl auf seine eigene Brust blickt. Sie konstituiert das Zeigeziel der ersten, autotaktilen Zeigegeste (Abb. 1.4) und den räumlichen Referenten des proximalen Lokaldeiktikons HIER (Z. 10). Das Zeigeziel der zweiten, mit schnellem Anschluss produzierten Zeigehandlung liegt dicht beim ersten Zeigeziel und wird nicht eigens durch den Blick hergestellt. Stattdessen blickt der Zeigende zur Adressatin, so dass sich Komponenten der zweiten Zeigehandlung und das zum multimodalen Format der ersten Zeigehandlung gehörende Adressatenmonitoring überlagern. Das zweite Beispiel stammt aus dem „Mutige Mädchen“-Korpus. Die Trainerin erklärt einen Bewegungsablauf, den die Mädchen zur Selbstverteidigung lernen werden. Im Verlauf ihrer Erklärung produziert sie eine Zeigegeste auf eines ihrer Beine. Da das Bein der visuellen Selbstwahrnehmung zugänglich ist, wird auch hier der Blick als Ressource zur Herstellung von Verweis- bzw. Suchraum und Zeigeziel eingesetzt:

7.2 Zeigen am eigenen Körper

399

Beispiel 2: „hinteres Bein“ (MM_B1_00:14:10) Abbildung 2.1

1

L:

, Abbildung 2.3

2

Abbildung 2.2

Abbildung 2.4

das wir vielleicht dIese stunde leider NICHT mehr machen,

Zu Beginn ihrer Äußerung setzt die Trainerin das linke Bein einen Schritt zurück und blickt dabei in die Runde der Schülerinnen (Abb. 2.1–2.2). Das Temporaldeiktikon SPÄter (Z. 1) kündigt an, dass die Erläuterung für künftige Übungen relevant sein wird. Unmittelbar darauf formuliert die Trainerin zunächst eine Paren these, zu deren Beginn sie das zurückgesetzte Bein mit der linken Hand berührt

400

7 Spezielle Fälle

Beispiel 2 (Fortsetzung) Abbildung 2.5

3 4 5

(1.0)

Abbildung 2.6

HIER mit dem HINteren bein was -) SCHIENbeintritt.

(Abb. 2.3) und dabei den Zeigefinger leicht abgespreizt. Anschließend wirft sie einen Blick in die Runde der Schülerinnen und schließt dabei auch die hinter ihr stehenden Mädchen mit ein (Abb. 2.4). In der folgenden Pause (Z. 3) senkt sie den Kopf und richtet den Blick auf das hintere Bein, während sie eine ZfHu-Geste mit einem deutlich von der Hand abgespreizten Zeigefinger formt (Abb. 2.5). Dadurch wird der Verweisraum für den deiktischen Zeigeakt hergestellt, wobei die Geste den sprachlichen Zeigeakt projiziert bzw. vorwegnimmt. Mit der syntaktischen Wiederaufnahme des Matrixsatzes (Z. 4) nach der Parenthese (Z. 2) und der Pause (Z. 3) blickt sie zu den Schülerinnen auf (Abb. 2.6). Simultan zur Artikulation des Lokaldeiktikons HIER (Z. 4) führt sie einen zeigenden Schlag (tap) auf das zurückgesetzte Bein aus (Abb. 2.6). Den Blick richtet sie nicht erneut auf das Bein, sondern in die Runde der Schülerinnen. Der Schlag auf das Bein wird simultan zur zweiten Akzentsilbe auf dem Lokaladjektiv HINteren (Z. 4) wiederholt, während ihr Blick weiterhin auf die Schülerinnen orientiert ist. Beim dritten Beispiel handelt es sich erneut um institutionelle Kommunikation. Allerdings stammt die Sequenz nicht aus der Lehr-Lern-Interaktion, sondern aus der Arzt-Patient-Kommunikation unter den besonderen Rahmen-

7.2 Zeigen am eigenen Körper

401

bedingungen einer Schmerzkonferenz (vgl. dazu die Bemerkungen in Kapitel zu Korpus und Methode). Die insgesamt 32 Minuten dauernde Schmerzkonferenz ist schon eine Weile in Gang, die fokussierte Interaktion ist hergestellt und die Beteiligten sind einander zugewandt. Eine erste ausführliche Befragung des Patienten zu seinen Schmerzen hat bereits stattgefunden. Der Patient schildert seine nächtlichen Schmerzprobleme im Rückenbereich und die damit einhergehende Unbeweglichkeit. Auf die Nachfrage einer der Ärzte, ob und wenn ja welche Maßnahmen er dagegen ergreift, beschreibt der Patient verschiedene Bewegungsmuster, die er liegend im Bett ausführt. Dazu gehört auch das Hochlegen der Beine am Morgen, eine Bewegung, bei der der Patient infolge einer Operation eingeschränkt ist. An dieser Stelle setzt der Ausschnitt mit den Erläuterungen des Patienten zu seinen Bewegungseinschränkungen ein. Um das Bein zu identifizieren, das seinen Bewegungsspielraum einschränkt, führt er eine beidhändige Zeigegeste am eigenen Körper aus. Am Ende der Turnkonstruktionseinheit, in der er seine morgendlichen Schmerzlinderungsmaßnahmen geschildert hat (Z. 1–5), projiziert der Patient durch den Reformulierungsindikator (Gülich und Kotschi 1987) also: (Z. 5) eine Fortsetzung seiner Darstellung. Zu diesem Zeitpunkt befinden sich seine Hände Beispiel 3: „des Bein“ (SK27_10_05)

01 02 03 04

P:

Abbildung 3.1

05

- (-)

die BEIne (--) HOCH, (1.0)

NEHme_also:Abbildung 3.3

Abbildung 3.2

(-) Abbildung 3.4

402

7 Spezielle Fälle

05 NEHme_also:Beispiel 3 (Fortsetzung) Abbildung 3.3

06 07 08 09 10

(-) Abbildung 3.4

weil_ja DES bein (.) geht ja (.) (-) ja, (.) -) lEtzten operaTION, (2.0)

in Ruhelage zusammengefaltet in seinem Schoß, während er seinen Blick auf den Chefarzt als Primäradressaten orientiert (Abb. 3.1). Bevor der Patient nach der kurzen Pause weiterspricht, blickt er auf seine Hände (Abb. 3.2), löst sie kurz darauf aus der Ruhelage und beginnt sie in einer spiegelbildlichen Parallelbewegung seitlich leicht zu öffnen (Abb. 3.2). Indem der Patient den Blickkontakt mit dem Adressaten auflöst und seinen Blick nach unten auf den eigenen Körper richtet, stellt er zunächst einen Verweisraum her und projiziert eine körperliche Handlung, die es vom Adressaten wahrzunehmen gilt. So wird die Relevanz der folgenden Zeigegeste etabliert. Anschließend setzt die verbale Explizierung ein (Z. 6: weil_ja DES bein (.) geht ja (.) so RICHtig,). Simultan zur Äußerung des deiktischen Demonstrativartikels DES (Z. 6) berühren Mittel-, Zeige- und Ringfinger beider Hände das linke Knie mit zwei kleinen Schlägen (taps), wobei die Handinnenflächen präsentativ nach oben weisen. Der Blick bleibt währenddessen auf das Zeigeziel gerichtet (Abb. 3.3; die Doppelpfeile kennzeichnen die zwei Schläge). Mit der Äußerung des Nomens bein wendet der Patient seinen Blick wieder dem Adressaten zu, während der autotaktile Berührungskontakt mit dem Zeigeziel aufgelöst und der durch die Hände begrenzte Raum durch die laterale Öffnung der Hände erweitert wird (Abb. 3.4). Aufgrund der Dauer des auf den Adressaten

7.2 Zeigen am eigenen Körper

403

gerichteten Blicks und der multimodalen Koppelung des Blicks mit den präsentativ geöffneten, das eigene Knie weiterhin im Fokus haltenden Händen (Abb. 3.4) unternimmt der Patient hier über das Adressatenmonitoring hinaus den Versuch, vom Arzt ein Rückmeldesignal zu erhalten. Thema der Explizierung ist die mangelnde Funktionsfähigkeit des (linken) Beins (Z. 6) und der zeitliche (und möglicherweise kausale) Bezug zu einer früheren Operation (Z. 9). Dadurch, dass auf das Bein lediglich mit dem deiktischen Demonstrativum DES plus Nomen referiert wird, ist zur referenziellen Desambiguierung der Einsatz der Zeigegeste unabdingbar. Die Art, in der sie ausgeführt wird, macht einen Teil des eigenen Körpers zum Objekt. Die Beobachtungen zum multimodalen Ablaufformat beim Zeigen am eigenen Körper decken sich mit den Beobachtungen zu deiktischen Zeigehandlungen, die an Räumen und Objekten ausgeführt werden. So stellt der Zeigende zunächst durch den Blick den künftigen Verweisraum für das Verbaldeiktikon her. Der Verweisraum wird durch den Einsatz der Zeigegeste für den Adressaten als Suchraum konstituiert. Im Unterschied zum Zeigen an distalen Zeigezielen kann das Zeigeziel hier erstens berührt werden, was das Vektor-Ziel-Problem (potenziell) vereinfacht. Zweitens befindet es sich am oder im Körper des Zeigenden. Für den Zeigenden bedeutet das, dass er zusätzlich zur visuellen Überprüfung seines Zeigeakts das Zeigeziel auch haptisch sicherstellen kann. Es findet eine propriozeptive Rückmeldung durch den eigenen Körper statt, und zwar bei autotaktilen Handlungen – anders als beim Berühren eines Gegenstandes – in zweifacher Weise, insofern das berührende (in diesem Fall die Fingerspitzen) und das berührte Körperteil (in diesem Fall das Knie) eine propriozeptive Wahrnehmung ermöglichen. Das Klopfen auf das eigene Bein hat noch eine weitere Funktion: Es dient einer gestischen Präzisierung des Referenten, denn wie der weitere Verlauf zeigt, geht es nicht global um das „linke Bein“, sondern insbesondere um das „linke Knie“. Dieses stellt topographisch einen kleineren Ausschnitt zu dem vorher gestisch identifizierten Bein dar – semantisch gesehen bildet es ein Meronym zum „linken Bein“. Blick und Gestik leisten also nicht nur die zur Referenzherstellung notwendige Präzisierung des verbaldeiktisch unzureichend mit DES bezeichneten Beins, sondern sie setzen darüber hinaus einen engeren thematischen Fokus, der später (nach 3.4 Minuten) auch verbal eingeführt wird: °hh und da(nn) hab_I ja auch noch mit dem (.) lInke KNIE_äh:: ab und zu:- desch_is gott sei dank nImmer SO: schlImm wie_s WAR. Auch für den Adressaten bedeutet die Tatsache, dass der Zeigende das Zeigeziel berührt, eine Vereinfachung des Vektor-Ziel-Problems, denn anders als beim Zeigen auf ein distales Zeigeziel muss er keine imaginäre Verlängerungslinie von der Zeigegeste zum Zeigeziel ziehen. Mit der Vereinfachung des Vektor-Ziel-Pro-

404

7 Spezielle Fälle

blems geht allerdings nicht automatisch auch eine Erleichterung der Referenzherstellung – also des Übergangs vom visuellen, wahrnehmungsbezogenen Teil zum kognitiv-verstehenden Teil der Gesamthandlung – einher. Insbesondere im medizinischen Kontext wird die Referenzherstellung dadurch verkompliziert, dass der Referent im Sinne einer schmerzätiologischen Ursachenfeststellung oft nicht sichtbar im Körperinneren liegt. Nachdem im Vorherigen einige der spezifischen Bedingungen des Zeigens am eigenen Körper dargelegt wurden, wird im Folgenden untersucht, welche Pro bleme beim Zeigen am eigenen Körper mit verdecktem Zeigeziel entstehen. Wie in den vorherigen Beispielen stellt auch hier der Körper des Zeigenden den Verweisbzw. Suchraum dar. Für den Zeigenden gilt daher zunächst, dass das Zeigeziel, da es sich am eigenen Körper befindet, berührt und haptisch sichergestellt werden kann.82 Eine visuelle Überprüfung des eigenen Tuns ist also nicht unbedingt erforderlich, hier allerdings auch nicht möglich, da sich das Zeigeziel am unteren Teil des Rückens befindet. Dieser Sonderfall des Zeigens am eigenen Rücken bringt diverse Probleme mit sich, die interaktiv bearbeitet werden. Bei dem Ausschnitt handelt sich um eine längere Bearbeitungssequenz, in der Arzt und Patient gemeinsam den zentralen Schmerzpunkt am Körper des Patienten zu lokalisieren suchen. Sie ist zeitlich relativ am Anfang der Schmerzkonferenz angesiedelt. Der Patient hat mit Hilfe zweier Stöcke den Raum betreten und auf dem angewiesenen Stuhl Platz genommen. Nachdem der Chefarzt den Patienten zunächst zum Gebrauch der Stöcke befragt hat, thematisiert er die Bewegungsproblematik und fordert den Patienten auf, noch einmal aufzustehen und ohne Stöcke auf und ab zu laufen. Während der Patient der Aufforderung nachkommt, teilt der Chefarzt den Ärztekollegen seine diagnostischen Beobachtungen mit. Unmittelbar nachdem der Patient wieder Platz genommen hat, setzt die zu analysierende Interaktionseinheit damit ein, dass der Chefarzt sich wieder dem Patienten als Hauptadressaten zuwendet. Die Sequenz untergliedert sich in drei Teilsequenzen, die der präziseren Lokalisierung des Schmerzes dienen. Gliederungskriterien für die Dreiteilung bilden die Fragen des Arztes sowie die verbalen und nonverbalen Aktivitäten des Patienten, zusammengefasst also die interaktiven Bearbeitungsschritte zur Lösung des Lokalisierungsproblems. Die erste Teilsequenz (Z. 1–4) beginnt mit der Frage des Chefarztes83 nach dem Hauptschmerz (Z. 1) und setzt als Antwort eine Lokalisierung des Schmerzes

82 Wie bereits erwähnt gibt es auch Zeigeziele am eigenen Körper, die sich außerhalb der Reichweite autotaktiler Gesten befinden. 83 Der Chefarzt (CA) spricht zwar hervorragend Deutsch, ist aber kein Muttersprachler.

7.2 Zeigen am eigenen Körper

405

Beispiel 4: „Hauptschmerz“ (SK27_10_05)

01 02 03 04 05 06 07 08 09 10 11 12

CA: PA:

13 14 15 16 17 18 19 20 21 22 23 24

CA: PA:

CA: PA: CA: PA:

CA: PA: CA: PA: CA:

WO: is der HAUPTschmerz; (1.5) da HINten; (-) also auf_m_m:: (-) ; sie_sie hA bitte? sEh:r sEh:r (-) KLEIN gemalt; ist das wirklich sO: KLEIN? oder Es strahlt AUS; pfhh (-) = =(ma) sonst str[ahlts] SCHON_etwas aus aber:-(-) [ja ] da:_sch - (-) do bei der_ el ja? (.) da [unten,] [das ] KENnen wir nichtwi [ja ] (...) also (...) [wir sind ]_wir sind_uns [also HIER] ja !DA! (-)

am eigenen Körper konditionell relevant. Während der Frage sitzt der Patient mit zusammengefalteten Händen auf dem Stuhl und blickt zum Chefarzt (Abb. 4.1). In der anschließenden Pause löst er seinen linken Arm aus der Ruhelage (Abb. 4.2) und führt ihn nach hinten an seinen Rücken (Abb. 4.3). Dann beginnt er eine Antwort zu formulieren (Z. 3: da HINten;). Zu diesem Zeitpunkt ist sein Arm bereits hinter dem Rücken, der Oberkörper ist zur rechten Seite gebeugt und die Gesamtbewegung mündet in einen vorläufigen Ruhepunkt (Abb. 4.4). Diese Position wird gehalten (Abb. 4.5), während der Patient das akzentuierte Lokaldeiktikon HINten (Z. 3) artikuliert. Simultan dazu vollführt er mit dem nach innen gebogenen Arm kleine kreisende Bewegungen84 am Rücken, die im Detail jedoch weder für den Arzt noch für uns sichtbar sind:

84 In der Videoaufnahme werden die kreisenden Armbewegungen, die im Standbildformat leider nicht repräsentiert werden können, am linken T-Shirtärmel des Patienten erkennbar.

406

7 Spezielle Fälle

Beispiel 4: Erste Teilsequenz „Hauptschmerz“ (Z. 1–4): Abbildung 4.1

01

CA:

WO: is der HAUPTschmerz; Abbildung 4.2

Abbildung 4.3

(1.5)

02 Abbildung 4.4

03 04

da HINten; (-) also auf_m_m:: (-)

Abbildung 4.5

7.2 Zeigen am eigenen Körper

407

Nach einer kurzen Pause setzt der Patient seine Äußerung mit einer durch den Reformulierungsindikator also eingeleiteten, als selbstinitiierte Selbstreparatur nachgeschobenen Präpositionalphrase fort (Z. 4: also auf_m_m:: (-)), die jedoch abgebrochen und dadurch ihrerseits reparaturbedürftig wird. Weitere Reparaturindikatoren (Schegloff et al. 1977; Schegloff 1979, 1984) sind das zweimalige Ansetzen des Lauts [m] (Kontraktion / Rest des Artikels „dem“), dessen Dehnung und Abbruch. Es folgt erneut eine Pause. Grammatisch projiziert die Präpositionalphrase mit dem kontrahierten Überbleibsel des bestimmten Artikels ein maskulines Nomen im Singular, das – so die semantisch-pragmatische Projektion – ein schmerzempfindliches bzw. schmerzanfälliges Körperteil bezeichnet. Als nominale Ergänzung kommt vorzugsweise das Nomen „Rücken“ in Frage, das von der Normalausrichtung des Sprechers aus einen im rückwärtigen Teil des Körpers befindlichen und daher mit dem Lokaldeiktikon HINten kompatiblen Bereich bezeichnet. Doch sicher ist dies keineswegs. Eine eindeutige Referenzherstellung ist allein auf der Grundlage des Verbalen nicht möglich. Im Gegenteil ist der verbale Turnanteil so aufgebaut, dass das Rekurrieren auf eine Zeigegeste zur Verständnisherstellung unabdingbar wird. Dass es sich tatsächlich um den Rückenbereich handelt, klärt erst die dorsale Zeigegeste des Patienten. Bislang fallen mindestens zwei Besonderheiten auf: Erstens bleibt der Blick des Patienten konstant auf den Adressaten gerichtet. Weder geht der Blick auf den Verweisraum, was beim Zeigen hinter dem Rücken unmöglich ist, noch auf die Zeigegeste selbst, was möglich und als Kontextualisierungsmittel denkbar wäre. Der Blick fällt also als Ausdrucksressource in der üblichen Weise weg. Zweitens liegt der Verweisraum (aus Sicht des Zeigenden) bzw. der Suchraum (aus der Sicht des Adressaten) außerhalb des Sichtfeldes der Beteiligten. Für den Zeigenden kann das gar nicht anders sein, Verweisraum und Zeigeziel bleiben für ihn visuell unzugänglich. Für den Adressaten wäre eine andere Variante möglich, doch dazu müssten folgende Veränderungen vorgenommen werden: Der Zeigende müsste sich umdrehen und dem Adressaten den Rücken zuwenden, was aus verschiedenen Gründen offenbar dispräferiert ist. Zum einen würde dies gegen fundamentale Regeln der körperlich-räumlichen Konfigurierung fokussierter Interaktionen verstoßen, die nach Kendon (1990: 209) nach dem sog. F-formation system organisiert sind. Zum anderen müsste dafür der Blickkontakt mit dem Adressaten vollständig aufgegeben werden, was nicht nur sehr markiert ist (vgl. Goffman 1963: 95), sondern weitere Probleme mit sich bringt, die interaktiv zu bewältigen wären. Dazu gehört das wechselseitige Monitoring der Beteiligten und die Sicherstellung des Zeigenden, dass seine Zeigegeste wahrgenommen wurde, also die Wahrnehmungswahrnehmung. Der Patient nutzt die Möglichkeit sich umzudrehen zunächst nicht. Dadurch bleibt der Suchraum auch in der zweiten Teilsequenz verdeckt. Darin produziert

408

7 Spezielle Fälle

der Patient erneut eine Zeigegeste am eigenen Rücken, dieses Mal allerdings mit dem anderen Arm: Beispiel 4: Zweite Teilsequenz „Hauptschmerz“ (Z. 5–17)

05 06 07 08 09 10 11

CA: PA: CA: PA:

sie_sie hA bitte? sEh:r sEh:r (-) KLEIN gemalt; ist das wirklich sO: KLEIN? oder Es strahlt AUS; pfhh (-) =

;

Abbildung 4.6

12 13 14

CA: PA:

=(ma) sonst str[ahlts] SCHON_etwas aus aber:- (-) [ja ] da:_sch Abbildung 4.7

15 16 17

el ja? (.)

Abbildung 4.8

- (-)

7.2 Zeigen am eigenen Körper

409

In der zweiten Teilsequenz findet zunächst eine thematische Refokussierung statt. Der Chefarzt führt als Vergleichsgröße eine vom Patienten zu einem früheren Zeitpunkt angefertigte Zeichnung ein (Z. 5), die schematisch den zuvor thematisierten Schmerzpunkt lokalisiert, und rahmt nach einer kurzen, vom Patienten mit der Verständnisnachfrage bitte? (Z. 6) initiierten Reparatursequenz (Z. 7), seine Frage neu (Z. 8–9: ist das wirklich sO: KLEIN? oder Es strahlt AUS;). Durch diese Neurahmung geht es nun zusätzlich um die wechselseitige Abbildbarkeit verschiedener Verweisräume: des menschlichen Körpers als Suchraum für das erfragte Zeigeziel und der Zeichnung als semiotischem Abbildsystem, die gegenwärtig allerdings nicht vorliegt, sondern durch die Äußerung des Chefarztes lediglich im Vorstellungsraum der Interagierenden aufgerufen wird. Dabei stellt das Adverb wirklich die Brücke dar zwischen den beiden Verweisräumen (dem physischen und dem imaginierten abbildlichen) und markiert die beiden bisherigen Lokalisierungsversuche – die zu einem anderen Zeitpunkt angefertigte Zeichnung und die in der Interaktion unmittelbar vorausgegangene Lokalisierungshandlung, bei der der Patient nicht sichtbar auf eine Stelle am Rücken gezeigt hat – in ihrer Beziehbarkeit aufeinander als reparaturbedürftig: Das nicht sichtbare Zeigeziel der globalen dorsalen Zeigegeste und die Kleinräumigkeit der Zeichnung bilden einen potenziellen Widerspruch, den der Arzt in einer zweischrittigen Alternativfrage ausformuliert. Die erste Teilfrage Z. 8 (ist das wirklich SO: KLEIN?) thematisiert das Problem der wechselseitigen Projizierbarkeit von Zeichnung und Körper, während die zweite Teilfrage (Z. 9: oder Es strahlt AUS;) eine alternative Sichtweise eröffnet. Damit wird die Antwort des Patienten als präzisions- bzw. reparaturbedürftig markiert. Nach den Verzögerungssignalen öh::: pfhh (-) und einer kurzen Pause (Z. 10) wiederholt der Patient mit beschleunigter Sprechgeschwindigkeit seine Aussage (Z. 11: ) und konzediert dann das vom Arzt als Alternative genannte Ausstrahlen des Schmerzes (Z. 12: (ma) sonst strahlts SCHON_etwas aus aber:-). Bis dahin friert er die Körperpositur aus der ersten Teilsequenz ein (Abb. 4.4–4.5), bei der der Arm hinter dem Rücken, der Oberkörper nach rechts vornüber gebeugt und der Blick auf den Adressaten gerichtet ist. Schließlich kommt er im ja-aber-Format (Z. 12 u. 14) und mit der bekräftigenden Diskurspartikel schon ein drittes Mal auf seine Feststellung zurück (Z. 12: aber:-(-) Z. 14: da:_sch ). Simultan zur Artikulation der adversativen Konjunktion aber: (Z. 12) löst er die eingefrorene Körperhaltung auf, begibt sich zurück in eine aufrechte Sitzposition und führt die Hände wieder vor dem Körper zusammen (Abb. 4.6). Im Verbund mit der Pause markiert diese kurzzeitige Ruheposition die Schaltstelle zwischen der ersten und der zweiten Zeigehandlung.

410

7 Spezielle Fälle

Mit der Fortsetzung des Redezugs (Z. 14: da:_sch) löst der Patient beide Hände wieder aus der Ruhelage. Die Arme werden jeweils am Oberkörper entlang zur Seite bewegt. Beim Satzakzent auf HAUPTpunkt erreichen rechte und linke Hand jeweils lateral den Hüftbereich (Abb. 6.7). Die Feststellung (Z. 14: da:_sch ja da_schO_der HAUPTpunkt;) wird anschließend zweifach repariert, indem der Patient zunächst auf die objektive medizinische Terminologie als verbales Präzisierungsmittel zurückgreift (Z. 15/16: do bei der_äh:::- (-) äh el vier fünf) und dann erneut eine deiktische Zeigehandlung am eigenen Körper vornimmt (Z. 18: da unten). Simultan zur verbalen Explizierung mittels der medizinischen Fachterminologie (Z. 16: el vier fünf) bewegt er den rechten Arm weiter nach hinten, während er den linken wieder in die Ruhelage vor den Oberkörper bringt. Beim Lokaladverb da (Z. 17), das zusammen mit dem Lokaladverb unten zur Kontextualisierung einer nonverbalen (Zeige-)Handlung und zur engeren Eingrenzung des Suchraums dient, erreicht die linke Hand den hinteren Lendenwirbelbereich (Abb. 4.8). Die Körperpositur, die der Patient nun einnimmt, verhält sich spiegelbildlich zu der beim ersten Zeigeversuch eingenommenen Körperhaltung. Auch sie wird eingefroren, wobei der Blick des Patienten auf den Chefarzt gerichtet ist. Wieder bleiben Suchraum und Zeigeziel für die Betrachter verdeckt. Es muss also gute Gründe geben, warum der Patient sich weder im ersten noch im zweiten Anlauf umdreht, obwohl er dem Adressaten dadurch Suchraum und Zeigeziel visuell zugänglich machen könnte. Deren Sichtbarkeit ist schließlich eine entscheidende Gelingensbedingung für erfolgreiches Zeigen, in der Hierarchie der interaktionalen Präferenzen hier jedoch offenbar der Aufrechterhaltung der face-to-face-Orientierung nachgeordnet. Erst in der dritten Teilsequenz steht der Patient auf, dreht dem Adressaten den Rücken zu und führt für diesen nun sichtbar die Zeigegeste aus. Die dritte Teilsequenz (vgl. nächste Seite) beginnt mit der Zurückweisung der Patientenäußerung (Z. 14–18) da::_sch ja da schO_der HAUPTpunkt; do bei der_äh:::-(-) äh el vier fünf (.) ja? (.) da [unten,]) durch den Chefarzt (Z. 19). Der Redebeginn des Chefarztes (Z. 19) überlappt mit dem Ende der zweiten Lokalisierungshandlung des Patienten (Z. 18: da unten). Mit einer kollektiven Wir-Aussage (Z. 19: [das] KENnen wir nicht-) weist er den Versuch des Patienten, die Lokalisierungsversuche durch den Rekurs auf das Ärztewissen adressatenspezifisch zuzuschneiden und zu präzisieren, explizit zurück. Im Anschluss an seine Zurückweisung reformuliert der Arzt wiederum im Wir-Format seine anfängliche Lokalisierungsfrage (Z. 20: wir wo:l[len] von ihnen hören WO es wehtut–). Durch die offensichtliche und unleugbare Kontrafaktizität der Behauptung [das] KENnen wir nicht wird die Zurückweisung zusätzlich verschärft. Das Demonstrativum das in der Arztäußerung bezieht sich diskursdeiktisch zurück

7.2 Zeigen am eigenen Körper

411

Beispiel 4: Dritte Teilsequenz „Hauptschmerz“ (Z. 19–24)

19 20 21 22 23

CA: PA: CA: PA:

[das] KENnen wir nichtwi [ja ] (...) also (...) [wir sind ]_wir sind_uns [also HIER] Abbildung 4.9

Abbildung 4.10

Abbildung 4.11

24

CA:

ja !DA! (-)

auf el vier fünf (d. h. Lendenwirbel vier und fünf) in der Patientenäußerung. Gegenstand der Zurückweisung ist jedoch nicht, wie auf der propositionalen Oberfläche formuliert, der Rekurs des Patienten auf ein dem Ärztegremium unzugängliches Wissen, sondern im Gegenteil ein im Regelfall ausschließlich von den Ärzten gewusstes und von ihnen obendrein als exklusiv beanspruch-

412

7 Spezielle Fälle

tes Expertenwissen85. Die Aussage [das] KENnen wir nicht bedeutet hier folglich nichts anderes als: ‚das wollen wir – VON IHNEN – nicht hören‘. Diese Lesart wird durch die kontrastierende Anschlussformulierung ‚wir wollen von ihnen X hören‘ bekräftigt. Überspitzt formuliert sagt der Chefarzt dem Patienten damit: ,das kennen SIE nicht bzw. das können SIE nicht richtig, d. h. in unserem, dem Sinne der Experten, anwenden‘. Überlappend mit der zweiten Turnkonstruktionseinheit des Chefarztes (Z. 20) gibt der Patient ein Rückmeldesignal (Z. 21: ja) und erhebt sich kurz darauf, um in diesem dritten und letzten Anlauf für den Adressaten schließlich sichtbar eine Zeigehandlung am eigenen Rücken auszuführen. Dem Beginn seiner Rede leicht vorauslaufend und überlappend mit den wiederholten, schwer verständlichen Redeabbrüchen des Chefarzts (Z. 22) beginnt der Patient aufzustehen (Abb. 4.9). Der Reformulierungsindikator (Gülich und Kotschi 1987: 220) also, mit dem der Patient seine Turnübernahme signalisiert, ratifiziert die Nachfrage des Arztes und kündigt eine erneute Verdeutlichungshandlung an. Bei der Artikulation des Lokaldeiktikons HIER (Z. 23) hat er sich vollständig erhoben, die linke Hand befindet sich bereits hinter dem Rücken (Abb. 4.10). Auffällig ist, dass der Patient gegenüber seinen früheren deiktischen Lokalisierungsversuchen (da hinten; da unten; do bei der el vier fünf) nun das proximale Lokaldeiktikon HIER verwendet. Zum einen indiziert er dadurch eine räumliche Präzisierung des deiktischen Lokalisierungsversuchs. Zum anderen kündigt er damit die Sichtbarkeit von Suchraum und Zeigeziel für den Adressaten an und projiziert auf diese Weise die emergierende Repositionierung seines Körpers im Interaktionsraum. Die Repositionierung ist insofern markiert, als sie eine vorübergehende Auflösung der F-Formation mit sich bringt. Der Patient vollzieht eine Drehung um 90 Grad, bei der er dem Chefarzt den Rücken zuwendet. In dem Moment, in dem die Hand das Zeigeziel berührt und nachdrücklich markiert, äußert der Chefarzt simultan ja !DA! (Abb. 4.11). Erst die sichtbar ausgeführte Zeigegeste zur Demonstration des Hauptschmerzpunkts wird vom Chefarzt als Antwort auf die von ihm zu Sequenzbeginn gestellte Lokalisierungsfrage (Z. 1: WO: is der HAUPTschmerz;) ratifiziert. Es stellt sich die Frage, warum der Patient sich im dritten Anlauf schließlich doch umdreht. Der Grund dafür liegt in den vom Chefarzt sequenziell aufgebauten interaktionalen Anforderungen: Dadurch, dass er keinen der bisherigen Antwortversuche ratifiziert, sondern sowohl die vorangegangenen Lokalisierungsversuche als auch die verbalen Reparaturen und mit besonderer Vehemenz schließlich die mittels der medizinischen Fachterminologie vorgenommene Objektivierung

85 vgl. zum Konzept der epistemischen Autorität Heritage und Raymond (2005).

7.2 Zeigen am eigenen Körper

413

der Schmerzlokalisation als unzureichend zurückweist, lässt er dem Patienten keine andere Option mehr. Zweierlei ist hier in mehreren Anläufen und mit mehreren Reparaturen von den Beteiligten interaktiv erarbeitet worden: erstens die Lokalisierung des Hauptschmerzes (Beantwortung der eingangs gestellten Lokalisierungsfrage) und zweitens das Ausführungsformat der Zeigehandlung selbst mitsamt ihren lokalen Gelingensbedingungen. Dabei ist festzustellen, dass die spezifischen Bedingungen des Zeigens hinter dem Rücken, bei dem der Zeigende den Blickkontakt aufgeben und sich umdrehen muss, um das Zeigeziel sichtbar zu machen, interaktionale Konsequenzen auch für die Schlussphase des Zeigeakts haben: Die Vergewisserung seitens des Zeigenden, dass der Adressat der Zeigegeste folgen, das Zeigeziel wahrnehmen und den Referenten identifizieren konnte, erfolgt hier nicht in der üblichen Weise durch visuelle Überprüfung mittels eines Kontrollblicks zur Wahrnehmungswahrnehmung. Die Wahrnehmungswahrnehmung, die in der face-to-face-Orientierung durch ein wechselseitiges Monitoring (M. Goodwin 1980a; Schmitt und Deppermann 2007) der Beteiligten stattfindet, kann hier nur auditiv vollzogen werden. Dies geschieht, indem der Chefarzt durch seine explizite verbale Rückmeldung ja !DA! die gelungene Referenzherstellung bestätigt und sein Verstehen bzw. seine Zufriedenheit dokumentiert. Die Analyse hat gezeigt, dass der Chefarzt seine eingangs gestellte Lokalisierungsfrage letztlich als Aufforderung zu einer vom Patienten (sichtbar) am eigenen Körper auszuführenden Zeigehandlung intendiert hat. Dem trägt der Patient insofern Rechnung, als er sowohl im ersten als auch in allen darauf folgenden Lokalisierungsversuchen neben verbalen Ressourcen manuelle Zeigegesten einsetzt. Dies wird vom Gebrauch der Lokaldeiktika auch gefordert, allerdings werden die Zeigegesten für die Adressaten nicht sichtbar hinter dem Rücken ausgeführt. Einzig der Rückgriff auf die medizinische Fachterminologie (el vier fünf) benötigt keine körperlich-visuellen Zeigmittel. Doch gerade dieser verbale Präzisierungsversuch wird vom Chefarzt am vehementesten zurückgewiesen. Während die Ursache dafür, dass die früheren Lokalisierungsversuche des Patienten vom Chefarzt nicht ratifiziert werden, zunächst in der mangelnden Sichtbarkeit des Zeigeziels liegt, offenbart die explizite Zurückweisung der fachterminologischen Lokalisierung institutionell und beteiligungsstrukturell bedingte Gründe für seine anhaltende Kooperationsverweigerung. Diese sind in dem speziellen Setting Schmerzkonferenz zu suchen und können an dieser Stelle nicht ausgeführt werden (vgl. dazu Stukenbrock 2008). Ohne dem Patienten explizite Regieanweisungen zu geben, reformuliert der Chefarzt seine Frage so lange, bis er die Zeigehandlung in der gewünschten Form elizitiert hat. Auffällig ist nun, dass die Ratifizierung der Zeigehandlung erstaunlich schnell erfolgt, nämlich bereits simultan zur autotaktilen Berührung des Zeigeziels durch

414

7 Spezielle Fälle

den Patienten, was eine weitere Interpretation nahelegt: In dieser Form entspricht das ja !DA! des Chefarztes nicht dem interaktiven Rückmeldeformat einer auf eine Frage neu gewonnenen Erkenntnis. Stattdessen handelt es sich um den dritten Teil eines triadischen Sequenzformats, das typisch für Lehr-Lern-Interaktionen ist: Frage – Antwort – Bestätigung der korrekten, vom Fragenden vorab gewussten Antwort. D. h. der Chefarzt weiß schon, was der Patient zeigen soll, und dieser zeigt nach mehreren Anläufen schließlich auch, was er zeigen soll und – was noch wichtiger ist – er tut dies in der erwünschten Weise. Was auf der Oberfläche der Interaktion zwischen Chefarzt und Patient als diagnostische Fragesequenz erscheint, stellt sich in der Interaktion zwischen dem Chefarzt und seinen Ärztekollegen als didaktische Elizitierungssequenz mit demonstrativem Charakter dar. Darin dient das Zeigen nicht allein der Verständnisherstellung und dem Informationsgewinn bezüglich der Schmerzlokalisierung, sondern dem Chefarzt geht es auch um die Performanz des Zeigens selbst. Indem er das Zeigen des Patienten auf der Bühne der Schmerzkonferenz als diagnostisch relevanten Akt inszeniert, führt er seinen Kollegen die Relevanz eines körperbezogenen, die multimodalen Ausdrucksressourcen des Patienten stärker einbeziehenden Verfahrens in der Arzt-Patient-Kommunikation vor Augen. Das Zeigen des Patienten, bei dem dieser sowohl Subjekt als auch Objekt der eigenen, der Schmerzlokalisierung dienenden Zeigehandlung ist, ist eingebettet in das Demonstrieren des Chefarztes, bei dem dieser Subjekt und der Patient bzw. dessen Körper Objekt der didaktischen Demonstrationen des Arztes ist. In der Interaktion zwischen dem Chefarzt und dem Patienten erklärt sich die reparaturaufwendige Komplexität der Zeigesequenz aus den speziellen Gelingensbedingungen des Zeigens am eigenen Rücken. In die didaktischen Ausführungen des Chefarztes eingebettet erweist sie sich als ein von ihm inszeniertes Elizitierungsverfahren, das den Patienten zu einer möglichst unverstellten Antwort anleiten und dem Ärztegremium sowohl die Lokalisierungshandlung als auch das kommunikative Verfahren und nicht zuletzt die Kompetenz des Chefarztes vorführen soll.

Zusammenfassung Die exemplarische Analyse der Besonderheiten, die beim Zeigen am eigenen Körper auftreten, hat folgende Ergebnisse erbracht: Unter der Voraussetzung, dass die entsprechende Körperregion, die das Zeigeziel darstellt, der visuellen Wahrnehmung zugänglich und nicht durch ein sozio-kulturelles Tabu belegt ist, folgt das Zeigen am eigenen Körper dem multimodalen Ablaufformat, das standardmäßig beim Zeigen auf Räume und Objekte festzustellen ist. Insofern unterscheidet sich das Zeigen am eigenen Körper in einem entscheidenden Aspekt

7.2 Zeigen am eigenen Körper

415

vom Zeigen auf das Selbst bei der Personendeixis: Während Zeigende beim personendeiktischen Zeigen auf das Selbst kontinuierlich zum Adressaten blicken, richten Zeigende, die am eigenen Körper zeigen, ihren Blick zunächst auf den Verweisraum und das Zeigeziel, bevor sie zum Adressaten blicken. Demgegenüber weicht das Blickmuster beim personendeiktischen Zeigen auf das Selbst in charakteristischer Weise vom multimodalen Standardformat ab, das durch Blickalternation zwischen Verweisraum und Zeigeziel einerseits und Adressaten andererseits gekennzeichnet ist. Die standardmäßige Blickalternation zwischen Zeigeziel und Adressaten funktioniert beim Zeigen am eigenen Körper allerdings nur, solange der Zeigende den eigenen Körper zum Betrachtungsobjekt machen kann, was aber nicht immer möglich ist. So gibt es Fälle, in denen sich die entsprechende Körperregion außerhalb des visuellen Wahrnehmungsraums des Zeigenden und/oder des Adressaten befindet. Beim Zeigen am eigenen Körper kann das Problem visueller Unzugänglichkeit des zu zeigenden Körperteils nicht wie beim Zeigen auf Räume oder Objekte durch eine – gemeinsame – räumliche Positionsveränderung in Relation zum Zeigobjekt gelöst werden, sondern es verlangt die Bewältigung potenziell konfligierender Interaktionsanforderungen, die sich wie folgt darstellen: Zeigehandlungen dienen dazu, einem Adressaten den Fundort des intendierten Zeigeziels anzuzeigen. Dabei ist die Körperausrichtung des Zeigenden auf das Zeigeziel ebenso wichtig wie seine Adressatenorientierung. Beim Zeigen am eigenen Körper können diese beiden Interaktionsanforderungen in Konflikt miteinander geraten, da der Körper des Zeigenden den Verweis- bzw. Suchraum und das Zeigeziel seiner eigenen Zeigegesten darstellt und nun sowohl als Zeigesubjekt als auch als Zeigobjekt fungiert. Liegt das Zeigeziel beispielsweise am Rücken des Zeigenden, so befindet es sich nicht nur außerhalb des gemeinsamen o-space (Kendon 1990: 211) der Beteiligten, sondern auch außerhalb eines überhaupt als gemeinsam herstellbaren visuellen Wahrnehmungsraums. Dadurch fällt zum einen der Blick des Zeigenden als Mittel der Verweisraumherstellung und als Kontextualisierungsmittel für die Zeigegeste weg. Zum anderen sieht sich der Zeigende mit zwei konfligierenden Interaktionsanforderungen konfrontiert: die Aufrechterhaltung von Blickkontakt und face-to-face-Orientierung gegenüber dem Adressaten um den Preis eines verdeckt bleibenden Zeigeziels versus der Sichtbarmachung des Zeigeziels durch Neuausrichtung seines Körpers im Raum um den Preis einer vorübergehenden Auflösung von Blickkontakt und face-to-face-Orientierung. In solchen Fällen können Reparaturen erforderlich werden, in denen die jeweiligen Präferenzen interaktiv ausgehandelt werden müssen. So können Situationen mit hohen Präzisionsanforderungen wie in der Arzt-Patient-Interaktion eine Neupositionierung des Körpers des Zeigenden erfordern, während in Situationen, in denen das Zeigeziel am eigenen Körper nicht exakt lokalisiert werden muss, eine

416

7 Spezielle Fälle

unzureichende visuelle Zugänglichkeit der entsprechenden Körperregion kein Verständnisproblem darstellt. Darüber hinaus ist festzuhalten, dass perzeptorische Unzugänglichkeit modalitätsspezifisch ist. Da beim Zeigen am eigenen Körper die Möglichkeit besteht, dass die propriozeptive Wahrnehmung die Koordination zwischen zeigendem und gezeigtem Körperteil steuert, können alternative Realisierungsformate in Kraft treten, in denen andere Modalitäten (haptische und auditive Wahrnehmung) entsprechende Funktionen übernehmen. Wie andere Zeigehandlungen auch ist das Zeigen am eigenen Körper ein gleichermaßen situationsabhängiger wie situationskonstituierender Akt, dessen Gelingensbedingungen je nach Kontext variieren. Während das Zeigen am eigenen Rücken in der Alltagsinteraktion auf eine präzise Lokalisierung des Zeigeziels und damit auf eine Modifikation der Körperposition des Zeigenden verzichten kann, erfordern medizinische (diagnostische ebenso wie therapeutische) Kontexte eine weitaus größere Präzision und damit unter Umständen ein in der Alltagsinteraktion dispräferiertes Format: die Suspension der preference for minimization (Sacks/Schegloff 1979) bei der Referenzherstellung sowie die Suspension der Präferenz für die Aufrechterhaltung von Blickkontakt und F-Formation (Goffman 1963; Kendon 1990).

7.3 Modaldeixis Formal wird die Modaldeixis im Deutschen durch den Ausdruck so repräsentiert. Obwohl dieser Ausdruck eine hochfrequente Form im gesprochenen Deutschen ist, scheint er sich allen Versuchen einer grammatisch stichhaltigen Klassifikation zu widersetzen. Die vielen Klassifikationsversuche bemühen sich entweder, auf möglichst abstrakter Ebene den letzten Rest semantischer und/oder funktionaler Gemeinsamkeit zwischen den verschiedenen Varianten herauszudestillieren, um am Konstrukt einer grammatischen Einheit festhalten zu können (Sandig 1987; Weinrich 1993), oder sie streben umgekehrt danach, ihr linguistisches Objektiv mit einem höheren Auflösungsgrad auf die empirische Wirklichkeit zu richten und ihre Datenbefunde in eine stärker differenzierende Theoriediskussion rückzuführen (Auer 2006; Barske und Golato 2010; Hennig 2006; Streeck 2002). In einschlägigen Grammatiken, Wörterbüchern und Einzeluntersuchungen wird verschiedentlich auf eine deiktische Verwendungsweise des Sprachzeichens so hingewiesen. Im Metzler-Lexikon Sprache, das systematisch die drei klassischen Dimensionen der Personal-, Lokal- und Temporaldeixis aufführt, heißt es, „[s]peziellere Deixeis beziehen sich z. B. auf Eigenschaften (dt. so)“. Zifonun (1997: 2335) betrachtet das Sprachzeichen so in Vergleichssätzen (Beispiel: Sie singt so gut, wie sie immer gesungen hat) als deiktisch verweisenden Bestandteil

7.3 Modaldeixis

417

einer Gradphrase. Den weiten Deixisbegriff, der dieser Kategorisierung zugrunde liegt, teile ich nicht und unterscheide mit Lyons (1977) u. a. zwischen Deixis und Phorik. Ebenso ist die von Thurmair aufgestellte Behauptung, dass sich für „alle Verwendungen von so [...] feststellen [lässt], daß sie deiktisch sind“ (Thurmair 2001: 27) nicht aufrecht zu erhalten. Dasselbe gilt für ihre Analyse des von einer Geste begleiteten so in ad-adjektivischem Gebrauch, dem sie dieselbe Funktion zuschreibt wie dem so in expliziten Vergleichen mit der wie-Gruppe (Thurmair 2001: 30). Betrachtet man allein die prosodischen Verhältnisse, werden die Unterschiede (unakzentuiert in der wie-Gruppe versus akzentuiert in deiktisch-gestischer Verwendung) deutlich. Ein weiteres Argument gegen eine solche Subsumption liefert die on-line-Syntax (Auer 2000): Während das deiktisch-gestisch verwendete so keine auf das Adjektiv folgenden sprachlichen Elemente projiziert, liegt aus der Perspektive einer inkrementellen Syntax die entscheidende Beziehung zwischen dem so und der wie-Gruppe in der Vergleichskonstruktion darin, dass das so strukturaufbauend und die wie-Gruppe strukturabarbeitend operiert (vgl. zu den Begriffen Auer 2006: 293). Aus deixistheoretischer Perspektive ist schließlich festzuhalten, dass ein kategorialer Unterschied zwischen textuellen Verweisbeziehungen, die im Fall von so + Adjektiv + wie-Gruppe treffender als syntaktische Projektionsbeziehungen aufzufassen sind, und Verweisen auf den außersprachlichen Kontext besteht. In den zuletzt genannten Fällen fungiert der Ausdruck so als „Zeigzeichen“ (Bühler 1965 [1934]) auf das situativ emergierende Interaktionsgeschehen und inkorporiert eine visuell wahrzunehmende gestische Handlung in die grammatische Struktur der Rede (Streeck 2002: 582; Stukenbrock 2010). Die deiktische Funktion von so im multimodalen Zusammenspiel mit Blick und Gestik wird auch von Fricke (2007) gesehen. Sie schließt zwar die Modaldeixis aus den Dimensionen der Deixis aus, hält jedoch an der Klassifikation des Ausdrucks so als Deiktikon fest, mit der Besonderheit, dass sie es zur Lokaldeixis rechnet (Fricke 2007: 78). Ihre Argumentation gründet sich erstens auf eine Ähnlichkeit zwischen dem Gebrauch von so/solch und dem Gebrauch des Demonstrativpronomens dieser. Ihr zweites Argument lautet, dass bestimmte Typen des so-Gebrauchs eine Zeigegeste erfordern, dass Zeigegesten sonst aber nur in der Lokaldeixis vorkämen. Eine Ausdifferenzierung erfolgt jedoch nicht, so dass beispielsweise ad-nominale, ad-adjektivische, ad-adverbiale und ad-verbale Verwendungsweisen ebenso wenig unterschieden werden wie die Formvarianten so und solch, die unzutreffenderweise als Einheit konzeptualisiert werden. Dabei geht der grundsätzliche Funktionsunterschied zwischen dem Gebrauch von so als Deiktikon gegenüber so als Indexikalitätsmarker (Auer 1981b) verloren. Weinrich fasst die Merkmale des Sprachzeichens so unter dem Begriff der „Bedeutungsrahmung“ zusammen, das innerhalb der Kategorie der „Status-Adverbien“ die Subkategorie „Rahmen-Adverb“ bildet und „die Bedeutung eines

418

7 Spezielle Fälle

Verbs, Adjektivs oder Adverbs ein[rahmt]“ (Weinrich 1993: 582 f.). Die unter diese Kategorie subsumierten Fälle erweisen sich in der empirischen Untersuchung als wesentlich heterogener, so dass Differenzierungen erforderlich sind. Deixistheoretisch sind lediglich die von Weinrich aufgeführten Fälle mit Situationsbezug relevant, deren Gemeinsamkeit darin besteht, dass sich der Ausdruck so auf etwas außerhalb der Sprache Wahrnehmbares bezieht und dem Adressaten anzeigt, im situativen Kontext nach Verständnishilfen zu suchen. Dabei ist zwischen Fällen zu unterscheiden, die eine genaue visuelle Wahrnehmung der körperlich-gestischen Aktivitäten des Sprechers erfordern, und Fällen, in denen ein präzises Monitoring der körperlich-visuellen Aktivitäten des Sprechers nicht notwendig ist. Im Folgenden werden ausschließlich Fälle diskutiert, in denen der deiktische Gebrauch von so mit redebegleitenden Gesten und/oder körperlichen Handlungen korreliert, die zum Verständnis des Modaldeiktikons unabdingbar sind. Das Hauptaugenmerk gilt jenen Verwendungsformen, in denen der Ausdruck so eine vom Adressaten wahrzunehmende körperliche Aktivität kontextualisiert, die von einer einfachen Arm-/Handgeste bis zu einer gesamtkörperlichen Demonstration reichen kann. Es handelt sich also um genuin deiktische Fälle, in denen so als „Zeigwort“ im „Zeigfeld“ der Sprache fungiert und für seine „Bedeutungserfüllung [...] an sinnliche Zeighilfen gebunden“ ist (Bühler 1965 [1934]: 80). Eine gestische bzw. körperlich-visuelle Komponente ist zum Verständnis dieser Gruppe von so-Ausdrücken ebenso obligatorisch wie bei deiktisch-gestischen Verwendungsweisen des Demonstrativpronomens dieser, des Lokaldeiktikons hier etc. (vgl. auch Ehlich 2007 [1987]: 152 f.). Andere Autoren sprechen in diesem Zusammenhang von „Zeiggestennotwendigkeit“ (Harweg 1990) oder „Zeigegestenpflicht“ (Sennholz 1985). In der Terminologie Fillmores (1997), der innerhalb der Kategorie deiktischer Ausdrücke den nicht-deiktischen vom deiktischen Gebrauch und innerhalb des deiktischen Gebrauchs den symbolischen vom gestischen Gebrauch unterscheidet, gehören sie zu den gestisch gebrauchten deiktischen Ausdrücken. Von den 30 untersuchten Fällen sind alle Instanzen des deiktisch-gestischen so-Gebrauchs prosodisch durch einen Fokusakzent gekennzeichnet.86 Sie kon

86 Zwischenfälle, in denen das Modaladverb lediglich einen Nebenakzent trägt oder durch Längung prosodisch hervorgehoben ist, werden nicht behandelt. Sie sind nicht nur aufgrund ihrer andersartigen prosodischen Struktur problematisch, sondern stellen korrelierend mit der weniger starken prosodischen Markierung auch aus gestischer Sicht Zweifelsfälle dar, die eine gesonderte Untersuchung verlangen. So werden zwar in den meisten Fällen redebegleitende Gesten produziert, diese besitzen jedoch nicht denselben Status wie die durch das prosodisch akzentuierte, deiktisch-gestische so kontextualisierten Gesten.

7.3 Modaldeixis

419

stituieren eine scharf umrissene Gruppe, die sich dadurch auszeichnet, dass ihr Verständnis untrennbar mit dem situativ emergierenden, visuell wahrzunehmenden und durch das so relevant gesetzten Interaktionskontext verbunden ist. Voraussetzung dafür ist, dass die Teilnehmer einen wechselseitigen audio-visuellen Zugang zueinander und zum Wahrnehmungsraum haben.

7.3.1 so sieht/sehen X aus + Geste Als semantisch-pragmatische Paradefälle können diejenigen Instanzen betrachtet werden, in denen mittels des Wahrnehmungsverbs sehen explizit ausformuliert wird, dass ein durch X Bezeichnetes in seiner Ganzheit gezeigt und visuell wahrgenommen werden soll. Die Funktion des Ausdrucks so besteht in dieser Konstruktion darin, den Wahrnehmungsakt des Adressaten temporal an den Äußerungsakt des Sprechers zu binden und ihn mit der Anweisung an den Adressaten zu versehen, das Objekt in seinem Sosein, seiner Phänomenologie wahrzunehmen. Ich möchte sie als visuelle Evidenz-Konstruktion bezeichnen und als multimodale Gesamtgestalt (package; vgl. Goodwin 2003a; Heath 1986) konzeptualisieren, die nur durch den Einbezug körperlich-visueller Ausducksressourcen adäquat beschrieben werden kann. Zwei Beispielanalysen, von denen die erste den default-Fall und die zweite eine humorvolle Variante darstellt, sollen dies verdeutlichen. Im ersten Beispiel aus dem Datenset „Kerners Köche“ stellt das zu betrach tende X eine spezielle Zutat – die sog. Tonkabohne – dar, die nicht nur selten und daher verhältnismäßig unbekannt, sondern aufgrund ihrer suchtgefährdenden Inhaltsstoffe in Deutschland in eingeschränkter Form verboten ist. Die Köchin (K5) hat jedoch einige Tonkabohnen als Anschauungsobjekt von einem Freund aus Portugal mitgebracht. Unterschiedliche Sinneswahrnehmungen konstituieren den Erfahrungseindruck einer Speisezutat, der den Fernsehzuschauern allerdings nur medial vermittelt werden kann. Zum Erfassen der Eigenschaften der Tonkabohne gehört in einer Kochsendung nicht nur die visuelle, sondern auch die olfaktorische und insbesondere die gustatorische Wahrnehmung durch die unmittelbar am Geschehen Beteiligten. Da die Geschmacksprobe aufgrund der in Deutschland herrschenden Einschränkungen in diesem Fall ausgeschlossen ist, bleiben lediglich der visuelle Eindruck und die Geruchsprobe, die von der Köchin (K5) durch die Wahrnehmungsverben ausschauen und riechen bezeichnet und mit der Aufforderung verbunden werden, die entsprechenden Perzeptionshandlungen durchzuführen. Während die zweite dieser Aufforderungen im expeditiven Feld bzw. Lenkfeld der Sprache (Zifonun et al. 1997, Bd. 1: 321) operiert, da sie im Impera-

420

7 Spezielle Fälle

Beispiel 1: „Tonkabohnen“ (KK1_1_00:11:44)

1

K5:

ein (.) lieber FREUND, Abbildung 1.1

3

an PORtugal,= =an JENS, Abbildung 1.2

Abbildung 1.3

4

hat mir die MITgegeben,

5 6

SO schaun die tonkabohnen aus; RIECH_a_ma:l,

tiv formuliert und persönlich an den Moderator adressiert wird (Z. 6: RIECH_a_ ma:l,), wird der Aufforderungscharakter der vorausgehenden Äußerung (Z. 5: SO schaun die tonkabohnen aus;) durch ihr deiktisch-gestisches Format bedingt. Sie richtet sich nicht allein an den unmittelbaren Interaktionspartner, sondern auch an die Studio- und Fernsehzuschauer. Die folgende Analyse beschränkt sich auf die verbalen und nonverbalen Aktivitäten zur Herstellung der visuellen Wahrnehmungshandlung, die mit dem Modaldeiktikon so korrelieren.

7.3 Modaldeixis

421

Zunächst erwähnt die Köchin (K5) den Spender der Tonkabohnen (Z. 1: ein (.) lieber FREUND,) und winkt, während sie als syntaktischen Einschub einen Gruß formuliert (Z. 2/3: grÜße an PORtugal=,=an JENS,), mit der linken Hand in die Kamera (Abb. 1.1). Parallel dazu greift sie mit der rechten Hand nach den Tonkabohnen auf dem Kochtisch. Dabei lehnt sie sich mit dem Oberkörper nach vorne und wendet dem Moderator Kerner den Rücken zu. Anschließend formuliert sie den in Z. 1 mit einer Nominalphrase begonnenen und durch den Einschub unterbrochenen Satz weiter (Z. 4: hat mir die MITgegeben,). Dabei nimmt sie ihre ursprüngliche Position am Kochtisch wieder ein und richtet sich mit dem Oberkörper erneut auf Kerner aus. Die Wiederherstellung der face-to-face-Orientierung in Form eines L-arrangement (Kendon 1990: 213) zwischen ihr und Kerner bildet die Voraussetzung für die Fortsetzung der durch den Fernsehgruß unterbrochenen fokussierten Interaktion. Simultan zur Artikulation der Anapher die in der Verbalphrase (Z. 4: hat mir die MITgegeben,) richtet die Köchin ihren Blick ostentativ auf ihre Hände (Abb. 1.2), die nun jeweils eine Tonkabohne halten. Mit dem artikulatorischen Onset des Modaldeiktikons SO (Z. 5) hebt sie parallel ihre rechte und linke Hand mit den vertikal nach oben gehaltenen Tonkabohnen auf Brusthöhe an (Abb. 1.3) und führt auf diese Weise eine Präsentativgeste aus, die das Zeigobjekt Tonkabohne in den Aufmerksamkeitsfokus ihres Interaktionspartners und der Zuschauer rückt. Wie an der Kopf- und Blickorientierung der Interaktanten zu erkennen ist, ist der visuelle Aufmerksamkeitsfokus der Zeigenden und ihres Adressaten auf den verbal und gestisch hergestellten gemeinsamen Wahrnehmungsraum und die darin befindlichen Demonstrationsobjekte gerichtet. Das deiktische Adverb so trägt in dieser Intonationsphrase den Fokusakzent. Es handelt sich um einen klaren Fall dessen, was in der Typologie Fillmores (1997: 62) als gestischer Gebrauch (gestural use) deiktischer Ausdrücke gilt. Durch den Gebrauch des Ausdrucks so erteilt die Sprecherin dem Adressaten die Anweisung, das simultan stattfindende körperliche Geschehen visuell wahrzunehmen und daraus relevante Einsichten über das betreffende Objekt zu gewinnen. Dabei liegt die Besonderheit des Auftretens von so in der Konstruktion so sieht/sehen X aus + Geste darin, dass die Notwendigkeit der Herstellung eines objektbezogenen perzeptorischen Fokus durch das visuelle Wahrnehmungsverb explizit ausformuliert wird. Das nächste Beispiel bildet eine humorvolle Variante der Präsentation eines Anschauungsobjekts im multimodalen Format so sieht/sehen X aus. Darin wird ironisch mit dem Aspekt der Betrachtungswürdigkeit eines unbekannten/seltenen Anschauungsobjekts als typischem Vertreter seiner Kategorie gespielt. Denn bei dem betrachteten Gegenstand handelt es sich um den nur allzu bekannten Alltagsgegenstand Zigarette. Die Sequenz stammt aus der ersten „Big Brother“-Staffel. Zlatko bekommt zum Trost für die soeben erzählte Geschichte über seine Schulprobleme eine Zigarette geschenkt:

422

7 Spezielle Fälle

Beispiel 2: „Zigaretten“ (bb01_00:01:49)

01 02 03 04

Adr:

zladdi NICHT traurig sein-

Ker: Zlt:

[zladdi ((atmet))

]

Abbildung 2.1 Jhn

Abbildung 2.2

Adr Zlt

05 06 07 08

Ker: Zlt: Ker: Adr:

((lacht)) was ist DAS? [ (( lacht)) ] [ ((lacht)) ja ] geNAU; Abbildung 2.3 Jrg

09 10

Jrg:

; haste schOn verGESsen;

Das Transkript setzt damit ein, dass Andrea Trostworte an Zlatko richtet und ihm mit der Fokussierungsaufforderung gUck_ma für DICH (Z. 2) eine Zigarette reicht. Zlatko nimmt die Zigarette entgegen, atmet hörbar ein und aus (Z. 4) und hält seinen Blick auch nach der Übergabe weiterhin auf die Zigarette gerichtet, während eine weitere Bewohnerin (Ker), die in der Kameraeinstellung nicht zu

7.3 Modaldeixis

423

sehen ist, lacht (Z. 5). Die Zigarette hält er dabei auf Brusthöhe vor seinem Oberkörper (Abb. 2.1). Zu diesem Zeitpunkt dient Zlatkos Blick nicht mehr der interpersonellen Koordinierung (Deppermann und Schmitt 2007) bei der Zigarettenübergabe. Indem er weiterhin starr auf die Zigarette blickt, erfährt sein Blick in dieser die Transaktion überdauernden Gerichtetheit eine Funktionsneuzuweisung. Durch seinen Blick hält Zlatko den visuellen Aufmerksamkeitsfokus auf die Zigarette in seiner Hand aufrecht. Dadurch, dass dies sichtbar für die anderen geschieht, fungiert der Blick als interaktive Ressource und konstituiert einen gemeinsamen Wahrnehmungsraum für weitere Handlungen. Er operiert als nonverbales Zeigzeichen (Bühler 1965 [1934]) auf einen Wahrnehmungsraum, der für weitere Handlungen interaktiv relevant gesetzt wird. Die von Zlatko durch den Blick aufgebaute Projektion wird verbal durch seine Frage was ist DAS? (Z. 6) eingelöst. Der gestische Hinweis zum Auffinden des Zeigeziels und zur Herstellung der Referenz für das deiktische Demonstrativum DAS erfolgt durch die eingefrorene Blickorientierung als Zeiginstrument auf Suchraum und Zeigeziel (Abb. 1.2). Auf Zlatkos gespieltes Erstaunen über den vermeintlich fremden, kategorial nicht einzuordnenden Gegenstand in seiner Hand reagiert Jürgen, indem er als zweiten Paarteil auf Zlatkos Frage eine Antwort im multimodalen Format SO sieht/sehen X aus + Geste produziert. Seine Geste wird als Präsentativgeste in oHHo-Form (vgl. Kapitel 5.4.1) realisiert und von einem Blick auf das Zeigobjekt in Zlatkos Hand begleitet (Abb. 1.3). Die Tatsache, dass Jürgen nicht das syntaktische Format der Frage (was ist das) aufgreift und mit der Präsentativkonstruktion das ist X antwortet, sondern stattdessen auf die visuelle Evidenz-Konstruktion (so sehen X aus) rekurriert, ist Ausdruck dessen, dass er Zlatkos Frage nicht als ernst gemeinte Benennungsfrage, sondern als Kontextualisierungshinweis auf ein ironisch-scherzhaftes Spiel mit der (Un)Bekanntheit des Gegenstands verstanden hat. Das Spiel gründet in der gemeinsamen Erfahrung der Bewohner, dass Zigaretten im „Big Brother“-Haus ein knappes Gut sind, das man so selten zu Gesicht bekommt, dass der Wiedererkennungseffekt erlischt und die kategoriale Wahrnehmung eines entsprechenden Exemplars nicht mehr möglich scheint. Linguistisch betrachtet funktioniert die spielerische Inszenierung der Wahrnehmungswürdigkeit einer Zigarette als typischer Vertreterin ihrer Kategorie aufgrund des gemeinsamen sprachlichen Wissens der Beteiligten um den Standardfall (vgl. dazu die Analyse von Beispiel 1). So stellt das Sprachspiel zwischen Jürgen und Zlatko eine ironische Pervertierung des Standardfalls dar, der als Folie für die Ironisierung dient und dadurch als emisch relevante, mental verankerte und jederzeit abrufbare multimodale Einheit im kommunikativen Haushalt der Sprecher ausgewiesen wird.

424

7 Spezielle Fälle

Es träfe die Sache nicht, diese Konstruktion gleichzusetzen mit einem ähnlichen Fall, in dem das Demonstrativum das in der Konstruktion das ist /das sind X + Präsentativgeste gebraucht wird, und beide unter die Kategorie einer hybriden Lokaldeixis (Fricke 2007) zu subsumieren. Denn anders als Demonstrativa und Lokaldeiktika fügt es der Aufforderung, der körperlichen Aktivität des Sprechenden visuell zu folgen und im unmittelbaren Handlungskontext die verbal nicht vermittelten Informationen zu finden, eine qualitative Komponente hinzu. Der entscheidende Unterschied besteht darin, dass im Fall von so sieht / sehen X aus die Prototypikalität des gezeigten X fokussiert wird. Dies ist mit der interaktiven Projektion zweier ganz spezieller Anweisungen an den Adressaten verbunden. Diese lauten, dass der präsentierte Gegenstand erstens perzeptorisch als beispielhaftes Anschauungsobjekt wahrgenommen werden soll, von dem zweitens eine kognitive Repräsentation als exemplarische Realisierungsinstanz gebildet werden soll. Im Gegensatz dazu kann es sich im Fall der multimodalen Konstruktion das ist/sind X + Geste bei dem präsentierten Objekt auch um ein untypisches, nicht sofort identifizierbares oder deformiertes Exemplar seiner Gattung handeln, was im Fall von so sieht/sehen X aus + Geste gerade ausgeschlossen ist. Dieses Ausschlusskriterium ist ein weiterer Kontextualisierungshinweis für den Adressaten, wie er die Zeigehandlung zu verstehen hat: nämlich als eine, die ihm etwas vorführt, das er als prototypisch in seinem Wissensbestand abspeichern kann. Zusammengefasst fungiert die multimodal zu konzeptualisierende visuelle Evidenz-Konstruktion als Anweisung an den Adressaten, seine visuelle Aufmerksamkeit auf das Zeigeziel, das präsentierte Objekt zu richten und es in seiner Phänomenologie, im Hinblick auf kategorienbildende, saliente Merkmale wahrzunehmen und als prototypischen Vertreter der entsprechenden Kategorie mental abzuspeichern. Anders gestaltet sich der semantisch-pragmatische Zusammenhang in Fällen, in denen nicht einzelne Objekte in ihrer phänomenologischen Ganzheit wahrgenommen, sondern entweder bestimmte Eigenschaften von Objekten oder prozessuale Abläufe, Verfahren- oder Handlungsweisen fokussiert werden. Diese Fälle werden in den folgenden drei Abschnitten behandelt.

7.3.2 so X (X = Adjektiv) + Geste Eine weitere gestische Verwendungsweise des Modaldeiktikons so tritt in adverbialer Voranstellung zu einem (meist prädikativ gebrauchten) Adjektiv auf. In diesen Fällen wird durch das Adjektiv an einem Gegenstand X eine äußerlich sichtbare Eigenschaft (Größe, Länge, Höhe, Breite etc.) fokussiert, deren spezifischer Grad bzw. deren Dimensionalität erst durch die Geste angezeigt wird. Semantisch betrachtet handelt es sich um Ausdrücke aus der Klasse der relativen

7.3 Modaldeixis

425

Adjektive (Eisenberg 2006: 240 ff.), die ihre aktuelle Bedeutung in Abhängigkeit von ihrem jeweiligen Bezugsgegenstand und damit aus dem Kontext erhalten. Bei der Verwendung eines relativen Adjektivs zusammen mit dem deiktisch-gestisch gebrauchten Adverb so findet eine Arbeitsteilung zwischen verbalen und visuellen Ausdrucksressourcen statt: Die semantisch als relativ zu geltende Eigenschaft wird verbal bezeichnet, während die Dimensionalität bzw. der spezifische Grad, in dem die Eigenschaft auf das Bezugsobjekt zutrifft und es dadurch als durchschnittlich oder abweichend charakterisiert, visuell durch die Geste ausgedrückt wird. Das Modaldeiktikon übt dabei eine „flag function“ (Streeck 2002: 582) aus, indem es als verbaler Kontextualisierungshinweis auf die simultan stattfindende gestische Aktivität des Sprechers verweist. Anders als bei den oben diskutierten Beispielen 1 und 2, in denen ein Objekt in seiner Ganzheit vorgeführt und die Konstruktion so sieht/sehen X aus in der Regel von einer Präsentativgeste begleitet wird, gehören die Gesten im vorliegenden Fall zur Klasse der ikonischen Gesten (Kendon 2004: 100; McNeill 1992: 12; McNeill 2005: 39). In der folgenden Sequenz aus dem Kochkorpus vergleicht der moderierende Fernsehkoch (HL) den Zuschnitt des Thunfischsteaks, das einer der Kandidaten (K4) in der laufenden Sendung zubereitet, mit den Dimensionen des Koteletts, das dieser tags zuvor gekocht hat, und vollführt in Verbindung mit dem Modaldeiktikon so eine ikonische Geste: Beispiel 3: „so dick“ (KS)

01 02 03 04 05 06

HL:

und ich muss SAgen, (0.3) GEStern, (0.5) dein KOTelett rolf; (0.4) Abbildung 3.1

07 08

K4:

war schon_n KNALler; ja;

426

7 Spezielle Fälle

Beispiel 3 (Fortsetzung) Abbildung 3.2

09

HL:

dat war ja SO dick; Abbildung 3.4

10 11 12 13 14 15

K4: P: HL: P: K4:

Abbildung 3.3

Abbildung 3.5

((lacht)) a:ber dat THUNfischsteak; ((lacht)) ((lacht)) das kann man noch TOPpen;

Der Fernsehkoch (HL) befindet sich am Kochtisch von Kandidat 4 (K4) und hat das Thunfischsteak, das dieser zubereitet, in die rechte Hand genommen. Doch zunächst thematisiert er nicht das aktuelle Kochgeschehen, sondern ruft mit einer Bewertung das Gericht in Erinnerung, dass der Kandidat am Vortag gekocht hat: GEStern, (0.5) dein KOTelett rolf; (0.4.) war schon_n KNALLer; (Z. 2–4). Dabei blickt er seinen Adressaten an (Abb. 3.1). Dieser reagiert auf die Bewertung mit einem Rückmeldesignal (Z. 5: ja;). In welcher Hinsicht das Kotelett bemerkenswert war, erhellt insbesondere für diejenigen Zuschauer, denen das Wissen über die vorangegangene Kochsendung nicht zur Verfügung steht, erst aus der nächsten Turnkonstruktionseinheit. Sie

7.3 Modaldeixis

427

spezifiziert die Zuschreibung KNALler (Z. 4) im Hinblick auf den Durchmesser des Kotelettstücks: dat war ja SO dick; (Z. 6), die ohne eine begleitende ikonische Geste vage bleiben würde. Bereits beim Onset der Anapher dat löst der Sprecher den Blickkontakt mit seinem Adressaten auf und beginnt Kopf und Blick in Richtung der eigenen Hände zu orientieren (Abb. 3.2). Dadurch veranlasst er den Adressaten, seiner Blickorientierung zu folgen und ebenfalls in Richtung des durch den Blick hergestellten Wahrnehmungsraums zu schauen. Als nächstes löst der Sprecher seine linke Hand vom Thunfischsteak und bewegt sie aufwärts. Zugleich beginnt er, die nachfolgende ikonische Geste zu formen, bei der Daumen und Zeigefinger von der restlichen, zur Faust geschlossenen Hand abgespreizt werden. Diese Form wird bereits erkennbar im Verlauf der Artikulation der Partikel ja (Abb. 3.3). Der Blick beider Interaktanten ist dabei auf die Hand des Sprechers gerichtet. Simultan zur Produktion des akzentuierten Modaldeiktikons SO erreicht die Geste ihren Gipfelpunkt. Damit kommt die vertikale Aufwärtsbewegung des Arms zum Abschluss; zugleich wird die ikonische Fingerformation zur Repräsentation des Kotelettdurchmessers in die exakte Position gebracht (Abb. 3.4). Noch vor Beendigung der Turnkonstruktionseinheit durch das Adjektiv dick löst sich der Blick des Zeigenden wieder vom Zeigraum und richtet sich erneut auf den Adressaten (Abb. 3.5), während die ikonische Geste gehalten und durch einen kurzen rhythmischen Schlag (baton) visuell akzentuiert wird. Der Schlag, dessen temporale Qualität im Standbild nicht repräsentierbar ist, erfolgt simultan zur Äußerung des Adjektivs dick. Wie der weitere Interaktionsverlauf verdeutlicht, dient die Vergegenwärtigung eines abwesenden Gegenstands der vergleichenden Profilierung eines präsenten Gegenstands: des Thunfischsteaks, dessen Zuschnitt das Kotelettstück noch übertrifft und daher vom moderierenden Fernsehkoch als Anlass zur Erheiterung genutzt wird. Das Kotelettstück vom Vortag, also etwas Abwesendes, wird in den Vorstellungsraum der Beteiligten geholt und hinsichtlich einer bestimmten Eigenschaft (überdurchschnittlich dick zu sein) im aktuellen Wahrnehmungsraum durch die ikonische Geste visualisiert. Bei der Repräsentation des Kotelettdurchmessers mittels Modaldeiktikon und Geste handelt es sich folglich um einen Fall der Deixis am Phantasma (Bühler 1965 [1934]), die in Kapitel 7.4 dargelegt wird.

7.3.3 so X (X = Verb) + Geste Mit der Konstruktion so X (X = Adjektiv) + Geste ist die Konstruktion so X + Geste verwandt, bei der der X-Slot durch ein Verb besetzt ist, das eine körperliche Handlung bezeichnet. Bei zusammengesetzten Tempora wird das Modaldeiktikon dem infiniten Verbteil (z. B. muss man SO abschälen) vorangestellt. Bei einfachen

428

7 Spezielle Fälle

Tempora steht es nach dem finiten Verb (z. B. er sitzt SO da). Die Positionsvarianten haben Konsequenzen für das multimodale Realisierungsformat der Gesamthandlung. Als Konstante bleibt jedoch, dass sowohl bei der adverbialen Voranstellung als auch bei der Nachstellung der Gebrauch des Ausdrucks so exakt denjenigen Moment in der online-Emergenz von Sprache und Gestik markiert, in dem die relevante Handlung ausgeführt wird. Meine Analyse beschränkt sich auf die ad-verbiale Voranstellung des Modaldeiktikons, da sie in meinen Daten die weitaus häufigere Variante und damit den Standardfall darstellt. Im folgenden Beispiel aus der Sendung „Kerners Köche“ (vgl. nächste Seite) erläutert einer der eingeladenen Fernsehköche (K2), wie man idealerweise eine Ananas schält, schneidet und anrichtet. Im Verlauf seiner Erklärung führt der Koch begleitende Bewegungen mit der rechten Hand, die ein Messer hält, und der freien linken Hand aus. Die Analyse beschränkt sich auf die Demonstration der durch das Verb abschälen bezeichneten Handlung. Zu Beginn seiner Erläuterung (Z. 1: und wenn man die jetzt mit dem MESser schneidet,) nimmt der Koch ein Messer in die rechte Hand (Abb. 4.1). Der Blick der Beteiligten ist auf den Wahrnehmungsraum gerichtet. Das Temporaldeiktikon jetzt markiert den wenn-Satz als temporal zu interpretierenden Adverbialsatz und kündigt die Ausführung der durch die Präpositionalphrase bezeichneten Handlung im Sprechzeitraum an. Mit Sprechzeitraum ist aufgrund des syntaktisch projizierten Hauptsatzes nicht die punktuelle encoding time (Fillmore 1997: 67) des Adverbialsatzes, sondern die online-Emergenz der gesamten, zu diesem Zeitpunkt noch unabgeschlossenen Turnkonstruktionseinheit gemeint. Während er den Hauptsatz produziert, demonstriert der Koch eine der Teilhandlungen dessen, was er zusammenfassend unter Ananasschneiden versteht. Die temporalen Relationen zwischen der online-Emergenz der Rede und der ausführenden Geste gestalten sich wie folgt: Simultan zur Artikulation des Reformulierungsindikators (Gülich/Kotschi 1987: 220) also, der auf eine Spezifizierung der im wenn-Satz begonnenen Erläuterung verweist, setzt er das Messer am oberen Ende der Ananas an (Abb. 4.2) und führt es in einer Abwärtsbewegung außen an der Frucht entlang (Abb. 4.3–4.4). Faktisch führt er damit keinen Schnitt aus, sondern simuliert die Schneidebewegung nur. Diese korreliert zeitlich exakt mit der verbalen Produktion des Modaldeiktikons so. Bezeichnenderweise wird der handlungsspezifizierende Verbalinfinitiv abschälen erst in der Beendigungsphase der vorgeführten gestischen Handlung artikuliert. Es bestehen die gleichen temporalen Relationen zwischen vorauslaufender Geste und verbalem Korrelat wie beim Gebrauch der Konstruktion so X (X = Adjektiv) + Geste. Im vorliegenden Fall handelt es sich nicht nur um eine Erläuterung, sondern zugleich um eine Instruktion, der, wie das Modalverb muss signalisiert, im Kontext fachgerechten Kochens eine gewisse deontische Qualität zukommt. Die

7.3 Modaldeixis

Beispiel 4: „so abschälen“ (KK1_1_00:03:05) Abbildung 4.1

1

K2:

und wenn man die jetzt mit dem MESser schneidet, Abbildung 4.2

muss man also SO ab

2

Abbildung 4.3

len, Abbildung 4.4

3 4 5 6 7

muss man SEHR viel wEgschneiden,= =weil diese brAUnen AUgen, die (.) INnen noch sind, Ker

ja:,

429

430

7 Spezielle Fälle

Funktion des deiktisch-gestischen so liegt darin, den entscheidenden Moment in der emergierenden körperlichen Demonstration, dem besondere Aufmerksamkeit gebührt, zeitlich exakt zu markieren. Diese spezifische Funktion, zugleich Indikator von etwas visuell Wahrzunehmendem und Indikator des entscheidenden Fokussierungsmoments zu sein, erklärt das gehäufte Auftreten des deiktisch-gestischen Gebrauchs von so in Instruktionskontexten, in denen Sprecher neben verbalen Erklärungen körperliche Demonstrationen einsetzen, um ihren Adressaten spezifische Formen von Wissen (prozessuales Wissen, Handlungsabläufe, motorische Fertigkeiten) zu vermitteln (vgl. Lindwall und Ekström 2012; Stukenbrock 2014a). Noch deutlicher werden die Projektionsverhältnisse zwischen deiktisch- gestisch gebrauchtem so in der Funktion als Zeigzeichen auf eine wahrzunehmende körperliche Handlung, die erst nachträglich durch ein Handlungsverb deskriptiv bezeichnet wird, im nächsten Beispiel. Es ist interaktionsstrukturell ganz ähnlich aufgebaut. Der Unterschied liegt lediglich in der zeitlichen Zerdehnung, die dadurch zustande kommt, dass es sich bei der Handlung um den Essensvorgang handelt, dessen Ausführung die verbale Produktion unterbricht bzw. verzögert. In dieser Sequenz vermittelt der Koch seinen Adressaten, dass Spaghetti „weggeschlabbert“ werden dürfen, und führt dies lege artis vor. Während der Koch das Fernsehpublikum adressiert (Z. 11–12), richtet er seinen Blick bereits auf den Wahrnehmungsraum – die mit Spaghetti gefüllte Gabel (Abb. 5.1) – und beginnt simultan zur Artikulation des Modaldeiktikons so, dessen lang gezogener Vokal die Temporalität des Spaghettihochziehens ikonisch abbildet, die Gabel in den Mund zu schieben (Abb. 5.2). In der anschließenden 0,4-sekündigen Pause wird das Spaghettischlabbern, begleitet von Schlürfgeräuschen, ausgeführt (Abb. 5.3). Erst nach Abschluss des Essvorgangs versprachlicht Beispiel 5: „Nudeln wegschlabbern“ (KK1_2_00:07:56)

01 02 03 04

K1:

05 06 07 08 09 10 11

KE: K1:

gendas wird IMmer gefragt; man DARF sie richtig wegziehen; ne? man DARF die nudeln wegSCHLABbern und ZIEhen, und es DARF auch so_n gAnz klein bisschen spritzen; ja? [ja ] [also] im MUND; man dArf sie RUH:ig so-= =WIRKlich;= = Abbildung 5.1

spritzen; 06 ja? 07 KE: [ja ] 7.3 Modaldeixis 08 K1: [also] im MUND; 09 man dArf sie RUH:ig so-= 10 =WIRKlich;= Beispiel 5 (Fortsetzung) 11 = Abbildung 5.1

an den FERNsehern,

12

Abbildung 5.2

SO::-

13 15

KE:

an den:_o' emPFANGS Abbildung 5.4

16

K1:

SO:: (.) WEGziehen; (.)

Abbildung 5.3

431

-

432

7 Spezielle Fälle

der Koch noch einmal, wie der Spaghettiverzehr ausgeführt werden soll (nämlich als WEGziehen, Z. 16), und greift dabei erneut auf das Modaldeiktikon zurück. Zu diesem Zeitpunkt sind die Nudeln bereits vollständig in seinem Mund verschwunden und werden ostentativ zerkaut (Abb. 5.4). Während der erste so-Gebrauch (Z. 13) katadeiktisch die körperlich-visuelle Handlung projiziert und den Aufmerksamkeitsfokus auf die Aktivitäten im blickorganisatorisch bereits hergestellten Wahrnehmungsraum richtet, schließt der zweite so-Gebrauch (Z. 16) anadeiktisch den Mikrointeraktionsrahmen, innerhalb dessen die relevante Demonstrationshandlung vollzogen wurde. Auch hier haben wir es mit einer Art Instruktion zu tun (wie man Spaghetti isst), die allerdings weniger deontischen, als vielmehr permissiven Charakter hat. Wie der nächste Konstruktionstyp zeigt, können bei instruierenden Interaktionstypen dieser Art die handlungsbezeichnenden Verben ganz ausgespart und die produzierten multimodalen Formate auch ko-konstruiert werden.

7.3.4 so Ø + Geste/Performanz/Inszenierung Bei diesem letzten Konstruktionstyp ist das Modaldeiktikon so verbal nicht eingebettet. Die von ihm kontextualisierte körperliche Aktivität stellt in der Regel mehr als eine einzelne Geste dar und umfasst eine ganzkörperliche Darstellung, Aufführung oder Inszenierung des Sprechers. Der Verweisraum für das Modaldeiktikon so ist daher der darstellende Körper. Er fungiert als display-Raum und Medium der dargebotenen Aufführung. Ähnlich wie beim Zeigen am eigenen Körper (vgl. Kapitel 7.2 sowie Stukenbrock 2008), bei dem der Körper des Zeigenden identisch ist mit dem Körper, auf den gezeigt wird, so dass er zugleich Subjekt und Objekt der Zeigehandlung ist, stellt auch der Körper des Darstellenden zugleich Subjekt und Objekt der Aufführung dar und muss daher als semiotischer Doppelraum konstituiert werden. Wie im Folgenden dargelegt werden soll, spielt die Projek tionskraft des Modaldeiktikons so dabei eine Schlüsselrolle, indem es als verbales Scharnier zwischen den Vorbereitungs- und den eigentlichen Aufführungshandlungen der jeweiligen Akteure fungiert. Im folgenden Beispiel aus dem „Big Brother“-Korpus haben sich drei der Bewohner im Garten versammelt, um Golf zu spielen. Verena hat sich gegenüber ihren Mitbewohnern als Golf-Spezialistin ausgewiesen und beginnt, nachdem der Wechsel zur neuen Aktivität hergestellt ist (Z. 1), John Instruktionen zur richtigen Schlagtechnik zu geben. Insgesamt zwölf Mal wird der Ausdruck so in dem Ausschnitt verwendet. Sieben davon stellen Instanzen des deiktisch-gestischen Gebrauchs dar: Z. 7, 9, 12, 14, 16, 27 und 34. Bei den anderen Fällen handelt es sich um den hier nicht untersuchten Gebrauch als change of activity-Marker (s. o. Abschnitt 2): Z. 1 und 26, als Indexikalitätsmarker (Auer 1981b): Z. 23 und 28,

7.3 Modaldeixis

433

sowie als Vorlaufkonstruktion mit so (Auer 2006: 298 ff.): Z. 22. Da aus Platzgründen nicht alle sieben Instanzen des deiktisch-gestischen so-Gebrauchs behandelt werden können, beschränkt sich die Analyse auf die Instanzen in Z. 7, 12 und 16: Beispiel 6: „Golfturnier“ (bb02_5 00:26:55) Abbildung 6.1

01 02

Jhn: Ver:

03 04

05 06

Alx:

[SO: kinder;] VORbereitet; h nicht wie IHR; (1.0)

Jhn:

Abbildung 6.2

es_stand in den SPIELregeln; he_he Abbildung 6.3

07

_s golfturnier

SO: oder wat;

Abbildung 6.4

434

7 Spezielle Fälle

Beispiel 6 (Fortsetzung) Abbildung 6.5

09 10 11 12 13 14 15

16 17 18 19 20 21 22 23 24 25

Ver:

Alx: Ver: Alx: Jhn: Ver:

Jhn:

SO:? (0.5) ja:;(-) SO:, den HIERhin, SO; ne, (0.8)

Abbildung 6.6

hh Abbildung 6.7

un' (-) und [dann SO;] (0.5) [WEISSte?] [] [hm_hm,] SO, des sin' dEr muss (.) hIer muss so (.) FLACH sein; ne? hm,

7.3 Modaldeixis

435

Beispiel 6 (Fortsetzung)

26 27 28 29 30 31 32 33 34

Ver:

Alx: Ver: Jhn:

SO. und dann musst du quasi SO; ich wIll hier NICH so:wenn des jemand SIEHT (ja), dann [sagt der nachher-] [((lacht)) ] die alte wenn er RAUSkommt hat er(h)-

Vor Beginn der Sequenz befinden sich Verena, John und Alex in einer halbkreisförmigen face-to-face-Konstellation (Abb. 6.1), in der alle denselben Beteiligungsstatus eines ratifizierten Teilnehmers (Goffman 1981: 131) haben. John übernimmt den Golfschläger von Verena, beendet durch den change of activity-Marker (Z. 1: SO: kinder;) das verbale Vorspiel und stellt dadurch den Rahmen für die körperliche Aktivität her. Als nächstes ändert er seine Position im Raum. Er führt mit drei Schritten eine Vierteldrehung aus, infolge derer er Alex den Rücken zuwendet und sich in face-to-face-Position zu Verena bringt. Dadurch ändert sich das Beteiligungsformat auf grundlegende Weise: Alex verlässt den Interaktionsraum und die fokussierte Interaktion (Abb. 6.2). Im Folgenden bilden Verena und John eine interaktive Dyade, während Alex sich der Hauskatze Sternchen zuwendet (Z. 17, 18, 20) und lediglich ein einziges Mal durch das byplay (Goffman 1981: 134) eines kommentierenden Lachens (Z. 31) teilnimmt. John leitet nicht nur den Aktivitätswechsel ein und bewirkt durch sein körperliches Verhalten eine Neustrukturierung der Teilnehmerkonstellation, sondern er initiiert durch die Frage SO: oder wat- (Z. 7) auch die nachfolgende Instruktionssequenz.87 Die temporalen Relationen gestalten sich dabei wie folgt: Noch bevor John seine Frage formuliert, hat er mit leicht gegrätschten Beinen, der Positionierung des Schlägers, dem vornüber gebeugten Oberkörper und dem auf den Ball gerichteten Blick diejenige Haltung eingenommen (Abb. 6.2), die von seiner Interaktionspartnerin wahrgenommen und ggf. korrigiert werden soll, wie seine anschließende Frage verdeutlicht. Während John seine Frage formuliert, behält er sowohl die Körperpositur als auch die Blickausrichtung bei (Abb. 6.3). Die Adressatenauswahl kann auf-

87 Vgl. zu Instruktionen die Vielzahl an konversations- und interaktionsanalytischen Untersuchungen wie z. B. Garfinkel (2002); Gazin und De Stefani (2014); Goodwin (2006); Lindwall und Ekström (2012); Mondada (2009, 2011); Svensson et al. (2009); Stukenbrock (2014a).

436

7 Spezielle Fälle

grund des dyadisch reorganisierten Beteiligungsformats und des gemeinsamen Wissens um Verenas Expertenstatus ohne namentliche Adressierung oder turnzuteilenden Blick erfolgen. Der statisch auf den Golfball gerichtete Blick im Verbund mit der eingefrorenen Körperpositur signalisiert, dass der Sprecher von einer Wahrnehmung seines Körpers ausgeht und die Positur für die Betrachtung bzw. Überprüfung durch die Adressatin aufrecht erhält. Der Verweisraum für das Modaldeiktikon so ist in diesem Fall folglich der gesamte Körper des Sprechers als Aufführungsraum einer richtigen oder falschen Golfspielerhaltung. Johns Frage setzt als zweiten Paarteil eine Antwort relevant, die nur und erst dann gegeben werden kann, wenn die Adressatin der durch das Modaldeiktikon erteilten Betrachtungsaufforderung nachgekommen ist. Anders als bei den oben betrachteten Instruktionssequenzen, in denen die Rollen von Sprecher, Zeigendem und Instruierendem in einer Person vereinigt waren, ist der Sprecher hier zwar auch Zeigender, doch was er zeigt bzw. ausführt, ist potenziell korrekturbedürftig. Die Rolle der Instruierenden erfüllt die Adressatin. Durch die multimodale Integration von Körper-Display und Frageintonation auf dem Deiktikon SO und die Expansion durch oder wat fordert er seine Adressatin nicht allein zur Wahrnehmung seiner Haltung, sondern auch zu eventuellen Korrektur- und In struktionshandlungen auf. Die an die Adressatin gerichtete Aufforderung lautet, ihn wahrzunehmen und im Hinblick auf Fehlhaltungen, die nur ihrem Expertenblick zugänglich sind, zu korrigieren. Wie der weitere Verlauf deutlich macht, werden diese Projektionen interaktiv eingelöst. Unmittelbar nach Johns Turnabschlusspunkt löst Verena ihre Standposition auf und läuft in der einsekündigen Pause (Z. 9) zu John (Abb. 6.4). Simultan zur Artikulation des Modaldeiktikons (Z. 9: SO:?) tritt sie an John heran und beginnt, Oberkörper und Arme in eine Golfschläger haltende Position zu bringen (Abb. 6.5). Mit dem Sprecherwechsel (Z. 9) werden die Rollen Sprecherin, Zeigende und In struierende wieder vereint. Ein wichtiger Unterschied zu den im Vorigen dargestellten Instruktionshandlungen besteht darin, dass das Modaldeiktikon von der Instruierenden hier mit ansteigender try marker-Intonation (Auer 1979; Sacks und Schegloff 1979) gesprochen wird. Dadurch wird über die Wahrnehmungsaufforderung hinaus ein Verstehensdisplay des Adressaten relevant gesetzt. Das gedehnte, intonatorisch ansteigende so tut aber noch mehr, denn es projiziert darüber hinaus eine Demonstration und zeigt dem Adressaten an, dass dazu zunächst bestimmte Schritte der interpersonellen Koordinierung bewerkstelligt werden müssen. D. h. dieses so kontextualisiert in diesem Fall keine simultan stattfindende körperliche Aktivität, sondern projiziert eine, die sich erst im Vorbereitungsstadium befindet und deren Gelingensbedingungen gemeinsam hergestellt werden müssen. Dazu gehört die Übergabe des Schlägers von John an Verena in der anschließen-

7.3 Modaldeixis

437

den 0,5-sekündigen Pause, in der sich Verena außerdem parallel zu John ausrichtet und dabei die Oberkörper- und Armhaltung einer Golfspielerin einnimmt (Abb. 6.6). Es folgen Demonstrationen (Z. 11–15), in denen Verena John die richtige Schlägerhaltung vorführt. Die körperlichen Demonstrationen werden verbal durch verschiedene gestisch gebrauchte Deiktika begleitet (Z. 12: SO:, Z. 13: den, Z. 13: HIERhin, Z. 14: SO), die an dieser Stelle nicht im Einzelnen analysiert werden können. In der anschließenden 0,8-sekündigen Pause bringt Verena ihre Fuß- und Körperposition in ein side-by-side arrangement (Kendon 1990: 213) mit John, bevor sie zum Schlag ausholt. Diese Schlagbewegung wird verbal durch die Ankündigung un‘ (-) und dann SO; (Z. 16) projiziert. Beim Temporaldeiktikon dann verlässt der Schläger die Ruheposition und wird nach rechts seitlich hochgeschwungen. Die Amplitude erreicht mit dem Turnabschluss auf dem Modaldeiktikon SO ihren Umkehrpunkt (Abb. 6.7). Doch wird die anschließende, abwärts laufende Schlagbewegung nicht zu Ende geführt, sondern auf der Hälfte abgebremst und angehalten. Wie im „Ananas“-Beispiel (s. o.) wird die relevante Handlung nicht wirklich ausgeführt, sondern zu didaktischen Anschauungszwecken lediglich simuliert. Eine Besonderheit dieser Sequenz liegt darin, dass die Koordinierung zwischen den Beteiligten mit einem Minimum an Sprache vollzogen wird und in den Zeilen 7–16 quasi auf einen Dialog mit hochgradig kontextualisierungsreichen so-Verwendungen reduziert ist, die jeweils unterschiedliche Folgehandlungen projizieren. Die Projektionsverhältnisse gewinnen dadurch an Komplexität, dass ihr Anforderungsprofil koordinationstheoretisch in höherem Maß nicht nur intraindividuell, sondern interindividuell organisiert ist. So kontextualisiert Johns Frage SO: oder wat (Z. 7) nicht nur seine körperliche Aktivität, sondern sie projiziert über die Anweisung zur visuellen Wahrnehmung hinaus eine Evaluation, Korrektur und Instruktion seitens der Adressatin. Die Antwort der Adressatin erfolgt nonverbal, indem sie sofort auf John zugeht und damit ihre Bereitschaft zur Übernahme der Instruktionsrolle körperlich zum Ausdruck bringt. Ihr anschließend mit try marker-Intonation produziertes SO:? (Z. 9) fokussiert nun umgekehrt seine visuelle Wahrnehmung auf ihre körperlichen Aktivitäten und projiziert darüber hinaus erstens die zur Demonstration notwendigen Vorbereitungshandlungen (Schlägerübergabe), zweitens die Demonstration selbst und drittens ein Verstehensdisplay ihres Adressaten. Dabei sind die Verbindungs bögen zwischen den von Verenas SO:? aufgebauten Projektionen und den projek tionsabarbeitenden Elementen unterschiedlich weit gespannt. Sie unterscheiden sich nicht nur hinsichtlich der Realisierungsmodalitäten (verbal – körperlich/ visuell) und des koordinationstheoretischen Status (interpersonell: visuelle Wahrnehmung, Schlägerübergabe, Verstehensdokumentation; intrapersonell:

438

7 Spezielle Fälle

körperliche Demonstration), sondern auch hinsichtlich ihrer Temporalität. Während die Schlägerübergabe als Voraussetzung für die körperliche Demonstra tion sofort stattfindet, erfolgt die Verstehensdokumentation durch minimale Rückmeldesignale erst in Z. 21 (hm_hm,) und Z. 25 (hm,), nachdem Verena eine Rückversicherungsformel (Z. 19: WEISSte), dann eine Expansion ihrer Instruktion (Z. 22–23) und eine weitere Rückversicherungsformel in Form des tags ne? (Z. 24) produziert hat. Das Demonstrieren und Instruieren wird hier als Vormachen zum Zwecke des Nachmachens vollzogen. Das bedeutet, dass die Beteiligten mehrfach ihre Rollen als Betrachtender und Vorführender wechseln. Dies erfordert in weit höherem Maß als in den oben diskutierten Beispielen („Ananas“; „Spaghetti“) ein fortwährendes, intensives wechselseitiges Monitoring. In der online-Emergenz dieses mit multiplen Aktivitäts- und Rollenwechseln einhergehenden Prozesses, die von den Beteiligten gemeinsam hergestellt werden müssen, fungiert das deiktisch- gestisch verwendete so als aktivitätsstrukturierendes, wahrnehmungssteuerndes, rollenzuweisendes und die interpersonelle Koordination organisierendes, hochgradig kontextsensitives Instrument.

Zusammenfassung Die empirischen Analysen zum Modaldeiktikon so haben vier verschiedene Kon struktionstypen ergeben, die sich dadurch unterscheiden, wie das Modaldeiktikon so in den verbalen Kontext eingebettet ist. Die Darstellung dieser vier Konstruktionstypen begann mit dem verbal explizitesten Format, sie setzte sich fort mit zwei multimodal ganz ähnlich organisierten Formaten, die sich in der Hauptsache durch das verbale Korrelat der ikonischen Geste voneinander unterschieden (X = Adjektiv gegenüber X = Verb), und sie endete mit dem verbal am stärksten reduzierten Format. Bei dem ersten von mir als visuelle Evidenz-Konstruktion bezeichneten Typ (SO sieht/sehen X aus + Präsentativgeste) ist das multimodale Realisierungsformat vereinfachend zusammengefasst wie folgt organisiert: Blick auf Wahrnehmungsraum bzw. -objekt → gefolgt von so + simultaner Präsentationsgeste → gefolgt von VP → gefolgt von NP. Dabei wird in der Verbalphrase durch ein visuelles Wahrnehmungsverb (in der Regel sehen) die vom Adressaten auszuführende Wahrnehmungshandlung angewiesen. Die den Gegenstand X bezeichnende NP ist der Präsentativgeste sequenziell nachgeordnet. Die Besonderheit dieser Konstruktion liegt darin, dass mit ihr auf die Prototypikalität des gestisch präsentierten X fokussiert wird. Der Adressat wird nicht nur angewiesen, seine visuelle Aufmerksamkeit auf den Gegenstand zu richten, sondern er soll seine Wahrnehmung dergestalt organisieren, dass er den Gegenstand in seiner Phänomenolo-

7.3 Modaldeixis

439

gie, seinen gestaltbildenden Merkmalen, wahrnehmen und als exemplarischen Vertreter der entsprechenden Kategorie kognitiv repräsentieren kann. Anders verhält es sich beim zweiten Konstruktionstyp SO X (X = Adjektiv) + Geste. In diesem Fall soll der Gegenstand nicht holistisch wahrgenommen, sondern im Hinblick auf die durch die ikonische Geste repräsentierte und verbal durch das Adjektiv X bezeichnete Eigenschaft fokussiert werden. Hinsichtlich der temporalen Relationen konnte festgestellt werden, dass das verbale Korrelat – das Adjektiv – der entsprechenden ikonischen Geste nachfolgt, so dass sich verallgemeinernd folgendes Projektionsschema ergeben hat: Blick auf Wahrnehmungsraum/-objekt → projiziert Onset der Geste → ikonische Geste simultan zu so → → beide projizieren auf unterschiedlichen Modalitätsebenen ein eigenschaftsbezeichnendes Adjektiv → Projektionseinlösung durch Adjektiv. Mit dem zweiten Konstruktionstyp verbindet den dritten Konstruktionstyp SO X (X = Verb) + Geste erstens das multimodale Realisierungsformat (das verbale Korrelat – in diesem Fall das handlungsbezeichnende Verb – folgt der Geste), und zweitens der spezifische Gestentyp der ikonischen Gesten. Die Ikonizität beruht in diesem Fall nicht auf einer Ähnlichkeitsrelation zwischen Gestenform und adjektivisch bezeichneter Eigenschaft wie beim zweiten Typ, sondern auf einer vollzugsperspektivischen Repräsentationsbeziehung zwischen einer körperlich ausgeführten oder simulierten Handlung und dem entsprechenden Handlungsverb. Dem Deiktikon so kommt dabei die Funktion zu, denjenigen Moment in der emergierenden körperlichen Demonstration, den es visuell wahrzunehmen gilt – also die eigentliche Vollzugsgeste selbst –, zu markieren. Als vierter Konstruktionstyp wurde der verbal isolierte Gebrauch von SO + Geste/Aufführung/Inszenierung ermittelt. Der verbalen Reduziertheit steht ein hoher körperlich-visueller Realisierungsaufwand gegenüber, denn in der Regel wird durch das Deiktikon eine ganzkörperliche Darstellung oder Aufführung des Sprechers projiziert, bei der der Körper einen semiotischen Doppelraum konstituiert. Er fungiert zugleich als Darstellungssubjekt und als Darstellungsobjekt. Dabei sind die Übergänge zur Inszenierung fließend. So finden sich im Kontext narrativer Figurendarstellung in Alltagserzählungen Fälle einer multimodalen Inszenierung von Figuren, die über die Redewiedergabe hinausgehen, indem der Erzähler mit der animierten Rede zugleich die körperlichen Verhaltensweisen der erzählten Figur visuell zur Anschauung bringt (Stukenbrock 2012a). Verallgemeinernd ist festzuhalten, dass der deiktisch-gestische Gebrauch des Ausdrucks so weit mehr leistet als lediglich eine Perzeptionsanweisung an den Adressaten zu erteilen. Je nachdem, in welchem verbalen und interaktiven Kontext es verankert ist, kommen noch andere, konstruktionsspezifische Projektionen mit ins Spiel. Bei der visuellen Evidenz-Konstruktion wird die Perzeptionsanweisung dahingehend spezifiziert, dass das präsentierte Objekt phänomeno-

440

7 Spezielle Fälle

logisch und holistisch wahrgenommen und als Prototyp kognitiv repräsentiert bzw. in den Wissensbestand integriert werden soll. Bei der ad-adjektivischen Konstruktion geht es demgegenüber um die perzeptorische Fokussierung auf ein dem konkreten Gegenstand akzidenziell eignendes Merkmal. Die syntagmatische Kombination des Deiktikons so mit einem Verb wiederum kontextualisiert eine Vollzugsgeste oder -handlung, die mit der Vermittlung von prozessualem Wissen insbesondere in Instruktionssequenzen verbunden ist. Das syntaktisch unverbundene so schließlich kontextualisiert eine ganzkörperliche Performanz oder Inszenierung, die nicht nur wahrgenommen, sondern je nach Aktivitätstyp (z. B. Instruktion, Narration) evaluiert, korrigiert, applaudiert usw. werden soll. Wie an dem „Golfturnier“ -Beispiel zu sehen war, spielt die Intonation als Kontextualisierungshinweis dabei eine Schlüsselrolle. Allen vier Typen ist gemeinsam, dass das Deiktikon so als Hinweis auf eine vom Sprecher ausgeführte und vom Adressaten visuell wahrzunehmende Handlung fungiert. Dies tut es jedoch nicht allein. Als interaktiv ebenso wichtige Herstellungshandlungen haben sich in allen Fällen die Konstituierung des Interak tionsraums, die Körperorientierung der Beteiligten sowie der Einsatz des Blicks als körperlich-visuelles Verweisinstrument erwiesen. Die Analysen belegen daher eine untrennbare Verbindung zwischen der online-Organisation des Interaktionsraums, des Wahrnehmungsraums, des Körper-, Blick- und Gesteneinsatzes und der Sprachverwendung.

7.4 Deixis am Phantasma Das vorliegende Kapitel untersucht die interaktive Etablierung und Intersubjektivierung deiktisch konstruierter Phänomene, die den Beteiligten zum Zeitpunkt ihrer Interaktion perzeptorisch nicht zugänglich sind und die daher imaginiert werden müssen. Seit Bühler (1965 [1934]) wird der deiktische Bezug auf Vorgestelltes als Deixis am Phantasma bezeichnet und von den beiden anderen Modi sprachlichen Zeigens, der demonstratio ad oculos et ad aures und der Anaphorik, theoretisch unterschieden. Von diesen Modi des Zeigens hat die Deixis am Phantasma sowohl theoretisch als auch empirisch am wenigsten Aufmerksamkeit erfahren. Abgesehen von Untersuchungen zu schriftsprachlichen Textkorpora (Ehlich 1979, 2007) liegt bislang keine systematische Studie zur Deixis am Phantasma in der mündlichen Kommunikation und unter den Bedingungen körperlicher Kopräsenz der Beteiligten vor. Ausnahmen bilden die Arbeiten von Fricke (2002, 2007), die sich auf ein semi-experimentell erhobenes Datenkorpus von Wegbeschreibungen beschränkt und damit den Konstitutionsbedingungen natürlicher face-to-face-Interaktion nur begrenzt Rechnung trägt, sowie Unter-

7.4 Deixis am Phantasma

441

suchungen, in denen vereinzelt das Zeigen am Abwesenden thematisiert wird (Schmitt und Deppermann 2010; Ehmer 2011; Hanks 1990; Haviland 2000; Liddell 2000; Murphy 2005; Stukenbrock 2012b, 2014b). Ausgangspunkt für die empirischen Untersuchungen des Zeigens am Abwesenden auf der Grundlage des hier entwickelten Modells bildet Bühlers Subkategorisierung der Deixis am Phantasma in drei Hauptfälle. Das wesentliche, alle Fälle verbindende Merkmal besteht darin, dass die durch deiktische Ausdrücke und/oder Zeigegesten hergestellten Demonstrata nicht sinnlich wahrnehmbar sind, sondern in der Vorstellung konstruiert werden müssen. Beim ersten Hauptfall referiert der Sprecher auf Abwesendes, als wäre es präsent, und lokalisiert dieses Abwesende im unmittelbar umgebenden Wahrnehmungsraum. Sprecher und Hörer stellen sich etwas Abwesendes als in die gegebene Wahrnehmungsordnung hineinversetzt vor. Beim zweiten Hauptfall verhält es sich umgekehrt: Der Sprecher versetzt sich an einen vorgestellten Ort und nimmt dort in der Vorstellung eine bestimmte räumliche Perspektive ein. Von diesem neuen Standpunkt seiner versetzten Origo aus zeigt und referiert er auf vorgestellte Phänomene (Objekte, Orte, Ereignisse, Personen etc.) innerhalb der imaginierten Wahrnehmungsordnung, als seien sie sinnlich wahrnehmbar. Beim dritten Hauptfall wird der unmittelbar gegebene Wahrnehmungsraum durch die Vorstellung dergestalt erweitert, dass etwas nicht mehr in Wahrnehmungsreichweite Befindliches an die Grenze zwischen Anwesendem und Abwesendem geholt wird. Der dritte Fall nimmt eine Zwischenstellung zwischen dem Zeigen am Anwesenden (demonstratio ad oculos et ad aures) und dem Zeigen am Abwesenden (Deixis am Phantasma) ein und wird von Bühler daher als „Zwischenfall“ bzw. als „ein labiles und unbeständiges Eingangserlebnis“ bezeichnet (Bühler 1965 [1934]: 135). Die Unterschiede zwischen der demonstratio ad oculos und den drei Hauptfällen der Deixis am Phantasma lassen sich wie folgt veranschaulichen, wobei Details wie Origoinklusivität versus Origoexklusivität bzw. Proximalität versus Distalität aus Gründen der Vereinfachung in den Schemata nicht differenziert werden. Als Grundlage dient das im ersten Teil dieser Studie entwickelte Modell, das entsprechend adaptiert wird. Die Abkürzung WR steht für Wahrnehmungsraum und VR demgegenüber für Vorstellungsraum.

442

7 Spezielle Fälle

demonstratio ad odulos: deikt. Ausdruck + (Zeige-)Geste INSTANTIIEREN

Zeigeziel Origo

Referent

WR

dritter Hauptfall der Deixis am Phantasma: deikt. Ausdruck + (Zeige-)Geste INSTANTIIEREN

Zeigeziel Origo

WR

Referent VR

7.4 Deixis am Phantasma

erster Hauptfall der Deixis am Phantasma („der Berg kommt zu Mohammed“): deikt. Ausdruck + (Zeige-)Geste INSTANTIIEREN

Origo

Zeigeziel

Zeigeziel

Referent

Referent

WR

VR

zweiter Hauptfall der Deixis am Phantasma („Mohammed geht zum Berg“): deikt. Ausdruck + (Zeige-)Geste INSTANTIIEREN

Origo

Origo

WR

VR

Zeigeziel Referent

443

444

7 Spezielle Fälle

7.4.1 V on der demonstratio ad oculos zum nicht sichtbaren Zeigeziel: Analysen zum dritten Hauptfall One foot in Eden still, I stand, And look across the other land. Edwin Muir

Um die Brücke zwischen den bislang analysierten demonstratio ad oculos-Fällen und Fällen genuiner Deixis am Phantasma zu schlagen, beginnen die Analysen mit den typologischen Grenzfällen, die bei Bühler den dritten Hauptfall darstellen. Sie markieren den Übergang zwischen der demonstratio ad oculos und der Deixis am Phantasma, da Sprecher ausgehend vom Hier-und-Jetzt des Wahrnehmungsraums auf etwas unmittelbar jenseits der Wahrnehmungsgrenze Befindliches zeigen. Das erste Beispiel illustriert einen einfachen Fall, in dem die Sprecherin aus dem gemeinsamen Wahrnehmungsraum heraus auf etwas visuell nicht mehr Zugängliches zeigt. Die Sequenz stammt aus einer Stadtführung und setzt damit ein, dass die Stadtführerin ihre Ausführungen am derzeitigen Standort beendet, indem sie die nächste Wegstrecke ankündigt. Dazu führt sie mit dem linken Arm eine Zeigegeste aus (Abb. 1), die die einzuschlagende Richtung und die Vertikalität der aufwärts zu steigenden Treppen anzeigt: Beispiel 1: „Treppe“ (StFB1_00:14:15) Abbildung 1

1 2

SF:

Das Zeigeziel – der Wegverlauf mit den aufwärts führenden Treppen – liegt außerhalb des unmittelbaren Wahrnehmungsraums der Interaktionsteilnehmer. Die Sicht darauf ist durch Gebäude verdeckt, an denen die Gruppe zunächst vor-

7.4 Deixis am Phantasma

445

beilaufen muss. Da der Bezug auf das nicht Sichtbare vom gegenwärtigen Standort aus vollzogen wird, ohne dass eine Vergegenwärtigung oder eine deiktische Versetzung stattfindet, handelt es sich um Bühlers „Zwischenfall“, den dritten Typ der Deixis am Phantasma. Das zweite Beispiel ist einer anderen Stadtführung entnommen und repräsentiert einen ähnlichen Fall, allerdings mit dem Unterschied, dass nun nicht auf ein noch nicht wahrnehmbares Stück auf der künftigen Wegstrecke, sondern auf etwas bereits Zurückliegendes und daher nicht mehr in Sichtweite Befindliches verwiesen wird. Die Stadtführerin und ihre Gruppe bewegen sich von einem Standort zum nächsten. Die Stadtführerin beendet die mobile Phase, indem sie stehen bleibt und sich mit einer halben Drehung zu der nachfolgenden Gruppe umwendet. Ein unmittelbar hinter ihr laufender Teilnehmer stellt fokussierte Interaktion mit ihr her, indem er mit einer Frage an sie herantritt. Die Frage bezieht sich auf eine zuvor betrachtete Sehenswürdigkeit, die sich nun nicht mehr in Sichtweite befindet: Beispiel 2: „dort bei den Brunnen“ (StFLing1_00:20:54)

1

GT:

2

SF:

ich habe nO fi[GUren[ja Abbildung 2.1

3

GT:

Abbildung 2.2

dOrt bei den BRUNnen;

Das Zeigeziel – die Figurenornamente eines zuvor betrachteten Brunnens – liegt zum Sprechzeitpunkt außerhalb des unmittelbaren Wahrnehmungsraums der Beteiligten und muss in der Vorstellung rekonstruiert werden. Zusammen mit dem origoexklusiven distalen Lokaldeiktikon dOrt (Z. 3) führt der Sprecher eine Zeigegeste in die Richtung aus, aus der die Gruppe gekommen ist. Die Zeigegeste wird im ZfHv-Format ausgeführt (Abb. 2.1) und im Verlauf der referenziell spezifi-

446

7 Spezielle Fälle

zierenden Präpositionalphrase bei den BRUNnen (Z. 3) raumvektoriell ausgerichtet. Auf dem Substantiv BRUNnen erreicht sie ihren Gipfelpunkt (Abb. 2.2). Auffällig ist erstens, dass der Sprecher nicht in Richtung seiner Zeigegeste blickt, sondern stattdessen auf seine Adressatin orientiert bleibt, und zweitens, dass der Zeigefinger schräg in die Luft gerichtet wird und die Zeigegeste dadurch vektoriell verhältnismäßig vage bleibt. Diese Auffälligkeiten sind darauf zurückzuführen, dass in diesem Fall eine kinesische Zeigehilfe nicht unbedingt erforderlich ist: Erstens ist der gemeinsame Grund (common ground) zwischen den Beteiligten durch die unmittelbar vorhergehende Interaktion am Brunnen hinreichend etabliert, so dass die Referenzherstellung auf die fiGUren (Z. 1) auch ohne eine präzise Lokalisierung als erfolgversprechend gelten kann. Zweitens wird das ambige Lokaldeiktikon dOrt (Z. 3) durch die Präpositionalphrase bei dem BRUNnen (Z. 3) präzisiert. Drittens schließlich handelt es sich um den dritten Hauptfall der Deixis am Phantasma, bei dem das Zeigeziel nicht sichtbar in einem vektoriell nicht präzise herstellbaren Suchraum liegt. Anstelle der realen Wahrnehmung müssen die Beteiligten ein mentales Modell des Raums aufbauen, der ihnen vom gegenwärtigen Standort aus perzeptorisch nicht mehr zugänglich ist, und aus der Erinnerung die räumlichen Details rekonstruieren, um das Demonstratum im Vorstellungsraum zu lokalisieren. Auch die Zeigehandlung im nächsten Beispiel konstituiert einen Grenzfall zwischen der demonstratio ad oculos und der Deixis am Phantasma und ist damit ein weiterer Beleg für den dritten Hauptfall. Der Ausschnitt stammt aus der ersten Minute einer Bayreuther Stadtführung. Er soll ausführlicher betrachtet werden, da er einen besonders anschaulichen Fall für die Betrachtung der Parameter der Zeigehandlung darstellt. Diese werden von der Stadtführerin schrittweise in der Interaktion mit ihren Adressaten entwickelt und dadurch einer Sequenzanalyse zugänglich gemacht. Die schrittweise, interaktive Entfaltung der Parameter kommt dadurch zustande, dass die Stadtführerin ihre körperlichen Teilakte verbal kommentiert und mit der Instruktion verbindet, die Adressaten mögen ihre Gesten und Körperpositur nachmachen. Aufgrund der Komplexität des Ausschnitts wird das Verbaltranskript vorangestellt, bevor eine ausführliche multimodale Sequenzanalyse erfolgt: Beispiel 3: „so stellen wie ich“ (StFLIng1_00:00:28)

01 02 03 04 05 06 07 08 09 10 11

SF:

SONdern, (.) wenn sie sich einmal SO stellenwie Ich das jetzt TUe, hh ihren LINken arm DA: R und den RECHten im neunzig grad winkel auf !DIE!se seite, Ehen HINter dem schloss, (0.5) JA::; den HOFgarten, und Am hofgarten die villa WAHNfried;

01 02 03 04 05

SF:

SONdern, (.) wenn sie sich einmal 7.4 Deixis SO stellenam Phantasma 447 wie Ich das jetzt TUe, hh ihren LINken arm DA: R und den RECHten im neunzig grad winkel auf Beispiel 3 (Fortsetzung) !DIE!se seite, 06 Ehen 07 HINter dem schloss, 08 (0.5) 09 JA::; 10 den HOFgarten, 11 und Am hofgarten die villa WAHNfried; Die Teilnehmer stehen mit der Stadtführerin im Halbkreis zusammen. Die Stadtführerin hat die Gruppe soeben willkommen geheißen und ihre Ausführungen begonnen. Die fokussierte Interaktion (FI), die den ersten Parameter konstituiert, ist damit bereits hergestellt (Abb. 3.1). Um ihren Körper als visuell wahrzunehmende Ausdruckressource (VK) in den Aufmerksamkeitsfokus ihrer Adressaten zu rücken, verlässt die Stadtführerin ihren Platz in der kreisförmigen Gruppenkonfiguration und positioniert sich seitlich (Abb. 3.2) zu den Gruppenmitgliedern. Gleichzeitig fordert sie die Teilnehmer auf, dieselbe Körperorientierung einzunehmen. Das gestisch gebrauchte Modaldeiktikon SO (Z. 2) fungiert als Anweisung an die Adressaten, ihre Aufmerksamkeit auf die körperlichen Aktivitäten der Stadtführerin zu richten. Dabei indiziert das Temporaldeiktikon jetzt (Z. 3), dass die wahrzunehmenden und nachzuahmenden Körperhandlungen unmittelbar zum Äußerungszeitpunkt vollzogen werden. Damit ist als zweiter Parameter der verweisende Körper der Zeigenden (VK) etabliert: Abbildung 1.1

01 02 03

SF:

Abbildung 1.2

SONdern, (.) wenn sie sich einmal SO stellenwie Ich das jetzt TUe,

448

7 Spezielle Fälle

Nachdem sie ihren Körper als visuell wahrzunehmende Ressource etabliert hat, streckt die Stadtführerin ihren linken Arm aus und etabliert ihn damit als für den Zeigeakt spezifiziertes Verweisinstrument (Abb. 3.3–3.4). Die Armbewegung wird von einer weiteren Instruktion begleitet, der zufolge die Adressaten dieselbe Bewegung ausführen sollen. Die Instruktion enthält den lokaldeiktischen Ausdruck DA: RÜber; (Z. 4), zu dessen Verständnis die Adressaten die Stadtführerin visuell wahrnehmen müssen. Erst dann können sie die Bewegung und die räumliche Orientierung nachmachen. Auf diese Weise hat die Stadtführerin auch ihren Arm als gestisch relevante Ressource (ZG) in den visuellen Aufmerksamkeitsfokus ihrer Gruppe gerückt. Sie selbst blickt, während sie die Armbewegung ausführt, in die Richtung (Abb. 3.3–3.4), in die der Arm weisen wird. Damit ist außerdem der Verweisraum (VR) als vierter Parameter etabliert. Die Adressaten blicken zunächst zur Stadtführerin, um deren Körper (VK) und die Armgeste (ZG) wahrzunehmen (Abb. 3.3), und dann in die angezeigte Richtung (Abb. 3.4). In dem Augenblick, in dem die Adressaten ihren Blick vom Körper der Zeigenden (VK) und ihrer Zeigegeste (ZG) auf den Raum orientieren, in den diese verweist, ist der Suchraum (SR) als fünfter Parameter der Zeigehandlung hergestellt: Abbildung 3.3

04

hh ihren LINken arm DA:

Abbildung 3.4

ber strecken,

Die theoretisch getroffene Unterscheidung zwischen Verweisraum (VR) als einen die perzeptorische Selbstorganisation des Zeigenden betreffenden Parameter und Suchraum (SR) als die durch den Zeigeakt geleistete perzeptorische Fremdorientierung zeigt sich hier erstens im sequenziellen Nacheinander der Blickorientierung der Stadtführerin (=> VR) gegenüber der ihrer Adressaten (=> SR) und zweitens in der Abfolge der Blickorientierungen der Adressaten zunächst auf die Zeigende (=> VK) bzw. ihre Geste (=> ZG) und dann auf den angezeigten Raum (=> SR).

7.4 Deixis am Phantasma

449

Im nächsten Schritt streckt die Stadtführerin auch ihren rechten Arm aus, während der linke Arm auf dem Gestengipfelpunkt eingefroren wird, und richtet ihren Blick entsprechend neu aus (Abb. 3.5). Damit stellt sie einen zweiten Verweisraum (VR‘) her. Dieser wird durch die zweite Zeigegeste (ZG‘) für die Adressaten als zweiter Suchraum (SR‘) relevant gesetzt. Dabei enthält die simultan zur Zeigegeste formulierte Instruktion ein deiktisches Demonstrativpronomen (Z. 5: !DIE!se seite), das erneut die visuelle Wahrnehmung der Adressaten erforderlich macht. Wie auf den Abbildungen 3.5 und 3.6 zu sehen ist, reorientieren die Teilnehmer ihren Blick zurück auf die Stadtführerin (VK), so dass sie deren die zweite Zeigegeste (ZG‘) als relevante Informationsquelle wahrnehmen können. Die Stadtführerin richtet ihrerseits ihren Blick neu aus und schaut, nachdem sie zuvor den zweiten Verweisraum hergestellt hat (Abb. 3.5), zurück zu den Adressaten (Abb. 3.6): Abbildung 3.5

05

Abbildung 3.6

und den RECHten im neunzig grad winkel auf !DIE!se seite, Abbildung 3.7

Abbildung 3.8

450

7 Spezielle Fälle

Unmittelbar darauf orientiert sie sich wieder zurück auf den Verweisraum und produziert simultan zur Artikulation des stark akzentuierten proximalen Demonstrativums !DIE!se (Z. 5) einen kleinen Schlag (stroke) mit der rechten Hand in die angezeigte Richtung (Abb. 3.7). Nachdem sie den Schlag ausgeführt hat, friert sie auch den rechten Arm in der ausgestreckten Position ein und blickt erneut zurück zu ihren Adressaten (Abb. 3.8). Wie auf den Abbildungen 3.6 und 3.8 zu erkennen ist, begibt sich die Stadtführerin zwei Mal in die für Zeigehandlungen typische Doppelorientierung, die im theoretischen Teil dieser Untersuchung als Ressourcen-Spagat bezeichnet wurde (vgl. Kapitel 4.5 sowie Stukenbrock 2009a): Während ihre untere Körperhälfte zusammen mit der Zeigegeste auf das Zeigeziel orientiert ist, wandert der Blick flexibel zu den Adressaten (Abb. 3.6). Interaktiver Zweck dieser kurzen Reorientierung des Blicks ist das Adressatenmonitoring.88 Bis zu diesem Zeitpunkt in der emergierenden Zeigehandlung sind von den Beteiligten folgende Konstitutionskomponenten interaktiv hervorgebracht worden: fokussierte Interaktion (FI), verweisender Körper der Zeigenden (VK), gestisches Zeiginstrument (ZG), Verweisraum (VR) und Suchraum (SR). Dabei werden die für die Zeigehandlung erforderlichen körperlichen Teilakte von der Stadtführerin als multimodale Demonstrationen ausgeführt. Die von den Gruppenmitgliedern zu imitierenden Körperbewegungen werden von verbalen In struktionen begleitet, die die körperlichen Teilakte beschreiben. Durch die Imita tion der Körperausrichtung und Zeigegesten der Stadtführerin vollziehen die Adressaten am eigenen Körper die Koordinaten der vom gegenwärtigen Standort aus vektoriell zu extrapolierenden Räume nach. So ist auf Abbildung 3.9 zu sehen, dass sich einige Teilnehmer in dieselbe körperliche und visuelle Orientierung wie die Stadtführerin begeben haben. Diejenigen allerdings, die dadurch in eine back-to-face-Orientierung zur Stadtführerin geraten, drehen sich, wie die Frau im Hintergrund am linken Bildrand, unmittelbar darauf wieder um (Abb. 3.10), um die weiteren Aktivitäten der Stadtführerin wahrnehmen zu können.

88 Dieser Blick, der zum Monitoring der Aufmerksamkeitsorientierung der Adressaten eingesetzt wird und durch die visuelle Wahrnehmung des Interaktionspartners Informationen über dessen visuelle Wahrnehmung zu erhalten sucht, ist im vorliegenden Modell als Kontrollblick zur Wahrnehmungswahrnehmung bezeichnet worden. Er kann in unterschiedlichen Phasen der Zeigehandlung auftreten. Sein privilegierter Ort ist, wie im theoretischen Teil dargelegt (4.9) und im empirischen Kapitel (6.8) ausführlich nachgewiesen wurde, der Moment, in dem der Zeigende das Zeigeziel hergestellt hat und sich vergewissert, ob seine körperlichen Displays im Hinblick auf das adressatenseitige Auffinden von Suchraum und Zeigeziel als erfolgreich gelten können.

7.4 Deixis am Phantasma

451

Im Verlauf ihrer Ausführungen produziert die Stadtführerin eine weitere Zeigegeste, indem sie den linken Unterarm aus der eingefrorenen Position in die Vertikale (Abb. 3.10) und simultan zur Artikulation der lokalen Präposition HINter (Z. 7) wieder abwärts bewegt. Damit ist auf der gestischen Ebene das potenzielle Zeigeziel hergestellt, das in der Apodosis (Z. 6: °hh dann WÜRden sie SEhen-) durch das visuelle Wahrnehmungsverb angekündigt und durch den Konjunktiv zugleich als unzugänglich gerahmt wurde. Es liegt innerhalb des durch den linken Arm indizierten Suchraums, bleibt aber als perzeptorisches Phänomen hypothetisch, da es durch das Schloss verdeckt wird: Abbildung 3.9

Abbildung 3.10

06

den sie SEhen

07 08 09 10 11

HINter dem schloss, (0.5) JA::; den HOFgarten, und Am hofgarten die villa WAHNfried;

Nach einer Pause (Z. 8) und der Beglaubigungspartikel JA:: (Z. 9) nennt die Stadtführerin schließlich als Referenzobjekte ihrer Zeigehandlung den HOFgarten (Z. 10) und die villa WAHNfried (Z. 11). Aus der Tatsache, dass die beiden Zeigeziele perzeptorisch nicht zugänglich sind und die Referenten folglich nicht aus dem visuellen Wahrnehmungsakt generiert werden können, ergibt sich die Notwendigkeit, sie durch einen Symboldausdruck zu benennen. Dasselbe Procedere wiederholt sich wenig später in Bezug auf ein weiteres nicht sichtbares Zeigeziel, das sich in Richtung der mit rechts ausgeführten Zeigegeste befindet. Dabei handelt es sich, wie der entsprechende Symbolausdruck klarstellt, um ein Denkmal von Jean Paul, das sich die Adressaten ebenfalls vorstellen müssen.

452

7 Spezielle Fälle

Aufgrund der Besonderheit, dass das Zeigeziel unzugänglich ist und daher die Benennung des Referenten durch einen Symbolausdruck erzwingt, variiert auch der Einsatz der Intersubjektivierungsmechanismen: die Wahrnehmungswahrnehmung einerseits und die Verstehensdokumentation anderseits. Da der Referent durch einen Symbolausdruck bezeichnet wird, entfällt das Problem deiktischer Referenzherstellung und mithin die Notwendigkeit, die gelungene Errechnung des Referenten aus dem Zeigeziel interaktiv zu dokumentieren. Was die Wahrnehmungswahrnehmung betrifft, so war zu sehen, dass die Stadtführerin den Kontrollblick zur Wahrnehmungswahrnehmung zwar einsetzt. Dies tut sie jedoch nicht, um sich zu vergewissern, dass ihre Adressaten das Zeigeziel sehen können, denn in dieser Hinsicht erweist sich der Kontrollblick sequenziell als überflüssig. Stattdessen setzt sie ihn deutlich früher im multimodalen Ablaufformat ein: und zwar zu einem Zeitpunkt, an dem sie sicherstellen kann, dass die Adressaten ihren Körper (VK) und ihre multimodalen Teilakte (ZG) wahrnehmen. Da sie ihren Adressaten die Anweisung erteilt, es ihr nachzutun, bezieht sich ihr Adressatenmonitoring folglich darauf, ob diese die einzelnen Teilakte wahrnehmen und damit die Voraussetzung für die Imitation schaffen. Mit der multimodalen Selbst- und Fremdinszenierung dieser komplexen, auf hypothetische Anschauungsobjekte bezogenen Zeigehandlung vermittelt die Stadtführerin ihren Adressaten eine körperlich nachvollziehbare, in deren leiblicher Erfahrung gründende Raumerfahrung. Diese tritt an die Stelle der sinnlichen Erfahrung der Anschauungsobjekte selbst, die sich außerhalb des unmittelbaren Wahrnehmungsraums befinden und auf dem Parcours durch die Stadt nicht vorgesehen sind. Auch wenn die Zeigehandlung vom unmittelbaren Wahrnehmungsraum ausgeht und diesen als indexikalischen Grund erhält, handelt es sich nicht um eine demonstratio ad oculos. Wie in den vorherigen Beispielen wird auch in der vorliegenden Sequenz auf Zeigeziele gezeigt, die für die Teilnehmer von ihrem gegenwärtigen Standort aus nicht sichtbar sind. Die Herstellung dieser Zeigeziele konstituiert folglich den dritten Hauptfall der Deixis am Phantasma. Wie aus den Detailanalysen hervorging, werden bei der Realisierung des dritten Hauptfalls der Deixis am Phantasma die Parameter der Zeigehandlung analog zur demonstratio ad oculos abgearbeitet, allerdings mit dem entscheidenden Unterschied, dass das Zeigobjekt nicht sichtbar ist. Dies hat Konsequenzen nicht nur für die perzeptorischen Parameter der Zeigezielherstellung, der Wahrnehmung und der Wahrnehmungswahrnehmung, sondern auch für den kognitiven Parameter des Referenten. Dieser muss, da er nicht aus der perzeptorischen Identifizierung des Zeigeziels abgeleitet werden kann, im Verlauf der Zeigehandlung durch einen Symbolausdruck benannt oder aus anderen, perzeptionsunabhängigen Informationen inferiert werden. Aus der Tatsache, dass eine visuelle Wahrnehmung des Zeigeziels faktisch nicht möglich ist, folgt außerdem, dass der

7.4 Deixis am Phantasma

453

Intersubjektivierungsmechanismus der Wahrnehmungswahrnehmung an dieser Stelle dysfunktional wird, auch wenn er durchaus für andere Zwecke und an anderen Stellen im sequenziellen Ablaufformat eingesetzt werden kann.

7.4.2 V ergegenwärtigung von Abwesendem im Wahrnehmungsraum: Analysen zum ersten Hauptfall Is this a dagger, which I see before me, The handle toward my hand? Come, let me clutch thee:I have thee not, and yet I see thee still. Art thou not, fatal vision, sensible To feeling, as to sight? or art thou but A dagger of the mind, a false creation, Proceeding from the heat-oppressed brain? I see thee yet, in form as palpable As this which now I draw. Macbeth II,1,33

Im Folgenden werden Instanzen von Bühlers erstem Hauptfall der Deixis am Phantasma analysiert. In solchen Fällen verbleibt die Origo des Sprechers im aktuellen Wahrnehmungsraum, während dieser mit Phänomenen angereichert wird, die real nicht präsent sind. Der Sprecher vergegenwärtigt sich und seinen Adressaten etwas Abwesendes, indem er es durch die deiktische Zeigehandlung in den Wahrnehmungsraum hineinzitiert und dort lokalisiert. Laut Bühler handelt es sich dabei um „Zitierungen von Abwesendem in den Präsenzraum hinein wie im Drama“ (Bühler 1965 [1934]: 140), weshalb er dieses Verfahren als dramatisches Verfahren bezeichnet und dem epischen Verfahren entgegensetzt. Die erste Sequenz zur Exemplifizierung dieses Verfahrens stammt aus dem Korpus der Stadtführungen. In dem Beispiel evoziert der Stadtführer durch eine deiktische Zeigehandlung ein Phänomen im umgebenden Wahrnehmungsraum, das real nicht mehr sichtbar ist, da der entsprechende Ort inzwischen bebaut wurde. Er steht mit seiner Gruppe in einer Gartenanlage (Abb. 1.1) und stellt die baugeschichtliche Entwicklung des Stadtviertels dar. Zunächst führt er den Namen des Viertels (Z. 3: WÖLfelblock) und anschließend die historische Figur des Architekten ein (Z. 4: WÖLfel), der die Gestaltung des Viertels maßgeblich beeinflusst hat. Wie der Stadtführer wenig später erläutert, gehörte zu den Gestaltungsmaßnahmen des Architekten die Entwicklung und Bebauung der damals frei daliegenden Sumpfwiesen:

454

7 Spezielle Fälle

Beispiel 1: „Sumpfwiesen“ (StFLIng2_00:10:43)

01 02

SF:

die bAUten auf die sie SEhen, Abbildung 1.1

03

das ist also (0.4)

04 05 06

deVElopp ein !BAU!unternehmer, Abbildung 1.2

- (-)

-

Abbildung 1.3

07

der nun SAH,

08 09

hIer sind die SUMPFwiesen, -) auf der ANderen seite des mains der BAHNhof,

7.4 Deixis am Phantasma

455

Im Verlauf seiner Darstellung evoziert der Stadtführer an der Stelle, an der er sich mit seiner Gruppe befindet, die sich dort ehemals erstreckenden Sumpfwiesen, die später bebaut wurden. Dazu führt er eine deiktische Zeigehandlung aus, bei der er im Verbund mit dem proximalen Lokaldeiktikon hIer (Z. 8) mit beiden Armen eine Zeigegeste ausführt, die einen weiten Bogen in die Luft zeichnet und dadurch die Größe des durch das Lokaldeiktikon bezeichneten Territoriums andeutet (Abb. 1.2–1.3). Zudem wechselt er vom Präteritum ins Präsens (Z. 8: hIer sind die SUMPFwiesen,) und vergegenwärtigt dadurch ein vergangenes, nicht mehr existentes Phänomen im unmittelbaren Wahrnehmungsraum der Beteiligten. Seine Adressaten sollen sich an dem indizierten Ort anstelle der sichtbaren Bebauung die nicht mehr wahrnehmbaren Sumpfwiesen vorstellen. Damit handelt es sich um den ersten Hauptfall der Deixis am Phantasma. Etwas Abwesendes – in diesem Fall etwas Vergangenes – wird im gegenwärtigen Wahrnehmungsraum verankert. Dabei zeigt sich, dass zwar der Suchraum perzeptorisch zugänglich ist, nicht jedoch das darin zu imaginierende Phänomen. Im zweiten Beispiel aus dem „Big Brother“-Korpus werden als abwesende Phänomene zwei Personen an speziellen Standorten im umgebenden Wahrnehmungsraum lokalisiert. Zwei Bewohner, Jürgen und Zlatko, sind damit beschäftigt, den Wohnraum sauber zu machen, während die übrigen Mitbewohner noch schlafen. Sie sind in unterschiedliche Reinigungsaktivitäten involviert und geraten in fokussierte Interaktion miteinander, als Jürgen das Fehlverhalten einiger Mitbewohner thematisiert. Allerdings bleibt die Personenreferenz implizit. Jürgen vermeidet es, die Namen der gemeinten Personen zu nennen und rekurriert stattdessen auf eine deiktische Zeigehandlung, bei der er den umgebenden Raum als Ressource zur Referenzherstellung nutzt. Dieser Raum ist zum Sprechzeitpunkt im Hinblick auf die Referenten, über die der Sprecher spricht und die er als imaginäre Zeigeziele im umgebenden Raum lokalisiert, leer. Auch die zeitliche Differenz zwischen Referenzeit und Sprechzeitpunkt wird durch Vergangenheitstempora (Perfekt, Präteritum) fortwährend in Erinnerung gerufen. Aufgrund der Komplexität des Ausschnitts wird zur Übersicht das Verbaltranskript vorangestellt, bevor die multimodale Analyse Schritt für Schritt nachvollzieht, wie der erste Hauptfall der Deixis am Phantasma hergestellt wird: Beispiel 2: „lästern“ (bb01_B_00:06:50)

01 02 03 04 05 06 07 08 09 10 11 12 13

Jrg:

Zlt: Jrg:

gEstern hab ich ma geMERKT; (1.8) hast_e vOllkommen RECHTwie DIE am ((0.9) ich stand ja hier HINter denen, (0.6) genAu HINter den beiden, (-) wo wir da: (.) VORgelesen haben; bei JE::den(0.9) ber JEdes teil; (-)

h

01 Jrg: gEstern hab ich ma geMERKT; 02 (1.8) 03 hast_e 456 7 Spezielle Fälle vOllkommen RECHT04 wie DIE am (05 (0.9) 06 Zlt: Beispiel 2 (Fortsetzung) 07 Jrg: ich stand ja hier HINter denen, 08 (0.6) 09 genAu HINter den beiden, (-) 10 wo wir da: (.) VORgelesen haben; 11 bei JE::den12 (0.9) 13 ber JEdes teil; (-) 14 Zlt: hm, 15 Jrg: 16 Zlt: wer_MAnu und (.) CHRISsi; 17 Jrg: ja_ja;

h

Jürgen eröffnet das Gespräch, in dem er seinem Adressaten eine Beobachtung, die er am Abend zuvor über die anderen Mitbewohner gemacht hat, mitteilt und kommentiert (Z. 1–4). Dabei bezieht er sich mit dem akzentuierten Demon strativpronomen DIE (Z. 4) auf die gemeinten Personen und unterstellt seinem Adressaten genügend gemeinsames Wissen zur personendeiktischen Referenzherstellung. Dadurch, dass Jürgens Kommentar explizit ein Urteil bestätigt, das sein Adressat vor kurzem selbst gefällt hat, wird seine Äußerung an den früheren Diskurs rückgebunden. Nach einer Pause, in der die Beteiligten mit dem Putzen fortfahren, äußert Zlatko seine Zustimmung (Z. 6: naTÜRlich:). Daraufhin unterbrechen beide ihre Putzaktivität und begeben sich in eine face-to-face-Orientierung (Abb. 2.1):

01 02 03 04 05

Jrg:

gEstern hab ich ma geMERKT; (1.8) hast_e vOllkommen RECHTwie DIE am ((0.9) Abbildung 2.1

Jrg Zlt

zen sind;

7.4 Deixis am Phantasma

457

Im nächsten Redezug (Z. 7) baut Jürgen die vergangene Szene aus, indem er durch eine deiktische Zeigehandlung die räumliche Konfiguration der abwesenden Gesprächsbeteiligten und seine eigene Position rekonstruiert. Dazu blickt er, bevor er seine Äußerung (Z. 7) beginnt, an einen entfernten Ort im Zimmer und stellt dadurch den Verweisraum (VR) für seinen späteren Zeigeakt her (Abb. 2.2): Abbildung 2.2

Dann beginnt er wieder zu reden (Z. 7: ich stand ja hier HINter denen,). Ohne die Anzahl der Mitbewohner zu spezifizieren, hinter denen er zum erzählten Zeitpunkt gestanden hat, vollführt Jürgen eine Zeigegeste mit zwei Gipfelpunkten (Abb. 2.3–2.4), die die räumliche Position der betreffenden Personen und damit implizit auch deren Anzahl indiziert. Der zweiteilige Zeigeakt wird mit einem vollständig ausgestreckten Arm ausgeführt. Die Hand befindet sich in der für Identifizierungs- und Lokalisierungsakte typischen ZfHu-Form (vgl. Kapitel 5.1.1). Auf diese Weise lokalisiert Jürgen seine eigene, vergangene Position im Wahrnehmungsraum in Relation zu den räumlichen Positionen zweier Mitbewohner, die zum Referenzzeitpunkt an einer ganz bestimmten Stelle im Raum in fokussierter Interaktion miteinander waren. Aufgrund seiner eigenen Position in Relation zu den beiden hat er deren Gespräch mitgehört (vgl. zum Konzept des overhearer Goffman 1981: 132). Abbildungen 2.3 und 2.4 zeigen die temporalen Beziehungen zwischen verbalen und visuellen Ressourcen:

458

7 Spezielle Fälle

Abbildung 2.3

07 08

Jrg:

Abbildung 2.4

ich stand ja hier HINter denen, (0.6)

Ohne dass er den zeigenden Arm absenkt, wiederholt der Sprecher nach einer Mikropause (Z. 8) seinen Zeigeakt. Dazu expandiert er auch die raumdeiktische Beschreibung. Diese spezifiziert nun auch sprachlich die Anzahl der Personen (Z. 9: den beiden), hinter denen der Sprecher stand, sowie seine exakte räumliche Position (Z. 9: genAu HINter). Die Gestengipfelpunkte treten mit der Artikulation des Adverbs (genAu) und der Numerale (beiden) auf (Abb. 2.5–2.6). Nach der Wiederholung seiner Zeigegeste blickt der Sprecher zurück zu seinem Adressaten, während er seine nächste Turnkonstruktionseinheit formuliert (Abb. 2.7): Abbildung 2.5

09

Abbildung 2.6

genAu HINter den beiden, (-) Abbildung 2.7

09

7.4 Deixis am Phantasma

genAu HINter den beiden, (-)

459

Abbildung 2.7

10

wo wir da: (.) VORgelesen haben;

h

Im Anschluss daran blickt er erneut in Richtung des Verweisraums (Abb. 2.8), in dem er zuvor die beiden abwesenden Teilnehmer lokalisiert hat, und hält diese Blickorientierung während der gesamten Pause (Z. 12) aufrecht (Abb. 2.9). Damit inszeniert und simuliert er die Wahrnehmung des Abwesenden und lädt seinen Adressaten ebenfalls zu einem imaginären Wahrnehmungsakt ein. Mit Beginn der nächsten Äußerungseinheit (Z. 13) richtet er seinen Blick wieder auf den Adressaten (Abb. 2.10) und vergewissert sich (Kontrollblick zur Wahrnehmungswahrnehmung), ob der Adressat sich ebenfalls auf den relevanten Ort im Wahrnehmungsraum orientiert, an dem die beiden Personen vorzustellen sind: Abbildung 2.8

11 12

bei JE::den(0.9) Abbildung 2.10

Abbildung 2.9

460 11 12

7 Spezielle beiFälle JE::den-

(0.9)

Abbildung 2.10

13 14 15 16 17

Zlt: Jrg: Zlt: Jrg:

ber JEdes teil; (-) hm, wer_MAnu und (.) CHRISsi; ja_ja,

In der vorliegenden Sequenz evoziert Jürgen einen spezifischen Moment des vorangegangenen Abends. Durch das Zeigen am Phantasma lässt er die vergangene räumliche Konfiguration der Teilnehmer im gegenwärtigen Wahrnehmungsraum wiedererstehen. Zum Sprechzeitpunkt befinden sich weder die Mitbewohner noch er selbst an dem indizierten, durch das Lokaldeiktikon hier (Z. 7) definierten Raum. Indem er seine Zeigegesten auf den Ort richtet, an dem sich die zwei Mitbewohner und er selbst am Abend zuvor befunden haben, und seinen Blick auf die imaginären Zeigeziele richtet, zitiert er die abwesenden Personen und sein vergangenes Selbst in den Wahrnehmungsraum hinein und integriert sie dort. Er bevölkert den aktuell wahrnehmbaren Raum mit abwesenden Phänomenen, in diesem Fall mit den Teilnehmern einer vergangenen Interaktion, die am selben Ort, allerdings zu einem anderen Zeitpunkt, stattgefunden hat. Was das sequenzielle Ablaufformat betrifft, werden die Parameter der Zeigehandlung nach dem Muster der demonstratio ad oculos realisiert. Zuerst begeben sich die Beteiligten in fokussierte Interaktion. Dann etabliert der Sprecher perzeptorisch den Verweisraum, indem er seinen Blick dorthin orientiert. Anschließend führt die Zeigegeste aus, deren Gipfelpunkte zeitlich mit den entsprechenden Verbaldeiktika korrelieren. Am Ende des gestischen Zeigeakts orientiert der Sprecher sich wieder auf den Adressaten und überprüft dessen Wahrnehmung. Da es sich hier jedoch um eine Instanz der Deixis am Phantasma handelt, bei der weder der Zeigende noch der Adressat die Zeigeziele (demon

7.4 Deixis am Phantasma

461

strata) visuell wahrnehmen kann, stellen sowohl die Wahrnehmung als auch die Wahrnehmungswahrnehmung hybride Akte dar, mit denen sich die Beteiligten gegenseitig weniger ihre Wahrnehmungs-, als vielmehr ihre Imaginationsakte anzeigen. Diese Feststellung bedarf einiger Erläuterungen, die zugleich die Besonderheiten des ersten Hauptfalls der Deixis am Phantasma profilieren. Die Besonderheiten des ersten Hauptfalls liegen darin, dass etwas Abwesendes, sinnlich nicht Wahrnehmbares vom Vorstellungsraum in den Wahrnehmungsraum hineinversetzt und dort lokalisiert wird. Während die vorgestellte Entität also nicht wahrnehmbar ist, bleibt hingegen der Ort, der dieser vorgestellten Entität durch den Zeigeakt im realen Wahrnehmungsraum zugewiesen wird, sehr wohl wahrnehmbar. Die Hybridität zwischen Perzeption und Imagination besteht folglich darin, dass als Verweis- bzw. Suchraum ein Ort im realen Wahrnehmungsraum konstituiert wird, auf den die Beteiligten sich visuell orientieren, wohingegen das Zeigeziel ein nicht wahrnehmbares Phantasma darstellt. Der erste Hauptfall am Phantasma zeichnet sich dadurch aus, dass es im Suchraum nichts wahrzunehmen gibt, auch wenn der Suchraum selbst sinnlich wahrnehmbar ist. Stattdessen markiert der Suchraum eine Leerstelle, die durch die Vorstellungskraft zu füllen ist. Anders als bei der demonstratio ad oculos stiftet die Deixis beim ersten Hauptfall also nicht den Übergang von individueller zu gemeinsamer Wahrnehmung, sondern den Übergang von individueller zu gemeinsamer Imagination – zu einer Imagination allerdings, die im Wahrnehmungsraum verankert wird und daher wahrnehmungsbasiert ist. Wahrnehmbar ist der Suchraum als derjenige Teilbereich im sinnlich zugänglichen Wahrnehmungsraum, in dem das Abwesende lokalisiert wird. Folglich dient die bei der demonstratio ad oculos als Kontrollblick zur Wahrnehmungswahrnehmung fungierende Adressatenorientierung beim ersten Hauptfall nicht zur Überprüfung der Zeigeziel-Wahrnehmung durch den Adressaten, sondern zur Feststellung, ob der Adressat den Vorstellungsakt anhand der Zeigehandlung nachvollzieht. Indikator dafür ist, dass der Adressat sich auf den Suchraum orientiert, in dem die imaginäre Entität vorzustellen ist. Auch in folgendem Beispiel handelt es sich bei der Entität, die durch eine deiktische Zeigehandlung in den Wahrnehmungsraum der Beteiligten integriert wird, um eine Person. Doch im Unterschied zum vorherigen Beispiel ist dies keine individuelle Person, sondern eine generische Figur. Die Sequenz stammt aus dem „Mutige Mädchen“-Korpus. Die Schülerinnen haben soeben eine Bodenübung gemacht, in der sie auf Matten liegend zur Selbstverteidigung Tritte nach links und rechts geübt haben. Bei dieser Übung hat jedes Mädchen für sich allein trainiert und Lufttritte in Richtung eines imaginären Angreifers ausgeführt. Zur Variation dieser Übung leitet die Trainerin die Schülerinnen im nächsten Schritt zu einer Partnerübung an, bei der die Mädchen dieselben Bewegungen mit einer

462

7 Spezielle Fälle

Partnerin praktizieren sollen, die einen Angreifer darstellt. Im Verlauf ihrer Erläuterungen führt die Trainerin eine deiktische Zeigehandlung aus, die den ersten Hauptfall der Deixis am Phantasma konstituiert: Beispiel 3: „realistische Angreifer“ (MM_C3_00:23:14-23:42) Abbildung 3.1

01 02 03 04

T:

und wir machen die ANgreiferjetzt mal_n bisschen reaLIStischer, (0.8) das HEISST,= Abbildung 3.2

05

=

7.4 Deixis am Phantasma

463

Beispiel 3 (Fortsetzung) Abbildung 3.3

Abbildung 3.4

WR

06 07

jetzt HIER ist das OPfer ja? ihr mAcht dann nicht SOAbbildung 3.5

08 09 10 11 12 13 14 15 16

VR

Abbildung 3.6

Abbildung 3.7

(1.0)

aber SO, und dann HIER RUM, un_nochmal HIER, un_dann_nochma_SO, und (.) dann nochmal WEIter;

464

7 Spezielle Fälle

Die Trainerin leitet die neue Übungsphase mit der Ankündigung ein, dass der Angreifer in der nächsten Übung realistischer dargestellt werden soll (Z. 1–2). Zu diesem Zeitpunkt befindet sie sich an der Stirnseite der Turnhalle. Die Mädchen liegen auf den Matten verstreut im Raum (Abb. 3.1). In der Pause (Z. 3) beginnt die Trainerin auf eine frei gewordene Matte zuzulaufen. Im Laufen beginnt sie eine neue Äußerung (Z. 4), die eine Erklärung dessen projiziert, was sie sich unter der Simulation eines realistischeren Angreifers vorstellt (Z. 6–7). Dabei bezieht sie sich explizit auf ihre Vorstellung (Z. 5: also meine VORstellung,) und rahmt dadurch das Folgende als hypothetisch und imaginär. Für die unmittelbar darauf ausgeführte deiktische Zeigehandlung bedeutet dies, dass sie im Modus der Deixis am Phantasma realisiert wird. Bereits zu diesem Zeitpunkt in ihrer emergierenden Äußerung bereitet die Trainerin die Zeigehandlung vor, indem sie ihre Arme und Hände seitlich vom Körper in eine entsprechende Position bringt (Abb. 3.2.). Noch bevor sie die Matte erreicht hat, führt sie im Verbund mit dem akzentuierten Lokaldeiktikon HIER (Z. 6) eine mit beiden Armen ausgeführte Zeigegeste auf die leere Matte (Abb. 3.3) aus. Die Hände befinden sich in der oHHuForm (vgl. dazu Kapitel 5.4.3), der Blick ist auf die Matte gerichtet. Durch die Zeigehandlung wird das imaginäre Opfer aus dem Vorstellungsraum in den Wahrnehmungsraum hineinzitiert und an der Stelle lokalisiert, auf die die Trainerin mit beiden Händen zeigt (Abb. 3.4). Zugleich richtet sie Blick und Körper auf das imaginäre Opfer aus. Während der Suchraum sichtbar ist und durch ein visuell wahrnehmbares Objekt – die leere Turnmatte – räumlich umgrenzt wird, ist das Demonstratum (das Opfer) nicht wahrnehmbar, sondern muss von den Adressatinnen in der Vorstellung ergänzt werden. Gemäß Bühler handelt es sich um den ersten Hauptfall der Deixis am Phantasma. Etwas Abwesendes (in diesem Fall das imaginäre, generische Opfer) wird – ohne Origoversetzung von Sprecherin und Adressatinnen – in den unmittelbaren Wahrnehmungsraum hineinzitiert und dort lokalisiert. Nachdem das imaginäre Opfer durch die deiktische Zeigehandlung auf der Matte platziert wurde, stellt es eine etablierte Größe dar, auf die im weiteren Verlauf rekurriert werden kann. So nutzt die Trainerin die durch die Zeigehandlung intersubjektivierte Vorstellung eines am Boden liegenden Opfers, um im nächsten Schritt auszuführen, wie die Angreiferrolle nicht aussehen soll. Eingeleitet durch das Modaldeiktikon SO, das im Äußerungskontext (Z. 7: ihr mAcht dann nicht SO-) eine performative Handlung projiziert (vgl. dazu ausführlich das vorherige Kapitel 7.3), verlässt die Trainerin die Ebene der verbalen Instruktion und wechselt in den performativen Modus, indem sie vorspielt, wie die Schülerinnen in der anschließenden Partnerübung die Angreiferrolle nicht ausüben sollen. Dazu macht sie einige taumelnde Schritte, die Unentschlossenheit, Kraftlosigkeit und Passivität verkörpern (Abb. 3.5–3.6). Anschließend kehrt sie wieder

7.4 Deixis am Phantasma

465

in die Rolle der instruierenden, erklärenden Lehrerin zurück (Abb. 3.7), bevor sie erneut in den performativen Modus wechselt, um ein positives Beispiel der Angreiferrolle vorzuführen (Z. 12–16). Durch den Wechsel in den performativen Modus wird der erste Hauptfall der Deixis am Phantasma verlassen. Indem die Trainerin sich in die Rolle der Schülerinnen versetzt und vormacht, wie diese sich in der angekündigten Partner übung gerade nicht in die Angreiferrolle versetzen sollen, vollzieht sie mehrere Origoversetzungen, die deixistheoretisch den zweiten Hauptfall konstituieren (vgl. dazu das nächste Unterkapitel). Demgegenüber wird im ersten Hauptfall die Origo des Sprechers beibehalten. An dem Beispiel wird deutlich, dass mehrfache Wechsel zwischen Wahrnehmungs- und Vorstellungsraum sowie zwischen unterschiedlichen Zeigmodi bruchlos ineinander übergehen können. In der vorliegenden Sequenz vollzieht die Sprecherin zunächst eine Zeigehandlung, die den ersten Hauptfall der Deixis am Phantasma repräsentiert und damit ein sinnlich nicht zugängliches, vorzustellendes Phänomen in den Wahrnehmungsraum integriert. Wenig später bildet dieses vorgestellte Phänomen räumlich den Anker und pragmatisch das Patiens von Handlungen, deren Ausführung an deiktische Versetzungen gebunden ist, die den zweiten Hauptfall der Deixis am Phantasma konstituieren. Die Untersuchungen zum ersten Hauptfall der Deixis am Phantasma haben exemplarisch gezeigt, wie Sprecherinnen und Sprecher durch deiktische Zeigehandlungen perzeptorisch nicht zugängliche Phänomene in den unmittelbaren Wahrnehmungsraum hinein zitieren. Diese Phänomene können nicht sichtbare Raumgegebenheiten oder Gegenstände, aber auch Personen, Teilnehmerkonfigurationen und deren Handlungen sowie generische Figuren wie die Opfer-Figur im letzten Beispiel sein. Das multimodale Ablaufformat entspricht dem anhand der demonstratio ad oculos entwickelten Modell zu den Parametern der Zeigehandlung. Anders als bei der demonstratio ad oculos ist bei keinem der drei Hauptfälle das deiktisch hergestellte Demonstratum perzeptorisch zugänglich. Aus der Sicht des theoretischen Modells liegen die Besonderheiten des ersten Hauptfalls darin, dass im Unterschied zum zweiten wie auch zum dritten Hauptfall der Verweis- bzw. Suchraum perzeptorisch zugänglich ist. Daher beziehen sich sowohl die Wahrnehmung als auch die Wahrnehmungswahrnehmung nicht auf Zeigeziel und Referenten, die im Gegensatz zum Suchraum nicht wahrnehmbar sind, sondern auf die Herstellung des Suchraums. Die interaktive Funktion des Kontrollblicks zur Wahrnehmungswahrnehmung besteht mithin nicht darin, Zeigeziel- und Referenzherstellung des Adressaten zu überprüfen, sondern festzustellen, ob dieser den Imaginationsakt mitvollzieht und ob der dazu erforderliche räumliche Verankerungsakt gelingt. So stellt der erste Hauptfall der Deixis am Phantasma eine Überblendung des Wahrnehmungsraums

466

7 Spezielle Fälle

mit Phänomenen dar, die aus dem Vorstellungsraum importiert werden, wobei der Ort der Überblendung im umgebenden Wahrnehmungsraum der Beteiligten exakt lokalisiert wird. Beim ersten Hauptfall der Deixis am Phantasma interagieren Perzeption und Imagination in einer spezifischen Weise miteinander, insofern sich die Perzeption auf das Wo des zu lokalisierenden Phänomens (Verweisbzw. Suchraum), die Imagination hingegen auf das Was bzw. auf das Phänomen selbst bezieht.

7.4.3 Versetzung in den Vorstellungsraum: Analysen zum zweiten Hauptfall Auf die Analysen zum ersten Hauptfall der Deixis am Phantasma folgen nun Analysen von Instanzen, in denen die Sprecher ihre Origo in den Vorstellungsraum versetzen und innerhalb des Vorstellungsraums auf Abwesendes zeigen. Die Analysen belegen die Vielfalt und das Spektrum an verbalen und körperlichen Verfahren, auf die deiktische Versetzungen des zweiten Hauptfalls gründen. Im ersten Beispiel („Kettensäge“) versetzt sich der Sprecher in den Vorstellungsraum eines Baumarkts. Die Zeigehandlung, die den Vorstellungsraum herstellt und die Versetzung bewerkstelligt, besteht aus einem deiktischen Raum ausdruck und einer beidhändigen Zeigegeste, die von einer entsprechenden Blickorientierung des Sprechers begleitet werden. Die Sequenz stammt aus einer Talkshow. Teilnehmer sind der Moderator Johannes B. Kerner (JK) sowie die Gäste Ranga Yogeshwar (RY) und das Ehepaar Axel (AM) und Judith Milberg (JM). Die Beteiligten diskutieren die unorthodoxe Arbeitsteilung im Haushalt des Schauspielers Axel Milberg und seiner Frau: Beispiel 1: „Kettensäge”

01 02 03 04 05 06 07 08 09 10 11 12 13 14

AM: JK: RY: JM: RY: AM: JM: AM: RY:

((lacht))] [JA ] hm_hm, [sie BRAUCHT eine] kett [ja (-) ja; ] ich [BRAUCH (eine);] -

kEin SONderange[bot-] [hm_hm,] Abbildung 1.1

08 AM: [sie BRAUCHT eine] kett 09 JM: [ja (-) ja; ] 10 ich [BRAUCH (eine);] AM: 11 7.4 Deixis am Phantasma 12 13 kEin SONderange[bot-] 14 RY: [hm_hm,] Beispiel 1 (Fortsetzung)

467

Abbildung 1.1

15

AM:

kann man sich ja auch mal eine (.) LEIhen; Abbildung 1.2

16

Abbildung 1.3

es gibt da HINten;

In der Sequenz ironisiert Axel Milberg die Tatsache, dass seine Frau auf den Kauf einer teuren Kettensäge besteht, anstatt das Gerät im Baumarkt auszuleihen. Die Idee konkretisiert er, indem er sich deiktisch in einen Baumarkt versetzt und von seiner verschobenen Origo aus verbal und gestisch auf den in der imaginierten Baumarkthalle lokalisierten Geräteverleih zeigt. Die Verfahren, mittels derer der Sprecher die deiktische Versetzung in den Vorstellungsraum bewerkstelligt, gestalten sich wie folgt: Zu Beginn der relevanten Äußerungseinheit (Z. 16: es gibt da HINten;) reorientiert er seinen Blick und schaut in eine vor ihm liegende, relativ entfernte Richtung (Abb. 1.2). Damit projiziert er einen neuen Aufmerksamkeitsfokus, der im weiteren Verlauf durch verbale und gestische Zeigmittel elaboriert wird. Laut des in Kapitel 4 entwickelten Modells konstituiert er damit den Verweisraum (VR) für einen künftigen Zeigeakt. Da es sich um Zeigen am Phantasma handelt, stellt auch der Verweisraum einen imaginären Raum dar.

468

7 Spezielle Fälle

Beispiel 1 (Fortsetzung) Abbildung 1.4

17

Abbildung 1.5

!GANZ! am ENde; Abbildung 1.6

Im nächsten Schritt äußert der Sprecher die distalen Lokaldeiktika da HINten (Z. 16), die einen Ort indizieren, der relativ weit von ihm entfernt ist. Gleichzeitig hebt er beide Arme hoch, bis seine Hände auf Augenhöhe angekommen sind. Die Zeigefinger sind ausgestreckt (Abb. 1.3). In dem Augenblick, indem er das akzentuierte Adverb GANZ (Z. 17) artikuliert, streckt er beide Arme nach vorne aus. Die Hände bilden eine Zeigegeste in der ZfHu-Form (Abb. 1.4). Dann retrahiert er seine Arme wieder bis zu der Position neben seinem Kopf (Abb. 1.5) und wirft sie in jenem Moment erneut nach vorne (Abb. 1.6), in dem er die räumliche Beschreibung reformuliert (Z. 17: am ENde;). Die beidseitig ausgeführte Zeigegeste wird zwei weitere Male wiederholt (Abb. 1.7–1.8; Abb. 1.9–1.10). Sowohl die Form als auch die Bewegungsbahn (trajectory) der Zeigegesten indizieren einen entfernten Ort und visualisieren den deiktischen Ausdruck da HINten (Z. 16). Über die deiktische Funktion hinaus repräsentiert die repetitive, parallele Auf- und Abbewegung beider Arme ikonisch das typische räumliche Arrangement eines Bau-

7.4 Deixis am Phantasma

469

Beispiel 1 (Fortsetzung) Abbildung 1.7

ischer wEise verSTECKT,

18

Abbildung 1.9

19 20 21 22

Abbildung 1.8

JM: AM:

Abbildung 1.10

[MARKtes, ] [BAUmarktes,]

markts mit seinen langen, endlosen Gängen und den sich rechts und links neben dem Besucher auftürmenden Regalreihen. Während beim ersten Hauptfall der Deixis am Phantasma ein imaginäres Objekt in den unmittelbaren Wahrnehmungsraum zitiert und dort lokalisiert wird, wird im vorliegenden Fall genau umgekehrt verfahren. Statt das Abwesende im präsenten Wahrnehmungsraum zu vergegenwärtigen, versetzt der Sprecher sich bzw. seine Origo an einen imaginären Ort – einen Baumarkt – und referiert von dort aus auf weitere, in diesem Vorstellungsraum zu imaginierende Entitäten. Die Versetzung wird durch den koordinierten Gebrauch unterschiedlicher

470

7 Spezielle Fälle

Ressourcen hergestellt und kommunikativ vermittelt. Dazu gehören der Blick als vorauslaufende, den – in diesem Fall imaginären – Verweisraum herstellende Ressource, die Zeigegesten und der lokaldeiktische Ausdruck da HINten. Weder der Blick, noch die Gesten besitzen ein reales, faktisch sichtbares Zeigeziel. Wie der deiktische Ausdruck werden der Blick und die Gesten nur dann verständlich, wenn sie vom versetzten indexikalischen Grund aus, den sie zugleich herstellen, prozessiert werden. Dieser wird durch den imaginären Raum des Baumarkts konstituiert, an den sich der Sprecher in der Vorstellung versetzt hat. Von seinem imaginären Standort aus performiert er die Wahrnehmung eines Geräteverleihs am Ende der Regalreihen der imaginären Baumarkthalle, den er mit Zeigegesten für seine Adressaten lokalisiert. Subsumiert man dieses Beispiel unter den zweiten Hauptfall der Deixis am Phantasma, lässt sich die hier vollzogene Versetzung in den Vorstellungsraum wie folgt darstellen: deikt. Ausdruck + (Zeige-)Geste INSTANTIIEREN

Origo

Origo

Zeigeziel Referent

WR

VR

Zeigeziel Referent

7.4 Deixis am Phantasma

471

Allerdings enthüllt die bisherige Analyse noch nicht die ganze Wahrheit. Die Baumarkt-Szene besitzt eine Pointe, in der sich die empirische Komplexität der Deixis am Phantasma im interaktiven Vollzug offenbart. Denn genau genommen zeigt der Sprecher von seiner in den Vorstellungsraum (Baumarkt) versetzten Origo aus nicht auf einen von dort aus als sichtbar vorzustellenden Geräteverleih, sondern er betont im Gegenteil, dass dieser TÜCKischer wEise verSTECKT (Z. 18) sei. Innerhalb des Vorstellungsraums, der durch den zweiten Hauptfall der Deixis am Phantasma konstituiert wurde und in Bezug auf den Wahrnehmungsraum eine Unsichtbarkeit ersten Grades besitzt, wird eine Unsichtbarkeit zweiten Grades inszeniert. Diese Unsichtbarkeit zweiten Grades, die innerhalb des Vorstellungsraums gilt, ist durch die Faktoren Distalität (Z. 16–17: da HINten; !GANZ! am ENde;), kundenfeindliche Raumgestaltung (Z. 18: TÜCKischer wEIse verSTECKT;) und Dunkelheit (Z. 19: im hAlbdunkel) bedingt. Zum zweiten Hauptfall tritt daher innerhalb des durch die Versetzung konstituierten Vorstellungsraums der dritte Hauptfall hinzu. Dieser wird nicht wie im Standardfall vom Wahrnehmungsraum (WR) aus konstituiert, sondern als Vorstellungsraum zweiten Grades (VR2) von jenem Vorstellungsraum (VR1) aus hergestellt, der durch den zweiten Hauptfall zustande kommt. Die schematische Darstellung der Verschachtelung von zweitem und drittem Hauptfall im vorliegenden Beispiel gestaltet sich wie folgt: deikt. Ausdruck + (Zeige-)Geste INSTANTIIEREN

Zeigeziel

Origo

Origo

Referent WR

VR1

VR2

Verallgemeinernd lässt sich anhand dieser Analyse erstens festhalten, dass die Versetzung durch die Deixis selbst und nicht durch andere Mittel zur Konstruktion eines imaginären Raums geleistet wird. Zweitens offenbart diese Sequenz, dass Sprecher auch mehrfache Versetzungen vollziehen. Diese können – wie im

472

7 Spezielle Fälle

vorherigen Beispiel („realistischer Angreifer“) in Kapitel 7.4.2 – entweder unmittelbar aufeinander folgen oder – wie im vorliegenden Beispiel – ineinander verschachtelt sein. Einen noch komplexeren Fall stellt das nächste Beispiel aus dem „Big Brother“-Korpus dar. Darin vollzieht der Sprecher mehrere aufeinander folgende Versetzungen und wechselt zwischen Wahrnehmungs- und Vorstellungsraum hin und her. Es handelt sich um einen Ausschnitt aus einer Alltagserzählung, bei der der Sprecher mehrfache footing-Wechsel vornimmt, indem er sich in die erzählte Situation versetzt und Aspekte der Erzählung multimodal inszeniert. In der Sequenz erzählt Jürgen zwei Mitbewohnerinnen, Andrea und Joana, wie er beim Krankenhausbesuch in dem Zweibettzimmer seiner Freundin dem Mann der Zimmergenossin begegnet ist. Dieser hat seine Frau, anstatt ihr zur Geburt des Kindes zu gratulieren, beleidigt und beschimpft. Die Analyse konzentriert sich auf die deiktischen Versetzungen, mit denen der Erzähler die Pointe seiner Erzählung gestaltet. Zuvor liefert er einige Hintergrundinformationen, die die Krankenhaussituation im Hinblick auf den Zustand der Frau und die daraus erwachsenden zeitlichen, sozialen und emotionalen Relevanzstrukturen des Besuchs präzisieren. Dieser Teil wird in der Vergangenheit erzählt (Z. 1–4). Von ihm hebt sich der folgende Teil durch mehrfache deiktische Versetzungen und performative Einlagen ab. Der Ausschnitt setzt kurz vor der Pointe ein: Beispiel 2: „Krankenhaus“ (bb01_D_00:11:54)

01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23

Jrg:

Adr: Jrg: Joa: Adr: Jrg: Adr: Jrg:

d_die frau hat das KIND bekommen,= =der mAnn (.) war nicht daBEI, = =kam dann SPÄ:ter, die frau war schon wieder zurück im ZIMmer, kommt der REIN, (-)

(0.8) sO:ho hh so rein, (1.0)

[((lacht))] [((lacht))] boah ich [hätt dem n KOPFschuss verpasst;] [näh das hat der nicht geSAGT; ] ((schnappt lachend nach Luft)) Lachstößen ich_h STEH, h h ich kUck meine h FREUNdin an, hh ((lacht)) o:ah; wenn_ so TRAUrig wär_ne, h

siehst DU dann us; 12 wenn ich DICH sin-= 13 =krieg ich sUn_ne HA:L:S;> 7.4 Deixis am Phantasma 473 14 Adr: [((lacht))] 15 Jrg: [((lacht))] boah ich [hätt dem n KOPFschuss verpasst;] 16 Joa: Beispiel 2 (Fortsetzung) 17 Adr: [näh das hat der nicht geSAGT; ] 18 Jrg: ((schnappt lachend nach Luft)) Lachstößen ich_h STEH, h 19 20 h ich kUck meine h FREUNdin an, hh 21 Adr: ((lacht)) 22 Jrg: o:ah; 23 wenn_ so TRAUrig wär_ne, h Bevor der Erzähler zur Pointe kommt, verdeutlicht er, dass die Frau nach ihrer Entbindung wieder zurück im Zimmer war, als ihr Mann sie besuchen kam. Diese Informationen werden in den Vergangenheitstempora Perfekt und Präteritum gegeben (Z. 1–4). An der Schnittstelle zwischen Narration und Performation vollzieht der Erzähler zunächst eine deiktische Versetzung in die erzählte Zeit und in den erzählten Raum: kommt der REIN, (Z. 5). Diese Versetzung kommt erstens durch den Tempuswechsel ins szenische Präsens und zweitens durch den Gebrauch des deiktischen Bewegungsverbs kommen in Verbindung mit dem lokaldeiktischen Verbzusatz herein zustande.89 Der Ausdruck hereinkommen beschreibt die körperliche Bewegung eines Agenten in einen räumlich umgrenzten Bereich hinein aus der Perspektive dessen, der sich bereits in diesem Raum befindet – also eine Bewegung auf die Origo des Sprechers zu. Doch ist diese Bewegung nicht auf dessen faktische Origo im Hier-und-Jetzt des Wahrnehmungsraums, sondern auf seine Origo im Vorstellungsraum gerichtet. Der „Aufnahmestandpunkt“ (Bühler 1965 [1934]: 135), von dem aus an diesem Punkt in der Erzählung das Geschehen im Krankenhaus imaginiert wird, ist nicht Jürgens Origo als Erzähler (JE), der sich mit seinen Mitbewohnerinnen in der Küche des „Big Brother“-Hauses befindet, sondern seine in die erzählte Zeit, in den erzählten Vorstellungsraum des Krankenhauses und in die erzählte Figur (JF) seines vergangenen Selbst versetzte Origo. Bühler spricht in diesem Zusammenhang vom „Körpertastbild“90, das in räumlicher Relation zu den Personen und Gegebenheiten im Krankenhauszimmer vergegenwärtigt wird. Es handelt sich also an dieser Stelle um eine Instanz des zweiten Hauptfalls der Deixis am Phantasma, die bis zum jetzigen Zeitpunkt in der Erzählung ausschließlich durch verbaldeiktische Mittel zustande kommt:

89 Vgl. zu den deiktischen Verben Fillmore (1997: 77 ff.). 90 Bühler (1965 [1934]: 137).

474

7 Spezielle Fälle

deikt. Ausdruck + (Zeige-)Geste INSTANTIIEREN

Origo

Origo

WR

Zeigeziel Referent

VR

Laut Bühler91 kann für die Zuhörerinnen angenommen werden, dass auch sie die Szene imaginär wahrnehmen, indem sie sich in der Phantasie gleichfalls ins Krankenhauszimmer versetzen. Angeleitet und orientiert durch die vom Erzähler verwendeten deiktischen Sprachmittel sehen die Zuhörerinnen die Figur des Ehemannes aus der Perspektive ihrer imaginär in das Krankenhauszimmer versetzten Origo eintreten. Im nächsten Schritt wechselt der Erzähler die Perspektive, indem er das Eintreten des Mannes nun nicht mehr aus der Beobachterperspektive beschreibt, sondern aus der Figurenperspektive92 eben jenes Mannes ausführt. Dazu verändert er in der 0,8-sekündigen Pause (Z. 7) seine körperlichen Displays: Er macht einige Rückwärtsschritte und stellt dadurch den Bühnenraum bzw. den on- und offstage-Bereich für die bevorstehende Inszenierung her. Am Startpunkt – gewissermaßen an der imaginären Bühnenrampe – erhöht er die Muskelspannung seines Oberkörpers, beugt sich leicht vor, schiebt den Kopf nach vorne und unter-

91 Bühler (1965 [1934]: 137): „Es ist so, wenn sich Mohammed zum Berge ‚versetzt‘ vorkommt, daß sein präsentes Körpertastbild mit einer phantasierten optischen Szene verknüpft wird. Deshalb vermag der Sprecher die Positionszeigwörter hier, da, dort und die Richtungsangaben vorn, hinten, rechts, links genau so am Phantasma wie in der primären Wahrnehmungssituation zu verwenden. Und dasselbe gilt für den Hörer. Der Hörer versteht sie wenn er selbst in ähnlicher Weise ‚versetzt‘ ist, d. h. wenn sein eigenes Körpertastbild mit einer korrespondieren optischen Phantasieszene verknüpft ist.“ 92 Vgl. zur Unterscheidung von Erzähler- und Figurenperspektive bzw. observer und character viewpoint McNeill (2005: 187 ff.).

7.4 Deixis am Phantasma

475

nimmt dann eine Pantomime der dezidiert aggressiven, machohaften Körperhaltung, in der der Mann das Zimmer betritt (Abb. 2.1):

05 06

kommt der REIN, (-) (h) mit BIER? Abbildung 2.1

07 08 09

(0.8) so(h)o

Dadurch dass die Verkörperung (embodiment) bereits vor der Redewiedergabe beginnt, projiziert Jürgens körperliches Verhalten seine verbalen Aktivitäten und kontextualisiert das anschließend Gesagte als fremde Rede. Ein verbum dicendi zur metasprachlichen Rahmung ist insofern verzichtbar, als die Redewiedergabe hier körperlich eingeleitet wird. Im Vollzug der Redewiedergabe wird der footingWechsel darüber hinaus auch prosodisch signalisiert, indem Jürgen ein tieferes Register wählt und ein code-switching in den rheinischen Dialekt vornimmt.93 Doch bevor Jürgen den Mann auch verbal animiert, unterstreicht er mit einer Beschwörungsformel die Glaubwürdigkeit seiner szenischen Darbietung. Durch den beschwörenden Metakommentar tritt er nicht nur verbal aus seiner Darbietung aus, sondern suspendiert diese auch körperlich, indem er eine den verbalen Schwur begleitende Beschwörungsgeste ausführt (Abb. 2.2). Durch den Beschwörungsakt rekonstituiert Jürgen sich sowohl verbal als auch körperlich als Erzähler (JE) und Akteur im Hier-und-Jetzt des Wahrnehmungsraums. Beglaubigungsfor-

93 Vgl. zum code-switching als Mittel des footing-Wechsels Goffman (1981: 126 f. u. 145) sowie Deppermann (2007), Günthner (2002, 2007a, 2007b) und Kotthoff (2007).

476

7 Spezielle Fälle

mel und Beschwörungsgeste gehören zu seiner Rolle als Erzähler (JE). Folglich agiert er in diesem Moment wieder als sounding box, author und principal (vgl. Goffman 1981) seiner ihm selbst eignenden verbalen und nonverbalen Aktivitäten im Hier-und-Jetzt der Erzähltätigkeit. Durch die anschließende Inszenierung des Mannes tritt Jürgen wieder in den Vorstellungsraum des Krankenhauses ein, verschiebt seine Origo jedoch ein weiteres Mal, und zwar auf der personendeiktischen Dimension. Die Origo, von der aus das Folgende zu verstehen ist, ist nun nicht mehr die Perspektive eines in das Krankenhauszimmer versetzten Beobachters, der den Mann eintreten sieht, sondern von dort vollzieht der Erzähler eine weitere Versetzung in die erzählte Figur eben jenes Mannes: deikt. Ausdruck + (Zeige-)Geste INSTANTIIEREN

Origo

Origo

WR Origo

Zeigeziel Referent

VR

Der Wiedereintritt in den Vorstellungsraum wird durch die Reformulierung der Handlungsbeschreibung (Z. 9: °hh so rein,) vollzogen. Diese enthält das Modaldeiktikon so (vgl. dazu Kapitel 7.3), das als Anweisung an die Adressatinnen fungiert, die körperlichen Aktivitäten des Erzählers wahrzunehmen, und das dadurch zugleich die szenische Darbietung projiziert. In der nachfolgenden Pause (Z. 10) schlüpft der Erzähler erneut die körperliche Rolle des Mannes (Abb. 2.3) und setzt damit die Darbietung fort (Abb. 2.3–2.6), die er durch das Zwischenspiel mit der Beschwörungsgeste unterbrochen hat:

7.4 Deixis am Phantasma

477

09 Abbildung 2.3

10 11

Abbildung 2.4

(1.0)

Die Darbietung mündet in eine konzertierte, ko-expressive Aufführung von animierter Rede und animiertem Körper, die zugleich den Höhepunkt der Geschichte und den Höhepunkt der Inszenierung darstellt. Dabei animiert Jürgen Stimme, Wortwahl und prosodische Gestaltung der Äußerung (Z. 11–13), so dass ein layering of voices (Bakhtin 1981, 1986; Günthner 2002, 2007a, 2007b) entsteht mit dem Effekt, dass man durch die Stimme der animierten Figur hindurch die evaluative Stimme des Erzählers mitzuhören vermag. In den Begriffen von Goffmans footing-Theorie (Goffman 1981) agiert Jürgen damit als sounding box einer Äußerung, als deren author und principal der Mann fungiert.

478

7 Spezielle Fälle

Die Redewiedergabe wird begleitet von gestischen Handlungen, die wie die animierte Rede von der versetzten Origo aus – d. h. vom raum-, zeit- und personenperspektivischen Standpunkt der erzählten Figur (character viewpoint, McNeill 1992, 2005) aus – instantiiert werden. Dieses analog zum layering of voices zu konzeptualisierende Phänomen sich überlagernder Körper oder „Körpertastbilder“ (Bühler 1965 [1934]), das dadurch entsteht, dass jemand seinen Körper als Aufführungsinstanz der körperlichen Verhaltensweisen eines anderen einsetzt, bezeichne ich als Lamination von Körpern bzw. Körpertastbildern. Dadurch wird auf der körperlich-visuellen Ebene genau das vollzogen, was bei der Redewiedergabe mit den von Goffman dekonstruierten Sprecherrollen geschieht: Sie werden auf mehrere Akteure verteilt. In der Sequenz fungiert Jürgens Körper als Aufführungsinstanz der dem Ehemann zugeschriebenen körperlichen Verhaltensweisen. So blickt Jürgen (JF), kurz bevor er das deiktische Anredepronomen DU artikuliert, in der Körperrolle des Mannes auf dessen imaginierte Frau im Phantasma-Raum des Krankenhauses (Abb. 2.4). Es folgt ein Konditionalsatz, dessen Protasis ebenfalls ein deiktisches Anredepronomen der zweiten Person enthält (Z. 12: wenn ich DICH sin-). Das Pronomen stellt das verbale Korrelat (lexical affiliate, vgl. Schegloff 1984; McNeill 2005) einer simultan dazu ausgeführten Zeigegeste auf die Angeredete dar (Abb. 2.5). Blick und Zeigegeste weisen zusammen auf einen im Vorstellungsraum zu lokalisierenden imaginären Ort, an dem sich die deiktisch und gestisch fokussierte, in der Vorstellung zu vergegenwärtigende Frau befindet. In der nachfolgenden, syntaktisch projizierten Apodosis (Z. 13) inszeniert Jürgen die in der Redewendung (Z. 13: krieg ich sUn_ne HA:L:S;) artikulierten Aggressionen des Mannes gegenüber seiner Frau, indem er durch eine Geste in Richtung Hals dessen angestaute Wut visualisiert (Abb. 2.6). Es handelt sich um eine am eigenen Körper ausgeführte Geste, doch stellt der Körper des Zeigenden nicht das eigentliche Bezugsobjekt dar, sondern fungiert als Stellvertreter für den Körper der inszenierten Figur. Die Figur ist damit nicht nur author und principal der geäußerten Worte, sondern auch der körperlichen Handlungen. Jürgens Blick in der Rolle der dargebotenen Figur bleibt während der animierten Rede und Gestik auf die imaginierte Frau gerichtet. Das anschließende, gemeinsame Lachen mit seinen Zuhörerinnen sowie deren Kommentare (Z. 14–18) rekonstituieren Jürgen in seiner Rolle als Erzähler (JE) im Hier-und-Jetzt. Der indexikalische Grund dieser Handlungen befindet sich im unmittelbaren Wahrnehmungsraum der „Big Brother“-Küche, in der Jürgen die Geschichte erzählt. Nach dem interaktiven Intermezzo mit seinen Mitbewohnerinnen versetzt Jürgen sich noch einmal in den Vorstellungsraum und inszeniert seine eigenen Reaktionen in der erzählten Situation, indem er in sein vergangenes Selbst (JF) schlüpft. Während er bei der ersten Versetzung in sein vergangenes Selbst jedoch

7.4 Deixis am Phantasma

479

die Beobachterperspektive eingenommen hat, aus der er den Mann ins Krankenhauszimmer eintreten sah, gestaltet sich die Perspektive nun weitaus komplexer: Abbildung 2.7

Abbildung 2.8

ich h

19 Abbildung 2.9

20 21 22 23

Adr: Jrg:

h ich gUck meine h ((lacht)) o:ah; wenn_

STEH, h Abbildung 2.10

hh

FREUNdin an, ;=ne,

h

Einerseits wechselt er auf der körperlich-visuellen Ebene in den performativen Modus und unternimmt eine Selbstanimation seiner Handlungen, für die er notwendigerweise die Figurenperspektive (character viewpoint, McNeill 1992) einnimmt. Dazu begibt er sich zunächst in eine betont aufrechte Körperhaltung, die sowohl mit seiner Animation des aggressiven Ehemannes als auch mit seiner entspannten Körperhaltung als Erzähler kontrastiert (Abb. 2.7). Nach einem kurzen Lacher, der die Darbietung unterbricht (Abb. 2.8), kehrt er körperlich in die Figurenperspektive seines vergangenen Selbst zurück. In dieser Rolle richtet

480

7 Spezielle Fälle

er einen Blick sprachlosen Erstaunens auf seine Freundin (Abb. 2.9) und lokalisiert diese dadurch rechts von sich im Vorstellungsraum. Mit einem weiteren Lacher verlässt er die Darbietung seines vergangenen Verhaltens im imaginären Krankenhauszimmer, blickt seine Adressatinnen im Hier-und-Jetzt des „Big Brother“-Hauses an (Abb. 2.10) und kehrt damit in den unmittelbaren Wahrnehmungsraum zurück. Andererseits bleibt er auf der verbalen Ebene im deskriptiven Modus und liefert eine online-Beschreibung seiner körperlichen Inszenierungen (Z. 19: ich h° STEH,). Diese Handlungsbeschreibungen sind nicht Teil der szenischen Darbietung, denn in der erzählten Situation hat er gerade nicht die Worte ich h° STEH, h° °h ich gUck meine h° FREUNdin an, °hh (Z. 19–20) artikuliert, sondern ist im Gegenteil in sprachloses Erstaunen verfallen. Da die Handlungsbeschreibungen im Präsens erfolgen, sind sie auch kein reiner Bestandteil seiner Rolle als Erzähler (JE) im unmittelbaren Wahrnehmungsraum der „Big Brother“-Küche. Stattdessen werden sie aus der Perspektive des in den Vorstellungsraum des Krankenhauses versetzten Beobachters formuliert. Damit nimmt Jürgen zugleich die Rolle des im Vorstellungsraum Beobachtenden und die Rolle des im Vorstellungsraum Beobachteten bzw. Agierenden ein. Allein die Lachstöße, die sowohl seine szenische Darbietung als auch seine Beschreibung mehrfach unterbrechen (Abb. 2.8 und Abb. 2.10), rekonstituieren ihn für kurze Momente in der Rolle des Erzählers im Hier-und-Jetzt des „Big Brother“-Hauses, bevor er am Ende ganz ins Hier-undJetzt der Erzählsituation zurückkehrt. Jürgen wechselt folglich nicht allein zwischen performativer Ebene (versetzte Figurenperspektive seines reaktualisierten, vergangenen Selbst in der erzählten Situation) und lachend-kommentierender Ebene (nicht versetzte Erzählerperspektive seines im Hier-und-Jetzt des „Big Brother“-Hauses verankerten Selbst), sondern überblendet damit auch noch die handlungsbeschreibende Ebene (versetzte Beobachterperspektive seines vergangenen Selbst in der erzählten Situation) – mit der besonderen Pointe, dass er wie in einer out of body-Erfahrung sich selbst zu beobachten scheint. Es liegt also ein komplexer Rollenmix vor, der sich dadurch auszeichnet, dass unterschiedliche Perspektiven zugleich realisiert und multimodal auf unterschiedliche Ressourcen verteilt werden (vgl. die schematische Darstellung auf der nächsten Seite). Jürgens körperliche Selbstanimation als erzählte Figur (JF) im Vorstellungsraum des Krankenhauses ist in mehrfacher Hinsicht seiner Animation des Ehemannes entgegengesetzt. So kontrastieren die beleidigenden Worte des Mannes an seine Frau mit dem Blick wortlosen Einverständnisses zwischen Jürgen und seiner Freundin und dessen vornüber gebeugte, aggressive Macho-Haltung mit der aufrechten Haltung, die Jürgen als Ausdruck seines sprachlosen Innehaltens in der Reinszenierung seines erinnerten Selbst (JF) einnimmt. Und während der Blick und die Zeigegeste, die Jürgen in der Rolle des seine Frau adressierenden

7.4 Deixis am Phantasma

481

deikt. Ausdruck + (Zeige-)Geste INSTANTIIEREN

Origo

Origo

WR Origo

Origo

Zeigeziel Referent

VR

Ehemannes ausführt94, nach links gerichtet sind (Abb. 2.4–2.6), richtet er den in der Rolle seines vergangenen Selbst ausgeführten Blick zu seiner Freundin nach rechts (Abb. 2.9). Im imaginativ aufgebauten Vorstellungsraum des Krankenhauses zeichnet sich dadurch eine räumliche Mikro-Ökologie ab, der zufolge die Frau des Macho-Mannes das linke Krankenhausbett, Jürgens Freundin hingegen das rechte Krankenhausbett belegt hat. Indem Jürgen im unmittelbaren Wahrnehmungsraum der „Big Brother“-Küche körperlich einen Bühnenraum herstellt und durch seine Inszenierungen ausgestaltet, entsteht ein genuiner Phantasma-Raum mit einer klar definierten räumlichen Binnenstruktur und zwei komplementären, dyadischen Beteiligungsformaten (participation frameworks). Diese bestehen aus dem Macho-Mann

94 Zur Inszenierung der diskreditierenden Unhöflichkeit des Ehemanns gehört auch die Zeigegeste, die dieser in Jürgens Performance im Verbund mit dem personendeiktischen Anredepronomen DICH (Z. 12) auf die Angeredete richtet; vgl. zur Personendeixis ausführlich Kap. 7.1.

482

7 Spezielle Fälle

das vergegenwärtigte Krankenzimmer

Macho-Mann + Frau

Js vergangenes Selbst + Freundin

und seiner Frau, die auf der linken Seite des imaginären Krankenhauszimmers lokalisiert sind, und aus Jürgen und seiner Freundin, die auf der rechten Seite vorzustellen sind. Dieser durch Verbaldeiktika, Redewiedergabe, die Adressierung vorgestellter Personen und die körperliche Animation fremder und eigener Verhaltensweisen strukturierte Vorstellungsraum baut sich wie folgt auf:

7.4 Deixis am Phantasma

483

Die Tatsache, dass Jürgen im Wahrnehmungsraum der „Big Brother“-Küche einen eigenen Bühnenraum herstellt und die Adressatinnen durch seine Darbietung zu Augenzeuginnen einer nicht nur narrativ, sondern auch körperlich-räumlich vergegenwärtigten Szene macht, scheint diese Versetzungen in die Nähe des ersten Hauptfalls zu rücken, den Bühler bezeichnenderweise als „dramatisches Verfahren“ (Bühler 1965 [1934]: 140) charakterisiert hat. Dies ist jedoch insofern irreführend, als Dramatisierungen, begriffen als szenische Vergegenwärtigungen von Imaginärem, sowohl im ersten als auch im zweiten Hauptfall der Deixis am Phantasma stattfinden und dabei unterschiedliche Grade an Gegenwärtigkeit haben können. Dasselbe gilt für Raumüberblendungen. Deixistheoretisch entscheidend ist daher nicht der Grad an Präsenzhaftigkeit bzw. die evokative Qualität, mit dem etwas Abwesendes vorgestellt und vergegenwärtigt wird, sondern die Frage danach, ob die Origo unversetzt aufrecht erhalten (erster Hauptfall) oder durch deiktische Mittel verschoben wird (zweiter Hauptfall). Als drittes und letztes Beispiel zum zweiten Hauptfall soll abschließend eine Sequenz aus dem Kochkorpus untersucht werden. Die Gemeinsamkeit zwischen diesem und dem vorherigen Beispiel besteht darin, dass der Sprecher über die verbaldeiktischen Ressourcen hinaus auf das reiche Veranschaulichungspotenzial körperlicher Ausdrucksressourcen rekurriert und die im Vorstellungsraum stattfindende Situation multimodal inszeniert. Doch anders als im vorherigen Beispiel liefert der Sprecher keine Alltagserzählung, in der individuelle Personen auftreten, sondern er schildert eine Situation, in der die generische Figur des Profikochs auftritt. Zudem zeichnet sich die Darstellung dadurch aus, dass sie als kontrafaktisch gerahmt wird und der Selbstpositionierung des Sprechers als Laie gegenüber der als unerreichbar inszenierten Kompetenz eines Profis dient. Daraus entsteht als weitere Besonderheit die Simultaneität von performativen und handlungsbeschreibenden Elementen, die die deixistheoretische Frage nach dem Grad der Versetzung aufwirft. In dem Ausschnitt erläutert Polettos Gast, Ulrich Pleitgen, die Schwierigkeiten des Laien, beim Kochen den Überblick zu behalten. Um den Gegensatz zwischen Profi und Laien zu veranschaulichen, inszeniert er als Gegenrolle zu sich als Laien einen Profi, der mit raschen, zielsicheren Handgriffen alles unter Kontrolle hat. Während er auf der verbalen Ebene im beschreibenden Modus bleibt, schlüpft er auf der körperlichen Ebene in die Rolle des Profis. Während sich die sprachliche Darstellung auf die Probleme des Laien bezieht, dient die körperliche Inszenierung dazu, kontrastiv die Kompetenz des Profis auf die Bühne zu bringen. So bezieht sich das Relativpronomen der (Z. 3) anaphorisch auf den Laien, der das Referenzobjekt der Negativaussage (Z. 3–5) sowie der nachfolgenden Präsentativkonstruktion (Z. 6: das IST natürlich jemand,) ist. Durch die Gleichzeitigkeit von handlungsbeschreibenden Elementen, die mit einem footing in der Sprecherrolle des Laien geäußert werden und dessen Schwierigkeiten thematisieren, und

484

7 Spezielle Fälle

Beispiel 3: „Kühlschrank“ (PK3_00:00:53)

01

UP:

ja aber dAs_is das problem des LAIen

02

PL:

((lacht)) Abbildung 3.1

03

UP:

der nIch_sO aus_m Abbildung 3.3

Abbildung 3.2

schrank; Abbildung 3.4

szenischen Elementen, die mit dem footing und aus der Origo des Profis ausgeführt werden, entsteht eine Überblendung zwischen Laien- und Profirolle. Wie zu sehen sein wird, hat dies Konsequenzen für den Grad der deiktischen Versetzung. Eingeleitet wird die Inszenierung durch das Modaldeiktikon sO (Z. 3) und Veränderungen im körperlichen Display des Sprechers. Er löst die Hände vom Kochtisch, wischt sie an der Schürze ab (Abb. 3.1) und bringt sie dann in Startposition, während er gleichzeitig den Blick von der Adressatin ab- und einem imaginären Raumbereich zuwendet (Abb. 3.2). Durch die kontrafaktische Rahmung ist klar, dass die deiktisch mit so eingeleitete Darbietung nicht ihn selbst, sondern den

7.4 Deixis am Phantasma

Beispiel 3 (Fortsetzung) Abbildung 3.5

04

und schnEll von HIER, Abbildung 3.7

Abbildung 3.6

05

und_n bisschen was vom

se;

(.)

Abbildung 3.8

06 07 08

das IST der MUSS sich das alles vorher machen-= =weil die konzentration nicht REICHT,

485

486

7 Spezielle Fälle

generischen Gegentypus des Profis auf die Bühne bringt, in den er sich versetzt hat. Als er die Präpositionalphrase aus_m KÜHLschrank (Z. 3) artikuliert, macht er mit dem rechten Arm eine rasche Greifbewegung in die Luft (Abb. 3.3). Die Geste stellt pantominisch das Öffnen eines Kühlschranks dar. Bewegungsbahn und Gipfelpunkt der Geste lokalisieren einen imaginären Kühlschrank schräg rechts vor dem Sprecher. Bevor die Armbewegung abgeschlossen ist, richtet der Sprecher seinen Blick bereits auf einen neuen Verweisraum (Abb. 3.4), der das nächste imaginäre Zeigeziel enthält. Dieses wird in der folgenden Äußerungseinheit mit dem gestisch gebrauchten proximalen Lokaldeiktikon HIER (Z. 4) bezeichnet und durch seitliche Greifbewegungen mit beiden Armen auf der anderen Seite des Sprechers in dessen Hüftbereich lokalisiert (Abb. 3.5). Von dort aus geht die Bewegung fließend in eine dritte Greifbewegung über, die ebenfalls durch den Blick als vorauslaufende, einen neuen Teilbereich des imaginären Raums herstellende Verweisressource kontextualisiert wird (Abb. 3.6). Im Verlauf der dritten Bewegung beugt der Sprecher sich mit dem gesamten Oberkörper nach unten hinter den Kochtisch (Abb. 3.7) und greift in einen auf dem Boden vorzustellenden Behälter, aus dem er ein weiteres Objekt zutage fördert – in diesem Fall imaginäres Gemüse, wie seine zur Greifgeste geformte Hand verkörpert (Abb. 3.8). In der Rolle des Profis manipuliert er imaginäre Objekte in einer imaginären Küche, die durch räumlich entsprechend platzierte Gesten, zeitlich und räumlich entsprechend abgestimmte Blickorientierungen sowie durch den Gebrauch deiktischer Ausdrücke im Vorstellungsraum lokalisiert werden. Die deiktische Versetzung betrifft sowohl die personen- als auch die raumdeiktische Dimension. Wie die aus der Figurenperspektive ausgeführten Gesten indizieren, versetzt der Sprecher sich körperlich in die Figur des Profis, der in einer auf ihn zugeschnittenen, imaginären Küche zielsicher imaginäre Objekte manipuliert. Dazu, dass beim Profi jeder Handgriff sitzt, gehört nicht nur die professionelle intrapersonelle Koordinierung der Arbeitsabläufe, sondern auch eine perfekte, geradezu schlafwandlerische Raumorientierung in der imaginären Küche. Alle diese Aspekte werden von dem Sprecher körperlich inszeniert. Deixistheoretisch ist allerdings zu berücksichtigen, dass der Sprecher auf der verbalen Ebene zugleich in der Rolle des erklärenden, deiktisch nicht versetzten Interaktionsbeteiligten im Hier-und-Jetzt agiert. Zwar bezieht sich das proximale Lokaldeiktikon HIER (Z. 4) nicht auf das Hier-und-Jetzt der Sprechsituation, sondern auf die versetzte Origo der im Vorstellungsraum lokalisierten Figur des Profikochs, von der aus das imaginäre HIER konstituiert wird. Doch ist es nicht die Figur des imaginierten Profikochs, die in der vorgestellten Situation HIER sagt, sondern die erklärende Stimme von Polettos Gast, der die körperliche Darbietung beschreibend und kommentierend begleitet. Während also auf der körperlichen Ebene eine vollständige deiktische Versetzung in die Figur und

7.4 Deixis am Phantasma

487

den sie umgebenden Raum vollzogen wird, findet auf der verbalen Ebene eine Perspektivüberlagerung statt, indem der Sprecher zwar das HIER der Figur übernimmt, über diese aber zugleich weiterhin in der dritten Person und folglich aus der Beobachterperspektive spricht. Das Phänomen einer Diskrepanz zwischen zwei verschiedenen Origines ist bereits von Fricke (2002; 2007) konstatiert und dem Versuch einer zeichentheoretischen Auflösung unterworfen worden. Im Gegensatz dazu wird hier folgender Erkläransatz gewählt: Der Widerspruch muss nicht aufgelöst werden, sondern er stellt im Gegenteil ein wesentliches Merkmal multimodaler Rollenüberlagerungen dar, die auch auf anderen Modalitätsebenen auftreten (vgl. auch Schmitt und Deppermann 2010; Stukenbrock 2012b) und ein theoretisch wohl fundiertes (Bakhtin 1981, 1986; Goffman 1981), in Bezug auf die Prosodie (layering of voices) auch empirisch untersuchtes Phänomen (Deppermann 2007; Günthner 2007a, 2007b) darstellen. Demnach können verschiedene footings gleichzeitig aufrecht erhalten werden, mehrfach ineinander eingebettet sein und ineinander übergehen. Für die Deixis am Phantasma ist entscheidend, dass diese multiplen footings mit deiktischen Ausdrucksmitteln hergestellt werden und weitere Ausdrucksressourcen (Blick, Gestik, Körperpositur, Bewegung im Raum etc.) umfassen, die unterschiedlich verankert sein können. Schematisch zusammengefasst ergibt sich folgende Darstellung für die Besonderheiten des zweiten Hauptfalls der Deixis am Phantasma, die in dieser Sequenz durch den Rollenmix zwischen Figur und Kommentator und die dadurch bedingten mehrfachen Origines zustande kommt: deikt. Ausdruck + (Zeige-)Geste INSTANTIIEREN

OrigoK

OrigoK

Zeigeziel Referent OrigoV

OrigoV WR

VR

488

7 Spezielle Fälle

Während auf der als OrigoK bezeichneten körperlichen Ebene eine vollständige Versetzung in den Vorstellungsraum vollzogen wird, findet auf der als OrigoV bezeichneten verbalen Ebene ein Origo-Splitting zwischen Figuren- und Kommentatorenperspektive bzw. zwischen in den Vorstellungsraum versetzter und im Wahrnehmungsraum verbleibender Origo statt.

Zusammenfassung Ausgangspunkt der in den vorangegangenen Kapiteln unternommenen Analysen zur Deixis am Phantasma bildete Bühlers Postulat von drei theoretisch zu unterscheidenden Hauptfällen. Während der erste und der dritte Hauptfall durch den Erhalt der Origo definiert sind und durch das Kriterium unterschieden werden, ob ein perzeptorisch nicht zugängliches (nicht sichtbares) Demonstratum an der Grenze zum Wahrnehmungsraum lokalisiert (dritter Hauptfall) oder in diesen hineinzitiert wird (erster Hauptfall), zeichnet sich demgegenüber der zweite Hauptfall durch eine Versetzung der Origo in einen Vorstellungsraum aus. Im Unterschied zum dritten Hauptfall, der theoretisch und empirisch dem multimodalen Ablaufformat der demonstratio ad oculos am nächsten steht, kommen sowohl der erste als auch der zweite Hauptfall durch die augenscheinliche Kontrafaktizität der durch die deiktische Zeigehandlung postulierten Relation zwischen Origo (im Normafall der Sprecher) und Zeigeziel zustande. Das bedeutet, dass in beiden Fällen eine ad oculos-Interpretation der deiktischen Suchanweisung buchstäblich „ins Nichts“ führt. Doch während beim ersten Hauptfall die ad oculos-Interpretation der deiktischen Anweisung für den Suchraum erhalten und lediglich für Zeigeziel bzw. Referenten suspendiert wird, wird die ad oculos-Interpretation beim zweiten Hauptfall vollständig außer Kraft gesetzt. Der erste Hauptfall ist dadurch charakterisiert, dass Perzeption und Imagination der Interaktionsbeteiligten in einer spezifischen Weise zusammenwirken müssen, um die Integration eines vorgestellten Phänomens in den aktuellen Wahrnehmungsraum zu leisten. Für das multimodale Ablaufformat der deiktischen Zeigehandlung bedeutet dies, dass die Parameter weitestgehend in Übereinstimmung mit dem Standardfall des ad oculos-Zeigens abgearbeitet werden. Denn will der Zeigende ein imaginäres Phänomen an einem ganz bestimmten Ort im realen Wahrnehmungsraum verankern, muss er wie beim Zeigen auf Anwesendes diesen Ort für seine Adressaten herstellen und verfolgt dabei dieselben Strategien. Erst an dem Punkt, an dem der perzeptorische Parameter des Suchraums etabliert ist, greift die Imagination in der für den ersten Hauptfall spezifischen Weise, indem sie das abwesende Phänomen an der durch den Suchraum markierten Leerstelle vergegenwärtigt oder den Suchraum in der Weise umgestaltet, dass das vorzustellende Phänomen dort Platz hat.

7.4 Deixis am Phantasma

489

Der zweite Hauptfall der Deixis am Phantasma tendiert von allen drei Fällen am stärksten zur Imagination. Er verlangt eine Imagination sowohl des perspektivischen Standpunkts, von dem aus gezeigt wird (Origo), als auch eine Imagination des Phänomens selbst (Zeigeziel bzw. Referent), auf das vom imaginierten Standpunkt aus gezeigt wird. Zeigende und Adressaten müssen sich aus dem Wahrnehmungsraum heraus in einen Vorstellungsraum versetzen und können bei der Konstituierung der zu imaginierenden Phänomene weder auf eine wahrnehmungsräumlich verankerte Origo wie im ersten und dritten Hauptfall noch auf einen perzeptorisch zugänglichen Suchraum wie im ersten Hauptfall rekurrieren. Hinsichtlich des multimodalen Ablaufformats lässt sich feststellen, dass die Parameter zwar häufig analog zur demonstratio ad oculos in Erscheinung treten, dabei aber nicht denselben funktionalen Stellenwert haben. So setzen Sprecherinnen und Sprecher beim zweiten Hauptfall häufig Zeigegesten und entsprechende Blickmuster ein, doch im Gegensatz zur demonstratio ad oculos sowie zum ersten und dritten Hauptfall konstituieren und strukturieren diese visuellen Zeighilfen zusammen mit den Verbaldeiktika ausschließlich einen Vorstellungsraum. In dieser Funktion verlangen sie vom Adressaten anstelle raumbezogener Perzeptionsakte modellbildende Imaginationsakte. Daher nutzt der Adressat die Zeigegesten seines Interaktionspartners nicht als Vektoren zur Auffindung von Suchraum und Zeigeziel im realen Wahrnehmungsraum, sondern er bleibt auf dessen gestische Performanz orientiert, was ein anderes Blickmuster mitbedingt. Die bisherigen Feststellungen gelten für einfache Fälle, die theoretisch problemlos zu konstruieren sind, in der Empirie jedoch verhältnismäßig selten in reiner Form auftreten. Dies ist als empirisches Zwischenergebnis der hier vorgenommenen Untersuchungen zu den drei Hauptfällen der Deixis am Phantasma festzuhalten. Darüber hinaus erhellen die vorgelegten Analysen zugleich die theoretisch bislang unzureichend erfasste Komplexität der Deixis am Phantasma im interaktiven Vollzug. Die Komplexität ergibt sich erstens aus den Überblendungen der von Bühler als Wahrnehmungs- und als Vorstellungsraum bezeichneten Größen. Sowohl im ersten als auch im zweiten Hauptfall können Überblendungen von Wahrnehmungs- und Vorstellungsraum stattfinden, die die rigorose typologische Trennung zwischen diesen beiden Hauptfällen in komplexen Situationen problematisch erscheinen lassen. Eine Möglichkeit, dieses Problem zu lösen, besteht darin, zwei verschiedene Arten der Überblendung von Wahrnehmungs- und Vorstellungsraum zu unterscheiden95 und diese mit der typologischen Differenzierung zwischen erstem

95 Diese Unterscheidung ist mit der blending theory nicht erfassbar. Während die blending theory von zwei input spaces und einem daraus entstehenden blend ausgeht, vermag Bühlers

490

7 Spezielle Fälle

und zweitem Hauptfall der Deixis am Phantasma zu korrelieren: So kann einerseits eine Vergegenwärtigung vorstellungsräumlicher Komponenten im Wahrnehmungsraum (erster Hauptfall: Überblendung des Wahrnehmungsraums mit vorstellungsräumlichen Komponenten) oder andererseits eine Anreicherung des Vorstellungsraums mit wahrnehmungsräumlichen Komponenten (zweiter Hauptfall: Überblendung des Vorstellungsraums mit wahrnehmungsräumlichen Komponenten) stattfinden. Das Unterscheidungskriterium besteht darin, welcher Raum den aufnehmenden Raum darstellt und aus welchem komplementär dazu die importierten Komponenten stammen. Diese Frage lässt sich nicht ohne eine Auseinandersetzung mit der Frage, ob die Origo versetzt oder beibehalten wird, beantworten. Allerdings wäre es zu kurz gegriffen, die Raumfrage von der Origo frage und umgekehrt die Origofrage von der Raumfrage abhängig zu machen, doch genau diese Zirkularität bestimmt die Auffassung von der Deixis am Phantasma. Den Kern dieses unentwirrbar erscheinenden Problems bildet das Raum-Konzept, das durch den hohen theoretischen Stellenwert, den es bereits bei Bühler besitzt, zu einer Dominanz der lokaldeiktischen Dimension geführt hat. Dabei wird verkannt, dass Raum sowohl für die theoretische Modellierung als auch für die empirische Analyse der drei Hauptfälle jeweils einen ganz unterschiedlichen Status besitzt. Während der zweite und der dritte Hauptfall durch genuin raumperzeptorische Eigenschaften definiert sind und ein jeweils charakteristisches Zusammenspiel von Wahrnehmbarem und Nicht-Wahrnehmbaren relevant setzen, funktioniert der zweite Hauptfall anders. Sein Definitionskriterium ist die Origo-Versetzung, die sich nicht allein in der Dimension des Raums, sondern auch in den deiktischen Dimensionen der Zeit und der Person vollziehen kann. Dies hat Konsequenzen für den theoretischen Status des Raums, der sich in Fällen, in denen lediglich eine Versetzung auf personendeiktischer Ebene stattfindet, schnell als metaphorisch erweist. Daraus ergibt sich der zweite Grund für die in den Daten zutage getretene Komplexität der Deixis am Phantasma: So haben die Analysen ergeben, dass es unterschiedliche Grade der Versetzung gibt und dass Versetzungen nicht notwendigerweise alle Dimensionen (Raum, Zeit, Person) zugleich betreffen müssen, sondern einzelne Dimensionen isoliert oder schrittweise nacheinander erfassen

Unterscheidung von zwei Hauptfällen der Deixis am Phantasma die deixistheoretisch relevante Frage nach Origoerhalt versus Origoverschiebung mit dem Phänomen der räumlichen (aber auch der zeitlichen und der personalen) Überblendung zu verbinden. Ein weiterer Vorteil der Bühlerschen Theorie liegt darin, dass sie die von Bühler zwar selbst nicht theoretisierte Differenzierung der Simultaneität unterschiedlicher Origines bzw. multipler verbaler, prosodischer, gestischer und körperlicher footings (Goffman 1981) ermöglicht, die im Konstrukt des blend amalgamiert werden.

7.4 Deixis am Phantasma

491

können. Nicht zuletzt in Abhängigkeit vom Ressourcenaufwand können Versetzungen en passant vollzogen oder als bühnenartig inszenierte multimodale Performances realisiert werden. Sie weisen dementsprechend ein variables Maß an Subtilität bzw. Explizitheit auf. Theoretisch und empirisch bedeutsam ist drittens die Feststellung, dass multiple Origines auftreten können. Dieses Phänomen wird in der vorliegenden Studie als Origo-Splitting konzeptualisiert und von den Graden der Versetzung theoretisch unterschieden. Während sich das Konzept des Versetzungsgrads auf die betroffenen deiktischen Dimensionen bezieht und dem empirisch beobachtbaren Kontinuum subtiler Shifts Rechnung trägt, beinhaltet das Konzept des Origo-Splitting die explizite Zuweisung mehrerer Origines und deren simultane Instaniierung, wie sie insbesondere in den untersuchten Rollenüberlagerungen vorkommen und nur durch eine multimodale Analyse zugänglich werden. Ein vierter Grund für die Komplexität der Deixis am Phantasma liegt darin, dass Sprecher nicht einen einzigen Deixistyp realisieren, sondern zwischen unterschiedlichen Zeigmodi hin und her wechseln. Diese Transformationen zwischen unterschiedlichen Zeigmodi werden erst durch eine emergenzbezogene, vollzugsrekonstruktive Analyseperspektive zugänglich und haben daher bislang keinen Eingang in die Theoriebildung gefunden (vgl. jedoch Hanks 1990). Die vorangegangenen Analysen haben gezeigt, dass die Annahme einer monolithischen Origo die empirische Vielfalt und Vielschichtigkeit der Deixis am Phantasma nicht adäquat erfassen kann (vgl. auch Fricke 2007). Dasselbe gilt für die Begriffe des Wahrnehmungs- und des Vorstellungsraums, die in Bühlers Theorie einen zentralen Stellenwert einnehmen und ein brauchbares heuristisches Kriterium zur Unterscheidung der drei Hauptfälle konstituieren, sich in komplexen Fällen jedoch als begrenzt erweisen. So hat sich als Ergebnis der vorliegenden Analysen ergeben, dass die deiktische Versetzung gemäß dem zweiten Hauptfall nicht notwendigerweise in toto auf allen Dimensionen vollzogen und wieder aufgelöst wird, sondern in andere Versetzungstypen übergehen oder mit diesen interagieren kann. Bezogen auf den Begriff der Origo bedeutet das, dass sie zum einen selektiv in Bezug auf einzelne Dimensionen versetzt und zum anderen einem multimodalen Splitting unterworfen werden kann. Für den theoretischen Status der Begriffe des Wahrnehmungs- und des Vorstellungsraums folgt daraus, dass die raumbezogene Dichotomie zwar eine anschauliche Metapher zur Grundunterscheidung der verschiedenen Typen der Deixis am Phantasma darstellt, keineswegs jedoch das alleinige Kriterium zur Kategorisierung konkreter Fälle konstituieren kann.

8 Schlussdiskussion „Titelträume sind in den Sand geschriebene Prä-Texte“. Mit diesem Zitat zur Suggestivität literarischer Titel und der Imaginationskraft ihrer Leserinnen und Leser habe ich meine Untersuchung zur „Deixis in der face-to-face-Interaktion“ begonnen. Zum Schluss soll nicht vorenthalten werden, wie das Zitat weitergeht (Gerigk 2002: 15): Titelträume sind in den Sand geschriebene Prä-Texte: Die Lektüre des wirklichen Textes, die der Titel gegebenenfalls nach sich zieht, wird diesen Prä-Text automatisch tilgen. Und doch ist es nicht ausgeschlossen, dass sich nach abgeschlossener Lektüre der gelöschte Prä-Text wieder meldet.

Auch wissenschaftliche Titel können Titelträume auslösen. Doch anders als bei literarischen Titeln und den durch sie ausgelösten Titelträumen ist der evokative Spielraum für die freie Phantasie – für Versetzungen ins Phantasma – geringer. Man könnte sogar im Gegenteil behaupten, dass der wissenschaftliche Titel einen Prä-Text konstituiert und damit einen Projektionsbogen entwirft, der durch den Text selbst eingelöst und durch seine Lektüre abgearbeitet wird. Gelingt dies nicht, bleiben beide, Titel und Werk, Prätext (pretext). Unter dem Titel „Deixis in der face-to-face-Interaktion“ hat diese Studie den Versuch unternommen, auf der Grundlage eines breit gestreuten Videokorpus96 das Zusammenspiel zwischen verbalen und körperlich-visuellen Ausdrucksressourcen in deiktischen Prozessen zu beschreiben und in einem theoretischen Modell zu integrieren. Die Untersuchung basiert auf der Überzeugung, dass die Deixis Sprecher und Adressaten in einem semiotisch komplexen „interaktiven Feld“ (interactive field, vgl. Goodwin 2007a) zusammenbringt und daher als interaktive, multimodale Herstellungsleistung aller Beteiligten konzeptualisiert werden muss. Deixis aus interaktionaler, multimodaler Perspektive zu begreifen, bedeutet, sie in der face-to-face-Situation als ihrem eigentlichen Ort und unter ihren genuinen Konstitutionsbedingungen aufzusuchen. Um dies zu leisten, mussten methodische und theoretische Paradigmen zusammengeführt werden, die aufgrund ihrer unterschiedlichen Forschungstraditionen bislang wenig Berührungspunkte hatten: So ist die Deixis von Logik, Sprachphilosophie, Grammatik und Pragma-

96 Bei der Zusammenstellung des Videokorpus wurden unterschiedliche Beteiligungsformate (Dyaden, Mehrpersonenkonstellationen, komplexe Beteiligungsformate in massenmedial vermittelten Bühneninteraktionen), unterschiedliche Formalitätsgrade, kommunikative Genres, stationäre und mobile Settings, verbal dominierte und körperliche-manuell dominierte Aktivitäten, Alltagsinteraktionen und institutionelle Kommunikation (Arzt-Patient-Kommunikation, Lehr-Lern-Interaktion) berücksichtigt.

8 Schlussdiskussion

493

tik als Gegenstand reklamiert, im Vergleich zu theoretischen Bemühungen in den genannten Feldern allerdings kaum empirisch-deskriptiv behandelt worden. Die wenigen deskriptiven Untersuchungen arbeiten zumeist mit schriftsprachlichen Textkorpora und unterwerfen ihren Gegenstand damit einem Reduktionismus, demzufolge zentrale Ausdrucksmittel wie Prosodie, Gestik, Blick, Körperpositur, Proxemik, Bewegungen und Gegebenheiten im Raum wegfallen. Die Gestenforschung wiederum hat ihr Interesse vor allem auf die Beschreibung und Klassifikation von Gestentypen gerichtet und deren Beziehung zur Sprache entweder vernachlässigt oder im Zusammenhang mit kognitiven Theorien zur Sprachgenerierung betrachtet. Bis auf wenige Ausnahmen beginnt sich erst in jüngerer Zeit ein praxeologischer Ansatz durchzusetzen, der neben manuellen Gesten auch andere körperliche Ausdrucksressourcen mit in den Blick nimmt und damit der Multimodalität natürlicher face-to-face-Interaktion Rechnung trägt. Indem diese Arbeit auf die von Karl Bühler im ersten Drittel des 20. Jahrhunderts formulierte Deixistheorie zurückgeht, unternimmt sie auch den Versuch, dessen bahnbrechende Vorstellungen zum zentralen Stellenwert von Gestik, sinnlicher Wahrnehmung, Körper und Raum in deiktischen Prozessen ernst zu nehmen und mit dem im 21. Jahrhundert zur Verfügung stehenden technischen, methodischen und theoretischen Instrumentarium empirisch-deskriptiv zu untersuchen. Die vorgelegten Analysen sind im Spannungsfeld zwischen den deixistheoretischen Errungenschaften Bühlers, den technischen Neuerungen bei der Aufzeichnung, Aufbereitung und Auswertung von Videodaten sowie den methodisch-methodologischen Entwicklungen einer konversationsanalytisch basierten, multimodal erweiterten Interaktionalen Linguistik entstanden. Das Ziel der Analysen bestand darin, die Regularitäten der sozialen Praxis des deiktischen Zeigens interaktionstheoretisch zu konzeptualisieren. Ergebnis dieses Abstraktionsprozesses sind die perzeptorischen, interaktiven und kognitiven Komponenten der deiktischen Zeigehandlung, die die Bausteine des theoretischen Modells bilden. Dieses beschreibt auf abstrakter Ebene die Standardlösung auf das wiederkehrende interaktive Problem der Intersubjektivierung von Gegenständen mittels geteilter Wahrnehmung und Aneignung dieser Gegenstände im gemeinsamen Handlungsvollzug. Der Gültigkeitsanspruch des Modells bezieht sich auf die face-to-face-Interaktion. Es beruht auf dem Kerngedanken, dass die deiktische Zeigehandlung ein multimodales Phänomen darstellt, das sich in bestimmte Teilkomponenten ausdifferenziert, die als Parameter bezeichnet wurden. Aus interaktionaler Perspektive lassen sich diese Teilkomponenten als Aufgaben definieren, die von den Interaktionsbeteiligten gemeinsam abgearbeitet werden. Sie sind auch als „Anweisungen“ formulierbar und tragen damit der Vorstellung vom „Anweisungscharakter“ der deiktischen Prozedur Rechnung, auf den immer wieder hingewiesen wird. Wie die vorliegende Studie nachweist, untergliedert sich die deiktische Zeigehandlung in eine Reihe von perzeptorischen, kognitiven und interaktiven

494

8 Schlussdiskussion

Einzelanweisungen, die erst durch eine mikroanalytische, vollzugsrekonstruktive Analyseperspektive zugänglich werden. Zugleich folgen sie einem bestimmten, in gewissem Maß flexiblen sequenziellen Ablaufformat, das durch fallübergreifende Analysen systematisch wiederkehrender Komponenten erarbeitet wurde. Die Verfahren der demonstratio ad oculos, durch die Interaktionsbeteiligte sich im Hier-und-Jetzt ihres unmittelbaren, sinnlich zugänglichen Wahrnehmungsraums gemeinsam orientieren, sind es auch, mittels derer das Hier-undJetzt transzendiert werden kann, wie dies in der Deixis am Phantasma der Fall ist. Die Untersuchung hat gezeigt, dass deduktive, theoretische Aussagen zum Stellenwert der Geste nur wenig Aussagekraft bezüglich der in den Daten vorgefundenen sozialen Praxen des Zeigens besitzen. So wurde zum einen anhand von Fällen zur Personendeixis und zur Deixis am Phantasma nachgewiesen, dass Zeigegesten entgegen herrschender Auffassungen eine funktional tragende Rolle spielen. Zum anderen wurde anhand von systematisch unterscheidbaren Fällen eines deiktisch-gestischen Gebrauchs des Ausdrucks so auch der Modaldeixis neben den klassischen drei Dimensionen ein zentraler Stellenwert in der face-to-face-Kommunikation zuerkannt. Gegenüber dem gestischen Gebrauch anderer Deiktika liegt die Besonderheit des Modaldeiktikons so darin, dass es nicht mit einer Zeigegeste, sondern mit ikonischen bzw. darstellenden Gesten verbunden wird, die bis zu ganzkörperlichen Darbietungen ausgestaltet werden können. Zum Abschluss komme ich noch einmal auf die Veranschaulichung des theoretischen Modells zurück in dem Bemühen, sowohl die Interaktivität als auch die temporale Emergenz zu visualisieren. Dabei handelt es sich um eine idealtypische Konstruktion, da die Parameter nicht notwendigerweise immer alle realisiert und in derselben Reihenfolge abgearbeitet werden müssen. Im Gegenteil stellt die Variabilität und Flexibilität im sequenziellen Ablaufformat ein wesentliches Merkmal der Kontextadaptivität der deiktischen Zeigehandlung dar.97 Allerdings gehören einige der Parameter (logisch, temporal, sequenziell, interaktiv) enger zusammen als andere. Dies betrifft zum Beispiel den verweisenden Körper (VK) des Zeigenden und dessen Zeigegeste (ZG); die Zeigegeste (ZG) und den deiktischen Ausdruck (DA); den Suchraum (SR), das Zeigeziel (ZZ) und den Referenten (RR). Zur temporalen Variabilität im sequenziellen Ablaufformat kommt eine gewisse Flexibilität hinsichtlich der Zuordnung zwischen Ressourcen und Funktionen hinzu. Auch wenn die verschiedenen Ressourcen für unterschiedliche Dinge unterschiedlich gut geeignet sind und daher prototypische oder privile-

97 So kann sich z. B. ein Sprecher zuerst auf den künftigen VR orientieren, bevor er die FI mit seinem Adressaten herstellt; die Wahrnehmungswahrnehmung kann mehrmals an unterschiedlichen Stationen der emergierenden Zeigehandlung auftreten oder ganz wegfallen, etwa wenn besonders starke common ground-Symmetrien zwischen den Beteiligten bestehen.

8 Schlussdiskussion

495

gierte Beziehungen zwischen Ressourcen und Funktionen bestehen, handelt es sich dabei nicht um 1:1-Beziehungen. Es gibt weder scharfe Grenzen noch kategoriale Ausschließlichkeiten. Zudem haben die Analysen eine Multifunktionalität der Ressourcen zutage gefördert. Der Versuch, ein starres Schema zu entwickeln ist angesichts der Flexibilität, Adaptivität (gerade eine Voraussetzung und ein Ergebnis von Indexikalität!) inadäquat. Die sich in den Realisierungsvarianten manifestierende Variabilität belegt den genuin interaktiven Charakter von Zeigehandlungen. Interaktivität, Flexibilität und Indexikalität sind jedem einzelnen Parameter, dem sequenziellen Zusammenspiel der Parameter und dem multimodalen Gesamtformat einbeschrieben. Zeigehandlungen werden nicht von einem einzelnen, sondern gemeinsam vollbracht. Daher trägt jede Zeigehandlung die Spuren des Zeigenden wie des Adressaten, sie ist immer die gemeinsame Hervorbringung beider. So wie ihr Gelingen abhängig ist von deren interaktiver, perzeptorischer und kognitiver Koordinierung, sind Reparaturen Ausdruck gemeinsamer Nachbesserungen an der Realisierung einzelner Parameter und gescheiterte Versuche Resultat mangelnder Koordinierungsprozesse. Deiktische Zeigehandlungen tragen zudem auch die Spuren des Kontexts und mehr noch, sie konstituieren ihn zugleich. Der Kontext stellt keine präexistente, statische Größe dar, sondern ist das Resultat interaktiver Hervorbringungen98 mittels unterschiedlicher Ressourcen. Er verändert sich in der online-Emergenz der Interaktion fortwährend und muss daher in dieser Veränderbarkeit begriffen werden. Die reflexive Veränderung des Kontexts bedeutet, dass das, was Figur war, im nächsten Zug zum Grund der Folgeäußerung werden kann. Besonders sichtbar wird dies an Ketten von aufeinander aufbauenden Versetzungen und multiplen embeddings bei der Deixis am Phantama, da dort die emergierenden Wechsel in den Figur-Grund-Relationen mit oft unmerklich vollzogenen, subtilen Wechseln zwischen Wahrnehmungs- und Vorstellungsraum bzw. zwischen unterschiedlichen Arten von Phantasma-Räumen einher geht. Das hier vorgelegte Modell der deiktischen Zeigehandlung ist im Kern ein prozessuales Modell, doch sind Emergenz, Temporalität und Interaktivität als zentrale Schlüsselmomente bildlich nur schwer darstellbar. Daher wird in der folgenden Veranschaulichung der zeitliche Prozess, der in der bildlichen Repräsentation eingefroren ist, durch Pfeile symbolisiert, die von den schematisch durch zwei Smiley-Figuren repräsentierten Beteiligten zu den Parametern führen. Die obere Figur repräsentiert den Zeigenden und die untere den Adressaten, so dass die gemeinsamen Anteile beider an der interaktiven Konstitution des gesamten Prozesses sowie seiner Teilaufgaben veranschaulicht wird:

98 Vgl. auch Goodwin und Duranti (1992: 44); Hanks (1992: 70); Mondada (2007: 86).

FI

VR

VK

indexikal. Merkmale

Origo

+

ZG

relat. Merkmale

INSTANTIIEREN

DA

charakter. Merkmale

RR

ZZ

SR

WW

VV

496 8 Schlussdiskussion

8 Schlussdiskussion

497

Als Teilanweisungen lassen sich die Parameter 1–10 wie folgt formulieren: 1. [FI] an Zeigenden und Adressaten: Stellt fokussierte Interaktion her! 2. [VR] an Zeigenden: Orientiere dich im Raum und stelle den Verweisraum für deine künftige Zeigehandlung her! 3. [VK] an Zeigenden: Stelle deinen Körper als verweisenden Körper her! an Adressaten: Nimm die körperlichen Displays deines Interaktionspartners als die eines verweisenden Körpers wahr! 4. [DA] und 5. [ZG] an Zeigenden: Produziere einen deiktischen Ausdruck im Verbund mit einer (Zeige-) Geste, die es deinem Adressaten von seinem momentanen körperlichen Standort aus, mit seiner augenblicklichen Aufmerksamkeitsorientierung und aufgrund seiner Wissensvoraussetzungen ermöglichen, sich auf den indizierten Raumausschnitt zu orientieren, darin das intendierte Zeigeziel aufzufinden und den Referenten zu identifizieren! an Adressaten: Nimm die Zeigegeste deines Interaktionspartners wahr und nutze sie in Kombination mit dem deiktischen Ausdruck, um einen Referenten zu identifizieren! 6. [SR] an Adressaten: Stelle anhand der deiktisch enkodierten Merkmale, der körperlich-visuellen Orientierungshilfen und der vektoriell zu verlängernden Linie der Zeigegeste innerhalb des Wahrnehmungsraums perzeptorisch den Suchraum (ad oculos) bzw. imaginativ den Vorstellungsraum (am Phantasma) her! 7. [ZZ] an Adressaten: Finde innerhalb des Suchraums das Zeigeziel, indem du aus den potenziellen Zeigezielkandidaten auf der Grundlage perzeptorischer (und kognitiver – vgl. 8) Salienzmerkmale das wahrscheinlichste Zeigeziel auswählst! 8. [RR] an Adressaten: Identifiziere den Referenten, indem du auf der Grundlage des gemeinsamen und als gemeinsam gewussten Wissens (shared common ground) die perzeptorischen und die kognitiven Salienzfaktoren miteinander verrechnest! 9. [WW] an Zeigenden: Orientiere dich so, dass du die Wahrnehmungen deines Interaktions-

498

8 Schlussdiskussion

partners wahrnehmen und auf das Gelingen oder Misslingen deiner perzeptorischen Fremdorientierung schließen kannst! 10. [VD] an Adressaten: Dokumentiere, dass du den Referenten hergestellt und die Illokution verstanden hast!

9 Bibliographie Atkinson, J. Maxwell & John Heritage (Hg.) 1984: Structures of Social Action: Studies in Conversation Analysis. Cambridge: Cambridge University Press. Auer, Peter 1981a: Referierungssequenzen in Konversationen: Das Beispiel ‚Ortsangaben‘. Linguistische Berichte 62: 94–106. Auer, Peter 1981b: Zur indexikalitätsmarkierenden Funktion der demonstrativen Artikelform in deutschen Konversationen. In: Götz Hindelang & Werner Zillig (Hg.), Sprache: Verstehen und Handeln, 301–310. Tübingen: Niemeyer. Auer, Peter 1984: Referential Problems in Conversation. Journal of Pragmatics 8(5–6): 627–648. Auer, Peter 1986: Kontextualisierung. Studium Linguistik 19: 22–47. Auer, Peter 1988: On Deixis and Displacement. Folia linguistica 22(3–4): 263–292. Auer, Peter 2000: On line-Syntax – oder: Was es bedeuten könnte, die Zeitlichkeit der mündlichen Sprache ernst zu nehmen. Sprache und Literatur (Themenheft: Die Medialität der Gesprochenen Sprache) 85: 43–56. Auer, Peter 2005a: Syntax als Prozess. InLiSt – Interaction and Linguistic Structures 41. Auer, Peter 2005b: Projection in Interaction and Projection in Grammar. Text & Talk 25(1): 7–36. Auer, Peter 2005c: Delayed Self-repairs as a Structuring Device For Complex Turns in Conversation. In: Auli Hakulinen & Margret Selting (Hg.), Syntax and Lexis in Conversation. Studies on the Use of Linguistic Resources in Talk-in-Interaction, 75–102. Amsterdam: Benjamins. Auer, Peter 2006: Construction Grammar Meets Conversation: Einige Überlegungen am Beispiel von „so“-Konstruktionen. In: Susanne Günthner & Wolfgang Imo (Hg.), Konstruktionen in der Interaktion, 291–314. Berlin/New York: de Gruyter. Auer, Peter 2013: Sprachliche Interaktion. Eine Einführung anhand von 22 Klassikern. 2. Aufl. Berlin/Boston: de Gruyter. Auer, Peter & Aldo Di Luzio (Hg.) 1992: The Contextualization of Language. Amsterdam/ Philadelphia: Benjamins. Auer, Peter & Susanne Uhmann 1982: Aspekte der konversationellen Organisation von Bewertungen. Deutsche Sprache 1: 1–32. Bakhtin, Mikhail 1981: Discourse in the Novel. In: Michael Holquist (Hg.), The Dialogic Imagination. Four Essays, 259–421. Austin: University of Texas Press. Bakhtin, Mikhail 1986: Speech Genres and Other Late Essays. Hg. v. Caryl Emerson & Michael Holquist. Austin: University of Texas Press. Bar-Hillel, Yehoshua 1970: Communication and Argumentation in Pragmatic Languages. In: Bruno Visentini & Camillo Olivetti (Hg.), Linguaggi nella società e nella tecnica. 269–284. Mailand: Edizioni di Communità. Barske, Tobias & Andrea Golato 2010: German so: managing sequence and action. Text & Talk 30(3): 245–266. Benveniste, Émile 1974: Probleme der allgemeinen Sprachwissenschaft. Dt. Erstausgabe. München: List. Bergmann, Jörg R. 1994: Ethnomethodologische Konversationsanalyse. In: Gerd Fritz & Franz Hundsnurscher (Hg.), Handbuch der Dialoganalyse, 3–16. Tübingen: Niemeyer.

500

9 Bibliographie

Bergmann, Jörg R. 2001: Das Konzept der Konversationsanalyse. In: Klaus Brinker, Gerd Antos & Wolfgang Heinemann et al. (Hg.). Text- und Gesprächslinguistik. Ein internationales Handbuch zeitgenössischer Forschung. Bd. 2, 919–927. Berlin/New York: de Gruyter. Birkner, Karin & Anja Stukenbrock (Hg.) 2009: Die Arbeit mit Transkripten in Fortbildung, Lehre und Forschung. Mannheim: Verlag für Gesprächsforschung. Blühdorn, Hardarik 1993: Deixis und Deiktika in der deutschen Gegenwartssprache. Deutsche Sprache 21(1): 44–62. Blühdorn, Hardarik 1995: Was ist Deixis? Linguistische Berichte 156: 109–142. Blühdorn, Hardarik 2002: Rauminformation und Demonstrativität. Am Beispiel des Deutschen. Deutsche Sprache 30(3): 252–275. Bohle, Ulrike 2007: Das Wort ergreifen – das Wort übergeben. Explorative Studie zur Rolle redebegleitender Gesten in der Organisation des Sprecherwechsels. Berlin: Weidler. Braunmüller, Kurt 1977: Referenz und Pronominalisierung. Zu den Deiktika und Proformen des Deutschen. Tübingen: Niemeyer. Bühler, Karl [1934] 1965: Sprachtheorie. Die Darstellungsfunktion der Sprache. 2. Auflage. Stuttgart: Gustav Fischer Verlag. Bühler, Karl 1990: Theory of Language. The Representational Function of Language. Translated by Donald Fraser Goodwin. Amsterdam/Philadelphia: Benjamins. Butterworth, George 1995: Origins of Mind in Perception and Action. In: Chris Moore & Philip J. Dunham (Hg.), Joint Attention. Its Origins and Role in Development, 29–40. Hillsdale, NJ: Lawrence Erlbaum Associates. Butterworth, George 2003: Pointing is the Royal Road to Language for Babies. In: Sotaro Kita (Hg. ), Pointing. Where Language, Culture, and Cognition Meet, 9–33. Mahwah, NJ: Erlbaum. Butterworth, George & Shoji Itakura 1998: Development of Precision Grips in Chimpanzees. Developmental Science 1(1): 39–43. Butterworth, George & Shoji Itakura 2000: How the eyes, head and hand serve definite reference. British Journal of Developmental Psychology 18(1): 25–50. Calbris, Geneviève 1990: The semiotics of French gestures. Bloomington: Indiana University Press. Cheang, Kiseang 1990: Semantik der Deixis. Eine organismische Analyse sprachlicher Deixis. Opladen: Westdeutscher Verlag. Clark, Herbert H. 1996: Using language. Cambridge: Cambridge University Press. Clark, Herbert H. 2003: Pointing and Placing. In: Sotaro Kita (Hg. ), Pointing. Where Language, Culture, and Cognition Meet, 243–268. Mahwah, NJ: Erlbaum. Clark, Herbert H., Susan E. Brennan & Stephanie D. Teasley 1991: Grounding in Communication. In: Lauren B. Resnick & John M. Levine (Hg.), Perspectives on Socially Shared Cognition, 127–149. Washington, DC: American Psychological Association. Clark, Herbert H. & Richard J. Gerrig 1990: Quotations as Demonstrations. Language 66(4): 764–805. Clark, Herbert H., Robert Schreuder & Samuel Buttrick 1983: Common Ground and the Understanding of Demonstrative Reference. Journal of Verbal Learning and Verbal Behavior 22(2): 245–258. Clark, Herbert H. & Deanna Wilkes–Gibbs 1986: Referring as a Collaborative Process. Cognition 22(1): 1–39. Consten, Manfred (2004): Anaphorisch oder deiktisch? Zu einem integrativen Modell domänengebundener Referenz. Tübingen: Niemeyer.

9 Bibliographie

501

Couper-Kuhlen, Elizabeth & Margret Selting (Hg.) 1996: Prosody in Conversation. Interactional Studies. Cambridge/New York: Cambridge University Press. de Jorio, Andrea [1832] 2000: Gesture in Naples and Gesture in Classical Antiquity. A Translation of Andrea de Jorio’s La mimica degli antichi investigata nel gestire napoletano. Translated and edited by Adam Kendon. Bloomington: Indiana University Press. Deizi, Urs 1989: Honig. Eine autoethnographische Studie zum Schlüsselsymbol einer Mikrogemeinschaft. Bochum. Deppermann, Arnulf 2007: Playing With the Voice of the Other: Stylized Kanaksprak in Conversations Among German Adolescents. In: Peter Auer (Hg.), Style and Social Identities. Alternative Approaches to Linguistic Heterogeneity, 325–360. Berlin/New York: Walter de Gruyter. Deppermann, Arnulf & Reinhold Schmitt 2007: Koordination. Zur Begründung eines neuen Forschungsgegenstandes. In: Reinhold Schmitt (Hg.), Koordination. Analysen zur multimodalen Interaktion, 15–54. Tübingen: Narr. Deppermann, Arnulf & Reinhold Schmitt 2008: Verstehensdokumentationen: Zur Phänomenologie von Verstehen in der Interaktion. Deutsche Sprache 3: 220–245. Diessel, Holger 1999: Demonstratives. Form, Function and Grammaticalization. Amsterdam: Benjamins. Diessel, Holger 2006: Demonstratives, Joint Attention, and the Emergence of Grammar. Cognitive Linguistics 17(4): 463–489. Diewald, Gabriele Maria 1991: Deixis und Textsorten im Deutschen. Tübingen: Niemeyer. Drew, Paul & Anthony Wootton (Hg.) 1988: Erving Goffman. Exploring the Interaction Order. Boston: Northeastern University Press. Duranti, Alessandro & Charles Goodwin (Hg.) 1992: Rethinking Context. Language as an Interactive Phenomenon. Cambridge: Cambridge University Press. Eco, Umberto 1976: A Theory of Semiotics. Bloomington: Indiana University Press. Efron, David [1941] 1972: Gesture, Race and Culture. Den Haag: Mouton. Ehlich, Konrad 1979: Verwendungen der Deixis beim sprachlichen Handeln. Linguistisch-philologische Untersuchungen zum hebräischen deiktischen System. Frankfurt am Main/Bern/ Las Vegas: Lang. Ehlich, Konrad 1982: Anaphora and Deixis: Same, Similar, or Different? In: Robert J. Jarvella & Wolfgang Klein (Hg.), Speech, Place, and Action. Studies in Deixis and Related Topics, 315–338. Chichester: Wiley. Ehlich, Konrad 1983: Deixis und Anapher. In: Gisa Rauh (Hg.), Essays on Deixis, 79–97. Tübingen: Narr. Ehlich, Konrad 1985: Literarische Landschaft und deiktische Prozedur: Eichendorff. In: Harro Schweizer (Hg.), Sprache und Raum. Psychologische und linguistische Aspekte der Aneignung und Verarbeitung von Räumlichkeit, 246–261. Stuttgart: Metzler. Ehlich, Konrad 1987: so – Überlegungen zum Verhältnis sprachlicher Formen und sprachlichen Handelns, allgemein und an einem widerspenstigen Beispiel. In: Inger Rosengren (Hg.), Sprache und Pragmatik, 279–298. Stockholm: Almqvist und Wiksell. Ehlich, Konrad 2007: Sprache und sprachliches Handeln. Berlin/New York: de Gruyter. Ehmer, Oliver 2011: Imagination und Animation. Die Herstellung mentaler Räume durch animierte Rede. Berlin/New York: de Gruyter. Ehrich, Veronika 1982: Da and the System of Spatial Deixis in German. In: Jürgen Weissenborn & Wolfgang Klein (Hg.), Here and There, 43–63. Amsterdam: Benjamins.

502

9 Bibliographie

Ehrich, Veronika 1983: ‚Da‘ im System der lokalen Demonstrativadverbien des Deutschen. Zeitschrift für Sprachwissenschaft 2: 197–219. Ehrich, Veronika 1985: Zur Linguistik und Psycholinguistik der sekundären Raumdeixis. In: Harro Schweizer (Hg.), Sprache und Raum. Psychologische und linguistische Aspekte der Aneignung und Verarbeitung von Räumlichkeit, 130–162. Stuttgart: Metzler. Ehrich, Veronika 1992: Hier und jetzt. Studien zur lokalen und temporalen Deixis im Deutschen. Tübingen: Niemeyer. Ehrich, Veronika & Heinz Vater 1988: Temporalsemantik. Beiträge zur Linguistik der Zeitreferenz. Tübingen: Niemeyer. Eibl-Eibesfeldt, Irenäus 1987: Grundriss der vergleichenden Verhaltensforschung. 7. Auflage. München: Piper. Eisenberg, Peter 2006: Grundriss der deutschen Grammatik. 2 Bde. 3., durchgesehene Auflage. Stuttgart: Metzler. Ekman, Paul & Wallace V. Friesen 1969: The Repertoire of Nonverbal Behaviour: Categories, Origins, Usage, and Coding. Semiotica 1: 49–98. Enfield, Nicholas J. 2001: ‘Lip-pointing’. A Discussion of Form and Function with Reference to Data from Laos. Gesture 1(2): 185–212. Enfield, Nicholas J. 2003: Demonstratives in Space and Interaction: Data from Lao Speakers and Implications for Semantic Analysis. Language 79(1): 82–117. Enfield, Nicholas J. & Stephen C. Levinson (Hg.) 2006: Roots of human sociality. Culture, cognition and interaction. Oxford: Berg. Eriksson, Mats 2009: Referring as Interaction: On the Interplay Between Linguistic and Bodily Practices. Journal of Pragmatics 41(2): 240–262. Fillmore, Charles 1972: Ansätze zu einer Theorie der Deixis. In: Ferenc Kiefer (Hg.), Semantik und generative Grammatik, 147–174. Frankfurt am Main: Athenäum-Verlag. Fillmore, Charles 1982: Towards a Descriptive Framework for Spatial Deixis. In: Robert J. Jarvella & Wolfgang Klein (Hg.), Speech, Place, and Action. Studies in Deixis and Related Topics, 31–60. Chichester: Wiley. Fillmore, Charles 1997: Lectures on Deixis. Stanford, CA: CSLI Publications. Flom, Ross, Kang Lee & Darwin Muir (Hg.) 2007: Gaze Following: Its Development and Significance. Mahwah, NJ: Erlbaum. Fricke, Ellen 2002: Origo, Pointing, and Speech. The Impact of Co-speech Gestures on Linguistic Deixis Theory. Gesture 2(2): 207–226. Fricke, Ellen 2007: Origo, Geste und Raum. Lokaldeixis im Deutschen. Berlin/New York: de Gruyter. Fuchs, Anna 1988: Dimensionen der Deixis im System der deutschen ‚Tempora‘. In: Veronika Ehrich & Heinz Vater (Hg.), Temporalsemantik. Beiträge zur Linguistik der Zeitreferenz, 1–25. Tübingen: Niemeyer. Garfinkel, Harold 1967: Studies in Ethnomethodology. Englewood Cliffs, NJ: Prentice-Hall. Garfinkel, Harold 2002: Ethnomethodology’s Program. Working Out Durkheim’s Aphorism. Lanham MD: Rowman & Littlefield. Gazin, Anne-Danièle & Elwys De Stefani 2014: Instructional sequences in driving lessons: Mobile participants and the temporal and sequential organization of actions. Journal of Pragmatics 65: 63–79. Gerigk, Horst-Jürgen 2002: Lesen und Interpretieren. Göttingen: Vandenhoeck und Ruprecht. Goffman, Erving 1963: Behavior in Public Places. Notes on the Social Organization of Gatherings. New York: Free Press of Glencoe.

9 Bibliographie

503

Goffman, Erving 1967: Interaction Ritual. Essays on Face-to-face Behavior. Garden City, NY: Doubleday. Goffman, Erving 1974: Frame Analysis. An Essay on the Organization of Experience. New York: Harper & Row. Goffman, Erving 1981: Forms of Talk. Philadelphia: University of Pennsylvania Press. Goldin-Meadow, Susan & Synthia Butcher 2003: Pointing Toward Two-word Speech in Young Children. In: Sotaro Kita (Hg.), Pointing. Where Language, Culture, and Cognition Meet, 85–107. Mahwah, NJ: Erlbaum. Goodwin, Charles 1980: Restarts, Pauses, and the Achievement of a State of Mutual Gaze at Turn-Beginning. Sociological Inquiry 50(3–4): 272–302. Goodwin, Charles 1986: Gesture as a Resource for the Organization of Mutual Orientation. Semiotica 62(1–2): 29–49. Goodwin, Charles 1994: Professional Vision. American Anthropologist 96(3): 606–633. Goodwin, Charles 2000a: Pointing and the Collaborative Construction of Meaning in Aphasia. Texas Linguistic Forum 43: 67–76. Goodwin, Charles 2000b: Action and Embodiment within Situated Human Interaction. Journal of Pragmatics 32(10): 1489–1522. Goodwin, Charles 2000c: Gesture, Aphasia, and Interaction. In: David McNeill (Hg.), Language and Gesture, 84–98. Cambridge: Cambridge University Press. Goodwin, Charles 2003a: Pointing as Situated Practice. In: Sotaro Kita (Hg.), Pointing. Where Language, Culture, and Cognition Meet, 217–241. Mahwah, NJ: Erlbaum. Goodwin, Charles 2003b: The Body in Action. In: Justine Coupland & Richard Gwyn (Hg.), Discourse, the Body, and Identity, 19–42. Hampshire: Palgrave Macmillan. Goodwin, Charles 2007a: Environmentally Coupled Gestures. In: Susan D. Duncan, Justine Cassell & Elena T. Levy (Hg.), Gesture and the Dynamic Dimension of Language. Essays in Honor of David McNeill, 195–212. Philadelphia: Benjamins. Goodwin, Charles 2007b: Interactive Footing. In: Elizabeth Holt & Rebecca Clift (Hg.), Reporting Talk. Reported Speech in Interaction, 16–46. Cambridge: Cambridge University Press. Goodwin, Charles & Alessandro Duranti 1992: Rethinking Context: an Introduction. In: Alessandro Duranti & Charles Goodwin (Hg.), Rethinking Context. Language as an Interactive Phenomenon, 1–42. Cambridge: Cambridge University Press. Goodwin, Charles & Marjorie H. Goodwin 1986: Gesture and Co-Participation in the Activity of Searching for a Word. Semiotica 62(1–2): 51–75. Goodwin, Charles & Marjorie H. Goodwin 1987: Concurrent Operations on Talk. Notes on the Interactive Organization of Assessments. IPrA Papers in Pragmatics 1(1): 1–54. Goodwin, Charles & Marjorie H. Goodwin 1992: Assessment and the Construction of Context. In: Alessandro Duranti & Charles Goodwin (Hg.), Rethinking Context. Language as an Interactive Phenomenon, 147–190. Cambridge: Cambridge University Press. Goodwin, Charles & John Heritage 1990: Conversation Analysis. Annual Review of Anthropology 19: 283–307. Goodwin, Marjorie H. 1980a: Processes of Mutual Monitoring Implicated in the Production of Description Sequences. Sociological Inquiry 50(3–4): 303–317. Goodwin, Marjorie H. 1980b: He-Said-She-Said: Formal Cultural Procedures for the Construction of a Gossip Dispute Activity. American Ethnologist 7(4): 674–695. Goodwin, Marjorie H. 2006a: The Hidden Life of Girls. Games of Stance, Status, and Exclusion. Malden, MA: Wiley-Blackwell.

504

9 Bibliographie

Goodwin, Marjorie 2006b: Participation, affect, and trajectory in family directive/response sequences. Text & Talk 26(4–5): 515–543. Green, Keith (Hg.) 1995a: New Essays in Deixis. Discourse, Narrative, Literature. Amsterdam: Rodopi. Green, Keith 1995b: Deixis: A Revaluation of Concepts and Categories. In: Keith Green (Hg.), New Essays in Deixis. Discourse, Narrative, Literature, 11–25. Amsterdam: Rodopi. Grice, Paul 1957: Meaning. The Philosophical Review 66(3): 377–388. Grice, Paul 1975: Logic and Conversation. In: Peter Cole & Jerry L. Morgan (Hg.), Syntax and Semantics. Speech Acts, Vol. 3, 41–58. New York/San Francisco/London: Academic Press. Gülich, Elisabeth & Thomas Kotschi 1987: Reformulierungshandlungen als Mittel der Textkonstitution. Untersuchungen zu französischen Texten aus mündlicher Kommunikation. In: Wolfgang Motsch (Hg.), Satz, Text, sprachliche Handlung, 199–261. Berlin: Akademie Verlag. Gullberg, Marianne & Sotaro Kita 2009: Attention to Speech-Accompanying Gestures: Eye Movements and Information Uptake. Journal of Nonverbal Behavior 33(4): 251–277. Gumperz, John J. 1992a: Contextualization and Understanding. In: Alessandro Duranti & Charles Goodwin (Hg.), Rethinking Context. Language as an Interactive Phenomenon, 229–252. Cambridge: Cambridge University Press. Gumperz, John J. 1992b: Contextualization Revisited. In: Peter Auer & Aldo Di Luzio (Hg.), The Contextualization of Language, 39–54. Amsterdam/Philadelphia: Benjamins. Günthner, Susanne 2006: Zwischen Scherz und Schmerz – Frotzelaktivitäten in Alltagsinteraktionen. In: Helga Kotthoff (Hg.), Scherzkommunikation. Beiträge aus der empirischen Gesprächsforschung, 81–108. Radolfzell: Verlag für Gesprächsforschung. Günthner, Susanne 2007a: Ansätze zur Erforschung der „kommunikativen Praxis“: Redewiedergabe in der Alltagskommunikation. In: Vilmos Ágel & Mathilde Hennig (Hg.), Zugänge zur Grammatik der gesprochenen Sprache, 73–98. Tübingen: Niemeyer. Günthner, Susanne 2007b: The Construction of Otherness in Reported Dialogues as a Resource for Identity Work. In: Peter Auer (Hg.), Style and Social Identities. Alternative Approaches to Linguistic Heterogeneity, 419–443. Berlin/New York: Mouton de Gruyter. Halliday, Michael & Ruqaiya Hasan 1979: Cohesion in English. London: Longman. Hanks, William F. 1990: Referential Practice. Language and Lived Space Among the Maya. Chicago: University of Chicago Press. Hanks, William F. 1992: The Indexical Ground of Deictic Reference. In: Alessandro Duranti & Charles Goodwin (Hg.), Rethinking Context. Language as an Interactive Phenomenon, 43–77. Cambridge: Cambridge University Press. Hanks, William F. 1996: Language and Communicative Practices. Boulder: Westview Press. Hanks, William F. 2005: Explorations in the Deictic Field. Current Anthropology 46(2): 191–220. Hanks, William F. 2009: Fieldwork on Deixis. Journal of Pragmatics 41(1): 10–24. Harweg, Roland 1990: Studien zur Deixis. Bochum: Brockmeyer. Hausendorf, Heiko 1995: Deixis and Orality. Explaining Games in Face to Face Interaction. In: Uta M. Quasthoff (Hg.), Aspects of oral communication, 181–197. Berlin/New York: de Gruyter. Hausendorf, Heiko 2003: Deixis and Speech Situation Revisited. The Mechanism of Perceived Perception. In: Friedrich Lenz (Hg.), Deictic Conceptualisation of Space, Time and Person, 249–269. Amsterdam: Benjamins. Hausendorf, Heiko (Hg.) 2007: Gespräch als Prozess. Linguistische Aspekte der Zeitlichkeit verbaler Interaktion. Tübingen: Narr.

9 Bibliographie

505

Haviland, John B. 2000: Pointing, Gesture Space, and Mental Maps. In: David McNeill (Hg.), Language and Gesture, 13–46. Cambridge: Cambridge University Press. Haviland, John B. 2003: How to Point in Zinacanán. In: Sotaro Kita (Hg.), Pointing. Where Language, Culture, and Cognition Meet, 139–169. Mahwah, NJ: Erlbaum. Haviland, John B. 2004: Gesture. In: Alessandro Duranti (Hg.), A Companion to Linguistic Anthropology, 197–221. Malden, MA: Blackwell. Heath, Christian 1986: Body Movement and Speech in Medical Interaction. Cambridge: Cambridge University Press. Heath, Christian 2002: Demonstrative Suffering: The Gestural (Re)embodiment of Symptoms. Journal of Communication 52(3): 597–616. Heath, Christian & Paul Luff 2007: Gesture and Institutional Interaction. Figuring Bids in Auctions of Fine Art and Antiques. Gesture 7(2): 215–240. Helfrich, Hede & Harald G. Wallbott 1980: Theorie der nonverbalen Kommunikation. In: Hans Peter Althaus, Helmut Henne & Herbert Ernst Wiegand (Hg.), Lexikon der Germanistischen Linguistik. 2., vollst. neu bearb. u. erw. Auflage, 267–275. Tübingen: Niemeyer. Hennig, Mathilde 2006: So, und so, und so weiter. Vom Sinn und Unsinn der Wortklassifikation. Zeitschrift für germanistische Linguistik 34(3): 409–431. Herbermann, Clemens-Peter 1988: Modi Referentiae. Studien zum sprachlichen Bezug zur Wirklichkeit. Heidelberg: Winter. Heritage, John 1984: A Change-of-state Token and Aspects of its Sequential Placement. In: John Maxwell Atkinson & John Heritage (Hg.), Structures of Social Action. Studies in Conversation Analysis. 1. Auflage, 299–345. Cambridge: Cambridge University Press. Heritage, John & Charles Raymond 2005: The Terms of Agreement: Indexing Epistemic Authority and Subordination in Talk-in-Interaction. Social Psychology Quarterly 68(1): 15–38. Himmelmann, Nikolaus P. 1996: Demonstratives in Narrative Discourse: A Taxonomy of Universal Uses. In: Barbara A. Fox (Hg.), Studies in Anaphora, 205–254. Amsterdam: Benjamins. Himmelmann, Nikolaus P. 1997: Deiktikon, Artikel, Nominalphrase. Zur Emergenz syntaktischer Struktur. Tübingen: Niemeyer. Hindmarsh, Jon & Christian Heath 2000: Embodied Reference: A Study on Deixis in Workplace Interaction. Journal of Pragmatics 32(12): 1855–1878. Hockett, Charles 1960: The Origin of Speech. Scientific American 203: 88–96. Holt, Elizabeth & Rebecca Clift (Hg.) 2007: Reporting Talk. Reported Speech in Interaction. Cambridge: Cambridge University Press. Hopper, Paul J. 1992: Times of the Sign. Discourse, Temporality and Recent Linguistics. Time and Society 1(2): 223–238. Hopper, Paul J. 1997: Discourse and the Category “Verb” in English. Language and Communication 17(2): 93–102. Hutchby, Ian & Robin Wooffitt 2005: Conversation Analysis. Principles, Practices and Applications. Oxford: Polity. Jakobson, Roman [1957] 1971: Shifters, Verbal Categories, and the Russian Verb. In: Roman Jakobson, Selected Writings, Volume 2, 130–147. Berlin: Mouton de Gruyter. Jarvella, Robert J. & Wolfgang Klein (Hg.) 1982: Speech, Place, and Action. Studies in Deixis and Related Topics. Chichester: Wiley. Jespersen, Otto [1924] 1965: The Philosophy of Grammar. London: Allen und Unwin.

506

9 Bibliographie

Kendon, Adam 1972: Some Relationships Between Body Motion and Speech. An Analysis of an Example. In: Aron Wolfe Siegman (Hg.), Studies in Dyadic Communication, 177–210. New York: Pergamon Press. Kendon, Adam 1980: Gesticulation and Speech: Two Aspects of the Process of Utterance. In: Mary Ritchie Key (Hg.), The Relationship of Verbal and Nonverbal Communication, 207–227. Den Haag: Mouton. Kendon, Adam 1990: Conducting Interaction. Patterns of Behavior in Focused Encounters. Cambridge: Cambridge University Press. Kendon, Adam 2004: Gesture. Visible Action as Utterance. Cambridge: Cambridge University Press. Kendon, Adam & Laura Versante 2003: Pointing by Hand in “Neapolitan”. In: Sotaro Kita (Hg.), Pointing. Where Language, Culture, and Cognition Meet, 109–137. Mahwah, NJ: Erlbaum. Kita, Sotaro 1993: Language and Thought Interface: A Study of Spontaneous Gestures and Japanese Mimetics. Department of Psychology and Department of Linguistics. Chicago: University of Chicago Press. Kita, Sotaro (Hg.) 2003a: Pointing. Where Language, Culture, and Cognition Meet. Mahwah, NJ: Erlbaum. Kita, Sotaro 2003b: Pointing: A Foundational Building Block of Human Communication. In: Sotaro Kita (Hg.), Pointing. Where Language, Culture, and Cognition Meet, 1–8. Mahwah, NJ: Erlbaum. Klein, Wolfgang 1978: Wo ist hier? Präliminarien zu einer Untersuchung der lokalen Deixis. Linguistische Berichte 58: 18–40. Klein, Wolfgang 1990: Überall und nirgendwo. Subjektive und objektive Momente in der Raumreferenz. Zeitschrift für Literaturwissenschaft und Linguistik 78: 9–42. Kühn, Christine 2002: Körper – Sprache. Elemente einer sprachwissenschaftlichen Explikation non-verbaler Kommunikation. Frankfurt am Main: Lang. Kühn, Christine 2005: Von Gestik, Sprache und halben Wahrheiten. Zur Notwendigkeit einer integrativen Perspektive auf sprachliche und visuell-körperliche Kommunikation im Verstehensprozess. Osnabrücker Beiträge zur Sprachtheorie 70: 93–115. Levinson, Stephen C. 1995: Interactional Biases in Human Thinking. In: Esther N. Goody (Hg.), Social Intelligence and Interaction. Expressions and Implications of the Social Bias in Human Intelligence, 221–260. Cambridge: Cambridge University Press. Levinson, Stephen C. 2000: Pragmatik. 3. Auflage. Tübingen: Niemeyer. Levy, Elena T. & David McNeill 1992: Speech, Gesture, and Discourse. Discourse Processes 15(3): 277–301. Liddell, Scott K. 2000: Blended Spaces and Deixis in Sign Language Discourse. In: David McNeill (Hg.), Language and Gesture, 331–357. Cambridge: Cambridge University Press. Lindwall, Oskar & Anna Ekström 2012: Instruction-in-interaction: the teaching and learning of a manual skill. Human Studies 35(1): 27–49. Linell, Per [1982] 2005: The Written Language Bias in Linguistics: Its Nature, Origins and Transformations. London: Routledge. Loehr, Daniel 2007: Aspects of Rhythm in Gesture and Speech. Gesture 7(2): 179–214. Luhmann, Niklas 1984: Soziale Systeme. Grundriß einer allgemeinen Theorie. Frankfurt am Main: Suhrkamp. Lyons, John 1977: Semantics. Cambridge: Cambridge University Press. Lyons, John 1983: Semantik. München: Beck.

9 Bibliographie

507

McNeill, David 1987: So You Do Think Gestures Are Nonverbal? A Reply to Feyereisen. Psychological Review 94(4): 499–504. McNeill, David 1992: Hand and Mind. What Gestures Reveal About Thought. Chicago: University of Chicago Press. McNeill, David 2000: Language and Gesture. Cambridge: Cambridge University Press. McNeill, David 2005: Gesture and Thought. Chicago: University of Chicago Press. McNeill, David, Justine Cassell & Elena T. Levy 1993: Abstract Deixis. Semiotica 95(1–2): 5–19. Mondada, Lorenza 2002: Die Indexikalität der Referenz in der sozialen Interaktion: diskursive Konstruktionen von ‚ich‘ und ‚hier‘. Zeitschrift für Literaturwissenschaft und Linguistik 125: 79–113. Mondada, Lorenza 2007: Interaktionsraum und Koordinierung. In: Reinhold Schmitt (Hg.), Koordination. Analysen zur multimodalen Interaktion, 55–93. Tübingen: Narr. Mondada, Lorenza 2009: The Embodied and Negotiated Production of Assessments in Instructed Actions. Research in Language and Social Interaction 42(4): 329–361. Mondada, Lorenza 2011: The situated Organization of Directives in French: Imperatives and Action Coordination in Video Games. Nottingham French Studies 50(2): 19–50. Mondada, Lorenza 2012: Deixis: an integrated interactional multimodal analysis. In: Pia Bergmann, Jana Brenning, Martin Pfeiffer & Elisabeth Reber (Hg.), Prosody and Embodiment in Interactional Grammar, 173–206. Berlin/Boston: de Gruyter. Müller, Cornelia 1996: Zur Unhöflichkeit von Zeigegesten. Osnabrücker Beiträge zur Sprachtheorie 52: 196–222. Müller, Cornelia 1998: Redebegleitende Gesten. Kulturgeschichte, Theorie, Sprachvergleich. Berlin: Spitz. Müller, Cornelia 2004: Forms and Uses of the Palm Up Open Hand: A Case of a Gesture Family? In: Cornelia Müller & Roland Posner (Hg.), The Semantics and Pragmatics of Everyday Gestures. Proceedings of the Berlin Conference April 1998, 233–256. Berlin: Weidler. Müller, Cornelia, Cienki, Alan et al. (Hg.) 2013: Body – Language – Communication. An International Handbook on Multimodality in Human Interaction. Vol. 1. Berlin/Boston: Mouton de Gruyter. Murphy, Keith M. 2005: Collaborative Imagining: The Interactive Use of Gestures, Talk, and Graphic Representation in Architectual Practice. Semiotica 156(1/4): 113–145. Pechmann, Thomas & Werner Deutsch 1982: The Development of Verbal and Nonverbal Devices for Reference. Journal of Experimental Child Psychology 34(2): 330–341. Pekarek, Simona 1998: Deixis and the Interactional Construction of Context. Pennsylvania Working Papers in Linguistics 5(1): 127–138. Phillips, Charles Garrett 1986: Movements of the Hand. Liverpool: Liverpool University Press. Pizzuto, Elena Antinoro & Micaela Capobianco 2008: Is Pointing “Just” Pointing? Unraveling the Complexity of Indexes in Spoken and Signed Discourse. Gesture 8(1): 82–103. Povinelli, Daniel J. & D. Richard Davis 1994: Differences Between Chimpanzees (Pan troglodytes) and Humans (Homo sapiens) in the Resting State of the Index Finger: Implications for Pointing. Journal of Comparative Psychology 108(2): 134–139. Psathas, George 1990: The Organization of Talk, Gaze, and Activity in a Medical Interview. In: George Psathas (Hg.), Interaction Competence, 205–230. Washington, DC: University Press of America. Quine, Willard Orman van 1960: Word and Object. Cambridge: Technology Press of the Massachusetts Institute of Technology.

508

9 Bibliographie

Rauh, Gisa 1978: Linguistische Beschreibung deiktischer Komplexität in narrativen Texten. Tübingen: Narr. Rauh, Gisa (Hg.) 1983: Essays on Deixis. Tübingen: Narr. Rauh, Gisa 1984: Aspekte der Deixis. Sprachwissenschaft 9: 23–84. Redder, Angelika 2000: Textdeixis. In: Klaus Brinker, Gerd Antos & Wolfgang Heinemann et al. (Hg.), Text- und Gesprächslinguistik. Ein internationales Handbuch zeitgenössischer Forschung, Bd. 1, 283–293. Berlin/New York: de Gruyter. Redder, Angelika 2001: Aufbau und Gestaltung von Transkriptionssystemen. In: Klaus Brinker, Gerd Antos & Wolfgang Heinemann et al. (Hg.), Text- und Gesprächslinguistik. Ein internationales Handbuch zeitgenössischer Forschung, Bd. 2, 1038–1059. Berlin/New York: de Gruyter. Rohlfing, Katharina, Daniel Loehr & Susan D. Duncan et al. 2006: Comparison of Multimodal Annotation Tools – Workshop Report. Gesprächsforschung – Online-Zeitschrift zur verbalen Interaktion 7: 99–123. Rossano, Federico 2012: Gaze behavior in face-to-face interaction. Ph.D. dissertation. Max Planck Institute for Psycholinguistics Series Nijmegen. Sacks, Harvey 1992: Lectures on Conversation. Hg. Gail Jefferson. Oxford, UK/Cambridge, MA: Blackwell. Sacks, Harvey & Emanuel A. Schegloff [1975] 2002: Home Position. Gesture 2(2): 133–146. Sacks, Harvey & Emanuel A. Schegloff 1979: Two Preferences in the Organization of Reference to Persons in Conversation and Their Interaction. In: George Psathas (Hg.), Everyday Language. Studies in Ethnomethodology, 15–21. New York: Irvington. Sacks, Harvey, Emanuel A. Schegloff & Gail Jefferson 1974: A Simplest Systematics for the Organization of Turn-Taking for Conversation. Language 50(4): 696–735. Sandig, Barbara 1987: Kontextualisierungshinweise: Verwendung von so im Prozeß sprachlichen Handelns. In: Inger Rosengren (Hg.), Sprache und Pragmatik. Lunder Symposium 1986, 327–333. Stockholm: Almqvist und Wiksell. Schegloff, Emanuel A. 1979: The Relevance of Repair to Syntax-for-Conversation. In: Talmy Givón (Hg.), Syntax and Semantics. Volume 12: Discourse and Syntax, 261–286. New York: Academic Press. Schegloff, Emanuel A. 1984: On Some Gestures’ Relation to Talk. In: John Maxwell Atkinson & John Heritage (Hg.), Structures of Social Action. Studies in Conversation Analysis. 266–296. Cambridge: Cambridge University Press. Schegloff, Emanuel A. 1992: Repair after Next Turn: The Last Structurally Provided Defense of Intersubjectivity in Conversation. American Journal of Sociology 97(5): 1295–1345. Schegloff, Emanuel A. 1998a: Body Torque. Social Research 65(3): 535–596. Schegloff, Emanuel A. 1998b: Reflections on Studying Prosody in Talk-in-Interaction. Language and Speech 41(3–4): 235–263. Schegloff, Emanuel A. 2007a: Sequence Organization in Interaction. A Primer in Conversation Analysis. Cambridge: Cambridge University Press. Schegloff, Emanuel A. 2007b: Conveying Who You Are: The Presentation of Self, Strictly Speaking. In: Nick Enfield & Tanya Stivers (Hg.), Person Reference in Interaction. Linguistic, Cultural, and Social Perspectives, 123–148. Cambridge: Cambridge University Press. Schegloff, Emanuel A. 2010: Commentary on Stivers and Rossano: “mobilizing response”. Research on Language and Social Interaction 43(1): 38–48. Schegloff, Emanuel A., Gail Jefferson & Harvey Sacks 1977: The Preference for Self-Correction in the Organization of Repair in Conversation. Language 53(2): 361–382.

9 Bibliographie

509

Schmauks, Dagmar 1991: Deixis in der Mensch-Maschine-Interaktion. Multimediale Referentenidentifikation durch natürliche und simulierte Zeigegesten. Tübingen: Niemeyer. Schmitt, Reinhold 2005: Zur multimodalen Struktur von turn-taking. Gesprächsforschung – Online-Zeitschrift zur verbalen Interaktion 6: 17–61. Schmitt, Reinhold (Hg.) 2007: Koordination. Analysen zur multimodalen Interaktion. Tübingen: Narr. Schmitt, Reinhold & Arnulf Deppermann 2007: Monitoring und Koordination als Voraus setzungen der multimodalen Konstitution von Interaktionsräumen. In: Reinhold Schmitt (Hg.), Koordination. Analysen zur multimodalen Interaktion, 95–128. Tübingen: Narr. Schmitt, Reinhold & Arnulf Deppermann 2010: Die multimodale Konstitution eines imaginären Raums als interaktive Problemlösung. In: Arnulf Deppermann & Angelika Linke (Hg.), Sprache intermedial. Stimme und Schrift, Bild und Ton, 199–242. Berlin/New York: de Gruyter. Schütte, Wilfried 2007: ATLAS.ti 5 – ein Werkzeug zur qualitativen Datenanalyse. Gesprächsforschung – Online-Zeitschrift zur verbalen Interaktion 8: 57–72. Selting, Margret, Peter Auer, Birgit Barden et al. 1998: Gesprächsanalytisches Transkriptionssystem (GAT). Linguistische Berichte 173/176: 91–122. Selting, Margret, Peter Auer, Dagmar Barth-Weingarten et al. 2009: Gesprächsanalytisches Transkriptionssystem 2 (GAT 2). Gesprächsforschung – Online-Zeitschrift zur verbalen Interaktion 10: 353–402. Selting, Margret & Elizabeth Couper-Kuhlen 2000: Argumente für die Entwicklung einer ‚interaktionalen Linguistik‘. Gesprächsforschung – Online-Zeitschrift zur verbalen Interaktion 1: 76–95. Selting, Margret & Elizabeth Couper-Kuhlen (Hg.) 2001a: Studies in Interactional Linguistics. Amsterdam/Philadelphia: Benjamins. Selting, Margret & Elizabeth Couper-Kuhlen 2001b: Introducing Interactional Linguistics. In: Margret Selting & Elizabeth Couper-Kuhlen (Hg.), Studies in Interactional Linguistic, 1–22. Amsterdam/Philadelphia: Benjamins. Selting, Margret & Elizabeth Couper-Kuhlen 2001c: Forschungsprogramm ‚Interaktionale Linguistik‘. Linguistische Berichte 187: 257–287. Sennholz, Klaus 1985: Grundzüge der Deixis. Bochum: Brockmeyer. Sherzer, Joel 1973: Verbal and Nonverbal Deixis: The Pointed Lip Gesture Among the San Blas Cuna. Language in Society 2(1): 117–131. Sherzer, Joel 1983: Kuna Ways of Speaking. An Ethnographic Perspective. Austin: University of Texas Press. Sidnell, Jack & Tanya Stivers (Hg.) 2012: The Handbook of Conversation Analysis. Wiley-Blackwell. Silverstein, Michael 1976: Shifters, Linguistic Categories, and Cultural Description. In: Keith H. Basso & Henry A. Selby (Hg.), Meaning in Anthropology, 11–56. Albuquerque: University of New Mexico Press. Sitta, Georg 1991: Deixis am Phantasma. Versuch einer Neubestimmung. Bochum: Brockmeyer. Sperber, Dan 1994: Understanding Verbal Understanding. In: Jean Khalfa (Hg.), What is Intelligence? 179–198. Cambridge: Cambridge University Press. Sperber, Dan & Deirdre Wilson 1986: Relevance. Communication and Cognition. Oxford: Blackwell. Stivers, Tanya & Federico Rossano 2010: Mobilizing Response. Research on Language and Social Interaction 43(1): 3–31.

510

9 Bibliographie

Stivers, Tanya & Jack Sidnell 2005: Introduction: Multimodal Interaction. Semiotica 156(1/4): 1–20. Streeck, Jürgen 1983: Konversationsanalyse. Ein Reparaturversuch. Zeitschrift für Sprachwissenschaft 2(1): 72–104. Streeck, Jürgen 1988: The Significance of Gesture: How it is Established. IPrA Papers in Pragmatics 2(1–2): 60–83. Streeck, Jürgen 1993: Gesture as Communication I: Its Coordination With Gaze and Speech. Communication Monographs 60(4): 275–299. Streeck, Jürgen 1994: Gesture as Communication II: The Audience as Co-Author. Research on Language and Social Interaction 27(3): 239–267. Streeck, Jürgen 1995: On Projection. In: Esther N. Goody (Hg.), Social Intelligence and Interaction. Expressions and Implications of the Social Bias in Human Intelligence, 87–110. Cambridge: Cambridge University Press. Streeck, Jürgen 2002: Grammars, Words, and Embodied Meanings: On the Uses and Evolution of So and Like. Journal of Communication 52(3): 581–596. Streeck, Jürgen 2007: Geste und verstreichende Zeit: Innehalten und Bedeutungswandel der „bietenden Hand“. In: Heiko Hausendorf (Hg.), Gespräch als Prozess. Linguistische Aspekte der Zeitlichkeit verbaler Interaktion, 157–180. Tübingen: Narr. Streeck, Jürgen 2008: Depicting by Gesture. Gesture 8(3): 285–301. Streeck, Jürgen 2009a: Gesturecraft. The Manu-facture of Meaning. Amsterdam: Benjamins. Streeck, Jürgen 2009b: Forward-Gesturing. Discourse Processes 46(2–3): 161–179. Streeck, Jürgen & Ulrike Hartge 1992: Previews: Gestures at the Transition Place. In: Peter Auer & Aldo Di Luzio (Hg.), The Contextualization of Language, 135–158. Amsterdam/ Philadelphia: Benjamins. Streeck, Jürgen & Mark L. Knapp 1992: The Interaction of Visual and Verbal Features in Human Communication. In: Fernando Poyatos (Hg.), Advances in Non-verbal Communication. Sociocultural, Clinical, Esthetic, and Literary Perspectives, 3–23. Amsterdam: Benjamins. Stukenbrock, Anja 2008: „Wo ist der Hauptschmerz?“ – Zeigen am eigenen Körper in der medizinischen Kommunikation. Gesprächsforschung – Online-Zeitschrift zur verbalen Interaktion 9: 1–33. Stukenbrock, Anja 2009a: Referenz durch Zeigen: Zur Theorie der Deixis. Deutsche Sprache 37: 289–315. Stukenbrock, Anja 2009b: Herausforderungen der multimodalen Transkription: Methodische und theoretische Überlegungen aus der wissenschaftlichen Praxis. In: Karin Birkner & Anja Stukenbrock (Hg.), Die Arbeit mit Transkripten in Fortbildung, Lehre und Forschung, 144–170. Mannheim: Verlag für Gesprächsforschung. Stukenbrock, Anja 2009c: Erklären – Zeigen – Demonstrieren. In: Janet Spreckels (Hg.), Erklären im Kontext. Neue Perspektiven aus der Gesprächs- und Unterrichtsforschung, 160–176. Baltmannsweiler: Schneider-Verlag Hohengehren. Stukenbrock, Anja 2010: Überlegungen zu einem multimodalen Verständnis der gesprochenen Sprache am Beispiel deiktischer Verwendungsweisen des Ausdrucks „so“. InLiSt – Interaction and Linguistic Structures 47. Stukenbrock, Anja 2012a: Zur Beredsamkeit des Körpers. Figurendarstellung und Figurenwissen als multimodale Alltagsinszenierung. In: Lilith Jappe, Olav Krämer & Fabian Lampert (Hg.), Figurenwissen. Funktionen von Wissen bei der narrativen Figurendarstellung, 345–385. Berlin/Boston: de Gruyter.

9 Bibliographie

511

Stukenbrock, Anja 2012b: Imagined spaces as a resource in interaction. Bulletin suisse de linguistique appliquée 96: 141–161. Stukenbrock, Anja. 2013: Sprachliche Interaktion. In: Peter Auer (Hg.), Sprachwissenschaft. Grammatik – Interaktion – Kognition, 217–259. Stuttgart: Metzler. Stukenbrock, Anja 2014a: Take the words out of my mouth: Verbal instructions as embodied practices. Journal of Pragmatics 65: 80–102. Stukenbrock, Anja 2014b: Pointing to an ‘empty’ space: Deixis am Phantasma in face-to-face interaction. Journal of Pragmatics 74: 70–93. Stukenbrock, Anja & Karin Birkner 2010: Multimodale Ressourcen für Stadtführungen. In: Marcella Costa & Bern Müller-Jacquier (Hg.), Deutschland als fremde Kultur: Vermitt lungsverfahren in Touristenführungen, 214–243. München: Iudicium. Svensson, Marcus S., Paul Luff & Christian Heath 2009: Embedding instruction in practice: contingency and collaboration during surgical training. Sociology of Health & Illness 31(6): 889–906. Thurmair, Maria 2001: Vergleiche und Vergleichen. Eine Studie zu Form und Funktion der Vergleichsstrukturen im Deutschen. Tübingen: Niemeyer. Tomasello, Michael 2008: Origins of Human Communication. Cambridge, MA: MIT Press. Tschauder, Gerhard 1990: Anaphorik, Deixis und Metadeixis. Zeitschrift für Phonetik, Sprachwissenschaft und Kommunikationsforschung 43(6): 731–747. Weinrich, Harald 1993: Textgrammatik der deutschen Sprache. Mannheim: Dudenverlag. Weissenborn, Jürgen 1988: Von der ‘demonstratio ad oculos’ zur ‘Deixis am Phantasma’. Die Entwicklung der lokalen Referenz bei Kindern. In: Achim Eschbach (Hg.), Karl Bühler’s Theory of Language. Proceedings of the Conferences Held at Kirchberg, August 26, 1984 and Essen, November 21–24, 1984, 257–276. Amsterdam: Benjamins. Weissenborn, Jürgen & Wolfgang Klein 1982: Here and There. Amsterdam: Benjamins. Wilkins, David 2003: Why Pointing With the Index Finger Is Not a Universal (in Sociocultural and Semiotic Terms). In: Sotaro Kita (Hg.), Pointing. Where Language, Culture, and Cognition Meet, 171–215. Mahwah, NJ: Erlbaum. Williams, Robin 1988: Understanding Goffman’s Methods. In: Paul Drew & Anthony Wootton (Hg.), Erving Goffman. Exploring the Interaction Order, 64–88. Boston: Northeastern University Press. Zifonun, Gisela, Ludger Hoffmann & Bruno Strecker 1997: Grammatik der deutschen Sprache. 3 Bände. Berlin/New York: de Gruyter.

10 Register Ablauf-/Gesamt-/Realisierungsformat – multimodales 36 f., 61 f., 121 f., 133 f., 169 ff., 177, 189, 195, 251, 257, 272, 293, 313, 329, 353 f., 358, 361, 366, 374, 380, 392–394, 403, 413–416, 428, 438–440, 452, 465, 488 f. – sequenzielles 34, 231, 241, 243 f., 251, 254, 264, 281, 315, 343–350, 453, 460 f., 494–498 – temporales Ablaufformat 31, 66, 95 f., 145, 148, 177, 494–498 Adaptivität 30 f., 35, 71, 231, 343–350, 495 Adressatenorientierung 122, 415 Adressatenzuschnitt 69, 71, 80, 95, 350 anamnestisch 15, 173, 177, 250, 299 Anaphorik/anaphorisch 7–9, 10 f., 15 f., 18, 122, 138, 158, 173, 180, 299, 304, 312, 440, 483 Aufmerksamkeit – visuelle 33, 34, 52, 55, 228 Aufmerksamkeitsdivergenz 57, 62, 66, 276, 293 Aufmerksamkeitsfokus – gemeinsamer 34, 52, 62 – kognitiver 34 – perzeptorischer 34 – visueller 214, 227, 421, 423, Aufmerksamkeitsorientierung 86 ff., 122, 214 Autodeiktika 10 Begegnung (encounter, face engagement) 52 Beteiligungsformat 127 f., 140, 175, 176, 352, 378, 387, 389 f., 392, 413, 435 f., 481 f., 492 Blick 36, 47, 171, 177, 218, 220, 243, 251, 289, 292 (s. auch Zeigen mit dem Blick) – Blickausrichtung/-orientierung 86 ff., 195, 274 f., 284, 295, 315 f., 328, 369, 371, 373, 374, 377, 395, 398, 400, 421, 423, 427, 436, 467, 470, 478, 480–482, 486 – Blickkontakt 88 f., 131, 324, 381, 394, 402

– –

Blickmuster 378, 380 f., 392–394, 415, 439 f., 448, 489 Blickorganisation 122, 263, 292, 295, 377, 402 f., 407, 427, 432, 448–450

common ground (s. Hintergrundwissen, gemeinsames) da – Anwesenheits-da 11 – Lokalisierungs-da 11 Dauer, innere 29 ff., 50, 220 deiktisch – deiktische Prozedur 8, 57, 122 – deiktischer Ausdruck 2, 9–12, 33, 39–41, 50 f., 65–67, 343, 418 – deiktische Zeigehandlung 18, 31 f., 34–44, 65 f., 93–96, 313 f., 342–344, 351, 493–498 Deixis – abstract deixis 10 – als Teil der Grammatik, des Sprachsystems 13 f. – als Teil des Sprachgebrauchs 13 f. – Diskursdeixis 5, 8, 15 f., 299 – empathische Deixis 5 – Gegenstands-/Objektdeixis 5, 108, 110 f., 121 f., 353 f. – Hier-Deixis 60 f., 252, 366, 393 – Ich-Deixis 60 f., 93, 252, 366, 376–378, 381, 393 f. – Modaldeixis 5, 18, 27, 331, 416–440, 494 – Personal-/Personendeixis 5, 112–114, 121 f., 124–130, 186, 194, 229, 352–394, 398, 415, 455 f., 486, 490, 494 – Raum-/Lokaldeixis 5, 17, 108, 130, 353 f., 417, 486, 490 – Rededeixis 5 – Situationsdeixis 10, 75 – Sozialdeixis 5, 18 – Textdeixis 5, 8 – Zeit-/Temporaldeixis 5, 11, 18, 490

514

10 Register

Deixis am Phantasma 7, 10, 16, 175, 285, 287, 427, 440–491, 494 f. – erster Hauptfall 7, 441, 443, 453–466, 483, 488–490 – zweiter Hauptfall 7, 441, 443, 466–491 – dritter Hauptfall 7, 287, 441 f., 444–453, 471, 488 f. demonstratio ad oculos (et ad aures) 7, 9, 16 f., 51–53, 232, 285, 287, 343, 351 f., 440–442, 460 f., 465, 488 f., 494 Demonstration, körperliche 18, 414, 418, 428, 430, 436–440 Demonstrativa 8 – Demonstrativadverbien 17 – Demonstrativartikel 17 Dimensionen, deiktische 4 ff., 8, 417, 490 f., 494 Diskursdeixis (s. Deixis) distal 10, 40, 273, 275, 403, 441, 471 domain of scrutiny 50, 56, 94, 99, 241 Doppelausrichtung/-orientierung, multimodale 59, 69 ff., 264, 348 Doppelraum, semiotischer 64, 395, 432, 439 egozentrisch 3, 5 f., 7, 91 Embleme 20 f. empraktisch 14 endophorisch 15 f., 18, 299 exophorisch 8, 10, 15 f., 299 face-to-face-Interaktion 1, 3, 7, 36, 93, 238, 352, 440 F-formation 53, 140, 407, 412 Figur/Grund 39–41, 66, 72 f., 78, 99, 134–136, 140, 150, 220, 227, 229, 297, 495 fokussierte Interaktion 50–55, 232–241, 447 Fokussierungsaufforderung 53 ff., 108, 240 f. Fokussierungsbestätigung 53 ff., 240 f. Gebärdensprache 20 f. Gegenstandsdeixis (s. Deixis) Gestalt, multimodale 29 f., 49, 67, 95, 98, 114, 122, 419 Geste – darstellende 18, 21 f. – deiktische (s. auch Zeigegeste) 21 f.

– ikonische 18, 21 f., 218, 427, 438 f., 494 – manuale 47 – metaphorische 21 f., 33, 35 – pragmatische 21 f. – Taktstock- (batons) 21 f., 114, 166, 168, 212, 304, 328, 427 Gestenanatomie 22–28 Gestenbegriff 19–21 Gesteneinheit 22–27, 35–37 Gestenforschung 19–22, 28, 35 f., 47, 493 Gestenphase 23–27, 35–37, 107 – Durchführungs-/Schlagphase (stroke) 23–27 – Gipfel-/Höhe-/Umkehrpunkt (apex) 23–27 – Nachhalt (post-stroke hold) 23–27, 154, 157, 271, – Nukleus (nucleus) 23–27 – Rückzugs-/Retraktionsphase (retraction) 23–27, 156, 171 – Vorbereitungs-/Preparationsphase (preparation) 23–27 – Vorhalt (pre-stroke hold) 23–27 Gestenphrase 23–27, 35–37, 107 Gestentypen/-typologien 19 ff., 33 Gestik/Gestikulation 19–22 gestischer Gebrauch 2, 3, 10 ff., 418, 421 Grund (s. Figur/Grund) Heterodeiktika 10 Hintergrund – gemeinsamer konzeptueller (common conceptual ground) 50, 72, 79–81, 297 – gemeinsamer Wahrnehmungs- (common perceptual ground) 50, 72 f., 79–81, 88 f., 91, 220, 227, 297 Hintergrundwissen, gemeinsames 40, 50, 78–85, 88, 90–92, 95, 123, 134, 178, 300, 446, 494 Hybriddeixis 17 ikonisch 106 f., 150, 159, 161, 165, 167 f., 199, 267, 274, 287, 425, 427, 468 Indexikalität 2, 495 indexikalitätsmarkierend/Indexikalitätsmarker 15 f., 91, 134, 178, 250, 284, 417, 432

10 Register

Instruktion 120 f., 131, 203 f., 235, 237 f., 270 f., 340–342, 346, 390, 428, 430, 432, 435–440, 446–450, 464 instrumentell 68, 93, 253, 261, 265, 269 Intention(alität) 68, 91 – kommunikative 60 interactive field 2, 492 Interaktivität 36, 324, 327, 494 Interaktionale Linguistik 12, 34 f., 47, 493 Interaktionsgeschichte 84 Interaktionsraum 53, 57, 125, 127, 136 f., 139 f., 185, 229, 232 f., 237, 241, 259, 261, 269, 279, 395, 412, 435, 440 joint attention 17, 60, 74, 78, 86 Kendon‘s continuum 19–22 körperlich-visuell 12, 29, 40, 47, 65 f., 232, 418 f. Koexpressivität 65 Ko-Konstruktion 139, 282, 432 konditionelle Relevanz, modalitätsübergreifende 34 f., 35, 88, 240, 316, 330, 342, 347 Kontext 34, 39, 52, 77, 85, 97, 121, 123, 131, 133 f., 159, 175, 177, 195, 199, 222, 229, 231, 315, 330, 354 f., 358, 404, 416, 418, 425, 430, 438 f., 495 – kontextadaptiv 36, 494 – kontextsensitiv 49, 95, 195, 230, 344, 350, 438 – Kontextualisierung 67, 135, 140 f., 149, 153, 201, 213 f., 224, 228 f., 410, 418, 432, 436 f., 440, 475, 486 – Kontextualisierungshinweis/-mittel 62, 75, 78, 81–85, 94, 121, 253, 257, 259, 395, 407, 415, 423–425, 440 – Kontextualisierungstheorie 47 Kontrollblick 164, 281, 325, 342, 358 – zur Wahrnehmungswahrnehmung 87 ff., 106, 180, 188–191, 212, 220, 314–323, 393, 450, 452, 459, 461, 465 Kontrollverfahren (proof procedures) 51, 85 Konversationsanalyse 12, 34 f., 47, 493 Koordination/Koordinierung 31, 68, 70 – interpersonell 30 ff., 35, 49 ff., 60, 65,

515

71, 74, 86, 95, 121 f., 158, 177, 180, 229, 243, 247, 264, 437 f. – intrapersonell 30 ff., 35, 49 ff., 56, 58 f., 71, 74, 95, 121 f., 177, 229, 241, 243, 437 Kopräsenz 1, 49, 51, 123, 232, 440 Kopulakonstruktion 302 Korrelat, verbales 105, 107 f., 124, 131 f., 145, 158, 161, 173, 272, 380, 428, 438 f. Kotemporalität 24, 28–34 Leibgebundenheit 1, 6 Lenkfeld 62, 157, 419 lexikalisches Korrelat (s. verbales Korrelat) L-Formation 127, 204, 260 f., 421 Lokalisierung 13, 50, 64, 75 f., 79, 81 f., 102 f., 107 f., 110, 121 f., 133 f., 150, 158, 173, 282, 404, 412 f. Malfeld 4 mapping 42, 79 Merkmale – charakterisierende 40 f., 66 f., 229 – indexikalische 40 f., 66 f., 229 – relationale 40 f., 66 f., 229 Modaldeixis (s. Deixis) Modell der deiktischen Zeigehandlung 36–44, 49–96, 134, 186, 232, 254, 294, 296, 343 f., 441–443, 465, 470, 474, 481, 487, 494–498 Modi des Zeigens 3, 7–9, 16, 465, 491 Monitoring 54, 71, 86 ff., 108, 180, 314, 407, 438 – Adressaten-/Fremdmonitoring 87, 177, 180, 187, 189, 191, 212, 284 f., 289, 293–295, 314 f., 323–330, 380, 383 f., 393, 398, 403, 450, 452, 461 – Selbstmonitoring 123, 133 f., 177, 180, 289, 293–295, 374, 395 multimodaler Verdichtungsraum 32 f. multimodales Ablauf-/Realisierungsformat (s. Ablaufformat) Multimodalität 3, 12, 28, 39 Multimodalitätsforschung 47 Nennwörter 4 next turn proof procedure 34

516

10 Register

online 81, 138, 251, 304 – Analyse 11, 80, 91 – Emergenz 80 f., 85, 134, 299, 312, 344, 417, 428, 438, 494 f. – Syntax 417 Orientierung – Fremdorientierung 178, 194, 231, 251 – Ko-Orientierung 115, 245, 293, 295, 314 f., 347 – Selbstorientierung 194, 231, 241–243, 245 f., 251, 254, 257, 264 Origo 2, 3 ff., 39, 41, 441–443, 453, 464 f., 473 ff. Origoexklusivität 65, 441 Origoinklusivität 65, 441 o-space 53, 415 Paarsequenzen 34, 342 f., 436 – multimodale 34, 63, 143 f., 316, 423 Pantomime 20 f. Parameter der Zeigehandlung 35, 49 ff., 93 ff., 133 f., 186, 231 f., 240 f., 254, 265, 295, 325, 343, 446–452, 460, 488, 493 – interaktive 51, 94 f. – kognitive 51, 60, 94 f., 330, 452 – perzeptorische 51, 60, 68, 81, 90, 94 f., 329 f., 452 – räumliche 94 f. Performance 18, 432–440, 464 f., 473, 477–483, 491 Personaldeixis (s. Deixis) perzeptorisch-intermediär 61, 68, 93, 95, 228, 253, 259, 261, 265, 269 Präferenz 195, 395, 407, 410, 415 f. Präsentativfunktion 141, 158 Präsentativgesten 215–218, 220–222, 224, 299, 301–303, 313, 317–319, 324, 340, 421–425, 438 Präsentativkonstruktion 138, 180, 204, 222, 224 praxeologisch 1, 5, 12 f. Projektion 28, 34 f., 65, 92, 108, 135, 171, 213 f., 228, 241, 251, 264, 268, 271, 285, 343, 407, 417, 423, 424, 430, 432, 436–440, 464, 467, 475 f. Projektivität 30 ff., 35

Prosodie 22, 27, 30, 35, 47, 166, 168, 257, 331, 418, 487, 493 proximal 10, 40, 65 f., 135, 441 Raumdeixis (s. Deixis) Realisierungsformat, multimodales (s. Ablaufformat) recognitional use 15 Rededeixis (s. Deixis) Referent 38, 41–44, 72 ff., 78–85, 282, 289, 296–313, 407–415, 494 Referenz(herstellung) 13, 94 f., 103, 123, 191, 404 – Problem der Referenzherstellung 38, 41, 50 f., 72 ff., 82, 282, 296 Relevanz 31, 33 f., 75, 77, 80, 91, 123, 472 Reparatur 41 f., 75 f., 82 ff., 105, 108, 114, 130, 156 f., 164, 191 f., 195, 231, 264, 271, 282, 284 f., 287, 289, 292–295, 301, 306, 310, 312 f., 320 f., 323, 329, 336, 348–350, 361 Ressourcen-Spagat 70 f., 89, 263 f., 271, 317, 348, 393, 450 Salienz 79 – konzeptuelle/kognitive 42, 50, 77, 79 ff. – perzeptorische 42, 50, 77 f., 79 ff., 84, 309 Sequenzanalyse 34, 251, 446 Sequenzialität 28 ff., 34 sequenzielle Organisation 50, 72, 95 f., 162 Situationsdeixis (s. Deixis) Sozialdeixis (s. Deixis) soziozentrisch 5 f., 91 Standbild 25–27 Suchraum 37, 41–44, 50, 56 ff., 71 f., 94 f., 135, 139 f., 150, 153, 169, 177, 229, 241 f., 265, 272–281, 282, 395, 407, 448 f., 455, 461, 464 f., 488 Symbolfeld 3 symbolischer Gebrauch 10 ff., 418 Symbolwörter 4 f. Systembedeutung 13 Teilnehmerrollen 11, 18, 350 Temporaldeixis (s. Deixis)

10 Register

Temporalität 28 ff., 65, 253 f., 494 f. – Kotemporalität 28 ff., 33 – Simultaneität 28 ff., 32, 33, 253 f. – Synchronizität 28 ff., 33 – Teilsimultaneität 31, 32 Temporalitätsstruktur 27, 31, 33, 36 f., 69, 171, 173, 184, 218, 269, 293, 428, 430 Textdeixis (s. Deixis) topomnestisch 6 transactional segments 53 Transkription – interlineare 25 f. – multimodale 25 f., 48 – symbolische 25 f., 32 Umfeld 3, 14 unfokussierte Interaktion 52 Vektor 67, 72 ff., 77, 169, 171, 173, 175, 182, 194 f., 197, 199, 220, 227, 229, 265 Vektor-Ziel-Problem 38, 41, 72 ff., 99, 123, 134, 265, 282, 296, 403 Versetzung 465–467, 469–473, 476–478, 483, 486–491 Verstehen 51, 90–93, 330–342 Verstehensdokumentation 82, 90–93, 330–342, 413, 436–438, 452 verweisender Körper 50, 53, 59–64, 94 f., 252–264, 314, 350, 447 f. Verweisraum 50, 56–59, 94 f., 186, 241–251, 272, 407, 436, 448 f., 465, 470 visuelle Evidenz 218, 220, 225, 227, 302 visuelle Evidenz-Konstruktion 419, 423 f., 438 Vorstellungsraum 441–443, 461, 464, 466 f., 469, 471–473, 476–478, 480–483, 486–491, 495 Wahrnehmung 50 f., 85–90, 177 f., 313–329, 419, 461 – auditive 89 f. – erster Ordnung 51, 88 ff., 314 – zweiter Ordnung 51, 88 ff., 314 – dritter Ordnung 51, 88 ff. – Rekursivität der 88 ff. – visuelle 52, 89 f.

517

– wechselseitige 86, 88 Wahrnehmungsgrund, gemeinsamer (common perceptual ground) 50 f., 72 ff., 88 f., 91, 227, 297 Wahrnehmungsraum 85, 123, 441–444, 453, 455, 461, 464 f., 471 f., 488–491, 495 Wahrnehmungswahrnehmung 85–90, 133 f., 177, 257, 263 f., 272, 295, 313–329, 333, 407, 413, 452 f., 461, 465 Wissen, gemeinsames (s. Hintergrundwissen) written language bias 2 Zeigeakt 35–37, 75 Zeigefingergeste 100, 114, 228–230, 392 Zeigeformat, multimodales 61, 69, 96, 127, 353, 355 Zeigegeste 9 ff., 35–37, 41, 50, 67–71, 265–272 Zeigegestenfakultativität, -notwendigkeit, -pflicht, -unmöglichkeit 9 f., 418 Zeigehandlung (s. deiktische Zeigehandlung, s. Parameter der Zeigehandlung) Zeigen – am eigenen Körper 394–416, 432 – mit dem Blick 114, 169, 175, 177, 192–195, 196, 218, 220, 228 f., 251, 289, 292, 295, 354, 363, 365, 378–380, 385 f., 388, 390, 423 – mit dem Daumen 123–135, 177, 195, 229, 354, 364 f. – mit dem Kinn 192–195 – mit dem kleinen Finger 135–140, 229 – mit dem Kopf 114, 169–177, 186, 192–195, 196, 228 f., 354, 356, 363, 365 – mit dem Zeigefinger 101 f., 121 f., 169, 353 f., 358, 365 – mit dem Zeigefinger Handfläche nach unten (ZfHu) 102–114, 121 f., 158, 161 f., 267, 273, 360 f., 392, 400, 457, 468 – mit dem Zeigefinger Handfläche vertikal (ZfHv) 114–122, 267 f., 383, 445 – mit geöffneter Hand 140 f., 228 f., 354 – mit offener Hand Handfläche nach oben (oHHo) 141–148, 287, 331, 423 – mit offener Hand Handfläche nach unten (oHHu) 159–168, 285, 287, 361, 464

518 –

10 Register

mit offener Hand Handfläche vertikal (oHHv) 27, 149–158, 256, 269, 274 f., 285, 391 – an Objekten 214–227, 228 – mit Objekten 196–214, 228 Zeigeziel 37 f., 41–44, 50 f., 72–78, 94 f., 135, 139 f., 169, 177, 229, 282–295, 395 – nicht sichtbares 404–415, 444–452, 470, 488 f.

Zeigfeld 3 f., 9, 39, 418 Zeiginstrument 37, 40, 67 f., 197, 199, 201–204, 206, 210, 212, 214, 218, 228 f., 265, 289, 423 Zeigwörter 4, 418 Zeitdeixis (s. Deixis) Zeitlichkeit (s. auch Temporalität) 28–35 – interaktive 29 f. Zweifelderlehre 3