218 79 10MB
German Pages 398 [400] Year 1995
Linguistische Arbeiten
329
Herausgegeben von Hans Altmann, Peter Blumenthal, Herbert E. Brekle, Gerhard Heibig, Hans Jürgen Heringer, Heinz Vater und Richard Wiese
Margret Selting
Prosodie im Gespräch Aspekte einer interaktionalen Phonologie der Konversation
Max Niemeyer Verlag Tübingen 1995
Die Deutsche Bibliothek - CLP-Einheitsaufnahme Setting, Margret: Prosodie im Gespräch : Aspekte einer internationalen Phonologie der Konversation / Margret Selting. - Tübingen : Niemeyer, 1995 (Linguistische Arbeiten ; 329) NE: GT ISBN 3-484-30329-8
ISSN 0344-6727
© Max Niemeyer Verlag GmbH & Co. KG, Tübingen 1995 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen. Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Printed in Germany. Druck: Weihert-Druck GmbH, Darmstadt Einband: Hugo Nadele, Nehren
Inhalt
Vorwort Verzeichnis der Transkriptionszeichen
Verzeichnis der Abbildungen
0.
Überblick über Argumentationsgang und Ergebnisse der Arbeit
1.
Zielsetzung und Methodologie der interaktionalen Phonologie
IX X
ΧΠ
1
der Konversation
6
1.1.
Theoretische und methodologische Grundlagen und Prämissen
6
1.1.1.
Kontextualisierung
9
1.1.2. 1.1.3.
Ziele und Aufgaben der interaktional-prosodischen Analyse Prosodie als autonomes Signalisierungssystem und bisherige Ansätze der Prosodie- und Intonationsforschung Prosodische Kategorien als Teilnehmerkategorien und bisherige Ansätze der Prosodieund der Intonationsforschung Methodisches Vorgehen im Rahmen vorliegenden Untersuchung.
1.1.4.
11 16
1.2. 1.2.1. 1.2.2. 1.2.2.1. 1.2.2.2. 1.2.3. 1.2.4.
Datenerhebung Transkription der Daten Wahl und Beschränkung der Beschreibungskategorien Das Problem der Réhabilitât der Transkription Überblick über die deskriptiven Kategorien und Parameter Auditive Transkription und akustische Analyse
20 33 33 34 35 37 38 47
2.
Prosodie der Einheiten- und Turnkonstruktion
50
2.1.
Einheitenkonstruktion: interne Kohäsion und Abgrenzung von Turnkonstruktionseinheiten
51
VI 2.1.1. 2.1.2. 2.1.3. 2.1.4. 2.1.5.
Die prosodische Organisation und Konfiguration der Turnkonstruktionseinheit: die Kategorie 'Kontur' Fortsetzung begonnener Einheiten: Signalisierung der internen Kohäsion von Einheiten Neustart einer Turnkonstruktionseinheit 'Sätze' als Turnkonstruktionseinheiten: Die Beziehung von Syntax und Prosodie für die Einheitenkonstruktion Andere Syntagmen als einzelne 'Sätze' in Turnkonstruktionseinheiten
53 58 67 70 76
2.1.6.
Pausen als Abgrenzungssignale?
85
2.2.
Turnkonstruktion: Kombination aufeinanderfolgender Einheiten in Mehr-Einheiten-Turns
89
2.2.1. 2.2.1.1. 2.2.1.2. 2.2.1.3. 2.2.2. 2.2.2.1. 2.2.2.2.
Anschluß neuer Einheiten Tonhöhenanschluß neuer Einheiten Sprechtempo und'Durchhecheln' Die Kategorie'Vorlauf' Die Akzentsequenz Prominente akzentuierte Silben der Turnkonstruktionseinheit Die Wahl und interaktive Relevanz akzentuierter Silben:
91 93 98 104 109 109 117 127 135
2.2.3. 2.2.3.1. 2.2.3.1.1. 2.2.3.1.2. 2.2.4.
Akzent und Fokus der Einheit Akzenttonhöhenbewegungen: Akzent(proto)typen Sequenzen lokaler Tonhöhenbewegungen Tonhöhenbewegungen bei Anhängseln, Turnübernahmesignalen, Rezeptionssignalen u.ä Globaltonhöhenverläufe Die interaktive Relevanz spezieller Globaltonhöhenverläufe Hohe globale Tonhöhe Tiefe globale Tonhöhe Prosodische Markierung: Kontextualisierung von 'Erstaunen' o.ä. ...
142 148 155 155 159 164
2.3.
Die Organisation des Sprecherwechsels
178
2.3.1. 2.3.1.1. 2.3.1.2.
Projektierung und Kontextualisierung von Turnende Turnhalten und Turnbeenden Die Beziehung zwischen Syntax und/oder aktivitäts-typ-spezifischen Orientierungsschemata und Prosodie für die Turnbeendigung Der turnübergabe-relevante Raum
178 182
2.2.2.3. 2.2.2.4. 2.2.2.5.
2.3.1.3.
193 195
VII 2.3.2.
Kontextualisierung überlappender Turns: turnkompetitive versus
2.3.2.1. 2.3.2.2. 2.3.2.3. 2.3.2.4.
nicht-turnkompetitive Überlappungen Turnkompetitive Unterbrechungen eines laufenden Turns 'Kampf'um die Turnfortsetzung Legitime überlappende Turnübernahmen Hintergrundkommentare o.ä. ohne Turnbeanspruchung
2.4.
Zusammenfassung und Fazit zur Prosodie der Einheiten- und
208 210 215 219 224
Turnkonstruktion
229
3.
Prosodie konversationeller Fragen
232
3.1.
Taxonomie konversationeller Fragen
238
3.1.1.
Nicht-einschränkende "offene" Fragen
243
3.1.2. 3.1.2.1.
Einschränkend weiterführende Fragen Einschränkend weiterführende "engere" verständigungsbearbeitende Fragen Inferenzüberprüfungen Problemmanifestierende Fragen Manifestation von einseitigen Verstehensproblemen Manifestation von Bedeutungsverstehensproblemen Manifestation von Referenzverstehensproblemen Manifestation von akustischen Verstehensproblemen Manifestation von Erwartungsproblemen Wi'eso-Nachfragen 'Erstaunte Nachfragen' (Prosodisch markierte Problemmanifestationen)
257
3.1.2.2. 3.1.3. 3.1.3.1. 3.1.3.1.1. 3.1.3.1.2. 3.1.3.1.3. 3.1.3.2. 3.1.3.2.1. 3.1.3.2.2.
3.2.
258 270 285 286 287 290 292 293 294 298
Zusammenfassung der dekomponierten Bündel konstitutiver Merkmale konversationeller Fragen
304
3.3.
Zusammenfassung und Fazit zur Analyse konversationeller Fragen ..
307
4.
Prosodie des Erzählens und Argumentierens in Alltagsgesprächen....
312
4.1.
Die Erzählung Praktikum beim NDR und die Argumentation Die Betonung von Nachrichtensprechern
319
Vili 4.2. 4.3. 4.4. 4.5. 4.6.
5.
Uniwechsel als Beispiel für eine weitere Argumentation Die Erzählung Gesangsunterricht Die Kurzerzählung Das schlechte Raucherinnengewissen und deren Einbettung in die sie umgebende Argumentation Morgendliche Rituale als Beispiel für eine scherzhafte Argumentation Zusammenfassung und Fazit zur Prosodie des Erzählens und Argumentierens in Alltagsgesprächen
327 332
Perspektiven
365
Literatur
367
Sachregister
374
347 356 360
Vorwort
Über die Jahre hin haben viele Kolleginnen und Kollegen, Freundinnen und Freunde zur Entwicklung meiner hier präsentierten Ideen beigetragen, v.a. in Arbeitsgruppen, Workshops und Kolloquien in Oldenburg, Bielefeld, Bremen, Aachen, und Konstanz. Hier einige Kolleginnen und Kollegen namentlich zu nennen, hieße, andere wichtige Diskussionen und Denkanstöße auszulassen. Deshalb möchte ich an dieser Stelle namentlich nur Peter Auer und Elizabeth Couper-Kuhlen danken, die eine vorherige Version dieser Arbeit im Detail gelesen und kommentiert haben. Sie haben ganz wesentlich zur Verbesserung von Ungereimtheiten und Fehlern beigetragen und ich habe mich bemüht, wo immer ich konnte, ihre Kritik zu berücksichtigen. Vielen herzlichen Dank! Die Gutachter der Arbeit, Dafydd Gibbon, Klaus Gloy und John J. Gumperz, steuerten weitere Kritik und Anregungen bei, für die ich ihnen ebenfalls von Herzen danke. Wertvolle Hinweise auf Fehler und mißverständliche Formulierungen verdanke ich auch Beatrix Schönherr. Dennoch werden leider Fehler und Irrtümer verblieben sein, für die ich ganz allein die Verantwortung tragen muß. Meinen Oldenburger Kolleginnen und Kollegen danke ich für ihre materielle wie auch ideelle Unterstützung meines Habilitationsprojekts, Susanne Even für ihre Hilfe bei der Einrichtung des Typoskripts für den Druck. Prosodische Analysen sind schwer vermittelbar. Um das Verständnis dieser Arbeit zu erleichtern und einen Eindruck von meinen Daten zu vermitteln, bin ich gerne bereit, interessierten Leserinnen und Lesern gegen Übersendung einer Leerkassette eine Tonkassette mit den in Kapitel 4 analysierten Gesprächsausschnitten zur Verfügung zu stellen. Da ich auch viele der in den anderen Kapiteln analysierten Gesprächsausschnitte genau aus diesen Erzählungen und Argumentationen entnommen habe, dürfte die zugehörige Kassette die Nachvollziehbarkeit der vorliegenden Analyse entscheidend verbessern. Meine Adresse: Universität Potsdam, Institut für Germanistik, Postfach 601553, 14415 Potsdam.
Potsdam, Anfang 1995, M.S.
Verzeichnis der Transkriptionszeichen Notation und Charakterisierung der Sprechweise in der Textzeile: a b e r DA kam a b e r DA kam Sicher s i : cher s : i : eh : e r :
primär akzentuierte Silben einer Einheit sekundär akzentuierte Silben einer Einheit auffällig starker Akzent Längung/Dehnung eines Lautes Dehnung eines ganzen Wortes
(0.8)
kurzes Absetzen, kurze Pause von bis zu ca. 0.5 Sek. Dauer je Punkt ca. 0.5 Sek Pause, hier also ca. 1 Sek. Pause mit Längenangabe in Sek.
((schnieft)) ((lacht)) ((hehehe)) ja(h)ha ri(h)chtich
para- und/oder außersprachliche Vorgänge
(?),(???) (? e r kommt a(1)so
unverständlich, je nach Länge vermuteter Wortlaut nicht mit Sicherheit identifizierter Laut
?)
nach "Lachsilben" qualifiziertes Lachen Lachpartikeln innerhalb von Wörtern
deutlicher Glottalverschluß silbische Laute nach den Kriterien Sonorität und Länge des Lautes schneller Anschluß, "latching" ich
simultanes Sprechen, untereinander Stehendes iiberiappt sich und ist parallel zu lesen
gehe jaha
Intonationsnotation in der Intonationszeile: Globaltonhöhenverläufe: (immer vor der "( )" Klammer notiert) F,S,H,M,T(
H,F(
)
[(
)(
(
< >
)]
)
Angabe des globalen Tonhöhenverlaufs vor der durch die Klammer angegebenen Akzentsequenz: F=fallend, S=steigend, H=hoch, M=mittel, T=tief (Klammern stehen i.d.R. vor dem ersten Akzent und am Ende der kohäsiven Einheit, bei Veränderungen zu global tiefen oder hohen Einheiten, wo auch der Voriauf einbezogen ist, steht die erste Klammer dort, wo der Globaltonhöhenverlauf beginnt.) Kombination von globalen Angaben zusammengesetzte Kontur mit nur schwachen oder keinen internen Grenzen zwischen unterschiedlichen Globalveiiäufen "eingefügte" Kontur/Redepassage, nach der die vorherige Kontur wiederaufgenommen wird
XI Akzent(proto)typen:
(immer innerhalb der "( )" Klammem stehend)
\ /
V Λ ? /, ? \, ?
fallender Akzent: Fg-Gipfel im Silbenkem bzw. kurz davor und Rest der Silbe bzw. des Wortes und danach fallend: steigender Akzent: Fg-Tal im Silbenkem bzw. kurz davor und Rest der Silbe bzw. kurz danach steigend: s*/ gleichbleibender Akzent: wind v.a. durch Lautheit und/oder Dauer konstituiert und wiikt ggf. wie etwas gegen den Globaltonhöhenverlauf gehalten: —·— fallend-steigender Akzent: wie fallender Akzent auf einer akzentuierten Silbe plus steigende FQ auf einer späteren unakzentuierten Silbe steigend-fallender Akzent: wie steigender Akzent auf einer akzentuierten Silbe plus fallende FQ auf einer späteren unakzentuierten Silbe unsichere Transkription eines Akzents bzw. Akzenttyp gar nicht entscheidbar
Akzentmodifikationen : T\, 1/ Τ-,
i-
\_
lokal größere Tonhöhenbewegungen bei einem Akzent, höherer Gipfel und/oder größere Bandbreite als bei den umliegenden Akzenten lokale Tonhöhensprünge zu hohen bzw. tiefen gleichbleibenden Akzenten nach ganz tief fallende Tonhöhenbewegung Folge von schwachen Akzenten bzw. unakzentuierten Silben innerhalb des Globalverlaufs
Vorläufe: (immer vor der "( )" Klammer stehend) \, /,
, < t >
Tonhöhenbewegung unakzentuieiter Silben vor der Akzentsequenz: fallend, steigend, gleichbleibend upstep beim Beginn der neuen Einheit downstep beim Beginn der neuen Einheit continuance, d.h. Tonhöhenfortsetzung, bei Fortsetzung und/oder Beginn einer neuen Einheit hoher bzw. tiefer Vollauf
Andere prosodiche Parameter, die lokal oder global vorkommen und deren Dauer durch die Position der "< > " angegeben wird: , < f f > ,
,
, , < a l l all> ,
,
forte, laut sehrlaut piano, leise sehr leise allegro, schnell lento, langsam accelerando, schneller werdend rallentando, langsamer werdend crescendo, lauter werdend diminuendo, leiser weidend
XII
Verzeichnis der Abbildungen
Abb. 1-18
akustische Analysen ausgewählter Segmente
Figur 1
(a) Struktur der Intonationskontur (b) Tabellarische Zusammenstellung der konstitutiven prosodischen Einzelparameter
Figur 2
Taxonomie konversationeller Fragen
0. Überblick über Argumentationsgang und Ergebnisse der Arbeit Die Beschäftigung mit Prosodie, v.a. Intonation, erlebt in den letzten Jahren in der Linguistik Hochkonjunktur. Der Vielzahl der Interessen an diesem Phänomen entspricht eine Vielzahl der Sichtweisen und Konzeptualisierungen. Z.B. interessiert sich die generative Phonologie im Rahmen metrischer und autosegmentaler Ansätze für die Regeln der Erzeugung der suprasegmentalen phonologischen Eigenschaften der Sprache. Die generative Grammatik sieht v.a. Akzent, und z.T. auch Intonation, als eine systematisch auf der Grundlage syntaktischer Strukturen zugewiesene phonologische Eigenschaft zur Erzeugung des Fokus eines Satzes. Im Rahmen psycholinguistischer Forschung stellt sich die Frage nach der Rolle der Prosodie beim Sprachverstehen und bei der Sprachverarbeitung. Computerlinguisten arbeiten an Modellen der automatischen Erkennung und Erzeugung von prosodischen Strukturen. Schließlich interessiert sich die Diskurs- und Gesprächsanalyse für die Analyse der Rolle der Prosodie in natürlichen Gesprächen. Der Gegenstand der gängigen Prosodieforschung ist häufig (immer noch) die Prosodie im Hinblick auf ihre (meist letztlich introspektiv zugeschriebene) Funktion bei der Formulierung und Verwendung einzelner Sätze bzw. Äußerungen in (meist unexpliziert präsupponierten) Sprachverwendungssituationen. Den Nachweis der empirischen und interaktiven und interpretativen Relevanz ihrer Kategorien und Analysen in der Realität der konversationellen Interaktion bleiben viele Ansätze schuldig. Demgegenüber ist der Gegenstand der vorliegenden Arbeit Prosodie in Alltagsgesprächen. Sie basiert strikt auf der empirischen Analyse eines Korpus "echter" natürlicher Alltagsgespräche; die Sprecherinnen und Sprecher verwenden ausnahmslos nordwestdeutsche Varietäten des Deutschen. Das zentrale Ziel dieser Arbeit ist die Analyse der Rolle der Prosodie bei der Organisation der alltäglichen Konversation. Die interaktive und interpretative Relevanz von prosodischen Kategorien als "Teilnehmerkategorien" in den untersuchten Konversationen wird nachgewiesen, indem gezeigt wird, daß und wie Teilnehmer in Konversationen prosodische Kategorien als Ressource für die Organisation des Gesprächs verwenden und interpretieren und sie aufgrund dieser Interpretation in ihren Folgereaktionen behandeln. Prosodie wird verstanden als Oberbegriff für diejenigen suprasegmentalen Aspekte der Rede, die sich aus dem Zusammenspiel der akustischen Parameter Grundfrequenz (FQ), Intensität und Dauer in silbengroßen oder größeren Domänen ergeben. Hierzu gehören auditive Phänomene wie Intonation, d.h. der Tonhöhenverlauf gesprochener Sprache in der Zeit, Lautstärke, Länge, Pause, sowie die damit zusammenhängenden komplexeren Phänomene Sprechgeschwindigkeit/Tempo und Rhythmus (vgl. hierzu auch Couper-Kuhlen 1986: chapter 1). Methodisch greife ich bei meiner Analyse auf Verfahren der ethnomethodologischen Konversationsanalyse zurück. Indem ich jedoch gegenüber dem Systemcharakter der Interaktion, der Beschreibung des Interaktionssystems als "self-righting mechanism" (Schegloff/Jefferson/Sacks 1977: 381), stärker die Produktions- und Interpretationsaktivitäten der Interaktionspartner hervorhebe und in diesem Sinne prosodische Parameter als von den
2 Interaktionspartnern systematisch und aktiv verwendete Signalisierungsmittel rekonstruiere, stelle ich meine Arbeit in den Rahmen der neueren Kontextualisierungsforschung (Gumperz 1982, 1992, Auer 1986, 1992a). Auf diese Verbindung von phonologischer Analyse und interpretativer/interaktionistischer Methodologie verweist die Benennung des hier entwickelten Ansatzes als interaktionale 'Phonologie der Konversation'. Diese Arbeit knüpft an die Arbeiten zur 'Phonology for Conversation' (Local/Kelly/Wells 1986 et passim) an, die von einigen Phonologen v.a. an der Universität York (GB) entwickelt wird. Im ersten Kapitel dieser Arbeit werde ich die Zielsetzung und Methodologie der interaktionalen Phonologie der Konversation, z.T. in Auseinandersetzung mit anderen Ansätzen, explizieren und das zugrundeliegende Korpus und Transkriptionssystem vorstellen. In den folgenden Analysekapiteln weiden dann die Grundzüge einer interaktionalphonologischen Analyse der Verwendung von Prosodie im Gespräch erarbeitet Im zweiten Kapitel, "Prosodie der Einheiten- und Turnkonstruktion", wird die prosodische Struktur der Tumkonstruktionseinheit und des Turns untersucht. Die Untersuchungen dieses Kapitels werden die interaktive Relevanz jeder einzelnen der von mir verwendeten Transkriptions- und Beschreibungsparameter für die konversationeile Interaktion zeigen und nachweisen. Im Vordergrund steht zuerst die Beschreibung der Prosodie der Konstruktion einzelner Turnkonstruktionseinheiten, d.h. der Organisation der internen Kohäsion und der Abgrenzung einzelner Turnkonstruktionseinheiten voneinander, sowohl in Ein-Einheiten-Turns wie auch bei der Kombination mehrerer Turnkonstruktionseinheiten in Mehr-Einheiten-Turns. Hierbei werde ich zeigen, daß die Struktur der zur Konfiguration von Einheiten verwendeten Intonationskontur wie auch die anderen konventionell von uns als Signalisierungsmittel verwendeten prosodischen Parameter aus ihrer Funktionsweise in der konversationellen Interaktion heraus erklärt werden müssen: Die von uns in Dienst genommenen prosodischen Kategorien, Parameter und Strukturen sind auf die strukturelle Lösung sich permanent stellender Aufgaben und Anforderungen der Organisation der konversationellen Interaktion hin angelegt und zugeschnitten. Diese prosodischen Parameter verwenden wir bei der Produktion und Interpretation routinemäßig ablaufender Prozesse der Herstellung und Aushandlung konversationeller Aktivitäten und sie machen diese Aktivitäten oft erst als solche interpretierbar. Ich werde zeigen, daß für bestimmte konversationelle Aktivitäten Bündel prosodischer und kookkunierender anderer Signale konstitutiv sind, z.B. für Aktivitäten wie die Fortsetzung versus den Abbruch und Neubeginn einer Tumkonstruktionseinheit, das Turnhalten für die Fortsetzung des Turns nach dem Ende einer Tumkonstruktionseinheit, die Signalisierung der semantischen Struktur der Einheit, die Signalisierung von 'Erstaunen'. Danach steht die Beziehung der Prosodie zu syntaktischen und aktivitätstypspezifischen Orientierungsschemata für die Projektion des Turnwechsels im Zentrum. Diese Analyse greift Untersuchungsergebnisse zur Rolle der Prosodie in der neueren Forschung auf (z.B. Jefferson 1986 und Local/Kelly/Wells 1986) und entwickelt diese weiter. Auch hier zeigt sich, daß für die Lösung der Aufgaben der Gesprächsorganisation Bündel von prosodischen Parametern als Kontextualisierungshinweise verwendet weiden. Nach meinen Analysen spielen für die Signalisierung und Projektierung des Turnendes und mithin der Tumübergabe syntaktische und/oder aktivitätstypspezifische Orientierungsschemata eine globaler projektierende Rolle,
3 wohingegen prosodische Signale eine lokaler kontextualisierende Rolle spielen. Für die Kontextualisierung überlappender Rede als turnbeanspruchende(r) 'Unterbrechung(sversuch)' versus nicht-tumbeanspruchender 'Hintergrundkommentar' u.ä. ist hingegen allein die prosodische Signalisierung konstitutiv. Die Analysen zur Einheiten- und Tumkonstniktion ergeben, daß für die Herstellung und Interpretation von konversationellen Aktivitäten Bündel konstitutiver Merkmale verwendet werden. Prosodische Signale und Signalkombinationen kookkurrieren mit anderen konstitutiven Merkmalen, sind aber manchmal die einzigen aktivitätstyp-unterscheidenden Signale. Die prosodischen Signalkombinationen und aktivitätskonstituierenden Merkmalbündel lassen sich in ihre prosodischen Einzelparameter dekomponieren, für die z.T. auch allgemeinere interaktive 'Bedeutungen' rekonstruiert werden können. Im dritten Kapitel, "Prosodie konversationeller Fragen", wird die Beziehung zwischen Grammatik und Prosodie genauer untersucht In den meisten einschlägigen Ansätzen wird eine enge Beziehung zwischen Intonation und Grammatik vorausgesetzt. Als Paradebeispiel dieser Beziehung gilt gemeinhin, daß allein die Intonation zwischen den syntaktischen Satztypen 'Aussagesatz' und 'Fragesatz' unterscheidet, und daß weiterhin bei z.B. spezifischeren Fragesatztypen wie 'Ergänzungsfrage' und 'Entscheidungsfrage' unterschiedliche Intonationen zwischen dem Ausdruck von unterschiedlichen Graden der 'Höflichkeit', 'interpersonellen Markierung' o.ä. unterscheiden (vgl. hierzu z.B. Pheby 1980). Mit meiner empirischen Analyse konversationeller Fragen in natürlichen Frage-AntwortSequenzen will ich zeigen, daß diese bisherigen Annahmen und Analysen für konversationelle Fragen nicht haltbar sind. Ich werde zeigen, daß Prosodie, und insbesondere auch die letzte Tonhöhenbewegung konversationeller Fragen, nicht in systematischer Beziehung zum Satztyp oder Satzmodus der Äußerung steht. Vielmehr werden prosodische Merkmale in Kookkurrenz mit syntaktischen und semantischen Merkmalen als aktivitätstypspezifische Kontextualisierungshinweise bei der Konstitution unterschiedlicher konversationeller Aktivitäten verwendet, die auch je andere sequentielle Implikationen für die Antwort des Rezipienten haben. Meine Analyse und Dekomponierung konversationeller Fragen resultiert in einer Taxonomie konversationeller Fragen im Hinblick auf die mit ihnen vollzogenen konversationellen Aktivitäten. Und für die Konstitution genau definierter konversationeller Aktivitätstypen wird Prosodie als ggf. alleiniges typ-unterscheidendes konstitutives Merkmal verwendet. Die Ergebnisse dieser Analysen werfen auch ein neues Licht auf tief verankerte Bestandteile unseres Alltagswissens und zeigen deren empirische Basis wie auch deren notwendige Beschränkung auf: Z.B. zeigt sich, daß das alte Stereotyp, Fragen hätten steigende Intonation, durchaus eine reale Basis hat, aber für einen wesentlich präziser und eingeschränkter als bisher formulierten Fragebegriff. Weiterhin erlaubt meine Analyse die Rekonstruktion der sequentiellen Grundlage und der Intuition, die offenbar zu solchen unexplizierten Kontextualisierungen und verkürzten Globalinterpretationen wie 'höflichen Fragen' o.ä. zu bestimmten Frageformen geführt haben. Die Analyse konversationeller Fragen zeigt, daß Prosodie nicht in Abhängigkeit von der Grammatik bzw. der Syntax erklärt und beschrieben werden kann. Die Prosodie ist vielmehr ein unabhängiges, autonomes Signalisierungssystem (vgl. auch Gibbon 1984, Bolinger 1986). Es wird von den Interagierenden offenbar als eigenständiges Modul neben anderen Modulen
4 behandelt, auf das sie für die Kombination der für die Konstitution ihrer Aktivitäten spezifischen Merkmalbündel zurückgreifen. Der Nachweis der Unabhängigkeit der Prosodie von der Grammatik ist zugleich auch die Voraussetzung der Analyse der Prosodie als Kontextualisierungsverfahren sowohl bei der Konstitution einzelner Turnkonstruktionseinheiten und Turns wie auch bei der Organisation komplexerer Aktivitäten wie Erzählen und Argumentieren in konversationeller Interaktion. Bei der Beschreibung der Prosodie von Äußerungen und sprachlichen Aktivitäten in natürlicher Interaktion muß eine Trennung vorgenommen werden zwischen der Analyse der Akzentuierung im Sinne der Wahl der Akzentsilben und der Wahl der dort gewählten Akzenttonhöhenbewegung. Die Wahl der (Position der) Akzentsilbe erfolgt unter Berücksichtigung grammatischer Prinzipien und muß mit Rückgriff auf grammatische Prinzipien analysiert werden (siehe Kapitel 2.2.2.2.); die Wahl der Akzenttonhöhenbewegung hat dagegen interaktive Relevanz und kann nur im Rückgriff auf die sequentielle Struktur und Organisation der Interaktion analysiert werden. Das Thema 'Akzent und Fokus' liegt genau im Schnittpunkt der grammatischen und interaktiven Analyse. Es ergibt sich die Perspektive, daß die interaktional-phonologische Analyse an grammatische Analysen anschließen kann, wenn auch grammatische Prinzipien als Ressourcen betrachtet werden, die sich Interaktionspartner für die Konstitution konversationeller Aktivitäten aktiv zunutze machen. Im vierten Kapitel, "Prosodie des Erzählens und Argumentierens in Alltagsgesprächen", werden dann komplexere Aktivitätstypen untersucht. Es wird gezeigt, wie Teilnehmer mithilfe der Wiederaufnahme, Umkehrung und Variation von Akzentsequenzen in aufeinanderfolgenden Turnkonstruktionseinheiten und Aktivitätsteilen die Art kohäsiver Beziehungen zwischen Einheiten und Aktivitätsteilen herstellen und signalisieren. Intonationskonturen werden als stilistische Gestaltungsmittel zur Signalisierung der Art und Weise des Erzählens und Argumentierens analysiert. Auch hier wird gezeigt, daß Intonation nicht als von den Aktivitätstypen Erzählen und Argumentieren abhängiges Signalisierungssystem beschrieben werden kann. Vielmehr verwenden Interaktionspartner auch hier Intonation aktiv und sequenzübergreifend als Ressource zur Kontextualisierung und Aushandlung prototypischer und übergreifender Interaktionsstile, mit denen prototypische und übergreifende Formen interaktiver Reziprozität zwischen den Interaktionspartnern bei der Konstitution dieser Aktivitätstypen kontextualisiert werden. Die prototypischen Pole eines Kontinuums bilden dabei kooperatives Erzählen und strittig-antagonistisches Argumentieren. Bewegungen zwischen diesen prototypischen Polen mithilfe der Herstellung und Abfolge spezifischer Intonationskonturen innerhalb der konstituierten übergreifenden Stile bei Erzählungen und Argumentationen werden zur Signalisierung und Kontextualisierung unterschiedlicher Aktivitätsteile dieser Aktivitäten und deren Beziehungen zueinander wie auch zur Aushandlung der lokalen Form interaktiver Reziprozität zwischen den Interaktionspaitnem verwendet. Die (prototypischen) Stile können jedoch auch in andere Aktivitätstypen "übertragen" werden. Dann legen sie die mit ihrem Prototyp verbundenen Interpretationsschemata und Assoziationen für die Interpretation dieser anderen Aktivitäten nahe. Diese Analysen, die v.a. an Analysen von Gumpen: 1982 anknüpfen, zeigen auch hier die interaktiv relevante aktive Verwendungsweise der Intonation als Kontextualisierungsverfahren und verdeutlichen erneut die Wirkungsweise und das Wesen der prosodischen Kontextualisierung von Aktivitäten in der konversationellen Interaktion.
5 Mit allen Analysen dieser Arbeit wird gezeigt, daß prosodische Kategorien eine konkrete und in der Interaktion nachweisbare Relevanz haben und daß prosodische Kategorien genau auf die Erfordernisse der Gesprächsorganisation zugeschnitten sind. Prosodische Kategorien stehen aber auch in enger Beziehung zur Grammatik und zu anderen Ebenen der Organisation der Interaktion, die wir als Grundlage unserer Konstitution und Interpretation sprachlicher Aktivitäten in Gesprächen verwenden. Mit der Analyse von Prosodie als Kontextualisierungsverfahren wird eine Analyseperspektive eröffnet, die es erlaubt, zunächst so unterschiedliche Phänomene wie die Konstruktion von Einheiten, die Turnorganisation, die Konstitution einzelner Aktivitäten bis hin zur Konstitution ganzer interaktiver Gattungen wie Erzählungen und Argumentationen in einer einheitlichen Analyseperspektive zu betrachten und die gemeinsame Voraussetzung der Interpretation solcher Aktivitäten als Aktivitäten zu explizieren. Keine einzige Äußerung aus echten Gesprächen scheint ohne die Einbeziehung der Prosodie und der interaktiven Analyseebene hinreichend vollständig und distinktiv als sprachliche Handlung analysierbar zu sein. Im Gegenteil: Der Schluß liegt nahe, daß rein sequentielle Interaktionsanalysen, die die Prosodie vernachlässigen, diese stillschweigend und unexpliziert in die Analyse und Interpretation sprachlicher Aktivitäten mit einbeziehen und mithin bestenfalls unvollständige, schlimmstenfalls falsche Explikationen erbringen.
1. Zielsetzung und Methodologie der interaktionalen Phonologie der Konversation Die interaktionale Phonologie der Konversation versteht sich als ein linguistischer, speziell ein phonologischer Analyseansatz, der sich bei der Analyse phonologischer und prosodischer Phänomene theoretisch und methodisch auf Sichtweisen und Verfahren der Ethnomethodologie, der ethnomethodologischen Konversationsanalyse und der Kontextualisierungsforschung stützt. In den Rahmen einer interaktionalen Phonologie der Konversation gehören Analysen sowohl der segmental-phonologischen wie auch der prosodischen Organisation der gesprochenen Sprache in der sozialen Interaktion. Mir geht es im Rahmen dieser Arbeit um die Prosodie. Im folgenden werde ich die theoretischen und methodologischen Grundlagen, die Zielsetzungen und Aufgaben, und die Hauptunterscheidungskriterien einer prosodischen Analyse im Rahmen einer interaktionalen Phonologie der Konversation von anderen Ansätzen zur prosodischen Analyse explizieren. Danach werde ich mein methodisches Vorgehen darstellen.
1.1. Theoretische und methodologische Grundlagen und Prämissen Ethnomethodologie, ethnomethodologische Konversationsanalyse und Kontextualisierungsforschung gehören zu den Ansätzen innerhalb des sogenannten "interpretativen Paradigmas" (Wilson 1978) der Geistes- und Sozialwissenschaften. Alle Forschungsansätze innerhalb dieses sogenannten "interpretativen Paradigmas" sehen soziale Interaktion als einen interpretativen Prozeß an, in dem sich im Ablauf der Interaktion die Interagierenden gegenseitig ihre Absichten, Haltungen und Interpretationen anzeigen und in diesem wechselseitigen Prozeß ihre Aktivitäten aufeinander beziehen und abstimmen, Bedeutungen und Definitionen aushandeln und herstellen (vgl. ebd.: 58ff.). Soziales Handeln wird aufgefaßt als bedeutungs- und sinnvolles, aufeinander bezogenes Handeln, als Prozeß von ständiger Definition und Reinterpretation, mit dem soziale Realität hergestellt und gegebenenfalls verändert wird. Ziel interpretativer Analysen ist die Rekonstruktion von Kategorien als Teilnehmerkategorien, d.h. als emische Kategorien, an denen sich Interaktionspartner in Interaktionen bei der Produktion und Rezeption von Aktivitäten orientieren. Streeck (1989: 198) formuliert dies als die "Forderung, daß die von Analysierenden extern vorgenommenen Beschreibungen jene Einheiten und Mechanismen - oder 'Organisationen' - erfassen sollen, an denen die Kommunizierenden sich in ihrer Interaktion miteinander leiten lassen, daß, um SACKS' Metapher zu verwenden, der "apparatus", wie ihn die wissenschaftliche Analyse präsentiert, ein "members' apparatus" ist. Einlösbar ist diese Forderung nur unter der Prämisse, daß der Apparat keine nur mentale Kompetenz von Individuen ist, sondern eine 'öffentliche Ordnung', an der sich Beteiligte in einer interindividuell einsehbaren Weise ausrichten." Die Konversationsanalyse ist einerseits eine genuin strukturalistische Forschungsmethode:
7 "Konversationsanalyse ist Strukturanalyse. Ausgehend von der Annahme, daß es grundsätzlich möglich ist, die "ultimate behavioral materials" (GOFFMAN) zu isolieren, aus denen menschliche Interaktion konstruiert wird, ist sie darum bemüht, deren "Werte im System" - im System "sprachliche Interaktion" - zu bestimmen" (Streeck 1989:204). Diese Ähnlichkeit konversationsanalytischer und strukturalistischer Untersuchungen hebt auch Levinson (1983:367) hervor: "Both kinds of approach are concerned with corpora of recorded materials; both have as a central methodological tool the use of a 'slot and filler' heuristic - i.e. the investigation of how sequential (or syntagmatic) considerations restrict the class of items that may expectably follow, and of how items in that class contrast with one another (or stand in paradigmatic relation)." Jedoch weist Levinson auch sofort auf die substantiellen Unterschiede hin (ebd.): "First, some of the rules formulated in CA (= Conversation Analysis, M.S.), e.g. the turn-taking rules (...), are as much regulative as constitutive, to employ the distinction used by Searle (1969) to distinguish speech act rules (themselves constitutive of each kind of speech act) from, for example, traffic rules (merely regulative of independently existing traffic flow). Secondly, the CA rules describe unmarked expectations rather than the set of possible well-formed sequences or conversations; in this way rules are much more like Grice's maxims than like linguistic rules. Consider, for example, the rule that given a first part of an adjacency pair, a second part should follow; as the notion of conditional relevance (...) makes clear, failure to provide a second is itself a communicative resource that can be used to contribute effectively to conversation. So the adoption of the 'slot and filler' heuristic should not be construed as carrying with it the special sense of rule that is found in linguistics." Die unmarkierte "Normalform" einer Sequenz oder Aktivität in einer bestimmten Situation wird damit zu einem kognitiven Schema, an dem sich Interaktionspartner bei ihren lokalen situations- und rezipientenspezifisch zugeschnittenen Aktivitäten orientieren. Da aber prinzipiell auch immer andere Aktivitäten möglich gewesen wären, die dann eben andere Interpretationen, Inferenzen und Anschlußaktivitäten gefordert hätten, muß auch die Herstellung von Routineaktivitäten als interaktive Leistung analysiert und beschrieben werden (Schegloff 1986). Konversations- und Kontextualisierungsanalyse beschreiben die Produktions- und Interpretationsleistungen von Interaktionsteilnehmern in Interaktionen, mit denen die Interaktionsteilnehmer ihre Interaktionen herstellen und koordinieren. Die ethnomethodologische Konversationsanalyse liefert dabei einerseits grundlegende Konzepte und Kategorien der Analyse konversationeller Interaktion, die auch eine Neubestimmung der Analyseeinheiten und -fragestellungen phonologisch-prosodischer Untersuchungen gegenüber traditionelleren Analysen erfordern. Andererseits stellt sie methodische Verfahren zur Verfügung, die auf die empirische Analyse und die Rekonstruktion von unmarkierten Erwartbarkeitsbeziehungen zwischen (sprachlichen) Aktivitäten abzielen, an denen sich Teilnehmer in Interaktionen beobachtbar und nachweisbar orientieren.
8
1.1.1. Kontextualisierung Als Mittel der Organisation und Koordination der o.g. 'öffentlichen Ordnung' werden in jüngster Zeit zunehmend die sogenannten "Kontextualisierungshinweise" untersucht (vgl. insbesondere Gumperz 1982, 1990, 1992; Auer 1986, 1992a). Für die wechselseitige Signalisierung und Kontextualisierung von Aktivitätstypen (Gumperz 1982,1992) verwenden die Interaktionspartner neben den segmentalen vor allem auch prosodische Signale, deren Analyse der Gegenstand der vorliegenden Arbeit ist. Der Begriff der Kontextualisierung, der 1976 von John Gumperz und Jenny Cook-Gumperz geprägt und v.a. von Gumperz 1982 weiterentwickelt wurde, bezieht sich auf die konstitutiven Leistungen der Interaktionspartner, mit denen sie in ihren Interaktionen Kontexte sprachlich oder durch sprachbegleitende Signale hervorbringen und relevant machen und mit denen sie ihre jeweiligen Aktivitäten wechselseitig interpretierbar und erschließbar machen. So ist zum Beispiel eine Kontexteigenschaft wie Formalität oder Informalität nicht allein durch äußere Kontextfaktoren wie Ort, Zeit, Beziehung der Interaktionspartner usw. beschreibbar, sondern Formalität oder Informalität wird durch die Art der Interaktion selbst, durch die verwendeten sprachlichen und nicht-sprachlichen Signale hergestellt, aufrechterhalten und ggf. verändert und beendet. Die Relevanz des Kontextualisierungsansatzes für die Linguistik, die Kontexte gerne als eine außersprachliche Größe betrachtet, die unidirektional sprachliches Handeln beeinflußt oder gar determiniert, beschreibt Auer (1986: 23f.) wie folgt: "Im Gegensatz zu dieser Vorstellung von Kontext als einer Determinante individuellen Verhaltens gehen nun Cook-Gumperz & Gumperz (1976) von einem aktiven Interaktionsteilnehmer aus, der nicht nur auf Kontext reagiert, sondern auch Kontext aufbaut: Sprecher bilden nicht nur Sätze, um ('referentielle') Bedeutungen oder Informationen zu übermitteln, sie stellen ihre Äußerungen zugleich in einen Kontext und ermöglichen so dem Rezipienten Verstehen. Anders gesagt: für die Interaktionsteilnehmer besteht die Aufgabe darin, (sprachliche) Handlungen auszuführen und zugleich interpretierbar zu machen, indem ein Kontext konstruiert wird, in den sie sich einbetten. Der Schritt von 'Kontext' zu 'Kontextualisierung' ist demzufolge folgendermaßen gekennzeichnet: (a) Kontext wird nicht als material gegeben, sondern als interaktiv produziert angesehen. Seine Realität ist nicht die einer physikalischen Präsenz, sondern die eines (Ethno-)Konstrukts, das dazu dient, in einer zwar revidierbaren, aber für alle praktischen Zwecke ausreichenden Weise die Situation zu definieren. Für die wissenschaftliche Analyse bringt ein solcher kognitiver Kontextbegriff eine wesentliche Erschwernis mit sich. Es ist nun nämlich nicht mehr damit getan, das objektive Vorliegen bestimmter äußerer (etwa lokaler) Gegebenheiten, bestimmter 'Rollen' der Teilnehmer oder bestimmter textueller Vorgängerstrukturen festzustellen; es muß vielmehr gezeigt werden, daß sich die Teilnehmer an diesen objektiv gegebenen Strukturen orientieren. So wird z.B. die Tatsache, daß ein Interaktionsteilnehmer 'Lehrer' und die andere 'Schülerin', oder die eine 'Ärztin' und der andere 'Patient' ist, nicht schon deshalb relevant, weil eine solche Kategorisierung aufgrund unseres externen Wissens möglich ist, sondern es ist nachzuweisen, daß die Teilnehmer auch tatsächlich mit diesen Kategorien (und nicht etwa mit alternativ verfügbaren wie 'Bekannter', 'Nachbarin' oder 'Musikfan') operieren. Wichtig ist, ob ein objektiv vorliegendes Kontextmerkmal (nicht nur individuell, sondern wechselseitig) wahrgenommen, d.h. zu einem Teil der Interaktion gemacht wird.
9 (b) Auf diese Weise wird 'Kontext' zu einem analytischen Problem. Es ist nicht mehr möglich, sich mit einem Verweis auf den als Restkategorie in die Untersuchung mit einbezogenen Kontext zu begnügen. Die Strategien, mittels derer ihn die Teilnehmer konstruieren, sind ein eigenständiges Thema der Forschung." Kontextualisierung erlaubt den Aufeinanderbezug von mehreren sonst eher disparaten Forschungsbereichen: formorientierten strukturellen Analysen v.a. zur Phonetik/Phonologie, Prosodie und Kinetik, Syntax, Sprechstilen, Codes usw. in gesprochener Sprache in Gesprächen, die Analyse von semantischen u.a. interpretativen Frames, Rahmen, Schemata usw., und die Konversationsanalyse natürlicher Gespräche (ebd.: 22). Auer 1986 definiert die in diesem Ansatz relevanten Begriffe wie folgt: "Unter Kontextualisierung wollen wir all jene Verfahren verstehen, mittels derer die Teilnehmer an einer Interaktion für Äußerungen Kontext konstituieren. Solche Verfahren stellen zwischen zwei essentiellen Bestandteilen eine Verbindung her: einem empirisch gegebenen (beobachtbaren) Datum, das der kontextualisierende Teilnehmer aus einem Zeichenvorrat sprachlicher oder nichtsprachlicher Art auswählt - dem Kontextualisierungshinweis ("contextualization cue") -, und einer Komponente des Hintergrundwissens. Wir wollen davon ausgehen, daß dieses Hintergrundwissen in Form von Schemata organisiert ist. Kontextualisierungsverfahren sind also dadurch bestimmt, daß in ihnen bestimmte Kontextualisierungshinweise auf eine bestimmte Art eingesetzt werden, um Schemata aus dem Hintergrundwissen verfügbar zu machen" (ebd.: 24). In einer an die ethnomethodologische Konversationsanalyse angelehnten Methodologie werden in Interaktionen verwendete linguistische und andere Strukturen als emische Signalisierungs- und Kontextualisierungsmittel aufgefaßt, mit denen Interaktionspartner sich wechselseitig die für die Interaktion relevanten Interpretationsrahmen verfügbar machen und (ggf. strategisch) nahelegen. Die ethnomethodologische Konversationsanalyse interessiert sich v.a. für die formalen Organisationsmechanismen konversationeller Interaktion und beschreibt diese als kontextfreie Organisationsmechanismen - z.B. im Falle des Turn-Taking-Systems als einen "(kontextfreien) formalen Apparat" (Sacks/Schegloff/Jefferson 1974: 699) und im Falle von Reparaturen als einen "self-righting mechanism" (Schegloff/Jefferson/Sacks 1977: 381), einen "selbstkorrigierenden Mechanismus für die Organisation des Sprachgebrauchs in der sozialen Interaktion" (Übersetzung von Streeck 1983: 85) -, die lokal von den Interaktionspartnern verwendet und auf die spezifische Situation kontext-sensitiv zugeschnitten werden (Sacks/Schegloff/ Jefferson 1974: 699f.). Hierbei konzentrieren sich die Analysen der ethnomethodologischen Konversationsanalyse zumeist auf die sequentielle Struktur und Organisation von konversationeilen Aktivitäten. Im Vergleich mit der Sichtweise der Interaktion als "self-righting mechanism" heben Kontextualisierungsforscher stärker die situativen Produktions- und Interpretationsaktivitäten der Teilnehmer hervor und rekonstruieren die konversationelle Organisation als eine von den Interaktionspartnern interaktiv zuwege gebrachte. Bereits Goodwin 1981 zeigte nämlich, daß Turnorganisation keinem abstrakten Regelwerk folgt, sondern daß der Blickkontakt zwischen Interaktionspartnern das Zustandekommen und die interne Organisation des Turns entscheidend mit beeinflußL Ähnlich sind auch andere von der Konversationsanalyse beschriebene
10 formale Mechanismen das Resultat (inter-)aktiv hergestellter Organisationsaktivitäten. Und genau diese Perspektive der (inter-)aktiven Herstellung interaktiver Phänomene in einem mit Hilfe von Signalen koordinierten Interaktions- und Interpretationsprozeß rückt in der Kontextualisierungsforschung in den Vordergrund. Die Organisation der konversationellen Interaktion wird damit als ein wechselseitig hergestellter Interaktions- und Interpretationsprozeß aufgefaßt, in dem sich Interaktionspartner interaktive Bedeutungen signalisieren und Bedeutungen inferieren und aushandeln. Konversationelle Aktivitäten sind als solche signalisiert und erkennbar gemachte, als solche 'kontextualisierte' Aktivitäten. Rezipientenreaktionen und andere Aktivitäten sind das Resultat der Interpretation von Aktivitäten im Kontext Und Interpretationen von Aktivitäten sind keine unanalysierbaren a priori: "... interpretation at the level of conversation is a function of an inferential process that has as its input syntactic, lexical and prosodie knowledge, and ... judgements of intent are based on speakers' ability to relate the information received in these channels" (Gumperz 1982: 117). Die Perspektive der Kontextualisierung gegenüber einer rein sequentiell vorgehenden Konversationsanalyse hat Gumperz einmal mit folgendem Beispiel verdeutlicht: "Now there are two important points that need to be made about the distinction between the kind of conversational analysis that I suggest and some forms of sociological analysis which deal with such things as non-first firsts. The problem is how do I know what a non-first first is. That assumes that we pay attention to everything when involved in a conversation, that your short-term memory retains everything that we hear. There's evidence that we don't necessarily do that. Conversational signalling is very redundant. I can also give you a sentence with certain kinds of prosodie treatment that mark it as a non-first attempt. For example, if I say "Come here.", that's a first attempt. But if I say "Come herel" that's probably a second attempt. I don't have to hear the first "Come here" to process the second one as most probably a second attempt. By the way in which the message is treated linguistically I assume that it is a second attempt. Now how do you account for this in terms of the kind of structuralist analysis that you find in ethnomethodological work?" (Gumperz 1984: 111) Nun gilt es zu fragen, mit Hilfe welcher Signale und Verfahren Interaktionspartner sich wechselseitig ihre Aktivitäten als z.B. bezogen auf die Formulierung einer Äußerungseinheit, die Organisation des Sprecherwechsels, die Herstellung von Aktivitäten und Sequenzen im Gespräch wie Frage-Antwort-Sequenzen, Reparatursequenzen, Erzählungen usw. verstehbar und interpretierbar machen. In der Kontextualisierungsforschung stehen neben non-verbalen und kinetischen v.a. auch die nicht-segmentalen prosodischen und die segmentalen verbalen Signale im Vordergrund, mit denen Interaktionspartner die Organisationsmechanismen der konversationeilen Interaktion aktiv herstellen und für den Rezipienten interpretierbar machen. Neben der Prosodie gehören hierzu als weitere verbale Signale z.B. auch die Wahl von Partikeln (vgl. Franck 1980) und lexikalischen Einheiten und Formulierungsverfahren (vgl. Gülich/Kotschi 1987), die Wahl syntaktischer Alternativen (vgl. Fox 1987, Fox/Thompson 1990), die Wahl und Veränderung der Sprachvarietät bzw. des Sprechstils (vgl. z.B. Auer 1984, Gumperz 1982: 131 und Kapitel 9, Hinnenkamp 1989, Selting 1989a,b).
11 Kontextualisierung bedeutet immer die Nahelegung eines (ggf. kulturspezifischen) Interpretationsrahmens für die Interpretation einer konkreten Äußerung in einer konkreten Interaktionssituation. Dabei werden die Signale natürlich nicht mechanistisch, sondern als Ressource verwendet, die der Sprecher ggf. auch strategisch einsetzen kann. Der nahegelegte Interpretaüonsrahmen kann ein konventionell erwartbarer oder auch ein unerwarteter und ggf. aufgrund sozialer Erfahrungen oder Bewertungen assoziierter sein. "Thus the activity type does not determine meaning but simply constrains interpretations by channelling inferences so as to foreground or make relevant certain aspects of background knowledge and to underplay others. (...) A basic assumption is that this channelling of interpretation is effected by conversational implicatures based on conventionalized co-occurrence expectations between content and surface style. That is, constellations of surface features of message form are the means by which speakers signal and listeners interpret what the activity is, how semantic content is to be understood and how each sentence relates to what precedes or follows. These features are referred to as contextualization cues." (Gumperz 1982: 131) Da viele Kontextualisierungshinweise linguistischer Natur sind und im Prinzip auch m.E. jedes linguistische Phänomen in einer Kontextualisierungsperspektive als Ressource im Hinblick auf Kontextualisierungsverfahren analysierbar ist, ist der Kontextualisierungsansatz auch unmittelbar relevant für die Linguistik. Das Kontextualisierungskonzept liefert eine Gesamtperspektive zur integrativen Beschreibung ansonsten sehr unterschiedlicher Einzelphänomene (vgl. auch Gumperz 1982: 208).
1.1.2. Ziele und Aufgaben der interaktional-prosodischen Analyse Der Gegenstand der vorliegenden Untersuchung ist Prosodie im Gespräch. Den Begriff Prosodie verwende ich - wie bereits ausgeführt - als Oberbegriff für diejenigen Aspekte der Rede, die sich aus dem Zusammenspiel der akustischen Parameter Grundfrequenz, Intensität und Dauer bzw. der auditiven Korrelate Tonhöhe, Lautheit und Länge in silbengroßen oder größeren Domänen ergeben. Hierunter fallen auditive Phänomene wie Intonation, d.h. der Tonhöhenverlauf der Segmente und Äußerungen in der Zeit, Lautstärke, Länge von Segmenten, Sprechgeschwindigkeit bzw. Tempo, Rhythmus und Pausen. Das zentrale Ziel einer interaktional-prosodischen Analyse ist die Analyse der Rolle der Prosodie bei der Organisation der alltäglichen Konversation. Als Jürgen Streeck 1983 die Relevanz konversationsanalytischer Fragestellungen und Analysen für die Linguistik herausstellte, hob er mit Bezug auf Schegloff 1979 die Gebundenheit sprachlicher Objekte wie 'Sätze', die in Alltagsgesprächen vorkommen, an die Organisationsmechanismen des Gesprächs hervor. Als wichtigste Kennzeichen von sprachlichen Äußerungen bzw. Sätzen, die in Gesprächen gesagt werden, nannte Streeck in Anlehnung an Schegloff 1979: "- sie sind an Turns gebunden, in denen sie vorkommen, (...); - sie sind von voraufgegangenen Äußerungen geprägt, haben "sequentielle Implikationen" für nächste Äußerungen, treten also nicht isoliert auf; - sie sind immer im Hinblick auf die Bedürfnisse ihres konkreten Empfängers gestaltet (recipient designed) (...);
12 - sie sind Produkte eines störanfälligen Systems, das Reparaturen an Ort und Stelle erforderlich machen kann (...)" (ebd.: 74f.). Hiermit haben Schegloff und Streeck die grundlegenden Einheiten und Mechanismen benannt, auf die hin aus ethnomethodologischer Perspektive sprachliche und nicht-sprachliche Objekte zugeschnitten sind. Ebenso wie Schegloff 1979 in seiner Konzeption einer 'Syntaxfor-conversation' zeigte, daß sprachliche Objekte wie 'Sätze' auf die Erfordernisse der Turnkonstruktion zugeschnitten sind (vgl. auch Auer 1992b), so liegt die Hypothese nahe, daß gerade auch prosodische und phonologische Phänomene als die primordialen Manifestationsformen gesprochener Sprache auf die Bedürfnisse und Erfordernisse gesprochener Sprache in Gesprächen, d.h. konkret der Turnkonstruktion und der Gesprächsorganisation, zugeschnitten sind. Ziel einer interaktional-phonologischen Analyse ist dann auch die Beschreibung der prosodischen Parameter, die in natürlichen Gesprächen zur Tumkonstruktion und zur Gesprächsorganisation verwendet weiden. Konkret geht es dabei z.B. um folgende interaktive Aufgaben: (1) Die Konstruktion von Turnkonstruktionseinheiten und Turns: Herstellung bzw. Signalisierung der internen Kohäsion und der Abgrenzung wie auch der Kombination von Äußerungseinheiten in Redebeiträgen oder Turns, d.h. den aus der Konversationsanalyse bekannten sogenannten "Turnkonstruktionseinheiten" (Sacks/Schegloff/Jefferson 1974, Schegloff 1982,1987); Signalisierung der internen Struktur, der "Bausteine" und "Bauweise" dieser Turnkonstruktionseinheiten, u.a. auch das Zusammenwirken der prosodischen Struktur mit der Syntax und Lexiko-Semantik und mit der Position der Einheit im Turn oder in einer Gesprächssequenz (vgl. auch Selting 1991,1992a). (2) Die Organisation des Sprecherwechsels: Signalisierung des Status der Turnkonstruktionseinheit innerhalb des Turns, z.B. Signalisierung, ob eine gegebene Einheit turnbeendend sein soll oder nicht und ob also ein Sprecherwechsel ansteht oder nicht (vgl. Local/Kelly/Wells 1986); Signalisierung der Art des Sprecherwechsels mit Hilfe z.B. rhythmischer Prinzipien (vgl. Couper-Kuhlen 1993); Signalisierung, ob ein simultan einsetzender Redebeitrag eines zweiten Sprechers das Rederecht beansprucht oder nicht (French/Local 1983). (3) Konstitution interaktiv relevanter Aktivitätstypen: Verwendung prosodischer, gegebenenfalls in Kookkurrenz mit anderen Parameter(n) als aktivitätstyp-unterscheidende Kontextualisierungshinweise bei der Konstitution von Aktivitätstypen, wie z.B. unterschiedlichen Typen konversationeller Fragen oder unterschiedlichen Typen von Reparatureinleitungen bzw. Problemmanifestationen im Gespräch (vgl. Selting 1991,1992a; Kelly/Local 1989). (4) Analyse der Rolle der Prosodie für die Signalisierung kohäsiver Beziehungen zwischen Aktivitätsteilen und Aktivitäten und für die Herstellung von Interaktionsstilen: Signalisierung der Art der Beziehungen aufeinanderfolgender Einheiten zueinander, u.a. auch im Hinblick auf kohäsive Beziehungen in längeren Turns wie beim Erzählen oder Argumentieren und im Hinblick auf die Konstitution von z.B. kooperativen versus antagonisti-
13 sehen Interaktionsstilen und -beziehungen (vgl. Gumperz 1982, Selting 1988,1989a,b, 1992b; Couper-Kuhlen 1983, Goldberg 1978). Prosodische Parameter werden als Kontextualisierungshinweise aufgefaßt, d.h. als Signale, die die für die Interpretation einer gegebenen Aktivität relevanten Interpretationsrahmen verfügbar machen und nahelegen (Gumperz 1982). Die durch prosodische Signale nahegelegten Interpretationsrahmen beziehen sich z.B. auf die von Auer 1986 dargelegten "Schemata auf fünf Ebenen: das generelle Schema des fokussierten Interagierens, die Schemata des 'turn-taking' (also 'Rezipient', 'Zuhörer', 'Sprecher', 'Adressat'), Handlungsschemata, thematische Schemata sowie Beziehungsschemata", denen er die folgenden interaktiven Problemstellungen zuordnet: "1) Reden wir (gerade) miteinander? 2) Wer spricht (gerade) mit wem? 3) Was tun wir (gerade)? 4) Worüber sprechen wir (gerade)? sowie 5) Wie stehen wir (gerade) zueinander?" (Auer 1986: 27). Die Analyse prosodischer Parameter als Kontextualisierungshinweise setzt die Unabhängigkeit der Prosodie von der Grammatik oder der Textsorte oder anderen quasi "unabhängigen" Variablen voraus. Bei allen o.g. Aktivitäten legen aktivitätstypspezifische konstitutive Bündel prosodischer Signale die entsprechenden Interpretationsrahmen, die diese Aktivitäten als Aktivitäten im Sinne der genannten Aktivitätstypen interpretierbar machen, erst nahe. Die prosodischen Signale unterscheiden sie von vielleicht auf den ersten Blick segmental ähnlichen, dennoch aber prosodisch anders kontextualisierten Aktivitätstypen. Für die Konstitution und Interpretation des Rezipienten sind diese prosodischen Merkmalbündel also distinktiv. Der Gegenstand meiner Untersuchungen ist also die Organisation der konversationeilen Interaktion, speziell die Konstruktion von Turnkonstruktionseinheiten und Turns, die Gesprächsorganisation und die Aktivitätskonstitution. Ich werde mich mit der Untersuchung der genannten prosodischen Parameter befassen, soweit sie für diese Aufgaben relevant sind, und systematisch ihre Rolle für die Organisation der Konversation herausarbeiten.1 Dagegen werde ich mich nicht in umgekehrter Perspektive von den Einzelparametern ausgehend systematisch mit der Rolle einzelner prosodischer Parameter wie z.B. der Rolle der Lautstärke oder der Sprechgeschwindigkeit oder des Rhythmus für die Organisation der Interaktion befassen (zur Rolle der Sprechgeschwindigkeit vgl. etwa Uhmann 1992, für eine systematische Analyse des Rhythmus und seiner Rolle für die Organisation der Interaktion siehe Auer 1990, Couper-Kuhlen/Auer 1991, Couper-Kuhlen 1993, Müller 1991). Hiermit dürfte deutlich sein, daß in der vorliegenden Arbeit der Terminus "interaktionalphonologisch" sich immer auf Einheiten und Funktionen der konversationellen Interaktion und deren Organisation bezieht. Interaktional-phonologische bzw. -prosodische Einheiten und Kategorien sind Teilnehmerkategorien, deren Relevanz für die Organisation der alltäglichen Interaktion nachgewiesen werden muß. Diese phonologischen Einheiten und Funktionen müssen nicht unbedingt mit phonologischen Einheiten und Funktionen kontextfrei produzierter Sätze des Deutschen übereinstimmen. Im Rahmen interaktional-phonologischer Analysen sind Sprache allgemein und einzelne sprachliche Subsysteme primär als kommunikativ bzw. interaktiv relevante Signalisierungssysteme von Interesse. Bei der interaktional-phonologischen Analyse konversationeller Aktivitäten wird dementsprechend immer von der sequentiell interpretierten Aktivität als Explan1
Für einen neueren Überblick über vorliegende Arbeiten zum Thema Prosodie bzw. Intonation und Diskurs siehe Brilnner 1989.
14 andum ausgegangen und es wird danach gefragt, mit Hilfe welcher konstitutiven Signale aus welchen Signalisierungssystemen sie hergestellt und als solche interpretierbar gemacht werden. Ziel der interaktionalen 'Phonologie der Konversation' ist dabei die Analyse und 'Dekomponiening' (vgl. auch Schegloff 1987) konversaüoneller Aktivitäten bis in die kleinsten interaktiv und interpretativ relevanten Parameter, die in konstitutiven Merkmalbündeln als Kontextualisierungshinweise verwendet werden. Die interaktional-phonologische Analyse kann dabei durchaus ausgehen von holistischen interpretativen Kategorien und Zuschreibungen und diese im Forschungsprozeß sukzessive dekomponieren. Dem methodologischen Usus der ethnomethodologischen Konversationsanalyse folgend strebe ich eine Kombination von Struktur- bzw. Distributionsanalyse und interpretativer bzw. Sequenzanalyse an (vgl. auch Levinson 1983: chapter 6), die sich in den Analysen selbst jedoch meist ergänzen und ineinander greifen. Erstere ist im Prinzip ähnlich einer strukturalistischen Struktur- und Distributionsanalyse; letztere hingegen ist typisch und konstitutiv für die Konversations- und Kontextualisierungsanalyse und mithin auch für die interaktionale Phonologie der Konversation. Bei der Strukturanalyse geht es um die Identifizierung (ggf. zunächst noch holistischer) interpretativer Einheiten und deren strukturelle Analyse und Dekomponiening in ihre kleinsten interpretativ relevanten und distinktiven/konstitutiven Parameter. Bei der sogenannten Sequenzanalyse geht es um den empirischen Nachweis der interpretativen Relevanz der analysierten Kategorien: Es wird davon ausgegangen, daß interaktiv relevante Kategorien vom Rezipienten nicht nur wahrgenommen und funktional interpretiert, sondern auch im sequentiell nachfolgenden Turn oder in anderen Rezipientenreaktionen diese Interpretation dem Sprecher signalisiert wird. Zum Beispiel folgt auf eine als konversationeile Frage interpretierte Aktivität eines ersten Sprechers entweder die konditioneil relevante Antwort des Rezipienten, oder aber der Rezipient gibt einen Hinweis, daß und ggf. weshalb er diese Antwort nicht gibt. Im letzteren Fall ist aber gerade auch dieser Hinweis Evidenz dafür, daß der Rezipient die Frage als Frage verstanden hatte. In diesem Sinne kann die Reaktion des Rezipienten in den sequentiell nachfolgenden Rezipientenreaktionen als Evidenz für die Interpretation einer Äußerung und für die interpretative Relevanz einer Kategorie herangezogen werden (Sacks/ Schegloff/Jefferson 1974; Levinson 1983: Kapitel 6). In der interaktional-phonologischen Analyse soll mithilfe der Sequenzanalyse gezeigt werden, daß und wie die Kategorien interaktional-phonologischer Analysen auf die sich ständig stellenden Erfordernisse der Organisation der alltäglichen Interaktion zugeschnitten sind, daß und wie Teilnehmer an Konversationen sich beobachtbar bzw. rekonstruierbar an diesen Kategorien orientieren und sie systematisch und 'methodisch' als Ressource verwenden.2 Daran anlehnend möchte ich die Aufgaben, Arbeitsschritte und Ziele einer interaktionalen Phonologie der Konversation wie folgt formulieren:
Zu den in der Konversationsanalyse verwendeten Analyse- und Validieningsverfahren vgl. auch Wootton 1989, für eine Anwendung dieser Verfahren auf den Gegenstandsbereich prosodischer Analysen siehe Couper-Kuhlen/Selting (im Druck).
15 Im Rahmen der Struktur- und Distributionsanalyse geht es um: (1) Die Identifizierung relevanter (ggf. holistischer) interpretativer Einheiten. Hierbei steht die Rekonstruktion und Analyse der für die Konstitution und Organisation des Gesprächs (in bezug auf die Turnkonstruktion, Gesprächsorganisation, Handlungs-/Aktivitätstypenkonstitution, Beziehungsgestaltung, usw.) relevanten phonetisch-phonologischen, ggf. noch holistischen, Kategorien und Kontextualisierungen im Vordergrund. (2) Die Analyse und Dekomponierung der Bausteine und Bauweise holistischer Einheiten. Holistische Kategorien sollen in ihre kleinsten interpretativ relevanten und distinktiven/konstitutiven Kategorien, Parameter und Merkmale, die als Kontextualisierungshinweise verwendet werden, dekomponiert werden. Diese kleinsten interpretativ relevanten und distinktiven Kontextualisierungshinweise werden auf ihre Kombinationsmöglichkeiten und -restriktionen im Hinblick auf die Konstitution von Aktivitäten untersucht. (3) Die Analyse der Beziehungen zwischen textueller bzw. segmentaler und phonologischer/prosodischer Kontextualisierung. Um die Rolle der prosodischen Kontextualisierungshinweise für die Organisation und Kontextualisierung sprachlicher Aktivitäten zu untersuchen, wird nach der Kookkurrenz und Interdependenz interaktional-phonologischer Parameter mit syntaktischen, semantischen, aktivitätstypspezifischen u.a. Einheiten gefragt Im Rahmen der interpretativen Sequenzanalyse geht es um: (1) Den Nachweis der interpretativen Relevanz der analysierten Kontextualisierungshinweise. Es muß nachgewiesen und demonstriert werden, wie phonologische/prosodische Parameter von den Teilnehmern als Signale und interaktiv/interpretativ relevante Kategorien verwendet werden, an denen sie sich tatsächlich rekonstruierbar orientieren; die sie tatsächlich bei ihren konversationellen Aktivitäten als interpretative Kategorien methodisch und systematisch verwenden; mit denen sie tatsächlich im sequentiellen Kontext bestimmte Inteipretationen und sequentielle Implikationen für die Folgereaktion erwartbar bzw. konditioneil relevant machen. Methodisch wird hierbei v.a. die Reaktion des Rezipienten in den auf ein Phänomen folgenden Turns herangezogen, die als "Display" der situativen Interpretationen angesehen wird. (2) Die Rekonstruktion des Sinns und der interaktiven Aufgaben, auf deren routinemäßige Bewältigung die phonologischen Parameter zugeschnitten sind, sowie der Interpretationsrahmen und Evokationen, die durch die analysierten phonologischen Einheiten und Parameter kontextualisiert, lokal relevant und verfügbar gemacht werden.3 3
Insbesondere bei dieser letztgenannten Aufgabe ist eine Anbindung der interaktìonal-phonologischen Analyse an z.B. eine interaktional/interpretativ-soziolinguistische Stilanalyse möglich und sinnvoll (vgl. Selting/Hinnenkamp 1989 und die anderen Beiträge im Sammelband Hinnenkamp/Selting 1989). Konversationsanalytiker nehmen an, daß diese qualitative Analyse und der Nachweis der interaktiven Relevanz eines strukturellen Phänomens einer quantitativen Analyse überlegen ist: Faktisch kann ein Phänomen durchaus in vielen Fällen entgegen der Erwartung realisiert sein; dennoch belegt dann genau die Tatsache, wenn trotz unerwarteter Realisierung die Interaktionspartner ihre Orientierung an der Erwartung mit z.B.
16 Dieses Vorgehen lehnt sich eng an die Vorgehensweise und Konzeption einer "phonology for conversation" der Phonologen der Universität York, Local, Kelly, Wells u.a., an (siehe v.a. Local/Kelly/Wells 1986). Auf deren Einzelanalysen und -ergebnisse werde ich an geeigneten Stellen meiner eigenen Analyse noch näher eingehen. Von den herkömmlichen Forschungsansätzen im Rahmen der Phonologie und Prosodie, bei denen der Status der Kategorien und Ergebnisse im Hinblick auf empirisch beobachtbares sprachliches Handeln nicht immer klar ist, unterscheidet sich der hier entwickelte Ansatz v.a. durch die geforderte und für diesen Ansatz notwendige Ergänzung der Struktur- und Distributionsanalyse durch den empirischen Nachweis der interpretativen Relevanz der Kategorien und Modelle im Rahmen der interpretativen Sequenzanalyse. In einer interaktional-phonologischen Analyse erscheinen dann statt der in anderen Ansätzen explizierten "Regeln" Explikationen und Rekonstruktionen der Verfahren und 'Methoden', mit denen Teilnehmer mit bestimmten sprachlichen und prosodischen Mitteln an bestimmten Stellen im Gespräch erkennbar und für die Rezipienten verstehbar Sinn erzeugen. Da meine Daten nur Gespräche mit Sprechern nordwestdeutscher Varietäten des Deutschen umfassen, sind meine Einzelergebnisse auf diese Varietät beschränkt. Mit dem in der Konversationsanalyse üblichsten "Beweisverfahren", der Analyse von Rezipientenreaktionen bei nicht erwartungsgemäß laufenden oder dyspräferierten Sequenzverläufen, gibt es jedoch bei der Analyse der Rolle der Prosodie gelegentlich Probleme: Da die Prosodie allein keine Aktivitäten konstituiert, sondern nur ein konstitutiver Parameter einer Aktivität ist, resultiert ihre Variation lediglich in der Konstitution unterschiedlicher Aktivitäten, auf die jeweils anders reagiert wird. Indem ich dies aufzeige, kann ich zwar mittels der Folgereaktion die Relevanz der Prosodie für die Interpretation der Vorgängeräußerung plausibel machen, die Relevanz der Prosodie selbst jedoch nicht so explizit wie bei z.B. Nachbarpaaren nachweisen. Einklagungen oder die Markierung dyspräferierter Aktivitäten, die die analysierte Normalform als Orientierungsschema nachweisen (vgl. hierzu Levinson 1983), beziehen sich ja auf holistisch interpretierte Aktivitäten, i.d.R. nicht auf deren isolierte Prosodie. Deshalb müssen Nachweise der inteipretativen Relevanz prosodischer Phänomene wohl oft impliziter bleiben.
1.1.3. Prosodie als autonomes Signalisierungssystem und bisherige Ansätze der Prosodie- und Intonationsforschung Die Analyse der Prosodie als Kontextualisierungshinweis setzt die Annahme der Unabhängigkeit der Prosodie von anderen linguistischen Systemen voraus, die Annahme der Prosodie als autonomem Signalisierungssystem. Prosodie wird als eigenständiges Signalisierungssystem unabhängig von Grammatik und Text(sorte), wohl aber in Kookkurrenz mit grammatischen und textuellen Signalen verwendet. Innerhalb der linguistischen Prosodie- und Intonationsforschung wird diese Annahme auch von Bolinger (seit 1958, siehe v.a. 1982, 1986, 1989), Gibbon (v.a. 1981, 1984, 1987) und Knowles (1984) vertreten; sie steht jedoch im Gegensatz zu vielen gängigen Intonationstheorien, v.a. dem systemisch-tonetischen Ansatz in 'Accounts', Korrekturen, Nachfragen, usw. manifestieren, die Wirksamkeit dieser Erwartungsstruktur. Das kann aber nur eine genaue sequentielle Analyse aufdecken. Eine quantitative Analyse wäre hier wenig aufschlußreich, da sie die interaktive Bedeutung der Phänomene nicht erfassen kann.
17 der Tradition von Halliday 1967, für das Deutsche repräsentiert v.a. durch Pheby (v.a. 1969, 1980), und einigen neueren nicht-linearen generativen Intonationstheorien (für das Deutsche siehe v.a. Wunderlich 1988), die Intonation in systematischer Beziehung zu grammatischen Kategorien beschreiben.4 Bolinger 1986 grenzt seine grundlegende Annahme wie folgt von anderen Intonationstheorien ab: "it differs from others mainly in its insistence on the independence of intonation from grammar. Intonation has more in common with gesture than with grammar (...), though both gesture and intonation are tremendously important to grammar, as their lines intersect" (Bolinger 1986: viii). Ähnlich wie in der Analyse in dieser Arbeit sieht Bolinger 1989 die Aktivitäten der konversationellen Interaktion als die Einheiten an, in bezug auf die Grammatik und Intonation in ihrer Interdependenz analysiert werden müssen, um die Rolle der Intonation zu analysieren: "Intonation and syntax make their separate contributions to conversational interaction. There is where they come together, not in a higher or more properly linguistic domain" (ebd.: 78). Bolinger faßt Intonation als Teil der Gestik auf; Grammatik und Gestik seien am besten als autonome Systeme mit Verbindungslinien zu sehen. Zur Auffassung von Intonation als Teil der Gestik paßt dann Bolingers - von Lakoff/Johnson 1980 entliehene - "metaphor of up and down", in deren Rahmen er fallende und steigende wie auch hohe und tiefe Tonhöhenverläufe ikonisch interpretiert als z.B. "up in the air", "down", "keyed up'V'keyed down", "play sth. up/down", usw. (vgl. Bolinger 1986: 202ff.). "The theoretical position of this book is that intonation is fundamentally the opposition of up and down, with meanings clustering around the poles of the opposition in accord with metaphorical extensions (...), also that intonation shares with physical gesture the manifestations of this opposition - up and down are carried by the facial muscles, shoulders, etc." (ebd.: 221). Im Rahmen seiner 1989iger Monographie analysiert Bolinger dann (offenbar anhand von introspektiven Beispielen) die Verwendung der Prosodie für die Signalisierung und Begrenzung ("demarcation") von "segments" (ebd.: 8Iff.) und für die Formulierung von unterschiedlichen Typen von Fragen und anderen Äußerungstypen und belegt damit weiter seine These der Autonomie der Intonation von der Grammatik (vgl. auch ebd.: 143). Auch bei der Analyse der Akzentuierung besteht er darauf, daß die Akzentzuweisung und die Interpretation der Akzentdomänen nicht grammatisch, sondern semantisch erklärt werden muß mit den Prinzipien "accent of power" und "accent of interest" (vgl. ebd.: chapter 9). In vielerlei Hinsicht kommt Bolingers Analyse trotz anderer Methodologie zu ähnlichen Ergebnissen wie die vorliegende Analyse. In Anlehnung an Bolinger faßt auch Gibbon (v.a. 1981, 1984, 1987) Intonation als ein autonomes System auf, als ein "metalokutives Signalisierungssystem". Auch er sieht Prosodie als primär bezogen auf mündliche Interaktion: "Discourse structures, not sentence structures are the primary correlates of the structures defined by the prosodie systems of language." (Gibbon 1987: 4). Gibbon hebt über Bolinger hinaus v.a. die genre- und stilkonstitutive Funktion der Akzentuierung hervor: Er postuliert prosodische Sprechstile, die aus der unterschiedlichen Organisation der Akzentuierung in unterschiedlichen Aktivitätstypen und Kontexten resultieren: Während z.B. in Vorlesestilen die Akzentuierung zur Signalisierung der Für einen Überblick über die Forschung zur Prosodie im Deutschen siehe Gibbon 1987a, für einen Überblick über die neuere nicht-lineare prosodische Phonologie siehe v.a. Goldsmith 1990.
18 syntaktischen Struktur eingesetzt wird, signalisiert sie in längeren Beiträgen zu dialogischen Interaktionen eher die semantische Strukturierung der Beiträge, in ritualisierter Kommunikation kann sie schließlich vor allem zur Herstellung eines bestimmten Rhythmus und einer bestimmten Stilisierung verwendet werden (die "Ebenenwechselhypothese"; vgl. Gibbon 1983: 204ff„ 1984: 166). Schließlich faßt auch Knowles (1984: 227) Intonation auf als "part of rhetoric, or the strategies employed to get that message across". Während Bolinger und Gibbon Prosodie und v.a. auch Intonation als von der Grammatik unabhängige, autonome Signalisierungssysteme auffassen, beschreibt Pheby die Formen und Funktionen der Intonation des Deutschen in strikter Abhängigkeit von grammatischen Strukturen. Eine solche Abhängigkeit der Intonation von der Grammatik wird auch präsupponiert, wenn in älteren (Bierwisch 1969) und einigen neueren generativen Intonationstheorien (Wunderlich 1988) syntaktisch definierten Satzstrukturen Intonationen zugewiesen weiden. Pheby kommt zu dem Resultat, daß Intonation im Deutschen zwischen Satzarten wie Aussagen und Fragen unterscheidet und innerhalb derartiger Satzarten zwischen interpersonell bzw. informatorisch unmarkierten versus markierten Satztypen differenziert (Pheby 1980: 874ff.) Im Rahmen der empirischen Analyse von natürlichen konversationeilen Fragen in FrageAntwort-Sequenzen werde ich in Kapitel 3 dieser Arbeit zeigen, daß einige von Phebys Annahmen und Ergebnissen, besonders diejenigen zur Differenzierungsfunktion der Intonation innerhalb der Satzarten, für die Analyse empirisch erhobener konversationeller Fragen als konversationelle Aktivitäten nicht haltbar sind. Aus dieser Analyse ergibt sich auch, daß v.a. die von Pheby postulierten, je nach Frageform umgekehrten Markierungsverhältnisse ein Artefakt seiner allein die Syntax zum Ausgangspunkt nehmenden Analyse ist. Demgegenüber gehen die neueren generativen Intonationsmodelle von einer modularen Struktur aus, bei der phonologisch-prosodische und syntaktische Systeme zunächst als voneinander unabhängige Systeme der Grammatik angesehen werden (Selkirk 1984, Nespor/Vogel 1986; für das Deutsche z.B. Wunderlich 1988, von Stechow/Uhmann 1986, Uhmann 1988) Die meisten dieser Ansätze behandeln die grammatisch basierte Analyse der Akzentsetzung getrennt von der Analyse der Intonation, sagen aber zur Intonation und deren Funktionen bisher noch ziemlich wenig (vgl. aber Hirschberg/Pierrehumbert 1986, Pierrehumbert/Hirschberg 1990). Lediglich Bannert (1983, 1985) und Wunderlich 1988 weisen Intonationen zu, die - ähnlich wie bei Pheby und anderen traditionellen Intonationstheorien den Satztyp bzw. semantischer gesprochen den Satzmodus von Sätzen festlegen. In bezug auf die Analyse der Akzentsetzung hat sich in den neueren Arbeiten eine Art Konsensusmodell herausgebildet, in dem nach den grammatischen und prosodischen Strukturen gefragt wird, mit denen bestimmte (semantische) Fokus-Strukturen bzw. Fokus-Hintergrund-Gliederungen erzeugt werden; mit der Übernahme der These Selkirks (1984: 27f.), daß der prominenteste Tonhöhenakzent einer Intonationsphrase frei zugewiesen wird und den semantischen Fokus der Phrase konstituiert, liegt eine Autonomieauffassung mit Bezug auf die Intonation nahe. Darauf gehe ich in Kapitel 2.2.2.2. noch näher ein. Ebenfalls einen modularen Ansatz vertritt das Münchener Projekt "Modus-Fokus-Intonation" unter der Leitung von Hans Altmann. Dieser Ansatz sucht jedoch gegenüber den meisten bisherigen Ansätzen weniger holistisch nach den einzelnen, die Satzmodi konstituierenden Merkmalen:
19 "Satzmodi werden (...) verstanden als komplexe syntaktische Strukturen (Beispiele: Aussagesatz, Entscheidungsfragesatz, Wunschsatz), denen regelhaft bestimmte abstrakte Funktionstypen (Beispiele: Aussage, Entscheidungsfrage, Wunsch) zugeordnet sind. Die jeweiligen Formtypen ergeben sich aus dem Zusammenspiel von Merkmalen aus vier verschiedenen Merkmalsmengen: a) Kategoriale Füllung (Beispiel: w-Ausdriicke in w-Fragesätzen und w-Exklamativsätzen) b) Stellungseigenschaften (Beispiele: Stellung des finiten Verbs an erster, zweiter oder letzter Position; Stellung des w-Frage-Ausdrucks in Versicherungsfragen) c) morphologische Markierung (Beispiel: Konjunktiv Π in Wunschsätzen) d) intonatorische Markierung" (Altmann/Batliner/Oppenrieder 1989: 1) Ein wichtiges Ziel des Projekts ist die Bildung "intonatorischer Prototypen", "die die zentrale und typische Realisierungsform des entsprechenden Satzmodus in unserem Korpus darstellen" (Oppenrieder 1988: 169). Diese intonatorischen Prototypen, die u.a. durch sie kennzeichnende akustische Parameterwerte ausgewiesen sind, bewirken eine kontextfreie Klassifizierbarkeit von Sätzen als Exemplaren eines bestimmten Satzmodus. Intonation unterscheidet dann zwischen den Satzmodi ansonsten formidentischer Sätze. Gegenüber bisherigen Untersuchungen ergeben sich mit den Ergebnissen des Münchener Projekts v.a. genauer unterschiedene Satztypen, bei denen auch systematischer als bisher nach der Kookkurrenz syntaktischer und intonatorischer Signale für den Satzmodus gefragt wird. In intonatorischen Minimalpaaren signalisieren jeweils nur die angegebenen Konturen zwischen unterschiedlichen Satzmodi bei ansonsten demselben Satz. Die Konzeptionalisierung sowohl der syntaktischen wie auch der prosodischen Einheiten und Kategorien als prototypisch organisierte Konzepte impliziert dabei, daß es klare und weniger klare Realisierungen gibt. Im Prinzip werden im Hinblick auf die Analyse der Intonation mit den Analysen des Münchener Projekts die Ergebnisse bisheriger, v.a. systemisch-tonetischer und an syntaktischen Kategorien orientierter Analysen bestätigt und verfeinert. Fraglich scheinen mir hier v.a. die weitreichenden Schlußfolgerungen, zu denen sich die Projektmitarbeiter berechtigt sehen. Während die modulare oder als Merkmalbündel organisierte Darstellung der Konstitutionskomponenten von Satztypen wesentliche Fortschritte gegenüber bisherigen holistischeren Herangehensweisen bringt und auch der in meiner Analyse gewählten Analyse- und Darstellungsweise weitgehend entspricht, möchte ich die den Experimenten zugrundeliegende Annahme in Zweifel ziehen, daß "in gelesene(n) Realisationen von vorgegebenen Satzstrukturen" und "in spontaner Rede im Prinzip dieselben intonatorischen Merkmale bei der Satzmoduskennzeichnung eingesetzt werden, wenn sich auch die jeweilige Ausprägung dieser Merkmale bei spontanen und vorfabrizierten Äußerungen unterscheiden dürfte" (Oppenrieder 1988: 174). Fraglich scheint mir v.a., welcher Art die Ergebnisse sind, die das Projekt erzielt hat. M.E. leisten die Autoren die sorgfältige Erhebung und Beschreibung der von den Versuchspersonen eingebrachten Intuitionen und ggf. stereotypen Vorstellungen über die Formen und Funktionen der Intonation in deutschen Sätzen, die ihnen zudem einschließlich von Satzzeichen wie ".", "?", "!" präsentiert wurden (siehe das Korpus in Batliner/Oppenrieder 1989). Dies besagt jedoch nicht viel über die Verwendung der Intonation in natürlichen Interaktionen. Falls jedoch die Satzmodi mitsamt ihren prototypischen Intonationen als Aktivitätstypen aufgefaßt werden sollten, bedürfte es des Nachweises, daß (a) in der Tat abstrakte kontextfreie Satz-/Aktivitätsmodi mit allein den angegebenen Merkmalen die Interpretation des jeweiligen Aktivitätstyps bedingen, und daß umgekehrt (b) nicht
20 etwa z.B. bei Äußerungen mit diesen Merkmalen eine ganz bestimmte sequentielle Position im Gespräch und eine ganz bestimmte semantische Beziehung zu Vorgängeräußerungen oder auch andere Elemente der konversationellen Situation für die Interpretation dieses Aktivitätstyps (mit-)entscheidend sind, und daß (c) die im Hinblick auf die Analyse des Satzmodus getroffenen Unterscheidungen tatsächlich auch in der konversationellen Interaktion getroffen werden und als interpretativ relevant rekonstruierbar sind. Vor einem solchen Nachweis wäre hinsichtlich einer Übertragung der experimentellen Ergebnisse auf natürliche Interaktion wohl mehr Vorsicht angebracht.
1.1.4. Prosodische Kategorien als Teilnehmerkategorien und bisherige Ansätze der Prosodie- und Intonationsforschung Die Zielsetzung, prosodische Kategorien als Teilnehmerkategorien zu erforschen, verlangt besondere Vorsicht bei der Zugrundelegung und beim Umgang mit Transkriptions- und Beschreibungskategorien. Denn wenn diese aufgrund theoretischer Ableitung und/oder Modellierung angenommen und zugrunde gelegt werden, muß es sich nicht auch um Teilnehmerkategorien handeln, die Interaktionspartner bei ihren interpretativen Prozessen in Alltagskonversationen nachweisbar zugrunde legen. Andererseits ist jedoch unabweisbar, daß ein Erstellen von Forschungshypothesen, mit denen jede Analyse - expliziert oder unexpliziert - notwendig beginnen muß, immer schon ein bestimmtes Maß an Kategorisierung und damit ein Inventar von Beschreibungs- und Analysekategorien voraussetzt. Gerade im Hinblick auf die Beschreibung eines so relationalen Phänomens wie Prosodie in Konversationen scheint sich dieses Problem in einer sehr grundlegenden Weise zu stellen. Es wird bereits unmittelbar relevant bei der Transkription der Daten vor und ggf. weiterhin während jeder Analyse. Bei der Transkription des Textes von Äußerungen gehen wir in der Regel völlig unproblematisiert davon aus, daß unsere schriftsprachlichen Wörter - manchmal ad hoc durch unkonventionelle Schreibungen modifiziert - unsere Eindrücke der gesprochenen Wörter und Äußerungen wiedergeben und potentiellen Leserinnen und Lesern unserer Texte vermitteln oder vermitteln können. Nur selten machen wir uns noch klar, daß diese Art der Transkription im Prinzip die gesamte phonologische, morphologische, syntaktische, lexikalische usw. Analyse, die die explizierte Grammatik unserer Sprache oder unser unexpliziertes intuitives Wissen über unser Sprachsystem ausmacht, voraussetzt. Fälle, in denen wir die Lautfolge [das] in der Transkription je nach sprachlichem Kotext einmal als , ein anderes Mal als repräsentieren, werfen auf diesen Sachverhalt nur einen kurzen Lichtstrahl. Und ganz gleichgültig, ob wir unsere Transkriptionen mit orthographischen oder phonetischen Symbolen repräsentieren, in jedem Falle gebrauchen wir und setzen wir die gesamte phonologische Analyse unserer Sprache sowie gegebenenfalls die Beziehungen zwischen Phonologie und Orthographie voraus. Unsere Wahl konstituiert in jedem Fall die zu analysierenden Daten; nicht selten schränkt sie bereits hier weitere Analysefragestellungen von vornherein und nicht immer völlig reflektiert ein. (Zur Kritik orthographischer oder IPA-phonologischer Transkription vgl. auch Kelly/Local 1988.)
21 In bezug auf die prosodische Ebene stellt sich dieser Sachverhalt keineswegs prinzipiell anders dar. Wunderlich (1988: 37) bemerkt völlig richtig, wenn auch in ganz anderem Zusammenhang: "In der Melodie die Töne zu erkennen, ist keine triviale Aufgabe." Wunderlich bezieht sich damit auf das Problem des Zusammenhangs zwischen phonetischen Repräsentationen von Tonhöhen in akustischen Grundfrequenzanalysen und -aufzeichnungen und den unserer Wahrnehmung und Interpretation innerhalb des Sprachsystems zugrundeliegenden phonologischen Kategorien. Dasselbe Problem der Beziehung zwischen phonetischen Phänomenen (z.B. Tonhöhenverläufen) und phonologischen Kategorien (z.B. Tönen oder Akzenttypen, je nach theoretischem Hintergrund) stellt sich aber auch bei allein auditiven Analysen: "Allerdings muß sich der an solchen Fg-Dokumentationen arbeitende Linguist immer des methodologischen Problems bewußt sein, daß er vielleicht Töne in der Melodie identifiziert, die allein phonetischen Einflußgrößen zu verdanken sind, oder Töne übersieht, die sich wegen dieser Einflußgrößen nur wenig ausprägen. Die Historie der Intonationsforschung hat uns gelehrt, daß Linguisten etwas zu hören glauben, was akustisch nicht vorhanden ist; ebenso kann der Betrachter einer akustischen Aufzeichnung etwas zu sehen glauben, was phonologisch nicht vorhanden ist" (ebd.). Da wir jedoch notwendig mit Kategorien arbeiten müssen, ist also jede Transkription in einem sehr elementaren Sinne theoriegeleitete Datenkonstitution. In der gängigen Intonationsforschung wird unterschieden zwischen den folgenden Ansätzen, die v.a. den Tonhöhenverlauf unterschiedlich beschreiben (siehe ausführlich CouperKuhlen 1986: 64ff., Gibbon 1976: Kap. 3): (a) Die (amerikanische) Ebenenanalyse in der Tradition von v.a. Pike 1945 und Trager/Smith 1957 (vgl. auch Pierrehumbert 1980); (b) die (britische) prosodische Analyse: Beschreibung von Melodien (tunes) (Armstrong/Ward 1926; von Essen 1964) bzw. Tönen in Ton-/Intonationsgruppen (tones) (Kingdon 1958, Schubiger 1958, O'Connor/Arnold 1973; auf der Grundlage der systemischen Sprachtheorie auch Halliday 1967 und Pheby 1969, 1980; mit stärkerer Parametrisierung auch Crystal 1969 und Couper-Kuhlen 1986); (c) die konfigurationale Analyse von Akzentkonfigurationen und Intonationskonturen (Bolinger 1958 et passim, vgl. auch Gibbon/Selting 1983). Während die Ebenenanalyse von Pike 1945 und Trager/Smith 1957 in der ursprünglich vorgesehenen Form heute keine ernstzunehmende Rolle mehr spielt, wird eine neue Art der 2Ebenen-Modellierung nach einem Vorschlag von Pierrehumbert 1980 in der neueren generativen Phonologie zugrunde gelegt bei der Modellierung der Generierung von Intonationskonturen zu gegebenen Sätzen. Darauf gehe ich später noch ein. Eine längere deskriptive Tradition haben v.a. die (britischen) prosodischen Analysen. Die frühe Analyse von Armstrong/Ward 1926 war sprachdidaktisch ausgerichtet und ging von wenigen holistischen Melodien als für praktische Zwecke ausreichende Beschreibung aus; diesem Ansatz lehnt sich für das Deutsche die sprachdidaktische Darstellung von von Essen 1964 (Original 1956) an. Dem Melodie- bzw. tune-Ansatz folgte mit Kingdon 1958 und Schubiger 1958 die sogenannte tonetische Analyse, bei der die Tonhöhenbewegungen der betontesten Silbe einer Intonations- bzw. Tongruppe beschrieben werden. Weiterentwicklungen des tonetischen Ansatzes legten dann in der Folge vor: O'Connor und Arnold 1973; auf der Grundlage seiner systemischen Sprachtheorie Halliday 1967 und daran anschließend für das Deutsche Pheby 1969,1980 und Kohler 1977; Brazil 1975, 1978 et passim; sowie stärker parametrisierend Crystal 1969 und Couper-Kuhlen 1986. Wegen der im folgenden darge-
22 stellten gemeinsamen Grundlagen und Annahmen aller dieser letztgenannten Ansätze fasse ich - anders als z.B. Couper-Kuhlen 1986 und Gibbon 1976 - alle diese Analysen als Weiterentwicklungen oder Varianten des tonetischen Ansatzes auf. An diese Analyse schließen fast sämtliche neuere diskursanalytische und kompetenztheoretische Intonationstheorien an. Sowohl die älteren melodisch (von Essen 1964) und systemisch-tonetisch (Pheby 1969,1980, Köhler 1977) orientierten Modelle, wie auch neuere modular orientierte generative Ansätze (Uhmann 1991, Wunderlich 1988) und experimentelle Untersuchungen zur Intonation (Altmann u.a. 1989) sind dabei auf die Lösung satzgrammatischer Problemstellungen zugeschnitten. In diskursanalytischen Ansätzen werden diese dennoch z.T. unproblematisiert auf die Analyse gesprochener Sprache im Diskurs übertragen. Im wesentlichen orientieren sich dabei die neueren Modelle trotz anderer Begrifflichkeit an denselben Prämissen über die interne Struktur und Funktion intonatorischer Einheiten und Kategorien wie die alten Modelle. Dem tonetischen Ansatz steht mit gänzlich anderen und m.E. für die Analyse von Prosodie im Gespräch geeigneteren Grundlagen und Annahmen der konfigurationale Ansatz von Dwight Bolinger gegenüber, den ich ebenfalls im weiteren genauer darstellen werde.
(a) Der tonetische Ansatz Für meine Untersuchung habe ich mich gegen die Übernahme der sonst vielfach üblichen tonetischen Transkription, wie sie etwa von Crystal 1969 vorgeschlagen wird, entschieden. Die tonetische Analyse geht von der zentralen Rolle der phonologischen Kategorien Tongruppe' (auch Toneinheit' genannt) 'Nukleus' (auch Tonsilbe') und Ton' (auch Tonmuster1) aus. Diesen Kategorien entsprechen in neueren Arbeiten die Kategorien 'Intonationsphrase', 'Fokussilbe' und 'Akzentton' (Selkirk 1984, Wunderlich 1988, Uhmann 1991). Diese Kategorien sind jedoch von Anbeginn an im Hinblick auf grammatisch orientierte Intonationsanalysen entwickelt worden und sind genau auf diese Art von Analyse zugeschnitten.5 Die Tongrappe ist in dieser Tradition eine phonologische Einheit, die im Hinblick auf eine Bestimmung der grammatisch relevanten Funktionen der Intonation definiert ist; in der praktischen empirischen Analyse bringt diese Kategorie erhebliche Segmentierungsprobleme mit sich (Pheby 1969: 50f., Cruttenden 1986: 35-58, Selting 1993). Zudem kümmert sich die tonetische Analyse fast ausschließlich um die Tonhöhenverläufe in und nach der sogenannten Nukleussilbe, der per definitionem am stärksten betonten Tonsilbe einer Tongruppe; demgegenüber werden an anderen Stellen allenfalls noch die Tonhöhenniveaus prominenter prä-nuklearer 'head'- oder 'key'-Silben für relevant gehalten, nicht aber deren Tonhöhenv^r/ä«/e. Diese Konzentration des Interesses auf den Nukleus ist nur nachvollziehbar, wenn man davon So ist es bemerkensweit, daB einer der Klassiker der englischen Phonetik, Henry Sweet, bemerkt, daB die in Intonationssprachen wie dem Englischen verwendeten intonations bzw. tones level, rising, falling, compound rising (V) und compound falling (Λ) in funktionaler Hinsicht sentence-tones seien: "In all these cases the tones are functionally 'sentence tones', that is, they modify the general meaning of the whole sentence" (or. 1877, zitiert nach: Sweet 1971: 177). An anderer Stelle ist explizit im Zusammenhang mit sentencetone von syntaktischen Satztypen die Rede: "The interesting question now arises, how do such languages express these general ideas (interrogation, affirmation, etc.), which it is the function of the English tones to express" (or. 1873-4, zitiert nach: Sweet 1971:179).
23 ausgeht, daß es die wichtigste oder gar einzig wichtige Funktion der Intonation ist, in der sogenannten Nukleussilbe der Tongruppe die Unterscheidung zwischen grammatischen Satzarten bzw. Satzmodi auszudrücken.6 In Abhängigkeit von den syntaktischen Satzarten wird dann die Intonation als Mittel der Satzartendifferenzierung analysiert. Eine solche Analyse ist für die Beschreibung der Prosodie konversationeller Interaktion mit viel zu starken und viel zu eingeschränkten Prämissen behaftet.7 Insbesondere die Grundeinheit der Tongruppe'/ Toneinheit/Intonationsphrase' wie auch die Analyse des Tonmusters' bzw. Nukleus(-Akzenttons) als der letzten Tonhöhenbewegung der Einheit im Hinblick auf die Unterscheidung und Differenzierung von Satzarten bzw. Satzmodi sind auf die Analyse kontextfreier Sätze zugeschnitten und kaum auf die Verhältnisse der Sprachverwendung in natürlicher konversationeller Interaktion übertragbar. Die Probleme der tonetischen Intonationsanalyse lassen sich diskutieren mit Bezug auf die Arbeiten des bekanntesten Theoretikers des Birminghamer Ansatzes der discourse intonation, David Brazil, der eine Verbindung herstellt zwischen Intonationsanalysen im Rahmen des Hallidayschen systemischen Ansatzes (Halliday 1967) und dem ebenfalls von der Hallidayschen systemischen Linguistik stark beeinflußten Birminghamer Ansatzes zur Diskursanalyse wie er zuerst von Sinclair/Coulthard 1975 vorgestellt wurde (vgl. hierzu insgesamt die Darstellungen in Brazil 1975, 1978, 1981, 1985; Brazil/Coulthaid/Johns 1980; Coulthard/Brazil 1982).8 Die Analyseeinheit der Tongruppe oder Toneinheit, v.a. wenn damit einzelne Äußerungen in offenbar mehrere Tongruppen zerlegt werden wie in den Beispielen // he G A M b l e d II a n d LOST II (aus Coulthard/Brazil 1982: 102) II R a r c h i m E D e s II Ρ w a s a siCILian // (aus Brazil 1981: 48) II w e ' r e ¡¡ging II Energy II (aus Coulthard/Brazil 1982: 110)
und vielen anderen, ist m.E. oft unplausibel. Hier wild aus der Tradition der tonetischen Analyse eine Analysekategorie übernommen, die von Anfang an stark auf die Bedürfnisse eines Intonationsforschers zugeschnitten war, der die grammatische Funktion der Intonation und die Informationsverteilung in Sätzen untersucht. Die Definition der Tongruppe in Abhängigkeit von der prominentesten Tonhöhenbewegung, des Nukleus bzw. der Tonsilbe, die per definitionem eine Toneinheitengrenze (wenn sie auch gelegentlich nicht genau lokalisierbar ist) zwischen zwei prominenten Tonhöhenbewegungen verlangt, führt oft zu rein theoretischen und empirisch schwer vorstellbaren und unplausiblen Segmentierungen (vgl. hierzu noch genauer Selting 1987d und v.a. 1993).
Auf die empirisch nicht gerechfertigte Konzentration der Suche nach dem einen Hauptakzent oder Nukleus von Sätzen hat auch z.B. bereits Fuchs 1976 hingewiesen. Daß sich linguistische und phonetische Forschung bis zu seiner Zeit nicht an Sprache in spontanen Konversationen, sondern fast ausschließlich an spoken prose als Datengrundlage orientiert hat, bemangelt schon Abercrombie 1963. Das trifft dann vermutlich auch auf die Tradition zu, in der die tonetischen Beschreibungskategorien entwickelt worden sind. Auf ähnliche Ansätze zur Diskursintonation wie z.B. Brown/Currie/Kenworthy 1980 oder auch Weiterentwicklungen bzw. Adaptionen des Birminghamer Ansatzes an z.B. die Relevanztheorie von Sperber/Wilson 1986 wie bei Vandepitte 1989 wird hier nicht näher eingegangen. Für eine Detailauseinandersetzung mit dem tonetisch-systemischen Ansatz anhand der Analyse von Pheby 1980 siehe Selting 1993.
24 Auch das Schwergewicht auf der Analyse des Nukleus ist nur verständlich, wenn man davon ausgeht, daß primär die grammatische Funktion der Intonation interessant ist und daß die Intonation am Satzende für die Bestimmung des Satztyps bzw. Satzmodus als z.B. Aussage versus Frage und davon abgeleiteter detaillierterer Zuordnungen verantwortlich ist. Deshalb also das Schwergewicht auf die Untersuchung des Nukleus bzw. der Tonsilbe im Rahmen der meisten älteren Untersuchungen, die sich zunächst alle für die grammatische Funktion der Intonation interessierten. Gegenüber dem Nukleus "verblaßt" dann regelmäßig die notierte und/oder auch nicht einmal mehr weiter berücksichtigte Tonhöhengestalt anderer prominenter Silben der Toneinheit, wie z.B. bei Brazil der Silbe, in der die Option des key gewählt wird, mit der die Information der nachfolgenden Toneinheit als contrastive, additive oder equative präsentiert wird (Brazil 1982: 104): Hier wird lediglich das Tonhöhenniveau für relevant gehalten (high, mid, low key), nicht aber die Gestalt der Tonhöhenbewegung wie sie aber bei den Tönen der Tonsilbe sehr wohl genau analysiert wild. Als Resultat ergeben sich auch nur eingeschränkte Möglichkeiten, die Tonhöhenverläufe von aufeinanderfolgenden Einheiten zu vergleichen und z.B. als kohäsive Signalisierungsmittel zu analysieren. Der Kritikpunkt ist also, daß tonetische Kategorien eine m.E. zu eng und zu theoretisch definierte Analyseeinheit zugrunde legen, die zu z.T. unplausiblen Segmentierungen zwingt und zu empirisch ungerechtfertigter Konzentration der Analyse auf einzelne a priori für relevant gehaltene Tonhöhenbewegungen in einer solchen Einheit führen. So kann sie z.B. relevante kohäsive Einheiten nicht erfassen, die größer sind als die Toneinheit, aber kleiner als die pitch sequence (Brazil 1982: 110), die ähnlich wie ein Paraton (Couper-Kuhlen 1983) ganze thematisch kohäsive Einheiten oder Redebeiträge erfaßt.9 Ebenfalls typisch für tonetische Analysen ist weiterhin die Interpretation der Wahl prominenter Silben im Hinblick auf die Informationsverteilung, wenn diese auch bei Brazil im Sinne einer Sprecher-Hörer-Beziehung vorgestellt wird (Brazil 1981: 46), wie auch die Zuschreibung von - ggf. relativ abstrakten - Bedeutungen zu den auf dem Nukleus der Tongruppe realisierten Tönen. Brazil unterscheidet hier primär zwischen proclaiming (fallend bzw. ggf. steigend-fallend) und referring (fallend-steigend bzw. ggf. steigend) tones, mit denen Information als konversationeil neu bzw. gegeben präsentiert wird. Eine Kritik des post hoc Charakters der Brazilschen Analyse der proclaiming und referring tones übt Cruttenden (1986: 115-117) mit Bezug auf die Darstellung in Brazil 1975: "The basic problem with this sort of labelling of tones is that it appears to become very much post hoc. Consider the following examples: [/ = Toneinheitengrenze; ρ = proclaiming tone; r = referring tone; CAPITAL LETTERS = Tonsilbe; Darstellungsform leicht verändert gegenüber dem Original; M.S.]
Dies ist auch bei der für das Deutsche vorliegenden Intonationsanalyse von Pheby (v.a. 1969, 1980) der Fall (vgl. dazu genauer Selting 1993). Für eine Diskussion der Probleme der tonetischen Tongruppenanalyse siehe auch Cruttenden 1986:35-58.
25 /r I've come to S E E y o u / ρ w i t h the R A S H / r I've got o n m y C H I N /p a n d u n d e r N E A T H / r w h i c h has d e V E L o p e d / ρ in the past three D A Y S / r w e l l it's IRRltating / r a n d at W O R K / r w i t h the DUST/ r u s b e i n g a CLOThing factory / r well I find it's IRRltating / ρ m a k e s m e want to SCRATCH it / (p. 7)
Brazil does say that 'the decision as to what parts of what he says can be marked as referring rests, of course, with the speaker' (p. 7) but even so it is difficult to see any reason why some tonics (nuclei) should be called 'referring' and other 'proclaiming' other than that the use of rises and falls requires these labels. Part of the problem is that any labels for abstract meaning are likely to appear post hoc in the absence of a detailed working out of their relationship to local meanings." Insgesamt macht also Brazil sehr starke Anleihen bei der tonetischen Intonationsanalyse, schneidet das Modell jedoch auf Diskursgegebenheiten zu. Dabei sei Intonation "a self contained meaning system" und intonatorische Bedeutungen können beschrieben werden "at an appropriate level of abstraction without reference to co-occurring lexical or grammatical choices" (Coulthard/Brazil 1979: 21). Methodisch wird dabei häufig auf konstruierte Paradigmen zurückgegriffen, die die intonatorischen Kontraste als Evidenz für die zugeschriebenen Bedeutungen illustrieren sollen; die durch den explizierten oder implizierten Kontext evozierten und nahegelegten Präsuppositionen werden jedoch vernachlässigt. Den Nachweis der interpretativen Relevanz seiner Kategorien bleibt Brazil damit schuldig. Die tonetischen Analysekategorien, v.a. in der Crystalschen 1969iger Version, wurden auch in anderen diskursanalytischen Ansätzen übernommen. Chafe (1980, 1987, 1988) entwickelte einen kognitiv-psycholinguistisch orientierten Ansatz der Analyse natürlicher gesprochener Sprache, in der "idea units" (1980) bzw. "intonation units" (1987,1988) als linguistische Einheiten analysiert weiden, die Sprecher zur "Verpackung" ('packaging') ihrer je aufeinanderfolgend präsentierten kognitiven Informationseinheiten gebrauchen. Auch die interne Struktur der Intonationseinheit wird im Sinne kognitiver Aktivations- und Informationsverarbeitungsprozesse reinterpretiert Im Rahmen der frühen Kontextualisierungsforschung ging auch Gumperz 1982 vorwiegend von tonetischen Beschreibungskategorien aus; in neueren Arbeiten hingegen spricht er in Anlehnung an Chafes (1980) "idea units" von der "informational phrase", die er wie folgt definiert: "Prototypically, the best way to characterize such an informational phrase is on the basis of prosody as a rhythmically bounded chunk consisting of a lexical string that falls under a single intonation contour which is set off from other such units by a slight pause and constitutes a semantically interpretable syntactic unit. I want to argue that speakers chunk the stream of speech into processing units on the basis of cooccurrence judgements that build on prosody and rhythm, as well as on syntactic and semantic knowledge." (Gumperz 1990: 234; vgl. auch Gumperz/Berenz 1991). Hier stellt sich jedoch die Frage, wie die holistisch interpretierte Einheit der "informational phrase" mithilfe der sie konstituierenden prosodischen Signale systematisch interpretierbar gemacht wird.
26 (b) Neuere generative und modulare Modelle In den neueren generativen und modularen Modellen, die sich an Pierrehumbert 1980, Selkirk 1984 und Nespor/Vogel 1986 orientieren, wird die sogenannte Intonationsphrase, die der Tongruppe entspricht, als Einheit mit wenigstens einem obligatorischen Nukleus bzw. einer Fokussilbe mit einem (Nuklear-)Akzentton modelliert, vor der ggf. noch andere prominente Silben mit Akzenttönen auftreten können; daneben können weitere Phrasen- und/oder Grenztöne vorkommen (für das Deutsche vgl. Wunderlich 1988, Uhmann 1991). Die holistischen Akzenttonhöhenbewegungen der tonetischen Analyse werden hier in Tonsequenzen aus Hoch und Tief dekomponiert ( \ entspricht H*T, / entspricht T*H, usw.). Dabei bleibt es bei der Annahme eines obligatorischen Nukleus pro Intonationsphrase. Im Unterschied zur tonetisch-systemischen Analyse, die diesen Nukleus der (phonetisch) prominentesten Silbe zuordnet und sich damit die o.g. Probleme einhandelt, definiert die neuere Konzeption den Nukleus im Englischen positional: Der Nukleus ist einfach der letzte Akzent einer möglichen Reihe von Akzenten.10 Folglich muß dieser in keiner Weise auch phonetisch besonders ausgewiesen sein. Wodurch anders, als für und im Hinblick auf die Satzmodusunterscheidung, sollte diese Definition bedingt sein? Zugleich wird mit dieser Definition das Konzept der Intonationsphrase gegenüber der Tongruppe noch stärker phonologisiert und noch mehr von der Notwendigkeit der Rückbindung an phonetische Evidenz entlastet. Die neueren nicht-linearen Modelle leisten bisher vor allem die Überführung der traditionellen Kategorien in ein algorithmisches Modell von Tonfolgen, das für die Generierung von Intonation verwendbar sein soll.
(c) Der konfìgurationale Ansatz Bolinger (seit 1958, zuletzt 1986,1989) vertritt einen konfigurationalen Ansatz, der m.E. wesentlich offener ist als der tonetische. Bolinger macht eine Unterscheidung zwischen Intonation, dem globaleren Tonhöhenverlauf ganzer Äußerungen, und Akzentprofilen (profiles), den lokalen Akzent-Tonhöhenverläufen. Akzente sind v.a. pitch jumps als Figur bei einer baseline-intonation als Hintergrund, "Tonhöhenhervortretungen" (pitch obtrusions) bzw. Tonhöhensprünge nach oben oder nach unten in Relation zur baseline der Intonation der unakzentuierten Silben als Referenzlinie: "always we find an overall melody or intonation, with jumps, narrow or wide, to mark the accents" (Bolinger 1986:11). Die Tonhöhenbewegung selbst kann quasi parametrisch dekomponiert werden, wobei die einzelnen Parameter für den Ausdruck unterschiedlicher Bedeutungsaspekte verwendet werden. Wenn Akzentuierung als solche eher als Mittel zum Ausdruck des semantischen Gewichts eines Wortes (semantic weight) verwendet wird, dann fungiert die Bandbreite der Akzentbewegung als Mittel zum Ausdruck emotionaler Bedeutungen (degree of upnesslemotion) (ebd.: 20). Und auch der Akzenttyp, sowie die Tonhöhenverlaufsrichtung und die relative Höhe der baseline oder Referenzlinie werden zum Ausdruck von Bedeutungen verwendet.
Für das Deutsche ergeben sich hier Übertraglingsprobleme, die z.B. von Stechow/Uhmann 1986 diskutieren.
27 Profile weiden in der Regel zu Konturen (contours) verbunden, zu holistischen ganzen Intonationskonfigurationen (complete intonations), mit denen Lokutionen formuliert werden. Konturen können konventionalisiert sein, sowohl im Hinblick auf situative Angemessenheit wie auch im Hinblick auf evozierte oder nahegelegte Interpretationen von Äußerungen (vgl. ebd.: 252, vgl. auch den Begriff der Kontextualisierung, s.o.). Für die Grammatik eines Satzes ist nur die Melodie am Ende von Phrasen und Sätzen wichtig. Bolinger nennt Beispiele, in denen die Intonation einer Äußerung für deren Funktion als Aussage oder Frage entscheidend ist, und Beispiele, in denen die Intonation die Segmentierung von Sätzen und die Zugehörigkeit ambiger Phrasen signalisiert. Dennoch: "Nevertheless, though intonation is indispensable to grammar, the grammatical functions of intonation are secondary to the emotional ones; speakers feel differently about what they say, and the feelings manifest themselves in pitch changes that serve as clues" (ebd.: 27). Und hierin liegt m.E. dann auch begründet, weshalb Bolinger zu einer anderen Analyse kommen muß als die Tonetiker: Wenn auch die Funktion von Prosodie und Intonation zum Ausdruck emotionaler oder affektiver Bedeutungen - oder wie ich selbst in meiner Analyse lieber sagen werde: die Funktion von Prosodie und Intonation zur Signalisierung kohäsiver Beziehungen zwischen Äußerungen und Aktivitäten, sowie als Mittel und Signal zur Konstitution, Aufrechterhaltung und Veränderung von Gespächsstilen und interaktiven Beziehungen - mit berücksichtigt werden soll, dann spielt nicht ausschließlich und nicht einmal nur hauptsächlich ein sogenannter Nukleus und die dort gewählte Melodie eine Rolle, sondern die Melodie der gesamten Äußerungen. Aus diesem weniger beschränkten Erkenntnisinteresse resultieren dann notwendigerweise andere Beschreibungskategorien und -konzepte. Obwohl Bolinger hinsichtlich der Einheiten, die er betrachtet, meist nicht über das hinausgeht, was in der tonetischen Analyse vermutlich als ein oder zwei eng verschmolzene Tongruppen angesehen würde, berücksichtigt er meist mehr als einen Akzent als relevant für die Beschreibung. "Most English declaratives of any considerable length have two marked peaks of pitch, one toward the beginning and one toward the end" (Bolinger 1965: 114; zitiert nach Gibbon 1976: 226). Damit bezieht er offensichtlich die Einheit in die Analyse von Akzenten mit ein, die Brazil für die Wahl des key und die anderen Tonetiker als head zwar bei den stress marks berücksichtigen, nicht aber bei den relevanten Tonhöhenverläufen (s.o.). Einige Zwei-Akzent-Konturen sind so häufig, daß sie mittlerweile in der Intonationsforschung mit Namen belegt sind, z.B. eine Kontur mit einem steigenden und einem fallenden Akzent, die man als "hat pattern" (Cohen/t Hart 1967) oder "suspension bridge" (Bolinger 1961) bezeichnet (vgl. auch Bolinger 1986: 47). Die Funktion dieser Akzentuierung wird von Bolinger 1986 in Verbindung mit der Thema-Rhema Struktur von Äußerungen gebracht. Er spricht in diesem Zusammenhang auch von thematic und rhematic accent "The favored, typical, "unmarked" shape of an utterane containing a theme and a rheme is to have two main accents, thematic and rhematic, one toward the beginning and one toward the end" (ebd.: 50). Aber, anders als bei den Tonetikern, die den Nukleus am liebsten in letzter Position hören: "the balance of importance can be shifted and the last accent need not be either the most important or the most prominent one" (ebd.: 51). Gegenüber der tonetischen Analyse scheinen mir Bolingers Kategorien schon besser als Ausgangspunkte für die Analyse konversationeller Interaktion geeignet. Allerdings bedient
28 auch er sich offenbar v.a. introspektiver Daten.11 Für die Transkription und Darstellung größerer Mengen empirischer Daten ist Bolingers Notationsweise völlig ungeeignet. Meine weiter unten vorgestellten Analysekategorien sind deshalb zwar z.T. Bolingers Kategorien ähnlich, wurden aber unabhängig davon entwickelt und auf die Verwendbarkeit für empirische Untersuchungen zugeschnitten. Interessanterweise setzt sich auch in anderen neueren Forschungsrichtungen derzeit offenbar eine ähnliche Sichtweise wie die Bolingersche durch: Mit der Anlehnung an Pierrehumberts (1980) Modellierung der Intonation steht ein Akzentsequenzmodell im Vordergrund der Diskussion. Formale Modelle, die mW. am ehesten mit dem Bolingerschen Modell vereinbar wären, sind Modelle wie die von Gärding (1983) oder Ladd (1990), die mit lokalen und globalen Kategorien arbeiten.
(d) Parametrisierung Parametrisch angelegt sind die Kategorien der Vertreter des neueren Ansatzes der Phonology for Conversation: Statt mit holistischen phonologischen Kategorien wie Ton oder Akzent arbeiten sie zunächst allein mit den diese Kategorien konstituierenden Parametern Tonhöhenverlauf, Lautstärke, Länge, Rhythmus usw. (siehe z.B. Local/Kelly/Wells 1986 bzw. Local/ Wells/Sebba 1985). Allerdings darf auch bei dieser Analyse m.E. nicht übersehen werden, daß allein die Art und Weise der Wahrnehmung und Notation von Tonhöhenverläufen bereits von den Prämissen über den Gegenstand abhängt und eine voraussetzungsfreie Notation von Tonhöhenverläufen wohl nicht möglich ist. So notieren z.B. Local/Wells/Sebba 1985 und Local/Kelly/Wells 1986 wahrgenommene Tonhöhenbewegungen als Bewegungen bzw. Tonhöhenebenen auf den einzelnen Silben der Äußerungen wie in den beiden Beispielen auf der folgenden Seite. Hier sind oberhalb der Texüinie in parametrischer Notation prosodische Parameter wie Lautstärke und Tempoveränderungen und in einem Fall auch der rhythmische Wert der Silben angegeben, unter der Textzeile dann in impressionistischer Notation der wahrgenommene Tonhöhenverlauf der Silben der relevanten Segmente der Äußerungen. Durch diese Notation können sich Leserinnen und Leser relativ leicht einen Eindruck über den Tonhöhenverlauf der transkribierten Einheiten verschaffen. Der Vorteil liegt auch in der größeren Explizitheit der Analyse: Während bei der Transkription mit holistischeren Akzenttypen die Transkribierenden beim Hör- und Transkriptionsprozeß über Ähnlichkeit und Zugehörigkeit von Einzelvorkommen zu Strukturtypen unexpliziert entscheiden, wird diese Entscheidung bei einer Transkription wie der hier wiedergegebenen in die spätere Analyse verlagert und damit leichter explizierbar. Die parametrisierende Transkription allein läßt dabei nicht immer eindeutige Interpretationen aufgrund der Transkription zu: So ist z.B. nicht deutlich, ob Tonhöhenbewegungen von Silben diese Silben als 'betonte' konstituieren oder nicht, bzw. ob die Kombination eines bestimmten Tonhöhenverlaufs und der Lautstärke einer Silbe diese als 'prominent'
Etliche seiner Unterscheidungen und Kategorien wurden jedoch in früheren Arbeiten experimentell abgesichert; diese Arbeiten werden hier vernachlässigt. Zu einer zusammenfassenden Darstellung vgl. Gibbon 1976:221-232.
[rail
rail] c
< > 'thought she 'told me she was going down to Lor'rai:nes:
A:
[rail
rail]
c
c
< > [dim] 'ye:s (.) s h e ' s ' b e e : n the:re
M:
(0.3)
A: | - a h ° h / [rail
rail] c
M :
< > [dim] -She's 'c/ome here to 'go to the 'toi:le:t
A:
ohh:(.) hah (.) h a / h - h a h :
F:
ah::/
O:
c
L heh-heh
(aus: Local/Kelly/Wells 1986:417)
1)
[f r a i l . —
F:
,
—
—
f]
[f
f]
[accel.
-
[mf]] J,
,
y e a h t h e m t : u m p h i m t h e m t^'ump h i m g o o d a n d p r o p e r y o u k n o w
Ν
— [mf]
nothing more them thump him bad =
(cresc.] = them thump him and kill him
(0.5)
true
s
(aus: Local/Wells/Sebba 1985: 312)
(0.5)
30 konstituiert oder nicht. Aber genau diese Zusammenhänge sollen dort ja auch expliziert und nicht vorausgesetzt werden. Demgegenüber sind die von mir verwendeten Akzenttypen (s.u.) bereits interpretativere und holistischere Kategorien, die bereits mehr an den Alltagswahrnehmungen und -Interpretationen von Rezipienten ansetzten. Wenn jedoch davon ausgegangen wird, daß menschliche Wahrnehmung generell und erst recht phonetische bzw. prosodische Transkriptionen auf kategorialer Wahrnehmung beruhen und ohne kategoriale interpretative Grundlage gar nicht denkbar sind, dann folgt daraus, daß auch impressionistische Notationen von Tonhöhenverläufen wie die Local et al.'schen eine solche kategoriale Grundlage haben. Local et al. phonologisieren ihre Kategorien lediglich nicht im Sinne einer tonetischen Tongruppe, einer Akzentsequenz oder eines Nukleus als phonologisch-prosodischen Einheiten. Darüberhinaus liegt der Unterschied lediglich im Grad der Notation phonetischer Details. Jedoch bringt eine z.T. handschriftliche impressionistische Darstellung wie die von Local et al. v.a. praktische Probleme bei der Darstellung und Verwaltung von Daten.
(e) Zu HIAT 2 Die Notation der Tonhöhenniveaus von Silben sieht das von Ehlich/Rehbein 1979 v.a. für diskursanalytische Transkriptionen vorgeschlagene Notationssystem HIAT 2 vor, das in jüngster Zeit von einigen deutschen Gesprächsanalytikern übernommen wird. Ehlich/Rehbein schlagen vor, zwischen der Notation von bedeutungsunterscheidenden "Tönen" bei z.B. Inteqektionen und Rezeptionssignalen wie HM mit Ύ versus "/" versus "V" usw. und der Notation des Tonhöhenverlaufs (Intonation) von anderen Äußerungen zu unterscheiden.12 Für die Transkription von Intonation wird in HIAT 2 vorgeschlagen, die Tonhöhenbewegung der Äußerung in die Notation der relativen Tonhöhe von aufeinanderfolgenden Silben auf vier vorgegebenen Tonhöhenebenen aufzuspalten. Ein Beispiel ist das folgende (ebd.: 69):
Aber ein Eiuazeug hätte doch mehr Lärm gemacht.
Diese Notation zerlegt globale wie auch lokale Tonhöhenbewegungen in Abfolgen von Tonhöhenebenen. Bei dieser Notation ist unklar, ob die Tonhöhenbewegung in der Silbe Lärm eine gleichbleibende oder eine fallende ist. Lediglich für die Transkription von Akzenten, in denen auffällige Tonhöhenbewegungen, sogenannte "Niveaudehnungen" oder "extremer Anstieg bzw. Abfall" als "Abweichung 12 Auf die Problematik dieser Unterscheidung gehe ich hier nicht weiter ein. Sie wird weiter begründet in Ehlich 1979 und Ehlich 1986. Ehlichs Postulierung von Tönen für das Deutsche ist von Wunderli 1981 (300f.) als unhaltbar kritisiert worden. Ehlich/Rehbein 1979 sahen die Transkription von Intonation nur im Falle von "Abweichungen von Normalverläufen" (ebd.: 72) vor und präsupponierten damit unproblematisiert und unexpliziert die erst ja noch zu beschreibenden Noimalverläufe der Intonation in Gesprächen. Angesichts der neueren Entwicklung der Forschung in diesem Bereich vermute ich jedoch, daß die Autoren diese Position heute auch nicht mehr vertreten würden.
31 von der normalen Struktur" (ebd.: 70) verwendet werden, schlagen Ehlich/Rehbein 1979 die Notation von Tonhöhenbewegungen wie in folgenden Beispielen vor (ebd.: 70f.): (c) Nachfrage m i t "extremem A n s t i e g " :
(a) N a c h f r a g e :
wer hat das gesagt?
w e r hat das g e s a g t ?
Mir scheint dieses System hinsichtlich der vorgeschlagenen Tonhöhenniveaus zu starr und hinsichtlich der Beschränkung der Notation der "normalen" Tonhöhenbewegung als Tonhöhenniveaus von Silben zu unklar und in vielen Fällen dann auch mißverständlich und widersprüchlich zu sein. Eine längere Äußerung mit kontinuierlich fallender Tonhöhe und mehreren ebenfalls auf fallender Tonhöhenverlaufslinie liegenden Akzentgipfeln wie in der folgenden nach Local et al.'s Notation transkribierten Äußerung ist mit HIAT 2 nicht darstellbar:
37:7 D:
8 D:
w i e H A T t e s e d e n n n i c h SCHISS v o n w e g n m i t d e i n e r
L U N g e röntchen daß de da: . d e i n rauchen
feststelln
Wenn aber die HIAT 2 Ebenendarstellung wieder als kontinuierlicher Tonhöhenverlauf interpretiert werden soll, dann besteht die Gefahr der ad hoc Rekonstruktion. Schwierigkeiten treten ebenfalls bei der Rekonstruktion des Tonhöhenverlaufs akzentuierter Silben der transkribierten Äußerungen auf, bei denen die Rekonstruktion der tatsächlichen Akzenttonhöhenbewegungen bei einzelnen Akzenten systematisch mehrere Möglichkeiten erlaubt. Eine Äußerung wie HAM se no nimmals geFRACHT würde in HIAT 2 vielleicht so transkribiert:
8 D:
H A M se no nimmals g e F R A C H T
Hierbei bleibt aber unklar, ob bei der Silbe FRACHT eine steigende oder fallende Tonhöhenbewegung gewählt wird, die unterscheiden würde zwischen den folgenden Alternativen:
32
"
8 D:
-
^
« \
HAM se no nimmals geFRACHT
und
—
8 D:
-
_
U
HAM se no nimmals geFRACHT
Bei der folgenden HIAT-Transkription hingegen bleibt unklar, ob die zu feststelln ansteigende oder die von dort fallende Tonhöhenbewegung als maßgeblichere interpretiert werden soll:
11 M:
das RAUchen KÖNji die da nich feststelln
Und auch wenn von Tonhöhenverläufen bzw. Akzenten geredet wird, dann könnte ohne weitere Definition die Tönhöhe bei der Silbe RAU als zu RAU hin fallend oder aber als von RAU an steigend und gleichermaßen bei der Silbe KÖN als zu KÖN hin steigend oder aber als von KÖN an fallend beschrieben werden.13 Hier ist also eine genauere Definition von Akzent vonnöten, die der Tatsache Rechnung trägt, daß in der Regel akzentuierte Silben Träger von Tonhöhenbewegungen in zeitlicher Relation zum Intensitätsgipfel bzw. Silbennukleus der Akzentsilbe sind. Denn insbesondere bei Tonhöhenkonfigurationen wie (a)
und
(b)
besteht m.E. systematisch die Gefahr der ad hoc Notation und der unexplizierten ad hoc Rekonstruktion von Akzenttonhöhenbewegungen, da hier für die Analyse und Rekonstruktion der Tonhöhenbewegung zwei Faktoren eine Rolle spielen, die bei HIAT 2 unexpliziert bleiben: Zum einen hängt es bei einer Notationen wie (a) vom Timing der Tonhöhenbewegung in Relation zu der in HIAT 2 unterstrichenen Akzentsilbe und deren Silbennukleus ab, ob die Konfiguration als steigende oder fallende Akzenttonhöhenbewegung rekonstruiert wird. Zum anderen hängt es von der Explikation der Wahrnehmungs-, Definitions- und Inteipretationskriterien ab, ob in einer derartigen Konfiguration in Relation zum Nukleus der Akzentsilbe Diese Möglichkeiten sind nicht etwa meine Erfindung: Tatsächlich sind derartige Probleme bei realen Mißverständnissen aufgetreten, die ich selbst in Diskussionen mit Kollegen hatte, die sich am HIAT-Modell orientieren.
33
systematisch der ansteigende oder aber umgekehrt der fallende Teil der Tonhöhenbewegung als definierend angesehen und entsprechend systematisch transkribiert wird. Erst wenn expliziert wird, daß für die Definition und Notation des Akzents die Tonhöhenbewegung im und nach dem Silbennukleus der Akzentsilbe wichtiger ist als die Tonhöhenbewegung zum Silbennukleus der Akzentsilbe hin,14 kann dieser Sachverhalt auch systematisch in Transkriptionen berücksichtigt und beschrieben werden.15 Wenn dies aber trotz Beibehaltung der holistischen Interpretationskategorie 'Akzent' auf der segmentalen Ebene in der intonatorischen Transkription nicht expliziert und geklärt wird, dann ist letztlich der Sinn der Aufspaltung der Tonhöhenbewegung in diskrete Ebenennotationen in nur scheinbar parametrischer Notation m.E. nicht einsichtig und in der praktischen Transkriptionsarbeit eher unpraktisch und irreführend.
1.2. Methodisches Vorgehen im Rahmen der vorliegenden Untersuchung Nunfolgend werde ich mein Vorgehen und meine Kriterien bei der Datenerhebung und der Datentranskription darstellen.
1.2.1. Datenerhebung Um Gesprächsaufhahmen zu erhalten, deren technische Tonqualität eine akustische Analyse des Materials zumindest an einigen Stellen erlaubt, benötigte ich Gesprächsdaten in Tonstudioqualität und nahm dafür eine sicherlich reduzierte "Natürlichkeit" der Gespräche in Kauf (vgl. hierzu die Ausführungen zum "Beobachterparadoxon" bei Labov 1972). Dennoch erreichen natürlich die akustischen Datenanalysen nicht dieselbe Qualität wie bei Äußerungen, die direkt ins Mikrofon gesprochen werden. Der vorliegenden Analyse liegen vier ca. zweistündige informelle Gespräche mit drei Teilnehmenden im Tonstudio der Universität Oldenburg zugrunde. An drei der Gespräche nahmen nur Frauen teil; bei diesen Frauen-Gesprächen waren zwei Teilnehmerinnen enger miteinander bekannt, mit der jeweils dritten Frau dagegen waren beide nicht näher vertraut. Die Frauen in diesen Gesprächen waren alle in Lehrberufen tätig und deshalb auch an "öffentliches Reden" gewöhnt. An dem vierten Gespräch nahmen zwei Studentinnen und ein Der Gmnd für diese Konvention, die der Intuition von Laien oft zu widersprechen scheint, ist vermutlich, daß für die funktionale Analyse der Intonation, v.a. auch im Hinblick auf die traditionelle Unterscheidung von Satztypen bzw. Satzmodi, von jeher v.a. die mit der sogenannten Nukleussilbe beginnende und das Satzende betreffende Tonhöhenbewegung von Interesse war. Im Prinzip wäre diese Konvention sicherlich umkehrbar, allerdings wären dann Generalisierungen hinsichtlich der Funktion von Intonation vermutlich viel schwieriger zu formulieren. Praktisch bedeutet dies, daß die häufige Klage, unterschiedliche Transkribierende 'hörten' unterschiedlich und dies sei die Quelle der Unzuverlässigkeit prosodischer Transkriptionen, falsche Ursachen benennt: Die Transkribierenden liören' nicht unterschiedlich, sondern sie hören oder transkribieren nach unterschiedlichen Kriterien bzw. transkribieren ad hoc, weil sie sich der Kriterien nicht oder zu wenig bewußt sind. Die systematische Klärung der Wahmehmungs- und Notationskriterien ist jedoch die Voraussetzung systematischer Transkriptionen.
34 Student teil. Alle Gesprächsteilnehmer sind gebürtige Norddeutsche aus dem Raum BremenOldenburg-Osnabrück-Wilhelmshaven und haben auch überwiegend in Norddeutschland gelebt; eine Teilnehmerin verbrachte einige Zeit im Rheinland, eine andere lebte einige Jahre in Rheinland-Pfalz, zur Zeit der Datenerhebung lebten jedoch beide wieder seit einiger Zeit in Oldenburg. Durch den Wohnortwechsel bedingte dialektale Einflüsse im Bereich der Prosodie und Intonation waren für mich nicht rekonstruierbar relevant; die Sprecherinnen und Sprecher verwenden ausnahmslos eine nordwestdeutsche Varietät des Deutschen. Ich hatte die Teilnehmenden jeweils gebeten, an einem informellen Gespräch teilzunehmen. Sie sollten ganz einfach wie auch bei anderen informellen Gelegenheiten Kaffee miteinander trinken, die jeweils dritte Person bzw. sich gegenseitig kennenlernen und sich erzählen, was ihnen gerade einfalle. Wenn sie keine Lust mehr hätten, könnten sie ruhig nach ca. einer Stunde das Gespräch beenden. Zur Auflockerung der Situation deckte ich einen Tisch mit Kaffee und Kuchen und den übrigen für einen Kaffeeklatsch üblichen Utensilien. Dennoch war der Charakter des Ortes Tonstudio natürlich nicht zu verdecken; zudem standen auf dem Tisch zwar etwas verdeckt, aber dennoch sichtbar drei Richtmikrofone, die jeweils auf die Plätze der Gesprächsteilnehmenden gerichtet waren. Nach meinem eigenen Eindruck wie auch nach den Kommentaren der Teilnehmenden selbst entstanden dennoch völlig normale Gespräche, in denen manchmal explizit auf die Aufnahmesituation eingegangen wurde, in denen sich aber die Teilnehmenden nicht erkennbar anders als in anderen informellen Gesprächen verhielten. Die Aufnahmesituation sei den Teilnehmenden auch nicht besonders unangenehm gewesen, vielmehr hätten sie sie sogar teilweise vergessen. Die Gespräche dauerten alle mehr als eineinhalb Stunden.
1.2.2. Transkription der Daten Von den gesamten Gesprächen wurde zunächst eine Rohtranskription hergestellt.16 Auf der Grundlage dieser Rohtranskriptionen wählte ich die Sequenzen aus, die der genaueren Feinanalyse unterzogen werden sollten. Zugleich lieferte die Rohtranskription die Grundlage für die darauf aufbauende Feintranskription. Meine Beschreibungskategorien für die Feintranskription sind das Resultat jahrelanger, extensiver auditiver und z.T. akustisch unterstützter Analysearbeit, die ich während meiner Zusammenarbeit mit Dafydd Gibbon an der Universität Bielefeld begonnen habe (siehe Gibbon/Selting 1983). Diese Arbeit habe ich kontinuierlich weitergeführt und die ursprünglich verwendeten Kategorien aufgrund zunehmender Sensibilisierung für den Gegenstand und konstruktiver Kritik von Fachkolleginnen und Fachkollegen präzisiert und verändert. Das dieser Arbeit zugrundeliegende Gesamtbeschreibungssystem wird weiter unten zunächst im Überblick dargestellt und danach im Detail begründet und gerechtfertigt. Zuvor sollen hier jedoch einige generelle Probleme derartiger Analysen erörtert werden.
Für die Herstellung der Rohtranskripte danke ich Ronald Jacobs, für die Bereitstellung der finanziellen Mittel dafür dem Fach Germanistik des Fachbereichs 11 der Universität Oldenburg.
35 Hinsichtlich der Anfertigung der Feintranskriptionen stellten sich nämlich einige methodologische Probleme, deren explizite und methodisch begründete Behandlung beim hier gewählten Schwerpunkt auf Prosodie und Intonation besonders vonnöten war: (1) das Problem der Wahl und Beschränkung der Transkriptionskategorien; (2) das Problem der Reliabilität der Transkription von Prosodie und Intonation. Die Transkription von Prosodie und Intonation ist wie jegliche andere Art der Datenrepräsentation ein theoriegeleitetes Vorgehen, wenn auch die zugrundeliegende Theorie nicht immer expliziert wird (s.o. Kapitel 1.1.4.). Bei so relationalen Phänomenen wie lokalen Tonhöhenverläufen, mit denen akzentuierte Silben konstituiert werden, ergibt sich ein Problem aus der Kategoriengebundenheit der Wahrnehmung: Man hört und interpretiert in Kategorien, die man als relevant erachtet (vgl. hierzu auch Lieberman 1965); relationale Phänomene werden prototypischen Kategorien zugeordnet, auch wenn die Grenzbereiche zwischen Kategorien äußerst fließend sind. Dieses Problem ist m.E. keineswegs im Bereich von Prosodie und Intonation gravierender als im Bereich anderer Untersuchungsbereiche; es erscheint uns nur so, weil unsere Intuitionen in diesem Bereich aufgrund mangelnder Schulung und Routine besonders unzuverlässig und auch wenig durch metasprachliche Alltagskategorien (vor-)strukturiert sind. Insofern bestehen hier dieselben Prinzipien und Voraussetzungen wie bei jeglicher kategoriengebundener Wahrnehmung und Interpretation.
1.2.2.1. Wahl und Beschränkung der Beschreibungskategorien Das Problem der Wahl und Beschränkung bzw. der möglicherweise notwendigen weiteren Präzisierung und Differenzierung von Beschreibungskategorien stellte sich mir vor allem in bezug auf die Beschreibung lokaler Tonhöhenbewegungen bei akzentuierten Silben, für die in bezug auf die Beschreibung des Deutschen zur Zeit mindestens zwei relevante Modelle miteinander konkurrieren: ein Modell mit fünf Akzenttypen und ein Modell mit drei Akzenttypen. Traditionell wurden lokale Tonhöhenverläufe im Deutschen mit i.d.R. drei grundlegenden Tonmustern' beschrieben: fallend, steigend, gleichbleibend; daneben wurden die Varianten fallend-steigend und steigend-fallend vorgesehen (Pheby 1969, 1980). Bei letzteren handelt es sich aber nur um Kombinationen von fallenden und steigenden Tonhöhenbewegungen, die den Grundbestand von drei Tonmustern nicht tangieren. Neuere experimentelle Arbeiten zur kategorialen Wahrnehmung von Intonation haben jedoch nahegelegt, daß Experimentteilnehmer unter experimentellen Bedingungen durchaus feinere Tonhöhenverlaufsmuster auf einem Tonhöhenkontinuum semantisch interpretieren können. So stellte z.B. Köhler 1987 die Aufgabe, Äußerungen mit sukzessive verschoben synchronisierten FQ-Verläufen semantisch daraufhin zu beurteilen, ob sich die Bedeutung der Stimulusäußerung gegenüber der vorherigen Stimulusäußerung verändert habe. Seine Ergebnisse zeigen, daß die so gefundenen kategorialen Grenzen bei der Interpretation von Tonhöhenverläufen auf akzentuierten Silben sich nicht genau mit den traditionellen Kategorien fallend, steigend und gleichbleibend auf der Akzentsilbe decken. Diese Ergebnisse wurden z.T. durch Braun/Jin 1987 bestätigt, die in Anlehnung an die Arbeit Kohlers von fünf verschiedenen Akzentprototypen ausgingen: fallender Akzent, steigender Akzent, Gipfelakzent,
36 Tiefakzent, und gleichbleibender Dehnungsakzent. (Vgl. auch Jin 1990; die Probleme solcher Experimente zur kategorialen Wahrnehmung diskutieren Repp 1984, Schiefer/Batliner 1988.) Weiterhin arbeiten auch die neueren generativen Untersuchungen zur deutschen Intonation mit differenzierteren Modellen: Uhmann 1988 legt vier 'Akzenttöne' zugrunde: H*+T (=fallender FQ-Verlauf durch die akzentuierte Silbe, bezieht nachfolgende unakzentuierte Silben ein), T*+H (=steigender FQ-Verlauf durch die akzentuierte Silbe, bezieht nachfolgende unakzentuierte Silben ein), H* (=FQ-Gipfel im Nukleus der akzentuierten Silbe, kein Einfluß auf unakzentuierte Silben), T* (= Fg-Tal im Nukleus der akzentuierten Silbe, kein Einfluß auf unakzentuierte Silben) (nach Uhmann 1988:76). Wunderlich 1988 arbeitet mit sechs 'Akzentmustern': Gipfelakzent, Brückenakzent, Fallend-Tiefakzent, Tiefakzent-Steigend, Echoakzent, Linker Brückenpfeiler (Wunderlich 1988: 11); hierbei ist jedoch der Brückenakzent lediglich aus zwei der anderen Akzenttypen zusammengesetzt, so daß die fünf Grundbestandteile dieser Akzente sind: Gipfelakzent, Linker Brückenpfeiler, Fallend-Tiefakzent, Tiefakzent-Steigend und Echoakzent. Über die praktische Handhabbarkeit von Modellen mit drei versus fünf grundlegenden prototypischen Tonhöhenbewegungen und damit auch über die von mir im weiteren auf der Ebene der Transkription holistischer Tonhöhenverläufe im Bereich akzentuierter Silben als Akzentprototypen zugrundezulegenden Kategorien sollte eine Versuchsreihe entscheiden, die ich im Herbst 1988 mit mir selbst und mit Studentinnen und Studenten der Germanistik an der Universität Oldenburg durchführte. Bei dieser Versuchsreihe ging ich davon aus, daß diejenigen Kategorien, die von mir selbst und von Versuchspersonen konsistenter und zuverlässiger angewendet werden, geeigneter sind für die Verwendung als Beschreibungskategorien. Um die beiden Modelle gegeneinander zu überprüfen, führte ich je einen "Transkriptionsversuch" mit einem 3-Akzent-Modell (fallend, steigend, gleichbleibend) und einem 5-Akzent-Modell (fallend, steigend, Gipfel, Tal/tief, gleichbleibend) mit je einer Gruppe von Versuchspersonen und mit mir selbst durch. Als Ergebnis erhielt ich, daß weder ich selbst noch die Versuchspersonen das 5-Akzent-Modell mit hinreichender Zuverlässigkeit anwenden konnten, während das 3-Akzent-Modell generell konsistenter und zuverlässiger angewendet werden konnte.17 In diesem in Anlehnung an die Vorgehensweise bei Braun/Tin 1987 und Jin 1990 durchgefühlten "Transkriptionsversuch" transkribierten Studierende der Germanistik an der Universität Oldenburg einige ausgewählte prosodische Parameter der konversationeilen Erzählung "Gesangsunterricht'' aus meinem Korpus, die auch weiter unten in dieser Arbeit noch genauer analysiert wird. Insgesamt wurde in zwei getrennten "Transkriptionsversuchen" mit jeweils getrennten Gruppen von 15 bzw. 8 Versuchspersonen jeweils die Übereinstimmung bei der Interpretation von Grenzen zwischen Einheiten, bei der Interpretation von Akzentstellen und bei der Zuordnung von drei bzw. fünf Akzenttypen zu den Akzentstellen überprüft. Die hier relevanten Ergebnisse zu den Akzenttypen sind: Bei der Wahl zwischen drei Akzenttypen stimmten die Vp bei 75,7% der transkribierten Akzentstellen zu mehr als 50% in ihren Transkriptionen überein. Bei der Wahl zwischen fünf Akzenttypen stimmten demgegenüber die VP nur bei 60,6% der transkribierten Akzentstellen zu mehr als 50% in ihren Transkriptionen überein. Auch bei meinen eigenen zu unterschiedlichen Zeitpunkten je zweimal mit einem Inventar von drei und von fünf Akzenttypen angefertigten Transkriptionen lag die Übereinstimmung der Transkriptionen bei drei Akzenttypen deutlich höher als bei fünf. Sogar wenn die niedrigere Übereinstimmungsrate mit den unterschiedlichen Zufallsquoten bei unterschiedlich großen Wahlmöglichkeiten statistisch erwartbar und erklärbar wäre, hat dies m £ . dennoch darüber hinausgehende Konsequenzen für Transkriptionen. Wenn für Transkriptionen eine Übereinstimmung von idealerweise 100% wünschenswert wäre, dann läßt ein Kategorieninventar mit drei Akzenttypen bei ca. 75,7% Übereinstimmung vertretbare Resultate erwarten. Eine Übereinstimmung von nur 60,6% dagegen läßt mich jedoch erheblich an der zuverlässigen Handhabbarkeit der fünf Akzenttypen, zumindest für praktische Transkriptionen, zweifeln. Und wenn man sich z.B. die Ergebnisse von Jin's Wahrnehmungsund Akzentzuordnungsversuchen, an deren Design und Aufbau meine Versuche angelehnt waren, im De-
37 (Auf eine genauere Darstellung dieses Versuches und seiner Ergebnisse wird im Rahmen dieser Arbeit aus Platzgründen verzichtet.) Als Ergebnis dieses Versuches entschied ich mich, für meine Arbeit weiterhin von einem Modell mit den grundlegenden Akzentprototypen fallend, steigend und gleichbleibend im Rahmen des weiter unten dargestellten Gesamtbeschreibungssystems auszugehen.
1.2.2.2. Das Problem der Reliabilität der Transkriptionen Eines der üblichen Verfahren, die Reliabilität von Transkriptionen zu verbessern, ist die unabhängige Transkription derselben Daten durch verschiedene Transkribenten, mit dem Idealziel, daß bei hinreichend klaren Transkriptionskriterien auch eine möglichst hohe Übereinstimmung des Transkriptionsresultats erzielt werden kann. Die dieser Arbeit zugrundeliegenden Intonations-Transkriptionen sind folgendermaßen erstellt: Jede Einzeltranskription wurde entweder von mir selbst mit mindestens vierwöchigem Zeitabstand zweimal unabhängig voneinander, oder von mir und einer anderen Transkribentin unabhängig voneinander transkribiert. Für die Auswahl von für Intonationsphänomene gut sensibilisierten Transkribentinnen, die die von mir unabhängigen Transkriptionen herstellten, konnte ich auf die Ergebnisse des Transkriptionsversuches zurückgreifen.18 In diesen Intonationstranskriptionen wurden die prosodisch kohäsiven Äußerungseinheiten identifiziert und abgegrenzt, Akzentstellen identifiziert, Akzenttypen identifiziert bzw. zugeordnet, globale Tonhöhenverläufe und gelegentlich auch die Art des Tonhöhenanschlusses folgender Einheiten notiert. Andere prosodische Parameter wie z.B. Pausen, Tempo- und Lautstärkeveränderungen und segmental-phonologische Parameter wurden von mir ergänzt. Auf diese Weise entstanden je zwei unabhängige Transkriptversionen, auf deren Grundlage ich selbst in einem letzten Transkriptionsdurchgang die Endversionen der Transkripte herstellte. Auch die Transkriptionskategorien sind bereits auf das Ziel hin angelegt, holistische Einheiten zu dekomponieren und soweit möglich prosodische Kategorien in ihre konstitutiven Parameter zu parametrisieren. Mit fortschreitender Sensibilisierung der Forschenden für prosodische Parameter sind jedoch vielleicht sukzessive weitere Parametrisieningen möglich und für weitere Analysen auch nötig. In diesem Sinne ist weder die hier vorliegende Transkription noch die Analyse abgeschlossen.
tail anschaut, liegen doit die Übereinstimmungsergebnisse auch nicht viel höher als meine bei der Zuordnung von fünf Akzenttypen. Für die Herstellung dieser Zweittranskriptionen danke ich Doerthe Welzel und Ulrike Kairies, für weitere Korpus-Verwaltungsaibeiten Ulrike Zscherp. Auch hierfür verdanke ich die finanziellen Mittel dem Fach Germanistik der Universität Oldenburg.
38 1.2.3. Überblick über die deskriptiven Kategorien und Parameter An dieser Stelle möchte ich der Detailanalyse vorgreifend einen kurzen Überblick über die in dieser Arbeit verwendeten Beschreibungskategorien und -parameter geben, um das Verständnis der in den folgenden Kapiteln diskutierten Beispiele zu erleichtern. Dort finden sich auch die Argumente und Analysen, die die Annahme der Einzelkategorien weiter begründen und rechtfertigen und die interpretative Relevanz dieser Kategorien und Parameter zeigen und nachweisen. Ähnlich wie Crystal 1969 verwende ich Prosodie als Oberbegriff und unterscheide zwischen unterschiedlichen prosodischen Systemen. Unter Prosodie bzw. "prosodischen Systemen" versteht Crystal (1969: 5) solche "sets of mutually defining phonological features which have an essentially variable relationship to the words selected, as opposed to those features (for example, the (segmental) phonemes, the lexical meaning) which have a direct and identifying relationship to such words". Hierzu gehören Tonhöhenverlauf ("tone", "pitch direction"), Bandbreite ("pitch range"), Pausen ("pause"), Lautstärke ("loudness"), Sprechgeschwindigkeit/Tempo ("tempo"), Rhythmus ("rhythmicality"), Artikulationsspannung ("tension"), und die paralinguistischen Parameter Stimmqualität ("voice qualifiers") und Charakterisierungen paralinguistischer Aktivitäten ("voice qualifications") (für eine Übersicht über Crystals genaue Systematisierung dieser Phänomene vgl. ebd.: 177ff.) Prosodie wird dabei also als der umfassendere Begriff angesehen, der den Gegenstandsbereich der Intonation mit umfaßt. Da der Intonation in dieser Arbeit z.T. besonderes Interesse gilt, wird sie oft explizit zusätzlich benannt. Zu den spezifischen intonatorischen Parametern gehören v.a. globale und lokale Tonhöhenverläufe von Äußerungen, die Intonationskonturen konstituieren. Zu den berücksichtigten anderen prosodischen Parametern gehören v.a. globale und lokale Lautstärkeund Tempoveränderungen. Prosodie und Intonation werden verwendet zur Konstruktion 'prosodisch kohäsiver Einheiten'. Diese fallen oft, jedoch nicht immer, mit Turnkonstruktionseinheiten zusammen; manchmal umfassen sie jedoch auch mehr oder weniger als eine Turnkonstruktionseinheit; gelegentlich werden prosodisch kohäsive Einheiten turn-übergreifend von zwei Sprechern konstituiert. Für die Signalisierung prosodisch kohäsiver Einheiten spielt die Intonationskontur eine herausragende Rolle gegenüber anderen prosodischen Parametern. Prosodische und intonatorische Parameter werden in einer (oder ggf. mehr als einer) Prosodiezeile unter der Textzeile von Transkriptionen notiert, wie in den folgenden Beispielen: (1) K2: 364 364 I:
aber geNAUso viele köpn auch NICH s(h)ingn F(\ \ )
(2) K2: 438-439 438 R:
und als ich dann hier ANgefangn hab mit S(/
39 439 R:
aesanasüMterricht / )
àhm:: -
(3) K2: 448-449 448 R: *
undann hab ich HIER halt so: die gesangsTECHnik dann nich=
FC/ \ / ) < ail >
Da in dieser Arbeit segmental-phonetische Details der Daten nicht im Vordergrund der Analyse stehen, wird in der Textzeile der Transkripte eine in der Konversationsanalyse übliche, wenn auch prinzipiell kritisierbare Transkription gewählt (zu einer Kritik vgl. Kelly/Local 1988). Darüber hinaus werden in der Textzeile der Transkripte die prominentesten Akzentsilben, primäre Akzente einer Einheit, durch FETTE GROSSBUCHSTABEN repräsentiert; weniger prominente, sekundäre Akzente werden durch einfache GROSSBUCHSTABEN gekennzeichnet. Ein auffallig starker Akzent erhält zudem eine UNTERSTREICHUNG. Längung eines Lautes bzw. eines Segments wird durch Doppelpunkte ":" angezeigt (für weitere Transkriptionskonventionen siehe das Verzeichnis der Transkriptionskonventionen im Vorspann dieser Arbeit). Ein Stern am linken Transkriptrand, wie in (3), kennzeichnet die für die Analyse unmittelbar relevante Zeile.
Die Intonationskontur Eine Intonationskontur ist eine aufgrund ihrer Tonhöhenverlaufsgestalt - und gegebenenfalls auch aufgrund ihres (wahrgenommenen) Rhythmus - von Analysierenden und Rezipienten als kohäsiv wahrgenommene prosodische bzw. melodische Einheit zwischen Grenzsignalen. Als Grenzsignale fungieren vor allem ein Bruch und Neuansatz in der melodischen Führung und/oder anakrustische, schnellere Silben am Beginn einer neuen Einheit, eventuell auch eine Lautdehnung am Einheitenende oder eine Abgrenzungspause. Der Begriff 'Kontur' wurde gewählt, weil er sich nur auf die prosodische bzw. intonatorische Konfiguration bezieht. Damit wird bereits begrifflich reflektiert, daß Prosodie, und insbesondere Intonation, als autonome Signalisierungssysteme aufgefaßt weiden, die unabhängig von der Grammatik verwendet werden. Demgegenüber haftet anderen Begriffen wie der Tongruppe' oder der 'intonational phrase/Intonationsphrase' allzuoft eine zu enge Verbindung mit grammatischen Strukturen oder Prinzipien an. Die mit Hilfe von Intonationskonturen konfigurierten und voneinander abgegrenzten Einheiten sind keine mikroprosodischen Segmente, sondern kohäsive Einheiten auf der Ebene der Turnkonstruktion und der Gesprächsorganisation, d.h., i.d.R. Wörter, Phrasen, Sätze oder noch größere segmentale und textuelle Einheiten, die als Turnkonstruktionseinheiten vorkommen können. Die Untergliederung des Redestroms in und mit Hilfe von Intonationskonturen ist dabei auf die Erfordernisse der Turn- und Gesprächsorganisation zugeschnitten. Die abgegrenzten Einheiten sind oft größer als die im Hinblick auf
40 grammatische Analysen definierten Tongruppen' der tonetischen Analyse (s. Kapitel 1.1.3. für eine Kritik dieser Kategorie). Eine für die Zwecke der Turnkonstruktion konfigurierte und abgegrenzte Einheit deckt sich auch nicht notwendig mit einer breath group (Lieberman 1967). Die physiologische Notwendigkeit der Atmung könnte zwar ggf. Pausen erfordern, aber weder deren spezifische Kontextualisierung als z.B. Abgrenzungspausen bedingen, noch prosodische Brüche und Neuansätze ohne Pausen erklären. Die physiologische Notwendigkeit ist mithin keine hinreichende Erklärung der Untergliederung der Rede mit Hilfe von prosodischen Signalen und Intonationskonturen. Eine Kontur ist eine holistische melodische Gestalt, mit allerdings variablen und deshalb erst retrospektiv analysierbaren Enden. Während fallende und steigende lokale Tonhöhenbewegungen prinzipiell eine Intonationskontur potentiell beenden können, signalisieren gleichbleibende und ggf. leicht steigende lokale Tonhöhenbewegungen die Kontur als noch nicht beendet und projektieren eine noch ausstehende Fortsetzung bzw. eine noch ausstehende Beendigung. Obwohl die Intonationskontur nie allein auftritt, bestehen dennoch für Text und Kontur voneinander unabhängige Konstruktionsschemata. Obwohl in den meisten Fällen Text und Kontur in Kookkurrenz miteinander Turnkonstruktionseinheiten konstituieren und abgrenzen, ist das keineswegs immer so. In einigen Fällen werden nämlich Konturen eines ersten Sprechers von einem Folgesprecher über einen Sprecherwechsel hinweg im Folgeturn vervollständigt oder fortgesetzt (s.u.), ohne einen prosodischen/melodischen Bruch zu konstituieren. Weiterhin können Konturen in andere Konturen eingebettet werden oder mit weiteren Konturen zu einer größeren Einheit verbunden werden.
Die Struktur der Intonationskontur Zur Konstitution und Konstruktion von Intonationskonturen werden globale und lokale Tonhöhenverläufe verwendet. Die unterschiedlichen Komponenten der Kontur erfüllen unterschiedliche Aufgaben bei der Organisation konversationeller Interaktion. Schematisch läßt sich die Struktur einer Intonationskontur wie in Figur 1 darstellen. Es folgt auch eine tabellarische Zusammenstellung der konstitutiven Einzelparameter der Kontur. Die wichtigste Einheit ist die "kohäsive Akzentsequenz". Sie wird konstituiert durch wenigstens einen oder die Abfolge mehrerer Akzente mit den dort jeweils gewählten lokalen Tonhöhenbewegungen auf einer globalen Tonhöhenverlaufslinie, ohne jedoch von einem notwendigen Nukleus in letzter Position auszugehen. "Vorlauf' bezieht sich auf mögliche unakzentuierte Silben vor der Akzentsequenz.
41 Figur 1: (a) Struktur der Intonationskontur
Notationsbeispiel:
F(
allgemeine Struktur:
Vorlauf
kohäsive Akzentsequenz
bestehend aus folgenden Strukturkomponenten:
unakzentuierte Silben vor der Akzentsequenz
Globaltonhöhenverlauf mit einem bzw. mehreren Akzenttypen
\
\
/
)
(b) Tabellarische Zusammenstellung der konstitutiven prosodischen Einzelparameter Vorläufer (immer vor der "( )" Klammer notiert) \,
/,
-
Tonhöhenbewegung unakzentuierter Silben vor der Akzentsequenz: fallend, steigend, gleichbleibend upstep beim Beginn der neuen Einheit downstep beim Beginn der neuen Einheit continuance, d.h. Tonhöhenfortsetzung, bei Fortsetzung und/oder Beginn einer neuen Einheit hoher bzw. tiefer Vorlauf anakrustische schnelle Vorlaufsilben schneller Anschluß der Folgeeinheit
, < t >
=
Globaltonhöhenverläufe: (immer vor der "( )" Klammer notiert) F,S,H,M,T(
H, F ( [ ( )(
(
)
)
Angabe des globalen Tonhöhen Verlaufs vor der durch die Klammer angegebenen Akzentsequenz: F=fallend, S=steigend, H=hoch, M=mittel, T=tief (Klammem stehen i.d.R. vor dem ersten Akzent und am Ende der kohäsiven Einheit, bei Veränderungen zu global tiefen oder hohen Einheiten, wo auch der Vorlauf einbezogen ist, steht die erste Klammer dort, wo der Globaltonhöhenverlauf beginnt.) Kombination von globalen Angaben zusammengesetzte Kontur mit nur schwachen oder keinen internen Grenzen zwischen unterschiedlichen Globalverläufen "eingefügte" Kontur/Redepassage, nach der die vorherige Kontur wiederaufgenommen wird
42 Alrantfproto)tvpen: (immer innerhalb der "( )" Klammem stehend) \
/
\J
Λ
?/,
?\,
?
fallender Akzent: Fg-Gipfel im Silbenkem bzw. kurz davor und Rest d a Silbe bzw. des Wortes und danach fallend: steigender Akzent: FQ-Tal im Silbenkern bzw. kurz davor und Rest der Silbe bzw. kurz danach steigend: gleichbleibender Akzent: wird v.a. durch Lautheit und/oder Dauer konstituiert und wirkt ggf. wie etwas gegen den Globaltonhöhenverlauf gehalten: —·— fallend-steigender Akzent: wie fallender Akzent auf einer akzentuierten Silbe plus steigende FQ auf einer späteren unakzentuierten Silbe steigend-fallender Akzent wie steigender Akzent auf einer akzentuierten Silbe plus fallende FQ auf einer späteren unakzentuierten Silbe unsichere Transkription eines Akzents bzw. Akzenttyp gar nicht entscheidbar
Akzentmodifilcatinnp.n· t \,
1/
Τ- ,
4--
\_
Ideal größere Tonhöhenbewegungen bei einem Akzent, höherer Gipfel und/oder größere Bandbreite als bei den umliegenden Akzenten Ideale Tonhöhensprünge zu hohen bzw. tiefen gleichbleibenden Akzenten nach ganz tief fallende Tonhöhenbewegung Folge von schwachen Akzenten bzw. unakzentuierten Silben innerhalb des Globalverlaufs
Weitere relevante Notationskonvention: Tonhöhenanschluß so ausgewiesener Segmente (Indizes werden zur Verdeutlichung bei mehreren Möglichkeiten gebraucht)
Um die Kontur genauer zu beschreiben, unterscheide ich zwischen Parametern mit globalem und lokalem Skopus. Beide Parameter sind immer noch holistische und interpretative Kategorien. Allerdings kann meine Unterscheidung zwischen globalen und lokalen Kategorien wie auch z.B. zwischen unterschiedlichen Stärken und/oder Bandbreiten bei lokalen Tonhöhenbewegungen als der Versuch gesehen werden, Konturen in ihre auditiv diskriminierbaren Parameter zu dekomponieren.
Globale Tonhöhenverläufe Der wichtigste globale Parameter ist die wahrgenommene Tonhöhenbewegung innerhalb der gesamten Akzentsequenz, d.h. als einer Akzentsequenz, die meist auf einer einheitlich fallenden (F), steigenden (S), gleichbleibend mittleren (M), hohen (H) oder tiefen (T) Tonhöhenverlaufslinie realisiert wird. Die Globaltonhöhenbewegung wird dabei durch die Tonhöhenverläufe der unakzentuierten Silben und/oder der aufeinanderfolgenden Akzentgipfel kon-
43 stituiert. Sie steht vermutlich in Beziehung zur sogenannten "Deklinationslinie" (cf. e.g. Liberman/Pierrehumbert 1984).21 Runde Klammern "( )" geben die Länge der kohäsiven Akzentsequenz an. Die linke Klammer "(" steht in der Regel vor dem ersten Akzent der Akzentsequenz, die rechte Klammer ")" in der Regel am Ende der kohäsiven Sequenz. Wenn aber der Vorlauf oder ein Teil des Vorlaufs in den Globaltonhöhenverlauf einbezogen ist, dann steht die linke Klammer am Anfang der gesamten Einheit bzw. dort, wo die Globaltonhöhenbewegung beginnt. Wenn die Globaltonhöhe nach einem Haltesignal (s.u.) ohne potentielles Konturenende "hängenbleibt", dann wird ggf. die Klammer offen gelassen. Eine Tonhöhenwiederaufnahme und Fortführung der Kontur nach einer Pause oder "Störung" wird mit für "continuing" angegeben. Gelegentlich wird auch durch eckige Klammern "[ ]" eine größere Einheit angezeigt, in der z.B. zwei oder mehr Einheiten aufgrund ihres kontinuierlich fallenden Tonhöhenverlaufs (vgl. Couper-Kuhlens "Paraton", 1983) oder auch ihrer Kombination aus einer global steigenden und einer global fallenden Einheit ohne oder mit nur schwach ausgeprägten internen Grenzen zwischen Globalverläufen eine größere zusammengesetzte Einheit konstituieren. Spitze Klammem "< >" innerhalb von Einheiten, d.h. "( < > )", bezeichnen "eingefügte" Konturen oder Redepassagen, nach denen die zuvor suspendierte Kontur wieder aufgenommen und fortgesetzt wird.
Lokale Tonhöhenverläufe: Akzenttonhöhenbewegungen Der wichtigste lokale Parameter ist der Tonhöhenverlauf in und nach akzentuierten Silben bis zur nächsten akzentuierten Silbe, d.h. in der Akzenteinheit. Ich unterscheide zunächst fünf Akzent(proto)typen, die sich aus drei grundlegenden lokalen Tonhöhenbewegungen ergeben. Ihre Transkriptionsrepräsentation und deren (proto)typische schematisierte Tonhöhenverläufe sehen wie folgt aus: Ύ bezeichnet einen "fallenden Akzent", bei dem ein Tonhöhengipfel im Silbenkern bzw. kurz davor liegt und die Tonhöhe im Rest der Silbe bzw. des Wortes und der restlichen Akzenteinheit fällt. Eine Darstellung dieser Tonhöhenkonfiguration wäre somit: *S . Hierbei wird - auch der tonetischen Analyse entsprechend - nicht der Tonhöhenanstieg ("onglide") zur akzentuierten Silbe in einem Verlauf wie als definierend genommen, sondern der Tonhöhenverlauf, der in der Akzentsilbe beginnt und danach fortgesetzt wird. "/" bezeichnet einen "steigenden Akzent", bei dem ein Tonhöhental im Silbenkern bzw. kurz davor liegt und der Rest der Silbe bzw. des Wortes und der restlichen Akzenteinheit steigt Schematisiert sähe diese Konfiguration wie folgt aus: » / . Auch hier wird wiederum nicht der Tonhöhenabfall vor der Akzentsilbe in einer Konfiguration wie als Definitionskriterium genommen, sondern wiederum die Akzenttonhöhenbewegung, die in der Akzentsilbe beginnt und danach fortgesetzt wird.
Die genaue Beziehung zwischen dem wahrgenommenen Globaltonhöhenverlauf und der akustisch analysierten Deklinationslinie bedarf jedoch der weiteren Untersuchung (vgl. hierzu generell Couper-Kuhlen 1986:82ff.).
44 "-" bezeichnet einen "gleichbleibenden Akzent", bei dem die Tonhöhe in der Akzentsilbe und im Rest der Akzenteinheit gleichbleibt, und bei dem die Akzentuierung v.a. mithilfe der Parameter Länge und/oder Lautstärke konstituiert wird; dieser Akzent wirkt ggf. wie etwas gegen den Globaltonhöhenverlauf gehalten und gedehnt, manchmal mit Tonhöhensprung nach oben oder unten. Ein möglicher schematisierter Verlauf wäre ·—. "V" bezeichnet einen "fallend-steigenden Akzent". Hierbei wird die erste, fallende Tonhöhenbewegung ebenso wie ein fallender Akzent auf einer akzentuierten Silbe realisiert, die zweite, steigende Tonhöhenbewegung folgt auf einer unakzentuierten Silbe sofort danach oder erst später in der Einheit. "Λ" bezeichnet einen "steigend-fallenden Akzent". Auch hier wird die erste, steigende Tonhöhenbewegung ebenso wie ein steigender Akzent auf einer akzentuierten Silbe realisiert, die zweite, fallende Tonhöhenbewegung folgt auf einer unakzentuierten Silbe sofort danach oder erst später in der Einheit.20 "..." bezeichnet eine Folge nicht weiter spezifizierter schwach akzentuierter oder unakzentuierter Silben, die auf der Linie des Globaltonhöhenverlaufs liegen. Nicht alle Akzente können mit gleicher Klarheit als Realisierungen dieser Akzent(proto)typen identifiziert werden, jedoch tendieren die meisten Akzente mehr oder weniger klar zu diesen Akzent(proto)typen. In der Analysepraxis bringt ggf. die Kontrastierung mit einer möglichen Alternative größere Klarheit: Wenn auch gelegentlich nicht klar gesagt werden kann, daß es sich um einen deutlich fallenden Akzent handelt, so kann er dennoch klar von einem steigenden Akzent unterschieden weiden. In unklaren Fällen wird "?/", "?", o.ä. notiert. Akzente können unterschiedlich stark sein, und sie können durch lokale Tonhöhenvariationen modifiziert und markiert werden. Akzentnotation mit FETTEN GROSSBUCHSTABEN in der Textzeile zeigt primäre Akzente einer Einheit an, nur GROSSBUCHSTABEN hingegen schwächere sekundäre Akzente. Unterschiedliche Akzentstärken können durch unterschiedliche Lautstärke der Akzentsilben, jedoch ebenso durch markiert große Tonhöhenbewegungen bei den Akzenten Zustandekommen. Stark erhöhte Lautstärke bei markiert starken Akzenten ist durch eine getrennte Notation des Lautstärkeparameters ausgewiesen. Auffällig große, markierte lokale Tonhöhenbewegungen nach oben oder unten bei einem Akzent (notiert als z.B. "1\" oder "4-/") konstituieren Akzente mit größerer Bandbreite als in den umliegenden Akzenten. Die Bandbreite der normalen, unmarkierten Tonhöhenbewegung, d.h. die Tiefe des Falls oder die Höhe der Steigung, wird i.d.R. über die Notation des Globaltonhöhenverlaufs mit erfaßt. Ein fallender Akzent bei mittlerer Globaltonhöhe fällt i.d.R. nicht bis ganz tief, wohinMeine Akzenttypen entsprechen den wichtigsten Tonmustern, die auch in tonetischen Intonationsanalysen des Deutschen zugrunde gelegt werden. So unterscheidet auch Pheby (1969, 1980 usw.) zwischen einem fallenden, einem steigenden und einem gleichbleibenden Tonmuster mit den Varianten fallend-steigend und steigend-fallend. Im Vergleich mit Bolingers Tonhöhenakzenten bzw. Akzent-Profilen sind meine Akzenttypen "einfacher" (vgl. z.B. Bolinger 1986). Bolinger entwickelte seine Akzent-Profile jedoch auch für das Englische, das bekanntlich (a) variationsreichere Intonationsformen als das Deutsche konstituiert und (b) diese auch für mehr Funktionen als im Deutschen verwendet (vgl. hierzu Bolinger 1989:42f.).
45 gegen ein fallender Akzent bei notierter fallender Globaltonhöhe tiefer fällt. Wenn die letzte Tonhöhenbewegung einer Einheit, v.a. bei sonst global mittlerer Tonhöhe, nach ganz tief fallt, so ist dies mit * V " erfaßt. Normalerweise setzen die unakzentuierten Silben nach der Akzentsilbe die dort gewählte Tonhöhenbewegung fort. Vgl. folgende schematische Darstellungen von Tonhöhenverläufen:
_ F(
\
Bei Gegenläufigkeit von lokalen und globalen Tonhöhenbewegungen gehen jedoch die unakzentuierten Silben nach einer Akzentsilbe bald wieder in die Globaltonhöhenbewegung über und setzen dann nicht einfach die Akzenttonhöhenbewegung fort. Bei einer Kontur S(\\\) ergäbe das einen Tonhöhenverlauf wie
s( \
Die Analyse der Akzente ist rein auditiv und relational; es bestehen keine theoretischen Beschränkungen hinsichtlich der Zahl der in einer Einheit möglichen primären und sekundären Akzente, genausowenig hinsichtlich deren Status als so etwas wie ein "Nukleus" oder nicht. Die zeitliche Organisation der Akzente konstituiert relativ regelmäßige, "isochrone" oder unregelmäßige, "unisochrone" Akzentrhythmen (vgl. auch Bolinger 1986: 63ff., Selting 1989a).
Vorläufe Eine neue prosodische Einheit wird oft mit einem Tonhöhensprung nach oben oder unten ("" für "upstep" bzw. "" für "downstep") am Anfang der Vorlaufsilben der neuen Einheit von der vorherigen Einheit abgesetzt, bei besonders hohen oder tiefen Vorlaufsilben notiere ich auch "" für "hoch" bzw. "" für "tief'. Ebenso oft findet sich jedoch auch eine Tonhöhenfortsetzung ("" für "continuing/continuance"). Wenn nicht eindeutig ist, an welche von mehreren möglichen vorangegangenen Einheiten eine neue Einheit mit Tonhöhenfortsetzung anschließt, dann wird ein Index zur Vereindeutigung gebraucht: < c > ; die zweite so gekennzeichnete Stelle schließt dann an die erste an. Als Tonhöhenverläufe kommen im Vorlauf meist gleichbleibende ("-"), gelegentlich aber auch fallende ('V) oder steigende ("/") vor. Die Notation des Tonhöhenverlaufs ist für Vorläufe nur nötig, wenn durch
46 diese Verläufe aufeinanderfolgende Konturen deutlich voneinander abgesetzt oder deutlich wiederaufgenommen werden. In vielen Fällen werden am potentiellen Ende von Einheiten weitere Elemente mit gleichbleibender Tonhöhenbewegung angeschlossen, die die Einheit fortsetzen und wie beim Beginn eines neuen Vorlaufs die geplante Fortsetzung der nun begonnenen prosodischen Einheit "projektieren"; in solchen Fällen steht dann das Zeichen für eine unakzentuierte Tonhöhenbewegung nach der Akzentsequenz.
'»N
... Ausschließlich so is aber ... \ ) -
Oft wird auch die neue Einheit mit schnellen Vorlaufsilben (Anakrusis, s.u.; notiert als "" mit ggf. Angabe der Länge dieser Qualifikation durch Plazierung der spitzen Klammer) und/oder einem schnellen Anschluß angeschlossen. Vorläufe werden im Rahmen dieser Arbeit nur genauer transkribiert, wenn sie für die Analyse unmittelbar relevant sind. Wenn sie nicht notiert werden, impliziert eine geschlossene Klammer vor den neuen Vorlaufsilben das (potentielle) Ende der vorausgegangenen Einheit und den Beginn einer neuen Einheit.
Nachläufe Mit derselben Transkriptionskonvention wie für Vorläufe werden auch gelegentliche unakzentuierte Tonhöhenbewegungen nach der Akzentsequenz notiert, die durch einen kleinen Tonhöhensprung von der vorherigen Einheit abgetrennt sind:
das war SO ne ( ... /) /
Hierbei handelt es sich dann um Nachläufe nach der Akzentsequenz.
Weitere prosodische Parameter Als weitere prosodische Parameter sind v.a. Lautstärke- und Sprechgeschwindigkeits- bzw. Tempoveränderungen gegenüber einer zuvor etablierten Normallautstärke und Normalsprechgeschwindigkeit relevant. Unter Sprechgeschwindigkeit verstehe ich die wahrgenommene Dichte produzierter Silben relativ zu einer zeitlichen Einheit (vgl. hierzu auch Uhmann's 1992 Density /: "density of syllables per time"). Lautstärke- und Sprechgeschwindigkeitsveränderungen können als lokale und globale Signale eingesetzt werden. Lokal erhöhte
47 Lautstärke konstituiert z.B. bei einer akzentuierten Silbe einen gegenüber umliegenden Akzenten markierten, da prominenteren stärkeren Akzent; global erhöhte Lautstärke bei größeren Teilen von oder ganzen Turnkonstruktionseinheiten kontextualisiert z.B. eine 'Unterbrechung'. Lokal schnellere Sprechgeschwindigkeit kann z.B. den Beginn einer neuen prosodischen Einheit signalisieren; global schnellere Sprechgeschwindigkeit kann z.B. Zwischenbemericungen oder andere Zwischenaktivitäten in laufenden Turns kontextualisieren (vgl. hierzu auch Uhmann 1992). Veränderungen der Lautstärke und Sprechgeschwindigkeit werden wie folgt als relative Angaben in spitzen Klammern notiert; die Position der spitzen Klammem in Relation zur Textzeile der Transkripte zeigt die lokale bzw. globale Extension des Parameters an: , ,
,
,
, ,
fate, laut sehr laut piano, leise sehr leise allegro, schnell lento, langsam crescendo, lauter werdend diminuendo, leiser werdend accelerando, schneller werdend rallentando, langsamer werdend Glottalverschluß, der über eine Pause gehalten wird
In den folgenden Kapiteln dieser Arbeit werde ich zeigen, daß und wie alle diese Parameter wichtige Funktionen bei der Organisation der alltäglichen Interaktion erfüllen.
1.2.4. Auditive Transkription und akustische Analyse Die Prosodietranskription kann je nach Analyseziel unterschiedlich detailliert werden. So sind z.B. in einer Notation wie im o.g. Beispiel (3) K2: 448-449 448 R:
undann hab ich HIER halt so: die gesangsTECHnik dann nich=
F(/ \ / ) < all >
die Vorlauf- und Abgrenzungssignale von der Vorgängereinheit expliziert. Sind diese im Detail nicht relevant, sondern geht es nur um z.B. die Analyse von Tonhöhenbewegungen in aufeinanderfolgenden Einheiten, um Akzente oder Globalverläufe, dann können die Transkripte um die Vorlaufnotationen vereinfacht werden. In diesem Fall impliziert eine geschlossene Klammer am Ende der vorausgegangenen Einheit das (potentielle) Ende dieser Einheit und den darauf folgenden Beginn einer neuen Einheit, deren Vorlaufsignale an dieser Stelle nicht weiter berücksichtigt sind. Im Prinzip lassen sich mit steigendem Detaillierungsgrad die
48
hier gewählten Kategorien weiter parametrisieren und sich damit an die Analyse von Local et al. annähern. Die Transkription einiger häufig vorkommender Tonhöhenverläufe kann wie folgt als vereinfachter prototypischer Tonhöhenverlauf schematisiert werden und dem Lesenden als "Vorstellungsbild" bei der Lektüre der folgenden Kapitel dienen.
• s(\
S(/
^ M(\
F(\
\
/)
M(/
\
S(/
\)
/
/
M( /
Akustische Analysen und Ausdrucke des Grundfrequenzverlaufs einer Äußerung werden im Rahmen dieser Arbeit v.a. verwendet zur Illustration und Visualisierung einiger der beschriebenen Phänomene, in der Annahme, daß eine solche Illustration dem Leser das Verstehen der Phänomene erleichtert. In einigen Fällen, besonders bei der Beschreibung und Transkription von Phänomenen wie unterschiedlich hohen globalen Tonhöhenverläufen und unterschiedlichen Bandbreiten von Akzentbewegungen, wurden akustische Analysen auch zur Unterstützung der auditiven Analyse und Transkription herangezogen. In jedem Fall haben akustische Analysen hier jedoch nur unterstützende Funktionen bei den auf auditiven Kategorien basierenden Beschreibungen und Analysen und deren Vermittlung. Deshalb wurden auch keine weitergehenden systematischen akustischen Analysen und z.B. deren quantitative Auswertung für erstrebenswert gehalten. Solche Analysen hätten vom Hauptziel dieser Arbeit, der Entwicklung eines interaktional-phonologischen Analyseansatzes, zu weit abgelenkt. Jedoch könnte eine weitergehende lohnende Aufgabe durchaus darin bestehen, die akustische Basis interaktional-phonologischer Kategorien und Unterscheidungen zu untersuchen. Wollte man die deskriptiven Kategorien dieses Modells formalisieren, so läge vermutlich eine erste Orientierung an den Arbeiten von G°arding (1983) und Ladd (1990) nahe, die ebenfalls mit einer Kombination von globalen und lokalen Kategorien arbeiten. Allerdings
49 müßten m.E. die prosodischen Einheiten funktional anders als in diesen Ansätzen interpretiert weiden. Die hier verwendeten akustischen Analysen wurden mit dem Programm Signalize in Verbindung mit einem Macintosh PC an der Universität Hamburg erstellt. 21 Auf der Grundlage der von diesem Programm gelieferten Oszillogramme des sprachlichen Signals werden die Grundfrequenzverläufe errechnet und analog als Verlaufskurven dargestellt. Es wird allgemein angenommen, daß eine systematische Beziehung besteht zwischen der gemessenen Grundfrequenz (Fg) und der wahrgenommenen Tonhöhe. (Zum Hintergrund und für die Grundlagen der Interpretation akustischer Analysen möchte ich an dieser Stelle pauschal verweisen auf Ladefoged 1982 2 , Neppert/Pétursson 1986 und Lieberman/Blumstein 1988.) Bei den wiedergegebenen Ausdrucken findet sich jeweils oben das Oszillogramm des sprachlichen Signals und unten die Darstellung des Grundfrequenzverlaufs. Der gemessene FQ-Bereich ist auf der Y-Achse angegeben, auf der X-Achse ist die zeitliche Organisation des Signals ablesbar. Streuwerte bei den Grundfrequenzdarstellungen sind v.a. durch folgende Faktoren bedingt: Einerseits sind sie das Resultat der Repräsentation zahlreicher Messungen auf kleinem Raum, v.a. wenn ein Abschnitt von mehreren Sekunden in seinem Gesamtverlauf dargestellt wird; andererseits wurde, v.a. wenn mehrere Sprecher an einer zu messenden Sequenz beteiligt sind, auf eine Feinfilterung des akustischen Materials für den jeweils optimalen Frequenzbereich verzichtet, um den Gesamtverlauf für alle beteiligten Sprecher erfassen zu können. Da die Ausdrucke im Rahmen der vorliegenden Arbeit jedoch v.a. zur Illustration dienen sollen, können die technischen Details der Messungen außer acht bleiben. Die Segmentierung und Zuordnung der akustischen Segmente zu den transkribierten auditiven Segmenten erfolgte mit Hilfe der genau angesteuerten Lautwiedergabe des akustischen Analyseprogramms.
Ich danke Peter Auer für seine Unterstützung und Geduld bei der Herstellung der Analysen und Ausdrucke.
2. Prosodie der Einheiten- und Turnkonstruktion Ein Turn kann bekanntlich aus einer oder aus mehreren Turnkonstruktionseinheiten' ('turnconstructional units', Sacks/Schegloff/Jefferson 1974) bestehen. Immer noch weitgehend offen ist jedoch die Frage, woran und wie wir und Rezipienten solche Einheiten erkennen bzw. welche Rolle syntaktische und/oder lexikalisch-semantische und/oder aktivitätstypspezifische und/oder prosodische Strukturen und Parameter bei der Konstruktion, Projektion und Abgrenzung solcher Einheiten spielen. In ihrem Standardaufsatz "A simplest systematics for the organization of turn-taking for conversation" postulierten Sacks/Schegloff/Jefferson 1974 als methodisch relevante Komponenten zur Organisation des Sprecherwechsels in Konversationen eine Turnkonstruktionsund eine Turnallokationskomponente. In der Turnkonstruktionskomponente ('turn-constructional component') wird geregelt, was als eine Einheit gelten kann, nach der oder mit deren Ende dann eine übergaberelevante Stelle ('transition-relevance place') gegeben ist, an der die Regeln der Turnallokationskomponente ('turn-allocation component1) greifen. Für unsere Untersuchung hier sind zunächst die Regeln und Prinzipien der Turnkonstruktion von besonderem Interesse. Sacks/Schegloff/Jefferson sagen dazu folgendes: "There are various unit-types with which a speaker may set out to construct a turn. Unit-types for English include sentential, clausal, phrasal, and lexical constructions (...). Instances of the unit-types so usable allow a projection of the unit-type under way, and what, roughly, it will take for an instance of that unit-type to be completed. Unit-types lacking the feature of projectability may not be usable in the same way" (ebd.: 702). Hier wird also als wichtigste Eigenschaft der Turnkonstruktion hervorgehoben, daß mit Hilfe der genannten segmental-linguistischen Mittel Fortsetzungen bis zum Ende einer in unserem Sprachsystem in irgendeiner Weise "vollständigen" Einheit "projektiert" werden können. Allerdings liefern Sacks/Schegloff/Jefferson keine Detailanalysen zur internen Struktur oder Verknüpfung von Einheiten in Turns. Die Hypothese liegt nahe, daß hier Prosodie eine wichtige Rolle spielt Hierzu bemerken sie dann auch später, wenn sie auf die Projektierung möglicher übergaberelevanter Stellen mit Hilfe z.B. der Syntax (genannt weiden '"possible completion points' of sentences, clauses, phrases, and one-word constructions, (...) and multiples thereof') näher eingehen (ebd.: 721f): "Clearly, in some understanding of 'sound production' (i.e. phonology, intonation etc.), it is also very important to turn-taking organization. For example, discriminations between what as a one-word question and as the start of a sentential (or clausal or phrasal) construction are made not syntactically, but intonationally. When it is further realized that any word can be made into a 'one-word' unit-type, (...) via intonation, then we can appreciate the partial character of the unit-types' description in syntactic terms." Es stellt sich im Anschluß hieran die Frage, wie also Turnkonstruktionseinheiten als kohäsives Ganzes produziert und signalisiert und wie ggf. solche Einheiten innerhalb eines Turns kombiniert weiden. Wie signalisieren Sprecher prospektiv und damit für den Rezipienten bereits vor einem möglichen Einheitenende erkennbar, daß nach der gerade in Produktion be-
51 findlichen (turninternen) Einheit noch eine weitere Einheit angeschlossen werden soll ('turn holding'), bzw. umgekehrt, daß die gerade in Produktion befindliche Einheit eine turnbeendende sein soll, nach der ein Sprecherwechsel ansteht ('tum yielding')? Eine projektierende, prospektive Signalisierung ist dabei wichtig für die Orientierung des Rezipienten, damit dieser als nächster Sprecher mit möglichst nur minimaler Überlappung oder Verzögerung seinen Turn übernehmen kann. Wie werden also 'one-unit turns' und 'multi-unit turns' (Schegloff 1982, s.u.) bzw. 'turn holding' und 'turn yielding' (Local et al., s.u.) signalisiert und kontextualisiert? Welche Rolle spielen hierbei prosodische Signale? Im Zusammenhang der genannten Aufgaben der Gesprächsorganisation können aus analytischen Gründen mehrere Aufgabenkomplexe unterschieden werden: (1) die Konstruktion einzelner Turnkonstruktionseinheiten, (2) die Abgrenzung und Kombination einzelner Turnkonstruktionseinheiten in Mehr-Einheiten-Turns, und (3) die Organisation des Sprecherwechsels. Diese weiden in den folgenden Kapiteln genauer betrachtet.
2.1. Einheitenkonstruktion: inteme Kohäsion und Abgrenzung von Turnkonstruktionseinheiten Mit 'stretches of talk* und speziell der Frage, wie einerseits 'stretches of talk* als zusammenhängend konstruiert, andererseits durch 'minimal disjunctions' Grenzen zwischen aufeinanderfolgenden 'stretches of talk' oder Neuansätze beim Beginn/Neubeginn eines 'stretch of talk' signalisiert werden, beschäftigen sich Local/Kelly 1986. Ähnlich wie Jefferson 1986 kommen sie zu dem Ergebnis, daß Tonhöhe allein nicht ausreicht, um solche 'stretches' bzw. z.B. den Status von Pausen innerhalb oder zwischen 'stretches of talk' zu beschreiben. Vielmehr sei es nötig, sich die genaue Art der Lautproduktion innerhalb und an den Grenzen solcher Einheiten anzuhören. Local/Kelly unterscheiden, insbesondere in bezug auf Pausen nach Konjunktionen wie well, but, so und Verzögerungssignalen wie uh (entspricht wohl weitgehend den bei uns üblicherweise als äh, eh, öh o.ä. transkribierten Verzögerungssignalen) zwischen zwei Arten von Pausen, "(i) 'holding' silences (to imply that they maintain and project speaker claims to the turn) and (ii) 'trail-off silences (to imply that they are intended to constitute a legitimate place for turn transition to occur)" (Local/Kelly 1986: 195). Einheiten-interne Halte-Pausen werden durch einen gehaltenen Glottalverschluß signalisiert, der erst mit der Produktion des nächsten Lautes nach einer solchen Pause gelöst wird. Zudem werden die Laute der so angeschlossenen Fortsetzung der Einheit oft im Hinblick auf ihren präzisen Artikulationsort assimiliert an den vorherigen Laut vor der Halte-Pause. Mit dem gehaltenen Glottalverschluß wird dann prospektiv Turnholding signalisiert: d.h. eine Fortsetzung dieser Einheit wird noch folgen; mit der Assimilation wird noch einmal retrospektiv eine Fortsetzung der begonnenen Einheit signalisiert. Umgekehrt finden sich bei den beendenden Auslauf-Pausen ('trail-off), mit denen keine Fortsetzung projektiert, sondern umgekehrt eine Grenze bzw. ein Ende der Einheit signalisiert wird, ein hörbares Ausatmen ohne Glottalverschluß, oftmals zentralisierte Vokale und leisere und langsamere Sprechweise in den auslau-
52 fenden Konjunktionen; die Rede nach der Pause beginnt mit artikulatorischen Brüchen ('articulatory breaks'), diese nächsten Laute wurden also nicht projektiert. Mit Bezug auf Tonhöhe heißt es: "Interestingly, the pitch characteristics which precede these two kinds of 'silence' would not on their own serve to uniquely distinguish the kinds of utterance. (...) For 'holding' pieces we find that the pitch associated with the conjunctional may be level or rising (the level may be higher, lower or on the same pitch as the preceding talk). Whatever the pitch configuration, it never reaches the bottom of the speaker's pitchrange. For 'trail-off pieces the pitch associated with the conjunctional may be level or may fall. If the pitch is level, it is always lower than that at the start of the preceding syllable. On occasions (but certainly not on every occasion) the pitch associated with die 'trail-off conjunctional reaches the bottom of the speaker's pitch range. There would thus appear to be distinct kinds of phonetic shapes for 'holding' conjunctionals + pause on one hand, and 'trail-off conjunctionals + pause on the other" (ebd.: 195f). Evidenz dafür, daß Interaktionspartner sich an diesen Signalen orientieren, sehen Local/Kelly in folgenden Strukturen: (1) Bei Sequenzen der Struktur "conjunctional + pause + overlapping talk" ist der Sprecher, der eine Halte-Pause produziert, auch derjenige Sprecher, dem offenbar das Fortsetzungsrecht zusteht; der andere Sprecher, der überlappend eingesetzt hatte, bricht ab: "... if the current speaker produces a 'holding silence', breaking their talk with glottal closure, then despite overlapping talk which may follow, it is that speaker who maintains the turn" (ebd.: 197). (2) Bei Sequenzen der Struktur "conjunctional + pause", bei denen die Pause als 'trail-off pause' produziert wurde, fährt, wenn der Rezipient den Turn nicht übernimmt, der Sprecher fort mit höherem, lauterem und ggf. schnellerem Einsatz der neuen Rede: "What seems to be happening here is that by producing the subsequent talk in this way, the speaker is retrospectively constituting the 'trail-off conjunctional as a non-trail-off one" (ebd.: 200). Diese Verfahren und insbesondere diese Turnhaltetechnik sind nicht auf ihren Gebrauch mit Konjunktionen beschränkt, sondern: "They appear to constitute a locally-available resource for 'breaking" talk but at the same time projecting that more talk is going to be done" (ebd.: 200).1 Die hier verwendeten prosodischen Turnhalte-Signale sind dieselben, die auch bei der Technik des 'Durchhechelns' ('rush through', Schegloff 1982) als Verbindung aufeinanderfolgender Einheiten im Turn verwendet werden (s.u.). Allerdings wird der gehaltene Glottalverschluß als Haltesignal in meinen Materialien wenig systematisch verwendet. Im folgenden werde ich weitgehend angelehnt an die Analysen und Vorgehensweisen bei Locai et al. die Rolle der Prosodie bei der Konstruktion und Organisation von Turnkonstruktionseinheiten in Ein- und Mehr-Einheiten-Tums im Deutschen untersuchen. Dabei werde ich v.a. auch die von mir als prosodische Transkriptions- und Beschreibungskategorien zugrunde gelegten Parameter als methodische Mittel für die Herstellung und Organisation von Tumkonstruktionseinheiten und Turns rekonstruieren. Hierbei geht es zunächst nur um die Beschreibung der relevanten prosodischen Parameter bei der Herstellung und Abgrenzung einzelner Turnkonstruktionseinheiten; erst später wird es um die Rolle prosodischer Parameter Für eine Fortsetzung dieser Analysen siehe auch Local 1992.
53 für die Kombination von Turnkonstruktionseinheiten in Mehr-Einheiten-Tums, die Turnbeendigung und die Organisation des Sprecherwechsels gehen.
2.1.1. Die prosodische Organisation und Konfiguration der Turnkonstruktionseinheit: die Kategorie 'Kontur' Die Prosodie der Konstruktion einzelner Turnkonstruktionseinheiten kann man zunächst am einfachsten analysieren anhand von Turnkonstruktionseinheiten, die mit einem 'Satz' zusammenfallen, einer grammatischen Konstruktion mithin, die wir gemeinhin als grammatisch vollständig bewerten und interpretieren. Hier ist dann zu fragen, wie und weshalb Rezipienten und Analysierende eine gegebene Einheit als Einheit interpretieren, obwohl sie vielleicht durch Pausen, interne Wiederholungen, Wiederaufnahmen o.ä. "gestört" wird. In diesem Sinne geht es also um unsere Kriterien für die Identifizierung und Interpretation der gesprochenen Laute und Wörter als zusammengehörige kohäsive Einheiten. Mit welchen Signalen wird angezeigt, ob eine gegebene Fortsetzung der Rede eine Fortsetzung der alten Einheit oder eine neue Einheit ist? Da - wie ich noch zeigen werde - Einheiten prinzipiell lokal verlängerbar sind, kann das Ende einer vorherigen Einheit mit letztendlicher Sicherheit nur retrospektiv aus dem Beginn einer neuen Einheit inferiert werden.2 Vgl. die folgenden mit Sternchen versehenen Beispiele, von denen die ersten drei wiedergegebenen Sequenzen direkt aneinander anschließen: (1) K l : 409 ((Nach der Besprechung eines Buches.)) 409 I :
410 R:
MACHT i h r a u f : F(\ .
LKHRamt
/
mhm
\/ 411 N :
*hm*hm _
.
maGIster M(\ )
(2) K l : 415 412 I :
DEUTSCH und M(\ /
413 N :
414 I :
poliTIK
mhm
\/ 415 I :
un WAS macha DU
S(/
/)
Ähnlich argumentiert auch Couper-Kuhlen (1983: 77f) im Anschluß an Yule 1980 hinsichtlich der Identifikation der Grenzen von Paratonen.
54 (3) Kl: 416 416 R: *
ICH mach gymMAsium P(\
417 I:
mhm \/
418 N:
un DU
\
)
m/)
(4) Kl: 539f 538 N:
mm NICH SCHLECHT F(/ \ )
539 E: *
WELche tage MACHST du eigntlich wollt ich F(/ \
540 R:
noch wissen außer MITTwochs
*
541 I:
\
ja JETZT hab ich ähm:
\M(/
)
. UMgeSTELLT
\
/
)
In allen vier gesternten Zeilen fällt eine Turnkonstruktionseinheit die auch jeweils die einzige des Turas ist, mit einem Satz zusammen. (1):409 und (2):415 sind kurze Fragen; (3):416 ist eine kurze Antwort auf (2):415; (4):539f ist eine syntaktisch komplexere Frage mit einer erweiterten syntaktischen Struktur. In allen Fällen verläuft offenbar die Produktion der Einheit störungsfrei; lediglich die Lautdehnung bei auf: im Beispiel (1) könnte als kleine Verzögerung angesehen werden. Mit der syntaktischen Einheit fällt auch jeweils eine prosodische Einheit zusammen: In (1), (3) und (4) beginnt die Einheit mit einer akzentuierten Silbe, in (2) bildet die Konjunktion un einen Vorlauf vor dem ersten Akzent In allen Fällen hat die gesamte Einheit vom ersten Akzent an einen einheitlichen globalen Tonhöhenverlauf: Die ganze Einheit wird in (1), (3) und (4) mit insgesamt fallender Tonhöhe realisiert, in (2) steigt die globale Tonhöhe der gesamten Einheit Nach einer solchen Einheit folgt manchmal, aber bei weitem nicht immer, eine kurze Pause. Dieselbe Art der Konstitution einer Turnkonstruktionseinheit findet sich auch in Turnkonstruktionseinheiten in Mehr-Einheiten-Turns. (5), (6) und (7) zeigen zwei solche Einheiten: (5) Kl: 541ff 541 I:
ja JETZT hab ich áhm:
\M(/
. UMgeSTELLT
\
/
)
55 542 I: *
i c h h a t t e d e n n ie M Ô G l i c h k e i t M(\
\
UMzustellen \
)
.
MITTwoch SAMStach und SOHNtach F(/ \ \ )
..
(6) Kl: (Fortsetzung von (5)) 544 I: *
w e i l das W O L L T ich mir nich mehr LBIstn hier F(\ \ )
5 4 5 I:
mm: MEHRmals inner WOche w:âhrend ich hier: M( / \
546 I:
nach OLdnburch muß
\
)
(7) K2: 417f 417 R: *
j a a a l s o für MICH s i n d se e i g n t l i c h \ F(\
418 R :
n o c h recht: leBENdich so \ )
419 R :
a l s o e s is n o c h n i c h SOs w e i t T( ... \
immer
zurück= )
Die Einheit in (5):542 liegt auf ziemlich gleichbleibender mittlerer globaler Tonhöhe; die Einheit in (6):544 hat einen fallenden globalen Tonhöhenverlauf. Die Einheit in (7):417 hat zunächst ein unakzentuiertes Turnübernahmesignal jaa mit fallender Tonhöhe und einen mit einem Tonhöhensprung nach oben und schnellerer Sprechgeschwindigkeit abgesetzten Vorlauf, an den sich eine global fallende Akzentsequenz anschließt. Dieser global fallende Verlauf der Kontur vom ersten Akzent an ist auch auf dem akustischen Ausdruck in Abb. 1 gut zu sehen. Der globale Tonhöhenverlauf scheint für die Kontextualisierung der Einheit als kohäsive Einheit eine herausgehobene Rolle zu spielen; andere prosodische Parameter wie z.B. die globale Lautstärke und die Sprechgeschwindigkeit können als zusätzliche Parameter verwendet werden. Globale Tonhöhenverläufe sind nur ein Parameter der für die gesamte Konfiguration der Turnkonstruktionseinheit relevanten Tonhöhenverlaufsparameter. Neben globalen Tonhöhenverläufen spielen v.a. lokale Tonhöhenverläufe eine Rolle: v.a. die lokalen Akzenttonhöhenbewegungen in der Akzentsequenz, aber auch un akzentuierte Tonhöhenbewegungen vor der
56
z
ja
à£èo
\
f n r* r çiTKÎs&trj&ç. r tv * h DXt* ες F (\
i
κ cL ζ ç \
Abb. 1
Akzentsequenz. Alle diese Tonhöhenverlaufsparameter sind Komponenten der holistischen Einheit, die ich 'Kontur' nenne. Die Kontur als Ganze wird verwendet zur Signalisierung der internen Kohäsion einer prosodischen Einheit zwischen Grenzsignalen (s.u.). Diese prosodische Einheit konfiguriert i.d.R. Turnkonstruktionseinheiten. Wenn - wie ich im nächsten Kapitel zeigen werde - nach internen Störungen die Kontur fortgesetzt wird, dann setzt das eine wiederaufzunehmende holistísche Einheit mit einer erkennbaren und wiederaufnehmbaren "Gestalt" voraus. Genau eine solche Gestalt ist die Kontur. Konturen werden - wie noch zu zeigen ist - in Folgeeinheiten wiederaufgenommen, wiederholt bzw. zitiert, umgedreht oder variiert. Damit werden unterschiedliche Arten kohäsiver Beziehungen zwischen Turnkonstruktionseinheiten und Aktivitäten konstituiert. Und dies ist weitere Evidenz, daß sich Interaktionspartner an den Konturen von Turnkonstruktionseinheiten orientieren. Obwohl Konturen meist mit Turnkonstruktionseinheiten kookkurrieren, sind sie von diesen unabhängige holistische prosodische Einheiten. Gegebenenfalls können sie auch über einen Sprecherwechsel hinweg von zwei Sprechern konstituiert werden: (8) Kl: 957ff 957 R:
BIM: M( /
auftritt hattn wir auch zum beispiel auf:
ίθ: )
57
SOMmer \ )
960 R:
kulTURsommer ja T(\
)
(9) Kl: 412f 411 N:
412 I:
*hm*hm
maGIster M(\ )
DEUTSCH und
M(\
/ poliTIK
413 Ν:
\)
414 I:
mhm
\/
Auch diese Fortsetzung von Konturen durch nächste Sprecher spricht dafür, daß Sprecher und Rezipienten sich an Intonationskonturen orientieren. In der Literatur sind verschiedentlich holistische Konturen diskutiert worden, für das Deutsche z.B. die 'Vortragsintonation', die 'Zickzackmelodie', die 'Hutkontur1 und stilisierte Intonationen wie 'Rufintonationen'. Die 'Vortragsintonation' ist die von von Essen 1964 präskribierte Intonation der öffentlichen Rede, eine kontinuierlich fallende Kontur mit lauter fallenden Akzenten. Die 'Zickzackmelodie' ist eine von von Essen für die öffentliche Rede als unangemessen verurteilte Kontur mit fallendem Globaltonhöhenverlauf, aber steigenden Akzenten. Die 'Hutkontur' (Cohen/t'Hart 1967) oder der 'Spannungsbogen' ('suspension brigde' bei Bolinger 1986: 46ff.) besteht aus zwei Akzenten: einem steigenden am Beginn und einem fallenden am Ende; die dazwischen liegenden Silben bleiben entweder auf hoher Tonhöhe oder fallen unter die Tonhöhe der Tonhöhengipfel ab. In stilisierten 'Rufintonationen' werden meist gleichbleibende Akzente auf unterschiedlichen Tonhöhen verwendet (vgl. Ladd 1980, Bolinger 1986: Kapitel 10). Holistischen Konturen werden auch oft abstrakte Bedeutungen zugeschrieben. Ladd 1980 und Bolinger 1986 sprechen z.B. von einer 'contradiction contour' und einer 'surprise/ redundancy contour'. Gelegentlich wird Tonhöhe auch ikonisch interpretiert: So basiert Bolingers 1986iger Intonationsanalyse weitgehend auf Interpretationen von Tonhöhen im Rahmen der "Metaphorik des Hoch und Tief' ('metaphor of up and down') von Lakoff/ Johnson 1980. Auch dies reflektiert, daß wir zumindest in unseren intuitiven Interpretationen auf holistische Konturen Bezug nehmen. Bevor wir uns jedoch mit der Analyse der Funktion und der interpretativen Relevanz von ganzen Intonationskonturen bei der Turn- und Gesprächsorganisation befassen, müssen
58 zunächst die konstitutiven Komponenten der Kontur genauer analysiert werden. Eine genauere Beschreibung der Kontur erfordert eine möglichst weitgehende Dekomponierung und Parametrisierung der holistischen Einheit in ihre kleinsten interpretativ relevanten prosodischen Parameter. Die konstitutiven Komponenten der Intonationskontur sind: der globale Tonhöhenverlauf, die kohäsive Akzentsequenz mit den dort gewählten lokalen Akzenttonhöhenbewegungen, sowie der Vorlauf der Akzentsequenz. Neben der Intonationskontur sind die weiteren prosodischen Parameter Lautstärke und Sprechgeschwindigkeit von besonderer Relevanz für die Einheiten- und Turnkonstruktion. Im folgenden sollen nun diese einzelnen Komponenten und ihre Parameter genauer im Hinblick auf ihre Aufgaben und Funktionen bei der Turnkonstruktion und Gesprächsorganisation untersucht werden.
2.1.2. Fortsetzung begonnener Einheiten: Signalisierung der internen Kohäsion von Einheiten Nicht immer werden Einheiten so störungsfrei produziert wie in den bisherigen Beispielen. Im folgenden gebe ich zunächst einige Beispiele für Einheiten, die nach internen "Störungen" fortgesetzt werden. Ich werde dabei den Begriff "Störung" als allgemeinen Oberbegriff verwenden, in der Annahme, daß unter dem Gesichtspunkt der Produktion einer Einheit jegliche Verzögerung oder interne Pause, jeglicher Fehler oder jegliche andere Turbulenz auf einer sehr allgemeinen Ebene als "Störung" angesehen werden kann. Damit wird zunächst nichts über die Ursache oder auch über die lokale Verwendung und Interpretation einer solchen spezifischen Störung impliziert. (10) Kl: 489 489 N:
ich
ARbeite hiermäh: inner FANNkuchnstube F(\ \
(11) K2: 390f 390 R: *
391 R:
JEder wollte sch âh sch SCHLACHzeuch spieln M[M(/ \ giTARre spieln und SOLche sachen \ /
(12) Kl: 518 517 I:
WIE lange GEHT das da H(\ / )
518 Ν:
BIS um:àh: F(\
..
HALB zwölf ZWÖLF \ \ )
(13) K2: 382ff 382 R: *
un dann hab ich F(\
. m: allerdings auch noch
383 R:
während der SCHULzeit angefangp
*
. âh:
(0.9)
\
384 R:
in einer BAND ZU spieln / )
(14) KO: 37:7f 37:7 R:
wie HATtese denn nich SCHISS von wegn mit deiner F(\ \
37:8 R:
LDNge röntchen daß de da:
*
. dein RAUchen feststelln
\
/
(15) Kl: 932ff 932 R:
unich ich DENG mir: wenn ich jetz: Wochenende
M(\ 933 R:
HIER wäre daß es LHICHter wäre da irgndwie / \
934 R: ρ ( 2.3
)
konTAKte zu HALtp \ \ )
(0.8)
935 N:
mhm \/
(16) Kl: 962ff 960 R: 961 N: 962 R:
=die ham:
ach mhm \ \/
kultur(?) fete HIER gemacht F(\
)
60 963 R: Γ ((râuspert sich))
im: im zenTRALbereich
\
)
mhm
964 Ν:
\/
(17) K2: 679 679 R:
*
ICH denke* .. *auch NACHrichtensprecher
M(/
\
)
In (10) findet sich nur ein gedehntes Verzögerungssignal äh:. In (11) wird ein Wort abgebrochen, ein Verzögerungssignal produziert, das Wort erneut begonnen und abgebrochen und erst dann beim dritten Versuch produziert; es findet sich aber keine Pause und die gesamte Störungsbearbeitung wird innerhalb des globalen Tonhöhenverlaufs abgewickelt.3 In (12), (13) und (14) finden sich Pausen jeweils in Verbindung mit vorausgegangenen oder folgenden Lautdehnungen und Verzögerungssignalen. In (15) ist eine Pause ohne Verzögerungssignale von beträchtlicher Länge (2.3 Sek.). In (16):962 wird eine Einheit nach Zwischenaktivitäten einer Rezipientin und in 963 nach eigenem Räuspern des Sprechers fortgesetzt In (17) wird ein Glottalverschluß über die Pause hinweg gehalten (notiert als * .. *). Nach den Störungen und Pausen wird jeweils der vor der Pause begonnene und projektierte Satz weitergeführt Aber auch prosodisch wird die begonnene Einheit weitergeführt: Nach der Pause wird mit derselben Tonhöhe wie vor der Pause fortgesetzt und die globale Tonhöhenbewegung wiederaufgenommen und weitergeführt (vgl. für 'continuation1 in der Transkription). Im Falle einer Akzentsilbe gleich nach der Pause konstituiert diese eine in Relation zur vorherigen Globaltonhöhe wahrnehmbare lokale Akzenttonhöhenbewegung. Die Tonhöhe vor der Störung war dabei quasi "hängengeblieben", d.h. entweder beim Verzögerungssignal mit lokal gleichbleibend "in der Schwebe" geendet, oder aber auch im Rahmen des globalen Tonhöhenverlaufs noch leicht global gefallen, aber auf keinen Fall lokal gefallen. Und genau dort, wo die Tonhöhe "hängen" geblieben war, wird sie bei der Fortsetzung wieder aufgenommen und weitergeführt. Diese prosodische Wiederaufnahme ist in der akustischen Analyse des Beispiels (14) in Abb. 2 gut zu sehen: sowohl die Grundfrequenz wie auch die Lautstärke auf dem da: vor der Pause und dem dein nach der Pause sind sehr ähnlich. Etwas anders verhält es sich in den folgenden Fällen: (18) Kl: 885f. 885 R:
also ICH weiß wohl::ö
*
.
F(/?
Zugleich zeigt (11) eine insgesamt auf mittlerer globaler Tonhöhe verlaufende prosodisch kohäsive Einheit ohne Grenzsignale, die mehr als einen einfachen 'Satz' umfaßt und die von der tonetischen Analyse in wenigstens zwei Tongruppen segmentiert wiirde. Aufgrund des einheitlichen Globaltonhöhenverlaufs ohne Bruch oder sonstige Grenze in der melodischen Führung wird sie hier als eine kohäsive Einheit interpretiert
61
2070.0 •»2040.01 2010.0 700.0
1200.0
1700.0
2200.0
2700.0
3200.0
3700.0
4200.0 ms
70Q.Q
12Q0.0
1700.0
2200.0
2700.0
5200.0
5700.0
4200.0 rns
290.0 260.0
230.0 200.0
170.0 140.0
viWaacfenz £Jrsfanve:y.
"uWi^äRinjndas a à a:
dajhtfj&nfetftet*·
Abb.2
886 R:
ausm bereich muSIK daß viele hier WOHp: . ΗΟΗφ auch / \ \ )
(19) K2: 375f 375 R:
376 R:
ich BIN auch: F(\ < all >
zum beispiel
relativ SPÂT damit angefangn mit \
mit SINgen \ )
In (18):886 wird das vor der Pause bereits produzierte Element WOHN wiederaufgenommen und als "Auftakt" der Fortsetzung emeut produziert. Auch in (19):376 wird ein unmittelbar vor der Pause produziertes Element mit gleicher Tonhöhe und Lautstärke wiederholt; der Satz wird bis kurz vor die Störung "zurückgespult" ("recycled") und mit neuem "Auftakt" störungsfrei zu Ende gebracht. Hingegen wird das Element zum beispiel in (19):375 mit einem Tonhöhensprung nach unten, , abgesetzt. Jedoch kehrt hier der Sprecher nicht zur vorherigen Tonhöhe zurück, sondern setzt seinen Satz nach dem Downstep weiter fort. Es findet sich damit ein Grenzsignal innerhalb einer Einheit; aufgrund der aber syntaktisch unzweifelhaft zusammengehöri-
62 gen Struktur wird dieser nicht als Beginn einer neuen Einheit gehört.4 Solche Fälle sind jedoch selten. Auf etwas andere Weise sind in den nächsten Beispielen (20) und (21) 'unmarkierte Selbstkorrekturen' eingebettet: (20) Kl: 591 591 R: *
592 R:
MIR kommt das: immer so vor . daß es NICHTS T(\ \
.
nich VIEL zu sagn hat= \ )
(21) Kl: 842 842 I:
âhm un dann warn da mal ΟλΜΖι ganze EXtratourn mit bei= F(\ \ )
(22) Kl: 483 483 I : *
DANN is es aber auch nur .. aso STRESSzeit ne F(/ \ /)
In (20) wird ein Element vor der Pause, NICHTS, nach der Pause ersetzt durch ein anderes Element, nich VIEL. Dadurch daß diese Selbstkorrektur aber mit der Tonhöhenfortsetzung quasi in die Einheit eingebunden wird, wild sie unauffällig vorgenommen. Man könnte von einer unauffälligen, "unmarkierten Selbstkorrektur" sprechen. In (21) und (22) wird jedoch nicht mit gleicher Tonhöhe fortgesetzt, sondern ein Downstep bei Beginn der Satzfortsetzung nach der Pause produziert. In (21) wird das ersetzende Element, ganze, mit abgesetzt und damit auf andere Weise als in (20) die Selbstkorrektur unauffällig gestaltet. In (22) ist nach einer "Störung" das Wiederaufnahmesignal aso (= 'also') von einem Downstep erfaßt. Auf diese Weise wird das Wiederaufnahmesignal aso vom fortgesetzten Satz abgesetzt und damit quasi als "Editionssignal" oder "Regieanweisung" zwischen Störung und Fortsetzung piaziert.5 In beiden Fällen kehrt unmittelbar nach diesen Elementen der Sprecher zu der Tonhöhe zurück, die vor der Störung verwendet wurde. Auch bei solchen einheiten-internen Störungen wird jeweils nach der Störungsbehandlung der Satz unmittelbar weitergeführt. Die Wiederaufnahme des Satzes nach der einheiteninternen Störungsbehandlung und ggf. einem Editionssignal wird auch prosodisch mit der In der norddeutschen Umgangssprache ist die syntaktische Konstruktion bin ... angefangn völlig akzeptabel und normal; es liegt hier also ein Satz vor, kein Anakoluth. Vgl. hierzu auch Gülich/Kotschi 1987, die Signale wie also als Reformuliemngs-, Korrektur- uü. Editionssignalé beschreiben.
63 Wiederaufnahme und Fortsetzung der Tonhöhenbewegung auf gleicher Tonhöhe wie vor der Störungsbehandlung signalisiert Zusammenfassend läßt sich sagen, daß die interne Kohäsion einer Einheit signalisiert wird entweder (1) durch die störungsfreie Produktion einer kookkurrierenden syntaktisch vollständigen Struktur mit einem prosodisch einheitlichen globalen Tonhöhenverlauf, oder (2) durch eine ganz bestimmte Kontextualisiening einheiten-interner Produktionsstörungen und Pausen, nämlich mithilfe der folgenden prospektiv und retrospektiv wirkenden Signale: (a) Prospektive Signale/Kontextualisierungshinweise: (aa) bei Störungen ohne Pause: [+ Unvollständigkeit der begonnenen syntaktischen Struktur vor der Störung]; [+ verzögernde Lautdehnungen bzw. Verzögerungssignale] (ab) bei Störungen mit Pause: [+ Unvollständigkeit der begonnenen syntaktischen Struktur vor der Pause]; [+ lokal gleichbleibende, "schwebende", "hängenbleibende" Tonhöhe, zumindest keine lokal fallende Intonation vor der Pause]; [± verzögernde Lautdehnungen vor oder nach der Pause] [± Verzögerungssignale wie äh, öhm vor oder nach der Pause] [± über die Pause gehaltener Glottalverschluß] plus (b) Retrospektive Signale/Kontextualisierungshinweise: [+ Fortsetzung und Beendigung der vor der Störung/Pause projektierten syntaktischen Struktur]; [+ nach der Störung Wiederaufnahme der vorherigen Tonhöhe und ggf. Lautstärke und Fortsetzung des globalen Tonhöhenverlaufs (= 'kohäsiver Anschluß')]; [± Wiederaufnahme des Elements unmittelbar vor der Pause als 'Recyclingsignal' mit selber Tonhöhe wie zuvor] bzw. [± Korrektur oder Editionssignal mit vor der Fortsetzung der Einheit]. Bei der Kontextualisiening einheiten-interner Produktionsstöiungen und Pausen werden somit prospektive und retrospektive Signale eingesetzt. Die prospektiven Signale leisten eine Kontextualisiening einer folgenden Produktionsstörung oder einer folgenden Pause als einheiteninterne und projektieren zugleich die Fortsetzung der noch unvollendeten Einheit. Insbesondere die lokal gleichbleibende Tonhöhenbewegung, das "Hängenbleiben der Kontur", scheint dabei in Kookkurrenz mit den anderen Signalen ein noch ausstehendes Konturenende mit anderer als gleichbleibender, nämlich lokal fallender oder lokal steigender Tonhöhenbewegung (s.u.), zu projektieren. Komplementär kontextualisieren dann die retrospektiven Signale die nach der Störung bzw. Pause fortgesetzte Rede als die projektierte Fortsetzung der unterbro-
64 chenen Einheit (und eben nicht als z.B. eine neue Einheit). Diese retrospektive Signalisierung ist insofern besonders interessant, als sie dem Rezipienten eine Interpretation des Anschlusses und damit zugleich eine prospektive Einordnung der nun beginnenden Rede als kohäsiv anschließend ermöglicht, bevor der Inhalt der Rede überhaupt bekannt ist Alle diese Signale fungieren damit in bezug auf die in Produktion befindliche Einheit als Kontextualisierungen einheiten-interner Störungen, im Gegensatz zu z.B. dem Abbruch und dem Neubeginn einer neuen Einheit. In bezug auf den Turn fungieren sie entsprechend als lokale Einheiten- und damit auch Turnhaltesignale. Zugleich liefern solche lokalen Einheitenhalte- und Einheitenfortsetzungssignale Evidenz für die Relevanz solcher Phänomene wie dem fortgesetzten, einheitlichen globalen Tonhöhenverlauf einer Einheit. Dieser globale Tonhöhenverlauf wird einerseits durch die Tonhöhenverlaufsrichtung der unakzentuierten Silben, andererseits durch die Tonhöhe aufeinanderfolgender Akzentgipfel konstituiert. Diese Globalverläufe konfigurieren eine Turnkonstruktionseinheit als eine einheitliche, holistische, kohäsive prosodische Gestalt, zu der man eben auch zurückkehren und sie fortsetzen kann. Evidenz dafür, daß die genannten lokalen Kontextualisierungshinweise von den Rezipienten der entsprechenden Äußerungen auch tatsächlich als Signale für einheiten-interne Störungen bzw. als lokale Turnhaltesignale interpretiert werden, ergibt sich aus folgenden Beobachtungen: (1) An so kontextualisierten Stellen innerhalb einer Einheit und eines Turns finden in der Regel keine "geordneten"/unauffälligen/normalen Turnübemahmen durch den Rezipienten statt. Der Rezipient wartet vielmehr die Fortsetzung ab und ergreift u.U. erst später das Wort. Das ist der Normalfall, der auch in den meisten der angeführten Beispiele vorliegt. Mit Beispiel (15), das ich hier noch einmal einfüge, liegt ein selten deutlicher Fall vor, in dem die Rezipientin Ν im Verlauf der relativ langen einheiten-internen Pause von 2.3 Sekunden sogar ein Rezeptionssignal (vgl. Schegloffs und Goodwins 'continuer') produziert und damit explizit das Nicht-Übemehmen des Turns signalisiert. (15) K l : 932ff 932 R:
unich ich DENG mir: wenn ich jetz: Wochenende M(\
933 R:
HIER wäre daß es LEICHter wäre da irgndwie
/ 934 R:
ι- (
\ 2.3
)
konTAKte zu HALtp
935 N:
\
\
(0.8)
)
mhin L
\/
(2) Falls doch Turnübernahmen durch Rezipienten an so kontextualisierten Stellen vorkommen, dann sind sie entweder als Formulierungshilfen, Nebenbemerkungen o.ä., oder aber als Unterbrechungen kontextualisiert und interpretierbar. Nur je ein Beispiel für eine Formulierungshilfe und eine Unterbrechung:
65 (23) K l : 957ff 957 R:
BIWi
M( /
auftritt hattp wir auch zum beispiel auf:
958 R: Γ àhm: auf der fete vom: . kulTUR \ 959 Ν:
960 R:
(0.9) SOMmer \ )
kulTURsommer ja T(\ )
Hier im Beispiel (23) führt Ν in Zeile 959 nach 0.9 Sekunden einheiten-interner Pause nach anderen bereits voraufgegangenen Formulierungsproblemen des Sprechers R dessen syntaktischen Satz und dessen Kontur unter Wiederaufnahme seiner Tonhöhe kohäsiv weiter. R interpretiert diese Intervention als Formulierungshilfe und wiederholt und bestätigt in Z. 960 das gesuchte Wort auf tiefer globaler Tonhöhe und mit schnellem Tempo. (24) K l : 493ff 493 N: *
ich HAB auch M(\
. zw aso inöh LETZ \
beDIHnung oder KÖche
494 R:
Η(/
KÜche M àh NICH Ausschließlich F(/ \ ) ccresc
881 N : *
dJAA M(\)
die ich so: KENnen:
M(\ )
882 N :
stuDENtp
)
creso
(28) Kl:
M(\
. KENnlerne hier M(\ )
)
(29) K l : 574 N: * 575 I:
o d e r W o h e r kennt i
M(\ )
N: Ee (\ /)
oder NUR SO M(\
(30) K l : 510 N:
i c h h a b E i n e n monat h a b ich âhm: < all >F(/ )-
NEE (\)
. .
68
511 Ν: *
oder die LETZten zwei monate hab ich ziemlich
F(\
(31) K2: 591 R:
592 R:
593 I:
594 R: *
âh:
(0.4)
wo: immer mit video AÜFgezeichnet
F(\
mhm \/ also JEder war geHALtp: SELber eine zu MXchen M(\ \ \ î\ ) jaa (0.9) \
595 I:
(32) Kl: 993 N:
aber wieso f X h r s du denn dann wenn:
H(\ 1* 0 0 2 N:
1003 N:
KANNS du nich mal η Wochenende HIERbleibm H,F(\ /
(0.8)
ich mein wenn du
JAA=ich hab . ähm: . FEste beZIEhungn da ne= F(\ \ /) H(\) < all > fxdim dim
[+ Projektion einer neubeginnend-fortführenden Folgeeinheit bzw. eines Neuansatzes] ->
[+ Projektion einer sich unterordnenden Fortführung] ->
[+ gleichrangige Fortführung] ->
[+ 'Durchhecheln' zwecks Sicherung des Rederechts] Daß der Vorlauf der Kontur als interaktiv relevante Ressource eingesetzt wird und relevant ist, zeigt sich an folgenden Beobachtungen: (1) Die hier analysierten Signale , , kommen - wie wir gesehen haben vornehmlich in Kookkurrenz mit dem Beginn einer neuen Satzkonstruktion vor. Umgekehrt kommt zumindest überhaupt nicht mitten in einer kohärenten Einheit oder mitten in einem weitergeführten Satz vor. Die Wahl des Tonhöhenanschlusses neuer Einheiten ist oft gleichlaufend mit der Art des im Text der Einheit z.B. mithilfe von Konjunktionen signalisierten kohäsiven semantischen Anschlusses an die Vorgängereinheit: Textuelle und prosodische Signale weiden als gleichlaufende kumulative Signale verwendet. (2) Häufig kommen Verzögerungen oder Pausen im Vorlauf einer neuen Einheit vor, etwa nach dem Anschluß und Beginn einer neuen Einheit mit aber: oder und dann:. (Vgl. hierzu noch einmal die Beispiele (18)-(21).) In einigen Fällen, wie in (25), kommt eine solche Pause genau am Ende eines Vorlaufs vor. In vielen Fällen sind alle Vorlaufsilben vor der ersten akzentuierten Einheit der Akzentsequenz -Silben. (25) K2: 390ff 390 R:
JEder wollte sch ä h sch SCHLACHzeuch M[M(/ \
391 R:
g i T A R r e spieln u n d SOLche sachen \ / )
spieln
106
393 Ν: 394 I:
aber SINOp wollte K(h)EIner=un dann F(/ \ )] < all > ((lacht)) ((lacht))
395 R:
((räuspert sich))
396 R:
MUßte sich da ma einer zu DURCHringn= F[F(\ \ )
392 R:
(3) Der Vorlauf scheint der Raum zu sein, in dem auch noch Rezipienten mit eigenen Aktivitäten wie verspäteten Turnübernahmen oder Rezipientenreaktionen intervenieren können. Nicht selten kommen Fälle vor, in denen ein adressierter nächster Sprecher sein Rederecht erst nach einer Pause und nach Beginn einer neuen Einheit durch den bisherigen Sprecher verspätet übernimmt Für eine solche verspätete Turnübemahme scheint der Vorlauf einer neuen Einheit des bisherigen Sprechers noch eine geeignete Stelle zu sein. Siehe das folgende Beispiel: (26) Kl: 1001 N:
aber wieso FÄHRS du denn dann wenn: H(\ ) -
1002 N:
KANNS du nich mal η Wochenende HIERbleibm H,F(\ / )
1003 N:
ich mein wenn du
JAA=ich hab H(\) < all >
FEste beZIEhungn da ne= F(\ \ /)
In (26) ist in 1001-1002 R direkt adressiert worden, R übernimmt jedoch den Turn erst verspätet nach einer Pause (1002) und nachdem Ν zu einer neuen Einheit eingesetzt hat. Mitten im Vorlauf dieser neuen Einheit von N, und zwar genau nachdem R erkennen konnte, daß Ν nun vermutlich eine Art Reformulierung ihrer Frage projektiert, übernimmt R doch noch den Turn. Diese mit einem bereits begonnenen Tum überlappende Turnübernahme ist mit erhöhter Lautstärke und hoher Tonhöhe bei JAA als Turnbeanspruchung signalisiert (s.u.) und Ν bricht ihre Einheit wenig später ab. Ebenso beginnen auch Hintergrundkommentare o.ä. oft parallel mit dem Vorlauf einer neuen Einheit des Sprechers: (27) K2: 367 Ν:
ICH kann NICH singn F(\ \ )
107 368 R:
also ich denke m i r daß die M E I s t p
F(\ ICH a u n i c h (\ )
369 I:
(28) K2: 584 R:
585 R:
586 I: 587 R:
r
aber::
das is a u c h
.
ja geWOHNheit halt \ M(\ )
m a n K A N N sich D R A N g e W Ö H p ne (1.0) F(\ / \ /)
jaa mhm \ \/ g e N A U s o sich SELber im FERMsehn zu sehn=
M(\
G L A U B ich wohl M(\ )
In (27) pflichtet I in 369 der Feststellung von Ν in 367 bei, aber in einer verspäteten Turnübernahme, nachdem R sein Gegenargument bereits begonnen hat In diesem Fall ist diese Einheit jedoch mit
als nicht-kompetitiver, nicht das Rederecht beanspruchender Hintergrundkommentar kenntlich gemacht (vgl. Kap. 2.3.2.4.). In (28) bekundet I in 588 ihre Zustimmung zu R's vorherigen Behauptungen, nachdem R nach einer Pause nun gerade den Vorlauf einer neuen Einheit produziert hat. Da hier der Vorlauf in 587 sehr kurz ist, gerät I mit ihrem Kommentar bereits mitten in R's Turn hinein. In allen drei Fällen scheint der Vorlauf der neuen Einheit noch als ein Raum ausgenutzt zu werden, während dem bzw. spätestens an dessen unmittelbarem Ende man noch verspätet reagieren und intervenieren kann. Gelegentlich stehen auch verspätete Rezeptionssignale genau am Ende des Vorlaufs der neuen Einheit und damit simultan mit dem ersten Akzent der Akzentsequenz: (29) Kl: 808 R: 809 R: 810 N : * 811 R: 8 1 2 N:
ich
H A B hier: F (\
. n o c h ne W O H n u n g \ )
(0.5)
r a l s o ich W O H n e in Wilhelmshaven ERSTwohnsitz F (\ / ) mhm L v und
H A B hier F(\
(0.8) η ZWEXTwohnsitz \ ) mhm \/
108 (30) Kl: 1033 R:
1034
I:
es IS halt auch für . ne gewisse ZEIT so seh ich das T(\ \ ) jaa \
1035 R:
r wir hm jetzt erst geHKIratet: im: okTOber letztes jähr < all > S(/ / ) 1036 I: STIMMT M(\ )
(31) K2: 615 N:
=das hört sich ÜHMÖOlich an T( / \ )
616 N:
also wenn du das HINterher HÖirs=
M(\ \ /)
jaa
617
I:
\
In (29)-(31) werden jeweils Rezeptionssignale bzw. in (30) ein Zustimmungssignal genau parallel mit dem ersten Akzent der Akzentsequenz und damit genau nach dem Vorlauf dieser Einheiten produziert. Damit ist gezeigt, daß (a) Sprecher sich an einer Kategorie wie dem Vorlauf für ihre Turnhaltetechnik orientieren, und daß (b) auch Interaktionspartner offenbar in der Lage sind, sich für ihre verspäteten Reaktionen und Interventionen am Vorlauf neuer Einheiten zu orientieren. Der Vorlauf scheint noch zum Turnübergabe-relevanten Raum (Sacks/Schegloff/ Jefferson 1974) zu gehören. Die Tatsache, daß gelegentlich Rezeptionssignale genau parallel mit ersten Akzent einer Einheit produziert werden, läßt weiterhin vermuten, daß - vermutlich aufgrund rhythmischer Prinzipien - das Ende des Vorlaufs und damit der erste Akzent der Einheit für die Rezipienten quasi lokal "vorhersehbar" ist. Dies bedarf der weiteren Untersuchung.
109 2.2.2. Die Akzentsequenz Die Akzentsequenz oder kohäsive Akzentfolge wird konstituiert durch wenigstens einen oder die Abfolge mehrerer Akzente mit den hier jeweils gewählten lokalen Tonhöhenbewegungen auf einer globalen Tonhöhenverlaufslinie. Bei Anwesenheit einer Akzentsequenz oder auch eines einzelnen Akzents ist der Vorlauf ein möglicher zusätzlicher Bestandteil der Kontur. Bei der Analyse der Akzentsequenz unterscheide ich zwischen lokalen und globalen Tonhöhenverläufen: den lokalen Tonhöhenverläufen auf akzentuierten und nachfolgenden unakzentuierten Silben, und dem globalen Tonhöhenverlauf der gesamten Akzentsequenz. Obwohl letztlich bei genauen Beschreibungen diese beiden Kategorientypen nicht immer sauber voneinander getrennt werden können, ist ihre analytische Trennung dennoch nötig, da diese Parameter unabhängig voneinander als interaktiv relevante Signalisierungsmittel verwendet werden. Genauer zu beschreiben und hinsichtlich ihrer interpretativen Relevanz zu untersuchen sind im folgenden (a) die Plazierung prominenter akzentuierter Silben in Turnkonstruktionseinheiten, d.h. die Prinzipien der Wahl und Interpretation akzentuierter Silben, sowie (b) die generellen Eigenschaften der dort konstituierten und beginnenden lokalen Akzenttonhöhenbewegungen bzw. Akzenttypen, und (c) die Globaltonhöhenverläufe der Akzentsequenz.
2.2.2.1. Prominente akzentuierte Silben der Turnkonstruktionseinheit 'Akzentuierung' oder kurz 'Akzent' steht hier für Hervorhebung, Betonung oder Prominenz einer Silbe gegenüber den umliegenden unakzentuierten Silben. Dabei bleibt zunächst unspezifiziert, durch welche prosodischen Parameter diese Akzentuierung konstituiert wird: durch lokale Tonhöhenbewegungen und/oder erhöhte Lautstärke und/oder größere Länge der akzentuierten Silbe gegenüber den umliegenden unakzentuierten/unbetonten Silben. Die Einheit aus Akzentsilbe und nachfolgenden unakzentuierten Silben bis zur nächsten Akzentsilbe, diese aber nicht einschließend, nenne ich 'Akzenteinheit'. Wie die meisten meiner Beschreibungskategorien ist auch die Kategorie 'Akzent' immer noch eine holistische inteipretative Kategorie. Meines Erachtens ist eine Parametrisierung gerade dieser Kategorie in die konstitutiven Parameter Tonhöhenverlauf und Lautstärke in vielen Fällen auditiv sehr schwer und nur unzuverlässig möglich, da beide Parameter aneinander gekoppelt vorkommen. Viele Akzente werden durch eine Tonhöhenbewegung und erhöhte Lautstärke, oft auch zusätzliche Länge, bei einer akzentuierbaren Silbe konstituiert. In den Fällen, in denen Akzente durch eine unauffällige Kombination der Parameter Tonhöhenverlauf, Lautheit und Länge der Akzentsilbe Zustandekommen und keine markierte, herausgehobene Verwendung eines dieser Parameter den Akzent als auffällig kennzeichnet, halte ich eine Analyse mithilfe der noch holistischen Kategorie Akzent für ausreichend. (Zu den Problemen der Beziehung zwischen Tonhöhe/Grundfrequenz, Lautheit/Intensität und Länge/ Dauer bei der Konstitution und Wahrnehmung betonter Silben vgl. Lehiste 1970: insbes. Kapitel 4.) Wenn jedoch eine Parametrisierung auditiv relativ verläßlich möglich erscheint, dann wird auch in meiner Beschreibung durchaus soweit wie möglich eine Parametrisierung vorge-
110 nommen: So wird unterschieden zwischen Akzenttypen mit unterschiedlichen Tonhöhenverläufen, zwischen unterschiedlichen Akzentstärken aufgrund der unterschiedlichen Lautheit der Akzentsilbe und zwischen Akzenten mit unterschiedlichen Bandbreiten der Tonhöhenbewegung. Zusätzliche Länge von Vokalen wird ebenfalls in der Textzeile gekennzeichnet. In diesem Sinne nähert sich meine Transkription und Beschreibung einer parametrischen Transkription an wie sie von Local/Kelly/Wells 1986 und Kelly/Local 1989 gefordert wird. Insofern aber alle diese Transkriptionen noch immer von einer vorausgesetzten 'normalen' und unmarkierten Realisierung ausgehen, sind auch diese Beschreibungen noch interpretativ und gelangen nicht bis zu den einzelnen akustischen oder artikulatorischen Konstituenten dieser Kategorien. In der Regel haben Turnkonstruktionseinheiten wenigstens eine, meistens jedoch zwei oder drei akzentuierte Silben und darauf folgend jeweils mehrere unakzentuierte Silben. Dazu einige Beispiele (alle aus dem Anfang von Kl): (32)
142 R:
a c h SO JA M(\) M(\)
< f>
d i e e r s t n drei vier SITzungn w a r ich d a . M M(\ \
594 R:
M I T T l e r w e i l e η b i ß c h e n BESser w i e das so a n n e r uni F(\ \
595 R:
L Ä U F T u n d so
/
)
(0.9)
m i t STUdium u n d so=
M (/
)
(47) K2: 419 R:
also es is n o c h n i c h SO: weit T( \
zurück=
113
420 R: f =(?nur?) ich DENK immer in zwanzich JAHRN is noch M(\ \ 421 Ν: mhm \/
422 R:
interesSAHter \ )
((lacht))
In ( 4 6 ) w a r ich mir unsicher, o b ich d i e Silbe BES des Wortes BESser
als akzentuiert transkri-
bieren sollte oder nicht. V o n der Lautheit her scheint keine L ö s u n g eindeutig gerechtfertigt. D e n n o c h paßt sich diese Silbe als rhythmische Prominenz gut in den R h y t h m u s der Einheit ein. Darüberhinaus läge e i n e Rekonstruktion der Einheit ohne d e n rhythmischen A k z e n t auf BESser
d e m Höreindruck ferner als eine mit rhythmischem Akzent. A u s diesen Gründen er-
hielt BESser
e i n e Akzentnotation. 1
D a s s e l b e Problem stellte sich mit B e z u g auf den Akzent bei JAHRN
in ( 4 7 ) : 4 2 0 . D i e
akustische A n a l y s e dieser Einheit (Abb. 3) zeigt, daß die F Q d e s S e g m e n t s [ja:n] g e g e n ü b e r
^050.0, 2020*0 1990.0 500.0
800.0
1100.0
1400.0
1700.0
2000.0
2 3 0 0 . 0 ms
500.0
800.0
1100.0
1400.0
1700.0
2000.0
2 5 0 0 . 0 mis
180.0 160.0
140.0 120.0 100.0
flCüfaJtkriaiMisifi Μ( \ J
b¿Y\hzc J
j a : η is ηοκ \
riYhosan-έ-ε \ )
Abb. 3
Ladd 1980 argumentiert für die generelle Gebundenheit der Wahrnehmung von Prominenz oder Akzentuiertheit an rhythmische Kriterien - "Stress as a Rhythmic Phenomenon" (ebd.: 25ff.). Siehe auch ebd. das Kapitel II: "Evidence for the Rhythmic Nature of Prominence". Besonders deutlich wird dies bei gleichbleibenden Akzenten: "Perceptually, stress is based not on the 'level' assigned to a particular segment, but on the position of the segment in a hierarchical structure. We perceive a particular stress level because we perceive the structure" (ebd.: 25). Ladd geht von einer zugmndeliegenden hierarchischen Struktur aus. Danach scheint der Rhythmus die Struktur zu sein, in der Akzente wahrgenommen werden. Später heißt es dann bei Ladd weiter "Rhythmic relations are inferred on the basis of the whole structure, and it is futile to look for acoustic correlates of the 'stress level' on a particular syllable" (ebd.: 166). - Zur neueren metrischen Phonologie siehe Liberman/Prince 1977 als mittlerweile klassischem Beitrag, Goldsmith 1990 zum Überblick über den Forschungsstand.
114 den direkt umliegenden Silben nicht "herausgehoben" ist und auch keine ausgeprägte FQ-Bewegung hat. Gegenüber [tsvantsiç] und [na] liegt jedoch [ja:n] genau in der Mitte zwischen den beiden anderen Akzenten und erlaubt damit einen rhythmisch unmarkierten Akzent. Auch hier liegt eine Rekonstruktion der Einheit ohne den Akzent auf [ja:n] dem Höreindruck ferner als eine Rekonstruktion mit diesem Akzent. Hier zeigt sich dann auch, daß für die Wahrnehmung der Intonationskontur z.T. Tonhöhenverlauf und Rhythmus relevant sind. In diesem Sinne wurden bereits in Kapitel 2.1.5. rhythmisch unintegrierte sprachliche Syntagmen als Kriterium genommen, so "zerrissene" Teile nicht als eine einheitliche prosodische Einheit zu beschreiben, obwohl die Teile ggf. sogar zu grammatisch vollständigen Sätzen "zusammengestückelt" wurden. Umgekehrt hat auch das Vorhandensein lokal erhöhter Lautstärke und/oder FQ-Bewegung nicht unbedingt die Wahrnehmung und Interpretation eines Akzents zur Folge. Dies zeigt die akustische Analyse in Abb. 4. In Abb. 4 ist zu sehen, daß die von der FQ-Bewegung her "herausgehobenste" Silbe [ge:t], die auch mit größerer Lautstärke und Dauer produziert wird als andere Segmente derselben Einheit, auditiv nicht als akzentuierte Silbe der Einheit wahrgenommen und interpretiert wird; mit einem Akzent in dieser Silbe würde auch die Äußerung eine ganz andere Bedeutungsinterpretation erzeugen (s.u.).
2060.0 MÜ2040.0I 2020.0
500.0
800.0
M(\ )
finanziere.)
121 (54)
(Kontext: Ν arbeitet abends in einem Restaurant.) 517 I:
(55)
WIE lange OEHT das da H(\ / )
.
(Kontext: Ν hat nach I's Arbeitszeiten in ihrem Bistro-Job gefragt.) 528 I:
ja ich FANG immer ziemlich spät An: F(\ \ /)
In (52) liegt der primäre Akzent auf dem Prädikativ, in (53) auf dem infiniten, in (54) auf dem finiten Verbteil und schließlich in (55) auf dem Verbzusatz der Einheit In diesen Fällen sind keine rhematisch stärkeren Elemente, wie z.B. Objekte, vorhanden. In allen Fällen werden folglich weite Foki interpretiert. Wie aus den Kontextangaben ersichtlich, sind alle diese Einheiten neufokussierend oder fokusweiterfiihrend, z.T. initiieren sie ganz neue Themen.8 Demgegenüber werden die Akzente in den folgenden Einheiten als solche mit engem Fokus gehört: (56)
(Kontext: Ν hat erzählt, sie studiere Germanistik.) 520 N:
(57)
(Kontext: Ν hat erzählt, daß sie bis spät nachts in ihrem Restaurant jobben muß. Danach hat I erwähnt, daß auch sie in einem Bistro arbeitet.) 527 N:
(58)
und WIE lange geht das DA: F(\ /) < all >
(Kontext: I sagte, daß sie ihr Studium hier beenden wolle.) 430 I:
(59)
WAS machs DO: H(\ /)
un mal SEHN was DAMN kommt F(\ \ )
.
(Kontext: R argumentierte, Ν könne doch zur Uni Hannover wechseln.) 464 I:
ja aber DAS: âh: wâr für mich alles viel zu UMständlich F(\ \ )
In (56) wird ein Anredepronomen primär akzentuiert, in (57) eine pronominale Ortsbestimmung, in (58) ein Zeitadverb und schließlich in (59) ein anaphorisches Pronomen. Alle diese Elemente sind nach der rhematischen Hierarchie rhematisch schwache Elemente, die neben unakzentuierten rhematisch stärkeren Elementen stehen. In allen Fällen resultiert hier folglich der Regel entsprechend eine enge Fokusinterpretation. Wie die Kontextangaben nahelegen,
Uhmann verwendet zur Ermittlung der Fokusweite von Aussagesätzen den W-Frage- und/oder den Korrekturtest, den sie zugleich auch zur Datenkonstruktion einsetzt. Mir scheint für meine Daten der Rückgriff auf den natürlichen Gesprächskontext sinnvoller, auch wenn sich hier mehr Unsicherheiten ergeben. Echte Gespräche lassen sich eben nicht immer so sicher analysieren wie für die Analyse konstruierte Gesprächssequenzen.
122 etablieren diese Einheiten einen Adressatenwechsel oder sie etablieren eine Neufokussierung im nahegelegten bzw. hergestellten Kontrast zu vorherigen Foki. In allen Fällen hätte die primäre Akzentuierung eines rhematisch stärkeren Elements derselben Einheit wie z.B. in den folgenden zu Vergleichszwecken abgewandelten Beispielen zu weiteren Fokusinterpretationen geführt, die in den o.g. Kontexten keine engen Foki erzeugt und damit z.T. keine kohäsiven Anschlüsse produziert hätten: (56')
464 Is
ja aber das: âh: WÁR für mich alles viel zu U M s t à n d l i c h F( \ \ )
(57*)
520 N:
W A S MACHS du: H(\ / )
(58')
527 N:
u n d W I E lange GEHT das da: F(\ / ) < all >
(59')
430 I:
u n mal SEHN was dann KOMMT F(\ \ )
.
Nach dieser Analyse bewirkt also bei NLO das Zusammenspiel der grammatischen Prinzipien Akzentzuweisung zu rhematisch klassifizierten Satzgliedern die Fokusprojektion bzw. die semantische Interpretation der Fokusdomäne(n) der Einheit Demgegenüber erklärt Jacobs 1988 den Skopus des Fokus allein auf der Grundlage syntaktischer Strukturen und Merkmale, die im Hinblick auf die Erzeugung der semantìschen Fokus-Hintergrund-Gliederang von Sätzen zugewiesen werden. Der Skopus eines Fokus ergibt sich demnach allein aus der Zuweisung des Fokus und Akzents zu mehreren bzw. einem Element in der syntaktischen Konstituentenstruktur des Satzes und darauf operierenden Fokusregeln. Zusätzliche Regeln zur Fokusprojektion sind dabei überflüssig. Für die Sätze (1) weil ich kein BAfög krich (2) ich m a c h gymNAsium (3) w a s machs DU:
sähe die Konstituentenstruktur mit der Zuweisung der Fokusstruktur nach der Jacobschen Darstellung und der Anwendung seiner Akzentregeln folgendermaßen aus:9
Ich orientiere mich an der Darstellung und den Kategorien von Jacobs 1988. Zum Hintergrund dieser Darstellung der Satzstrakturen des Deutschen allgemein siehe z.B. GrewendorfHamm/Stemefeld 1987, Grewendorf 1988, von Stechow/Steroefeld 1988.
123 (i)
weil
ich
kein
BAfög k r i c h
In diesem Satz liegt kein zugewiesener spezieller Fokus vor. Der Satz soll nach einem Vorgängerkontext, in dem die Sprecherin erzählt hat, daß sie zu Hause wohnt, so akzentuiert werden, daß ein weiter Fokus mit dem ganzen Verb-Letzt-Satz in seinem Skopus erzeugt wird und mögliche Alternativen mithin Sätze mit ganz anderem Inhalt wären. In unserem Beispiel werden die NP kein BAfög und das Verb krich integriert. In diesem Fall wird nach Jacobs' Regeln 4 und 5 (ebd.: 120 und 122) jede nicht mit [-na] versehene Konstituente, außer dem integrierten Verb, mit "+" als 'betont' ausgezeichnet, [-na] bedeutet hier "unter Neutralakzentbedingungen nicht hervorhebbar" (ebd.: 120); die Elemente, auf die das zutrifft, weiden in einer Liste zusammengestellt und entsprechen im wesentlichen Pheby-Uhmanns rhematisch schwachen Elementen.10 Das Element, das von der größten Zahl mit "+" markierter Konstituentenknoten dominiert wird, enthält den Akzent, also BAfög. (2)
VZ-S
mach
Nach der Frage un WAS machs du liegt der zugewiesene Fokus in (2) auf dem Element gymNAsium. Mögliche Alternativen wären hier realschule, grund- und hauptschule o.ä. Nach Regel 3 (ebd.: 118) erhält hier dann nur die mit [+F] fokusmarkierte Konstituente NP und der diese Konstituente dominierende Knoten VP das Merkmal "+" und es resultiert ein enger Skopus des Fokus. 10
Zu den [-na]-Elementen gehören nach Jacobs 1988, Klein 1990 und Rosengren 1990"a) Personalpronomina (er, sie, es, ich, du etc.); b) Reflexiv- und Reziprokpronomina (sich, einander etc.); c) Pro-Adverbien (da, dann etc.); d) die indefiniten Pronomina jemand, niemand und nichts; e) der definite und der indefinite Artikel; f) die Komplementierer daß und ob; g) die Hilfsverben sein und haben; h) kasuswertige Adpositionen (wie auf in airf Gerda warten); i) leere Wörter' jeder Art (e, t, PRO, pro etc.)" (zitiert nach Klein 1990: 58f.). Während die unter a)-h) genannten Elemente jedoch fokussiert und dann akzentuiert werden können, ist das bei den letzteren, den leeren Kategorien und Spuren in der syntaktischen Ableitung, nicht möglich (ebd.).
124
Im Beispiel (3) wird ein Element, das zu den [-na]-Elementen gehört, fokussiert. Relevante Alternativen wären nur andere Anredepronomen. Auch hier resultiert die Zuweisung des "+" nur zu dieser Konstituente und dem sie dominierenden Knoten VL-S. Die meisten der vorliegenden Ansätze analysieren jedoch Akzentzuweisung und Akzentverteilung wie auch die semantische Akzentinteipretation nur mit Bezug auf einzelne, in erfundene Vorgängerkontexte eingebettete Sätze. In konversationeller Interaktion stehen jedoch Turnkonstruktionseinheiten in thematischen Sequenzen, in denen die aufeinanderfolgenden Turnkonstruktionseinheiten und Turns die thematische Entwicklung des Gesprächs konstituieren. Dieses geschieht mithilfe von Aktivitäten der 'Fokussierung' (Kallmeyer 1978, Maynard 1980, s.o. Kapitel 2.2.). Wenn Fokussierungsaktivitäten eine sequentielle Struktur haben und auf der Interpretation semantischer Beziehungen zwischen Einheiten beruhen (s.u.), dann ist die Herstellung und Signalisierung des semantischen Fokus bzw. der semantischen FHG jeder einzelnen Turnkonstruktionseinheit die Voraussetzung dieser Fokussierungsaktivitäten. Vor diesem Hintergrund stellt sich dann auch aus einer ethnomethodologischen und konversationsanalytischen Perspektive die Frage nach den Grundlagen und Prinzipien der Herstellung und Signalisierung des Fokus der Einheit. Akzent wird nun als ein Signalisierungsmittel relevant, mit dem sich Interaktionspartner wechselseitig mit Hilfe der sprachlichen Struktur ihrer Einheiten den Fokus bzw. die Fokus-Hintergrund-Struktur der gerade produzierten Einheit signalisieren. Die interpretative Relevanz dieser Fokus-Hintergrund-Struktur der einzelnen Einheiten zeigt sich daran, daß Interaktionspartner und Rezipienten in ihren Folgeeinheiten an genau die so hergestellten Fokussierungen in ihren eigenen Fokussierungen und Folgeaktivitäten je nach intendierter Fortsetzung kohäsiv oder nicht-kohäsiv anknüpfen. Die FHG einer solchen Anknüpfung steht dann jeweils in Alternation zu möglichen anderen FHG, die jedoch andere semantische Beziehungen hergestellt hätten. Dies kann man sich beispielhaft an folgendem Gesprächsausschnitt verdeutlichen, bei dem die Fokus weiten der Einheiten jeweils in Klammern vermerkt sind. (60) Kl: 517-540 516 I:
W I E lange QEHT das da H
(weit)
(weit)
(weit)
(eng)
((druckst)) 527 Is 528 Ns
ρ LÄNger ne M(\
/)
529 Is
ja ich FANG immer ziemlich spät Ans F(\ \ /)
530 Is
ers um HALB NEUN F(\ / )
531 Ns 532 Is
(weit)
pf (h) ρ dJOs das is ganz schön F(\
533 Ns
. BLÖde ne= \ /) =mhm \/
(weit)
534 Is
JOO un âh i*IN der woche geht das MEIstens M(\) F(/ \
535 Is
mindestens bis halb EINS / )
536 Is
ja un wemma was LOS is oder so natürlich LÄNger . < all > S(/ / )
537 Ns
mhm .
(eng
+weit)
(weit)
\/
538 Is
un am Wochenende geht es Mindestens bis EINS .
F(/
539 Ns
mhm . \/
\
\
)
(eng)
126 540 Ν:
m m NICH SCHLECHT F(/ \ )
541 R:
WELche tage MACHST du eigntlich wollt F(/ \
542 R:
noch wissen außer MITTwochs \ )
ich
(eng)
Hier stellen die Einheiten mit weiten Foki kontinuierliche thematische Weiterentwicklungen her, bei denen die einzelnen Einheiten keine besonderen Beziehungen zu Vorgänger- oder Nachfolgeeinheiten voraussetzen oder nahelegen. Anders ist dies jedoch bei den Einheiten mit engen Foki. Nach der ersten Frage mit weitem Fokus in Zeile 516, die eine Neufokussierung des Gesprächs von der vorherigen Fokussierung der Überarbeitung von Ν zu den Arbeitszeiten bei ihrem Job initiiert, hat die fast wortgleiche Frage in Zeile 526, die ebenfalls wieder die Fokussierung wechselt, nämlich von I's Arbeitsplatz zu ihren Arbeitszeiten, einen engen Fokus auf dem lokalen anaphorischen Pro-Element DA:. Dieser enge Fokus stellt genau den Gegensatz her zwischen der hier gestellten Frage nach I's Arbeitszeiten bei ihrem Job und der vorherigen fast wortgleichen Frage, in der I nach N's Arbeitszeiten bei N's Job gefragt hatte. Der enge Fokus der zweiten Frage legt damit den neuen Fokus als gegen einen früheren Fokus gesetzt nahe und etabliert damit eine besonders enge kohäsive Beziehung zwischen beiden Fragen. Obwohl sowohl die Frage in Z. 516 wie auch die in Z. 526 neufokussierende sind, legen sie unterschiedlich enge kohäsive Beziehungen zu Vorgängereinheiten nahe. Ähnlich legt der enge Fokus in der Frage in Zeile 519 eine Gegeneinandersetzung des DU: in dieser Frage gegen einen anderen bisherigen Adressaten einer ähnlichen Frage nahe und knüpft zugleich kohäsiv an eine solche frühere Frage an. Gleichzeitig entwickelt die Frage selbst jedoch das Gespräch weiter, fokussiert es neu von N's Job auf I's Job. Schließlich legt der enge Fokus in Zeile 534 in der Phrase IN der woche einen Gegensatz zu einem außerhalb der Woche, nämlich am Wochenende nahe. Nach der Frage nach den Arbeitszeiten kann der enge Fokus hier als eine kataphorische Projektierung des nahegelegten "Gegenstücks" interpretiert weiden. Und auch bei der Formulierung des "Gegenstücks" in Zeile 538 stellt der enge Fokus wiederum eine anaphorische kohäsive Beziehung zur vorherigen Einheit in Zeile 534f her. Auch der enge Fokus der Frage in Zeile 541f stellt eine enge kohäsive Anknüpfung an Vorgängereinheiten her, legt aber nicht, wie die vorherigen engen Foki, eine Absetzung nahe. Vielmehr scheint hier der Frager R noch zusätzliche Informationen zur Vervollständigung seines auch explizierten Wissens über I's Arbeitszeiten zu verlangen. In solchen Fällen, in denen das finite Verb oder andere '"innermost' elements of the predicate" akzentuiert werden, spricht Fuchs 1984 von "focus on ascription": "With focus on ascription, ascription itself is 'called up' as a dimension of relevance. Since the event-participant relation is 'given in the discourse', calling up this dimension of relevance results in establishing a relation to the 'source' of that givenness: prior ascription (in some mode ...). This kind of focussing thus affords a metacommunicative device for specifically referring back to prior ascription while effecting a new one (in one of the possible modes, again, and under the
127 aspects/to the extent specified by the rest of the sentence)" (ebd.: 150). Etwas später spricht sie auch davon, daß Äußerungen mit solchen Akzenten "sound more 'insistent', which is explainable by their focus on 'ascription'" (ebd.: 151). Dies scheint sich auch genau für die Signalisierung einer engen Anknüpfung an einen früheren Fokus bei gleichzeitiger Fokusweiterführung zu eignen. Diese Analyse der Foki führt zu folgenden hypothetischen Schlußfolgerungen: Weiter Fokus scheint die Ressource für thematische Weiterentwicklungen zu sein, bei denen die FHG allein noch keine Nahelegung einer bestimmten kohäsiven Beziehung zu anderen Einheiten impliziert. Demgegenüber impliziert enger Fokus die Herstellung einer besonderen kohäsiven Beziehung zu einer anderen Einheit, ggf. wird ein Gegensatz bzw. eine Fokussierung in Absetzung von einem vorherigen oder zu folgenden Fokus nahegelegt Das macht einen engen Fokus auch geeignet für die Formulierung von Korrekturen oder von Erwartungsproblemen mit Bezug auf spezifische Vorgängerelemente, wie z.B.: (61) Kl: 923-924 923 R:
das is g a r n i c h so EINfach M(\ )
924 Ν:
is N I C H so EINfach= H(T\ \ )
((heh))
Leider kann diese Problematik von Akzent und Fokus im Rahmen dieser Arbeit nur andiskutiert werden. Sie verdient eine eigene Arbeit. In diesem Zusammenhang steht also die interessante Frage, wie Interaktionspartner auf ihr sprachliches und grammatisches Wissen und ggf. auf grammatische Prinzipien als Ressource zurückgreifen, um eine bestimmte semantische Struktur ihrer Turnkonstruktionseinheit zuwege zu bringen und eine bestimmte semantische Beziehung ihrer Einheit zur Vorgängereinheit interpretierbar zu machen. Vor diesem Hintergrund werden grammatische Prinzipien als Voraussetzung von Verständigung und Interaktion und die damit beschreibbaren Turnkonstruktionsverfahren als kommunikative Ressource und Signalisierungsmittel analysierbar. Das Phänomen 'Akzent' bildet mithin eine Schnittstelle zwischen Grammatik und Interaktion.
2.2.2.3. Akzenttonhöhenbewegungen: Akzent(proto)typen Die akzentuierten Silben der Einheit können weiter nach den bei ihnen konstituierten lokalen Tonhöhenbewegungen differenziert werden. Diese können zwar aufgrund segmentaler, mikroprosodischer oder auch sonstiger lokal wirksamer Bedingungen im Detail sehr unterschiedlich aussehen. Dennoch tendieren die meisten der vorzufindenden lokalen Akzenttonhöhenbewegungen mehr oder weniger klar zu den prototypischen Akzenttypen 'fallend', 'steigend', 'gleichbleibend', 'fallend-steigend' und 'steigend-fallend'. Diese werden anhand der Tonhöhenbewegung unterschieden, die in/mit der Akzentsilbe beginnt und danach i.d.R. bis
128
zum Ende der Akzenteinheit fortgesetzt wird. Bei Gegenläufigkeit von lokaler und globaler Tonhöhenbewegung geht jedoch ggf. die Akzenttonhöhenbewegung bald nach der Akzentsilbe wieder in die Globaltonhöhenbewegung über. Im folgenden werden diese Akzent(proto)typen genauer beschrieben und mit prototypischen Beispielen illustriert. Die hier unterschiedenen Typen lokaler Tonhöhenbewegungen halte ich für ausreichend für die Beschreibung der von meinen Informanten benutzten nord(west)deutschen Varietät des Deutschen. Sie entsprechen Phebys Tonmustem, denen ebenfalls die Analyse einer nord(ost)deutschen Varietät des Deutschen zugrundelag. Andere Varietäten verlangen jedoch ggf. andere Beschreibungskategorien. Modifizierte Formen lokaler Tonhöhenbewegungen wie auch variables Timing der Tonhöhenbewegungen in Relation zum Silbennukleus (z.B. zur Erzeugung verzögerter Akzentgipfel relativ zum Silbennukleus) können prinzipiell dialektspezifisch oder aber auch zur Erzeugung rhetorisch und interaktiv relevanter Tonhöhenbewegungen verwendet weiden (vgl. auch Knowles 1984). (1) Fallender Akzent (oder auch Gipfel- und/oder Fallender Akzent) (transkribiert als Ύ bei Akzentsilben). Bei diesem Akzenttyp kookkurriert der Nukleus der akzentuierten Silbe mit einem Tonhöhengipfel oder aber er liegt kurz nach einem Tonhöhengipfel und die Tonhöhe im Rest der akzentuierten Silbe und in der weiteren Akzenteinheit fällt. Dieser Akzenttyp kann wie folgt schematisch dargestellt weiden: *"\ . Ein möglicher Tonhöhenaufstieg ('onglide') zum Tonhöhengipfel wie z.B. in einer Tonhöhenbewegung wird dabei nicht als die entscheidende Tonhöhenbewegung angesehen, sondern erst die Tonhöhenbewegung, die in der Akzentsilbe beginnt und danach fortgesetzt wird.11 Beispiele klarer und prototypischer Fälle von fallenden Akzenten finden sich in der akustischen Analyse des Beispiels (62) K2: 398 R:
u n d ich h a b n o c h AOTnahpi davon= M(\ )
399 R:
=und das K L I N G T zum T E I L . also W I R K l i c h F(\ \ \ )
in Abb. 5. Dort ist sichtbar, daß der des Nukleus der Akzentsilbe jeweils genau einen FQGipfel bildet und daß die FQ danach fällt. Weitere Beispiele finden sich auch in den folgenden Abbildungen. (2) Steigender Alczçnt (oder auch Tal- und/oder Steigender Akzent) (transkribiert als "Γ bei Akzentsilben). Bei diesem Akzenttyp liegt der Nukleus der akzentuierten Silbe in einem Tonhöhental oder kurz nach einem Tonhöhental und die Tonhöhe im Rest der akzentuierten Silbe und in der weiteren Akzenteinheit steigt weiter an. Dieser Akzenttyp kann wie folgt schematisch dargestellt werden: . Wiederum wird ein möglicher Tonhöhenabfall ('onglide1) zum Tonhöhental wie z.B. in einer Tonhöhenbewegung nicht als entscheidende Tonhöhenbewegung angesehen, sondern erst die Tonhöhenbewegung, die in der Akzentsilbe beginnt und danach fortgesetzt wird.
Für eine Begründung dieser Konvention siehe Kapitel 1.1.4.
129
2060.0
•5Ö3Ö.Ö" 2000.0 500.0
800.0
1100.0
1400.0
1700.0
2000.0
2300.0
2600.0 ms
500.0
800.0
1100.0
1400.0
1700.0
2000.0
2500.0
¿600.0 ms
180.0 160.0 140.0 120.0 100.0
anιφΑ
prì 3x ¿alna m ¿af.onaod.is ilzrjisomtaxt m< \ ' ) F( \ J \
aiio
vzïkLiç. \ )
Abb. 5
Akustische Analysen klarer Fälle von steigenden Akzenten in der Einheit (63) K2: 390 R:
JEder wollte sch ä h sch SCHLACHzeuch spieln M[M(/ \
391 R:
giTARre spieln und SOLche sachen \ / )
392 R:
aber SINOp wollte K(h)BIner=un dann F(/ \ )] < all >
finden sich in Abb. 6 auf den Silben sol und singn. Bei sol steigt die Tonhöhe nach dem Akzentgipfel und bleibt hoch bis zur Silbe sa, fällt dann aber in der letzten Silbe der Einheit ab. Ein solcher Fall einige Silben nach einem steigenden Akzent findet sich oft, wenn steigende Akzente gegenläufig zu fallenden Globalverläufen verwendet werden. Nach singn bleibt hingegen die Fq bis zur nächsten Akzentsilbe kei hoch und fällt erst mit der Akzenttonhöhenbewegung. (3) GleichbleihenHpir AWi-nt (transkribiert als "-" bei Akzentsilben). Bei diesem Akzenttyp liegt der Nukleus der akzentuierten Silbe auf gleichbleibender Tonhöhe und die Tonhöhe im Rest der akzentuierten Silbe und in der weiteren Akzenteinheit bleibt (fast) gleich. Der Akzent wirkt ggf. wie etwas gegen den Globaltonhöhenverlauf gehalten.
130
500.0
800.0
1100 Ό
1400.0 1700 Ό 2000.0
2300.0 2600.0 ms
500.0
900.0
1100.0
1400.0 1700.0 2000.0
2500.0 £600.0 ms
130.0 160.0
140.0 120.0 100.0
Μ(...
J
fôaxtrorçip'^nW \
i} 3
\
y
/ *
)
ζ ι ι υ νο Ρ( Λ
\
)
Abb. 6
Schematisch kann dieser Akzenttyp wie folgt dargestellt werden: - — . Er wird oft mit einem Tonhöhensprung nach oben oder unten von der vorherigen Akzenteinheit abgesetzt, manchmal wird der Akzent jedoch auch allein mithilfe der Parameter erhöhte Lautstärke und/ oder segmentale Länge konstituiert. Beispiele für gleichbleibende Akzente in der Einheit (64) K2: 447 R:
DAS w a r sehr HILFreich H()
finden sich in Abb. 7. Obwohl hier die erste Akzentsilbe höher liegt als der Rest der Einheit, wird die Gesamteinheit als gleichbleibend hoch wahrgenommen. Gegenüber den dargestellten einfachen Akzenttypen fallend, steigend und gleichbleibend, ist den beiden komplexeren Akzenttypen fallend-steigend und steigend-fallend gemeinsam, daß deren erster Teil der Tonhöhenbewegung auf einer akzentuierten und der zweite Teil i.d.R. auf einer sofort oder später folgenden unakzentuierten Silbe realisiert wird. Da die Plazierung des zweiten Teils der Tonhöhenbewegung nicht festgelegt ist, kann er verwendet werden, um eine letzte Tonhöhenbewegung als wenig prominente, unakzentuierte Tonhöhenbewegung bis ggf. an das äußerste Ende einer Einheit zu verschieben. Zugleich eignen sich diese komplexen Akzenttypen auch gut für die Herstellung stilistisch relevanter Tonhöhenbewegungen.
131
i n ? l W ' r'wwi>má¿ll •2030.0
™
• 2010.0 500.0
800.0
1100.0
• 1 soci • 1 60.0 • 140.0 120.0 • 100 0
1400.0 m
.
500.0
800.0
Η(-
'
1100.0 ms
-
)
Abb. 7
(4) Fallend-stp.i gp.nHp.r Alczp.nt (transkribiert als "V"). Bei diesem Akzenttyp wird der erste, prominentere Teil der Akzenttonhöhenbewegung, Ύ , bei einer Akzentsilbe realisiert, während der zweite, weniger prominente Teil der Bewegung, "/", nachfolgend noch innerhalb derselben Akzentsilbe oder aber bei einer späteren, unakzentuierten Silbe realisiert wird. Ein Beispiel für einen klaren Fall von fallend-steigendem Akzent in der Einheit (65) K2: 377 R:
äh: inner SCHUle hab ich mich
M(/ 378 R: *
immer geweigert ip CHOR zu gehn \ / )
ist in Abb. 8 zu sehen. Der akustische Ausdruck zeigt, daß die fallende und dann steigende FQ- bzw. Tonhöhenbewegung bei den Silben CHOR und gehn ungefähr gleich groß ist. Jedoch hat CHOR eine deutlich höhere Lautstärke als gehn. gehn wird als unakzentuierter zweiter Teil der vorherigen Akzenttonhöhenbewegung und nicht als neue Akzenttonhöhenbewegung transkribiert.12 In diesem Ausdruck zeigt die FQ bei der Silbe SCHU in SCHUle einen weniger klaren Fall eines steigenden Akzents: Der Nukleus der Akzentsilbe fällt bereits genau mit dem Fg-Gipfel nach einem Tonhöhensprung aus einem Fg-Tal zusammen, die Tonhöhe in den nächsten beiden Silben le hab bleibt noch relativ hoch, bevor sie kontinuierlich weiter langsam abfällt Auditiv scheint mir (auch bei wiederholten unabhängigen Transkriptionen) eine steigende Akzenttonhöhenbewegung näher zu liegen als eine fallende.
132
2060.0
'"SbÖ'.Ö • 2000.0
•
180.0
•
160.0
500 ,Q
800.0
1100.0
1400.0
1700.0 2000.0
2500.0
2600.0 m¡
500.0
800.0
1100.0
1400.0
170Q.Q 2000.0
2300.0 2600.0 m:
• 140.0 120.0
• 100.0
ε*.
i r u f i u ù ^ i a n i c T m i M 9 v at^-gt Tf.: t o ï t s u g â : « , J M( / \ / ) Abb. 8
Aufgrund ähnlicher Verhältnisse wurden auch die folgenden Beispiele als Einheiten mit einer letzten fallend-steigenden Akzenttonhöhenbewegung analysiert: (66) K5: 422 C:
r un dann . ham hat sich ein . HAOFlein von FRAUN gefundn < all > F(\ / 423 L: L hm 424 C: *
die: jetz so die arbeit noch mal dokumenTIERN wolltn \ / )
(67) K5: 553 C:
also ICH hab . ((knurrt)) war NICH eine von den SCHBINfraun T(\ \ \ / )
(68) K2: 12 N:
was HAS du denn da für HARbm S(/ \ /)
...
In einigen Fällen, wie z.B. in (67)-(68), umfaßt die letzte unakzentuierte Tonhöhenbewegung nur sehr kurze Segmente. Dies zeigt, daß neben einer möglichen stilistisch relevanten Verwendung die Herstellung dieser kurzen letzten Tonhöhenbewegung als Verfahren verwendet
133 werden kann, eine letzte steigende Tonhöhenbewegung, die konstitutiv für einen bestimmten Aktivitätstyp ist (siehe Kapitel 3), so weit wie möglich an das äußerste Ende der Einheit nach hinten zu verschieben. (5) Steigend-fallender Akzent (transkribiert als "Λ"). In diesem Fall wird wieder der erste, prominentere Teil der Tonhöhenbewegung, "/", bei einer Akzentsilbe konstituiert und der weniger prominente Teil Ύ entweder noch innerhalb derselben Silbe begonnen oder bei einer nachfolgenden unakzentuierten Silbe realisiert. Beispiele für steigend-fallende Akzenttypen finden sich in den folgenden Einheiten; in (72) hängt der Sprecher nach dem steigend-fallenden Akzent ohne Grenzsignale ein unakzentuiertes Anhängsel mit erneut steigender Tonhöhenbewegung an. (69) Kl: 566 R:
A e r is w a h r s c h e i n l i c h a vorBEIgerauscht T(\ / \ )
(70) K2: 337 R:
ich W E I ß g a r n i c h die genAüe zahl T(\ / \ )
(71) Kl: 175 R: 176 N :
w i r S I N D frauen u n d K Ü S s e n alle dieselbe m e i n u n g h a b m H,F(/ / \ )
ja \
(72) K2: 432 R:
â h m h a b ich m i c h selbst beOLEItet u n d so F(\
Im Beispiel (72) ist die Tonhöhe bei der letzten Akzentsilbe REIN niedrig, steigt aber zu einem Gipfel bei der Folgesilbe ge an, bevor sie von dort wieder bis zum Anhängsel der Einheit fällt. Die Beispiele (69)-(72) zeigen Fälle, in denen dieser Akzenttyp den Effekt hat, eine seltenere und deshalb auffälligere Tonhöhenbewegung zu konstituieren, die ggf. stilistische Bedeutung hat (s.u.).
134 Nicht für alle akzentuierten Silben ist die Identifizierung und Zuordnung der Akzenttonhöhenbewegung zu den Prototypen klar und eindeutig. In den allermeisten Fällen jedoch tendieren die Tonhöhenbewegungen zumindest in die Richtung dieser Akzentprototypen. In weniger klaren Fällen ist dennoch in der Analysepraxis oft die am ehesten ähnliche Akzenttonhöhenbewegung deutlich abgrenzbar von den Alternativen: Wenn auch ein gegebener Akzent nicht mit Sicherheit als fallender Akzent wahrgenommen wird, so ist doch deutlich, daß er noch viel weniger einem steigenden oder einem gleichbleibenden Akzent ähnelt. Aus diesem Grunde spreche ich von meinen Akzenttypen als Prototypen: Neben sehr klaren Exemplaren als prototypischen Beispielen stehen auch unklarere Exemplare als Fälle an der "Peripherie", die dennoch einem gegebenen Prototypen ähnlicher sind als einem anderen.13 (In sehr unsicheren Fällen notiere ich ein Fragezeichen "?" vor dem zugeordneten Akzenttypen, um auf die Unsicherheit der Transkription hinzuweisen.) Die Akzentprototypen sind holistische interpretative Kategorien. Sie knüpfen an die alltägliche interpretierende Wahrnehmung von Akzenten in der Alltagskommunikation an. Außer der für den Akzenttypen konstitutiven lokalen Tonhöhenbewegung sind an der Konstitution des Akzents oftmals, aber nicht immer, auch die Parameter Lautstärke und Länge der Akzentsilbe beteiligt. Gemeinhin wird von der vor-herrschenden Rolle der Tonhöhenbewegungen für die Wahrnehmung von Prominenz bzw. Akzentuierung ausgegangen.14 Bei den unmarkierten, unauffälligen Akzenttypen, bei denen die hier zugrunde gelegten holistischen Akzenttypen in ihrer unauffälligen und prosodisch nicht weiter markierten und modifizierten Form hergestellt werden, ist eine weitergehende parametrisierende Analyse in ihre einzelnen konstitutiven prosodischen Parameter Tonhöhe, Lautstärke und Länge auf der Grundlage vorwiegend auditiver Analysen nur unzuverlässig möglich und im Rahmen der vorliegenden Arbeit auch unnötig.15 Demgegenüber sind in markierten Realisierungen der Akzenttypen, in denen Sprecher v.a. die Parameter Lautstärke oder Tonhöhe in auffälliger Weise zur Markierung eines Akzents verwenden, diese Parameter leicht auditiv identifizierbar. Durch diese markierte Verwendung v.a. der Parameter Lautstärke und Tonhöhe kommen unterschiedliche Akzentstärken und/oder unterschiedliche Bandbreiten bei Akzenttypen zustande, die mithilfe der Notation der Parameter "" bzw. "t" oder "4-" genauer transkribiert weiden. Ein Beispiel für die Herstellung von markiert großen Bandbreiten ist die Einheit (73) KO: 11 M:
d a s RAUchen KÖNji d i e da n i c h F E S T s t e l l n F (4-/ T\ \ ) crei.
gespannt
rei.
gespannt>
Dieselbe Datenlage veranlaßte auch die Mitarbeiter des Münchener Projekts "Modus - Fokus - Intonation" von der prototypischen Organisation der Strukturierung und Wahrnehmung von Intonation auszugehen (s.o. Kapitel 1.1.3.). Von der entscheidenden Rolle lokaler Tonhöhenbewegungen für die Akzentinteipretation geht auch Bolingeraus. Für einen Überblick über die ältere Forschung zum Verhältnis der Parameter Tonhöhe/F0, Lautstärke/Intensität, und Lange/Dauer siehe Lehiste 1970:125ff.
135 in der M, die in benachbarten Einheiten eine Bandbreite von ca. 5 Halbtönen ausnutzt, bei den ersten beiden Akzenten dieser Einheit die Bandbreite einer gesamten Oktave herstellt (s.u. Abb. 15 für den akustischen Ausdruck dieser Äußerung). Akzenttypen und v.a. ihre Kombination in der kohäsiven Akzentsequenz werden verwendet zur Konstitution der lokalen Tonhöhenbewegungen der Kontur. Diese tragen wohl am meisten zur eigentlichen, ggf. regional spezifischen "Melodie" der Einheit bei. Die letzte Tonhöhenbewegung von Ein-Einheiten-Turns wird in Kookkunenz mit anderen sprachlichen Merkmalen der Einheit zur Signalisierung und Konstitution von Aktivitätstypen verwendet (siehe Kapitel 3).
2.2.2.4. Sequenzen lokaler Akzenttonhöhenbewegungen Interaktionspartner können in aufeinanderfolgenden Einheiten desselben oder unterschiedlicher Sprecher Akzentsequenzen wiederholen bzw. wiederaufnehmen, umdrehen und variieren, um so intonatorisch die Art der kohäsiven Beziehung zwischen Einheiten zu signalisieren. Dies will ich nunfolgend an einigen Sequenzen demonstrieren und damit auch die interaktive Relevanz der Akzentsequenz und der sie konstituierenden Akzenttypen zeigen. (a) Wiederholung/Wiederaufnahme von Akzentsequenzen: (74) K2: 575 I:
K O C H T ich NIE: und KOMMT ich NIE: F(\ -) F(\ -)
(75) Kl: 52 N:
HAS das MITbekomm H,S(\ / )
53 N:
W A R S du inner KRsten Sitzung da H,S(\ / )
(76) Kl: 443 I:
ERSmal m: würd ich dann irgndwo HINkommn: M(\
\
444 I:
woMÖGlich noch in ein anderes BUHdesla:nd \ \ / )
445 I:
und dann
da
< all
MÖCHT ich nich BUSIibm . M(\ \ /) all >
136 (77) K2: 568 I:
un:d GANZ früher mußt ich au immer noch mit zur KIRche M(/ \ /)
569 I:
und ich kann mich erinnern M(\ / )
In (74) und (75) werden jeweils in aufeinanderfolgenden Einheiten dieselben Akzentsequenzen wiederholt und damit die Einheiten als kohäsiv signalisiert In (76) und (77) weiden die fallend-steigenden letzten Akzenttonhöhenbewegungen der ersten Einheiten in der Folgeeinheit jeweils wiederaufgenommen. Die Wiederholung einer derartigen Konfiguration, v.a. wenn sie innerhalb eines einzigen kurzen Wortes konstituiert wird, kann kaum zufällig sein. Sie wird vielmehr als kohäsives Mittel verwendet, das auch stilistische Funktionen erfüllt. Dieselbe Art der Wiederholung bzw. Wiederaufnahme von Akzentsequenzen findet sich auch im Folgeturn eines nächsten Sprechers nach einem Sprecherwechsel: (78) Kl: 357 N: *
WEIßT du auch nich was da RAUSgekommn is F(/ \ ) NEe
358 R:
(\/)
359 R:
. dhab ich NICHTS von geHÖRT bisher F(/ \ )
Das nächste Beispiel (79) ist ein komplexeres, in dem sowohl einzelne Akzentsequenzen als auch ganze Folgen von Akzentsequenzen wiederholt werden: (79) Kl: 422 N:
423
I:
aber KUNST is aber nich kein gutes ANgebot hier oder T,F(\ \ / ) .
ES F(\
NEE: ) M(\ )
OEjHT
\
.
MICH
F(\
so SONderlich GUT \ \)
424 N:
. mhm
425 I:
A:ber ich mach das jetzt hier zuENde M(T- )
426 I:
WEIL: eine ausbildung BRAUCH der mensch M(-
427 I:
.
T-
aso s HAB ich mir jetzt so geSAiOT F(\ \ )
)
137 428 I:
und:
.
ich KÖMmer m i c h da n i c h W E I t e r d r u m M(\ T)
429 I:
ich M A C H das hier zuBMde M(T- ) < all >
430 I:
u n mal S E H N w a s D A M M kommt F(\ \ )
.
Durch Wiederholung der Akzentsequenz werden hier jeweils einerseits die direkt aufeinanderfolgenden Zeilen 425 und 426, und mit einer kleinen Variation auch 428 und 429 als zusammengehörig gekennzeichnet. Zugleich werden jedoch auch die Akzentsequenzabfolgen aus 425-427 fast wiederholt in 428-430. Damit erhält dieser gesamte Turnteil eine interne diskurssemantische Strukturierung in zwei Teile: Der Darstellung der gegenwärtigen Gedanken und Entschlossenheit der Sprecherin I mit der Kontur M( - T-) bzw. M( \ T-) folgt jeweils eine Art metakommunikativer Kommentar aus distanzierterer Perspektive mit der anderen Kontur F(\\). Im Kapitel 2.1.4. wurde bereits darauf hingewiesen, daß auch Nachträge zu einer Turnkonstruktionseinheit durch eine Wiederholung der letzten Tonhöhenbewegung(en) der Bezugseinheit als kohäsive Nachträge kontextualisiert werden. Auch diese Beispiele zeigen, daß die Wiederholung bzw. Wiederaufnahme derartig komplexer Akzentsequenzen kein Zufall ist. Sprecher setzen solche Wiederholungen und Wiederaufnahmen als interaktive Signalisierungsmittel zur Herstellung und Kontextualisierung kohäsiver Beziehungen zwischen Einheiten aktiv ein. Dafür spricht auch, daß sie im Einklang mit der diskurssemantischen Struktur der Sequenzen verwendet werden.
(b) Umkehrung von Akzentsequenzen: (80) K l : 820 I:
das K A M a u c h (\ )-
821 I:
entweder
.
ich MUßte m i c h entSCHEIDM F(\ \ )
(0.7) zuHAUse wohρ u n d fürn A ü t o arbeitp
M(/
/
)
822 I : ρ oder H I B R wohp u n d für ne W O H n u n g arbeitn F (\ \ ) 823 N : mhm \/
(1.0) 824 I:
u n d a h a b ich m i c h LIEber für das AUto entschiede
M(/
)
138 Hier wird vom ersten entweder-Teil des Turns, der zwei steigende Akzente hat, der oder-Teil des Turas, der genau umgekehrt zwei fallende Akzente hat, abgesetzt formuliert. Die Akzentsequenz aus steigendem plus fallendem Akzent in 824 wirkt im Anschluß daran wie eine Synthese nach der Opposition aus entweder und oder. Dieselbe Art von Gegeneinandersetzung auch auf der Ebene der Akzentsequenzen findet sich im nächsten Beispiel (81): Dort steht hier η paar wochen in 828 gegen DANN in 829 und erneut jeder FLUCHT in 831 gegen aber ALle in 832: (81) Kl: 827 I:
weil ich mein: WIE« bei dir AUCH ne M( / \ /)
828 I:
die MEIstp die WOHN hier η paar wochen Η(/ / )
829 I: r un
830 N:
DAMN sind sie wieder in wilhelmsHAVN F S(/
577 I:
willemshavm bewußt geSE:HN
/
578 I:
un IRgndwann eines abmds saßen wir mal m: M( /
579 I:
bei MARgret zuHAUse \ \ )
580 I:
..
un dann FING sie mit eimal an F(\ < all >
daß sie mich vom SEHN her KEHN würde und
\
\
)
139 In (83) wird eine "Akzentumkehrung" zur prosodischen Kontextualisierung des diskurssemantischen Gegensatzes zwischen einem in sich als zusammengehörig formulierten MACHN wir fei/j-Teil und einem sondern-Teil verwendet: (83) K5: 433 C:
434 C: 435 L:
MACHN wir das mal ANders H,F(\ t) - sch un SCHREIBH wir kein paPIER M(\ Î- ) hm
\ 436 C:
sondern ORSHH wir ein Video F(\ i)
Der nach oben abgesetzte gleichbleibende Akzent " Î " kontrastiert mit dem nach unten abgesetzten selben Akzenttyp "I". In allen diesen Beispielen kontextualisieren die erste Akzentsequenz und ihre umgekehrte Folge-Akzentsequenz auch diskurssemantisch gegeneinandergestellte Einheiten. Auch hier spricht genau diese Kookkurrenz von prosodischer und diskurssemantischer Struktur dafür, daß diese Akzentsequenzumkehrungen keineswegs Zufälle sind, sondern daß der Sprecher sie als Kontextualisierungshinweise aktiv einsetzt.
(c) Variation von Akzentsequenzen: (84) K l : 765 N:
GEH doch mal HIB eh . M(\ T\ )
766 N:
vielleicht kann er dir SAGN woran das LIECHT= F(\ \ )
767 N:
=un was de da MAchen kanns M(t\ )
(85) K l : 837 I:
a es is schon SO oft in meim beKANNtnkreis VORgekomjn
H,F(Î\ \ \ / ) < all >
838 I:
(0.7)
dann warn se SO« geHERvon willemshavn ne F(\ \ /)
140 In (84) und (85) werden jeweils einige fallende Akzente in aufeinanderfolgenden Akzentsequenzen mit markiert großen Bandbreiten variiert. Zudem haben die Akzentsequenzen hier unterschiedlich viele Akzente. Im folgenden Beispiel (86) wird nach zwei Einheiten mit nur je einem steigenden Akzent eine Einheit mit einem zusätzlichen fallenden vor dem steigenden Akzent verwendet. (86) K l : 1005 R:
r =also:
ich bin verHEIratet= M( / ) mhm
1006 N:
\/
=meine FRAU wohnt da
1007 R:
M(/
r
1008 R:
(0.6)
)
oder wir WOH^ halt zuSAiqi da T(\
/
((lacht))
1009 N:
Die Variation von Akzentsequenzen bietet offenbar die Möglichkeit, trotz relativ ähnlich bleibender Konturen bzw. letzter Tonhöhenbewegungen einer Kontur dennoch Parameter zu variieren oder zu ergänzen. Auf diese Weise wird zwar einerseits retrospektiv an vorherige Konturen angeknüpft, dennoch werden andererseits neue Konturen konstituiert, die eigenständige neue Einheiten konfigurieren.
(d) Aufeinanderfolgende Konturen ohne direkte Bezüge zu vorherigen: Wenn bei der Variation von Akzentsequenzen noch an vorherige Konturen angeknüpft wird, dann werden in den folgenden Beispielen in den aufeinanderfolgenden Einheiten jeweils neue Konturen hergestellt, die nicht erkennbar die vorherigen Akzentsequenzen wiederaufnehmen bzw. an diese anknüpfen: (87) K4: 210 L: 211 C: 212 L:
ρ ey das is SO:ι SCHÖN= L
H,F(/
\)
((lacht)) =das müssn wir ECHT wieder MACHN H,F(\ \ )
(88) K4: 107 C:
man k* ..
aso FRAU kann eignlich nich SAGN: F(/ \
141 108 C:
daß es so: âh DIB feministische theoloGIB gibt / \ )
109 C:
=sonnern da gibts GANZ viel verschiedene M(\
110 C: 111 E:
r STRÖmungn und* .. t) mhm=
\/
L
(89) K5: 558 C:
559 E:
r äh: . und . es war ein FiÜrRichterliches HIM und HER F(T\ \ \)
mhm: \/
560 C:
und äh: also die soZ:BKtin H,S
(101) K2: 684 N: *
nee DAS NICH \ F(\ \ )
In (100) und (101) haben die Turnübernahmesignale eigene unakzentuierte Tonhöhenbewegungen vor der Akzentsequenz. In (101) ist das unakzentuierte Turnübernahmesignal nee jedoch von der Folgeeinheit durch einen Tonhöhensprung zur Akzentsilbe getrennt. Turnübemahmesignale können jedoch ebenfalls in eigenständiger Einheit stehen, wie in (102) und (103), oder in die Akzentsequenz eingebunden weiden, wie in (104) und (105). (102) K2: 412 N:
a is wahrscheinlich WITzich wemman M(\
413 N:
so ALte AOFnahjn hört ne Ν / /)
414 R:
JOa M(\/)
415 N: 416 I:
(1.0)
(2.1)
((lacht leise)) ((zieht leise Nase hoch))
147 417 R:
jaa also für MICH sind se eigntlich immer \ F(\ < all >
418 R:
noch recht: leBENdich so \ )
(103) Kl: 7 I:
WARST du da: als ich n: refeRAT gehalten hab F(\ \ /)
((...)) 9 N:
10 N:
.
r
NEe: da war ich M(\/)
*ich glaub das war daNACH irgndwie die Sitzung
M( \ 11 I:
mhm
\/
\/
WARS du noch ZiXNger da
12 N:
H,S(\
13 * I: 14 N:
)
mhm
r
/
)
JAa ich war dann das LETZte mal AUCH da M
(0.7)
Hier ist die Einheit mit global hohem Tonhöhenverlauf die erste Einheit einer größeren kohäsiven Einheit, in der die Akzentsequenz in einer zweiten Einheit auf mittlerem globalem Tonhöhenniveau wiederholt wird. Während die erste Akzentsequenz in (109):425 noch als global hoch gehört wird und in der Tat ja auch auf Fq-Werte bis um ca. 200 Hz ansteigt, liegt die zweite Akzentsequenz in 426 bereits etwas tiefer. Das zeigt der akustische Ausdruck in Abb. 13. Das letzte Beispiel zeigte nun auch schon ein Beispiel für einen komplexen größeren Tonhöhenverlauf, bei dem mehrere Globaltonhöhenverläufe durch ihre Formulierung auf einer größeren einheitlichen Tonhöhenverlaufslinie als kohäsiv formuliert werden. Weitere Beispiele sind: (110) K2: 390 R:
J E d e r w o l l t e sch â h sch SCHLACHzeuch spieln
M [M ( /
\
391 R:
g i T A R r e spieln u n d SOLche sachen \ / )
392 R:
aber S I N G p w o l l t e K(h)EIner=un d a n n
F(/ 393 N : 394 I:
\
)]
< all > ((lacht)) ((lacht))
(111) K2: 395 R:
M U ß t e sich d a m a einer zu DURCHringn= F[F(\ \ )
396 R:
=HAB ich d a m a ANgefangn damit F(\ \ )] < all >
In diesen Fällen scheint die Globaltonhöhenbewegung der gesamten größeren Einheit in eckigen Klammern "[ ]" diese Einheit als eine größere Einheit zu konstituieren. Solche größeren
153
UH2050.0. 1
" " W o
2010.0
500.0
800.0
1100.0
1400.0
1700.0
2000.0 ms
500.0
900.0
1100.0
1400.0
1700.0
2000.0 rns
220.0 200.0 180.0
160.0 140.0 120.0
100.0
Ihnx^an
airçt AO ψ dt k o B W n ^ a l c û / n : F t H( / )
HÌ2040.0 1
2020.0 500.0
800.0
1100.0
1400.0
1700.0
2000.0
2500.0 ms
500.0
800.0
1100.0
1400.0
1700.0
2000.0
2500.0 ml?
220.0 200.0 180.0 160.0 140.0 120.0 100.0
6>*hiρ
F(\ \ )
486 N:
mhm \/
487 I:
.
STIMMT M(\ )
((holt tief Luft)) .
machs du AÜCH abmds was
Η(/ )
488 Ν:
mhm \/
489 N:
ich
ARbeite hiermáh: inner FANNkuchnstube \ F(\
156 (114) K l : =das: das GING überhaupt nich ne T(\ /) P>
1047 Ν:
JAAl aber trotzDEM: \ ) H,F(\
hs au ne GRÖßere entFERnung \ ) /
dasSINS vielleicht nochma: S(/
ne STUNde ME:HR= \ \ )
In allen diesen Gesprächsausschnitten wird in der gesternten Zeile eine Neufokussierung vorgenommen bzw. der Fokus gewechselt. In (113):487 geht der Fokus von I's Job zu N's Job, in (114):517 von der Menge der Arbeit, über die zuvor geredet worden war, zu den Zeiten der Arbeit. In (115):936 fragt I in Zeile 936, nachdem R erzählt hat, daß er als Musikstudent wenig Zeit zum Musizieren findet, ob R denn nicht mit anderen Studenten zusammen in einer Gruppe spiele. In diesem Fall kontextualiert die negative Formulierung durch I den erfragten Sachverhalts als einen, der ihrer Erwartung widerspricht. Dennoch wird aber prosodisch dieser Widerspruch zu den Erwartungen nicht so deutlich wie in anderen Fällen signalisiert (s.u. Kap. 2.2.4.). In allen diesen Fällen handelt es sich bei den betrachteten Einheiten zudem um Fragen, die das Rederecht dem Rezipienten zuweisen. In (116) wird ein Einwurf mit hoher Tonhöhe formuliert: Nachdem R zuvor erzählt hatte, daß er und seine Frau in unterschiedlichen Städten leben, erzählt nun N, daß sie zwei Monate lang eine Fernbeziehung gelebt habe, damit aber unzufrieden sei. I wirft in N's noch nicht beendeten Turn, dessen Fortsetzung mit un:d also mit gleichbleibender Tonhöhe projektiert ist, die Bemerkung ein, in N's Fall sei die Entfernung ja auch größer als in R's vorher dargelegtem Fall. Damit wird der Fokus verschoben von der Fernbeziehung an sich zur Rolle der Größe der Entfernung in so einer Fembeziehung. Diese Äußerung ist nicht als Unterbrechung kontextualisiert - die Lautstärke ist gegenüber den umliegenden Äußerungen nicht erhöht. Umgekehrt ist sie aber auch nicht als Hintergrundbemerkung o.ä. signalisiert, auf die Ν nicht zu reagieren bräuchte. Vielmehr scheint die hohe globale Tonhöhe diese Äußerung als fokuswechselnden Einwurf zu kontextualisieren, der immerhin so "hochgespielt" ist, daß die Gesprächspartnerin ihn eben nicht als Hintergrundbemerkung behandeln, sondern berücksichtigen sollte. Auch hier wird also mit der Einheit das Rederecht der Rezipientin für eine Reaktion zugewiesen. Und genau diese liefert Ν auch, wenn sie diesen Einwurf als Gegenargument gegen ihr Argument behandelt und mit einer Stützung ihres eigenen Arguments reagiert. Das Gemeinsame dieser Beispiele ist, daß offenbar die hohe Globaltonhöhe mit einem Fokuswechsel bzw. einer Neufokussierung kookkurriert, auf die die Gesprächspartner jeweils durch Lieferung einer relevanten Folgeaktivität reagieren sollen. In dieser Hinsicht verlangen diese Einheiten eine vielleicht gegenüber anderen Gesprächssequenzen erhöhte Aufmerksamkeit des Rezipienten. Die Tonhöhe scheint dementsprechend diese Turns in gewisser Weise "hochzuspielen", zumindest in dem Sinne, daß den Rezipienten mit von Anfang der Turnkonstruktionseinheit an und dann weiterhin mit hoher Globaltonhöhe die Notwendigkeit einer ggf. erhöhten Aufmerksamkeit signalisiert wird, da in ihnen der Fokus gewechselt wird und die Rezipienten auf diese Turns reagieren sollen. Diese Fälle stehen jedoch neben vielen
158 anderen Fällen, in denen fokuswechselnde bzw. neufokussierende Äußerungen nicht mit hoher Globaltonhöhe kontextualisiert werden.
(b) Emphatische Äußerungen Weitere Äußerungstypen, die häufig hohe globale Tonhöhe haben, sind sogenannte emphatische Äußerungen. In den folgenden beiden Beispielen setzen Sprecher eine Sequenz mit emphatischen Turns fort In (117) stimmt R einer Interpretation seiner Lebenssituation emphatisch zu; in (118) setzt ebenfalls R eine Bewertungssequenz nach einer ersten, positiv bewertenden Äußerung mit einer zweiten, eskalierenden Bewertung fort (Auer/Uhmann 1982). Diese zweite Bewertung, die gegenüber der ersten die Bewertung gleichlaufend verstärkt, hat hohe globale Tonhöhe und ist der Beginn eines Paratones, in dem der Fokus dieser Bewertung dann noch weiter ausgebaut wird. (117) Kl: 1094 I:
dann wird das noch ne UMstellung werdp F(\
1095 I: Γ wenn du eines tages βλΜΖ zu hause bist \ ) 1096 R: JA * H(\)
1097 R: *
DAS . glaub ich AUCH Η(/ \ )
1098 N: 1099 I:
DAS:
(1.6)
((lacht)) ((lacht))
(118) K2: (am Ende einer längeren Erzählung des R) 456 I: r dag aber GUT M(\) 457 N: L ((haucht))
(0.8)
458 R: *
JAA . H(\ )
also MIR macht das viel SPAß F[ H,F(\ \)
459 R:
und ich MERK auch daß ich F(\
460 R:
((schnalzt))
(0.7)
âh: in dem bereich:
. öh:
461 R: - wohl auch ganz gude verANlagungp habe so nech= \ / )]
462 I: mhm \/
159 Die Verwendung hoher globaler Tonhöhe in eskalierenden gleichlaufenden zweiten positiven Bewertungen paßt genau zu dieser Art von zweiter Aktivität. Sie ist durchaus metaphorisch interpretierbar im Sinne eines "Hochspielens" dieser zweiten eskalierenden positiven Bewertung auch in prosodischer Hinsicht. Negative Bewertungen werden demgegenüber eher genau umgekehrt "heruntergespielt" (s.u.). Auch emphatische Äußerungen sind mit der metaphorischen Interpretation vereinbar, daß die so kontextualisierte Äußerung gegenüber anderen Äußerungen "hochgespielt" wird.
2.2.3.1.2.Tiefe globale Tonhöhe Tiefe globale Tonhöhe kommt einerseits bei konversationell dyspräferierten Aktivitäten (Schegloff/Jefferson/Sacks 1977) wie negativen Bewertungstums, Zurückweisungen und Fremdkorrekturen vor, andererseits bei relativ zu einer laufenden Turnkonstruktionseinheit "untergeordneten" Aktivitäten wie Selbstkorrekturen, Nebenbemerkungen und Einschüben/Parenthesen. In Kombination mit anderen Parametern wird sie auch zur Kontextualisierung von Hintergrundkommentaren ohne Turnbeanspruchung verwendet (s.u.). (a) Konversationeil dyspräferierte Aktivitäten Zunächst einige Beispiele mit tiefer globaler Tonhöhe in negativen Bewertungen: (119) Kl: (Thema: Studienfächer) 418 I:
r
äh
äACH M(\ )
419 R: 420 N:
KUNST M(\ )
((lacht)) mhm \/
421 N: *
aber KONST is aber nich kein gutes ANgebot hier oder T,F(\ \ / )
422 I:
.
ES OE:HT NEE: . MICH so SONderlich GUT F(\ \ ) M(\ ) F(\ \ \)
(120) Kl: (nachdem R erzählt hat, daß seine Frau nicht nach OL ziehen wird) 1027 N:
* 1028 Ν:
1029 R:
dag ja
T(
AUCH ne blöde situation ne
\
/)
Oder
M( /
)
ja: \
β IS schon: bißchen M(\
.
HIHderlich aber . \ )
160 1030 R:
aso: (1.0)
es beLAstet jetz nich so unmöglich Τ,F(\
1031 R: f daß man das nich DURCHhaltn könnte \ ) 1032 N:
mhm \/
In (119): 421 und (120): 1027 werden negative Bewertungen mit tiefer globaler Tonhöhe formuliert. Diese Bewertungen wirken dadurch - genau umgekehrt zu positiven Bewertungen "heruntergespielt". In beiden Fällen reagieren hier die Rezipienten mit gleichlaufenden negativen Bewertungen, die aber auf mittlerer globaler Tonhöhe hegen. Die weiteren Ausführungen von R in (120): 1030f, mit denen er die Relevanz des negativ bewerteten Sachverhalts herunterstuft, liegen dann wieder auf global tiefer Tonhöhe. In diesen Beispielen scheinen also negative Bewertungen wie auch die Relevanzrückstufungen des negativ bewerteten Sachverhalts prosodisch mithilfe der Wahl tiefer globaler Tonhöhe "heruntergespielt" zu werden.17 Auch in Zurückweisungen und Fremdkorrekturen findet sich global tiefe Tonhöhe: (121) Kl: 589 R:
das HAT aber NICHTS weiter zu SAGN F
Dies ist natürlich auch weitere Evidenz für eine Dyspräferenz solcher negativer Bewertungen gegenüber positiven Bewertungen.
161 836 I:
aber V I E l e
M(î\ )
(121) beginnt damit, daß R gegenüber den beiden jüngeren Gesprächspartnerinnen, die in den Anfangssemestern sind, behauptet, daß er im achten Semester sei, habe nichts weiter zu sagen. N's Entgegnung in 590 weist er dann in 591f mit einer Reformulierung seiner Position mit tiefer Tonhöhe zurück. Auch hier scheint die tiefe Tonhöhe zugleich diesen Dissenspunkt in seiner Relevanz "herunterzuspielen". In (122) hatte I in der Formulierung des Resultats ihrer Erzählung in 832 zur Kontextualisierung des Gegensatzes zwischen also jeder FLUCHT aufwilmsHAVN und aberALle komm se zu(h)RÜCK ne schon tiefe globale Tonhöhe verwendet. Auch R's Fremdkorrektur na ALle komm se beSTIMMT nicht zurück du hat tiefe Tonhöhe. Diese könnte einerseits natürlich eine fortführende prosodische Anknüpfung sein, andererseits jedoch auch diese Fremdkorrektur als Aktivität "herunterspielen". An diese tiefe Tonhöhe knüpft dann I in ihrer Selbstkorrektur in 835 offenbar wieder an. Wenn diese Interpretationen zutreffen, dann legt dies nahe, daß bei konversationell dyspräferierten Aktivitäten wie Zurückweisungen, Fremdkorrekturen sowie negativen Bewertungen Sprecher die Tonhöhe verwenden können, um den Status dieser Aktivitäten als dyspräferierte Aktivitäten auch prosodisch zu kontextualisieren, indem sie diese Aktivitäten durch die tiefe Tonhöhe "herunterspielen".
(b) "Untergeordnete" Aktivitäten Aber auch einer laufenden und projektierten Turnkonstruktionseinheit untergeordnete Nebenoder Zwischenaktivitäten werden häufig mit tiefer Tonhöhe gegenüber den übergeordneten Aktivitäten kontextualisiert: So werden z.B. Nebenbemerkungen und Einschübe/Parenthesen in einer laufenden übergeordneten Einheit durch tiefe globale Tonhöhe "abgesetzt" und der übergeordneten Einheit so "untergeordnet", ggf. in Verbindung mit schnellerer Sprechgeschwindigkeit "eingeschoben", bevor die suspendierte übergeordnete Einheit wieder aufgenommen wird: (123) K2: 336 R:
und:
. â h im: . b e r e i c h geSANG h a m w i r F(/
337 R: *
ich W E I ß gar nich die genAUe zahl < d T(\ / \ )>
338 R:
also beSTIMMT \
. SIEBM ... FACHlehrer dafür \ \ )
162 (124) K2: 569 I :
u n d ich k a n n m i c h erXNnern M(\ / )
570 I:
ich h a b KIBt MITgesungp F(Τ\ )
571 I: *
ich h a b IMmer nur M(\
.
m a n K J S t e ja M I T s i n g n < d T(\ / )d>
572 I:
r d e n M O N D auf u n d zugemacht
573 N :
L
V
.
>
((lacht)) ((lacht))
(125) Kl: 604 N :
a ICH h a b jetzt A U überlegt o b ich nacher m a G I s t e r . F(/ \ \
605 N : *
P:RÖfung also Zwischenprüfung \
606 N :
=weil irgnwie geFÄLLT m i r das hier n i c h m e h r < all > F(\ )
HECHseln \
sollte= )
In (123) und (124) werden Nebenbemerkungen neben der übergeordneten Einheit mit tiefer Tonhöhe abgesetzt und so in eine projektierte und mit der Nebenbemerkung suspendierte Einheit eingeschoben. In (123) wird diese Nebenbemerkung zusätzlich mit schnellerer Sprechgeschwindigkeit kontextualisiert. Nach der Nebenbemerkung wird dann die suspendierte übergeordnete Einheit fortgesetzt. In (125) findet sich eine spezifische Art von Selbstkorrektur als Einschub. Hier werden das Korrektursignal also und die Korrektur selbst, Zwischenprüfung, mit tiefer Tonhöhe von der übergeordneten Kontur abgesetzt, die nach der Korrektur unmittelbar wiederaufgenommen und fortgesetzt wird. Ähnlich wird auch im folgenden Beispiel eine exemplifizierende Expansion gegenüber einer Erzählung "untergeordnet": (126) K2: 431 R:
JOA u n : d a n n : âh: d u r c h das giTARrespieln M(\ ) M(\ ) -
(0.6)
432 R:
ä h m h a b ich m i c h selbst beOLBItet u n d so F(\
163 434 R : *
435 R:
436 N :
= i c h h a b (0.5) T( < all > Γ s a c h e n A u s p r o b i e r t NACHgespielt u n d SOwas nech= \ \ \ / )
mhm \/
437 R:
=das:
*
T(
(0.5)
w a s m a n : so gern a n m u s i k H Ö R T
438 R:
u n d als ich dann hier ANgefangn h a b mit
...
(1.3)
/ )
SU 439 R:
aesanasUNterricht / )
440 R :
w a r i c h eigntlich so vonner v o n n e r Q R U N D l a g e h e r F(\
mhm
442 N :
àhm:: -
\/
R exemplifiziert und veranschaulicht in den mit tiefer Tonhöhe als Einschub kontextualisierten Turnkonstruktionseinheiten in 434-437 seinen vorherigen Erzählteil. Auch hier wird nach den Einheiten mit tiefer globaler Tonhöhe die vorherige globale Tonhöhe wieder aufgenommen. Diese Beispiele legen nahe, daß unabhängig von ihrer Länge bestimmte Elemente bis zu ganze Passagen in Turns mit tiefer Tonhöhe von der "übergeordneten" Einheit "abgesetzt" und dieser so "untergeordnet" werden können. Diese Einschübe suspendieren die Fortsetzung einer projektierten "übergeordneten" Einheit. Gegenüber den übergeordneten Einheiten sind die eingeschobenen und so kontextualisierten Einheiten oft ergänzend, klärend, verständigungssichemd oder auch korrigierend. Zumindest in den angeführten Beispielen erscheinen alle diese Einheiten in gewisser Weise gegenüber den übergeordneten Einheiten als "heruntergespielt". Damit stehen sie auch prosodisch genau im Gegensatz zu den neufokussierenden bzw. fokuswechselnden und emphatischen Turnkonstruktionseinheiten, deren konversationelle Relevanz offenbar mithilfe hoher Tonhöhe "heraufgespielt" bzw. "heraufgestuft" wird. Zusammenfassend läßt sich die interaktive Bedeutung der Kontextualisierungshinweise hoher und tiefer globaler Tonhöhenverlauf wie folgt kurz festhalten: [+ hohe globale Tonhöhe] -> Heraufstufen konversationeller Relevanz ("Hochspielen") [+ tiefe globale Tonhöhe] -> Herunterstufen konversationeller Relevanz ("Herunterspielen")
164 2.2.4. Prosodische Markierung: Kontextualisierung von 'Erstaunen' o.ä. Einige der bisher dargestellten lokalen und globalen Signalisierungsmittel konstituieren in spezifischen Kombinationen prosodisch auffällige, markierte Turnkonstruktionseinheiten. Für die Konstitution solcher prosodisch markierter Einheiten eignen sich offenbar v.a. folgende Kombinationen von globalen und/oder lokalen Tonhöhen- und/oder Lautstärkeveränderungen: (1) die Konstitution globaler Tonhöhen- und Lautstärkeveränderungen mit: - global hoher Tonhöhe (H( )), und - global größerer Lautstärke als in umliegenden Einheiten (); (2) die Konstitution lokal markierter Akzente mit: - lokal größerer Lautstärke (), und - lokal größerer Tonhöhenbewegungen als bei umliegenden Akzenten (t); - auffällige Längung der Akzentsilbe ('::' o.ä. in der Textzeile). Für die Konstitution prosodisch markierter Einheiten werden v.a. Signalkombinationen von H( ) und einem weiteren Parameter verwendet: Entweder die Kombination der beiden globalen Parameter H( ) + , ggf. mit weiteren lokal markierten Akzenten; oder die Kombination von H( ) plus wenigstens einem lokal markierten Akzent mit lokal größerer Lautstärke oder Bandbreite oder Länge als bei den umliegenden unmarkierten Akzenten. Prosodisch markierte Turns werden von Rezipienten anders interpretiert und behandelt als ihre unmarkierten Varianten. Ich beschränke mich auf die Analyse der prosodischen Markierung in konversationellen Fragen und Problemmanifestationen. Den Unterschied zwischen prosodisch unmarkierten und prosodisch markierten Äußerungen verdeutlichen die Beispiele (127) und (128), in denen die Problemmanifestation bitte einmal unmarkiert und einmal markiert formuliert wird. Die akustischen Analysen der beiden Problemmanifestationen stehen sich in Abb. 14 gegenüber. In der unmarkierten Form mit einem schwachen bis normal starken steigenden Akzent auf mittlerer Tonhöhe wird das Signal bidde - ebenso wie z.B. seine hochsprachennähere Variante bitte und das W-Wort was (s.u.) - als Manifestation eines akustischen Verstehensproblems verwendet und vom Rezipienten mit einer ggf. prosodisch veränderten Wiederholung bzw. Teilwiederholung des Bezugsturns behandelt. Das zeigt (127) (für weitere Beispiele siehe Selting 1987a: 3.2.1.):
165
• •
2030.0
•
2010.0
• 2020.0 300.0
•
500.0
7 0 0 . 0 ms
290.0
300.0
500.0
7 0 0 . 0 ms
300.0
500.0
7 0 0 . 0 ms
290.0
260.0
•
230.0
260.0 230.0
• 200.0 •
2060.0
W2040.0VI
200.0
170.0
•
170.0
140.0
•
140.0
500.0
300.0
7 0 0 . 0 ms
cía M( /
Abb. 14
(127) Kl: 1056 R:
d e n k ich S C H O N daß das a u c h M(\
A U S s c h l a g g e b m d ist \ )
ich w a r S I E b m JAHre m i t ihm z u S A M H F(/ \ \ )
1057 Ν :
1058 R:
1059 N: 1060 R:
1061 N:
.
BIDde= M(/ )
r =ich w a r SIEbm JJkHre m i t ihm zusamp^also d a is F 167 C: r ( (lacht) ) 168 E : RAUCH ich ne zigaRETte dazu L
169 E: 170 L:
r
171 C:
S(/
\
)
((lacht)) JA DAS ma ich AUCH M( \ ) F(/ \ )
((lacht)) j(h)a das kenn ich
172 C:
Γ das kenn ich zum beispiel OBERHAUPT nich
H,F(/ \ )
173 ? : mja: \/ 174 C:
r
175 L:
L
SO früh RAUchen uuh M(/ \ ) \ (da?)
E reagiert mit dem prosodisch markierten, 'erstaunten' JA auf C's Schilderung ihrer morgendlichen Gewohnheiten. Hier behandelt die Rezipientin C das Signal jedoch nicht sofort als Manifestation eines Widerspruchs zu den eigenen Erwartungen der E, sondern reagiert zunächst nur mit einem mhm. Im weiteren formulieren jedoch zunächst L in 165 und dann überlappend E in 166 und 168 ihre eigenen, ganz anderen Gewohnheiten und explizieren damit die unterschiedlichen Gewohnheiten der Gesprächspartnerinnen. Auf die Explikation die-
173 ser Gegensätzlichkeit reagiert C zunächst mit Lachen (167,171), bevor auch sie ihre Haltung zu den Gewohnheiten der anderen in 172 expliziert. Auch diese Explikation hat die Signalkombination H( ) + und drückt C's Erstaunen über L's und E's Gewohnheiten aus. Angesichts dieser Weiterentwicklung des Gesprächs bestätigt sich die Analyse des prosodisch markierten JA als erste Manifestation des Erstaunens bzw. des Widerspruchs zu den eigenen Erwartungen durch E, die ausgehend von ihren eigenen Gewohnheiten die Gewohnheiten der C als unerwartet, erstaunlich o.ä. inteipretiert. Alle diese Beispiele zeigen, daß unabhängig von der Länge und der Form der Turnkonstruktionseinheit bei verständigungssichernden und problemmanifestierenden Turns die Signalkombination H( ) + bzw. als Kontextualisierung von 'Erstaunen' bzw. eines Widerspruchs zu den eigenen Erwartungen verwendet wird. Diese Signale scheinen die anderen Signale zu überlagern und eine Bearbeitung und ggf. Klärung des signalisierten Widerspruchs zu verlangen. Auch die Signalkombination hohe globale Tonhöhe plus Akzent(e) mit größerer Bandbreite (H( ) + (Î)) wird häufig zur Signalisierung eines Widerspruchs zu den eigenen Erwartungen verwendet. Siehe die Beispiele (134)-(135): (134) KO: ((Thema: Peter)) 10:9
D:
m j a bei u n s e r m theATERstück w a r er:
M(/ 11:1
h a l t u n s e r beLEÜCHter
\ 11:2
M:
.
M U R beLEÜCHter=
H(T\ 11:3
D: E:
)
\
)
r =JA N U R beLEÜCHter M(\)F(\ \ ) wieso HU:R L M(\ ) ((Im w e i t e r e n erzählt D, w i e Peter ihr B e l e u c h t e r w u r d e u n d welche w i c h t i g e n A u f g a b e n ein Beleuchter hat.))
In diesem Beispiel markiert M ihren Turn in 11:2 mit global hoher Tonhöhe und einer großen Bandbreite beim ersten Akzent ihrer Einheit. Die Lautstärke ist gegenüber den umliegenden Einheiten dagegen kaum verändert. Dies zeigt auch die akustische Analyse in Abb. 17. M manifestiert damit ihr Erstaunen darüber, daß es in einer Laientheatergruppe eine Person gibt, die nur als Beleuchter fungiert. Im nächsten Beispiel wird die "Nachfrage" EHRlich NICH mit hoher globaler Tonhöhe und einem Akzent mit größerer Bandbreite als üblich prosodisch markiert: (135) K2: ((Thema: l's Tätowierungen)) 191 N :
u n W A S sacht deine M A m a dazu T,S(/ / )
...
174
mja&itûhaW^éiîjWwiZtfe l i a i W i UJt M( / \ )
Hita&fej&p Kuafofes^Ts h ( t\ \ ) Vla' sd«» M(\)F(\
\
)
M( \)
Abb. 17
192 I:
die h a t d a n o c h NIE: W A S ZU g e S A G T .
M,F(T\
\
EHRlich NICH H,F(T\ / ) no n i c h EIN W O R T
F(T\
\ )
195 Ν :
196 I:
197 I:
r
IS ja W I T z i c h = T,F(\ \ )
=mhm \/ FIND ich A U C H k o m i s c h F(t\ \ )
Ν manifestiert in Z. 193 ihr 'Erstaunen' darüber, daß I's Mutter auf I's Tätowierungen nicht weiter reagiert hat Während hier N's Tum unüberlappt nach dem vorherigen Turn steht, beginnt I ihre Folgereaktion früh, sobald sie N's Frage erkannt hat. In den Folgeturns bestätigt I, daß auch sie diese Reaktion erstaunlich fand und gibt damit retrospektiv zu erkennen, daß sie N's Nachfrage als 'erstaunte' interpretiert hat Die Akzente in den Zeilen 192, 194 und 197 verwenden dagegen Τ für die Signalisierung von 'Emphase' (vgl. Selting, im Druck). In den bisherigen Beispielen wurden die Merkmalkombinationen H( ) + bzw. oder (t) als Signale für die Konstitution sogenannter 'erstaunter' Nachfragen verwendet. Obwohl die Äußerungen ganz unterschiedliche Strukturen aufwiesen und unterschiedliche Elemente aus den Vorgängerturns Wiederaufnahmen, kontextualisierten sie in allen Fällen einen Widerspruch zu den eigenen Erwartungen.
175 Das Gemeinsame der bisherigen Beispiele war zudem, daß alle prosodisch so markierten Turns unüberlappt produziert wurden. Der Vergleich dieser Turns mit den weiter unten analysierten 'Unterbrechungen' (Kap. 2.3.2.) zeigt jedoch, daß die Signalkombination H( ) + nicht unabhängig von der sequentiellen Position der so kontextualisierten Rede analysiert werden kann. Im folgenden Beispiel wird eine andere Signalkombination, nämlich T( ) + , verwendet: (136) K2: 172 N:
WIK hasn das da tätoWIERT M < f >
178 I:
NEE: das (?war?) AUCH so: DÄMlich T(-) T,F(\ \ )
(( lacht ))
Der Turn in 177 wird mit tiefer globaler Tonhöhe und zwei starken Akzenten formuliert. Auch diese Frage wird von mir als Analysierender als "auffällige" und markierte Frage interpretiert. I als Rezipientin dieser Frage reagiert mit einer Erzählung darüber, wie es zu dieser Tätowierung gekommen ist. Im Unterschied zu den Fragen mit H( ), die 'Erstaunen' nahelegen, scheint die prosodische Markierung mit T( ) hier eher eine Art 'skeptische, befremdete Verwunderung' nahezulegen. Derartige Markierungsweisen mit T( ) finden sich jedoch im vorliegenden Korpus sehr selten und bedürfen der weiteren Untersuchung. Vermutlich sind [+ prosodisch markiert] und [ - prosodisch markiert] Ausprägungen einer Dimension, die von gegensätzlichen Polen eines Kontinuums strukturiert sind, deren interne Grenzen aber ggf. unklar und fließend sein können. Im konkreten Einzelfall kann also eine Einheit hinsichtlich der Dimension [± prosodisch markiert] durchaus nicht klar einem Pol zuneigen. In diesem Fall wäre die Interpretation dieser Äußerung vielleicht in besonderem Maße das Resultat subtiler interaktiver Aushandlungsprozesse. Als Fazit der Analyse kann festgehalten werden: Bei nicht-überlappenden verständigungssichernden und problemmanifestierenden Fragen, Nachfragen und Problemmanifestationen werden die Signal- bzw. Merkmalbündel H( ) + , H( ) + bzw. H( ) + (T)
176 als Ressource verwendet, um 'Erstaunen' bzw. einen Widerspruch zu den eigenen Erwartungen zu signalisieren. Sie kontextualisieren die Turnkonstruktionseinheit als eine sogenannte 'erstaunte Inferenzüberprüfung' bzw. 'erstaunte Nachfrage', deren Inhalt im Widerspruch zu den eigenen Erwartungen des Produzenten steht. Offenbar werden je nach hergestellter semantischer Beziehung zum Vorgängerturn so kontextualisierte Fragen ohne direkte Wiederaufnahme eines problematischen Elements als 'erstaunte Inferenzüberprüfungen', solche mit einer Wiederaufnahme eines problematischen Elements aus dem Vorgängertum als 'erstaunte Nachfragen' gehört und behandelt. Das Ergebnis der Analyse kann man wie folgt in Kurzform fassen: Bei [+ konversationelle Frage bzw. Nachfrage]: H( ) + {, , (Î)} -> 'Erstaunen', Widerspruch zu den eigenen Erwartungen Hierbei signalisiert die prosodische Markierung zusätzlich zu den in Kapitel 3 näher beschriebenen aktivitätstyp-konstitutiven Merkmalbündeln für diese Aktivitätstypen ein 'Erstaunen' bzw. einen "Widerspruch zu den eigenen Erwartungen'. Ihre sequentielle Implikation ist 'potentiell erforderliche Problembearbeitung bzw. Widerspruchsklärung': In der Regel behandeln die Rezipienten prosodisch markierter Turns diese nämlich anders als ihre prosodisch unmarkierten Varianten, nämlich in der Tat als 'erstaunte' oder 'verwunderte' Äußerungen, die Hintergrundinformationen oder Explikationen bisher implizit unterstellter Annahmen erfordern, um den signalisierten Widerspruch zu bearbeiten bzw. zu klären. (Vgl. hierzu noch genauer Selting, in Vorher.) Wenn hingegen der Rezipient des prosodisch markierten Turns keine Reaktion liefert, die vom Gesprächspartner als Beitrag zur Widerspruchsklärung interpretiert werden kann, dann obliegt dem Produzenten der erstaunten Äußerung die Signalisierung der von ihm präferierten Fortsetzung: Hier hat er die Möglichkeiten, entweder mit einer erneuten Nachfrage oder Problemmanifestation sein Bestehen auf einer Problembehandlung anzuzeigen (siehe Beispiele (130), (131)), oder aber mit Problemlösungs- und Relevanzrückstufungssignalen eine (weitere) Problembehandlung zu beenden oder zu verhindern, bzw. die Nicht-Behandlung des ursprünglich signalisierten Problems durch den Rezipienten zu ratifizieren (Beispiele (132), (133), (135)). Diese Analyse der prosodischen Markierung ist gebunden an Äußerungen, mit denen verständigungssichernde und problemmanifestierende Fragen und Nachfragen o.a. in nichtüberlappenden Turns gestellt werden, denn die Interpretation der Signalkombinationen ist nicht unabhängig von der sequentiellen Position des Turns, in dem sie verwendet werden. Die hier betrachteten 'erstaunten' Äußerungen kamen in nicht-überlappenden Turns vor. In überlappenden Turns kontextualisieren H( ) + auch 'Unterbrechungen' (siehe Kapitel 2.3.2.l.ff). In anderen Aktivitätstypen als Fragen und Nachfragen werden v.a. hohe Tonhöhe plus lokal markierte Akzente auch zur Signalisierung anderer interaktiver Bedeutungen wie z.B. 'Emphase' oder ggf. auch zur Signalisierung von Emotionen wie 'Erregung' verwendet. Es zeigt sich eine Verwandtschaft der globalen Tonhöhen in prosodisch markierten Einheiten zu derselben globalen Tonhöhe in unmarkierten Einheiten: H( ) in unmarkierten Einheiten wurde oben als eher "hochspielend" analysiert. Diese Interpretation paßt auch hier: 'Erstaunte' Äußerungen mit H( ) werden "hochgespielt", um ihr die besondere Aufmerksamkeit zu sichern, die nötig ist, um den manifestierten Widerspruch zu klären. Daß die
177 prosodisch markierten Turnkonstruktìonseinheiten anders behandelt werden als ihre unmarkierten Gegenstücke liefert Evidenz für die interpretative Relevanz der prosodischen Markierung. Im Hinblick auf die Analyse und Rechtfertigung der hier isolierten Einzelparameter einer Prosodie der Konversation liefert die Verwendung der globalen Tonhöhe und der erhöhten Lautstärke in diesen prosodisch markierten Turns auch weitere Evidenz für die interpretative Relevanz der Unterscheidung zwischen lokalen und globalen Beschreibungsparametern. Die globalen Tonhöhen und die globalen und lokalen Lautstärkeveränderungen werden nämlich hier als eigenständige Signale sichtbar, die unabhängig von den lokalen Tonhöhenbewegungen konstituiert weiden und die als eigenständige konstitutive Signale für die Kontextualisierung von Äußerungen verwendet werden.
178
2.3. Die Organisation des Sprecherwechsels Bei der Analyse der Prosodie des Sprecherwechsels geht es um die Rolle der Prosodie einerseits für die Projektierung und Kontextualisierung eines bevorstehenden Turnendes, und andererseits für die Signalisierung und Kontextualisierung überlappender gleichzeitiger Rede während eines laufenden Turns als kompetitiv/unterbrechend oder nicht Diese beiden Analysekomplexe werden in den folgenden Kapiteln behandelt.
2.3.1. Projektierung und Kontextualisierung von Turnende Im Kapitel zur Prosodie der Einheitenkonstruktion habe ich bereits etliche Beispiele angeführt, aus denen hervorging, daß eine an syntaktischen oder aktivitätstypspezifischen Orientierungsschemata gemessen noch unvollständige Struktur ihre eigene Fortsetzung projektiert zumindest solange sie nicht erkennbar abgebrochen und durch einen Neuansatz auch retrospektiv als abgebrochen kontextualisiert wird. In diesem Sinne hatte ich gefolgert, daß syntaktische Einheiten wie 'Sätze' und/oder aktivitätstypspezifische Strukturen wie die erwartbaren Teil-Aktivitäten beim 'Erzählen', 'Argumentieren', 'Beschreiben', 'Jemanden vorstellen', 'ein Seminar durchführen1, 'eine Sitzung leiten' usw. als globale Orientierungsschemata eher globalere Projektierungen ermöglichen, wohingegen prosodische Signale eher lokalere Kontextualisierungen von Aktivitäten innerhalb solcher globalerer Schemata leisten. Spezielle Haltesignale, v.a. gleichbleibende Tonhöhenverläufe in Kookkurrenz mit Lautdehnungen etc., projektieren eine Fortsetzung der Einheit An möglichen Einheitenenden kontextualisieren sowohl fallende als auch steigende lokale Tonhöhenbewegungen mögliche Einheitenenden, nach denen jedoch prinzipiell noch weitere Einheitenverlängerungen kohäsiv angeschlossen werden können. Diese Analyse soll nun in bezug auf das Turnende ergänzt werden. In neuester Zeit wird die Rolle der Prosodie für die Signalisierung eines bevorstehenden Turnendes intensiv diskutiert. Es stellt sich die Frage, ob spezielle Merkmalbündel aus Tonhöhe und anderen prosodischen Parametern dazu beitragen, das Ende einer Einheit als nichtturnbeendend versus turnbeendend zu kontextualisieren. In der bisherigen Diskussion um diese Frage stehen sich anscheinend die Positionen von Jefferson 1986 und Local/Kelly/Wells 1986 gegenüber. Bei der Beschäftigung mit der Frage, an welchen Stellen Überlappungen beim Turnwechsel vorkommen und konkret bei der Frage "what is 'completion'?" kommt Jefferson 1986 zu folgendem Ergebnis: "When I talk about how recipients monitor an utterance in progress, I talk in terms of possibly complete actions, and/or syntactic possible completion. Now and again people ask if I've considered intonation, and if so, does it matter? I say I have, and it doesn't seem to. At the start of this project on overlapping talk I did a mass of transcribing, and was careful to catch a range of intonational features, assuming that would have a lot to do with the phenomenon. But while I was working with the materials, it didn't seem to matter. Speakers would, for example, produce what I heard as 'full stop' intonation and then keep going (...). Or, for example, speakers would produce 'continuing' or indeterminate intonation, a recipient would start up, and there would
179 be a clean transition (...)· What held across cases of clean transition and recipient onset resulting in overlap alike was observable completed actions or syntactic possible completion" (ebd.: 179f). Bei einer Zählung von ca. 800 Fällen nicht-überlappenden und ebenfalls ca. 800 Fällen überlappenden Turnwechsels und deren Kookkurrenzen mit 'completion' oder 'non-completion' Intonation ergab sich folgende Tendenz (ebd.: 180): "Clean Transition: Overlap:
ca. 70% ca. 30% ca. 75% ca. 25%
after completion intonation; after non-completion intonation; after non-completion intonation; after completion intonation."
Aber laut Jefferson wird Intonation nicht als Turnwechsel-Signal, sondern nur als kookkurrierende Begleiterin verwendet: "Conceivably, then, the intonation contours in question constitute some sort of 'accompaniment' rather than a transition-relevant 'signal', such that in these clean transitions we are seeing an incidental convergence rather than something like cause and effect. Perhaps it's not 'because' a speaker produces completion intonation that a recipient starts up, but it so happens that a speaker has produced this contour while a recipient has - by reference to such features as action and syntax - found an utterance to be possibly complete" (ebd.: 181). Andere Autoren, die allerdings mehr Parameter als nur Tonhöhe berücksichtigen, insbesondere auch Sprechgeschindigkeit, und die auch die Tonhöhe in differenzierteren deskriptiven Parametern erfassen, kommen zu anderen Ergebnissen. Duncan/Fiske 1977 erzielten aufgrund ihrer strukturellen Analyse des Turn-taking in natürlichen Gesprächen das Ergebnis, daß Sprecher ein oder mehrere der folgenden Signale verwenden, um dem Rezipienten ihr Turnende anzuzeigen: fallende oder steigende, aber nicht gleichbleibende, Tonhöhe am Ende einer 'phonemic clause' ('intonation-marked clause'); eine Reihe sogenannter 'stereotyped expressions' oder 'sociocentric sequences' wie you know oder or something; grammatische Vollständigkeit; Lautdehnung ('paralinguistic drawl') in der letzten Silbe oder der betonten Silbe einer 'phonemic clause'; Abnahme von Tonhöhe und/oder Lautstärke ('decrease in paralinguistic pitch and-or loudness') in oder am Ende der 'sociocentric sequence'; die Beendigung einer innerhalb des Turns verwendeten Handbewegung (ebd.: v.a. 176ff). Je mehr Signale gesendet werden, um so größer ist die Wahrscheinlichkeit, daß auch tatsächlich ein Sprecherwechsel stattfindet. Dennoch kann der Sprecher alle anderen Signale mit einem Gestikulationssignal ('speaker gesticulation signal'), d.h. einer Handbewegung über die Stelle hinweg, an der die anderen Signale gegeben werden, außer Kraft setzen. Es wird argumentiert, daß das Turn-taking System eher 'erlaubend' als 'zwingend' sei: Nach der Sendung der genannten Signale hat der Hörer die Möglichkeit, den Turn zu übernehmen, aber nicht die Verpflichtung. Nach dieser Analyse wird also das Turnende mit Hilfe prosodischer Signale signalisiert und geordneter Turnwechsel ('smooth transition') kommt durch die Sendung solcher Signale zustande.1
Zu einer Kritik dieses Ansatzes vgl. Goodwins 1979 Rezension.
180 Auch Local/Kelly/Wells 1986 suchen die phonetischen Exponenten/Parameter der Signalisierung von Turnende, die hierfür in Dienst gestellten "delimitative systems". Hierbei gehen auch sie (ebd.: 413) davon aus, daß nicht nur Tonhöhe ('pitch') und andere prosodische Parameter eine Rolle spielen, sondern sie suchen die "general phonetic resources" auch im segmentalen Bereich. Ihr Gegenstand ist die Organisation des Turn-taking im nordenglischen Dialekt von Tyneside. Bei 'turn-endings' identifizieren sie zwei 'classes' bzw. Varianten phonetischer Merkmalcluster, die sich nur durch den Parameter Tonhöhe unterscheiden. Am häufigsten tritt das folgende erste Cluster phonetischer Merkmale mit Tonhöhenanstieg am Turnende auf: "(a) A general slowing down in tempo to the end of the turn (...). The domain of this slowing down is, minimally and usually, the last two feet (Abercrombie, 1964) of the turn. (b) A sudden increase and decrease in loudness during the ictus syllable of the last foot of the turn. We call this 'swell' (...). (c) Appreciable duration on the ictus syllable of the last foot of the tum whatever the phonological length of the vowel (...). (d) Centralized quality in the vowel(s) of the last foot of the turn (...). (e) A pitch step-up at the end of the tum, which is usually greater than any other pitch step-up in the turn and which always attains a higher point than any other stepup in the turn" (ebd.: 416). (Der genaue Tonhöhenverlauf kann hier noch weiter in Klassen unterteilt werden, siehe hierzu ebd.: 420). In anderen Fällen sind die Merkmale (a) bis (d) identisch, lediglich der Intonationsverlauf in (e) ist anders, nämlich bis nach tief in der Bandbreite des Sprechers fallend: "(e) a drop in pitch, on the last syllable of the tum, to the bottom of the speaker's range" (ebd.: 420). Hieraus geht hervor, daß prinzipiell ein ganzes Merkmalbündel an der Signalisierung eines Turnendes beteiligt ist. Intonation am Ende eines Turns spielt hier eine konkomitante Rolle und kann, wie gerade im Tynesider Dialekt, dialektspezifisch verwendet werden. Evidenz für die interpretative Relevanz dieser Cluster ergibt sich für Local/Kelly/Wells aus fünf Beobachtungen: (1) Offenbar wurden solche Turnteile, die die o.g. phonetischen Merkmale aufweisen, vom Sprecher als vollständig signalisiert bzw. deren Interpretation als vollständig war vom Sprecher vorgesehen. In keinem Fall gibt der Sprecher nämlich nach dem Turnwechsel zu erkennen, daß er noch nicht fertig war mit seinem Redebeitrag (vgl. ebd.: 423ff). (2) Auch Rezipienten behandeln so signalisierte Redeteile als vollständigen Turn, denn nach so gekennzeichneten Turnenden beginnen nächste Sprecher ihre Turns ganz normal und ohne Verzögerung (vgl. ebd.: 426). (3) An anderen, von der syntaktischen Struktur her möglichen Turnübergabepunkten, wo die o.g. Merkmale nicht auftreten, sondern im Gegenteil noch oft ein 'rush through' des Sprechers 'turnholding' signalisiert, finden normalerweise keine Turnwechsel statt bzw. beginnen bisherige Rezipienten normalerweise nicht mit einem Turn (vgl. ebd: 426f). (4) Wenn jedoch vom bisherigen Rezipienten Turns begonnen werden an Punkten, an denen der bisherige Sprecher keine der o.g. Turnbeendigungssignale verwendet hatte, dann sind diese parallelen Turns auch speziell auf diese Position zugeschnitten: sie sind z.B. mit
181 den phonetischen Merkmalen 'leise' und 'tief als nicht-kompetitive/nicht-unterbrechende Hintergrundbemerkungen kontextualisiert (vgl. ebd.: 429ff). (5) Wenn nach einem Turnende mit den genannten Turnbeendigungssignalen der Sprecherwechsel nicht erfolgt, da der bisherige Rezipient die Sprecherrolle nicht übernimmt, so kann der bisherige Sprecher z.B. durch das "Nachschieben" einer Tag-Question und einer kurzen Pause signalisieren, daß sein Turn beendet war. Damit macht er die Nicht-Übernahme des Turns durch den Rezipienten an einer Stelle, an der diese Turnübernahme angesagt war, in irgendeiner Weise "auffällig" ('noticeable'; vgl. ebd.: 432f.). Auch Schegloff 1987 beschäftigt sich mit der Prosodie am Turnende. Er beschreibt 'pitch peaks' und 'raised amplitude' auf Silben kurz vor einem Turnende als Beginn des 'turnübergabe-relevanten Raums': "The relevance of a pitch peak of this sort (but certainly not all pitch peaks) is that it marks the enhanced likelihood that the next possible completion of the turn-constructional unit will be an actually intended turn-completion. [...] That is, the developing grammatical structure of an utterance in the course of its production is potentially compatible with alternative points of possible completion. Pitch peaks, and their suppression, are one means by which speakers can indicate which syntactically possible completions are built to be completions on this occasion, and which not. A pitch peak thus can project intended turn completion at the next grammatically possible completion point. In doing so, it can also open the "transition relevance space" (Sacks et al., 1974, p. 703 et passim), the stretch of time in which transition from current to next speaker is properly done. It is after such pitch peaks that intendingnext-speakers who aim to get an early start begin their next turns. It is such pitch peaks which speakers suppress to show their parsing interlocutors that imminent syntactically possible completions are not designed to be actual completions. It is such pitch peaks after which speakers may increase the pace of their talk in an effort to "rush through" into a next turn component. Such a pitch peak can, then, mark the imminent completion of a turn, and the appropriate place for a next turn, and its speaker, to start" (Schegloff 1987:106f; ebenso in ders. 1988: 144f). Solche Strukturen zeigen, daß sich Interaktionspartner an Intonationskonturen orientieren und sie als Ressource für ihre Gesprächsorganisation nutzen. Die Beschreibungen von Jefferson 1986, Duncan/Fiske 1977, Local/ Kelly/Wells 1986 und Schegloff 1987 beziehen sich offenbar auf dieselben relevanten Stellen, die lediglich unterschiedlich benannt und mit unterschiedlichen Methoden untersucht werden. So scheinen die von Local/Kelly/Wells 1986 beschriebenen Silben, bei denen die delimitiven Merkmalbündel, v.a. 'swell' und 'duration' mit folgendem 'pitch step-up' bzw. 'drop' im letzten Takt des Turns beginnen, den Silben mit 'pitch peaks' und 'raised amplitude' kurz vor dem Turnende bei Schegloff 1987 zu entsprechen. Und diese Silben entsprechen auch meiner letzten Akzentsilbe der Akzentsequenz mitsamt ihren unakzentuierten Folgesilben in der letzten Akzenteinheit. Die unakzentuierten Silben nach der letzten Akzentsilbe sind weniger prominent als die vorherige Akzentsilbe. Wodurch dies im Detail zustandekommt, wird bei meiner Analyse nicht mehr genau parametrisch aufgeschlüsselt Im Unterschied zu Locai et al. und Schegloff fasse ich den letzten Akzent der Einheit und seine unakzentuierten Folgesilben als strukturelle Elemente der Kontur auf, wohingegen Locai et al. und Schegloff sie eher losgelöst als Einzelphänomene am Ende von Einheiten betrachten. Ebenso wie für Schegloff ergibt sich für mich, wie die folgende Analyse zeigen
182 wird, die Position der letzten Akzenteinheit als letzte Akzenteinheit aus deren Position in Relation zur syntaktisch projektierten Einheit Darüber hinaus beschreiben Local/Kelly/Wells 1986, wie auch Duncan/Fiske 1977, sowohl steigende als auch fallende Tonhöhenbewegungen als delimitiv; die genaue Tonhöhenbewegung scheint in unterschiedlichen Varietäten des Englischen eine unterschiedliche und z.T. dialektspezifische Rolle bei der Turnkonstruktion zu spielen. Dies entspricht auch meiner eigenen Analyse: Der gleichbleibenden Tonhöhenbewegung als Turnhaltesignal stehen fallende und/oder steigende Tonhöhenbewegungen in der letzten Akzenteinheit als mögliche Turnendesignale gegenüber. Im folgenden wird anhand eigener Analysen zuerst die Intonation am Turnende untersucht, dann der Frage der Beziehung zwischen v.a. der Syntax und der Prosodie für die Projektierung des Turnendes nachgegangen, schließlich die Rolle des letzten Akzents der Einheit weiter beleuchtet
2.3.1.1. Turnhalten und Turnbeenden Ebenso wie bei der Projektierung einer Fortsetzung bei einheiten-internen "Störungen" (s.o. Kap. 2.1.2.) kann auch an einem Einheitenende der Sprecher mit gleichbleibender und ggf. leicht steigender Tonhöhenbewegung, ggf. in Kombination mit anderen Signalen, ein beabsichtigtes Tumhalten signalisieren und damit eine Turnfortsetzung projektieren. Demgegenüber sind fallende und steigende Tonhöhenbewegungen nicht in dieser Weise turn-haltend.
(a) Tumhalten Zunächst einige Beispiele für die Projektierung einer Tumfortsetzung mit Hilfe einer letzten gleichbleibenden Tonhöhenbewegung als Turnhaltesignal: (1) Kl: 1074 R:
= n a m : M I R geht das so daß ich auch: \ M( / < f , d i m dim>
1075 R :
ö h schon jahreLANO so lebe \ )
1076 R:
i c h h a b ö h STAudich < all > F(\ a c h SO (\)
1077 N :
1078 R:
.
d i e beZIEhung zu w i l l e m s h a v n AOPrechterhaltp \ / ) -
(0.6)
183 1079 R:
1080 R: 1 0 8 1 N:
auf der A N d e r e n seite aber: b i n ich a u c h F - b e r u f l i c h viel A u ß e r h a l b gewesen so W A S w e i ß ich \ ) T(\ ) mhm \/
1082 R:
AOSbildung oder M(\ )
1083 R:
h a b a u c h A u ß e r h a l b geAKbeitet schon < all >M(\ \ )
1084 R:
u n d J E T Z T eben die U H I hier M(\ \
1085 N :
in o l d e n b u r c h ) mhm \/
(0.6)
In Zeile 1082 findet sich die Projektierung einer Fortsetzung der begonnenen und noch nicht beendeten Turnkonstruktionseinheit mit Hilfe einer gleichbleibenden Tonhöhenbewegung bei der Konjunktion oder. Dies entspricht der bereits oben dargestellten prospektiven Kontextualisierung einer turn-internen "Störung". Demgegenüber wird jedoch in Z. 1078 eine gleichbleibende unakzentuierte Tonhöhenbewegung bei den letzten Silben einer möglichen syntaktisch vollständigen Konstruktion produziert Danach folgt eine Pause und derselbe Sprecher R setzt seinen Turn fort Wenn diese letzte gleichbleibende Tonhöhenbewegung analog zu ihrer Verwendung bei einheiten-intemen Störungen als Turnhaltesignal verwendet wird, so kookkurriert dies hier mit einer ebenfalls auf diskurssemantischer Ebene noch ausstehenden Fortsetzung: Die Gesprächspartner reden über die Beschwernisse von Wochenendbeziehungen bzw. Wochenendheimfahrem, die ständig zwischen zwei Orten pendeln. Wenn nun R über seine eigene Pendler-Situation spricht und als einen Ort willemshavn benennt dann ist nun der Bezug auf einen anderen Ort erwartbar. Die prosodische Fortsetzungsprojektion unterstützt damit lokal am Ende der Einheit in Z. 1078 die globaler aufgebaute diskurssemantische Fortsetzungsprojektion. Potentielle Turnenden, an denen mit gleichbleibenden letzten Akzenttonhöhenbewegungen eine Fortsetzung projektiert wird, finden sich im nächsten Gesprächsausschnitt (2): (2) Kl: 422 N :
aber R O H S T is aber n i c h kein gutes ANgebot h i e r o d e r T,F(\ \ / )
423 I:
.
424 N :
. mhm .
ES O B t H T NEE: . H I C H so SONderlich G U T F(\ \ ) M(\ ) F(\ \ \)
184 425 I:
A:ber ich mach das jetzt hier zuKNde M(t- )
426 I:
WEIL: eine ausbildung BRAUCH der mensch M(Î)
427 I:
aso s HAB ich mir jetzt so geSA:OT F(\ \ )
428 I:
und:
429 I :
ich MACH das hier zuEHde M(t- ) < all >
430 I:
un mal SEHN was DANN kommt F(\ \ )
431 N:
in WELchem semester BIS du denn S(\ \ )
.
ich KOlbner mich da nich HEIter drum M(\ t)
Nach jeder der Turnkonstruktíonseinheiten in den Zeilen 425, 426, 427, 428, 429 und 430 könnte vom Aktivitätstyp und von der aufgebauten Diskurssemantik her I's Explikation ihrer Entscheidung, trotz des schlechten Angebots in ihrem Studienfach den Studienort nicht wechseln zu wollen, potentiell beendet sein. Dennoch formuliert sie die Einheiten in 4 2 5 , 4 2 6 , 4 2 8 und 429 mit einer nach oben abgesetzten gleichbleibenden letzten Akzenttonhöhenbewegung. Während die wiederholte Absetzung bzw. Heraushebung der Akzenttonhöhenbewegung eher stilistisch erklärbar ist (siehe Kap. 2.2.2.3.), so ist doch die gleichbleibende Richtung der letzten Tonhöhenbewegung als Turnhaltesignal interpretierbar. Danach behält I das Rederecht und kann sich sogar eine Pause nach jeder so kontextualisierten Einheit erlauben, bevor sie ihren Turn fortsetzt. Evidenz für die Interpretation einer letzten gleichbleibenden Akzenttonhöhenbewegung als Turnhaltesignal ergibt sich aus (3): (3) K l : 1021 N:
=aber daß sie nach Olidenburch ganz kommt F[ H, F ( / )
1022 Ν:
oder daß ihr HIER l:ebt F( / )
1023 R:
NEE das kommt nich in FRAge weil: sie dort ARbeitet ne F(\ \ \ /) is nich DRIN ( \)1
1024 N:
1025 R: * 1 0 2 6 N:
sie hat ρ festen JOB da M( ... ) ach SO mhm (\)
\/
185 (2.4) 1027 Ν:
da? ja AUCH ne blöde situation ne
T(
\
.
/)
Auch hier könnte diskurssemantísch die Einheit in 1025 turnbeendend sein und faktisch ist sie es auch, denn R setzt nicht fort und in 1027 übernimmt Ν den Turn. Dennoch verwendet R in 1025 eine letzte gleichbleibende Akzenttonhöhenbewegung, ein Turnhaltesignal. Ν reagiert darauf mit dem Rezeptionssignal mhm, das die von R projektierte Turnfortsetzung ratifiziert Da R aber nicht fortsetzt, entsteht eine lange Pause von 2.4 Sekunden, nach der Ν den Folgeturn erst übernimmt. Hier zeigt sich, daß Ν eine Turnhalte-Kontextualisierung interpretiert hatte und daß dann bei Nicht-Fortsetzung einer projektierten Fortsetzung ein rascher Tumwechsel verhindert ist. Ebenso wie gleichbleibende Tonhöhenverläufe, ggf. in Kombination mit anderen Signalen, im Falle einer einheiten-internen Störung eine Einheitenfortsetzung projektieren, so kann auch eine gleichbleibende Tonhöhenbewegung am möglichen Ende von Turnkonstruktionseinheiten eine Fortsetzung des Turns projektieren. Das Gemeinsame beider Verwendungen gleichbleibender Tonhöhenbewegungen wäre dann, daß sie eine noch ausstehende Beendigung der (prosodischen und melodischen) Einheit projektieren. Unter bestimmten Umständen scheinen für diese Fortsetzungsprojektion auch leicht, d.h. im Rahmen mittlerer Globaltonhöhenverläufe, steigende Tonhöhenbewegungen verwendet zu werden: (4) Kl: 544 I:
weil das WOLLT ich mir nich mehr LEIstn hier F(\ \ )
545 I:
mm: MEHRmals inner WOche w:âhrend ich hier: M( / \
546 I:
nach OLdnburch muß \ )
547 N:
mhm=
548 I:
=dann BIN ich nämlich nur UNausgeschlafen H(\ / )
549 I: •
\/
- und KRXCH nur halbe SAchen mit M(\ \ /) mhm \/
L
550 N:
551 R:
551al: 552 R:
du bist in Wilhelmshaven dann
H(/ ) - mhm \/ . in einem Bistro . L
H(/ )
186 I scheint in Ζ. 549 mit der letzten steigenden unakzentuierten Tonhöhenbewegung eine Tumfortsetzung zu projektieren, die Ν mit dem Rezeptionssignal mhm ratifiziert. Diskurssemantisch und aktivitätstypspezifisch könnte der Turn hier durchaus beendet sein. Allerdings setzt auch hier, wie in (3), die Turninhaberin I ihren projektierten Turn nicht fort. Und auch hier verstreichen dann ca. 1.5 Sekunden Pause vor dem Turnwechsel zu R. Auch hier scheinen sich also die Rezipienten Ν und R daran zu orientieren, daß I mit der steigenden letzten Tonhöhenbewegung eine Turnfortsetzung projektiert hat. Bei der Analyse steigender letzter Tonhöhenbewegungen ergibt sich jedoch das Problem, daß sie je nach Aktivitätstyp, in dem sie verwendet werden, ggf. auch aktivitätstypspezifische oder stilistische Kontextualisierungen leisten (s.u.). In (5): 301 finden wir jedoch bei bestehender diskurssemantischer Fortsetzungserwartung keine Turnhaltesignale, sondern eine fallende Tonhöhenbewegung im Bereich mittlerer Globaltonhöhe: (5) Kl: 300 R :
âhm .
301 R: *
=aber ich DENK immer M(\ )
302 R:
is vielleicht η bißchen KURZ g e d a c h t = M( / )
r w a s K O M M T für M I C H dabei RAUS ne M(/ T\ \ /)
303 N :
304 R: 305 R: 306 N :
mhm \/
W E N N die sich schon v o n v o r n h e r E I N so M( / \ ρ auf ne spezielle theMAtik àhm: / hm \
307 R:
E I N s c h i e ß e n oder EINstellen / / )
308 R:
u n d d a n n : unter UMstândp a u c h dann SOLche M (/ \
309 R: *
p a s s i e r e n öh: ) -
310 N :
r mhm
311 R:
L ((lacht))
312 I:
sachen
ja w a s W I L L der eigntlich hier F(\ )
ja d a s F I N D ich aber η STARkes STÜCK \ F(\ \ \ )
187 Hier haben die Gesprächspartner schon eine Weile über Seminare mit frauenspezifischen Themen geredet. I hat gerade von einem Fall erzählt, in dem einem Mann von den anwesenden Frauen in einem Seminar mit einem frauenspezifischen Thema das Recht abgesprochen wurde, an dem Seminar teilzunehmen. Daraufhin fragte Ν den R, ob er denn schon einmal an einem Seminar mit einem frauenspezifischen Thema teilgenommen habe, was R verneint hat und im wiedergegebenen Ausschnitt nun weiter begründet. Diskurssemantisch ist in diesem Zusammenhang zu erwarten, daß die Einheit aber ich DENK immer in Z. 301 eine Fortsetzung projektiert, in der das Objekt dieses Denkens expliziert wird. Dieses Beispiel zeigt, daß bei bestehender übergreifender Fortsetzungsprojektìon eine weitere prosodische Fortsetzungsprojektion mit lokalen Turnhaltesignalen zumindest nicht zwingend ist. Eine andere Art der Kontextualisierung einer beabsichtigten Turnfortsetzung findet sich in (5):309. Dort könnte nach der syntaktischen Konstruktion in Z. 308-309 und dann: unter UMständn auch dann SOLche sachen passieren durchaus die Einheit bzw. der Tum potentiell beendet sein. In diesem Fall könnte das referierende SOLche (sachen) anaphorisch rückbezogen werden auf die vorherige Erzählung der I über die Behandlung des Mannes in einem Seminar mit einem frauenspezifischen Thema. Hier fügt jedoch R an das mögliche Satzende das Turnhaltesignal öh: mit einer Lautdehnung und mit einer gleichbleibenden Tonhöhenbewegung an und projektiert so mit diesen lokalen Turnhaltesignalen eine Fortsetzung seines Turns. Diese Fortsetzung wird dann auch gleich anschließend geliefert.
(b) Turnbeenden In den bisherigen Beispielen standen den turnhaltenden Einheiten mit gleichbleibender oder leicht steigender letzter Tonhöhenbewegung z.T. letzte turnvergebende Einheiten mit fallenden oder steigenden letzten Tonhöhenbewegungen nach. Ob eine fallende oder eine steigende letzte Tonhöhenbewegung am Turnende gewählt wird, scheint jedoch weniger von der Turnbeendigung als vielmehr vom konstituierten Aktivitätstyp abzuhängen. So werden in Kap. 3 unterschiedliche Typen konversationeller Fragen untersucht, die sich z.T. allein durch eine fallende versus steigende letzte Tonhöhenbewegung unterscheiden. Auch bei anderen konversationellen Turns als Fragen kommen am Turnende sowohl fallende als auch steigende Tonhöhenbewegungen vor. Die fallenden Tonhöhenbewegungen können dabei innerhalb einer mittleren Globaltonhöhe verbleiben oder auch bis zu einer tiefen Tonhöhe fallen. Ob die Tonhöhenbewegung bis zu einer mittleren oder tiefen Tonhöhe fällt, scheint allein keinen Einfluß auf die Interpretation der Einheit als turnbeendigend oder nichtturnbeendigend zu haben. Dies zeigen die folgenden Beispiele. In (6) und (7) kommen Turns mit (relativ tief) fallender letzter Tonhöhenbewegung am Ende global fallender Intonationskonturen vor. Im einen Fall, (6):776f, setzt der Rezipient mit weder schnell noch verzögert anschließender Turnübemahme fort; im anderen Fall, (7):338f, erfolgt die Turnübernahme nach einem Rezeptionssignal und einer Pause:
188
(6) Kl: 774 I:
ich WEIß AUCH nich F(/ \ )
775 I:
das KRICH ich auch immer in großen F (/
776 I: *
HALLN und in muSEEN un so \ \ )
777 Ν:
un da WARS du noch NICH mit beim ARZT um mal zu M(\ / \ ) *NEE T(\)
778 Is
(7) K2: 326 Ν:
und geSANO M(/ )
328 N:
HABT ihr denn hier irgndwie son: son LEHrer F(\ ... /
329 Ν:
oder wie LAUFT das \ )
330 R:
jaa=es GIBT ähm: \ F(\
331 R:
((räuspert sich))
332 R:
für JEdp \ ) für jedes FACH M(/ )
..
für jedp: âh für jedes instruXENT und ebm auch für
T(
...
t\
für .. den geSANGSbereich ähm \
. PACHlehrer dann \ )
335 N:
mhm \/
336 R:
und: . äh im: . bereich geSANG ham wir F(/
337 R:
ich WEIß gar nich die genAUe zahl T(\ / \ )
338 R: Γ also beSTIMMT \
339 N:
...
. SIEBM ... FACHlehrer dafür \ \ ) mhm \/
189 340 Ν:
und wie LBRNT man das muß man da VORsingn oder was M(/ ) M(\ )
Jedoch kommen genau solche Tonhöhenbewegungen auch am Ende von nicht-turnbeendenden Einheiten mitten im Turn vor. Siehe das folgende Beispiel, in dem außer der am Ende der Einheit in Zeile 112 tief fallenden Tonhöhe auch noch das deutliche Einheitenendesignal benutzt wird, und dennoch dieselbe Sprecherin den Tum fortsetzt: (8) K4: 106 C:
man k* .. aso FRAU kann eignlich nich SAGN: F(/ \
107 C:
daß es so: äh DIB feministische theololOIB gibt= / \ )
108 C:
=sonnern da gibts GANZ viel verschiedene (\
109 C:
STRÖmungn und* .. Î)mhm= \/
110 E: 111 C:
=VXEle arbeiten halt auch so mit F(\
112 C:
mit som: ja:
113 C:
un das SIEHT dann auch wieder OANZi F(\ /
114 C:
UNterschiedlich aus=daß sie ersmal versuchen \ ) < all > M(\
115 C:
überhaupt noch matriarCHAle religiOfl: zu erforschn ... / \ )
matriarCHAlen ANsatz oder so / \ )
...
Dieselbe Situation ergibt sich jedoch auch bei den Turnenden mit einer nur im mittleren Globalverlauf fallenden letzten Tonhöhenbewegung: (9) K l : 474 I:
Ν:EE das: aber DAS wàr ja unMÖOlich M( - ) M(/ \ ) < all >
.
475 I: *
DAS würde man überhaupt nich SCHAF£en M(/ \ )
476 N:
NEE: M(\)
*ich ARbeite AO=deswegn FRAG ich M(\ \) M(\ )
190
(10) Kl: 1008 R:
oder wir WOHF halt zuSAiqi da
r
T(\
/
((lacht))
1009 Ν: un:d öh: . dann:
1010 R:
(1.2)
*:is das die Ausnahme T(\
daß ich dann mal HIER bleibe in OLdenburch ne \ \ /) mja das dja \ T( 1014 R: was wir schon geMACHT habm is : M( / 1015 R: r daß: áh: sie MICH dann mal besuchen kommt * \ mhm 1016 N: \/ 1017 I:
jaa \
1018 N: r
IS (h)vielleicht ja AU(h) ma ganz(h) nett ((lacht)) M(/ \ )
(h)hm
1019 I:
\
(11) K l : 471 N:
un WIB finanziere du dein: STUdium F(\ / )
472 I: *
ja ich geh ebm abms ARbeitn \ < all > M(\ )
473 N:
JEDN ABMD F(\ \ )
474 I:
N:EE das: aber DAS wâr ja unMÖQlich M( - ) M(/ \ ) < all >
...
In (9):475, (10): 1015 und (11):472 enden die letzten fallenden Tonhöhenbewegungen im Bereich der mittleren Globaltonhöhe, fallen also nicht nach tief ab. In (9) übernimmt die Rezipientin den Folgetum direkt im Anschluß; hier liegt also ein ganz unauffälliger, weder schneller noch verzögerter Turnwechsel vor. In (10) produziert zuerst Ν ein "continuer"-Re-
191 zeptíonssignal mhm vqi dem Turnende. Doch liefert I ein Bestätigungssignal jaa direkt im Anschluß an den Turn, und direkt daran anschließend übernimmt Ν in 1018 den Turn für einen längeren Beitrag. Sowohl I als auch Ν scheinen also nach R's Einheitenende seine Turnübergabeabsicht verstanden zu haben und reagieren mit eigenen Turnübernahmen. Demgegenüber ist der Turnwechsel nach I's Turnende mit fallender letzter Tonhöhenbewegung im mittleren Bereich in (11):472 verzögert. Erst nach ca. 1.5 Sekunden Pause übernimmt Ν den Folgeturn. Allerdings ist hier der Folgeturn eine Reparatureinleitung, konkret eine Inferenzüberprüfung mit Bezug auf den Ausdruck abms. Im Korpus kommen derartige verzögerte Tumübernahmen nach Vorgängerturns, die mit fallenden Tonhöhenbewegungen im mittleren Bereich enden, relativ häufig vor. Viele dieser Verzögerungen können jedoch auch als Verzögerungen einer dyspräferierten Reparatureinleitung oder als Resultat anderer Aktivitäten wie Lachen und dadurch verzögerter Turnübernahme des Rezipienten angesehen weiden. Sie müssen deshalb nicht das Resultat eines aufgrund der fallenden Tonhöhe im mittleren Bereich prosodisch nicht deutlich genug kontextualisierten Turnendes sein. Als Resultat dieser Analyse ergäbe sich dann, daß die Tiefe der fallenden Tonhöhenbewegung nicht als Tumbeendigungssignal verwendet wird. Neben fallenden kommen auch steigende Tonhöhenbewegungen am Turnende vor. Dies ist insbesondere bei bestimmten Typen konversationeller Fragen, die in Kap. 3 genauer untersucht werden, systematisch der Fall. Bei diesen Fragen ist die letzte Tonhöhenbewegung jedoch konstitutiv für den spezifischen Aktivitätstyp. Daß steigende Tonhöhe jedoch auch bei anderen Aktivitäten als konversationellen Fragen am Turnende vorkommt, zeigen folgende Beispiele: (12) K2: 166 N :
a das m u ß ja ziemlich T I E F g e w e s n sein ne Τ (\
Τ (\ /)
167 N :
w e n n d a so ne FETTschicht zu SEHN is= T,S(/ ) //
170 I:
b i s U N t e r die siebm HAUTschichten gegangn sein \ \ (4.0)
171 N :
nhn \/
192 (13) Kl: 947 R:
wir HAU in diesem semester Einige AUFtritte geHABT M(T\
\
\
\
)
948 R:
((ráuspert sich))
949 R:
AUCH: ähm: M(\ ) -
950 R:
ÜBERwiegnd muß ich sagn M(\ ) -
951 R:
JAA des STREIKS der geWEsji is: T,F(\ \ \ )
952 R:
953 N:
(1.0)
. ANläßlich àhm: M(\ ) -
(1.5)
hier ganz verSCHWINdp= - m:uSIK soll ja T(\ \ )
mhm mhm mhm mhni mhm \/
mhm \/
954 I:
955 R:
=die LEHrerausbildung T(\
956 N:
nech / ) WEIß ich (\
)
957 R: *
und DA: is dann: auch einiges geLAUfen an ad aktion T(\ / )
958 ? :
(0.7)
959 R:
BIM» auftritt hattji wir auch zum beispiel auf: M(/
960 R:
ähm: auf der fete vom: . kulTÜR
961 N:
ECHT T(/ ) < Ρ >
(1.0)
(0.9)
SOMmer \ )
Nach (12): 167 erfolgt nach dem Turnende mit steigender letzter Tonhöhenbewegung, die global im tiefen Bereich verbleibt, ein schnell angeschlossener Tumwechsel. In (13) aber formuliert R seinen Turn mit auf tiefer Globaltonhöhe steigender letzter Tonhöhenbewegung am Ende einer längeren Antwort auf N's Frage, ob die Uni-Bigband, in der R mitspielt, auch einmal öffentlich auftrete. In diesem Fall übernimmt nun eine der Rezipientinnen nach 0.7 Sekunden Pause den Tum, weist ihn aber sofort wieder R als nächstem Sprecher zu. Das Fazit dieser Analyse der Tonhöhenbewegungen am Turnende ist, daß am Turnende sowohl fallende als auch steigende Tonhöhenbewegungen auftreten, und daß weiterhin die Höhe bzw. Tiefe dieser letzten Tonhöhenbewegungen offenbar nicht als Turnendesignal verwendet wird. Während dann gleichbleibende und ggf. leicht steigende lokale Tonhöhenbewe-
193 gungen an potentiellen Satz- und Einheitenenden eine Fortsetzung des Turns projektieren, kommen an Turnenden fallende und steigende lokale Tonhöhenbewegungen vor, die als mögliche Enden von Intonationskonturen auch mögliche Einheiten- und Turnenden kontextualisieren. Die hierdurch den Rezipienten von Turns ermöglichte Orientierung für eine Antizipation eines Turnendes ist jedoch so nicht hinreichend beschrieben. Rezipienten können sich danach zwar lokal und v.a. retrospektiv nach einem potentiellen Turnende an der letzten Tonhöhenbewegung orientieren und hier an der Wahl der Tonhöhenbewegung projektiertes Turnhalten versus Nicht-Turnhalten des derzeitigen Sprechers erkennen. Aber wie ist antizipierend erkennbar, daß bzw. wann die letzte Tonhöhenbewegung eines Turns beginnt? Wodurch ist m.a.W. über diese lokale und retrospektive Orientierung hinaus eine globalere Orientierung und Antizipation möglich? Hierfür spielt offenbar die Beziehung zwischen syntaktischen und/oder aktivitäts typspezifischen Orientierungsschemata und Prosodie eine wichtige Rolle.
2.3.1.2. Die Beziehung zwischen Syntax und/oder aktivitätstypspezifischen Orientierungsschemata und Prosodie für die Turnbeendigung Bei der Frage nach der Rolle der Prosodie in Relation zur Syntax von Einheiten und Turns spricht die prinzipielle Verlängerbarkeit von Einheiten und Turns eher dafür, daß Rezipienten sich global stärker an der Syntax als an der Prosodie orientieren. Wie bereits in Kapitel 2.1.4. gezeigt, können prosodische Einheiten ebenso wie syntaktische Einheiten prinzipiell verlängert werden. Folgende Beispiele bezeugen diese Beziehung zwischen Syntax und Prosodie auch fur die letzte Einheit eines Turns. Ich gebe wieder Beispiele für Rechtsexpansionen. Im folgenden sind 'mögliche Satzendepunkte' wieder mit '#' gekennzeichnet. (14) Kl:539ff 539 R:
WELche tage MACHST du # eigntlich # wollt ich F(/ \
540 R:
noch wissen # außer MITTwochs # \ )
541 I:
ja JETZT hab ich áhm: \M(/
. tJMgeSTELLT \ / )
Hier ist die Frage von R an I mit der Konstruktion WELche tage MACHST du als syntaktisch mögliche Konstruktion gestellt, aber R verlängert den Satz noch über zwei weitere mögliche Satzendepunkte hinweg. I als Rezipientin wartet bis zu einer kurzen Pause ab, bevor sie den Turn für ihre Antwort übernimmt. Der "bruchlosen" syntaktischen Verlängerung entspricht hier eine "bruchlose" Verlängerung der Intonationskontur: der global fallende Verlauf wird einfach fortgesetzt Auch in den nächsten beiden Beispielen werden Turns über mögliche Satzendepunkte der letzten Einheit hinaus verlängert. In diesen Fällen zeigen zugleich aber auch die Frühstarts
194 der nächsten Sprecher genau nach solchen möglichen Satzendepunkten eine Orientierung der Turnübemehmenden an der Syntax von möglichen Sätzen: (15) Kl: 438 R:
du KÖNNtes auch: ôh
M(\ 439 R: 440 I: *
441 I:
r
nach der Zwischenprüfung \
η die OHI noch mal WECHseln # für die (?prüfung?) T\ \ ) JAa aber M(\/) das : HÖCHT ich nich=das LOHNT sich nich M(\ ) M(\ < all >
. .
für mich \ )
(16) Kl: 936 I:
SPIELS du nich mit H,F(\
937 I:
in soner ORUPpe \ /)
938 I: 939 R: *
940 R:
so bestimmte LEUtji \
daß ihr euch dann: M(
ρ regelmä&ich TREPPT # oder was \ ) jaa im moMENT hab ich das nur \ H,F(/
(0.6) ähm: .
941 R:
. h
am dienstagABMD daß ich . ahm:
(1.2)
In beiden Fällen beginnen die Frühstarts genau nach dem Ende syntaktisch möglicher Sätze und in beiden Fällen kontextualisieren zudem hier die Turnübernehmenden ihre Turnübernahmen mit erhöhter Lautstärke als kompetitive, aber legitime Tumübernahmen (s. Kap. 2.3.2.3.). Solche Fälle zeigen, daß zumindest dann, wenn nächste Sprecher für ihre Folgereaktionen den frühestmöglichen Startpunkt suchen, sie sich an der Syntax des Turns bzw. am frühesten Ende syntaktisch möglicher Sätze orientieren, und daß sie eine dort piazierte Turaübemahme angesichts der Turnverlängerung des letzten Sprechers auch als legitime Turnübemahme hinstellen und damit ggf. ihr Recht auf eine Turnübernahme an dieser Stelle verteidigen (s.u.). Die bisherige Analyse zeigt, daß auch bei der Konstruktion von turnbeendenden Einheiten syntaktische und prosodische Schemata und Signale je spezifische Funktionen übernehmen:
195 Syntaktische (und/oder aktivitätstypspezifische) Orientierungsschemata haben vor einem möglichen Konstruktionsende stärkere global prospektiv projektierende Kraft (es folgt noch etwas), bei der Fortsetzung selbst kontextualisiert diese Fortsetzung der Konstruktion sich jedoch auch retrospektiv selbst als eine Fortsetzung (dies ist das projektierte Folgende)·, der flexible Charakter der syntaktischen Konstruktion 'möglicher Satz' bringt es mit sich, daß diese Konstruktion prinzipiell über mögliche Endepunkte hinaus weiter verlängert werden kann. Hierbei spielen dann prosodische Signale eine lokal kontextualisierende Rolle: Spezielle Haltesignale projektieren prospektiv eine Fortsetzung der Einheit bzw. des Turns und damit auch eine noch ausstehende Verlängerung bzw. Beendigung, und kontextualisieren retrospektiv die Art des Anschlusses der Fortsetzung (dies setzt/setzt nicht die projektierte Einheitfort). An möglichen Einheiten- und Turnenden kontextualisieren sowohl fallende als auch steigende lokale Tonhöhenbewegungen mögliche Einheiten- und Turnenden, nach denen jedoch ebenfalls prinzipiell noch Einheitenverlängerungen kohäsiv angeschlossen und die Einheiten damit fortgesetzt werden können. Dem spezifischen Turnhaltesignal gleichbleibende Tonhöhenbewegung stehen offenbar keine ähnlich spezifischen prosodischen Turnendetonhöhenbewegungen gegenüber. Damit ergibt sich bisher noch wenig Evidenz für eine routinemäßige prospektive prosodische Projektierung und Kontextualisierung von Turnenden mit spezifischen prospektiven Turnendesignalen. Vielmehr können wir bisher ein projektiertes Turnende nur negativ bestimmen: als nicht-turnhaltend. Bei bevorstehenden Turnenden ist eine projektierte syntaktische bzw. aktivitätstypspezifische und prosodische Einheit (Intonationskontur) potentiell beendet und dort finden sich keine Tumhaltesignale. Diese Analyse entspricht auch dem Turn-taking-Modell von Sacks/Schegloff/Jefferson 1974, nach dem mit dem Ende von Turnkonstruktionseinheiten - wenn nicht durch besondere Techniken Mehr-Einheiten-Turns angekündigt und ratifiziert werden - das Rederecht zur Disposition steht Hiernach ist dann die Produktion von Ein-Einheiten-Turns der unmarkierte Fall, die Produktion von Mehr-Einheiten-Turns hingegen der markierte Fall, der des Einsatzes besonderer Techniken und Turnhalte-Verfahren bedarf.
2.3.1.3. Der turnübergabe-relevante Raum Nach Schegloff 1987 eröffnet der letzte Akzent der Turnkonstruktionseinheit den 'turnübergabe-relevanten Raum'. Dies kann man auch in meinem Material gut sehen, wenn Turnhaltesignale wie im Falle des 'Durchhechelns' nach diesem letzten Akzent einer Einheit beginnen, oder wenn Rezipienten nach einem solchen letzten Akzent ein Rezeptionssignal oder einen frühen Start ihres Anschlußtums piazieren. Evidenz für die Position des letzten Akzents der Akzentsequenz als Beginn des 'turnübergabe-relevanten Raums' liefern Beispiele, in denen das 'Durchhecheln', notiert mit , (genau) nach der letzten Akzentsilbe der Akzentsequenz beginnt:
196 (18) K2: 382 R:
un dann HAB ich < all >F(\
383 R:
während der SCHULzeit angefangn \
384 R:
in einer BAND ZU spieln=da harn wa so
/
.
m: allerdings auch noch
âh:
(0.9)
)
(0.8)
(19) K2: 425 R: *
öhm:
(0.8)
426 R:
=un hab < all >
bin ich an eip OOSpelchor RANgekomjn= F[H(/ )
(0.6)
dann DA: M(/
(0.4)
MITgesungen )
(0.7)
(20) K2: 394 R: *
MUßte sich da ma einer zu DURCHringn= F[F(\ \ )
395 R:
=HAB ich da ma ANgefangn damit F(\ \ )] < all >
In (18) und (19) beginnt der Sprecher sein schnelleres "Durchhecheln' nach dem letzten Akzent einer Einheit und hält das schnellere Sprechtempo bis hinein in die zweite Einheit bzw. bis genau zum ersten Akzent der neuen Einheit In (20) sind die letzte Akzentsilbe der ersten Einheit wie auch der schnelle erste Akzent der neuen Einheit in das Durchhecheln' einbezogen. Wesentlich häufiger sind jedoch Fälle, in denen eine neue Einheit nur schnell angeschlossen wird und/oder die neue Einheit mit einem schnellen Vorlauf beginnt (vgl. Kapitel 2.2.1.2.).
Evidenz für eine mögliche Orientierung von Rezipienten am letzten, oder besser, möglichen letzten Akzent einer Einheit (s.u.) als Beginn des 'Übergabe-relevanten Raums', in dem Turnhalten versus Turnübergabe ggf. ausgehandelt wird, liefern auch die Positionen von Rezeptionssignalen wie mhm, jaa usw. bei nicht-letzten Einheiten des Turns sowie die Positionen von Frühstarts von Turns des bisherigen Rezipienten. Rezeptionssignale wie mhm, und ggf. auch jaa, verwenden die Rezipienten von Mehr-Einheiten-Turns als sogenannte 'Continuer' oder 'Rezeptionssignale' (auch 'Rezipientensignale', 'Hörersignale' o.ä. genannt), um dem bisherigen Sprecher weiterhin das Rederecht zu ratifizieren bzw. zuzuweisen. Laut
197 Schegloff (1982: 81ff) verwenden Rezipienten sogenannte 'continuer', die in Transkriptionen des Englischen i.d.R. als uh huh o.ä. transkribiert werden, v.a. mit folgender Funktion: "Perhaps the most common usage of 'uh huh', etc. (in environments other than after yes/no questions) is to exhibit on the part of its producer an understanding that an extended unit of talk is underway by another, and that it is not yet, or may not yet be (even ought not yet be), complete. It takes the stance that the speaker of that extended unit should continue talking, and in that continued talking should continue that extended unit. 'Uh huh', etc. exhibit this understanding, and take this stance, precisely by passing an opportunity to produce a full turn at talk. When so used, utterances such as 'uh huh' may properly be termed 'continuers"' (ebd.: 81).2 Strukturell gesehen behandeln diese Rezeptionssignale das Problem, dem derzeitigen Sprecher zu signalisieren, daß er seinen Tum fortsetzen und weiterspiechen kann/soll und der derzeitige Zuhörer weiterhin die Rezipientenrolle innehalten wird. Um dem Sprecher eine derartige Orientierung möglichst früh und projektiv zu erlauben, scheint es interaktions-logisch sinnvoll, dieses Signal - zwar natürlich nachdem der Rezipient verstanden hat, daß der Sprecher einen längeren Turn projektiert hat, aber - vor dem Ende einer Einheit, spätestens jedoch genau nach dem Ende einer Einheit zu plazieren, auf jeden Fall aber vor dem Beginn der Folgeeinheit. Und genau das scheinen auch zumindest quantitativ gesehen häufige Positionen dieser Rezeptionssignale zu sein: Neben Rezeptionssignalen, die nach dem Ende einer Einheit und vor dem Beginn der nächsten Einheit stehen, kommen nämlich zumindest genauso häufig, vielleicht sogar häufiger, Rezeptionssignale vor dem Ende einer Einheit bzw. eines Turns vor. Allerdings stehen sie selten genau nach dem letzten Akzent der Akzentsequenz. Unmarkiert scheinen zunächst Fälle zu sein, in denen bei auch sonst regem Turnwechsel das Rezeptionssignal freistehend, ohne Überlappung, nach dem Abschluß der Turnkonstruktionseinheit steht. Diese Signale stehen dann am Ende einer projektierten syntaktisch potentiell vollständigen Einheit, und nach dem Rezeptionssignal setzt der bisherige Sprecher seinen Turn weiter fort. (21) Kl: 477 I:
NEE: M(\ )
*ich geh DREIma1 in der WOche abends arbeitn < all > F(\ \ ) \
478 N: *
479 I:
und DREImal in der woche das REICHT dann mh: M(/ \ / ) -
Zu 'continuers' vgl. weiterhin auch Goodwin 1986, der auch den Unterschied zwischen diesen 'continuers'/Rezeptionssignalen und 'assessments'/Bewertungen wie z.B. Oh: wo:(h)w. Oh Go:d etc. herausarbeitet.
198
(22) Kl: 824 I:
825 I:
un da hab ich mich LIEber für das AUto entschiede M( / \ ) all>
619 N: |- Sprecher das lesn=WAS du so im RAdio hörs )F(/ \ )
620 I: mhm \/
(25) Kl: 858 Ν:
ja Oder du has tatsächlich so: \M( /
859 Ν: r EIN zwei leute die AUCH am Wochenende hier bleibm \ \ ) all > 860 I: jaa \ 861 Ν:
=aber MEIstens is das so= M(/ )
=aber DANN: is es ja auch: F(\
1054 R: r auch die die ART der beziehung irgndwo ne î\ /) 1055 I: ja
(27) Kl: 871 Ν:
das is schon außeraeW&HHlich F(\ < all >
872 Ν:
wenn die mal HIERbleibt un \ )mhm
873 I: *
(0.9)
\/
874 Ν:
WEIß ich nich M(\ )
(28) K2: 405 R:
=so daß man
(0.8)
äh daß ich mich
200 406 R: 407 I:
überFORdert habe eigntlich damit auch dann ne F(\ /) mhm \/
(29) Kl: 1010 R:
un:d öh: . dann:
1011 R:
daß ich dann mal HIER bleibe in OLdenburch ne \ \ /) mja das dja
1012 N:
(1.2)
*:is das die Ausnahme T(\
Ν T(
In den Fällen (24)-(26) steht das Rezeptionssignal gegen Ende der Einheit nach dem letzten Akzent. In (24):620 steht es nach zwei ungefähr ähnlich langen Akzenteinheiten; in (27):860 steht es dort, wo die letzte Akzenteinheit ungefähr die Länge der vorherigen erreicht hat Ein Rezeptionssignal genau nach dem letzten Akzent wie in (27) ist jedoch selten. In (28) und (29) steht das Rezeptionssignal am potentiellen Ende der projektierten syntaktischen Konstruktion. In (29) fügt der Sprecher parallel mit N's Reaktion noch einen weiteren Akzent bei der Verlängerung an. Dies zeigt, daß der vom Rezipienten interpretierte letzte Akzent der Einheit nicht auch tatsächlich der letzte Akzent sein bzw. bleiben muß, denn Einheiten sind ja prinzipiell verlängerbar. Analog zur Rede von 'möglichen syntaktischen Satzendepunkten' zwingen solche Fälle uns dazu, aus der Sicht des Rezipienten von 'möglichen letzten Akzenten der Einheit' zu sprechen. Diese lassen sich offenbar aufgrund der syntaktischen Projektion (und ggf. aufgrund rhythmischer Prinzipien?) absehen. Verlängerte Einheiten finden sich auch in den folgenden Beispielen: (30) Kl: 1083 R:
hab auch Außerhalb geARbeitet schon < all >M(\ \ )
1084 R: *
und JETZT eben die UNI hier M(\
1085 N:
\
in oldenburch ) mhm \/
In (30) wäre mit der Pause in Zeile 1084 die Einheit potentiell zu Ende; ggf. wäre ein Rezeptionssignal nach dieser Pause jedoch verspätet. Die Fortsetzung der Einheit durch das unakzentuierte in oldenburch verlängert die Einheit um ein von der Information her redundantes Element, gibt aber vielleicht dem Rezipienten Gelegenheit zu einer nicht-verspäteten Rezipientenreaktion in Relation zur Gesamteinheit.
201 Wenn hingegen ein verspätetes Rezeptionssignal mit Bezug auf eine Vorgängereinheit erst im Verlauf einer neuen Einheit und dann VQT der letzten Akzenteinheit gegeben wird, dann folgt häufig gegen Ende der projektierten Einheit noch ein weiteres Rezeptionssignal: (31) K2: 448 R:
undann hab ich HIER halt so:
F(/
449 R:
die gesangsTECHnik dann nich=
450 R:
\
ρ =was: also KLASsischen gesang angeht so ne
T(
451 I:
452 R: 453 X:
/ )
r L
\
mhm
mhm
\/
\/
wie man
T[
/)
(0.7)
(1.9)
resoNANZráume ausnutzt
(4--
)
mm
Erst das zweite Rezeptionssignal in Zeile 450 scheint dann die Sprecherrolle über die Einheit hinaus zu ratifizieren. Alle diese Fälle legen nahe, daß einerseits Rezipienten sich stärker an der Syntax, d.h. am vorhersehbaren möglichen Ende der syntaktischen Konstruktion, als am letzten Akzent orientieren. Das Rezeptionssignal des Rezipienten liegt oft im bzw. vor dem letzten syntaktisch projektierten Wort der Einheit. Das Signal steht aber andererseits auch gegen Ende der letzten Akzenteinheit der Turnkonstruktionseinheit, die voraussichtlich nun bald zu Ende gehen wird. In einigen Fällen ist diese letzte Akzenteinheit auch ähnlich lang wie die vorausgegangene Akzenteinheit und aufgrund dessen ihre Länge ungefähr vorhersehbar. Beide Beobachtungen lassen sich so zusammenbringen: Ein möglicher letzter Akzent gegen Ende einer möglichen syntaktisch projektierten Einheit signalisiert das nun tatsächlich bald, mit Ende dieser Akzenteinheit, bevorstehende Ende dieser Turnkonstruktionseinheit und fungiert damit als ein zusätzliches lokales Signal, an dem der Rezipient sich im Hinblick auf seine eigene Reaktion orientieren kann. Hier steht dann entweder für den Sprecher Tumhalten und ggf. dessen Ratifizierung durch den Rezipienten oder aber Turnbeenden und Turnübernahme des Rezipienten an. Dies scheint auch dem Sinn von Rezeptionssignalen bzw. 'Continuern' zu entsprechen, die eigene Reaktionsabsicht des Rezipienten auf einen Turn möglichst schon vor dem Ende des in Produktion befindlichen Turns zu signalisieren, damit sich daran auch der derzeitige Sprecher orientieren kann. Ein ähnliches Bild ergibt sich auch bei der Analyse von Frühstarts eines Folgetums:
202
(32) Kl: 450 R: r âhm:
451 I:
..
also ich DENke daß das nich F(\
(34) Kl: 874 N:
ICH würd AU nich fahrn wenn ich so: M(/ \ )
875 N:
LEUte hier hätte mit deman was am Wochenende S(/
- nee DAMN: wâr ja alles: \ M(/
877 I: * 878 N:
in ORDnung= \ ) ( (seufzt))ja
203 (35) Kl: 984 Ν:
genau da mußt ich ARbeitji un dann: war ich noch F(\
985 N:
r auf ner ANdern fete eingeladn \ ) 986 R: da kann NICH viel * F(\ 987 R: 988 N:
r LOS gewesen sein inner FANNkuchenstube ) \ \
((lacht)) ((räuspert sich)) NEEe (\ /)
In (32):453 erfolgt die Tumiibernahme der I nach dem Ende einer Turnkonstruktionseinheit, aber gemessen an R's Fortsetzungsprojektion vor dessen projektiertem Turnende. Sie führt zum Abbruch der gerade projektierten Turnfortsetzung des R. Diese Turnübernahme ist mit als die Übernahme eines legitimen Turns kontextualisiert (s.u.). In (33), (34) und (35) erfolgen Frühstarts gegen Ende der Turnkonstruktionseinheit, aber nach dem letzten Akzent der Einheit. In (33) wird dieser Frühstart am Ende der syntaktisch möglichen Einheit mit als die Übernahme eines 'legitimen Turns' kontextualisiert; in (34) und (35) stehen diese Frühstarts vor möglichen Satzenden und werden weder so kontextualisert noch so behandelt In allen diesen Fällen stehen Rezeptionssignale wie auch der Frühstart eines Folgeturns nach oder gegen Ende einer projektierten syntaktischen Einheit, zugleich aber auch nach dem letzten Akzent der Einheit In einigen Fällen fällt dies zusammen mit ungefähr ähnlich langen Akzenteinheiten. Dies legt nahe, daß Rezipienten sich für ihre eigenen Reaktionen global an möglichen syntaktisch vollständigen Konstruktionen, und ggf. am Rhythmus von Einheiten, orientieren. Zugleich liegen diese Reaktionen aber auch nach dem letzten Akzent der Turnkonstruktionseinheit und vor einem faktischen Einheiten- oder Turnende. Das spricht dann für eine Relevanz des möglichen letzten Akzents einer projektierten Einheit als einem lokalen Orientierungspunkt für den Rezipienten. Der mögliche letzte Akzent scheint damit in der Tat den "Raum" zu eröffnen, der ein bevorstehendes mögliches Ende der Einheit anzeigt und ein quasi "genaues Hören" auf das syntaktische Ende und eine rechtzeitige Reaktion relevant macht. Die Interpretation, ob eine begonnene Akzenteinheit voraussichtlich die letzte sein wird oder nicht, läßt sich dagegen für den Rezipienten offenbar nur aus der Interpretation der syntaktisch projektierten Einheit und der durchgeführten Aktivität auf der Grundlage globaler projektierender syntaktischer und ggf. aktivitätstypspezifischer Orientierungsschemata erschließen. Dennoch heißt die Interpretation, daß ein möglicher letzter Akzent eiTeicht ist, nicht, daß es auch tatsächlich der letzte Akzent war, denn aufgrund der prinzipiellen Verlängerbarkeit von Einheiten können natürlich auch noch ganze Akzenteinheiten an potentielle Einheitenenden angehängt werden. Die letzte Akzenteinheit kann ggf. für die Aushandlung der Rezipientenreaktion nutzbar gemacht werden: Wenn die Rezipientenreaktion gegen Ende der Einheit noch nicht erfolgt ist, kann der Sprecher oder die Sprecherin offenbar die Einheit um ggf. unakzentuierte Wörter
204
oder Partikeln verlängern, um so dem Rezipienten noch Gelegenheit zu einer "rechtzeitigen" Reaktion vor dem Ende der laufenden Einheit zu geben. Zu diesen Verlängerungstechniken gehört auch die Verwendung von Anhängseln wie ne, nech, nick, usw. am Ende von Tumkonstruktionseinheiten. Siehe hierzu folgende Beispiele: (36) K2: 591 R:
äh:
592 R:
wurdn die UNterrichtsstundn dann nich=die man dann: \ / ) all all> mhm \/
593 Ii
(0.4) wo: immer mit video ÀUPgezelehnet F(\
..
also ich DENke daß das n i c h F(\
456 I:
N E E u n d ich M Ö C H t e schon in w i l l e m s h a v n BLEZM= M(\) S(/ \ )
Mit ähm: in Zeile 450 hat R gerade einen mit einer Frage an ihn zugewiesenen Turn übernommen und eine Antwort projektiert, als I während R's Verzögerungspause mit einem eigenen Turn einsetzt. Daraufhin setzt R seinerseits seinen ihm qua Zuweisung und erfolgter Turnübernahme zustehenden Turn fort und kontextualisiert sein legitimes Sprechen angesichts der nicht-legitimen Turnübernahme durch I mit . Nach dem Ende von R's erster Turnkonstruktionseinheit beginnt I in Z. 453 trotz R's Fortsetzungsprojektion mit der Konjunktion aber erneut einen Turn, eine Korrektur der von R ihr unterstellten Meinung, und kontextualisiert diese ebenfalls mit als quasi legitime Unterbrechung zwecks Korrektur. Aber auch hierdurch läßt sich R nicht den Turn nehmen: Auch er setzt wieder in Überlappung fort und kontextualisiert auch die weitere Einheit mit . R's zwei Turnkonstruktionseinheiten bilden eine einzige syntaktische Einheit und es ist plausibel, sie als die Produktion der Antwort auf die an ihn gestellte Frage anzusehen. Genau so scheint er seine beiden, nur aufgrund von I's Tumübernahmeversuch getrennten Einheiten auch zu kontextualisieren: als legitime Turnproduktion, die er sich nicht nehmen lassen will. (50) Kl: 971 N :
nee
\
w a n n W A R die DENN= H,F(\ / )
972 I:
= v i e l l e i c h w a r das a m W o c h e n e n d e
M(\ )
((..·)) 976 I:
977 R: *
r
M I T T w o c h s vielleicht M(\ )
KÖNNte wohl η FREItag geWEsen sein M(\
978 N: 979 I:
(?????????????????????????) (???)
217 Auch in (50) übernimmt R in 977 verspätet einen mit einer Frage in 971 an ihn zugewiesenen Turn. Hier hatten I und Ν vor R's Antwort einige Turns produziert, um bei der Suche nach der Antwort mitzuhelfen. Mitten während eines solchen Turns von I, der mit
als "Hintergrundbemerkung" ohne Turnanspruch kontextualisiert ist (s.u.), beginnt R in 977 seine noch ausstehende Antwort. Diese hat wiederum , aber keine höhere Tonhöhe. Auch hier scheint R damit seinen Turn als legitimen Turn zu kontextualisieren. Da einerseits der Turn für eine Antwort an ihn zugewiesen war, andererseits I selbst ihre vorherige Bemerkung mit
auch nicht als turnbeanspruchend kontextualisiert hatte, unterbricht R ja auch in der Tat niemanden, sondern nimmt sich nur den ihm zustehenden Turn an dieser Stelle und noch in Überlappung mit I's Bemerkung. Auch angesichts weiterer, nicht rekonstruierbarer überlappender Hintergrundkommentare mit
von I und Ν ändert R seine prosodischen Signale und damit die Kontextualisierung seines Turns nicht. (51) Kl: 1035 R: 1036 I:
1037 I:
wir hm jetzt erst geHEIratet: im: okTOber letztes jähr
S(/ / ) STIMMT M(\ )
mhm \/ (2.2)
1038 R:
un ich DENke das wird M(\
irgndwann vorBEI sein ne \ /) ja Solange BRAUCHS du ja \F ( / \
1039 I:
1040 I: 1041 R:
auch gar nich mehr ) mhm \/
Auch in (51): 1038 verteidigt erneut R angesichts eines nach einer kurzen Pause überlappt einsetzenden Beitrags von I seinen Turn mit zunächst sich erhöhender und dann erhöhter Lautstärke. Dieselben Signale finden sich in (52):780: Dort verteidigt L angesichts von E's nach einer kurzen Pause überlappt einsetzenden Redeansatzes mit zunächst sich erhöhender und dann erhöhter Lautstärke ihren begonnen und projektierten Turn. Nachdem E abgebrochen und auch nicht fortgesetzt hat, kehrt L dann wieder zur vorherigen normalen Lautstärke zurück. Auch hier kontextualisiert mithin L mit der erhöhten Lautstärke ihren Anspruch, den begonnenen und projektierten Turn als ihren legitimen Tum fortzusetzen.
218 (52) K4: 776 L:
und SCHEINTS irgndwie daß: mm .. M( /
777 L:
daß die: mm .. da η bißchen emPFIHDlich sind \ )
778 L:
*also
779 L:
oder das: irgnwie konKREter habm wolln
.. .
F(\
)
780 L: r oder . also .
ich KANN das nur so SCHWAMmich M(/ \
781 E:
wir LEBM M(\
782 L: r bis jetz SAON ne \ /) 783 E: wir LEBM doch im ZBXTalter des narZISSmus L F ( I I \ ) Demgegenüber scheint mir im Beispiel (53) die Turnzuweisung nicht so klar zu sein: (53) K l : 923 R:
das is gar nich so EINfach ((heh)) M(\ )
924 N: r is NICH so EINfach= H(t\
925 R:
\
)
mit som
926 R:
=JETZT=ich MEIne:
*
M(\
verteidigt. Die Wiederholung dieser Äußerung in 1059 wird als zugewiesener Tum unüberlappt und dementsprechend ohne formuliert. Auch die daran anschließende Explikation seiner vorherigen Annahmen durch R in 1062-1064 wird als legitimer Turn überlappt angeschlossen; in dieser Einheit wird nun < f f> mit T( ) kombiniert.
222 Eine ähnliche Entgegnung findet sich auch in (57):324, wo diese Entgegnung allerdings zum Abbruch des Vorgängerturns führt: (57) K6: 320 L:
und kanns dann DEIne interpretaTION zum bestn gebm . . M,F(\ \ )
321 E:
Aber das is doch urALT . T(\ \ )
322 L:
JAA . es is* M(\)
323 L:
also für MICH isses n::
M(\ naJA=ich FIND es auch etwas verKÖRZT M(\) S(/ t\ )
324 C:
((lacht ca. 2 Sek.)) r =JA:* T(-)
326 C: =also: ((lacht ca 2 Sek.)) 325 L:
327 L: 328 C:
IS auch verKÜRZT WEISS ich ne . /) T,F(\ \ ) T(\ mhm \/
Auch hier erfolgt die Entgegnung, nachdem L mit also eine Reformulierung ihrer nun schon formulierten Position angekündigt hat. Hier wird nur die Turnübernahme und Ankündigung der 'Entgegnung' naJA mit formuliert und der weitere Turn nach dem Abbruch des Vorgängerturns hat wieder normale Lautstärke. In (58):39 wird auf dieselbe Weise eine verständigungssichernde Zwischenfrage mit als legitime Aktivität kontextualisiert. Die Zwischenfrage bezieht sich noch auf die Darstellung des zeitlichen Rahmens eines Seminars. Sie hat damit die Einheit in Zeile 35-36 als Bezugseinheit und fordert eine Präzisierung. Sie unterbricht die Neufokussierung N's auf die Nachteile einer solchen zeitlichen Organisation von Seminaren: (58) K l : 35 N:
36 N:
37 N:
un die is alle vierzehn TAge gekomm das war schon mal BLÖD < all > S(/ /) ... ((holt hörbar Luft))
weil: ALle vierzehn M(\
223 38 Ν: ρ TAge da kann se da \ 39 und DANN aber auch MOR zwei STUNden * R: M(\
nee VIER stundn dann ne - F(\ /) Aja (\ )
41 R:
Die Zwischenfrage hier ähnelt strukturell den Zwischenfragen z.B. in (41):494 oder (43):609f, wird aber hier anders kontextualisiert. Ebenfalls als zwei legitime parallele Aktivitäten scheinen sowohl R wie auch Ν ihre Beiträge in (59):725 und 726 zu präsentieren: (59) K2: 724 R:
DAS wär mal interesSANT das zu verGLEIchen F(/ \ \ )
725 R: r ich mein man KANNS ja einfach auf TONband AUFnehmn * < all > F(\ \ / )
F(\ \ ) mhm \/ WEIß nicht M(\ ) < all >
vielleicht
ρ SPOtRT oder irgendwelche inTRESSW M(\
die man hat
\
)
< all > JAA das M(\
225 902 I:
das STIMMT schon T(\
)
(62) K2: 364 I:
aber geNAUsoviele köpn auch NICH s(h)ingn F(\ \ )
365 N:
jaa \
366 R:
äh
(0.8)
m: ICH weiß nich H(\
)
(3.7) 367 N:
368 R: 369 I:
ICH kann NICH singn F(\ \ )
also ich denke mir daß die MEIstp F(\ ICH au nich (\ )
370 R:
sich das
.
EINredp oder ham einredn \
371 R:
LASsn ne=von ANdern leutp \ /) M(\ )
Eine Reihe unterschiedlicher Hintergrundkommentare zeigt der Gesprächsausschnitt (63): (63) K l : 1086 R:
und ich LEbe WIRKlich JAHreLAHQ schon so F(\ \ \ \ )
1087 R: r daß ich: EIgntlich jedes Wochenende so FAHre dann ne M(/ \ /) 1088 I: L ((lacht)) 1089 R: Γ ((lacht ca 0.7 Sek)) 1090 N: mhm \/ L -
1091 R:
das is:äh . dann AUCH η stück weit geWÖHnung M(/ \ )
(1.2)
BOHH T(- )
226 1093 Ν: 1094 I: 1095 I: 1096 R:
1097 R:
ICH könnts NICH F(\ \ )
dann wird das noch ne Dllstellung wer dp F(\ wenn du eines tages GUUIZ zu hause bist \ ) JA H(\) < f>
DASs
(1.6)
DAS . glaub ich AUCH \ )
H (/
((lacht)) ((lacht))
1098 N: 1099 I:
ö:h SCHWIErich werdp ersmal \ mhm
1100 R: r das wird diREKT H,F(\ stark 1101 I:
1102 R:
denk ich mir )
(2.2)
1103 R: r für MICH zumindest F(\ ) 1104 N?: boh
1105 N:
also das könnt ICH NICH
*
M(/
(2.3) 1106 I:
doch also ICH fin das AUCH gut \ F(/ \ )
In den Zeilen 1101 und 1104 werden sehr kurze Hintergrundkommentare bzw. Bewertungen mit
gegeben. Demgegenüber ist N's Hintergrundkommentar in 1093, der genau überlappt mit I's Turn begonnen und fortgesetzt wird, etwas länger. Aber auch dieser Beitrag wird von Ν mit
als nicht-turnbeanspruchend signalisiert und dementsprechend scheint sich I hinsichtlich der Formulierung ihres eigenen Turns auch nicht darum zu kümmern: Der Tum in 1094 wird weder prosodisch mit z.B. als den legitimen Turn beanspruchend kontextualisiert (er ist ja schließlich auch nicht gefährdet), noch wird dieser Turn unterbrochen oder verzögert o.ä. Damit behandelt I N's mit
formulierten Beitrag auch nur als reinen Hintergrundkommentar, der ihren eigenen Tum nicht stört. Mit dieser Analyse ist vereinbar, daß ein solcher
-Turn als Signal der Nicht-Beanspruchung des Turns auch in nicht-überlappender Position verwendet werden kann, um eine Turnzuweisung an den Produzenten zu verhindern: In (63): 1105 produziert Ν in der das Thema Wochenendfahrerei abschließenden Sequenz nach den anderen überlappenden Hintergrundkommentaren nun auch den Tum also das könnt ICH NICH mit
. Danach entsteht eine relativ lange Pause von 2.3 Sekunden, nach der I das Gespräch fortsetzt. Mit dem
227
-Kommentar scheint Ν hier zwar einen Beitrag zu liefern, zugleich aber auch zu signalisieren, daß sie den Turn nicht weiter übernehmen will. Eine Kontextualisierung eines überlappenden Turns mit
scheint also diesen Turn als nicht-kompetitiven, den Turn nicht beanspruchenden Hintergrundkommentar zu konstituieren. Der bisherige Sprecher modifiziert seine eigene Rede entsprechend auch nicht weiter, sondern fährt ungestört mit seinem eigenen Turn fort. Ein überlappender Kommentar ohne prosodische Kontextualisierung seines Turnstatus scheint demgegenüber uneindeutiger zu sein und wird ggf. auch als kompetitiv interpretiert: (64) K2: 584 R:
aber::
585 R :
586 I:
587 R :
589 R :
ja g e W O H H h e i t \ (\
ρ m a n K A N N s i c h D R A N geWÖHJI ne F(\ / \ /)
jaa mhm \ \/
halt )
(1.0)
r g e N A U s o s i c h S E L b e r im P E K N s e h n zu sehn=
M(\
T\
)
G L A U B ich w o h l M(\ ) = i c h b i n einmal H I E R d r i n g e w e s p < all > (/ )
(0.6)
Der Kommentar in Zeile 588 ist nicht mit
formuliert und hinsichtlich seines Status damit offenbar für R uneindeutig. Hier reagiert R, indem er seine eigene Rede, solange sie mit diesem Kommentar überlappt, mit modifiziert und damit signalisiert, daß er seinen Turn weiter beansprucht. Der mit der Kontextualisierung eines Turns mit
nahegelegte Interpretationsrahmen 'nicht-turnbeanspruchend' läßt sich dann auch für andere Arten von Beiträgen ausnutzen. Vgl. die folgende "vorsichtige" nicht-unterbrechende Zwischenfrage mit
, die eine zuvor projektierte Fortsetzung der Darstellung nicht unterbricht, aber dennoch subtil, quasi "aus dem Hintergrund", einen Fokuswechsel herbeiführt: (65) Kl: 466 I:
n a d a z u g e H Ö : R T ja a u n o c h F(\
467 I:
d a s O E < L D = w a s ich n i c h / )
.
(h)HAB M(/)
öh
.
228 468 R: ρ mhm= \/ 469 I: =weil ich kein BAfög krich: \ M(/ ) < all > 470 I:
oa so GUT wie NICHTS F(\ / )
.
471 Ν: *
un WIE finanziera du dein: STUdium F(\ / )
472 I:
ja ich geh ebm abms ARbeitn \ < all > M(\ )
...
N's Frage ist durch das
wie das genaue Gegenteil einer Unterbrechung der laufenden Darstellung von I kontextualisiert, dennoch unterbricht sie aber faktisch diese Darstellung und wechselt den Fokus. Die leise Sprechweise läßt diesen Turn aber nicht als 'Unterbrechung', sondern nur als "vorsichtige" nicht-unterbrechende Zwischenfrage erscheinen, auf die Ν sofort eingeht. Als Fazit dieser Analyse ergibt sich folgende Taxonomie der Kontextualisierung überlappender Rede durch den Sprecher: [+ überlappende Rede] [- turnkompetitiv]
[+ turnkompetitiv] 'Unterbrechung' als nicht-legitime Turnübernahme
I
H( ) +
Fortsetzung bzw. Übernahme eines 'legitimen Turns'
Hintergrundkommentar o.â.
Wenn von einem Sprecher simultan mit dem Beitrag eines anderen Sprechers überlappende Rede produziert wird, dann können prosodische Signale den sequentiellen Status dieser überlappend einsetzenden Rede als [± turnkompetitiv] kontextualisieren: Unabhängig von der genauen Position der überlappenden Rede relativ zum Vorgängerturn unterscheiden die Signale versus
zwischen dem Status der Rede als 'turnkompetitiv' versus 'nicht-turnkompetitiv'.
konstituiert überlappende Rede als nicht das Rederecht beanspruchenden Beitrag, durch den sich der bisherige Sprecher nicht stören zu lassen braucht. hingegen kontextualisiert einen überlappenden Beitrag als rederechtbeanspruchend. Wird dieses Rederecht für die Produktion eines an dieser Stelle legitimen bzw. für legitim gehaltenen Turns beansprucht, z.B. für einen dem betreffenden Sprecher sowieso zugewiesenen Turn oder für Entgegnungen bzw. Reparaturen, die ebenfalls als lokale Störungsbehandlungen immer legitime Turns sind, dann wird dieser Tum lediglich zur Bekräftigung dieses Turnanspruchs mit formuliert. Wird hingegen der Tum für eine nicht im genannten Sinne legitime Unterbrechung eines laufenden Turns beansprucht, so wird er mit der Signalkombination H( ) + als 'Unterbrechung' kontextualisiert. Das zusätzliche Signal H( ) scheint dazu zu die-
229 nen, die Unterbrechung selbst und die damit initiierte Aktivität - offenbar in Verwandtschaft zu anderen Verwendungen von H( ) - in ihrer interaktiven Relevanz "hochzuspielen": Der Rezipient soll quasi sofort reagieren und seinen Turn abgeben. Die hier zusammengefaßten Aktivitätstypen lassen sich mit folgenden Merkmalbündeln darstellen: Turnkompetitive 'Unterbrechung': H( ) + Turnkompetitive Fortsetzung bzw. Übernahme eines 'legitimen Turns': Nicht-turnkompetitiver überlappender Beitrag:
Diese Analyse wird durch die in den Transkripten sichtbaren jeweiligen Rezipientenreaktionen bestätigt: Bei bzw. nach kompetitiven Beiträgen eines zweiten Sprechers bricht entweder der erste Sprecher (bald) ab oder signalisiert seinerseits seinen weiteren Beitrag als turnkompetitiven 'Kampf um das Rederecht'. Bei einem nicht-kompetitiven Hintergrundkommentar läßt sich hingegen der Sprecher nicht weiter stören.
2.4.
Zusammenfassung und Fazit zur Prosodie der Einheiten- und Turnkonstruktion
In der bisherigen Analyse wurde gezeigt, daß alle die von mir zugrunde gelegten prosodischen Kategorien und Parameter interaktiv relevant sind und wichtige strukturelle Aufgaben bei der Organisation der konversationellen Interaktion erfüllen. Sie sind quasi die herausgebildeten strukturellen Lösungsmittel für die sich permanent im Laufe von Gesprächen stellenden Aufgaben der Gesprächsorganisation. Die wichtigsten Ergebnisse der Analyse können in folgenden Punkten zusammengefaßt werden: (1) Prosodische Parameter müssen als Mittel der Herstellung und Organisation einzelner Tumkonstruktionseinheiten in Ein-Einheiten-Turns wie auch der Kombination von Turnkonstruktionseinheiten in Mehr-Einheiten-Turns analysiert werden. Prosodie, insbesondere der Globaltonhöhenverlauf der Intonationskontur, leistet die Konfiguration von Äußerungen als kohäsive Turnkonstruktionseinheit. Einheiten-interne Störungen und Pausen werden mit prospektiven und retrospektiven Einheiten- und Turnhaltesignalen als einheiten-interne kontextualisiert und damit zugleich eine Fortsetzung der Einheit projektiert Alle strukturellen Komponenten der Kontur erfüllen wichtige Aufgaben bei der Turnorganisation: Der Vorlauf von Intonationskonturen dient der Abgrenzung wie auch der Signalisierung der Art des Anschlusses neuer Einheiten, v.a. in Mehr-Einheiten-Turns. Wenn der Tonhöhenanschluß eher die semantische Beziehung der Folgeeinheit projektiert, dann dienen anakrustische schnelle Vorlaufsilben als für die konversationelle Interaktion typische Turnhaltesignale: sie leisten das 'Durchhecheln' in eine neue Einheit. Die Wahl prominenter akzentuierter Silben gegenüber den nicht-prominenten unakzentuierten Silben stellt in Wechselwirkung mit der grammatischen Struktur die semantische Fokus-Hintergrund-Struktur der Turnkonstruktionseinheit her. Grammatische Prinzipien werden offenbar als Ressource verwendet, um eine semantische Struktur und Interpretation der Einheit und ihrer Beziehung zur Vorgängereinheit zu erzeugen. Die an den Akzentstellen gewählten lokalen Akzenttonhöhenbewegungen dienen der Herstellung und Signalisierung von Akzentsequenzen als wesentlich-
230 sten Bestandteilen von Konturen, an denen sich Interaktionspartner in den Folgeeinheiten u.a. für die Signalisierung der Art der kohäsiven Beziehungen zwischen Einheiten orientieren: Indem sie solche Einheiten wiederholen und wiederaufnehmen, umdrehen und variieren, beziehen sie sich auf sie und verwenden sie für ihre Konstitution von kohäsiven Beziehungen und Interaktionsstilen. Die globale Tonhöhe signalisiert unmarkiertere versus markiertere Einheiten. Mit hoher globaler Tonhöhe werden Einheiten in ihrer konversationellen Relevanz eher 'heraufgespielt' und mit tiefer globaler Tonhöhe eher 'heruntergespielt'. In Kombination mit v.a. global höherer Lautstärke wird das Signal hohe globale Tonhöhe je nach sequentieller Umgebung z.B. für die Kontextualisierung eines Widerspruchs zu den eigenen Erwartungen ('Erstaunen') oder für die Kontextualisierung einer 'Unterbrechung' verwendet. (2) Bei der Analyse der Rolle der Prosodie bei der Organisation des Sprecherwechsels komme ich zu ähnlichen Ergebnissen wie bisherige konversationsanalytische Untersuchungen. Hier muß die Beziehung zwischen v.a. Syntax und Prosodie genauer betrachtet werden. Sowohl in syntaktischer wie in prosodischer Hinsicht sind Turnkonstruktionseinheiten wie auch Turns prinzipiell verlängerbare und damit letztendlich nie vorhersehbare flexible und dynamische Einheiten. Dennoch sind syntaktische Orientierungsschemata offenbar stärker konventionalisiert bzw. ist das mögliche Ende einer syntaktisch möglichen Einheit besser ungefähr vorhersehbar als das mögliche Ende einer ebenfalls prinzipiell immer verlängerbaren Kontur. Für die Projektierung von Turnende und damit anstehendem Turnwechsel spielen syntaktische und/oder aktivitätstypspezifische (Orientierungs-) Schemata demgemäß eine globaler projektierende Rolle, wohingegen prosodische Signale eine lokal kontextualisierende Rolle spielen. Meine Analyse bestätigt die in der Konversationsanalyse entwickelte Auffassung, daß die Turnübergabe am Ende einer Tumkonstruktionseinheit die unmarkiertere Aktivität ist. Bei der Tumübergabe finden sich (ggf. aktivitätstypspezifische) fallende oder steigende letzte Tonhöhenbewegungen in der letzten Akzenteinheit und ggf. danach. Demgegenüber wird ein Turnhalten für einen Mehr-Einheiten-Turn oft mit Turnhaltesignalen projektiert: Es findet sich das 'Durchhecheln* in eine neue Einheit und/oder andere Turnhaltesignale wie v.a. lokal gleichbleibende Tonhöhe am Ende einer nicht-letzten Einheit und ggf. Verzögerungssignale o.ä. als Beginn und Projektion einer weiteren Einheit. Die Wahl einer lokal gleichbleibenden letzten Tonhöhenbewegung als Turnhaltesignal projektiert eine weitere Einheit mit lokal fallender oder steigender letzter Tonhöhenbewegung als melodischem Konturenende. Demgemäß haben, wie erwähnt, Turnenden bzw. mögliche Turnenden lokal fallende oder steigende letzte Tonhöhenbewegungen, die jedoch prinzipiell noch weiter fortsetzbar sind, und keine Turnhaltesignale. Ein mögliches Turnende ist dann ein solches, an dem eine syntaktisch und/oder aktivitätstypspezifisch and prosodisch/ intonatorisch mögliche Einheit beendet ist üDSi keine Turnhaltesignale produziert werden. Prosodische Signale sind damit sowohl an der lokalen Kontextualisierung und Projektierung von Turnfortsetzung versus Neuansatz nach turn-intemen Störungen und Pausen, wie auch an der lokalen Kontextualisierung von Turnende beteiligt, nicht aber bei der globaleren Turnprojektion. Dennoch kommt jedoch ein solches mögliches Einheiten- und Turnende natürlich nicht ganz unerwartet: Der mögliche letzte Akzent gegen Ende einer projektierten syntaktisch möglichen Einheit eröffnet nämlich den sogenannten 'turnübergabe-relevanten Raum', an des-
231 sen Ende entweder ein Turnwechsel ansteht oder aber ein solcher Tumwechsel verhindert weiden muß. Das ist die Einheit, in der die genannten prosodischen Kontextualisierungen relevant sind. Bei einer Tendenz zu rhythmisch isochroner Akzentsetzung heißt das, daß Rezipienten sich im Hinblick auf den Beginn ihrer Folgereaktion ggf. auch an einer aufgrund der bisherigen Länge der Akzenteinheiten erwartbaren Länge der letzten Akzenteinheit orientieren können. An dieser Stelle trifft sich dann meine Analyse offenbar genau mit neueren Untersuchungen zur rhythmischen Organisation des Turnwechsels in Gesprächen (siehe v.a. die neueren Arbeiten von Couper-Kuhlen). (3) Bei überlappender Rede kontextualisieren prosodische Signale den Status der Rede. Hohe globale Tonhöhe in Kombination mit global größerer Lautstärke kontextualisiert überlappende Rede als rederechtbeanspruchende 'Unterbrechung' eines laufenden Turns, wogegen sich der/die so Unterbrochene seiner/ihrerseits mit global größerer Lautstärke zur Kontextualisierung der Beanspruchung des legitimen Turns, des 'Kampfs um sein/ihr Rederecht', wehren kann. Genau umgekehrt signalisiert geringere Lautstärke als in den umliegenden Turns überlappende Rede als nicht-turnkompetitive Hintergrundkommentare o.ä. (4) Die für die Konstitution von Aktivitäten der Turnorganisation verwendeten prosodischen Signale lassen sich in einzelne konstitutive Parameter dekomponieren. Für jeden einzelnen dieser Parameter ist (s)eine interaktive Relevanz und Bedeutung rekonstruierbar, die dieser Parameter dann auch in die Merkmalbündel für die Konstitution anderer konversationeller Aktivitäten einbringt (s.u.). Mit der in dieser Arbeit verwendeten Methodologie der Analyse prosodischer Parameter bekommen prosodische Kategorien eine genuin empirische Basis. Es wurde gezeigt, daß die Relevanz prosodischer Parameter und Kategorien anhand natürlicher spontaner empirischer Daten nachgewiesen werden kann und muß: Wenn unsere Interpretationen der Funktion und Bedeutung prosodischer Parameter eine empirische Basis haben, dann muß diese auch am empirischen Material aufzeigbar sein. Die beobachtbare und rekonstruierbare Interpretation und Reaktion von Rezipienten auf prosodische Parameter rechtfertigt damit die von mir verwendeten Kategorien. Es zeigt sich, daß prosodische Parameter und Kategorien von ihrer Funktion und Bedeutung in der konversationellen Interaktion her beschrieben und erklärt werden müssen: Prosodische Parameter und Kategorien weiden in der von mir beschriebenen Weise von Sprechern in Interaktionen verwendet, weil sie so den strukturellen Erfordernissen der konversationeilen Interaktion auf systematische und methodische Weise dienen.
232
3. Prosodie konversationeller Fragen Ziel dieses Kapitels ist es, die Unabhängigkeit der Prosodie und vor allem auch der Intonation von der Grammatik bzw. spezieller vom syntaktischen Satztyp bzw. Satzmodus nachzuweisen. Ich werde zeigen, daß Prosodie und Intonation wichtige Funktionen hinsichtlich der Unterscheidung von konversationell und interaktiv relevanten Fragetypen erfüllen, daß diese aber nicht - wie vielfach angenommen - in systematischer Beziehung zum grammatischen Satztyp oder (eher semanüsch gesprochen) Satzmodus stehen. Vielmehr werde ich umgekehrt zeigen, daß Intonation als ein von der Grammatik unabhängiges Signalisierungssystem angesehen werden muß. Lediglich bei der Wahl der Akzentstelle bzw. der Position des Akzents von Äußerungen greifen Sprecher, wie ich in Kapitel 2.2.2.2. gezeigt habe, auch auf allgemeine Prinzipien der Grammatik zurück, nicht aber für die Wahl der Tonhöhenbewegung. Der (unmarkierte) Tonhöhenverlauf der letzten Akzentsilben ist nicht vom Satztyp o.ä. determiniert, sondern unterscheidet und kontextualisiert in Kookkurrenz mit syntaktischen und semantischen Strukturen unterschiedliche Aktivitätstypen in der konversationellen Interaktion. Das Resultat der Analyse ist eine Taxonomie konversationeller Fragen, die durch die Kombination von Merkmalen aus unterschiedlichen unabhängigen Systemen konstituiert werden. Meine Analyse wird zeigen, daß es nötig ist, die grammatische und die interaktive Beschreibungsebene getrennt zu halten: Wenn auch die Beschreibung der Akzentstellen, der Wahl und Verteilung prominenter akzentuierter Silben in der Einheit, eine Analyse (auch) auf grammatischer Ebene verlangt, so erfordert die Beschreibung der Akzenttypen, der an der Akzentstelle gewählten Tonhöhenbewegung, und anderer prosodischer Parameter, den Bezug auf die Organisationsmechanismen der konversationellen Interaktion. Im Hinblick auf die Entwicklung einer Alternative zum traditionellen Ansatz möchte ich darlegen, daß und wie ein interaktional-phonologischer Ansatz die Form und Funktion der Prosodie in Gesprächen, und speziell auch der Intonation, gewinnbringender und besser erklären kann als traditionelle und neuere Arbeiten, die auf der Grundlage traditioneller Annahmen zum Zusammenhang von Grammatik und Intonation arbeiten. Es wird sich zeigen, daß sich einige bisher nur unzureichend geklärte Fragen der Satzintonationsforschung besser lösen lassen, wenn man Intonation als autonomes Signalisierungssystem auffaßt, das keine primär grammatischen, sondern interaktive Funktionen erfüllt. Der Nachweis, daß Intonation unabhängig ist von der Grammatik, ist zugleich auch die Voraussetzung für die Beschreibung der Prosodie und Intonation als Kontextualisierungshinweis auf interaktiver Ebene, sowohl im Hinblick auf die Konstitution von konversationellen Fragen in diesem Kapitel, als auch im Hinblick auf die Konstitution und Organisation des Stils komplexerer konversationeller Aktivitätstypen wie Erzählungen und Argumentationen in Kapitel 4 dieser Arbeit. Die bisherigen Forschungsergebnisse zur Typologie von Fragesätzen, die Fragesätze vor allem nach den syntaktischen und intonatorischen Strukturen differenzieren, sind zu sehr das Ergebnis der Analyse sehr eingeschränkter Beispiel- bzw. Textsorten: nämlich größtenteils immer noch einzelne kontextfreie Sätze oder aber letztendlich introspektiv basierte erfundene
233 Kurzdialoge. Nach der gängigen Auffassung verlangt hierbei der syntaktische Satztyp bzw. Satzmodus (deklarativ, interrogativ, imperativ, exklamativ usw.) in unmarkierten Fällen eine ganz bestimmte terminale Intonation. Wird eine andere als diese terminale Intonation gewählt, wird dies als markiert interpretiert. Die Funktionen der Tonmusterselektion gibt Pheby mit 'Differenzierung' an. Sie leistet die 'Unterscheidung zwischen Satzarten' und die 'Unterscheidung innerhalb von Satzarten' (Pheby 1980: 874). Die 'Unterscheidung zwischen Satzarten' bezieht sich darauf, daß die Wahl des Tonmusters zwischen der Interpretation eines Satzes als Aussage- oder Fragesatz entscheidet: "Ein Satz, der mit Tonmuster la 0) oder lb (Λ) als Aussagesatz interpretiert wird, trägt die Intention einer Entscheidungsfrage und erhält die kommunikative Funktion einer Frage, wenn er mit einer - für die Entscheidungsfrage normalen - steigenden Intonation (Tonmuster 2a (J)) gesprochen wird" (ebd.).1 Die 'Unterscheidung innerhalb der Satzarten' bezieht sich darauf, daß mithilfe der Wahl unterschiedlicher Intonationen bei derselben Satzart, vor allem bei Entscheidungs- und Ergänzungsfragen, hinsichtlich der interpersonellen Markierung im Sinne von Interesse und/oder Höflichkeit markierte und unmarkierte Versionen dieser Fragesätze unterschieden werden (ebd.: 875f und 887). Jedoch weisen in Abhängigkeit von der syntaktischen Satzart beide Fragetypen "umgekehrte Markierungsverhältnisse" auf: "Bei Ergänzungsfragen ist Tonmuster la (\) unmarkiert und Tonmuster 2a (/) markiert, und bei Entscheidungsfragen ist Tonmuster 2a (/) unmarkiert und Tonmuster la (\) markiert" (ebd.: 886). Dafür werden folgende Beispiele gegeben: (75a) / / \ wie heißen sie // ("neutral") (75b) // / wie heißen sie // ("höflich") und (78a) // / kommt der klempner heute // (informatorisch unmarkiert) (78b) //\kommt der klempner heute // (informatorisch markiert) (ebd.: 887; vgl. hierzu auch Köhler 1977: 205ff.). Eine ähnliche, d.h. auf die Festlegung der Satzart/des Satztyps, bzw. semantischer gesprochen: des Satzmodus, abzielende Analyse liegt, trotz ihrer anderen Terminologie und ihrer ganz anders gearteten modularen Gesamtansätze, auch den Arbeiten von Wunderlich 1986 und 1988 und Uhmann 1991 (vgl. dort Kap. 3.5.2.2.), wie auch dem mit sehr viel differenzierteren Satzmodi arbeitenden Ansatz von Altmann u.a. 1989 (s.o. Kapitel 1.1.3.) zugrunde; und ähnliche Funktionen der Intonation bei derartigen Fragesatztypen sind traditionell auch immer für das Englische postuliert worden (vgl. Hirschberg/Pierrehumbert 1986, Pierrehumbert/Hirschberg 1990; für eine Zusammenfassung der älteren Forschung siehe Arndt/Janney 1987: Kapitel 6). 2 Dennoch erscheinen mir weder die zugeschriebenen Einzelinteipretationen Bereits Gumpeiz (1982: 112f.) hat darauf hingewiesen, daß bei Verb-Zweit-Sätzen mit unterschiedlichen Intonationen deren Unterscheidung nach den Kategonen Aussage- und Fragesätze keine grammatische, sondern eine pragmatische ist Da so argumentierende Arbeiten meine Analyse nicht voranbringen, wird auf deren genauere Darstellung und Kritik im Einzelnen verachtet. Eine solche systematische Beziehung zwischen Intonation und den grammatischen Satztypen bzw. Satzmodi wurde traditionell von sämtlichen älteren Intonationstheorien angenommen (siehe besonders von Essen 1964, der immer noch als Basis der Darstellung der Intonation von Fragesätzen in deutschen Grammatiken herangezogen wird, Bierwisch 1969, Kohler (1977: 196ff), Pheby
234 zu den isolierten Sätzen gerechtfertigt, noch die Postulierung umgekehrter Markiertheitsverhältnisse besonders plausibel zu sein. Weiterhin werden die postulierten Markiertheitsverhältnisse von meinen empirischen Daten in keiner Weise gestützt. Die Zuschreibung von unmarkierten und markierten Varianten der Fragesatztypen läßt sich anhand empirischer Daten aus meinen Konversationen weder quantitativ noch qualitativ rechtfertigen. Rein quantitativ gesehen, findet sich in meinem derzeitigen Korpus konversationeller Fragen die folgende Häufigkeitsverteilung für W-Fragen (Ergänzungsfragen) und Verb-Erst-Fragen (Entscheidungsfragen): W-Fragen mit fallender Intonation: 42 W-Fragen mit steigender Intonation: 46 Verb-Erst-Fragen mit fallender Intonation: 14 Verb-Erst-Fragen mit steigender Intonation: 51 Hiemach ergibt sich bei den W-Fragen eine annähernd gleiche Vorkommenshäufigkeit der beiden Varianten, während bei den Verb-Erst-Fragen die angeblich informatorisch markierte Variante seltener vorkommt. Jedoch scheint Pheby seine Markiertheitszuschreibungen auch weniger in quantitativer als in qualitativer Hinsicht rechtfertigen zu wollen, wenn er auf die unterschiedlichen Interpretationen der jeweiligen Varianten eingeht Über die Plausibilität der oben in Klammem gesetzten globalen Interpretationen im Sinne von Höflichkeit und Interesse mit Bezug auf einzelne kontextfreie Sätze kann man jedoch m.E. nur spekulieren. Gegenüber dieser Zuschreibung von Globalinterpretationen zu Tonmustern in Abhängigkeit von der syntaktischen Satzart argumentieren Altmann u.a. 1989 sehr viel differenzierter. Hier wird weniger holistisch als in den anderen Ansätzen nach den einzelnen, die Satzmodi konstituierenden Merkmale aus unterschiedlichen sprachlichen Bereichen gesucht In diesem modularen Modell unterscheiden intonatorische Prototypen zwischen den Satzmodi ansonsten formidentischer Sätze (vgl. Oppenrieder 1988). Jedoch bleibt offen, in welcher Hinsicht diese Satzmodi in realer konversationeller Interaktion relevant sind (s.o. Kapitel 1.1.3.) Am Ende dieser Erörterung der Analyse der Funktion der letzten Tonhöhenbewegung in tonetisch-systemischen und verwandten Ansätzen stehen also Zweifel an der Plausibilität und Übertragbarkeit dieser Analyse auf die Verhältnisse der natürlichen Sprachverwendung in der konversationellen Interaktion. Es stellt sich jedoch auch prinzipiell die Frage, wieso eine derartige Interpretation mit umgekehrten Markiertheitsverhältnissen, die der doch zunächst so viel plausibleren Hypothese entgegensteht, daß ein und dasselbe Tonmuster auch bei allen Fragesatztypen dieselbe Funktion ausdrückt, überhaupt zur anerkannten Hypothese werden konnte, obwohl die vorgelegte Evidenz alles andere als klar ist. Zum einen liegt die Prämisse zugrunde, daß die Intonation satztyp-unterscheidende Funktionen übernimmt, wenn die Syntax allein keine eindeutige Zuordnung zuläßt. Immerhin könnten z.B. Verb-Erst-Sätze ja auch den Satzmodus Imperativsatz, Exklamativsatz oder Adhortativsatz ausdrücken (vgl. Oppenrieder 1988: 170f.). Für den Entscheidungsfragesatz bzw. dessen unmarkierten Fall soll also die steigende Intonation die nötige Differenzierung im 1980, Klein 1980,1982) und von den gängigen Grammatiken, sofern sie überhaupt auf Intonation Bezug nehmen (eben Pheby 1980, Dudengrammatik (1984:733f.). Für eine frühe diskursive Typologie von Fragen, die sich aber von meiner unterscheidet, siehe Bolinger 1957 und die Anmerkungen dazu in Selting (1987: 56f und 161ff).
235 Hinblick auf die Satzmodusunterscheidung erbringen.3 Zum anderen ist jedoch im Rahmen der vorliegenden Ansätze mit der bisher üblichen Methodologie auch gar keine andere Analyse als eine Korrelation von Syntax, oder semantischer gesprochen: Satzmodus, und Intonation durchführbar, ohne in eine zirkuläre Argumentation zu geraten. Diese Frage wird jedoch erst später genauer diskutierbar sein. Gegenüber diesem traditionellen Interesse gilt im folgenden mein Interesse der empirischen Analyse der syntaktischen, semantischen, prosodischen und sequentiellen Eigenschaften von konversationellen Fragen in konversationellen Frage-Antwort-Sequenzen. Diese Analyse erzwingt eine Revision bisheriger Annahmen zum Zusammenhang von Grammatik und Intonation bei diesen Sprechhandlungen bzw. bei den damit assoziierten grammatischen Satztypen. Wenn nämlich eine Interpretation der letzten Tonhöhenbewegung in Fragesätzen im Hinblick auf eine Satzarten- bzw. Satzmodusdifferenzierung unbefriedigend bleibt, dann stellt sich die Frage, welchen Unterschied es denn dann in Fragen dieser Art macht, ob die Sprecher eine steigende oder eine fallende letzte Tonhöhenbewegung wählen. Diese Frage soll im weiteren mit Bezug auf empirische Daten aus meinem Korpus beantwortet werden. Im Rahmen konversationsanalytischer Arbeiten wird gemeinhin davon ausgegangen, daß Frage-Antwort-Sequenzen eine Art "Grundbaustein" konversationeller Interaktion schlechthin sind. 'Fragen' bilden den Ersten Teil eines Nachbarpaares, als dessen Zweiter Teil eine 'Antwort' konditioneil relevant wird. Da beide Strukturteile dieses Paares von unterschiedlichen Sprechern geleistet werden, kann man Frage-Antwort-Sequenzen als ein paradigmatisches Modell für sequentielle Organisation überhaupt ansehen (Sacks/Schegloff/Jefferson 1974). Eine 'konversationelle Frage' ist also eine konversationelle Aktivität einer Sprecherin bzw. eines Sprechers, die eine 'Antwort'reaktion des Rezipienten konditioneil relevant macht. Eine Frage fokussiert einen Sachverhalt als "offen", für deren Beantwortung dem Adressaten ein "Expertenwissen" zugeschrieben wird. Die Form der 'Frage' legt dabei einer möglichen 'Antwort'reaktion des Rezipienten Restriktionen auf: Sie schließt kohärent an und liefert z.B. die 'erfragte', fokussierte Information. Nur so angeschlossene Aktivitäten sind überhaupt als 'Antwort' hörbar. Andernfalls gibt der Rezipient einen Hinweis/Account über seine Verletzung der konditionellen Relevanz, um eine mögliche weitergehende Interpretation dieser offiziellen Verletzung einer konditioneilen Relevanz zu verhindern. Wie Schegloff 1984 betont, weisen konversationelle Aktivitäten, die von Rezipienten als Fragen behandelt werden, vermutlich eine Vielzahl unterschiedlicher sprachlicher und nichtsprachlicher formaler Eigenschaften auf. Denn immerhin interpretieren wir häufig ganz normale Aussagesätze, als seien sie wie Fragen gemeint, und andererseits interpretieren wir Fragesätze, als seien sie wie ganz normale Aussagen oder Mitteilungen o.ä. gemeint. Darüberhinaus können solche Äußerungstypen je nach spezifischem außersprachlichem und sequentiellem Kontext für sehr unterschiedliche interaktive Aktivitäten verwendet werden, z.B. Fragen als Einladungen oder Prä-Einladungen. Schegloff 1984, der den sequentiellen Charakter der Frage-Antwort-Sequenz hervorhebt, mutmaßt, ob nicht letztlich Frage-Antwort-Sequenzen auf Paarsequenzen und die hierin bestehende Beziehung konditioneller Relevanz zurückgeführt werden können. Dann läge seiner 3
Siehe Oppenrieder (1988:203ff.) für einen Überblick über die intonatorischen Prototypen der von Altmann u.a. untersuchten Satzmodi.
236 Meinung nach kein Erkenntnisgewinn am Ende der spezielleren Untersuchung von Fragen bzw. Frage-Antwort-Sequenzen in Gesprächen. Mein Ausgangspunkt ist jedoch ein anderen Ich beginne mit 'klaren Fällen' von Fragen und ich möchte rekonstruieren, in welcher Weise Interaktionspartner bei der Formulierung dieser 'klaren Fälle' von Fragen deren sprachliche Form als interaktive Ressource verwenden. Dementsprechend möchte ich im folgenden zeigen, daß durchaus mit Gewinn danach gefragt werden kann, wozu unterschiedliche syntaktische und prosodische Strukturen und die Herstellung semantischer Beziehungen zum Vorgängerturn mithilfe unterschiedlicher linguistischer Signalisierungsmittel interaktiv verwendet werden können; im spezielleren eben auch "Fragesatzstrukturen" mit unterschiedlichen semantischen Beziehungen zur Vorgängereinheit, die im Gespräch Unterschiedliches leisten. Eine an konversationellen Aktivitäten orientierte, aber in einem weiteren Schritt die sprachliche und prosodische Form genauer analysierende Untersuchung legen auch Kelly/Local 1989 in ihrem Kapitel "Intonation and Interaction" vor (eine erweiterte Fassung von Local 1986). Konkret untersuchen sie anhand von Interviewdaten, die im Rahmen des Tyneside Linguistic Survey erhobenen wurden, folgende konversationeile Aktivitäten, die vor allem durch die prosodisch unterschiedliche Realisierung von lokutiv ähnlichen oder gar identischen Elementen, meist die Wiederholung eines einzelnen Befragungsitems durch den Interviewee, konstituiert werden: 'displays of recognition', 'understanding checks', 'prefaces to checks', 'displays of mulling over'. Kelly/Local argumentieren, daß sequentiell unterschiedlich interpretierte 'repeats' auch unterschiedliche phonetische Korrelate haben. Diese gleichen z.T. den aus der linguistischen Literatur bekannten Phänomenen bei unterschiedlichen Fragetypen, allerdings ziehen auch Kelly/Local es vor, ihre Analyse von den konversationellen Aktivitäten her und nicht mit den möglichen Fragetypen zu beginnen. Kelly/Locals Ergebnis ist, daß im Tyneside - anders als in anderen Varietäten und anderen Darstellungen der Intonation des Englischen - ein 'understanding check' bei einem signalisierten 'problem of hearing' in Form der Wiederholung eines voraufgegangenen Elements mit fallender Intonation high-to-low und weiterhin v.a. mit erhöhter Lautstärke gegenüber umliegender und normaler Lautstärke realisiert wird (vgl. ebd.: 279). 'Prefaces to checks' bei einem 'meaning problem' haben demgegenüber nur fallende Intonation high-to-mid (ebd.: 281). 'Mulling over' oder 'try-outs', mit denen ein Interviewee für sich selbst ein Item (vielleicht nachdenkend) wiederholt, um es erst dann zu kommentieren, haben fallende Intonation midto-low, weiterhin weiden sie langsamer und länger produziert (ebd.: 281f). 'Recognition displays' dagegen haben steigende Intonation und unterschiedliche Lautstärken, sind aber nie leiser als die Normallautstärke des Sprechers (ebd.: 282). Bei anderer syntaktischer Struktur, nämlich wenn ein W-Fragewort vorkommt, haben 'understanding checks' jedoch in Übereinstimmung mit anderen Varietäten auch im Tyneside English steigende Intonation (ebd.: 282).4 Es zeigt sich hier, daß z.T. allein die Intonation aktivitätstyp-unterscheidende Funktion hat. Allerdings scheint mir diese Analyse zu vernachlässigen, daß gerade in den Fällen, die Kelly/Local als Beispiele für 'understanding checks' anführen, auffällig viele dieser Sequenzen damit enden, daß der Interviewee angibt, das fragliche Wort nicht zu kennen und es nie gehört zu haben (vgl. die Beispiele 12 bis 20, S. 267-270). Angesichts dessen könnten hier in den Fällen, in denen von der in anderen Varietäten des Englischen üblichen Intonation abgewichen wird, auch Fälle vorliegen, in denen gar keine einfachen 'understanding checks' infolge eines einfachen Hörverstehensproblems signalisiert werden. Vielmehr
237 Zu ähnlichen Ergebnissen mit Bezug auf konversationelle Aktivitäten der Manifestation und Bearbeitung von Verständigungsproblemen in Behörden-Gesprächen bin auch ich selbst in früheren Arbeiten gekommen (Selting 1987a, b, c). Ich habe gezeigt, daß unterschiedliche Problemtypen, die alle im Rahmen von Nebensequenzen, bzw. genauer: Reparatursequenzen, im Gespräch behandelt werden, mit je unterschiedlichen Problemmanifestationen signalisiert weiden. Als problemtyp-unterscheidende Signalisierungsmittel wurden dabei die syntaktische und prosodische Struktur der Problemmanifestation isoliert. Diese gleichen z.T. den in der Linguistik traditionell unterschiedenen "Fragetypen". Aber neben der Kookkurrenz syntaktischer und intonatorischer Merkmale für die Signalisierung von spezifischen Problemtypen wurden insbesondere durch die Verwendung von höherer Tonhöhe und/oder größerer Lautstärke und/oder stärkeren Akzenten als in den umliegenden Sequenzen prosodisch unmarkierte und prosodisch markierte Problemmanifestationen unterschieden, mit denen wiederum je andere konversationelle Aktivitäten hergestellt weiden. Und so unterschiedene Problemmanifestationen werden dann auch je unterschiedlich vom Rezipienten behandelt. An diese frühere Analyse will ich im folgenden anknüpfen. Meine Perspektive bleibt dabei ähnlich, der Gegenstand wird jedoch ausgeweitet von der Analyse der Manifestation von Verstehensproblemen zur zusätzlichen Analyse anderer Arten von Aktivitäten, die routinemäßig in der Form konversationeller Frage-Antwort-Sequenzen durchgeführt werden. Dabei zeigt sich sofort, daß konversationelle Fragen mit unterschiedlichen syntaktischen und prosodischen Strukturen an unterschiedlichen sequentiellen Positionen im Gespräch auch ganz unterschiedliche interaktive Aufgaben erfüllen. Ich möchte den Zusammenhang genauer analysieren zwischen folgenden Eigenschaften der Frage: (1) ihrer empirisch vorgefundenen syntaktischen Struktur, (2) der hergestellten semantischen Beziehung zum Vorgängerturn, (3) ihrer empirisch vorgefundenen Prosodie und (4) den Eigenschaften der folgenden Antwort des Rezipienten. Damit geht es mir also um die systematische Untersuchung der Rolle der strukturellen Eigenschaften der Frage für die Konstitution einer Äußerung als konversationelle Frage bzw. als spezifischer Fragetyp, der eine spezifische Antwort verlangt. Dabei analysiere ich die Frage in ihrem Kontext, d.h. in ihrer Beziehung zum vorausgegangenen und nachfolgenden Turn. Meine Hypothese ist, daß die unterschiedlichen syntaktischen und prosodischen Möglichkeiten und die explizit hergestellten semantischen Beziehungen zum Vorgängerturn bei der Formulierung konversationeller Fragen systematisch, 'regelhaft' bzw. 'methodisch' verwendet werden, um damit auch unterschiedliche Aktivitäten herzustellen: Denn so unterkönnte die eihöhte Lautstärke zusätzlich zur fallenden Intonation signalisieren, daß der Interviewee eine Bestätigung einfordert, daß er das unerwartete und unbekannte und für ihn 'erstaunliche' Elements richtig gehört hat. In diesem Falle läge aber eine andere Aktivität vor als ein einfaches 'understanding check', nämlich eine Manifestation eines (lokalen) Erwartungsproblems (vgl. Selting 1987a, und s.o. Kapitel 2.2.4.). Zudem wäre dann das prosodische Merkmal erhöhte Lautstärke zu erklären als Mittel der prosodischen Markierung der Problem manifestation bei diesem Problemtyp. Eine solche Analyse würde eine zusätzliche Aktivität analysieren, die durch die weitere Entwicklung der Gesprächssequenzen durchaus plausibel erscheint, und zugleich den vermeintlichen und eigentlich unplausiblen Widerspuch auflösen, daß bei den 'understanding checks' dieselbe Aktivität in verschiedenen Varietäten nicht nur anders, sondern genau gegensätzlich signalisiert werden soll.
238 schiedene Fragen leiten je unterschiedliche Frage-Antwort-Sequenzen ein, in denen auch je unterschiedliche 'Antworten' erwartbar sind. Meine Analyse soll also zeigen, daß die strukturellen Eigenschaften der 'Frage' zumindest einige strukturelle Eigenschaften der 'Antwort' erwartbar machen. M.a.W.: Die Struktur der Frage erlegt der Struktur der Antwort offenbar Restriktionen auf. Aus der Konversationsanalyse von Frage-Antwort-Sequenzen aus natürlichen Gesprächen ergibt sich eine neue Typologie von Fragen, die für eine "konversationsgrammatische" Beschreibung des Deutschen grundlegend wäre. Meine Analyse beschränkt sich jedoch auf die am häufigsten in meinem Korpus vorkommenden Fragetypen und ist keineswegs eine Analyse aller Fragetypen oder aller Frageaktivitäten. Im Rückblick auf die Analyse der Beziehung zwischen den syntaktischen, semantischen, prosodischen und intonatorischen Eigenschaften von Fragen wird sich zeigen, daß die allseits übliche Annahme, Intonation stünde in einer systematischen Beziehung zu den grammatischen Satztypen bzw. Satzmodi, sich zumindest für empirisch erhobene Daten aus echten Gesprächen nicht halten läßt. Meine Analyse erzwingt vielmehr die Annahme, daß zwar die Position der Akzente für die (semantische) Fokussierung relevant ist (s.o. Kap. 2.2.2.2.), daß jedoch Intonation als autonomes Signalisierungssystem, unabhängig von der Grammatik, als konstitutives Element auf interaktiver Ebene zur Konstitution von interaktiv je spezifischen Fragetypen verwendet wird. Es resultiert die Notwendigkeit, zwischen der Analyse des Beitrags der syntaktischen Struktur (v.a. Wortstellung und Fragewörter), der semantischen Beziehung zum Vorgängerturn (der 'Fokussierung' einer Äußerung als Resultat seiner Akzentuierung und ggf. Wortstellung in Relation zum Vorgängerturn) und der Intonation bzw. weiterer prosodischer Parameter zur Konstitution von Fragen zu differenzieren.5
3.1. Taxonomie konversationeller Fragen Der Präsentation in diesem Kapitel liegt folgende Analyse zugrunde: Zunächst habe ich anhand noch weitgehend intuitiver Analysen alle Frage-Antwort Sequenzen meines Korpus gesammelt. Die Kategorie 'Frage' rechtfertigte sich dabei erst aus der Folgereaktion 'Antwort' und nicht allein von der Syntax her. Dann habe ich eine Klassifikation der Fragen vorgenommen anhand der folgenden Kriterien: Wie werden sie vom Rezipienten im Folgeturn behandelt? Welche semantische Beziehung besteht zum Vorgängerturn? Und: Welche syntaktischen und prosodischen Strukturen kommen vor? Die unterschiedliche Behandlung von "oberflächenstrukturell" unterschiedlichen Fragen im Folgeturn gilt als Evidenz für die 'interpretative Relevanz' der unterschiedlichen Frageformen für Interaktionspartner. Das Resultat ist eine Taxonomie konversationeller Fragen im Hin5
Eine weitere Frage beträfe die Art der TonhOhenanknüpfung der Frage an die vorausgegangene Äußerung wie auch der dann folgenden Antwort an die Frage. Hier wäre danach zu fragen, ob analog zu dem von Goldberg 1978 beschriebenen "Peak amplitude affiliation mechanism" innerhalb von Frage-Antwort-Sequenzen ebenfalls eine Art "Pitch affiliation mechanism" bzw. ein Tonhöhen-Mechanismus zur Anknüpfung/Signalisierung der Art der kohäsiven Beziehung aufeinanderfolgender Äußerungen der Sequenz und innerhalb einer Sequenz verwendet wird.
239 blick auf die mit ihnen vollzogenen konversationellen Aktivitäten. Bei der Präsentation meiner Ergebnisse gehe ich schon von dieser ursprünglich natürlich induktiv gewonnenen Taxonomie aus, die ich als Überblick und Strukturierungshilfe auch den Beispielanalysen vorangestellt habe (siehe Figur 2). Im Anschluß an eine überblicksartige Besprechung der dort aufgeführten konversationellen Fragetypen analysiere ich dann exemplarische Beispiele aus meinem Korpus. Die Klassifikation und Analyse zielt auf eine Dekomponierung der holistischen konversationellen Aktivität 'Frage' bis in die kleinsten interpretativ relevanten Signale, die eine Äußerung als eine konversationelle 'Frage' konstituieren und kontextualisieren und als solche interpretierbar machen. Hierbei wählen die Interaktionspartner offenbar konstitutive Signale aus den folgenden autonomen Signalisierungssystemen (1) - (3) aus und verwenden sie als Bündel kookkurrierender Signale für die Kontextualisierung eines bestimmten Fragetyps, der eine spezifische Reaktion der Rezipienten mit den in (4) genannten Merkmalen verlangt: (1) Syntaktische Struktur der Frageäußerung: finiter Fragesatz bzw. dessen Ellipse versus einzelnes, ggf. lokalisiertes, W-Wort: [± finiter Fragesatz bzw. dessen Ellipse] [± W-Wort oder W-Phrase oder X-Phrase] [± Erststellung des finiten Verbs] (2) Semantische Beziehung zum Vorgängerturn: v.a. ob und welche Art der Wiederaufnahme eines (problematischen) Bezugselements: [± Neufokussierung] [± Fokusweiterführung] [± Refokussierung] [± Wiederaufnahme eines problematischen Bezugselements/-sachverhalts durch anaphorische Wiederaufnahme/Zitierung oder W-Wort-Ersetzung des Bezugselements] (3) Prosodie der Frageäußerung: v.a. ob steigende oder fallende letzte Tonhöhenbewegung und ob prosodisch gegenüber den umliegenden Äußerungen markiert oder nicht: [+ Intonation: fallende vs. steigende letzte Tonhöhenbewegung]6 [± prosodisch markiert] (4) Die mit diesen Komponenten konstituierte Frage impliziert eine ganz spezifische "Aufforderung" an den Rezipienten, eine je spezifische erwartete Reaktion zu liefern: [± Einladung zur uneingeschränkten Elaboration des Themas] [± Erwartung eingeschränkter 'Antwort'] [± Nebensequenzauslösung] In der folgenden Darstellung gehe ich aus von konversationellen Aktivitäten, die im weitesten Sinne erste Teile einer Frage-Antwort-Sequenz konstituieren.7 Diesen ordne ich dann die 6
'
Bei der Formulierung dieses Merkmals habe ich eine Notation im Sinne einer binären Opposition vermieden, um nicht ohne Rechtfertigung einem Mitglied dieses Paars den Status des markierten und dem anderen den des unmaikierten Merkmals zuzuweisen. Eine Notation als [+ x] impliziert damit zunächst also nur per Redundanzregel, daß nicht [+ y], [+ z] usw. Hierbei werden dann Frage-Antwort-Sequenzen und durch ggf. spezielle Arten von Fragen initiierte Reparatursequenzen noch nicht unterschieden; solche Reparatursequenzen sind eben eine spezielle Art von
240 konstitutiven Signalisierungssysteme als autonome Systeme zu, aus denen Interaktionspartner Signale wählen und in Kookkurrenz miteinander verwenden, um den intendierten Aktivitätstyp zu signalisieren und zu konstituieren.8 Vom Aktivitätstyp her gesehen, geben die Linien zu den autonomen Systemen konstitutiver Merkmale die zu kombinierenden konstitutiven Merkmale an; umgekehrt läßt sich von den Merkmalen her rekonstruieren, für die Konstitution welcher Aktivitätstypen sie notwendig und typ-unterscheidend sind. Mehr als eine Verbindung zwischen einem autonomen Signalisierungssystem und einem Aktivitätstyp verweist darauf, daß mehrere Merkmale verwendet werden können, sowohl alternativ als auch in Kombination. Die Linientypen variieren nach System. Die Gemeinsamkeit aller konversationellen 'Fragen' ist, daß sie eine mit dem Ende der Turnkonstruktionseinheit bevorstehende Beendigung des in Produktion befindlichen Turns und damit einen Sprecherwechsel projektieren, der das Rederecht/die Redepflicht für die nun konditionell relevante 'Antwort' an den Rezipienten vergibt. Entsprechend dem Erfordernis, eine bevorstehende Turnvergabe möglichst früh dem Rezipienten anzuzeigen, sind hierfür die Fragesätze besonders gut geeignet. W-Wort bzw. bei Verb-Erst-Fragen das Verb in erster Position signalisieren eine solche Äußerung von Anfang an als 'Frage' mit bevorstehender Turnvergabe. Daneben werden aber auch andere Frageformen zur Konstitution spezieller Sequenzen verwendet. Wie aus der schematischen Darstellung ersichtlich, gehe ich von der grundlegenden Unterscheidung zwischen (1) nicht-einschränkenden "offenen" Fragen, und (2) einschränkend weiterführenden Fragen aus. Der Unterschied zwischen diesen beiden Typen ergibt sich aus der signalisierten semantischen Beziehung zum Vorgängerturn. Diese beschreibe ich, z.T. in Anlehnung an Maynards 1980 Kategorien, generell als Beziehung der Fokussierung aufeinanderfolgender Aktivitäten in den Kategorien 'Neufokussierung', 'Fokus(sierungs)weiterführung' und 'Refokussierung',9 die unterschiedliche Konsequenzen für die Weiterentwicklung der Konversation haben. 'Neufokussierung' meint eine thematische Weiterentwicklung, bei der gegenüber der vorherigen Einheit der Gesprächsgegenstand gewechselt oder als neu präsentiert wird (vgl. Maynards 'topic initiator' und 'topic change'). Bei 'Fokusweiterführung' wird an die Fokussierung der Vorgängereinheit kohäsiv und kohärent angeknüpft und die bisherige Fokussierung weitergeführt, indem der Gesprächsgegenstand sukzessive detaillierend (weiter) verschoben wird (vgl. Maynards 'on-topic talk' bzw. 'further topical talk'). 'Refokussierung' meint dagegen, daß die
Frage-Antwort-Sequenz mit einer spezifischen Art der Beziehung und Einbettung in das es umgebende übergeordnete Gespräch. Die Idee der graphisch repräsentierten Einanderzuordnung der autonomen Systeme im vorliegenden Diagramm verdanke ich Dafydd Gibbon (Universität Bielefeld). Der ethnomethodologische Begriff der 'Fokussierung' bezeichnet eine (holistische) Interpretation, die sich aus der hergestellten und interpretierten semantischen Beziehung zwischen aufeinandeifolgenden Aktivitäten bzw. Äußerungen ergibt. Zu den sprachlichen Signalisierungsmitteln, mit denen Sprecher die Interpretation von Aktivitäten der Fokussierung erzeugen, gehören die Herstellung und Signalisierung der semantischen Fokus-Hintergrund-Struktur der je einzelnen Äußerungen mit Hilfe der Akzentuierung, der Wort- bzw. Satzgliedstellung, lexikalischer Mittel usw. Zum ethnomethodologischen Begriff der Tokussierung' allgemein und dessen Beziehung zum linguistischen Begriff des 'Satzfokus' siehe Kapitel 2.2.
242 thematische Entwicklung innehält und ein bereits zuvor fokussierter Sachverhalt noch einmal erneut fokussiert wird bzw. die Fokussierung auf einem wiederaufgenommenen Element/Sachveihalt liegt (vgl. auch Kapitel 2.2.). Während bei nicht-einschränkenden "offenen" Fragen eine Neufokussierung vorgenommen oder insinuiert wird, wird bei den einschränkend weiterführenden Fragen keine Neufokussierung vorgenommen, sondern entweder die bisherige Fokussierung weitergeführt und verschoben oder ein schon einmal fokussierter Sachverhalt refokussiert und als Problem manifestiert. Bei den einschränkend weiterführenden verständigungsbearbeitenden Fragen wird eine bisherige Fokussierung weitergeführt und verschoben, um innerhalb des fokussierten Rahmens Verständigung herzustellen und zu bearbeiten.10 Hier wird ggf. zu einem bereits thematischen - und ggf. auch unakzentuiert/nicht-fokussierend anaphorisch wiederaufgenommenen - Sachverhalt zusätzliche Information fokussiert und angefordert, um die bisherige Fokussierung weiterzuführen und/oder ein bisheriges Verstehen bzw. eine Inferenz des Fragers zu überprüfen. Ggf. sind diese Fragen auch explizit verständigungssichernd und nehmen dann eine Zwischenstellung ein zwischen der unproblematischen Fortsetzung des Gesprächs und der expliziten Manifestation eines Verständigungsproblems. Dagegen erfolgt bei den problemmanifestierenden Fragetypen immer eine Refokussierung in der Form einer expliziten und fokussierten Wiederaufnahme eines problematischen Elements aus dem Vorgängerturn, die eine Problembearbeitung durch den Rezipienten verlangt Diese explizite Problembehandlung hat immer das Format einer Reparatur(neben)sequenz, konkreter einer fremdinitiierten Selbstreparatur (Jefferson 1972, Schegloff/Jefferson/ Sacks 1977, Selting 1987a). Das genaue Format der Wiederaufnahme und die prosodische Struktur der Frage unterscheiden hier unterschiedliche Problemtypen. Bei der syntaktischen Form der Fragen scheint v.a. eine Unterscheidung zwischen fíniten Fragesätzen und deren Ellipsen einerseits und isolierten infiniten Phrasen (W-Wörter, WPhrasen oder wiederaufgenommene X-Phrasen aus dem Vorgängertum) andererseits grundlegend zu sein. Bei den syntaktischen Satztypen können hier v.a. W-Fragen und Verb-Erst-Fragen unterschieden werden. Es wird sich zeigen, daß demgegenüber sogenannte 'Verb-ZweitFragen' einen anderen Status haben. In prosodischer Hinsicht ist die Unterscheidung zwischen fallenden und steigenden letzten Tonhöhenbewegungen der Frage und zwischen prosodisch markierter und prosodisch unmarkierter Form interaktiv relevant. Prosodische Markierungsformen sind v.a. hohe globale Tonhöhe plus größere Lautstärke und/oder stärkere Akzente oder größere lokale Tonhöhenbewegungen als in den umliegenden Äußerungen (siehe Kapitel 2.2.4.). Allerdings ist eine prosodisch markierte Form nicht bei allen Fragetypen belegt, in einigen Fällen wohl auch Der Unterschied zwischen "Neufokussierung' und "Fokusweiterfiihnmg' ist dabei in rein semantischer Hinsicht leider oft alles andere als klar. Offenbar kann in Zweifelsfällen dieselbe kohäsiv anschließende Folgeeinheit mithilfe der Prosodie als •Neufokussierung' oder als "Fokusweiterfühning' kontextualisiert und "hingestellt" weiden. Der Unterschied liegt dann nur in der damit relevant gemachten Implikation für die Art und den Spielraum der Antwort. Dies ist genau das, was Maynard (1980: 263) meinte, wenn er schrieb: "Topicality (...) is a matter not only of content, but is partly constituted in the procedures conversationalists utilize". Die zirkuläre Argumentation, die eine solche auf die Frage beschränkte Analyse erfordern und damit methodologisch anrüchig machen würde, kann hier nur durch die Konversationsanalyse der procedures und der sequentiellen Implikationen der so kontextualisierten Fragen im Hinblick auf die genaueren Eigenschaften der konditionell relevanten Antwort aufgelöst werden.
243 nicht möglich. Z.B. fehlen prosodisch markierte nicht-einschränkende "offene" Fragen. Solche Fragen werden nämlich automatisch als Manifestation eines Erwartungsproblems interpretiert: als "erstaunte", "zweifelnde" Fragen, in denen der Frager einen Widerspruch zu seinen Erwartungen manifestiert. Im folgenden werden diese Typen konversationeller Fragen und ihre verschiedenen Varianten durch Beispiele genauer belegt und illustriert. Ich möchte anhand von Beispielen aus meinem Korpus zeigen, daß die mithilfe der genannten Merkmale konstituierten und unterschiedenen Typen konversationeller Fragen tatsächlich unterschiedliche Antwortreaktionen relevant machen. Die Analyse der Antwort gibt Evidenz für die Unterscheidung der genannten Fragetypen. Neben Fällen, in denen die Antwort erwartungsgemäß erfolgt, liefern auch gerade die einklagenden Reaktionen der Gesprächspartner auf nicht-erwartungsgemäße Antworten weitere Evidenz für die interaktive Relevanz dieser Unterscheidungen.
3.1.1. Nicht-einschränkende "offene" Fragen In die Klasse der nicht-einschränkenden "offenen" Fragen fallen alle Frageäußerungen, die gegenüber dem Vorgängerturn ein neues Thema eröffnen oder innerhalb eines thematischen Rahmens eine neue Fokussierung vornehmen, die dann Ausgangspunkt daran anknüpfender fokusweiterführender Sequenzen sein kann. Nicht-einschränkende "offene" Fragen sind oft eher neufokussierende Gesprächsfortsetzungsinitiativen als Fragen in einem engeren Sinne. Sie können dabei selbstverständlich kohäsive Beziehungen zu vorherigen Einheiten haben, aber primär sind sie auf die thematische Weiterentwicklung der Konversation ausgerichtet. In diesem Sinne erlauben diese Fragen dem Rezipienten einen großen Spielraum für die Gestaltung seiner Antwort. Nicht-einschränkende "offene" Fragen werden mit W-Fragen und VerbErst-Fragen mit steigender letzter Tonhöhenbewegung formuliert, wie sie in den folgenden Beispielen vorkommen.11 (a) W-Fragen Bei den W-Fragen kann man der Syntax nach unterscheiden zwischen finiten W-Fragesätzen und W-Ellipsen. W-Ellipsen haben wie die W-Fragesätze eine steigende Intonation und werden von den Rezipientinnen und Rezipienten als nicht-einschränkende Fragen behandelt. WEllipsen mit fallender Intonation werden dagegen nicht als W-Ellipsen, sondern als Problemmanifestationen verwendet (s.u.).
Dieser Analyse liegen insgesamt 46 W- und 51 Verb-Erst-Fragen zugrunde, die als nicht-einschränkende "offene" Fragen analysiert wurden.
244
(1) K4: ((Thema: Kritik einer Seminarteilnehmerin an L's Seminarleitungsstil.)) 1189 L:
[ JA . BUMM . DA hat ich mein FETT WECK ne
1190 ?: 1191 E:
(\) (\ ) T,F(/ ((schnalzt))
\
\
/)
un WAS has du geSA:CHT M(\
/
)
1192 L:
äh η FIEL mir ersmal NICH mehr viel ein S(/ / )
1193 L:
dann hab ich gesacht M( ... )
1194 L:
naJA ich mein das wär nich so EINfach [M(\
/
)
1195 L:
DIE KENNtn sich alle nich M(\ / )
1196 L:
un BIS die mal WABMgelaufn wárn und .. M(\ / )((L setzt weiter fort.))
(2) K2: 208 R: 209 N: 210 I:
ich weiß gar nich wie ich das verschriftliehen soll ((lacht)) ((lacht))
211 N:
wie SIEHTS jetzt eigntlich AUS mit dem fach muSIK F(\ \ /)
*
212 N:
also da HÖRT man ja auch gar nichts mehr ne F(\ /)
213 R:
im moMENT . äh: weiß ich AUCH nichts neues M(/ \ )
214 R:
das das: öh scheint auf EIS zu liegen oder M(\ )
215 R: r
JEdnfalls so .. rein nach ADssen hin T(\
216 I: 217 N:
\
)
mhm nhn \/
218 N: 219 R: 220 R:
un wer letz das : ähn der der .. ähm ... lehrbetrieb is jetzt sonst w . äh ganz normal weitergelaufn
245 K5: 285
also ich ich muß mich DE:R:maßn ARgern über die ne T,F(\ \ /)
286
un wieSOι M(/)
287
....
288
die MACHT innerhalb der: ähf M(\
289
literaTURwissenschaftlerip in der FRAUNforschung \ \
290
ne DBRmaßn MIEse: . poliTIK ne
weil DIE: Ah . ((r&uspert sich)) M(\ ) -
\
\
\
/)
291 292 293 294 295
mhm also: ((räuspert sich)) karRIEre geht der über EINladungn ne nhn mhm ((L setzt noch weiter fort.))
Kl: 121
ich finde geRAde bei SOLchn sachen M(\ /
122
HÖR ich immer lieber KXHner \ \ )
123 124 125 126 127
nhn \/ was DIB dazu sagen F(\ ) STIMMT mhm M(\ ) \/
..
is NEsentlich interesSANter F(\ \ ) ja \
128 *
WARUM F(\ /) das
((stöhnt))
129 130
äh:m . ja das kommt auch DAher weil .. mh M(\ )
131
diese ganzen FRAUNthemen von wegen emanzipaTION un so M(\ \ )
246 132 I:
die wern von den MEIsten fraun DIE sich damit M(\
133 I:
beSCHÄFtigen und die da so: HIMterstehn \ \ / )
134 I:
...
135 I: 136 R:
137 I:
irgnwie so HOCHgejubelt und F(\
r u h auch so exTREM ausgebreitet ne \ /) mhm L \/ undâh
.
(5) Kl: 410 I:
DEUTSCH UND M(\
411 N:
/
poliTIK \)
412 I:
mhm \/
413 I: *
un WAS machs DU S(/ /)
414 R:
ICH mach gymllAsium F(Ν \ )
415 I:
mhm V
416 N: *
un DU M( /
417 I:
reALschule \ )
In den Beispielen (l)-(5) kommen jeweils in den gesternten Zeilen nicht-einschränkende "offene" W-Fragen vor, allesamt mit steigenden letzten Tonhöhenbewegungen. In (1), (2) und (5):413 haben diese die Form finiter W-Fragesätze, in (3), (4) und (5):416 kommen die WFrage-Ellipsen un wieSO:, WARUM und un DU vor, ebenfalls mit letzter steigender Tonhöhenbewegung. In allen Fällen eröffnet die Frage eine auch thematisch neue Sequenz, indem in der Frage eine Neufokussierung vorgenommen oder suggeriert wird, an die in der Antwort kohäsiv und kohärent angeknüpft werden soll. So geht in (1):1191 der Fokus von L's Erzählung über das schlechte Verhalten einer Lehrerin, die an ihrem Seminar teilnahm, zu ihren eigenen Reaktionen auf dieses Verhalten. Die Rezipientin beantwortet die Frage ausführlich. In (2):211 wech-
247 seit Ν den Fokus vom Thema Aufnahmesituation zur Situation im Fach Musik. Auch hier beantwortet R nach N's Zusatz die Frage ausführlich. Vor (3) teilt zunächst L das Faktum ihres sich ärgerns mit, und C fokussiert dann in Z. 286 die Gründe oder Motive dafür. Ebenso stellt in (4) I zuerst fest, daß sie zur Frauenthematik lieber die Meinung von Männern als von Frauen hört und R fokussiert dann in Z. 128 die Gründe dafür. In (5) finden in den Zeilen 413 und 416 jeweils Sprecherrollenwechsel und zugleich auch Fokuswechsel vom Studium des einen Teilnehmers zum Studium des nächsten Teilnehmers statt. In allen Fällen beantwortet dann im Folgeturn die Rezipientin die gestellte Frage; in (2) allerdings erst nach einem Zusatz zur Frage. Wenn diese Fragen - wie v.a. in den angegebenen Beispielen (l)-(4) - die Konversation thematisch weiterentwickeln sollen, scheinen die Frager den Rezipienten für ihre Antwort einen uneingeschränkten weiten Spielraum einzuräumen. Dementsprechend scheinen sie das Rederecht für einen ggf. eher längeren Tum zu übergeben. In vielen Fällen ist die Antwort der Rezipienten auf nicht-einschränkende "offene" Fragen dann auch der Beginn einer längeren Ausführung; insofern scheinen auch die Rezipienten solche Fragen nicht als Einschränkung der von ihnen nun erwarteten Reaktion zu interpretieren. Allerdings lassen häufig die 'Antwortenden' nach einer ersten Antwortreaktion eine zumindest kurze Pause, vielleicht um den 'Fragenden' Gelegenheit zu einer Reaktion zu geben, bevor sie die 'Antwort' weiter elaborieren oder in anderer Weise das Gespräch nun selbst weiterführen. Solche Fälle legen nahe, daß bei diesem Fragetyp der Antwortende das Rederecht für einen gegebenenfalls längeren, uneingeschränkten Tum zugewiesen erhält, mit weitem Spielraum für die Fortsetzung. In diesem Sinne handelt es sich bei den nicht-einschränkenden "offenen" Fragen eher um Gesprächsfortsetzungsinitiativen als um Fragen in einem engeren Sinne. Sie sind "echte" Fragen in dem Sinne, daß sie keine spezifischen Voraussetzungen haben und auch keine spezifische Antwort bevorzugen oder nahelegen. Lediglich wenn die nicht-einschränkenden "offenen" Fragen in übergeordnete Sequenzen eingebettet sind, scheint nur eine kurze Antwort erwartet zu werden. In (5) stehen die Fragen in einer ganzen Frageserie: Die Gesprächspartner fragen sich gegenseitig in z.T. elliptischer Kurzform nach ihren Studienfächern und Studiengängen. Auf die (z.T. elliptisch) kurzen Fragen folgen hier ebenso kurze Antworten. Auch hier sind die Fragen aber "offene" und "echte" Fragen, die inhaltlich keine spezifische Antwort präferieren und auch keine Vermutungen mit Bezug auf die erwartete Antwort nahelegen. Hiermit zeigt sich, daß die Einbettung einer nicht-einschränkenden "offenen" Frage in eine übergeordnete Sequenz die erwartbare Länge der Antwort einschränken kann. (b) Verb-Erst-Fragen Zunächst einige Beispiele mit finiten Verb-Erst-Fragen mit steigender letzter Tonhöhenbewegung: (6) Kl: 796 Ν 798 Ν 799 I
hat ne gehirnerschütterung gehabt und öh .. (?nun) is dicht ne mhm
800 801
802 803 804 805 806 807 *
och wußte sie vorher au nich bis sie (???) zum arz gegangen is un der da .. tausend tests gemacht hat un dann meint er s: kam von der gehirnerschütterung r dja: L r (?hja) η da kann man nichts mehr machn L nee ((lacht)) FÄHRS du denn AUCH jeden tach F(\ / )
808
ich
809
also ich WOHne in Wilhelmshaven BRSTwohnsitz F(\ / )
810
811
HAB hier: . noch ne WOHnung F(\ \ )
(1.0)
(0.5)
[
mhm und
HAB hier (0.8) η ZWBITwohnsitz F(\ \ )
812
mhm \/
813
un:d dann bin ich am Wochenende immer in wilhelmsHAven S(/ / ) (1.0)
814
r un:d mittlerWEIle auch: . UHter der WOche einmal F(/ \ \ )
815
mhm \/
C4: 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383
dassis son lesebuch fü:r fraunliteraturkurse ah ja weil de .. ds halt immer schwierich is für die kursleiterip diese ganzen sammlungp .... âh zusammenzustelln un die auch kein nhn . nhn bock dazu habm auch verständlicherweise versteh ich ja . ja ... ich war ja selbst oder bin . öfter selbst inner läge ((hustet zweimal sehr laut)) ja: ((râuspert sich)) raucherhustn has de mhm
382
BIS du denn AUCH hier an der UNI beschäfticht H,S(\ / / )
*
383
mhm \/
384
STELIe von michael EKSzett= \ \ )
..
ich verTRHT im moment die F(\
249 385 E:
=der is LBKtor für TÜRkisch M,F(\ \ / ) hmHM
386 C:
\/
387 E:
un ich M A C H so M(\
388 E:
ja M(\)
)
....
-
diDAKtik DEUTSCH als FREMDsprache F(\ \ \ )
(8) K4: ((L hat erzählt, daß sie die Arbeit an ihrem Buch vor sich her schiebt und nun zuerst in Urlaub fahren wird.)) 356 357 358 359
L: L: C: E:
un ich v(h)erbinde das dann halt mit dem netten und r ich hoffe das ich denn was tue ((lacht)) ((lacht)) L mja das is auch besser
360 L:
eJA: T(\)
361 L:
ich GLAUB sonst mach ich das MIE zuende ne M(/ \ /)
362 C:
363 E: *
364 L:
r mhm \/
HAS du denn beliebich viel ZEIT oder: L S(/ / ) nee es MUß eigentlich im herbs STEhen ne \ T,S(/ \ /)
365 E:
366 L:
hmhm \/ SPXtestens M(\ ) ((L setzt weiter fort.))
In den Gesprächsausschnitten (6)-(8) kommen in den gesternten Zeilen jeweils Verb-ErstFragen vor. Alle diese Fragen sind neufokussierend gegenüber dem Vorgängerturn, z.T. leiten sie ganz neue Gesprächsthemen ein oder entwickeln das bisherige Thema mit einem Fokuswechsel weiter. In allen Fällen haben auch diese nicht-einschränkenden "offenen" Verb-Erst-Fragen eine steigende letzte Tonhöhenbewegung. Die häufigste Intonation bei diesen Fragen ist eine Akzentsequenz (\ /), jedoch können der letzten steigenden Tonhöhenbewegung auch andere Tonhöhenbewegungen vorausgehen, so etwa noch eine oder mehrere steigende Akzenttypen wie in (7) und (8). Ebenso wie bei den nicht-einschränkenden W-Fragen werden auch diese Verb-Erst-Fragen offenbar als nicht-einschränkende "offene" Fragen verstanden. In den Beispielen (6)-(8) werden jeweils Aktivitäten des Rezipienten relativ allgemein fokussiert, und es wird jeweils
250 eine relativ extensive Antwort gegeben, die ggf. nach Rezipientenreaktionen und Pausen auch noch weiter ausgebaut wird. Auch diese Fragen werden wohl mehr als Gesprächsfortsetzungsinitiativen denn als Fragen in einem engeren Sinne behandelt. Dagegen sind in den Extrakten (9)-(10) die Antworten auf kurze elliptische Fragen in Fragereihen wiederum nur kurz: (9) K2: ((nach dem Thema Mitbewohner zu Hause)) 873 N: Γ joa .. V
hab AUCH bei meiner MUTter .. geLEBT M(T\
\
/ )
874 I:
Da \
875 N: r mit meiner SCHWEster zusammn
M(/ ) 876 I: mhm \/ 877 N:
umeine GROßeltern M(\ )
878 N:
nat(h)ürlich(h) T( ... ) JAa mhmmhm
879 I:
(\/)
\/
\/
880 N:
nhn \/
881 I:
deine ÄLtersch âh M(\
882 Ν:
JAa . . ZWEI JAHre H(\/) F(\ \ )
883 I:
mhm \/
884 Ν:
DEIne Η(/ )
885 I:
nee ICH bin die ÄLteste \ F(\ \ )
886 N:
wie alt BIS du denn M(\ )
(10) K l : wenn das zum beispiel ne frau geschrieben hätte hätte ich das nich gekauft weil das dann nur so hier . scheiß mànner: un un un mh das is doch klar und von seiner mutter un .. ich die unterdrückte
251 404 405 406 407 408
Ν: dann hätt ich das nich gekauft N: aber so weil das η mann geschriebm hat . N: fandich das schon ganz interessant Ν: i- wie selbstkritisch oder . . auch nich I: L ja
409 I:
[
MACHT ihr auf: LEHRamt F(\ /
410 R:
mhm \/
411 N:
*hm*hm (- _)
412 I:
DEUTSCH UND M(\ /
413 N:
maGIster M(\ )
poliTIK \)
414 I:
mhm \/
In (9) gibt Ν dieselbe Frage, die I voriier in Zeile 881 an sie gerichtet hatte, in 884 in elliptischer Form an I zurück und I beantwortet sie ebenso kurz wie sie selbst vorher geantwortet hat. In beiden Fällen folgt auf eine kurze elliptische Frage eine kurze elliptische Antwort Im Extrakt (10) stellt I als Einleitung zu einer ganzen Fragereihe zu den anwesenden Personen die Frage nach dem Studienziel der Rezipienten, die von R und Ν nur jeweils minimal beantwortet wird. Offenbar ist hier kein nächster Sprecher direkt gewählt worden und niemand übernimmt das Rederecht zu einer ausführlicheren Antwort. Wie bereits die W-Fragen in (5) stehen auch in (9) und (10) diese Fragen in einer Art "Befragungsreihe" aus mehreren ähnlich strukturierten Fragen hintereinander. Die Fragen werden offenbar im Sinne von Fragen verstanden, die lediglich z.B. der Voraussetzungsklärung für das Rezipientendesign der Gesprächsfortsetzung durch den Frager selbst dienen und das Rederecht nicht für einen längeren Redebeitrag vergeben; entsprechend sind bei den Fragen in diesen Extrakten auch Formulierungen gewählt und akzentuiert, die die Frage eng eingrenzen darauf, ob die eigene Schwester auch älter sei und ob die Adressaten auf LEHRamt studieren. Diese Fragen in (9) und (10) sind nur ein Glied im Zusammenhang aufeinanderfolgender Frage-Antwort-Sequenzen. Den in meinem Korpus verwendeten nicht-einschränkenden "offenen" W- und VerbErst-Fragen, die gegenüber dem Vorgängertum eine Neufokussierung vornehmen, ist gemeinsam, daß sie alle eine steigende letzte Tonhöhenbewegung aufweisen. Die so verwendeten Fragen haben i.d.R. die syntaktische Struktur eines finiten Fragesatzes oder dessen Ellipse.12 Sie werden als nicht-einschränkende "offene" und in gewisser Hinsicht "echte" Fragen prä-
Eine Frage-Ellipse ist nicht identisch mit einer problemmanifestierenden oder wiederaufnehmenden WPhrase oder X-Phrase, wie sie später noch betrachtet werden. Die in diesem Abschnitt betrachteten Ellipsen, die auch aus den Fragewörtern warum und wieso, gegebenenfalls mit Anknüpfungssignal und, bestehen, haben immer eine steigende Intonation. Genau diese steigende Intonation ist offenbar für die Interpretation und Behandlung dieser weiterführenden Elemente als Ellipsen nicht-einschränkender Fragen durch Rezipienten verantwortlich. Mit fallender Intonation werden dieselben Fragewörter jedenfalls als Manifestationen lokaler Erwartungsprobleme behandelt (s.u. Kapitel 3.1.3.2.1.).
252 sentiert bzw. kontextualisiert, bei denen der Frager eine ("echte" und nicht etwa von ihm selbst nahegelegte) Antwort erwartet, die das Gespräch thematisch weiterentwickelt.13 Diese Fragen fordern offenbar vom Rezipienten mehr Informationen zum fokussierten Sachverhalt und die Rezipienten interpretieren die Fragen - sofern sie nicht in besonderen sequentiellen Umgebungen stehen, die die erwartete Länge der Antwort einschränken - als Übergabe des Rederechts für einen uneingeschränkten, gegebenenfalls längeren Turn, der einen Beitrag zur thematischen Weiterentwicklung des Gesprächs leistet. (c) Einklagungen der erwarteten Antwort Die bisherigen Beispiele zeigten Fälle, in denen die Rezipienten der Fragen im Folgeturn offenbar entsprechend den mit den Frageformen nahegelegten Interpretationen und Erwartungen reagierten. Zumindest signalisieren die Frager keine Unzufriedenheit mit den Antworten. Das ist jedoch nicht immer so. Das Beispiel (11) zeigt einen "abweichenden" Fall, in dem eine längere Antwort eingeklagt wird: (11) K2: ((Beginn eines neuen Themas)) 12 N:
was HAS du denn da für KARbm S (/ \ /)
13 I :
ACH sod* . JA das : .. H(\ ) M(\) -
14 I:
SCHRECKlich aus weil die nicht geNXHT wordn is / \ )
15 Ν: *
was HAS enn da geMACHT
16 I:
da hab ich mich mal geSCHNITTn inner SCHUle < all > F( \ \ /)
17 I:
also quasi η SCHOL*UNfall sach ich da immer zu T,F(\ \ )
18 I:
((lacht leise ca. 2 Sek.))
M(\
\
...
die SIEHT nur so : F(\
)
((Hiernach erzählt I das Ereignis.))
In (11) werden zwei W-Fragen formuliert Die erste W-Frage in Zeile 12 hat sowohl eine global steigende als auch eine auf der letzten unakzentuierten Silbe noch steigende letzte Tonhöhenbewegung. Es handelt sich um eine neufokussierende Frage, die in die Kategorie der nicht-einschränkenden "offenen" weiterführenden W-Fragen gehört, mit nach hinten verschoEine Kontextualisierung bzw. Präsentation einer Frage als nicht-einschränkende oder einschränkende Frage impliziert natürlich nicht unbedingt, daß sie für den Frager auch tatsächlich eine solche ist. Er kann sie auch aus strategischen Gründen nur so kontextualisieren, um die mit diesen Fragetypen verbundenen Interpretationsrahmen auszunutzen. Wenn dies jedoch im Material nicht manifestiert wird, sind solche strategischen Verwendungen mithilfe konversationsanalytischer Methodologie nicht analysierbar.
253 bener letzter Tonhöhenbewegung. In der Antwort verschiebt I aber den Fokus von den Narben selbst (und ggf. deren Geschichte) zum Aussehen dieser Narben und scheint diese Frage nicht ausführlich beantworten zu wollen. Die dann folgende zweite W-Frage mit der fallenden letzten Tonhöhenbewegung in Zeile 15 fokussiert das Gespräch erneut auf die schon gestellte Frage nach den Narben selbst, dieses Mal jedoch gegenüber der ersten W-Frage enger auf die Geschichte (was HAS enn da geMACHT) fokussierend. Und diese Geschichte wird von I dann auch dargestellt. Nach der ersten kurzen Antwort von I in Zeile 16 läßt sie zunächst eine Pause, in der im Prinzip Ν das Rederecht erneut übernehmen könnte, bevor I nach weiteren "Zwischenaktivitäten" (vgl. das Lachen) in Zeile 17 eine Erzählung ankündigt und dann das zugrundeliegende Ereignis noch genauer schildert. Diese Elaboration der Antwort auf die zweite, dann einschränkender weiterführende Frage zur Erzählung könnte in diesem Fall noch als eine Reaktion auf die erste, "offene" W-Frage interpretiert werden. Bei dieser Interpretation wäre die zweite Frage eine einklagende Frage, mit der ein ausführlicher und thematisch weiterführender Beitrag zur Gesprächsentwicklung angefordert wird, nachdem I auf die erste nicht-einschränkende Frage nicht ausführlich genug geantwortet hat. Methodisch liefern gerade solche Fälle, in denen erwartbare Reaktionen eingeklagt werden, Evidenz für die interaktive Relevanz strukturell analysierter Fragetypen. Deshalb gebe ich mit (12) - (14) noch einige weitere Beispiele, in denen nach nur kurzen Antworten auf uneingeschränkte "offene" Fragen Fortsetzungen eingeklagt werden: (12) Kl: 466 I:
na dazu geHÖR:T ja au noch F(\
.
467 I:
das OE:LD=was ich nich (h)HAB / ) M(/)
ôh
468 R: r mhm= \/ 469 I: =weil ich kein BAfög krich: \ M(/ ) < all > 470 I:
oa so GUT wie NICHTS F(\ / )
.
471 N: *
un WIE finanziere du dein: STUdium F(\ / )
472 I:
ja ich geh ebm abms ARbeitn \ < all > M(\ )
473 N:
JEDN ABMD F(\ \ )
474 I:
N:EE das: aber DAS wàr ja unMÖQlich M( - ) M(/ \ ) < all >
475 I:
DAS würde man überhaupt nich SCHAFfen M(/ \ )
...
.
254 476 Ν:
ΝΕΕ: M(\)
477 I:
NEE: M(\ )
*ich ARbeite AU=deswegn FRAG ich M(\ \) M(\ ) *ich geh DREIma1 in der WOche abends arbeitn < all > F(\ \ ) mhm \/
478 Ν: 479 I:
und DREIma1 in der woche das REICHT dann mh: M(/ \ / )-
480 I: r wenn DANN: (\ 481 N: aber du MERKS es ne M(\ /)
482 I:
ja wenn DANN VORlesungszeit IS: \ S(/ \ / ) < all >
483 I :
DANN is es aber auch nur F(/
.. aso
STRESSzeit ne \ /)
((I setzt noch weiter fort.)) In (12):471 wechselt der Fokus von kein Baßg biegen zu (anderer) Studiumsfinanzierung und Ν stellt eine uneingeschränkte "offene" Frage. I beantwortet N's Frage zunächst nur kurz und nach einer Pause weist Ν ihr das Rederecht mit der Reparatureinleitung JEDN ABMD erneut zu. Nach der durch die Reparatureinleitung verursachten Klärungssequenz, die sich insgesamt von Z. 474-476 erstreckt, liefert I eine ausführliche Antwort auf N's Frage. (13) K l : ((Nachdem Ν erzählt hat, daß sie viel gearbeitet hat:)) 513 N:
und âh: ich war kaPUTT= T( ... \ )
514 N: - =das: das GING überhaupt nich ne T(\ /) P>
M(\
436 I: Γ hin und her (?und?)
)
437 N:
(16) Kl : 99 I:
hmm \/ ((Danach spricht R über einen möglichen Studienortwechsel.))
((Thema: die Überrepräsentation von Frauen in Lehrveranstaltungen)) also ICH fin das immer FÜRCHterlich wenn: . η da F(\ \ )
101 N:
find ICH AUCH M(/ \ )
102 R:
das is ja sowieSOs M(\)
103 I:
JAA . M(\)
104 I:
masSItV da so Ν )
((holt hörbar Luft))
wastuDIBRS du denn H(\ )
260 106 Ν:
107 R:
ich mein das KOMMT ja auch immer M(\
ich: mach auch DEUTSCH: und: muSIK M( / \)
108 N: r ach SO : = M(\) 109 R: =also für mich is musik das ERste M( ... \ ) ((Hiernach setzt Ν fort über die Situation in Germanistik.))
(17) K5: ((Thema: Schwierigkeiten mit einem Leistungsschein)) 581 C: r und . JA: und M(\) 582 L: mhm
dann ham wir verSUCHT das zu erKLÄRN F(\ \ )
\/
583 C:
STÜH:DEN:LA¡NO F(\ \ \ )
584 C: r un also ... also 585 L:
hmm: \
586 E:
bei WEM WARn das H(/ \ )
587 C:
vorname EKSzet M(\ )
588 E:
AH ja . ja M(\ ) ACH M(\ )
589 L:
JA ja . M(\ )
590 E: r die KENN ich M(\ )
591 L: KENN ich AUCH F(\ \ ) 592 L: 593 C:
HÜPFte doch auf unsrer fete AUCH rum= F(\ \ ) =mhm \/
(18) K6: 307 L:
m: und
also es OZBT da auch OUTE arbeitn= S(\ / )
261 308 L:
=aber die beNÜTzn: MEIstens ohne es zu sagn
F(\ \
309 L:
auch diese ANdern methodn ne \ /)
310 C: r hn: \ 311 E: ja WIE siehtn das konkret AUS (?) F(/ \ ) 312 L:
es is Elgnlich M( / )
313 L:
also ICH empf:inde das als eine ähm: .. F(/
314 L:
àh MACHerzàhlung mit PSYCHOanalytischem vokabuLAR \ \ \)
315 E:
AUS der sieht . des SCHREIbenden F(\ \ )
316 L:
mhin \/
317 E : *
wie KANN ich das als reziPIENT denn MAchn F(\ \ \ )
318 L:
((pustet aus))
319 L:
und kanns dann DEIne interpretaTION zum bestn gebm M, F(\ \ )
320 E:
kanns (ein?) TEXT lesn M, S(/ )
Aber das is doch urALT T(\
\ )
Die W-Fragen in den gesternten Zeilen der Gesprächsausschnitte (15)-(18) haben eine fallende letzte Tonhöhenbewegung. Sie alle führen einen bisherigen Fokus weiter, indem sie ein weiterführendes und noch nicht thematisiertes Detail der bisherigen Fokussierung in einer auf dieses Detail einschränkenden Frage erfragen, um offenbar für die Sicherung oder Überprüfung des eigenen Verständnisses oder der eigenen Erwartungen mehr und zusätzliche Informationen zu erhalten. Im Korpus kommt in 20 Fällen dieser Art insgesamt 16 Mal die Partikel denn vor, in den übrigen 4 Fällen wird kookkurrierend die Partikel eigentlich verwendet. Die Akzente liegen fast immer auf finiten Verbteilen, gelegentlich auch auf dem W-Wort (s.o. Kapitel 2.2.2.2.). Es wird häufig durch expliziten anaphorischen Rückbezug (z.B. mit das) an den Vorgängerturn angeknüpft, dieses anaphorische Element aber nicht durch Akzentuierung als Fokus der Frage signalisiert. In Verbindung mit den vorgefundenen Fokussierungen kontextualisieren offenbar die Partikeln denn und eigentlich lexikalisch einen kohäsiven Rückbezug auf bereits fokussierte Elemente oder bisher unhinterfragt als gemeinsam unterstellte Annahmen oder Präsuppositionen (vgl. hierzu auch Thurmair 1991). In (15):431 fragt N, in welchem Semester I, die erzählt hat, daß sie in Oldenburg ihr Studium beenden will, denn sei; offenbar hat sie angenommen, I sei noch ziemlich jung und könne wohl noch nicht so weit fortgeschritten sein im Studium, daß sie bereits an ihren Ab-
262 schluß denkt. Mit der Frage leitet Ν eine Nebensequenz ein. I nennt dann die Studiensemester ihrer Fächer und benennt nach einer kurzen Pause und nach N's Rezeption dieser Antwort noch die Gründe für ihre unterschiedlichen Studiensemester in ihren beiden Fächern. Nach beiden Teilen der Antwort reagiert Ν jeweils lediglich mit einem Rezeptionssignal. Offenbar entspricht die von I gegebene Information ihren Erwartungen; zumindest wird nicht mehr Information eingeklagt Nach dieser Nebensequenz führt R das übergeordnete Thema weiter. In (16): 105 vergewissert sich N, ob R's Sicht, eine Überrepräsentation von Frauen in Seminaren sei normal, mit seinem Studienfach zusammenhängt; das läßt auch ihre abgebrochene Äußerung in Z. 106 vermuten. Als Antwort benennt R kurz seine Fächer. Hierauf signalisiert Ν mit ach SO in Zeile 108, daß sie zwar etwas anderes erwartet hat, ihr zuvor nicht explizit manifestiertes Verstehensproblem aber nun gelöst ist (vgl. hierzu die Anmerkungen zu ach so in Kapitel 3.1.3.). Auch hier leitet die Frage N's eine Nebensequenz ein, nach der Ν im Anschluß an die wiedergegebene Sequenz das Gespräch über die Situation im Fach Germanistik fortsetzt. In (17):586 fragt E offenbar zur eigenen Verständnissicherung nach, bei wem denn die erzählten Schwierigkeiten aufgetreten seien. Auch hier antwortet C nur kurz durch Nennung des Namens und E und L bestätigen beide explizit mit AH ja bzw. ACH ihr Verständnis und ihre Identifizierung dieser Person. Hier wird nach dem Ende der Nebensequenz in 590 der Fokus der Nebensequenz, die in Rede stehende Person, in das übergeordnete Gespräch übernommen und im folgenden reden die Teilnehmerinnen weiter über eine Gelegenheit, bei der auch diese Person anwesend war. In allen drei Fällen wird also die W-Frage mit fallender letzter Tonhöhenbewegung als Eröffnung einer Nebensequenz behandelt und der relativ kurzen Frage folgt eine kurze Antwort, in der zunächst die erfragte Information nur genannt wird. Eine Expandierung dieser Information liefert der 'Antworter' gegebenenfalls später, sie wird aber nicht vom 'Frager' angefordert oder eingeklagt Die Frage fokussiert zusätzliche Informationen zum bisherigen Fokus oder eine bislang offenbar implizit und unhinterfragt unterstellte Annahme. Die Fokussierung dient der expliziten Verständigungsbearbeitung und Verständigungssicherung. Falls hier die Frage ein implizites Verstehensproblem der Fragenden bearbeiten soll, dann weist die Fragende sich selbst die Verantwortung oder "Schuld" für dieses Verstehensproblem zu. Die Tendenz zu kürzeren und eingeschränkteren Antworten auf W-Fragen mit fallender letzter Tonhöhenbewegung zeigt sich auch im Beispiel (18):311 und 317. In beiden Fällen könnte man sich als Reaktion auf derartige Fragen nach dem wie eines wissenschaftlichen Ansatzes auch ausführlichere Erläuterungen denken. Dennoch sind L's Antworten in 312-314 und 318-319 kurz gehalten. Sie scheinen zu unterstellen, daß für E diese kurzen Antworten genügen bzw. daß E selbst sonst das Gespräch darüber weiterführen wird. Und genau das tut E mit ihren weiteren Fragen auch. Gegenüber den oben betrachteten nicht-einschränkenden "offenen" Fragen scheinen die einschränkend weiterführenden "engeren" verständigungsbearbeitenden Fragen mehr Informationen und Voraussetzungen zu implizieren, die auch in der Antwort nicht in Frage gestellt werden sollen, in (18) die prinzipielle Kompetenz von E (und auch L) als prinzipiell umfassend informierte Wissenschaftlerinnen. Die Fragen sind eben nicht wie nicht-einschränkende Fragen kontextualisiert und werden demgemäß auch nicht wie "offene" Fragen behandelt.
263 Anders verhält es sich demgegenüber in (19), einem Gesprächsausschnitt, der bereits im letzten Kapitel analysiert wurde: (19) K2: ((Beginn eines neuen Themas)) 12 N :
w a s HAS d u d e n n d a für H A R b m S (/ \ /)
13 I:
A C H sod* H(\ )
14 I:
S C H R E C K l i c h aus weil die nicht g e ü X H T w o r d n is
. JA das: M(\) -
..
die SIEHT nur so: F(\
/ 15 Ν : *
...
\
)
w a s HAS e n n d a geMACHT M(\
\
)
16 I :
d a h a b ich m i c h mal geSCHNITTn inner SCHUle < all > F( \ \ /)
17 I:
a l s o quasi η SCHOL*UNfall sach ich d a immer zu T,F(\ \ )
18 I:
((lacht leise ca. 2 Sek.)) ((Hiernach erzählt I das Ereignis.))
Die W-Frage mit fallender letzter Tonhöhenbewegung in (19):15 wird nach einer voraufgegangenen W-Frage mit steigender letzter Tonhöhenbewegung als zweite, "einklagende" Frage gebraucht In diesem Fall könnte jedoch die Elaboration der Antwort zur Erzählung auch noch als eine eingeklagte Reaktion auf die erste, "offene" W-Frage interpretiert werden. Bei dieser Interpretation wäre die zweite Frage eine "engere" einklagende Frage, mit der ein ausführlicher und thematisch weiterführender Beitrag noch auf die erste Frage angefordert wird. Gegenüber den nicht-einschränkenden "offenen" W-Fragen mit steigenden letzten Tonhöhenbewegungen fuhren also die W-Fragen mit letzten fallenden Tonhöhenbewegungen eine Vorgängerfokussierung weiter oder fokussieren eine bisher unhinterfragt zugrunde gelegte Annahme. Die W-Fragen mit fallenden letzten Tonhöhenbewegungen erfragen offenbar weitere Informationen, z.T. Detaillierungen, um die bisherige Verständigung Uber eine Vorgängerfokussierung weiterzuführen, oder um eine Inferenz oder ein implizites Verstehensproblem des Fragenden zu überprüfen bzw. zu klären. Es bleibt ein bereits fokussierter Sachverhalt weiterhin fokussiert, aber es wird ein weiteres Detail, eine weitere neue Zusatzinformation zu diesem Fokus verlangt, oder es wird eine bisher unhinterfragt unterstellte Prämisse überprüft In einigen Fällen leiten sie verständigungsbearbeitende Nebensequenzen ein, nach denen wieder in das suspendierte übergeordnete Gespräch zurückgegangen wird. Eine solche W-Frage mit fallender letzter Tonhöhenbewegung läßt dem Rezipienten offenbar nur einen engeren Spielraum für die Antwort. Sie wird als enger und auf konkretere Information einschränkend fokussiert verstanden, und eher als Aufforderung zu einer kürzeren eingeschränkten Antwort behandelt, kaum als Einladung zur unmittelbaren Elaboration des
264 Themas. Eine Expansion der Antwort wird auch nicht vom 'Frager' initiiert bzw. eingeklagt. Wenn ggf. zu einer Elaboration des Themas übergegangen wird, dann läßt auch bei diesem Fragetyp oft der Antworter Gelegenheit für eine Rezipientenreaktion, die hier jedoch eher aus Rezeptionssignalen oder Verstehenssignalen besteht, aber keine Fortsetzung verlangt. Der sequentielle Status der Frage, d.h. ob sie wie ein Verständigungsproblem in einer Nebensequenz behandelt werden soll wie in (15)-(17), oder ob sie sofort ins Gespräch integriert wird wie in (18) und (19), kann damit offenbar interaktiv ausgehandelt werden. Die auf eine eingeschränktere Antwort zielende W-Frage mit fallender letzter Tonhöhenbewegung macht sie dann auch besonders geeignet für die Signalisierung von Formulierungsproblemen, die sich nur auf ein einziges Wort o.ä. beziehen, wie in (20):
(20) K2: 736 I:
zum BEIspiel diese M,F(\
....
737 I: *
w i e N E N N T m a n die denn= M(\ )
738 I:
=die F R A U e n die die KLBXdung v o r f ü h r n a u f m L A U F s t e g M(\
MANnekins M(\ ) .
ähJOA M(\)
Dasselbe gilt für die Signalisierung von Verstehensproblemen, die sich nur auf einzelne Aspekte des voraufgegangenen Turns beziehen, v.a. Referenzverstehensprobleme und bestimmte Typen von Bedeutungsverstehensproblemen, die nur eine spezifisch eingeschränkte Problembearbeitung benötigen (s.u.). Bei diesen problemmanifestierenden Fragetypen findet sich dann ebenfalls die fallende letzte Tonhöhenbewegung; die semantische Beziehung zum Vorgängerturn und die syntaktische Struktur der Frage unterscheiden sie jedoch von den hier besprochenen einschränkend weiterführenden "engeren" verständigungsbearbeitenden Fragen.
(b) Verb-Erst-Fragen Auch die hier zu analysierenden Verb-Erst-Fragen haben fallende letzte Tonhöhenbewegungen. Einige Beispiele: (21) Kl: 354 R:
d a B I N ich n i c h g e W E s e n das W ( h ) E I ß ich n i c h
F[ (\
265 355 R: Γ ((lacht)) 356 I: ((lacht mit)) 357 Ν: r WEIßt du auch nich was da RAUSgekommn is F(/ \ ) NEEe 358 R: (\
359 R:
. dhab ich NICHTS von geHÖRT bisher F(/ \ )
JA das hab ich AUCH gelesen . F(\ \ ) ((N setzt weiter fort.))
(22) Kl: 278 R: 279 R:
in muSIK zum beispiel is es ganz ANders ne H,F(/ \ /) die zuSAMJfcetzung M(\ )
280 N: r is dann MEHR mä* * M,F[(\ ) 281 R:
282 R:
KOmischerweise=ich weiß AUCH nich M(\ ) M(\ ) < all >
pxp
P>
=JAa (\/) =mhm \/
mhm \/
285 N:
KOmisch=obWOHL das η musischer beREICH is H(\ )H, F(/ \
286 N:
- wo man ja IMmer meint daß das vielleicht FRAUen . / \ ja \
287 I: 288 N:
- oeHAPsoviel machn oder \ / )
mhm
289 R:
\/
(23) K4: ((Thema: L und E waren beide Tanzen)) 259 E:
HAT mir AUCH gut getan F(\ \ )
/)
260 L:
WA M(/)
2 6 1 E:
mhm \/
262 L: r ((lacht ca. 1 Sek.)) 2 6 3 E: FEIne SAche L F(\ \ ) 2 6 4 C: *
warst RXCHtich inna DISCHko oder F(\ \ )-
2 6 5 E:
n: Elgnlich nur ne STÜNde lang M(/ \ )
266
AH ja M(\ ) mhm mhm
267
268 E:
un das BRste mal in einer SALzadisko F(/ \ )
2 6 9 L: r was is DAS denn 2 7 0 C:
< all>F(\ *mhm
)
Kl: 775 I :
das KRICH ich auch immer in großen F(/
7 7 6 I:
HALLN und in muSEEN un so \ \ )
777 N: r un da WARS du noch NICH mit beim ARZT um mal zu M(\
/
\
7 7 8 I: 779
*NEE T(\) has SCHISS oder was T(\ )
*
780
N:EE ich denke eignlich M(\ )
7 8 1 I:
das kommt vom KREISlauf und von der LUFT und: F(\ \ )
782 783 784 785
)
N: r ((lacht)) I: L ((lacht mit?)) N: irgnwie erKLÂRN kann man sich das SCHON N: also ICH wär da schon LÄNGST mit hingegangn
267
(25) K6: 933 934 935 936
C C L E
ΝΕΕ aber das is das war ja â . war was GANZIieh UNverfängliches=es ging: . um . àh .. aha RAUchen
937 C:
RAUchen . GEnau
938 C 939 L 940 E
FESTstelln kann
941 L: 942 E:
OB f:rau oder mann das .. beim röntchen mhm mhm
u(h)nd (h) so(h) mhm
• mhm das war KURZ vor der Einstellung M(\ \ )
943 L:
ach SO»: M(\ ) < f >
944 L:
un dann HAS du gedacht das RAFfn die oder wie= M(\ \ / ) < dim > =JA ... M(\)
945 E:
946 L: *
947 L: 948 E:
wie has geLOgn=has erzählt du tttRS keiner od(h)er w(h)ie M(\ M(\ ) ) ((lacht DOCH doch doch F(\ \ \ )
949 C: 950 L:
951 C:
neeNEE aber M(\ ) ((lacht))
ach SO: M(\)
das RAUchn KÖNfJ die da nich FESTstelln
F(i/
T\
da HAB ich noch gar nich drüber NACHgedacht M( / \ )
In den Beispielen (21)-(25) werden in den gesternten Zeilen jeweils Inferenzen aus den vorhergegangenen Turns expliziert und mit Verb-Erst-Fragen bzw. deren Ellipsen mit fallender letzter Tonhöhenbewegung formuliert. Auch hier handelt es sich offenbar um Verständigungsbearbeitungsfragen, oft lediglich um weiterführende Reformulierungen vorheriger Turns. In (21):357 zieht Ν eine Inferenz aus R's Beitrag in 354 im Hinblick auf ein sie interessierendes Ereignis. In (22) zieht ebenfalls Ν eine Inferenz aus den bisherigen Turns und dem Tum aus 278: wenn - wie das Gespräch ergeben hat - in Germanistik eine Überrepräsentation
268 von Frauen herrscht und in Musik es ganz anders ist, dann läßt sich relativ sicher inferieren, daß eben in Musik mehr Männer studieren. In (23) haben die Gesprächspartnerinnen schon eine Weile über das Tanzen geredet und E hat erzählt, daß auch sie am Wochenende Tanzen war. Da C und L beide auf einer Privatfete waren, E aber nicht, vermutet nun offenbar C, sie sei in einer Disko gewesen und verbalisiert dies in einer Verb-Erst-Frage in 264. In (24) hat I erzählt, daß ihre Ohren oft verstopfen, u.a. auch in großen Räumen. Nachdem sie N's erste Inferenz in Form einer Verb-Zweit-Inferenzüberprüfung (s.u.), ob sie damit noch nicht zum Arzt gegangen sei, verneint hat, inferiert Ν nun als Grund dafür in Zeile 779, Ν habe einen Arztbesuch bisher aus Angst unterlassen und formuliert dies in Form einer Verb-Erst-Frage mit fallender letzter Tonhöhenbewegung. Das Beispiel (25) zeigt, daß Verb-Erst-Fragen mit fallender letzter Tonhöhenbewegung gegebenenfalls Präsuppositionen nahelegen und überprüfen. L, E und C reden hier zunächst über die Verwendung der Tonbandaufnahme eines früheren Gesprächs, an dem E teilgenommen hatte, in einem Seminar, das C besucht hatte. In dem im Seminar verwendeten Gesprächsausschnitt ging es um eine Diskussion über die Frage, ob Ärzte des Gesundheitsamts ohne diesbezügliche Informationen durch ihre Patienten feststellen können, ob ein Patient raucht oder nicht. In Zeile 942 gibt E als Hintergrundinformation, daß die thematisierten Gesundheitsamtsuntersuchungen und das in diesem Zusammenhang für sie wichtige Problem, ob Ärzte Raucher identifizieren können, kurz vor ihrer Einstellung virulent geworden sei. In Zeile 944 expliziert dann L ihre Vermutung, weshalb hier überhaupt ein Problem für E liegen könnte, in einer Verb-Zweit-Inferenzüberprüfung mit steigender letzter Tonhöhenbewegung: ob L bei ihrer eigenen Untersuchung gedacht habe, daß die Ärzte merken (RAFfen), daß sie raucht. Präsupponiert scheint hier zu sein, daß das Rauchen ein Problem für die Einstellung sein könnte. Nach E's Bestätigung formuliert nun L in 946 den Sachverhalt noch konkreter, der einem befürchteten Merken und Durchschauen seitens der Ärzte als weitere Presupposition zugrundeliegen muß: Ob sie gelogen habe; ob sie erzählt habe, sie sei kein Raucher. Diese Fragen werden als Verb-Erst-Fragen mit fallender letzter Tonhöhenbewegung formuliert. Das Verständnis dieser Fragen setzt die pragmatischen Präsuppositionen voraus, daß man (a) nur durchschaut werden kann, wenn man etwas verbergen möchte, und daß (b) Lügen ein verbreitetes Mittel sind, ein solches Verbergen zu erreichen. Und genau der Sachverhalt, daß E wohl gelogen hat, um etwas zu verbergen und deshalb Angst vor dem Entdeckt-werden hatte, den E selbst ja nicht expliziert hat, wird durch die Wahl der fallenden letzten Tonhöhenbewegungen als Präsupposition nahegelegt und überprüft. Die Fragen sind nämlich nicht als nicht-einschränkende "offene" Fragen kontextualisiert, die voraussetzungsfrei nach den Gründen für E's Angst fragen, sondern als verständigungsbearbeitende Inferenzüberprüfungen, die die von L unterstellten Gründe bereits benennen. In allen Fällen reagieren hier die Rezipienten mit einer Kurzantwort, meist einer Bestätigung mit jaa o.ä. oder einer Zurückweisung mit nee o.ä. Hierin zeigt sich ihre Ähnlichkeit mit den (Verb-Zweit-)Inferenzüberprüfungen, die im nächsten Kapitel untersucht werden. In (22) folgt dem akzentuierten Rezeptionssignal Mhm, das hier an der Strukturstelle einer Kurzantwort steht, nach einer Pause die Elaboration KOmischerweise=ich weiß AUCH nich. In (23) wird offenbar mit dem n: eine Kurzantwort angedeutet, bevor als KoiTektur eine einge-
269 schränkte Antwort formuliert wird. 16 Auch in (24) geht der Korrektur die Zurückweisung N:EE voraus. In (25) erfolgt nur eine Zurückweisung und danach übernehmen die Gesprächspartnerinnen des Turn. Ebenso wie die W-Fragen mit fallender letzter Tonhöhenbewegung scheinen auch die Verb-Erst-Fragen mit fallender letzter Tonhöhenbewegung von den Rezipienten nicht als unmittelbare Einladungen zur Elaboration des Themas interpretiert zu werden. Es handelt sich um Explikationen von Inferenzen oder um Fremdreformulierungen, oft über eine Angelegenheit, für die der Rezipient als zuständiger und kompetenter Experte gilt. Es wird kein Element des Vorgängerturns explizit und fokussiert wiederaufgenommen und damit als Problem manifestiert. Vielmehr liegt auch hier die Fokussierung der Frage auf weiterführenden Elementen, die eine Inferenz o.ä. explizieren. Für die Antwort scheinen sie jedoch dem Rezipienten nur einen kleineren Spielraum zu gewähren. Sie werden vom Rezipienten im Folgeturn bestätigt oder korrigiert. Sie werden wie das behandelt, was man alltagssprachlich und "laienlinguistisch" als "Bestätigungsfrage" bezeichnet: Der Frager bzw. die Fragerin möchte eine Bestätigung bzw. Zurückweisung und gegebenenfalls eine Kurzelaboration bzw. Korrektur. Eine weitere Entfaltung des Themas durch den Rezipienten der Frage, wie in (23):268, erfolgt erst, wenn der Frager das Rederecht auch nach einer Pause oder anderen Zwischenaktivitäten nicht wieder beansprucht hat. Als Fazit zu den explizit verständigungsbearbeitenden W- und Verb-Erst-Fragen mit fallender letzter Tonhöhenbewegung läßt sich festhalten: W- und Verb-Erst-Fragen mit fallender letzter Tonhöhenbewegung werden anders verwendet und interpretiert als ihre Entsprechungen mit steigender letzter Tonhöhenbewegung. Gegenüber den nicht-einschränkenden "offenen" weiterführenden Fragen mit steigenden letzten Tonhöhenbewegungen sind Fragen mit letzten fallenden Tonhöhenbewegungen einschränkend weiterführende Fragen, die oft die Verständigung bearbeiten und sichern. Oft enthalten diese Fragen verständigungssichernde oder -überprüfende Explikationen von Inferenzen aus vorherigen Turns. Insofern als in diesen Fragen zusätzliche Informationen zum vorherigen Fokus fokussiert und angefordert werden, entwickeln sie das Gespräch thematisch eingeschränkt weiter. Tendenziell scheinen sie dem Rezipienten einen kleineren Spielraum zu gewähren und eher kürzere Antworten zu verlangen als die oben analysierten nicht-einschränkenden Fragen. Jedenfalls scheinen sie von den Rezipienten kaum als Einladungen zur unmittelbaren Elaboration des Themas interpretiert zu werden. Eine Expansion kurzer Antworten wird auch vom Frager nicht angefordert. 17 Eine letzte Tonhöhenbewegung kann allerdings bis in den Nachlauf der Äußerung nach hinten verschoben werden. Dadurch werden die anderen Tonhöhenbewegungen innerhalb der Einheit frei für die Signalisierung anderer Bedeutungskomponenten, z.B. stilistischen. Als Fazit der bisherigen vergleichenden Analyse ergibt sich damit, daß bei Fragesätzen und deren Ellipsen z.T. allein eine steigende letzte Tonhöhenbewegung konstitutiv dafür ist, Es könnte sich bei dem n: auch um ein bloßes Verzögerungssignal handeln, dann wäre aber auffällig, daB hier n: statt des üblicheren m: gewählt wird. Die beschriebene Verwendung der letzten Tonhöhenbewegung bei konversationeilen Fragen in FrageAntwort-Sequenzen ist dann offenbar die Grundlage dafür, daß in den Fällen, in denen solche Fragen als gesprächs- oder themeneröffnende Fragen verwendet werden und damit ein zuvor fokussierter Sachverhalt nicht im sequentiellen Kontext identifiziert werden kann, mit der fallenden letzten Tonhöhenbewegung offenbar ein früheres Gespräch, ein gemeinsames Vorwissen o.ä. als kontextuelle Presupposition nahegelegt werden kann.
270 ob sie als nicht-einschränkende "offene" oder als einschränkend weiterführende "engere" Frage kontextualisiert, interpretiert und behandelt wird.18 Damit bestätigt sich das alte stereotype und intuitive Alltagswissen, Fragen hätten steigende Intonation, aber nun mit einem viel präziser definierten und differenzierteren Fragebegriff, der sich nur auf eine ganz bestimmte konversationelle Aktivität bezieht, nämlich nichteinschränkende "offene" Fragen, und nicht auf einen syntaktischen Satztyp oder einen Satzmodus! Fragen mit fallender letzter Tonhöhenbewegung werden nicht in diesem Sinne als "offene" Fragen präsentiert und kontextualisiert. Die konstitutiven Merkmale der einschränkend weiterführenden W- und Verb-Erst-Fragen lassen sich zu folgendem Meikmalbündel zusammenfassen: [+ Fokusweiterführung, mit Explizierung zusätzlicher Informationen bzw. Inferenzen zur vorherigen Fokussierung] [+ W- bzw. Verb-Erst-Fragesatz bzw. dessen Ellipse] [+ fallende letzte Tonhöhenbewegung: (... \)] [ - prosodisch markiert] [+ Turnexit für ggf. kurze eingeschränkte Antwort des Rezipienten, ggf. Bestätigung/Zurückweisung + Kurzelaboration] [ - Einladung an den Rezipienten zur unmittelbaren Elaboration des Themas] [± Auslösung einer Nebensequenz]
3.1.2.2. Inferenzüberprüfungen Im folgenden werden Inferenzüberprüfungen betrachtet, die die Form von Verb-Zweit-Sätzen (gelegentlich auch Verb-End-Sätzen) oder nicht-finiten Phrasen mit steigenden und fallenden letzten Tonhöhenbewegungen haben. Diese Inferenzüberprüfungen weiden offenbar so formuliert, daß sie einer Ratifizierung durch den Rezipienten bedürfen. Obwohl sie keine syntaktischen Fragekennzeichen aufweisen, teilen sie dennoch mit den konversationellen Fragen die Eigenschaft, mit Beendigung des Turns eine Reaktion des Rezipienten konditionell relevant werden zu lassen, in der Regel zumindest Bestätigungen/Zurückweisungen als Minimalreaktionen vor einer eventuellen Elaboration der 'Antwort'. Inferenzüberprüfungen kommen mit steigender und mit fallender letzter Tonhöhenbewegung vor, mit und ohne das Anhängsel ne. Da Verb-Zweit-Inferenzüberprüfungen auch mit fallender Intonation formuliert werden, kann die steigende Intonation nicht konstitutiv für sie sein. Mit anderen Worten: bei vorliegender Verb-Zweit-Satzstruktur kann es nicht nur - wie in der Literatur oft angenommen - die Intonation sein, die quasi aus dem Aussagesatz eine Frage macht In eine ähnliche Richtung weist auch eine Intuition Batliners, der unterschiedliche Intonationen, v.a. hinsichtlich der sogenannten 'Offsettonhöhe' bei denselben Satzmodi als Zeichen einer graduell skalierbaren "Fragehaltigkeit' interpretiert Als fragetypische "pragmatische Bedeutungsdimensionen', auf die hin Fragen als mehr oder weniger 'fragehaltig' eingestuft werden können, werden eine "Skala zunehmender Antwortdetermination" oder eine "Skala des angezeigten Interesses an einer bestimmten Antwort" vorgeschlagen (siehe Batliner 1989: 156f.). - Sicherlich ließe sich mein Analyseergebnis auch mit Kleins 1982 Analyse, nach der Fragen mit steigender versus fallender Intonation sich im Geltungsanspruch unterscheiden, zusammenbringen.
271 Wenn jedoch die Analyse der Prosodìe abgekoppelt werden muß vom grammatischen Satztyp bzw. Satzmodus, dann wird in der Konsequenz auch die Rede von "Verb-Zweit-Fragen" sinnlos. Denn nach gängiger Auffassung sind ja die sogenannten "Verb-Zweit-Fragen" gerade solche, die syntaktisch keine Fragen sind und ihren Fragemodus nur durch die steigende Tonhöhenbewegung erhalten. Nach der vorliegenden Analyse wären diese Sätze hinsichtlich ihres Satztyps ganz normale Verb-Zweit-Sätze, die jedoch interaktiv - wie andere syntaktische Konstruktionen auch - für frageähnliche Aktivitäten verwendet werden können, z.B. für die Konstitution ratifizierungsbedürftiger Inferenzüberprüfungen, mit denen der Turn für die konditionell relevante Reaktion an den Partner vergeben wird. Die letzte Tonhöhenbewegung kontextualisiert hierbei "Verwandtschaften" zu den Typen konversationeller Fragen. Im folgenden werden zunächst Inferenzüberprüfungen mit steigenden und dann mit fallenden letzten Tonhöhenbewegungen analysiert. (a) Inferenzüberprüfungen mit (... /) Zunächst einige Beispiele mit finiten Verb-Zweit-Sätzen: (26) K2: 706 R: *
d u MEINST W I R K l i c h daß sie das SO HINkriegn
707 N:
JAa M(\/)
708 N :
ich A C H t e d a mal ich ACHte d a jetz mal d r a u f = M(\ ) F(\ )
w e i l sie darauf g e T R I M M T sind M( \ / )
709 R:
710 N :
H(/
\
\
\
...
=aber ich HEIN JAA
F(/ \)
(27) Kl: 544 I:
w e i l das W O L L T ich m i r n i c h mehr L E I s t n hier F (\ \ )
545 I:
m m : M E H R m a l s inner WOche w : á h r e n d ich hier: M(/ \
546 I :
nach OLdnburch muß \ )
547 N :
.
mhm=
\/
..
/
alle
272 548 I:
=dann BIN ich n ä m l i c h nur UNausgeschlafen
549 I:
)
/
H(\
u n d KRICH nur halbe SAchen mit M(\
\
/)
hmm
550 Ν :
V 551 R: *
du bist in W i l h e l m s h a v e n d a n n
H(/
552 I:
mhm
553 R:
. in e i n e m Bistro
554 I: 555 R:
\/
/
)
mhm
\/
u n d in W E L c h e m M(/ )
556 I:
also ss in der OÖkerstra:ße= F[ (\ )
557 I:
=das heißt EINfach nur Bistro: F(\ \ /)] ((atmet ein))
558 R: 559 I: 560 R:
das ist das EINzige M(\ ; (ein)) a c h DAS b i s t r o H(\ )
Dieses sind die einzigen Beispiele im gesamten Korpus, die uneingeschränkt als Verb-ZweitInferenzüberpriifungen mit steigender letzter Tonhöhenbewegung interpretiert werden können. In (26) kennzeichnet der Sprecher den ersten Turn in 706 von Anfang an mit der Turneinleitung du MEINST als Inferenz aus bzw. konkreter noch als Fremdreformulierung (vgl. Gülich/Kotschi 1987) der vorherigen Beiträge der Gesprächspartnerin. Dies impliziert, daß er zumindest zunächst keine Turnfortsetzung projektiert und damit der Turn nach Beendigung an Ν als Rezipientin übergeht, die hier allerdings erst verspätet mit der Bestätigung JAa reagiert. Die zweite Inferenzübeiprüfung in 709 knüpft direkt an die erste an und endet mit den gleichen letzten Tonhöhenbewegungen, die auf diese Weise auch prosodisch die kohäsive Beziehung zwischen beiden Inferenzüberprüfungen signalisieren. Diese Sequenz steht in einer Argumentation (s.u. Kap. 4.1.) und es wäre erwartbar, daß Ν für die Stützung ihres Arguments ggf. viel Raum beanspruchen könnte. In (27):551ff formuliert R, nachdem I erzählt hat, sie wolle nicht mehr mehrmals in der Woche abends in ihrem Bistro arbeiten, wenn sie am nächsten Morgen hier nach OLdenburch muß, die Inferenz, daß I in Wilhelmshaven wohnt. Er formuliert diese Inferenz mit steigenden lokalen Tonhöhenbewegungen auf global hoher Tonhöhe. Als I diese Inferenzen mit mhm bestätigt, fragt er sofort weiter nach konkreteren Informationen. Häufiger kommen Fälle vor, in denen die letzte steigende Tonhöhenbewegung der Inferenzübeiprüfung in das Frageanhängsel ne oder gelegentlich auch he oder oder u.a. verschoben wird:
273 (28) Kl: 874
Ν:
ICH würd A D nich fahrn wenn ich so: M(/ \ )
875
Ν:
LEUte hier hätte mit deman was am Wochenende S(/
nee DANN) war ja alles: \ M( /
878
Ν:
879
N:
880
R:
=mhm \/ also DtJ MEINST jetz M(/ \
881 N:
dJAA M(\)
882 N:
stuDENtn M(\ )
883
R:
in ORDnung= \ ) ((seufzt))ja
. leute von der U N I ne \ /)
die ich so: KENnen: . KENnlerne hier M(\ ) M(\ )
mhm
(29) K2: 405
R:
=so daß man (0.8) áh daß ich mich
406
R:
407
I:
überPORdert habe eigntlich damit auch dann ne F(\ /) mhm \/
4* 0 8
N:
a das kanns du HEUte sagn ne M(\ /)
409
R:
410
I:
JAja das weiß man dann NACHher M(\ ) M(\ )
ja (?ne?) \ /
Auch in den Extrakten (28) und (29) formuliert der Sprecher in den gesternten Zeilen eine Inferenz aus den vorherigen Beiträgen der Gesprächspartnerin und Rezipientin dieser Inferenzübeiprüfung. In (28) wird - wie zuvor in (26) - diese Inferenz auch mit der Formulierung also DU MEINST explizit als solche eingeleitet; in (29) knüpft die Frage an die vorherige Erzählung an und liefert eine Inferenz aus dieser Erzählung, die der Erzähler bestätigt. Die Bestätigung der Rezipienten behandelt damit die Inferenzübeiprüfung als reaktions- bzw.
274 "beantwortungsbedürftig" und beschließt diese Sequenz mit der Bestätigung und einer eventuellen kurzen weiteren Elaboration. Wie oben argumentiert, vergibt das Anhängsel ne, das fast ausschließlich mit steigender Tonhöhenbewegung verwendet wird, i.d.R. nicht das Rederecht, sondern fordert allenfalls ein Rezeptionssignal o.ä. an. Eine Bestätigung bzw. Zurückweisung kann natürlich einerseits als ein solches, gegenüber mhm vielleicht stärkeres Rezeptionssignal angesehen werden. Oft wird aber das Rederecht auch für mehr als nur die Bestätigung/Zurückweisung vergeben. Daß die Konstruktion aus [Inferenzexplikation] + [né] das Rederecht an den Rezipienten vergibt, zeigt auch das Beispiel (30), in dem eine ausbleibende Reaktion des Rezipienten durch ein zweites, offenbar stärkeres Anhängsel oder eingeklagt wird: (30) Kl :
((nachdem R von seiner Pendelei zwischen Oldenburg und Wilhemshaven erzählt hat, und nach 2.4 Sek. Pause:))
1027 N :
dap ja A U C H ne blöde situation ne
T(
1028 Ν :
r
1029 R:
I
*
1031 R: 1032 N:
/)
Oder
M(/
L
1030 R:
\
)
ja:
? IS schon: bißchen
\
M(\
aso:
(1.0)
.
H I H d e r l i c h aber . \
)
es beLAstet jetz n i c h so u n m ö g l i c h T,F(\
r d a ß m a n das n i c h DURCHhaltp könnte \ ) mhm
L
\/
.
Nachdem in der kurzen Pause nach dem Turn in 1027 eine verbale Reaktion ausbleibt, schiebt Ν in 1028 das offenbar stärker einklagende Signal oder mit steigendem Akzent nach. Dieses nach so kurzer Pause bereits nachgeschickte zweite, stärkere "Anhängsel" könnte darauf hinweisen, daß Ν ihre eigene Turnbeendigung in 1027 als noch relativ schwach signalisiert einschätzt. Simultan mit dem oder gibt jedoch R nun schon seine Bestätigung ja: und expandiert dann weiter. Die mit dem oder noch simultane Bestätigung des R kann als Signal interpretiert weiden, daß er um seine Turnübernahmeverpflichtung wie auch um seine verspätete Reaktion weiß und jetzt, nachdem er eh schon so spät reagiert, der Ν möglichst früh seine Turnübernahme projektiert. In diesem Sinne wäre R's simultaner Einsatz als Signal der Anerkennung seines "Fehlers" zu werten, nach dem ersten Turnteil nicht rechtzeitig reagiert zu haben. (Siehe hierzu Kapitel 2.3.2.3.) Inferenzüberprüfungen mit (.../) kommen auch in der Form nicht-finiter Phrasen vor. (31) K2: ((über I's Tätowierung)) 178 179 180 181
I: I: I: I:
na so un un
d a w a r n w i r ... . vierzehnjährige mädchen sitzen u m η t i s c h h e r u m .. a l l e p i k s e n auf ihrm a r m rum ne ... d a m e i n t ich n a t ü r i c h müßte das a u c h m a c h e n
275 182 I: 183 N : 184 I:
u n w e i l ich immer mutiger b i n als andere(h) b e s s e r gesaacht
185 I:
h a b ich d e n n GLEICH da: M( \
186 R:
= i n der SCHDle M(\ /)
*
.. oder w a r (( lacht ))
.. RICHtich: was H I N g e m a c h t = \ \ / )
187 I:
äNEE: DAS w a r irgendwo zu HAUse mal T(\) F(\ \ )
188 I:
(( ca. 5 Sek. Pause ))
189 N :
u n W A S sacht deine M A m a dazu T,S(/ / )
(32) Kl: ((über ein Konzert der Unibigband)) 971 I:
= v i e l l e i c h w a r das a m W o c h e n e n d e
M(\ )
972 I: 973 N: 974 R:
hm(h) nee: a: norMAlerwei*=aso \ M( / ) N E E
862 C:
ja AUCH anner: politischen HALtung . S
475 I:
DAS würde man überhaupt nich SCHAFfen M(/ \ )
476 N:
NEE: M(\)
...
.
*ich ARbeite Aü=deswegn FRAG ich M(\ \) M(\ )
In den Gesprächssausschnitten (36) und (37) kommen jeweils Inferenzüberprüfungen oder Verständnissicherungen mit fallender letzter Tonhöhenbewegung mit Bezug auf eine zuvor hergestellte Referenz vor. In (36) expliziert E in 735 die Referenz, die L in 734 mit die nur anaphorisch impliziert hatte; L bestätigt diese Referenzexplikation in 736. In (37) expliziert Ν in 473 mit JEDN ABMD eine Interpretationsmöglichkeit der von I im Vorgängertum verwendeten Zeitreferenz abms; diese wird jedoch von I zurückgewiesen und etwas später durch DREImal in der woche ersetzt. In beiden Fällen haben wir hier auch wieder ein Sequenzformat, in dem eine Inferenzüberprüfung durch den 'Fragenden' eine Bestätigung/Zurückweisung + ggf. Korrektur durch den Rezipienten verlangt Insofern als die Inferenzüberprüfungen eine zuvor implizite Referenz explizieren, führen sie durch Nennung und Fokussierung der nun explizierten präziseren oder konkreteren Referenz die alte Fokussierung weiter. Die offenbar klärungsbedürftige Referenz o.ä. wird nicht als Problem explizit manifestiert, sondern gleich mit einer möglichen Problemlösung behandelt, die allerdings der Ratifizierung bedarf. Im Format einer solchen Referenzexplikation wird dieser Typ der Inferenzüberprüfung auch häufig vom Problemträger als erste Problembearbeitung nach der expliziten Manifestation eines Referenzverstehensproblems verwendet (s.u.).
280 In allen Fällen reagiert auch hier der Rezipient bzw. die Rezipientin mit einer Bestätigung bzw. Zurückweisung. Jedoch werden bei den Inferenzüberprüfungen mit fallender letzter Tonhöhenbewegung offenbar Bestätigung und Zurückweisung nicht als gleich präferierte Reaktionen behandelt. Bestätigungen erfolgen hier nämlich sofort im Anschluß an die Inferenzüberprüfung mit (...\) (siehe (33) und (36)). Doch die Zurückweisungen machen hier die Sequenz komplizierter: In (34), wo C die Inferenzen von L und E noch weiter zuspitzt und damit eher korrigiert, läßt sie nach einer ersten Pause nach L's Inferenzübeiprüfung in Zeile 863f zunächst E in Zeile 865 noch einen Beitrag formulieren und erst nach einer weiteren relativ langen Pause beginnt sie ihren eigenen Beitrag, den sie mit JOA beginnt, bevor sie dann mit beziehungsweise als Reformulierungssignal ihre Korrektur quasi "maskiert" und somit vorsichtig dagegen setzt. In (35) reagiert Ν auf die Zurückweisung ihrer Inferenz durch I in 862f mit dem Signal oh auf global hoher Tonhöhe. In (37) rechtfertigt I sofort nach ihrer Zurückweisung, weshalb N's Inferenz nicht zutreffend ist und Ν bekundet dann noch einmal explizit ihr Verstehen und ihre Erwartungen mit Bezug auf l's Zurückweisung. Diese Art der expliziten Behandlung der Zurückweisung in (35) und (37) signalisiert, daß nun der Produzent der Inferenz "umgedacht" und sein bisheriges Verstehen bzw. seine bisherigen Erwartungen korrigiert hat. Gegenüber diesen Arten der Formulierung und Behandlung der Zurückweisung von Inferenzen erscheint die Bestätigung dann natürlich als problemloser und präferierter. Als Fazit ergibt sich, daß im Gegensatz zu den Inferenzüberprüfungen mit steigender letzter Tonhöhenbewegung, die aufgrund ihrer letzten Tonhöhenbewegung offenbar den nicht-einschränkenden "offenen" Fragen näherstehen und dementsprechend keine Reaktion besonders präferieren, bei den zuletzt betrachteten Inferenzüberprüfungen mit fallender letzter Tonhöhenbewegung diese eher wie Inferenzüberprüfungen behandelt werden, die eigentlich eine Bestätigung präferieren. Dementsprechend ist eine Bestätigung hier eine einfache und unkomplizierte Reaktion, wohingegen eine Zurückweisung die Sache komplizierter macht (zur sequentiellen Beschreibung dyspräferierter Turns vgl. bes. Schegloff/Jefferson/Sacks 1977 und Levinson 1983: Kapitel 6.3).
(c) Prosodisch markierte Inferenzüberprüfungen Inferenzüberprüfungen treten gelegentlich auch in prosodisch markierter Form auf, d.h. mit hoher globaler Tonhöhe und größerer Lautstärke oder mit hoher globaler Tonhöhe und lokal markierten Akzenten (siehe Kap. 2.2.4.). Diese prosodische Markierung überlagert dann die sonstigen Signale und macht die Inferenzüberprüfungen zu 'erstaunten Inferenzüberprüfungen1. Hieraus ergibt sich Evidenz, daß diese Art der prosodischen Markierung zur Signalisierung von "Erstaunen" o.ä. unabhängig ist von der Fragesatzstruktur und von der Problemmanifestation im engeren Sinne (s.u.). Hierzu zwei Beispiele:
281 (38) K2: 291-312 ((über R's Instrumente)) 291 R:
unDANN muß ich noch: . klaVIER machen F(\ / )
292 N:
SCHÖN M(\) < Ρ >
293 R:
JA: ((lacht)) M(-)
also für MICH is es mehr ... quâleREI T,F(\ \)
294 N: r WArum: T(\
295 R:
)
und ZKANO T(-
296 I: L
297 R:
)
has du das in deiner JUgend nicht geLERNT
F(\ / ) NEIN H(- )
298 R: r ((lacht ca. 2 Sek.)) 299 I: na(hh) 300 N:
((lacht ca. 1 Sek.))
301 R:
UND giTARre is noch dabei F(\ \ )
302 N: •
klaVIER FINDS du nich SCHÖN H(\ T\ /)
303 N:
ICH hátts gern geLERNT M, F(/ \ ) ich MAG . ich MAG das instrument SCHON gerne= M(\) S(\ \ )
304 R:
305 N: 306 I: 307 R: 308 R:
...
..
=JAA M(\) ja wemman das so SPÄT . anfangen MPSS zu lern: S(\ \ )
< f > bloß: also mir FÄLLT das sehr SCHWER F(\ \
309 N:
das spieln \ )
ähn \/
312 N:
was is daran SCHWER
(
\)
In diesem Beispiel erwähnt R, daß das Klavierspielen für ihn eine Quälerei sei (293). In 302 verwendet Ν hohe globale Tonhöhe und eine lokal größere Bandbreite bei einem Akzent als
282 prosodische Markierungsmittel in einer prosodisch markierten Inferenzüberprüfung mit steigender letzter Tonhöhenbewegung, in der sie sich vergewissert, ob R klavier wirklich nicht schön fände. Die prosodische Markierung dieses Turns signalisiert ihr Erstaunen, ihre Überraschung über diese dem R zugeschriebene Haltung. Deren Hintergrund, nämlich ihre eigene ganz andere Haltung, expliziert Ν nach einer Pause mit ICH hätts gern geLERNT. Im Folgetum, den R in Relation zur an ihn gestellten Frage erst in 304 verspätet übernimmt, grenzt er seine Haltung ein und bearbeitet den Widerspruch, indem er seinen eigenen Hintergrund expliziter als bisher darstellt: Er mag das Instrument, doch ihm fällt das Spielen schwer. Die prosodisch markierte Inferenzüberprüfung wird also hier nicht wie eine "einfache" Inferenzüberprüfung behandelt, sondern N, R und I leiten eine Widerspruchsklärung ein. (39) Kl: 550 R:
du bist in WILhelmshaven dann
H(/
551 I:
mhm \/ . in einem Bistro / ) r mhm \/ und in HELchem M(/ )
552 R: 553 I: 554 R:
555 I:
also ss in der M(\ \
9
S:
w e n n sie s b e S C H R E I b m kônn is das ja k e i n p r o b L E M M( ... / \)
10 K: *
we(nn) ich W A S M( ... /)
11 S:
w e n n sie s b e S C H R E I b m könji M( \ )
12 K:
JAA M(\)
.
spinneREI \)
J A A K A N N ich F(\ \ )
In (45):45 ersetzt das unakzentuierte was mit steigender Tonhöhenbewegung den gesamten vorausgegangenen Turn, in (46): 10 ersetzt was nur einen Teil daraus und lokalisiert ihn zugleich durch die Zitierung einiger voraufgegangener Elemente bis zum problematischen Bezugselement. In beiden Fällen reagieren die Rezipienten mit einer Wiederholung des problematischen Teils des Bezugstums. Für diesen Fragetyp ergibt sich das folgende Merkmalbündel: [+ W-Wort-Ersetzung des Bezugselements] [+ Intonation: steigende Tonhöhenbewegung ( / )] [+ Aufforderung zur Wiederholung des Bezugselements]
3.1.3.2. Manifestation von Erwartungsproblemen Erwartungsprobleme mit Bezug auf den letzten Turn werden entweder mit 'WIESO! WESHALB/WARUM-Nzcbfrageri mit/plus der Wiederaufnahme des problematischen Bezugselements bzw. Bezugssachverhalts manifestiert oder aber mit einer sogenannten 'erstaunten Nachfrage', in der das problematische Bezugselement bzw. der problematische Bezugssachverhalt wiederaufgenommen wird. Mit diesen Fragen manifestiert der Problemträger jeweils einen Widerspruch zu den eigenen Erwartungen, der in den folgenden Turns
294
bearbeitet und damit das Problem gelöst werden soll. Oft leitet der Problemträger selbst durch Explikation seiner eigenen Erwartungen die Widerspruchsklärung ein. Das drückt das folgende allgemeine Merkmalbündel der Manifestationen von Erwartungsproblemen aus: [+ Refokussierung in Form der fokussierten Zitierung/ anaphorischen Wiederaufnahme/Ersetzung des Bezugselements bzw. Bezugssachverhalts] [± prosodisch markiert] [+ Aufforderung an den Rezipienten zur Beteiligung an der Widerspruchsklärung]
3.1.3.2.1. Wiese-Nachfragen W/eso-Nachfragen' enthalten die Fragewörter WIESO, WESHALB, WARUM plus die Wiederaufnahme eines problematischen Bezugselements oder Bezugssachverhalts aus einem vorausgegangenen Bezugsturn. Diese problemmanifestierenden Wieso-Nachfragen haben fallende letzte Tonhöhenbewegungen; dadurch unterscheiden sie sich auch prosodisch von den nichteinschränkenden "offenen" W-Fragen, in denen auch die Fragewörter wieso, weshalb und warum, aber eben mit steigender letzter Tonhöhenbewegung und in neufokussierenden Turns vorkommen. Die problemmanifestierenden Wieso-Nachfragen können die Form finiter WiesoFragesätze mit fallender letzter Tonhöhenbewegung haben. Sie können aber auch das Fragewort in eigenständiger Einheit mit fallendem Akzent haben und daran eine andere Frage anschließen, in der das Bezugselement bzw. der Bezugssachverhalt wiederaufgenommen oder expliziert wird; diese Frage kann dann eine steigende oder eine fallende letzte Tonhöhenbewegung haben. Wieso-Nachfragen manifestieren ein lokales Erwartungsproblem, einen Widerspruch zu den eigenen Erwartungen, der in den Folgetunis bearbeitet werden soll. Geeignete Bearbeitungsverfahren sind die (ggf. beidseitige) Explikation von Hintergrundwissen und Erwartungen durch die Interaktionsteilnehmer, um den signalisierten Widerspruch zu bearbeiten und zu klären. Einige Beispiele: (47) K5: 101 E:
ich FINde diese ORlaubsregelung an der UNI F(\ \ \
102 E:
VÖLlich UNsinnich ne . \ \ /)
103 E:
ich HAB nichts von meinem urlaub ne F(î\ /)
104 L: ι-
ICH AO nich
M(/ 105 E:
\
) man ARbeitet ja sowieSO ne S(/ T\ /)
295 106 L:
JA
M(\) 107 C: *
WIEso GIBTS da ne offizielle ORlaubsregelung M(\ )M(\ / ) ja es
108 E: 109 E:
OIBT eine urlaubsregelung F(\ )
110 E:
aber es IST Eben NICHT SO . M(\ \ \ /) wie in jedm: SCHÜLbetrieb
111 E:
M( t-
)
oder an jedm ANderem betrieb 112 E:
M(t-
)
113 E:
wo du WIRKlich mal fü:r FÜNF wochn im jähr F(/ \
114 E:
alles stehn und LXEgn lassen KANNST \ / )
115 E: 116 C: 117 L:
und WIRKlich PRlaub machn kannst ne= F(/ î\ /) =mhm =mhm
(48) Kl: 458 N: 459 I: 460 R:
FABOS du jedn TACH= F(\ / )
r =mhm \/ für dich:
461 * R:
wieSO du KANNST ja auch öh:: zum beispiel öh: M(\) M(\
462 R:
hanMOver oder irgendwie ne andre uni hier \
463 R:
in äh in NIEdersachsn \ )
464 I:
ja aber DAS» Ah: wär für mich alles F(\
465 I:
viel zu UMstàndlich .. da: HINziehn un:d \ ) T(\ )-
...
296 466 I:
na dazu geHÖR:Τ ja au noch F(\
.
467 I:
das OE:LD=was ich nich (h)HAB / ) M(/)
öh
468 R: r mhm= \/
=weil ich kein BAfög krich: \ M( / ) < all >
469 I:
(49) K l : 960 R: r =die ham:
961 N: r ach mhm \ \/ 962 R: 963 R: r ((ráuspert sich))
kultur(?) fete HIER gemacht F(\ im: im zenTRALbereich \ ) mhm
964 N:
\/
965 R:
da WARN auch ne GANze menge LEUte M(\ / \ )
966 N:
WIEso= T(\ )
967 Ν: r =wann WAR die denn F(\ ) 968 R: aber das has du LEIder nich: F(\
mtgekricht ) 970 N: NEEe: L H(\ /) 971 N:
nee \
wann WAR die DENN= H,F(\ / )
(50) K l : 1001 N: *
aber wieso FAHRS du denn dann wenn: H(\ ) -
1002 N:
KANNS du nich mal η Wochenende HIERbleibm H,F(\ / )
(0.8)
297 1003 Ν:
ich mein wenn du
JAA=ich hab H(\) < all >
1006 N:
1007 R:
mhm \/ =meine FRAU wohnt da M(/ )
(0.6)
1008 R: ρ oder wir WOHfl halt zuSAMJt da T(\
((lacht))
In (47): 107 formuliert C das Fragewort WIEso in einer eigenen Einheit mit fallender Tonhöhenbewegung und fügt in einer zweiten Einheit eine weitere Verb-Erst-Frage mit steigender letzter Tonhöhenbewegung mit der akzentuierten Zitierung des Bezugselements aus 101 an. Hierbei ersetzt sie allerdings die Spezifikation des Nomens: der ursprüngliche definite Artikel diese wird ersetzt durch einen indefiniten Artikel ne plus ein spezifizierendes Adjektiv offizielle. Hiermit wird C's eigene andere Erwartung expliziert, daß es an der Uni wohl keine offizielle Urlaubsregelung gebe. E's Behandlung des durch diese Frage manifestierten Erwartungsproblems besteht in einer versuchten Widerspruchsklärung: Sie erläutert die Urlaubsregelung an der Uni, indem sie sie ausführlich von den ihr offenbar mehr zusagenden Urlaubsregelungen in anderen Arbeitsbereichen absetzt. Auch im Beispiel (48) formuliert R in 461-463 ein vorangestelltes wieSO mit fallender letzter Tonhöhenbewegung in eigener Einheit und schließt daran in einem Verb-Zweit-Satz die Explikation des für ihn unerwarteten Sachverhalts an. I antwortet zunächst kurz und läßt in 465 zunächst eine Pause, bevor sie dann weiter expliziert, weshalb sie nicht an eine andere Uni in Niedersachsen wechseln möchte. Im Beispiel (49) wird das Fragewort WIEso in Z. 966f mit global tiefer Tonhöhe und mit schneller Geschwindigkeit gesprochen und die Sprecherin schließt auch schnell noch eine weitere W-Frage mit fallender letzter Tonhöhenbewegung an. Wenn sie mit dem Fragewort WIEso einen Widerspruch zu ihren Erwartungen manifestiert, dann fokussiert sie mit der angeschlossenen weiteren W-Frage ihr Erwartungsproblem genauer, nämlich auf den Zeitpunkt des in Rede stehenden Ereignisses. Auch hier signalisieren der Akzent auf dem finiten Verb und die Partikel denn die Refokussierung auf die bereits fokussierte Fete. Ν kann anscheinend gar nicht glauben, daß sie diese Fete, die sie ja nicht in Frage stellt, versäumt hat. Die Fokussierung auf den Zeitpunkt des Ereignisses läßt dabei eher eine (zumindest zunächst) kurze Antwort erwarten, z.B. die Nennung des Tages oder des Datums. Den Unterschied zwischen Wieso-Nachfragen' mit fallender und nicht-einschränkenden "offenen" Fragen mit steigender letzter Tonhöhenbewegung verdeutlicht der Fortgang dieser Sequenz: R läßt sich durch N's Frage in 966f nicht sofort unterbrechen, er läßt nur nach der kurzen Pause in 968 seinen Turn leiser werden () und bricht schließlich ab, nachdem Ν
298 erneut mit hoher Tonhöhe den Turn übernommen hat. - Allerdings bricht er nicht eher ab, als er Ν noch die Schuld für ihr eigenes Nicht-mitkriegen zugeschrieben hat: Wenn Ν in 966 ein Erwartungsproblem manifestiert, kann die Ursache für ihre nicht-erfüllten Erwartungen bei Ν selbst oder bei Anderen liegen: Entweder ist das Fest nicht ausreichend öffentlich bekannt gemacht worden, oder sie selbst hat nicht genügend aufgepaßt. Schon parallel damit, daß Ν ihre Problemmanifestation ergänzte, hatte R in 968 zur Schuldzuschreibung angesetzt Nach einer Bestätigung und Ratifizierung von R's Schuldzuschreibung wiederholt Ν dann ihre W-Frage, allerdings nun mit letzter steigender Tonhöhenbewegung und global hoher Tonhöhe. Damit wird die ursprünglich refokussierend gestellte W-Frage, mit der Ν ihr Problem manifestierte und an R zur "Reparatur" formulierte, nun als nicht-einschränkende "offene" Frage reformuliert. Diese "offene" Frage scheint nun benutzt zu weiden, um eine ganz neu begonnene Frage-Antwort-Sequenz einzuleiten, in der kein Problem mehr geklärt werden soll, sondern Ν nur noch, wie in einer "offenen" neufokussierenden Frage, um Informationen bittet. In der Folge wird dann der Zeitpunkt gesucht und auch N's Widerspruch ausführlich bearbeitet. In (50):1001 wird das Fragewort wieso in den finiten Fragesatz eingebunden, auch hier ist die Tonhöhenbewegung fallend, und auch hier expliziert Ν den Widerspruch zu ihren eigenen Erwartungen noch einmal deutlich in der Verb-Erst-Frage mit steigender letzter Tonhöhenbewegung in der Folgezeile 1002. Auch hier reagiert R mit einer ausführlichen Hintergrundbeschreibung seiner familiären Situation. Als Fazit dieser Analysen ergibt sich, daß die Wieso-Nachfragen mit fallender letzter Tonhöhenbewegung einen Widerspruch zu den eigenen Erwartungen manifestieren, der durch eine Widerspruchsklärung weiter bearbeitet werden soll. An diese werden häufig andere, den Widerspruch eingrenzende oder explizierende W- oder Verb-Erst-Fragen mit steigenden oder fallenden letzten Tonhöhenbewegungen angeschlossen. Diese signalisieren dann vielleicht auch eine "Verwandtschaft" zu den bereits besprochenen Fragetypen. Das für Wieso-Nachfiragen' festzuhaltende Bündel konstitutiver Merkmale ist: [+ Fragewort wieso, weshalb, warum o.ä.] [+ fokussierte Zitierung/anaphorische Wiederaufnahme des Bezugselements bzw. Bezugssachverhalts] [+ Intonation: fallende letzte Tonhöhenbewegung (... \)] [± prosodisch markiert (?)]
3.1.3.2.2.
'Erstaunte Nachfragen' (Prosodisch markierte Problemmanifestationen)
In prosodisch markierten Problemmanifestationen werden die oben in Kapitel 2.2.4. beschriebenen Merkmalbündel H( ) + oder H( ) +lokal markierte Akzente mit oder (t) konstituiert Die Fragen werden dadurch prosodisch auffällig gemacht. Anders als ihre unmarkierten "Verwandten" werden die prosodisch markierten Problemmanifestationen generell als Manifestationen eines lokalen Erwartungsproblems interpretiert, als Manifestation eines Widerspruchs zu den eigenen Erwartungen, der durch eine Widerspruchsklärung bearbeitet werden soll. Eine derartige prosodische Markierungsweise wird bei problemmanifestierenden Fragetypen nur zur Manifestation lokaler Erwartungsprobleme verwendet. Daneben kommen
299 derartige prosodisch markierte Formen jedoch auch unabhängig vom Format der Problemmanifestation vor, z.B. in prosodisch markierten Inferenzüberprüfungen (siehe Kapitel 3.1.2.2.). Die gemeinsame Interpretation des Merkmals [+ prosodisch markiert] scheint - wie bereits ausgeführt - 'Erstaunen', die Signalisierung eines Widerspruchs zu den Erwartungen des Fragenden zu sein. Darauf heben auch die üblichen holistischen Alltagsinterpretationen dieser Äußerungen als 'erstaunte', 'verwunderte', 'ungläubige', 'zweifelnde' o.ä. Fragen bzw. Nachfragen ab. Die Bezugselemente lokaler Erwartungsprobleme sind i.d.R. keine Einzelelemente des voraufgegangenen Turns, sondern ganze Bezugssachverhalte, auf die gegebenenfalls Einzelelemente referieren. In Kapitel 2.2.4. wurden bereits einige Fragen als Beispiele für das Phänomen der prosodischen Markierung angeführt und kurz besprochen. Die dort wiedergegebenen akustischen Analysen illustrieren und stützen meine auditiven Analysen. In diesem Kapitel steht der Aspekt der Verwendungsweise der prosodischen Markierung für die Kontextualisierung eines Erwartungsproblems im Vordergrund. Aus Platzgründen werden die hier angeführten Beispiele nicht mehr mit weiteren akustischen Analysen illustriert. Zunächst ein Beispiel für eine prosodisch markierte W-Frage: (51) K5: 211 E:
H A S d u denn a n deiner diss geARbeitet in letzter zeit M, S(/ / )
212 L:
N E E D D R als ich w u ß t e dann is der d o k t o R A N d n t e r m i n M(\) S(/ \ /)
213 L:
h a b ich m i c h mal KURZ η abend HINgesez M(\ \ )
214 L :
J A u n d a n n h a b ich erst η SPÖKES gemacht ne T,S(\ / ) / < all >
((lacht ca. 3 Sek.))
215 E: 216 E: 217 L:
mhm \/ r m L
geNAU M(\)
((
lacht
ja \
))
218 C:
WAS h a s d u gemacht H, S(/ )
219 L:
irgendwie so ZETtelchen geSCHRIEbm F(\ / ) sie hat ne ganz nette EXMladung g e s c h r i e b m M(\ )
220 E: 221 L: 222 C :
223 E:
((lacht))
((lacht ca. 2 Sek.)) ... h m h m \/ m i t B I L D c h e n u n d ziTAT F(\ \)
300 Hier wird mit der Frage WAS has du gemacht eine fokussieite anaphorische Wiederaufnahme des zwischen Lachen als witzig und selbstironisch formulierten Bezugssachverhalts η SPÔkes gemacht aus Zeile 214 geleistet. Das Fragewort selbst wird stark akzentuiert und die ganze Einheit liegt auf hoher globaler und steigender Tonhöhe und wird dadurch prosodisch markiert und auffällig gemacht. Diese Frage ist keine Manifestation eines akustischen Verstehensproblems8, aber auch mehr als nur die Manifestation eines Bedeutungsverstehensproblems mit Bezug auf den Ausdruck spökes : C ist offenbar verwundert über L's Art der selbstironischen und "respektlosen"9 Charakterisierung ihres Sich-drückens vor der Arbeit an ihrer Dissertation, hat zumindest eine Charakterisierung als η SPÖkes gemacht an dieser Stelle nicht erwartet und ist nun offenbar um so neugieriger, auf welche Tätigkeit sich diese Charakterisierung wohl bezieht. Die Frage wird mit einer Hintergrunddarstellung bearbeitet: L und E erläutern die beiden bekannte Tätigkeit, auf die mit η SPÖkes gemacht referiert wurde. Dabei bleibt L in Zeile 219 mit der Hintergrunddarstellung ZETtelchen geSCHRIEbm und dem anschließenden Lachen (221) im Rahmen der mit dem Lachen in Zeile 214 und dann weiter mit η SPÖkes gemacht angeschlagenen selbstironischen Modalität, ohne das Problem ernsthaft zu bearbeiten. Jedoch bleibt auch E in ihrer Modalität und antwortet in Zeile 220 ernsthaft mit einer Benennung der wirklichen Tätigkeit der L, die sie nach L's Lachen und C's Rezeptionssignal auch noch fortsetzt. Damit behandeln L und E das manifestierte Problem weder als akustisches Verstehensproblem, noch als reines Bedeutungsverstehensproblem mit Bezug auf den Ausdruck spökes, sondern als Erwartungsproblem mit Bezug auf Tätigkeiten, die L η SPÖkes machen nennt und mit denen sie sich vor der Arbeit an ihrer Dissertation drückt. Für die Signalisierung der Frage als eine solche 'erstaunte', 'verwunderte' Frage, mit der ein Erwartungsproblem manifestiert wird, ist allein die Prosodie konstitutiv.10 In Kapitel 2.2.4. wurde mit dem Beispiel (131) ein Beispiel für eine prosodisch markierte Verb-Erst-Frage gegeben, nämlich die Frage 12 D:
=HAM se no NIMmals gePRACHT H,F(\ \ / )
Dort wurde auch gezeigt, daß diese Frage als Manifestation eines Widerspruchs zu den eigenen Erwartungen behandelt wird. Ein weiteres Beispiel findet sich in (52): (52) KO: 18:2ff((Thema: Ob vielleicht bei M heimlich ein AIDS-Test durchgeführt wurde.)) 2
M:
nee H A M se nich gemacht H A M se nich geMACHT \ F(\ \ ) F(\ \ )
3
M:
((räuspert sich))
Dieselbe Frage ohne die ptosodische Markierung wird i.d.R. als Manifestation eines spezifischen akustischen Verstehensproblems gehört und erwartungsgemäß mit einer Wiederholung des ersetzten Elements aus dem Bezugsturn bearbeitet. Diese Charakterisierung gab L selbst in einer späteren Befragung zu dieser Transkriptstelle und bestätigte damit die hier explizierte Interpretation. Für ein weiteres Beispiel mit der prosodisch markierten W-Frage WAS mit H( ) + siehe Kapitel 2.2.4., Beispiel (130).
301 4
M:
DAfür müssn se ΒΙ keine Erwartung einer präferierten Reaktion [+ fallende letzte Tonhöhenbewegung: (... \)] -> Erwartung einer Bestätigung als präferierter Reaktion [+ prosodisch markiert] -> Signalisierung von Widerspruch zu eigenen Erwartungen: 'Erstaunen', 'Verwunderung' o.ä. Manifestation von einseitigen Verstehensproblemen generell: [+ Refokussierung in Form der fokussierten anaphorischen Wiederaufnahme/Zitierung des Bezugselements aus dem Vorgängerturn] [ - prosodisch markiert] [+ Nebensequenzauslösung] [+ Aufforderung zur Problembearbeitung an den Rezipienten] Manifestation von Bedeutungsverstehensproblemen: [+ Aufforderung zur Bedeutungseiklärung o.ä.] Nachfrage: [+ W-Fragewort (außer wieso, weshalb, warum o.ä.), oft was ist... ] [+ fokussierte Zitierung/anaphorische Wiederaufnahme des Bezugselements] [+ fallende letzte Tonhöhenbewegung (,..\)] Echofrage: [+ fokussierte Zitierung des Bezugselements] [+ steigende letzte Tonhöhenbewegung (... /)]
306 Manifestation von Referenzverstehensproblemen: [+ W-Wort-Ersetzung des Bezugselements] [+ fallende Tonhöhenbewegung ( \ ) ] [+ Aufforderung zur Ersetzung des referierenden Bezugsausdrucks durch anderen referierenden Ausdruck] Manifestation von akustischen Verstehensproblemen: [+ W-Wort-Ersetzung des Bezugselements] [+ steigende Tonhöhenbewegung ( / )] [+ Aufforderung zur Wiederholung des Bezugselements] Manifestation von Erwartungsproblemen (Widerspruch zu den eigenen Erwartungen) generell: [+ Refokussierung in Form der fokussierten anaphorischen Wiederaufnahme/ Zitierung/Ersetzung des Bezugselements/Bezugssachverhalts] [± prosodisch markiert] [+ Aufforderung an den Rezipienten zur Beteiligung an der Widerspruchsklärung] Wiese-Nachfragen: [+ Fragewort wieso, weshalb, warum o.ä.] [+ fokussierte Zitierung/anaphorische Wiederaufnahme des Bezugselements bzw. Bezugssachverhalts] [+ fallende letzte Tonhöhenbewegung (... \)] [± prosodisch markiert (?)] 'Erstaunte Nachfragen': [+ beliebige andere Form der Problemmanifestation] [+ prosodisch markiert: H( ) + oder H( ) + bzw. (Î)] Diese einzelnen Merkmale und Signale werden als Kontextualisierungshinweise für die Konstitution unterschiedlicher Typen konversationeller Fragen verwendet. In diesem Sinne ist eine konversationelle Frage eine holistische konversationeile Aktivität, die mit Hilfe der Kombination kookkumerender Kontextualisierungshinweise konstituiert und interpretiert wird. Hierbei bin ich v.a. im Bereich der 'Semantischen Beziehung zum Vorgängerturn', bei der Unterschiede zwischen 'Neufokussierung', 'Fokusweiterführung' und 'Refokussierung' aktivitätstyp-unterscheidende Merkmale sind, noch weitgehend auf der Ebene holistischer interpretativer Kategorien geblieben. Auf die grammatischen Voraussetzungen der Konstitution und Interpretation derartiger semantischer Beziehungen kann im Rahmen dieser Arbeit leider nicht mehr genauer eingegangen werden (s.o. Kapitel 2.2.2.2.).
307
3.3. Zusammenfassung und Fazit zur Analyse konversationeller Fragen 'Fragen' sind ein ganz spezifischer Aktivitätstyp in einer ganz spezifischen sequentiellen Position, deren allgemeines Charakteristikum ist, daß sie das Rederecht an den Rezipienten bzw. die Rezipientin für die konditioneil relevante 'Antwort' vergeben. Damit der Rezipient diese Aktivität früh genug erkennen kann, um unproblematisch anschließend den Turn übernehmen zu können, wäre es günstig, diese Aktivität bereits relativ früh als solche kenntlich zu machen. Bei den Fragen, die sich der syntaktischen Struktur der Frage- bzw. Interrogativsätze bedienen, ist dieses Erfordernis durch die spezifische Syntax dieser Sätze gewährleistet: Das W-Fragewort bzw. die Verb-Erst-Position als erste Position des Satzes projektieren bereits am Anfang der Einheit diese als eine Frage. Konversationelle Aktivitäten, die die Syntax von Fragesätzen und darüber hinaus andere aktivitätstyp-spezifische Kontextualisierungshinweise verwenden, konstituieren spezielle Sequenzen, wie z.B. nicht-einschränkende "offene" FrageAntwort-Sequenzen, einschränkend weiterführende Verständigungsbearbeitungs- und Problembehandlungssequenzen, in denen auch je unterschiedliche Typen von 'Antworten' konditionell relevant sind. Meine Analyse konversationeller Fragen zeigt, daß es, um eine Beschreibung und Taxonomie konversationeller Fragen zu erstellen, notwendig und sinnvoll ist, die holistische konversationeile Aktivität 'Frage' in ihre interpretativ relevanten konstitutiven Merkmale zu dekomponieren und genauer den jeweiligen Beitrag dieser Merkmale zur Konstitution konversationeller Fragen zu analysieren. Als Fazit meiner Analyse ergibt sich: Eine Analyse von Fragen als konversationellen Aktivitäten muß die empirische Analyse der syntaktischen und seman ti sehen und prosodischen Struktur der Frageäußerung, der Beziehungen der Frage zu ihren Vorgängeraktivitäten und der sequentiellen Implikationen für die Rezipienten umfassen. Anhand dieser Dimensionen können Fragetypen unterschieden werden, die je unterschiedliche Antworten verlangen. Ohne eine solche Analyse sind Fragen als konversationelle Aktivitäten nicht analysierbar. Für jeden der in der Taxonomie in Figur 2 (siehe Seite 241) aufgeführten Typen konversationeller Fragen wurde ein Bündel konstitutiver Merkmale ermittelt (siehe Kapitel 3.2.). Die Merkmale selbst betreffen vier Eigenschaften der konversationellen Frage, die zu Anfang dieser Analyse bereits vorangestellt wurden und nun präzisiert werden können. Im folgenden weiden diese vier konstitutiven Merkmalsysteme und die damit je unterschiedenen interaktiv relevanten Bedeutungen bzw. Aktivitätsaspekte einander zugeordnet ('->' kann gelesen werden als 'ist relevant für (die Unterscheidung zwischen)1): (1)
Semantische Beziehung zum Vorgängerturn: v.a. ob und welche Art der Wiederaufnahme eines (problematischen) Bezugselements: [± Neufokussierung] -> ± nicht-einschränkende "offene" Frage [± Fokusweiterführung] -> ± einschränkend weiterführende, ggf. explizit verständigungsbearbeitende Frage [± Refokussierung in der Form der Wiederaufnahme eines problematischen Bezugselements/Bezugssachverhalts durch anaphorische Wiederaufnahme/
308 Zitierung oder W-Wort-Ersetzung des Bezugselements] [± anaphorische Wiederaufnahme/Zitierung] -> Bedeutungsverstehensproblem, Erwartungsproblem [± W-Wort-Ersetzung] (2)
(3)
(4)
-> Refercnzverstehensproblem, akustisches Verstehensproblem Syntaktische Struktur der Frageäußerung: finiter Fragesatz bzw. dessen Ellipse versus einzelnes, ggf. lokalisiertes, W-Wort: [± finiter Fragesatz bzw. dessen Ellipse] [± W-Wort] Prosodie der Frageäußerung: v.a. ob prosodisch gegenüber den umliegenden Äußerungen markiert oder nicht und ob steigende oder fallende letzte Tonhöhenbewegung: [+ steigende letzte Tonhöhenbewegung (... /)] -> ggf. weniger einschränkend im Hinblick auf Antwort, "offenere" Antworterwartung, weiter Spielraum [+ fallende letzte Tonhöhenbewegung (... \)] -> ggf. einschränkender fokussieiend und eingeschränktere Antworterwartung, engerer Spielraum [± prosodisch markiert] -> ± Manifestation/Signalisierung von 'Erstaunen', 'Verwunderung', Widerspruch zu den eigenen Erwartungen Die mit diesen Komponenten konstituierte Frage impliziert eine ganz spezifische "Aufforderung" an den Rezipienten, eine je spezifische erwartete Reaktion zu liefern: [+ Projektierung von Turnexit am Ende der Einheit] [± Einladung zur unmittelbaren Elaboration des Themas] [± Erwartung eingeschränkter, fokussierter 'Antwort'] [± Nebensequenzauslösung]
Hiermit zeigt sich, daß eine genauere linguistische Analyse der sprachlichen Struktur und der sequentiellen Behandlung von Fragen sinnvoll und notwendig ist, um unterschiedliche Fragetypen mit unterschiedlichen sequentiellen Implikationen zu unterscheiden. Meine Analyseergebnisse stellen einige bisher in der Linguistik und in der Konversationsanalyse übliche Annahmen in Frage. Die diesbezüglichen Schlußfolgerungen können in folgenden Punkten zusammengefaßt werden: (1) Die Prosodie konversationeller Fragen, v.a. die Wahl und Konstitution globaler und lokaler Tonhöhenverläufe (Konturen) und anderer globaler prosodischer Strukturen, ist unabhängig von der Syntax und Semantik der Äußerung. Dieselben syntaktischen Satztypen, wie z.B. W-Fragen und Verb-Erst-Fragen, können mit steigenden oder fallenden Tonhöhenbewegungen formuliert werden. Nicht einmal bei Verb-Zweit-Inferenzüberprüfungen ist eine steigende letzte Tonhöhenbewegung konstitutiv für deren Interpretation als Inferenzüberprüfung, die eine 'Antwort'reaktion erfordert; auch dieser Aktivitätstyp kann eine steigende oder fallende letzte Tonhöhenbewegung haben. Ein alleiniger Rückgriff auf so diffuse und holisti-
309 sehe Kategorien wie 'Höflichkeit', 'interpersonelle Markiertheit' o.ä. kann den Unterschied, den unterschiedliche Tonhöhenbewegungen bei der Verwendung dieser Satztypen in Gesprächen erzeugen, nicht erklären. Vielmehr ergibt sich folgender Schluß: Die Prosodie ist ein autonomes Signalisierungssystem, unabhängig von der syntaktischen Struktur der Einheit und von der semantischen Beziehung der Frage zum Vorgängerturn. In Kookkurrenz mit der Syntax der Einheit und der semantischen Beziehung zum Vorgängerturn signalisiert und unterscheidet die Prosodie jedoch spezifische Typen konversationeller Fragen in spezifischen sequentiellen Positionen, die auch je unterschiedliche Antworten verlangen. Auf einen einfachen Gegensatz gebracht bedeutet das: Die Prosodie ist nicht konstitutiv für syntaktische Satztypen oder semantische Satzmodi, sondern für Aktivitätstypen, mit denen spezifische konversationeile Aktivitäten von Teilnehmern vollzogen werden. Damit ergibt sich, daß die allseits übliche Annahme, Intonation stünde in einer systematischen Beziehung zu den grammatischen Satztypen bzw. semantischen Satzmodi sich zumindest für empirisch erhobene Daten aus echten Gesprächen nicht halten läßt. Meine Analyse erzwingt vielmehr die Annahme, daß zwar die Wahl der Akzentstellen für die Herstellung der semantischen Fokus-Hintergrund-Gliederung der Einheit in Beziehung zur Grammatik steht (s.o. Kapitel 2.2.2.2.), daß jedoch die Intonation als autonomes Signalisierungssystem unabhängig von der Grammatik verwendet wird, um auf interaktiver Ebene als konstitutives Merkmal bei der Unterscheidung von interaktiv relevanten Typen konversationeller Fragen zu dienen. Es resultiert die Notwendigkeit, zwischen der Analyse des Beitrags der syntaktischen Struktur (v.a. Wort-/Satzgliedstellung und Fragewörter), der semantischen Beziehung zum Vorgängerturn (des Fokus einer Äußerung als Interpretation seiner Akzentuierung und ggf. Wortstellung in Relation zum Vorgängerturn) und der Intonation bzw. weiterer prosodischer Parameter als autonome Signalisierungssysteme bei der Konstitution von Fragen zu differenzieren. (2) Für die Signalisierung einer spezifischen konversationeilen Aktivität ist aber dennoch gegebenenfalls allein die Prosodie konstitutiv und typ-unterscheidend gegenüber anderen Aktivitäts- und Fragetypen: Bei uneindeutiger semantischer Beziehung zur Vorgängereinheit unterscheidet allein die letzte Tonhöhenbewegung auf denselben lokutiven Elementen und Strukturen zwischen nicht-einschränkenden "offenen" versus einschränkend weiterführenden, "engeren", verständigungsbearbeitenden Fragen; Inferenzüberprüfungen ohne versus mit der Erwartung einer präferierten Reaktion (vgl. hierzu die alten stereotypen holistischen Bezeichnungen 'Vergewisserungsfragen' versus 'Bestätigungsfragen'); Manifestation von Referenzverstehensproblemen versus akustischen Verstehensproblemen. Weiterhin unterscheidet in vielen Fällen allein die prosodische Markierung zwischen den unmarkierten Versionen von Fragen und Problemmanifestationen, in denen kein 'Erstaunen', keine 'Verwunderung' bzw. kein Widerspruch zu den eigenen Erwartungen signalisiert wird, und den prosodisch markierten Frageformen und Problemmanifestationen, mit denen immer zusätzlich zu den anderen Bedeutungskomponenten 'Erstaunen', 'Verwunderung' bzw. ein Widerspruch zu den eigenen Erwartungen allein mit prosodischen Mitteln signalisiert wird.
310 Wenn bei diesen Fragetypen allein die Prosodie typ-unterscheidend sein kann, dann erlaubt erst eine Konversationsanalyse dieser Äußerungen, die die Reaktion des Rezipienten als Kriterium für die Verifizierung der Analyse und Unterscheidung der Fragetypen heranzieht, eine nicht-zirkuläre Argumentation. Demgegenüber untersuchten frühere linguistische Analysen, die allein die Frage untersuchten, in einem ersten Schritt die "normale", unmarkierte Intonation in systematischer Beziehung zu einer anderen Größe innerhalb der Frageäußerung selbst, in der Regel eben dem syntaktischen Satztyp oder dem semantischen Satzmodus. In einem zweiten Schritt wurden dann die im ersten Schritt nicht erklärbaren Unterschiede mit globalen externen Faktoren wie "Höflichkeit", "Interesse" o.ä., deren Effekt jedoch offenbar nicht für weiter empirisch nachweisbar gehalten wurde, erklärt. Demgegenüber liefert die vorliegende Analyse eine einfachere Beschreibung der empirischen Fakten, die auch für prosodische Parameter weitgehend einheitliche interaktive Bedeutungen rekonstruiert. (3) Nicht-einschränkende "offene" Fragen haben eine steigende letzte Tonhöhenbewegung: (... /). Damit wird das alte stereotype Alltagswissen bestätigt, Fragen hätten steigende Intonation, allerdings nur mit Bezug auf den sehr viel enger und präziser definierten Begriff der nicht-einschränkenden "offenen" Frage. Zuschreibungen wie 'höflich', 'interpersonell markiert' o.ä. zu Fragesätzen mit steigender Intonation wären dann als Resultate unexplizierter Kontextualisierungen und in diesem Sinne als verkürzte Globalinterpretationen des Phänomens interpretierbar, daß diese nicht-einschränkenden Fragen den Rezipienten die geringsten Antwortbeschränkungen auferlegen und den größten Spielraum für die konversationeile Weiterentwicklung lassen. Demgegenüber schränken andere Fragetypen die Reaktion des Rezipienten z.T. wesentlich mehr ein, da sie verständigungsbearbeitend und -sichernd, reparatureinleitend und ggf. problemmanifestierend sind und nur eine eingeschränkte, ggf. kürzere Antwort bzw. eine eingeschränkte Problembearbeitung bezüglich eines voraufgegangenen Turns verlangen und damit der thematischen Weiterentwicklung durch den Rezipienten nur einen kleineren Spielraum einräumen bzw. sie erst einmal ganz blockieren (vgl. hierzu auch den Höflichkeitsbegriff von Brown/Levinson 1987). (4) Verständigungsbearbeitende und problemmanifestierende Fragetypen haben steigende oder fallende letzte Tonhöhenbewegungen. Hier signalisieren diese letzten Tonhöhenbewegungen in einigen Fällen vielleicht "Verwandtschaften" zu den o.g. Fragetypen. Fallende letzte Tonhöhenbewegungen schränken offenbar in vielen Fällen die präferierte 'Antwort'reaktion des Rezipienten tendentiell mehr ein als steigende; diese Frage bedarf jedoch der weiteren Untersuchung. (5) Eine prosodische Markierung mit hoher globaler Tonhöhe und erhöhter Lautstärke oder stärkeren bzw. lauteren Akzenten und/oder größeren lokalen Tonhöhenbewegungen als in den umliegenden Turnkonstruktionseinheiten wird als Ressource verwendet zur Signalisierung von 'Erstaunen', 'Verwunderung', einem Widerspruch zu den eigenen Erwartungen. Diese Signalisierung ist den anderen Konstitutionsmerkmalen der konversationellen Frage hinzufügbar und sie überlagert dann die anderen Merkmale. Im Prinzip kann vermutlich jede Frageform in prosodisch markierter Form als 'erstaunte Frage' verwendet weiden. (6) Wenn Prosodie ein aktivitätstyp-konstitutives Signal ist, dann greifen rein sequentielle Analysen, wie sie etwa v.a. Schegloff 1984 und 1987 propagiert, zu kurz. Meine Analyse zeigt, daß gerade auch innerhalb der sequentiell definierten Frage-Antwort- und Reparatursequenzen weitere interne Strukturen bestehen, für deren Analyse die Berücksichtigung lingui-
311 stischer und prosodischer Strukturen unabdingbar ist (zu den internen Strukturen von Reparatursequenzen siehe auch Selting 1987a). (7) Die für konversationelle Aktivitäten konstitutive letzte Tonhöhenbewegung ist aber in ihrer Position nicht festgelegt und damit offenbar stilistisch variierbar. Sie ist z.B. an das Ende der Einheit verschiebbar, und zwar bis in die letzten unakzentuierten Silben der Äußerung. Damit eröffnet sich die Möglichkeit, die übrigen intonatorischen Strukturen der Einheit, v.a. die Akzenttonhöhenbewegungen vor der letzten Tonhöhenbewegung, als kohäsive und/oder stilistische Signale zu verwenden. (8) Als aktivitätstyp-spezifische, aber dennoch frei zuoidbare autonome Signalisierungsmittel können prosodische Signale natürlich auch auf andere als die durch sie spezifizierten Aktivitäten "übertragen" werden, z.B. wenn sequentiell nicht eingebundene, isolierte Fragen formuliert werden. Per Assoziation o.ä. bringen die konstitutiven prosodischen Mittel dann den qua "normaler" aktivitätstyp-spezifischer Zuordnung mit ihnen verbundenen Interpretationsrahmen mit und legen diesen bei der Interpretation der Aktivität nahe. Genau dies ist das Wesen und das Spezifische der Sichtweise sprachlicher Phänomene als Kontextuaüsierungshinweise (Gumperz 1982). Zuschreibungen wie 'höflich' und 'interpersonell markiert' zu bestimmten Fragesätzen mit steigender Intonation machten sich genau diesen Prozeß zunutze, explizierten ihn aber nicht. Mit dieser Analyse wurde gezeigt, daß sowohl Grammatik und Intonation, wie auch einzelne prosodische Parameter, jeweils sowohl getrennt als auch in ihrer Interaktion miteinander, analysiert werden müssen. Einerseits ergibt sich damit die Forderung nach einer noch stärkeren "Modularisierung" bei der Analyse sprachlicher Signalisierungsmittel, andererseits ergibt sich jedoch auch die lohnende und interessante Perspektiven der Untersuchung der Wechselwirkung konversationeller und grammatischer Prinzipien bei der Organisation der konversationeilen Interaktion.
4. Prosodie des Erzählens und Argumentierens in Gesprächen Nachdem im vorigen Kapitel die Unabhängigkeit der Prosodie von der Grammatik nachgewiesen worden ist, kann Prosodie nun als autonomes Kontextualisierungsmittel bei der Organisation konversationeller Aktivitäten weiter untersucht werden. Das Ergebnis der bisherigen Analyse war, daß bei der Konstitution konversationeller Fragen prosodische Strukturen im Hinblick auf die mit diesen Äußerungen vollzogenen Aktivitäten typunterscheidend sind. Das betrifft die letzte Tonhöhenbewegung der konversationellen Frage und die Konstitution prosodisch unmarkierter versus prosodisch markierter Fragetypen. Bei der letzten Tonhöhenbewegung ist jedoch durchaus Variation möglich: So zeigten einige bisherige Beispiele bereits, daß eine letzte steigende Tonhöhenbewegung als letzte Tonhöhenbewegung auf akzentuierten Silben, aber auch im Rahmen des fallend-steigenden Akzents als letzte Tonhöhenbewegung auf unakzentuierten Silben realisiert werden kann. Ich hatte bereits angedeutet, daß diese Variation ggf. stilistisch relevant ist. Bei der Analyse konversationeller Fragen wurden alle anderen Tonhöhenbewegungen außer der letzten der Einheit außer Acht gelassen. Im folgenden sollen nun ganze Akzentsequenzen, die Hauptbestandteile von Intonationskonturen, als stilistische Gestaltungsmittel und Kontextualisierungshinweise in der Alltagskonversation untersucht werden. Stilanalyse wird erst sinnvoll, wenn mehr als einzelne Äußerungen betrachtet und in ihrer Beziehung zueinander oder zu relevanten Alternativen analysiert werden. Z.B. sind einzelne Fragen kaum hinsichtlich ihres Stils analysierbar. Bei wiederholter Verwendung derselben Fragetypen nacheinander sind jedoch dieselben Fragetypen durchaus als stilbildend bzw. als stilistisch relevante Wahlen aus möglichen Alternativen inteipretierbar: Nacheinander gestellte Fragen, die z.B. als nicht-einschränkende und damit im Hinblick auf die Rezipientenreaktionen "offene" Fragen mit letzter steigender Tonhöhenbewegung formuliert und interpretiert weiden, sind geeignet, pauschal als eher 'ungezwungen', 'kooperativ', 'höflich' und 'offen' interpretierte Alltags-Interaktionsstile zu konstituieren. Hingegen kontextualisieren lauter nacheinander gestellte Fragen mit fallender letzter Tonhöhenbewegung, die wie verständigungsbearbeitende und damit weniger offene Fragen formuliert werden, eher einschränkendere, weniger kooperative, ggf. typische institutionsspezifische Interaktionsstile. Bei Fragereihen in der Kommunikation in Institutionen, z.B. vor Gericht oder ggf. in der Schule, sind wohl am ehesten Fragereihen mit fallender letzter Tonhöhenbewegung zu erwarten, wohingegen solche Fragen in gehäufter Verwendung in Alltagsgesprächen Assoziationen an 'Ausfragerei' und Verhörsituationen wecken dürften. Derartige Fragereihen kommen jedenfalls in meinem Korpus informeller Alltagsgespräche nicht vor. Umgekehrt wären wir über einen Sozialbeamten, der bei der Erhebung von Routinedaten zur Person eines Klienten alle diese Fragen als/wie nicht-einschränkende "offene" Fragen formulieren würde, wohl auch eher verwundert und würden ihm ggf. 'übertriebene Freundlichkeit' oder strategische Motive unterstellen. Auf diese Weise zeigt sich auch bei Fragen, daß die Wiederholung der analysierten Fragetypen in Interaktionen durchaus stilistische Bedeutung hat. Aktivitätstypen, an denen sich die stilistische Verwendung von Intonationskonturen besonders gut zeigen läßt, sind konversationeile Erzählungen und Argumentationen. Deshalb soll in diesem Kapitel die Verwendung und Bedeutung der Prosodie bei der Organisation von
313 Erzählungen und Argumentationen genauer untersucht werden. Gemeinsam ist Erzählungen und Argumentationen, daß sie mehr als eine einzige Turnkonstruktionseinheit beanspruchende längere Aktivitäten sind, die von den Gesprächsteilnehmern die Erfüllung bestimmter Zugzwänge verlangen (Kallmeyer/Schütze 1977). Neben der Sicherung des Rederechts für einen solchen längeren Redebeitrag besteht ein weiteres Organisationsproblem bei der Konstitution dieser Aktivitäten darin, die interne Struktur dieser Redebeiträge zu signalisieren: die Organisation der Gesamtaktivität aus aufeinanderfolgenden Aktivitätsteilen, die jeweils als einzelne konstitutive Aktivitätsteile kenntlich gemacht und in ihren Beziehungen zueinander gestaltet werden müssen. Ich möchte im folgenden v.a. den von den Interaktionspartnem hergestellten Tonhöhenverlauf in Erzählungen und Argumentationen genauer betrachten und zeigen, wie dieser als stilistisches Gestaltungsmittel für die Lösung dieses Organisationsproblems in der Alltagskommunikation verwendet wird. Unter 'Stil' verstehe ich in Anlehnung an Sandigs 1986iger Stildefinition zunächst ganz allgemein "die sozial relevante (bedeutsame) Art der Handlungsdurchführung" (Sandig 1986: 23). Wenn Sandig Stil als "d a s Mittel der Situationsanpassung von Handlungen" auffaßt, mit dem "im konkreten Handeln durch die Art der Durchführung weitere(r) intersubjektiv erkennbare(r) Sinn zum generell gegebenen Handlungstyp" hinzugebracht wird (ebd.: 31f.), trifft sich die neuere Stilistik genau mit der Kontextualisierungsforschung und der interpretativen Soziolinguistik (vgl. insbes. Hinnenkamp/Selting 1989). Auer definiert 'Stil' im Unterschied zu Varietät usw. als "Menge kookkurrierender, sozial interpretierter Merkmale" (Auer 1989: 29) bzw. "Menge interpretierter, kookkurrierender sprachlicher und/oder nichtsprachlicher Merkmale, die (Gruppen/Rollen von) Personen, Textsorten, Medien, etc. zugeschrieben weiden" (ebd.: 30). Im Rahmen einer ethnomethodologisch orientierten interpretativ-soziolinguistischen Stilistik haben wir Stil folgendermaßen definiert: Stile sind sozial und interaktiv interpretierte holistische Strukturen bzw. Einheiten, die auf interpretative Konzepte verweisen, "welche Interaktionsteilnehmer typisierend und kategorisierend bei der Interpretation sprachlichen und nicht-sprachlichen sozialen Handelns in sozialen und interaktiven Kontexten zugrundelegen und verwenden" (Selting/Hinnenkamp 1989 :7). "Stile (sind) also dynamische und in der Situation selbst immer wieder erneut hergestellte und gegebenenfalls modifizierte und auf den Rezipienten zugeschnittene (...) Mittel der Signalisierung und Herstellung gemeinsam geteilter, relevanter sozialer und interaktiver Bedeutungen; sie sind Kontextualisierungsmittel, die kraft ihrer interpretativen "Indexe" auf die jeweils relevanten Interpretationsrahmen verweisen" (ebd.: 6; vgl. auch Selting 1989b). Gegenüber den bisher betrachteten Kontextualisierungshinweisen impliziert Stil immer auch den Vergleich mit anderen möglichen Stilen: "Stile resultieren also daraus, daß konkretes sprachliches Verhalten in konkreten Sprachgebrauchssituationen interpretiert wird in Relation zu als solchen relevant gemachten paradigmatischen Alternativen" (ebd.: 6). Auch Stile sind holistisch interpretierte Strukturen bzw. Gestaltungsmittel, die in ihre konstitutiven Einzelparameter dekomponiert werden können. Mit Bezug auf diese Einzelparameter sind dann Stilwahl und Stilveränderungen als interaktiv relevante Aktivitäten beschreibbar. Stilanalyse erfordert neben der Identifizierung interaktiv relevanter Stile und deren Dekom-
314 ponierung in ihre interaktiv relevanten Merkmale vor allem auch die Rekonstruktion der mit den jeweiligen Stilen relevant gemachten und nahegelegten Interpretationsrahmen sowie die damit evozierten Rezipientenreaktionen. In dieser Perspektive ist 'Stil' rekonstruierbar als 'interaktive Leistung' (Selting 1989b). Bei der folgenden Analyse der Rolle der Prosodie bei der Organisation konversationeller Erzählungen und Argumentationen schließe ich an frühere Arbeiten von Gumperz 1982 an. Gumpens interessiert sich für die Rolle der Prosodie bei der Kontextualisierung konversationeller Aktivitäten und bei der Inferierung konversationeller Erwartungen und Bedeutungen in der Interaktion: "We need to examine the role of prosody in this inferential process and to consider how prosody interacts with other modalities to signal thematic connections and to generate interpretation of communicative intent" (ebd.: 101). Anhand der Untersuchung eines Fernseh-Werbespots und eines Gesprächs unter Studenten exemplifiziert er seine Vorgehensweise. Diese besteht im wesentlichen aus (a) einer Identifizierung und Beschreibung des mit Hilfe kookkurrierender lexikalischer, syntaktischer, etc. und prosodischer Signalisierungsmittel konstituierten Stils der Aktivitäten und der dadurch relevant gemachten interpretativen Frames, und (b) der Identifizierung und Beschreibung von Beziehungen zwischen Äußerungen und Aktivitäten durch die Analyse der Kookkurrenz und Alternation der genannten Signalisierungsmittel in aufeinanderfolgenden Äußerungen, Turns oder Aktivitäten. Prosodie wird analysiert als ein Mittel, mit dem der Stil einer Mitteilung diese Mitteilung als z.B. 'intim' oder 'faktisch' etabliert (vgl. ebd.: 103), mit dem die kohäsive thematische Struktur einer Aktivität (vgl. ebd.: 104) und die rhetorische Struktur einer Argumentation signalisiert weiden (vgl. ebd.: 116). Gumperz kommt zu dem Schluß, daß "accent placement and tune, along with syntax and lexicon, guide the listener in inferring relationships among utterances and supplying nonlexical information" (ebd.: 115). In ähnlicher Perspektive fassen Gumperz/Kaltman/O'Connor 1984 Aktivitäten wie 'Erzählen' und 'Argumentieren', neben z.B. 'Beschreiben', 'Erklären', 'Hervorheben', 'Rechtfertigen', 'Ausdrücken von Gefühlen' als kommunikative Aufgaben ("communicative tasks") auf, die von Interaktionspartnern signalisiert und interpretiert werden: "These are not time-bound sequences (...). They are interpretive judgements. The categories (...) shade into one another, and in addition, one can do more of these things at once. The point is that such categories map out some important distinctions of communicative intentions" (ebd.: 9f). Bei der Signalisierung und Interpretation dieser Aktivitätstypen und den damit verbundenen kommunikativen Intentionen spielen prosodische Kontextualisierungshinweise eine wichtige Rolle. Ähnlich argumentiert Knowles (1984: 227), wenn er sagt: "intonation is part of rhetoric, or the strategies employed to get that message across" (vgl. auch Tench 1988). Die Rolle von Intonationskonturen bei der thematischen und rezipientenspezifischen Organisation eines Gesprächsausschnitts analysieren auch Gibbon/Selting 1983. Sie zeigen, daß und wie Gesprächsteilnehmer durch die von ihnen verwendeten Konturen signalisieren, welchem von verschiedenen eröffneten thematischen "Räumen" sie ihren jeweiligen Beitrag als kohäsiv zuordnen. Zu den unterschiedlichen thematischen "Räumen" gehören im analysierten Beispiel nämlich je unterschiedliche Intonationskonturen, mit denen die Interaktionspartner genau diesen "Raum" signalisieren, an ihn wieder kohäsiv anknüpfen und ihn auch von den anderen "Räumen" absetzen.
315 Auch bei Erzählungen und Argumentationen zeigt sich, daß Prosodie und Intonation nicht als von diesen Aktivitätstypen (oder Textsorten) abhängiges System beschrieben werden kann. Vielmehr verwenden Interaktionspartner auch bei der Konstitution dieser Aktivitätstypen die Intonation als eigenständiges Signalisierungssystem in Kookkurrenz mit den für den jeweiligen Aktivitätstyp konstitutiven textuell-diskursiven, lexikalischen, syntaktischen u.a. Mitteln, um den Stil, die Art und Weise der Durchführung dieser Aktivität, zu signalisieren. Intonationskonturen werden als Mittel zur Signalisierung und Herstellung von Stilen und damit kontextualisierten Formen interaktiver Reziprozität in einem Kontinuum zwischen entgegengesetzten Polen prototypischer Stile und prototypischer Formen interaktiver Reziprozität genutzt. In meinem Korpus kontextualisieren die Interaktionspartner in einigen Alltagserzählungen mithilfe abwechslungsreicher Konturen mit unterschiedlichen Tonhöhenbewegungen eine 'kooperative unterhaltende Erzählung'. Diese Gestaltung der konversationellen Erzählung mit abwechslungsreichen Konturen kontrastiert mit der Gestaltung von Argumentationen mit Konturen mit (fast) nur fallenden Tonhöhenbewegungen, mit denen diese als 'antagonistische Argumentationen' kontextualisiert werden. 'Kooperative Erzählungen' und 'antagonistische Argumentationen' scheinen die beiden Pole eines Kontinuums zu sein, bei denen die genannten prototypischen Intonationskonturen zur Signalisierung einer kooperativen versus einer antagonistischen Reziprozitätsgrundlage, des Stils der Interaktion, in Kookkurrenz mit den lexikalischen u.a. für die Aktivitätstypen Erzählen und Argumentieren konstitutiven Strukturen verwendet werden, um diese prototypischen Stile für die betreffende Aktivität nahezulegen. Die prototypischen Stile können jedoch auch in andere Aktivitätstypen "übertragen" werden, wenn etwa in einer Argumentation die Teilnehmer ähnliche Konturen verwenden wie in Erzählungen. Dann legt der Stil die mit seinem Prototyp verbundenen Inteipretationsschemata und Assoziationen für die Interpretation der gegebenen Aktivität nahe. Auf diese Weise können z.B. "funktionale" Erzählungen (Gülich 1980) in einer antagonistischen Argumentation oder aber kooperative Argumentationen kontextualisiert werden, in denen die prototypisch kookkurrierenden Zusammenhänge zwischen Text und Prosodie gegeneinanderlaufend eingesetzt werden. Genau diese "Übertragbarkeit" zeigt freilich, daß diese Intonationskonturen aktiv als autonome Signalisierungsmittel verwendet werden. Es ergibt sich folgendes Bild der Zuordnung von Kontur-konstituierenden lokalen Tonhöhenbewegungen, Aktivitätstypen und möglichen Formen interaktiver Reziprozität als prototypischen Polen eines Kontinuums. Aktivitätstypen
ERZÄHLEN
M ö g l i c h e F o r m interaktiver Reziprozität
< KOOPERATIV
lokale T o n h ö h e n bewegungen
(abwechslungsreiche Konturen)
ARGUMENTIEREN > ANTAGONISTISCH
(vorwiegend n u r fallende Akzente)
In Kapitel 2.2.2.4. wurde gezeigt, wie Sequenzen prominenter lokaler Tonhöhenbewegungen auf akzentuierten Silben - z.B. / + \ , / + \ , \ + \ + \ , / + / , / + -, u.v.a.m., oder auch eher auffälligere Verwendungen von fallend-steigenden Akzentbewegungen V mit einer prominenten
316 fallenden Tonhöhenbewegung auf einer akzentuierten und einer weniger prominenten steigenden Tonhöhenbewegung auf unakzentuierten letzten Elementen einer Einheit - in aufeinanderfolgenden Einheiten wiederholt oder wiederaufgenommen, umgedreht oder variiert werden können, um damit kohäsive Beziehungen zwischen Einheiten herzustellen. Es wurde argumentiert, daß die Art der intonatorischen Anknüpfung von Folgeeinheiten an Vorgängereinheiten nicht zufällig, sondern als Kontextualisierungsmittel verwendet wird. Sie leisten oft eine Kontextualisierung und Unterstützung der diskurssemantischen Entwicklung. Sequenzen lokaler Tonhöhenbewegungen werden jedoch auch für die Konstitution der Reziprozitätsgrundlage der Kommunikation bei der Organisation von Erzählungen und Argumentationen gebraucht. Allgemein werden Konturen mit fallenden ynd steigenden (und ggf. anderen) lokalen Tonhöhenbewegungen offenbar zur Kontextualisierung einer kooperativen Reziprozitätsgrundlage der Interaktion verwendet; prototypisch stehen dafür die Konturen unterhaltender Alltagserzählungen. Konturen mit nur fallenden lokalen Tonhöhenbewegungen werden hingegen verwendet zur Kontextualisierung einer eher antagonistischen Reziprozitätsgrundlage der Kommunikation. Die Herstellung und Abfolge je spezifischer Intonationskonturen innerhalb von Erzählungen und Argumentationen wird dann weiterhin zur Signalisierung und Kontextualisierung unterschiedlicher Strukturteile bzw. Teilaktivitäten dieser Aktivitäten wie auch zur Aushandlung der lokalen Form interaktiver Reziprozität zwischen den Interaktionspartnem verwendet. So sind z.B. bei Argumentationen mit kooperativer Reziprozitätsgrundlage die Intonationskonturen ähnlich variationsreich wie bei kooperativen Erzählungen. In der aktuellen Konversation handeln Sprecherinnen und Sprecher jedoch grundsätzlich die Reziprozitätsgrundlage ihrer Interaktion von Aktivität zu Aktivität neu aus und verwenden dabei die Wahl der lokalen Tonhöhenbewegungen und die Konstitution von Intonationskonturen als subtiles Kontextualisierungsmittel, mit dem sie sich wechselseitig lokal den gerade relevanten Stand der interaktiven Reziprozität signalisieren. Mit der Art und der Richtung der Abfolge von veränderten Intonationskonturen läßt sich dann die interaktive Reziprozität verändern und aushandeln. Die Tatsache, daß die Interaktionspartner sich dabei auf vorherige Konturen beziehen, zeigt, daß sie diese Konturen als interaktiv relevante Phänomene behandeln. Zur Organisation und Konstitution der konversationeilen Erzählung gibt es eine Fülle von Arbeiten, die hier nicht referiert werden sollen (für einen Überblick vgl. Gülich/Quasthoff 1985). Mir geht es im folgenden vor allem um die Rolle und Leistung der Prosodie bei der Herstellung von Erzählungen und Argumentationen. Dabei schließe ich vor allem an Konversationsanalysen von konversationellen Erzählungen an, bei denen es um die Rekonstruktion der Produktion der konversationellen Erzählung als geordnete Strukturierungsleistung innerhalb von Interaktionsprozessen geht (vgl. v.a. Sacks 1971, 1986, Jefferson 1978, Kallmeyer/Schütze 1977, Gülich 1980, Quasthoff 1980, Kallmeyer 1981). Für die Analyse und Segmentierung der Teilaktivitäten der Erzählungen und Argumentationen empfiehlt sich z.T. der Rückgriff auf bereits etablierte Analyse- und Beschreibungskategorien. Ich greife für die Analyse von Erzählungen v.a. auf die Kategorien von Kallmeyer/Schütze 1977 zurück, deren wichtigste Begriffe ich nunfolgend kurz erläutere. Bei einigen Phänomenen scheint mir auch ein Rückgriff auf die rein oberflächenstrukturell orientierten Kategorien von Labov/Waletzky 1973 brauchbar, obwohl das zugrundeliegende stati-
317 sehe Gesamtmodell der Autoren insgesamt für die Analyse konversationeller Erzählungen sicherlich nicht ausreicht (vgl. auch Quasthoff 1980 für eine Analyse und Kritik dieses Ansatzes). Konstitutiv für die Durchführung einer konversationellen Erzählung ist laut Kallmeyer/Schütze 1977 und Kallmeyer 1981 eine Aufgabenkontur des Erzählens, bei der bestimmte kognitive Strukturen/Figuren "im Sinne von allgemeinen Inhaltselementen" und bestimmte, bei ihrer Darstellung relevante Gestaltungsprinzipien/Zugzwänge wirksam sind (für eine Kurzfassung, an der auch ich mich hier orientiere, siehe Kallmeyer 1981: 411f.). "Zu den kognitiven Strukturen gehören: - Ereignisträger; d.h. soziale Einheiten als Handlungs- und Geschichtenträger, die handelnd oder erleidend Ereignisse der Geschichte konstituieren und miteinander verknüpfen. - Ereigniskette; d.h. die Kette von Ereignissen in zeitlicher Folge, die final und/oder kausal miteinander verknüpft sind. - Situation; d.h. herausgehobene Elemente der Ereigniskette, die besonders detailliert und unter Berücksichtigung der Erlebnisträger dargestellt werden, und die in der Regel von besonderer Bedeutung für den Verlauf der Ereigniskette sind. - Thematische Geschichte; d.h. der Typ der Gesamtgeschichte, ihre Modalität (ernst, lustig usw.), ihr Themenpotential (zum Beispiel Sterbegeschichte), ihre Verlaufskurve, die Erlebnis- und Erfahrungsperspektive des Erzählers und die Bewertung im Sinne einer Moral" (Kallmeyer 1981: 411). Die Thematisierung und Darstellung dieser Elemente in zumindest rudimentärer Form konstituiert also eine konversationelle Erzählung.1 In den von mir untersuchten Erzählungen verwenden Erzählerinnen und Erzähler für unterschiedliche Aktivitätsteile unterschiedliche Intonationskonturen, um die Konstitution solcher Aktivitätsteile wie auch die Beziehung von Aktivitätsteilen zueinander zu kontextualisieren. Im Unterschied zur Erzählung, bei der ein einziger Sprecher extensives Rederecht für diese Aktivität erhält, werden konversationelle Argumentationen von wenigstens zwei Sprechern durchgeführt: Proponent und Opponent bearbeiten einen strittigen Punkt (Schütze 1978: 73). Eine Argumentation wird initiiert, wenn eine Behauptung o.ä. vom Rezipienten bestritten wird und im weiteren Gesprächsverlauf die Interaktionspartner die Rollen von Proponent und Opponent übernehmen und mit Bezug auf die Bearbeitung des strittigen Punktes unterschiedliche Positionen vertreten. Nach Kallmeyer/Schütze 1977 und Schütze 1978 werden mit der Initiierung einer Argumentation für beide Interaktionspartner v.a. die Zugzwänge des Begründens und Belegens bei der Darlegung und/oder Bekräftigung ihrer jeweiligen Argumente oder aber deren Zurücknahme wirksam. Für diese Aktivitäten steht den Interaktionspartnern abwechselnd das Rederecht bzw. die Redepflicht zu. Der strittige Punkt wird von Proponent und Opponent bearbeitet und entfaltet, bis das Schema wechselseitig beendet wird (Gestaltschließung) (vgl. auch Coulter 1990).2 1
2
Maßgeblich für den Konstitutionsprozeß der Erzählung wie auch für seine spezifische sprachliche Ausgestaltung und ggf. den Grad der Ausschmückung im Hinblick auf die Funktion der Erzählung im Interaktionsprozeß sind dann die Gestaltungsprinzipien/Zugzwänge "Detaillierung", "Gestaltschließung" und "Relevanzfestlegung und Kondensierung" mit ihren je weiteren untergeordneten Prinzipien (vgl. auch Gülich 1980). Auch das Thema Argumentation ist in Philosophie und Linguistik ausführlich behandelt worden und es liegen zahlreiche Arbeiten dazu vor, z.T. mit sehr unterschiedlicher Zielsetzung. Für einen Überblick siehe Völzing 1980.
318 Wenn es für die Initiierung einer Argumentation konstitutiv ist, einen strittigen Punkt zu etablieren, so kann dennoch die weitere Bearbeitung dieses strittigen Punktes in der Argumentation auf der Grundlage sowohl kooperativer wie auch antagonistischer Reziprozität erfolgen. Kooperatives Argumentieren scheint eher auf eine Minimisierung des Dissenspunktes und ggf. die Erzielung eines Kompromisses abzuzielen, wohingegen antagonistisches Argumentieren eher mit einer Hervorhebung und Betonung des Dissenspunktes und ggf. der Unvereinbarkeit der vertretenen Positionen verbunden ist (vgl. hierzu auch Klein 1981, Kotthoff 1989). Wenn sich Erzählungen und Argumentationen in der lokalen Rederechtverteilung für die konstitutiven Aktivitätsteile unterscheiden, so scheint dieser Unterschied keine Erklärung zu liefern für die Wahl unterschiedlicher Intonationskonturen. Denn auch wenn in Argumentationen die jeweiligen Turns ggf. kürzer sind als bei vielen Erzählungen, sind dennoch bei deren Gestaltung prinzipiell sowohl Konturen aus nur fallenden wie auch aus fallenden und steigenden und ggf. anderen Tonhöhenbewegungen möglich. Die Wahl der lokalen Tonhöhenbewegungen beim Argumentieren wird vielmehr für die Herstellung und ggf. lokale Veränderung der Reziprozitätsgrundlage der Kommunikation, des Stils bzw. der Art und Weise des Argumentierens, eingesetzt. Bei der Beschreibung der Struktur der Argumentationen in den folgenden Kapiteln reicht eine kursorische Begrifflichkeit aus: Für die vorliegende Analyse ist lediglich eine Segmentierung nach Argumenten und Gegenargumenten und ggf. Aktivitäten ihrer jeweiligen Stützung nötig. Eine solche einfache Segmentierung betrachtet nur die Oberfläche der Aktivitäten und besagt nichts über die Konstitutionsbedingungen und die feinen Details der konstituierten Aktivitäten. Eine solche Analyse würde hier zu weit führen. Ich werde zeigen, daß Interaktionspartnerinnen und -partner Intonationskonturen verwenden, um auch hier die Aktivität des Argumentierens selbst wie auch die Kooperationsbeziehung zwischen den Teilnehmern herzustellen und lokal auszuhandeln. Im folgenden werden fünf Beispielanalysen präsentiert, die jeweils unterschiedliche Aspekte illustrieren. In 4.1. werden die Erzählung Praktikum beim NDR und die Argumentation Die Betonung von Nachrichtensprechern gegenübergestellt, um die prototypischen Pole des Kontinuums, eine kooperative Erzählung und eine antagonistische Argumentation, zu illustrieren. In 4.2. folgt mit der Argumentation Uniwechsel ein Beispiel für eine weitere Argumentation. In 4.3. wird die Erzählung Gesangsunterricht als Beispiel einer komplexen Erzählung präsentiert, die in eine komplexe Argumentation eingebettet ist. Die Kurzerzählung Das schlechte Raucherinnengewissen in 4.4. steht als Beispiel für eine Kurzerzählung innerhalb einer komplexen Argumentation und Unterhaltung. Schließlich analysiere ich in 4.5. mit der Argumentation Morgendliche Rituale ein Beispiel für eine scherzhafte und lustige kooperative Argumentation, in der dann folglich die konstitutiven Konturen (ernsthafter) antagonistischer Argumentationen kaum noch konsistent vorkommen. Dieser Fall, in dem in der Argumentation eher die prototypischen Konturen von Erzählungen verwendet werden, zeigt, daß die Intonation unabhängig von der konstituierten Argumentation ist und eigenständig zur Herstellung der Kooperationsbeziehung zwischen den Interaktionspartnern beiträgt. Es wird sich zeigen, daß Intonation als ein Signalisierungsmittel verwendet wird, mit dem Interaktionspartner Interpretationsrahmen nahelegen, die die laufenden Aktivitäten in übergreifende Ori-
319 entìerungsrahmen einbetten, die so schwer beschreibbare Phänomene wie die "Atmosphäre" und das "Klima" der Interaktion ausmachen.
4.1.
Die Erzählung Praktikum beim NDR und die Argumentation Die Betonung von Nachrichtensprechern
In den folgenden beiden Gesprächsausschnitten Praktikum beim NDR und Die Betonung von Nachrichtensprechern werden die Konturen konstituiert, die offenbar prototypisch zur Signalisierung und Kontrastierung informeller kooperativer Erzählungen versus antagonistischer Argumentationen verwendet werden. Gesprächsteilnehmende sind zwei Studentinnen (N (= Nat) und I (= Ina)) und ein Student (R (= Ron)). Die beiden Ausschnitte folgen mit kurzem Abstand aufeinander. Im ersten Ausschnitt Praktikum beim NDR erzählt Ν von ihrem Praktikum und ihren Schwierigkeiten, Nachrichten zu sprechen wie ein professioneller Nachrichtensprecher. Im zweiten Ausschnitt greift R dann N's Behauptung, Nachrichtensprecher hätten alle ne GANZ bestimmte beTOnung drauf, an und behauptet, Nachrichtensprecher brächten IHRE art zu sprechen auch mit REIN. Dort entwickelt sich dann eine Argumentation um diese Frage. Der besseren Übersicht halber werden bei den folgenden Transkripten am rechten Rand die segmentierten Teilaktivitäten und die hierbei jeweils konstituierten Intonationskonturen vermerkt. Genau auf diese gehe ich in der anschließenden Analyse genauer ein. Da es mir bei dieser und den folgenden Analysen vor allem um die Verwendung der Intonation als stilistischem Gestaltungsmittel geht, das den Stil der jeweiligen Aktivität als 'kooperativ' bzw. 'antagonistisch' nahelegt, werde ich die Analyse der sequentiellen und diskursiven Strukturen, die die Aktivitäten des Erzählens und Argumentierens erst konstituieren und in Kookkurrenz mit denen die Intonation erst ihre Relevanz erlangt, kurz halten. Dies geschieht nicht aus konzeptionellen Gründen, sondern aus Platzgründen. Transkript (1): Praktikum beim NDR (Korpus 2; Laufnr. Uher 274ff.) 601 I:
ja V
..
man muS sich ersmal dran geWÖHp un dann H,F(T\
)
man SELber empfindet ja so wie man REdet von M(\ / r von der Höhe un von der LAUTsCärke als n o M A i L
\
606 I: L
Oberleitung
von
Argumentation zu Bel eg erζ Ahl ung ne= /) mhm \/
320 607 Ν: Γ =un wemman das dann HÖi re (\ /) mhm 608 I: BELEGERZAHLUNG 609 R: 610 Ν:
((rauspert sich)) ich hab das
611 N:
ich hab ah LETZtes jähr beim EN de er η PRAXtikum gemacht M(\ \ \ / )
612 N:
hier in OLdenburch (\
/
.
)
Ereignis träger und übergrel- M(\ \ V 1 fender Situations(\y) rahmenl
un dann: SOLLT ich da NACHrichtn vorlesp F(\ \ )
Ereignissituation
614 N:
undann
615 N:
= so wie du das inner schule
ErelgF(T\i/ \) niskette/ (\) Komplikation
613 N:
LIES du das OANZ normal VORF(t\ 1/ \)
T(/ \)
Situationsrahmen2
(\ \J )
Evaluatlon2
F(\ \) F ( / \)
- Sprecher das lesn=WAS du so im RAdio hôrs )F(/ \ ) mhm
Transkript (2): Die Betonung von Nachrichtensprechern (Korpus 2; Laufnr. Uher 323ff.) 654 N:
un ich hab dann ma HINterher nachdem das praktikum F [F ( /
655 N:
beENdet war . nochma so auf NACHrichten geachtet / \
656 N:
wie die gelesen werdn=und es stimmt tatSÂCH=
657 N:
man KANN es RAUShôrn F(\ \ )
658 N:
wie IiBUte da SPREchen ob das jetzt . . F(\ \
)
(\ )) auch so im PBWIsehn F(\ )
Beh. Ν
F(\
\) F(\) F(\ \ \ V >
659 N: r hier so TAgesschau oder SONSwas is ne . . \ \ /) 660 R: mhm L \/ 661 N: r die ham ne OANZ bestimmte beTOnung drauf .. F(î\ \ ) 662 I: mhm L
\/
Beh.N
F(î\ \)
321 663 Ν:
für eip SELber is eg wahrscheinlich M{ /
664 Ν:
norMAL wemmans hört \ )
665 N:
JETZ inzwischen achte ich da AD nich mehr drauf= T(/ \ )
666 N:
=aber wemman da QAMZ speziell drauf achtet M,F(T\ \ )
667 N:
Zwischenbemerk . Ν M(/ \) T(/ \)
Beh.N
M,F(T\
is es schon: . SSBB gekûnsselt T(\ ) < f>
\)
T(\)
((ca. 5 Sek. Pause)) 668 N:
aber da ACHtet man glaubich auch z: zu M,F(\
Na zu
chbemerkung Beh.Ν M,F(\ \)
((ca. 6 Sek. Pause)) 670 R:
-
HM: ((râuspert sich)) T(\)
geKflNstelt sagst du M(\ ) -
671 N:
hmm \/
672 R:
673 R: 674 N:
675 N:
also du MEINS das is nicht ah: .. F(\
Beh.N
H(\) H(\) F ( \ \)
SELber habe
)
676 R:
677 N:
Reformul i erimg Beh.Ν durch R F(\ \ \)
- so UMgangssprachlich wie WIR jetzt reden \ \ ) s NICH m* MEIne melodie is das so: H(\ ) - H(\ ) r die ICH F(\
Anknüpfung an Beh.Ν durch R M(\)-
hmhm \/ Γ ja NEE AUCHi M( \)M(/
679 R:
Korr.Ν
. a die ANdere wie ich habm \ ) ((atmet)) weist du ((ein)) < all >
*auch HACHrichtensprecher \ ) dim>
Gegenarg.R
430 I:
u n m a l S E H N w a s DANN k o m m t F(\ \ )
drum )
zuENde t- )
.
Nach je zwei solchen Einheiten steht eine Kontur F(\\), mit der jeweils Einheiten abgesetzt werden, die gegenüber der eigentlichen Begründung einen Wechsel in die metakommunikative Perspektive vornehmen. Wie bereits in Kapitel 2.2.2.4. argumentiert, sind solche Wiederholungen von Akzentsequenzen sicherlich kein Zufall, sondern sie werden als aktivitätsstrukturierende Signale verwendet. Nach einer anschließenden Frage-Antwort-Sequenz initiiert R in Zeile 438 eine Argumentation, indem er in Mißachtung von I's vorher explizierter Entscheidung nun seinerseits I rät, sie könne doch nach der Zwischenprüfung die Universität wechseln. Gegen dieses und weitere für einen Studienortwechsel angeführte Argumente des R bringt I dann ihre Gegenargumente gegen ihren Studienortwechsel vor, die R wiederum überprüft und z.T. als nur eingeschränkt zutreffende Argumente zurückweist. In dieser Argumentation über den strittigen Punkt, ob I prinzipiell die Uni wechseln könnte oder nicht, verwendet R durchwegs nur fallende Akzente, so z.B. bei der Formulierung seiner Argumente in 438-439, 450-455 und 461-464. Diese fallenden Akzente werden nur in der Einheit in 438f mit M(\\ 1\\) durch eine lokal größere Bandbreite einer Akzenttonhöhenbewegung variiert; in 462 verwendet R auch einen von der Lautstärke her stärkeren Akzent. Andere als fallende lokale Tonhöhenbewegungen verwendet R in dieser Argumentation gar nicht. Zum einen führt er damit auch prosodisch kohäsiv seine Argumente weiter; andererseits ist jedoch seine ausschließliche Verwendung nur fallender Tonhöhenbewegungen dabei auffällig. I's Konturen sehen demgegenüber ganz anders aus: Nachdem sie jeweils an R kohäsiv angeknüpft hat, verwendet sie alle verfugbaren Akzenttypen und konstituiert damit unterschiedliche und variationsreichere Konturen, nimmt Akzentsequenzen kohäsiv wieder auf und stellt damit Beziehungen zwischen ihren Einheiten her. In ihrem Gegenargument in Zeile 440-447 nimmt I nach dem Turnübernahmesignal JAA mit M(S/) zunächst mit fallenden Akzenten R's Konturen kohäsiv wieder auf, geht dann aber in 443-447 zu Konturen mit letzten fallend-steigenden Akzenttonhöhenbewegungen über. Sie
331 argumentiert, daß sie in Niedersachsen bleiben möchte, um nicht Gefahr zu laufen, später als Referendarin in einem anderen Bundesland arbeiten zu müssen. Dabei verwendet sie vielleicht als Reaktion auf R's Argument ebenfalls viele prominente fallende Tonhöhenbewegungen auf akzentuierten Silben, beendet aber fast jede Einheit auch mit einer weniger prominenten steigenden Tonhöhenbewegung auf einer unakzentuierten Silbe. Besonders auffällig sind dabei die Einheitenenden in den Zeilen 444 und 445: 443 Is
ERSmal m: würd ich dann irgndwo HINkommn:: M(\
\
444 I:
woMÖGIich noch in ein anderes BUNdesla:nd \ \ / )
445 I:
und dann
da
MÖCHT ich nich BLEI:bm . M(\
Die letzten fallend-steigenden Tonhöhenbewegungen der Einheit kontextualisieren offenbar eine jeweils kohäsive Anknüpfung der Einheit an die vorherige. Die Einheiten sind dabei unterschiedlich lang. Mit kohäsionsherstellender Weiterverwendung dieser Tonhöhenbewegungen wird auch I's Nachfrage IS dock so ne mit M(V) in 449 angeschlossen. In Zeile 451, 453 und dann v.a. 457-458 stützt sie angesichts von R's einschränkendem Argument in Zeile 450-455, daß Referendare nicht notwendig im Bundesland ihres Studienortes eingestellt weiden, ihr eigenes Gegenargument gegen einen Studienortwechsel mit weiteren Begründungen für ihre Entscheidung, die Universität nicht wechseln zu wollen. Diese werden wiederum mit Akzentsequenzen aus fallenden und steigenden Akzenten formuliert. Nach R's weiterer Argumentation in Zeile 461-464, sie könne doch eine andere Universität in Niedersachsen wählen, mit der er I's vorherige Begründung ignoriert, knüpft I in 465466 wieder zuerst bei der generellen Formulierung ihres Gegenarguments bzw. ihrer eigenen Zurückweisung von R's Argument kohäsiv an R's Konturen an. Hierbei nimmt sie zunächst auch seine fallenden Akzente wieder auf. Bei der dann folgenden Stützung ihrer Gegenargumente in 467-471 geht sie aber zu anderen Akzentsequenzen über und stellt die einzelnen Bestandteile der Stützung ihrer Gegenargumente mit der Wiederholung von Tonhöhenbewegungen in der Einheitenfolge F(\/) M(/) NM(/) F(\/) als weitergeführte und kohäsiv zusammengehörige Aktivitäten dar. Während also R seine Argumente für einen Studienortwechsel nur mit fallenden Akzenten formuliert, nimmt I zwar diese fallenden Akzente auf bzw. setzt ihre eigenen Gegenargumente gegen einen Studienortwechsel zuerst mit vorwiegend fallenden Akzenten dagegen, verwendet aber dennoch danach bei der Formulierung der Stützungen ihrer Gegenargumente ganz unterschiedliche Konturen. Ebenso wie R, aber aufgrund der unterschiedlichen Tonhöhenbewegungen deutlicher erkennbar, setzt I vor allem die Tonhöhenverläufe am Ende der Einheiten zur Signalisierung der internen Struktur und der kohäsiven Beziehungen zwischen ihren Einheiten ein. Die Verwendung variationsreicher Tonhöhenbewegungen stellt auch hier Ähnlichkeiten her zum "kooperativen Erzählstil" und I kontextualisiert damit offenbar gegenüber R's Formulierung seiner Argumente jeweils Übergänge zu einem kooperativeren Argumentations· und Interaktionsstil.
332 4.3. Die Erzählung Gesangsunterricht Der folgende lange Gesprächsausschnitt ist demselben informellen Gespräch zwischen den drei Studierenden Nat, Ida und Ron entnommen wie die beiden letzten. Die drei haben über R's Musikstudium gesprochen und reden nun über R's Studienschwerpunkt Gesang. Transkript1Gesangsausbildung"3 (Korpus 2; Laufnr. Uher 160-236) 328 N:
und geSANO M(/ )
329 N:
HABT Ihr denn hier irgndwie son: son UHrer F(\ ... /
330 N:
oder wie LÄUFT das \ )
331 R:
jaa=es GIBT ahm: \ F(\
332 R:
((rauspert sich))
Frage-Antwort Sequenzen Frage: F(\ / \)
für JEDJJ \ )
Antwort:
für jedes FACH M( / )
\F(\ \) M(/) T ( T \ \ \) F ( / \ \ \)
..
für jedp: ah für jedes insCruMBNT und ebm auch für T( ... î\
334 R: r- für . . den geSANGSbereich ahm
. FACHlehrer dann )
335 N¡
mhm \/
336 R:
und:
337 R:
ich WEIß gar nich die genXUe zahl
338 R:
also beSTIMMT
ah im: . bereich geSANG ham wir F(/
\
SUBH
.. FACHlehrer dafür
\
\
)
339 N:
mhm \/
340 N:
und wie LEHNT man das mufi man da VORsingn oder was M(/ M(\ ) )
341 R:
((lacht))
342 R:
ich KANN dir das jetzt nur von: F(\
343 R:
gesangslehrerin sagn=ich HAB gleich am anfang ) F(\ < all >
JAA: F[H(\ )
Frage:
M(/)M(\)
Antwort:
F[ H(\) F(\ Λ ) F(\ \ \)
hm
NSIner / \ .
M(\)l
Ich danke Friederike Jin und Christel Gebel für unabhängige Transkriptionen des hier präsentierten Gesprächsausschnitts. - Ein Teil des hier wiedergegebenen Gesprächsausschnitts wurde bereits in Setting 1992b analysiert.
333 die RICHtige erWisCHT so für mich \ \ )
344 R: r âh
hhn
345 Ν:
\/
kein verOLIICB M( \ )]
346 R:
ich hab jetz nich < ali >
347 R:
also WIR ham immer angefangen so mit ÜBUNgp Ft/ \ )
..
348 R:
irgendwelche sachen so T,F( ... )
349 R:
also sie hat mir was VORgespielt aufm klaVIER: T< \ \
350 R:
daß ichs NACHs inge so \ )
351 R:
un:d
352 R:
was ich BESser machen und ANders machen könnte T( \ \ )
Fl/ \) T,F(... I T(\ \ \) M(\) T(\ \) M( / V )
dann SAGT sie mir da sachen zu: M(\ )
mhm \/
353 N:
354 R:
Beschreibung;
also es IS schon: auch ne TBCHnik die M(/ \
355 R: r man lernen kann 356 N:
ne /) mhm \/
357 N: (- das ja: DAS glaub ich= T(\ )
358 I: jaa=
Bestätigung W.-
TIN)
Λ 359 R: 360 R:
=NICHT nur M
386 R:
während der SCHULzeit angefangp
((râuspert sich))
(2.1)
. m: allerdings auch noch
. ah:
(0.9)
\
387 R:
V)
((lacht)) jaa
in einer
BAUD
/
spieln=da ham wa so
ZU
)
(0.8)
wollte AUCH erst keiner SINgp F(\ / )
2. Station: •Komplikation· F(\ \ /) F(V) F(\ /) M( / ) M[ M(/ \ S /) F(/ \)1
335 390 R: r ((lacht)I 391 Ii
In der BÂND
M(/ )
((lacht))
mhm
392 N:
{(lacht))
393 R:
JEder wollte sch âh sch SCHLACHzeuch spieln M[M(/ \
394 R:
giTARre spieln und SOLche sachen \ / )
395 R: 396 N: 397 I¡
- aber SINgp wollte K(h)IXner=un dann F(/ \ )] < all > ((lacht)) ((lacht))
398 R:
((rauspert sich))
399 R:
MUSte sich da ma einer zu DURCHringnF[F(\ \ )
Ereignissituation/ Resultat: : Fl F(\ F(\ \M
400 R: f =HAB ich da ma ANgefangn damit F(\ \ )] < all > 401 Ii 402 R:
also n:atûrlich toTAiL ohne TBCHnik
S(\ \
403 R:
und ich hab noch AUPnahçi davon= M(\ )
ne /)
(1.1)
Bewertungl : S(\ V ) M( \ ) F(\ \ \) M(\\\)
=und das KLINGT zum TEIL . also WIRKlich F(\ \ \ )
406 I: 407 N:
OHoho ((lacht)) M(\ \ \) ((lacht)) ((lacht)) un DANN auch in einer F(\
stimmLAge so . TONhôhe / /
409 R:
wo das: für mich recht UNgünstich war nich= \ / )
410 R:
—So das man (0.8) âh da& ich mich
411 R:
überFORdert habe eigntlich damit auch dann ne F(\ /) mhm \/
412 I: 413 N: 414 R: 415 I:
416 N: 417 R: 418 I:
a das kanns du HKUte sagn ne M(\ /) - JA ja das weis man dann mcHher M(\ ) M(\ )
ja (?ne?) \ /
((lacht)) ((lacht)) ((lacht))
Bewertung2 : F(\ / / V ) F(V>
Perspektivenwechsel weg v. d. Erzählung
336
a is wahrscheinlich wiTzich wemman
M(\
F 420 Ν:
so ALte ADFnahfi hört ne \ / ) /
421 R:
JOa M(\ /)
422 N: 423 I:
(1.0)
(2.1)
((lacht leise)) ((zieht leise Nase hoch))
424 R:
jaa also für MICH sind se eigntlich immer \ F(\ < all >
425 R:
noch recht : leBKNdich so
426 R:
also es is noch nich SOi weit zurück= T( ... \ )
\
)
427 R: r =(?nur?) ich DENK immer in zwanzich JAHrn is noch M(\ \ 428 N: mhm L
\/
429 R:
interesSAMter \ )
((lacht)) ((lacht)) (0.9) JA . STIMMT (1.7) F(\ )
430 N: 431 I:
432 R:
JA un dann hab ich: H(\)
433 R:
Ohm:
434 R:
=un hab < all >
435 R:
später auch die Ultung ûberNOMmen < all> M(/ )]
436 R:
undh:
=auch:
(0.8)
Ohm: weitergemacht auch (1.2) M(/ ) -
bin ich an eip OOSpelchor RANgekomji= F[H(/ )
(0.6)
dann DAi M(/
(0.4)
MITgesungen )
(0.7)
(1.9)
das war noch viel MSHR auf geSAMO aufgebaute F(\ \ )
. ganz AMders dann nech M(\ / )
Fortsetzung der Erzähl ung 3. Station: H(\) M(/) F[ H(/ -) M ( / -) M( / -)]
F(\ \)
(V) (/)
(0.7)
als bei der musik die ich VORher gemacht hab M( / )
(3.3) 439 R:
JOA un:dann: ah: durch das glTAKrespieln M(\ )M(\ )-
440 R:
âhm hab ich mich selbst beOLHItet und so F(\
M(\) M(\) F ( \ /V) T(\ \ v i T( ... /)
337 442 R:
=ich hab (0.5) T< < ail »
443 R:
sachen Ausprobiert NkCHgespielt und SOwas nech = \ \ \ / ) all> mhm/
435 R:
später auch die LEItung überNOMmen < all> M(/ )]
436 R:
undh:
437 R:
=auch:
438 R:
als bei der musik die ich VORher gemacht hab M(/ )
(0.8)
ôhm: WBItergemacht auch (1.2) M(/ ) -
bin ich an ein GOSpelchor RANgekomirt= F[H{/ )
(0.6)
dann DAi M(/
(0.4)
MITgesungen )
(0.7)
(1.9)
das war noch viel MEHR auf geSANG aufgebaut= F(\ \ )
.
ganz AHders dann nech M(\ / )
(0.7)
Anders als in der Entgegnung auf N's vorherige Bemerkungen verwendet R hier in Zeile 432 sofort wieder einen steigenden Akzenttypen in H(\) M(/). Danach wird durch die dreimalige Wiederholung der Akzentsequenz (/ -) innerhalb eines Paratones die Darstellung des Situationsrahmens der dritten Station als kohäsive Einheit konstituiert: F[ H(/ -) M(/ -) M(/ -)]. Die zweimalige Wiederholung dieser eher unüblichen Akzentsequenz zeigt hier wiederum sehr deutlich, daß diese Abfolgen von Tonhöhenbewegungen keineswegs zufällig, sondern aktiv als Signalisierungsmittel verwendet werden. Unmittelbar hiernach steht die zusammenfassende Situationsbeschreibung undh: das war noch viel MEHR auf geSANG aufgebaut=auch:. ganz ANders dann nech als bei der musik die ich VORher gemacht hab (436ff) mit zunächst fallenden und dann auch wieder steigenden Tonhöhenbewegungen: F(\\) M(V) M(/). Bei der dann folgenden Darstellung von konkreteren Einzelaktivitäten innerhalb dieser Station stellt R Konturen mit zunächst v.a. wieder fallenden und dann auch steigenden Tonhöhenbewegungen her: M(\) M(\) F(\/V) T(\\V) T(... /): 439 R:
JOA un:dann: äh: durch das giTARrespieln M(\ )M(\ ) -
(0.6)
440 R:
ahm hab ich mich selbst beGLEItet und so F(\
442 R:
=ich hab (0.5) T( < all >
345 443 R:
444 N:
r sachen Ausprobiert NACHgespielt und SOwas nech= \ \ \ / )
mhm \/
445 R:
=das: T(
(0.5)
was man: so gern an musik HÖRT ... / )
(1.3)
An die letzten steigenden Tonhöhenbewegungen dieser Erzählung der dritten Station scheint auch unmittelbar die Einleitung zur Erzählung der vierten Station in Zeile 446f intonatorisch anzuknüpfen: S(/ /). Und auch hierauf folgt wieder eine zusammenfassende Situationsbeschreibung mit fallenden prominenten und einer letzten weniger prominenten steigenden Tonhöhenbewegung auf einem Anhängsel: F(\V): 446 R:
und als ich dann hier ANgefangn hab mit S