171 69 51MB
German Pages 258 [260] Year 1990
Linguistische Arbeiten
248
Herausgegeben von Hans Altmann, Peter Blumenthal, Herbert E. Brekle, Hans Jürgen Heringer, Heinz Vater und Richard Wiese
Friederike Jin
Intonation in Gesprächen Ein Beitrag zur Methode der kontrastiven Intonationsanalyse am Beispiel des Deutschen und Französischen
Max Niemeyer Verlag Tübingen 1990
CIP-Titelaufnahme der Deutschen Bibliothek Jin, Friederike : Intonation in Gesprächen : ein Beitrag zur Methode der kontrastiven Intonationsanalyse am Beispiel des Deutschen und Französischen / Friederike Jin. - Tübingen : Niemeyer, 1990 (Linguistische Arbeiten ; 248) NE:GT ISBN 3-484-30248-8
ISSN 0344-6727
© Max Niemeyer Verlag GmbH & Co. KG, Tübingen 1990 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Printed in Germany. Druck: Weihert-Druck GmbH, Darmstadt
Inhalt
1. KONTRASTIVE INTONATIONSFORSCHUNG
l
1.1.
Prosodische Universalien
l
1.2.
Unterschiede und Gemeinsamkeiten zwischen Deutsch und Französisch
3
1.3.
Einheiten der Intonationsbeschreibung
7
1.4.
Bedeutung von Intonation
9
1.4.1. 1.4.2. 1.5.
Die metalokutive Hypothese Kontextualisierung
10 12
Analyseebenen und Überblick über die Arbeit
13
2. INTONATIONSBESCHREIBUNGSSYSTEME (Methode 1) 2.1.
2.2.
17
Die französische Intonationsforschung
18
2.1.1. 2.1.2. 2.1.3.
19 24 26
Der interne Akzent Der externe Akzent Beschreibung von Intonation in Diskursen
Die deutsche Intonationsforschung
28
2.2.1.
Ansätze, die längere Tonhöhenverläufe beschreiben 2.2.1.1. v. Essen (1964) 2.2.1.2. Die tonetische Transkription 2.2.1.3. Experimental-phonetische Beschreibung
28 28 31 32
2.2.2.
Zwei-Ebenen-Modelle
33
2.2.3.
integrierte Ansätze: Akzent + Tonhöhenverlauf
38
2.2.4.
Zusammenfassung: phonologische Kategorien des Deutschen
40
VI
Inhalt
2.3.
Vergleich der deutschen und französischen Beschreibungssysteme
41
2.3.1. 2.3.2. 2.3.3.
41 42 43
Anzahl der Tonstufen Die Kategorie Akzent Intonationssyntax
3.
MATERIALBESCHREIBUNG
45
4.
INTERSUBJEKTIVE ÜBEREINSTIMMUNG BEI DER BEURTEILUNG VON INTONATIONSKATEGORIEN (Methode 2)
53
4.1.
Kategoriale Wahrnehmung
54
4.2.
Methode und Versuchsbedingungen
56
4.3.
Beurteilung nicht-muttersprachlicher Intonation
58
4.3.1. 4.3.2.
58 59
4.4.
Beurteilung der deutschen Intonationskategorien
68
4.4.1. 4.4.2. 4.4.3.
Einheiten Akzentstellen Akzenttypen
68 73 74
4.4.3.1. 4.4.3.2.
74 78
4.4.4. 4.5.
Problemstellung und Versuchsdurchführung Auswertung und Diskussion
Unterscheidung von 5 Akzenttypen im Deutschen Unterscheidung von 3 Akzenttypen im Deutschen
Zusammenfassung der deutschen intonatorischen Kategorien
79
Beurteilung der französischen Intonationskategorien
82
4.5.1. 4.5.2.
Einheiten Der interne Akzent
84 84
4.5.2.1. 4.5.2.2.
88 88
Steigung vs. Fall Intonationskategorien des internen Akzents
4.5.3. 4.5.4. 4.6.
VII
Der externe Akzent Zusammenfassung der französischen Kategorien
91 94
Vergleich Deutsch—Französisch 4.6.1. 4.6.2. 4.6.3.
5.
Inhalt
(Prosodische) Einheiten Akzente Tonhöhenniveaus und Tonhöhenbewegungen
96 96 98 100
AKUSTISCHE ANALYSE VON STEIGUNGEN (Methode 3)
103
5.1.
Die Arbeitsmittel
103
5.2.
Das Material
106
5.3.
Methode
106
5.4
Analyse der phonetischen Parameter
112
5.4.1. 5.4.2. 5.4.3.
112 113 115
5.5.
Vergleich der zeitlichen Dauer Vergleich der Grundfrequenz — Steigungen Vergleich der Intensität
Zusammenfassung
119
6. FUNKTIONEN VON INTONATIONSZEICHEN IN GESPRÄCHEN (Methode 4) 121 6.1.
Diskursstruktur
121
6.1.1. 6.1.2.
122 123 123 124 127 131
6.1.3. 6.2.
Informationsstruktur Handlungsstruktur 6.1.2.1. Methodische Vorbemerkungen 6.1.2.2. Interaktive Einheiten 6.1.2.3. Handlungsstrukturen von Einzelhandlungen Eine exemplarische Analyse
Intonationsstrukturen
134
VIII
Inhalt
6.3.
6.4.
7.
Funktionen von Intonationszeichen
138
6.3.1. 6.3.2.
139 150
Die Erklärungskontur im Französischen Die Erklärungskontur im Deutschen
Zusammenfassung und Vergleich der deutschen und französischen Erklärungskontur
161
ZUSAMMENFASSUNG UND AUSBLICK AUF EIN MODELL ZUR ANALYSE INTONATORISCHER FEHLER
165
7.1.
Untersuchungsergebnisse
166
7.2.
Untersuchungsmethoden
171
7.3.
Ausblick auf ein Modell zur Analyse intonatorischer Fehler
172
LITERATURLISTE ANHANG:
1. auditive Transkriptionen des deutschen Korpus 2. auditive Transkriptionen des französischen Korpus
177 l 33
Kontrastive Intonationsforschung
1. KONTRASTIVE INTONATIONSFORSCHUNG
Ziel der vorliegenden Arbeit ist ein doppeltes. Einerseits geht es darum, Unterschiede zwischen der französischen und der deutschen Intonation in Gesprächen herauszuarbeiten. Zum zweiten sollen auch die Methoden der kontrastiven Intonationsanalyse selber Gegenstand der Arbeit sein. Die zentrale Frage der Arbeit lautet: Mit Hilfe welcher linguistischer Methoden kann man die Intonationssysteme zweier Sprache miteinander vergleichen und intonatorische Fehler von Nicht-Muttersprachlern analysieren? Besondere Aufmerksamkeit wird dabei der Auswahl des Untersuchungsmaterials geschenkt. Während in vielen Intonationsbeschreibungen ad hoc erfundene, gelesene Sätze den Korpus bilden, wird in dieser Arbeit die Intonation des Deutschen und Französischen in Texten spontan gesprochener Sprache untersucht und verglichen werden. Der Textkorpus besteht aus dialogischen Erklärungstexten, in denen zwei Gesprächspartner sich über den Aufbau von Bauklötzchen-Gebilden verständigen. In diesen Texten werden die intonatorischen Einheiten des Akzents und des Grenztons unter verschiedenen Aspekten beschrieben und zwischen den beiden Sprachen verglichen. In den folgenden Abschnitten dieses einleitenden Kapitels sollen grundlegende Voraussetzungen für diese Arbeit zusammengestellt werden. Es wird zunächst der Forschungsstand in den Bereichen der intonatorischen Universalienforschung und der kontrastiven, deutsch-französischen Intonationsforschung dargestellt werden, um den Ausgangspunkt der Arbeit zu skizzieren. Anschließend werden einige Grundprobleme der Intonationsforschung erörtert, die hier gewählte Position begründet und ein Überblick über den Aufbau der Arbeit gegeben.
1.1. Prosodische Uni versauen Sucht man nach Unterschieden zwischen zwei Sprachsystemen, so kann ein Blick auf sprachliche Universalien helfen, den Untersuchungsbereich genauer zu bestimmen. Viele Intonationsforscher gehen davon aus, daß ein Kernbereich der Intonation durch die menschlichen Artikulations- und Perzeptionsorgane determiniert ist. Das folgende Zitat von Bolinger verdeutlicht diese Position: "we can think of an intonational core, an innate pattern ... from which speakers and cultures may depart, but to which some force is always pushing them back." (1978, S. 510)
Hier sollen kurz einige Ergebnisse kontrastiver Untersuchungen und ihre Annahmen im Hinblick auf intonatorische Universalien dargestellt werden. Die umfangreichste Untersuchung stammt von Bolinger (1978). Er trägt Untersuchungsergebnisse zu insgesamt über 50 Sprachen, Tonsprachen und Intonationssprachen, zusammen und vergleicht die intonatorischen Kategorien des Akzents und der terminalen Tonhö-
2
Kontrastive Intonationsforschung
henbewegung. Im Bereich des Akzents nimmt er an, daß die kontrastive und die attitudinale Funktion (climax., anticlimax, emotional backshiff) universal sind. In einer allgemeinen Form bedeutet dies, daß ein Zusammenhang zwischen akzentuiert/nicht-akzentuiert und dem Informationswert eines Äußerungsteils angenommen wird. Dies wird gestützt durch eine Untersuchung von Bearth (1980), der in einer Reihe von westafrikanischen Tonsprachen ebenfalls einen Zusammenhang zwischen Tonhöhe und Informationswert aufzeigt. Auch im Bereich der terminalen Kontur können Uni Versalien angenommen werden. Cruttenden (1986) gibt einen Überblick über mögliche Uni Versalien. "Falling Neutral Statement Sentence final Neutral question wordquestion Command
Rising Implicational or tentative Statement yes/no question Sentence non-final Sympathetic question word question Request" (Cruttenden 1986: 168)
Bolinger (1978) findet bei 38 von 57 Intonationssprachen eine fallende Tonhöhenbewegung am Ende von Deklarative (entweder als terminaler Fall oder als ein über die Äußerung verteiltes Abfallen ('downdrift'). Nur in einem Fall (Yokuts) wird eine Steigung am Ende von Deklarative berichtet, während bei den restlichen 18 keine eindeutigen Ergebnisse vorliegen. Von den 16 Tonsprachen gibt es sogar in 13 Fällen Ergebnisse über fallende Tonhöhenbewegung in Deklarative, bei den restlichen 3 Fällen liegen keine Ergebnisse zu diesem Phänomen vor. Auf der anderen Seite haben von 41 Sprachen (Tonsprachen + Intonationssprache) 37 Sprachen entweder ein terminates Steigen oder eine hohe Silbe am Ende von Entscheidungsfragen. In zwei Fällen gibt es keine intonatorische Fragemarkierung, bei den restlichen beiden Fällen fehlen eindeutige Ergebnisse. Diese in den meisten Sprachen vorhandene Unterscheidung zwischen steigender und fallender Tonhöhe wird von verschiedenen Autoren aufgegriffen. Cruttenden (1981) nimmt sie als grundlegende Unterscheidung für die Bedeutungszuweisung zu intonatorischen Formen. Er nimmt allerdings keine konkrete Bedeutungen an (wie z.B. Frageintonation, Intonation eines Deklarativsatzes), sondern abstrakte Bedeutungen: steigend bzw. hoch als Offen' (open meaning) und fallend bzw. tief als 'geschlossen' (closed meaning). Vaissiere (1983) nimmt neben der terminalen Kontur und der globalen Tonhöhebewegung zwei weitere Tonhöhen- bzw. FO-Phänomene als intonatorische Uni versauen an: den Neuanfang der Basislinie (resetting of the baseline), der als Grenzsignal interpretiert wird und die Bandbreite der Tonhöhenbewegungen, die die Tendenz hat, gegen Ende schmaler zu werden. Außerdem weist sie auf universelle Pausen- und Längephänomene hin. Für diese intonatorischen Universalien, Tonhöhenbewegung zum Signalisieren des Informationswerts und des Äußerungstyps, sind ethologische und physiologische Erklärungen herangezogen worden. Ohala (1983) nimmt ein 'Faulheitsprinzip' (laziness principle) an: ein Steigen bzw. ein hoher Ton ist anstrengender zu produzieren und beinhaltet deswegen mehr
Kontrastive Intonationsforschung
3
Informationsgehalt und Aufmerksamkeitsforderung als ein Fallen bzw. ein tiefer Ton. Man kann also annehmen, daß hoher vs. defer Ton, steigende vs. fallende Tonhöhenbewegung, große vs. kleine Tonhöhenbewegungen und Brüche in einer Tonhöhenkontur sowohl im Französischen als auch im Deutschen mit Informationswert und Gliederungsphänomenen in Verbindung gebracht werden können. Die Frage, die in dieser Arbeit untersucht werden soll, ist, wie diese sehr allgemeinen Phänomene im System der beiden Sprachen ausgeprägt sind.
1.2. Unterschiede und Gemeinsamkeiten zwischen Deutsch und Französisch In diesem Kapitel sollen bisherige Untersuchungsergebnisse zu Unterschieden und Gemeinsamkeiten in Form und Verwendung intonatorischer Mittel zwischen dem Deutschen und dem Französischen dargestellt werden. 1981 hatte Wunderli eine zusammenfassende Darstellung der vergleichenden Untersuchungen der deutschen und französischen Intonation gegeben. Er stellt fest, daß, außer im Bereich des Wortakzents, sowohl vergleichende Untersuchungen als auch Einzeluntersuchungen zu den beiden Sprachen fehlen. Inzwischen ist die Forschung im Bereich der Einzelsprachen fortgeführt worden, obwohl es im Deutschen auch heute keine Übereinstimmung über die Beschreibungskategorien gibt. Bei den vergleichenden deutsch-französischen Untersuchungen, die eine Beziehung zwischen den Beschreibungssystemen der beiden Sprachen herstellen, gibt es aber — meines Wissens — keine neuen Erkenntnisse. Ich werde deshalb zunächst Unterschiede und Gemeinsamkeiten zwischen dem deutschen und dem französischen prosodischen System, die als gesichert gelten dürfen, kurz darstellen. Für eine ausführliche Darstellung verweise ich auf die Untersuchungen von Delattre (1965a) und den Überblicksartikel von Wunderli (1981). Intonation ist sowohl im Deutschen als auch im Französischen eine Eigenschaft des Satzes bzw. einer aus einem oder mehreren Wörtern bestehender Äußerungseinheit. Dies unterscheidet beide Sprachen von Tonsprachen wie z.B. dem Chinesischen, in dem Intonation eine Eigenschaft der Silbe ist und lexikalische Bedeutung trägt, und auch von Sprachen wie z.B. dem Schwedischen, wo Intonation eine Eigenschaft des Wortes ist.1 Größere Unterschiede allerdings ergeben sich, wenn man rhythmische Eigenschaften und Akzentuierungsregeln miteinander vergleicht. Traditionell werden die Sprachen nach rhythmischen Gesichtspunkten eingeteilt in silbenzählende und akzentzählende Sprachen (Abercrombie 1967). In silbenzählenden Sprachen, zu denen das Französische gehört, wird der Rhythmus auf den Silben aufgebaut, d.h. der Abstand der Silben zueinander ist gleich. In den akzentzählenden Sprachen dagegen, zu denen das Deutsche gehört, ist der
l
Die Behauptung von Ehlich (1979), daß die deutschen Diskurspartikel 'mhm' anhand von lexikalischen Tönen unterschieden werden können, ist bereits durch die Argumentation in Wunderli (1981, S. 300) widerlegt worden und soll hier nicht noch einmal aufgegriffen werden.
Kontrastive Intonationsforschung
Abstand der Akzente zueinander gleich, der Rhythmus wird also auf den Akzenten aufgebaut. Diese Unterschiede spiegeln sich, worauf schon Abercrombie im Vergleich des Englischen und Französischen hinweist, auch in den literarischen Metriken der beiden Sprachen wider. Während im Französischen der silbenzählende Alexandriner vorherrscht, gibt es im Deutschen vornehmlich Verse, die auf dem rhythmischen Fuß ( = Akzent) aufgebaut sind. Inwieweit sich dieser rhythmische Unterschied allerdings in meßbaren Abständen von Silben oder Akzente explizieren läßt, ist sehr fraglich. Roach (1982) hat die von Abercrombie angegebenen Kriterien untersucht und konnte aufgrund seiner Meßergebnisse diesen Unterschied zwischen den Sprachen nicht stützen. "The results reported here give no support to the idea that one could assign a language to one of the two categories on the basis of measurements of time intervals in speech. Consequently one is obliged to conclude that the basis for the distinction is auditory and subjective — a language is syllable timed if it sounds syllable-timed." (S. 78)
Sicherlich spielen für den Eindruck des Rhythmus auch eine Reihe von segmentalen Faktoren eine Rolle. So gibt es z.B. im Deutschen eine deutliche Vokalreduktion in unakzentuierten Silben, d.h. die Vokale in unakzentuierten Silben werden in der Regel mehr zentralisiert, ähnlich dem Schwa, ausgesprochen, wohingegen im Französischen auch in unakzentuierten Silben die Vokalqualität erhalten bleibt. Alle diese Fragen im Zusammenhang mit Rhythmus müssen allerdings in ihrer Kontextabhängigkeit gesehen werden. So gibt es sowohl im Deutschen als auch im Französischen mehr oder weniger deutlich rhythmische Texte.
K»i I« III «I
S'Z 17.
m JU m oz| Syllable 4
Syllabi«!
Syll*W«
German
Gei· man
French
Frencn
Abbildung 1.1: Akzentposition in Wörtern und syntaktischen Einheiten im Deutschen und Französischen (aus: Delattre 1965a S.29/31)
Kontrastive Intonationsforschung
5
Unterschiede zwischen dem französischen und deutschen prosodischen System gibt es neben dem Bereich des Rhythmus vor allem im Bereich der Akzentuierung. Delattre (1965a) hat in zwei Corpora von 1500 Wörtern Französisch und 2400 Wörtern Deutsch die Akzentpositionen in Wörtern und syntaktischen Einheiten untersucht. Die Ergebnisse zeigten deutliche Unterschiede (vgl. Abbildung 1.1) Im Französischen ist sowohl auf Wortebene als auch auf der syntaktischen Ebene die Akzentposition ausschließlich auf der letzten Silbe, im Deutschen ist das Bild heterogener. Auf Wortebene gibt es eine deutliche Tendenz zur ersten und zweiten Silbe. Auf der syntaktischen Ebene ist die Streuung größer, eine deutlich bevorzugte Position läßt sich nicht feststellen. Für diese sehr unterschiedliche Verteilung können zwei Gründe zur Erklärung herangezogen werden. Dafür muß zunächst auf die Unterscheidung hingewiesen werden, die in der englischen Terminologie zwischen stress, accent und prominence gemacht wird: "stress:
Designated position (syllable in a lexical item; word in a syntactic phrase) assigned by lexical stress rules and nuclear stress rule. This notion of 'abstract stress* links Bolinger's notion of lexical stress and the typical usage of the term in generative phonology. Accent: Articulatory pulse (laryngeal) or pulse-like pitch protrusion from a baseline, regulary associated with a stress position. This is essentially Bolinger's term and has received widespread recognition in this meaning. It co-occurs with 'minor correlates' in the form of syllabic fortition processes (including onset aspiration, tensing, lengthening); these may occur without noticeable 'major correlate* pitch patterning. This may require modification of the definition of accent in terms of more generalised prosodic fortition processes. Prominence: Perceived subjective property of syllables determining conspicuousness relative to flanking syllables. It is a pre-theoretical notion and may be explicated as a complex function of stress, accent and other (including functional) cognitive factors." (Gibbon 1988, S.18)
Ich werde im folgenden diese Unterscheidung in leicht abgewandelter Form übernehmen. Für 'stress* auf lexikalischer Ebene werde ich im Deutschen die Begriffe 'Iktus' bzw. 'Wortiktus' (vgl. Isacenko/Schädlich 1966), für 'stress' auf syntaktischer Ebene den Begriff des 'Normalakzents' verwenden. Die Unterscheidung in 'accent' und 'prominence' werde ich allerdings nicht übernehmen. Akzent ist für diese Arbeit als Wahrnehmungskategorie definiert. Wenn es um die phonetische Form des Akzents geht, die bei Gibbon als 'accent' bezeichnet wird, werde ich die Begriffe Tonhöhenkontur auf der auditiv-phonetischen Ebene, und FO-Kontur auf der akustisch-phonetischen Ebene verwenden. Der Wortiktus und der Normalakzent liegen im Französischen auf der letzten Silbe, die als eine phonetische Einheit durch den Akzent auf der letzten Silbe gekennzeichnet wird (mot phonique). Im Deutschen dagegen ist die Position des Normalakzents nicht so eindeutig festlegbar. Der zweite Grund liegt darin, daß der deutsche Akzent von der Position des Normalakzents auf jede beliebige Silbe bzw. jedes beliebige Wort verschoben werden kann. Jede
6
Kontrastive Intonationsforschung
Position ergibt eine korrekte Äußerung, die sich allerdings in den semantischen und pragmatischen Bedeutungen unterscheiden. Man sagt, das Deutsche hat einen freien Satzakzent. Im Französischen ist diese Verschiebung nicht möglich. Der Akzent ist auf die letzte Silbe einer Einheit festgelegt. Allerdings gibt es die Möglichkeit einen zusätzlichen Akzent, den sogenannten Insistenzakzent zur Fokussierung nicht-letzter Äußerungsteile zu verwenden. Dieser Akzent kann wie der deutsche Akzent auf jede beliebige Silbe bzw. jedes beliebige Wort der Äußerung fallen. Auf der Ebene der Intonation, hier verstanden als Melodieverlauf, gibt es kaum noch gesicherte Ergebnisse. Delattre (1965a) weist auf den unterschiedlichen Gebrauch der drei akustischen Parameter FO, Intensität und Dauer hin: Im Französischen gibt es im Gegensatz zum Deutschen (und Spanischen und Englischen, die Delattre ebenfalls untersucht hat) keine Variationen in der Intensität (gemeint ist die Intensität der Vokale). Dagegen sind Variationen in der Vokaldauer bestimmend für den französischen Akzent. In beiden Sprachen gibt es Tonhöhensteigungen und Tonhöhenfälle. Nach Delattre (1965a) unterscheiden sie sich aber in ihrer Form. Während im Deutschen die Tonhöhe über eine längere Strecke hinweg steigt und eine eher konkave Form bildet, endet die französische Steigung auf einen Plateau und bildet eine eher konvexe Form (vgl. Abbildung 1.2). Minor Continuation
Major Continuation
Finality
German
die
- te der Frau
SCHNEI - der
let
LEH
-
ha - MEAU
p4 - da - LA IT
re-rln
French
le
cu -
H£
du
Abbildung 1.2: Vergleich der deutschen und französischen Intonationskontur für weiterweisende und terminate Einheiten (aus: Delattre 1965a, S.25)
Auch bei den Tonhöhenfällen gibt es nach Delattre Unterschiede. Im Deutschen besteht ein terminaler Äußerungsteil aus einem steigenden Akzent, auf den ein Tonhöhenbruch folgt, die letzten unbetonten Silben werden auf dem tiefsten Niveau gesprochen. Im Französischen dagegen besteht eine terminale prosodische Einheit aus einer global fallenden, konvexen Linie.
2
Dieser Akzenttyp wird in der Untersuchung von Delattre (1965a) nicht berücksichtigt. Dies ist möglicherweise ein weiterer Beleg für die von Fonagy (1980a) aufgestellte Hypothese der intonatorischen Sprachentwicklung (vgl. Kapitel 2).
Kontrastive Intonationsforschung
7
Soweit die Ergebnisse von Delattre, die meiner Meinung nach zwar auf einige interessante Punkte aufmerksam machen, wie z.B. das Zusammenspiel der drei akustischen Parameter, andererseits aber z.T. auch recht oberflächlich bleiben. So kann ich mir z.B. bei den Beispielen in Abbildung 1.2 für das Deutsche in der terminalen Einheit auch eine fallende Kontur vorstellen (vgl. Abbildung 1.3)
die
TAN - te der Frau
SCHNEI - der
1st
LEH
-
re - rln
Abbildung 1.3: Alternative für die terminate Kontur im Deutschen
Grundsätzlich scheint mir die Schwierigkeit darin zu liegen, daß beliebige, kontextlose Beispielsätze miteinander verglichen werden, ohne zu überprüfen, inwiefern sie vergleichbar sind. Ein Vergleich der deutschen und französischen Intonationssysteme, der sich nicht auf einzelne Sätze, sondern Texte bezieht, ist mir nicht bekannt.
1.3. Einheiten der Intonationsbeschreibung Als sprachliche Einheit, innerhalb derer Intonation analysiert/beschrieben wird, wird in bisherigen Arbeiten fast ausschließlich die syntaktische Einheit des Satzes bzw. des Syntagmas/der Phrase genommen. Entweder werden auch explizit nur syntaktische Funktionen für Intonation angenommen (DiCristo 1978, Bierwisch 1966, Wunderlich 1988), oder aber es werden, obwohl auch semantische oder pragmatische Funktionen untersucht werden, nur Sätze bzw. syntaktische Einheiten als Analysegegenstände benutzt (von Essen 1964, Rossi et al. 1981, Rossi 1985). Selbst wenn ein Korpus gesprochener Sprache der Analyse zugrundeliegt, wie dies bei Pheby (1975) der Fall ist, werden für die Analyse der Intonation des Korpus nur die Einheiten verwendet, in denen die syntaktische Struktur mit der intonatorischen Struktur übereinstimmt, d.h. in den Begriffen von Halliday (1967), in dessen theoretischen Rahmen Pheby arbeitet, daß nur die unmarkierten Fälle im System der tonality untersucht werden. Rossi (1985), dessen These zwar ist, daß Intonation nicht eine syntaktische Funktion hat, behauptet trotzdem, daß eine intonatorische Teilung einer Nominalphrase nicht möglich ist, wie in dem folgenden Beispiel: * le fils // de la voisine s'est tue en voiture (1985, p. 135) Beispiele aus den Bauklötzchen-Texten zeigen die Unzulänglichkeit syntaktischer Einheiten als Basis für spontan gesprochene Sprache. An beliebigen syntaktischen Stellen können
8
Kontrastive Intonationsforschung
Akzente benutzt werden, sogar um eine Nominalphrase zu zerteilen, wie die folgenden Beispiele zeigen: Beispiel 1: tu prends un cube / bleu \ Beispiel 2: einen blauen \ Klotz /
Die Frage nach der Einheit, auf der Intonationszeichen realisiert werden und eine Bedeutung haben, ist bereits von v. Essen (1964) diskutiert worden. Trotz des im Titel verwendeten Wortes "Satzintonation" ist für v. Essen nicht der Satz sondern der Ausspruch die Bezugsgröße der Intonation. Den Ausspruch bestimmt v. Essen folgendermaßen: "Ein Ausspruch ist nicht eine Aneinanderreihung von Lauten oder Wörtern, sondern als eine Ganzheitlichkeit in der psychischen Sphäre des Sprechers entworfen, und er gewinnt durch den Sprechakt nur seine sinnlich wahrnehmbare Gestalt." (S. 11)
Es handelt sich also (a) um eine Planungseinheit in den psychischen Prozessen des Sprechers und (b) um eine als ganzheitlich (als Gestalt) wahrnehmbare Einheit. Für beide Merkmale ist es schwer, operationalisierbare Definitionen anzugeben, um einen Ausspruch empirisch zu identifizieren, v. Essen benutzt für seine Beispiele dann auch Sätze und bezeichnet sie auch als Sätze, ohne weiter auf diese Problematik einzugehen, obwohl seine Definition auch auf kleinere oder größere Einheiten passen würde. Diese vereinfachende Behandlung dieses komplizierten Problems ist eventuell von der Adressatengruppe abhängig. Nimmt man an, daß diese Einheiten in allen Sprachen irgendwie gekennzeichnet werden, dann kann ein Nicht-Muttersprachler ohne Probleme die Einheit identifizieren; er muß nur die Form der Kennzeichnung erlernen. Für eine formale Darstellung reicht diese Definition sicher nicht aus. In modernen Arbeiten zur Intonation werden die verschiedensten Diskursstrukturen als Korrelate für Intonation verwendet. Beispiele für pragmatische Untersuchungen sind Cutler/Levelt (1983) und Selling (1987b), die Korrekturen mit Akzenten korreliert haben und Gibbon/Selting (1983), die prosodische Stilwechselphänomene beschrieben haben, die mit Adressatenwechsel korrelierten. Bereits in älteren Arbeiten wird eine mit pragmatischen Strukturen verwandte Struktur untersucht: die Informationsstruktur. So spricht Halliday (1967,1970) von 'information chunking' und Pheby (1983) untersucht in diesem Rahmen die deutsche Intonation als Markierer für Informationseinheiten. In allen diesen Arbeiten geht es jeweils um eine Korrelierung von textuellen Strukturen mit intonatorischen Strukturen. Die Übereinstimmung von syntaktischen, semantischen, lexikalischen oder pragmatischen Strukturen, die in diesen Arbeiten gefunden worden sind, sind jedoch kein Beweis für eine solche Funktion der Intonation. Die folgende Arbeit von Cutler (1983) geht einen Schritt weiter in Richtung auf ein Erklärungsmodell. Sie diskutiert psycholinguistische Ergebnisse für die Bestimmung der Funktion der Intonation. Cutler untersucht Zusammenhänge zwischen Prosodie und sprachlichen Korrekturen und stellt fest, daß prosodische Korrekturindikatoren dann benutzt werden, wenn die Fehler Verständigungsprobleme hervorrufen können. Ein zweites Ergebnis ist, daß Korrekturen
Kontrastive Intonationsforschung
9
der Prosodie nur dann durchgeführt werden, wenn anderenfalls die Äußerung von dem Hörer falsch interpretiert werden könnte. Das folgende Beispiel aus einem französischen Korpus (Sader 1984) zeigt eine typische Korrektur von Intonation: •
Beispiel 3:
·
*
on est une association nationalE· *
·
· ·
·
· *
»
* · .. on est une association nationals
Diese beiden Äußerungsteile folgen direkt aufeinander. Im ersten Teil wird er mit einem deutlichen Akzent auf dem a von nationale und nicht-tieffallender Intonation am Ende des Äußerungsteils gesprochen. In der wortwörtlichen Wiederholung wird die Intonation korrigiert: Der Akzent wird sehr schwach gesprochen und die Intonation fällt am Ende auf das tiefe Niveau. Pragmatisch kann man das folgendermaßen interpretieren: Die Intonation des ersten Äußerungsteils weist auf einen nichtabgeschlossenen Redebeitrag hin, einen Anfang einer Argumentation. Das ist an dieser Stelle jedoch pragmatisch unverständlich, denn dieses Thema ist gerade ausgiebig diskutiert worden. Die Sprecherin korrigiert ihre Intonation in eine tieffallende Intonation, die das Ende einer Einheit anzeigt. Prosodie wird nur dann korrigiert, wenn die Verständigung gefährdet ist. Aus Beobachtungen dieser Art zieht Cutler den folgenden Schluß: "The function of prosody is thus seen to be, in the speaker's view, primarily concerned with the semantics or pragmatics of the utterance." (Cutler 1983, S. 91)
Ich möchte in dieser Arbeit den Versuch machen, konsequent als Einheit der Intonationsbeschreibung pragmatische Einheiten zu verwenden und Intonationseinheiten in den pragmatischen Strukturen, den Handlungsstrukturen und der Informationsstruktur von Texten zu untersuchen. Diese Strukturen werden in Kapitel 6 entwickelt und auf das Material angewandt.
1.4.
Bedeutung von Intonation
Die Frage, die in diesem Abschnitt behandelt werden soll, ist die Frage nach der Art der Bedeutung, die Intonation tragen kann. McGregor (1982) hat in einer Untersuchung Versuchsteilnehmer gebeten, Äußerungen in einem Text zu interpretieren. Dabei bezogen sich die Versuchsteilnehmer häufig auf intonatorische Phänomene, denen sie jedoch sehr unterschiedliche Bedeutungen, die sich hauptsächlich auf die Einstellung oder das Verhalten der Kommunikationsteilnehmer beziehen, wie z.B. "His voice sounds dreamy as if he's living it. The voice falls after each thing with a little pause in between." oder "There's amusement. It starts off quietly. He captures her intonation by imitating her. I doubt if the imitation is accurate. It's his own interpretation of it. He was trying to capture the feeling that O.H.M.S. was something special for her." (McGregor 1982, S.126). Bolinger verweist auch auf die Unsicherheit bei der Beurteilung von Intonation
10
Kontrastive Intonationsforschung
und auf die Verbindungen zwischen Intonation und Verhalten: "This book is by a linguist who believes that intonation is too important a subject to be left just to linguists. It concerns psychologists, since intonation, the least self-conscious and least commented-on side of vocal communication, allows observers to catch communicators off guard and watch certain of their inner workings" (1986, S.vii)
Auch im Fremdsprachenunterricht ist die Intonation ein besonders schwieriges Phänomen, und zwar nicht nur, weil es wenig didaktisch verwendbare Intonationsbeschreibungen gibt, sondern auch, weil der emotionale Widerstand eine fremde Intonationskontur zu lernen, unvergleichbar groß ist. Ein Modell der Sprachverarbeitung müßte dieser Unsicherheit Rechnung tragen und nicht eine eindeutige Funktion für eine Intonationseinheit postulieren, sondern die Mehrdeutigkeit im Modell beschreiben. Das hier verwendete Modell der Sprachverarbeitung, das der Interpretation der Intonation zugrundeliegt, ist durch zwei theoretische Ansätze bestimmt: 1. die metalokutive Hypothese (Gibbon 1980, 1983) 2. Kontextualisierung (Gumperz 1982)
1.4.1.
Die metalokutive Hypothese
Gibbon (1980, 1983) entwirft ein Sprachmodell, das mit paraleüen, teilweise synchronisierten sprachlichen Verarbeitungsebenen arbeitet. In Anlehnung an die Prager Schule (konfigurative Funktion der Intonation) wird angenommen, daß die Intonation auf einer eigenen Ebene, die Gibbon "metalokutive Ebene" nennt, verarbeitet wird und deshalb auch auf einer eigenen Ebene beschrieben werden sollte. Die Verarbeitungsprozesse der Intonationszeichen werden mit denen der lokutiven Ebenen (Morphologie, Lexik, Syntax, Phonetik, Semantik, Pragmatik) z.T. synchronisiert, d.h. die Intonationszeichen verweisen deiktisch auf Verarbeitungsprozesse auf diesen Ebenen. Dieser deiktische Verweis auf andere sprachliche Verarbeitungsprozesse konstituiert die Funktion der Intonationszeichen, die somit wahlweise syntaktische, morphologische, semantische oder pragmatische Funktion haben können. Ich möchte hier eine leicht abweichende Position vertreten. Ich gehe davon aus, daß Sprache vorrangig pragmatisch strukturiert ist (vgl. dazu auch Gibbon 1987a). Ich übernehme einen Teil des von Gibbon vorgeschlagenen Modells, indem ich ebenfalls annehme, daß Intonation auf einer von den anderen sprachlichen Ebenen getrennten Ebene verarbeitet wird. Allerdings nehme ich eine etwas andere Anordnung der Ebenen an, indem ich postuliere, daß die Information aller Ebenen pragmatisch genutzt und interpretiert wird, d.h. die pragmatische Ebenen ist nicht eine neben anderen Ebenen, sondern eine hierarchisch höherstehende Ebene. Eine solche Anordnung der Verarbeitungsebenen wird auch durch die oben dargestellten Ergebnisse über das Wissen der Kommunikationsteilnehmer über Intonation (wie es sich z.T. in Korrekturen manifestiert) gestützt.
Kontrastive Intonationsforschung
11
Eine Übereinstimmung von syntaktischen mit intonatorischen Strukturen ist damit also kein Beweis für die "syntaktische Funktion" der Intonation, sondern eine (durchaus wahrscheinliche) Übereinstimmung zwischen zwei Systemen, die unabhängig voneinander die pragmatische Struktur (die Handlungsstruktur) der Sprache verdeutlichen. Die folgende Abbildung zeigt diesen Zusammenhang noch einmal graphisch:
INTONATION MORPHOLOGIE SYNTAX SEMANTIK - PRAGMATIK LEXIK PHONETIK
Abbildung 1.4: Modell der Sprachverarbeitung (Semantik und Pragmatik werden hier nicht genau voneinander getrennt.)
Aus dieser Anordnung der Ebenen zueinander folgt auch ein methodisches Problem. Die pragmatischen Strukturen sind nicht unabhängig von den grammatischen und den intonatorischen Strukturen zu bestimmen. Die Einheit des Sprechakts kann z.B. auch alleine durch die Intonationsstruktur markiert sein. Aus dem Satz du nimmst einen bleuen und einen gelben \ \
kann man zwei Sprechakte interpretieren, wohingegen du ninüst einen blauen und einen gelben" / \
als nur ein Sprechakt verstanden werden kann. Das Ziel meiner Untersuchung kann es nur sein, plausible Strukturen auf beiden Ebenen zu postulieren, die dann auch plausibel miteinander korrelieren.
12
Kontrastive Intonationsforschung
1.4.2. Kontextualisierung Der Soziolinguist und Konversationsanalytiker Gumperz hat in dem Buch "Discourse Strategies" (1982) für die Beschreibung der Bedeutung von Intonation und Stilwechsel das Konzept der Kontextualisierungshinweise ("contextualization cues") vorgeschlagen. Er geht davon aus, daß Interaktanten über ein gemeinsames Wissen verfügen, das ihnen hilft, Ereignisse zu kategorisieren, Absichten zu inferieren und Erwartung über den Fortgang der Aktivität zu bilden. Zu diesem Wissen gehören Stereotypen über die Sprachform, in der diese Aktivitäten durchgeführt bzw. aus der diese Aktivitäten interpretiert werden können. Diese stereotypen sprachlichen Formen nennt Gumperz Kontextualisierungshinweise: "A basic assumption is that this channelling of interpretation is effected by conversational implicatures based on conventionalized co-occurrence expectations between context and surface style. That is, constellations of surface features of message form are means by which speakers signal and listeners interpret what the activity is, how semantic context is to be understood and how each sentence relates to what precedes or follows. These features are referred to as contextualization cues" (S. 131)
Der fundamentale Unterschied zu anderen Herangehensweisen liegt darin, daß Gumperz die Kontextualisierungshinweise nicht im System der Sprache angesiedelt sieht, sondern sie in Verbindung mit kulturellem Wissen bringt. Es handelt sich um stereotypes Wissen, das in Interaktion gelernt wird, kaum bewußt ist und außerhalb eines interaktiven Prozesses keine analysierbare Bedeutung hat. Gumperz entwickelt diese Vorstellung von dieser Art der Funktion der Intonation anhand von Analysen des indischen Englisch. Er stellt fest, daß sich das indische Englisch in den klassischen Bereichen der Grammatik kaum vom britischen Englisch unterscheidet, gleichzeitig es aber wesenüiche Unterschiede in den Bereichen der Sprache gibt, die Diskursstrukturen anzeigen, also hauptsächlich im Bereich der Prosodie und einigen lexikalischen und syntaktischen Strukturen. Die Diskursstrukturen und die sprachlichen Mittel, die verwendet werden, um diese anzuzeigen, ähnelten mehr denen der indischen Sprachen als denen des britischen Englisch. Es scheint also einen Unterschied zwischen dem Lernen und damit auch dem Verarbeiten der Grammatik einerseits und dem Lernen von Diskursstrukturen und deren sprachlichen Indikatoren andererseits zu geben. Besonders interessant war die Tatsache, daß diese Kontextualisierungshinweise in zwei nicht verwandten indischen Sprachen und im indischen Englisch vorkommen. Das deutet daraufhin, daß Kontextualisierungshinweise weniger sprach- als kulturabhängig sind. Intonation soll in dieser Arbeit einerseits im Bereich der Grammatik untersucht werden. Es geht dabei um Formen und Kombinierbarkeit von Formen, denen abstrakte Bedeutungen zugeschrieben werden können. Gleichzeitig soll berücksichtigt werden, daß der größte Teil der Bedeutung von Intonationszeichen in ihrer Funktion als Kontextualisierungshinweis liegt, d.h. nicht außerhalb einer gegebenen Interaktion analysiert werden kann bzw. nicht einfach verallgemeinert werden kann.
Kontrastive Intonationsforschung
13
1.5. Analyseebenen und Überblick über die Arbeit Die grundlegende Unterscheidung der phonetischen Untersuchungsbereiche in artikulatorische Phonetik, akustische Phonetik und auditive Phonetik gilt auch für die Intonationsforschung. So kann z.B. der Akzent artikulatorisch als laryngaler Impuls (vgl. Gibbon 1984), akustisch als FO-Kontur und auditiv als Tonhöhenkontur expliziert werden bzw. als eine Funktion aus diesen drei Begriffen und der zeitlichen Position zur Silbenstruktur (Gibbon 1987b). Mehr Schwierigkeiten bereitet der Intonationsforschung dagegen, eine klare Trennlinie zwischen Phonetik und Phonologic zu ziehen. In der segmentalen Phonetik und Phonologic gibt es über die Einheiten der Beschreibung bzw. des Systems — sicher auch bedingt durch die Tradition der Buchstabenschrift — allgemeine Übereinstimmung. Dagegen sind die Einheiten der Intonationsforschung sehr umstritten und es gibt verschiedene Richtungen, die sich auf unterschiedliche Weise mit dem Problem der intonatorischen Formen und Funktionen auseinandersetzen. Cutler/Ladd (1983b) unterscheiden zwei Richtungen in der Intonationsforschung: die model-builders (phonologisch) und die measurers (akustisch-phonetisch): "One approach — let us call it the "concrete" approach (die 'measurers', F.J.) — defines prosody more or less in physical terms, as those phenomena that involve UK acoustic parameters of pitch, duration, and intensity. This approach conceives of the link between form and function in prosody as a relatively direct mapping between concrete meanings or functions and specific acoustic shapes or variables." (S. 1/2) "... the abstract approach does not assume that the relation between form and function is so straightforward as to justify the search for direct correlates. Prosody is not a phonetically defined component of language with a set of heterogeneous functions like "phrase boundary" and "question"; such messages are not conveyed by the prosody as a peripheral channel running parallel to the text, but as part of the whole linguistic structure, of which the prosodic features are one aspect. Acoustic parameters are seen as cues to abstract formal categories, not to concrete ones, and the main aim of prosodic research is to model the formal system." (S. 2)
Eine dritte Richtung der Intonationsforschung ist auditiv-phonetisch orientiert. Das folgende Zitat aus Selling (1987a) verdeutlicht diese Position: "The approach adopted here is thus more phonetic in orientation; no attempt is made to isolate phonological units as predeterminants of structures on different levels of linguistic organization." (S. 11)
Ich möchte in dieser Arbeit 5 Analyseebenen für die Intonation unterscheiden (vgl. Abbildung 1.5), neben den 3 phonetischen Ebenen die Ebene der Phonologic und die der Funktionen. Auf jeder dieser Ebenen können einige Aspekte der Intonation untersucht werden. Eine vollständige Intonationsbeschreibung müßte die Intonation auf allen Ebenen spezifizieren und die Zusammenhänge zwischen den Einheiten der verschiedenen Ebenen explizieren (vgl. Gibbon 1984).
14
Kontrastive Intonationsforschung
1. Phonetik
artikulatorische Impulse
Spannung . 1.
2. Phonologie (linguistische Kategorien)
akustische
auditive
Intensität Frequenz Dauer
Lautstärke Tonhöhe Länge Rhythmus
Akzenttypen Terminaltöne Globalverläufe
3. Funktionen
kontrastiver Akzent Fokus Grenzsignal
Abbildung 1.5: Analyseebenen
Auch der Vergleich französischer und deutscher intonatorischer Phänomene kann auf allen diesen 5 Ebenen vorgenommen werden. Annahme ist, daß das, was sich als "deutscher" oder "französischer" Akzent bemerkbar macht, ein Produkt aus Fehlern von verschiedenen Ebenen ist. So kann man z.B. französische phonologische Kategorien lernen, dann aber z.B. die Steigungen (die in beiden Sprachen phonologische Kategorien sind) falsch realisieren (artikulatorische + akustische Ebene) oder auch an falscher Stelle im Diskurs benutzen (Ebene der Funktionen). In dieser Arbeit sollen Unterschiede zwischen der französischen und der deutschen Intonation auf drei Ebenen untersucht werden: auf akustisch-phonetischer, phonologischer bzw. auditiv-linguistischer und funktionaler Ebene. Die phonetisch-artikulatorische und phonetisch-auditive Ebene können für dieses kontrastive Untersuchungsinteresse unberücksichtigt bleiben, da man annehmen kann, daß die Beziehungen zwischen artikulatorischen, akustischen und auditiven Phänomen durch den menschlichen Produktions- und Perzeptionsapparat bedingt sind und sich deshalb keine Unterschiede zwischen Französisch und Deutsch in der Beziehung der drei phonetischen Teilbereiche zueinander ergeben. Der akustisch-phonetische Bereich bietet den Vorteil, daß die Daten gut zugänglich und leicht meßbar und vergleichbar sind. Jede dieser drei zu untersuchenden Ebenen hat nicht nur unterschiedliche Explicanda, sondern auch unterschiedliche Methoden, mit denen die jeweiligen Explicanda untersucht werden bzw. untersucht werden können. Im ersten Kapitel werden als Grundlage und Rahmen für die empirische Arbeit die wichtigsten Intonationsbeschreibungssysteme des Deutschen und des Französischen vorgestellt. Auf dieser Ebene der von Intonationsforschern vorgeschlagenen Kategorien soll ein erster Vergleich zwischen der deutschen und der französischen Intonation angestellt werden. Die Frage lautet auf dieser Ebene: Welche intonatorischen Phänomene sind in den beiden Sprachen in der wissenschaftlichen Beschreibung berücksichtigt worden? Die folgenden vier Kapitel beschäftigen sich aus unterschiedlichen Perspektiven mit dem Korpus. In Kapitel 3 wird die Wahl des Korpus begründet und die wesentlichen Merkmale des Materials dargestellt. In den letzten drei Kapiteln werden dann drei verschiedene empirische Methoden vorgestellt und auf den Korpus bzw. Ausschnitte des Korpus angewendet. In Kapitel 4 wird die intersubjektive Übereinstimmung bei der Beurteilung
Kontrastive Intonationsforschung
15
von Intonationskategorien untersucht. Diese Untersuchung läßt Rückschlüsse auf auditiv-linguistisch wichtige bzw. unwichtige Merkmale des Tonhöhenverlaufs in den beiden Sprachen zu. Im Kapitel 5 wird ein Aspekt des akustischen Materials untersucht, und zwar die Steigungen. Sowohl in der deutschen als auch der französischen Intonation gibt es steigende Tonhöhenverläufe. Trotzdem werden gerade diese steigende Stellen häufig in der Rede vom Nicht-Muttersprachlern als auffällig empfunden. In diesem Kapitel sollen diese Stellen auf Unterschiede in ihrer akustischen Form hin untersucht werden. Diese Unterschiede können Hinweise für die unterschiedliche Wahrnehmung geben, eine Gleichsetzung der akustischen Merkmal mit auditiven Merkmalen kann und soll jedoch nicht gemacht werden. Kapitel 2, 4 und 5 beschäftigen sich aus unterschiedlicher Perspektive mit den Formen der Intonation. Im letzten Kapitel, dem 6. Kapitel wird mit der hermeneutisch-interpretativen Methode die Verwendung von Intonationszeichen in Gesprächen untersucht und versucht, Unterschiede zwischen dem Deutschen und dem Französischen herauszufinden. Die Transkriptionssysteme werden auf den Ergebnissen der Kapitel 2 und 4 aufgebaut und berücksichtigen Akzente und Grenztöne. Die Strukturen, innerhalb derer den Intonationszeichen Funktionen zugeschrieben werden, sind Sprechhandlungsstrukturen. Der Aufbau der Arbeit ist durch einen vertikalen und einen horizontalen Aspekt bestimmt. Unter dem vertikalen Aspekt gesehen, bauen die einzelnen Kapitel der Arbeit aufeinander auf. Der Überblick über die Intonationsbeschreibungssysteme setzt einen Rahmen sowohl für die Wahrnehmungsversuche in Kapitel 4 als auch für die akustische Analyse ia Kapitel 5, deren Explicanda nach Ergebnissen des Wahrnehmungsversuchs ausgewählt werden. Für die funktionale Beschreibung von Intonationszeichen in Kapitel 6 wird aufbauend auf den drei ersten Analysekapiteln ein Intonationstranskriptionssystem entwickelt und auf den Korpus angewandt. Gleichzeitig gibt es einen horizontalen Aspekt in der Struktur der Arbeit, indem in jedem Kapitel, d.h. jedem Analyseschritt ein Vergleich zwischen den beiden Sprachen vorgenommen wird. In allen Bereichen geht es um einzelne Aspekte der Intonationsunterschiede zwischen dem Deutschen und dem Französischen. Alle Aspekte zusammen ergeben ein differenziertes Bild bzw. eine Erklärung für das, was man als 'intonatorische Fehler' produziert und wahrnehmen kann.
Intonationsbeschreibuogssysteme
17
2. INTONATIONSBESCHREIBUNGSSYSTEME (Methode 1)
In diesem Kapitel soll ein kurzer Überblick über die wichtigsten systematischen Intonationsbeschreibungen des Französischen und des Deutschen gegeben werden. Intonation ist in der französischen und auch der deutschen Literatur in unterschiedlichen Paradigmen und unter unterschiedlichen Erkenntnisinteressen in sehr unterschiedlichen Beschreibungssystemen beschrieben worden. Bei der Darstellung der Intonationsbeschreibungen geht es mir darum, wie die folgenden zwei Aspekte behandelt werden: a) phonologische Einheiten b) Syntax der intonatorischen Einheiten. Ziel dieses Kapitels ist es, die in der deutschen und der französischen Intonationsforschung vorherrschenden Fragestellungen in bezug auf Kategorien und Intonationssyntax zu skizzieren und miteinander zu vergleichen. Die unterschiedliche Schwerpunktbildung in der Intonationsforschung der beiden Sprachen kann sicherlich durch unkontrollierbare Variablen wie z.B. persönliche Vorlieben des jeweiligen Intonationsforschers beeinflußt werden. Interessant für eine kontrastive Analyse ist ein solcher Vergleich der Schwerpunkte in der Intonationsforschung dann, wenn man annimmt, daß u.a. auch der unterschiedliche Phänomenbereich (deutsche vs. französische Intonation) die unterschiedlichen Beschreibungssysteme bedingt. In diesem Sinne können Unterschiede zwischen der deutschen und der französischen Intonation aus den Unterschieden zwischen den Beschreibungssystemen erschlossen werden. Dieser Weg soll in diesem Kapitel eingeschlagen werden. Obwohl das Thema dieser Arbeit "Intonation in Gesprächen" ist, sollen in diesem Kapitel auch satzorientierte Herangehensweisen berücksichtigt werden. Eine Einschränkung auf allein die Beschreibungssysteme, die für Diskurse und an Diskursmaterial entwickelt worden sind, würde weder dem Forschungsstand der Intonationsforschung noch dem zu beschreibenden Problem der unterschiedlichen Kategoriensysteme gerecht. Der größte Teil der Intonationsbeschreibungssysteme ist nämlich an Sätzen entwickelt worden. Würde ich den Vergleich auf allein die diskursorientierten Beschreibungen beschränken, würde dies nicht dem Diskussionsstand der Intonationsforschung entsprechen. Der Vergleich würde sich auf ein französisches (Mertens 1987) und ein deutsches (Gibbon 1984, Gibbon/Selting 1983, Selling 1987a) System beschränken, da alle anderen entweder satzorientiert gearbeitet haben, oder, wenn sie an Diskursmaterial gearbeitet haben, dann nur wenige ausgewählte Phänomene beschrieben haben, ohne den Anspruch eines Beschreibungssystems zu verfolgen. Was die Beschreibungskategorien selber angeht, so scheint es mir sinnvoller, anzunehmen, daß die in Sätzen beschriebenen auch in Diskursen vorkommen, wenn sie auch eventuell einen anderen Stellenwert haben können.
18
Intonationsbeschreibungssysteme
Systematische Untersuchungen zu dem Unterschied zwischen Satz- und Diskursintonation sind mir nicht bekannt. Eine Untersuchung von Tropf (1985) stützt aber die Annahme, daß es sich nicht um unterschiedliche Systeme handelt. Er untersucht die FO-Kontur von Ergänzungsfragen in spontan gesprochener Rede mit der FO-Kontur gelesener Ergänzungsfragen, die von denselben Sprechern auf denselben Sätzen realisiert wurden. Sein Ergebnis ist, daß es zwar einen quantitativen (Tonhöhenumfang) aber keinen qualitativen (Tonmuster) Unterschied gibt (Tropf 1985, S.57). Schwierigkeiten ergeben sich mehr aus der Bestimmung der Einheiten, auf die diese Kategorien angewendet werden, d.h. bei Synchronisierung von lokutiver und metalokutiver Ebene, da die Einheitengröße in satzorientierten Herangehensweisen durch die Wahl des Analysegegenstandes, nämlich den Satz, vorgegeben ist, der Satz aber sicher nicht die relevante Analyseeinheit für Intonation in Gesprächen darstellt.
2.1. Die französische Intonationsforschung In der französischen Intonationsforschung steht der Akzent im Mittelpunkt der Untersuchungen. Es werden im allgemeinen zwei (manchmal sogar drei) Typen von Akzenten unterschieden: 1. Der interne Akzent ( accent interne (Rossi 1980), accent oxytonique (Fonagy 1980a), dynamischer, normaler, finaler, logischer, ... Akzent). 2. Der externe Akzent (l'accent externe, (Rossi 1980), /'accent d'insistance (Lucci 1980), accent barytonique (Fonagy 1980a), bei dem in einigen Arbeiten zwei Varianten unterschieden werden: a) der affektive (emotioneile, expressive, ...) Akzent b) der enonciative (intellektuelle, distinktive, logische, didaktische, ...) Akzent. Trotz dieser verwirrend vielen unterschiedlichen Begriffe, die in der Intonationsliteratur verwendet werden und die ich hier in den Klammern nur angedeutet habe, lassen sich die beiden Typen relativ eindeutig distributionell unterscheiden (Ich folge im weiteren Verlauf der Arbeit der Terminologie von Rossi 1980). Der externe Akzent ist ein Initialakzent, d.h. er fällt auf den Anfang einer akzentuierbaren Einheit, oder auf ein Wort, das normalerweise nicht akzentuiert wird, wie z.B. Artikel, Präpositionen. Er ist fakultativ und sein Skopus/Bereich ist das Wort oder die Silbe. Der interne Akzent dagegen ist ein finaler Akzent, d.h. er fällt auf die letzte Silbe einer akzentuierbaren Einheit. Er ist obligatorisch. Sein Skopus ist die ganze akzentuierbare Einheit, die durch diesen Akzent als Einheit gekennzeichnet wird, was im allgemeinen als
Intonationsbeschreibungssysteme
19
'delimitative' Funktion bezeichnet wird. Diese beiden Akzentsysteme des Französischen können unabhängig voneinander beschrieben werden. Fonagy (1980a) wie auch Leon/Leon (1980) gehen davon aus, daß es sich beim internen und externen Akzent um zwei prosodische Systeme handelt, von denen der externe Akzent das modernere System darstellt, das sich im Laufe dieses Jahrhunderts immer mehr über das ältere System des internen, finalen Akzents überstülpt: "L'accent fran?ais nous offre, ä n'en point douter, le rare spectacle d'un Systeme prosodique en evolution." (Fonagy 1980a, S.171).
Um diese beiden Typen von Akzenten gruppieren sich die Arbeiten zur französischen Intonationsforschung. Der interne Akzent steht im Mittelpunkt der Untersuchungen von Delattre (1966, 1969), Rossi et al. (1981) und Rossi (1985), die hauptsächlich anhand von gelesenen Sätzen die Intonationsmuster des Französischen beschreiben und systematisieren. Der externe Akzent dagegen steht im Mittelpunkt der Arbeiten von Fonagy/Fonagy (1976), Fonagy (1980a), Lucci (1980), Leon/Leon (1980) und anderen, die an Texten gesprochener Sprache intonatorische Phänomene beschreiben. Rossi (1985) versucht im Rahmen einer Rhema-Thema-Beschreibung eine Verbindung dieser beiden Phänomene. Eine dritte Richtung, die sich z.T. mit den Arbeiten über den externen Akzent überschneidet, sind die Untersuchungen von expressiven Varianten der Intonationsmuster (Leon 1970), auf die ich hier nicht systematisch eingehen möchte.
2.1.1.
Der interne Akzent
Delattre (1966, 1966/7, 1969) macht eine Intonationsanalyse in der strukturalistischen Tradition. Anhand von Minimalpaaren ermittelt er mithilfe des Kommutationstests bedeutungstragende Unterschiede im Melodie verlauf von Sätzen. Er vergleicht diese Intonationsmuster in ihrer akustischen Form und überprüft sie in Wahrnehmungsexperimenten auf ihre linguistisch-phonologische Bedeutung. Es ergeben sich sieben distinktive Intonationsmuster, die er anhand der folgenden beiden Merkmale beschreibt: a) Tonhöhenvariationen zwischen vier Tonstufen. b) Form der Tonhöhenkurve: gerade, konvex, konkav. Die sieben Intonationsmuster benennt Delattre mit der Funktion, die er ihnen zuweist. Abbildung 2.1 zeigt die zehn Basiskonturen des Französischen, von denen die Konturen 4, 5 und 10 sowie die Konturen 7 und 9 als Variationen je eines Intonems zu verstehen sind. Bei den Mustern 2 und 4 kann es auch fallende Varianten geben, allerdings mit der Stellungseinschränkung, daß diese alternativen Muster nicht direkt vor dem Muster 6 auftreten dürfen. Die fallenden Varianten der continuation fallen im Unterschied zu den
20
Intonationsbeschreibungssysteme
Mustern 5 und 6 nicht bis auf das tiefste Niveau, sondern bleiben im mittleren Bereich, d.h. die continuation majeure fällt von Niveau 4 — 2, die continuation mineure von 3—2. Zweitens hat Delattre in einer Untersuchung spontan gesprochener Sprache, einer Diskussion mit Simone de Beauvoir (Delattre 1961), festgestellt, daß sich die beiden Formen der continuation nicht unbedingt in dem erreichten Niveau unterscheiden, sondern durch den Tonunterschied zwischen der vorletzten und der letzten Silbe. Damit wird hier an diesem Punkt das Vorhandensein von statischen Tonstufen in Frage gestellt. minor continuation Outnd
! vu
\ major continuation raccidtnl.
}finanty j'ii pri« peur.
> ndunitlon Quill· hoinurl • command
AJdoz · nous. • quMtlon Vousnevoyeipu?
>hlghpar*nth»ii Monsieur l'agam.
> Implication Jevois fortbin). • Iowparanthuts Chin Madam·.
10 > Inttnogatlon Quapula-Jilalra?
Abbildung 2.1: Ehe zehn Basiskonturen der französischen Intonation nach Delattre (aus Delattre 1966-7, S. 173)
Diese ersten systematisch zusammengestellten Ergebnisse über die französische Intonation sind in der Intonationsforschung bis heute von verschiedenen Forschern präzisiert und korrigiert worden. Ich möchte hier nur kurz die Problembereiche aufzeigen, eine ausführliche Diskussion findet sich in Wunderli (1978).
Intonationsbeschreibungssysteme
21
Carton (1974) kommt nach der Untersuchung eines Korpus gesprochener Sprache zu dem Ergebnis, daß die Opposition continuation mineure vs. continuation majeure nur in einem Subsystem des Französischen, nämlich im niveau de la langue soigne und im Vorlesestil vorkommt. Wunderli (1987) hat die verschiedenen Varianten der Parenthese beschrieben und die Bedingungen untersucht, unter denen sie auftreten. Leon (1970) beschreibt weitere Intonationsverläufe, die exklamative Funktion haben können. Eine ausführliche Darstellung der französischen Intonation, die einerseits auf den Arbeiten von Delattre basiert und andererseits moderne computergestützte experimentalphonetische Verfahren und Erkenntnisse der Phonetik miteinander verbindet, findet sich in Rossi et al. (1981). Dort wird versucht, ein Interpretationsmodell zu entwickeln, das es ermöglicht, von den akustischen Daten über Wahrnehmungsexperimente auf die phonologisch relevanten Intonationskonturen zu schließen. Das Interpretationsmodell verarbeitet das phonetisch-akustische Material zu prosodischen Einheiten, die mit einem Intonemnamen benannt werden. Die Zuordnung der segmentalphonetischen Bezeichnungen werden manuell vorgenommen. In einer ersten Verarbeitungsstufe wird das akustische Material mithilfe mikroprosodischer Regeln geglättet. In der zweiten Stufe werden dann mithilfe eines Stilisierungsverfahrens Intoneme zugeordnet. Das Modell ist auch in Wahrnehmungstests überprüft worden. Für mein Untersuchungsinteresse steht das verwendete Kategoriensystem, das von Rossi (1985) noch ergänzt worden ist, im Mittelpunkt. Rossi postuliert die folgenden acht phonologischen Basiseinheiten, die er ebenso wie Delattre anhand ihrer Funktionen benennt: 1. 2. 3. 4. 5. 6. 7. 8.
contimiatif majew (CT) coDÜouatif appellatif (C A) onumeratif (EN) conünuatif mineur (et) cooclusif majew (CC) conclusif mineur (cc) ictus molodique (1C) accent (ononciaüf) (AC oder auch AE)
Diese Einheiten ähneln weitgehend denen von Delattre. Zusätzlich zu Delattre postulieren Rossi et al. die Einheiten enumeratif und conclusif mineur, sowie die externen Akzente ictus melodique und accent enonciatif. Außerdem wird eine weitere Beschreibungsebene eingeführt, auf der Gruppen von Intonemen zu einer höheren phonologischen Einheit zusammengefaßt werden. Die Einheiten assertion (AS), und parenthese (PAR) bzw. incidente (IN) sind Einheiten, die mehrere von den obengenannten Basiseinheiten beinhalten (vgl. Rossi et al. 1981, S. 203): AS
- >
( CT, 1C ), CC
22
Intonationsbeschreibungssysteme
IN bzw. PAR - >
( et ), cc
Die Basiseinheiten können als Grundbestandteile der Intonationskonturen angesehen werden. Sie sind akustisch anhand der akzentuierten Silben (interne Akzente) beschreibbar. Die Bestimmungsmerkmale sind: die erreichte Tonstufe, Dehnung und die Position innerhalb einer morphologischen bzw. syntaktischen Einheit. Bei den Tonstufen werden sechs Stufen unterschieden, die von der tiefsten zur höchsten mit dem folgenden Namen benannt werden: infra-grave, grave, medium, infra-aigu, aigu und sur-aigu. Abbildung 2.2 zeigt einen Überblick über die von Rossi et al. angenommenen Intoneme mit ihren jeweiligen Bestimmungsmerkmalen.
phonologische Einheit
akustische Merkmale Tonstufe Dehnung
CT et CA CC cc
infra-aigu medium hohes infra-aigu grave/infra-grave
AE b z w . AC
+ frequence -t- intensite + frequence
1C EN
50» 50% 50« 100« -
morphologisch/syntaktische Merkmale (Position) Endposition Endposition Endposition Endposition Anfangsposition Anfangsposition
Abbildung 2.2: Formen der Intoneme nach Rossi 1981
Die Einheiten AS, IN bzw. PAR sind komplexere Einheiten. Sie sind akustisch nicht alleine anhand der akzentuierten Silbe bestimmbar, sondern nur anhand von zwei oder mehreren Polen: dem Ansatz (attaque), der Silbe vor dem Akzent (pretonique) und der akzentuierten letzten Silbe. Rossi (1980) stellt explizit Überlegungen zur Syntax dieser Einheiten für einen Teilbereich dieser Intonationsstrukturen vor, nämlich für die assertive Intonation Die syntaktischen Regeln sehen bei Rossi folgendermaßen aus: Rl R2 R3 R4 R5 R6 R7 R8 R9 RIO
AS PROG TERM CT
-: -: -: -:
CT+ -: CC ct EN ct 1C
PROG, TERM {CT.CT+.IC} CC { (ct),(EN) } infra-aigu (et) sur-aigu { (ct),(EN) } grave et EN { haut-m&iium, 1C - > 0 } haut-modium (vgl. Rossi 1980, S. 205)
Intonationsbeschreibungssysteme
23
Diese Grammatik scheint mir noch nicht ganz ausgearbeitet zu sein. Es fehlt ein Lexikon. Die Regel R3 und R7 sind überflüssig, R3 und R6 können zusammengelegt werden, da sie nicht verzweigend sind. Außerdem vermischt Rossi hier syntaktische und lexikalische Kategorien, denn die Angaben infra-aigu, sur-aigu, haut-medium und grave, die sich auf die Tonstufen beziehen, auf denen diese Einheiten realisiert werden sollen, sind wohl besser als lexikalische Einträge eines prosodischen Lexikons zu verstehen und sollten dann durchgängig für alle Einheiten in ein prosodisches Lexikon geschrieben werden. Eine Umformulierung der Syntaxregeln, die sich meiner Meinung nach aus der Arbeit von Rossi ergibt, könnte folgendermaßen aussehen (optionale Elemente sind eingeklammert): Rl R2 R3 R4 R5
AS PROG PROG PROG TERM
- > - > - > -> - >
PROG, TERM (et), (EN), CT (et), CT+ 1C (et), (EN), CC
Das dazugehörige prosodische Lexikon könnte aus der Tafel (Abb. 2.2) bestehen. Die Einheit 'AS' wäre dann nicht mehr als selbständige lexikalische Kategorie, sondern als syntaktische Kategorie wie auch PROG und TERM zu verstehen und müßte nicht anhand der Merkmale in der Tafel bestimmt werden. Die bei Delattre bereits beschriebene Einheit der question kommt auch in der Beschreibung von Rossi et. al. vor. Allerdings hat diese Einheit keinen eindeutigen Status. Einerseits ist sie als komplexe Einheit aus anderen Einheiten zusammengesetzt, vergleichbar den Kategorien AS und PAR, andererseits ist sie auch durch eine Tonstufe charakterisiert, nämlich das aigu, wohingegen die anderen komplexen Einheiten nämlich PAR und AS nicht eigene akustisch/auditive Merkmale haben, sondern aus zwei oder mehr Basiseinheiten zusammengesetzt werden. Letzteres läßt sich sicher konsistenter innerhalb einer Syntax der Intonationszeichen beschreiben, wie sie oben dargestellt worden ist. Rossi et al. schlagen zwar eine Syntax vor, ordnen aber der 'komplexen* Einheit QU keinen eindeutigen Status zu. Dies Problem ergibt sich meiner Meinung nach u.a. daraus, daß Rossi et al. z.T. eine satzorientierte Herangehensweise wählen, in der Sätze die größte Analyseeinheit darstellen, und den Intonationsmustern auf Sätzen eine Funktion zugewiesen werden muß. Eine diskursorientierte Herangehensweise, die in der linguistischen Beschreibung zwischen segmental-syntaktischen und intonatorisch-syntaktischen Einheiten trennt, könnte das auf einem Satz realisierte Intonationsmuster der QU z.B. nicht als eigenständige Einheit, sondern als ersten Bestandteil einer größeren intonatorischen Einheit, die auf segmentaler Ebene z.B. einer Frage-Antwort-Sequenz entspricht, ansehen.
24
2.1.2.
Intonationsbeschreibungssysteme
Der externe Akzent
Der externe Akzent unterscheidet sich von dem oben beschriebenen internen Akzent durch seine Position innerhalb einer intonatorischen Einheit: er fällt auf den Anfang eines akzentuierbaren Syntagmas bzw. auf normalerweise nicht akzentuierbare Einheiten, wie z.B. Artikel oder Präpositionen. Die Grenzen eines intonatorischen Syntagmas sind durch morphologische (Wort) oder syntaktische (Syntagma) Kriterien bestimmt. Auch in der Form wird der externe Akzent z.T. vom internen Akzent unterschieden. Während der letztere neben der FO-Variation als wichtigen Parameter die Dauer hat, kann beim externen Akzent der Vokal nicht gedehnt werden. Daraus folgt auch, daß auf dem Vokal selber keine Tonhöhenvariation realisiert werden kann. Der externe Akzent besteht in der Regel akustisch gesehen aus einem abrupten FO-Sprung um ein bis zwei Niveaus nach oben. Obwohl dieser Akzent auch als accent d'intensite bezeichnet wird, ist die Rolle der Intensität nicht eindeutig. Fonagy (1980a) stellt nach Messungen an nicht weiter spezifizierten Material fest, daß die sogenannten Intensitätsakzente nicht durch zusätzliche Intensität, sondern durch FO-Variationen realisiert werden. Dagegen stellt Buff (1985) eine Untersuchung von journalistischen Texten die von professionellen Radiosprechern gesprochen werden. Er stellt fest, daß sowohl die externen als auch die internen Akzente zum großen Teil mit zusätzlicher Intensität realisiert werden. Rossi (1980, 1985) unterscheidet drei Typen von nicht-finalen intonatorischen Einheiten im Französischen, die er sowohl nach Formen als auch nach Funktionen eindeutig voneinander abgrenzt: den ictus melodique, den accent enonciatif und den accent emphatique. Bei allen dreien handelt es sich um Tonhöhenbewegungen auf nicht-finalen Silben, sie unterscheiden sich durch die Höhe der Tonhöhenbewegung. Der ictus melodique besteht aus einem Tonhöhensprung auf einer nicht-finalen Silbe im Niveau medium oder bis ins infra-aigu. Es handelt sich bei diesem Tonhöhensprung nach Rossi's Begriffssystem nicht um einen 'Akzent', obwohl der Tonhöhensprung an einer Stelle realisiert wird, an der ein externer Akzent möglich wäre, sondern es handelt sich um den erhöhten Ansatz einer terminalen Kontur. Abbildung 2.3 zeigt diese Kontur in schematischer Form. 1C
1C
\
Vc 11 est i
rriv
*
cc Jean Claude
Abbildung 2.3 ictus molodique (aus Rossi 1980, S. 197)
Intonationsbeschreibungssysteme
25
Ich werde im folgenden diese Kontur allerdings trotzdem unter den Oberbegriff des externen Akzents fassen, da es zumindest in der Form gemeinsame Beschreibungsmerkmale gibt. Der accent enonciatif ist durch eine Tonhöhenbewegung bis in das Niveau aigu gekennzeichnet. Rossi (1985) beschreibt seine akustische Form folgermaßen: "AE est realise par un relief de la melodic et de l'intensite qui caracterise l'ictus melodique; la montee est rapide et breve et atteint g£neralement le niveau aigu; lorsque le AE se combine avec l'accent interne, notamment dans les monosyllabes, le relief de ce dernier se deplace d'un niveau intonatif. En dehors de la nature de son relief, l'accent enonciatif est caracterise par son mouvement rapide: l'augmentation de duree qui peut eventuellement l'accompagner n'est pas significative et ne peut lui confferer le role domarcatif qu'assument par exemple les intonemes continuatifs." (S. 147)
Der accent emphatique ist — ebenso wie andere emphatische bzw. expressive Intonationskonturen — durch eine größere Bandbreite der Tonhöhe gekennzeichnet. Er geht über das Niveau des aigu hinaus und wird im sur-aigu realisiert. Die genaue akustische Form hängt, nach Rossi, von dem expressiven Wert ab, der ausgedrückt werden soll. Genauere Angaben zu verschiedenen Formen und expressiven Werten macht Rossi jedoch nicht. Kennzeichnend für die Untersuchungen zum externen Akzent ist die Feststellung, daß es sich bei diesem Akzent um ein schwer faßbares Phänomen handelt. Fonagy führt z.B. eine Reihe von Wahrnehmungexperimenten durch, in denen er Franzosen beurteilen läßt, welche Silben akzentuiert sind. Das Ergebnis sind sehr heterogene Urteile. In einem weiteren Experiment sollten Franzosen die beiden folgenden und weitere ähnliche Äußerungen auf ihre Emphase beurteilen: ... ...
il est plus pur que l'a u tre. il est plus p u r que l'a u tre
(vgl. Fonagy 1980a, 137)
Das Ergebnis war, daß diese Äußerungen für identisch gehalten wurden. Fonagy zieht daraus den folgenden Schluß: "En tachant de determiner la place de l'accent dans la phrase, on a l'impression que l'accent en franc.ais est souvent moins marque, plus "fuyant" que dans les autres langues romanes, dans les langues germaniques et slaves ou dans le hongrob." (S. 130)
Unter welchen Bedingungen dieser Akzent auftritt, darüber gibt es noch kein genaues Wissen. Fonagy bestimmt ihn deshalb als probabilistischen Akzent, dessen Vorkommen durch eine Reihe von Variablen bedingt ist. Unter anderen haben Fonagy, Lucci Leon und Rossi auf die folgenden hingewiesen: Textsorten bzw. Sprechstile, Wortlänge, Silbenstruktur, Wortart und Informationsverteilung. Externe Akzente kommen besonders häufig bei professionellen Radiosprechern (Buff 1985), Fonagy/Fonagy (1976), politischen Rednern (Leon 1971), Lehrern und Intellektuellen (Lucci 1980 nennt den externen Akzent dementsprechend accent didactique) vor. Der
26
Intonationsbeschreibungssysteme
externe Akzent gibt diesen Texten einen bestimmten Rhythmus, der sie von anderen Textsorten und Sprechstilen unterscheidet. Besonders ausgeprägt ist diese rhythmische Tendenz in journalistischen Texten, in denen der externe Akzent häufig auf zwei oder drei direkt aufeinanderfolgende Silbe fällt, was einen Eindruck von Unruhe vermittelt und Aufmerksamkeit fordert. (Staccato-Rhythmus bei Fonagy 1980a). Neben dem allgemeinen Kriterium der Textsorte spielen die Faktoren Wortlänge, Silbenstruktur und Wortart eine Rolle (Lucci 1980). Je länger das Wort, desto höher die Wahrscheinlichkeit eines externen Akzents auf der ersten Silbe. Fängt ein Wort mit einem Konsonanten an, ist die Wahrscheinlichkeit eines externen Akzents größer als bei Worten, die mit einem Vokal beginnen. Was die Wortarten betrifft, so zeigt die Untersuchung von Lucci, daß die seltener vorkommenden Wortarten (Numeralia und Komparativwörter) prozentual häufiger akzentuiert werden als die häufiger vorkommenden Substantive, Adjektive und Verben. Rossi (1985) untersucht Zusammenhänge zwischen der Informationsverteilung in Sätzen und dem Vorkommen von externen Akzenten. Er weist dem accent enonciatif eine Thematisierende Funktion zu. Einheiten, die wegen syntaktischer Stellungsbeschränkungen weder die Rhemaintonation CC tragen noch extrapoliert werden können, wie z.B. Verben, können durch externe Akzente als rhematische Elemente markiert werden.
2.1.3.
Beschreibung von Intonation in Diskursen
Die beiden Beschreibungssysteme des internen und externen Akzents sind miteinander kompatibel (vgl. Rossi 1985) und können in ein System integriert werden, das es auch erlaubt, spontane Sprache in Diskursen zu beschreiben. Einige mögliche Modifikationen, die sich aus der Arbeit mit Intonation in spontan gesprochener Sprache ergeben, werden in Kapitel 5 diskutiert. An dieser Stelle soll noch ein anderes Beschreibungssystem vorgestellt werden, das explizit für die Beschreibung spontaner Sprache in Diskursen entwickelt worden ist. Mertens (1987) entwirft ein relationales Modell für die französische Intonation, das er in einer Implementierung in PROLOG expliziert. Er baut auf den Arbeiten von van Dooren/van den Eynde (1982) auf, die für das Niederländische ein Zwei-Ebenen-Modell mit zusätzlicher, sekundärer Modifikation der Tonhöhenniveaus entwickelt haben. Van Dooren/van den Eynde unterscheiden zwei primäre Tonhöhen: HIGH und LOW, die durch Tonhöhenunterschiede von mindestens einer Terz (bei Mertens mindestens 5 Halbtönen) markiert sind. Diese primären Tonhöhenstufen können durch Tonhöhenunterschiede von einem bis zwei Halbtönen bei Mertens mindestens 2 Halbtöne) modifiziert werden. Diese modifizierende Faktoren werden HEIGHTENING und LOWERING genannt. Grundbestandteil der intonatorischen Beschreibung ist die Silbe. Für jede Silbe wird das Tonhöhenniveau bestimmt, bei akzentuierten Silben, auf denen Tonhöhenvariationen realisiert werden, werden zwei Tonhöhenniveaus bestimmt. Die Bestimmung der Tonhöhe
27
Intonationsbeschreibungssysteme
erfolgt allein in Bezug auf die vorhergehende Silbe. Es handelt sich also um eine rein lokale Niveaubestimmung. Nicht ganz klar ist mir der Status der beiden Einheiten 'EXTRA-HOCH' und 'EXTRA-TIEF'. Im theoretischen Teil werden sie von Mertens als Extremwerte der Bandbreite eines Sprechers bezeichnet, also mithilfe einer im relationalen, linearen Modell nicht vorgesehenen globalen Kategorie definiert (S. 71). In der Implementierung dagegen werden sie lokal als Tonhöhenunterschied zur vorhergehende Silbe von mehr als acht Halbtönen expliziert (S.291). Diese insgesamt acht Tonstufen werden als " Tonhöhenphoneme" (phoneme de hauteur) bezeichnet. Die für die semantische Interpretation relevante Einheit des 'Intonationsmorphems' (morpheme intonatif) ergibt sich aus der Zuordnung des Tonhöhenphonems zu einer 'Lokalisation' (localisation). 'Lokalisation' ist der Oberbegriff zu verschiedenen Silbentypen, die anhand der Merkmale akzentuiert/nichtakzentuiert und initial/final bestimmt werden. Abbildung 2.4 gibt einen Überblick über alle aus diesem Modell ableitbaren Intonationsmorpheme. Localisations non accentuees
accentuees
point initial
point final
accent initial
/h h \h /l 1 \1
/h h \h /l 1 \1
H L
accent f i n a l more 1 •ore 2 H* /H H \H /L L \L L-
H+ /H H \H /L L \L L-
Abbildung 2.4 Intonationsmorpheme nach Mertens 1987 (H, h = high; L, l = low; / = heightening; \ = lowering; H + = extra-high; L— = extra-low; Großbuchstaben bezeichnen akzentuierte, Kleinbuchstaben nicht-akzentuierte Silben), (aus Viertens 1987, S. 91).
Zusammenfassend kann man feststellen, daß in der französischen Intonationsforschung von Delattre bis Rossi eine deutliche Kontinuität in den Beschreibungssystemen besteht. Rossi erweitert zwar das Inventar an Intonemen, die zentralen Intoneme von Delattres Beschreibung werden aber auch bei Rossi verwendet. Ein Unterschied besteht in der Lokali sierung der bestimmenden Beschreibungseinheit. Während Delattre den Tonhöhenverlauf auf der gesamten Äußerung beschreibt, lokalisiert Rossi die phonologisch entscheidenen Tonhöhenparameter auf der Silbe des internen Akzents bei den Basiseinheiten und auf dem Ansatz, der Pretonique und der Akzentsilbe des internen Akzents bei den komplexen
28
Intonationsbeschreibungssysteme
Einheiten. Außerdem formuliert Rossi explizit eine Syntax der Intonationszeichen, die unabhängig von der segmentalen Syntax ist. Die Beschreibung der externen Akzente und internen Akzente kann in ein Beschreibungssystem integriert werden, wie es bei Rossi (1985) und auch in dem diskursorientierten Modell von Mertens (1987) der Fall ist.
2.2. Die deutsche Intonationsforschung In der deutschen Intonationsforschung gibt es drei zentrale Untersuchungsgegenstände: Akzente, Terminaltöne und Tonhöhenverläufe auf längeren Äußerungsteilen. Funktional gesehen werden die Akzente mit dem Begriff des Fokus zusammengebracht, die Terminaltöne mit dem des Satzmodus. Hier sollen drei verschiedene Richtungen der deutschen Intonationsforschung vorgestellt werden: 1. Ansätze, die auditiv oder experimental-phonetisch Tonhöhenverläufe auf längeren Äußerungsteilen beschreiben, 2. Zwei-Ebenen-Modelle und 3. ein hierarchisches Beschreibungssystem für Diskursintonation. Dabei geht es ebenso wie bei der Darstellung der französischen Intonationsforschung zunächst um die Darstellung der Modelle, die meist an Sätzen entwickelt worden sind und dann um die Darstellung der Anwendung auf Diskursintonation. Bei den älteren Arbeiten aus der Zeit vor den 80ziger Jahren wird kein Anspruch auf Vollständigkeit erhoben. Ich stelle nur die Beschreibungssysteme vor, auf die auch in der modernen Literatur zurückgegriffen wird. Eine umfassende Darstellung der deutschen Intonationsforschung bis in die Mitte der 70ziger Jahre findet sich in Gibbon (1976) und Girouard (1984).
2.2.1.
Ansätze, die längere Tonhöhenverläufe beschreiben
2.2.1.1. von Essen (1964) Gegenstand dieses grundlegenden Werks über deutsche Intonation sind die konventionellen intonatorischen Muster des Deutschen, die ein Studierender, der Deutsch als Fremdsprache lernt, beherrschen muß. Es geht also um die grammatikalisierbaren Einheiten und Funktionen deutscher Intonation. Der Ausspruch als die grundlegende intonatorische Einheit (vgl. Einleitung), wird anhand der folgenden Beschreibungskategorien beschrieben: 1. die Silben werden eingeteilt in unbetonte Silben, hervorgehobene Silben und Schwerpunktsilben. Die Schwerpunktsilbe ist definiert einerseits als die auffälligste Silbe eines Ausspruchs, andererseits als die letzte hervorgehobene Silbe eines Ausspruchs. 2. Die Tonhöhe der Silben wird auf vier Tonstufen idealisiert: tief, gehoben-tief, mittel, hoch.
Intonationsbeschreibungssysteme
29
3.' Wenn die Schwerpunktsilbe die letzte Silbe eines Ausspruchs ist, kann es innerhalb der Silbe Tonhöhenbewegungen (aufwärts oder abwärts) geben. Anhand dieser Kategorien teilt von Essen den Ausspruch intonatorisch in drei Teile: den Vorlauf, den rhythmischen Körper und den Nachlauf. Der Vor lauf geht vom Anfang bis zur ersten hervorgehobenen Silbe ausschließlich. Der rhythmische Körper umfaßt den Teil von der ersten hervorgehobenen Silbe bis zur Schwerpunktsilbe einschließlich. Der Nachlauf beginnt nach der Schwerpunktsilbe und geht bis zum Ausspruchsende. Ein Beispiel von von Essen (S. 27) veranschaulicht diese Kategorien:
· ·· ·
Das ganze Unternehmen ist nutzlos gewesen. Abbildung 2.5: Die Struktur des Ausspruchs nach von Essen
Für die phonologischen Kategorien entscheidend sind zwei Stellen: die Tonstufe der Schwerpunktsilbe und die Tonstufe und Richtung der Tonhöhe im Nachlauf. Alle Variationen im Vorlauf und im ersten Teil des rhythmischen Körpers gehören für v. Essen in den Bereich des emotionalen Ausdrucks und sind damit einer systematischen Beschreibung nicht zugänglich. Für das Deutsche unterscheidet v. Essen drei phonologisch distinktive Muster, anhand derer sich die "Ausspruchskategorie" des Ausspruchs bestimmen läßt. Die Ausspruchskategorie ist ein Begriff, der in Analogie zu dem syntaktischen Begriff des Satzmodus verstanden werden muß. Er unterscheidet die folgenden drei Ausspruchskategorien: terminal, progredient und interrogativ. In der folgenden Tafel sind die Ausspruchskategorien mit ihren jeweiligen phonologischen Merkmalen festgehalten: phonologische Merkmale Ausspruchskategorie
Schwerpunktsilbe
terminal
tief
progredient
mittel
interrogativ
tief
Nachlauf tief Mittel hochsteigend
Abbildung 2.6: Ausspruchskategorien und ihre phonologischen Merkmale nach von Essen.
Mir ist allerdings nicht ganz klar, warum v. Essen vier Tonstufen annimmt. Für die Bestimmung der phonologischen Kategorien reichen drei Tonstufen aus, um emotionale Variationen zu beschreiben, brauchte man noch weitere Tonstufen. Von einer Syntax der Intonation ist bei v. Essen nicht die Rede, da die grundlegende
30
Intonationsbeschreibungssysteme
Einheit der Ausspruch ist, und ein Ausspruch nur eine phonologisch relevante melodische Form hat. Kombinationen werden nur am Rande erwähnt, wenn er z.B. über die Anwendungen der progredienten Form spricht: "Unvollendete Aussprüche (hier: progrediente Form, F.J.) weisen gleichsam über sich hinaus auf etwas, das noch gesagt werden soll, also auf einen abschließenden, terminalen Teil." (S. 15). Nicht ganz klar ist mir allerdings, ob die progrediente Form eine Ausspruchskategorie ist, oder ob sie nur Teil eines Ausspruchs sein kann. Im zweiten Fall gäbe es eine Hierarchie, die sich in folgender Intonationssyntax verdeutlichen läßt: Ausspruchl - > Ausspruch2 - >
(progrediem), terminal (progredient), interrogativ
Ehlich/Rehbein (1979) wenden die Kategorien von v. Essen auf Diskurse an. Sie unterscheiden in der Regel vier Tonstufen (manchmal, bei Bedarf, auch fünf oder sechs). Jede Silbe bekommt 1. eine Tonstufe zugewiesen und wird 2. nach der Akzentuierungsstärke eingeteilt in "nicht akzentuiert", "akzentuiert" oder "stark akzentuiert". Abbildung 2.7 und 2.8 zeigen diese Kategorien und ihre Notationsweise. -
oo o
o 0
0
- 0 0 0
Ab«r ·
-
O
Rugnu9 hvttt doch rmhr Lirm 9tmachi.
o o o o o
-
o
o
o
~ o o o o Aber tin FIUO.MU0 hin· doch mehr Lirm gemacht.
Abbildung 2.7: Beispiel für die Intonationstranskription von Ehlich/Rehbein (aus: Ehlich/Rehbein 1979, S. 69)
-.1
o
o o o
o
wer hat das gesagt?
Abbildung 2.8: Beispiel für die Behandlung von Tonhöhenvariationen auf einer Silbe (aus: Ehlich/Rehbein 1979, S. 71)
Im Unterschied zu von Essen nehmen sie keine 'Glides' innerhalb einer Silbe an, sondern weisen einer Silbe zwei Tonstufen zu, wenn es Tonhöhenvariationen innerhalb einer Silbe gibt. Bei extremem Anstieg oder Abfall innerhalb einer Silbe werden die Tonstufen mit einer Linie verbunden (vgl. Abbildung 2.8). Von einer phonologischen Beschreibung, die von den Autoren angestrebt wird, ist dieses System, das versucht, alles zu notieren, weit entfernt. Mir scheint es theoretisch eher auf der Ebene einer phonetischen Beschreibung zu liegen, in die ja notwendigerweise auch sprachliches Wissen des Phonetikers eingeht.
Intonationsbeschreibungssysteme
31
Für eine Transkription von Diskursintonation scheint mir dieses System nicht geeignet zu sein. Einerseits verlangt es zu große Genauigkeit, indem alle Silben, auch die nicht akzentuierten, auf ihre Tonhöhe bestimmt werden müssen. Andererseits ist es für eine genaue Wiedergabe der Tonhöhe wiederum zu ungenau, da das sprachliche Kontinuum auf vier bzw. manchmal fünf oder sechs Tonstufen festgelegt werden muß. Eine abfallende Linie z.B., die auf mehr als sechs Silben kontinuierlich fällt (ohne deswegen in extreme Bereiche zu kommen), ist mit diesem System nicht eindeutig darstellbar.
2.2.1.2. Die tonetische Transkription: Kohler 1977, Pheby 1975 Kohler (1977) und — ausführlicher — Pheby (1975) haben das Halliday'sche Intonationssystem auf das Deutsche übertragen. Dieses System arbeitet mit einem Inventar von "Tönen", d.h. Tonmustern oder Konfigurationen der Tonhöhe, die in der gesprochenen Sprache identifizierbar sind, und deren Selektion aus dem für eine Sprache vorhandenen Inventar bedeutungsunterscheidende Funktion hat. Eine Tongruppe, d.h. die sprachliche Einheit, in der ein Tonmuster ausgewählt wird, bekommt eine interne Struktur zugewiesen. Sie besteht aus l bis n Takten. Ein Takt ist definiert als die Einheit die mit einer akzentierten Silbe beginnt und vor der nächsten akzentuierten Silbe endet. Von den Takten einer Tongruppe ist einer besonders hervorgehoben: er beinhaltet die Tonsilbe, die den Anfang der Tonstelle bildet. Die 'Tonstelle' (Pheby) bzw. 'Nukleus' (Kohler) ist die Stelle auf der das Tonmuster realisiert wird. Sie besteht aus der Tonsilbe' (Kohler : 'Nukleussilbe') und fakultativ auch noch aus dem Nachlauf, den nichtakzentuierten Silben mit zum Ende des Taktes bzw. den folgenden Takten bis zum Ende der Tongruppe (vgl. Abbildung 2.9). Tonmusternummer
charakteristische Tonhöhenbewegung: fallend
/ / ! . _ . . ~ ._ . / / « (1) # wir haben schon angefangen # «
»
Tongruppengrenze Satzgrenze
l
Tonsilbe Tongruppe Abbildung 2.9: Struktur der Tongruppe nach Pheby (aus Pheby 1975, S. 36)
Die phonologisch bedeutungstragende Einheit des Tonmusters entspricht also der Tonhöhenbewegung auf dem letzten Teil eines Äußerungsstücks, ebenso wie bei v. Essen (wenn es auch einigere kleinere Benennungsunterschiede gibt). Im Unterschied zu v. Essen postuliert Pheby fünf Tonmuster, zusätzlich zu den drei Typen von v. Essen (steigend, gleichbleibend, fallend) noch die beiden Typen steigend-
32
Intonatioosbeschreibungssysteme
fallend und fallend steigend, die er explizit als nicht- zusammengesetzte Töne sondern als gleichberechtigte Tonmuster neben die drei anderen stellt, (ebenso wie Halliday fürs Englisch). Bei der Beschreibung der Funktionen faßt er die fünf Töne allerdings in Pheby 1981 und 1983 wieder zu drei Tönen zusammen und erhält die auch von v. Essen beschriebenen drei Tonmuster: 1. / mit der Variante v : interrogativ 2. \ mit der Variante : terminal 3. — : progredient
Kohler (1977) nimmt noch einen weiteren Ton an. Er unterscheidet bei den steigenden Tönen nach dem erreichten Niveau, einmal hochsteigend und einmal mittelhoch-steigend. Sowohl bei von Essen als auch bei Pheby und Kohler gibt es eine problematische intonatorische Einheit, nämlich die progrediente Intonationskontur. In einer satzorientierten Herangehensweise ist diese Einheit leicht zu bestimmen: wenn sich die Tonhöhe am Satzende auf einer mittleren Tonstufen bewegt, wird die Kategorie progredient zugeordnet. Da sich die Tonhöhe aber auch an anderen Stellen auf einer mittleren, unmarkierten Tonstufe bewegt, kann ohne vorherige Festlegung der Einheiten (z.B. durch syntaktische Kriterien oder andere prosodische Kriterien wie Pause) die intonatorische Einheit 'progredient' in den meisten Fällen nicht zugeordnet werden. Mir scheint es für eine Diskursbeschreibung sinnvoller, diese Einheit nicht als intonatorisch-phonologische Einheit, sondern als den unmarkierten, keine Bedeutung tragenden Fall anzusehen.
2.2.1.3. Experimental-phonetische Beschreibung Oppenrieder (1988) stellt eine Untersuchung zu intonatorischen Merkmalen von Satzmodi vor, die im Rahmen eines DFG-Projekt erarbeitet worden war. Ziel der Untersuchung ist es, anhand phonetisch-akustischer Merkmale intonatorische Prototypen für Satzmodi, wie sie aus dem Modell von Altman (1987) ableitbar sind, zu bestimmen. Die Prototypen sollten anhand von Merkmalsbündeln mit den folgenden Parametern bestimmt werden: 1. Der Offsetwert, der der Wert 'hoch' bzw. 'tief annehmen kann, 'hoch' und 'tief werden bezogen auf den Gesamtumfang der FO der Äußerung. 2. Die Kontur der Hauptakzentsilbe, die die Werte 'konvex' bzw. 'konkav* und 'fallend' bzw. 'steigend' annehmen kann. 3. Die Dauer der Gesamtäußerung, die Dauer der Hauptakzentsilbe und die relative Dauer der Akzentsilbe, die als Verhältnis zur durchschnittlichen Silbendauer in der Äußerung berechnet wird.
Intonationsbeschreibungssysteme
33
4. Die Bandbreite der Gesamtäußerung (range) und die Bandbreite der Akzentkontur. Es wurden 18 Satzmodi untersucht. Aufgrund segmentaler Einschränkungen wurden jedoch nicht alle Prototypen mit jeweils dem anderen verglichen, sondern es wurden Paare oder Tripel aufgestellt, die die gleiche segmentale Struktur aufwiesen und sich nur in intonatorischen Eigenschaften unterschieden. Die Beispielsätze wurden in Perzeptionstest auf Identifizierbarkeit und Diskriminierbarkeit überprüft. Die gut identifizierbaren und diskriminierbaren Exemplare wurden einer akustischen Analyse anhand der obengenannten Parameter unterzogen. Ergebnis war, daß die zentralen Bestimmungsmerkmale der Intonationsmuster der Offsetwert und die Kontur der Hauptakzentsilbe waren, die Einheit, die bei v. Essen als Nachlauf und Schwerpunktsilbe und bei den tonetischen Ansätzen als Tonmuster bezeichnet wird. Die Tatsache, daß Oppenrieder mehr Satzmodi unterscheidet, ist auf das Zusammenspiel von segmentalen und intonatorischen Merkmalen zurückzuführen.
2.2.2.
Zwei-Ebenen-Modelle
Der älteste Ansatz, der zur Beschreibung der deutschen Intonation ein Zwei-Ebenen-Modell vorschlägt, ist von Isacenko und Schädlich (1966, 1970) entwickelt worden. Sie gehen von den folgenden drei Annahmen aus: — daß es im Deutschen zwei phonologisch relevante Tonstufen gibt: hoch und tief. — daß die phonologisch relevante Eigenschaft im Deutschen "Tonbrüche", d.h. Wechsel zwischen den Tonstufen sind. — daß der "Iktus" der relevante Bezugspunkt für die Wahrnehmung phonologischer Einheiten ist. "Iktus" bestimmen sie als Eigenschaft des Wortes folgendermaßen: "Als "Wort" wird hier ein Morphem oder eine minimale Verbindung von Morphemen angesehen, die selbständig in einer normalen, d.h. nicht-metasprachlichen Äußerung in der Umgebung /# #/ auftreten kann. Das Won ist eine Eingabe-Einheit, die aus dem lexikalischen Speicher gewählt und in die Äußerung eingesetzt wird. Prosodisch ist das Wort dadurch gekennzeichnet, daß es ein und nur ein silbisches Segment besitzt, welches gegenüber mindestens einem anderen silbischen Segment markiert ("hervorgehoben") werden kann. Dieses markierbare silbische Segment, welches nicht notwendigerweise mit der Silbe zusammenfallt, nennen wir Iktus." (S. 28/29)
Durch diese drei theoretischen Annahmen grenzen Isacenko/Schädlich sich von anderen Herangehensweisen ab, in denen der ganze Melodie verlauf bzw. Grundfrequenzverlauf
34
Intonationsbeschreibungssysteme
einer Äußerung beschrieben wird. Isacenko/Schädlich machen den Versuch aus dem kontinuierlichen, akustischen Material diskrete, lexikalisierbare Einheiten zu abstrahieren, nämlich die Tonbrüche zwischen den Tonstufen hoch und tief und ihre Stellung zum Iktus des nächsten Wortes. Ihre Methode ist experimental-phonetisch. Sie synthetisieren bzw. re-synthetisieren natürlichsprachliche Sätze mithilfe eines Vokoders entsprechend den von ihrem Modell voraussagbaren Mustern, wie z.B. der folgende, allseits bekannte Satz: Vorbereitungen sind ge die
alles ist be troffen
reit
Diese Sätze wurden von Versuchspersonen auf Natürlichkeit und verschiedene Funktionen hin beurteilt. Isacenko/Schädlich erhalten damit vier phonologisch relevante Einheiten: den präiktisch steigenden, den präiktisch fallenden, den postiktisch steigenden und den postiktisch fallenden Tondbruch (vgl. Abbildung 2.10). A steigender Tonbruch
B fallender Tonbruch
präiktisch postiktisch
Abbildung 2.10: Die phonologischen Einheiten nach Isacenko und Schädlich
Für die Funktionen übernehmen sie die drei Funktionen von v. Essen und fügen eine vierte hinzu: 1. 2. 3. 4.
interrogativ (v.Essen: interrogativ) Satzfragment (v.Essen: progredient) nicht-interrogativ (v.Essen: terminal) nicht interrogativ + kontrastiv
An anderer Stelle (1970, S. 61) interpretieren sie diese Funktionen in einer allgemeineren, abstrakteren Fassung: Die Einheiten der Gruppe A (steigende Tonbrüche) weisen auf etwas Kommendes hin und sind damit anaphorisch. Die Einheiten der Gruppe B weisen auf nichts hin, sondern phrasieren den Redeverlauf. Eine Syntax für diese Einheiten könnte also folgendermaßen aussehen: intonatorische Einheit — >
A* B
Intonationsbeschreibungssysteme
35
Dieses Modell ist von Bierwisch (1966) aufgenommen worden, der aus einer generativen Grammatik Äußerungen ableitet, die mit Information über phonologische Einheiten versehen sind. Antoniadis (1984) wiederum hat das Bierwisch'sche Modell in einen Sprachgenerator integriert. Auch Stock/Zacharias (1973) benutzten dieses Zwei-Ebenen-Modell von Isacenko/Schädlich in ihrer didaktisch orientierten Beschreibung der deutschen Intonation, was als ein Beweis für die grundlegende Bedeutung dieses Modells für die deutsche Intonationsbeschreibung angesehen werden kann. Nichtsdestotrotz ist das Modell von Isacenko und Schädlich wegen des unnatürlichen Klanges der Äußerungen viel kritisiert worden. Hauptkritikpunkt lag darin, daß es keinen Beweis dafür gibt, daß das, was ein Mensch aus dem unnatürlich klingenden Material herausinterpretieren kann, in natürlicher Sprache überhaupt vorkommt bzw. relevant ist. Die Arbeiten von Isacenko/Schädlich sind weder von ihnen selbst noch von anderen Forschern fortgeführt worden. Zwei-Ebenen-Modelle haben aber trotzdem in den 80ziger Jahren und zwar aufbauend auf Arbeiten von Pierrehumbert (1980) fürs Englisch auch in der deutschen Intonationsforschung starke Beachtung gefunden. Pierrehumbert (1980) schlägt ein sequentielles Zwei-Ton-Modell vor, das mit einem endlichen Automaten verarbeitet werden kann. Die Verkettung von aufeinander folgenden Hoch- und Tieftönen erzeugt den Tonhöhenverlauf eines Satzes. Dieses Modell ist von Wunderlich (1988), Fery (1988) und Uhman (1988) für die Beschreibung deutscher Intonation genutzt worden. Wunderlich (1988) übernimmt für seine Beschreibung der Intonationsmuster des Deutschen die Beschreibungsmethode, wie sie von der Holländischen Schule z.B. ('t Hart & Collier 1975, 't Hart 1984) entwickelt worden ist, die aus dem phonetisch-akustischen Material mithilfe von Stilisierungsverfahren Intonationskonturen ableiten. Eine erste Anwendung auf das Deutsche findet sich in Adriaens (1984). Wunderlich benutzt einen umfangreichen Korpus gesprochener deutscher Sätze und abstrahiert daraus Intonationsmuster des Deutschen. Die Beschreibungskategorien sind der FO-Verlauf auf der Akzentsilbe und ihrer Umgebung sowie (gegebenenfalls) der initiale oder finale FO-Verlauf der Intonationsphrase. Der FO-Verlauf wird idealisiert, sprecherspezifische Variationen und mikroprosodische Variationen werden korrigiert. Diese Muster wurden in einem zweiten Schritt synthetisiert und in Perzeptionsexperimenten überprüft. Abbildung 2.11 zeigt die so gewonnenen Intonationsmuster.
36
Intonations beschreibungssysteme
Abbildung 2.11:
A
Gipfelakzent
B
Brückenakzent
C
Fallend-Tiefakzent
0
Tiefakzent-Steigend
E
Echoakzent
F
Linker Brückenpfeiler
JM4
Intonationsmuster deutscher Sätze nach Wunderlich (aus Wunderlich 1988, S. 11; beidseitige Klammern bezeichnen Silben, die einen Satzakzent tragen, einseitige Klammern kennzeichnen die Grenze der Intonationsphrasen)
Diese Muster werden phonologisch in Anlehnung an Pierrehumbert (1980) mit den folgenden Kategorien beschrieben: - zwei Tonstufen: Hoch (H) und Tief (L). — Grenzton oder Nichtgrenzton. Die Nichtgrenztöne werden weiter unterschieden in Töne, die mit Akzentsilben verbunden sind (T*) und "freischwebende ('floating') Töne (T), die mit allen Silben einer durch Grenze oder Akzentsilbe begrenzten Domäne zu assozieren sind." (S. 13) Die Grenztöne werden unterschieden in initiale (% T) und finale (T %) Töne. Die folgende Tafel gibt einen Überblick über die möglichen Einheiten.
37
Intonationsbeschreibungssysteme
^"^—-^Einheiten Niveau
Grenztöne initial
Nichtgrenztöne final
Akzentsilbe
freischwebende Töne
H (Hoch)
% H
H %
H *
H
L (Tief)
% L
L %
L *
L
Abbildung 2.12: Die phonologischen Einheiten nach Wunderlich
Aus diesen Kategorien können nun die im empirischen Material beschriebenen sechs Intonationsmuster zusammengesetzt werden. Ob auch andere, theoretisch mögliche Kombinationen zulässig sein könnten, wird nicht diskutiert. A: B: C: D: E: F:
H* H* H L* % H L* L* H% L* H (H%) H* H
Gipfelakzent Brückenakzent Fallend-Tiefakzent Tiefakzent-Steigend Echoakzent Linker Brückenpfeiler
Für die Kombination dieser Intonationsmuster innerhalb einer Intonationsphrase stellt Wunderlich die folgenden Regeln auf: 1. Muster, die Grenztöne enthalten, können nur am entsprechenden Platz in einer Intonationsphrase vorkommen. (Anfang bzw. Ende) 2. Der Brückenakzent ist von einer koordinativen syntaktischen Struktur abhängig und damit nicht beliebig kombinierbar. 3. Es gilt die Regel, daß zwei Tiefton-Akzente nicht aufeinander folgen dürfen. Bei der Formulierung dieser Regeln wird deutlich, daß Wunderlich keine eigenständige Syntax der Intonation formulieren möchte. Er vermischt syntaktische Funktionen mit phonologischen Regeln (Punkt 2) und kommt zu Aussagen, die zumindest noch zu beweisen sind: denn warum sollten nicht zwei Tieftöne aufeinander folgen, wie es z.B. in dem Modell von Gibbon (1984) angenommen wird? Auch ist mir nicht ersichtlich, warum der Brückenakzent eine Basiseinheit sein soll, und nicht als aus zwei Akzenten, nämlich Typ F und C, bestehend analysiert wird. Uhmann (1988) arbeitet mit der gleichen Methode und innerhalb desselben Theorierahmens. Im Unterschied zu Wunderlich stellt sie jedoch nicht ein Inventar von Intonationsmustern für deutsche Sätze oder Phrasen auf, sondern trennt die phonologische von der syntaktischen Ebene und stellt ein Inventar deutscher Akzenttöne und Grenztöne auf. Abbildung 2.13 zeigt das phonologisch-intonatorische Inventar mit einer Beschreibung der phonetischen Realisierung.
38
Intonationsbeschreibungssysteme
Funktionstypcn AkzcnttDD
Phonologische Merkmale
Phonetische Realisierung
H*+T
fallender Fo- Verlauf durch die akz. Silbe, bezieht nachfolgende unakz. Silben ein
T*+H
steigender Fo- Verlauf durch die akz. Silbe bezieht nachfolgende unakz. Silben ein
Phonologisches Korrelat des
H*
Fo-Gipfel im Nukleus der akz. Silbe, kein
Merkmals
T»
Fo-Tal im Nukleus der akz. Silbe, kein Einfluß auf unakz. Silben
Grtruton
T%
Fokus-
Einfluß auf unakz. Silben
Phonologisches Korrelat der Phrasierungsregeln
H%
sprecherindividuelles Fo-Minimum (baseline) an der/den Phrasengrenzen Fo-Werte über dem Minimum und dem sprecherindiv. mittleren Niveau
Abbildung 2.13: phonologisches Inventar nach Uhmann 1988 (aus: Uhmann 1988, S. 76)
Die beiden weiteren möglichen Varianten des Akzenttons, nämlich H + T* und T + H* werden zwar mit den Mustern von Isacenko/Schädlich in Verbindung gebracht, dann jedoch ohne Begründung nicht berücksichtigt.
2.2.3.
integrierte Ansätze: Akzent + Tonhöhenverlauf
Gibbon/Selting (1983) haben ein Transkriptionssystem für Diskursintonation entwickelt. Dieses System basiert auf den theoretischen Arbeiten von Gibbon (1980) und Gibbon (1984), der eine Art Meta-Beschreibungssystem entwickelt hat, für die Intonation des Englischen und Deutschen und wahrscheinlich auch weiterer Tonhöhenakzentsprachen. Gibbon/Selting (1983) haben dieses Meta-System für die Beschreibung der deutschen Intonation (in einem Gespräch aus einer Rundfunksendung) konkretisiert. Selling (1987a) hat dieses System erweitert und auf anderes Diskursmaterial angewendet. Die metalokutive Hypothese (vgl. Kapitel 1) ist Grundlage der Beschreibung, was sich dadurch verdeutlicht, daß eine unabhängige Beschreibungsebene für Intonation verwendet wird. Das System arbeitet mit globalen und lokalen Kategorien: Akzenten, Endgrenztönen und Globalverläufen. Bei den lokalen Kategorien unterscheiden sie zwei Typen von Akzenten: eine Abweichung von der Grundlinie (base-line) nach oben (notiert als " + ") und eine Abweichung von der Grundlinie nach unten (notiert als " —"). Diese beiden Akzenttypen sind bei Gibbon (1984) eigenüich artikulatorisch als aufwärts bzw. abwärts gerichtete Impulse definiert. Die Tonhöhenbewegungen, die für eine Akzentbeschreibung im Vordergrund stehen müssen, sind nur als Korrelate der Impulse bezeichnet. Gibbon (1984) weist auch auf die Möglichkeit hin, den FO-Gipfel relativ zum Silbenkern zu verschieben und dadurch die Akzenttypen zu modifizieren (delayed accent). Diese Modifikationsmöglichkeit ist jedoch im Transkriptionssystem nicht berücksichtigt. Modifi-
Intonationsbeschreibungssysteme
39
Rationen von Akzenten durch Tonhöhensprünge werden durch Pfeile vor dem Akzent festgehalten: t + , l + , T- und 4-. Selling (1987a) schlägt vor, die Stärke des Akzents mit der Kombination verschiedener Zeichen, die z.T. auch in die segmentale Transkriptionszeile eingefügt werden, zu notieren: — ein einfacher Akzent bekommt nur ein Intonationszeichen in der Intonationszeile — ein stärkerer Akzent bekommt zusätzlich ein Akzentzeichen in der segmentalen Transkriptionszeile — bei einem besonders starken Akzent wird zusätzlich zum Intonationszeichen und dem Akzentzeichen noch das dazugehörige Wort unterstrichen. Die ikonische Darstellung in Abbildung 2.14 verdeutlicht diese Kategorien: F ( +
-t-
+
T--T -ix 'f
R ( -
-
4 -i
Abbildung 2.14: Ikonische Darstellung der Beschreibungskategorien von Gibbon und Selling (aus Selling 1987a, S. 782)
Für die globalen Beschreibungskategorien werden die Akzente zu rhythmisch kohäsiven Gruppen, den ( -frames) zusammengefaßt. Genaue Kriterien für eine kohäsive Gruppe werden nicht angegeben. Die folgenden Kriterien können berücksichtigt werden: Iteration von Akzenten, Gestalten, Rhythmus. Diese Gruppen von Akzenten werden mit Endgrenztönen und Globalverläufen weiter charakterisiert. Der Endgrenzton ist die Tonhöhenbewegung, die sich vom letzten Akzent bis zum Ende eines -frames erstreckt. Für die Endgrenztöne gibt es kein festgelegtes Inventar, sondern die Tonhöhenbewegung soll in der Transkription auditiv-phonetisch möglichst genau beschrieben werden und werden ikonisch transkribiert, wobei die Zeichen der Schreibmaschine Grenzen für die Genauigkeit setzen und eine Zuordnung zur segmentalen Struktur nicht gemacht wird. Anfangsgrenztöne werden bisher nicht berücksichtigt, könnten aber leicht in das System eingefügt werden. Als dritte Kategorie werden Globalverläufe notiert. Global verlaufe sind Tonhöhenbewegungen, die sich über ganze Gruppen von Akzenten ( -frames) bzw. auch mehrere Gruppen von Akzenten (-y-frames) erstrecken. Die Global verlaufe werden als Operatoren vor eine Gruppe geschrieben. Sie gelten für den ganzen folgenden eingeklammerten Ausdruck. Für Global verlaufe gibt es ebenso wie für die Grenztöne kein festgelegtes Inventar, sie werden ebenfalls auditiv-phonetisch möglichst genau beschrieben und folgendermaßen notiert: H für hoch, T für tief, S für steigend, S/F für steigend-fallend usw. Die Globalverläufe sind allerdings insofern eine kritische Kategorie, als nicht ganz klar ist, worauf sie sich beziehen: Beschreiben sie das Verhältnis der Akzentgipfel zueinander oder handelt es sich um die Linie, gegen die die unakzentuierten Silben tendieren? Und
40
Intonationsbeschreibungssysteme
lassen sich diese Kriterien überhaupt auditiv-phonetisch voneinander trennen? Zur Veranschaulichung führe ich hier noch einmal einen akustischen Ausdruck an, in dem diese Kategorien einer Äußerung zugeordnet worden sind: nn FREQUENCY 4001
300-
200·
,
" '
·
·
% · ·
.'
A'.'V»
1. · ^, ··..'.·>"'. '/.„
'
/
»
% \.':. .
100· sctreibn Se/ schreibn Se das hier driuf' . irt diese «nteruroer mit angebn, 0'
7ä
l'. 5
2
iTs
7"
3?54
BB7X4B : 109 - 1 1 2 UNGEFILTERT Transcription: schreib™ Se/ schreibin Se das hier drauf . und diese Rentonummer mit angebnt,
(+)vrice/
R( + write
+ it
here
-)/ on
F(+
+
and tnis pension number aJso gjve
Abbildung 2.15: Beispiel für das diskursorientierte Beschreibungssystem von Gibbon/Selting (aus: Selling 1987a, S. 780)
2.2.4. Zusammenfassung: phonologische Kategorien des Deutschen Die Darstellung dieser verschiedenen Ansätze zeigt, daß die Intonationsbeschreibungen des Deutschen sowohl in den Beschreibungsparametern als auch in den postulierten phonologischen Kategorien sehr heterogen sind. Einige beschreiben den Tonhöhenverlauf auf ganzen Äußerungen oder Äußerungsteilen, andere nehmen nur den Akzent als intonatorische Einheit, wiederum andere nehmen bestimmte "ausgezeichnete" Akzente und den folgenden Tonhöhenverlauf bis zum Ende einer sehr unterschiedlich bestimmten intonatorischen Einheit als relevante Einheiten für ihre Beschreibung. Unterschiede gibt es auch bei den als (linguistisch) relevant eingestuften Tonstufen; die Zahl schwankt zwischen zwei und vier Tonstufen. Schließlich ergeben sich aus diesen unterschiedlichen Beschreibungsparametern auch unterschiedliche phonologische Kategorien: die Zahl schwankt zwischen drei und sechs. Inwieweit diese Unterschiede darauf zurückgehen, daß unterschiedliche Textsorten die Grundlage für die verschiedenen Beschreibungssysteme bilden (vgl. Gibbon 1981) oder ob fehlende Bezüge der Intonationsforscher aufeinander zu dieser unübersichtlichen Situation geführt haben, kann hier nicht entschieden werden. Eine weitere mögliche Erklärung für die Heterogenität der Beschreibungskategorien kann davon ausgehen, daß das beschriebene Material kontinuierliche Daten sind, die für eine Beschreibung in Kategorien geteilt
Intonationsbeschreibungssysteme
41
werden müssen. Nimmt man an, daß ein geübter Intonationsforscher den Grundfrequenzverlauf einer Äußerung "hören" kann, dann stellt sich die Frage, zu welchen Kategorien er greift, um diesen Verlauf zu beschreiben.
2.3. Vergleich der deutschen und französischen Beschreibungssysteme In diesem Kapitel sollen Probleme zusammengestellt werden, die in den Beschreibungssystemen der beiden Sprachen Französisch und Deutsch unterschiedlich gelöst werden und damit auf mögliche Unterschiede in den Intonationssystemen der beiden Sprachen hindeuten. Es sollen drei Problembereiche diskutiert werden: 1. die Anzahl der Tonstufen, 2. die Behandlung der Kategorie des Akzents und 3. Überlegungen zur Intonationssyntax.
2.3.1.
Anzahl der Tonstufen
Im Französischen werden zwischen vier (bei Delattre) und acht (bei Mertens) Tonstufen unterschieden. Rossi/Chafcouloff (1972) haben in Perzeptionstests festgestellt, daß französische Muttersprachler sechs Tonstufen unterscheiden können, für die Beschreibung der phonologischen Einheiten verwenden Rossi et al. jedoch ebenso wie Delattre vier Tonstufen. Die beiden Extremwerte, das Niveau des sur-aigu und des infra-grave bekommen ebenso wie bei Mertens die Extremwerte extra-high und extra-low einen anderen Status zugewiesen, indem sie zur Beschreibung expressiver Varianten verwendet werden. Von den vier Tonstufen werden bei Delattre und bei Rossi et al. drei für die Beschreibung von Steigungen verwendet, d.h. anhand der Tonstufen werden die steigenden Tonhöhenbewegungen drei unterschiedlichen Typen zugeordnet. Bei Mertens (1987) werden die Steigungen vergleichbar unterschieden, zusätzlich werden auch die Tonhöhenfälle anhand der Niveaus in drei Typen geteilt. Im Deutschen dagegen variiert die Anzahl der angenommenen Tonstufen von zwei bei Isacenko/Schädlich, Wunderlich und Uhmann, über drei bei Pheby bis zu vier bei von Essen. Letzterer benutzt zur Beschreibung der phonologischen Einheiten allerdings auch nur drei der vier Tonstufen. Das System von Gibbon und Selling ist im Hinblick auf Tonstufen komplexer. Es werden zwar für die Kategorien jeweils die Werte 'hoch', 'mittet' und 'tief zugelassen, also ebenso wie bei Pheby und von Essen drei Niveaus angenommen. Diese Kategorien können aber miteinander verbunden werden, so daß sich wesentlich mehr Tonstufen ergeben. In dem oben angeführten Beispiel kann man eine Unterscheidung von mindestens fünf Tonstufen annehmen. Nimmt man die beiden die Akzente modifizierenden Faktoren t und l, dann kann man noch zwei weitere Tonstufen ergänzen. Allerdings könnte man auch diese Extremwerte dem Bereich der emphatischen Zeichen zuordnen, eine Unterscheidung, die bei Gibbon/Selting zwar bewußt nicht gemacht wird, die aber an dieser Stelle zu einer besse-
42
Intonationsbeschreibungssysteme
ren Vergleichbarkeit mit den französischen Systemen führt. Trotz dieser sehr komplexen Tonhöhenverwendung kann man jedoch auch für das System von Gibbon/Selting festhalten, daß es lokal nur eine Unterscheidung zwischen drei Tonstufen gibt. Hier scheint mir ein fundamentaler Unterschied zwischen dem Deutschen und dem Französischen zu liegen. Während im Deutschen drei Niveaus zur Beschreibung nicht-expressiver Intonationsmuster ausreichen, es sogar mehrere Zwei-Ebenen-Modelle gibt, gibt es keine französische Beschreibung, die weniger als vier Niveaus verwendet. Dieses Ergebnis weist auf eine größere Bedeutung der Niveauunterscheidung im Französischen hin. Besondere Bedeutung scheint diese Niveauunterscheidung für den Bereich der steigenden Tonmuster zu haben.
2.3.2. Die Kategorie Akzent In beiden Intonationsbeschreibungen kommt die Kategorie des Akzents vor. Schon in Kapitel l wurde ein wesentlicher Unterschied zwischen dem deutschen und französischen Akzent hervorgehoben: Während im Deutschen der Akzent mit wenigen Ausnahmen (z.B. in Korrekturen) innerhalb des Wortes regelmäßig auf den Dctus fällt, gibt es im Französischen einen Akzenttyp, der regelmäßig nicht auf den Iktus (d.h. im Französischen die letzte Silbe) fällt. D.h. anhand der Akzentposition werden im Französischen zwei Akzenttypen unterschieden, nämlich der interne und externe Akzent. Interessant ist die weitere Unterscheidung der Akzenttypen im Französischen und Deutschen. Während im Französischen der externe Akzent anhand der Tonstufen und der interne Akzent anhand der Tonstufen und der Konfiguration 'steigend' versus 'fallend' differenziert wird, werden im Deutschen nicht die Niveaus (s.o.) sondern die Konfigurationen zur Unterscheidung verwendet. Bei den Konfigurationen wird nicht nur zwischen steigend und fallend, sondern auch 'gleichbleibend', 'Gipfel' (vgl. 'Hochakzent' bei Wunderlich und Uhmann) und 'fallend-steigend' (vgl. '-' Akzent bei Gibbon/Selting, 'Tiefakzent' bei Wunderlich und Uhmann) unterschieden. Diese Konfigurationen können auch im Rahmen einer pitch accent theory als zeitliche Beziehungen zwischen Tonhöhengipfel und Iktussilbe expliziert werden, worauf in Kapitel 4 noch ausführlicher eingegangen werden soll. Eine Beschreibung der französischen Akzente im Rahmen einer pitch accent theory ist mir dagegen nicht bekannt. Allerdings wird diese Vielfalt der deutschen Akzente nicht in alle Beschreibungssysteme aufgenommen. V. Essen unterscheidet nur die Akzentstärke und beschreibt Tonhöhenbewegungen nur als Grenzton. Pheby's Tonmuster beschreibt ebenfalls nicht den Akzent, sondern eine Einheit aus Akzent und Grenzton, und auch in dem modernen System von Gibbon und Setting werden nur zwei Akzenttypen unterschieden, die aber in vielfältiger Weise mit den mindestens fünf Grenztönen interagieren können. Wunderlich und Uhmann dagegen unterscheiden vier Akzenttypen und nur zwei Grenztöne. Der Akzent und der Grenzton scheinen im Deutschen zwei eng miteinander verbundene Phänomene zu sein. Eine theoretische Klärung des Status der beiden Einheiten und experimental-phonetische
Intonationsbeschreibungssysteme
43
Unterscheidungen zu diesen Phänomenbereich stehen noch aus. Festzuhalten bleibt an dieser Stelle, daß der deutsche Akzent im Hinblick auf Konfigurationen vielfältiger zu sein scheint als der französische. Außerdem gibt es eine interessante Interaktion der Beschreibungskategorien Akzent und Grenzton, was im Französischen nicht möglich ist, da der interne Akzent per definitionem auch gleichzeitig Grenzton ist. Interaktionen können sich nur dann ergeben, wenn ein externer Akzent auf ein einsilbiges Wort fällt, das gleichzeitig letztes Wort der prosodischen Einheit ist. Der interne Akzent bleibt dann aber auch erhalten, er wird allerdings ein Tonhöhenniveau höher realisiert (vgl. Rossi 1985).
2.3.3.
Intonationssyntax
Syntaxregeln, die Basiseinheiten zu intonationssyntaktischen Einheiten zusammenfassen, sind nur von zwei Autorengruppen explizit formuliert worden. Rossi et al. schlagen eine Intonationssyntax für einen ausgewählten Bereich der französischen Intonation vor, und Gibbon/Selting verwenden intonationssyntaktische Regeln zur Beschreibung deutscher Diskursintonation. In der Formulierung der intonationssyntaktischen Regeln tritt ein grundlegender Unterschied zwischen deutscher und französischer Intonation zu Tage. Rossi et al. verwenden Hierarchien innerhalb der Basiseinheiten zur Formulierung intonationssyntaktischer Einheiten: 'hochsteigend' (CT, CA) markiert einen tieferen intonationssyntaktischen Einschnitt als 'steigend' (et), 'fallend' (CC) markiert den hierarchiehöchsten Einschnitt. Gibbon/Selting dagegen benutzen zusätzlich zu den Globalverläufen nicht die intonatorischen Einheiten selber, sondern den mit Intonation eng verwandten Parameter des Rhythmus zur intonatorischen Einheitenbildung. Intonatorische Einheiten (die -frames) werden also nicht alleine durch Intonation bestimmt, sondern durch das externe Kriterium des Rhythmus. Aus diesen beiden Beispielen alleine ist es natürlich nicht möglich, Unterschiede in den prosodischen Systemen der beiden Sprachen abzuleiten. Es scheint aber auch plausibel zu sein, daß der Rhythmus in einer akzentzählenden Sprache wie dem Deutschen eine größere Rolle spielt. Eine genaue Bestimmung der Rolle des Rhythmus und der Intonation, sowie die Interaktion dieser beiden prosodischen Parameter im Deutschen und Französischen könnte erst die Grundlage für solch einen Vergleich bilden.
Material
45
3. MATERIALBESCHREIBUNG
Für das Untersuchungsinteresse dieser Arbeit mußten hohe Ansprüche an den Korpus gestellt werden: 1. Eine Vergleichbarkeit der deutschen und französischen Intonation mußte gewährleistet sein. 2. Der Korpus mußte spontane Dialoge enthalten. 3. Die Aufnahmen mußten von hoher akustischer Qualität sein. Für das kontrastive Untersuchungsinteresse ist eine Vergleichbarkeit der deutschen und französischen Texte Voraussetzung. Gibbon (1980) weist bereits auf die in der Intonationsforschung vorherrschende Indifferenz gegenüber funktionalen Varietäten der Sprache hin. In der Praxis beschränkt sich die Sprachvarietät im allgemeinen auf laut gelesene Sätze, eine Varietät, die eine Reihe theoretischer Probleme in sich birgt und mit spontan gesprochener Sprache, in der Intonation sicher eine wichtigere Rolle spielt, nicht einfach gleichzusetzen ist. Eine Klärung der Sprachvarietät in der die Intonation untersucht und verglichen werden soll, ist eine notwendige Voraussetzung für eine kontrastive Untersuchung, um nicht in den Fehler zu verfallen z.B. deutsche Intonation in spontaner Sprache mit französischer Intonation in gelesenen Sätzen zu vergleichen (Gibbon 1980, S.32). Einige Untersuchungen haben gezeigt, daß Intonation innerhalb einer Sprache in Abhängigkeit verschiedener Faktoren des Kommunikationsprozesses variieren kann: in Abhängigkeit von der Art des Kanals (Gibbon 1981), in Abhängigkeit von den Beziehungen der Interaktanten (Gibbon/Selting 1983), in Abhängigkeit von der kommunikativen Aufgabe (Handlungsschema) (Johns —Lewis 1986b), in Abhängigkeit der sozialen Rollen der Interaktanten (Duez 1982) und in Abhängigkeit von emotionalen Faktoren (Fonagy 1978). Neben diesen Faktoren des aktuellen Kommunikationsprozesses spielen auch eine Reihe von Langzeitfaktoren eine Rolle, wie z.B. die regionale Varietät (Local 1986, Williams 1986 für Englisch), Zugehörigkeit zu einer sozialen Gruppe (Fonagy/Fonagy 1976) und individuelle Stileigenschaften (Nanov-Schwehr 1988, Leon 1971). Von diesen unterschiedlichen Faktoren sind in dieser Arbeit die Faktoren des aktuellen Kommunikationsprozesses systematisch berücksichtigt worden, regionale, soziale und individuelle Einflüsse auf die Ausprägung der Intonationskonturen wurden nicht erfaßt. Im folgenden soll die hier verwendete Sprachvarietät/Textsorte anhand der Komponenten eines einfachen Kommunikationsmodells bestimmt werden. (a) Kommunikationssituation Die Kommunikationssituation ist eine experimentelle Situation, in der sich zwei Interaktionspartner über die Konstruktion eines Bauklötzchen — Gebildes verständigen. Jeweils ein
46
Material
Interaktionspartner, bekommt vom Versuchsleiter eine Vorlage für ein Bauklötzchen — Gebilde, das er seinem Interaktionspartner so erklären muß, daß dieser in der Lage ist, es nachzubauen. Während der Durchführung dieser Aufgabe sitzen sich die beiden Interaktionspartner an zwei Tischen gegenüber, die durch eine Stellwand getrennt sind. So können die Interaktanten zwar miteinander sprechen, den Partner und dessen Arbeitsplatz aber nicht sehen. Das turn —taking ist in keiner Weise festgelegt, es wird nur darauf hingewiesen, daß es selbstverständlich erlaubt sei, daß der Nachbauende nachfrage. Das vom Versuchsleiter genannte Ziel der Aufgabe, nämlich die Übereinstimmung der Bauklötzchen Gebilde und auch die Aufgabe selbst, die gewisse spielerische Reize enthält, sorgen dafür, daß die Aufmerksamkeit der Interaktanten nicht auf die Sprachproduktion und damit auf den Analysegegenstand selber gerichtet ist, was zu Verzerrungen führen könnte. Es handelt sich also um kontrolliert ausgelöste, spontane Dialoge mit vorgegebenem Kommunikationsziel, die auch unter konversationsanalytischer Perspektive als 'natürliche' Interaktionen von Interesse sind. (b) Interaktionspartner und Kommunikationswissen Den Interaktionspartnern werden vom Versuchsleiter unterschiedliche Rollen zugewiesen. Der eine, den ich den 'Erklärenden' nennen werde, bekommt vom Versuchsleiter die Information über das zu bestimmende Gebilde, d.h. er verfügt über ein zusätzliches Wissen, das er dem anderen, im folgenden der 'Nachbauende' genannt, vermitteln soll. Der Nachbauende muß dieses Wissen in sein vorhandenes Wissen integrieren. Die Beziehung zwischen den Interaktionspartnern ist unter dem Aspekt der Wissensverteilung also asymmetrisch. (c) Kanal Der Kanal ist gekennzeichnet durch Direktheit, Nähe und die Ausschließlichkeit des akustischen Mediums. Unter Direktheit verstehe ich im Sinne von Gibbon 1981 ('rapid decay channel'), daß zwischen der Produktion einer Äußerung und der Äußerung keine Zeitspanne liegt, in der diese Äußerung gespeichert wird, wie dies besonders bei schriftlicher Kommunikation der Fall ist. Intonatorisch interessante Fälle, die durch diesen Kanaltyp ausgeschlossen werden, sind vorbereitetes Sprechen (rehearsed speech) oder rituelles Sprechen. Unter Nähe verstehe ich, daß die Verständigung nicht durch akustische Probleme beeinträchtigt wird. So ist z.B. anzunehmen, daß besonders lautes oder auch leises Sprechen zu anderen intonatorischen Konturen führt. Die Ausschließlichkeit des akustischen Mediums ist für das intonatorische Erkenntnisinteresse von besonderer Bedeutung. Es wird im allgemeinen angenommen, daß Gestik und Prosodie sich ergänzen und/oder redundant Phänomene in der Kommunikation signalisieren. Man kann also erwarten, daß je weniger die Gestik zur Kommunikation beitragen
Material
47
kann, desto mehr die prosodischen Zeichen verwendet werden. In dieser Anordnung der Kommunikationssituation ist die Gestik zwar nicht ausgeschlossen — tatsächlich haben die meisten Interaktanten auch Gesten benutzt — , sie können aber für die Interaktion keine Bedeutung haben, da der visuelle Kanal ausgeschaltet ist. Abbildung 3.1 zeigt die spezifische Ausfüllung der Komponenten des Kommunikationsmodells in diesen Texten.
experimentelle Situation akustischer Kanal Erklärende
Instruktionstext
allgemeine Informationen über Bauklötzchen, Schwerkraft, etc. spezifische Information über Bauklötzchen-Gebilde
Abbildung 3.1: Kommunikationsmodell
Diese Textsorte wurde sowohl im Französischen mit französischen Muttersprachlern als auch mit deutschen Muttersprachlern produziert. Ein dritter Materialtyp sind die Kontaktsituationen, in denen ein deutscher Muttersprachler auf Französisch einem französischen Muttersprachler die Konstruktion eines Bauklötzchen —Gebildes erklärt und umgekehrt. Um die akustische Qualität zu sichern, wurden alle Texte im Labor auf Magnetband aufgezeichnet, wobei die Interaktanten auf verschiedenen Kanälen aufgenommen wurden. Dieses Verfahren garantiert eine hohe akustische Qualität, die auch nummerische Analyseverfahren zuläßt. Der Korpus, der dieser Arbeit zugrundeliegt, umfaßt ca. 60 Minuten Text. Von diesen 60 Minuten entfallen jeweils gut 20 Minuten auf deutsche und französische Texte sowie 15 Minuten auf Kontaktsituationen. In der Tafel in Abbildung 3.2 sind die einzelnen Texte, jeweils mit ihrem Namen, der Zeitdauer und dem Bauklötzchen—Gebilde aufgeführt. Abbildung 3.3 zeigt die dazugehörigen Bauklötzchen—Gebilde. Die Namen verweisen jeweils auf den Text: französische Namen bezeichnen französische Texte, deutsche Namen deutsche Texte. Die Bezeichnung NMS bzw. nms bedeutet, daß Nicht — Muttersprachler beteiligt sind, wobei Großbuchstaben auf französische Nicht — Muttersprachler, Kleinbuchstaben auf deutsche Nicht — Muttersprachler verweisen.
48
Material
Name
Dauer
Bauklötzchen-Gebilde
Bemerkung
Wippe 1
6:50 Min.
Abb. 3a
erfolgreich
Wippe 2
5:10 M i n .
Abb. 3a
erfolgreich
Wippe 3 (1. Teil)
2:45 M i n .
Abb. 3a
nicht fehlerfrei nachgebaut
Materialsammlung
1:10 M i n .
Pyramide
2:00 M i n .
Abb. 3b
erfolgreich
Quader
3:30 M i n .
Abb. 3c
erfolgreich
Fassade
2:00 Min.
Abb. 3d
erfolgreich
pont
4:40 Min.
Abb. 3e
erfolgreich
Are de Triomphe
2:50 Min.
Abb. 3f
erfolgreich
Pyramide
3:00 Min.
Abb.
3g
erfolgreich
balanfoire
7:15 Min.
Abb. 3h
erfolgreich
araignee (Ausschnitte)
3:30 Min.
Abb. 3i
erfolgreich
Dreifachbrücke-NMS
Abb. 3j
nicht fehlerfrei nachgebaut
Pyramide-NMS
Abb. 3k
nicht fehlerfrei nachgebaut
balangoire-nms
Abb. 31
erfolgreich
ferme-nms (I.Teil)
Abb. 3m
erfolgreich
erfolgreich
—
Abbildung 3.2: Überblick über den Korpus
49
Material
__j
l
g
v »
b
s
r
'
>
••^
\
β
b
1 \u \
3b Pyramide
3a Wippe
1l K
ii
· i""^ X,
V
LΓ
\
»
•v > b
r
y
K
3d Fassade
3c Quader
N.
»·. . 1 .
r_
pKl 3f Are de Triomphe
3e pont \ \
\ \ \
9
fl
S
Ϊ
b
r
^ r
»
i
3g Pyramide
*
N.
v,—1
b S—^
s
r
k ϊ
s, N
x«^·
h b a lango re
^
9 b
X
xll
S
50
Material
3i araignee··
3j Dreifachbrücke-NMS
\
3k Pyramide-NMS
t
1
31 balansoire—nms
i
3m ferme —nms Abbildung 3.3: Bauklötzchen - Gebilde Zeichenerklärung: b = blau, dg = dunkelgrün
g = grün,
r = rot,
y = gelb,
hg = hellgrün,
Dieser Grundkorpus wird in den einzelnen Kapiteln unterschiedlich verwendet. Im 4. Kapitel zur intersubjektiven Übereinstimmung bei der Beurteilung von Intonationskonturen werden 8 Ausschnitte von jeweils ca. einer Minute Länge verwendet, die in annähernd orthographischer Transkription repräsentiert werden. Diese 8 Ausschnitte sind den Texten Pyramide, poui, Dreifachbrücke —NMS, balanyoire—nms und ferme— nms entnommen. Im Kapitel 5 bestehen die analysierten Daten aus 50 Stücken von jeweils 1—2 Sekunden Länge, die hauptsächlich den Texten Pyramide und pont entnommen sind. Diese Daten sind in akustisch—numerischen Werten und manuell zugeordneter phonetischer Transkription repräsentiert. In Kapitel 6 schließlich wird der gesamte Korpus verwendet. Alle Texte liegen als orthographische Transkriptionen vor. Im Gegensatz zur Datenrepräsentation in Kapitel 4 wird in diesem Kapitel mehr Wert auf segmentale Genauigkeit sowie Pausenphänomene
Material
51
gelegt, damit die Transkriptionen auch konversationsanalytischen Standards entsprechen. Die folgenden Transkriptionskonventionen werden verwendet: kurzes Absetzen der Stimme kleine Pause mittlere Pause (Pause
Sek.)
((lachend))
längere Pause, Zeitangabe in Sekunden Beschreibung der Sprechweise bzw. Beschreibung nicht — sprachlicher Phänomene; wenn es sich um sprechbegleitende Phänomene handelt, gilt es bis zum nächsten + Abbruch einer Äußerung oder eines Äußerungsteils
(en)fin
nicht sicher erkanntes Segment
(...)
nicht erkanntes Segment
de:s
Dehnung eines Lautes
E
realisiertes 'e caduc'
Die Intonation wird in einer getrennten Zeile notiert. Die Konventionen der Intonationstranskription werden in Kapitel 6 erklärt und diskutiert.
Intonationsbeurteilung
53
4. INTERSUBJEKTIVE ÜBEREINSTIMMUNG BEI DER BEURTEILUNG VON INTONATIONSKATEGORIEN (Methode 2)
In kontrastiven Untersuchungen wie auch in anderen Untersuchungen zur Intonation sind eine Reihe verschiedener experimenteller Methoden benutzt worden. In vielen Untersuchungen wird eine einfache "Labelling"-Methode verwendet: Versuchsteilnehmer, im allgemeinen Muttersprachler ohne linguistische bzw. intonatorische Kenntnisse, haben die Aufgabe, vorgegebenen Äußerungen Funktionslabels zuzuweisen, oder auf vorgegebene Funktionslabels hin, typische Äußerungen zu produzieren (vgl. Isacenko/Schädlich 1966, Fonagy 1980b, Scuffil 1982). Koberski (1979) benutzt diese Methode in abgewandelter Form für eine kontrastive Untersuchung des Französischen, Englischen, Ungarischen und Russischen. Sie läßt nicht einzelne Sätze mit Funktionen verbinden, sondern benutzt 'konventionelle' Situationen, d.h. sie gibt Situationen vor, in denen die Versuchsteilnehmer nicht 'Sätze* sondern 'Äußerungen' produzieren sollen. Die Situationen werden experimentell durch Beurteilung durch andere Muttersprachler auf ihre Konventionalitat überprüft und die Intonationsmuster der verschiedenen Sprachen werden verglichen. Ein ausführlicher Überblick über diese Methoden der Funktionszuweisung findet sich in Scuffil (1982). In allen diesen Herangehensweisen werden die Formen der Intonation, die Beschreibungskategorien, als bekannt vorausgesetzt. Untersucht werden die Funktionen, die diesen Formen konventionell zugewiesen werden können. Ich möchte in diesem Kapitel die Formen in den Mittelpunkt stellen. Die akustischen Daten, die an das menschliche Ohr gelangen, sind kontinuierliche Daten. Die Frage, die sich ein Intonationsforscher stellen muß, ist die Frage nach den linguistisch relevanten Beschreibungseinheiten und Beschreibungsformen d.h. den Beschreibungskategorien einer gegebenen Sprache. Im vorherigen Kapitel wurden verschiedene von Phonetikern entwickelte Kategoriensysteme dargestellt und verglichen. Besonders für die deutsche Intonationsforschung stellte sich heraus, daß die Kategoriensysteme der verschiedenen Forscher sehr heterogen z.T. sogar widersprüchlich sind. In diesem Kapitel soll es um die Frage gehen, wie man aus den kontinuierlichen akustischen Daten zu sinnvollen Beschreibungskategorien kommen kann. Das ist eine Frage, die im phonetischen Paradigma der Kategorialen Wahrnehmung seit ca. 30 Jahren im Mittelpunkt der Forschung steht. Ich möchte deshalb zunächst kurz einige Grundideen des experimentellen Paradigmas der kategorialen Wahrnehmung skizzieren. Für einen ausführlichen Überblick verweise ich auf Repp (1984), Hamad (1987) und Neisser (1987). Für meine eigenen Versuche habe ich die theoretischen Grundlagen der Kategorialen Wahrnehmung benutzt, die Methode (s.u.) jedoch, die essentieller Bestandteil dieses Paradigmas ist, habe ich für mein Untersuchungsinteresse, das auf Texte gerichtet ist, nicht anwenden können. Es wurde stattdessen eine metalinguistische Beurteilungsaufgabe gewählt, deren Ergebnisse anhand der Korrelation der Urteile und der Häufigkeitsverteilungen überprüft wurden. Die
54
Intonationsbeurteilung
Methode, die Durchführung und Auswertung der Versuche werden in Abschnitt 4.2. dargestellt. Bei dem Versuch geht es um zwei verschiedene Aufgaben: 1. die Beurteilung von nicht-muttersprachlicher Intonation 2. die Beurteilung von muttersprachlicher Intonation. In beiden Fällen geht es um die Frage der Wahrnehmung von Intonationskategorien. Bei der ersten Beurteilungsaufgabe geht es darum festzustellen, inwieweit es möglich ist, abweichende Intonation zu erkennen und mögliche Hinweise auf Inferenzfehler zu bekommen. Die Hypothese ist, daß Muttersprachler zwar keine Analyse von Intonationsfehlern durchführen, diese aber trotzdem lokalisieren können. In der zweiten Beurteilungsaufgabe geht es um die Bestimmung der Kategorien, die für die Wahrnehmung von Intonation in den beiden Sprachen Deutsch und Französisch vorherrschend sind. Die Versuche wurden — soweit wie möglich — parallel aufgebaut, so daß ein Vergleich der perzeptiven Kategorisierung des akustischen Kontinuums zwischen dem Deutschen und dem Französischen angeschlossen werden kann. Die Hypothese ist, daß es Unterschiede gibt zwischen der Wahrnehmung französischer und deutscher Kategorien. Unterschiede werden in drei Bereichen erwartet (vgl. dazu auch Kapitel 2): 1. Grenzton und Akzent im Deutschen entsprechen wahrnehmungsmäßig nicht dem internen und externen Akzent im Französischen. 2. Unterschiedliche Tonhöhenniveaus spielen im Französischen eine größere Rolle als im Deutschen. 3. Prosodische Einheiten können im Französischen (wegen des obligatorischen Grenzsignals des internen Akzents) sicherer bestimmt werden als im Deutschen.
4.1. Kategoriale Wahrnehmung
Die Kategoriale Wahrnehmung ist ein experimentelles Forschungsparadigma, das in der segmentalen Phonetik entwickelt und dort auch hauptsächlich angewendet worden ist. Die zentrale Frage dieser Forschungsrichtung lautet: Gibt es in der Wahrnehmung eines akustischen Kontinuums kategoriale Grenzen zwischen verschiedenen Lauten? Die Methode besteht im Identifizieren und Diskriminieren von synthetischen Lauten auf einem physikalischen Kontinuum. Die Definition von Studdert-Kennedy et al. (1970) verdeutlicht die ursprüngliche, "reine" Position des Paradigmas der kategorialen Wahrnehmung: "categorical perception refers to a mode by which stimuli are responded to, and can only be responded to, in absolute terms. Successive stimuli drawn from a physical continuum are not perceived as
Intonationsbeurteilung
55
forming a continuum, but as members of discrete categories. They are identified absolutely, that is, independently of the context in which they occur. Subjects asked to discriminate between pairs of such "categorical" stimuli are able to discriminate between stimuli drawn from different categories, but not between stimuli drawn from the same category. In other words, discrimination is limited by identification: subjects can only discriminate between stimuli that they identify differently." (Studdert-Kennedy et al., 1970 S. 234; zitiert nach Repp 1984, S. 252)
Kohler (1987a, 1987b, 1987c) hat im Rahmen dieses Paradigmas ein Experiment zur Wahrnehmung von Suprasegmentalia im Deutschen durchgeführt. Er läßt Äußerungen beurteilen, in denen der FO-Gipfel um jeweils 30 ms synthetisch verschoben wurde. Aufgabe der Versuchspersonen war es, zu entscheiden, wann sich die Äußerung änderte und welche Bedeutungen diese Veränderungen haben. Die Häufigkeitsverteilung der Beurteilungswerte zeigte ein Maximum, das mit dem Eintritt des FO-Gipfels in den Vokalkern korreliert. Nach dem Vokalkern gab es kein weiteres eindeutiges Maximum, sondern ein graduelles Übergehen in eine andere Interpretation. Es ergeben sich also drei voneinander unterscheidbare FO-Gipfel-Positionen, von denen zwei voneinander durch eine kategoriale Grenze getrennt werden. Diesen drei Typen werden zwei textbezogene Funktionen zugeordnet: 1. FO-Gipfel vor dem Silbenkern: "begründende Äußerung am Ende einer Argumentationskette " 2. FO-Gipfel auf/nach dem Silbenkern: "Beginn einer Argumentation". Verschiebt man den Grundfrequenzgipfel weiter nach rechts, d.h. in eine extreme Position des 2. Typs, dann wird die Äußerung als emphatische Äußerung interpretiert. Eine Frage, die aus den Ergebnissen von Kohler deutlich wird, ist die Frage nach der "Schärfe" der kategorialen Grenzen, nach der Absolutheit der Kategorien. Während Studdert-Kennedy et. al. (1970) die Position vertreten, daß es nur eine binäre Unterscheidung gibt zwischen Kategorien und Nicht-Kategorien, hat Massaro (1987) ein Modell vorgeschlagen, das verschiedene Grade der Zugehörigkeit zu einer Kategorie erlaubt. Besonders interessant in diesem Zusammenhang sind die Parallelen und Gemeinsamkeiten, die Medin/Barsalou zwischen den Paradigmen der Kategorialen Wahrnehmung, das sich ausschließlich mit sensorischen Wahrnehmungskategorien beschäftigt einerseits, und der Prototypen-Theorie, deren Untersuchungsgegenstand Kategorien des genetischen Wissens sind, andererseits ziehen. In beiden Forschungsrichtungen steht im Mittelpunkt die Kategorisierung der realen Welt. Diese Kategorisierung geschieht auf der Basis von Regeln bzw. Idealtypen oder Prototypen aufgrund bereits bekannter Exemplare oder aufgrund von Grenzen. Die verschiedenen Grade der Zugehörigkeit zu einer Kategorie, ihre Entfernung von Prototypen, wird auch mit dem Begriffspaar definierte Kategorie vs. "fuzzy"-Kategorie gefaßt. Eine definierte Kategorie (im Sinne des klassischen Paradigmas der Kategorialen Wahrnehmung eine 'Kategorie') ist dadurch charakterisiert, daß die Zugehörigkeit zur
56
Intonationsbeurteilung
Kategorie eindeutig durch eine Regel bestimmt ist. Bei einer "fuzzy" Kategorie dagegen ist es nicht möglich, eine Regel zu finden, die alle Mitglieder und nur die Mitglieder der Kategorie spezifiziert (vgl. Medin/Barsalou 1987, 461). Die Tendenz auch in der Kategorialen Wahrnehmung scheint dahin zu gehen, auch "fuzzy categories" zuzulassen. (Repp & Liberman 1987)3 Auch Schiefer/Batliner (1988), die selber eine Reihe von Experimenten zur kategorialen Wahrnehmung von Terminaltönen im Deutschen durchgeführt haben, plädieren dafür, daß das strikte Paradigma der Kategorialen Wahrnehmung nicht für Intonationsphänomene anwendbar ist. Sie gehen sogar soweit, zu fordern, daß auch der Begriff der "kategorialen Wahrnehmung" selber dann nicht verwandt werden solle, da dies nur zu begrifflichen Unklarheiten führe. Dies scheint mir allerdings nicht zwingend. Um auf das oben beschriebene Beispiel eines Versuchs zur kategoriale Wahrnehmung zurückzukommen, kann man sagen, daß die Grenze beim Eintritt des FO-Gipfels in den Vokalkern als definierte kategoriale Grenze interpretiert werden kann, während nach dem Vokalkern eine "fuzzy" Grenze ist. Zusammenfassend kann man festhalten, daß das Paradigma der kategorialen Wahrnehmung Grundbegriffe für die Beschreibung und eine Methode zur Erforschung akustischer Kategorien bereitstellt. Der Nachteil liegt darin, daß die Methoden synthetisiertes Material verlangen. Die Frage der Übertragbarkeit auf natürliche Sprache (z.B. für den Fremdsprachenunterricht) spricht Repp (1984) kurz an. Er stellt aber fest, daß systematische Arbeit bisher nicht geleistet worden ist. Daraus ergibt sich für meine Arbeit, die durchgängig an spontan gesprochener Sprache in Gesprächen orientiert sein soll, das Problem einer Untersuchungsmethode, die einerseits auf den Grundideen der kategorialen Wahrnehmung und Prototypentheorien aufbaut, andererseits als Untersuchungsgegenstand das in Kapitel 3 beschriebene Material benutzen kann.
4.2. Methode und Versuchsbedingungen
Ausgangspunkt ist die Annahme, daß Intonation kategorisierbar ist. Die Kategorien sind sprachabhängig, d.h. jeder kompetente Sprecher einer Sprache hat gelernt, diese Kategorien zu verstehen und selber zu verwenden. Die Frage, die in allen 11 Versuchen gestellt werden soll, ist die Frage nach der Bedeutung der vorgegebenen Kategorien für Muttersprachler bei der Wahrnehmung intonatorischer Phänomene (des intonatorischen Kontinuums) in spontan gesprochener Sprache.
Neisser zeigt im Anschluß an Lakoff eine interessante Erklärung für die Nicht-Kategorialität auf: "Lakoff suggests that the "graded structure" (...) appears because our models do not quite fit the world as it really is." (Neisser 1987, 5)
Intonationsbeurteilung
57
Da das Material spontan gesprochene Sprache in Texten sein soll, um auch gerade die für die Sprachverarbeitung interessanten Kontexteinflüsse nicht auszuschließen, scheiden die traditionellen Methoden der kategorialen Wahrnehmung, des Diskriminierens und Identifizierens im physikalischen Kontinuum, aus. Ich möchte vielmehr eine Methode verwenden, die in der Prototypentheorie benutzt worden ist: die Klassifizierung aufgrund von bereits bekannten Exemplaren. Dies bietet keine Schwierigkeit, wenn das "Exemplar" als bekannt vorausgesetzt werden kann, z.B. der 'Akzent' und die 'melodische Einheit' oder die 'französische' bzw. 'deutsche Intonation'. Eine Schwierigkeit ergibt sich bei weiteren Differenzierungen, da es für die Intonation — außer den funktionalen Labels wie Frageintonation usw., die für Texte unbrauchbar sind — keine allgemein bekannten Bezeichnungen gibt. Für diese Fragestellungen mußte dem eigentlichen Versuch eine Übungsphase vorgeschaltet werden, in der den Versuchspersonen Bezeichnungen für die zu beurteilenden Konturen nahegebracht wurden. Die Methode der Versuche besteht in einer metalinguistischen Beurteilungsaufgabe. Den Versuchsteilnehmern wird ein Text gesprochener Sprache als orthographische Transkription vorgelegt und von Kassette vorgespielt. Aufgabe der Versuchsteilnehmer ist es, den Text aufgrund vorgegebener Kategorien auf intonatorische Phänomene hin zu beurteilen. Bei den vorgegebenen Kategorien handelt es sich um muttersprachliche vs. nicht-muttersprachliche Intonation, prosodische Einheiten, Akzente und Akzenttypen. Die Kategorien konnten z.T. als bekannt vorausgesetzt werden (muttersprachlich vs. nicht-muttersprachlich, prosodische Einheiten und z.T. Akzente) während die letzte Kategorie, Akzenttypen (und z.T. Akzente) eine kurze Übungsphase (durch Vor- und Nachsprechen) von den Versuchsteilnehmern forderte, in der diese Kategorien an prototypischen Beispielen verdeutlicht und damit den Versuchsteilnehmer bewußt gemacht wurden. Als Maß für die Bedeutung einer Kategorie soll einmal die Übereinstimmung der muttersprachliche Urteile benutzt werden. Die Übereinstimmung wird anhand des Korrelationskoeffizienten bestimmt. Da den Versuchen eine große Datenmenge zugrundeliegt, soll und kann die Irrtuniswahrscheinlichkeit gering gehalten werden. Die Hypothesen werden mit einer Irrtumswahrscheinlichkeit von a= 0.1% auf ihre Annahme geprüft. Zum zweiten werden die Häufigkeitsverteilungen der Urteile untersucht. Für die 11 Versuche wurden 6 Textausschnitte von jeweils 1 — 2 Minuten verwendet. Diese Texte lagen den Versuchsteilnehmern in einer annähernd orthographischen Transkription in Partiturschreibweise vor. Die Tonband- bzw. Kassettenaufnahmen sind von hoher akustischer Qualität.
Die Versuchsteilnehmer waren 30 Deutsche und 13 Franzosen (die Anzahl der Deutschen ist doppelt so groß, da für die Akzenttypen im Deutschen 2 Versuche durchgeführt wurden). Die Teilnehmer sind überwiegend Studenten, jedoch nur zu ca. 1/3 Studenten der Linguistik. Sie nahmen freiwillig an den Versuchen teil, einige wurden bezahlt.
58
Intonationsbeurteilung
Bis auf jeweils eine/n Experten/in in der französischen und der deutschen Gruppe verfügte kein Teilnehmer über eine phonetische Ausbildung. Die Versuche wurden teilweise in einem Sprachlabor durchgeführt, in dem jedem Teilnehmer ein Kassettenrekorder und ein Kopfhörer zur Verfügung standen, und sie das Tempo der Versuchsdurchführung selber regulieren konnten. Ein anderer Teil wurde in Einzelsitzungen bzw. kleinen Gruppen bis zu 3 Personen durchgeführt, in denen die Versuchsleiterin das Tempo regelte. Signifikante Unterschiede ergaben sich aus dieser unterschiedlichen Anordnung nicht. Im folgenden werden die Versuche zu den drei Bereichen, der nicht-muttersprachlichen Intonation (4.3), der deutschen Intonationskategorien (4.4) und der französischen Intonationskategorien (4.5) dargestellt und diskutiert.
4.3. Beurteilung nicht-muttersprachlicher Intonation
4.3.1.
Problemstellung und Versuchsdurchführung
Eine interessante Frage im Bereich der Intonationsforschung ist die Frage, inwieweit es Intonationsregeln für eine spezifische Sprache gibt. Anders herum formuliert: Kann man intonatorische Fehler machen und wenn ja, welcher Art sind diese Fehler? Cutler (1983) stellt in einer Untersuchung von Korrekturen fest, daß prosodische Fehler nur dann korrigiert werden, wenn sie Verständigungsprobleme hervorrufen können. Korrekturen der Intonation kommen in diesen Gesprächen jedoch nicht vor. Ich möchte deshalb hier eine andere Herangehensweise an diese Frage wählen. Im folgenden werden vier Versuche dargestellt, in denen die Versuchsteilnehmer die Aufgabe hatten, intonatorische Fehler zu markieren. Gleichzeitig können diese Markierungen Aufschluß darüber geben, welche Interferenzen in der deutschen und französischen Intonation besonders "störend" sind. Es handelt sich um vier Ausschnitte aus Bauklötzchen-Texten in Kontaktsituationen. Der Erklärende ist jeweils der Nicht-Muttersprachler, der Nachbauende ist der Muttersprachler. Die Nicht-Muttersprachler sind zwei Franzosen und zwei Deutsche. Jeweils eine/r hat ein hohes Niveau in der Fremdsprache (= Französisch-/Deutschstudium + längerer Aufenthalt im Sprachland) und spricht grammatikalisch (fast) korrekt. Die anderen beiden haben Grundkenntnisse in der Fremdsprache (Schulunterricht + Aufenthalt im Sprachland) und können sich zwar verständlich machen, sprechen aber z.T. ungrammatisch und haben lexikalische Probleme. Die Textausschnitte von jeweils ca. 60 sec. wurden annähernd orthographisch transkribiert (vgl. S. 8 — 11). Die Versuchsteilnehmer hatten die Aufgabe, die Stellen zu markieren, an denen die Intonation nicht-muttersprachlich ist. In der Instruktion wurde besonders hervorgehoben, daß es nicht um syntaktische, morphologische, lexikalische oder segmental-phonetische Fehler ging (dafür wurde jeweils ein Beispiel gegeben), sondern daß die Aufgabe war, Fehler in der Sprachmelodie, der Betonung, der Intonation oder
Intonationsbeurteilung
59
Prosodie zu markieren. Es wurde betont, daß es nicht erforderlich sei, erklären zu können, warum sie eine bestimmte Stelle markiert hatten, sondern, daß es nur um die Lokalisation der intonatorischen Fehler ging, um die "Markierung der Stelle, an denen man hören kann, daß der Sprecher nicht Franzose ist." Die Größe der Einheiten wurden nicht festgelegt, sondern es wurde darauf hingewiesen, daß diese Stellen sowohl einzelne Wortteile, Wörter, Wortgruppen oder auch ganze Sätze sein können. Diese Stellen sollen unterstrichen werden. Die Texte wurden den Versuchsteilnehmern insgesamt dreimal vorgespielt, beim 3. Mal auf Wunsch auch mit kurzen Unterbrechungen. Die Reihenfolge war bei allen Versuchsteilnehmern gleich, zuerst wurde der Text mit dem Nicht-Muttersprachler mit niedrigem sprachlichen Niveau, dann der Text mit dem Muttersprachler mit hohem sprachlichen Niveau bearbeitet. Zusätzlich wurden die Versuchsteilnehmer nach Bearbeitung des 2. Textes darum gebeten, einige Kriterien, die sie bewußt bei der Beurteilung benutzt hatten, aufzuschreiben.
4.3.2.
Auswertung und Diskussion
Als Bezugsgröße für die Auswertung wurde der Text in Wörter eingeteilt. Um diese Einheit des "Wort" zu bestimmen, wurde die pragmatische Lösung gewählt, alles das als Wort zu zählen, was in der (annähernd) orthographischen Transkription zwischen zwei Leerzeichen steht. (Dadurch wurden z. B. die französischen Artikel vor einem vokalisch anlautenden Wort nicht als "Wort" gezählt, eine Ausgrenzung, die für meine intonatorischen Erkenntnisinteressen insofern sinnvoll scheint, da ein " oder ein "d" keine eigenständige Intonation tragen können. Andererseits wurden Wortabbrüche wie z.B. "Fla" (Dreifachbrücke, Z.6) als 'Wörter' gezählt.) Für jedes der 'Wörter' wurde für jeden Versuchsteilnehmer eingetragen, ob es als intonatorisch fehlerhaft bewertet worden war oder nicht. Für diese Urteile wurde die multiple Korrelation jedes Versuchsteilnehmers mit der Gesamtgruppe berechnet. Abbildung 4.1 bis Abbildung 4.4 zeigen die Korrelationskoeffizienten für jeden Versuchsteilnehmer. Von den 50 Werten sind 48 bei einer Irrtumswahrscheinlichkeit von a= 0.1% signifikant. Die Annahme einer zufälligen Markierung von intonatorischen Fehlern kann somit für die Gesamtgruppe zurückgewiesen werden. Betrachtet man allerdings die Korrelationskoeffizienten von jeweils Paaren von Versuchsteilnehmern in allen möglichen Kombinationen, dann zeigt sich, daß die Hypothese einer nicht-zufälligen Übereinstimmung schwächer ist. Abbildung 4.5 bis Abbildung 4.8 zeigen die Korrelationskoeffizienten der einfachen Korrelation von Paaren von Versuchsteilnehmern. Von den insgesamt 292 Korrelationskoeffizienten sind nur 26 bei einer Irrtumswahrscheinlichkeit von o = 0.1% signifikant. Noch deuüicher wird die Tendenz der Unsicherheit bei der Beurteilung intonatorischer Fehler, wenn man die Anzahl der Wörter mit der durchschnittlichen Anzahl der Fehlerurteile und der Anzahl der mehrheitlich übereinstimmenden Fehlerurteile vergleicht (Abbildung 4.9).
60
Intonationsbeurteilung
11 Ul (0
UJ
CO
-l α
t* J ·« u r~~\
B Z
« n n o » — — » o » e r - n < u — r-r-
-P
&ΙΛ
|
0 g Z?
OC
ω i
Ul
UJ r—
1 ' Q-"S *r-f "!—
^ Ul Z
OC 0 K O -1 U _l
o — tu n » in
j
Ul -1 X Q» l··
K
^ h§ 's
z u < (Λ UJ l
tu α
-σ
K Z
z